Analysis I-IV Joachim Hilgert
Der vorliegende Text ist eine vorl¨aufige Ausarbeitung meiner Vorlesungen Analysis I-IV (Wintersemester 2004/2005 – Sommersemester 2006) an der Universit¨at Paderborn. Diese Ausarbeitung ist nicht korrekturgelesen und nur zum internen Gebrauch gedacht! F¨ ur Kommentare und Korrekturen bin ich dankbar. Vorschl¨age f¨ ur Erg¨anzungen im Index werden jederzeit eingearbeitet. Paderborn, den 18.7.2005
J. Hilgert
Inhaltsverzeichnis Vorbemerkung
1
0 Vorbemerkung 0.1 Vom Wesen der Mathematik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ¨ 0.2 Uber die Abstraktion in der Mathematik . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0.3 Die Sprache der Mathematik: Mengenlehre . . . . . . . . . . . . . . . . . . . . . . . . . .
Analysis I
1 1 3 10
17
1 Axiomatik der reellen Zahlen 1.1 Rechenregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Positivit¨at und Ordnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Vollst¨andigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17 17 24 28
2 Stetige Funktionen 2.1 Grenzwerte von Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3 Stetige Funktionen auf Intervallen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
31 31 43 49
3 Differenzierbare Funktionen 3.1 Die Ableitung einer Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Rechenregeln f¨ ur Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 Der Mittelwertsatz und seine Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . .
57 57 61 66
4 Konvergenz von Folgen und Reihen 4.1 Folgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3 Umordnung von Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
71 71 80 86
5 Folgen von Funktionen 93 5.1 Konvergenz von Funktionenfolgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 5.2 Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 5.3 Beispiele von Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
Analysis II
131
6 Stammfunktionen 131 6.1 Integrationsregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 6.2 Spezielle Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134 7 Integrierbare Funktionen 137 7.1 Das Integral einer Stufenfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137 7.2 Folgen von Stufenfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 7.3 Integrierbare Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 i
ii
INHALTSVERZEICHNIS
8 Konvergenzs¨ atze 8.1 Folgen und Reihen integrierbarer Funktionen 8.2 Nullmengen und fast u ¨berall“ Konvergenz . ” 8.3 Norm-Konvergenz . . . . . . . . . . . . . . . 8.4 Die fundamentalen Konvergenzs¨atze . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
153 153 157 162 166
9 Verbindung zwischen Integral- und Differentialrechnung 9.1 Der Hauptsatz der Differential- und Integralrechnung . . . . 9.2 Die Taylorentwicklung . . . . . . . . . . . . . . . . . . . . . 9.3 Fourier-Reihen . . . . . . . . . . . . . . . . . . . . . . . . . 9.4 Einige spezielle Integrale . . . . . . . . . . . . . . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
175 175 181 185 189
10 Topologische R¨ aume 10.1 Umgebungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.2 Konvergenz und Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.3 Kompakte Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
193 193 201 205
11 Differenzierbarkeit 11.1 Differenzierbarkeit und Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2 H¨ohere Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.3 Partielle Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
213 213 220 225
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
12 Implizite Funktionen 239 12.1 Der Banachsche Fixpunktsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239 12.2 Der Satz u ¨ber implizite Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242
Analysis III 13 Elementare L¨ osungsmethoden fu ¨ r Differentialgleichungen 13.1 Differentialgleichungen mit getrennten Variablen . . . . . . . 13.2 Variation der Konstanten . . . . . . . . . . . . . . . . . . . . 13.3 Homogene Differentialgleichungen . . . . . . . . . . . . . . . . 13.4 Gleichungen vom Typ y 00 = f (y) . . . . . . . . . . . . . . . .
253 . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
257 257 259 260 262
14 Lokale Theorie gew¨ ohnlicher Differentialgleichungen 269 14.1 Der Satz von Picard–Lindel¨of . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269 14.2 Differentialgleichungen mit Parametern . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275 14.3 Differenzierbare Abh¨angigkeit von den Anfangswerten . . . . . . . . . . . . . . . . . . . . 279 15 Lineare gew¨ ohnliche Differentialgleichungen 285 15.1 Homogene Gleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 285 15.2 Inhomogene Gleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287 15.3 Lineare Differentialgleichungen n-ter Ordnung . . . . . . . . . . . . . . . . . . . . . . . . . 289 16 Konstante Koeffizienten 297 16.1 Die Exponentialfunktion f¨ ur Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 297 16.2 Differentialgleichungen h¨oherer Ordnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 307 16.3 Anwendungen auf nichtkonstante Inhomogenit¨aten . . . . . . . . . . . . . . . . . . . . . . 314 17 Meßbare Mengen und Funktionen 319 17.1 Meßbare Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 319 17.2 Meßbare Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 324
INHALTSVERZEICHNIS 18 Maß und Integral 18.1 Maße . . . . . . . . . . . . . . 18.2 Integrale . . . . . . . . . . . . 18.3 Produktmaße . . . . . . . . . 18.4 Nullmengen und Konvergenz
iii
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
Analysis IV
329 329 331 339 345
355
19 Spezielle Eigenschaften des Lebesgue-Maßes 19.1 Regularit¨at . . . . . . . . . . . . . . . . . . . . . 19.2 Charakterisierung des Lebesgue-Maßes . . . . . . 19.3 Affine Transformationen . . . . . . . . . . . . . . 19.4 Die Transformationsformel f¨ ur Diffeomorphismen
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
355 355 358 361 363
20 Immersionen und Untermannigfaltigkeiten 20.1 Immersionen . . . . . . . . . . . . . . . . . . . . 20.2 Untermannigfaltigkeiten . . . . . . . . . . . . . . 20.3 Nullstellenmengen differenzierbarer Abbildungen 20.4 Tangential- und Normalenvektoren . . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
373 373 376 380 383
21 Oberfl¨ achenmaße von Untermannigfaltigkeiten 387 21.1 Kurvenintegrale in Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 387 21.2 Der Maßtensor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 389 21.3 Das Oberfl¨achenmaß einer Untermannigfaltigkeit . . . . . . . . . . . . . . . . . . . . . . . 392 22 Der 22.1 22.2 22.3 22.4
Gaußsche Integralsatz Ein Spezialfall . . . . . . . . . Kompakta mit glattem Rand Der Gaußsche Integralsatz . . Die Greensche Formel . . . .
. . . .
401 401 403 410 416
23 Pfaffsche Formen 23.1 Pfaffsche Formen und Kurvenintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23.2 Stammfunktionen von Pfaffschen Formen . . . . . . . . . . . . . . . . . . . . . . . . . . . 23.3 Geschlossene Pfaffsche Formen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
419 419 424 427
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
24 Die Integrals¨ atze von Green und Stokes 431 24.1 Der Greensche Integralsatz in der Ebene . . . . . . . . . . . . . . . . . . . . . . . . . . . . 431 24.2 Der Satz von Stokes im Raum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 434 25 Kr¨ ummung von Untermannigfaltigkeiten des Euklidischen Raumes 437 25.1 Kr¨ ummung von Kurven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 437 25.2 Kr¨ ummung von Untermannigfaltigkeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . 440
Anhang
449
A Die natu 449 ¨ rlichen Zahlen A.1 Die Axiome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 449 A.2 Rechenregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 453 B Konstruktion der reellen und komplexen Zahlen B.1 Von den nat¨ urlichen zu den ganzen Zahlen . . . . . B.2 Von den ganzen zu den rationalen Zahlen . . . . . B.3 Von den rationalen zu den reellen Zahlen . . . . . B.4 Von den reellen zu den komplexen Zahlen . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
459 459 463 466 474
iv
INHALTSVERZEICHNIS
C Naive Mengenlehre 477 C.1 Die Axiome . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 477 D Hintergrundmaterial zur Linearen Algebra D.1 Lineare Gleichungssysteme . . . . . . . . . . D.2 Vektorr¨aume von Zahlentupeln . . . . . . . D.3 Determinanten . . . . . . . . . . . . . . . . D.4 Vektorr¨aume . . . . . . . . . . . . . . . . . D.5 Bilinearformen . . . . . . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
487 487 490 506 511 517
Index
522
Literaturverzeichnis
533
Kapitel 0
Vorbemerkung 0.1
Vom Wesen der Mathematik
Man kann Mathematik als eine Verfeinerung der Alltagssprache auffassen. Sie dient dazu, beobachtbare Vorg¨ange so pr¨azise zu beschreiben, daß es m¨oglich wird, Gesetzm¨aßigkeiten zu erkennen. Die Entdeckung der Newtonschen Gesetze der Mechanik, die die Planetenbewegungen ebenso bestimmen wie die Flugbahn eines Satelliten, ist ohne eine mathematische Formulierung kaum denkbar. Mathematische Beschreibungen sollten nicht als Abbilder, sondern als Modelle betrachtet werden und sind daher nicht durch die Situation festgelegt. Man braucht etwas Mathematik, um ein Wahlergebnis statistisch so aufzubereiten, daß man es auf einer Zeitungsseite wiedergeben kann; die pr¨azisen Hochrechnungen aus relativ wenigen ausgez¨ahlten Wahlkreisen zu erhalten, erfordert jedoch sehr viel mehr mathematischen Aufwand. An den obigen Beispielen kann man zwei Funktionen der Mathematik ablesen: Modellierung und Prognose. Die Newtonsche Mechanik ist das mathematische Modell f¨ ur die Bewegung massiver Gegenst¨ande und es ist Aufgabe der Mathematik, Flugbahnen vorherzuberechnen. Die Modellierung ist eine Aufgabe, die nicht von der Mathematik oder dem Mathematiker allein geleistet werden kann. Es ist Fachwissen in den Disziplinen n¨otig, in deren Zust¨andigkeit das zu beschreibende System f¨allt. Daher kommen Modellierungsprobleme in Mathematikb¨ uchern meist nur am Rande vor. In der Regel beinhaltet ein mathematisches Modell gesetzm¨aßige Zusammenh¨ange zwischen verschiedenen Eigenschaften des Systems. So sind zum Beispiel Spannung und Stromst¨arke in einem Stromkreis u ¨ber eine Materialeigenschaft, den Widerstand, gekoppelt. Kennt man zwei dieser Gr¨oßen, kann man die dritte berechnen. F¨ ur den Mathematiker bedeutet Prognose“ sehr oft das Herausrechnen einer un” bekannten Gr¨oße aus einer Reihe von bekannten Gr¨oßen. Die zentrale Problemstellung der Mathematik wird daher gern als das L¨osen von Gleichungen“ beschrieben. ” Das L¨osen von Gleichungen ist keineswegs ein Automatismus. Die meisten Gleichungen lassen sich nicht explizit l¨osen, und auch einfachen Gleichungen ist normalerweise nicht anzusehen, ob sie u ¨berhaupt eine L¨osung haben. Man pr¨ uft z.B. leicht nach, daß die Gleichung x2 + y 2 = z 2 in den Unbekannten x, y, z von x = 3, y = 4, z = 5 gel¨ost wird. Eine solche ganzzahlige L¨osung dieser Gleichung heißt ein pythagor¨aisches Zahlentripel. Mit etwas elementarer Geometrie kann man ein Konstruktionsverfahren angeben, wie man alle pythagor¨aischen Zahlentripel findet. F¨ ur die Fermatsche Gleichung xn + y n = z n in den Unbekannten x, y, z mit einer vorgegebenen nat¨ urlichen Zahl n > 2 dagegen gibt es keine positiven ganzzahligen L¨osungen. Das war von P. Fermat (1601–1665) behauptet worden, aber es bedurfte dreihundert Jahre intensiver mathematischer Forschung, dies 1996 zu beweisen. Mathematik ist also mehr als nur eine sprachliche Lupe. Losgel¨ost von der Modellierung beobachteter Ph¨anomene schafft sie sich eine eigene Begriffswelt und Werkzeuge, mit denen man diese Begriffswelt 1
2
KAPITEL 0. VORBEMERKUNG
untersuchen kann. Der Versuch Gleichungen zu l¨osen hat viele neue mathematische Entwicklungen in Gang gesetzt, aber den Begriffen und Techniken, die heute zum Repertoir des Mathematikers geh¨oren, ist diese Abstammung oft nicht mehr anzusehen.
Beispiel 0.1.1 (Die Entwicklung des Zahlbegriffs): In den natu ¨ rlichen Zahlen N: 1, 2, 3, . . . findet man keine L¨osung der Gleichung x + 1 = 1. Nimmt man die Null hinzu, so findet man zwar hierf¨ ur eine L¨osung, nicht aber f¨ ur die Gleichung x + 1 = 0. Daf¨ ur braucht man die ganzen Zahlen Z: . . . , −3, −2, −1, 0, 1, 2, 3, . . ., die wiederum nicht ausreichen, um die Gleichung 2x + 1 = 0 zu l¨osen. Zu desem Zweck f¨ uhrt man die rationalen Zahlen Q: m n mit m ∈ Z und 0 6= n ∈ Z ein. Schon die alten Griechen wußten, in den rationalen Zahlen die Gleichung x2 = 2 nicht l¨osbar ist. Man f¨ uhrt die reellen Zahlen R als Grenzwerte“ von rationalen Zahlen (z.B. unendliche ” Dezimalbr¨ uche) ein und st¨oßt wieder an eine Grenze: Die Gleichung x2 = −1 ist nicht l¨osbar in R. Wenn man schließlich die komplexen Zahlen C als Paare (a, b) reeller Zahlen mit (a, b) + (a0 , b0 ) = (a + a0 , b + b0 )
und (a, b)(a0 , b0 ) = (aa0 − bb0 , ab0 + ba0 )
als Addition und Multiplikation einf¨ uhrt, so l¨aßt sich der Fundamentalsatz der Algebra beweisen: ¨ Satz: Uber C sind alle Polynomgleichungen, d.h. Gleichungen der Form ak xk + ak−1 xk−1 + . . . + a1 x + a0 = 0, l¨ osbar. Analysiert man die Vorgehensweise, so findet man folgende Prinzipien, die auch in anderen Situationen zum Einsatz kommen: • Man schafft den richtigen Rahmen f¨ ur ein Problem (hier das L¨osen von Polynomgleichungen). • Der L¨osungsbegriff wird verallgemeinert (L¨osung in welchem Zahlbereich?). • Sp¨ater kann man dann immer noch die Frage stellen, ob es eine L¨osung in einem kleineren Zahlbereich gegeben hat, wie z.B: im Fermatschen Problem: xn + y n = z n f¨ ur ganzzahlige x, y, z.
¨ 0.2. UBER DIE ABSTRAKTION IN DER MATHEMATIK
0.2
3
¨ Uber die Abstraktion in der Mathematik
Der grundlegende Ansatz der modernen Mathematik ist es, Dinge u ¨ber ihre Eigenschaften zu beschreiben und sich dabei m¨oglichst auf diejenigen Eigenschaften zu beschr¨anken, die f¨ ur die zu behandelnde Frage wirklich relevant sind. Wenn man die Umlaufbahn eines Raumgleiters beschreiben will, dann betrachtet man ihn als einen bewegten Punkt (den Schwerpunkt). Will man ihn von einer Umlaufbahn ihn eine andere steuern, muß man ihn als dreidimensionales Objekt auffassen mit ausgezeichneten Richtungen, in die die Steuerraketen Schub aus¨ uben. Beim Andocken an eine Raumstation spielt die genaue Form des Gleiters eine Rolle, und beim Eintauchen in die Atmosph¨are auch noch die Hitzebest¨andigkeit des Materials. Diese Abstraktion vom Raumgleiter auf ein Objekt mit einigen klar festgelegten Eigenschaften ¨ erleichtert es, Ahnlichkeiten mit in anderen Zusammenh¨angen gefundenen Beschreibungen und L¨osungen zu erkennen und zu ben¨ utzen. Bewegte Massepunkte modellieren auch Wurfgeschosse oder Planeten, in der Aerodynamik von Tragfl¨achen verf¨ ugt man u ¨ber eine lange Erfahrung, und die Hitzebest¨andigkeit von Kacheln betrachtet man auch nicht erst seit dem Eintritt ins Raumfahrtzeitalter. Da der hohe Abstraktionsgrad f¨ ur viele die h¨ochste H¨ urde im Studium der Mathematik ist, soll die Bedeutung der Abstraktion f¨ ur die Mathematik hier an einer Reihe von Beispielen noch n¨aher erl¨autert ¨ werden. Zuerst geht es um den Ubergang von konkreten Modellen zu abstrakten Methoden:
Beispiel 0.2.1 (Stromkreise): Widerst¨anden R1 , R2 , R3 : I3 ? I2 ?
Betrachte einen Stromkreis mit einer Spannungsquelle U und drei
R3 R2 U
I1 ?
R1
Der Zusammenhang zwischen der Spannung U , den Widerst¨anden R1 , R2 , R3 und den resultierenden Stromst¨arken I1 , I2 , I3 ist durch die Kirchhoffschen Gesetze gegeben, die hier folgende Gleichungen erzwingen: I1
=
I2 + I3
U R2 I2
= =
R1 I1 + R2 I2 R3 I3
Dabei sind Spannung und Widerst¨ande bekannt und die Stromst¨arken zu berechnen. Man kann das machen, indem man eine Gleichung nach einer der gesuchten Gr¨oßen aufl¨ost, das Ergebnis in die anderen Gleichungen einsetzt und so die Zahl der Gleichungen und der Unbekannten um Eins reduziert hat. Dieses Verfahren wiederholt man und l¨ost die letzte Gleichung nach der einzig verbliebenen Unbekannten auf. Dann setzt man das Ergebnis wieder in die anderen Gleichungen ein und findet so sukzessive auch die anderen Unbekannten.
4
KAPITEL 0. VORBEMERKUNG Im physikalisch gesehen realistischen Fall R1 , R2 , R3 > 0 findet man so I2
=
R3 I3 R2
I1
=
I2 + I3 = (
U
=
I3
=
I2
=
I1
=
R3 R2 + 1)I3 = (1 + )I2 R2 R3 R1 R2 + R1 R3 + R3 R2 I3 R2 R2 U R1 R2 + R2 R3 + R1 R3 R3 U R1 R2 + R2 R3 + R1 R3 (R2 + R3 )U R1 R2 + R2 R3 + R1 R3
Wir k¨onnen also feststellen: • Wir haben die Gleichung gel¨ost. • Die L¨osung war nicht wirklich algorithmisch, d.h. automatisierbar, weil wir nicht vorgeschrieben haben, welche Gleichung nach welcher Unbekannten aufgel¨ost werden soll. • F¨ ur jeden Schaltkreis m¨ ußten wir uns neu entscheiden, wie wir die Gleichungen l¨osen wollen.
Beispiel 0.2.2 (Produktionsmodell): Betrachten wir ein Produktionssystem bestehend aus drei Produzenten mit je einem Produkt, das nach außen (an den Markt) und untereinander (zur Erm¨oglichung der Produktion) geliefert wird. Mit x1 , x2 , x3 werden die produzierten Mengen (einheitlich gemessen z.B. in Geldwert) bezeichnet. Annahme: Die von i an j gelieferte Menge ist proportional zu der von j produzierten Menge: aij xj . Sei yi die Nachfrage des Marktes nach dem Produkt von i. Ziel ist dann (nach Leontief) die Herstellung des folgenden Gleichgewichts von Produktion und Nachfrage. y1
x1
a x3 13
y3
a12 x2
x3
x2
y2
Es ergeben sich folgende Gleichungen y1 y2
= x1 − a12 x2 − a13 x3 = x2 − a21 x1 − a23 x3
y3
= x3 − a31 x1 − a32 x2
¨ 0.2. UBER DIE ABSTRAKTION IN DER MATHEMATIK
5
Wir vergleichen die Gleichungen der beiden Beispiele und formen sie etwas um, damit die Analogien deutlicher werden: I1 U R2 I2
= I2 + I3 = R1 I1 + R2 I2 = R3 I3
y1 y2 y3
= = =
x1 − a12 x2 − a13 x3 x2 − a21 x1 − a23 x3 x3 − a31 x1 − a32 x2
↓
↓
I1 + (−1)I2 + (−1)I3 R1 I1 + R2 I2 + 0I3 0 + R2 I2 + (−1)R3 I3
= = =
0 U 0
x1 + (−a12 )x2 + (−a13 )x3 (−a21 )x1 + x2 + (−a23 )x3 (−a31 )x1 + (−a32 )x2 + x3
−1 R2 R2
−1 0 −R3
y1 y2 y3
↓
↓ 1 R1 0
= = =
0 U 0
1 −a21 −a31
−a12 1 −a32
−a13 −a23 1
y1 y2 y3
Die resultierenden Zahlenschemata nennt man Matrizen und durch eine systematisierte Variante des sukzessiven Variableneliminierens von oben (dem Gauß-Algorithmus) kann man daraus die Unbekannten bestimmen. Wir stellen fest: ¨ • Mit dem Ubergang von den Gleichungen zu den Matrizen hat man nur redundante Information aus ¨ den Gleichungen entfernt und gleichzeitig die Ubersichtlichkeit erh¨oht. • Die Anzahl der Gleichungen und der Unbekannten ist f¨ ur das Vorgehen hier v¨ollig unerheblich und in den Anwendungen kommen durchaus Gleichungssysteme mit mehr als 10000 Variablen vor. • An dieser Stelle ist nichts dar¨ uber gesagt worden, welche Rolle die resultierende mathematische Struktur bei der Auswahl der mathematischen Modelle gespielt hat (in der Physik gibt es da ¨ nat¨ urlich weniger Optionen als in der Okonomie). Als n¨achstes betrachten wir einige Beispiel daf¨ ur, wie man aus konkreten Problemen in nat¨ urlicher Weise auf abstrakte (algebraische) Strukturen gef¨ uhrt wird: Beispiel 0.2.3 (Teilbarkeitsregeln): 7?
Wir beginnen mit der Frage: Gibt es eine Teilbarkeitsregel f¨ ur
Eine Zahl ist durch 7 teilbar, wenn sie bei Teilung durch 7 den Rest 0 liefert. Es liegt also nahe, von jeder Zahl z den Rest r zu betrachten, der sich ergibt, wenn man durch 7 teilt. Man schreibt dann z≡r
mod 7
und spricht vom Teilen mit Rest modulo 7. Wir schreiben unsere Zahlen im Zehnersystem und an dieser Darstellung wollen wir die Teilbarkeit durch 7 ablesen. Es ist also nicht abwegig, zun¨achst die Reste modulo 7 der Zehnerpotenzen zu berechnen: 1 10 100 1000 10000 100000 1000000
= = = = = = =
1 ≡ 1 mod 7 10 × 1 ≡ 3 × 1 mod 7 ≡ 3 mod 7 10 × 10 ≡ 3 × 3 mod 7 ≡ 2 mod 7 10 × 100 ≡ 3 × 2 mod 7 ≡ 6 mod 7 10 × 1000 = 3 × 6 mod 7 ≡ 4 mod 7 10 × 10000 ≡ 3 × 4 mod 7 ≡ 5 mod 7 10 × 100000 ≡ 3 × 5 mod 7 ≡ 1 mod 7
1 10 100 1000 10000 100000 1000000
= = = = = = =
0+1 7+3 98 + 2 994 + 6 9996 + 4 99995 + 5 999999 + 1
6
KAPITEL 0. VORBEMERKUNG
Ab hier wiederholen sich die Reste der Zehnerpotenzen modulo 7, weil man ja modulo 7 immer wieder mit 3 multipliziert: 10000000
= etc.
10 × 1000000 ≡ 3 × 1
mod 7 ≡ 3
mod 7
Man schreibt jetzt eine beliebige Zahl im Zehnersystem, d.h. als gewichtete Summe von Zehnerpotenzen, z.B. 94328 = 9 × 10000 + 4 × 1000 + 3 × 100 + 2 × 10 + 8 × 1 und rechnet die Reste modulo 7 aus: 94328
mod 7 ≡ 9 × 4 + 4 × 6 + 3 × 2 + 2 × 3 + 8 × 1
mod 7
Die Zahl 94328 ist also durch 7 teilbar, wenn 9×4+4×6+3×2+2×3+8×1 durch 7 teilbar ist. Wir haben also eine gewichtete Quersummenregel“ ” Man multipliziere die Einer mit 1 Zehner mit 3 Hunderter mit 2 Tausender mit 6 Zehntausender mit 4 Hunderttausender mit 5 und dann von vorne, etc. So erh¨alt man eine gewichtete Quersumme. Die Zahl ist durch 7 teilbar genau dann, wenn die gewichtete Quersumme durch 7 teilbar ist. Die Vorgehensweise l¨aßt sich sofort auf andere Zahlen u ¨bertragen: Teilbarkeit durch n 1.Schritt: Bestimme die Restklassen“ modulo n der 10er-Potenzen. Da es nur endlich viele Restklassen ” gibt, ergibt sich nach einem endlichen Anlauf“ eine periodische Struktur: ”
(Bemerkung: Daß es f¨ ur 7 es keinen Anlauf gibt, liegt daran, daß 7 eine Primzahl ist.) 2.Schritt: Schreibe eine Zahl m in der Form m = ak 10k + ak−1 10k−1 + . . . + a1 10 + a0 und berechne die Restklasse von m u ¨ber die Restklassen der aj gewichtet mit den Restklassen der 10j .
¨ 0.2. UBER DIE ABSTRAKTION IN DER MATHEMATIK
7
¨ Aus dem allgemeinen Verfahren kann man als Ubung die u ur: ¨blichen Teilbarkeitsregeln f¨ 3 4 5 8 9 11
(Quersumme) (letzten zwei Ziffern) (letzte Ziffer) (letzten drei Ziffern) (Quersumme) (alternierende Quersumme)
ableiten.
Analyse der Vorgehensweise: • Statt mit den Zahlen selbst haben wir mit ihren Resten modulo 7 gearbeitet, d.h. Zahlen mit gleichen Resten (diese bilden die Restklasse modulo 7) sind in dieser Problemstellung in jeder Hinsicht gleichwertig (¨ aquivalent). ¨ • Die Aufteilung in Aquivalenzklassen nach dem relevanten Merkmal (Restklassen modulo 7) bringt eine drastische Reduktion der Anzahl der zu betrachtenden Objekte (von unendlich vielen auf 7).
• Wir haben die Rechenoperationen + und × auf die Restklassen u ¨bertragen (das habe ich in der Tabelle der Zehnerpotenzen versteckt) und damit eine abstrakte algebraische Struktur eingef¨ uhrt, d.h. eine Menge (die Restklassen) mit Verknu ¨ pfungen (Addition und Multiplikation; hier ergibt sich ein sogenannter Ring). + 0 1 2 3 4 5 6
0 0 1 2 3 4 5 6
1 1 2 3 4 5 6 0
2 2 3 4 5 6 0 1
3 3 4 5 6 0 1 2
4 4 5 6 0 1 2 3
5 5 6 0 1 2 3 4
6 6 0 1 2 3 4 5
× 0 1 2 3 4 5 6
0 0 0 0 0 0 0 0
1 0 1 2 3 4 5 6
2 0 2 4 6 1 3 5
3 0 3 6 2 5 1 4
4 0 4 1 5 2 6 3
5 0 5 3 1 6 4 2
6 0 6 5 4 3 2 1
• Wir haben festgestellt, daß sich die Methode von 7 auf beliebige Zahlen verallgemeinern l¨aßt und es ist dann auch nicht mehr schwer, vom Zehner- auf ein beliebiges anderes System u ¨berzugehen.
Beispiel 0.2.4 (Symmetrie): Betrachte die regelm¨aßigen Vielecke
8
KAPITEL 0. VORBEMERKUNG
Es stellt sich die Frage, wie man die augenf¨alligen Symmetrie-Eigenschaften dieser Figuren pr¨azise beschreiben kann. Hier ist eine erste Antwort: Symmetrie ist eine Bewegung, die die Figur mit sich selbst zur Deckung bringt (z.B. Spiegelung oder Rotation). Solche Symmetrien kann man hintereinanderschalten und erh¨alt wieder eine algebraische Struktur (hier ist es eine Gruppe)
A
B
C
D
C
D
B
A
B
C
A
D
Es ist allerdings nicht wirklich klar, was eine Bewegung ist und damit ist der Begriff Symmetrie etwas vage gelassen. Abhilfe schafft hier der Begriff der Abbildung, ein Begriff, der in Mathematik absolut zentral ist: Wenn A und B zwei Mengen (von irgendwelchen Objekten, z.B. Punkten auf einem Vieleck) sind, dann ist eine Abbildung f : A → B eine Vorschrift, jedem Element von A ein Element von B zuzuordnen. ¨ Dies ist eine Abstraktion der Vorstellungen Vergleichen“ (von A und B z.B. durch Ubereinanderlegen) ” und Messen“ (von A durch B z.B. durch Anlegen eines Maßstabs oder durch Zuordnung einer Zahl). ”
¨ 0.2. UBER DIE ABSTRAKTION IN DER MATHEMATIK
9
A
B A ‘‘größer’’ als B
A
f
B
A ‘‘kleiner’’ als B
A
Die Punkte von A werden gemessen
f
Jetzt l¨aßt sich eine pr¨azisere Definition von Symmetrie formulieren: Eine Symmetrie von A ist eine Abbildung f : A → A, f¨ ur die jedes Element von A als Bild von genau einem Element von A auftaucht (jedes Element wird von genau einem Pfeil getroffen). An dieser Stelle kann man dann noch Zusatzforderungen stellen (z.B. Geraden auf Geraden, Winkel sollen erhalten bleiben, die Figuren sollen nicht zerrissen werden, etc.)
Wenn man nur die Rotationssymmetrien des n-Ecks betrachtet, dann liefert n-malige Anwendung der Rotation um 360 achste) die Identit¨at. Das erinnert an die n-fache n Grad (von einer Ecke auf die n¨ Addition von 1 in den Restklassen modulo n aus Beispiel 0.2.3. Vergleichen wir • Die Rotationen Rk des n-Ecks um k ×
360 n
Grad mit der Hintereinanderausf¨ uhrung
und • Die Restklassen [k] = {m | m ≡ k mod n} modulo n mit der Addition, so finden wir eine Korrespondenz Rk ←→ [k], die zus¨atzlich Rk ◦ Rk0 = [k] + [k 0 ] erf¨ ullt (◦ bezeichnet die Hintereinanderausf¨ uhrung). Man sagt, die beiden Strukturen sind isomorph (hier als Gruppen) und stellt fest, daß Aussagen, die die Verkn¨ upfungen betreffen, mit dieser Isomorphie von einer zur anderen Struktur einfach transferiert werden k¨onnen.
10
0.3
KAPITEL 0. VORBEMERKUNG
Die Sprache der Mathematik: Mengenlehre
¨ Die ersten Objekte mathematischer Uberlegungen waren Zahlen und geometrische Figuren. Was diese ¨ Objekte eigentlich sind, war praktisch von Anfang an Gegenstand intensiver Uberlegungen und kontroverser Philosophien. Im Laufe der Zeit kamen weitere mathematische Objekte ganz unterschiedlicher Natur hinzu wie z.B. Variablen, Gleichungen, Funktionen, etc. Die moderne Mathematik bedient sich der Mengenlehre zur Beschreibung aller mathematischen Objekte. Zahlen, Figuren, Funktionen sind Mengen mit gewissen Eigenschaften. Dabei ist keineswegs klar, was eine Menge ist. Der Begr¨ under der Mengenlehre G. Cantor gab folgende Definition“ einer Menge: Unter einer Menge verstehen wir jede Zusammenfas” sung von bestimmten wohlunterschiedenen Objekten unserer Anschauung oder unseres Denkens zu einem Ganzen. Dies ist keine wirkliche Erkl¨arung, weil der unbekannte Begriff Menge auf den ebenfalls unbekannten Begriff Zusammenfassung zu einem Ganzen zur¨ uckgef¨ uhrt wird. Widerspr¨ uchliche Bildungen solcher Zusammenfassungen f¨ uhren zu logischen Problemen wie dem vom Dorfbarbier, der alle M¨anner des Dorfes rasiert, die sich nicht selbst rasieren (rasiert er sich selbst oder nicht?). Antinomien wie diese f¨ uhrten Anfang des zwanzigsten Jahrhunderts in einen Streit u ¨ber die Grundlagen der Mathematik, der bis heute nicht wirklich ausgestanden ist. F¨ ur die gegenw¨artige Praxis der Mathematik ist vor allem bedeutsam, daß sich die axiomatische Methode, eine Theorie aus nicht hinterfragten Grundtatsachen (Axiomen) unter Ben¨ utzung festgelegter logischer Regeln aufzubauen, universell durchgesetzt hat. Auch f¨ ur die Mengenlehre und die Logik gibt es solche axiomatischen Zug¨ange, allerdings sind sie f¨ ur den Laien oder Anf¨anger nicht nachvollziehbar. Daher st¨ utzt man sich bei der Einf¨ uhrung in die Mathematik auf (m¨oglichst wenige) intuitive Konzepte, aus denen man dann das mathematische Geb¨aude aufbaut. Diese intuitiven Konzepte werden schließlich (in Vorlesungen wie Axiomatische Mengentheo” rie“ oder Logik“) hinterfragt, wenn die Studierenden eine gewisse Vertrautheit mit mathematischen ” Denkweisen erlangt haben. Ausgangspunkt f¨ ur unseren naiven“ Zugang zur Mengenlehre ist, daß eine Menge durch ihre Ele” mente festgelegt wird: Eine Menge ist gebildet, wenn feststeht, welche Objekte dazugeh¨ oren. Die Objekte, die zu einer Menge geh¨oren, heißen Elemente der Menge. Wenn M eine Menge ist und a ein Element von M , dann schreibt man a ∈ M (a ist Element von M ). Eine Menge kann man beschreiben, indem man alle seine Elemente aufz¨ahlt, oder aber indem man seine Elemente durch eine Eigenschaft charakterisiert: {a, b, c, d, e} ist die Menge der ersten f¨ unf (kleinen) Buchstaben des Alphabets und {x | x ∈ Z und
x ∈ Z} 2
ist die Menge der durch 2 teilbaren ganzen Zahlen (wenn wir akzeptieren, daß Z die Menge der ganzen Zahlen ist). Die Klammern { }, die in dieser Schreibweise vorkommen, nennt man Mengenklammern. Will man klarstellen, daß eine Menge aus Elementen einer vorgegebenen Menge X besteht, schreibt man auch {x ∈ X | Eigenschaften von x}, zum Beispiel
x ∈ Z} 2 f¨ ur die geraden Zahlen von oben. Wenn a kein Element von M ist, schreibt man a 6∈ M . Entsprechend unserem Ausgangspunkt nennen wir zwei Mengen gleich, wenn sie die gleichen Elemente enthalten. Also sind die Mengen {a, b, c, d, e} und {e, d, c, b, a} {x ∈ Z |
gleich, nicht aber die Mengen {a, b, c, d, e}
und {e, d, b, a}.
Wenn A und B Mengen sind, dann heißt A eine Teilmenge von B, wenn jedes Element von A auch Element von B ist. Man schreibt dann A ⊆ B. Es gilt also {e, d, b, a} ⊆ {a, b, c, d, e}.
0.3. DIE SPRACHE DER MATHEMATIK: MENGENLEHRE
11
F¨ ur jede Teilmenge A ⊆ B kann man ihr Komplement {b ∈ B | b 6∈ A} betrachten. Es wird mit B \ A oder (wenn B aus dem Kontext klar ist) {A bezeichnet. Wenn A keine Teilmenge von B ist, schreibt man A 6⊆ B. Die Menge PM := {N | N ⊆ M } aller Teilmengen von M heißt die Potenzmenge von M . Hat man zwei Mengen A und B, so gibt es verschiedene M¨oglichkeiten, daraus neue Mengen zu konstruieren: {x | x ∈ A oder x ∈ B} heißt die Vereinigung von A und B und wird mit A ∪ B bezeichnet. Dagegen heißt {x | x ∈ A und x ∈ B} der Schnitt von A und B und wird mit A ∩ B bezeichnet. Um sicherzustellen, daß der Schnitt zweier Mengen immer gebildet werden kann, muß man eine besondere Menge zulassen: die leere Menge, die u ¨berhaupt kein Element enth¨alt und mit ∅ bezeichnet wird. Die Definition von Schnitt und Vereinigung von zwei Mengen l¨aßt sich problemlos auf beliebig viele Mengen verallgemeinern: Hat man eine Familie von Mengen Aj mit j ∈ J, so ist [ Aj = {x | es gibt ein j ∈ J mit x ∈ Aj } j∈J
die Vereinigung der Aj und \
Aj = {x | f¨ ur alle j ∈ J gilt x ∈ Aj }
j∈J
der Schnitt der Aj . Die Vereinigung S von disjunkten Mengen, d.h. Mengen, deren Schnitt leer ist, bezeichnen wir oft mit A ∪. B bzw. . j∈J Aj . Eine dritte Menge, die man aus A und B bauen kann, ist das kartesische Produkt. Es besteht aus allen geordneten Paaren (a, b) mit a ∈ A und b ∈ B und wird mit A × B bezeichnet: A × B := {(a, b) | a ∈ A, b ∈ B}. (Wann immer wir eine neue Bezeichnung N f¨ ur ein bekanntes Objekt B einf¨ uhren, schreiben wir N := B). Das kartesische Produkt ist n¨ utzlich, wenn es darum geht, Beziehungen zwischen Elementen einer oder mehrerer Mengen zu modellieren. Betrachtet man als Beispiel die Menge H aller H¨orer der Vorlesung Analysis I und S, die Menge aller an der Universit¨at Paderborn angebotenen Studienrichtungen, so l¨ aßt sich aus der Teilmenge {(x, F ) ∈ H × S | x studiert F } von H ×S ablesen, welcher H¨orer welches Fach studiert. Allgemein bezeichnet man jede Teilmenge R eines kartesischen Produkts A × B als eine Relation zwischen A und B. Die Interpretation von (a, b) ∈ R ist: a steht in Relation“ R zu b. Man schreibt auch oft aRb statt (a, b) ∈ R. Wenn A gleich B ist, d.h. ” die Relation aus Elementen von A × A besteht, spricht auch von einer Relation auf A. Beispiel 0.3.1 : Sei A = {1, 3, 5} und B = {2, 3, 4}. Dann ist R := {(1, 2), (1, 3), (1, 4), (3, 4)} eine Relation. Bei genauerem Hinsehen stellt man fest, daß (a, b) ∈ A × B genau dann Element der Relation ist, wenn a kleiner als b ist. Wenn man jetzt die Relation < statt R nennt, wird die Schreibweise aRb zu a < b. Auf diese Weise erh¨alt man eine saubere mengentheoretische Beschreibung der Relation ohne auf die gewohnte intuitive Schreibweise verzichten zu m¨ ussen. Wenn jedes Element von A zu genau einem Element von B in Relation steht, nennt man so eine Relation eine Abbildung oder Funktion von A nach B. Die Idee hinter dieser Setzung ist, daß man
12
KAPITEL 0. VORBEMERKUNG
jedem Element a von A genau ein Element b von B zuordnen will, n¨amlich dasjenige mit (a, b) ∈ R. Man schreibt dann R : A → B, a 7→ R(a) und R(a) = b f¨ ur (a, b) ∈ R. Auch hier dient die ver¨anderte Schreibweise dazu, saubere mengentheoretische Definitionen (in denen nicht von Variablen etc. die Rede ist) und die traditionelle Notation f¨ ur Funktionen unter einen Hut zu bringen. Die obige Relation zwischen H¨orern der Analysis I und Studienrichtungen der Universit¨at Paderborn ist also genau dann eine Funktion, wenn jeder H¨orer f¨ ur eine Studienrichtung eingeschrieben ist, aber nicht f¨ ur mehrere (jedem H¨orer l¨aßt sich in eindeutiger Weise ein Studienfach zuordnen). Nicht ausgeschlossen ist durch die Definition der Funktion, daß mehrere H¨orer das gleiche Fach studieren. Die Formalisierung des Funktionsbegriffs als Teilmenge eines kartesischen Produkts mit gewissen Eigenschaften ist ein erstes Beispiel daf¨ ur, daß die Mengenlehre in der Lage ist, einen einheitlichen Rahmen f¨ ur zun¨achst als ganz verschieden betrachtete mathematische Begriffe zu schaffen. Sie ist ein wesentlicher Schritt im stufenweisen Aufbau eines immer komplexer werdenden mathematischen Universums, in dem nach immer den gleichen Prinzipien aus Mengen Funktionen zwischen Mengen, dann Mengen von Funktionen zwischen Mengen, dann Funktionen zwischen Mengen von Funktionen zwischen Mengen, etc. werden. An dieser Stelle k¨onnte man schon eine Reihe von Eigenschaften von Vereinigungs- und Durchschnittsmengen, Relationen und Funktionen beweisen. Da hier aber die Mengentheorie nicht Selbstzweck, sondern nur Startpunkt f¨ ur das Studium von Zahlensystemen, Gleichungen und Funktionen sein soll, schieben wir ¨ mengentheoretische Uberlegungen immer dort ein, wo sie tats¨achlich gebraucht werden. Die ersten Kapitel dieses Skripts handeln von mathematischen Objekten (Zahlen und Funktionen), die den meisten H¨orern bis zu einem gewissen Grad vertraut sind, und deren Eigenschaften sie wahrscheinlich auch ohne formale Beweise zu akzeptieren bereit w¨aren. Ein wesentlicher Grund daf¨ ur, daß diese Objekte hier dennoch so sorgf¨altig eingef¨ uhrt werden, liegt in der M¨oglichkeit, wichtige mathematische Denk- und Vorgehensweisen an vertrauten Objekten vorzuf¨ uhren. Da die an diesen Beispielen entwickelten Methoden im Laufe der Vorlesung und des gesamten Mathematikstudiums immer wieder ben¨ utzt werden, w¨are es unklug, diese Kapitel links liegen zu lassen, nur weil die Ergebnisse vertraut erscheinen. Mathematische Gesetzm¨aßigkeiten werden normalerweise als S¨ atze formuliert. S¨atze k¨onnen unterschiedliches Gewicht und unterschiedliche Funktionen haben. Einen Satz, den man (gemessen am Kontext) relativ leicht beweisen kann, bezeichnet man oft als Proposition. S¨atze, die vorbereitender Natur sind, werden oft Lemma genannt. Das Wort Lemma (Plural: Lemmata) ist griechisch und bedeutet Horn (weist eine Richtung - vgl. Dilemma). Dagegen heißen S¨atze, die mehr oder weniger unmittelbare Konsequenzen eines vorausgehenden Satzes sind, oft Korollar. Axiom 0.3.2 (Auswahlaxiom): Sei Γ eine Menge und {Uγ | γ ∈ Γ} eine Menge von nichtleeren Mengen. Dann kann man aus jedem Uγ ein Element xγ ∈ Uγ ausw¨ahlen. Schwierigkeiten macht das Auswahlaxiom, wenn M sehr viele (z.B. u ¨berabz¨ahlbar viele) Elemente enth¨alt. Das Auswahlaxiom ist plausibel, aber unabh¨angig von den g¨angigen Axiomensystemen der Mengenlehre (z.B. Zermelo–Fraenkel) und damit nicht beweisbar. Die Frage, ob man das Auswahlaxiom ben¨ utzen darf, hat im Grundlagenstreit eine wichtige Rolle gespielt. Wir merken an, daß wir das Auswahlaxiom ben¨ utzen, wo immer wir es nicht vermeiden k¨onnen.
Eine partielle Ordnung auf einer Menge M ist eine Relation ≤ auf M , die folgende Eigenschaften hat: (a) x ≤ x (Reflexivit¨ at). (b) Aus x ≤ y und y ≤ z folgt x ≤ z (Transitivit¨ at). (c) Aus x ≤ y und y ≤ x folgt x = y (Antisymmetrie). Man schreibt auch y ≥ x f¨ ur x ≤ y. Eine partielle Ordnung, die F¨ ur alle x, y ∈ M : (x ≤ y oder y ≤ x)
0.3. DIE SPRACHE DER MATHEMATIK: MENGENLEHRE
13
erf¨ ullt, heißt totale Ordnung. ¨ Um sich die Schreibarbeit zu vereinfachen und um sp¨ater bei komplizierteren Aussagen den Uberblick zu behalten, ben¨ utzt man f¨ ur die Quantoren f¨ ur alle“ und es existiert ein“ abk¨ urzende Schreibweisen ” ” ein: • Statt f¨ ur alle“ (oder zu jedem“) schreibt man ∀“ ” ” ” • Statt gibt es“ (oder existiert“) schreibt man ∃“ ” ” ” Sei (M, ≤) eine partiell geordnete Menge und N ⊆ M . Dann heißt x ∈ M eine obere Schranke von N , wenn y ≤ x f¨ ur alle y ∈ N gilt. Analog heißt x ∈ M eine untere Schranke von N , wenn x ≤ y f¨ ur alle y ∈ N gilt. N heißt total geordnet oder eine Kette, wenn die Einschr¨ankung der Relation ≤ auf N eine totale Ordnung ist. Eine total geordnete Menge M heißt induktiv geordnet, wenn jede total geordnete Teilmenge eine obere Schranke besitzt. Ein Element x ∈ N heißt maximal in N , wenn ∀x0 ∈ N : (x ≤ x0 ⇒ x = x0 ). Axiom 0.3.3 (Zornsches Lemma): Jede induktiv geordnete Menge hat ein maximales Element.
Eine total geordnete Menge M heißt wohlgeordnet, wenn jede nichtleere Teilmenge N von M ein kleinstes Element hat, d.h. eine untere Schranke, die zu N geh¨ort. Axiom 0.3.4 (Wohlordnungssatz): Jede Menge kann wohlgeordnet werden. Man kann zeigen, daß das Zornsche Lemma 0.3.3 ¨aquivalent zu einer Reihe anderer mengentheoretischer Aussagen ist, darunter auch das Auswahlaxiom 0.3.2 und der Wohlordnungssatz 0.3.4. Damit ist das Zornsche Lemma zwar in der Mengenaxiomatik von Zermelo-Fraenkel unter Zuhilfenahme des Auswahlaxioms beweisbar, nicht aber ohne dieses. Es birgt daher dieselben Schwierigkeiten wie das Auswahlaxiom und wir setzen es als Axiom ein.
Literatur: [DH85], [Ha72], [GH70] [If86], [Kat98], [Kl72], [Si98]
14
KAPITEL 0. VORBEMERKUNG
Analysis I
15
Kapitel 1
Axiomatik der reellen Zahlen In diesem Kapitel entwickeln wir ein Axiomensystem f¨ ur die reellen Zahlen, indem wir ausgehend von Minimalforderungen an ein brauchbares Zahlensystem zus¨ atzliche (plausible) Eigenschaften fordern, bis wir bei den in der Schule (intuitiv) ben¨ utzten reellen Zahlen landen.
1.1
Rechenregeln
Die entscheidende Eigenschaft, die aus einer beliebigen Menge eine Menge von Zahlen macht, ist die Existenz von Rechenoperationen wie Addition und Multiplikation. Ein Beispiel f¨ ur so eine Menge sind die nat¨ urlichen Zahlen. Allerdings reichen die nat¨ urlichen Zahlen f¨ ur praktische Rechnungen oft nicht aus. Zum Beispiel ist die einschr¨ankende Voraussetzung a < b“ in der Proposition A.2.3 u ¨ber die L¨osbarkeit ” von Gleichungen in der Praxis ein gravierendes Problem. Noch schlimmer, f¨ ur die Multiplikation hat man u ¨berhaupt kein Analogon zu Proposition A.2.3. Im ersten Abschnitt dieses Kapitels entwickeln wir ein Axiomensystem f¨ ur Zahlbereiche mit Addition und Multiplikation, in das die L¨osbarkeit von additiven und multiplikativen Gleichungen gleich eingebaut ist. Im zweiten Abschnitt integrieren wir den Gr¨oßenvergleich in unser Axiomensystem und im dritten Abschnitt schließen wir die Axiomatik mit dem Vollst¨andigkeitsaxiom ab. Dieses Axiom pr¨azisiert die Vorstellung, daß die Zahlengerade keine L¨ocher hat.
Addition Sei Z eine feste nichtleere Menge, die wir zu einer Menge von Zahlen1 machen wollen. Auf Z sei eine Addition gegeben, d.h. eine Abbildung a : Z × Z → Z, f¨ ur die wir die Notation x + y := a(x, y) einf¨ uhren und die die drei folgenden Axiome erf¨ ullt: Axiom 1.1.1 (Kommutativit¨ at): Axiom 1.1.2 (Assoziativit¨ at): Axiom 1.1.3 (L¨ osbarkeit):
∀x, y ∈ Z : x + y = y + x. ∀x, y, z ∈ Z : x + (y + z) = (x + y) + z.
∀a, b ∈ Z ∃x ∈ Z : a + x = b.
Als erste Konsequenz der Axiome f¨ ur die Addition auf Z finden wir die Null: Satz 1.1.4 : Es gibt genau ein n ∈ Z mit ∀x ∈ Z : x + n = x. 1 Wir
geben hier keine formale Definition des Begriffes Zahl“, sondern versuchen die Eigenschaften der reellen Zahlen ” (nicht der nat¨ urlichen Zahlen) zu axiomatisieren.
17
18
KAPITEL 1. AXIOMATIK DER REELLEN ZAHLEN
Beweis: Idee: Ein n, das eine solche Gleichung l¨ost, l¨ost alle solchen Gleichungen. Existenz: W¨ahle ein a ∈ Z, dann garantiert Axiom 1.1.3 die Existenz einer L¨osung der Gleichung a + z = a, d.h. eines Elements n ∈ Z mit a + n = a. Wir zeigen, daß mit diesem n f¨ ur alle x ∈ Z gilt x + n = x. W¨ahle dazu ein x ∈ Z. Wieder mit Axiom 1.1.3 finden wir ein y ∈ Z mit a + y = x. Dann rechnet man x+n
=
(a + y) + n
Ass
=
a + (y + n)
Kom
=
a + (n + y)
Ass
=
(a + n) + y
Def
a+y x
= =
Um die Eindeutigkeit zu zeigen, nimmt man an, man hat zwei solche Elemente n1 und n2 . Es gilt dann n1 = n1 + n2 = n2 + n1 = n2 .
Die durch den Satz 1.1.4 bestimmte Zahl heißt Null und wird mit 0 bezeichnet. Wegen der Kommutativit¨at der Addition erf¨ ullt sie auch die Gleichung 0 + x = x f¨ ur alle x ∈ Z. Satz 1.1.5 : Zu a, b ∈ Z gibt es genau ein x ∈ Z mit a + x = b. Beweis: Idee: Kombiniere die Axiome der Addition mit Satz 1.1.4. Die Existenz einer L¨osung ist durch Axiom 1.1.3 garantiert. Seien x1 und x2 zwei L¨osungen, d.h. a + x1 = b = a + x2 . Wieder mit Axiom 1.1.3 findet man ein z ∈ Z mit z + a = a + z = 0. Dann rechnet man mit Satz 1.1.4 sowie Kommutativit¨at und Assoziativit¨at x1 = 0 + x1 = (z + a) + x1 = z + (a + x1 ) = z + (a + x2 ) = (z + a) + x2 = 0 + x2 = x2 .
Die eindeutige L¨osung x ∈ Z der Gleichung a + x = b f¨ ur a, b ∈ Z heißt die Differenz von b und a und wird mit b − a bezeichnet. Die Zahl −a := 0 − a ∈ Z heißt das Negative oder das additive Inverse von a ∈ Z. Proposition 1.1.6 : Seien a, b ∈ Z. Dann gilt (i) a + (b − a) = b. (ii) a − a = 0. (iii) (b + a) − a = b.
1.1. RECHENREGELN
19
(iv) a + (−a) = 0. (v) b + (−a) = b − a. (vi) −(−b) = b. Beweis: Idee: Dies folgt direkt aus den Definitionen sowie Satz 1.1.5.
(i) Folgt unmittelbar aus der Definition der Differenz. (ii) Mit (i) folgt aus a + 0 = a mit Satz 1.1.5 die Gleichung a − a = 0. (iii) Wieder mit (i) liefert a + ((b + a) − a) = b + a die Gleichung ((b + a) − a) + a = b + a, woraus mit Satz 1.1.5 die Gleichung (b + a) − a = b folgt. (iv) Setze b = 0 in (i). (v) Wegen (iv) gilt (a + (−a)) + b = 0 + b = b, also wegen Kommutativit¨at und Assoziativit¨at a + (b + (−a)) = b und damit b + (−a) = b − a. (vi) 0 = b + (−b) = (−b) + b impliziert b = 0 − (−b) = −(−b), wobei die letzte Gleichheit aus (v) folgt.
¨ aten f¨ ur a, b, c, d ∈ Z Ubung 1.1.1 : Beweise die folgenden Identit¨ (i) a − 0 = a (ii) a + (b − c) = (a + b) − c (iii) −(b − a) = a − b (iv) a − (b − c) = (a + c) − b (v) (a − b) + (c − d) = (a + c) − (b + d) (vi) −(a + b) = −a − b
Multiplikation Wir erg¨anzen unsere Forderungen bez¨ uglich einer Addition auf Z durch analoge Forderungen bez¨ uglich einer Multiplikation, die gegeben ist als eine Abbildung m : Z × Z → Z, f¨ ur die wir die Notation xy := x · y := m(x, y) einf¨ uhren und die die drei folgenden Axiome erf¨ ullt: Axiom 1.1.7 (Kommutativit¨ at): Axiom 1.1.8 (Assoziativit¨ at): Axiom 1.1.9 (L¨ osbarkeit):
∀x, y ∈ Z : xy = yx. ∀x, y, z ∈ Z : x(yz) = (xy)z.
∀0 6= a ∈ Z, ∀b ∈ Z : (∃x ∈ Z : ax = b).
Die weitgehende Analogie in der Formulierung der Axiome f¨ ur die Multiplikation und die Addition f¨ uhrt dazu, daß es auch weitgehende Analogien in Resultaten und deren Beweisen f¨ ur Addition und Multiplikation gibt. Eine erste Konsequenz der Axiome f¨ ur die Multiplikation auf Z ist die Existenz einer Eins:
20
KAPITEL 1. AXIOMATIK DER REELLEN ZAHLEN
Satz 1.1.10 : Es gibt genau ein e ∈ Z mit ∀x ∈ Z : xe = x. Beweis: Idee: L¨ost e eine solche Gleichung (f¨ur x 6= 0), so l¨ost e alle solchen Gleichungen. Zun¨achst sondern wir einen pathologischen Fall aus: Wenn Z = {0}, dann ist die Aussage des Satzes trivialerweise richtig. Ab sofort nehmen wir an, daß 0 nicht das einzige Element von Z ist. Existenz: W¨ahle ein 0 6= a ∈ Z, dann garantiert Axiom 1.1.9 die Existenz einer L¨osung der Gleichung ax = a, d.h. eines Elements e ∈ Z mit ae = a. Wir zeigen, daß mit diesem e f¨ ur alle x ∈ Z gilt xe = x. W¨ahle dazu ein x ∈ Z. Wieder mit Axiom 1.1.9 finden wir ein y ∈ Z mit ay = x. Dann rechnet man Ass
Kom
Ass
Def
xe = (ay)e = a(ye) = a(ey) = (ae)y = ay = x. Um die Eindeutigkeit zu zeigen, nimmt man an, man h¨atte zwei solche Elemente e1 und e2 . Es gilt dann e1 = e1 e2 = e2 e1 = e2 .
Die durch den Satz 1.1.10 bestimmte Zahl heißt Eins und wird mit 1 bezeichnet. Satz 1.1.11 : Zu 0 6= a ∈ Z und b ∈ Z gibt es genau ein x ∈ Z mit ax = b. Beweis: Idee: Kombiniere die Axiome der Addition mit Satz 1.1.10. Seien x1 und x2 L¨osungen, d.h. ax1 = n = ax2 . W¨ahle ein z ∈ Z mit za = az = 1. Dann rechnet man mit Satz 1.1.10 sowie Kommutativit¨at und Assoziativit¨at x1 = 1 · x1 = (za)x1 = z(ax1 ) = z(ax2 ) = (za)x2 = 1 · x2 = x2 .
Bruchrechnen Die durch Satz 1.1.11 garantierte eindeutige L¨osung x ∈ Z der Gleichung ax = b f¨ ur 0 6= a ∈ Z, b ∈ Z b 1 heißt der Quotient von b und a und wird mit bezeichnet. Die Zahl ∈ Z heißt der Kehrwert oder a a das multiplikative Inverse von 0 6= a ∈ Z. Man ben¨ utzt auch die Notation a−1 f¨ ur das multiplikative Inverse von a. Proposition 1.1.12 : Seien a, b, c ∈ Z mit a 6= 0. Dann gilt (i) a
b = b. a
1.1. RECHENREGELN (ii)
a = 1. a b cb = . a a
(iii) c (iv) (v)
21
ab = b. a 1 1 a
= a.
Beweis: Idee: Dies folgt direkt aus den Definitionen sowie Satz 1.1.11.
(i) Folgt unmittelbar aus der Definition des Quotienten. a (ii) Aus a · 1 = a folgt mit (i) und der Eindeutigkeit aus Satz 1.1.11 die Gleichung = 1. a ³ b´ ³ ´ b b b cb (iii) a c = ac = c a = cb zeigt mit Satz 1.1.11, daß c = . a a a a a ba a (iv) = b = b · 1 = b. a a ³ 1´ ³1´ 1 (v) Wegen 1 = a ist a die L¨osung von x = 1, d.h. gleich 1 . a a a
Bislang stehen Addition und Multiplikation (abgesehen von der Einschr¨ankung a 6= 0 in Axiom 1.1.9) zusammenhangslos nebeneinander. Sie werden durch das folgende Distributivgesetz miteinander verkn¨ upft: Axiom 1.1.13 (Distributivit¨ at):
∀x, y, z ∈ Z : x(y + z) = (xy) + (xz).
Proposition 1.1.14 : Seien x, y, z ∈ Z. Dann gilt (i) (x + y)z = (xz) + (yz). (ii) x(y − z) = (xy) − (xz). (iii) 0 · x = 0. (iv) (−x)y = −(xy). Beweis: Idee: Nachrechnen mit den Definitionen, Axiom 1.1.13, Satz 1.1.5 und Proposition 1.1.6.
1.1.13
(i) (x + y)z = z(x + y) = (zx) + (zy) = (xz) + (yz). 1.1.6
1.1.13
(ii) xy = x(z + (y − z)) = (xz) + x(y − z), also x(y − z) = (xy) − (xz) wegen Satz 1.1.5. (iii) 0 · x = x · 0 = x(y − y) = (xy) − (xy) = 0 nach Proposition 1.1.6. (ii)
(iii)
(iv) (−x)y = (0 − x)y = 0 · y − (xy) = 0 − (xy) = −(xy).
22
KAPITEL 1. AXIOMATIK DER REELLEN ZAHLEN
Bemerkung 1.1.15 : (i) Wegen z · 1 = z f¨ ur alle z ∈ Z und z · 0 = 0 kann 1 = 0 nur gelten, wenn Z = {0}. (ii) Im Beweis von Proposition 1.1.14 wurde das Axiom 1.1.9 nicht ben¨ utzt. Dieser Umstand spielt zum Beispiel eine Rolle, wenn man Rechenregeln f¨ ur Ringe, wie z.B. die ganzen Zahlen oder Polynome mit Koeffizienten in einem K¨orper, aufstellen (und nicht separat beweisen) will. (iii) Um die Formeln u utzt man f¨ ur gew¨ohnlich die u ¨bersichtlicher zu gestalten, ben¨ ¨bliche Punkt vor Strich-Konvention und l¨aßt entsprechend Klammern weg. Das Distributivgesetz wird dann x(y + z) = xy + xz geschrieben und analog schreibt man x(y − z) = xy − xz.
Proposition 1.1.16 : Seien a, b ∈ Z \ {0}. Dann gilt (i) ab 6= 0. (ii)
a 6= 0. b
Beweis: Idee: Dies folgt mit Satz 1.1.11, Proposition 1.1.12 und Proposition 1.1.14 aus a · 0 = 0 f¨ur alle a ∈ Z.
(i) Wenn ab = 0, dann sind wegen a · 0 = 0 (vgl. Proposition 1.1.14) sowohl b als auch 0 L¨osungen von ax = 0. Die eindeutige L¨osbarkeit (Satz 1.1.11) zeigt daher b = 0 im Widerspruch zur Voraussetzung. a 1 1 (ii) Wegen = a (vgl. Proposition 1.1.12) und (i) gen¨ ugt es zu zeigen, daß 6= 0. Dies b b b 1 folgt aber mit Proposition 1.1.14 aus b = 1 6= 0. b
Wir beweisen die g¨angigen Regeln der Bruchrechnung: Satz 1.1.17 : Seien a, c ∈ Z und b, d ∈ Z \ {0}. Dann gilt ac ac (i) = . bd bd (ii)
a c ad + bc + = . b d bd
(iii)
a ad = . bd b
(iv)
a b c d
=
ad , falls auch c 6= 0. bc
1.1. RECHENREGELN
23
Beweis: Idee: Dies folgt mit Proposition 1.1.12 direkt aus den Definitionen. ³a c ´
ac c ac ac = db = da = ac. Damit folgt = aus der Definition des Quotienten. bd bd d bd bd ³a ´ c (ii) bd + = da + bc impliziert die Behauptung. b d ad ad a (iii) = = . bd bd b c ad acd a = = impliziert die Behauptung. (iv) d bc dbc b (i) bd
Es gibt eine Vielzahl von Zahlbereichen, die die Axiome 1.1.1, 1.1.2, 1.1.3, 1.1.7, 1.1.8, 1.1.9 und 1.1.13 erf¨ ullen. Falls 0 6= 1, nennt man (Z, +, ·) dann auch einen K¨ orper. ¨ Ubung 1.1.2 : Zeige: das Tripel (K, +, ·) mit K = {n, e, k} und + n e k
n n e k
e e k n
k k n e
· n e k
n n n n
e n e k
k n k e
ist ein K¨ orper. ¨ Ubung 1.1.3 : Zeige: ({n, e}, +, ·) mit + n e
n n e
e e n
· n e
n n n
e n e
ist ein K¨ orper. ¨ uchern (vgl. z.B. [J¨ a96], S. 34/35) wird ein K¨ orper wie folgt definiert: Ubung 1.1.4 : In manchen Lehrb¨ Es sei K eine Menge mit zwei Verkn¨ upfungen Addition + : K → K, (a, b) → a + b und Multiplikation · : K → K, (a, b) → a · b. (K, +, ·) heißt K¨ orper, wenn die folgenden Axiome erf¨ ullt sind: (A) Addition (A.1) (Assoziativit¨ at): F¨ ur alle a, b, c ∈ K gilt: (a + b) + c = a + (b + c). (A.2) (Kommutativit¨ at): F¨ ur alle a, b ∈ K gilt: a + b = b + a. (A.3) (Nullelement): Es gibt ein Element 0 ∈ K mit a + 0 = a f¨ ur alle a ∈ K. (A.4) (Invertierbarkeit): Zu jedem Element a ∈ K gibt es ein Element b ∈ K mit a + b = 0. (M) Multiplikation (M.1) (Assoziativit¨ at): F¨ ur alle a, b, c ∈ K gilt: (a · b) · c = a · (b · c). (M.2) (Kommutativit¨ at): F¨ ur alle a, b ∈ K gilt: a · b = b · a. (M.3) (Einselement): Es gibt ein Element 1 ∈ K mit a · 1 = a f¨ ur alle a ∈ K. (M.4) (Invertierbarkeit): Zu jedem Element a ∈ K \ {0} gibt es ein Element b ∈ K \ {0} mit a · b = 1. (D) Distributivgesetz: F¨ ur alle a, b, c ∈ K gilt: a · (b + c) = (a · b) + (a · c). Zeigen Sie, daß diese Definition ¨ aquivalent zu der durch die Axiome 1.1.1, 1.1.2, 1.1.3, 1.1.7, 1.1.8, 1.1.9 und 1.1.13 gegebenen Definition ist.
24
KAPITEL 1. AXIOMATIK DER REELLEN ZAHLEN
1.2
Positivit¨ at und Ordnung
Eine Besonderheit der reellen Zahlen ist ihre Anordbarkeit, die mit Addition und Multiplikation vertr¨aglich ist. Wir fassen das in zwei weitere Axiome f¨ ur Z: Gegeben sei eine Teilmenge P ⊆ Z, die die Rolle der Menge der (strikt) positiven Zahlen spielen soll. Axiom 1.2.1 (Totalordnung):
F¨ ur a ∈ Z gilt genau eine der folgenden Beziehungen: a = 0,
Axiom 1.2.2 (Vertr¨ aglichkeit):
a ∈ P,
−a ∈ P.
F¨ ur a, b ∈ P gilt a + b ∈ P und ab ∈ P .
Einen K¨orper Z, der zus¨atzlich die Axiome 1.2.1 und 1.2.2 erf¨ ullt, nennen wir einen geordneten K¨ orper. Satz 1.2.3 : Sei (Z, +, ·, P ) ein geordneter K¨ orper. Dann gilt a (i) a, b ∈ P ⇒ ∈ P. b (ii) 0 6= a ∈ Z ⇒ aa ∈ P . (iii) 1 ∈ P . Beweis: Idee: Dies leitet man mithilfe der Regeln des Bruchrechnens (vgl. Proposition 1.1.16 und Satz 1.1.17) sowie den Propositionen 1.1.6 und 1.1.14 aus den Axiomen 1.2.1 und 1.2.2 ab.
a (i) Beachte, daß wegen b ∈ P gilt b 6= 0. Proposition 1.1.16 und Axiom 1.2.1 liefern 6= 0. b ³ a´ a Aus − ∈ P folgt wegen b ∈ P und Axiom 1.2.2 −a = − a ∈ P , was im Widerspruch b b a zu Axiom 1.2.1 steht. Also bleibt, wieder mit Axiom 1.2.1, nur der Fall ∈ P u ¨brig. b (ii) Aus 0 6= a ∈ Z folgt a ∈ P oder −a ∈ P . Wenn a ∈ P , dann gilt aa ∈ P wegen Axiom 1.2.2. Wenn −a ∈ P , dann gilt nach den Propositionen 1.1.6 und 1.1.14 die Gleichheit aa = (−a)(−a) und somit, wieder wegen Axiom 1.2.2 aa ∈ P . (iii) Wegen 0 6= 1 und 1 · 1 = 1 folgt 1 ∈ P sofort aus (ii).
Eine Zahl a ∈ Z mit −a ∈ P heißt negativ. Wir definieren eine Relation < auf Z durch a
:⇔
b − a ∈ P,
d.h. < := {(a, b) ∈ Z × Z | b − a ∈ P }, und sagen b ist gr¨ oßer als a (oder, gleichbedeutend, a ist kleiner als b), wenn a < b. Wir schreiben a ≤ b statt
(a < b oder a = b).
Außerdem schreiben wir auch a > b f¨ ur b < a und a ≥ b f¨ ur b ≤ a. Die Relationen < und ≤ werden auch als Ordnungsrelation bezeichnet.
¨ UND ORDNUNG 1.2. POSITIVITAT
25
Proposition 1.2.4 : Sei (Z, +, ·, P ) ein geordneter K¨ orper. Dann gilt f¨ ur a, b, c ∈ Z (i) Es gilt 0 < a genau dann, wenn a ∈ P . (ii) (Trichotomie) Es gilt genau eine der folgenden Beziehungen a = b,
a < b,
b < a.
(iii) (Transitivit¨at) (a < b, b < c)
⇒
a < c.
Beweis: Idee: Dies folgt mit Proposition 1.1.6 direkt aus den Definitionen und den Axiomen 1.2.1 und 1.2.2.
(i) Dies ist eine direkte Konsequenz der Definition von < und a − 0 = a. (ii) Dies ist eine direkte Konsequenz der Definition von < und Axiom 1.2.1. (iii) a < b, b < c liefert b − a ∈ P, c − b ∈ P , also gilt nach Axiom 1.2.2 und Proposition 1.1.6 c − a = (c − b) + (b − a) ∈ P, was seinerseits a < c liefert.
Sei (Z, +, ·, P ) ein geordneter K¨orper und a, b ∈ Z. Nach Proposition 1.2.4 k¨onnen wir durch ( a f¨ ur a ≤ b min({a, b}) := min(a, b) := b f¨ ur a > b das Minimum min(a, b) von a und b definieren. Analog definiert man das Maximum max(a, b) von a und b durch ( b f¨ ur a ≤ b max({a, b}) := max(a, b) := a f¨ ur a > b. Induktiv (vgl. Satz A.1.9) definiert man das Minimum einer endlichen Menge {a1 , . . . , an } ⊆ Z durch ¡ ¢ min({a1 , . . . , an }) := min min({a1 , . . . , an−1 }), an und das Maximum einer endlichen Menge {a1 , . . . , an } ⊆ Z durch ¡ ¢ max({a1 , . . . , an }) := max max({a1 , . . . , an−1 }), an
Proposition 1.2.5 : Sei (Z, +, ·, P ) ein geordneter K¨ orper. Dann gilt f¨ ur a, b, c, d ∈ Z (i) a < b ⇒ a + c < b + c. (ii) (a < b, c < d) ⇒ a + c < b + d. (iii) (a < b, 0 < c) ⇒ ac < bc. (iv) (a < b, c < d, 0 < b, 0 < c) ⇒ ac < bd.
26
KAPITEL 1. AXIOMATIK DER REELLEN ZAHLEN
Beweis: Idee: Kombiniere die Propositionen 1.1.6, 1.1.14 und 1.2.4.
(i) a < b bedeutet b − a ∈ P und mit Proposition 1.1.6 impliziert dies (b + c) − (a + c) = b − a ∈ P also a + c < b + c. (ii) Mit (i) findet man a + c < b + c < b + d, also wegen der Transitivit¨at a + c < b + d. (iii) Mit b − a ∈ P und c ∈ P sowie Proposition 1.1.14 findet man bc − ac = (b − a)c ∈ P , also ac < bc. (iv) Mit (iii) folgert man ac < bc < bd und daraus, mit Proposition 1.2.4, ac < bd.
Die Einteilung des Zahlbereichs Z in positive und negative Zahlen (und 0) erlaubt die Einf¨ uhrung eines Absolutbetrags |a| (oft sagt man einfach nur Betrag) einer Zahl a ∈ Z: ( a f¨ ur a ≥ 0 |a| := −a f¨ ur a < 0. In jedem Fall ist also 0 ≤ |a|. Satz 1.2.6 : Sei (Z, +, ·, P ) ein geordneter K¨ orper. Dann gilt f¨ ur a, b ∈ Z (i) |a| = | − a|. (ii) −|a| ≤ a ≤ |a|. (iii) −b ≤ a ≤ b ⇔ |a| ≤ b. (iii’) −b < a < b ⇔ |a| < b. (iv) |a| − |b| ≤ |a + b| ≤ |a| + |b|. (v) |a| − |b| ≤ |a − b| ≤ |a| + |b|. (vi) |ab| = |a| |b|. ¯ a ¯ |a| ¯ ¯ (vii) ¯ ¯ = falls b 6= 0. b |b| Beweis: Idee: Mit den Propositionen 1.1.14, 1.2.4 und 1.2.5 sowie den Rechenregeln f¨ur K¨orper folgt dies aus den Definitionen.
(i) F¨ ur a = 0 ist das klar. F¨ ur a > 0 gilt −a < 0, also |a| = a = −(−a) = | − a|. F¨ ur a < 0 gilt −a > 0, also |a| = −a = | − a|. (ii) F¨ ur a = 0 ist das wieder klar. F¨ ur a > 0 gilt −a = −|a| < 0 < a = |a| und f¨ ur a < 0 gilt |a| = −a > 0 > a = −|a|. (iii) Wenn a ≥ 0, dann folgt aus a ≤ b die Ungleichung |a| = a ≤ b. Wenn a < 0, dann folgt aus −b ≤ a erst −a ≤ b und dann die Ungleichung |a| = −a ≤ b. Umgekehrt folgt aus |a| ≤ b die Ungleichung −b ≤ −|a| und dann −b ≤ −|a| ≤ a ≤ |a| ≤ b.
¨ UND ORDNUNG 1.2. POSITIVITAT
27
(iii’) Dies folgt sofort aus (iii). (iv) und (v) Durch aufaddieren der Ungleichungen aus (ii) f¨ ur a und b (nach Proposition 1.2.5(ii)) erh¨alt man −(|a| + |b|) ≤ a + b ≤ |a| + |b|. Mit (iii) folgt |a + b| ≤ |a| + |b|. Ersetzt man ¨ in dieser Uberlegung b durch −b, so folgt wegen (i) |a − b| ≤ |a| + |b|. Damit hat man jeweils die rechte der beiden Ungleichungen. Wendet man diese jetzt auf a + b statt a an, findet man |a| = |(a + b) − b| ≤ |a + b| + |b|, also |a| − |b| ≤ |a + b| (vgl. Proposition 1.1.6). Ersetzt man schließlich wieder b durch −b, findet man auch noch |a| − |b| ≤ |a − b|. (vi) Wenn a ≥ 0 und b ≥ 0, dann ist ab ≥ 0 und somit die Gleichung klar. Wenn a ≥ 0, b < 0, findet man −b > 0 und mit Proposition 1.1.14 |ab| = | − (ab)| = |a(−b)| = a(−b) = |a| |b|. Die F¨alle b ≥ 0, a < 0 und a < 0, b < 0 behandelt man ¨ahnlich. ¯a¯ ¯ a¯ |a| ¯¯ a ¯¯ ¯ ¯ ¯ ¯ = ¯ ¯. (vii) |a| = ¯b ¯ = |b| ¯ ¯ liefert b b |b| b
Der Ungleichung |a + b| ≤ |a| + |b| kommt eine besondere Bedeutung zu. Sie wird auf Grund der geometrischen Interpretation ihrer h¨oherdimensionalen Analoga die Dreiecksungleichung genannt. ¨ orper. Zeige, daß f¨ ur x, y ∈ Z gilt Ubung 1.2.1 : Sei Z ein geordneter K¨ (i) max{x, y} = 12 (x + y + |x − y|), (ii) min{x, y} = 12 (x + y − |x − y|).
¨ Ubung 1.2.2 : Sei Z ein geordneter K¨ orper. Zeige2 , daß die Menge C := Z × Z mit der Addition (x1 , y1 ) +C (x2 , y2 ) := (x1 + x2 , y1 + y2 ) und der Multiplikation (x1 , y1 ) ·C (x2 , y2 ) := (x1 x2 − y1 y2 , x1 y2 + x2 y1 ) ein K¨ orper ist, d.h. die Axiome 1.1.1, 1.1.2, 1.1.3, 1.1.7, 1.1.8, 1.1.9 und 1.1.13 erf¨ ullt. Welches Element ist die Null in C, welches die Eins in C? Was ist das additive Inverse zu (x, y) ∈ C? Was ist das multiplikative Inverse zu (x, y) ∈ C? Man beachte, daß f¨ ur Relationen gilt (x1 , y1 ) = (x2 , y2 ) :⇔ x1 = x2 und y1 = y2 . (Hinweis: F¨ ur Axiom 1.1.9 zeige man, daß (a1 , a2 ) ·C (x, y) = (b1 , b2 ) ist, wenn man x=
a1 b 1 + a2 b 2 a1 a1 + a2 a2
und
y=
−a2 b1 + a1 b2 a1 a1 + a2 a2
w¨ ahlt.)
2 Es
kommt wesentlich darauf an, daß alle Umformungen auf schon bewiesene Rechenregeln zur¨ uckgef¨ uhrt werden.
28
KAPITEL 1. AXIOMATIK DER REELLEN ZAHLEN
1.3
Vollst¨ andigkeit
Die Axiome 1.2.1 und 1.2.2 reichen immer noch nicht aus, um die reellen Zahlen unter allen K¨orpern auszuzeichnen. Wir werden sp¨ater sehen, daß der K¨orper Q der rationalen Zahlen diese beiden Axiome ebenfalls erf¨ ullt. Was die reellen Zahlen, die man in der Schule gew¨ohnlich durch den Zahlenstrahl beschreibt, gegen¨ uber den rationalen Zahlen auszeichnet, ist das Fehlen von L¨ochern“. Um diese ” Vollst¨ andigkeit mathematisch sauber beschreiben zu k¨onnen, f¨ uhren wir das Konzept einer gr¨ oßten unteren Schranke ein: Sei Z ein geordneter K¨orper und X ⊆ Z. Dann heißt m ∈ Z eine untere Schranke von X, wenn gilt ∀x ∈ X : m ≤ x. Eine Menge, f¨ ur die es eine untere Schranke gibt, heißt nach unten beschr¨ ankt. Eine untere Schranke m ∈ Z von X heißt gr¨ oßte untere Schranke von X, wenn gilt ∀n ∈ Z, n untere Schranke von X : n ≤ m. Da aus n ≤ m und m ≤ n folgt n = m (vgl. Proposition 1.2.4), kann es h¨ochstens eine gr¨oßte untere Schranke geben. Man nennt die gr¨oßte untere Schranke von X (wenn sie existiert) auch das Infimum von X und bezeichnet sie mit inf(X). Das Vollst¨andigkeitsaxiom fordert die Existenz einer gr¨oßten unteren Schranke f¨ ur jede nach unten beschr¨ankte Menge: Axiom 1.3.1 (Vollst¨ andigkeit): gr¨oßte untere Schranke.
Jede nach unten beschr¨ankte nichtleere Teilmenge von Z hat eine
¨ ¨ Ahnlich wie f¨ ur die nat¨ urlichen Zahlen (vgl. Ubung A.1.1) kann man einen Satz zeigen, der besagt, e daß zwei Mengen Z und Z mit zugeh¨origen Additionen und Multiplikationen sowie Ordnungen, die alle in diesem Kapitel eingef¨ uhrten Axiome erf¨ ullen, bijektiv aufeinander abgebildet werden k¨onnen und zwar so, daß die Additionen, Multiplikationen und Ordnungen ineinander u ¨bergehen. Der Beweis ist allerdings aufwendiger als im Falle der nat¨ urlichen Zahlen und wir verschieben ihn auf sp¨ater. Trotzdem nennen wir einen geordneten K¨orper, der das Vollst¨andigkeitsaxiom 1.3.1 erf¨ ullt, ein Modell f¨ ur die reellen Zahlen oder einfach die reellen Zahlen. Wir bezeichnen solch einen Zahlbereich mit R. Es ist an dieser Stelle u ¨berhaupt nicht klar, ob es so einen Zahlbereich u urlichen ¨berhaupt gibt. Man kann, ausgehend von den nat¨ Zahlen, ein Modell f¨ ur die reellen Zahlen konstruieren. Allerdings werden wir sp¨ater nur Eigenschaften von R ben¨ utzen, die aus den Axiomen folgen (d.h. nicht von der speziellen Konstruktion abh¨angen). Man kann daher das Axiomensystem f¨ ur die reellen Zahlen auch an den Anfang einer Analysisvorlesung setzen und einfach fordern, daß es so einen Zahlbereich wirklich gibt. Plausibler allerdings ist die Forderung nach der Existenz der nat¨ urlichen Zahlen (die wir ja auch nicht bewiesen haben) als Ausgangspunkt. In diesem Zusammenhang sei auf die (zum Teil philosophische) Frage verwiesen, ob die Mathematik Menschenwerk ist und erfunden“ wird oder aber ob sie Naturgesetz ist und entdeckt“ wird. Dazu ein Zitat, das L. ” ” Kronecker (1823–1891) zugeschrieben wird: Die nat¨ urlichen Zahlen hat der liebe Gott geschaffen, alles andere ist Menschenwerk. Man h¨atte die Vollst¨andigkeit der reellen Zahlen genauso gut auch u uhren ¨ber obere Schranken einf¨ k¨onnen: Sei Z ein geordneter K¨orper und X ⊆ Z. Dann heißt m ∈ Z eine obere Schranke von X, wenn gilt ∀x ∈ X : m ≥ x. Eine Menge, f¨ ur die es eine obere Schranke gibt, heißt nach oben beschr¨ ankt. Eine obere Schranke m ∈ Z f¨ ur X heißt kleinste obere Schranke von X, wenn gilt ∀n ∈ Z, n obere Schranke von X : n ≥ m.
¨ 1.3. VOLLSTANDIGKEIT
29
Man nennt eine kleinste obere Schranke von X auch das Supremum von X und bezeichnet sie mit sup(X). Wenn eine kleinste obere Schranke existiert, dann ist sie auch eindeutig bestimmt.
Axiom 1.3.2 (Vollst¨ andigkeit): kleinste obere Schranke.
Jede nach oben beschr¨ankte nichtleere Teilmenge von Z hat eine
Satz 1.3.3 : Die Axiome 1.3.1 und 1.3.2 sind ¨ aquivalent, d.h. ein angeordneter K¨ orper Z erf¨ ullt Axiom 1.3.1 genau dann, wenn er Axiom 1.3.2 erf¨ ullt. Beweis: Idee: Man vertauscht die Rollen von Infimum und Supremum durch Betrachtung der Abbildung x 7→ −x.
Es gelte Axiom 1.3.1 und X ⊆ Z sei nach oben beschr¨ankt. Wenn n ∈ Z eine obere Schranke von X ist, dann gilt x ≤ n f¨ ur alle x ∈ X, also −n ≤ −x f¨ ur alle −x ∈ −X := {−y ∈ Z | y ∈ X}, weil nach Proposition 1.1.6 gilt (−x) − (−n) = n − x. Also ist −n eine untere Schranke von −X. Genauso sieht man, daß f¨ ur jede untere Schranke m von −X die Zahl −m eine obere Schranke von X ist. Nach Axiom 1.3.1 findet man ein gr¨oßte untere Schranke m ∈ Z von −X. Wir behaupten, daß −m die kleinste obere Schranke von X ist. Dazu sei n ∈ Z eine obere Schranke von X, also −n eine untere Schranke von −X. Dann folgt −n ≤ m und daher −m ≤ n. Die Umkehrung wird ganz analog bewiesen.
¨ Bemerkung 1.3.4 : Man kann, so wie auch f¨ ur die nat¨ urlichen Zahlen (vgl. Ubung A.1.1), zeigen, daß die angegebenen Axiome die reellen Zahlen bis auf eine Bijektion, die Addition, Multiplikation, Eins, Null und Ordnung erh¨alt, eindeutig bestimmen. ¨ Der in Ubung 1.2.2 aus Z = R konstruierte K¨orper heißt der K¨orper der komplexen Zahlen. und wird mit C bezeichnet. ¨ Ubung 1.3.1 : Finde die gr¨ oßte untere Schranke und die kleinste obere Schranke der folgenden Mengen. (i) {1, 12 , 13 , . . . } (ii) {0, − 12 , 23 , − 34 , 45 , − 56 , . . . }
¨ Ubung 1.3.2 : Zeige: (i) (Bernoulli-Ungleichung) F¨ ur alle nat¨ urlichen Zahlen n ≥ 2 und alle von Null verschiedenen Zahlen x > −1 aus R ist (1 + x)n > 1 + nx. (ii) F¨ ur alle nat¨ urlichen Zahlen n und alle Zahlen q 6= 1 aus R gilt n X k=1
kq k−1 := 1 + 2q + 3q 2 + · · · nq n−1 =
1 − (n + 1)q n + nq n+1 . (1 − q)2
30
KAPITEL 1. AXIOMATIK DER REELLEN ZAHLEN
¨ Ubung 1.3.3 : Es seien x, y ∈ R. Man zeige, daß die gr¨ oßte untere Schranke inf({x, y}) von {x, y} gerade x + y − |y − x| 2 ist und leite eine entsprechende Formel f¨ ur die kleinste obere Schranke her. ¨ Ubung 1.3.4 : F¨ ur a, b ∈ R zeige man: Ist 0 < a < b, dann ist 0 <
1 b
<
1 . a
¨ Ubung 1.3.5 : Zeige: F¨ ur a, b ∈ R mit a < b gilt: a<
a+b < b, 2
wobei 2 := 1 + 1. ¨ Ubung 1.3.6 : Bestimme die gr¨ oßte untere und die kleinste obere Schranke der folgenden Mengen: (i) X := { n1 | n ∈ N}. (ii) X := {x ∈ R | x < 1}. ¨ Ubung 1.3.7 : Es sei (Z, +, ·, P ) ein geordneter K¨ orper. Man zeige: Das Supremum der Menge aller unteren Schranken von P ist 0. ¨ Ubung 1.3.8 : Genau die Zahlen aus R \ Q heißen irrationale Zahlen. Zeige, daß zwischen zwei reellen Zahlen immer eine rationale und eine irrationale Zahl liegen. Man sagt dann auch, daß Q und R \ Q dicht in R liegen. Hinweise: Zeige der Reihe nach 2 (i) Es gibt √ irrationale Zahlen, z.B. hat {x ∈ R | x ≤ 2} in Q kein Supremum. Das in R vorhandene Supremum heißt 2. (Das ist eine andere Methode, die Wurzel einer reellen Zahl zu definieren.) √ (ii) Konstruiere mit Hilfe von 2 eine irrationale Zahl, die zwischen zwei vorgegebenen reellen liegt.
(iii) Nutze das Archimedische Prinzip aus, um zwischen zwei reelle Zahlen eine rationale zu schieben.
¨ Ubung 1.3.9 : Es seien A, B ⊆ R nichtleere, nach oben beschr¨ ankte Mengen. Definiere C := {x + y | x ∈ A, y ∈ B}. Zeige, daß C nach oben beschr¨ ankt ist und daß f¨ ur das Supremum von C gilt sup(C) = sup(A) + sup(B).
Literatur: [Be03], [Eb92], [Fo83], [GH70] [Heu80], [K¨o90], [MM93]
Kapitel 2
Stetige Funktionen In diesem Kapitel studieren wir Funktionen, die auf Teilmengen von R definiert sind und Werte in R annehmen. Im Mittelpunkt des Interesses wird dabei das Verhalten solcher Funktionen bei Grenz¨ uberg¨ angen sein. Wichtigste Anwendung des Grenzwertbegriffs ist hier die Definition der Stetigkeit. Insbesondere geht es um die Existenz von speziellen Funktionswerten wie Maxima, Minima und Nullstellen. Im letzten Abschnitt beweisen wir einige grundlegende S¨ atze u ¨ber stetige Funktionen, die auf Intervallen definiert sind. Um sich eine Vorstellung u ¨ber das Verhalten einer Funktion f : M → R zu machen, skizziert man oft ihren Graphen {(x, f (x)) ∈ R × R | x ∈ M }.
2.1
Grenzwerte von Funktionen
F¨ ur eine vorgegebene Funktion f : A → R mit A ⊆ R m¨ochte man das Verhalten in der N¨ahe eines Punktes x0 ∈ R studieren. Die intuitive Vorstellung zur Aussage f (x) hat in x0 den Grenzwert y“ ist: ” f (x) ist beliebig nahe an y, wenn nur x nahe genug an x0 ist“. ” Um diese Vorstellung pr¨azise formulieren zu k¨onnen, muß man zun¨achst sicherstellen, daß die Funktion in den Punkten, die nahe“ bei x0 sind, u uhrt auf den Begriff des Intervalls. ¨berhaupt definiert ist. Dies f¨ ” Seien a, b ∈ R und a < b. Dann heißen die Mengen [a, b] := {x ∈ R | a ≤ x ≤ b} ]a, b] := {x ∈ R | a < x ≤ b} [a, b[ := {x ∈ R | a ≤ x < b} ]a, b[ := {x ∈ R | a < x < b} von a und b begrenzte Intervalle. Der Punkte a bzw. b heißt der linke bzw. der rechte Rand des jeweiligen Intervalls. Genauer heißt [a, b] das abgeschlossene Intervall zwischen a und b und ]a, b[ das offene Intervall zwischen a und b. Die Intervalle ]a, b] und [a, b[ werden halboffene Intervalle genannt. Man nennt auch die Mengen [a, ∞[ := ]a, ∞[ :=
{x ∈ R | a ≤ x} {x ∈ R | a < x}
] − ∞, b] := ] − ∞, b[ :=
{x ∈ R | x ≤ b} {x ∈ R | x < b}
] − ∞, ∞[ :=
R
Intervalle. Hier heißen ] − ∞, b] und [a, ∞[ abgeschlossen und ] − ∞, b[ und ]a, ∞[ offen. Beachte dabei, daß ±∞ hier keine Elemente von R sind, sondern nur Symbole, die in der Namensgebung f¨ ur die Mengen {x ∈ R | a ≤ x}, etc. verwendet werden. Insbesondere kann man mit ±∞ nicht rechnen! 31
32
KAPITEL 2. STETIGE FUNKTIONEN
Wenn man die Bedingung a < b zu a ≤ b abschw¨acht, die anderen Definitionen aber beibeh¨alt, findet man ]a, a[ = [a, a[ = ]a, a] = ∅ und [a, a] = {a}, weshalb man normalerweise auch die leere Menge und einpunktige Mengen als Intervalle bezeichnet. ¨ Ubung 2.1.1 : Zeige, daß eine Teilmenge M ⊆ R genau dann ein Intervall von einer der oben angef¨ uhrten Arten ist, wenn f¨ ur a, b ∈ M mit a ≤ b immer [a, b] ⊆ M gilt. (Hinweis: Wenn M beschr¨ ankt ist, betrachte Supremum und Infimum von M . Wenn M nach oben oder unten nicht beschr¨ ankt ist, zeigt man, daß M nach oben oder unten unbeschr¨ ankte Intervalle sind.)
Eine Teilmenge M ⊆ R heißt offen, wenn es zu jedem x0 ∈ M ein δ > 0 mit ]x0 − δ, x0 + δ[⊆ M gibt (beachte, daß diese Definition die leere Menge zu einer offenen Teilmenge von R macht!). Da die Vereinigung von offenen Mengen nach Definition selbst offen ist, gibt es zu jeder Teilmenge N ⊆ R eine gr¨oßte offene Teilmenge N ◦ von N . Diese Teilmenge nennt man das Innere von N . Eine ¢ ¡ Teilmenge M ⊆ R heißt abgeschlossen, wenn ihr Komplement in R offen ist. Das Komplement { ({M )◦ des Inneren des Komplements von M ist die kleinste abgeschlossene Teilmenge von R, die M enth¨alt. Sie wird mit M bezeichnet und heißt der Abschluß von M in R. ¨ Ubung 2.1.2 : Zeige: (i) Die offenen Intervalle sind offene Teilmengen von R. (ii) Die abgeschlossenen Intervalle abgeschlossene Teilmengen von R. (iii) Das Innere von [a, b] in R ist ]a, b[. (iv) Der Abschluß von ]a, b[ in R ist [a, b].
Sei M ⊆ R eine Teilmenge und x0 ∈ R ein Punkt, f¨ ur den gilt ∀δ > 0 : ]x0 , x0 + δ[ ∩ M 6= ∅. Man sagt, eine Funktion f : M → R hat den rechtsseitigen Grenzwert oder Limes y in x0 , wenn ∀² > 0 ∃δ > 0 : (x ∈ ]x0 , x0 + δ[ ∩ M ⇒ |f (x) − y| < ²).
y+ε y y−ε
x0+ δ
x0
b
Die Dreiecksungleichung zeigt, daß es nur einen solchen Grenzwert geben kann: Wenn n¨amlich y1 und y2 die obige Bedingung erf¨ ullen, dann gilt wegen |y1 − y2 | ≤ |y1 − f (x)| + |f (x) − y2 |, daß |y1 − y2 | < 2² f¨ ur jedes ² > 0 und x ∈ ]x0 , x0 + δ[ ∩ M mit passendem δ, also |y1 − y2 | = 0. Man schreibt lim f (x) = y
x→x0 +
oder
f (x0 +) = y.
Eine andere gebr¨auchliche Sprechweise ist: f konvergiert gegen y f¨ ur x → x0 +. 6
... ..
6 ........
................ ............ ....... ..... ... . ... ... .. ... . . .... ..............
H Y H Grenzwert
a
b
.. .. .. .. .. ... ... ... ... ... ... .... ...... ....... ......... ............... ...............
a
-
b
2.1. GRENZWERTE VON FUNKTIONEN
33
Beispiel 2.1.1 : (i) Die Funktion f : ]2, ∞[→ R,
−(x − 2)2 |x − 2| + (x − 2)
x 7→
hat in 2 den rechtsseitigen Grenzwert 0. y
6
H
2 HH
-x
HH
(ii) F¨ ur a ∈ R bezeichnet man mit bac die gr¨oßte ganze Zahl, die kleiner oder gleich a ist. Man nennt bac den ganzzahligen Anteil von a. Dann hat die Funktion ¹ º 2 x f : ]0, ∞[→ R, x 7→ x + −2 x 2 in 0 den rechtsseitigen Grenzwert 0. 6
1
p p p p pn + r
2 1 n+r
x
4 ©©
2
©
©
©©
©©
2
© ©©
−2
-
©
betrachte die Werte f¨ ur x =
1 n+r
mit n ∈ N und r ∈ [0, 1[
Analog zum rechtsseitigen Grenzwert kann man nat¨ urlich auch linksseitige und beidseitige Grenzwerte betrachten: Sei M ⊆ R eine Teilmenge und x0 ∈ R ein Punkt, f¨ ur den gilt ∀δ > 0 : ]x0 − δ, x0 [ ∩ M 6= ∅. Man sagt, eine Funktion f : M → R hat den linksseitigen Grenzwert oder Limes y in x0 , wenn ∀² > 0 ∃δ > 0 : (x ∈ ]x0 − δ, x0 [ ∩ M ⇒ |f (x) − y| < ²). Man schreibt dann lim f (x) = y
x→x0 −
oder f (x0 −) = y.
Andere Sprechweise: f konvergiert gegen y f¨ ur x → x0 −. Es sei M ⊆ R eine Menge. Ein Punkt x0 ∈ R heißt H¨ aufungspunkt von M (in Zeichen: x0 ∈ H(M )), wenn ∀ δ > 0 : (]x0 − δ, x0 + δ[\{x0 }) ∩ M 6= ∅.
34
KAPITEL 2. STETIGE FUNKTIONEN
Sei M ⊆ R eine Teilmenge und x0 ∈ H(M ). Man sagt, eine Funktion f : M → R hat den Grenzwert oder Limes y in x0 , wenn ∀² > 0 ∃δ > 0 : (x ∈ M ∩ ]x0 − δ, x0 + δ[ \ {x0 } ⇒ |f (x) − y| < ²). Man schreibt dann lim f (x) = y.
x→x0
Andere Sprechweise: f konvergiert gegen y f¨ ur x → x0 . Wenn man die Menge M besonders betonen will, schreibt man auch limM 3x→x0 f (x) = y und sagt f konvergiert gegen y f¨ ur x → x0 in M . ¨ Ubung 2.1.3 : Sei M ⊆ R und x0 ∈ R ein H¨ aufungspunkt von sowohl M ∩ ]x0 , ∞[, als auch von M ∩ ] − ∞, x0 [. Zeige: F¨ ur eine Funktion f : M → R sind die beiden folgenden Aussagen ¨ aquivalent. (1) limx→x0 f (x) = y. (2) limx→x0 + f (x) = y und limx→x0 − f (x) = y. Bleibt die Aquivalenz richtig, wenn man nur fordert, daß x0 ein H¨ aufungspunkt von M ist?
Beispiel 2.1.2 : (i) Die Funktion f : R \ {2} → R,
x 7→
−(x − 2)2 x−2
hat den Grenzwert limx→2 f (x) = 0. @
@
6
2 @
@c 2@ @
(ii) Die Funktion f : R \ {0} → R,
x 7→
¹ º 1 1 − x x
hat weder einen rechtsseitigen noch einen linksseitigen Grenzwert in 0. 6 .. . 1 x
.. ... ... ... ... .... .... .... ....... .......... ................. .......
..................... ........... ....... ..... .... .... ... ... ... ... .. ...
³ Es gilt z.B. f
1 n+r
´
-
¨ = r f¨ ur alle r ∈ [0, 1[ (vgl. auch Ubung 2.1.15).
Beispiel 2.1.3 : Betrachte die Funktion f : R → R, x 7→
1 x2 +1 .
2.1. GRENZWERTE VON FUNKTIONEN
35 6
........................................ ......... .......... ......... ............ ............ ........................ ........................ .
-
Wir zeigen, daß limx→1 f (x) = 12 . Dazu sei ² > 0. Wir m¨ ussen eine Zahl δ > 0 finden, f¨ ur die gilt ¯ ¯ ¯ 1 1¯ ∀ 0 < |x − 1| < δ : ¯¯ 2 − ¯¯ < ². x +1 2 Es gilt
¯ ¯ ¯ ¯ ¯ 1 1 ¯¯ ¯¯ 1 + x ¯¯ ¯ ¯ x2 + 1 − 2 ¯ = ¯ 2(x2 + 1) ¯ |x − 1|.
Da wir beliebig kleine δ nehmen d¨ urfen, k¨onnen wir von vorneherein annehmen, daß δ < 1 (in so einer Situation sagt man o.B.d.A. δ < 1 - ohne Beschr¨ankung der Allgemeinheit). Wenn 0 < |x − 1| < 1, dann gilt 0 < x < 2 und daher ¯ ¯ ¯ 1+x ¯ 3 ¯ ¯ ¯ 2(x2 + 1) ¯ ≤ 2 . Also hat man
¯ ¯ ¯ 1 1 ¯¯ 3 ¯ ¯ x2 + 1 − 2 ¯ ≤ 2 |x − 1|.
Wenn man jetzt δ := min{ 23 ², 1} setzt, folgt ¯ ¯ ¯ 1 1 ¯¯ 3 ¯ ¯ x2 + 1 − 2 ¯ ≤ 2 |x − 1| < ² f¨ ur alle 0 < |x − 1| < δ. Man will nat¨ urlich nicht immer so komplizierte Rechnungen wie in Beispiel 2.1.3 durchf¨ uhren, um zu sehen, daß Grenzwerte existieren. Der nachfolgende Satz liefert eine wesentliche Vereinfachung, weil er zeigt, wie man die Grenzwerte von komplizierten Funktionen ausrechnen kann, wenn man Grenzwerte von einfachen Funktionen kennt, aus denen die komplizierten Funktionen zusammengesetzt sind. Wenn zwei Funktionen f, g : A → R f¨ ur ein A ⊆ R definiert sind, dann kann man problemlos ihre Summe, ihre Differenz und ihr Produkt definieren: f + g : A → R, f − g : A → R, f g : A → R,
x 7→ f (x) + g(x) x 7→ f (x) − g(x) x 7→ f (x)g(x).
Wenn g(x) 6= 0 f¨ ur alle x ∈ A gilt, dann hat man auch den Quotienten f : A → R, g
x 7→
f (x) . g(x)
Ist in obiger Multiplikation die Funktion f konstant gleich c, so findet man die skalare Multiplikation cg : A → R,
x 7→ cg(x).
¨ Ubung 2.1.4 : Sei F(A, R) die Menge aller Funktionen f : A → R, ausgestattet mit der obigen Addition und skalaren Multiplikation. Dann ist F(A, R) ein R-Vektorraum.
36
KAPITEL 2. STETIGE FUNKTIONEN
Satz 2.1.4 : Seien f und g reellwertige Funktionen, die auf einer Teilmenge M von R definiert sind, und x0 ∈ R erf¨ ulle eine der drei folgenden Bedingungen ∀δ > 0 : M ∩ ]x0 , x0 + δ[6= ∅, ∀δ > 0 : M ∩ ]x0 − δ, x0 [6= ∅, ∀δ > 0 : M ∩ ]x0 − δ, x0 + δ[\{x0 } 6= ∅. Wir nehmen an, daß f und g entsprechend ein- oder beidseitige Grenzwerte in x0 haben und schreiben einfach lim f¨ ur limx→x0 + , limx→x0 − und limx→x0 . Dann gilt (i) lim(f + g)(x) = lim f (x) + lim g(x). (ii) lim(f − g)(x) = lim f (x) − lim g(x). (iii) lim(f g)(x) = lim f (x) lim g(x). (iv) Wenn lim g(x) 6= 0, dann lim fg (x) =
lim f (x) lim g(x) .
Beweis: Idee: Dreiecksungleichung. Wir f¨ uhren den Beweis f¨ ur rechtsseitige Limites und setzen α := lim f (x) und β := lim g(x) (die beiden anderen F¨alle lassen sich w¨ortlich u ¨bertragen). Nach Voraussetzung existieren zu ² > 0 Zahlen δ1 , δ2 > 0 mit ∀ x ∈ ]x0 , x0 + δ1 [ ∩M ∀ x ∈ ]x0 , x0 + δ2 [ ∩M
: :
|f (x) − α| < ² |g(x) − β| < ²
(i) Wenn δ := min{δ1 , δ2 }, dann finden wir mit der Dreiecksungleichung |f (x) + g(x) − (α + β)| ≤ |f (x) − α| + |g(x) − β| < 2² f¨ ur x ∈ ]x0 , x0 + δ[ ∩M . Wenn man dieses Argument auf daß lim(f + g)(x) = lim f (x) + lim g(x).
² 2
statt ² anwendet, sieht man,
(ii) Ganz analog zu (i). (iii) Wir stellen zun¨achst fest, daß |f (x)g(x) − αβ| = |(f (x) − α)g(x) + α(g(x) − β)| ≤ |f (x) − α| |g(x)| + |α| |g(x) − β|. Nach Voraussetzung existiert eine Zahl δ0 mit ∀ x ∈]x0 , x0 + δ0 [ ∩M : |g(x) − β| < 1, also |g(x)| ≤ |g(x) − β| + |β| < 1 + |β|. Wenn jetzt δ := min{δ0 , δ1 , δ2 }, dann finden wir |f (x)g(x) − αβ| ≤ (1 + |β| + |α|)² f¨ ur x ∈ ]x0 , x0 +δ[ ∩M . Wenn wir diesmal in obigem Argument ² durch finden wir lim(f g)(x) = lim f (x) lim g(x).
² 1+|β|+|α|
ersetzen,
(iv) An dieser Stelle m¨ ussen wir zun¨achst nachweisen, daß die Funktion fg u ¨berhaupt auf einer Menge der Form ]x0 , x0 + δ0 [ ∩M definiert ist. Zu diesem Zweck w¨ahlt man δ0 mit ∀ x ∈ ]x0 , x0 + δ0 [ ∩M : |g(x) − β| <
|β| 2
2.1. GRENZWERTE VON FUNKTIONEN
37
so, daß wegen |g(x)| = |(−β) − (g(x) − β)| ≥ |β| − |g(x) − β| gilt ∀ x ∈ ]x0 , x0 + δ0 [ ∩M : |g(x)| ≥ Also ist
f g
|β| > 0. 2
in der Tat auf ]x0 , x0 + δ0 [ ∩M definiert.
Jetzt w¨ahlt man δ := min{δ0 , δ1 , δ2 } und findet ¯ ¯ ¯ ¯ ¯ f (x) α ¯ ¯ β(f (x) − α) − α(g(x) − β) ¯ |β|² + |α|² 2(|β| + |α|) ¯ ¯=¯ ¯< − = ² 1 2 ¯ g(x) ¯ β¯ ¯ βg(x) β2 β 2 f¨ ur x ∈]x0 , x0 + δ[ ∩M , was wiederum lim fg (x) =
lim f (x) lim g(x)
impliziert.
Beispiel 2.1.5 : 2x (i) limx→1 x2 +x−1 = 2. Hier betrachtet man den Bruch als Funktion von x, die sowohl in einem offenen Intervall mit rechtem Rand 1 als auch in einem Intervall mit linkem Rand 1 definiert ist. ... ... ... ... ... ... ... ... .... ...... ..... .... ... ... ... ... .. ... .. .. .. .. .. .. .. .. .. ..
2
........................... ........... ........ ...... .... .... ... ... ... ... .. .. ..
1
.. ..
6 ........p
... ... .... .... ..... ....... .......... .................. ................
-
1
−1
(ii) limh→0 x+hh x = − x12 . Hier ist der Bruch bei festem x als Funktion in h zu betrachten, die wiederum sowohl in einem offenen Intervall mit rechtem Rand 0 als auch in einem Intervall mit linkem Rand 0 definiert ist.
Satz 2.1.6 : Seien f und g reellwertige Funktionen, die auf einer Teilmenge M von R definiert sind und x0 ∈ R erf¨ ulle eine der drei folgenden Bedingungen ∀δ > 0 : ]x0 , x0 + δ[ ∩M 6= ∅, ∀δ > 0 : ]x0 − δ, x0 [ ∩M 6= ∅, ∀δ > 0 : ]x0 − δ, x0 + δ[ ∩M 6= ∅. Wir nehmen an, daß f und g entsprechend ein- oder beidseitige Grenzwerte in x0 haben. und schreiben einfach lim f¨ ur limx→x0 + , limx→x0 − und limx→x0 . Wenn f (x) ≤ g(x) f¨ ur alle x, f¨ ur die f und g definiert sind, dann gilt lim f (x) ≤ lim g(x). Beweis:
38
KAPITEL 2. STETIGE FUNKTIONEN Idee: Differenzen betrachten und Satz 2.1.4 anwenden. Wir f¨ uhren den Beweis wieder f¨ ur die rechtsseitigen Grenzwerte (die beiden anderen F¨alle lassen sich wieder w¨ortlich u ¨bertragen). Wenn limx→x0 + f (x) > limx→x0 + g(x), dann zeigt Satz 2.1.4(ii), daß y := limx→x0 + (f − g)(x) > 0. Dann gibt es ein δ > 0 mit |f (x) − g(x) − y| < y2 f¨ ur x ∈ ]x0 , x0 + δ[ ∩M . Es folgt ∀ x ∈ ]x0 , x0 + δ[ ∩M : 0 <
3y y < f (x) − g(x) < 2 2
im Widerspruch zur Voraussetzung. y 2
z
y 2
}|
{z y
y 2
}|
{ 3y 2
Also haben wir limx→x0 + f (x) ≤ limx→x0 + g(x). y 6........................
......... ... ........ .... ... .... ... ... ........
g
``` a
` f -
x
Beachte, daß in Satz 2.1.6 die Relation ≤ und nicht < auftaucht. Wenn z.B. die Funktion f durch f (x) = −x und die Funktion g durch g(x) = x gegeben ist, dann gilt f (x) < g(x) f¨ ur alle x > 0, aber limx→0+ f (x) = limx→0+ g(x) = 0. Korollar 2.1.7 : Seien f, g und h reellwertige Funktionen, die auf einer Teilmenge M von R definiert sind und x0 ∈ R erf¨ ulle eine der drei folgenden Bedingungen ∀δ > 0 : ]x0 , x0 + δ[ ∩M 6= ∅, ∀δ > 0 : ]x0 − δ, x0 [ ∩M 6= ∅, ∀δ > 0 : ]x0 − δ, x0 + δ[ ∩M 6= ∅. Wir nehmen an, daß f, g und h entsprechend ein- oder beidseitige Grenzwerte in x0 haben. und schreiben einfach lim f¨ ur limx→x0 + , limx→x0 − und limx→x0 . Wenn f (x) ≤ g(x) ≤ h(x) f¨ ur alle x, f¨ ur die f , g und h definiert sind, und lim f (x) = lim h(x), dann hat auch g einen Grenzwert in x0 und es gilt lim f (x) = lim g(x) = lim h(x). Beweis: Idee: Wende Satz 2.1.6 doppelt an. Wir f¨ uhren den Beweis wieder f¨ ur die rechtsseitigen Grenzwerte (die beiden anderen F¨alle lassen sich wie zuvor w¨ortlich u ¨bertragen). Satz 2.1.6 kann nicht angewandt werden, bevor man weiß, ob limx→x0 + g(x) existiert. Setze y = limx→x0 + f (x) = limx→x0 + h(x). Zu ² > 0 gibt es Zahlen δ1 , δ2 > 0 mit ∀x ∈ ]x0 , x0 + δ1 [ ∩M ∀x ∈ ]x0 , x0 + δ2 [ ∩M
: :
f (x) − y > −² h(x) − y < ²
2.1. GRENZWERTE VON FUNKTIONEN
39
Wenn δ := min{δ1 , δ2 }, dann finden wir wegen f (x) − y ≤ g(x) − y ≤ h(x) − y, daß −² < g(x) − y < ² f¨ ur x ∈ ]x0 , x0 + δ[ ∩M . Dies zeigt limx→x0 + g(x) = y. y 6 .......................... h ........ .................................................................... ........... ....X ... X ... XXX ... ... XXg ... ... .... . . . . . . . . ............. ...... . . . . . . . . . . . .... ............ ..... f ...... ................ .............. x
Bis jetzt haben wir das Verhalten von Funktionen x 7→ f (x) untersucht, wenn sich x an einen festen Punkt x0 ann¨ahert. Ganz analog kann man aber auch das Verhalten von Funktionen im Unendlichen behandeln. Sei M ⊆ R eine nach oben unbeschr¨ankte Teilmenge. Wir sagen, eine Funktion f : M → R habe den Grenzwert y f¨ ur x → ∞, wenn es zu jedem ² > 0 ein x0 ∈ R mit ∀ x ∈ ]x0 , ∞[ ∩M : |f (x) − y| < ² gibt. Wir schreiben in diesem Fall limx→∞ f (x) = y und sagen f konvergiert gegen y f¨ ur x → ∞. .. ..
6.........
... .... ..... ...... ........ ......... ........... ............... ...................... ................................................
y
2² -
x0 Analog definieren wir den Grenzwert limx→−∞ f (x): Sei M ⊆ R nach unten unbeschr¨ankt. Eine Funktion f : M → R hat den Grenzwert y f¨ ur x → −∞, wenn es zu jedem ² > 0 ein x0 ∈ R mit ∀ x ∈ ] − ∞, x0 [ ∩M : |f (x) − y| < ² gibt. Sprechweise: f konvergiert gegen y f¨ ur x → −∞. Beachte, daß auch im Kontext der Grenzwerte ±∞ nichts anderes ist als ein Symbol, daß in der Namensgebung verwendet wird! Beispiel 2.1.8 : Es gilt
1 1 = 0 = lim . x→−∞ x x ¯ ¯ und x− := − 1² . Dann finden wir ¯ x1 ¯ < ² f¨ ur alle x > x+ und f¨ ur alle x < x− . lim
x→∞
Sei ² > 0, x+ :=
1 ²
y
.. 6 .. .
... ... ... .... ...... ........ ............... ......
................... ......... ....... .... ... ... ... .. .. .
-x
40
KAPITEL 2. STETIGE FUNKTIONEN
¨ Ubung 2.1.5 : Die Menge
¡ ¢ {f ∈ F ]a, ∞[, R | ∃ lim f (x)} x→∞
¨ ist ein Untervektorraum von F(]a, ∞[, R) (vgl. Ubung 2.1.4)
Proposition 2.1.9 : Sei M ⊆ R nach oben unbeschr¨ ankt und f : M → R eine Funktion. Setze N := { x1 | x ∈ M \ {0}} und g : N → R, t 7→ f ( 1t ). Dann gilt ]0, δ[ ∩N 6= ∅ f¨ ur jedes δ > 0 und lim f (x) = y
⇔
x→∞
lim g(t) = y.
t→0+
Beweis: Idee: Dies folgt aus Proposition 1.2.5 und den Definitionen. Wenn limx→∞ f (x) = y, dann gibt es zu ² > 0 ein x0 ∈ R mit (∗)
|f (x) − y| < ²
f¨ ur x ∈ ]x0 , ∞ ∩ M . Setze δ = daher (∗∗)
1 x0 .
Dann gilt (vgl. Proposition 1.2.5)
|g(t) − y| = |f
¡1¢ t
1 t
> x0 f¨ ur 0 < t < δ und
− y| < ²
f¨ ur t ∈ ]0, δ[ ∩N . Dies bedeutet aber, daß limt→0+ g(t) = y. Umgekehrt, wenn limt→0+ g(t) = y, dann gilt (∗∗) f¨ ur t ∈ ]0, δ[ ∩N . Mit x0 = dies (∗) f¨ ur x ∈ ]x0 , ∞[ ∩M , also limx→∞ f (x) = y.
1 δ
impliziert
Bemerkung 2.1.10 : Analog zu Proposition 2.1.9 beweist man: Sei M ⊆ R nach oben unbeschr¨ankt und f : M → R eine Funktion. Setze N := { x1 | x ∈ M \ {0}} und g : N → R, t → 7 f ( 1t ). Dann gilt ] − δ, 0[ ∩N 6= ∅ f¨ ur jedes δ > 0 und lim f (x) = y
x→−∞
⇔
lim g(t) = y.
t→0−
Beispiel 2.1.11 : x2 − 2x = lim x→∞ 2x2 − 3x − 1 x→0+ lim
2 x2
1 x2
−
− 3 x
2 x
−1
1 − 2t 1 = 2 t→0+ 2 − 3t − t 2
= lim
Im allgemeinen haben Funktionen keinen Grenzwert f¨ ur x → ±∞. Es gibt allerdings wichtige Klassen von Ausnahmen, wo das doch so ist: Sei M ⊆ R. Eine Funktion f : M → R heißt monoton steigend, wenn x1 ≤ x2
⇒
f (x1 ) ≤ f (x2 )
2.1. GRENZWERTE VON FUNKTIONEN
41
f¨ ur alle x1 , x2 ∈ M . Wenn x1 < x2
⇒
f (x1 ) < f (x2 )
f¨ ur alle x1 , x2 ∈ M , heißt f strikt oder streng monoton steigend. Analog sagt man, daß eine Funktion f : M → R monoton fallend ist, wenn x1 ≤ x2
⇒
f (x1 ) ≥ f (x2 )
⇒
f (x1 ) > f (x2 )
f¨ ur alle x1 , x2 ∈ M . Entsprechend, wenn x1 < x2
f¨ ur alle x1 , x2 ∈ M , heißt f strikt oder streng monoton fallend. Schließlich heißt f monoton, wenn es monoton fallend oder monoton steigend ist. Satz 2.1.12 : Sei M ⊆ R nach oben unbeschr¨ ankt sowie f : M → R monoton steigend und nach oben beschr¨ ankt (d.h. die Menge der Funktionswerte ist nach oben beschr¨ ankt). Dann existiert der Grenzwert limx→∞ f (x). Beweis: Idee: Supremum betrachten. Sei Z := {f (x) ∈ R | x ∈ M }. Dann ist Z nichtleer und beschr¨ankt. Sei K := sup(Z). Zu ² > 0 existiert ein x0 ∈ M mit K − ² < f (x0 ) ≤ K. Weil aber f monoton steigend ist, erhalten wir ∀ x ∈ ]x0 , ∞[ ∩M : K − ² < f (x) ≤ K. Dies zeigt |f (x) − K| < ² f¨ ur alle x ∈]x0 , ∞[ ∩M und damit limx→∞ f (x) = K. y K
6 ........................... ..................... ............. .......... ........ . . . . . . . . ....... ..... .... .... ... . . ... ... ... .. . ... ...
x
Bemerkung 2.1.13 : Ganz analog zu Satz 2.1.12 zeigt man: (i) Sei M ⊆ R nach oben unbeschr¨ankt sowie f : M → R monoton fallend und nach unten beschr¨ankt. Dann existiert limx→∞ f (x). (ii) Sei M ⊆ R nach unten unbeschr¨ankt sowie f : M → R monoton fallend und nach oben beschr¨ankt. Dann existiert limx→−∞ f (x). (iii) Sei M ⊆ R nach unten unbeschr¨ankt sowie f : M → R monoton steigend und nach unten beschr¨ankt. Dann existiert limx→−∞ f (x).
42
KAPITEL 2. STETIGE FUNKTIONEN y .. ... 6 .... ......
y 6
... ... ... .... ...... ....... ......... ........... ................ .......................... .......................... ............................... ................. ............ .......... ......... ........ ...... ...... .... .... ... ... ... ... ... ...
.. ........ .......... ............. .................. . . . . . . . . . . . . . . . . . . . . . . . . . . . ......................................
-x
-x
...................... ......................... ................ ............. ........... . . . . . . . . . ...... ....... ....... ....... ...... ......
¨ Ubung 2.1.6 : Entscheide, ob die folgenden Grenzwerte existieren und berechne sie gegebenenfalls. x . x→0 |x|
(i) lim
(ii) lim |x|, x→0
(iii) lim (x2 + x + 1), x→0+
1 x→1+ x−1
(iv) lim
,
¨ Ubung 2.1.7 : Sei
½
1 0
f (x) :=
falls x rational, falls x irrational.
Zeige, daß der Grenzwert lim f (x) f¨ ur kein a ∈ R existiert. x→a
¨ Ubung 2.1.8 : Sei f : R → R eine Funktion, die die Cauchysche Funktionalgleichung f (x + y) = f (x) + f (y) f¨ ur alle x, y ∈ R erf¨ ullt. Zeige: Falls der Grenzwert lim f (x) existiert, so existiert auch der Grenzwert lim f (x) x→0
f¨ ur jedes a ∈ R. ¨ Ubung 2.1.9 : Berechne die folgenden Limites. (i)
2 lim x +x , x→−1 x+1
x2 . x→0 |x|
(ii) lim
¨ Ubung 2.1.10 : Berechne den folgenden Grenzwert: µ ¶ 1 3 lim − . x→1 1−x 1 − x3
¨ Ubung 2.1.11 : Berechne die folgenden Limites. (i) lim
1 (x+h)2
h→0
(ii) (iii)
h
− 12 x
,
h→0−
lim
|x+h|−|x| , h
lim
|x+h|−|x| . h
h→0+
¨ Ubung 2.1.12 : Es seien a0 , . . . , an , b0 , . . . , bm ∈ R mit an 6= 0 und bm 6= 0. Diskutiere die Limites (i) lim
x→∞
an xn + · · · + a1 x + a0 , bm xm + · · · + b1 x + b0
x→a
2.2. STETIGKEIT
43
(ii) lim
x→−∞
an xn + · · · + a1 x + a0 . bm xm + · · · + b1 x + b0
¨ Ubung 2.1.13 : Zeige, daß aus lim f (x) = L folgt, daß lim |f (x)| = |L|. Gilt auch die Umkehrung? x→a
x→a
¨ Ubung 2.1.14 : Man fertige eine qualitative Skizze1 der folgenden Funktionen an: (i) f : R → R; f (x) =
1 . (x−121)2 +1
(ii) f : R → R; f (x) = xn f¨ ur n = 1, 2, 3, 4, 5 (in ein Schaubild). (iii) f : D → R; f (x) =
1 1c. bx
Welches ist die gr¨ oßte Teilmenge D ⊆ R, f¨ ur die f definiert ist?
¨ Ubung 2.1.15 : Es sei
½ f:
D x
→ 7 →
R 1 x
− b x1 c
.
(i) Man bestimme den gr¨ oßtm¨ oglichen Definitionsbereich D ⊆ R von f . (ii) Man fertige eine qualitative Skizze von f an. ur alle n ∈ Z und alle r ∈ [0, 1[ mit (n, r) 6= (0, 0) gilt: (iii) Man beweise, daß f¨ µ ¶ 1 f = r. n+r (iv) Man beweise (mittels der Definitionen), daß f weder einen linksseitigen noch einen rechtsseitigen Grenzwert in 0 besitzt.
¨ ur die Grenz¨ uberg¨ ange Ubung 2.1.16 : Formuliere die Analoga von Satz 2.1.4, Satz 2.1.6 und Korollar 2.1.7 f¨ x → ±∞ und beweise sie. Hinweis: Man kann das z.B. mithilfe von Proposition 2.1.9 und Bemerkung 2.1.10 tun.
2.2
Stetigkeit
Sei M ⊆ R und x0 ∈ M . Eine Funktion f : M → R heißt rechts–stetig in x0 , wenn ∀² > 0 ∃δ > 0 : (x ∈ M ∩ ]x0 , x0 + δ[ ⇒ |f (x) − f (x0 )| < ²). Analog heißt f : M → R links–stetig in x0 , wenn ∀² > 0 ∃δ > 0 : (x ∈ M ∩ ]x0 − δ, x0 [ ⇒ |f (x) − f (x0 )| < ²) und stetig in x0 , wenn ∀² > 0 ∃δ > 0 : (x ∈ M ∩ ]x0 − δ, x0 + δ[\{x0 } ⇒ |f (x) − f (x0 )| < ²). 1 Eine qualitative Skizze ist eine handschriftliche Skizze (keine Computerzeichnung!) der Funktion, die den ungef¨ ahren Verlauf in einem aussagekr¨ aftigen Bereich zeigt. Auch die Beschriftung und Skalierung der Achsen muss sinnvoll vorgenommen werden. Man soll aus der Zeichnung z.B. erkennen, wieviele Nullstellen die Funktion besitzt, wo in etwa Maxima und Minima liegen oder Sprungstellen vorhanden sind etc. Wenn die Werte (Abzissen- und/oder Ordinatenwerte) von besonderen Punkten leicht genau zu ermitteln sind, sind diese Werte einzutragen. Wenn sie nur ungef¨ ahr zu ermitteln sind, tr¨ agt man wenigstens ein, wo in etwa der betreffende Punkt liegt. Z.B. ist es h¨ aufig von Interesse, daß eine Nullstelle zwischen −1 und 0 liegt, wobei der exakte Wert nicht ermittelt werden kann. Bei Sprungstellen oder Definitionsl¨ ucken deute man mit • bzw. ◦ an, ob der betreffende Punkt zum Graphen geh¨ ort bzw. nicht dazu geh¨ ort.
44
KAPITEL 2. STETIGE FUNKTIONEN y
......... ........ ........ ...... . . . . . ........ ...... .... ...... .... ........... ......... . . . . . . . . . . . . .............. .... ............... .... .......... .... .... .... .................... ..... ......... .............. ............ ................ ......... ............... ..... .... .......... .....................
s
6 ........
s s
-x
a
x0 b
Wenn eine Funktion f : M → R in jedem Punkt von M stetig ist, nennt man sie stetig in M . In der Definition der (einseitigen) Stetigkeit h¨atte man den Punkt x0 auch jeweils mit in die Intervalle einbeziehen k¨onnen, weil |f (x0 ) − f (x0 )| = 0 gilt. Die hier gegebene Formulierung zielt darauf ab, den Zusammenhang mit der Definition des Grenzwerts deutlich herauszuarbeiten: Aus der Definition der Stetigkeit folgt n¨amlich unmittelbar, daß eine Funktion f : M → R dann und nur dann stetig in x0 ∈ M ist, wenn limx→x0 f (x) = f (x0 ) sofern x0 ∈ M ein H¨aufungspunkt von M ist. Andernfalls ist f in x0 automatisch stetig. Beispiel 2.2.1 : (i) Die Funktion f : R → R, x 7→ x ist stetig. y
6
¡f (x) ¡
¡ ¡
-x
¡
¡
¡
(ii) Die Funktion f : R → R, x 7→ |x| ist stetig. y
@
6
@
¡ ¡
¡
@ @¡
-x
(iii) Die Funktion f : R → R, x 7→ bxc ist in jedem Punkt rechts–stetig, aber nur in den Punkten von R \ Z stetig. y
-3 -2 -1
p
p
p
6 p
p 1
p
p -x
2
3
(iv) Die Funktion f : R\{0} → R, x 7→ |x| x ist stetig. Egal, wie man die Funktion an der Stelle 0 definiert, die resultierende Funktion ist nicht stetig. Man kann lediglich entweder Linksstetigkeit erreichen durch f (0) = −1 oder Rechtsstetigkeit durch durch f (0) = 1. y
6 -x
2.2. STETIGKEIT
45
Satz 2.2.2 : Seien f, g : M → R zwei Funktionen, die in x0 ∈ M stetig sind. (i) f ± g und f g sind in x0 stetig. (ii) Wenn g(x0 ) 6= 0, dann gibt es ein δ > 0 f¨ ur das gilt: (a) g(x) 6= 0 f¨ ur alle x ∈ M 0 := ]x0 − δ, x0 + δ[ ∩M , (b) Die Funktion
f g
: M 0 → R, x 7→
f (x) g(x)
stetig in x0 .
Analoge Aussagen lassen sich f¨ ur rechts- und linksseitige Stetigkeit machen (dabei ist nur die Bedingung (a) passend abzu¨ andern). Beweis: Idee: Wende Satz 2.1.4 an. Wenn es ein δ > 0 mit ]x0 − δ, x0 + δ[∩ M = ∅ gibt, dann sind nach Definition alle Funktionen M → R in x0 stetig und es ist nichts mehr zu zeigen. Wir k¨onnen also o.B.d.A. annehmen, daß f¨ ur alle δ > 0 gilt ]x0 − δ, x0 + δ[∩ M 6= ∅ und daher Satz 2.1.4 anwenden. (i) Mit Satz 2.1.4 rechnen wir lim (f ± g)(x) = lim f (x) ± lim g(x) = f (x0 ) ± g(x0 ) = (f ± g)(x0 )
x→x0
x→x0
x→x0
und analog lim (f g)(x) = lim f (x) lim g(x) = f (x0 )g(x0 ) = (f g)(x0 ).
x→x0
x→x0
x→x0
Dies beweist die Behauptung f¨ ur beidseitige Stetigkeit. Die entsprechenden Aussagen f¨ ur einseitige Stetigkeit zeigt man genauso. (ii) Wie im Beweis von Satz 2.1.4(iv) sieht man, daß es ein δ > 0 mit g(x) 6= 0 f¨ ur alle x ∈ ]x0 −δ, x0 +δ[ ∩M =: M 0 gibt. Damit ist die erste Aussage (f¨ ur beidseitige Stetigkeit) gezeigt. Dann rechnet man lim f (x) x→x0 g
=
limx→x0 f (x) f (x0 ) = = fg (x0 ), limx→x0 g(x) g(x0 )
was auch die zweite Behauptung zeigt.
¨ Ubung 2.2.1 : Sei I ein Intervall. Die Menge C(I, R) = {f ∈ F (I, R) | f stetig} ¨ ist ein Untervektorraum von F(I, R) (vgl. Ubung 2.1.4)
Beispiel 2.2.3 : (i) Definiere induktiv f¨ ur n ∈ N die Funktionen pn : R → R, x 7→ xn := x · xn−1 , wobei x1 := x ist. Zus¨atzlich setzt man x0 := 1 f¨ ur alle x ∈ R. Mit Induktion und Satz 2.2.2 sieht man dann auch, daß alle pn stetig sind. Die Funktionen pn heißen Potenzfunktionen.
46
KAPITEL 2. STETIGE FUNKTIONEN
(ii) Endliche Linearkombinationen von Potenzfunktionen heißen Polynomfunktionen oder einfach Polynome. D.h., eine Polynomfunktion ist eine Funktion der Form f : R → R,
x 7→
N X
an xn := a0 · 1 + a1 · x + a2 · x2 + . . . + aN −1 · xN −1 + aN · xN ,
n=0
wobei die an ∈ R feste Konstanten sind. Wieder mit Induktion und Satz 2.2.2 sieht man, daß alle Polynomfunktionen stetig sind. (iii) Sei f eine Polynomfunktion und Mf := {x ∈ R | f (x) 6= 0} die Menge der Punkte, an denen f nicht verschwindet. Dann kann man f¨ ur jede Polynomfunktion g : R → R eine Funktion g f
: Mf → R,
x 7→
g(x) f (x)
definieren. Solche Funktionen nennt man rationale Funktionen. Sei M ⊆ Mf . Dann sieht man wieder mit Satz 2.2.2, daß g(x) g x 7→ f : M → R, f (x) stetig ist.
¨ Ubung 2.2.2 : Die Menge Pol(R) = {f ∈ F (R, R) | f ist Polynomfunktion} ¨ ist ein Untervektorraum von C(R, R) (vgl. Ubung 2.2.1)
Satz 2.2.4 : Seien g : M → N und f : N → R Funktionen und f ◦ g : M → R,
x 7→ f (g(x)).
Wenn g stetig in x0 ∈ M ist und f stetig in y0 = g(x0 ) ∈ N , dann ist f ◦ g stetig in x0 . Wenn g in x0 nur einseitig stetig ist, dann folgt die entsprechende einseitige Stetigkeit f¨ ur f ◦ g. Beweis: Idee: Dies folgt direkt aus den Definitionen. Sei ² > 0. Wegen der Stetigkeit von f in y0 gibt es ein δ > 0 mit |f (y) − f (y0 )| < ² f¨ ur alle y ∈ N mit |y−y0 | < δ. Wegen der Stetigkeit von g in x0 gibt es ein γ > 0 mit |g(x)−g(x0 )| < δ f¨ ur alle x ∈ M mit |x − x0 | < γ. Aber dann folgt ¡ ¢ ¡ ¢ |f g(x) − f g(x0 ) | < ² f¨ ur alle x ∈ M mit |x − x0 | < γ. Damit ist gezeigt, daß f ◦ g in x0 stetig ist. Die Aussagen ¨ des Satzes f¨ ur einseitig stetiges g seien dem Leser als Ubung u ¨berlassen.
Beispiel 2.2.5 : (i) f : R → R, x 7→ |x2 − a| f¨ ur a ∈ R ist stetig.
2.2. STETIGKEIT
47
a
(ii) f : R → R, x 7→ bx2 c ist stetig in 0, aber nicht in 1.
(iii) f : R → R, x 7→ b−x2 c ist nicht stetig in 0.
Lemma 2.2.6 : Sei x0 ∈ M ⊆ R und f : M → R rechts–stetig in x0 . Wenn mit f (x0 ) < k ∈ R, dann gibt es ein δ > 0 mit der Eigenschaft, daß ∀ x ∈ [x0 , x0 + δ[ ∩M : f (x) < k. Beweis: Zu ² > 0 gibt es ein δ > 0 mit |f (x) − f (x0 )| < ² f¨ ur alle x ∈ [x0 , x0 + δ[ ∩M . Wenn man ² < k − f (x0 ) w¨ahlt, liefert dies f (x) − f (x0 ) ≤ |f (x) − f (x0 )| < k − f (x0 ), also f (x) < k f¨ ur alle x ∈ [x0 , x0 + δ[ ∩M .
Bemerkung 2.2.7 : Analog zu Lemma 2.2.6 beweist man:
48
KAPITEL 2. STETIGE FUNKTIONEN
(i) Sei x0 ∈ M ⊆ R und f : M → R rechts–stetig in x0 . Wenn mit f (x0 ) > k ∈ R, dann gibt es ein δ > 0 mit der Eigenschaft, daß ∀ x ∈ [x0 , x0 + δ[ ∩M : f (x) > k. > (ii) Sei x0 ∈ M ⊆ R und f : M → R links–stetig in x0 . Wenn mit f (x0 ) < k ∈ R, dann gibt es ein δ > 0 mit der Eigenschaft, daß > ∀ x ∈]x0 − δ, x0 ] ∩ M : f (x) < k. > k ∈ R, dann gibt es ein δ > 0 mit (iii) Sei x0 ∈ M ⊆ R und f : M → R stetig in x0 . Wenn mit f (x0 ) < der Eigenschaft, daß > ∀x ∈]x0 − δ, x0 + δ[ : f (x) < k.
¨ ur die f 2 in Ubung 2.2.3 : Finde ein Beispiel einer Funktion f : R → R, die in jedem Punkt unstetig ist, aber f¨ jedem Punkt stetig ist. ¨ Ubung 2.2.4 : Es sei f : R \ {0} → R die folgende Funktion: ½ f (x) :=
1 , q
0
falls x ∈ Q, x = falls x ∈ R \ Q.
p q
mit teilerfremden p ∈ Z, q ∈ N,
Zeige, daß f in allen irrationalen Punkten stetig und in allen rationalen Punkten unstetig ist. ¨ Ubung 2.2.5 : Es seien f, g : [a, b] → R stetige Funktionen. Zeige daß aus f (x) = g(x) f¨ ur alle x ∈ Q ∩ [a, b] bereits folgt, daß f (x) = g(x) f¨ ur alle x ∈ [a, b]. ¨ ur f, g : R → R folgendes m¨ oglich ist. Ubung 2.2.6 : Entscheide, ob f¨ (i) f ist stetig, g ist unstetig und f ◦ g ist stetig, (ii) f ist stetig, g ist unstetig und g ◦ f ist stetig, (iii) f ist unstetig, g ist unstetig und f ◦ g ist stetig.
¨ Ubung 2.2.7 : Die Funktion f : R → R sei definiert durch ( f:
1 − x2 x2 − 1
f¨ ur |x| > 1 . f¨ ur |x| < 1
(i) Fertige eine qualitative Skizze von f an. (ii) Untersuche, an welchen Stellen die Funktion f ein- oder beidseitige Grenzwerte hat. (iii) Zeige, daß man f an den Definitionsl¨ ucken so zu einer Funktion g erg¨ anzen kann, daß g auf ganz R stetig ist. Gib g an.
¨ ¨ 2.2.7(iii) in den Definitionsl¨ ucken von f differenzierbar? Ubung 2.2.8 : Ist die Funktion g aus Ubung
2.3. STETIGE FUNKTIONEN AUF INTERVALLEN
2.3
49
Stetige Funktionen auf Intervallen
Lemma 2.3.1 : Sei f : [a, b] → R eine stetige Funktion mit f (a) < 0 < f (b). Dann gibt es ein x0 ∈ [a, b] mit f (x0 ) = 0. Beweis: Idee: Betrachte das Supremum von Z = {x ∈ [a, b] | f (x) < 0} und ben¨utze Lemma 2.2.6. y 6 ...... ... . .. .. .............. . . . . . . . . .... . .... ... ... ... ... ... ....... .. .. . . . ..........................
a
b
x
Betrachte die Menge Z = {x ∈ [a, b] | f (x) < 0}. Wegen f (a) < 0 ist Z nicht leer. Sei x0 das Supremum von Z. Wir zeigen, daß f (x0 ) = 0. W¨are n¨amlich f (x0 ) < 0, dann h¨atte man x0 < b und es g¨abe es nach Lemma 2.2.6 ein δ > 0 mit [x0 , x0 + δ[ ⊆ [a, b] und f (x) < 12 f (x0 ) < 0 f¨ ur alle x ∈ [x0 , x0 + δ[. Insbesondere w¨are x0 + 2δ ∈ Z im Widerspruch zur Tatsache, daß x0 eine obere Schranke von Z ist. y 6 . .. . ... ... ... . . . .... ... 0 ........ . . . .... ..... ....... ....... ........ . . . . . . . . . . ...............
x
f (x0 )
x
W¨are andererseits f (x0 ) > 0, dann h¨atte man a < x0 und g¨abe es nach Bemerkung 2.2.7 ein ur alle x ∈]x0 − δ, x0 ]. Insbesondere δ > 0 mit ]x0 − δ, x0 ] ⊆ [a, b] und f (x) > 12 f (x0 ) > 0 f¨ δ w¨are x0 − 2 schon eine obere Schranke von Z im Widerspruch zur Tatsache, daß x0 kleinste obere Schranke von Z ist. Zusammen erhalten wir f (x0 ) = 0.
Beispiel 2.3.2 : Die Funktion f (x) = x5 + x − 1 ist auf dem Intervall [0, 1] stetig und erf¨ ullt f (0) = −1 und f (1) = 1. Es gibt also eine Zahl x0 ∈ [0, 1] mit x50 + x0 − 1 = 0. Dies ist eine reine Existenzaussage, die keinen Hinweis darauf gibt, wie man diese L¨osung der Gleichung x5 + x − 1 = 0 finden kann.
Satz 2.3.3 (Zwischenwertsatz): Sei f : [a, b] → R eine stetige Funktion und f (a) ≤ y0 ≤ f (b). Dann gibt es ein x0 ∈ [a, b] mit f (x0 ) = y0 . Beweis: Wende Lemma 2.3.1 auf die Funktion g : [a, b] → R, x 7→ f (x) − y0 an.
¨ Ubung 2.3.1 : Beweise folgende Variante des Zwischenwertsatzes: Sei f : [a, b] → R eine stetige Funktion und f (b) ≤ y0 ≤ f (a). Dann gibt es ein x0 ∈ [a, b] mit f (x0 ) = y0 .
50
KAPITEL 2. STETIGE FUNKTIONEN
Seien A und B beliebige Mengen. Eine Abbildung f : A → B heißt injektiv, wenn ∀ x, x0 ∈ A : (f (x) = f (x0 ) ⇒ x = x0 ) und surjektiv, wenn ∀ y ∈ B ∃ x ∈ A : f (x) = y. Wenn f injektiv und surjektiv ist, dann heißt f bijektiv. Also ist f genau dann bijektiv, wenn ∀ y ∈ B ∃! x ∈ A : f (x) = y. Seien I und J Intervalle in R und f : I → J eine Funktion. Als Relation hat man dann f = {(x, y) ∈ I × J | f (x) = y}. Setze
f −1 = {(y, x) ∈ J × I | (x, y) ∈ f }
Diese Relation ist genau dann eine Funktion f −1 : J → I, wenn f : I → J bijektiv ist. In diesem Fall heißt die Funktion f −1 : J → I, f (x) 7→ x die Umkehrfunktion von f . y
J
6 f −1 (x).......
p
... ... ... .. . ... ... ... ... ... ...... .. ......... . ............. . . . . . . . . . . . . . . . . . ..... .... .......... ...... ........ ...
p pp
p
p pp
pp
p
p pp
pp
f (x)
I
-
x
Satz 2.3.4 : Sei I ein Intervall in R und f : I → R eine strikt monoton steigende (fallende) stetige Funktion. Dann gilt (i) f (I) = {f (x) | x ∈ I} ist ein Intervall. (ii) f : I → f (I) ist bijektiv. (iii) f −1 : f (I) → I ist eine strikt monoton steigende (fallende) stetige Funktion. Beweis: Idee: Mit dem Zwischenwertsatz 2.3.3 zeigt man, daß f (I) ein Intervall mit den Endpunkten inf f (I) und sup f (I) ist. Teil (ii) und die strikte Monotonie in Teil (iii) folgen sofort aus der strikten Monotonie. Die Stetigkeit der Umkehrfunktion zeigt man anhand folgender Skizze:
y
2
y0 +δ y0 −δ
y0 y
1
x1
x0 x 0 −ε
x2 x 0 +ε
2.3. STETIGE FUNKTIONEN AUF INTERVALLEN
51
Wir beweisen den Satz f¨ ur strikt monoton steigende Funktionen, der andere Fall geht analog. (i) Nach dem Zwischenwertsatz 2.3.3 ist mit y1 = f (x1 ) und y2 = f (x2 ) auch jedes y zwischen y1 und y2 von der Form f (x). Mit der Charakterisierung der Intervalle aus ¨ Ubung 2.1.1 folgt jetzt die Behauptung. (ii) Wegen der strikten Monotonie ist f : I → R injektiv, also f : I → f (I) bijektiv. (iii) Wenn f −1 (y1 ) = x1 ≥ x2 = f −1 (y2 ), dann gilt nach Voraussetzung y1 = f (x1 ) ≥ f (x2 ) = y2 , d.h. y1 < y2 impliziert x1 < x2 . Also ist f −1 strikt monoton steigend. Bleibt noch die Stetigkeit von f −1 zu zeigen. Sei zun¨achst y0 = f (x0 ) ∈ f (I) kein Randpunkt und ² > 0. Dann gibt es y1 , y2 ∈ f (I) mit f (x1 ) = y1 < y0 < y2 = f (x2 ), also x0 ∈]x1 , x2 [⊆ I. Wir k¨onnen also auch x01 , x02 ∈ I mit x0 − ² < x01 < x0 < x02 < x0 + ² finden. F¨ ur y10 := f (x01 ) und y20 := f (x02 ) gilt dann y0 ∈]y10 , y20 [ und wir finden ein δ > 0 mit y10 < y0 − δ < y0 < y0 + δ < y20 . Wenn also |y − y0 | < δ, dann gilt y10 < y < y20 und somit −² + f −1 (y0 ) = x0 − ² < x01 = f −1 (y10 ) < f −1 (y) < f −1 (y20 ) = x02 < x0 + ² = f −1 (y0 ) + ², was wiederum
|f −1 (y) − f −1 (y0 )| < ²
impliziert. Damit folgt die Stetigkeit von f −1 in allen Punkten von f (I) außer den Randpunkten. Falls ein Randpunkt von f (I) zu f (I) geh¨ort, kann man das obige Argument ¨ leicht modifizieren und die (einseitige) Stetigkeit auch am Rand zeigen (Ubung).
¨ Ubung 2.3.2 : F¨ ur jedes n ∈ N zeige man: Die Potenzfunktion pn : [0, ∞[ → [0, ∞[ ist strikt monoton steigend und surjektiv. Die damit durch Satz 2.3.4 garantierte Umkehrfunktion heißt die n-te Wurzelfunktion und wird √ 1 mit x 7→ n x oder x 7→ x n bezeichnet.
Eine Funktion f : M → R heißt beschr¨ ankt, wenn es eine Zahl k ∈ R mit ∀x ∈ M : |f (x)| < k gibt. Beispiel 2.3.5 : (i) Die Funktion f : ]1, 3[→ R, x 7→
2 x
ist beschr¨ankt: Es gilt |f (x)| < 2 f¨ ur alle x ∈]1, 3[. ¡ 2 ¢ (ii) Die Funktion f : ]0, 3[→ R, x 7→ x2 ist nicht beschr¨ankt: Sei k > 0. Dann gilt f k+1 = k + 1 und 2 k+1 ∈]0, 3[.
52
KAPITEL 2. STETIGE FUNKTIONEN
Satz 2.3.6 : Eine stetige Funktion f : [a, b] → R auf einem abgeschlossenen beschr¨ ankten Intervall ist beschr¨ ankt. y
.. 6 .. .
... ... ... .... ...... ........ ................ .....
-x
................... ......... ....... .... ... ... ... .. .. .
(nicht stetig und nicht beschr¨ ankt!)
Beweis: Idee: Betrachte das Supremum von Z := {c ∈ R | a ≤ c ≤ b, f : [a, c] → R beschr¨ankt}. Wegen Lemma 2.2.6 und Bemerkung 2.2.7 gibt es ein δ > 0 mit ∀ x ∈ [a, a + δ] : f (a) − 1 < f (x) < f (a) + 1. Sei x0 := sup{c ∈ R | a ≤ c ≤ b, f : [a, c] → R beschr¨ankt}. Dann gilt b ≥ x0 ≥ a + δ > a. Als n¨achstes wollen wir zeigen, daß x0 = b. Wenn x0 < b gilt, finden wir, nochmal mit Bemerkung 2.2.7, ein δ1 > 0 mit (∗)
∀ x ∈ [x0 − δ1 , x0 + δ1 ] : |f (x)| < |f (x0 )| + 1. y
6
........ .................. ............. ................................. ......... ................ ....................................
a
x0 δ1
b x
Beachte, daß x0 − δ1 ∈ Z, da es ein x ∈ Z mit x0 − δ1 < x gibt und daher f : [a, x] → R beschr¨ankt ist. A fortiori ist also auch f : [a, x0 − δ1 ] → R beschr¨ankt, d.h. x0 − δ1 ∈ Z. Jetzt schließen wir mit (∗), daß f auf [a, x0 +δ1 ] beschr¨ankt ist. Dies aber steht im Widerspruch zur Definition von x0 . Also ist x0 = b. Jetzt wissen wir, daß f auf jedem Intervall der Form [a, c] mit c < b beschr¨ankt ist. Aus der Stetigkeit von f in b folgt aber, daß es ein δ2 > 0 mit ∀ x ∈ ]b − δ2 , b] : |f (x) − f (b)| < 1 gibt. Wenn also ∀ x ∈ [a, b − δ2 ] : |f (x)| < k und k 0 = max{k, |f (b)| + 1}, dann gilt ∀ x ∈ [a, b] : |f (x)| < k 0 ¯ ¡ ¢¯ weil |f (x)| = ¯f (b) − f (x) − f (b) ¯ ≤ |f (b)| + |f (x) − f (b)|. Also ist f : [a, b] → R beschr¨ankt.
Als Konsequenz von Satz 2.3.6 ergibt sich, daß eine stetige Funktion auf einem abgeschlossenen beschr¨ankten Intervall [a, b] sowohl einen minimalen als auch einen maximalen Wert hat:
2.3. STETIGE FUNKTIONEN AUF INTERVALLEN
53
Satz 2.3.7 : Seien a, b ∈ R und f : [a, b] → R stetig. Dann gibt es xmin , xmax ∈ [a, b] mit f (xmin ) = inf{f (x) | x ∈ [a, b]} =: inf f (x) x∈[a,b]
und f (xmax ) = sup{f (x) | x ∈ [a, b]} =: sup f (x). x∈[a,b]
Beweis: ¡
¢−1
Idee: Betrachte x 7→ sup f ([a, b]) − f (x)
und ben¨ utze Satz 2.3.6.
Sei W := f ([a, b]) := {f (x) | x ∈ [a, b]}. Nach Satz 2.3.6 ist die Menge W beschr¨ankt. Sei K = sup W . Wir suchen also ein xmax mit f (xmax ) = K. Dazu nehmen wir an, daß f (x) < K f¨ ur alle x ∈ [a, b]. Dann k¨onnen wir die Funktion g : [a, b] → R,
x 7→
1 K − f (x)
definieren. Nach Satz 2.2.2 ist g stetig und daher wegen Satz 2.3.6 beschr¨ankt. W¨ahle m > 0 mit g(x) < m f¨ ur alle x ∈ [a, b]. Dann gilt ∀x ∈ [a, b] : f (x) < K −
1 , m
was aber der Definition von K als kleinster oberer Schranke f¨ ur W widerspricht. Also muß es ein xmax ∈ [a, b] mit f (xmax ) = K geben. Die Aussage f¨ ur xmin zeigt man, indem man −f betrachtet (und davon das Minimum bestimmt).
In der Situation von Satz 2.3.7 sagt man, f nimmt auf [a, b] sein Maximum (oder Minimum) an oder auch, f hat in [a, b] ein Maximum (oder Minimum). Ein abgeschlossenes Intervall heißt kompakt, wenn es beschr¨ankt ist, d.h. von der Form [a, b] mit a, b ∈ R. Beispiel 2.3.8 : (i) Die Funktion f : [0, 2] → R, x 7→ x2 − 1 erf¨ ullt −1 = f (0) ≤ f (x) ≤ f (2) = 3 f¨ ur alle x ∈ [0, 2]. (ii) Die Funktion f : ]0, 2[→ R, x 7→ x2 − 1 erf¨ ullt −1 < f (x) < 3 f¨ ur alle x ∈]0, 2[, hat also keinen maximalen und keinen minimalen Wert.
Sei I ein Intervall und f : I → R eine Funktion. Dann heißt f (x0 ) ein Extremum von f , falls es das Minimum oder das Maximum von f ist. ¨ Ubung 2.3.3 : Zeige, daß aus a > 0 folgt, daß an > 0. Gilt dies auch f¨ ur a < 0? ¨ Ubung 2.3.4 : (i) Zeige, daß die Gleichung x5 − 3x3 − x + 1 = 0 im Intervall [0, 2] eine L¨ osung besitzt. (ii) Sei f : [a, b] → [a, b] eine stetige Funktion. Zeige, daß es ein c ∈ [a, b] gibt mit f (c) = c. (iii) Seien f, g : [a, b] → R stetige Funktionen mit f (a) ≤ g(a) und f (b) ≥ g(b). Zeige, daß es ein c ∈ [a, b] mit f (c) = g(c) gibt.
54
KAPITEL 2. STETIGE FUNKTIONEN
¨ Ubung 2.3.5 : Zeige, daß x4 − 3x3 + 1 eine Nullstelle im Intervall [0, 1] besitzt. ¨ Ubung 2.3.6 : (i) Finde ein Beispiel einer unbeschr¨ ankten Funktion f : [0, 1] → R. (ii) Wahr oder falsch? Ist f :]a, b[→ R auf jedem abgeschlossenen Teilintervall von ]a, b[ beschr¨ ankt, so ist f auf ]a, b[ beschr¨ ankt. (iii) Seien f, g : [a, b] → R beschr¨ ankte Funktionen. Zeige, daß dann auch f + g und f g auf [a, b] beschr¨ ankt sind.
¨ Ubung 2.3.7 : (i) Gib ein Beispiel einer Funktion f : [0, 1] → R, die kein Maximum auf diesem Intervall hat, (ii) Gib ein Beispiel einer stetigen Funktion auf einem unbeschr¨ ankten Intervall, die kein Maximum auf diesem Intervall hat, (iii) Gib ein Beispiel einer stetigen Funktion auf einem beschr¨ ankten Intervall, die kein Maximum auf diesem Intervall hat.
¨ Ubung 2.3.8 : Sei I ⊆ R ein Intervall. Zeige, daß jede strikt monotone Funktion f : I → R eine Bijektion f : I → f (I), x 7→ f (x) induziert. Ist die Aussage Jede strikt monotone Funktion f : I → f (I) hat eine stetige ” Umkehrfunktion f −1 : f (I) → I“ richtig? Begr¨ undung? ¨ Ubung 2.3.9 : Es sei
½ f:
]1, ∞[ x
→ 7→
R x x−1
.
(i) Fertige eine qualitative Skizze2 von f an. (ii) Zeige, daß f streng monoton f¨ allt. ¨ (iii) Uberpr¨ ufe die Existenz von lim f (x) und lim f (x) und berechne sie gegebenenfalls. x→1+
x→∞
Hinweis: Wenn g : ]a, ∞[→ R eine monoton fallende Funktion ist, die nicht nach oben beschr¨ ankt ist, dann existiert lim g(x) nicht. (Dieser Hinweis muß nicht gezeigt werden.) x→a+
¨ Ubung 2.3.10 : Untersuche die Menge ½ M :=
¯ ¾ ¯ x ¯ x ∈ ]1, ∞[ x−1 ¯
auf Infimum und Supremum. Ein sehr sch¨ oner Weg ist: (i) Zeige: Ist g : ]a, ∞[→ R eine monoton fallende Funktion, dann existiert sup g(]a, ∞[) genau dann, wenn limx→a+ g(x) existiert und inf g(]a, ∞[) genau dann, wenn limx→∞ g(x) existiert. Im Falle der Existenz gilt sup g(]a, ∞[) = limx→a+ g(x) und inf g(]a, ∞[) = limx→∞ g(x). (ii) Nutze Aufgabe 2.3.9. ¨ Etwas einfacher ist hier aber die direkte Uberpr¨ ufung. ¨ Ubung 2.3.11 : Wann ist die in Aufgabe 2.3.10 vorgestellte Methode zur Bestimmung von Infima und Suprema sinnvoll/praktikabel? Welche Voraussetzung an die Funktion f ist unbedingt notwendig? Kann diese Methode ausgeweitet werden? Hinweis: Man betrachte die Menge {x2 |x ∈ R} (hier ist die Methode sinnvoll) und die Menge { x1 −b x1 c|x ∈ R\{0}} (hier ist die Methode unpraktikabel). ¨ ankte Funktion. Man zeige: x 7→ xg(x) ist stetig im Punkt Ubung 2.3.12 : Es sei g : [−1, 1] → R eine beschr¨ x0 := 0. 2 Diese Skizze soll dazu dienen, eine Vermutung uber die in (iii) gefragten (einseitigen) Grenzwerte zu erhalten. In diesem ¨ Sinne ist hier qualitativ“ zu verstehen. ”
2.3. STETIGE FUNKTIONEN AUF INTERVALLEN ¨ Ubung 2.3.13 : Es sei f : R → R erkl¨ art durch f (x) =
55
x . 1+|x|
(i) Ist f auf R stetig? (ii) Zeige, daß f streng monoton wachsend ist. (iii) Zeige, daß f injektiv ist. (iv) Bestimme die Umkehrfunktion f −1 : f (R) → R von f .
¨ Ubung 2.3.14 : Bestimme Supremum und Infimum der ½ x M := 1 + |x|
Menge ¯ ¾ ¯ ¯ x∈R . ¯
¨ Ubung 2.3.15 : Sei I ⊆ R ein Intervall und f : I → R eine monoton steigende Funktion. Zeige, daß es nur abz¨ ahlbar viele Punkte x ∈ I gibt, in denen f nicht stetig ist. Hinweis: Betrachte in jedem Punkt x ∈ I die Sprungh¨ ohe“ limh→0+ f (x + h) − limh→0+ f (x − h). ” ¨ Ubung 2.3.16 : Man untersuche die folgenden Funktionen f : R → R auf Stetigkeit im Punkt x0 : (i)
1 f (x) =
(ii)
( f (x) =
1 2
0
f¨ ur x > 0 f¨ ur x0 = 0 f¨ ur x < 0
(x − 1)2 x−1
mit x0 = 1.
Literatur: [Be03], [Fo83], [GH70] [Heu80], [K¨o90], [MM93]
f¨ ur x ≥ 1 f¨ ur x < 1
56
KAPITEL 2. STETIGE FUNKTIONEN
Kapitel 3
Differenzierbare Funktionen In diesem Kapitel f¨ uhren wir die Ableitung als Maß f¨ ur die Ver¨ anderung von Funktionswerten ein, zeigen, wie man damit rechnet (Produktregel, Quotientenregel, Kettenregel etc.), und beweisen den grundlegenden Mittelwertsatz f¨ ur differenzierbare Funktionen.
3.1
Die Ableitung einer Funktion
Die Ableitung einer Funktion ist die formalisierte Antwort auf folgende (nicht formalisierte) Frage: Wie stark a¨ndert sich der Funktionswert f (x) einer Funktion in Abh¨angigkeit von dem Wert x? Im Graphen der ¨ Funktion schl¨agt sich diese Anderungsrate als Steigung nieder. Wenn f (x) die Position eines Gegenstandes ¨ zur Zeit x modelliert, dann l¨aßt sich die Anderungsrate als Geschwindigkeit interpretieren. Ist dagegen ¨ f (x) die Geschwindigkeit des Gegenstands, so interpretiert man die Anderungsrate als Beschleunigung (oder Verz¨ogerung). y
.....................
........ ....... 6 ......³ .........³ . . . . . . ³ . . . . . ........... .................³ ............ ........ ³ ....
f (x + h) f (x)
x
.
a
b
x
h
Sei M ⊆ R und f : M → R eine Funktion sowie x ∈ M ein H¨aufungspunkt von M . F¨ ur 0 6= h mit x + h ∈ M betrachtet man den Differenzenquotienten Qf,x : {h ∈ R | h 6= 0, x + h ∈ M } → R,
h 7→
f (x + h) − f (x) h
von f in x. Wenn der Grenzwert limh→0 Qf,x (h) existiert, dann nennt man ihn die Ableitung von f in x und sagt f ist differenzierbar in x. Wenn f in jedem Punkt von M differenzierbar ist, sagt man einfach, f : M → R ist differenzierbar. In diesem Fall bezeichnet man die Funktion M → R, die jedem x ∈ M die Ableitung von f in x zuordnet, mit f 0 : M → R und nennt sie die Ableitung von f . Beachte: Die Existenz des Grenzwerts limh→0
f (x+h)−f (x) h
ist gleichwertig mit ¯ ¯ ³ ´ ¯ f (x + h) − f (x) ¯ (∃y0 ∈ R)(∀² > 0)(∃δ > 0) : 0 6= h ∈] − δ, δ[ ∩ (M − x) ⇒ ¯¯ − y0 ¯¯ < ² , h
wobei M − x = {m − x | m ∈ M } ist.
Beispiel 3.1.1 : 57
58
KAPITEL 3. DIFFERENZIERBARE FUNKTIONEN
(i) Betrachte die Funktion f : ]0, ∞[→ R, x 7→ x1 . Dann gilt 1 x+h
f 0 (x) = lim
−
1 x
h
h→0
=−
1 , x2
d.h. f ist u ¨berall differenzierbar. y
.. .. 6 .. ..
... ... ... ... .... .... .... ...... ...... ....... ........ ......... ........... ............. ................. .......................... ..............
-
x
(ii) Die Funktion f : R → R, x 7→ x ist u ¨berall differenzierbar mit x+h−x = 1. h
f 0 (x) = lim
h→0
y
6
¡ ¡
¡
¡
¡
¡
¡
-x
¡
¡
(iii) Sei c ∈ R. Dann ist die Funktion f : R → R, x 7→ c ist u ¨berall differenzierbar mit c−c = 0. h→0 h
f 0 (x) = lim y
6
-x
Wenn f = (f1 , . . . , fn ) : ]a, b[→ Rn eine vektorwertige Funktion ist und x ∈]a, b[, so heißt f differenzierbar ¡in x, wenn alle f¢j , j = 1, . . . , n in x differenzierbar sind. Die Ableitung von f in x ist dann f 0 (x) := f10 (x), . . . , fn0 (x) ∈ Rn . Differenzierbarkeit ist eine st¨arkere Voraussetzung als Stetigkeit: Satz 3.1.2 : Sei M ⊆ R und f : M → R in x ∈ M differenzierbar. Dann ist f in x stetig. Beweis:
3.1. DIE ABLEITUNG EINER FUNKTION
59
Idee: Differenzenquotienten umformen. Sei 0 6= h ∈ M − x. Dann gilt f (x + h) =
f (x + h) − f (x) h + f (x). h
Weil f in x differenzierbar ist, gilt nach Satz 2.1.4 lim f (x + h) =
h→0
= =
f (x + h) − f (x) · lim h + f (x) h→0 h→0 h f 0 (x) · 0 + f (x) f (x), lim
und dies beweist die Behauptung.
Beispiel 3.1.3 : Um zu sehen, daß Stetigkeit nicht Differenzierbarkeit impliziert, betrachte die Funktion f : R → R, x 7→ |x|. Nach Beispiel 2.2.1 ist f u ¨berall stetig. Andererseits haben wir lim
h→0+
|0 + h| − 0 =1 h
und
lim
h→0−
|0 + h| − 0 = −1, h
woraus man sieht, daß f in 0 nicht differenzierbar ist. y
@
@
6 ¡
@ @¡
¡ ¡ -x
In Satz 2.3.7 haben wir gezeigt, daß stetige Funktionen auf kompakten Intervallen ihre Maxima und Minima annehmen, hatten aber keinerlei Hinweis darauf, wo man diese Extremwerte zu suchen hat. F¨ ur differenzierbare Funktionen liefert die Ableitung notwendige Bedingungen daf¨ ur, daß ein Punkt f (x0 ) ein Extremum, d.h. das Minimum oder das Maximum von f ist. Satz 3.1.4 : Sei f : ]a, b[→ R differenzierbar. Wenn f in x0 ∈]a, b[ ein Extremum hat, dann gilt f 0 (x0 ) = 0. Beweis: Idee: Betrachte das Vorzeichen des Differenzenquotienten in x0 . Wir beweisen die Behauptung f¨ ur den Fall, daß f sein Minimum in x0 hat, d.h. f (x0 ) = inf{f (x) | x ∈]a, b[}. Der andere Fall geht ganz analog. Es gilt f (x0 + h) − f (x0 ) ≥ 0 f¨ ur alle h mit x0 + h ∈]a, b[, also (x0 ) und f (x0 +h)−f ≥ 0 f¨ u r h > 0. Weil aber der Grenzwert h f 0 (x0 ) = lim
h→0
f (x0 + h) − f (x0 ) h
existiert, muß er gleich Null sein (vgl Satz 2.1.6).
f (x0 +h)−f (x0 ) h
≤ 0 f¨ ur h < 0
60
KAPITEL 3. DIFFERENZIERBARE FUNKTIONEN
Insbesondere sieht man mit Satz 3.1.4, daß eine stetige Funktion auf einem kompakten Intervall [a, b], die auf ]a, b[ differenzierbar ist, seine Extremwerte entweder an den Randpunkten des Intervalls oder aber an den Nullstellen der Ableitung annimmt. Beispiel 3.1.5 : Betrachte die Funktion f : [−2, 2] → R, x 7→ x2 − 2x − 3. Sie ist differenzierbar in ] − 2, 2[ mit Ableitung f 0 (x) = 2x − 2. Es gilt f 0 (x) = 0 genau dann, wenn x = 1. Wegen f (−2) = 5, f (1) = −4 und f (2) = −3 sieht man, daß f (1) = −4 das Minimum und f (−2) = 5 das Maximum von f auf [−2, 2] ist. Beispiel 3.1.6 : Betrachte die Funktion f : [−1, 1] → R, x 7→ |2x + 1|. Wegen ½ 2x + 1 f¨ ur x ≥ − 12 f (x) = −2x − 1 f¨ ur x < − 12 ist f differenzierbar in ] − 1, − 21 [ mit Ableitung f 0 (x) = −2 und in ] − 12 , 1[ mit Ableitung f 0 (x) = 2. Insbesondere gilt niemals f 0 (x) = 0. Wegen f (−1) = 1, f (− 21 ) = 0 und f (1) = 3 sieht man, daß f (− 12 ) = 0 das Minimum und f (1) = 3 das Maximum von f auf [−1, 1] ist (die Funktion ist streng monoton in ] − 1, − 21 [ und in ] − 12 , 1[, also k¨onnen Extremwerte nur an den Endpunkten dieser Intervalle auftauchen). y
p A
6¢ ¢ ¢
¢ A¢
-1 - 1 2
1
-x
¨ Ubung 3.1.1 : Benutze die Definition der Ableitung um folgende Funktionen zu differenzieren. (i) f (x) = 2x, (ii) f (x) = x2 , (iii) f (x) = 1/x2 . ¨ Ubung 3.1.2 : Sei
½ f (x) =
x2 0
falls x rational, falls x irrational.
F¨ ur welche x ∈ R ist f differenzierbar? ¨ Ubung 3.1.3 : Es sei D ⊆ R eine offene Teilmenge und f : D → R eine Funktion. Zeige: (i) Ist f differenzierbar in x0 ∈ D, so existiert der Grenzwert s(x0 ) := lim
h→0
f (x0 + h) − f (x0 − h) 2h
und es ist s(x0 ) = f 0 (x0 ). (ii) Aus der Existenz des Grenzwertes s(x0 ) folgt nicht die Differenzierbarkeit von f an der Stelle x0 . ¨ Ubung 3.1.4 : (i) Verallgemeinere die Definition von Grenzwerten auf komplexwertige Funktionen f : M → C, wobei M ⊆ C. (ii) Erstelle mit Hilfe von (i) eine Definition daf¨ ur, daß eine Abbildung f : C → C differenzierbar ist. (iii) Zeige, daß die Potenzfunktionen z n komplex differenzierbar sind. (iv) Zeige, daß z 7→ z nirgends komplex differenzierbar ist, aber u ¨berall stetig ist.
¨ ABLEITUNGEN 3.2. RECHENREGELN FUR
3.2
61
Rechenregeln fu ¨ r Ableitungen
In diesem Abschnitt zeigen wir, wie man Summen und Differenzen, Produkte und Quotienten von differenzierbaren Funktionen ableitet. Satz 3.2.1 : Sei M ⊆ R und f, g : M → R Funktionen, die in x ∈ M differenzierbar sind. Dann sind auch f ± g : M → R in x differenzierbar und es gilt (f ± g)0 (x) = f 0 (x) ± g 0 (x). Wir ben¨ utzen hier folgende Konvention: Wenn in einer Formel ± oder ∓ vorkommt, so hat man entweder u ¨berall das obere oder aber u ¨berall das untere Vorzeichen zu lesen. Beweis: Idee: Differenzenquotienten als Summe von zwei Quotienten schreiben. Wir betrachten den Fall f + g, der andere geht analog. Wegen (f + g)(x + h) − (f + g)(x) f (x + h) − f (x) g(x + h) − g(x) = + h h h und (vgl. Satz 2.1.4) µ ¶ f (x + h) − f (x) g(x + h) − g(x) lim + = h→0 h h =
f (x + h) − f (x) g(x + h) − g(x) + lim h→0 h h 0 0 f (x) + g (x) lim
h→0
folgt die Behauptung.
Satz 3.2.2 (Produktregel): Sei M ⊆ R und f, g : M → R Funktionen, die in x ∈ M differenzierbar sind. Dann ist auch die Funktion f g : M → R in x differenzierbar und es gilt (f g)0 (x) = f 0 (x)g(x) + f (x)g 0 (x). Beweis: Idee: Differenzenquotienten nach dem Schema ab − e ae b = (a − e a)b + e a(b − e b) aufspalten. Wegen (f g)(x + h) − (f g)(x) h
= =
(f (x + h) − f (x))g(x + h) + f (x)(g(x + h) − g(x)) h f (x + h) − f (x) g(x + h) − g(x) g(x + h) + f (x) h h
und (vgl. Satz 3.1.2) f (x + h) − f (x) = h g(x + h) − g(x) = lim h→0 h lim g(x + h) =
lim
h→0
h→0
f 0 (x) g 0 (x) g(x)
finden wir mit Satz 2.1.4 (f g)(x + h) − (f g)(x) = f 0 (x)g(x) + f (x)g 0 (x). h→0 h lim
62
KAPITEL 3. DIFFERENZIERBARE FUNKTIONEN
Beispiel 3.2.3 : Mit Satz 3.2.2 und Induktion findet man p0n (x) = nxn−1 f¨ ur die Potenzfunktionen pn : R → R (vgl. Beispiel 2.2.3). Da die Ableitung einer konstanten Funktion Null ist, sieht man durch Kombination von SatzP3.2.1 und Satz 3.2.2, daßPalle Polynomfunktionen differenzierbar sind und die n n Ableitung von f (x) = k=0 ak xk durch f 0 (x) = k=1 ak kxk−1 gegeben ist.
¨ Ubung 3.2.1 : Sei I ⊆ R ein offenes Intervall. Zeige durch Kombination von Satz 3.2.1 und Satz 3.2.2, daß die Menge der differenzierbaren Funktionen f : I → R bzgl. punktweiser Addition und Multiplikation mit Skalaren ¨ ein Untervektorraum von C(I, R) ist (vgl. Ubung 2.2.1). Zeige weiter, daß die Menge C 1 (I, R) = {f ∈ C(I, R) | f 0 existiert und ist stetig} ein Untervektorraum von C(I, R) ist.
Satz 3.2.4 (Quotientenregel): Sei M ⊆ R und f, g : M → R Funktionen, die in x ∈ M differenf := M ∩ ]x − δ, x + δ[ zierbar sind. Wenn g(x) 6= 0, dann gibt es ein δ > 0 mit g(e x) 6= 0 f¨ ur alle x e∈M f f und g : M → R ist in x differenzierbar mit Ableitung µ ¶0 f 0 (x)g(x) − f (x)g 0 (x) f (x) = . g g(x)2 Beweis: Idee: Differenzenquotienten nach dem Schema
a b
−
a e e b
=
(a−e a)b+e a(e b−b) be b
aufspalten.
f := M ∩ ]x − δ, x + δ[ folgt aus Satz 2.2.2, Die Existenz von δ > 0 mit g(e x) 6= 0 f¨ ur alle x e∈M weil g nach Satz 3.1.2 stetig in x ist. Wegen f g (x
+ h) − fg (x) h
=
f (x+h)−f (x) g(x) h
− f (x) g(x+h)−g(x) h , g(x)g(x + h)
solange g(x + h) 6= 0, und f (x + h) − f (x) = h g(x + h) − g(x) lim = h→0 h lim g(x + h) =
lim
h→0
h→0
lim g(x)g(x + h) =
h→0
f 0 (x) g 0 (x) g(x) g(x)2
finden wir wieder mit Satz 2.2.2 lim
h→0
f g (x
+ h) − fg (x) h
=
f 0 (x)g(x) − f (x)g 0 (x) . g(x)2
¨ ABLEITUNGEN 3.2. RECHENREGELN FUR
63
Beispiel 3.2.5 : Wenn die Z¨ahlerfunktion konstant ist, vereinfacht sich die Formel in Satz 3.2.4 zu: µ ¶0 g0 c = −c 2 . g g Insbesondere findet man mit Induktion µ ¶0 µ ¶0 1 1 1 = (x) = −n n+1 . n x pn x Dar¨ uber hinaus stellt man fest, daß jede rationale Funktion in allen Punkten ihres Definitionsbereiches differenzierbar ist und ihre Ableitung explizit ausgerechnet werden kann.
Satz 3.2.6 (Kettenregel): Seien M und N Teilmengen von R und g : M → N sowie f : N → R Funktionen. Betrachte die Verkn¨ upfung f ◦ g : M → R,
x 7→ f (g(x)).
Wenn g differenzierbar in x0 ∈ M ist und f differenzierbar in y0 = g(x0 ) ∈ N , dann ist f ◦g differenzierbar in x0 und es gilt (f ◦ g)0 (x0 ) = f 0 (y0 )g 0 (x0 ). Beweis: Idee: Differenzenquotienten nach dem Schema Hilfsfunktion y 7→
f (y)−f (y0 ) y−y0
a−e a x−e x
=
y a−e a y−e y−e y x−e x
aufspalten und die Stetigkeit der
0
− f (y0 ) in y0 ausn¨ utzen.
Die Hilfsfunktion ( ρ : N → R,
y 7→
f (y)−f (y0 ) y−y0
− f 0 (y0 )
0
f¨ ur y 6= y0 f¨ ur y = y0
ist nach der Definition der Ableitung und der Linearit¨at der Grenzwertbildung (vgl. Satz 2.1.4) stetig in y0 . F¨ ur alle y ∈ N gilt dann ¡ ¢ f (y) − f (y0 ) = (y − y0 ) f 0 (y0 ) + ρ(y) . F¨ ur x 6= x0 rechnen wir jetzt (f ◦ g)(x) − (f ◦ g)(x0 ) x − x0
= =
f (g(x)) − f (g(x0 )) x − x0 ¢ g(x) − g(x0 ) ¡ 0 f (g(x0 )) + ρ(g(x)) . x − x0
Da ρ ◦ g und f 0 ◦ g in x0 nach Satz 3.1.2 und Satz 2.2.4 stetig sind, konvergiert dieser Ausdruck f¨ ur x → x0 in M gegen g 0 (x0 )(f 0 (y0 ) + 0) und das beweist die Behauptung.
Satz 3.2.7 (Ableitung der Umkehrfunktion): Sei f : ]a, b[→ R eine strikt monoton steigende (fallende) stetige Funktion. Wenn f in x0 ∈]a, b[ differenzierbar ist mit f 0 (x0 ) 6= 0, dann ist die Umkehrfunktion f −1 : f (]a, b[) →]a, b[ in y0 = f (x0 ) differenzierbar und es gilt (f −1 )0 (y0 ) =
1 f 0 (x0 )
.
64
KAPITEL 3. DIFFERENZIERBARE FUNKTIONEN y
6 .. ...... .... .... .. . ... ... ... .... ... .. .... ...... ... ....... . . .. . . . . . . . ...... ... .............. .. .............. ... f .......... .... ......... ........ ......... . ...
pp p p pp p pp p p pp p pp f -1
a
b
x
Beweis: Idee: Differenzenquotienten nach dem Schema funktion x 7→
f (x)−f (x0 ) x−x0
y−e y x−e x
=
1 x−x e y−y e
aufspalten und die Stetigkeit der Hilfs-
− f 0 (x0 ) in x0 ausn¨ utzen.
Wir definieren die Hilfsfunktion ½ ρ : ]a, b[→ R,
x 7→
f (x)−f (x0 ) x−x0
− f 0 (x0 )
0
f¨ ur x 6= x0 f¨ ur x = x0
Diese Funktion ist nach der Definition der Ableitung und der Linearit¨at der Grenzwertbildung (vgl. Satz 2.1.4) stetig in x0 . An dieser Stelle bemerken wir, daß es nach Satz 2.3.4 und seinem Beweis ein offenes Intervall ]y0 −δ, y0 +δ[ in f (]a, b[) gibt. Außerdem k¨onnen wir mit Bemerkung 2.2.7(iii) wegen f 0 (x0 ) 6= 0, der Stetigkeit von f −1 in y0 und von ρ in x0 annehmen, daß (∀y ∈]y0 − δ, y0 + δ[) f 0 (f −1 (y0 )) + ρ(f −1 (y)) 6= 0. F¨ ur alle y ∈]y0 − δ, y0 + δ[ und y = f (x) gilt dann y − y0 = f (f −1 (y)) − f (f −1 (y0 )) = (f −1 (y) − f −1 (y0 ))(f 0 (f −1 (y0 )) + ρ(f −1 (y))). F¨ ur y 6= y0 haben wir x 6= x0 und k¨onnen rechnen f −1 (y) − f −1 (y0 ) y − y0
=
1 f 0 (f −1 (y0 )) + ρ(f −1 (y))
Da ρ ◦ f −1 nach Satz 2.3.4 und Satz 2.2.4 stetig ist, konvergiert dieser Ausdruck f¨ ur y → y0 1 1 gegen f 0 (f −1 (y0 ))+ρ(f = und das beweist die Behauptung. −1 (y )) f 0 (x0 )+0 0
Beispiel 3.2.8 : Die Quadratfunktion p2 : [0, ∞[→ [0, ∞[, x 7→ x2 ist strikt monoton steigend und bijektiv. Die erste Aussage folgt aus den Rechenregeln 1.2.5 f¨ ur die Positivit¨at, die zweite aus der Unbeschr¨anktheit von N (vgl. Lemma B.3.7) und dem Zwischenwertsatz 2.3.3. Die Umkehrfunktion von √ 1 p2 : [0, ∞[→ [0, ∞[ heißt die Quadratwurzelfunktion und wird mit x 7→ x oder x 7→ x 2 bezeichnet. Satz 3.2.7 zeigt jetzt, daß die Wurzelfunktion in ]0, ∞[ differenzierbar ist und die Ableitung durch √ 1 ( x)0 = √ 2 x gegeben ist. Allgemeiner ist auch pn : [0, ∞[→ [0, ∞[, x 7→ xn strikt monoton steigend und bijektiv. Ihre Umkehr√ 1 funktion heißt die n-te Wurzelfunktion und wird mit x 7→ n x oder x 7→ x n bezeichnet. Die Ableitung der n-ten Wurzelfunktion ist auf ]0, ∞[ durch √ n √ x 0 n ( x) = nx gegeben.
¨ ABLEITUNGEN 3.2. RECHENREGELN FUR
65
¨ Ubung 3.2.2 : (i) Sei f eine differenzierbare Funktion mit f (x) 6= 0 f¨ ur alle x ∈ R. Zeige daß µ ¶0 1 f0 = − 2. f f (ii) Zeige mit Induktion: Wenn f : R → R eine differenzierbare Funktion ist, so ist f¨ ur jedes n ∈ N auch die Funktion gn (x) := f (x)n differenzierbar, und es gilt gn0 (x) = n(f (x))n−1 f 0 (x).
¨ Ubung 3.2.3 : (i) Zeige, daß jedes Polynom an jeder Stelle differenzierbar ist, (ii) Finde Funktionen f, g : R → R, die an einer Stelle a ∈ R nicht differenzierbar sind, aber f¨ ur die f + g in a differenzierbar ist. (iii) Man finde und beweise eine Formel f¨ ur die Ableitung eines allgemeinen Polynoms.
¨ Ubung 3.2.4 : Zeige, daß die Ableitung einer rationalen Funktion f (x) =
an x n + · · · + a1 x + a0 bm xm + · · · + b1 x + b0
eine rationale Funktion mit dem gleichen Definitionsbereich ist. ¨ Ubung 3.2.5 : Finde p, q ∈ R so, daß die Funktion f (x) = x2 + px + q in x = 1 ein Minimum mit f (1) = 3 hat. ¨ Ubung 3.2.6 : Betrachte die Funktion f : ]0, 1[ → R, die durch f¨ ur 12 < x < 1 2x f (x) = 1 f¨ ur x = 21 2 ur 0 < x < 12 x + 2x f¨ gegeben ist. (i) Fertige eine qualitative Skizze der Funktion an. (ii) An welchen Stellen ist f stetig, an welchen Stellen nur linksseitig stetig, an welchen Stellen nur rechtsseitig stetig und an welchen Stellen differenzierbar? (mit Begr¨ undung) (iii) Berechne die Ableitung von f an den Stellen, an denen f differenzierbar ist.
¨ Ubung 3.2.7 : Zeige, daß die Funktion ( f:
[0, ∞[ x
→ 7 →
R x3 −2x x2 +5
ein (globales) Minimum besitzt. ¨ Ubung 3.2.8 : Sei c ∈ R und die Funktion fc : R → R durch fc (x) =
1 + (x + c)2 1 + x2
definiert. Zeige: (i) Die Funkrion fc besitzt ein globales Maximum mc . (ii) Die durch m(c) := mc definierte Funktion m : R → R ist stetig.
66
KAPITEL 3. DIFFERENZIERBARE FUNKTIONEN
3.3
Der Mittelwertsatz und seine Anwendungen
Betrachte den Graphen {(x, f (x)) ∈ R2 | x ∈ [a, b]} einer stetigen Funktion f : [a, b] → R auf einem kompakten Intervall [a, b], die auf dem offenen Intervall ]a, b[ differenzierbar ist. Es ist unmittelbar einleuchtend, daß es einen Punkt x0 ∈]a, b[ geben muß, an dem die Steigung f 0 (x0 ) des Graphen von f gleich (a) der Steigung f (b)−f der Verbindungsstrecke zwischen den Punkten (a, f (a)) ∈ R2 und (b, f (b)) ∈ R2 b−a sein muß. Der Mittelwertsatz besagt, daß dies tats¨achlich richtig ist. Satz 3.3.1 (Mittelwertsatz): Sei f : [a, b] → R stetig und differenzierbar im offenen Intervall ]a, b[. (a) . Dann gibt es ein x0 ∈ ]a, b[ mit f 0 (x0 ) = f (b)−f b−a y
6
.. ....³ .. .......³ ³ ..... .... ... .. .. .... ..p ³ ... ³ . .. ³ ³ ... ³ ..
........... .....³ .....³ .. ³ ......
... ... .. .. .. .. .. .. .. .. .. .. ... ... .. . ... .. ... ... .....................
. ... ... ... .... . ..
³
p ³³ ³³ a
³ ³³
-
x0
b
x
Beweis: Idee: Betrachte die Extremwerte der Hilfsfunktion x 7→ f (x) − Die Hilfsfunktion Φ : [a, b] → R,
x 7→ f (x) −
f (b)−f (a) (x b−a
− a).
f (b) − f (a) (x − a) b−a
(a) . Also ist stetig auf [a, b] und differenzierbar auf ]a, b[ mit Ableitung Φ0 (x) = f 0 (x) − f (b)−f b−a hat Φ nach Satz 2.3.7 sowohl ein Maximum als auch ein Minimum auf [a, b], d.h. es gibt ein xmax ∈ [a, b] mit Φ(xmax ) = sup{Φ(x) | x ∈ [a, b]} und ein xmin ∈ [a, b] mit Φ(xmin ) = inf{Φ(x) | x ∈ [a, b]}. Wegen Φ(a) = Φ(b) k¨onnen xmin und xmax nur dann beide auf dem Rand des Intervalls liegen, wenn Φ konstant ist, d.h. Φ(x) = Φ(a) f¨ ur alle x ∈ [a, b]. Dann ist aber Φ0 (x) = 0 f¨ ur alle x ∈]a, b[. Zusammen mit Satz 3.1.4 finden wir also mindestens ein x0 ∈]a, b[ mit Φ0 (x0 ) = 0. Weil aber
Φ0 (x0 ) = f 0 (x0 ) −
f (b) − f (a) , b−a
zeigt dies gerade die Behauptung.
¨ Ubung 3.3.1 : Zeige: das Innere eines Intervalls ist ein offenes Intervall. ¨ Ubung 3.3.2 : Sei M ⊆ R offen und f : M → R eine Funktion. Wir sagen, f ist in x0 ∈ M differenzierbar, es ein offenes Intervall I ⊆ M mit x0 ∈ I gibt, f¨ ur das die Einschr¨ ankung f |I von f auf I in x0 differenzierbar ist, d.h. f |I : I
→
R
x
7→
f (x)
ist differenzierbar in x0 . Zeige: f ist genau dann differenzierbar in x0 , wenn f |J f¨ ur jedes offene Intervall J ⊆ M mit x0 ∈ J in x0 differenzierbar ist.
Eine erste Folgerung des Mittelwertsatzes 3.3.1 ist:
3.3. DER MITTELWERTSATZ UND SEINE ANWENDUNGEN
67
Korollar 3.3.2 : Sei I ⊆ R ein Intervall und f : I → R stetig mit f 0 (x) = 0 f¨ ur alle x ∈ I ◦ . Dann ist f konstant auf I. Insbesondere unterscheiden sich zwei differenzierbare Funktionen mit identischen Ableitungen auf einem Intervall nur durch eine Konstante. Beweis: Idee: Mittelwertsatz. Seien x1 < x2 in I. Dann existiert nach dem Mittelwertsatz 3.3.1 ein x0 ∈]x1 , x2 [ mit 0 = f 0 (x0 ) =
f (x2 ) − f (x1 ) , x2 − x1
was f (x1 ) = f (x2 ) zur Folge hat. Damit ist die erste Behauptung bewiesen. Die zweite folgt, indem man die erste auf die Differenz der beiden Funktionen anwendet.
Korollar 3.3.3 : Sei I ⊆ R ein Intervall und f : I ◦ → R differenzierbar mit f 0 (x) > 0 f¨ ur alle x ∈ I ◦ . Dann ist f strikt monoton steigend. Beweis: Idee: Mittelwertsatz. Wir nehmen an, daß x1 < x2 in I ◦ und f (x1 ) ≥ f (x2 ). Dann gibt es nach dem Mittelwertsatz 3.3.1 ein x0 ∈]x1 , x2 [ mit f (x2 ) − f (x1 ) 0 < f 0 (x0 ) = ≤ 0. x2 − x1 Dieser Widerspruch beweist die Behauptung.
Bemerkung 3.3.4 : Ganz analog zu Korollar 3.3.3 zeigt man f¨ ur ein Intervall I ⊆ R und eine differenzierbare Funktion f : I → R die folgenden Aussagen: (i) Wenn f 0 (x) < 0 f¨ ur alle x ∈ I ◦ , dann ist f strikt monoton fallend. (ii) Wenn f 0 (x) ≥ 0 f¨ ur alle x ∈ I ◦ , dann ist f monoton steigend. (iii) Wenn f 0 (x) ≤ 0 f¨ ur alle x ∈ I ◦ , dann ist f monoton fallend.
Beispiel 3.3.5 : Betrachte die Funktion f : R → R, x 7→ (1+x)(1−x2 ). Dann ist f u ¨berall differenzierbar mit f 0 (x) = −(3x − 1)(x + 1). Also ist f 0 (x) > 0 f¨ ur x ∈] − 1, 13 [ und f 0 (x) < 0 f¨ ur x ∈] − ∞, −1[∪] 31 , ∞[. Also ist f strikt monoton steigend in ] − 1, 13 [ und strikt monoton fallend in ] − ∞, −1[ und in ] 31 , ∞[. Beispiel 3.3.6 : In Beispiel 2.3.2 haben wir gezeigt, daß die Gleichung x5 + x − 1 = 0 eine L¨osung in R hat. Die Funktion f (x) = x5 + x − 1 hat die Ableitung f 0 (x) = 5x4 + 1, die u ¨berall positiv ist. Also ist f strikt monoton steigend, und somit sieht man, daß die Gleichung x5 + x − 1 = 0 auch nicht mehr als eine L¨osung in R hat. Beispiel 3.3.7 : Die Umkehrungen von Korollar 3.3.3 und Bemerkung 3.3.4(i) sind falsch. Als Beispiel daf¨ ur betrachte die Funktion f : R → R, x 7→ x3 , die strikt monoton steigend ist, obwohl f 0 (0) = 0. Den Graphen dieser Funktion nennt man die kubische Parabel.
68
KAPITEL 3. DIFFERENZIERBARE FUNKTIONEN y
6
. ... ... .. . ... ... ... .. . ... ... .... ...... ...................... . . . . . . . . . .. ..... .... ... ... .. . ... ... ... .... .. ...
-x
kubische Parabel
Im Gegensatz zu Beispiel 3.3.7 sind die Umkehrungen von Bemerkung 3.3.4(ii) und (iii) richtig: Satz 3.3.8 : Sei I ⊆ R ein offenes Intervall. (i) Sei f : I → R differenzierbar und monoton steigend, dann gilt f 0 (x) ≥ 0 f¨ ur alle x ∈ I. (ii) Sei f : I → R differenzierbar und monoton fallend, dann gilt f 0 (x) ≤ 0 f¨ ur alle x ∈ I. Beweis: Idee: Betrachte die Vorzeichen der Differenzenquotienten. Wir beweisen nur (i), Teil (ii) geht ganz analog. Betrachte den Differenzenquotienten von f in x: f (x + h) − f (x) ≥0 h weil f (x + h) ≥ f (x) f¨ ur h > 0 und f (x + h) ≤ f (x) f¨ ur h ≤ 0. Aber dann gilt nach dem Satz 2.1.6 auch f¨ ur den Grenzwert f 0 (x) = lim
h→0
f (x + h) − f (x) ≥ 0, h
was die Behauptung beweist.
Sei M ⊆ R und f : M → R. Dann heißt f gleichm¨ aßig stetig auf M , wenn es zu jedem ² > 0 ein δ > 0 gibt, so daß aus x, y ∈ M und |x − y| < δ folgt, daß |f (x) − f (y)| < ². Die gleichm¨aßige Stetigkeit ist eine von vielen Regularit¨atseigenschaften“, die in unterschiedlichen ” S¨atzen als technische Voraussetzungen gebraucht werden. Proposition 3.3.9 : Ist f : R → R differenzierbar und gilt |f 0 (x)| ≤ k f¨ ur ein k ≥ 0 und alle x ∈ R, so ist f gleichm¨ aßig stetig. Beweis: Idee: Mittelwertsatz 3.3.1. Zu ² > 0 w¨ahle δ := k² . Wenn jetzt x < y mit |x−y| < δ, dann gibt es nach dem Mittelwertsatz 3.3.1 ein x0 ∈ ]x, y[ mit (y − x)f 0 (x0 ) = f (y) − f (x). Also haben wir |f (y) − f (x)| ≤ |y − x| |f 0 (x0 )| < δk = ². Daraus folgt die Behauptung, denn der Fall x = y ist trivial.
3.3. DER MITTELWERTSATZ UND SEINE ANWENDUNGEN
69
¨ Ubung 3.3.3 : Sei f : R → R differenzierbar. Zeige: Falls f (0) = 0 und |f 0 (x)| ≤ M f¨ ur alle x ∈ R, dann gilt |f (x)| ≤ M |x| f¨ ur alle x ∈ R. ¨ Ubung 3.3.4 : Sei f : R → R differenzierbar. Wahr oder falsch? Wenn f eine streng monotone Funktion ist, so ist auch f 0 streng monoton. ¨ Ubung 3.3.5 : Zeige, daß die Gleichung x3 − 2x2 − 4x = −1 genau 3 reelle L¨ osungen besitzt. Hinweis: Untersuche die Nullstellen der Ableitung der Funktion f (x) := x3 − 2x2 − 4x + 1.
¨ ur ein ² > 0 gilt, daß Ubung 3.3.6 : Sei I ein Intervall und f : I → R stetig. Zeige: Wenn x0 ∈ I ◦ und f¨ f : ]x0 − ², x0 + ²[\{x0 } → R differenzierbar ist mit limx→x0 f 0 (x) = η, dann ist f auch in x0 differenzierbar mit f 0 (x0 ) = η. ¨ Ubung 3.3.7 : Es seien f, g : [a, b] → R stetige Funktionen, die auf ]a, b[ differenzierbar sind, wobei g 0 (x) 6= 0 sei f¨ ur alle x ∈ ]a, b[. Zeige, daß dann g(a) 6= g(b) ist und ein c ∈ ]a, b[ existiert mit f 0 (c) f (b) − f (a) = . g 0 (c) g(b) − g(a)
¨ Ubung 3.3.8 : Zeige, dass die Gleichung
4x3 (x−1)2
= 3 eine L¨ osung in ]0, 1[ hat.
¨ Ubung 3.3.9 : Man finde eine stetige Funktion f : R → R, die f¨ ur alle x ∈ R \ {−3, 1} differenzierbar ist, und folgenden Eigenschaften hat: (i) f (0) = −1. (ii)
−1 f 0 (x) = 0 2
f¨ ur − ∞ < x < −3 f¨ ur − 3 < x < 1 f¨ ur 1 < x < ∞
¨ Ubung 3.3.10 : Man sch¨ atze (ohne Taschenrechner) die Gr¨ oße des Fehlers ab, mit dem der Ausdruck π21−1 − 1 berechnet wird, wenn man f¨ ur π den Wert 3, 14 annimmt. Es darf ohne Nachweis 3, 14 < π < 3, 142 benutzt π 2 +1 werden1 .
¨ Bei Ubung 3.3.10 ist die Methode, eine Absch¨atzung zu finden, wesentlich interessanter als das erreichte Ergebnis. Man kann z.B. mit sehr wenig Rechenaufwand zeigen, dass ¯µ ¶ µ ¶¯ ¯ ¯ 1 1 1 1 ¯ ¯ < 7 · 10−5 − − − ¯ π2 − 1 π2 + 1 2 2 3, 14 − 1 3, 14 + 1 ¯ ist, wobei dieses Ergebnis durch genauere Zwischenabsch¨atzungen bei der Herleitung noch verbessert werden kann.
Wende den Mittelwertsatz auf die Funktion f (x) = x21−1 − x21+1 an. Setze dazu h := π − 3, 14, ermittele eine obere Absch¨ atzung f¨ ur h und eine f¨ ur |f 0 (ξ)|, wobei π − h < ξ < π. Setze diese Absch¨ atzungen zusammen zu einer Absch¨ atzung von |f (π) − f (π − h)|. Zur Ermittelung einer oberen Absch¨ atzung von |f 0 (ξ)| zeige, daß f 0 in einem Intervall I, welches π − h, π und ξ enth¨ alt, streng monoton wachsend und negativ ist. Sch¨ atze dann π − h nach unten ab, z.B. durch 3, und berechne |f 0 (3)|. 1 Hinweise:
70
KAPITEL 3. DIFFERENZIERBARE FUNKTIONEN
Kapitel 4
Konvergenz von Folgen und Reihen In diesem Kapitel betrachten wir Folgen und Reihen von reellen und komplexen Zahlen. Die Konvergenzuntersuchungen werden auf Grenzwertverhalten von Funktionen zur¨ uckgef¨ uhrt und sp¨ ater zur Konstruktion von wichtigen Beispielklassen von Funktionen sowie in der Begr¨ undung der Integralrechnung verwendet. Von besonderer Bedeutung sind hier die geometrische Reihe, die Dezimalbruchentwicklung und der Umordnungssatz f¨ ur absolut konvergente Reihen.
4.1
Folgen
Eine Folge von Elementen einer Menge M ist eine Abbildung N → M, n 7→ an . Wir bezeichnen eine solche Folge mit (an )n∈N . In diesem Abschnitt betrachten wir Folgen reeller oder komplexer Zahlen, d.h. ¨ an ∈ R oder an ∈ C. Ahnlich wie f¨ ur reellwertige Funktionen kann man Summen und Differenzen sowie Produkte und, gegebenenfalls, Quotienten von Folgen bilden: (an )n∈N ± (bn )n∈N
:=
(an )n∈N (bn )n∈N (an )n∈N (bn )n∈N
:=
(an ± bn )n∈N
(an bn )n∈N ³a ´ n := bn n∈N
(4.1) (4.2) (4.3)
Letzteres ist nat¨ urlich nur m¨oglich, wenn alle bn von Null verschieden sind. Wenn (an )n∈N eine konstante Folge ist, d.h. an = c f¨ ur alle n ∈ N, dann wird aus dem Produkt die skalare Multiplikation c(bn )n∈N := (cbn )n∈N .
(4.4)
¨ Ubung 4.1.1 : Sei K gleich R oder C. Zeige: Die Menge FK aller Folgen in K mit der Addition aus (4.1) und der skalaren Multiplikation aus (4.4) ist ein K-Vektorraum.
Bemerkung 4.1.1 : Wenn z = x+iy ∈ C mit x, y ∈ R, dann definiert man das konjugiert Komplexe ¨ z von z durch z = x − iy. Dann gilt zz = x2 + y 2 ≥ 0 nach Satz 1.2.3, also k¨onnen wir nach Ubung 2.3.2 den Betrag von z durch √ |z| := zz √ definieren. F¨ ur z ∈ R ⊆ C, d.h. f¨ ur y = 0 und z = x, gilt |z| = x2 = |x|, wobei letzteres der Betrag der reellen Zahl x ist. Also ist weder der Name Betrag noch die Bezeichnung | · | ambivalent. Weiter gilt ¨ (Ubung) f¨ ur z, w ∈ C (i) |z| ≥ 0. 71
72
KAPITEL 4. KONVERGENZ VON FOLGEN UND REIHEN
(ii) |z| = 0 ⇔ z = 0. (iii) |z + w| ≤ |z| + |w| (Dreiecksungleichung). (iv) |zw| = |z| |w|.
Man sagt, eine Folge (an )n∈N komplexer Zahlen1 hat den Grenzwert oder Limes a, wenn ∀² > 0 ∃n0 ∈ N : (n0 < n ∈ N ⇒ |a − an | < ²). Man schreibt in diesem Fall limn→∞ an = a oder einfach an → a und sagt (an )n∈N konvergiert gegen a. Diese Definition sieht nicht nur genauso aus wie die Definition f¨ ur Grenzwerte von Funktionen im Unendlichen, sondern kann auch darauf zur¨ uckgef¨ uhrt werden, was uns die Wiederholung von einer Reihe von Argumenten erspart: Bemerkung 4.1.2 : Sei K gleich R oder C. Weiter sei FK die Menge aller Folgen (an )n∈N in K und F([1, ∞[, K) die Menge aller K-wertigen Funktionen auf [1, ∞[. Definiere eine Abbildung Φ : FK → F([1, ∞[, K),
(an )n∈N 7→ Φ((an )n∈N )
durch Φ((an )n∈N )(x) = abxc , wobei bxc wie in Beipiel 2.1.1 der ganzzahlige Anteil von x ist. y
6 p p
a2 a1
p p
p
1 2 3 4 5 6
x
Es gilt Φ(r(an )n∈N + s(bn )n∈N )(x) = Φ((ran + sbn )n∈N )(x) = (ra + sb)bxc = rabxc + sbbxc = rΦ((an )n∈N )(x) + sΦ((bn )n∈N )(x) = (rΦ((an )n∈N ) + sΦ((bn )n∈N )) (x), also Φ(r(an )n∈N + s(bn )n∈N ) = rΦ((an )n∈N ) + sΦ((bn )n∈N ), d.h. die Abbildung Φ ist linear. Daher gen¨ ugt es nachzuweisen, daß eine Folge (an )n∈N mit Φ((an )n∈N ) = 0 die konstante Nullfolge sein muß, um zu zeigen, daß Φ injektiv ist. Aber dieser Nachweis ist klar mit an = Φ((an )n∈N )(n) = 0. Man kann daher die Menge der Folgen in K als Teilmenge der K-wertigen Funktionen auf [1, ∞[ auffassen. Ganz analog zur Linearit¨at von Φ weist man nach, daß Φ((an )n∈N (bn )n∈N ) = Φ((an )n∈N )Φ((bn )n∈N ) und, falls bn 6= 0 f¨ ur alle n ∈ N,
µ Φ
1 Da
(an )n∈N (bn )n∈N
¶ =
Φ((an )n∈N ) . Φ((bn )n∈N )
wir R als Teilmenge von C auffassen, beinhaltet dies den Fall von Folgen reeller Zahlen
4.1. FOLGEN
73
Satz 4.1.3 : Eine Folge (an )n∈N reeller Zahlen konvergiert gegen a genau dann, wenn Φ((an )n∈N ) f¨ ur x gegen unendlich gegen a konvergiert, d.h. ¡ ¢ lim an = a ⇔ lim Φ (an )n∈N (x) = a. n→∞
x→∞
Beweis: Idee: Betrachte die Funktionswerte an den ganzzahligen Stellen. Wir schreiben f f¨ ur Φ((an )n∈N ) und w¨ahlen ein ² > 0. Wenn limn→∞ an = a, dann gibt es ein n0 ∈ N mit |a − an | < ² f¨ ur alle n > n0 . Dann gilt aber auch |a − f (x)| = |a − abxc | < ² f¨ ur alle x > n0 + 1. Damit folgt limx→∞ f (x) = a, weil ² beliebig war. Umgekehrt, wenn limx→∞ f (x) = a, dann finden wir ein x0 ∈ [1, ∞[ mit |a − f (x)| < ² f¨ ur alle x > x0 . Dann gilt aber auch |a − an | = |a − f (n)| < ² f¨ ur alle n > x0 ≥ bx0 c. Wir w¨ahlen n0 := bx0 c und sehen, daß limn→∞ an = a gilt.
Korollar 4.1.4 : Seien (an )n∈N und (bn )n∈N zwei Folgen reeller Zahlen mit limn→∞ an = a und limn→∞ bn = b. Dann gilt (i) limn→∞ (an ± bn ) = a ± b. (ii) limn→∞ (an bn ) = ab. (iii) limn→∞ ( abnn ) = ab , falls alle bn und b ungleich Null sind. Beweis: Idee: Dies folgt sofort aus Satz 4.1.3, Bemerkung 4.1.2 und Satz 2.1.4.
Bemerkung 4.1.5 : Der Satz 4.1.3 und sein Korollar 4.1.4 lassen problemlos auf komplexe Folgen ¨ u oder zun¨achst den Satz 2.1.4 auf kom¨bertragen. Man kann dies entweder direkt beweisen (Ubung) plexwertige Funktionen verallgemeinern, was mit den Eigenschaften des Betrags auf C (vgl. Bemerkung 4.1.1) ebenfalls unproblematisch ist. ¨ Ubung 4.1.2 : (i) Man verallgemeinert die Begriffe Grenzwert“ und Stetigkeit“ f¨ ur C-wertige Funktionen (die auf Teilmen” ” gen von R definiert sind), indem man in den Definitionen f¨ ur R-wertige Funktionen einfach den reellen Betrag durch den komplexen Betrag ersetzt. Sei M ⊆ R und f : M → C eine Funktion. Zeige: (a) Der limx→x0 f (x) existiert genau dann, wenn die Grenzwerte limx→x0 Re f (x) und limx→x0 Im f (x) existieren. In diesem Fall gilt lim f (x) = lim Re f (x) + i lim Im f (x).
x→x0
x→x0
x→x0
74
KAPITEL 4. KONVERGENZ VON FOLGEN UND REIHEN (b) f ist genau dann stetig in x0 ∈ M , wenn Re f und Im f stetig in x0 sind.
(ii) Man verallgemeinere Satz 4.1.3 f¨ ur C-wertige Folgen und Funktionen. (iii) Man beweise das Korollar 4.1.4 f¨ ur komplexe Folgen direkt aus der Definition des Grenzwerts von Folgen. (iv) Zeige: eine komplexe Folge (an )n∈N ist genau dann konvergent, wenn die beiden reellen Folgen (Re an )n∈N und (Im an )n∈N konvergent sind. In diesem Fall gilt lim an = lim Re an + i lim Im an .
n→∞
n→∞
n→∞
Korollar 4.1.6 : Seien (an )n∈N , (bn )n∈N und (cn )n∈N drei Folgen in R. (i) Wenn an ≤ bn f¨ ur alle n und limn→∞ an = a sowie limn→∞ bn = b, dann gilt a ≤ b. (ii) Wenn an ≤ bn ≤ cn f¨ ur alle n und limn→∞ an = a sowie limn→∞ cn = a, dann gilt limn→∞ bn = a. Beweis: Idee: Der erste Teil folgt sofort aus Satz 4.1.3 und Satz 2.1.6, w¨ahrend der zweite Teil aus Satz 4.1.3 und Satz 2.1.7 folgt.
Wie im Falle von Satz 2.1.6 wird ¡die¢ Aussage ¡in Korollar 4.1.6(i) falsch, wenn man ≤“ durch <“ ¢ ” ” ersetzt: Betrachte einfach die Folgen n1 n∈N und − n1 n∈N , die beide den Grenzwert 0 haben. Wenn eine Folge (an )n∈N komplexer Zahlen nicht konvergiert, dann nennt man sie divergent. Spezielle Klasse divergenter Folgen sind die folgenden: (a) Reelle Folgen (an )n∈N , f¨ ur die es zu jeder Zahl K ∈ R ein n0 gibt mit (∀n > n0 ) an > K. y K
p p p p 6p p p p p p p p p p p p pp p p x0
x
Man schreibt dann limn→∞ an = ∞ oder an → ∞, auch wenn dies kein Grenzwert im Sinne der Definition zu Anfang dieses Abschnitts ist. Analog schreibt man limn→∞ an = −∞ oder an → −∞, wenn es zu jeder Zahl K ∈ R ein n0 gibt mit (∀n > n0 ) an < K. (b) Komplexe Folgen (an )n∈N , f¨ ur die es zu jeder Zahl K ∈ R ein n0 gibt mit (∀n > n0 ) |an | > K. Auch hier schreibt man oft limn→∞ an = ∞, was aber etwas problematisch ist, denn damit werden z.B. auch Folgen erfaßt, die im Sinne von (a) eigentlich limn→∞ an = −∞ liefern.2 Eine Folge (an )n∈N in C heißt beschr¨ ankt, wenn es ein M ∈ R mit |an | < M f¨ ur alle n ∈ N gibt. 2 Der tiefere Grund f¨ ur dieses Problem ist, daß man f¨ ur R zwei unterschiedliche Punkte im Unendlichen unterscheidet, in C aber nur einen Punkt im Unendlichen betrachtet (Stichwort: Riemannsche Zahlenkugel“) ”
4.1. FOLGEN
75 y M M
6p p p p p p p pp p p p p x pp p p p p p
Eine Folge (an )n∈N in R nennt man nach oben beschr¨ ankt, wenn es ein M ∈ R mit an < M f¨ ur alle n ∈ N gibt, und nach unten beschr¨ ankt, wenn es ein M ∈ R gibt mit an > M f¨ ur alle n ∈ N. Also sind reelle Folgen genau dann beschr¨ankt, wenn sie nach oben und nach unten beschr¨ankt sind. Proposition 4.1.7 : Eine konvergente Folge in C ist beschr¨ ankt. Beweis: Idee: Nur endlich viele Folgenglieder haben Abstand gr¨oßer 1 vom Grenzwert. W¨ahle irgendein festes ² > 0 (z.B. ² = 1). Wenn limn→∞ an = a, dann gibt es ein n0 ∈ N mit (∀n > n0 ) |an − a| < ². Aber dann haben wir auch (∀n > n0 ) |an | < |a| + ². W¨ahlt man nun M := max{|a1 |, . . . , |an0 |, |a| + ²}, dann folgt |an | < M f¨ ur alle n ∈ N. y p 6 p p p p p p p p p p pp
p pp pp ppp p p p pp p ppppp ppp p p p p p
x
n0
Eine Folge (an )n∈N reeller Zahlen heißt monoton steigend, wenn n≤m
⇒
an ≤ am
n<m
⇒
an < am
f¨ ur alle n, m ∈ N. Wenn f¨ ur alle n, m ∈ N, heißt f strikt monoton steigend. Analog sagt man, daß eine Folge (an )n∈N monoton fallend, ist, wenn n ≤ m ⇒ an ≥ am f¨ ur alle n, m ∈ N. Entsprechend, wenn n<m
⇒
an > am
f¨ ur alle n, m ∈ N, heißt f strikt monoton fallend. Schließlich heißt (an )n∈N monoton, wenn sie monoton fallend oder monoton steigend ist. Proposition 4.1.8 :
76
KAPITEL 4. KONVERGENZ VON FOLGEN UND REIHEN
(i) Sei (an )n∈N eine monoton steigende Folge reeller Zahlen, die nach oben beschr¨ ankt ist. Dann existiert limn→∞ an . y
6 -x (ii) Sei (an )n∈N eine monoton fallende Folge reeller Zahlen, die nach unten beschr¨ ankt ist. Dann existiert limn→∞ an . Beweis: Idee: Der erste Teil folgt sofort aus Satz 2.1.12, wenn man bemerkt, daß die Abbildung Φ aus Bemerkung 4.1.2 monoton steigende Folgen auf monoton steigende Funktionen abbildet. Entsprechend folgt der zweite Teil aus Bemerkung 2.1.13.
Sei (an )n∈N eine Folge in einer Menge M und (pn )n∈N eine strikt steigende monotone Folge nat¨ urlicher Zahlen. Dann heißt die Folge (apn )n∈N : N → M, n 7→ apn eine Teilfolge von (an )n∈N . Beispiel 4.1.9 : (i) Sei (an )n∈N eine Folge, dann ist (a2n )n∈N eine Teilfolge von (an )n∈N . (ii)
1 1 1 1 2 , 4 , 8 , 16 , . . .
ist eine Teilfolge von 11 , 12 , 13 , 41 , . . ..
Proposition 4.1.10 : Sei (an )n∈N eine Folge komplexer Zahlen und (apn )n∈N eine Teilfolge von (an )n∈N . Wenn limn→∞ an = a, dann gilt limn→∞ apn = a. Beweis: Idee: Mit pn ≥ n folgt dies direkt aus den Definitionen. Sei ² > 0 und n0 ∈ N so, daß |an − a| < ² f¨ ur alle n > n0 . Da pn strikt monoton ist, gilt pn ≥ n (Induktion). Damit sieht man aber, daß (∀n > n0 )
|apn − a| < ²,
also limn→∞ apn = a. y
6p
p
ppp p p p p p p pp p ppp p p pp p p p
x
4.1. FOLGEN
77
Satz 4.1.11 (Bolzano–Weierstraß): Teilfolge. y
Jede beschr¨ ankte Folge reeller Zahlen hat eine konvergente
6
p p p cp p pc cp pc pc pc cp pc p p p p p p p p
-
x
Beweis: Idee: Betrachte die Suprema der Endst¨ucke (an )n≥k der Folge und w¨ahle eine Teilfolge, die diesen Suprema beliebig nahe kommt. Die Folge der Suprema ist monoton und beschr¨ ankt, hat nach Proposition 4.1.8 also einen Grenzwert, der dann auch der Grenzwert der Teilfolge sein wird.
Sei (an )n∈N beschr¨ankt. Setze bn := sup{ak | k ≥ n}. y
bn p p p p p p p p p p p p p p p p n p x p p p
6
Dann ist (bn )n∈N monoton fallend und beschr¨ankt, konvergiert also nach Proposition 4.1.8 gegen ein b ∈ R. y
6 (bn )n∈N
b
-
x
Wir definieren induktiv eine strikt monotone Folge (pn )n∈N in N durch p1 := min{m ∈ N | |am − b1 | < 1} und
n pn+1 := min m ∈ N | m ≥ pn + 1, |am − bpn +1 | <
1 o . pn + 1
Sei jetzt ² > 0. Dann gibt es ein n0 ∈ N so, daß sowohl |bn − b| < ² als auch n > n0 gilt. F¨ ur solche n rechnen wir |apn+1 − b| ≤ |apn+1 − bpn +1 | + |bpn +1 − b| <
1 n
< ² f¨ ur alle
1 + |bpn +1 − b| < 2² pn + 1
Also konvergiert die Teilfolge (apn )n∈N von (an )n∈N gegen b.
¨ Ubung 4.1.3 : Zeige, daß die Aussage des Satzes 4.1.11 von Bolzano-Weierstraß auch f¨ ur komplexe Folgen gilt. Hinweis: betrachte erst die Realteile und dann die Imagin¨ arteile der Folge.
Die folgende Proposition zeigt, daß man die Stetigkeit von Funktionen auf R auch durch die Konvergenz von Folgen ausdr¨ ucken kann. Das ist manchmal sehr n¨ utzlich, wenn man die Stetigkeit einer konkret gegebenen Funktion nachweisen muß.
78
KAPITEL 4. KONVERGENZ VON FOLGEN UND REIHEN
Proposition 4.1.12 : Sei M ⊆ R und f : M → R eine Funktion. F¨ ur x ∈ M sind folgende Aussagen aquivalent: ¨ (1) f ist rechtsseitig stetig in x. (2) F¨ ur jede Folge (xn )n∈N von Zahlen in M ∩]x, ∞[ mit limn→∞ xn = x gilt limn→∞ f (xn ) = f (x). (3) F¨ ur jede strikt monoton fallende Folge (xn )n∈N von Zahlen in M ∩]x, ∞[ mit limn→∞ xn = x gilt limn→∞ f (xn ) = f (x). Beweis: Idee: Die Implikationen (1)⇒(2)⇒(3)“ folgen unmittelbar aus den Definitionen. Die Implikation ” (3)⇒(1)“ l¨ aßt sich per Widerspruch aus den Definitionen beweisen. ”
Wir zeigen (3)⇒(1)“: Wenn f in x nicht rechtsseitig stetig ist, dann gibt es ein ² > 0 mit ” ¡ ¢ (∀n ∈ N) ∃xn ∈ M ∩ ]x, x + n1 [ |f (xn ) − f (x)| > ². Man kann jetzt eine Teilfolge (xnj )j∈N so ausw¨ahlen, daß . . . < xnj < x +
1 nj
< |xnj−1 − x|. Dann gilt
1 < xnj −1 < . . . nj
und insbesondere ist diese Teilfolge dann strikt monoton fallend. Trotzdem konvergiert die Folge (f (xnj ))j∈N f¨ ur j → ∞ nicht gegen f (x), obwohl die Folge (xnj )j∈N gegen x konvergiert.
Selbstverst¨andlich kann man analoge Aussagen auch f¨ ur linksseitig stetige und stetige Funktionen beweisen. ¨ Ubung 4.1.4 : Eine Folge (an )n∈N reeller Zahlen heißt Cauchy–Folge, wenn es zu jedem ² > 0 ein n0 ∈ N gibt mit (∀k, m ∈ N, k, m > n0 ) |ak − am | < ². Zeige, daß jede Cauchy–Folge konvergiert. Hinweis: Zeige zun¨ achst, daß jede Cauchy–Folge beschr¨ ankt ist und benutze dann den Satz 4.1.11 von Bolzano–Weierstraß.
¨ Ubung 4.1.5 : Benutze Definition des Grenzwertes einer Folge, um folgendes zu zeigen: 1 2 n→∞ n
(i) lim
= 0,
(ii) lim n+1 = 1, n→∞ n+2 ³ 2 ´ +1 divergiert, (iii) nn+1 n∈N
(iv) ((−1)n )n∈N divergiert. ¨ Ubung 4.1.6 : auch (an )n∈N .
Wahr oder falsch? Falls 0 ≤ an ≤ bn f¨ ur alle n ∈ N, und (bn )n∈N konvergiert, so konvergiert
¨ Ubung 4.1.7 : Definiere
3an + 4 f¨ ur n ≥ 2. 2an + 3 konvergiert und bestimme den Grenzwert. Hinweis: Proposition 4.1.10 a1 := 1;
Zeige, daß (an )n∈N
an+1 :=
¨ Ubung 4.1.8 : Berechne die folgenden Limiten:
4.1. FOLGEN
79
2n −n2 n 2 , n→∞ 2 n
(i) lim
(ii) lim (−2)3n 3−2n , n→∞
¨ Ubung 4.1.9 : Sei n ∈ N, q ∈ R. Zeige, daß 1 + q + · · · + q n =
1−q n+1 . 1−q
¨ achst f¨ ur x ∈] − 1, ∞[ und Ubung 4.1.10 : Zeige, daß die Folge ((1 + n1 )n )n∈N konvergiert. Hinweis: Beweise zun¨ n ∈ N die Bernoullische Ungleichung (1 + x)n ≥ 1 + nx und zeige dann, daß die gegebene Folge monoton und beschr¨ ankt ist. ¨ Ubung 4.1.11 : Ist (an )n∈N eine beschr¨ ankte Folge, so definiere sn := sup an ,
jn := inf ak . k≥n
k≥n
(i) Zeige, daß die Folgen (sn )n∈N und (jn )n∈N konvergieren. (ii) Es sei M+ ((an )n∈N ) := lim sn n→∞
und
M− ((an )n∈N ) := lim jn . n→∞
Zeige, daß f¨ ur alle beschr¨ ankten Folgen (an )n∈N , (bn )n∈N gilt M− ((an )n∈N ) + M− ((bn )n∈N )
≤
M− ((an + bn )∈N )
≤
M+ ((an + bn )n∈N )
≤
M+ ((an )n∈N ) + M+ ((bn )n∈N ).
(iii) Finde ein Beispiel zweier beschr¨ ankter Folgen (an )n∈N , (bn )n∈N derart, daß in obiger Ungleichungskette u ¨berall <“ steht. ”
¨ Ubung 4.1.12 : Man untersuche die nachstehenden Folgen (an )n∈N auf Konvergenz und bestimme gegebenenfalls die Grenzwerte √ √ (i) an = n + 4 − n + 2. ³ ´4 5n (ii) an = 2n+1 . (iii) an =
n2 −1 n+3
−
n3 +1 . n2 +1
¨ Ubung 4.1.13 : Man untersuche die nachstehenden rekursiv definierten Folgen (an )n∈N auf Konvergenz und bestimme gegebenenfalls die Grenzwerte
(ii) a1 = 0,
an+1 = 14 (an − 3). √ an+1 = 2 + an .
(iii) a1 = 2,
an+1 =
(iv) a1 = 0,
an+1 = 3an + 2.
(i) a1 = 0,
3 . 4−cn
80
4.2
KAPITEL 4. KONVERGENZ VON FOLGEN UND REIHEN
Reihen
Sei (an )n∈N eine Folge komplexer Zahlen. Dann ist die zugeh¨orige Reihe die Folge (sn )n∈N der Partialsummen n X sn := ak := a1 + . . . + an . k=1
P∞ Wenn die Folge (sn )n∈N konvergiert, P∞ dann sagt man, die Reihe k=1 ak konvergiert und bezeichnet den Grenzwert limn→∞ sn mitP k=1 ak . Dieser Grenzwert heißt auch die Summe oder der Wert der ∞ Reihe. Man schreibt auch oft k=1 ak anstatt (sn )n∈N und zwar und zwar unabh¨ P∞angig davon, ob die Reihe konvergiert oder nicht. In der Regel wird aus dem Kontext klar, ob mit k=1 ak die Reihe oder der Wert der Reihe gemeint ist.
Beispiel 4.2.1 (Geometrische Reihe): 1 Wert 1−x :
Die Reihe
P∞ k=0
xk konvergiert f¨ ur x ∈ [0, 1[ und hat den
6 1 XX XXX x X
XX
1
XXX X
-
x2
x
Die horizontale Seite des Dreiecks hat die L¨ ange
1 1−x
Allgemeiner, sei z ∈ C mit 0 6= |z| < 1 und an := z n−1 . Dann gilt |an+1 | = |z| |an | < |an |, d.h. die Folge (|an |)n∈N ist beschr¨ankt und monoton fallend. Also existiert nach Proposition 4.1.8 der Grenzwert limn→∞ |an |. Wegen lim |an | = lim |an+1 | = |z| lim |an | n→∞
n→∞
n→∞
muß limn→∞ |an | = 0 gelten. Damit haben wir lim z n−1 = 0
n→∞
f¨ ur alle z ∈ {w ∈ CP| 1 > |w|}. n Sei jetzt sn := k=1 ak := 1 + z + z 2 + . . . + z n−1 . Dann sieht man mit Induktion sofort (1 − z)sn = (1 − z n ). Es folgt
∞ X
1 − zn 1 = . n→∞ 1 − z 1−z
z k−1 = lim sn = lim
k=1
n→∞
Wenn |z| > 1 ist, dann ist die Folge (z n )n∈N nicht beschr¨ankt, weil die Kehrwerte (z −1 )n beliebig klein werden, also konvergiert die Folge (sn )n∈N nicht. F¨ ur z = 1 gilt sn = n, d.h. (sn )n∈N konvergiert nicht. F¨ ur z = −1 gilt sn = 1 f¨ ur n ungerade und sn = 0 f¨ ur n gerade. Also konvergiert (sn )n∈N auch in diesem Fall nicht.
Proposition 4.2.2 : Wenn die Reihe Null. Beweis:
P∞ k=1
ak konvergiert, dann konvergiert die Folge (an )n∈N gegen
4.2. REIHEN
81
Idee: Dreiecksungleichung. Sei s = limn→∞ sn =
P∞ k=1
ak und ² > 0. Dann gibt es ein n0 ∈ N mit (∀n > n0 )
|sn − s| < 12 ².
Also gilt f¨ ur n > n0 + 1 |an | = |sn − sn−1 | ≤ |sn − s| + |s − sn−1 | < 12 ² + 21 ² = ².
¨ Ubung 4.2.1 : Zeige, daß die geometrische Reihe
P∞ k=0
z k f¨ ur kein z ∈ C mit |z| = 1 konvergiert.
Beispiel 4.2.3 (Harmonische Reihe): Sei an := n1 . Dann gilt limn→∞ an = 0, aber die Reihe P Pn ∞ 1 urde die Reihe konvergieren, so w¨are die Folge (sn )n∈N k=1 k konvergiert nicht: Sei sn := k=1 ak . W¨ beschr¨ankt. Da die an alle positiv sind, ist sn monoton steigend. Andererseits ist die Folge (an )n∈N monoton fallend, woraus man a2n−1 +1 + a2n−1 +2 + . . . + a2n > 2n−1 a2n =
1 2
erh¨alt. Damit gilt aber s2n > n 12 im Widerspruch zur Beschr¨anktheit von (sn )n∈N . Als unmittelbare Folge von Korollar 4.1.4 (f¨ ur reelle Reihen) bzw. Bemerkung 4.1.5 (f¨ ur komplexe Reihen) erhalten wir P∞ P∞ Proposition 4.2.4 : Sei K gleich R oder C. F¨ ur zwei konvergente Reihen k=1 ak und k=1 bk in K mit ∞ ∞ X X ak = A und bk = B k=1
k=1
sowie c ∈ K gilt P∞ (i) k=1 cak ist konvergent mit Grenzwert cA, d.h. ∞ X
cak = c
k=1
(ii)
P∞
k=1 (ak
∞ X
ak .
k=1
± bk ) ist konvergent mit Grenzwert A ± B, d.h. ∞ X
(ak ± bk ) = (
k=1
Satz 4.2.5 (Cauchykriterium fu ¨ r Reihen): schaften ¨ aquivalent:
∞ X
k=1
ak ) ± (
∞ X
bk ).
k=1
Eine komplexe Reihe
P∞ k=1
ak sind folgende Eigen-
82
KAPITEL 4. KONVERGENZ VON FOLGEN UND REIHEN
(1)
P∞ k=1
ak ist konvergent.
(2) Zu jedem ² > 0 gibt es ein n0 ∈ N mit m ¯ ¯ X ¯ ¯ ∀n, m ∈ N mit n0 ≤ n ≤ m : ¯ ak ¯ < ². k=n+1
Beweis: Idee: Die Implikation (1)⇒(2)“ folgt direkt aus den Definitionen. Um die Implikation (2)⇒(1)“ P ” ” zu beweisen betrachtet man die Folge (sn )n∈N der Partialsummen sn = n k=1 ak . Wenn (2) gilt, ist ¨ diese eine Cauchyfolge. Damit sind auch (Re sn )n∈N und (Im sn )n∈N Cauchyfolgen. Nach Ubung 4.1.4 ¨ konvergiert jede Cauchyfolge. Also konvergiert nach Ubung 4.1.2 auch (sn )n∈N .
Satz 4.2.6 (Majorantenkriterium f¨ ur Reihen): Sei (an )n∈N eine Folge in P C und (bn )n∈N eine P∞ ∞ Folge in R mit |an | ≤ bn f¨ ur alle n ∈ N. Wenn k=1 bk konvergiert, dann ist auch k=1 ak konvergent und es gilt ¯ ¯ ∞ ∞ ¯X ¯ X ¯ ¯ ak ¯ ≤ bk . ¯ ¯ ¯ k=1
k=1
Beweis: Idee: Mithilfe der Dreiecksungleichung in C (vgl. Bemerkung 4.1.1) folgt dies aus dem Cauchy– Kriterium 4.2.5 f¨ ur Reihen.
P∞ ur Sei ² > 0. Das Cauchy–Kriterium 4.2.5, angewandt auf k=1 bk liefert ein n0 ∈ N so, daß f¨ Pm n0 ≤ n < m gilt 0 ≤ n+1 bk < ². Mit der Dreiecksungleichung erhalten wir m m m ¯ X ¯ X X ¯ ¯ ak ¯ ≤ |ak | ≤ bk < ², ¯ k=n+1
k=n+1
k=n+1
P∞
d.h. wir haben nachgewiesen, daß k=1 ak die Voraussetzungen des Cauchy–Kriteriums 4.2.5 erf¨ ullt und daher konvergiert. Weil aber f¨ ur jedes m ∈ N m m m ∞ ¯X ¯ X X X ¯ ¯ ak ¯ ≤ |ak | ≤ bk ≤ bk ¯ k=1
k=1
k=1
k=1
gilt, folgt nach Korollar 4.1.6, daß ∞ ∞ ¯ X ¯X ¯ ¯ ak ¯ ≤ bk . ¯ k=1
Eine komplexe Reihe
P∞ k=1
k=1
ak heißt absolut konvergent, wenn die Reihe
Aus Satz 4.2.6 erh¨alt man unmittelbar Korollar 4.2.7 :
Jede absolut konvergente Reihe ist konvergent.
P∞ k=1
|ak | konvergiert.
4.2. REIHEN
83
Beachte: Wenn es zu einer komplexen Reihe
P∞ k=1
(∀n ∈ N)
ak eine Konstante M > 0 mit
n X
|ak | ≤ M
k=1
gibt, dann ist die Reihe absolut konvergent, weil dann die Folge der Partialsummen steigend und beschr¨ankt ist. Man schreibt daher oft einfach ∞ X
Pn k=1
|ak | monoton
|ak | < ∞,
k=1
wenn man ausdr¨ ucken will, daß die Reihe absolut konvergiert. Satz 4.2.8 (Quotientenkriterium f¨ ur Reihen): Sei (an )n∈N eine komplexe Folge mit folgender Eigenschaft: Es gibt ein k ∈ N und ein q ∈ [0, 1[ so, daß f¨ ur alle n ≥ k gilt: ¯ ¯ ¯ an+1 ¯ ¯ ¯ ¯ an ¯ ≤ q. P∞ Dann konvergiert n=1 an absolut. Beweis: ¨ Ubung (Hinweis: Vergleiche die Reihe mit der geometrischen Reihe).
Satz 4.2.9 (Wurzelkriterium fu ¨ r Reihen): Sei (an )n∈N eine komplexe Folge mit folgender Eigenschaft: Es gibt ein k ∈ N und ein q ∈ [0, 1[ so, daß f¨ ur alle n ≥ k gilt: p n |an | ≤ q. P∞ Dann konvergiert n=1 an absolut. Beweis: ¨ Ubung (Hinweis: Vergleiche die Reihe mit der geometrischen Reihe).
Beispiel 4.2.10 (Dezimalbruchentwicklungen): Sei Z = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} und (an )n∈N eine Folge von Zahlen in Z. Dann ist die Reihe ∞ X ak 10k k=1
nach Satz 4.2.6 konvergent, weil 0≤ und die Reihe
∞ ∞ X 9 X 1 9 1 9 = = 1 =1 k k−1 10 10 10 10 1 − 10
k=1
konvergent ist. Man schreibt
9 ak ≤ k 10k 10
k=1
∞ X ak = 0.a1 a2 a3 . . . 10k
k=1
84
KAPITEL 4. KONVERGENZ VON FOLGEN UND REIHEN
und nennt diese Zahl einen Dezimalbruch. Beachte, daß mit dieser Definition gilt 0.999 . . . = 1 Umgekehrt sei jetzt eine relle Zahl x ∈]0, 1[ definiere dann induktiv n an := max m ∈ Z
© vorgegeben. Setze a1 := max m ∈ Z | ¯ o Pn−1 ak ¯ m ¯ 10n + k=1 10 k ≤ x .
m 10
ª ≤ x und
Mit Induktion sieht man zun¨achst, daß an ∈ Z f¨ ur alle n ∈ N. Wir behaupten, daß 0.a1 a2 a3 . . . = x gilt: Wegen
W¨are
P∞
Pn−1
ak k=1 10k
ak k=1 10k
≤ x f¨ ur alle n gilt ∞ X ak ≤ x. 10k
k=1
< x, so f¨ande man ein kleinstes n ∈ N mit ∞
X ak 1 + ≤ x. n 10 10k k=1
Aber dann h¨atte man
³P
n−1 ak k=1 10k
´ +
an +1 10n
≤x
im Widerspruch zur Definition von an . Man nennt die so gefundene Darstellung 0.a1 a2 a3 . . . f¨ ur x eine Dezimalbruchentwicklung von x. Wenn in einer Dezimalbruchentwicklung ab einem bestimmten n0 alle an = 0 sind, dann l¨aßt man die Nullen weg und sagt, x habe eine endliche Dezimalbruchentwicklung. Beachte, daß Dezimalbruchentwicklungen nicht eindeutig bestimmt sind. So ist z.B. 0.5 = 0.499 . . . Wenn man allerdings ausschließt, daß die Dezimalbruchentwicklung ab einem bestimmten n0 nur noch 9-en enth¨alt, dann ergibt sich, daß solche Dezimalbruchentwicklungen f¨ ur x ∈]0, 1[ immer existieren und eindeutig bestimmt sind: Sei dazu 0.a1 a2 a3 . . . = x = 0.b1 b2 b3 . . . so, daß in keiner der Entwicklungen eine unendliche 9er-Folge vorkommt. Wenn die beiden Dezimalentwicklungen nicht u ¨bereinstimmen gibt es die Zahl n = min{k ∈ N | ak 6= bk }. Durch Umbenennung k¨onnen wir o.B.d.A. annehmen, daß bn > an . Dann gilt 0=
∞ X bk − ak . 10k
k=n
Es gilt immer bk − ak ≥ −9, aber nach unserer Voraussetzung an die Gestalt der Dezimalentwicklung gibt es auch ein k > n mit bk − ak > −9. Damit rechnen wir 0 =
∞ X bk − ak bn − an + 10n 10k k=n+1
> =
1 −9 10n
∞ X k=n+1
1 10k
∞ 9 X 1 1 − 10n 10n+1 10k k=0
1 9 1 = − n+1 1 = n 10 10 1 − 10 = 0
4.2. REIHEN
85
Dieser Widerspruch zeigt die Behauptung. Wir bemerken zum Schluß, daß man analoge Entwicklungen auch f¨ ur jede andere nat¨ urliche Zahl q gr¨oßer Eins statt 10 definieren kann. Man muß dann nur dort wo jetzt 9 stand, q −1 setzen. Der wichtigste Fall nach q = 10 ist q = 2, der die dyadische Entwicklung liefert.
Satz 4.2.11 : Die Menge [0, 1[⊆ R ist nicht abz¨ ahlbar, d.h. es gibt keine bijektive Abbildung N → [0, 1[. Beweis: Angenommen es gibt eine Folge (rn )n∈N , in der jeder r ∈ [0, 1[ genau einmal vorkommt. Wir stellen jedes rn im Dezimalsystem ohne 9er-Perioden dar: rn = 0, rn,1 rn,2 . . . mit rn,j ∈ {0, 1}. Betrachte jetzt die Folge (sn )n∈N mit sn := rn,n , wobei wir 5 = 4 und k = 5 f¨ ur k ∈ {0, 1, 2, 3, 4, 6, , 7, 8, 9} setzen. Nach Beispiel 4.2.10 definiert s := 0, s1 s2 . . . dann eine Zahl in [0, 1[, die mit keinem der rn u ¨bereinstimmt, da sie sich an mindestens einer Stelle von rn unterscheiden (und keine 9er-Perioden enth¨alt.
Man sag auch [0, 1[ und damit R ist u ahlbar. ¨ berabz¨ ¨ Ubung 4.2.2 (Abel Konvergenzkriterium):
P (i) Seien (an )n∈N0 und (bn )n∈N0 komplexe Folgen und An := n k=0 ak . Beweise die partielle Summationsformel n n X X ak bk = An bn+1 − Am−1 bm + Ak (bk − bk+1 ), k=m
k=m
wobei man A−1 := 0 setzt. P (ii) Wenn P die Reihe ∞ k=0 Ak (bk − bk+1 ) und die Folge (An bn+1 )n∈N0 konvergieren, dann konvergiert auch die ∞ Reihe k=0 ak bk .
¨ Ubung 4.2.3 : Zeige, daß
P∞ n=1
n2−n konvergiert und berechne den Grenzwert. Hinweis: Betrachte ∞ X
n2−n −
n=1
∞ X
2−n .
n=1
P ¨ Ubung 4.2.4 : Sei Pn∈N an eine absolut konvergente Reihe, und sei (bn )n∈N eine beschr¨ ankte Folge. Zeige, daß dann auch die Reihe n∈N an bn absolut konvergiert. ¨ Ubung 4.2.5P : Wahr oder falsch? Wenn vergiert auch ∞ n=1 an bn .
P∞ n=1
an konvergiert und (bn )n∈N eine beschr¨ ankte Folge ist, so kon-
¨ Ubung 4.2.6 : Es sei 0 ≤ q < 1. F¨ ur die Folge (an )n∈N gelte |an+1 − an | ≤ q|an − an−1 |
(n ∈ N).
Zeige, daß (an )n∈N konvergiert. Hinweis: Zeige, daß (an )n∈N Cauchyfolge ist. ¨ Ubung 4.2.7 : Zeige, daß
P∞ ³ Qn n=1
Hinweis: Zeige mit Induktion, daß
´
1 2k−1 k=1 2k 2n+1 Qn 2k−1 1 k=1 2k ≤ 2n .
konvergiert.
86
KAPITEL 4. KONVERGENZ VON FOLGEN UND REIHEN
4.3
Umordnung von Reihen
Eine Umordnung von N ist eine Matrix p1,1 p2,1 p3,1 .. .
p1,2 p2,2 p3,2 .. .
p1,3 p2,3 p3,3 .. .
... ... ...
von nat¨ urlichen Zahlen, in der jede nat¨ urliche Zahl genau einmal vorkommt. Wir lassen allerdings auch zu, daß die Matrix nur endlich viele Zeilen hat. Insbesondere betrachten wir auch den Fall einer einzigen Zeile, der der intuitiven Vorstellung einer Umordnung von N entspricht. Es ist außerdem auch erlaubt, daß einzelne Zeilen oder Spalten P∞ nur endlich viele Zahlen enthalten. Wir sagen, eine Reihe k=1 ak ist aus den Reihen P∞ b1,k Pk=1 ∞ b2,k Pk=1 ∞ k=1 b3,k .. . zusammengesetzt, wenn es eine Umordnung p1,1 p2,1 p3,1 .. .
p1,2 p2,2 p3,2 .. .
p1,3 p2,3 p3,3 .. .
... ... ...
von N mit bi,j = api,j gibt. Satz 4.3.1 (Umordnungssatz):
Sei
P∞
ak eine Reihe, die aus den Reihen P∞ b1,k Pk=1 ∞ k=1 b2,k P∞ k=1 b3,k .. .
k=1
P∞ ur jedes m absolut konvergent mitPSumme Bm zusammengesetztPist. Wir nehmen an, daß k=1 P∞bm,k f¨ ∞ ∞ ist. Sei C = |b |. Wenn die Reihe C konvergiert, dann konvergieren m m,k m k=1 m=1 k=1 ak und P∞ B absolut und ihre Summen sind gleich: m m=1 ∞ X
ak =
∞ X
Bm .
m=1
k=1
Hier ist der Umordnungssatz f¨ ur Umordnungen mit unendlich vielen Zeilen formuliert. F¨ ur nur endlich viele Zeilen vereinfacht er sich in soweit, als die Summationen u ¨ber m immer nur endliche Summen sind. Ansonsten bleiben alle Argumente gleich. Beweis: Idee: Vergleiche die Partialsummen von
P∞ k=1
|ak | mit Summen u ¨ber endliche (linke obere) Teil-
quadrate der Umordnung.
Zu jedem n ∈ N gibt es ein q ∈ N mit {1, . . . , n} ⊆ {pi,j | i, j ≤ q}.
4.3. UMORDNUNG VON REIHEN
87 p p p p p p p1 p p p p p p p p p
q
Es gilt dann
n X
|ak | ≤
q X
Damit sieht man die Konvergenz von q X
q
p p p p p p p p
p p p p p p p p
p p p p p p p p
P∞ k=1
p p p p p p p p
p p p p p p p p
p p p p p p p p
q X
|b1,j | + . . . +
j=1
k=1
p p p p p p2 p p p p p3 p p p p p p p p p pn p p p p p p p p p p p
p p p p p p p p
|bq,j | ≤
j=1
∞ X
Ck .
k=1
|ak |. Analog liefert
∞ ∞ ¯X ¯X ¯ ¯ ¯ ¯ ¯ ¯ b1,j ¯ + . . . + ¯ bq,j ¯ ¯
|Bk | =
k=1
≤
j=1 ∞ X
j=1 ∞ X
j=1 ∞ X
j=1
|b1,j | + . . . +
≤
|bm,j |
Ck
k=1
P∞ P∞ (vgl. das Majorantenkriterium 4.2.6) die Konvergenz k=1 |Bk |. Das bedeutet k=1 ak und P ∞ k=1 Bk konvergieren absolut. Pn Es bleibt zu zeigen, daß die Folge vn := k=1 (Bk − ak ) gegen Null konvergiert. W¨ahle dazu ein ² > 0. Dann finden wir ein m ∈ N mit ∞ X
|am+k | =
k=1
∞ X
|ak | −
k=1
m X
|ak | < ².
k=1
W¨ahle ein r ∈ N mit r > m und {1, . . . , m} ⊆ {pi,j | i, j ≤ r}. p p p p p p p p p ×p p p p p p p ×p p p p p p p p × p p p p p p p p ×p p p p p p p p p p p p p p p p
r
r
p p p p p p p p
p p p p p p p p
p p p p p p p p
p p p p p p p p
p p p p p p p p
p p p p p p p p
Falls i oder j gr¨oßer als r ist, gilt dann pi,j > m. Setze si,n :=
n X
bi,k .
k=1
Dann enth¨alt die Differenz
n X
si,n −
i=1
k=1
f¨ ur n > r nur solche ak mit k > m. r i r n
m X
n
ak
p p p p p p p p
88
KAPITEL 4. KONVERGENZ VON FOLGEN UND REIHEN Aber dann gilt
¯ ¯ m ∞ n ¯X ¯ X X ¯ ¯ ak ¯ ≤ |am+k | < ² si,n − ¯ ¯ ¯ i=1
k=1
k=1
und folglich (weil n > m)
¯ n ¯ n ¯ ¯X X ¯ ¯ sk,n − ak ¯ < 2² ¯ ¯ ¯ k=1 k=1 P∞ f¨ ur alle n > r. F¨ ur jedes i enth¨alt die Reihe k=1 bi,n+k , deren Summe Bi − si,n ist, f¨ ur n > r nur solche ak mit k > m. Dabei kommt ak in h¨ochstens einer dieser Reihen vor und zwar h¨ochstens einmal. Damit folgt n X |Bi − si,n | < 2². i=1
Um dies einzusehen, stellen wir zun¨achst fest, daß zu i und n ein Ki,n ∈ N existiert mit i,n ∞ ¯X ¯ ³K ´ ² X ¯ ¯ |Bi − si,n | = ¯ bi,n+k ¯ ≤ |bi,n+k | + . n
k=1
PKi,n
k=1
P
Andererseits gilt k=1 |bi,n+k | = l∈Li,n |al |, wobei Li,n eine endliche Teilmenge von {m + Sn 1, m + 2, . . .} ist. Die Mengen Li,n , i = 1, . . . , n sind disjunkt. Setze Ln := . i=1 Li,n ⊆ {m + 1, m + 2, . . .}. Dann gilt n X
|Bi − si,n | ≤ ² +
i=1
X
|al | ≤ 2².
l∈Ln
Jetzt erhalten wir ¯ ¯ ¯ ¯ n n n n ¯X ¯ X ¯X ¯ X ¯ ¯ ¯ ¯ |Bk − sk,n | + ¯ sk,n − ak ¯ < 4². ¯ (Bk − ak )¯ ≤ ¯ ¯ ¯ ¯ k=1
Satz 4.3.2 : Sei
P∞ k=1
k=1
k=1
ak eine absolut konvergente Reihe, die aus den Reihen P∞ b1,k Pk=1 ∞ b2,k Pk=1 ∞ k=1 b3,k .. .
zusammengesetzt ist. Dann ist jede der Reihen ∞ X
P∞
ak =
k=1
k=1 bm,k ∞ X ∞ X
absolut konvergent und es gilt bm,k .
m=1 k=1
Beweis: Idee: Ben¨utze den Umordnungssatz 4.3.1. Wegen
k=1
n X k=1
|bi,k | ≤
∞ X k=1
|ak |
4.3. UMORDNUNG VON REIHEN
89
folgt die absolute Konvergenz der Reihen P∞ b1,k Pk=1 ∞ b2,k Pk=1 ∞ k=1 b3,k .. . Die Gleichheit
∞ X
ak =
∞ X ∞ X
bm,k
m=1 k=1
k=1
ist dann eine Konsequenz aus Satz 4.3.1.
Bemerkung 4.3.3 : Manchmal ist eine kanonische Numerierung von Folgengliedern vorgegeben, die schon mit einer negativen Zahl beginnt oder aber erst mit einer Zahl gr¨oßer als Eins. Wir schreiben dann n X
ak := am + . . . + an
k=m
f¨ ur m ≤ n in Z. Entsprechend kann man dann Reihen der Form ∞ X
ak
k=m
Pn Pn ur jedes n ∈ N nur mit m ∈ Z behandeln. Weil sich f¨ ur m ≤ 0 die Summen k=m ak und k=1 ak f¨ P∞ P0 um P∞den immer gleichen Term k=m ak unterscheiden, konvergiert k=m ak genau dann (absolut), wenn k=1 ak (absolut) konvergiert. P Die Umsummierbarkeit absolut konvergenter Reihen P erm¨oglicht es, auch Reihen der Form k∈Z ak P einen Sinn zu geben, sofern die Reihen k∈N ak und −k∈N ak absolut konvergieren. Wir zeigen ein Konvergenzkriterium, das zeigt, daß man in Satz 4.3.1 nicht auf die absolute Konvergenz verzichten kann: Satz 4.3.4 (Leibniz-Kriterium): Sei (an )n∈N P∞eine monoton fallende Folge nicht-negativer Zahlen mit limn→∞ an = 0. Dann konvergiert die Reihe k=0 (−1)k an und es gilt (∀n ∈ N)
s2n−1 ≤
∞ X
(−1)k ak ≤ s2n ,
k=0
wobei, wie u ¨blich, sn =
Pn
k k=0 (−1) an . y
6 -x
Beweis: Idee: Vergleiche die Folge (s2n )n∈N der Partialsummen mit geraden Indizes mit der Folge (s2n−1 )n∈N der Partialsummen mit ungeraden Indizes.
90
KAPITEL 4. KONVERGENZ VON FOLGEN UND REIHEN Mit den Voraussetzungen erhalten wir zun¨achst s2n−1
≤ s2n−1 + (a2n − a2n+1 ) = s2n+1 ≤ s2n+1 + a2n+2 = s2n+2 = s2n − (a2n+1 − a2n+2 ) ≤ s2n ,
also s2n−1 ≤ s2n+1 ≤ s2n+2 ≤ s2n . Dies zeigt, daß die Teilfolge (s2n−1 )n∈N monoton steigend und beschr¨ankt ist, w¨ahrend die Teilfolge (s2n )n∈N monoton fallend und beschr¨ankt ist. Insbesondere haben nach Proposition 4.1.8 beide Teilfolgen einen Grenzwert. Weiter gilt lim s2n − lim s2n−1 = lim (s2n − s2n−1 ) = lim a2n = 0,
n→∞
n→∞
n→∞
n→∞
was die Konvergenz von (sn )n∈N gegen ein s ∈ R zeigt. Aus der Monotonie der beiden Teilfolgen folgt dann aber auch s2n−1 ≤ s ≤ s2n .
Beispiel 4.3.5 : Die alternierende harmonische Reihe in der Umordnung 1 2 − 11
1 4 − 13
1 6 − 15
P
k1 k=1 (−1) k
1 8 − 17
konvergiert nach Satz 4.3.4, aber
... ...
konvergiert keine der Zeilen (die erste w¨ urde verdoppelt einen Wert f¨ ur die harmonische Reihe liefern).
¨ Ubung 4.3.1 : Finde eine Umordnung (an )n∈N der Folge 1, −1, 12 , − 12 , 31 , − 13 so, daß ¨ Ubung 4.3.2 : Zeige, daß die Reihe
∞ X m=2
konvergiert und bestimme ihren Wert. 1 = Hinweis: Suche A, B ∈ Z so, dass m(m−1)
A m−1
P n∈N
an divergiert.
1 m(m − 1) +
B m
gilt. Berechne dann die Partialsummen.
¨ Ubung 4.3.3 : Zeige, daß f¨ ur jede nat¨ urliche Zahl n ≥ 2 gilt ζ(n) :=
∞ X 1 < 2. n m m=1
Anleitung:
P P∞ (i) Betrachte die Reihe ∞ n=2 an , die aus den Reihen m=2 Konvergenz dieser Reihe.
1 mn
zusammengesetzt ist. Erstes Ziel ist die absolute
(ii) Ordne die Reihe so um, daß gewisse Anteile geometrische Reihen werden. Das ergibt eine neue Reihe. (iii) Nutze nun Aufgabe 4.3.2. (iv) Folgere, daß auch die urspr¨ ungliche Reihe
P∞
n=2 an gegen 1 konvergiert. P∞ (v) Was kann man nun u ¨ber die Konvergenz und den Reihenwert von m=2 m1n aussagen? P P∞ 1 1 (vi) Wie h¨ angen Konvergenz und Reihenwert von ∞ m=2 mn und m=1 mn miteinander zusammen?
¨ ¨ ufe die folgenden Reihen auf Konvergenz und absolute Konvergenz. Ubung 4.3.4 : Uberpr¨ P∞ ak ur beliebiges a ∈ C. Hierbei ist k! (sprich: Fakult¨ at von k) eine Abk¨ urzung f¨ ur k · (k − 1) · · · · · 2 · 1. (i) k=1 k! f¨ P∞ 1 √ . (ii) k=1 k
4.3. UMORDNUNG VON REIHEN
91
P∞
k1 k=1 (−1) k . ¢ P∞ ¡ 1 (iv) k=1 1 − k .
(iii)
¨ Ubung 4.3.5 : Es sei (ak )k∈N eine Folge nichtnegativer reeller Zahlen. Zeige P P∞ 2 (i) Wenn ∞ k=1 ak konvergiert, dann konvergiert auch k=1 ak . (ii) Die Umkehrung gilt nicht, d.h. es gibt mindestens eine Folge (ak )k∈N mit ak ≥ 0, f¨ ur die P aber ∞ k=1 ak divergiert.
P∞ k=1
a2k konvergiert,
¨ ¨ Ubung 4.3.6 : Uberpr¨ ufe die folgenden Reihen auf Konvergenz. P∞ k (i) . k=0 k+1 P∞ 1 (ii) k=0 k2 +k+1 . P∞ k 3 (iii) k=0 4k . P∞ ¡ −9k−10 ¢k (iv) . k=1 10k ¨ Ubung 4.3.7 : k P 2+3·(−1)k (i) Man zeige, daß die Reihe ∞ alterniert und, daß f¨ ur ak = 2+3·(−1) gilt limk→∞ ak = 0. Warum k=0 k+1 k+1 ist das Leibniz-Kriterium nicht anwendbar? ³ ´ P (−1)k k+1 (ii) Warum konvergiert die Reihe ∞ ˙ ? Ab welchem Index n unterscheiden sich die Partialsumk=0 k+2 k+3
men sn vom Grenzwert der Reihe um weniger als
3 ? 1000
¨ Ubung 4.3.8 :
³ ´ k P (−1)k 1 √ √ alterniert und, daß f¨ ur ak = k1 + (−1) gilt limk→∞ ak = 0. (i) Man zeige, daß die Reihe ∞ k=1 k + k k Warum ist das Leibniz-Kriterium nicht anwendbar? ³ ´ P (−1)k ˙ k ? Ab welchem Index n unterscheiden sich die Partialsum(ii) Warum konvergiert die Reihe ∞ k=0 2k+1 k+2 men sn vom Grenzwert der Reihe um weniger als
2 ? 1000
92
KAPITEL 4. KONVERGENZ VON FOLGEN UND REIHEN
Kapitel 5
Folgen von Funktionen In diesem Kapitel untersuchen wir Funktionen, die als Grenzwerte von Folgen anderer Funktionen auftauchen. Typischerweise wird man sp¨ ater neue komplizierte Funktionen als Grenzwerte von einfacheren Funktionen erhalten. Eine besondere Rolle kommt in diesem Zusammenhang den Grenzwerten von Polynomfunktionen, den Potenzreihen, zu. Weil es keinerlei zus¨ atzlichen Aufwand bedeutet und f¨ ur die gesamte Mathematik von fundamentaler Wichtigkeit ist, betrachten wir Potenzreihe (gleich) mit komplexen Koeffizienten und setzen auch komplexe Zahlen ein.
5.1
Konvergenz von Funktionenfolgen
Eine Folge von komplexwertigen Funktionen auf einer Menge M ist eine Abbildung N → ¨ F(M, C), n 7→ fn (vgl. Ubung 2.1.4). Wie f¨ ur Zahlenfolgen verwenden wir die Notation (fn )n∈N . Man sagt, eine Funktionenfolge (fn )n∈N von komplexwertigen Funktionen auf M konvergiert punktweise gegen eine Funktion f : M → C, wenn f¨ ur jedes x ∈ M gilt lim fn (x) = f (x).
n→∞
Beispiel 5.1.1 : Betrachte die Funktionen fn : R → R, die durch f¨ ur x > n1 1 nx f¨ ur 0 ≤ x ≤ n1 fn (x) = 0 f¨ ur x < 0 definiert ist. Diese Folge konvergiert punktweise gegen die Funktion f : R → R mit ½ 1 f¨ ur x > 0 f (x) = ur x ≤ 0 0 f¨ Insbesondere sehen wir, daß die Grenzfunktion nicht stetig ist, obwohl alle fn ’s stetig sind! Ein Konvergenzbegriff, der die Stetigkeit beim Grenz¨ ubergang erh¨alt, ist die gleichm¨ aßige Konvergenz. Wir sagen, eine Folge (fn )n∈N von komplexwertigen Funktionen auf M konvergiert gleichm¨ aßig gegen eine Funktion f : M → C, wenn es zu jedem ² > 0 ein n0 ∈ N gibt mit ∀x ∈ I, ∀n > n0 : |fn (x) − f (x)| < ². Es ist unmittelbar klar, daß gleichm¨aßige Konvergenz gegen eine Funktion f punktweise Konvergenz gegen dieselbe Funktion f impliziert. Die Intuition hinter der Definition von gleichm¨aßiger Konvergenz ist gerade, daß die fn (x) gegen die f (x) konvergieren sollen, aber so, daß die Konvergenzgeschwindigkeit nicht zu unterschiedlich ist.
93
94
KAPITEL 5. FOLGEN VON FUNKTIONEN
Beispiel 5.1.2 : (i) Die Funktionenfolge fn : [0, b] → R, x 7→ xn mit 0 < b < 1 konvergiert gleichm¨aßig gegen die konstante Funktion 0: |xn | ≤ |bn | → 0. (ii) Die Funktionenfolge fn : [0, 1[→ R, x 7→ xn konvergiert punktweise, aber nicht gleichm¨aßig gegen die konstante Funktion 0: Da R → R, x 7→ xn stetig ist und in 1 den Wert 1 hat, gibt es n¨amlich zu 1 > ² > 0 immer ein x ∈ [0, 1[ mit |xn | > ².
Proposition 5.1.3 : Seien (fn )n∈N und (gn )n∈N zwei gleichm¨ aßig konvergente Folgen von komplexwertigen Funktionen auf einer Menge M mit den Grenzwerten f : M → C und g : M → C. Dann konvergiert die Folge (fn ± gn )n∈N gleichm¨ aßig gegen f ± g. Beweis: Idee: Klar mit den Definitionen. Sei ² > 0. Dann gibt es n0 ∈ N mit |fn (x) − f (x)| < ²
und |gn (x) − g(x)| < ²
f¨ ur alle x ∈ M und alle n > n0 . Aber dann gilt auch ¡ ¢ ¡ ¢ | fn (x) ± gn (x) − f (x) ± g(x) | < 2² f¨ ur alle x ∈ M und alle n > n0 . Dies zeigt die Behauptung.
Wie f¨ ur Zahlenfolgen kann man auch an dieser Stelle analoge S¨atze f¨ ur Produkte und Quotienten von Funktionenfolgen zeigen. Allerdings braucht man Beschr¨anktheitsbedingungen f¨ ur die Gleichm¨aßigkeit der Konvergenz. Sei M ⊆ C und z0 ∈ M . Eine Funktion f : M → C heißt stetig in z0 , wenn ∀² > 0 ∃δ > 0 : (z ∈ M ∩ B(z0 ; δ) ⇒ |f (z) − f (z0 )| < ²), wobei B(z0 ; δ) := {z ∈ C | |z − z0 | < δ}. Wenn eine Funktion f : M → C in jedem Punkt von M stetig ist, nennt man sie stetig in M . Satz 5.1.4 : Die Folge (fn )n∈N von stetigen komplexwertigen Funktionen auf einer Menge M ⊆ C konvergiere gleichm¨ aßig gegen die Funktion f : M → C. Dann ist f stetig. Beweis: ¡ ¢ ¡ ¢ ¡ ¢ 3²-Argument“: Betrachte f (z) − fn (z) + fn (z) − fn (z0 ) + fn (z0 ) − f (z0 ) und wende ” die Dreiecksungleichung an.
Idee:
Halte z0 ∈ M fest und w¨ahle ² > 0. Dann gibt es ein n0 ∈ N mit ∀n > n0 , ∀z ∈ M :
|fn (z) − f (z)| < ².
5.1. KONVERGENZ VON FUNKTIONENFOLGEN
95
Halte ein n > n0 fest. Wegen der Stetigkeit von fn gibt es ein δ > 0 mit ∀z ∈ B(z0 ; δ) ∩ M :
|fn (z) − fn (z0 )| < ².
Dann gilt f¨ ur z ∈ B(z0 ; δ) ∩ M |f (z) − f (z0 )| ≤ |f (z) − fn (z)| + |fn (z) − fn (z0 )| + |fn (z0 ) − f (z0 )| < 3², was die Stetigkeit von f in z0 beweist.
Satz 5.1.5 : Die Folge (fn )n∈N von differenzierbaren reellwertigen Funktionen auf einem offenen Intervall I konvergiere gleichm¨ aßig gegen die Funktion f : I → R. Wenn die Folge (fn0 )n∈N aus stetigen Funktionen besteht und gleichm¨ aßig gegen eine Funktion g : I → R konvergiert, dann ist f differenzierbar und es gilt f 0 = g. Beweis: ¡
¢
Idee: Wende den Mittelwertsatz 3.3.1 auf fn und die Dreiecksungleichung auf fn0 (ξ) − g(ξ) + ¢
¡
g(ξ) − g(x0 ) an ( 2²-Argument“). ”
Nach Satz 5.1.4 ist g stetig. Halte x0 ∈ I fest und w¨ahle ² > 0. Dann gibt es wegen der Stetigkeit von g gibt es ein δ > 0 mit ∀x ∈]x0 − δ, x0 + δ[ ∩ I :
|g(x) − g(x0 )| < ².
Außerdem finden wir ein n0 ∈ N mit ∀n > n0 , ∀x ∈ I :
|fn0 (x) − g(x)| < ².
Halte ein n > n0 fest. Der Mittelwertsatz 3.3.1 zeigt, daß es zu jedem solchen x ein ξ zwischen x und x0 mit ¯ ¯ ¯ fn (x) − fn (x0 ) ¯ ¯ − g(x0 )¯¯ = |fn0 (ξ) − g(x0 )| ¯ x − x0 ≤ |fn0 (ξ) − g(ξ)| + |g(ξ) − g(x0 )| ≤ 2² gibt. Dies zeigt aber, daß f¨ ur festes x gilt ¯ ¯ ¯ f (x) − f (x0 ) ¯ ¯ − g(x0 )¯¯ ≤ 2², ¯ x − x0 was wiederum lim
x→x0
f (x) − f (x0 ) = g(x0 ) x − x0
impliziert. Also existiert f 0 (x0 ) und ist gleich g(x0 ).
Der Satz 5.1.5 l¨aßt sich m¨ uhelos auf Funktionen verallgemeinern, deren Definitionsbereich M eine (offene) Teilmenge von C ist, sobald man das komplexe Analogon zur Differenzierbarkeit definiert hat ¨ (vgl. Ubung 3.1.4).
96
KAPITEL 5. FOLGEN VON FUNKTIONEN
¨ Ubung 5.1.1 : Seien fn , gnP: [a, b] → R mit |fn (x)| ≤ gn (x) f¨ ur alle n ∈ N. Die Reihe gleichm¨ aßig. Zeige, daß auch ∞ aßig konvergiert. n=0 fn gleichm¨
P∞ n=0
gn konvergiere
¨ Ubung 5.1.2 : Entscheide, ob folgende Funktionenfolgen gleichm¨ aßig konvergieren. (i)
µ
(ii)
µ
2x + nx2 1 + nx2
¶ , n∈N
nx + x2 + nx3 1 + nx2
¶ . n∈N
¨ Ubung 5.1.3 : Sei f : R → R eine Funktion mit |f 0 (x)| ≤ M f¨ ur alle x ∈ R. Definiere µ fn : R → R,
fn (x) := f
x+
1 n
¶ .
Zeige, daß die Funktionenfolge (fn )n∈N gleichm¨ aßig gegen f konvergiert. ¨ aßig konvergente Folge stetiger Funktionen auf [a, b]. Zeige, daß Ubung 5.1.4 : Sei (fn )n∈N eine gleichm¨ lim lim fn (x) = lim lim fn (x).
n→∞ x→c
x→c n→∞
¨ aßig konverUbung 5.1.5 : Sei a > 0. Untersuche, ob die folgenden Funktionenfolgen (fn )n∈N auf [0, a] gleichm¨ gieren. (i) fn (x) =
1 − x2n , 1 + x2n
(ii) fn (x) = (1 − x)xn , (iii) fn (x) =
1 , 1 + nx2
¨ aßig Ubung 5.1.6 : Wahr oder falsch? Seien fn , f, gn , g : [a, b] → R stetige Funktionen derart, daß (fn )n∈N gleichm¨ gegen f und (gn )n∈N gleichm¨ aßig gegen g konvergiert. Dann konvergiert (fn gn )n∈N gleichm¨ aßig gegen f g. ¨ Ubung 5.1.7 : Man berechne den punktweisen Grenzwert der folgenden Funktionenfolgen (fn )n∈N und entscheide, ob die Konvergenz gleichm¨ aßig ist: 1
(i) fn (x) = x n auf [0, 1]. ( 0 x≤n (ii) fn (x) = auf ] − ∞, 196560] und auf R. x−n x>n (iii) fn (x) =
x 1+(nx)2
auf R.
5.2. POTENZREIHEN
5.2
97
Potenzreihen
Eine Potenzreihe ist eine Reihe der Form ∞ X
ak (z − z0 )k ,
k=0
wobei die ak ∈ C feste Koeffizienten sind, z0 eine weitere komplexe Zahl und man das Verhalten der Reihe in Abh¨angigkeit der Zahl z ∈ C studieren will. D.h. man studiert die Funktion M → C,
z 7→
∞ X
ak (z − z0 )k ,
k=0
P∞ wobei M die Menge der z ∈ C ist, f¨ ur die die Reihe k=0 ak (z − z0 )k konvergiert. Die erste Aufgabe ist dann nat¨ urlich festzustellen, ob M 6= ∅ ist, d.h., ob es u ¨berhaupt Punkte gibt, P∞ an denen die Potenzreihe konvergiert. Wenn f : M 0 → R f¨ ur alle z P ∈ M 0 ⊆ M die Gleichheit f (z) = k=0 ak (z − z0 )k erf¨ ullt, dann ∞ sagt man, f wird durch die Potenzreihe k=0 ak (z − z0 )k dargestellt. Beispiel 5.2.1 : P∞ (i) Nach Proposition 4.2.7 und Beispiel 4.2.1 konvergiert die geometrische Reihe k=0 z k f¨ ur jedes z ∈ B(0; 1) := {w ∈ C | |w| < 1} (beachte, daß nach Definition gilt 00 = 1) und hat jeweils die 1 . D.h. die Funktion Summe 1−z f : B(0; 1) z
→ C 7→
1 1−z
P∞ ur |z| > 1 wird durch die Reihe k=0 z k dargestellt. In diesem Beispiel wissen wir, daß die Reihe f¨ nicht konvergiert. Es ist alsoPnicht m¨oglich, die Funktion f auf einer viel gr¨oßeren Teilmenge M ∞ von C \ {1} durch die Reihe k=0 z k darzustellen als auf B(0; 1). (Eine genauere Untersuchung der geometrischen Reihe zeigt sogar, daß sie f¨ ur kein z ∈ C mit |z| = 1 konvergiert. Also ist B(0; 1) 1 tats¨achlich der maximale Bereich auf dem 1−z durch die geometrische Reihe dargestellt werden kann.) ¯ P∞ k¯ k (ii) Wegen ¯(−1)k+1 zk ¯ ≤ |z|k konvergiert auch die Reihe k=1 (−1)k+1 zk f¨ ur jedes z ∈ B(0; 1). Allerdings sind wir hier noch nicht in der Lage zu bestimmen, welche Funktion durch diese Potenzreihe dargestellt wird. Sp¨ater wird sich herausstellen, daß es im wesentlichen die Logarithmusfunktion ist.
Es kann vorkommen, daß eine Potenzreihe in keinem von Null verschiedenen Punkt konvergiert. Wenn es allerdings einen von Null verschiedenen Konvergenzpunkt gibt, dann gibt es gleich sehr viele solche Punkte: P∞ P∞ Satz 5.2.2 : Die Potenzreihe k=0 ak z k sei konvergent f¨ ur z0 6= 0. Wenn k=0 ak z k nicht f¨ ur alle z ∈ C absolut konvergiert, dann gibt es ein r > 0 mit folgenden Eigenschaften: P∞ k (i) ur z ∈ B(0; r) := {z ∈ C | |z| < r}. k=0 ak z konvergiert absolut f¨ P∞ k (ii) ur |z| > r. k=0 ak z divergiert, d.h. konvergiert nicht, f¨ Beweis:
98
KAPITEL 5. FOLGEN VON FUNKTIONEN Idee: Vergleiche mit der geometrischen Reihe. Nach Proposition 4.2.2 gilt limk→∞ ak z0k = 0 und mit ρ := |z0 | folgt limk→∞ |ak |ρk = 0. Insbesondere gibt es ein M > 0 mit |ak ρk | < M f¨ ur alle k ∈ N0 = N ∪ {0}. Wenn jetzt |z| < ρ, dann gilt |z|k |z|k |ak | |z|k = |ak ρk | k ≤ M k (5.1) ρ ρ k P∞ P∞ f¨ ur alle k ∈ N0 und k=0 M |z| ist konvergent. Also ist auch k=0 |ak | |z|k konvergent, d.h. ρk P∞ die Reihe k=0 ak z k ist absolut konvergent. P∞ k Damit haben wir gesehen, daß die Reihe ¨berall absolut konvergiert k=0 ak z entweder u oder aber die Menge X der Punkte z, f¨ ur die die Reihe absolut konvergiert, ist beschr¨ankt. In diesem Fall sei r := sup{|z| | z ∈ X}. Wenn z ∈ B(0; r), dann gibt es ein ρ ∈ R mit P∞ |z| < ρ < rPso, daß die Reihe k=0 ak ρk konvergiert. Nach Satz 4.2.6 konvergiert dann auch P∞ ∞ die Reihe k=0 |ak | |z|k . Es bleibt nur noch P zu zeigen, daß die Reihe k=0 ak z k f¨ ur |z| > r ∞ k divergiert. Wenn aber |z| > r und die Reihe a z konvergiert, dann zeigt der erste Teil k k=0 P∞ des Beweises, daß k=0 ak wk f¨ ur alle |w| < |z| absolut konvergiert, insbesondere also auch f¨ ur solche w ∈ C mit r < |w| < |z| (die es immer gibt). Dies steht aber im Widerspruch zur Definition von r.
P∞ Man kann den Fall, daß die Reihe k=0 ak z k in Satz 5.2.2 f¨ ur alle z ∈ C konvergiert, auch unter den zweiten Teil des Satzes subsummieren, indem man auch r = ∞Pin der Aussage zul¨aßt. Man nennt das r ∞ aus Satz 5.2.2 dann den Konvergenzradius der Potenzreihe k=0 ak z k .
r
P∞ Wenn k=0 ak z k keinen von Null verschiedenen Konvergenzpunkt hat, sagt man, der Konvergenzradius ist Null. Wir f¨ uhren den Limes superior und den Limes inferior f¨ ur Folgen in R ein: Sei (an )n∈N eine Folge in R. Setze Sn := sup{aj | j ≥ n} und In := inf{aj | j ≥ n}. Dann ist lim sup an = inf{Sn | n ∈ N} n→∞
der Limes superior von (an )n∈N und lim inf an = sup{In | n ∈ N} n→∞
der Limes inferior von (an )n∈N . Mit inf(∅) := ∞ und sup(∅) := −∞ lassen wir dann auch die Werte ∞ f¨ ur den Limes superior und −∞ f¨ ur den Limes inferior zu. Es ist klar, daß lim inf an ≤ lim sup an n→∞
n→∞
5.2. POTENZREIHEN
99
und die Folge konvergiert genau dann gegen a ∈ [−∞, ∞], wenn lim inf an = a = lim sup an n→∞
n→∞
¨ (Ubung!).
Lemma 5.2.3 : Sei M > 0. Dann gilt limk→∞
√ k
M = 1.
Beweis: Idee: Die Folge ist monoton und beschr¨ankt, hat also einen Grenzwert a. Betrachte die Folge der ak .
q Da der Fall M = 1 trivial ist und
1 M
Satz 5.2.4 : ρ sei der Konvergenzradius von
=
1 √ k M
gilt, k¨onnen wir uns nach Korollar 4.1.4 auf √ den Fall M > 1 beschr¨anken. In diesem Fall haben wir k M > 1 f¨ ur alle k, also ist wegen k ³ √ M ´k 1 √ √ =1 k+1 k+1 M M √ die Folge ( k M )k∈N monoton fallend (und nach unten beschr¨ankt). Damit ist diese Folge nach Proposition√4.1.8 konvergent mit einem Grenzwert a, der nach Korollar 4.1.6 gr¨oßer gleich 1 ist. Wegen k M ≥ a ≥ 1 ist die Folge (ak )k∈N durch M beschr¨ankt und das zeigt a = 1. k
∞ P
ak (z − z0 )k . Dann gilt:
k=0
¯ n o ¯ (i) ρ = inf m > 0 ¯ sup |ak mk | = ∞ . k∈N0
(ii) (Wurzelkriterium – Cauchy-Hadamard-Formel) ³ ´−1 1 ρ = lim sup |ak | k , k→∞
wobei mit
1 0
= ∞ und
1 ∞
1
1
= 0 auch die F¨ alle lim sup |ak | k = 0 und lim sup |ak | k = ∞ erfaßt sind. k→∞
k→∞
n (iii) (Quotientenkriterium) Falls ak 6= 0 f¨ ur alle k und lim | aan+1 | existiert, dann gilt
n→∞
¯ a ¯ ¯ n ¯ ρ = lim ¯ ¯. n→∞ an+1 an (iv) Falls ak 6= 0 f¨ ur alle k und lim supn→∞ | an−1 | existiert, dann gilt
³ ρ≥
¯ a ¯´−1 ¯ n ¯ lim sup ¯ . ¯ an−1 n→∞
Beweis: Idee: F¨uhre (i) auf Satz 5.2.2 zur¨uck, dann leite (ii) aus (i) sowie (iii) und (iv) aus (ii) ab.
100
KAPITEL 5. FOLGEN VON FUNKTIONEN (i) Setze ρ0 := inf{m > 0 | sup |ak mk | = ∞}. Wenn m < ρ0 , dann ist {ak mk | k ∈ N0 } k∈N0
beschr¨ankt und f¨ ur 0 < R < m < ρ0 konvergiert
∞ P
ak (z − z0 )k nach dem Beweis von
k=0
Satz 5.2.2, pr¨azise gesagt nach (5.1), absolut auf B(z0 ; R) := {z ∈ C | |z − z0 | ≤ R}. Umgekehrt, sei |z − z0 | > ρ0 . Dann gilt f¨ ur |z − z0 | > b > ρ0 , daß sup |ak bk | = ∞ und k∈N0
daher
¯ ¯ sup ¯ak |z − z0 |k ¯ = ∞.
k∈N0
Also konvergiert
∞ P
ak (z − z0 )k nach Proposition 4.2.2 nicht. Damit ist ρ0 also gerade
k=0
der Konvergenzradius. 1
1 ρ,
(ii) Wenn lim sup |ak | k < 1
k→∞
1
dann gibt es ein m > ρ mit lim sup |ak | k < k→∞
1 m.
Also gilt
m |ak | k < 1 f¨ ur fast alle k (d.h. alle bis auf endlich viele) und { |ak |mk | k ∈ N0 } ist beschr¨ankt. Wegen (i) zeigt dies m ≤ ρ und dieser Widerspruch zeigt 1
lim sup |ak | k ≥ ρ1 . k→∞
Wenn jetzt 0 < b < ρ, dann gibt es nach (i) ein M > 0 mit sup |ak |bk ≤ M , also mit k∈N0
Lemma 5.2.3
1
1
lim sup |ak | k b ≤ lim M k = 1. k→∞
k→∞
1
Aber lim sup |ak | k ≤ k→∞
1 b
1
f¨ ur alle 0 < b < ρ liefert mit b → ρ auch lim sup |ak | k ≤ k→∞
1 ρ.
Damit ist (ii) bewiesen. ¯ a ¯ ¯ a ¯ k ¯ k ¯ (iii) Sei lim sup¯ ak−1 = c. Dann gibt es zu ² > 0 ein N mit ¯ ak−1 ≤ c + ² f¨ ur alle k ≥ N . k→∞
Wir schreiben
¯ ¯ ¯ a ¯´ ¯ a ¯a ¯ ³¯ a ¯ ¯ a ¯ n ¯ ¯ n−1 ¯ ¯ N ¯ ¯ N −1 ¯ ¯ 1¯ |an | = ¯ ¯·¯ ¯···¯ ¯ ·¯ ¯ · · · ¯ ¯ · |a0 | an−1 an−2 aN −1 aN −2 a0
f¨ ur n ≥ N und stellen fest, daß wegen Lemma 5.2.3 ¯ ¯a ¯ ³¯ a ´ n1 1 1 ¯ N −1 ¯ ¯ 1¯ |an | n ≤ (c + ²)(n−N +1) n ¯ ¯ · · · ¯ ¯ · |a0 | | {z } aN −2 a0 | {z } −→ (c+²) −→ 1
n→∞
n→∞ 1
f¨ ur n ≥ N gilt. Damit findet man zun¨achst lim sup |an | n ≤ c + ² und dann n→∞
¯ a ¯ 1 ¯ n ¯ lim sup |an | n ≤ lim sup¯ ¯. n→∞ n→∞ an−1
(5.2)
1
an Analog zeigt man lim inf | an−1 | ≤ lim inf |an | n und zusammen erh¨alt man (iii) aus (ii). n→∞
n→∞
(iv) Dies folgt durch Kombination von (ii) mit (5.2).
Beispiel 5.2.5 : (i) Mit dem Wurzelkriterium 5.2.4 zeigt man, daß die Potenzreihe hat.
P∞ k=0
k k z k den Konvergenzradius 0
5.2. POTENZREIHEN
101
P∞ (ii) Mit dem Quotientenkriterium 5.2.4 zeigt man , daß die Reihe k=1 n12 z n den Konvergenzradius P∞ 1 ¨ 1Phat. Die Konvergenz von k=1 n2 wurde in Ubung 4.3.3 nachgewiesen. Die Konvergenz von ∞ k 1 (−1) l¨ a ßt sich dann mit dem Majorantenkriterium 4.2.6 als auch direkt mit dem Leibniz2 k=1 n Kriterium 4.3.4 nachweisen.
P∞ Wir sagen, eine Potenzreihe k=0 ak z k ist auf einer Kreisscheibe D := B(0; r) gleichm¨ aßig konvergent, wenn sie f¨ ur jedes z ∈ D konvergiert und die Funktionenfolge (fn )n∈N mit fn : D → C, x 7→
n X
ak z k
k=0
gleichm¨aßig gegen D → C, z 7→
P∞ k=0
ak z k konvergiert.
P∞ P∞ Satz 5.2.6 : Sei k=0 ak z k eine Potenzreihe mit Konvergenzradius r. Dann ist k=0 ak z k auf jeder Kreisscheibe der Form B(0; b) = {z ∈ C | |z| < b} mit 0 < b < r gleichm¨ aßig konvergent. Beweis: Idee: Ben¨utze Satz 4.2.6 und die Dreiecksungleichung. P∞ P∞ W¨ahle 0 < b < c < r. Dann konvergiert k=0 |ak |ck und wegen Satz 4.2.6 auch k=0 ak z k f¨ ur jedes z ∈ B(0; b) absolut. Setze s(z) :=
∞ X
ak z k
tn :=
k=0
n X
|ak |ck
und t :=
k=0
∞ X
|ak |ck .
k=0
Dann gilt ¯ ¯ ¯ ¯ n ∞ ∞ ∞ ¯ ¯ ¯ X ¯ X X X ¯ ¯ k¯ k¯ ak z ¯ = ¯ ak z ¯ ≤ |ak z k | ≤ |ak |ck = t − tn ¯s(z) − ¯ ¯ ¯ ¯ k=0
k=n+1
k=n+1
k=n+1
f¨ ur alle z ∈ B(0; b). Weil aber limn→∞ tn = t, folgt damit die Behauptung.
Da zwischen b und r immer noch eine Zahl b0 mit b < b0 < r zu finden ist, kann man den Satz 5.2.6 auch mit den abgeschlossenen Kreisscheiben B(0; b) = {z ∈ Z | |z| ≤ b} formulieren. Beispiel 5.2.7 : Die folgenden komplexen Reihen konvergieren auf ganz C absolut und definieren daher Funktionen C → C: (i) Die komplexe Exponentialreihe
∞ X zk k=0
(ii) Die komplexe Sinusreihe
∞ X
(−1)k
k=0
(iii) Die komplexe Kosinusreihe
∞ X
,
1 z 2k+1 . (2k + 1)!
(−1)k
k=0
k!
1 2k z . (2k)!
102
KAPITEL 5. FOLGEN VON FUNKTIONEN
(iv) Die komplexe Sinushyperbolikusreihe ∞ X
1 z 2k+1 . (2k + 1)!
k=0
(v) Die komplexe Kosinushyperbolikusreihe ∞ X k=0
1 2k z . (2k)!
Die zugeh¨origen Funktionen werden (wie im Reellen) mit exp : C → C, sin : C → C und cos : C → C sowie sinh : C → C und cosh : C → C bezeichnet. Beachte, daß i2k = (−1)k und i2k+1 = (−1)k i gilt. Also liefern die obigen Potenzreihendarstellungen exp(ix) = = =
∞ k k X i x k=0 ∞ X
k!
∞ X i2m x2m i2m+1 x2m+1 + (2m)! (2m + 1)! m=0 m=0
∞ ∞ X X (−1)m x2m (−1)m x2m+1 +i (2m)! (2m + 1)! m=0 m=0
= cos x + i sin x f¨ ur x ∈ R und daher die Eulersche Formel eix := exp(ix) = cos(x) + i sin(x).
sin(x)
e
ix
cos(x)
Mit analogen Rechnungen findet man sin(ix) = i
∞ X k=0
cos(ix) =
∞ X k=0
1 x2k+1 = i sinh x (2k + 1)!
1 2k x = cosh x. (2k)!
¨ Ubung 5.2.1 : (i) Definiere induktiv f¨ ur n ∈ N die Funktionen pn : C → C, x 7→ z n := z · z n−1 , wobei z 1 := z ist. Zus¨ atzlich 0 setzt man z := 1 f¨ ur alle z ∈ C. Zeige, daß alle pn stetig sind. Die Funktionen pn heißen (komplexe) Potenzfunktionen. (ii) Endliche komplexe Linearkombinationen von Potenzfunktionen heißen (komplexe) Polynomfunktionen oder einfach Polynome. D.h., eine komplexe Polynomfunktion ist eine Funktion der Form f : C → C,
z 7→
N X
an z n := a0 · 1 + a1 · z + a2 · z 2 + . . . + aN −1 · z N −1 + aN · z N ,
n=0
wobei die an ∈ R feste Konstanten sind. Zeige, daß alle komplexen Polynomfunktionen stetig sind.
5.2. POTENZREIHEN
Korollar 5.2.8 : Sei
103
P∞ k=0
ak xk eine Potenzreihe mit Konvergenzradius r. Dann ist die Funktion B(0; r) → C,
z 7→
∞ X
ak z k
k=0
stetig. Beweis: Idee: Zu z0 ∈ B(0; r) gibt es ein 0 < b < r mit z0 ∈ B(0; b). Da die Potenzreihe auf B(0; b) nach Satz 5.2.6 gleichm¨ aßig konvergiert, folgt die Behauptung aus der Stetigkeit von komplexen ¨ Polynomfunktionen (siehe Ubung 5.2.1) und Satz 5.1.4.
Wir wollen die Ableitung einer Funktion, die durch eine Potenzreihe dargestellt wird, selbst als Potenzreihe darstellen. Dazu ben¨otigen wir noch ein Lemma: Lemma 5.2.9 : Wenn 0 < q < 1, dann gilt limn→∞ nq n = 0. Beweis: Idee: Zeige zuerst, daß (nq n )n∈N f¨ur große n monoton fallend ist und wende Proposition 4.1.8 an. ¡ ¢ Beachte zun¨achst, daß limn→∞ n+1 n q = q < 1 (vgl. Korollar 4.1.4). Also gibt es ein n0 ∈ N mit n+1 ur alle n > n0 . Aber dann folgt n q < 1 f¨ 0 < (n + 1)q n+1 = nq n
n+1 q < nq n n
f¨ ur n > n0 und Proposition 4.1.8 zeigt, daß die Folge (nq n )n∈N einen Grenzwert a hat. Wegen der Identit¨at (n + 1)q n+1 = qnq n + q n+1 finden wir, indem wir die Grenzwerte f¨ ur n → ∞ von beiden Seiten berechnen (vgl. Beispiel 4.2.1), a = qa + 0. Wegen q < 1 folgt jetzt a = 0.
P∞ Man kann das Lemma auch beweisen, indem man zeigt, daß die Reihe n=0 nq n konvergiert (mit dem Quotientenkriterium aus Satz 5.2.4) und dann Proposition 4.2.2 anwendet.
Die folgende Anwendung von Satz 5.2.6 nehmen Bezug auf Begriffe wie Stetigkeit und Differenzierbarkeit, die man zwar auch im Komplexen definieren kann, aber bisher noch nicht aufgetaucht sind. Darum schr¨anken wir uns hier auf reelle Argumente ein. P∞ P∞ k k−1 Satz 5.2.10 : Die Potenzreihen haben denselben Konvergenzradius r. k=0 ak z und k=1 kak z P∞ k Wenn f auf ] − r, r[ durch a x dargestellt wird, dann ist f auf ] − r, r[ differenzierbar und f 0 wird k=0 k P∞ k−1 auf ] − r, r[ durch k=1 kak x dargestellt.
104
KAPITEL 5. FOLGEN VON FUNKTIONEN
Beweis: Idee: Leite die Reihe gliedweise ab und zeige, daß man die S¨atze 5.2.6 und 5.1.5 anwenden kann. P∞ k Sei r der Konvergenzradius von k=0 ¯ za¯knz . W¨ahle z und b mit 0 < |z| < b < r. Nach ¯ ¯ Lemma 5.2.9 konvergiert die Folge (n b )n∈N gegen Null, ist also insbesondere beschr¨ankt (vgl. Proposition 4.1.7). D.h. es gibt ein M > 0 (abh¨angig von z) mit ¯ ¯ ¯ 1 ³ z ´n ¯ 1 ³ ¯¯ z ¯¯n ´ n−1 n¯ ¯ |nan z |=¯ n an b ¯ = n ¯ ¯ |an |bn ≤ M |an |bn . z b |z| b P∞ k Weil die Reihe k=1 |ak |b konvergiert, konvergiert nach Satz 4.2.6 auch P∞ aber k−1 P∞ die Reihe k−1 ka z absolut. Damit haben wir gezeigt, daß der Konvergenzradius von k k=1 k=1 kak z P∞ k mindestens so groß ist wie der von k=0 ak z . Die umgekehrte Richtung folgt sofort aus |an | |z n | ≤ |z| n |an | |z n−1 |. Um auch die letzte Behauptung des Satzes zu zeigen, setzen wir sn (x) =
n X
ak xk
und tn (x) =
k=0
n X
kak xk−1 .
k=1
¨ Dann sind sn und tn f¨ ur alle n Polynomfunktionen mit s0n = tn (vgl. Ubung 3.2.3). Die Folgen (sn )n∈N und (tn )n∈N konvergieren nach Satz 5.2.6 gleichm¨aßig auf jedem Intervall [−b, b] ⊆] − r, r[. Damit folgt die Behauptung aus Satz 5.1.5.
Satz 5.2.11 (Identit¨ atssatz):
ρ sei der Konvergenzradius von
∞ P
ak (z − z0 )k und
k=0
f (z) =
∞ X
ak (z − z0 )k
k=0
f¨ ur z ∈ B(z0 ; ρ). Wenn z0 ein H¨ aufungspunkt der Nullstellenmenge {z ∈ B(z0 ; ρ) | f (z) = 0} ist, d.h. wenn es eine Folge (zn )n∈N in B(z0 ; ρ) mit zn 6= z0 , limn→∞ zn = z0 und limzn →z0 f (zn ) = 0 gibt, dann gilt ak = 0 f¨ ur alle k ∈ N0 , d.h. f ist konstant gleich 0. Beweis: Idee: Zeige zun¨achst a0 = 0 und teile dann die Funktion durch z − z0 . Sei (zn )n∈N wie im Satz angegeben. Dann gilt a0 = f (z0 ) = lim f (zn ) = 0 und n→∞
f1 (z) :=
∞
∞
k=1
k=0
X X f (z) ak (z − z0 )k−1 = ak+1 (z − z0 )k . = z − z0
n) Dies zeigt f1 (zn ) = zfn(z−z = 0, also a1 = 0. Diese Argumentation wendet man jetzt auf f1 0 statt f an und zeigt iterativ an = 0 f¨ ur alle n ∈ N.
P∞ Wenn die konstante Funktion 0 auf ] − r, r[ mit r > 0 durch die Potenzreihe k=0 ak xk mit Konvergenzradius r dargestellt wird, gilt a0 = 0. Mit dem Argument aus dem Beweis von Satz 5.2.10 hat auch die
5.2. POTENZREIHEN
105
P∞ Potenzreihe k=1 ak xk−1 den Konvergenzradius r. Sei f : ] − r, r[→ R die durch diese Reihe dargestellte Funktion. Dann gilt xf (x) = 0 f¨ ur alle x ∈] − r, r[, also f (x) = 0 f¨ ur alle x ∈] − r, 0[ ∪ ]0, r[. Weil aber f stetig in ] − r, r[ ist, muß auchPf (0) = 0 gelten. Damit haben wir gezeigt, daß die Nullfunktion auf ] − r, r[ ∞ auch durch die Potenzreihe k=1 ak xk−1 dargestellt wird. Wir wiederholen nun unser Argument und finden a1 = 0. Mit Induktion liefert obige Vorgehensweise, daß ak = 0 f¨ ur alle k ∈ N0 . Unser Ergebnis l¨aßt sich wie folgt interpretieren: Zu jeder Funktion ] − r, r[→ R gibt es h¨ochstens eine Potenzreihe mit Konvergenzradius r, die diese Funktion darstellt.
∞ P
Satz 5.2.12 : (Abel) f (z) = f (x) =
∞ P
ak z k konvergiere f¨ ur z = 1 (und dann auf B(0; 1)). Dann konvergiert
k=0
ak xk gleichm¨ aßig auf [0, 1]. Insbesondere ist die von f dargestellte Funktion auf [0, 1] stetig.
k=0
Beweis: Idee: Setze rk = −
∞ P
N P
am , zeige f (z) −
m=k+1
∞ P
ak z k =
k=0
rk (z k − z k+1 ) − rN z N +1 und sch¨ atze
k=N +1
mit Dreieicksungleichung sowie der geometrischen Reihe ab.
F¨ ur rk := −
∞ P
am gilt limk→∞ rk = 0, also ist {rk | k ∈ N} beschr¨ankt.
m=k+1
Sei |z| < 1 und N ∈ N. Jetzt rechnet man f (z) −
N X
ak z k
∞ X
=
k=0
ak z k
k=N +1 ∞ X
(rk − rk−1 )z k
=
k=N +1 ∞ X
rk z k −
=
k=N +1 ∞ X
∞ X
rk−1 z k
k=N +1
rk (z k − z k+1 ) − rN z N +1
=
k=N +1
und findet, daß f¨ ur x ∈ [0, 1[ gilt |f (x) −
N X
∞ X
ak xk | ≤ sup { |rk |} k≥N
k=0
k=N +1
|
{z } (geom. Reihe)
≤1
F¨ ur x = 1 hat man f (1) − Zusammen zeigt dies, daß
N P
ak =
k=0 N P
xk (1 − x) + |rN | ≤ 2 sup { |rk |}.
∞ P
ak = −rN , also |f (1) −
k=N +1
k≥N
N P
ak | ≤ 2 sup { |rk |}.
k=0
k≥N
ak xk auf [0, 1] gleichm¨aßig gegen f konvergiert. Die letzte Be-
k=0
hauptung folgt dann aus Satz 5.1.4.
106
KAPITEL 5. FOLGEN VON FUNKTIONEN
Bemerkung 5.2.13 : Die Rechnung im Beweis von Satz 5.2.12 ist ein Spezialfall von Abels partieller k P Summationsformel: F¨ ur c0 , . . . , cn , d0 , . . . , dn ∈ C und sk := dj gilt j=0
n X
ck dk =
n−1 X
k=0
(ck − ck+1 )sk + cn sn .
k=0
(in Satz 5.2.12 hatte man ck = z k , dk = ak zu nehmen).
Beispiel 5.2.14 : ∞ P
(a) Die Reihe log(1 + z) :=
k=1
(−1)k−1 k z k
∞ P
hat den Konvergenzradius ρ = 1 und
k=1
(−1)k−1 k
konvergiert
(nach dem Leibniz-Kriterium aus Satz 4.3.4). Also gilt nach Satz 5.2.12 f¨ ur x ∈ [0, 1], daß lim log(1 + x) = lim
x→1
x→1
∞ X (−1)k−1
k
k=1
k
x =
∞ X (−1)k−1 k=1
k
(Brouncker’s Reihe). b) Die Reihe arctan z :=
∞ P k=0
(−1)k 2k+1 2k+1 z
hat den Konvergenzradius ρ = 1 und wie in (a) sieht man ∞ X (−1)k k=0
2k + 1
= arctan 1
(Leibniz-Reihe). Wenn man den Arkustangens als Umkehrfunktion des Tangens erkannt hat, sieht man, daß arctan 1 = π4 .
Satz 5.2.15 : (Tauber) Falls f (z) =
∞ P
ak z k f¨ ur
k=0
Grenzwert lim f (x) existiert, dann konvergiert x→1−
∞ P
|z| < 1 konvergiert, limk→∞ kak = 0 und der
ak gegen lim f (x)). x→1−
k=0
Beweis: Idee: Setze ω(n) := sup {k |ak |} und zeige |f (x) − k≥n
w¨ ahle xn ∈ [0, 1[ mit (1 − xn )2 =
n P
ak | ≤ (1 − x)ω(0)(n + 1) +
k=0 ω(n+1) (n+1)2 ω(0)
und schließe |f (xn ) −
n P
ω(n+1) 1 . n+1 1−x
ak | → 0.
k=0
Wegen 1 − xk = (1 + x + x2 + · · · + xk−1 )(1 − x) ≤ k(1 − x)
∀x ∈ [0, 1]
gilt die Absch¨atzung ∞ ∞ X X xk 1 1 1 ≤ xk ≤ k n+1 n+11−x
k=n+1
k=n+1
(0 < x < 1)
Dann
5.2. POTENZREIHEN
107
und wir k¨onnen f¨ ur sn =
n P
ak und ω(n) := sup{k |ak |} rechnen k≥n
k=0
|f (x) − sn |
= ≤
|
n X
∞ X
ak (xk − 1) +
k=0 n X
ak xk |
k=n+1 ∞ X
|ak |(1 − xk ) +
k=n+1
k=0
≤ (1 − x)
n X
k |ak |
xk k
∞ X xk k |ak | + ω(n + 1) k
k=0
k=n+1
ω(n + 1) 1 ≤ (1 − x)ω(0)(n + 1) + . n+1 1−x B Wenn t = (1−x), A = ω(0)(n+1) und B = ω(n+1) ur t2 = B n+1 , gibt das |f (x)−sn | ≤ At+ t . F¨ A √ ω(n+1) vereinfacht sich dies zu At+ Bt = 2 AB. Jetzt w¨ahlt man xn ∈ [0, 1[ mit (1−xn )2 = (n+1) 2 ω(0) .
Weil letzteres f¨ ur n → ∞ gegen 0 konvergiert, gilt xn → 1. Da außerdem lim ω(n + 1) = 0, n→∞ haben wir jetzt r ω(n + 1) | f (xn ) −sn | ≤ 2 ω(0)(n + 1) → 0. | {z } n+1 lim f (x)
x→1−
Zusammen ergibt sich lim
n→∞
n X
ak = lim f (x). x→1−
k=0
¨ Ubung 5.2.2 : Sei r der Konvergenzradius der Potenzreihe ∞ X
ak z k ,
k=0
und sei m ∈ N. Zeige, daß die Potenzreihe ∞ X
ak z km
k=0
den Konvergenzradius r1/m hat. ¨ Ubung 5.2.3 : (a) Bestimme die Konvergenzradien der folgenden Potenzreihen und die Funktionen, die sie darstellen. P∞ k (i) k=1 kz , P∞ 2 k (ii) k=1 k z (b) Berechne die folgenden Summen. P∞ −k (i) . k=1 k7 P∞ 2 −k (ii) . k=1 k 3
¨ Ubung 5.2.4 :
Bestimme die Konvergenzradien der folgenden Potenzreihen.
108
KAPITEL 5. FOLGEN VON FUNKTIONEN
(i)
∞ X
k2 2−k z k ,
k=1
(ii)
∞ X (−1)k k √ z . k k=1
¨ Ubung 5.2.5 : Berechne die Konvergenzradien folgender Potenzreihen: ∞ X
∞ X zk , k+1
∞ X zk , k2
zk ,
k=0
∞ X z kn , n∈Z k
k=0
k=1
k=1
¨ Ubung 5.2.6 : Ordne folgende limites f¨ ur xn > 0 in aufsteigender Reihenfolge: lim sup
√ n
xn ,
lim inf
xn+1 , xn
lim sup
xn+1 , xn
lim inf
√ n
xn
¨ Ubung 5.2.7 : Zeige, daß f¨ ur a 6= 0 der Konvergenzradius der folgenden Potenzreihe 1/(e|b|) ist: 1 + az + a(a − 2b)
z2 z3 + a(a − 3b)2 + ... 2! 3!
(Tip: Benutze die vorige Aufgabe unter der Annahme, dass lim ¨ Ubung 5.2.8 : Sei fc (z) :=
P∞ n=0
µX ∞
an z n
n=0
xn+1 xn
existiert.)
cn z n mit Konvergenzradius rc . Entwickle erst formal folgende Identit¨ at: ¶ µX ¶ X ∞ ∞ · bn z n = (a ∗ b)n z n , n=0
fa · fb = fa∗b .
n=0
P Darin bedeutet der Stern ∗ die Cauchy–Faltung, die definiert ist durch (a ∗ b)n := n ν=0 aν bn−ν . Zeige weiterhin: min{ra , rb } ≤ ra∗b , d.h. im Inneren des kleineren Konvergenzkreises gilt die Identit¨ at nicht nur formal, sondern auch analytisch. ¨ Ubung 5.2.9 : Berechne die Konvergenzradien von fa , fb und fa∗b . fa (z) =
¨ Ubung 5.2.10 : Sei f (z) :=
∞ X
1 , 1−z
fb (z) =
1 1 − z/2
ak z k mit Konvergenzradius ρ > 0. Zeige, daß f¨ ur alle ξ auf dem Einheitskreis,
k=0
d.h. |ξ| = 1, die nicht Einheitswurzeln sind, d.h. ξ n 6= 1 f¨ ur alle n ≥ 1, lim
n→∞
n 1 X f (ξ ν z) = a0 n + 1 ν=0
gleichm¨ aßig in z auf jedem Kompaktum in B(0, ρ), der Kreisscheibe um 0 mit Radius ρ, gilt. Leite die Cauchy-Ungleichung daraus her: |a0 | ≤ sup |f (z)| f¨ ur jedes r ∈]0, ρ[ |z|=r
¨ Ubung 5.2.11 : Bestimme Limes superior und Limes inferior der Folgen (an )n∈N mit (i) an := (−1)n + (ii) an := n.
1 . n
5.3. BEISPIELE VON FUNKTIONEN
109
¨ Ubung 5.2.12 : F¨ ur genau welche x ∈ R konvergiert die Reihe ∞ µ X
x+
n=1
1 n
¶n ?
¨ Ubung 5.2.13 : Bestimme alle x ∈ R, f¨ ur die die Potenzreihe ∞ X (−1)n n √ x n n=1
konvergiert. (Hinweis: Insbesondere untersuche man den Rand des Konvergenzkreises!) ¨ Ubung 5.2.14 : Zeige, daß f¨ ur jedes n ∈ N0 und jedes z ∈ C die Reihe ¡ ¢n+2k ∞ X (−1)k z2 Jn (z) := k!(n + k)! k=0
absolut konvergiert. Die so definierte Funktion Jn : C → C heißt die Besselfunktion erster Art der Ordnung n.
5.3
Beispiele von Funktionen
Exponentialfunktion und Logarithmus ¨ In vielen physikalischen und anderen Modellen gibt es Gr¨oßen, deren zeitliche Anderung proportional zu ihrer aktuellen Gr¨oße ist (z.B. radioaktiver Zerfall, Bev¨olkerungsentwicklung). Mathematisch gesehen bedeutet das, man sucht Funktionen, deren Ableitung ein Vielfaches der Funktion ist (falls die Modellgr¨oße sich stetig in der Zeit ver¨andert, was man n¨aherungsweise oft annehmen kann). Man nimmt zun¨achst die Eins als Proportionalit¨atskonstante, alle anderen F¨alle lassen sich daraus leicht ableiten. Wir suchen also eine differenzierbare Funktion f : R → R mit f 0 = f . Eine solche Gleichung, in der eine Funktion und ihre Ableitung vorkommt, nennt man eine Differentialgleichung. Im dritten Semester werden solche Differentialgleichungen systematisch behandelt. Bemerkung 5.3.1 : Wir untersuchen die Gleichung f 0 = f mit ad hoc Methoden: Die Schl¨ usselidee ist es, nach einer Funktion zu suchen, die durch eine Potenzreihe dargestellt werden kann (vgl. Satz 5.2.10) und die Gleichung erf¨ ullt: ∞ X
ak xk = f (x) = f 0 (x) =
k=0
∞ X
(k + 1)ak+1 xk .
k=0
Man kann also versuchen, die ak so zu w¨ahlen, daß (∀k ∈ N0 ) (k + 1)ak+1 = ak gilt. Mit Induktion zeigt man sofort, daß aus dieser Rekursionsformel die Formel ak =
a0 k!
folgt, wobei k! := 1 · 2 · . . . (k − 1) · k
110
KAPITEL 5. FOLGEN VON FUNKTIONEN
(lies k Fakult¨ at) ist. Wenn wir jetzt zus¨ atzlich den Anfangswert f (0) = a0 = 1 fordern, stoßen wir auf die Potenzreihe ∞ X xk , k! k=0
die wir die Exponentialreihe nennen. P∞ k Satz 5.3.2 : Die Exponentialreihe k=0 xk! konvergiert f¨ ur alle x ∈ R und die durch diese Reihe dargestellte Funktion f : R → R erf¨ ullt die Differentialgleichung f 0 = f mit dem Anfangswert f (0) = 1. Beweis: ¨ Idee: Nach obigen Uberlegungen brauchen wir nur noch die Konvergenz zu beweisen. Wegen 1 k! 1 (k+1)!
=k+1
folgt diese aber sofort aus dem Quotientenkriterium 5.2.4 f¨ ur Potenzreihen (vgl. auch Beispiel 5.2.7).
Die durch Satz 5.3.2 definierte Funktion exp : R → R heißt die Exponentialfunktion. Man schreibt normalerweise ex statt exp(x). Die Wert e1 heißt die Eulersche Zahl und wird mit e bezeichnet. Es ist leicht, Funktionen f mit f 0 = cf f¨ ur beliebige konstanten c ∈ R zu produzieren: Beispiel 5.3.3 : Die Funktion f : R → R, x 7→ ecx ist differenzierbar und erf¨ ullt f 0 (x) = cf (x) (vgl. Satz 3.2.6).
Bemerkung 5.3.4 : Die Exponentialfunktion ist durch die Eigenschaften exp0 = exp und e0 = 1 eindeutig charakterisiert. Um das zu zeigen, nehmen wir an, daß f und g zwei differenzierbare Funktionen mit f 0 = f und g 0 = g sowie f (0) = g(0) = 1 sind. W¨ahle ein beliebiges x0 ∈ R und definiere die Hilfsfunktion h : R → R durch h(x) = f (x)g(x0 − x). Dann ist h differenzierbar und es gilt h0 (x) = f 0 (x)g(x0 − x) − f (x)g 0 (x0 − x) = f (x)g(x0 − x) − f (x)g(x0 − x) = 0. Nach Korollar 3.3.2 ist h konstant und wir finden f (x0 ) = f (x0 )g(0) = h(x0 ) = h(0) = f (0)g(x0 ) = g(x0 ). Da x0 beliebig war, folgt die Behauptung.
Bemerkung 5.3.5 : Eine der wichtigsten Eigenschaften der Exponentialfunktion ist, daß sie die folgende Funktionalgleichung erf¨ ullt: ∀x, y ∈ R :
ex ey = ex+y .
Zum Beweis h¨alt man ein x0 ∈ R fest und betrachtet die (konstante) Hilfsfunktion h : R → R, x 7→ ex ex0 −x aus Bemerkung 5.3.4. Dies zeigt ex ex0 −x = e0 ex0 = ex0 f¨ ur alle x, x0 ∈ R. Mit x0 = x + y folgt die Behauptung.
5.3. BEISPIELE VON FUNKTIONEN
111
¨ Ubung 5.3.1 : Man zeige, daß die Funktionalgleichung ez ew = ez+w f¨ ur alle z, w ∈ C gilt. Hinweis: Umordnungssatz 4.3.1 unter Verwendung der Binomialformel
k
(z + w) =
k µ ¶ X k j=0
j
z j wk−j
mit µ ¶ k! k = . j (k − j)!j!
Als erste Konsequenz der Funktionalgleichung sieht man, daß e−x = e1x . Weil aber ex f¨ ur positive x offensichtlich positiv ist, ist ex f¨ ur alle x ∈ R positiv. Damit ist aber auch die Ableitung der Exponentialfunktion positiv und somit ist die Exponentialfunktion wegen Korollar 3.3.3 strikt monoton steigend. Aus der Definition sieht man sofort, daß 1 + x < ex f¨ ur alle x > 0. Die Exponentialfunktion nimmt also beliebig große Werte an, und mit der Funktionalgleichung sieht man, daß sie auch beliebig kleine positive Werte annimmt. Insbesondere haben wir lim ex = 0.
x→−∞
7
6
5
4
3
2
1
-2
-1
1
2
Der Zwischenwertsatz 2.3.3 zeigt dann, daß exp : R → ]0, ∞[ surjektiv ist. Schließlich zeigt Satz 2.3.4, daß die Exponentialfunktion exp : R →]0, ∞[ eine strikt monoton steigende Umkehrfunktion hat, die wir mit ln : ]0, ∞[→ R,
x 7→ ln x
bezeichnen und den (natu ¨ rlichen) Logarithmus nennen.
112
KAPITEL 5. FOLGEN VON FUNKTIONEN
8
6
4
2
-3
-1
-2
1
2
3
-2
-4
-6
Mithilfe des nat¨ urlichen Logarithmus lassen sich weitere Varianten der Exponentialfunktion definieren: F¨ ur a > 0 und x ∈ R definiert man ax := ex ln a . Wenn x = n ∈ N, gilt wegen der Funktionalgleichung an = en ln a = eln a+...+ln a = eln a · . . . · eln a = a · . . . · a, d.h. die neue Definition ist mit der u ¨blichen vertr¨aglich. Bemerkung 5.3.6 : Die verallgemeinerten Exponentialfunktionen a• : R → ]0, ∞[, x 7→ ax erf¨ ullen folgende Regeln (i) (a• )0 = (ln a)a• , d.h. a• ist strikt monoton steigend f¨ ur a > 1, konstant f¨ ur a = 1 und strikt monoton fallend f¨ ur a < 1. (ii) ax ay = ax+y f¨ ur alle x, y ∈ R. (iii)
ax ay
= ax−y f¨ ur alle x, y ∈ R.
(iv) (ax )y = axy f¨ ur alle x, y ∈ R. 5 4 3 2 1 -4
-2
4
2
Insbesondere folgt aus dieser Bemerkung sofort, daß f¨ ur n ∈ N gilt a−n = wobei 3.2.8).
√ n
1 an
1
und a n =
√ n
a,
a die n-te Wurzel aus a, d.h., die eindeutig bestimmte positive Zahl b mit an = b ist (vgl. Beispiel
5.3. BEISPIELE VON FUNKTIONEN
113
Satz 5.3.7 : Die Funktion ] − 1, 1[ → R, x 7→ ln(x + 1) wird durch die Potenzreihe ∞ X (−1)k+1
k
k=1
xk
dargestellt. Beweis: Idee: Leite die Potenzreihe gliedweise ab, ziehe das Ergebnis von
1 x
ab und zeige, daß das Ergebnis
Ableitung Null hat.
Die Konvergenz der Potenzreihe wurde in Beispiel 5.2.1 schon bewiesen. Sei also f : ]−1, 1[→ R die Funktion, die durch die Potenzreihe auf ] − 1, 1[ dargestellt wird. Nach Satz 5.2.10 ist f differenzierbar und die Ableitung f 0 wird durch die Potenzreihe (vgl. Beispiel 4.2.1) ∞ X
(−1)k xk =
k=0
∞ X
(−x)k =
k=0
1 1+x
dargestellt. Andererseits gilt ln0 (x) = eln1 x = x1 nach Satz 3.2.7 und daher ist die Ableitung der Funktion 1 x 7→ ln(x + 1) gerade die Funktion x+1 . Wir sehen also mit Korollar 3.3.2, daß sich f und x 7→ ln(x + 1) nur durch eine Konstante unterscheiden. Wegen f (0) = 0 = ln(1) m¨ ussen die beiden Funktionen gleich sein.
Nach Bemerkung 5.3.6 sehen wir, daß auch die verallgemeinerten Exponentialfunktionen x 7→ ax mit a 6= 1 Umkehrfunktionen haben. Wir bezeichnen die Umkehrfunktion von R → ]0, ∞[, x 7→ ax mit loga : ]0, ∞[→ R und nennen diese Funktion den Logarithmus zur Basis a. Proposition 5.3.8 : Der Logarithmus zur Basis a erf¨ ullt folgende Regeln (i) loge = ln. (ii) loga (x) =
ln(x) ln(a)
(iii) (loga )0 (x) = a < 1.
f¨ ur alle x ∈]0, ∞[.
1 x ln a ,
d.h. loga ist strikt monoton steigend f¨ ur a > 1 und strikt monoton fallend f¨ ur
(iv) loga (xy) = loga (x) + loga (y) f¨ ur alle x, y ∈]0, ∞[. (v) loga ( xy ) = loga (x) − loga (y) f¨ ur alle x, y ∈]0, ∞[. (vi) loga (xp ) = p loga (x) f¨ ur alle x ∈]0, ∞[, p ∈ R. Beweis: (i) Dies folgt aus ln(e) = 1. ln(x)
(ii) a ln(a) = eln(x) = x. (iii) Folgt sofort aus (ii) (iv) aloga (x)+loga (y) = eln(x)+ln(y) = eln(x) eln(y) = xy. (v) aloga (x)−loga (y) = eln(x)−ln(y) = eln(x) e− ln(y) = xy . ¡ ¢ (vi) ap log(x) = aloga (x) p = xp .
114
KAPITEL 5. FOLGEN VON FUNKTIONEN
Betrachte die Potenzfunktionen pa : ]0, ∞[→ R,
x 7→ xa = ea ln x
f¨ ur beliebiges a ∈ R. Wie oben schon gezeigt, folgt aus der Funktionalgleichung der Exponentialfunktion, daß diese Definition der Potenzfunktionen f¨ ur a ∈ N mit derjenigen aus Beispiel 2.2.3 vertr¨aglich ist (in diesem Fall kann man zus¨atzlich auch negative x betrachten). Proposition 5.3.9 : p0a = apa−1 . Beweis: Mit der Kettenregel folgt sofort ³ ´0 a (xa )0 = ea ln(x) = ea ln(x) = axa x−1 = axa−1 . x
¨ ur x < 1 die Ungleichung ex ≤ (1 − x)−1 und veranschauliche diese Aussage anhand Ubung 5.3.2 : Beweise f¨ einer Zeichnung. ¨ Ubung 5.3.3 : Berechne die Ableitung der folgenden Funktionen. x2 ln(x3 ),
ln
1+x , 1−x
ln(ln x),
2x ,
x
22 .
¨ Ubung 5.3.4 : Beweise f¨ ur a > 0, a 6= 1: (logx a)0 = − ¨ Ubung 5.3.5 : Beweise:
(logx a)2 x ln a
∞ X (−1)k+1 = ln 2. k k=1
(Hinweis: Leibnizkriterium 4.3.4 und Abelscher Grenzwertsatz 5.2.12) ¨ Ubung 5.3.6 : Definiere eine Relation ∼ auf F(R, R) durch f ∼g
:⇔ ∃ lim (f − g)(x). x→∞
¨ (i) Zeige, daß ∼ eine Aquivalenzrelation ist. 2
(ii) Welche der folgenden Funktionen sind ¨ aquivalent zu e−x + x? (mit Beweis) f (x) = x2 ,
g(x) = x,
h(x) = 1.
¨ Ubung 5.3.7 : F¨ ur alle x ∈ R gilt limn→∞ (1+ nx )n = ex (Hinweis: Logarithmiere, teile durch x und interpretiere das Ergebnis als Differenzenquotient). ¨ Ubung 5.3.8 : Betrachte die Funktion η : ]0, ∞] → R, die durch η(x) = −x ln x gegegen ist. Zeige: (i) limx→0 η(x) = 0. (ii) η ist strikt positiv auf ]0, 1[. Pm P ur λ1 , . . . , λm ∈ [0, ∞[ mit n i=1 η(λi ) = 0 f¨ i=1 λi = 1, dann sind alle bis auf eines der λi gleich
(iii) Wenn Null.
Man ben¨ utzt die Funktion η um die Entropie eines Systems der statisitischen Mechanik bzw. den Informationsgehalt einer Zeichenkette zu beschreiben.
5.3. BEISPIELE VON FUNKTIONEN
115
Trigonometrische Funktionen ¨ Ahnlich wie im Falle der Exponentialfunktion l¨aßt sich auch die Definition der trigonometrischen Funktionen wie Sinus und Kosinus, die ja urspr¨ unglich aus der Kreis- und Dreiecksgeometrie stammen (daher der Name!), aus einer physikalisch motivierten Differentialgleichung ableiten. Die Gleichung f 00 = −f beschreibt einen Schwingvorgang, der dadurch zustande kommt, daß immer eine R¨ uckholkraft (nach Newton proportional zur Beschleunigung) der Auslenkung entgegen wirkt (wie bei einer Stahlfeder oder einer Schaukel). Dabei ist f 00 die Ableitung der Ableitung f 0 von f .
Bemerkung 5.3.10 : Analog zur Behandlung der Exponentialfunktion in Bemerkung 5.3.1 suchen wir eine Funktion, die durch eine Potenzreihe dargestellt werden kann und die Gleichung erf¨ ullt: ∞ X
ak xk = f (x) = −f 00 (x) = −
k=0
∞ X
(k + 1)(k + 2)ak+2 xk .
k=0
Man will also die ak so w¨ahlen, daß (∀k ∈ N0 ) (k + 1)(k + 2)ak+2 = −ak gilt. Wenn wir a0 und a1 vorgeben, sehen wir mit Induktion sofort, daß aus dieser Rekursionsformel die Formeln a0 a1 a2k = (−1)k und a2k+1 = (−1)k (2k)! (2k + 1)! A f¨ ur k ∈ N0 folgen. Damit gilt |ak | ≤ k! f¨ ur eine Konstante P∞ A > 0. Wegen der Konvergenz der Exponentialur die Wahl a0 = 1, a1 = 0 reihe folgt jetzt die Konvergenz der Reihe f (x) = k=0 ak xk aus Satz 4.2.6. F¨ erhalten wir die Kosinusreihe ∞ X 1 2k (−1)k x (2k)! k=0
und f¨ ur die Wahl a0 = 0, a1 = 1 erhalten wir die Sinusreihe ∞ X
(−1)k
k=0
1 x2k+1 . (2k + 1)!
Die beiden durch diese Reihen dargestellten Funktionen auf R heißen entsprechend Kosinus und Sinus. Sie werden mit cos : R → R und sin : R → R bezeichnet. Durch Ableiten der Potenzreihen finden wir cos0 = − sin,
sin0 = cos .
Außerdem folgt aus der Gestalt der Potenzreihen sofort cos(−x) = cos(x) und
sin(−x) = − sin(x).
Bemerkung 5.3.11 : Der Sinus ist durch folgende Eigenschaften eindeutig charakterisiert: sin00 = − sin,
sin(0) = 0,
sin0 (0) = 1.
cos(0) = 1,
cos0 (0) = 0
Analog ist der Kosinus durch die Eigenschaften cos00 = − cos,
116
KAPITEL 5. FOLGEN VON FUNKTIONEN
eindeutig charakterisiert. Um das zu zeigen, nehmen wir an, daß f und g zwei differenzierbare Funktionen mit f 00 = −f und g 00 = −g sind. W¨ahle ein beliebiges x0 ∈ R und definiere die Hilfsfunktion h : R → R durch h(x) = f (x)g 0 (x0 − x) + f 0 (x)g(x0 − x). Dann ist h differenzierbar und es gilt h0 (x) = −f (x)g 00 (x0 − x) + f 00 (x)g(x0 − x) = 0. Also ist h konstant und wir finden f (0)g 0 (x0 ) + f 0 (0)g(x0 ) = f (x)g 0 (x0 − x) + f 0 (x)g(x0 − x) f¨ ur alle x, x0 ∈ R. Wenn jetzt f1 und f2 zwei Funktionen mit f100 = −f1 und f200 = −f2 sowie f1 (0) = f2 (0) und 0 f1 (0) = f20 (0) sind, dann setze f := f1 − f2 und g := sin. Mit obiger Rechnung findet man 0 = f (x) cos y + f 0 (x) sin y f¨ ur alle x, y ∈ R. Mit y = 0 folgt also f (x) = 0 f¨ ur alle x ∈ R. Dies zeigt die Behauptung.
Aus der Schulgeometrie weiß man, daß die Zahl π in der Beschreibung von Sinus und Kosinus eine besondere Rolle spielt. Dort wird π als das Verh¨altnis zwischen Umfang und Durchmesser eines Kreises (beliebiger Gr¨oße) definiert oder auch als Verh¨altnis der Fl¨ache eines Kreises vom Radius r zur Fl¨ache eines Quadrats der Seitenl¨ange r. Diese Definitionen stehen uns hier nicht zur Verf¨ ugung, weil wir mit den bisher eingef¨ uhrten Konzepten weder Fl¨achen noch L¨angen gekr¨ ummter Kurven bestimmen k¨onnen.
Bemerkung 5.3.12 : Betrachte 22 24 cos(2) = 1 − + − 2! 4!
µ
26 28 − 6! 8!
¶ − ...
Die Summe der ersten drei Terme ist − 13 und mit Induktion sieht man, daß alle weiteren Terme negativ sind. Also gilt cos 2 < − 13 . Weil cos(0) = 1 gilt, muß nach dem Zwischenwertsatz 2.3.3 ein x > 0 mit cos x = 0 existieren. Sei x0 := inf{x ∈ R | x > 0, cos(x) = 0}, dann zeigt Lemma 2.2.6 (anwendbar wegen Korollar 5.2.8), daß x0 > 0 und cos(x0 ) = 0, d.h. x0 ist die kleinste positive Nullstelle von cos. Wir definieren π := 2x0 (sprich Pi). Wir behaupten, daß
π 2
die einzige Nullstelle von cos in ]0, 2[ ist: Es ist n¨amlich µ ¶ µ ¶ x2 x5 x2 sin x = x 1 − + 1− + ... 2·3 5! 6·7
positiv f¨ ur x ∈]0, 2[, also cos : ]0, 2[→ R wegen cos0 = − sin monoton fallend. Mit diesem Argument sieht man auch, daß sin π2 > 0. Schließlich stellen wir noch fest, daß ³ 1´ 1´ ³1 + − + . . . > 0, cos(1) = 1 − 2! 4! 6! was die Ungleichung
beweist.
π >1 2
5.3. BEISPIELE VON FUNKTIONEN
117
In Bemerkung 5.3.11 haben wir die Identit¨at f (0)g 0 (x + y) + f 0 (0)g(x + y) = f (x)g 0 (y) + f 0 (x)g(y) f¨ ur alle f, g mit f 00 = −f, g 00 = −g und x, y ∈ R gefunden (x0 = x + y). F¨ ur f = sin und g = cos finden wir cos(x + y) = cos x cos y − sin x sin y, f¨ ur f = sin und g = sin dagegen sin(x + y) = sin x cos x + cos x sin y. Setzt man in die erste der beiden Gleichungen y = −x ein, dann erh¨alt man 1 = (cos x)2 + (sin x)2 . Weil aber nach Bemerkung 5.3.12 cos π2 = 0 und sin π2 > 0, sehen wir jetzt sin π2 = 1 und dann cos(x + π2 ) = − sin x, cos(x + π) = − cos x, cos(π − x) = − cos x, cos(x + 2π) = cos x,
sin(x + π2 ) = cos x sin(x + π) = − sin x sin(π − x) = − sin x sin(x + 2π) = sin x
Die letzte Zeile bedeutet, daß die Funktionen cos und sin periodisch mit Periode 2π sind. Bemerkung 5.3.13 : Wegen cos(x±π) = − cos x sind alle Zahlen der Form π2 +kπ mit k ∈ Z Nullstellen von cos. Umgekehrt, wenn x ∈ R eine Nullstelle von cos ist, dann findet man ein k ∈ Z mit x−kπ ∈]− π2 , π2 ] und diese Zahl ist dann eine Nullstelle von cos. Da aber π2 die einzige Nullstelle von cos in ]0, 2[ ist und cos x = cos(−x) gibt es nur eine Nullstelle von cos in ] − π2 , π2 ], n¨amlich π2 . Also gilt x = π2 + kπ. Wir haben also alle Nullstellen von cos bestimmt: { π2 + kπ | k ∈ Z}. Wegen sin x = − cos(x + π2 ) kriegen wir auch gleich die Nullstellen von sin mitgeliefert: {kπ | k ∈ Z}. 1 0.5 -6
-4
-2
-0.5 -1
2
4
Mit der Bestimmung der Nullstellen von cos und sin sehen wir, daß ∀x ∈]0, π[ :
sin x > 0
und ∀x ∈] − π2 , π2 [ :
cos x > 0.
Also ist die Funktionen sin : ] − π2 , π2 [ → ] − 1, 1[
6
118
KAPITEL 5. FOLGEN VON FUNKTIONEN
strikt monoton steigend und die Funktion cos : ]0, π[ → ] − 1, 1[ strikt monoton fallend. Wegen ¡ ¢ sin − π2 = −1,
sin π2 = 1
cos 0 = 1,
cos π = −1
und dem Zwischenwertsatz 2.3.3 sind die Funktionen sin : [− π2 , π2 ] → [−1, 1] und cos : [0, π] → [−1, 1] bijektiv. Die zugeh¨origen Umkehrfunktionen heißen Arkussinus und Arkuskosinus. Sie werden mit arcsin : [−1, 1] → [− π2 , π2 ] und arccos : [−1, 1] → [0, π] bezeichnet. 3
1.5
1
2 0.5
-1.5
-1
-0.5
0.5
1
1
1.5
-0.5
-1
1
2
3
-1
-1.5
-1
Proposition 5.3.14 : arcsin0 (x) =
√ 1 1−x2
1 und arccos0 (x) = − √1−x . 2
Beweis: Idee: Wende den Satz 3.2.7 u¨ber die Ableitung der Umkehrfunktion an. Nach Satz 3.2.7 gilt arcsin0 (x) =
1 1 . = cos(arcsin x) sin0 (arcsin x)
Mit x = sin y rechnen wir cos(arcsin x)
=
cos y p = (cos y)2 p 1 − (sin y)2 = p = 1 − x2
weil cos y ≥ 0 f¨ ur y ∈ [− π2 , π2 ]. Die Ableitung des Arkuskosinus berechnet man analog.
5.3. BEISPIELE VON FUNKTIONEN
119
sin Die Funktion cos ist auf der Menge R \ { π2 + kπ | k ∈ Z} definiert und heißt Tangens. Sie wird mit tan bezeichnet. Analog ist die Funktion cos sin ist auf der Menge R \ {kπ | k ∈ Z} definiert und heißt Kotangens. Sie wird mit cot bezeichnet. Beide Funktionen sind periodisch mit Periode π. tan
cot
40 40 20
-3
-2
-1
20
1
-3
3
2
-2
-1
1
2
3
-20
-20
-40 -40
Der Tangens ist u ¨berall dort, wo er definiert ist, auch differenzierbar und mit der Quotientenregel Satz 3.2.4 und der Identit¨at 1 = (cos x)2 + (sin x)2 rechnet man leicht aus tan0 x = Damit sieht man, daß tan : ] − cos x > 0 f¨ ur ] − π2 , 0[ gilt
π π 2 , 2 [→
1 . (cos x)2
R monoton steigend ist. Wegen sin(− π2 ) = − sin( π2 ) = −1 und lim
x→(− π 2 )+
tan x = −∞
und analog stellt man fest lim tan x = ∞.
x→ π 2−
Also ist tan : ] − π2 , π2 [→ R bijektiv und hat eine Umkehrfunktion arctan : R →] − π2 , π2 [, die wir Arkustangens nennen. arctan 1.5 1 0.5 -7.5
-5
-2.5
2.5
5
7.5
-0.5 -1 -1.5
Proposition 5.3.15 : arctan0 (x) =
1 1+x2 .
Beweis: Idee: Wende den Satz 3.2.7 u¨ber die Ableitung der Umkehrfunktion an. Nach Satz 3.2.7 gilt arctan0 (x) =
1 = (cos(arctan x))2 . tan (arctan x) 0
120
KAPITEL 5. FOLGEN VON FUNKTIONEN Mit x = tan y rechnen wir (cos(arctan x))−2
(cos y)−2 (cos y)2 + (sin y)2 = (cos y)2 µ ¶2 sin y = 1+ cos y =
1 + (tan y)2
=
= 1 + x2
Wir zeigen, daß der Arkustangens durch eine Potenzreihe dargestellt werden kann: Satz 5.3.16 : Die Funktion arctan : R →] − π2 , π2 [ wird auf ] − 1, 1[ durch die Potenzreihe ∞ X
(−1)k
k=0
x2k+1 2k + 1
dargestellt. Beweis: Idee: Leite die Potenzreihe gliedweise ab, ziehe das Ergebnis von Ergebnis Ableitung Null hat.
Wegen
1 1+x2
ab und zeige, daß das
¯ ¯ 2k+1 ¯ ¯ ¯(−1)k x ¯ ≤ |x|2k+1 ¯ 2k + 1 ¯
sehen wir sofort, daß die Reihe auf ] − 1, 1[ absolut konvergiert. Sei f die durch diese Reihe dargestellte Funktion. Dann ist f differenzierbar und f 0 wird dargestellt durch die Reihe ∞ X
(−1)k x2k =
k=0
∞ X
(−x2 )k =
k=0
1 . 1 + x2
Also gilt f 0 = arctan0 und f −arctan ist eine konstante Funktion. Wegen f (0) = 0 = arctan(0) finden wir schließlich f = arctan.
¨ Ubung 5.3.9 : Beweise die folgenden Beziehungen zwischen den trigonometrischen Funktionen. (i) cos x cos y = 12 (cos(x + y) + cos(x − y)), (ii) cos x sin y = 12 (sin(x + y) − sin(x − y)), (iii) sin x sin y = 12 (cos(x − y) − cos(x + y)).
5.3. BEISPIELE VON FUNKTIONEN
121
Binomialfunktionen Betrachte die Binomialfunktion bα : ] − 1, ∞[, x 7→ (1 + x)α mit α ∈ R beliebig, aber fest. 12 10 8 6 4 2 -1
1
2
3
Binomialfunktionen f¨ ur α = −1, −0.2, 0, 0.5, 1, 2, 4 Wir wollen zeigen, daß diese Funktionen auf ] − 1, 1[ durch ein Potenzreihen dargestellt werden k¨onnen und die Potenzreihen auch bestimmen. Nach Proposition 5.3.9 gilt b0α (x) + xb0α (x) = α(1 + x)α−1 + xα(1 + x)α−1 = αbα (x). P∞ Wenn also bα auf ] − 1, 1[ durch die Potenzreihe k=0 ak xk dargestellt wird, dann wird b0α (x) + xb0α (x) durch die Potenzreihe ∞ X k=1
kak xk−1 +
∞ X
kak xk = a1 +
k=1
∞ X
((k + 1)ak+1 + kak )xk
k=1
P∞ dargestellt. Nach Satz 5.2.10 (plus Induktion) lassen sich die Koeffizienten einer Potenzreihe k=0 ak xk mit positivem Konvergenzradius durch die (iterierten) Ableitungen in 0 der dargestellten Funktion ausdr¨ ucken, sind also durch diese Funktion eindeutig bestimmt. Also muß αa0 = a1 und (∀k ∈ N)
αak = (k + 1)ak+1 + kak
gelten und das f¨ uhrt auf die Rekursionsformel (∀k ∈ N) ak+1 =
α−k ak . k+1
Aus bα (0) = 1 folgt a0 = 1 und mit Induktion finden wir ak = Der Ausdruck
α(α − 1) · · · (α − k + 1) . k!
µ ¶ α(α − 1) · · · (α − k + 1) α := k k!
µ ¶ α wird auch als Binomialkoeffizient bezeichnet. Man setzt zus¨atzlich := 1. Mit anderen Worten, 0 wenn die Binomialfunktion auf ] − 1, 1[ durch eine Potenzreihe dargestellt werden kann, dann sind die Koeffizienten durch die Binomialkoeffizienten gegeben. Es sind also zwei Dinge zu tun: Erstens m¨ ussen wir zeigen, daß die so gegebene Potenzreihe auf ] − 1, 1[ konvergiert. Zweitens ist nachzuweisen, daß sie die richtige Funktion darstellt.
122
KAPITEL 5. FOLGEN VON FUNKTIONEN
Satz 5.3.17 : Die Binomialfunktion bα : ] − 1, ∞[, x 7→ (1 + x)α mit α ∈ R wird auf ] − 1, 1[ durch die Potenzreihe ∞ µ ¶ X α k x k k=0
dargestellt. Beweis: Idee: Verkn¨upfe Funktion und Potenzreihe jeweils mit dem Logarithmus und leite ab. Sei ak =
α(α−1)···(α−k+1) . k!
Dann gilt ¯ ¯ ¯ ak ¯ ¯ ¯ = lim k + 1 = 1 lim ¯ k→∞ |α − k| k→∞ ak+1 ¯
P∞ und wir sehen mit dem Quotientenkriterium 5.2.4, daß die Reihe k=0 ak xk den Konvergenzradius 1 hat. Sei f : ] − 1, 1[→ R die durch diese Potenzreihe dargestellte Funktion. Dieselbe Rechnung, die uns auf die Gestalt der Koeffizienten ak gef¨ uhrt hat, zeigt jetzt, daß (1 + x)f 0 (x) = αf (x). Damit erhalten wir (ln ◦f )0 (x) =
f 0 (x) α b0 (x) = = α = (ln ◦bα )0 (x) f (x) 1+x bα (x)
f¨ ur alle x ∈] − 1, 1[. Da außerdem (ln ◦f )(0) = 0 = (ln ◦bα )(0) gilt, schließen wir erst auf ln ◦f = ln ◦bα und dann durch Anwenden der Exponentialfunktion auf f = bα .
µ ¶ m Wenn α = m ∈ N, dann gilt = 0 f¨ ur k > m und wir finden die u ¨bliche Binomialformel k (1 + x)m =
m µ ¶ X m k=0
die man auch leicht mit Induktion zeigt. Indem man x = (a + b)m
k a b
xk ,
setzt, erh¨alt man daraus auch die Formel
m µ ¶ X m m−k k = a b . k k=0
¨ Ubung 5.3.10 : Zeige die Binomialformel (a + b)m =
m µ ¶ X m k=0
f¨ ur die Binomialkoeffizienten
k
ak bm−k
µ ¶ m(m − 1) · · · (m − k + 1) m := k k!
mit Induktion. ¨ Ubung 5.3.11 : Zeige, daß die Funktion jα : ]−1, ∞[, x 7→ (1−x)−α mit α ∈ R auf ]−1, 1[ durch die Potenzreihe ¶ ∞ µ X α−1+k xk k k=0
dargestellt wird.
5.3. BEISPIELE VON FUNKTIONEN
123
Erzeugende Funktionen Sei (an )n∈N0 eine Folge in C. Eine Funktion f : M → C mit M ⊆ C, die auf einem Intervall der Form P∞ ] − ², ²[ durch die Potenzreihe n=0 an z n dargestellt wird, heißt eine erzeugende Funktion der Folge.
Beispiel 5.3.18 : Sei (Fn )n∈N0 die Folge der Fibonacci-Zahlen, d.h., es gilt F0 = 0, F1 = 1 und Fn+1 = Fn + Fn−1
(5.3)
f¨ ur alle n ∈ N. Dann verifiziert man mit Induktion sofort Fn ≤P2n und mit dem Quotientenkriterium aus ∞ Satz 5.2.4 und Satz 4.2.6 stellt man fest, daß die Potenzreihe n=0 Fn z n einen Konvergenzradius gr¨oßer 1 1 1 gleich 2 hat. Sei F : ] − 2 , 2 [ → R die erzeugende Funktion der Fibonacci-Folge. Multipliziert man (5.3) mit xn und summiert u ¨ber alle n ∈ N, so erh¨alt man auf der linken Seite ∞ X
Fn+1 xn =
n=1
F (x) − x x
und auf der rechten Seite ∞ ³X
∞ ´ ³X ´ Fn xn + Fn−1 xn = F (x) + xF (x).
n=1
n=1
¡ ¢ Damit findet man die Gleichung F (x) − x = x F (x) + xF (x) , die auf F (x) =
x . 1 − x − x2 √
Beachte, daß 1 − x − x2 = (1 − xr+ )(1 − xr− ) wobei r± = 1±2 5 (Verifikation durch ausmultiplizieren). Damit rechnet man, unter Benutzung der geometrischen Reihe, F (x) = = = = Es ergibt sich also
x 1 − x − x2 x (1 − xr+ )(1 − xr− ) ³ ´ 1 1 1 − r+ − r+ 1 − xr+ 1 − xr− ∞ ∞ ´ ³ X X 1 j j j j √ r+ x − r− x . 5 j=0 j=0 ¢ 1 ¡ n n Fn = √ r+ − r− 5
n und mit limn→∞ r− = 0 findet man
Fn , lim n→∞ √1 r n 5 + was auch oft in der Form Fn ∼
Beispiel 5.3.19 :
Fn 1 √ rn 5 +
geschrieben wird. Man sagt Fn ist asymptotisch gleich
Fn 1 √ rn 5 +
.
124
KAPITEL 5. FOLGEN VON FUNKTIONEN
(i) Betrachte die Menge S = {1, . . . , n} und k ∈ {1, . . . , n}. Wir bezeichnen die Anzahl der M¨oglich½ ¾ n keiten S in k disjunkte nichtleere Teilmengen aufzuspalten mit . Man nennt diese Zahlen auch k Stirling-Zahlen zweiter Art und die Aufteilungen Partitionen. Weiter setzen wir ur n < k 0 f¨ ½ ¾ 0 f¨ ur n < 0 oder k < 0 n = k 0 f¨ ur n 6= 0 = k 1 f¨ ur n = 0 = k Betrachte folgende zwei Typen von Partitionen: Solche, in denen eine der {n} ist ½ k Teilmengen ¾ n−1 und solche, f¨ ur die das nicht der Fall ist. Von der ersten Sorte gibt es St¨ uck (streiche k−1 {n} weg und finde Partitionen von {1, . . . , n − 1} in k − 1 Teilmengen). Aus der zweiten Sorte von Partitionen entfernt man in jeder Partition das Element n und bekommt dann jede Partition von . . , n − 1} genau k-mal (in jeder der k Teilmengen kann das n gewesen sein). Also gibt es ½ {1, . ¾ n−1 k Partitionen vom zweiten Typ. Zusammen erhalten wir die Rekursionsformel k ½ ¾ ½ ¾ ½ ¾ n n−1 n−1 = +k (5.4) k k−1 k ½ ¾ P∞ n n ¨ x . Mit Induktion sieht man (Ubung), daß f¨ ur (n, k) 6= (0, 0). Betrachte die Potenzreihe n=1 k ¯½ ¾¯ ¯ n ¯ ¯ ¯ ≤ (1 + k)n k f¨ ur n > k. Daher hat die Potenzreihe positiven Konvergenzradius (Satz 5.2.4 und Satz 4.2.6). Sei ³ ½n¾ ´ x 7→ Bk (x) die erzeugende Funktion der Folge auf einem passenden Intervall ] − ², ²[. k n∈N Multipliziert man (5.4) mit xn und summiert u ¨ber alle n ∈ N, so findet man Bk (x) = xBk−1 (x) + kxBk (x) f¨ ur k ∈ N, wobei B0 (x) = 1 gilt. Daraus leitet man Bk (x) =
x Bk−1 (x) 1 − kx
ab, was mit Iteration auf Bk (x) =
∞ ½ ¾ X n n=1
k
xn =
xk (1 − x) (1 − 2x) · · · (1 − kx)
1 f¨ ur k ∈ N0 f¨ uhrt. Wir f¨ uhren eine Partialbruchzerlegung von (1−x) (1−2x) ··· wir setzen an k X 1 αj = (1 − x) (1 − 2x) · · · (1 − kx) j=1 1 − jx
(1−kx)
durch, d.h.
und bestimmen die αr mit 1 ≤ r ≤ k indem wir mit 1 − rx multiplizieren und dann x = Das Ergebnis ist rk−1 . αr = (−1)k−r (r − 1)!(k − r)! Beachte, daß
∞ X 1 = rm xm . 1 − rx m=0
1 r
setzen.
5.3. BEISPIELE VON FUNKTIONEN
125
½ ¾ n Damit berechnet sich der Koeffizient von xn in Bk zu k ½ ¾ k X n = αr rn−k k r=1
=
k X
(−1)k−r
rk−1 rn−k (r − 1)!(k − r)!
(−1)k−r
rn r!(k − r)!
(−1)k−r
rn−1 (r − 1)!(k − r)!
r=1
=
k X r=1
=
k X r=1
f¨ ur n ≥ k. (ii) Interessiert man sich nicht daf¨ ur in wieviele Teilmengen S partitioniert wird, so erh¨alt man als Anzahl der m¨oglichen Partitionen die Bellsche Zahl n ½ ¾ X n b(n) = . k k=1 ½ ¾ n Wegen = 0 f¨ ur k > n findet man f¨ ur M ≥ n k b(n)
M X k X (−1)k−r
=
k=1 r=1
rn r!(k − r)!
M k X rn−1 X (−1)k−r (r − 1)! r=1 (k − r)!
=
k=1
M M −r X rn−1 ³ X (−1)s . (r − 1)! s=0 s!
=
k=1
¨ F¨ ur M → ∞ findet man (Ubung: pr¨ ufe die Konvergenz): ∞
b(n) =
1 X rn . e r=0 r!
Mit dem Quotientenkriterium u uft man, daß die Potenzreihe ¨berpr¨ ∞ X b(n) n B(x) = x n! n=0
positiven Konvergenzradius hat. Man nennt B dann auch die exponentiell erzeugende Funktion ¡ ¢ der Folge b(n) n∈N0 . Es gilt B(x) − 1
=
∞ ∞ 1 X xn X rn−1 e n=1 n! r=1 (r − 1)!
=
∞ ∞ 1 X 1 X (rx)n e r=1 r! n=1 n! ∞
= = =
1 X 1 rx (e − 1) e r=1 r! ¢ 1 ¡ ex e −e e x ee −1 − 1.
126
KAPITEL 5. FOLGEN VON FUNKTIONEN Damit ist b(n)n! gerade der Koeffizient von xn in der Potenzreihenentwicklung von ee
x
−1
.
¨ Ubung 5.3.12 : Man untersuche die nachstehenden Folgen (an )n∈N auf Konvergenz und bestimme gegebenenfalls die Grenzwerte ³ ´n 1 (i) an = 1 − 3n . p (ii) an = n(n + 3) − n. (iii) an =
ln(1+r)+7−3r n 2r n +5
mit r > 0.
¨ Ubung 5.3.13 : Man zeige,¡daß ¢ die Folge (an )n∈N mit an = cos der H¨ aufungspunkte von {cos n1 | n ∈ N}.
¡1¢ n
nicht existiert und bestimme die Menge
¨ Ubung 5.3.14 : Man untersuche die folgenden Funktionen f : R → R auf Stetigkeit im Punkt x0 = 0: i)
( f (x) =
(ii)
( f (x) =
x · cos x
x2 · sin 0
¡1¢ x
¡
1 x2
¢
f¨ ur x > 0, f¨ ur x ≤ 0. f¨ ur x 6= 0, f¨ ur x = 0.
¨ Ubung 5.3.15 : F¨ ur die Binomialkoeffizienten mit n, m ∈ N weise man folgende Beziehungen nach: ¶ µ ¶ µ n n . = (i) n−m m ¶ µ µ ¶ n n n−m . (ii) · m+1 = m+1 m ¨ Ubung 5.3.16 : Man untersuche die folgenden Reihen mithilfe des Leibniz-Kriteriums auf Konvergenz: P∞ n n+2 (i) n=2 (−1) n(n−1) . ¡π¢ P∞ (ii) n=1 cos(nπ) sin n . P∞ n n+6 (iii) n=1 (−1) n(n+1) . ¡ ¢ ¡1¢ P∞ π (ii) n=1 cos nπ + 2 sin n . ¨ Ubung 5.3.17 : Gegeben sei die Funktion f : R → R mit ( x3 ¡ ¢ f (x) = a sin(πx) + b sin πx 2
f¨ ur x 6∈ [−1, 1] f¨ ur x ∈ [−1, 1]
mit reellen Konstanten a und b. Man finde a und b so, daß f auf R differenzierbar ist. ¨ Ubung 5.3.18 : Gegeben sei die Funktion f : R → R mit ( (x + 2)2 f (x) = eax + b
f¨ ur x ≤ 0 f¨ ur x > 0
mit reellen Konstanten a und b. Man finde a und b so, daß f auf R differenzierbar ist. ¨ Ubung 5.3.19 : Man berechne die Ableitungen der folgenden Funktionen: 2
(i) f (x) = 10x
−1
.
5.3. BEISPIELE VON FUNKTIONEN
127
(ii) f (x) = −x + tan x. √ (iii) f (x) = tan x. (iv) f (x) = ln(x3 + 2x + 1). (v) f (x) = cosh3 x − (sinh2 x) (cosh x). √ (vi) f (x) = 3 x4 − 5.
¨ Ubung 5.3.20 : Man berechne die Ableitungen der folgenden Funktionen: (i) f (x) = 12 (sinh x) (cosh x) + x2 . (ii) f (x) = −x cot x + ln(sin x). (iii) f (x) =
x . x2 +1 x
(iv) f (x) = x (auf welchem Definitionsbereich kann man eine Funktion so definieren?). (v) f (x) = 7(2x + 5)2 − 2(8 − 9x) + 3. p (vi) f (x) = (4 − 7x)3 .
¨ Ubung 5.3.21 : Man untersuche die nachstehenden Folgen (an )n∈N auf Konvergenz und bestimme ggf. den Grenzwert: ³ ´ 3 2 2n − n +n+3 . (i) an = n+2 n3 ´6n ³ 1 . (ii) an = 1 − 2n p √ √ (iii) an = n + n − n. √ (iv) an = n4 − 2n2 − n2 . ¡ ¢ n sin +1+2n n2 +1 ¡ ¢ . (v) an = n+cos
n n2 +1
128
KAPITEL 5. FOLGEN VON FUNKTIONEN
Analysis II
129
Kapitel 6
Stammfunktionen Als Vorbereitung auf die Integrationstheorie und motiviert durch den sp¨ ater zu beweisenden Hauptsatz der Differential- und Integralrechnung studieren wir hier Funktionen mit vorgegebenen Ableitungen. Als Hilfe bei der Bestimmung solcher Funktionen beweisen wir die Substitutionsregel, betrachten partielle Integration und zeigen, wie man f¨ ur Funktionen vorgeht, die durch Potenzreihen dargestellt werden.
Sei I offenes Intervall und f : I → R eine Funktion. Eine Funktion F : I → R heißt Stammfunktion von f , wenn sie differenzierbar ist und F 0 = f erf¨ ullt. Wenn f eine Stammfunktion hat, so ist sie nach Beispiel 3.1.1 und Korollar 3.3.2 bis auf eine Konstante eindeutig bestimmt. Um eine Stammfunktion festzulegen, muß man also noch einen Funktionswert angeben. Im Vorgriff auf den Hauptsatz der Differential- und Integralrechnung verwendet man die Bezeichnung Z x f (t)dt (6.1) a
f¨ ur die Stammfunktion F von f mit F (a) = 0, falls es u ¨berhaupt eine solche gibt. Allerdings ist diese Notation mit etwas Vorsicht zu genießen: Weder gibt es zu jeder Funktion eine Stammfunktion, noch ist jede Stammfunktion durch ein Integral gegeben. F¨ ur nicht zu wilde“ Funktionen werden wir sp¨ater die ” Existenz von Stammfunktionen beweisen und auch sehen, daß diese Stammfunktionen durch Integrale gegeben sind.
Die Berechnung von Stammfunktionen (man sagt auch formale Integration) ist in der Regel nicht m¨oglich, es gibt aber eine Reihe von Techniken, mit denen wichtige Beispiele berechnet werden k¨onnen. Diese Techniken beruhen auf den Ableitungsregeln, die in Kapitel 3 bewiesen wurden.
6.1
Integrationsregeln
Seien f, g : I → R Funktionen und c ∈ R. Falls f und g Stammfunktionen haben, gilt Z x Z x Z x ¡ ¢ f (t) ± g(t) dt = f (t) dt ± g(t) dt a
und
a
Z
Z
x
cf (t) dt = c a
x
f (t) dt. a
131
(6.2)
a
(6.3)
132
KAPITEL 6. STAMMFUNKTIONEN
Beispiel 6.1.1 : ¢ Rx¡ 1 (i) F¨ ur a > 0 und x ∈ ]0, ∞[ gilt a t2 + 3t dt = man f¨ ur a < 0 und x ∈ ] − ∞, 0[ ben¨ utzen. Rx (ii) a (et − 1) dt = (ex − x) − (ea − a).
x3 3
−
a3 3
+
1 3
ln |x| −
1 3
ln |a|. Dieselbe Formel kann
Man kann in gewissen F¨allen auch Stammfunktionen von Produkten von Funktionen berechnen. Dazu nehmen wir an, daß f und g selbst differenzierbar sind. Dann gilt: Z x Z x ¡ ¢ f (t)g 0 (t)dt = f (x)g(x) − f (a)g(a) − f 0 (t)g(t)dt (6.4) a
a
wie man leicht aus der Produktregel 3.2.2 und (6.2) ableitet. Die Formel (6.4) heißt partielle Integration.
Beispiel 6.1.2 : (i) Mit f (t) = t und g(t) = sin t erh¨alt man aus (6.4) Z x t cos t dt = x sin x + cos x − 1. 0
(ii) Mit f (t) = ln t und g(t) = t erh¨alt man aus (6.4) Z x ln t dt = x ln x − x + 1. 1
Sei jetzt g : ]a, b[ → ]c, d[ eine differenzierbare Funktion. Wenn f : ]c, d[ → R eine Stammfunktion F : ]c, d[→ R mit F (y0 ) = 0 f¨ ur y0 = g(x0 ) hat, dann ist F ◦ g nach der Kettenregel in Satz 3.2.6 eine Stammfunktion von (f ◦ g)g 0 : ]a, b[→ R, d.h., Z
x
¡ ¢ ¡ ¢ ¡ ¢ f g(t) g 0 (t)dt = F g(x) − F g(x0 ) =
x0
Z
g(x)
f (s)ds.
(6.5)
g(x0 )
Umgekehrt, wenn (f ◦ g)g 0 : ]a, b[ → R eine Stammfunktion H : ]a, b[ → R hat und g eine differenzierbare Umkehrfunktion g −1 : ]c, d, [ → ]a, b[, dann rechnet man mit der Kettenregel und Satz 3.2.7 ¡ ¢ ¡ ¢ 1 (H ◦ g −1 )0 (y) = H 0 g −1 (y) (g −1 )0 (y) = f (y)g 0 g −1 (y) 0 ¡ −1 ¢ = f (y), g g (y) also ist H ◦ g −1 eine Stammfunktion von f , d.h., Z
Z
y
g −1 (y)
f (s)ds = y0
¡ ¢ f g(t) g 0 (t)dt.
(6.6)
g −1 (y0 )
Mit g(x) = y und g(x0 ) = y0 geht Formel (6.5) in Formel (6.6) u ¨ber. Man nennt die beiden Formeln auch die Substitutionsregel.
6.1. INTEGRATIONSREGELN
133
Beispiel 6.1.3 : 1 (i) Um die Stammfunktionen von s 7→ as+b f¨ ur feste Zahlen a 6= 0 und b in R zu bestimmen, betrachtet x−b man g(x) = a mit der Umkehrfunktion g −1 (y) = ay + b. Dann gilt
Z
y y0
1 ds as + b
Z =
ay0 +b
= = (ii) Um die Stammfunktionen von s 7→ der Ableitung g 0 (x) = Z
y
y0
√
3 2
ay+b
1 1+s+s2
Ã
a t−b a +b
= = =
Z
1 dt a
Z 1 ay+b 1 dt a ay0 +b t 1 (ln |ay + b| − ln |ay0 + b|) a √ zu bestimmen, betrachtet man g(x) = 21 ( 3x − 1) mit
und der Umkehrfunktion g −1 (y) =
1 ds = 1 + s + s2
!
1
2 √ (y+ 12 ) 3 2 √ (y0 + 12 ) 3
√2 (y 3
+ 21 ). Dann rechnet man
√ 1 3 √ √ dt 1 1 2 2 1 + 2 ( 3t − 1) + 4 ( 3t − 1)
√ Z √2 (y+ 1 ) 2 3 3 1 dt 3 2 √2 (y0 + 21 ) 4 + 43 t2 3 Z √2 (y+ 21 ) 3 2 1 √ dt 2 1 1 + t2 3 √3 (y0 + 2 ) 2y + 1 2y0 + 1 ´ 2 ³ √ arctan √ − arctan √ 3 3 3
Wenn eine Funktion durch eine Potenzreihe dargestellt werden kann, dann liefert der Satz 5.2.10 eine Stammfunktion in dem entsprechenden Bereich. P∞ k Proposition 6.1.4 : (Integration Potenzreihen) Wenn f auf ] − r, r[ durch k=0 aP k x dargestellt P∞ von ∞ ak k+1 wird, dann hat die Potenzreihe k=0 k+1 x denselben Konvergenzradius wie die Reihe k=0 ak xk und Rx P∞ ak k+1 die durch Reihe k=0 k+1 x dargestellte Funktion ist die Stammfunktion 0 f (t)dt. Beweis: P∞ ak k+1 P∞ Nach Satz 5.2.10 haben die Potenzreihen k=0 k+1 x und k=0 ak xk denselben Konvergenzradius und die durch die zweite Reihe dargestellte Funktion ist die Ableitung der durch die erste Reihe dargestellten Funktion.
¨ Ubung 6.1.1 : Berechne die folgenden Stammfunktionen R dx √ (i) 2 (ii) (iii) (iv)
R R R
1+x
√
dx
√
dx
1−x−2x2 1−x+2x2
arctan x dx
134
KAPITEL 6. STAMMFUNKTIONEN
¨ Ubung 6.1.2 : Berechne die folgenden Stammfunktionen R (i) eax+b dx R (ii) (a sin x + b cos x) dx R (iii) cos(2x) dx R (iv) (3 · 2x + 2 · 3x ) dx ¨ Ubung 6.1.3 : Berechne die folgenden Stammfunktionen R arctan x (i) dx 1+x2 R arcsin x √ (ii) dx 1−x2 R x (iii) e cos(x) dx R (iv) arccos x dx R (v) arcsin x dx ¨ Ubung 6.1.4 : Sei f : R → R stetig und F : R → R eine Stammfunktion von f . Zeige, daß die folgenden Aussagen ¨ aquivalent sind: (1) f (x) = −f (−x) f¨ ur alle x ∈ R. (2) F (x) = F (−x) f¨ ur alle x ∈ R.
6.2
Spezielle Beispiele
Stammfunktionen f¨ ur rationale Funktionen kann man finden, indem man zun¨achst versucht, sie als Linearkombinationen von Funktionen der Form 1 (ax + b)n
und
dx + e (ax2 + bx + c)n
zu schreiben und dann die Stammfunktionen dieser Funktionen berechnet. Im Prinzip geht das immer, weil man mithilfe des Zwischenwertsatzes 2.3.3 und Polynomdivision zeigen kann, daß jedes reelle Polynom als ein Produkt von linearen und quadratischen Faktoren geschrieben werden kann. Hat man so eine Produktdarstellung, setzt man eine Linearkombination mit unbekannten Koeffizienten an und l¨ost das resultierende lineare Gleichungssystem, um die Koeffizienten zu bestimmen. Der Fall n = 1 f¨ uhrt mit Substitution auf logarithmische und Arkustangens-Terme (vgl. Beispiel 6.1.3). Wir nehmen daher jetzt 1 an, daß n > 1 ist. Eine Stammfunktion von (ax+b) n ist durch 1 a(1 − n)(ax + b)n−1 gegeben, wie man leicht verifiziert. Schwieriger sind die Stammfunktionen von (ax2dx+e +bx+c)n zu bestimmen. 2 Man kann dazu annehmen, daß ∆ := b −4ac, die Diskriminante des quadratischen Polynoms ax2 +bx+ c, negativ ist, weil dies gerade bedeutet, daß man das Polynom nicht weiter als Produkt von Linearfaktoren q zerlegen kann. Mit r =
∆ b − 4a 2 kann man mit der Substitution x 7→ t = x + a Zahlen α, β ∈ R finden, die
2t 1 dx + e =α 2 +β 2 (ax2 + bx + c)n (t + r2 )n (t + r2 )n erf¨ ullen. Eine Stammfunktion von
2t (t2 +r 2 )n
ist 1 . (1 − n)(t2 + r2 )n
6.2. SPEZIELLE BEISPIELE
135
Es bleiben die Stammfunktionen
Z
x
Jn (x) := 0
(t2
dt + r2 )n
zu bestimmen. Mit partieller Integration zeigt man die Rekursionsformel Jn+1 =
1 t 2n − 1 1 + Jn . 2 2 2 n 2nr (t + r ) 2n r2
Zusammen mit dem Fall n = 1, der J1 (x) =
1 t arctan r r
liefert, ergibt dies die gew¨ unschten Stammfunktionen. W¨ahrend diese Methode im Prinzip immer funktioniert, hat man doch zun¨achst das Problem die Nullstellen des Nenners der rationalen Funktion zu bestimmen, was i.a. nicht exakt m¨oglich ist. Außerdem ist dies oft nicht der schnellste Weg und andere Wege liefern (auf den ersten Blick) andere Ergebnisse.
Beispiel 6.2.1 : Betrachte die Funktion x 1 = √ 4 x +1 2 2
x x4 +1
µ
Es gilt
1 1 √ √ − 2 2 x −x 2+1 x +x 2+1
¶
und obige Methode liefert die Stammfunktion ´ √ √ 1³ arctan(x 2 − 1) − arctan(x 2 + 1) . 2 Dagegen k¨onnte man auch einfach die Substitution x2 = y durchf¨ uhren, was sofort die Stammfunktion 1 arctan x2 2 liefert.
¨ Ubung 6.2.1 (Partialbruchzerlegung): Seien p und q reelle Polynomfunktionen. Zeige, daß die rationale 1 Funktion pq sich als Summe einer Polynomfunktion und einer Linearkombination von Funktionen der Form (ax+b) n oder (ax2dx+e schreiben l¨ aßt. +bx+c)n ¨ Ubung 6.2.2 : Berechne die folgenden Stammfunktionen R x4 (i) dx x4 −1 R 1 dx (ii) x4 +x2 +1 R 3x+5 (iii) dx (x2 +2x+2)2 R 1 (iv) dx x(x5 +1)2 R 2 x (v) dx (x−1)10
Newton (1642–1727) hat gezeigt, daß man Stammfunktionen von xp (a + x)q durch geeignete Substitutionen auf Stammfunktionen rationaler Funktionen zur¨ uckf¨ uhren kann, wenn eine der Zahlen p, q, p + q in Z liegt. Dagegen zeigte Tschebyscheff, daß dies f¨ ur andere p und q nicht m¨oglich ist.
136
KAPITEL 6. STAMMFUNKTIONEN 1
Beispiel 6.2.2 : Mit der Substitution x = (y 3 − 1) 5 findet man, daß Z 3 y s ds 5 y0 s3 − 1 eine Stammfunktion von
x
1 √ 3 1+x5
ist. Als Ergebnis erh¨alt man √ 1 (y − 1)2 3 2y + 1 ln 2 + arctan √ . 10 y + y + 1 5 3
Bemerkung 6.2.3 : Sei R eine reelle rationale Funktion in zwei Variablen. Dann gilt Z Z ¡ 2t 1−t2 ¢ 2 R(sin x, cos x) dx = R 1+t 2 , 1+t2 1+t2 dt, wie man mit der Substitution t = tan
¡x¢ 2
f¨ ur x ∈ ] − π, π[ sieht.
¨ Ubung 6.2.3 : Berechne die folgenden Stammfunktionen R cos5 x (i) dx 3 R sin x 1 dx (ii) cos(x)+sin(x) R 1 (iii) dx cos(x)+2 sin(x)+3 R 1 √ (iv) dx sin(x) cos3 (x) R √ 1 (v) dx tan x
Kapitel 7
Integrierbare Funktionen In diesem Kapitel entwickeln wir eine Integrationstheorie f¨ ur Funktionen einer reellen Variablen. Ausgehend von den sehr einfachen Elementarfunktionen, deren Integral gem¨ aß einer geometrischen Interpretation als Fl¨ ache eines Rechtecks definiert wird, u ¨ber Stufenfunktionen, gelangt man zur Klasse der integrierbaren Funktionen, deren Integral als Grenzwert gegeben ist.
In der Schule werden zwei Eigenschaften des Integrals besonders betont: Die Interpretation des Integrals einer Funktion als vom Graphen der Funktion bestimmte Fl¨ache und die Interpretation des Integrals als Stammfunktion. Wir besch¨aftigen uns hier mit der Fl¨acheninterpretation, weichen aber von dem in der Schule u ¨blichen Riemannschen Zugang insofern ab, als wir die Fl¨achen nicht durch schmale vertikale Streifen approximieren, sondern durch horizontale Ziegel variabler Breite. Wenn dieser Perspektivenwechsel zun¨achst auch unerheblich klingen mag, er f¨ uhrt auf einen deutlich leistungsf¨ahigeren Integralbegriff, das Lebesguesche Integral, der f¨ ur die Analysis von zentraler Bedeutung ist.
7.1
Das Integral einer Stufenfunktion
Eine Funktion f : R → R heißt elementar, wenn es a, b ∈ R mit ½ 1 x ∈ [a, b[ f (x) = 0 sonst gibt.
1
a
b
R Einer solchen Elementarfunktion f ordnet man die Zahl f := b − a zu, die als die vom Graphen der Funktion und der x-Achse eingeschlossene Fl¨ache interpretiert und das Integral von f genannt wird. Eine Stufenfunktion ist ein Element des von den Elementarfunktionen aufgespannten Untervektorraums FSt (R, R) von F(R, R), dem Raum aller Funktionen von R nach R. D.h., eine Stufenfunktion ist eine Linearkombination f = λ1 f1 + . . . + λn fn von Elementarfunktionen f1 , . . . , fn mit reellen Koeffizienten λ1 , . . . , λn ∈ R. 137
138
KAPITEL 7. INTEGRIERBARE FUNKTIONEN
Wir m¨ochten den Stufenfunktionen ebenfalls Integrale zuordnen und es bietet sich die Vorschrift Z Z Z f := λ1 f1 + . . . + λn fn (7.1) an.
Weil die Menge der Elementarfunktionen nicht linear unabh¨angig ist, haben wir hier aber ein Wohldefiniertheitsproblem. Dies l¨osen wir mit dem folgenden Lemma: Lemma 7.1.1 : Seien f1 , . . . , fn und g1 , . . . , gm Elementarfunktionen und λ1 , . . . , λn , µ1 , . . . , µm ∈ R. Wenn f = λ1 f1 + . . . + λn fn = µ1 g1 + . . . + µm gm , dann gilt auch
Z λ1
Z f 1 + . . . + λn
Z fn = µ1
Z g1 + . . . + µm
gm .
Beweis: Idee: Man ordnet die Unstetigkeitspunkte der fj und gi an und zerlegt die fj ’s und gi ’s entsprechend. R R P P Dann f¨ uhrt man n fj und m gi auf Linearkombinationen von Integralen der zerlegten j=1 λj i=1 µi Funktion zur¨ uck, die sich dann als gleich erweisen.
Es sei
½ fj (x) =
1 0
x ∈ [aj , bj [ sonst
½ und gi (x) =
1 0
x ∈ [ci , di [ sonst.
Wir ordnen die Elemente der Menge {a1 , b1 , . . . , an , bn , c1 , d1 , . . . , cm , dm } der Gr¨oße nach an: m1 < . . . < mk+1 . Sei ½ 1 x ∈ [ml , ml+1 [ hl (x) = 0 sonst. Dann gilt fj =
k X l=1
rlj hl
und gi =
k X l=1
sil hl ,
7.1. DAS INTEGRAL EINER STUFENFUNKTION
139
mit eindeutig bestimmten rlj , sil ∈ {0, 1}. Es ergibt sich f
=
n X
λj
k X
j=1
l=1
m X
k X
rlj hl =
k ³X n X
´ λj rlj hl
j=1
l=1
| {z } =:αl
=
µi
i=1
sil hl =
l=1
k ³X m X
´ µi sil hl .
i=1
l=1
| {z } =:βl
Indem man diese Gleichung von Funktionen an Punkten xl ∈ [ml , ml+1 [ auswertet, findet Slj +kj man αl = βl f¨ ur alle l = 1, . . . , k. Beachte, daß [aj , bj [= l=l [ml , ml+1 [ f¨ ur geeignete lj und j kj . Also haben wir lj +kj k X X fj = rlj hl = hl l=1
l=lj
und es ergibt sich Z
lj +kj
fj = bj − aj = mlj +kj +1 − mlj =
X
X Z
lj +kj
(ml+1 − ml ) =
l=lj
hl =
k X
l=lj
Z rlj
hl .
l=1
Jetzt rechnet man n X
Z λj
j=1
fj =
n X
λj
j=1
k X
Z rlj
hl =
k X n X l=1 j=1
l=1
Analog ergibt sich m X
Z λj rlj
Z µi
gi =
k X
i=1
hl =
k X
Z αl
hl .
l=1
Z βl
hl
l=1
und damit, wegen αl = βl , die Aussage des Lemmas.
Satz 7.1.2 : Die Vorschrift (7.1) definiert ein lineares Funktional Z : FSt (R, R) → R, d.h. es gilt
Z
Z (rf + sg) = r
Z f +s
g
f¨ ur alle f, g ∈ FSt (R, R) und alle r, s ∈ R. Beweis: P P Schreibe f = k λk fk und j gj als Linearkombinationen von Elementarfunktionen. P g = j µP Dann ist auch rf + sg = k rλk fk + j sµj gj eine Linearkombinationen von Elementarfunktionen und nach Lemma 7.1.1 gilt Z Z Z Z Z X X rλk fk + sµj gj = r f + s g. (rf + sg) = k
j
140
KAPITEL 7. INTEGRIERBARE FUNKTIONEN Wir nennen
R
f das Integral der Stufenfunktion f .
Jede Stufenfunktion f hat eine kanonische Darstellung als Linearkombination von Elementarfunktionen hj , f¨ ur die insbesondere gilt −1 h−1 i ({1}) ∩ hj ({1}) = ∅. Wenn n¨amlich f = λ1 f1 + . . . + λn fn mit
½
fj (x) =
1 0
x ∈ [aj , bj [ sonst
und die Elemente der Menge {a1 , b1 , . . . , an , bn } der Gr¨oße nach als c01 < . . . < c0k0 angeordnet sind,
streichen wir die c0j , an denen f stetig ist. Seien c1 < . . . < ck die Punkte, die noch u ¨brig bleiben. Dann ist f eine (eindeutig bestimmte) Linearkombination der (linear unabh¨angigen) Elementarfunktionen ( 1 x ∈ [cj , cj+1 [ hj (x) = 0 sonst. P Die resultierende Darstellung f = j µj hj nennen wir dann kanonisch. Die folgende Proposition listet noch einige weitere leicht zu zeigende, aber wichtige Eigenschaften des Integrals f¨ ur Stufenfunktionen auf: Proposition 7.1.3 : F¨ ur f, g ∈ FSt (R, R) gilt (i) Wenn f ≤ g, d.h. f (x) ≤ g(x) f¨ ur alle x ∈ R, dann gilt ¯R ¯ R (ii) ¯ f ¯ ≤ |f |, wobei |f |(x) := |f (x)|.
R
f≤
R
g.
¯R ¯ (iii) Wenn |f | ≤ M und f (x) = 0 f¨ ur x 6∈ [a, b[, dann haben wir ¯ f ¯ ≤ M (b − a). Beweis: Idee: Dreiecksungleichung. (i) Wegen Satz 7.1.2 k¨onnen wir annehmen, daß f = 0 ist und m¨ ussen nur zeigen, daß R g ≥ 0 gilt. Weil aber g ≥ 0, hat die kanonische Darstellung von g nur nicht-negative Koeffizienten. Also ist auch das Integral nicht negativ. (ii) Sei f = λ1 f1 + . . . + λn fn die kanonische Darstellung. Dann gilt |f | = |λ1 |f1 + . . . + |λn |fn und wir haben Z Z Z Z ¯Z ¯ ¯ Z ¯ ¯ ¯ ¯ ¯ ¯ f ¯ = ¯λ1 f1 + . . . + λn fn ¯ ≤ |λ1 | f1 + . . . + |λn | fn = |f |. (iii) Sei g die Elementarfunktion mit ½ g(x) =
1 0
x ∈ [a, b[, sonst.
R Dann gilt¯R g¯ = b − a und |f | ≤ M g. Also folgt nach (i), (ii) und der Linearit¨at des Integrals ¯ f ¯ ≤ M (b − a).
7.2. FOLGEN VON STUFENFUNKTIONEN
141
¨ Ubung 7.1.1 : Wahr oder falsch: Ist f = λ1 f1 + · · · + λn fn die kanonische Darstellung von f , so ist |f | = |λ1 |f1 + · · · + |λn |fn die kanonische Darstellung von |f |.
7.2
Folgen von Stufenfunktionen
Der folgende Satz wird f¨ ur den Aufbau einer Integrationstheorie f¨ ur allgemeinere als Stufenfunktionen von entscheidender Bedeutung sein. Auch seine Aussage wirkt harmlos, der Beweis ist allerdings recht subtil. Satz 7.2.1 : Sei (fn )n∈N eine monoton fallende Folge von nicht-negativen Stufenfunktionen, d.h. ∀x ∈ R, n ∈ N :
fn (x) ≥ fn+1 (x) ≥ 0.
Wenn f¨ ur jedes x ∈ R gilt lim fn (x) = 0,
n→∞
dann gilt auch
Z lim
fn = 0.
n→∞
Die Beweisidee f¨ ur diesen Satz ist, f¨ ur jedes δ > 0 nachzuweisen, daß fn ≤ δ f¨ ur große n, weil dann fn ≤ δ(b − a), wobei a und b die Grenzen eines festen kompakten Intervalls sind, außerhalb dessen mit f1 auch alle anderen fn verschwinden. R
δ
a
b
142
KAPITEL 7. INTEGRIERBARE FUNKTIONEN
W¨ahle f¨ ur jedes n ∈ N ein xn ∈ R aus, an dem fn sein Maximum annimmt. Wenn es zu vorgegebenem δ > 0 beliebig große n ∈ N gibt, f¨ ur die fn ≤ δ nicht gilt, findet man eine Teilfolge (xpn )n∈N mit fpn (xpn ) ≥ δ. Dann liefert aber der Satz 4.1.11 von Bolzano-Weierstraß eine konvergente Teilfolge (xqn )n∈N mit fqn (xqn ) ≥ δ. Sei x0 der Grenzwert dieser Teilfolge. Wegen limn→∞ fn (x0 ) = 0 < δ erhofft man sich jetzt einen Widerspruch. Das kriegt man aber nicht hin, weil x0 eine Sprungstelle von fn sein kann, d.h. wir k¨onnen nichts u ¨ber die Punkte nahe x0 aussagen. Der Ausweg besteht darin, die Funktionen fn passend zu modifizieren. Dazu dient das folgende Lemma: Lemma 7.2.2 : Seien f ∈ FSt (R, R) nicht-negativ und ² > 0. Dann gibt es eine Zahl η > 0 und eine nicht-negative Stufenfunktion g mit ∀x, y ∈ R mit |x − y| < η : und
g(x) ≤ f (y)
Z (f − g) < ².
f g
Beweis: Idee: Modifiziere die Funktion auf kleinen Intervallen um die Sprungstellen herum. Seien a0 , . . . , an die Sprungstellen von f und δ > 0 so klein, daß die Intervalle [aj − δ, aj + δ] paarweise disjunkt sind, d.h. sich nicht schneiden. Dann ist f auf jedem der Intervalle ]aj −δ, aj [ und ]aj , aj + δ[ konstant. Setze cj := f (aj − 12 δ) und W¨ahle η > 0 so, daß
n η < min
dj := f (aj + 21 δ).
² P ,δ 2 n j=0 |cj −dj | 2
o .
dj cj
η
a j−δ/2
η
a j−δ/2
aj
Jetzt definieren wir eine Stufenfunktion g durch ½ min(cj , dj ) x ∈ [aj − η, aj + η[ g(x) := f (x) sonst
f g
2η
2η
7.2. FOLGEN VON STUFENFUNKTIONEN Dann gilt wegen η <
δ 2
143
offensichtlich ∀x, y ∈ R mit |x − y| < η :
und die Ungleichung
Z
n X
(f − g) =
g(x) ≤ f (y)
2η|cj − dj | < ²
j=0
folgt ebenfalls aus der Wahl von η.
Beweis: [von Satz 7.2.1]
R
Idee: W¨ahle mit Lemma 7.2.2 Approximationen gn von fn mit (fn − gn ) <
² 2n
und zeige, daß f¨ ur R die induktiv durch h1 := g1 und hn := gn + (hn−1 − fn−1 ) konstruierte Folge sowohl hn als auch R (fn − hn ) gegen Null konvergieren.
R Nach Satz 7.1.2 und Proposition 7.1.3 zeigen unsere Voraussetzungen, daß die Folge ( fn )n∈N monoton fallend und beschr¨ankt ist. Nach Proposition 4.1.8 ist sie also konvergent und es ist unsere Aufgabe zu zeigen, daß der Grenzwert 0 ist.
Sei ² > 0. Mit Lemma 7.2.2 finden wir f¨ ur jedes n ∈ N eine Zahl ηn > 0 und eine nicht-negative Stufenfunktion gn mit ∀x, y ∈ R mit |x − y| < ηn : und
Z (fn − gn ) <
gn (x) ≤ fn (y)
² . 2n
Wir k¨onnen dar¨ uberhinaus annehmen, daß die Folge (ηn )n∈N monoton fallend ist. Wir definieren induktiv eine Folge (hn )n∈N von Stufenfunktionen durch h1 := g1
und hn := gn + (hn−1 − fn−1 ).
Mit Induktion sehen wir auch hn = gn −
n−1 X
(fk − gk ) ≤ gn ,
k=1
also gilt ∀x, y ∈ R mit |x − y| < ηn :
hn (x) ≤ fn (y)
und Z 0≤
Z (fn − hn ) =
Z (fn − gn ) +
(gn − hn ) =
n Z X k=1
(fk − gk ) ≤ ²
n X 1 ≤ ². 2k
k=1
144
KAPITEL 7. INTEGRIERBARE FUNKTIONEN Außerdem haben wir hn = hn−1 + (gn − fn−1 ) ≤ hn−1 + (gn − fn ) ≤ hn−1 , d.h. (hn )n∈N ist eine monoton fallende Folge von Stufenfunktionen. Da alle fn außerhalb von [a, b] verschwinden (a, b wie in der Bemerkung vor Lemma 7.2.2), verschwinden auch die gn (nach Lemma 7.2.2) sowie alle hn (nach Definition) außerhalb von [a, b]. Behauptung: Zu jedem δ > 0 gibt es ein nδ ∈ N mit ∀n > nδ :
hn ≤ δ.
Wenn dem nicht so ist, zeigt das Argument aus der Bemerkung vor Lemma 7.2.2, daß es eine konvergente Folge (xqn )n∈N mit Grenzwert x0 gibt, f¨ ur die gilt hqn (xqn ) ≥ δ. Sei m ∈ N so, daß fm (x0 ) < δ. Dann gibt es ein k ∈ N mit qk ≥ m und |xqk − x0 | < ηm , so daß hm (xqk ) ≤ fm (x0 ). Weil aber (hn )n∈N monoton f¨allt und qk ≥ m finden wir hqk (xqk ) ≤ hm (xqk ) ≤ fm (x0 ) < δ. Aber dies ist ein Widerspruch und wir haben obige Behauptung gezeigt. Also gilt insbesondere f¨ ur ² > 0 und n > n² Z Z Z 0 ≤ fn = hn + (fn − hn ) ≤ ²(b − a) + ² = ²(1 + b − a). Da a und b fest sind, zeigt dies gerade limn→∞
R
fn = 0.
Wenn f und g Stufenfunktionen sind, dann sind auch die Funktionen max(f, g) : R → R, x 7→ max{f (x), g(x)} und min(f, g) : R → R, x 7→ min{f (x), g(x)} Stufenfunktionen. Insbesondere sind der positive Teil f + := max(f, 0) und der negative Teil f − := max(−f, 0) von f Stufenfunktionen. Beachte, daß f = f+ − f− f+
f-
und |f | = f + + f − .
|f|
f
f
Korollar 7.2.3 : Seien (fn )n∈N und (gn )n∈N monoton steigende Folgen von Stufenfunktionen, f¨ ur die ∀x ∈ R :
lim fn (x) ≤ lim gn (x)
n→∞
n→∞
gilt (auch ∞ ist als Grenzwert zugelassen!). Dann gilt auch Z Z lim fn ≤ lim gn . n→∞
n→∞
7.2. FOLGEN VON STUFENFUNKTIONEN
145
Beweis: Idee: Ziehe ein festes fm von den gn , n ∈ N ab und spalte die Differenz in positiven und negativen Teil auf. Dann ben¨ utze Satz 7.2.1 und betrachte schließlich m → ∞. W¨ahle m ∈ N und setze hn := gn − fm . Mit (gn )n∈N ist auch (hn )n∈N monoton wachsend. Also ist (h− n )n∈N monoton fallend. Es gilt ∀x ∈ R :
lim hn (x) = lim gn (x) − fm (x).
n→∞
n→∞
Wegen fm (x) ≤ lim fn (x) ≤ lim gn (x) n→∞
gilt also
− 0 ≤ lim hn (x) = lim h+ n (x) − lim hn (x). n→∞
Da aus
h− n (x)
n→∞
> 0 folgt, daß
n→∞
h+ n (x)
n→∞
= 0, muß lim h− n (x) = 0
∀x ∈ R :
n→∞
gelten. Jetzt wenden wir Satz 7.2.1 auf die Folge (h− n )n∈N an und erhalten Z lim h− n = 0. n→∞
Also k¨onnen wir mit Satz 7.1.2 und Korollar 4.1.4 wie folgt rechnen: Z Z Z lim hn = lim ( h+ − h− n n) n→∞ n→∞ Z Z = lim h+ − lim h− n n n→∞ n→∞ Z = lim h+ n n→∞
≥ Dies impliziert
0.
Z
Z fm ≤ lim
gn .
Z
Z
n→∞
Da m ∈ N beliebig war, folgt auch lim
m→∞
fm ≤ lim
n→∞
gn ,
d.h. die Behauptung.
¨ Ubung 7.2.1 : Zeige: Sind (fn )n∈N und (gn )n∈N monoton fallende Folgen von Stufenfunktionen mit limn→∞ fn (x) = limn→∞ gn (x) f¨ ur alle x ∈ R, so gilt Z Z lim fn (x) = lim gn (x). n→∞
n→∞
¨ Ubung 7.2.2 : Wahr oder falsch? Ist (fn )n∈N eine Folge von Stufenfunktionen mit (a) |fn (x)| ≤ M f¨ ur alle x ∈ R und alle n ∈ N, (b) limn→∞ fn (x) = 0 f¨ ur alle x ∈ R.
146
KAPITEL 7. INTEGRIERBARE FUNKTIONEN
Dann gilt
Z lim
n→∞
fn = 0.
¨ Ubung 7.2.3 : Zeige: Sind (fn )n∈N und (gn )n∈N monoton fallende Folgen von Stufenfunktionen mit limn→∞ fn (x) ≤ limn→∞ gn (x) f¨ ur alle x ∈ R, so gilt Z Z lim fn (x) ≤ lim gn (x). n→∞
n→∞
¨ Ubung 7.2.4 : Wahr oder falsch? Ist (fn )n∈N eine Folge von Stufenfunktionen mit limn→∞ fn (x) = 0 f¨ ur alle x ∈ R, so gilt Z fn = 0. lim n→∞
¨ Ubung 7.2.5 R : Finde eine Folge (fn ) von nicht negativen Stufenfunktionen, so dass fn → 0 punktweise, 0 ≤ fn ≤ 1 und fn 6→ 0 .
7.3
Integrierbare Funktionen
Wir wollen die Klasse von Funktionen, die wir integrieren k¨onnen, u ¨ber die Stufenfunktionen hinaus ausdehnen. Die Grundidee ist, Funktionen durch Stufenfunktionen geeignet zu approximieren. Sei f ∈ F(R, R). Dann heißt f integrierbar, wenn es eine Folge (fn )n∈N von Stufenfunktionen gibt, die
∞ Z X
|fk | < ∞,
(7.2)
k=1
f (x) =
∞ X
fk (x), f¨ ur alle x mit
P∞ k=1
fk (x) absolut konvergent,
(7.3)
k=1
erf¨ ullt.
In diesem Fall sagen wir, f ist in Stufenfunktionen entwickelbar und schreiben f'
∞ X
fk .
k=1
1 Bemerkung 7.3.1 : Aus den Eigenschaften (7.2) und (7.3) liest man ab, daß die Menge P∞ L (R, R) 1 allerP integrierbaren Funktionen ein Untervektorraum von F(R, R) ist: Seien n¨amlich f ' k=1 fk und P∞ P∞ ∞ g ' k=1 gk sowie r ∈ R. Dann gilt rf ' k=1 rfk und f + g ' k=1 hk mit ( fl f¨ ur k = 2l − 1, hk := gl f¨ ur k = 2l.
1 Die
Bezeichnung L1 f¨ ur integrierbare Funktionen ist in Anlehnung an die international u ahlt ¨bliche Notation gew¨
7.3. INTEGRIERBARE FUNKTIONEN
147
Wir wollen nat¨ urlich das Integral einer integrierbaren Funktion durch ∞ Z X
fk
k=1
R R definieren, aber obwohl wegen | fk | ≤ |fk | und (7.2) diese Reihe absolut konvergiert, haben wir doch wie im Falle der Stufenfunktionen ein Wohldefiniertheitsproblem: Wir m¨ ussen nachweisen, daß das Integral nicht von Wahl der Entwicklung von f in Stufenfunktionen abh¨angt. Dies wird eine Konsequenz des folgenden Satzes sein: P∞
Satz 7.3.2 : Sei f ∈ L1 (R, R) und f '
k=1
fk . Wenn f ≥ 0, dann gilt auch
∞ Z X
fk ≥ 0.
k=1
Beweis: R
P∞
Idee: Betrachte f¨ur ein n0 ∈ N mit
|fk | < ² die monotone Folge gn := R |f | und schließe aus Korollar 7.2.3, daß lim gn ≥ 0. n→∞ k k=n0 +1
Pn
k=n0 +1
P∞ R
W¨ahle ² > 0. Wir werden zeigen, daß
k=1
Pn0
k=1
fk +
fk ≥ −2², was dann die Behauptung beweist.
Nach (7.2) gibt es ein n0 ∈ N mit Z ∞ X
|fk | < ².
k=n0 +1
Definiere eine monoton steigende Folge (gn )n∈N,n>n0 von Stufenfunktionen durch gn :=
n0 X
fk +
k=1
n X
|fk |.
k=n0 +1
Wegen f ≥ 0 und (7.3) gilt lim gn (x) ≥ f (x) ≥ 0
f¨ ur alle x ∈ R, f¨ ur die vergiert, dann gilt
P∞ k=1
n→∞
fk (x) absolut konvergiert. Wenn
P∞ k=1
fk (x) nicht absolut kon-
lim gn (x) = ∞ > 0.
n→∞
Jetzt sagt Korollar 7.2.3, daß
Z lim
gn ≥ 0.
n→∞
Damit erhalten wir
n0 Z X k=1
und −2² ≤ −2
Z ∞ X k=n0 +1
also die Behauptung.
Z ∞ X
fk +
|fk | ≤
|fk | ≥ 0
k=n0 +1 n0 Z X k=1
fk −
Z ∞ X k=n0 +1
|fk | ≤
∞ Z X k=1
fk ,
148
KAPITEL 7. INTEGRIERBARE FUNKTIONEN
P∞ P∞ Korollar 7.3.3 : Seien f ∈ L1 (R, R) sowie f ' k=1 fk und f ' k=1 gk zwei Entwicklungen von f in Stufenfunktionen. Dann gilt ∞ Z ∞ Z X X fk = gk . k=1
k=1
Beweis: Idee: Bilde die Differenz der Entwicklungen, beachte, daß dies eine Entwicklung der Nullfunktion liefert und wende Satz 7.3.2 an.
Aus (7.2) und (7.3) folgt mit Satz 7.1.2, daß f¨ ur die Funktionenfolge ( fl f¨ ur k = 2l − 1 hk := −gl f¨ ur k = 2l gilt 0'
∞ X
hk .
k=1
Mit Satz 7.3.2, angewandt auf die Nullfunktion, folgt jetzt Ã∞ Z ! Ã∞ Z ! ∞ Z X X X 0≤ hk = fl − gl k=1
l=1
l=1
Durch Vertauschen der Rollen von (fn )n∈N und (gn )n∈N erhalten wir auch die umgekehrte Ungleichung und damit die Behauptung.
Mit P∞Korollar 7.3.3 k¨onnen wir das Integral einer integrierbaren Funktion f mit der Entwicklung f ' k=1 fk in Stufenfunktionen durch Z ∞ Z X f := fk k=1
definieren. Eine komplexwertige R Funktion f = Re f + Im f heißt integrierbar, wenn Re f und Im f integrierbar sind. Das Integral f von f ist dann durch Z Z Z f := Re f + i Im f definiert. Wir bezeichnen die Menge der integrierbaren Funktionen f : R → C mit L1 (R). Aus Korollar R 7.3.3 und Satz 7.3.2 erhalten wir unmittelbar die folgende Bemerkung, die die Wahl der Bezeichnung f rechtfertigt: Bemerkung 7.3.4 : Die Abbildung
Z L1 (R) → C,
f 7→
f
ist ein lineares Funktional, dessen Einschr¨ ankung auf den Untervektorraum FSt (R, R) das in Satz 7.1.2 beschriebene lineare Funktional auf FSt (R, R) ist. Dar¨ uber hinaus gilt f¨ ur f, g ∈ L1 (R, R) wegen Satz 7.3.2 Z Z f ≤ g =⇒ f ≤ g. R R R Insbesondere folgt f¨ ur f ∈ L1 (R, R) aus −|f | ≤ f ≤ |f | die Ungleichung − |f | ≤ f ≤ |f |, d.h., ¯Z ¯ Z ¯ ¯ ¯ f ¯ ≤ |f |, falls |f | integrierbar ist.
7.3. INTEGRIERBARE FUNKTIONEN
149
½ Beispiel 7.3.5 : Sei S ⊆ R. Dann heißt die Funktion χS : R → R mit χS (x) =
1 0
x ∈ S, sonst,
die
charakteristische Funktion von S.
1
S
Wir zeigen, daß die charakteristische Funktion χ{a} eines Punktes a ∈ R integrierbar ist und das Integral 0 hat: Sei (bn )n∈N eine monoton fallende Folge in R mit bn > a f¨ ur alle n ∈ N und limn→∞ bn = a, dann gilt ∞ X (b1 − a) + (bn − bn+1 ) = 2(b1 − a) n=1
und ∀x 6= a :
χ[a,b1 [ (x) −
∞ X
χ[bn+1 ,bn [ (x) = 0.
n=1
1
a
b3
Damit sieht man, daß χ{a} ' χ[a,b1 [ −
b2
∞ X
b1
χ[bn+1 ,bn [ ,
n=1
was die Integrierbarkeit von χ{a} zeigt. Das Integral ist Z χ{a} = (b1 − a) −
∞ X
(bn − bn+1 ) = 0.
n=1
Beispiel 7.3.6 : Betrachte die Funktion f : R → R mit ½ x 0 ≤ x ≤ 1, f (x) := 0 sonst. Wir zeigen, daß f integrierbar ist und das Integral f
'
=
1 2
hat. Dazu weisen wir nach, daß
1 χ1 + 2 [ 2 ,1[ 1 + (χ[ 14 , 42 [ + χ[ 34 ,1[ ) 4 1 + (χ[ 18 , 82 [ + χ[ 38 , 48 [ + χ[ 58 , 68 [ + χ[ 78 ,1[ ) + 8 .. . ∞ 2n−1 X 1 X £ χ 2k−1 2k £ n 2 2n , 2n n=1 k=1
150
KAPITEL 7. INTEGRIERBARE FUNKTIONEN
Die Eigenschaft (7.2) folgt aus der Rechnung 2n−1 Z ∞ X 1 X χ[ 2k−1 2k 2n , 2n [ 2n n=1
=
2n−1 ∞ X 1 X ³ 2k 2k − 1 ´ − 2n 2n 2n n=1
=
∞ X 1 1 2n 2 n=1
=
∞ X 1 n 2 n=2
=
1 , 2
k=1
k=1
R die auch f = 12 beweist, sobald wir auch (7.3) nachgewiesen haben. Dies ist aber gerade eine Konsequenz P∞ der dyadischen Entwicklung einer reellen Zahl (vgl. Beispiel 4.2.10): Wenn n¨amlich x = n=1 an 21n mit an ∈ {0, 1}, dann gilt n−1 ½ 2X 1 an = 1, χ[ 2k−1 2k (x) = 2n , 2n [ 0 an = 0. k=1
Nat¨ urlich wollen wir nicht jedesmal solche Rechnungen anstellen, um so einfache Integrale auszurechnen. Sobald man den Zusammenhang mit Stammfunktionen hergestellt hat, ist das aber auch nicht mehr n¨otig.
Bemerkung 7.3.7 : Sei V ein endlich dimensionaler normierter R-Vektorraum und I ⊂ R ein Intervall. Eine Abbildung f : I → V heißt integrierbar, wenn es eine Basis B = {v1 , . . . , vn } von V gibt, so, daß alle Koeffizientenfunktionen I → R,
t 7→ fjB (t),
(j = 1, . . . n)
integrierbar sind, wobei die fjB (t) eindeutig bestimmt sind durch f (t) =
n X
fjB (t)vj .
j=1
Man definiert in diesem Fall das Integral von f durch Z f := I
n µZ X j=1
¶ I
fjB (t)dt
vj .
Dann ist f genau dann integrierbar, wennRdie Koeffizientenfunktionen fjB f¨ ur jede Basis von V integrierbar sind und man sieht, daß in diesem Falle I f nicht von B abh¨angt.
7.3. INTEGRIERBARE FUNKTIONEN
151
¨ Ubung 7.3.1 : Sei f ' f1 + f2 + · · · , und sei g eine Stufenfunktion. Zeige, daß f + g ' g + f1 + f2 + · · · .
¨ Ubung 7.3.2 : Sei f ' f1 + f2 + · · · und g ' g1 + g2 + · · · . Zeige, daß f ' f1 + g1 − g1 + f2 + g2 − g2 + f3 + g3 − g3 + · · · .
¨ Ubung 7.3.3 : Finde die kanonischen Darstellungen von (i) f = χ[−2,2[ − 2χ[−1,1[ , (ii) g = χ[0,2[ − 3χ[1,3[ , (iii) h = χ[0,5[ + 2χ[1,4[ − χ[2,3[ .
¨ Ubung 7.3.4 : Sei f = χ[0,2[ + χ[1,2[ + 3χ[3,4[ . Bestimme eine Stufenfunktion g und eine positive Zahl η mit den folgenden Eigenschaften: R (a) (f − g) < 17 , (b) g(x) ≤ f (y) f¨ ur alle x, y ∈ R mit |x − y| < η.
¨ anktes Intervall, und sei f integrierbar mit f (x) = 0 f¨ ur alle x 6∈ J. Zeige, Ubung 7.3.5 : Sei J ⊂ R ein beschr¨ daß es Stufenfunktionen f1 , f2 , . . . gibt mit fn (x) = 0 f¨ ur alle x 6∈ J, n ∈ N und f ' f1 + f2 + · · · .
¨ Ubung 7.3.6 : Sei
P∞ k=1
λk eine absolut konvergente Reihe reeller Zahlen. Betrachte die durch ( λn f¨ ur n ≤ x < n + 1, f (x) := 0 sonst,
definierte Funktion f : R → R. Zeige, daß f integrierbar ist und berechne ¨ Ubung 7.3.7 : Integrale:
R
f.
Seien a < b in R. Zeige, daß die folgenden Funktionen integrierbar sind und berechne die
(i) χ[a,b] , (ii) χ[a,b[ , (iii) χ]a,b] , (iv) χ]a,b[ .
¨ Ubung 7.3.8 : Auf dem Raum L1 (R, R) der integrierbaren Funktionen f : R → R sei die Relation ∼ durch Z f ∼ g :⇐⇒ |f − g| = 0 definiert. ¨ (i) Zeige, daß ∼ eine Aquivalenzrelation definiert. ¨ (ii) Sei [f ] die Aquivalenzklasse von f bzgl. ∼. Zeige, daß [f ] + [g] := [f + g]
und
λ[f ] := [λf ]
¨ eine Vektorraumstruktur auf der Menge aller Aquivalenzklassen definieren.
152
KAPITEL 7. INTEGRIERBARE FUNKTIONEN
(iii) Sei f : R → R+ stetig, nicht negativ und integrierbar. Zeige, daß [g] ∈ L1 [R, R] h¨ ochstens einen stetigen Repr¨ asentanten besitzt.
R
f > 0 , und folgere, daß eine Klasse
¨ Ubung 7.3.9 : Wahr oder falsch: Zu jeder integrierbaren Funktion f : R → R mit f ≥ 0 kann man eine Folge P (fk )k∈N von nichtnegativen Stufenfunktionen finden, die f ' ∞ ullt. k=1 fk erf¨ ¨ Ubung 7.3.10 : Zeige: Zu jederPstetigen integrierbaren P∞ Funktion f : R → R kann man eine Folge (fk )k∈N von Stufenfunktionen finden, die f ' ∞ ullt. k=1 fk und |f | ' k=1 |fk | erf¨ ¨ Ubung 7.3.11 : Seien λ, µ ∈ R, f, g : R → R und seien (fk ) , (gk ) Stufenfunktionen mit f'
∞ X
fk
und
g'
k=0
∞ X
gk .
k=0
(i) Zeige, daß λ · f + µ · g ' (λ · f0 ) + (µ · g0 ) + (λ · f1 ) + (µ · g1 ) + · · · . (Dabei sind die Terme in Klammern als Summanden aufzufassen.) P (ii) Finde ein Gegenbeispiel zu: λ · f + µ · g ' ∞ k=0 (λ · fk + µ · gk ) ! ¨ Hinweis: Uberlege, was die absolute Konvergenz der beiden Reihen bedeutet.
¨ Ubung 7.3.12 : Die Menge C der komplexen Zahlen ist ein Vektorraum u ¨ber C mit einer durch {1, i} gegebenen Basis. Dann heißt f : R → C integrierbar, wenn Re f und Im f integrierbar sind. Das Integral ist dann Z Z Z f = Re f + i · Im f . (i) Sei f : R → C integrierbar und λ ∈ C . Zeige: λ · f ist integrierbar und Z Z λ · f = (λ · f ) . Hinweis: Es reicht, dies f¨ ur λ = i zu zeigen. (Warum?) (ii) Sei f : R → C integrierbar. Es gilt
Z ¯Z ¯ ¯ ¯ |f | , ¯ f¯ ≤
falls |f |integrierbar ist. Hinweis: Falls z ∈ C , so gibt es u ∈ C , |u| = 1 , mit |z| = u · z .
Kapitel 8
Konvergenzs¨ atze Ziel dieses Kapitels ist Lebesgues Satz von der dominierten Konvergenz, der eines der wichtigsten Ergebnisse u ¨ber die Vertauschbarkeit von Grenzprozessen ist. Auf dem Weg dahin betrachten wir Reihen integrierbarer Funktionen, Nullfunktionen und Nullmengen sowie verschiedene Konvergenzbegriffe f¨ ur Folgen und Reihen integrierbarer Funktionen. Der entscheidende Vorteil des Lebesgue-Integrals, wie es in Kapitel 7 eingef¨ uhrt wurde, im Vergleich zum Riemannschen Integral, das u ¨blicherweise in der Schule behandelt wird, ist die M¨oglichkeit, Folgen und Reihen von integrierbaren Funktionen zu behandeln. In diesem Kapitel geben wir die f¨ ur die gesamte Analysis fundamentalen S¨atze u ¨ber Integrale von Grenzwerten integrierbarer Funktionen an.
8.1
Folgen und Reihen integrierbarer Funktionen
Sei (fn )n∈N eine Folge in L1 (R) und f ∈ F(R, C). Dann nennen wir (fn )n∈N eine Entwicklung von f , wenn ∞ Z X |fk | < ∞, (8.1) k=1
f (x) =
∞ X
fk (x), f¨ ur alle x mit
P∞ k=1
fk (x) absolut konvergent.
(8.2)
k=1
In diesem Fall sagen wir, f ist in integrierbare Funktionen entwickelbar und schreiben wie f¨ ur die Entwicklung in Stufenfunktionen ∞ X f' fk . k=1
Wir wollen zeigen, daß eine Funktion, die in integrierbare Funktionen entwickelbar ist, selbst integrierbar sein muß. Zur Vorbereitung beweisen wir zwei wichtige Aussagen u ¨ber den Betrag |f | einer integrierbaren Funktion. Lemma 8.1.1 : (i) Der Betrag |f | : R → R, x 7→ |f (x)| einer integrierbaren Funktion f ∈ L1 (R) ist selbst integrierbar. P∞ (ii) Wenn f als f ' k=1 fk in Stufenfunktionen entwickelt werden kann, dann gilt ¯ ¯ Z ∞ Z ∞ Z ¯X ¯ X ¯ ¯ fk ¯ ≤ |f | ≤ |fk |. ¯ ¯ ¯ k=1
k=1
153
¨ KAPITEL 8. KONVERGENZSATZE
154 Beweis: Idee: Betrachte eine Entwicklung
P∞
k=1 fk von f in Stufenfunktionen und dazu die Menge Z = {x ∈ R | f (x) konvergiert absolut}. F¨ ur die Folge gn := |f1 + . . . + fn | − |f1 + . . . + fn−1 | k k=1 Pn und x ∈ Z gilt dann |f (x)| = g (x) und indem man die Entwicklung f1 + f2 + . . . durch k k=1 g1 + f1 − f1 + g2 + f2 − f2 + . . . ersetzt, findet man eine Entwicklung von |f |.
P∞
Wir nehmen an, daß f '
P∞
k=1
fk eine Entwicklung von f in Stufenfunktionen ist. Sei
∞ ¯ X n o ¯ Z= x∈R¯ fk (x) konvergiert absolut k=1
und sn = f1 + . . . + fn . Dann gilt ∀x ∈ Z :
lim sn (x) = f (x)
n→∞
und somit ∀x ∈ Z :
lim |sn (x)| = |f (x)|.
n→∞
Definiere eine Folge (gn )n∈N integrierbarer Funktionen durch g1 := |s1 | = |f1 |
und gn := |sn | − |sn−1 |
f¨ ur n > 1 (da die fn Stufenfunktionen sind, sind auch die gn Stufenfunktionen). Wegen ¯ ¯ |gn | = ¯|sn | − |sn−1 |¯ ≤ |sn − sn−1 | = |fn | finden wir
∞ Z X
|gk | ≤
k=1
∞ Z X
|fk | < ∞,
k=1
d.h. die Entwicklung g1 + g2 + . . . erf¨ ullt (8.1). Zwar wissen wir, daß ∀x ∈ Z :
|f (x)| = lim |sn (x)| = lim n→∞
n→∞
n X
gk (x) =
k=1
∞ X
gk (x),
k=1
P∞ aber dennoch k¨onnen wir hier nicht schließen, P∞ daß |f | ' k=1 gk , weil es ja auch außerhalb Z noch Punkte geben k¨onnte, an denen k=1 gk (x) absolut konvergiert, wir aber nichts u ¨ber den Grenzwert wissen. Deshalb modifizieren wir die Reihe so, daß solche Extrapunkte nicht mehr auftreten k¨onnen: Wir betrachten die Entwicklung g1 + f1 − f1 + g2 + f2 − f2 + . . . , ¨ die nach obigen Uberlegungen ebenfalls (8.1) erf¨ ullt. Weiter stellen wir fest, daß |g1 (x)| + |f1 (x)| + | − f1 (x)| + |g2 (x)| + |f2 (x)| + | − f2 (x)| + . . . genau f¨ ur die x ∈ Z konvergiert. In diesem Fall gilt dann |f (x)| = g1 (x) + f1 (x) − f1 (x) + g2 (x) + f2 (x) − f2 (x) + . . . , d.h. es gilt |f | ' g1 + f1 − f1 + g2 + f2 − f2 + . . . und die Integrierbarkeit von |f | folgt, weil die fn und die gn Stufenfunktionen sind. Um die Ungleichung zu zeigen, stellen zun¨achst fest, daß nach Bemerkung 7.3.4 gilt ¯ ¯ ¯Z ¯ Z ∞ Z ¯X ¯ ¯ ¯ ¯ ¯ fk ¯ = ¯¯ f ¯¯ ≤ |f |. ¯ ¯ ¯ k=1
Außerdem haben wir
Z
Z |f | =
Z g1 +
Z g2 + . . . ≤
was schließlich die Behauptung beweist.
Z |f1 | +
|f2 | + . . . ,
8.1. FOLGEN UND REIHEN INTEGRIERBARER FUNKTIONEN
155
Mit Lemma 8.1.1 sehen wir, daß der positive und der negative Teil f± =
1 (|f | ± f ) 2
einer integrierbaren reellwertigen Funktion f auch wieder integrierbar ist. Weiter folgt sofort, daß mit f und g auch das punktweise Minimum min(f, g) = f − (f − g)+ und das punktweise Maximum max(f, g) = f + (g − f )+ wieder integrierbar ist. max(f,g) f g
min(f,g)
Lemma 8.1.2 : Sei f ∈ L1 (R) und ² > 0. Dann gibt es eine Entwicklung f ' Stufenfunktionen mit Z ∞ Z X |fk | < |f | + ².
P∞ k=1
fk von f in
k=1
Beweis: Idee: Man nehme irgendeine Entwicklung
P∞
fasse die ersten n0 Elemente davon k=1 gk von f und R P zusammen, wobei f¨ ur die verbleibenden Elemente gelten muß ∞ |gk | < 12 ². k=n0 +1
Sei zun¨achst f ' ein n0 ∈ N mit
P∞
k=1 gk
irgendeine Entwicklung von f in Stufenfunktionen. Dann gibt es Z ∞ X
|gk | <
k=n0 +1
1 ². 2
Setze f1 := g1 + . . . + gn0 und fn := gn0 +n−1 f¨ ur n > 1.
f f1
Dann gilt f'
∞ X
fk
und f − f1 '
k=1
Außerdem haben wir
∞ X
fk .
k=2 ∞ Z X
|fk | <
k=2
1 ². 2
Wegen |f1 | ≤ |f | + |f − f1 | finden wir mit Bemerkung 7.3.4 Z
Z |f1 | ≤
|f | +
∞ Z X k=2
Z |fk | <
1 |f | + ² 2
¨ KAPITEL 8. KONVERGENZSATZE
156 und schließlich
∞ Z X
Z |fk | <
|f | + ².
k=1
Satz 8.1.3 : Wenn eine Funktion f ∈ F(R) eine Entwicklung f ' hat, dann ist f integrierbar und es gilt Z ∞ Z X f= fk .
P∞ k=1
fk in integrierbare Funktionen
k=1
Beweis: Idee: Entwickle die fk in Stufenfunktionen fk,j mit
P∞ R j=1
|fk,j | <
R
|fk | + ²k und
P∞
k=1 ²k
< ∞.
Dann packe alle fk,j als eine Entwicklung f¨ ur f zusammen.
Sei gen
P∞
k=1 ²k
eine konvergente Reihe positiver Zahlen. Nach Lemma 8.1.2 gibt es Entwicklunfk ' fk,1 + fk,2 + . . .
der fk in Stufenfunktionen mit der Eigenschaft Z ∞ Z X ∀k ∈ N : |fk,j | < |fk | + ²k . j=1
Sei jetzt (gm )m∈N eine Folge der Stufenfunktionen, deren Umordnung die unendliche Matrix (fk,j )k,j∈N ist. Dann zeigt (8.1) mit Satz 4.3.1, daß ∞ Z ∞ Z ∞ X X X |gm | < |fk | + ²k < ∞. m=1
k=1
Wenn dar¨ uberhinaus die Reihe
k=1
∞ X
gm (x)
m=1
absolut konvergiert, dann konvergieren auch alle Reihen ∞ X
fk,j (x)
j=1
f¨ ur k ∈ N absolut und wegen (8.2) zeigt Satz 4.3.1, daß ∞ X
gm (x) =
m=1
∞ X
fk (x) = f (x).
k=1
Damit folgt aber
∞ X
f'
gm ,
m=1
also ist f integrierbar. Wegen
Z fk =
∞ Z X
fk,j
j=1
erhalten wir, wieder mit Satz 4.3.1, Z ∞ Z ∞ Z ∞ Z X X X fk,j = fk . gm = f= m=1
k,j=1
k=1
¨ 8.2. NULLMENGEN UND FAST UBERALL“ KONVERGENZ ”
157
P∞ R Korollar 8.1.4 : Wenn (fn )n∈N eine Folge in L1 (R) ist und k=1 |fk | konvergiert, dann gibt es eine integrierbare Funktion f mit Z ∞ ∞ Z X X fk und f= fk . f' k=1
k=1
f
Beweis: P∞ Sei Z die Menge der x ∈ R, f¨ ur die die Reihe k=1 fk (x) absolut konvergiert und definiere eine Funktion f ∈ F(R, R) durch (P ∞ k=1 fk (x) x ∈ Z f (x) = 0 sonst. P∞ Dann zeigt Satz 8.1.3, daß f integrierbar ist mit f ' k=1 fk .
8.2
Nullmengen und fast u ¨ berall“ Konvergenz ”
Der Beweis von Korollar 8.1.4, zeigt, daß es viele Funktionen gibt, f¨ ur die ist: Wir h¨atten f auf R \ Z beliebig definieren k¨onnen.
P∞ k=1
fk eine Entwicklung
f
Allerdings w¨are das Integral immer das gleiche geblieben. uhrt auf den Begriff der Nullfunktion: R Dies f¨ Eine integrierbare Funktion f heißt Nullfunktion, wenn |f | = 0 gilt.
Analog nennt man eine Menge M ⊆ R eine Nullmenge, wenn die charakteristische Funktion χM eine Nullfunktion ist (vgl. Beispiel 7.3.5). Wir bezeichnen die Menge aller Nullfunktionen mit L10 (R, R). Eine Menge A heißt abz¨ ahlbar, wenn es eine bijektive Abbildung N → A gibt.
¨ KAPITEL 8. KONVERGENZSATZE
158
Bemerkung 8.2.1 : Eine abz¨ ahlbare Vereinigung von Mengen ist eine Vereinigung der Form [ Ma = {z | (∃a ∈ A)z ∈ Ma } a∈A
mit A abz¨ahlbar und Ma f¨ ur jedes a eine Menge. Wie wir in Beispiel 7.3.5 gesehen haben, ist jede einelementige Teilmenge von R eine Nullmenge. Mit Korollar 8.1.4 erh¨alt man sofort, daß auch jede abz¨ahlbare Vereinigung von Nullmengen wieder eine Nullmenge ist: R S∞ Wenn n¨ a mlich M = N und χNk = dann gibt es eine integrierbare Funktion f mit f ' k k=1 P∞ P0, ∞ χ und f (x) = 1 f¨ u r alle x ∈ R, f¨ u r die k=1 Nk k=1 χNk (x) nicht konvergiert (d.h., wenn x in unendlich vielen Nk enthalten ist). Dann gilt f ≥ χM und Z 0=
f=
∞ Z X
Z χNk ≥
χM ≥ 0,
k=1
R also χM = 0. Dies zeigt u ¨brigens auch, daß kein Intervall der Form [a, b[ ⊆ R mit a < b abz¨ahlbar ist, da die charakteristische Funktion χ[a,b[ offensichtlich integrierbar ist und ein von Null verschiedenes Integral hat.
¨ ahlbare Vereinigung von abz¨ ahlbaren Mengen ist selbst abz¨ ahlbar. Ubung 8.2.1 : Zeige: Die abz¨ ¨ Ubung 8.2.2 : Sei χQ die charakteristische Funktion der Menge Q ⊂ R aller rationalen Zahlen. Zeige, daß χQ eine integrierbare Nullfunktion ist.
Proposition 8.2.2 : (i) Eine Funktion f ∈ F (R, C) ist genau dann eine Nullfunktion, wenn {x ∈ R | f (x) 6= 0} eine Nullmenge ist. (ii) Wenn Z ⊆ X ⊆ R und X ist eine Nullmenge, dann ist auch Z eine Nullmenge. Beweis: Idee: Entwickle die charakteristische Funktion χZ in unendlich viele identische Nullfunktionen. (i) Setze Z := {x ∈ R | f (x) 6= 0} und g := χZ . Wenn f eine Nullfunktion ist, dann ist |f | R R integrierbar und es gilt g ' |f | + |f | + . . . . Es ist n¨amlich |f | + |f | + . . . = 0 < ∞ und wenn |f (x)| + |f (x)| + . . . konvergiert, dann gilt f (x) = 0, also x ∈ R \ Z und g(x) = 0 = |f |(x) + |f |(x) + . . . . R R Wegen |f | = 0 gilt dann auch g = 0, d.h. Z ist eine Nullmenge. Umgekehrt, wenn X ⊇ {x ∈ R | f (x) 6= 0} eine Nullmenge ist und g = χX , dann gilt R g = 0 und man pr¨ uft wie zuvor, daß Rsowohl |f | ' g + g + . . . als auch f ' g + g + . . . gilt. Damit ist aber f integrierbar mit |f | = 0. R R (ii) Wie in (i) pr¨ uft man wieder nach, daß χZ ' χX + χX + . . . und findet χZ = χX + R χX + . . . = 0.
¨ 8.2. NULLMENGEN UND FAST UBERALL“ KONVERGENZ ”
159
Proposition 8.2.3 : Sei K gleich R oder C. (i) L10 (R, K) ist ein K-Untervektorraum von L1 (R). (ii) Wenn f ∈ L10 (R, K), dann gilt |f | ∈ L10 (R, K). Beweis: Wenn f, g ∈ L10 (R) und r, s ∈ C, dann gilt Z Z Z Z ¯ ¯ ¯ ¯ |rf + sg| ≤ (|r| ¯f ¯ + |s| ¯g ¯) = |r| |f | + |s| |g| = 0. Dies zeigt rf +sg ∈ L10 (R) und damit die erste Behauptung. Die zweite Behauptung ist trivial.
Aus Sicht der Integrationstheorie sind zwei Funktionen f, g ∈ L1 (R) gleichwertig, wenn sie sich nur durch eine Nullfunktion unterscheiden, d.h. f − g ∈ L10 (R). Wir sagen dann f und g sind fast u ¨ berall gleich und schreiben f = g (f.¨ u.) (8.3) ¨ (in englischsprachigen Texten a.e. f¨ ur “almost everywhere”). Die (f.¨ u.)-Gleichheit ist eine Aquivalenzre¨ lation. Die Menge der Aquivalenzklassen ist nichts anderes als der Quotientenvektorraum L1 (R)/L10 (R), der normalerweise mit L1 (R) bezeichnet wird. P∞ R P∞ |fk | konvergiert, integrierbarer Funktionen. Wenn Proposition 8.2.4 : Sei k=1 fk eine Reihe k=1 P∞ dann ist die Menge Z der x ∈ R, f¨ ur die k=1 fk (x) nicht absolut konvergiert, eine Nullmenge. Beweis: Nach den Voraussetzungen gilt χZ ' f1 − f1 + f2 − f2 + . . . , was aber nach dem Umordnungssatz 4.3.1 Z Z Z Z Z χZ = f1 − f1 + f2 − f2 + . . . = 0 impliziert.
Motiviert durch Resultate wie Proposition 8.2.4 sagen wir, eine Folge (fn )n∈N in F(R, C) konvergiert fast u ur die gilt: ¨ berall gegen ein f ∈ F(R, C), wenn es eine Nullmenge X ⊆ R gibt, f¨ ∀x 6∈ X :
lim fn (x) = f (x).
n→∞
In diesem Fall schreiben wir fn → f (f.¨ u.)
Proposition 8.2.5 : Seien f, g ∈ F(R, C).
¨ KAPITEL 8. KONVERGENZSATZE
160
(i) Wenn fn → f (f.¨ u.) und f = g (f.¨ u.), dann gilt fn → g (f.¨ u.). u.) und fn → g (f.¨ u.), dann gilt f = g (f.¨ u.). (ii) Wenn fn → f (f.¨ Beweis: Idee: Vereinige die Ausnahmemengen der beiden Konvergenzaussagen. Beachte, daß die Vereinigung von zwei Nullmengen A und B wegen χA∪B = min(1, χA + χB ) wieder eine Nullmenge ist. (i) Wenn fn → f (f.¨ u.) und f = g (f.¨ u.), dann gilt f¨ ur eine Nullmenge Z, daß fn (x) → f (x) f¨ ur alle x 6∈ Z. Außerdem gibt es eine Nullmenge X mit f (x) = g(x) f¨ ur alle x 6∈ X. Also gilt ∀x 6∈ Z ∪ X : fn (x) → f (x) = g(x) und dies beweist fn → g (f.¨ u.). (ii) Wenn fn (x) → f (x) f¨ ur x 6∈ X und fn (x) → g(x) f¨ ur x 6∈ Y mit X und Y Nullmengen, dann gilt ∀x 6∈ X ∪ Y : f (x) = g(x), was die Behauptung beweist.
Proposition 8.2.6 : F¨ ur eine Folge (fn )n∈N in F(R, C) sind folgende Aussagen ¨ aquivalent: (1) fn → f (f.¨ u.). (2) Es gibt eine Folge (hn )n∈N von Nullfunktionen f¨ ur die (fn + hn )n∈N punktweise gegen f konvergiert. Beweis: Idee: Betrachte auf der Ausnahmemenge die Differenz von Folgenglied und Grenzwert. Wenn (1) gilt, sei Z eine Nullmenge, die alle x ∈ R enth¨alt, f¨ ur die (fn (x))n∈N nicht gegen f (x) konvergiert. Setzt man ½ f (x) − fn (x) f¨ ur x ∈ Z hn (x) := 0 sonst, dann sind die hn nach Proposition 8.2.2 Nullfunktionen. Es gilt aber offensichtlich ∀x ∈ R :
lim (fn + hn )(x) = f (x),
n→∞
also (2). Wenn umgekehrt (2) gilt, dann impliziert Z Z |h1 | + |h2 | + . . . = 0 P∞ wegen Proposition 8.2.4, daß die Reihe k=1 hk außerhalb einer Nullmenge X (absolut) konvergiert. Aber dann gilt ∀x 6∈ X : lim hn (x) = 0 n→∞
und entsprechend ∀x 6∈ X :
lim fn (x) = lim (fn + hn )(x) = f (x).
n→∞
n→∞
¨ 8.2. NULLMENGEN UND FAST UBERALL“ KONVERGENZ ”
161
Bemerkung 8.2.7 : Wenn (fn )n∈N und (gn )n∈N Funktionenfolgen mit fn → f (f.¨ u.) und gn → g (f.¨ u.) sind, dann gilt nach den Rechenregeln f¨ ur Grenzwerte: (i) fn ± gn → f ± g (f.¨ u.). (ii) rfn → rf (f.¨ u.). (iii) |fn | → |f | (f.¨ u.). Insbesondere ist also die Menge der fast u ¨berall konvergenten Funktionenfolgen ein Untervektorraum des Raumes aller Funktionenfolgen.
Proposition 8.2.8 : Wenn f ' f1 + f2 + . . ., dann gilt f=
∞ X
Pn k=1
fk → f (f.¨ u.), d.h.
fk (f.¨ u.)
k=1
Beweis: Da
P∞ R k=1
|fk | konvergiert, folgt die Behauptung sofort aus Proposition 8.2.4.
¨ Ubung 8.2.3 : Zeige, daß L1 (R) bez¨ uglich Z k [f ] k :=
|f |
ein normierter Raum ist. Gilt dies auch f¨ ur L1 (R)? ¨ Ubung 8.2.4 : Sei R f die charakteristische Funktion der Menge aller rationalen Punkte in R. Zeige, daß f integrierbar ist mit f = 0. ¨ Ubung 8.2.5 : F¨ ur x, y ∈ R wird durch x ∼ y :⇔ x − y ∈ Q eine Relation erkl¨ art. Zeige ¨ (i) ∼ ist eine Aquivalenzrelation. ¨ (ii) In jeder Aquivalenzklasse gibt es ein x ∈ [0, 1]. ¨ (iii) Sei E ⊂ [0, 1] eine Menge, die aus jeder Aquivalenzklasse genau ein Element enth¨ alt. Dann gilt [ ]0, 1[⊂ {x + r : x ∈ E} ⊂ [−1, 2]. r∈Q∩[−1,1]
(iv) F¨ ur r, s ∈ Q mit r 6= s gilt {x + r : x ∈ E} ∩ {x + s : x ∈ E} = ∅. (v) Aus (iii) und (iv) folgt, daß χE nicht integrierbar ist.
¨ Ubung 8.2.6 : Zeige, daß die Relation Z f ∼ g :⇔
|f − g| = 0
¨ eine Aquivalenzrelation auf der Menge der integrierbaren Funktionen ist.
¨ KAPITEL 8. KONVERGENZSATZE
162
¨ Ubung 8.2.7 : Sei M eine abz¨ a ur alle x 6∈ M . Rhlbare Teilmenge von R, und sei f eine Funktion mit f (x) = 0 f¨ Zeige, daß f integrierbar ist mit f = 0. ¨ Ubung 8.2.8 : Die Cantor-Menge C entsteht aus dem Intervall [0, 1], indem zun¨ achst das offene mittlere Drittel herausgenommen wird, aus den zwei verbleibenden Intervallen wieder das jeweils offene mittlere Drittel, usw., also ½¸ · ¸ · ¸ · ¾ 1 2 1 2 7 8 C = [0, 1] \ , ∪ , ∪ , ∪ ... . 3 3 9 9 9 9 Zeige: R (i) χC ist integrierbar mit χC = 0, P −j (ii) C besteht genau aus den Punkten a ∈ R mit a = ∞ mit aj ∈ {0, 2}, j=1 aj 3 (iii) C ist u ahlbar, d.h. nicht abz¨ ahlbar. ¨ berabz¨
¨ Ubung 8.2.9 : Sei f : R → R eine Funktion. Betrachte die folgenden Aussagen: (i) f ist fast u ¨berall stetig. (ii) Es gibt eine stetige Funktion g : R → R so, daß f = g fast u ¨berall. ¯ ¯ (iii) Es gibt eine Nullmenge N ⊂ R so, daß f R\N stetig ist. Welche der sechs m¨ oglichen Implikationen zwischen diesen Aussagen sind allgemein g¨ ultig? Beweise dies bzw. finde Gegenbeispiele. Hinweis: Es reicht, vier der Implikationen zu beweisen bzw. zu widerlegen. ¨ Ubung 8.2.10 : Betrachtet man R als Q-Vektorraum, so ist Q ⊂ R ein Untervektorraum. (i) Zeige, daß jede Nebenklasse ξ = x + Q ∈ R/Q ein y ∈ [0, 1] enth¨ alt, und folgere, daß es ein Repr¨ asentantensystem E ⊂ [0, 1] von R/Q gibt. (ii) Sei E ein Repr¨ asentantensystem wie in (i). Zeige, dass [0, 1] ⊂ E + Q ∩ [−1, 1] ⊂ [−1, 2] . (iii) Folgere aus (ii) und der Eigenschaft, daß E ein Repr¨ asentantensystem von R/Q ist, daß χE nicht integrierbar ist. Hinweis: Betrachte die Funktionen χE+q mit q ∈ Q ∩ [−1, 1] und wende Korollar 8.1.4 sowie Proposition 8.2.4 an.
8.3
Norm-Konvergenz
Eine Folge (fn )n∈N von integrierbaren Funktionen heißt Norm-konvergent gegen f ∈ L1 (R), wenn Z lim |fn − f | = 0. n→∞
Wir schreiben daf¨ ur auch fn → f (i.N.).
Bemerkung 8.3.1 : Wenn (fn )n∈R und (gn )n∈R Folgen integrierbarer Funktionen sind mit fn → f (i.N.) und gn → g (i.N.), dann gilt nach den Rechenregeln f¨ ur Integrale und Grenzwerte sowie Bemerkung 7.3.4: (i) fn ± gn → f ± g (i.N.) (ii) rfn → rf (i.N.)
8.3. NORM-KONVERGENZ
163
(iii) |fn | → |f | (i.N.) Insbesondere ist also die Menge der Norm-konvergenten Folgen integrierbarer Funktionen ein Untervektorraum des Raumes aller Folgen integrierbarer Funktionen.
Proposition 8.3.2 : Wenn (fn )n∈N eine Folge integrierbarer Funktionen mit fn → f (i.N.) ist, dann gilt Z Z lim fn = f. n→∞
Beweis: Dies folgt sofort aus
¯Z Z ¯ Z ¯ ¯ ¯ fn − f ¯ ≤ |fn − f | ¯ ¯
(vgl. Bemerkung 7.3.4).
P∞ Pn Eine Reihe k=1 fk = ( k=1 fk )n∈R von integrierbaren Funktionen heißt Norm-konvergent gegen f ∈ L1 (R), wenn die Folge der Partialsummen in Norm gegen f konvergiert, d.h., wenn Z X n lim | fk − f | = 0. n→∞
Wir schreiben daf¨ ur auch
k=1
∞ X
fk = f (i.N.).
k=1
Proposition 8.3.3 : Wenn P∞ f ' k=1 fk , dann gilt
P∞ k=1
fk eine Reihe von integrierbaren Funktionen ist und f ∈ L1 (R) mit f=
∞ X
fk (i.N.).
k=1
Beweis: Idee: Betrachte |f −(f1 +. . .+fn )| und konstruiere ein passendes hn ∈ L1 (R) mit hn ' Zu ² > 0 w¨ahlen wir ein n0 ∈ N mit ∀n > n0 :
Z
P∞ k=n+1
Z |fn+1 | +
|fn+2 | + . . . < ².
Wegen f − f1 − . . . − fn ' fn+1 + fn+2 + . . . gilt f¨ ur
(P ∞
hn (x) := daß hn '
|fk (x)| |f (x) − (f1 (x) + . . . + fn (x))|
P∞ k=n+1
k=n+1
wenn die Reihe absolut konvergiert, sonst,
|fk | und |f − (f1 + . . . + fn )| ≤ hn
liefert Bemerkung 7.3.4 zusammen mit Satz 8.1.3 Z Z Z Z |f − (f1 + . . . + fn )| ≤ hn = |fn+1 | + |fn+2 | + . . . < ² f¨ ur alle n > n0 und dies zeigt die Behauptung.
|fk |.
¨ KAPITEL 8. KONVERGENZSATZE
164
Proposition 8.3.4 : (i) Wenn fn → f (i.N.) und f = g (f.¨ u.), dann gilt fn → g (i.N.). (ii) Wenn fn → f (i.N.) und fn → g (i.N.), dann gilt f = g (f.¨ u.). Beweis: Idee: Betrachte |f − g| ≤ |f − fn | + |fn − g|. Wenn f = g (f.¨ u.), dann ist h = g − f nach Proposition 8.2.2 eine Nullfunktion (insbesondere ist g integrierbar) und wir rechnen Z Z Z Z Z |fn − g| = |fn − (f + h)| ≤ |fn − f | + |h| = |fn − f |. Dies zeigt wegen fn → f (i.N.) die erste Behauptung. F¨ ur die zweite nehmen wir an, daß fn → f (i.N.) und fn → g (i.N.). In diesem Fall rechnen wir Z Z Z 0 ≤ |f − g| ≤ |fn − f | + |fn − g|. Da die ur n → ∞ gegen Null konvergiert, die linke aber garnicht von n abh¨angt, R rechte Seite f¨ folgt |f − g| = 0, also mit Proposition 8.2.2 die Behauptung.
Satz 8.3.5 : Sei (fn )n∈N eine Folge integrierbarer Funktionen mit Aussagen ¨ aquivalent: P∞ (1) k=1 fk = f (i.N.). P∞ u.). (2) k=1 fk = f (f.¨
P∞ R k=1
|fk | < ∞. Dann sind folgende
Beweis: Idee: Kombiniere Korollar 8.1.4, Proposition 8.2.8 und Proposition 8.3.3 mit Proposition 8.3.4 und Proposition 8.3.4.
P∞ R Wegen k=1 |fk | < ∞ gibt es nachPKorollar 8.1.4 eine integrierbare Funktion g mit g ' P ∞ ∞ u.) und nach Proposition 8.3.3 haben k=1 Pf∞k . Nach Proposition 8.2.8 gilt k=1 fk = g (f.¨ wir k=1 fk = g (i.N.).
Wenn jetzt (1) gilt, dann zeigt Proposition 8.3.4, daß f und g fast u ¨berall gleich sind. Also P∞ u.), d.h. (2). folgt mit Proposition 8.2.5, daß k=1 fk = f (f.¨ Umgekehrt, wenn (2) gilt, zeigt Proposition 8.2.5, daß f und g fast u ¨berall gleich sind. Dann Pn liefert Proposition 8.3.4 aber, daß k=1 fk → f (i.N.), also (1).
P∞ R Die n¨achsten beiden Beispiele zeigen, daß die Konvergenz der Summe k=1 |fk | in Satz 8.3.5 essen¨ tiell f¨ ur die Aquivalenz von fast-¨ uberall-Konvergenz und Norm-Konvergenz ist. Beispiel 8.3.6 : Betrachte die Funktionenfolge (fn )n∈N mit ( n f¨ ur x ∈ [n, n + 1[, fn (x) = 0 sonst.
8.3. NORM-KONVERGENZ
165
f5
f4 f3 f f1 2
ur jedes x ∈ R, daß fn (x) → 0. Insbesondere haben wir fn → 0 (f.¨ u.). Andererseits gilt RDann gilt f¨ fn = n, so daß die Folge nicht Norm-konvergent gegen 0 ist (vgl. Proposition 8.3.2). Beispiel 8.3.7 : Betrachte die Funktionenfolge (fn )n∈N mit ( £ n £ 1 f¨ ur x ∈ 2k−1 − 1, 2n+1 und 2k−1 ≤ n < 2k f¨ ur ein k ∈ N, k−1 − 1 fn (x) = 0 sonst.
f1
Wegen
R
fn =
1 2k−1
f2
f3
f4 f5 f6 f7
f¨ ur jedes n mit 2k−1 ≤ n < 2k finden wir: Z Z |fn | = fn → 0 f¨ ur n → ∞.
Damit folgt fn → 0 (i.N.). Andererseits ist f¨ ur jedes x ∈ [0, 1] der Wert fn (x) f¨ ur unendlich viele n gleich Null und auch f¨ ur unendlich viele n gleich Eins. Deshalb konvergiert die Folge (fn )n∈N f¨ ur kein x ∈ [0, 1]. Da aber [0, 1] keine Nullmenge ist, gilt also nicht fn → 0 (f.¨ u.).
Satz 8.3.8 (F. Riesz):
Sei (fn )n∈N eine Folge integrierbarer Funktionen.
(i) Wenn es zu jedem ² > 0 ein n0 ∈ N gibt mit Z ∀k, m > n0 :
|fm − fk | < ²,
dann gibt es eine integrierbare Funktion f mit fn → f (i.N.). (ii) Wenn fn → f (i.N.), dann gibt es eine Teilfolge (fpn )n∈N mit fpn → f (f.¨ u.). Beweis: Idee: W¨ahle Folgen (pn )n∈N , f¨ur die fp1 + (fp2 − fp1 ) + (fp3 − fp2 ) + . . . eine Entwicklung von integrierbaren Funktionen definiert.
Sei (²n )n∈N eine Folge positiver Zahlen mit
P∞
k=1 ²k
< ∞.
(i) W¨ ahle eine strikt monoton steigende Folge (pn )n∈N nat¨ urlicher Zahlen mit Z ∀k, m ≥ pn : |fk − fm | < ²n . Dann gilt
Z
Z |fp1 | +
Z |fp2 − fp1 | +
|fp3 − fp2 | + . . . < ∞.
Also folgt mit Korollar 8.1.4, daß es eine integrierbare Funktion f mit f ' fp1 + (fp2 − fp1 ) + (fp3 − fp2 ) + . . .
¨ KAPITEL 8. KONVERGENZSATZE
166
R gibt. Aber dann zeigt Proposition 8.3.3 |fpn − f | → 0 f¨ ur n → ∞. Aus Z Z Z |fk − f | ≤ |fk − fpm | + |fpm − f | folgt jetzt f¨ ur k > pn und m hinreichend groß, daß f¨ ur n → ∞, sehen wir, daß fk → f (i.N.).
R
|fk − f | < 2²n . Weil aber ²n → 0
(ii) Diesmal w¨ahlen wir eine strikt monoton steigende Folge (pn )n∈N nat¨ urlicher Zahlen mit Z ∀n ∈ N : |fpn − f | < ²n . Dann gilt
Z
Z |fpn+1 − fpn | ≤
und damit
Z
Z |fpn+1 − f | +
Z |fp1 | +
|f − fpn | < ²n+1 + ²n
Z |fp2 − fp1 | +
|fp3 − fp2 | + . . . < ∞.
Also folgt mit Korollar 8.1.4, daß es eine integrierbare Funktion g mit g ' fp1 + (fp2 − fp1 ) + (fp3 − fp2 ) + . . . gibt. Aber dann zeigt Proposition 8.2.8, daß fpn → g (f.¨ u.) und Satz 8.3.5, daß fpn → g (i.N.). Wegen Proposition 8.3.4 und fn → f (i.N.) finden wir f = g (f.¨ u.). Schließlich zeigt Proposition 8.2.5 noch fpn → f (f.¨ u.), also die Behauptung.
8.4
Die fundamentalen Konvergenzs¨ atze
Bemerkung 8.4.1 : Sei (fn )n∈N eine Folge integrierbarer Funktionen. Wenn f¨ ur jede Teilfolge (fpn )n∈N gilt fpn+1 − fpn → 0 (i.N.), ¨ dann erf¨ ullt (fn )n∈N die Cauchy-Bedingung aus Satz 8.3.8(i) (vgl. Ubung 4.1.4). Um dies zu zeigen, nehmen wir an, daß die Cauchy-Bedingung nicht erf¨ u llt ist. Dann gibt es ein ² > 0 R so, daß zu jedem n ∈ N zwei nat¨ urliche Zahlen m, m0 > n existieren mit |fm − fm0 | > ². Wir definieren induktiv eine Teilfolge (fpn )n∈N wie folgt: p1 = 1. Zu pn−1 finden wir zwei Zahlen m, m0 > pn−1 mit Z Z Z ² < |fm − fm0 | ≤ |fm − fpn−1 | + |fpn−1 − fm0 | und setzen
½ pn :=
m m0
Es gilt dann
R
|fm − fpn−1 | > sonst
Z ∀n ∈ N :
was die Behauptung beweist.
falls
|fpn − fpn−1 | >
² , 2
² 2
¨ 8.4. DIE FUNDAMENTALEN KONVERGENZSATZE
167
Satz 8.4.2 (Monotone Konvergenz - B. Levi): Sei (fn )n∈N eine monotone Folge reellwertiger integrierbarer Funktionen und M ∈ R mit Z ∀n ∈ N : |fn | ≤ M. Dann gibt es eine integrierbare Funktion f mit fn → f (i.N.) und fn → f (f.¨ u.). Beweis: Idee: Zeige, daß f1 +(f2 −f1 )+(f3 −f2 )+. . . eine Entwicklung in integrierbare Funktionen definiert. Indem wir fn durch fn − f1 oder f1 − fn ersetzen, k¨onnen wir o.B.d.A. annehmen, daß die Folge monoton steigend ist mit fn ≥ 0 f¨ ur alle n ∈ N. Dann gilt Z Z Z Z |f1 | + |f2 − f1 | + . . . |fn − fn−1 | = |fn | ≤ M f¨ ur alle n ∈ N. Also folgt mit Korollar 8.1.4, daß es eine integrierbare Funktion f mit f ' f1 + (f2 − f1 ) + (f3 − f2 ) + . . . gibt. Aber dann gilt nach Proposition 8.3.3 und Proposition 8.2.8 f = f1 + (f2 − f1 ) + (f3 − f2 ) + . . . (i.N.)
und
f = f1 + (f2 − f1 ) + (f3 − f2 ) + . . . (f.¨ u.),
was die Behauptung beweist.
Satz 8.4.3 (Dominierte Konvergenz - H. Lebesgue): Sei (fn )n∈N eine Folge integrierbarer Funktionen mit fn → f (f.¨ u.). Wenn es eine integrierbare Funktion g mit ∀n ∈ N :
|fn | ≤ g
gibt, dann ist f integrierbar und es gilt fn → f (i.N.). Insbesondere hat man
R
fn →
R
f f¨ ur n → ∞.
Beweis: Idee: Im Falle f = 0 wende den Satz 8.4.2 von der monotonen Konvergenz erst auf hn,m = max(|fn |, . . . , |fn+m |) f¨ ur m → ∞, dann auf die resultierende monoton fallende Folge von Grenzwerten an. Dann reduziere auf diesen Spezialfall durch die Ersetzung gn := fpn+1 − fpn , wobei (pn )n∈N eine beliebige Teilfolge von N ist.
Wir definieren hn,m = max(|fn |, . . . , |fn+m |) f¨ ur n, m ∈ N. max(f,g) f g
min(f,g)
F¨ ur festes n ∈ N ist dann die Folge (hn,m )m∈N monoton steigend und wegen Z Z Z |hn,m | = hn,m ≤ g < ∞
¨ KAPITEL 8. KONVERGENZSATZE
168
zeigt der Satz 8.4.2 von der monotonen Konvergenz, daß es eine integrierbare Funktion e hn mit hn,m → e hn (f.¨ u.) und hn,m → e hn (i.N.) f¨ ur m → ∞ gibt. Andererseits gilt f¨ ur jedes x ∈ R, daß die Folge (hn,m (x))m∈N monoton steigend und durch g(x) beschr¨ankt ist. Also konvergiert sie (nach Satz 2.1.12) gegen eine Zahl hn (x). Nach Proposition 8.2.5 gilt hn = e hn (f.¨ u.). Nach Proposition 8.3.4 ist hn integrierbar und es gilt Z Z Z |fn | ≤ hn,m ≤ hn . Nun ist aber die Folge (hn )n∈N monoton fallend mit hn ≥ 0 f¨ ur alle n ∈ N. Also zeigt wieder e e Satz 8.4.2, daß es eine integrierbare Funktion h mit hn → h (f.¨ u.) und hn → e h (i.N.) f¨ ur n → ∞ gibt. Jetzt gilt f¨ ur jedes x ∈ R, daß die Folge (hn (x))m∈N monoton fallend und durch 0 beschr¨ankt ist. Also konvergiert sie gegen eine Zahl h(x). Wieder mit Proposition 8.2.5 findet man h = e h (f.¨ u.) und mit Proposition 8.3.4 die Integrierbarkeit von h sowie hn → h (i.N.). Wir betrachten zun¨achst den Spezialfall f = 0. In diesem Fall haben wir fn → 0 (f.¨ u.) und das liefert hn → 0 (f.¨ u.): Wenn n¨amlich ² > 0 und limn→∞ fn (x) = 0, so gibt es ein n0 ∈ N mit ∀n > n0 : |fn (x)| < ², also ∀n > n0 , m > 0 :
0 ≤ hn,m (x) < ²
und ∀n > n0 :
0 ≤ hn (x) < ².
Aber dann gilt h = 0 (f.¨ u.), d.h. hn → 0 (f.¨ u.). Mit Proposition 8.3.4 finden wir hn → 0 (i.N.) und damit Z Z Z 0 ≤ |fn | ≤ hn → 0 = |f |, d.h.,
R
|fn − f | −→ 0. n→∞
Im allgemeinen Fall betrachten wir eine beliebige Teilfolge (fpn )n∈N von (fn )n∈N und setzen gn := fpn+1 − fpn . Dann gilt gn → 0 (f.¨ u.) und wegen |gn | ≤ 2g erf¨ ullt die Folge (gn )n∈N die Voraussetzungen des Spezialfalls. Also finden wir gn → 0 (i.N.). Das bedeutet aber gerade, daß wir erst die Bemerkung 8.4.1 und dann den Satz 8.3.8(i) auf (fn )n∈N anwenden k¨onnen. Als Ergebnis finden wir eine integrierbare Funktion fe mit fn → fe (i.N.). Andererseits zeigt Satz 8.3.8(ii) die Existenz einer Teilfolge (fqn )n∈N mit fqn → fe (f.¨ u.). Wegen fn → f (f.¨ u.) gilt also f = fe (f.¨ u.) und schließlich mit Proposition 8.3.4 fn → f (i.N.).
Betrachte die Menge der lokal integrierbaren Funktionen: Eine Funktion f : R → C heißt lokal integrierbar, wenn f¨ ur jedes h ∈ N die Funktion f χ[−h,h] integrierbar ist.
-h
h
¨ 8.4. DIE FUNDAMENTALEN KONVERGENZSATZE
169
¨ Die Menge der lokal integrierbaren Funktionen wird mit L1loc (R) bezeichnet und es ist eine leichte Ubung, 1 nachzuweisen, daß Lloc (R) ein Vektorraum ist. Proposition 8.4.4 : Seien f und g (lokal) integrierbare Funktionen auf R. Wenn g beschr¨ ankt ist, dann ist auch f g (lokal) integrierbar. Insbesondere ist jede integrierbare Funktion lokal integrierbar. Beweis: Idee: Seien (fn )n∈N und (gn )n∈N approximierende Folgen von Stufenfunktionen f¨ur f und g. Schneide die Folge fn gn oben mit M |f | und unten mit −M |f | ab, wobei M > 0 eine obere Schranke von |g| ist.
Indem wir die Funktionen, wenn n¨otig, mit der charakteristischen Funktion eines kompakten Intervalls multiplizieren, k¨onnen wir o.B.d.A. annehmen, daß f und g integrierbar sind. Sei M > 0 eine obere Schranke von |g|. Nach Proposition 8.2.8 existieren Folgen (fn )n∈N und (gn )n∈N von Stufenfunktionen mit fn → f (f.¨ u.) und gn → g (f.¨ u.). Dann ist (fn gn )n∈N eine Folge von Stufenfunktionen mit fn gn → f g (f.¨ u.). Betrachte die (nach Satz 8.1.1) integrierbaren Funktionen hn := max(−M |f |, min(fn gn , M |f |)). Wenn limn→∞ fn (x) = f (x) und limn→∞ gn (x) = g(x), dann gilt −M |f (x)| ≤ lim (fn (x)gn (x)) ≤ M |f (x)|, n→∞
also lim hn (x) = lim (fn (x)gn (x)) = f (x)g(x),
n→∞
n→∞
d.h. hn → f g (f.¨ u.).
M|f| fngn
-M|f|
Wegen |hn | ≤ M |f |, k¨onnen wir den Satz 8.4.3 von der dominierten Konvergenz anwenden, der dann die Behauptung beweist.
Sei A ⊆ R eine beliebige Teilmenge. Wir betrachten die Menge F(A, C) als Teilmenge von F(R, C) indem wir f : A → C mit der Funktion fe: R → C identifizieren, die durch ½ f (x) x ∈ A e f (x) = 0 sonst definiert ist. Wir sagen dann f : A → C ist integrierbar, wenn die Funktion fe (in Zukunft schreiben wir R f statt fe) integrierbar ist und bezeichnen ihr Integral mit A f . Der Satz 8.4.3 von der dominierten Konvergenz l¨aßt sich auf die Frage nach der Integrierbarkeit stetiger Funktionen anwenden: Proposition 8.4.5 : Sei I ⊆ R ein beschr¨ anktes Intervall. Dann ist jede stetige und beschr¨ ankte Funktion f : I → R integrierbar.
¨ KAPITEL 8. KONVERGENZSATZE
170 Beweis:
Idee: Approximiere f durch Stufenfunktionen mit konstanten Stufenl¨angen. Seien a < b die Intervallgrenzen von I. Definiere f¨ ur jedes n ∈ N eine Funktion fn : R → R durch 0 x
a
b
Da nach Voraussetzung mit f auch alle fn durch ein und dieselbe Konstante beschr¨ankt sind und die konstanten Funktionen auf [a, b] integrierbar, gen¨ ugt es nach dem Satz 8.4.3 von der dominierten Konvergenz zu zeigen, daß fn → f (f.¨ u.). Sei also x0 ∈]a, b[. Wenn die Folge (fn (x0 ))n∈N nicht gegen f (x0 ) konvergiert, dann finden wir ein ² > 0 und eine Teilfolge (fpn (x0 ))n∈N mit ∀n ∈ N : |fpn (x0 ) − f (x0 )| > ². Da f stetig ist, gibt es ein δ > 0 mit ∀x ∈]x0 − δ, x0 + δ[ :
|f (x) − f (x0 )| < ².
Nun finden wir aber k, m ∈ N mit £ £ b−a x0 ∈ a + k 2b−a ⊆ ]x0 − δ, x0 + δ[ pm , a + (k + 1) 2pm so, daß und
¡ ¢ fpm (x0 ) = f a + k 2b−a pm ¯ ¡ ¯ ¢ ¯ ¯ |fpm (x0 ) − f (x0 )| = ¯f a + k 2b−a − f (x0 )¯ < ². pm
Dieser Widerspruch beweist die Behauptung.
Beachte, daß die Voraussetzung f : I → C beschr¨ ankt in Proposition 8.4.5 wegen Satz 2.3.6 u ¨berfl¨ ussig wird, wenn I kompakt ist. Satz 8.4.6 : Sei (fn )n∈N eine gleichm¨ aßig konvergente Folge von stetigen (reell- oder komplexwertigen) Funktionen auf einem kompakten Intervall I und f die Grenzfunktion. Dann gilt Z Z f = lim fn . I
Beweis:
n→∞
I
¨ 8.4. DIE FUNDAMENTALEN KONVERGENZSATZE
171
Die Grenzfunktion f ist stetig nach Satz 5.1.4 und ist daher nach Satz 2.3.7 auf I beschr¨ankt. Wegen der gleichm¨aßigen Konvergenz gibt es dann eine Konstante, die alle |fn | beschr¨ankt, so daß der Satz 8.4.3 von der dominierten Konvergenz die Behauptung zeigt.
¨ Ubung 8.4.1 : Eine Menge A ⊆ R, deren charakteristische Funktion χA : R → R lokal integrierbar ist, heißt Lebesgue-meßbar. Sei M die Menge der meßbaren Teilmengen von R. Wenn A meßbar ist, dann definieren wir das Lebesgue–Maß µ(A) von A durch ½ R χA falls χA ∈ L1 (R, R) µ(A) = ∞ sonst Zeige die folgenden Aussagen: (i) ∅, R, jedes Intervall in R und jede abz¨ ahlbare Teilmenge von R sind Lebesgue-meßbar. (ii) F¨ ur alle A, B ∈ M gilt A ∩ B ∈ M, A ∪ B ∈ M und R \ A ∈ M. (iii) Wenn A, B ∈ M und A ⊆ B, dann gilt µ(A) ≤ µ(B). (iv) Wenn A ∈ M und µ(A) = 0 sowie B ⊆ A, dann gilt Wenn B ∈ M und µ(B) = 0. (iv) Wenn A, B ∈ M und A ∩ B = ∅, dann gilt µ(A ∪ B) = µ(A) + µ(B) (mit a + ∞ = ∞ = ∞ + ∞).
¨ Ubung 8.4.2 : Zeige die folgenden Aussagen: (i) Jede abz¨ ahlbare Vereinigung von Lebesgue-meßbaren Mengen ist Lebesgue-meßbar. (ii) Jeder abz¨ ahlbare Durchschnitt von Lebesgue-meßbaren Mengen ist Lebesgue-meßbar. S∞ P∞ k=1 µ(Aj ) = µ( k=1 Ak ).
(iii) Wenn Aj ∈ M f¨ ur j ∈ N und Ai ∩ Aj = ∅ f¨ ur i 6= j, dann gilt
¨ Ubung 8.4.3 : Sei f : R → R eine integrierbare Funktion. Setze fh (x) := f (x + h). Zeige, daß
R
fh =
R
f.
¨ Ubung 8.4.4 : (i) Sei [a, b] ein beschr¨ anktes Intervall, und sei (fn )n∈N eine Folge integrierbarer Funktionen mit fn (x) = 0 f¨ ur alle n ∈ N und alle x 6∈ [a, b]. Zeige: Konvergiert fn gleichm¨ aßig gegen die Nullfunktion, so gilt fn → 0 in Norm. (ii) Finde ein Beispiel einer Folge (fn )n∈N von integrierbaren Funktionen fn : [0, 1] → R derart, daß (a) fn → 0 in Norm, (b) (fn (x))n∈N ist f¨ ur jedes x ∈ [0, 1] divergent.
¨ Ubung 8.4.5 : Zeige, daß eine abz¨ ahlbare Vereinigung von Nullmengen eine Nullmenge ist. ¨ Ubung 8.4.6 : (i) Finde ein Beispiel einer Funktionenfolge (fn )n∈N , das zeigt, daß die Voraussetzung der Monotonie im Satz u ¨ber die monotone Konvergenz nicht weggelassen werden kann. R (ii) Finde ein Beispiel einer Funktionenfolge (fn )n∈N , das zeigt, daß die Voraussetzung |fn | ≤ M im Satz u ¨ber die monotone Konvergenz nicht weggelassen werden kann.
¨ Ubung 8.4.7 : Wahr oder falsch? Ist (fn )n∈N eine Folge integrierbarer Funktionen, die gleichm¨ aßig gegen die Nullfunktion konvergiert, so gilt fn → 0 in Norm. ¨ Ubung 8.4.8 :
¨ KAPITEL 8. KONVERGENZSATZE
172
(i) Sei f eine Nullfunktion und |g| ≤ f . Zeige, daß dann auch g eine Nullfunktion ist. (ii) Sei f eine beliebige Funktion, und sei g eine Nullfunktion. Zeige, daß das Produkt f g eine Nullfunktion ist.
¨ Ubung 8.4.9 : Finde ein Beispiel einer Funktionenfolge (fn )n∈N , das zeigt, daß die Voraussetzung |fn | ≤ g im Satz u ¨ber die dominierte Konvergenz nicht weggelassen werden kann. ¨ Ubung 8.4.10 : Finde ein Beispiel einer unbeschr¨ ankten stetigen Funktion, die integrierbar ist. ¨ Ubung 8.4.11 : (fn )n∈N und (gn )n∈N seien Folgen integrierbarer Funktionen und f sei integrierbar mit fn → f sowie gn → f in Norm. Zeige: Z ¡ ¢ ∀² > 0 ∃n0 ∈ N : n, m > n0 ⇒ |fn − gm | < ² .
¨ Ubung 8.4.12 : F¨ ur a, b ∈ R definiere χa,b : R → R durch
χa,b
χ[a,b[ = 0 −χ[a,b[
aa.
(i) Zeige, daß χa,b + χb,c = χa,c f¨ ur alle a, b, c ∈ R . (ii) Sei f : R → R derart, daß χ[a,b[ · f integrierbar ist f¨ ur alle a < b . Zeige, daß die Funktion F :R
→
x
7→
R Z χ0,x · f
stetig ist. Hinweis: Satz 8.4.3 von Lebesgue u ¨ber dominierte Konvergenz. (iii) Zeige: Wenn f in y ∈ R stetig ist, so ist F in y differenzierbar mit Ableitung F 0 (y) = f (y) . Hinweis: Sch¨ atze den Differentialquotienten mit Hilfe der Stetigkeit von f geeignet ab.
¨ Ubung 8.4.13 : Zeige, daß die folgenden Integrale existieren und den angegebenen Wert haben. (i)
Z
³
1
log 0
∞ X 1 ´ dx 1 ³ π2 ´ = = . 2 1−x x k 6 k=1
Hinweis: Entwickle den Integranden in eine Reihe und wende den Satz u ¨ber die monotone Konvergenz an. (ii)
Z
1
log(1 + x) 0
∞ X (−1)k−1 ³ π2 ´ dx = = . x k2 12 k=1
Hinweis: Entwickle den Integranden in eine Reihe und benutze (i), um eine passende Majorante zur Anwendung des Lebesgueschen Satzes u ¨ber die dominierte Konvergenz zu finden.
¨ ur x ≥ 1 durch Ubung 8.4.14 : Auf ] − ∞, 1[ seien f und g durch 0 definiert, f¨ f (x) =
∞ X (−1)k−1 · χ[k,k+1[ (x) k
k=1
(i) Zeige, daß f nicht integrierbar ist.
und
g(x) = |f (x)| −
1 ³ 1 1´ = − . x bxc x
¨ 8.4. DIE FUNDAMENTALEN KONVERGENZSATZE (ii) Definiere gn durch gn (x) =
n X 1 1 · χ[k,k+1[ (x) − · χ[1,n+1[ (x) k x
173
f¨ ur alle x ≥ 1
k=1
und gn (x) = 0 sonst. Zeige, daß (gn ) eine monotone wachsende Folge integrierbarer Funktionen mit g = supn gn ist. Hinweis: Dr¨ ucke gn durch g aus. (iii) Zeige, daß
Z gn =
n X 1 − log(n + 1) . k
k=1
(iv) Zeige, daß γ := supn∈N
n ´ ³X 1 − log(n + 1) < ∞ k k=1
(γ heißt Euler-Mascheronische Konstante.) R k+1 dx Hinweis: Benutze k = log(k + 1) − log k . Zeige x Z
k+1 k
³1 k
−
(v) Folgere mit Hilfe von (ii), daß g integrierbar ist mit
1´ 1 dx ≤ 2 . x 2k R
g =γ.
¨ Ubung 8.4.15 : Sei s ≥ 0 . Zeige: f (x) = χ[1,∞[ (x) · x−s ist genau dann integrierbar, wenn s > 1 ; in diesem Fall gilt Z ∞ dx 1 = . xs s−1 1 Hinweis: Man betrachte fn (x) = χ[1,∞[ (x) · x−s und unterscheide, ob s = 1 oder nicht. ¨ Ubung 8.4.16 : Seien a < b und f : [1, ∞[→ [0, ∞[ monoton fallend und lokal integrierbar. (Man kann zeigen, dass aus der Monotonie die lokale Integrierbarkeit folgt.) P (i) Zeige das folgende Reihe-Integral-Vergleichskriterium: Genau dann ist f integrierbar, wenn ∞ k=1 f (k) konvergiert. Hinweis: Satz u ¨ber die monotone Konvergenz. P −s genau dann konvergiert, wenn s > 1 . (ii) Sei s ≥ 0 . Zeige mit Hilfe von (i), daß ζ(s) = ∞ n=1 n
174
¨ KAPITEL 8. KONVERGENZSATZE
Kapitel 9
Verbindung zwischen Integral- und Differentialrechnung In diesem Kapitel behandeln wir einige Anwendungen der Integrationstheorie. Als erstes stellen wir den in Kapitel 6 angesprochenen Zusammenhang zwischen Integration und Stammfunktionen her. Danach ben¨ utzen wir iterierte Integrale, um hinreichend oft differenzierbare Funktionen durch Polynome zu approximieren. In einem weiteren Abschnitt geben wir einen kurzen Ausblick auf die Theorie der Fourier– Reihen. Zum Abschluß behandeln wir die Integrierbarkeit von Potenzfunktionen und f¨ uhren die Eulersche Gamma–Funktion ein.
9.1
Der Hauptsatz der Differential- und Integralrechnung
Sei A ⊆ B ⊆ R und g : B → R eine Funktion. Dann nennen wir g integrierbar u ¨ ber A, wennR die Einschr a nkung g| : A → R, x → 7 g(x) von g auf A integrierbar ist. In diesem Fall schreiben wir A g ¨ A R f¨ ur A g|A . Seien A, B ⊆ C ⊆ R mit A∩B = ∅ und g : C → R. Wenn g sowohl u ¨ber A als auch u ¨ber B integrierbar ist, dann ist gχA∪B = gχA + gχB u ¨ber A ∪ B integrierbar, d.h. g ist u ¨ber A ∪ B integrierbar, und es gilt Z Z Z g= g+ g. A∪B
A
A
B
B
Wenn D ⊆ A eine Nullmenge ist und g ∈ F(R, R), dann ist nach Proposition 8.2.2 die Funktion gχD eine Nullfunktion, weil sie außerhalb der Nullmenge D verschwindet. Bemerkung 9.1.1 : Sei I ein Intervall mit den Endpunkten a < b (auch a = −∞ und b = ∞ sind zugelassen und f : R → R integrierbar (wenn I beschr¨ankt ist, reicht lokal integrierbar). Dann ist nach Proposition 8.4.4 f integrierbar u ¨ber I und es gilt Z b Z Z Z Z f := f= f= f= f. a
[a,b]
[a,b[
175
]a,b]
]a,b[
176
KAPITEL 9. VERBINDUNG ZWISCHEN INTEGRAL- UND DIFFERENTIALRECHNUNG
Wenn a < c < b, dann ist wieder mit Proposition 8.4.4 f auch u ¨ber ]a, c[ und ]c, b[ integrierbar und es gilt Z b Z c Z b f= f+ f. a
a
Offensichtlich gilt
Z
c
c
f =0 c
und
Z
Z
b
b
λf = λ a
f a
f¨ ur λ ∈ R. Als zus¨ atzliche Konvention f¨ uhren wir die Schreibweise Z b Z a f := − f. b
a
ein.
Satz 9.1.2 : Sei I ⊆ R Rein Intervall, f : I → R integrierbar u ¨ber jedes kompakte Teilintervall von I, x c ∈ I und F : I → R, x 7→ c f . Dann gilt (i) Wenn f in x0 ∈ I rechts-stetig ist, dann gilt F (x0 + h) − F (x0 ) = lim f (x0 + h) = f (x0 ). h→0+ h→0+ h lim
(ii) Wenn f in x0 ∈ I links-stetig ist, dann gilt lim
h→0−
F (x0 + h) − F (x0 ) = lim f (x0 + h) = f (x0 ). h→0− h
Insbesondere, wenn I offen ist und f : I → R stetig, dann ist F differenzierbar mit F 0 = f . Beweis: Idee: Sch¨atze
R x0 +h x0
f ab.
Es reicht (i) zu zeigen, (ii) geht v¨ollig analog. Nach Definition gilt F (x0 + h) − F (x0 ) = h
R x0 +h c
f− h
R x0 c
f
=
1 h
Z
x0 +h
f. x0
Nach Voraussetzung gibt es zu jedem ² > 0 ein δ > 0 mit ∀t ∈ ]x0 , x0 + δ[ :
f (x0 ) − ² < f (t) < f (x0 ) + ².
ε f
ε
x0
x0 + h
9.1. DER HAUPTSATZ DER DIFFERENTIAL- UND INTEGRALRECHNUNG
177
Aber dann folgt f¨ ur 0 ≤ h < δ Z
x0 +h
h(f (x0 ) − ²) ≤
f ≤ h(f (x0 ) + ²). x0
Mit obiger Identit¨at erhalten wir f¨ ur 0 ≤ h < δ F (x0 + h) − F (x0 ) ≤ f (x0 ) + ². h
f (x0 ) − ² ≤ Da ² > 0 beliebig war, folgt lim
h→0+
F (x0 + h) − F (x0 ) = f (x0 ). h
Korollar 9.1.3 : Jede stetige Funktion auf einem offenen Intervall hat eine Stammfunktion. Beweis: Da stetige Funktionen auf kompakten Intervallen nach Proposition 8.4.5 integrierbar sind, k¨onnen wir Satz 9.1.2 anwenden.
Satz 9.1.4 (Hauptsatz der Differential- und Integralrechnung): Sei I ein offenes Intervall sowie f : I → R stetig. Seien a, b ∈ I und F : I → R eine Stammfunktion von f . Dann ist f u ¨ber [a, b] integrierbar und es gilt Z
b
f = F (b) − F (a). a
Beweis: Idee: Kombiniere Proposition 8.4.5 und Satz 9.1.2. Sei a0 < a, b < b0 mit [a0 , b0 ] ⊆ I. Dann ist nach Proposition 8.4.5 f u ¨ber [a0 , b0 ] integrierbar. 0 0 Nach Satz 9.1.2 ist f¨ ur c ∈ ]a , b [ die Funktion Z x G : ]a0 , b0 [→ R, x 7→ f c
eine Stammfunktion von f . Es gibt also (vgl. Beispiel 3.1.1 und Korollar 3.3.2) ein K ∈ R mit F (x) = G(x) + K f¨ ur alle x ∈]a0 , b0 [. Damit liefert Bemerkung 9.1.1 Z
Z
b
f= a
Z
c
f+ a
b
f = −G(a) + G(b) = F (b) − F (a). c
178
KAPITEL 9. VERBINDUNG ZWISCHEN INTEGRAL- UND DIFFERENTIALRECHNUNG
Wenn man kennzeichnen will, von welcher Variablen eine zu integrierende Funktion abh¨angt, schreibt man Z Z f (t)dt oder f (x)dx etc. statt
R
ur sich genommen keine Bedeutung. f . Das dt“ hat hier f¨ ”
Der Hauptsatz 9.1.4 wird oft wie folgt geschrieben: Z x F 0 (t)dt = F (x) − F (a). a
Beachte, daß wir hiermit die Bezeichnung integrierbar sind, gerechtfertigt haben.
Rx a
f (t)dt aus Gleichung (9.1) f¨ ur Funktionen, die stetig und
Das nachfolgende Beispiel zeigt, daß nicht jede Ableitung einer differenzierbaren Funktion integrierbar Rx ist, d.h., es ist nicht m¨oglich, jede Stammfunktion a f (t)dt im Sinne von Gleichung (9.1) als Integral zu interpretieren. Beispiel 9.1.5 : Betrachte die Funktion F : ] − 1, 1[→ R, die durch ½ 2 ur x 6= 0 x sin x12 f¨ F (x) = 0 f¨ ur x = 0 gegeben ist. 0.2
0.1
-1
-0.5
0.5
1
-0.1
-0.2
Dann rechnet man leicht nach, daß F differenzierbar ist mit ½ 2x sin( x12 ) − x2 cos( x12 ) f¨ ur x 6= 0, F 0 (x) = 0 f¨ ur x = 0. 30 20 10 -1
-0.5
0.5
1
-10 -20 -30
Wir wollen zeigen, daß F 0 nicht integrierbar ist. Setze dazu xk := √ F (xk ) =
(−1)k (k + 12 )π
1 (k+ 12 )π
∈]0, 1[ f¨ ur k ∈ N. Dann gilt
9.1. DER HAUPTSATZ DER DIFFERENTIAL- UND INTEGRALRECHNUNG und |F (xk ) − F (xk+1 )| =
179
2 k+1 2 1 ≥ . π (k + 12 )(k + 32 ) πk+2
Insbesondere sehen wir durch Vergleich mit der harmonischen Reihe, daß die Reihe ∞ X
|F (xk ) − F (xk+1 )|
k=1
nicht konvergiert. Da F 0 auf ]0, 1[ stetig ist und damit integrierbar u ¨ber jedes kompakte Teilintervall (vgl. Proposition 8.4.5) von ]0, 1[, zeigt Satz 9.1.4, daß Z xk F (xk ) − F (xk+1 ) = F 0. xk+1
W¨are jetzt F 0 integrierbar, so h¨atte man ¯ ¯ Z x1 Z n n ¯Z x k n Z xk ¯ X X X ¯ 0¯ |F (xk ) − F (xk+1 )| = F ¯≤ |F 0 | ≤ |F 0 | ≤ |F 0 | < ∞ ¯ ¯ xk+1 ¯ xk+1 xn+1 k=1
k=1
k=1
im Widerspruch zur Divergenz der Reihe. √ Beispiel 9.1.6 : F¨ ur r > 0 betrachte die Funktion f : [−r, r] → r2 − x2 , deren Graph gerade der obere Halbkreis um (0, 0) ∈ R × R mit Radius r ist (wir nehmen das hier als Definition des Kreises; wenn man den Satz des Pythagoras zur Verf¨ ugung hat, findetR man, daß diese Definition mit der geometrischen r Definition u ¨bereinstimmt). Damit interpretiert man 2 −r f als Fl¨ache eines Kreises mit Radius r. Mit partieller Integration findet man die Stammfunktion √ F (x) = 12 (x r2 − x2 + r2 arcsin xr ) √ von r2 − x2 . F 0.75 0.5 f 1
0.25 -1
-0.5
0.5
0.8
1
0.6
-0.25
0.4 -0.5
0.2
-0.75
Also erh¨alt man
Z
r
p
-1
r2 − x2 dx = F (r) − F (−r) =
−r
-0.5
0.5
1
r2 ³ π π ´ πr2 + = 2 2 2 2
und f¨ ur die Fl¨ache des Kreises mit Radius r ergibt sich r2 π. Das bedeutet, unsere analytische Definition der Zahl π stimmt mit der u ¨blichen geometrischen Definition u ¨berein.
¨ Ubung 9.1.1 : Sei I ein offenes Intervall und F : I → R differenzierbar mit F 0 : I → R beschr¨ ankt. Zeige: F 0 ist lokal integrierbar und es gilt Z b F (b) − F (a) = F 0 f¨ ur alle a, b ∈ I. a
Anleitung: Setze fn (x) := n(F (x + 1/n) − F (x)) und benutze den Satz von der dominierten Konvergenz. Benutze zum Nachweis der Existenz einer integrierbaren Majorante den Mittelwertsatz der Differentialrechnung. Rb ¨ Ubung 9.1.2 : Sei f : [a, b] → R stetig. Definiere g : [a, b] → R durch g(x) := x f . Zeige, daß g differenzierbar ist und bestimme die Ableitung von g.
180
KAPITEL 9. VERBINDUNG ZWISCHEN INTEGRAL- UND DIFFERENTIALRECHNUNG
¨ Ubung 9.1.3 : Zeige, daß die Folge (an )n∈N mit Z an :=
∞
e−
1+2nx+3x2 4n+5
dx
0
konvergiert und berechne den Grenzwert.
Differenzierbarkeitssatz von Lebesgue: Sei f : R × R → R eine Funktion, so daß (a) ay ∈ R die Funktion f (·, y) : R → R : x 7→ f (x, y) differenzierbar ist und (b) es eine lokal integrierbare Funktion g : R → R+ gibt, so daß ¯ ¯ d ¯ ¯ ur fast alle y ∈ [a, b] . ¯ f (x, y)¯ ≤ g(y) f¨ dx Rb R Dann ist die Funktion h(x) = a f (x, y) dy = χa,b · f (x, ·) differenzierbar mit Ableitung Z b d h0 (x) = f (x, y) dy . a dx ¨ Ubung 9.1.4 : (i) Sei
³Z
´2 Z 1 e−t2 (x2 +1) 2 e−x dx + dx f¨ ur alle t ∈ R . x2 + 1 0 0 R Rb Zeige, daß g konstant ist. Dabei ist a f (x) dx definiert als χa,b · f . Hinweis: Wende den obigen Satz an. (ii) Folgere aus (i), daß √ Z ∞ 2 π e−x dx = . 2 0 Hinweis: Berechne einen Wert und einen Grenzwert von g . t
g(t) =
¨ Ubung 9.1.5 : Sei I ⊂ R ein offenes Intervall und F : I → R differenzierbar mit beschr¨ ankter Ableitung F 0 : I → R . Zeige: F 0 ist lokal integrierbar und es gilt Z b Z b F 0 (x) dx = F 0 = F (b) − F (a) f¨ ur alle a, b ∈ I , a < b . a
Hinweis: Definiere
a
¡ fn (x) = n · F (x +
1 ) n
¢ − F (x)
f¨ ur alle n ∈ N \ 0 , x, x +
1 n
∈I .
Wende den Satz von Lebesgue u ¨ber die dominierte Konvergenz an. Um eine Majorante zu finden, wende den Mittelwertsatz der Differentialrechnung an. ¨ Ubung 9.1.6 : Sei f : [a, b] → R monoton fallend. P ankt, wobei A (i) Sei R eine Menge und % : R → [0, ∞[ eine Funktion. Es sei die Menge der r∈A %(r) beschr¨ alle endlichen Teilmengen von R durchl¨ auft. Zeige: {r ∈ R | %(r) > 0} ist h¨ ochstens abz¨ ahlbar. Hinweis: Zeige, daß {r ∈ R | %(r) ≥ f rac1k} f¨ ur alle k ∈ N \ {0} endlich ist. (ii) Zeige, dass f h¨ ochstens abz¨ ahlbar viele Unstetigkeitsstellen hat. Hinweis: Sei Df die Menge der Unstetigkeitsstellen und δf (x) = lim f (x − h) − f (x + h) P
h→0+
f¨ ur alle x ∈ [a, b] .
Zeige, daß x∈A δf (x) beschr¨ ankt ist, wobei A alle endlichen Teilmengen von Df durchl¨ auft. (iii) Zeige, dass f lokal integrierbar ist. Anleitung: (a) (b) (c) (d)
Zerlege [a, b] f¨ ur n ∈ N in n gleich lange Teilintervalle. Definiere geeignete Stufenfunktionen 0 ≤ fn ≤ f . Zeige, dass fn an den Stetigkeitsstellen von f gegen f konvergiert. Wende den Satz u ¨ber die monotone Konvergenz an.
9.2. DIE TAYLORENTWICKLUNG
9.2
181
Die Taylorentwicklung
Wenn eine Funktion f auf dem Intervall ] − r, r[ durch die Potenzreihe ∞ X
ak xk
k=0
dargestellt werden kann, dann ist f differenzierbar und ihre Ableitung f 0 ist auf demselben Intervall durch die Potenzreihe ∞ X kak xk−1 k=1
darstellbar. Wir k¨onnen wir den Prozeß iterieren und finden mit Induktion, daß f (n) , die durch f (0) := f und f (k+1) := (f (k) )0 induktiv definierte n-te Ableitung, durch die Potenzreihe ∞ X
k(k − 1) · · · (k − n + 1)ak xk−n
k=n
dargestellt wird. Damit findet man insbesondere, daß (∀n ∈ N0 ) also f (x) =
an =
f (n) (0) , n!
∞ X f (k) (0) k=0
k!
xk .
Die Taylorentwicklung sagt, daß dieses Ph¨ anomen in gr¨oßerer Allgemeinheit auftritt. F¨ ur n ∈ N nennen wir induktiv eine differenzierbare Funktion f : I → R auf einem offenen Intervall n-mal stetig differenzierbar, wenn f 0 : I → R stetig ist und (falls n > 1) n−1-mal stetig differenzierbar. Wir setzen dann wie zuvor f (0) := f und f (k+1) := (f (k) )0 f¨ ur k = 0, . . . , n − 1 und nennen f (k) die k-te ¨ Ableitungg von f . Ublicherweise verwendet man f¨ ur kleine k’s die Notation f 0 = f (1) , f 00 = f (2) , f 000 = f (3) . Man strebt eine Formel der Bauart f (x) = f (0) +
f 00 (0) 2 f (n−1) (0) n−1 f 0 (0) x+ x + ... + x + Rn (x) 1! 2! (n − 1)!
an. So eine Formel nennt man dann Taylor–Formel oder auch Taylor–Entwicklung. Das Polynom Pn−1 (x) := f (0) +
f 0 (0) f 00 (0) 2 f (n−1) (0) n−1 x+ x + ... + x 1! 2! (n − 1)!
heißt dabei das (n − 1)-te Taylor–Polynom und die Funktion Rn das n-te Taylor–Restglied. F¨ ur sich genommen ist die Taylor-Formel v¨ollig wertlos: wir h¨atten schließlich die Funktion Rn auch einfach durch Pn−1 f (k) k onnen. Interessant wird die Taylor-Formel, weil wir die Differenz von f und k=0 k! x definieren k¨ zeigen k¨onnen, daß Rn f¨ ur kleine x klein wird und somit f¨ ur solche x die Funktion f durch ein Polynom approximiert wird. Lemma 9.2.1 : Sei I ⊆ R ein Intervall, f : I → R integrierbar und c ∈ I. Dann ist die durch Z x F (x) = f c
definierte Funktion F : I → R stetig. Es existieren auch die einseitigen Limiten an den Intervallgrenzen, selbst wenn diese nicht zum Intervall geh¨ oren.
182
KAPITEL 9. VERBINDUNG ZWISCHEN INTEGRAL- UND DIFFERENTIALRECHNUNG
c
x
Beweis: Idee: Wende den Satz 8.4.3 von der dominierten Konvergenz auf Folgen der Form f χ[xn ,x] an und schließe F (xn ) → F (x).
Halte x ∈ I fest und betrachte eine beliebige Folge (xn )n∈N in I mit limn→∞ xn = x. Sei Jn das von x und xn begrenzte abgeschlossene Intervall (evtl. mit nur einem Punkt, wenn xn = x). Nach Proposition 8.4.4 ist f χJn integrierbar und mit Satz 8.4.3 gilt Z Z f = f χJn → 0 Jn
weil f χJn → 0 (f.¨ u.). Es gilt aber ½ R F (xn ) − F (x) =
−
RJn f f Jn
falls x ≤ xn falls x > xn ,
also |F (xn ) − F (x)| → 0
f¨ ur n → ∞.
W¨are F in x nicht stetig, dann g¨abe es ein ² so, daß zu jedem n ∈ N ein xn ∈]x − n1 , x + n1 [∩I existierte mit |F (xn ) − F (x)| ≥ ². ¨ Die Folge (xn )n∈N liefert dann aber einen Widerspruch zu obigen Uberlegungen. Dies zeigt die Stetigkeit von F auf I. Wenn a ∈ R ein ¨ber I ∪ {a} integrierbar und man R a Endpunkt des Intervalls I ist, ist f auch u setzt F (a) = c f . Dann kann man das Argument von oben wiederholen.
Sei a < 0 < b und f : ]a, b[→ R n-mal stetig differenzierbar. Nach Lemma 9.2.1 und Proposition 8.4.5 k¨onnen wir induktiv stetige Funktionen Fk,n,f : [a, b] → R f¨ ur k = 1, . . . , n durch Z
x
F1,n,f (x) := Z
0
f (n) ,
x
F2,n,f (x) :=
F1,n,f , 0
.. .
Z
x
Fn,n,f (x) :=
Fn−1,n,f 0
definieren. Dann setzen wir Rn := Fn,n,f .
9.2. DIE TAYLORENTWICKLUNG
183
Satz 9.2.2 : Sei a < 0 < b und f : ]a, b[→ R n-mal stetig differenzierbar. F¨ ur jedes x ∈]a, b[ gilt f (x) = f (0) +
f 0 (0) f 00 (0) 2 f (n−1) (0) n−1 x+ x + ... + x + Rn (x). 1! 2! (n − 1)!
Beweis: Idee: Wende den Hauptsatz 9.1.4 der Differential- und Integralrechnung auf die (n−1)-te Ableitung von f an und argumentiere mit Induktion. Wir f¨ uhren den Beweis durch Induktion u ¨ber n. Mit Satz 9.1.4 gilt Z x (n−1) (n−1) f f (n) = f (n−1) (0) + F1,n (x), (x) = f (0) + 0
was den Fall n = 1 beweist. Wir nehmen jetzt an, der Satz w¨are f¨ ur n − 1 bewiesen und wenden diesen Fall auf f 0 an. Wegen Fk,n−1,f 0 = Fk,n,f finden wir f 00 (0) f 000 (0) 2 f (n−1) (0) n−2 t+ t + ... + t + Fn−1,n,f (t) 1! 2! (n − 2)! Rx f¨ ur alle t ∈]a, b[. Durch die Integration 0 finden wir f 0 (t) = f 0 (0) +
f (x) − f (0) =
f 0 (0) f 00 (0) 2 f (n−1) (0) n−1 x+ x + ... + x + Rn (x). 1! 2! (n − 1)!
Proposition 9.2.3 : Sei a ≤ 0 ≤ b (a < b in R) und f : [a, b] → R integrierbar. Definiere die stetigen Funktionen Fk : [a, b] → R f¨ ur k = 1, . . . , n durch Z x Z x Z x F1 (x) := f, F2 (x) := F1 , . . . , Fn (x) := Fn−1 . 0
0
Dann gilt Fn (x) =
1 (n − 1)!
0
Z
x
(x − t)n−1 f (t)dt.
0
Beweis: Idee: Zeige mithilfe des Differenzenquotienten Rund das Mittelwertsatzes 3.3.1, daß G(x) =
t)m f (t)dt eine Stammfunktion von x 7→
1 (m−1)!
x (x 0
− t)m−1 f (t)dt ist.
1 m!
Rx 0
(x−
Wir f¨ uhren den Beweis durch Induktion u ur n = 1 ist die Formel gerade die Definition ¨ber n. F¨ ur m richtig ist, dann ist Fm+1 eine Stammfunktion von von F1 . Wenn die Formel f¨ Z x 1 x 7→ (x − t)m−1 f (t)dt (∗) (m − 1)! 0 mit Fm+1 (0) = 0. Es gen¨ ugt also zu zeigen, daß die Funktion G : [a, b] → R mit Z x 1 G(x) = (x − t)m f (t)dt m! 0 ebenfalls eine Stammfunktion von (∗) mit G(0) = 0 ist. Dazu rechnen wir Z x+h Z x 1 1 G(x + h) − G(x) = (x + h − t)m f (t)dt − (x − t)m f (t)dt h hm! 0 hm! 0 Z x Z x+h 1 1 (x + h − t)m − (x − t)m = f (t)dt + (x − t)m f (t)dt m! 0 h hm! x
184
KAPITEL 9. VERBINDUNG ZWISCHEN INTEGRAL- UND DIFFERENTIALRECHNUNG Da die Ableitung von x 7→ (x − t)m f¨ ur festes t ∈ [a, b] durch m(x − t)m−1 gegeben und [a, b] m m beschr¨ankt ist, gibt es mit dem Mittelwertsatz 3.3.1 ein M > 0 mit (x+h−t) h−(x−t) ≤ M . Aber dann zeigt Satz 8.4.3 von der dominierten Konvergenz, daß Z x 1 (x + h − t)m − (x − t)m lim f (t)dt h→0 m! 0 h ¶ Z xµ (x + h − t)m − (x − t)m 1 lim = f (t) dt m! 0 h→0 h Z x 1 = m(x − t)m−1 f (t)dt m! 0 Z x 1 (x − t)m−1 f (t)dt = (m − 1)! 0 Das zweite Integral in obigem Ausdruck f¨ ur den Differenzenquotienten von G l¨aßt sich f¨ ur t ∈ [x, x + h] wie folgt absch¨atzen: ¯ ¯ ¯ |h|m−1 Z x+h ¯ 1 Z x+h ¯ ¯ m (x − t) f (t)dt¯ ≤ |f (t)|dt, ¯ ¯ ¯ hm! x m! x wobei die rechte Seite der Ungleichung f¨ ur h → 0 gegen Null geht, weil f integrierbar ist. Zusammen finden wir, daß Z x G(x + h) − G(x) 1 lim = (x − t)m−1 f (t)dt, h→0 h (m − 1)! 0 was die Behauptung beweist.
Wendet man die Proposition 9.2.3 auf eine n-te Ableitung f (n) an, so findet man als Fn (x) gerade den Restterm Rn (x) der Taylorformel (vgl. Satz 9.2.2). Korollar 9.2.4 : Sei a < 0 < b und f : ]a, b[→ R n-mal stetig differenzierbar. Wenn x ∈]a, b[ und |f (n) (t)| ≤ M f¨ ur alle t ∈]0, x[, dann gilt |Rn (x)| ≤
M n |x| . n!
Beweis: Nach Proposition 9.2.3 gilt Rn (x) = Wegen
Z
x
1 (n − 1)!
x
(x − t)n−1 f (n) (t)dt.
0
Z n−1
(x − t) 0
Z
dt =
x
tn−1 dt =
0
xn n
folgt die Behauptung sofort aus den Voraussetzungen.
¨ Ubung 9.2.1 : Beweise den Mittelwertsatz der Integralrechnung: Ist f : [a, b] → R stetig und g :]a, b[→ [0, ∞[ integrierbar, so gibt es ein c ∈ [a, b] mit Z Z b f g = f (c) g. a
9.3. FOURIER-REIHEN
185
¨ Ubung 9.2.2 : Seien f, g : [a, b] → R stetige Funktionen mit f (c) = g(c).
Rb a
f =
Rb a
g. Zeige, daß es ein c ∈ [a, b] gibt mit
¨ Ubung 9.2.3 : Sei a < 0 < b und f :]a, b[→ R eine n mal stetig differenzierbare Funktion. Zeige, daß f¨ ur das Restglied Rn der Taylorentwicklung von f gilt: F¨ ur alle x ∈]a, b[ gibt es ein ξx ∈ [0, x] mit Rn (x) =
xn (n) f (ξx ). n!
Man nennt diese Darstellung von Rn die Lagrange–Form des Restglieds. Hinweis: Aufgabe 9.2.1. ¨ Ubung 9.2.4 : Berechne das dritte Taylorpolynom von f : [−1, 1] → R, x 7→ √
1 5−4x2
.
¨ Ubung 9.2.5 : Berechne sin(1) und cos(1) auf zwei Stellen genau, d.h. man ermittle Sch¨ atzwerte α, β derart, daß |α − sin(1)| < 5 · 10−3 und |β − cos(1)| < 5 · 10−3 . Hinweis: Taylorpolynome (um 0) bzw. Taylorrestglieder f¨ ur x = 1 untersuchen. ¨ Ubung 9.2.6 : Die Reihe, deren Partialsummen die Taylorpoynome sind, nennt man Taylorreihe. Entwickle f jeweils in die zugeh¨ orige Taylorreihe und bestimme den Konvergenzradius der Taylorreihe. Wo wird die Funktion f durch ihre Taylorreihe dargestellt? − 12
(i) f : R → R definiert durch f (x) := e −t2
Hinweis: Es ist limt→∞ p(t)e
x
2
= 0 = limt→−∞ p(t)e−t f¨ ur jede Polynomfunktion p.
(ii) f : ] − 1, 1[ → R definiert durch f (x) :=
9.3
f¨ ur x 6= 0 und f (0) := 0. 1 1−x
log
1 . 1−x
Fourier-Reihen
Bisher haben wir immer Polynomfunktionen ben¨ utzt, wenn wir andere Funktionen approximieren wollten. In vielen Anwendungen, insbesondere, wenn sie mit Schwingungsvorg¨angen zu tun haben, weiß man von vorneherein, daß die betrachteten Funktionen periodisch sind, d.h. es gibt ein a ∈ R mit f (x + a) = f (x) f¨ ur alle x ∈ R. Die Musterbeispiele f¨ ur solche Funktionen sind die trigonometrischen Funktionen sin(kx) und cos(kx) mit k ∈ N, die alle die Periode 2π haben. Die Wahl der Periode ist ziemlich unerheblich, da sie durch Ver¨anderung der Maßst¨abe umskaliert werden k¨onnen. Um nicht immer irgendwelche Konstanten mitschleppen zu m¨ ussen, betrachten wir nur Funktionen der Periode 2π. Es stellt sich heraus, daß praktisch alle Funktionen der Periode 2π durch diese Funktionen approximiert werden k¨onnen. Eine Funktion f : R → R der Form f (x) =
n X ¡ ¢ 1 ak cos(kx) + bk sin(kx) a0 + 2 k=1
mit a0 , a1 , . . . , an , b1 , . . . , bn ∈ R heißt ein trigonometrisches Polynom. Man kann Grenzwerte von Folgen trigonometrischer Polynome betrachten und je nach dem, welchen Konvergenzbegriff man verwendet, erh¨alt man mehr oder weniger große Klassen von approximierbaren Funktionen, die aber alle periodisch mit Periode 2π sind. Da die vollst¨andige Information u ¨ber eine Funktion mit Periode 2π schon in ihrer Einschr¨ankung auf ein beliebiges Intervall der L¨ange 2π steckt, betrachten wir im folgenden nur noch Funktionen auf [0, 2π].
186
KAPITEL 9. VERBINDUNG ZWISCHEN INTEGRAL- UND DIFFERENTIALRECHNUNG
2π
6π
4π
Eine Fourier-Reihe ist eine Reihe der Form ∞ X ¡ ¢ 1 a0 + ak cos(kx) + bk sin(kx) 2 k=1
mit aj , bj ∈ R.
¢ P∞ ¡ Satz 9.3.1 : Wenn eine Fourier-Reihe 12 a0 + k=1 ak cos(kx) + bk sin(kx) auf [0, 2π] in Norm gegen eine integrierbare Funktion f : [0, 2π] → R konvergiert, dann gilt Z 1 2π a0 = f (x)dx π 0 Z 1 2π ak = f (x) cos(kx)dx π 0 Z 1 2π bk = f (x) sin(kx)dx π 0 f¨ ur k ∈ N. Beweis:
¡ ¢ ak cos(mx) cos(kx) + bk cos(mx) sin(kx) f¨ ur n → ∞ in Norm gegen f (x) cos(mx) konvergiert. Analog f¨ ur f (x) sin(mx).
Idee: Zeige, daß 12 a0 cos(mx) +
Pn
k=1
Die Norm-Konvergenz zeigt Z 2π Z 2π ∞ Z 2π X ¡ ¢ 1 f (x)dx = a0 + ak cos(kx) + bk sin(kx) dx = πa0 . 2 0 0 0 k=1
Da die Funktion cos mx f¨ ur jedes m ∈ N beschr¨ankt ist, zeigt Proposition 8.4.4, daß x 7→ f (x) cos(mx) integrierbar ist. Außerdem gilt und ¯ Z 2π ¯¯ n ¯ X ¡ ¢ ¯1 ¯ ak cos(mx) cos(kx) + bk cos(mx) sin(kx) − f (x) cos(mx)¯ dx ¯ a0 cos(mx) + ¯ ¯ 2 0 k=1 ¯ ¯ Z 2π ¯ n ¯ X ¡ ¢ ¯1 ¯ ≤ ak cos(kx) + bk sin(kx) − f (x)¯ dx ¯ a0 + ¯ ¯ 2 0 k=1
−→
n→∞
0,
d.h. n X ¡ ¢ 1 a0 cos(mx) + ak cos(mx) cos(kx) + bk cos(mx) sin(kx) → f (x) cos(mx) (i.N.) 2 k=1
Unter Ben¨ utzung der Formeln Z
2π
(cos mx)2 dx
=
π
cos(mx) cos(kx)dx
=
0
f¨ ur k 6= m
cos(mx) sin(kx)dx
=
0
∀m, k ∈ N,
0
Z
2π
0
Z
2π 0
9.3. FOURIER-REIHEN
187
die unmittelbar aus 1 (cos(m + k)x + cos(m − k)x) = cos(mx) cos(kx) 2 und
1 (sin(m + k)x + sin(m − k)x) = sin(mx) cos(kx), 2 d.h. aus der Euler-Formel (vgl. Beispiel 5.2.7) folgen, finden wir wie oben Z 2π f (x) cos(mx)dx = πam 0
und analog
Z
2π
f (x) sin(mx)dx = πbm . 0
Weil die Funktionen sin(mx) und cos(mx) beschr¨ankt und integrierbar sind, k¨onnen wir nach Proposition 8.4.4 jeder u ¨ber [0, 2π] integrierbaren Funktion f leicht eine Fourier-Reihe via Z 1 2π a0 = f (x)dx π 0 Z 1 2π ak = f (x) cos(kx)dx π 0 Z 1 2π bk = f (x) sin(kx)dx π 0 f¨ ur k ∈ N zuordnen. Die Zahlen a0 , ak , bk heißen die Fourier–Koeffizienten von f . Viel schwieriger ist die Frage zu beantworten, unter welchen Umst¨anden die Fourier-Reihe von f gegen f konvergiert. Insbesondere f¨allt die Antwort f¨ ur unterschiedliche Konvergenzbegriffe (z.B. in Norm, gleichm¨aßig, punktweise) unterschiedlich aus. Man kann z.B. zeigen, daß die Fourier-Reihe gleichm¨aßig gegen f konvergiert, wenn f stetig differenzierbar ist. Dagegen gibt es stetige Funktionen, deren Fourier–Reihen nicht einmal punktweise gegen f konvergieren. Daf¨ ur folgt aus einem sehr tiefen Satz von Carleson (geb. 1928), daß in diesem Fall die Fourier–Reihe fast u utzliche allgemeine Theorie ¨berall gegen f konvergiert. Eine sehr n¨ ergibt sich wenn man die Konvergenz im quadratischen Mittel betrachtet, die wir an dieser Stelle nicht behandeln. Seien jetzt a0 , an , bn f¨ ur n ∈ N die Fourier-Koeffizienten einer integrierbaren reellwertigen Funktion f ∈ L1 (R, R). F¨ ur n ∈ Z setzen wir an −ibn n∈N 2 a−n +ib−n cn := −n ∈N 2 a0 n = 0 2 Wegen an = cn + c−n und bn = i(cn − c−n ) f¨ ur n ∈ N finden wir mit der Eulerschen Formel an cos(nx) + bn sin(nx)
=
(cn + c−n ) cos(nx) + i(cn − c−n ) sin(nx)
= cn (cos(nx) + i sin(nx)) + c−n (cos(nx) − i sin(nx)) = cn einx + c−n e−inx . Dies liefert die folgende Identit¨at von Reihen (¨ uber Konvergenz wird hier nichts gesagt) ∞ X a0 X cn einx . (ak cos(kx) + bk sin(kx)) = + 2 k=1
n∈Z
188
KAPITEL 9. VERBINDUNG ZWISCHEN INTEGRAL- UND DIFFERENTIALRECHNUNG
Wenn wir eine komplexwertige Funktion g : R → C integrierbar nennen, falls die Funktionen Re g : R → R, x 7→ Re(g(x)) und
Im g : R → R, x 7→ Im(g(x))
integrierbar sind, und dementsprechend setzen Z Z Z g := Re g + i Im g, erhalten wir f¨ ur f ∈ L1 (R, R) und n ∈ N 1 2π
Z
2π
f (x)e
−inx
0
1 dx = 2π
Z
2π 0
1 f (x)cos(nx)dx − i 2π
Z
2π
f (x)sin(nx)dx = cn . 0
Zusammen mit der analogen Rechnung f¨ ur negative n finden wir schließlich cn =
1 2π
Z
2π
f (x)e−inx dx (∀n ∈ N).
0
Diese Formulierung er¨offnet neue (gruppentheoretische) Sichtweisen und ist der Startpunkt f¨ ur sehr weitreichende Verallgemeinerungen und verschiedenste Anwendungen. ¨ Ubung 9.3.1 : Zeige: (i) n X
cos kx = −
k=1
sin(n + 12 )x 1 . + 2 2 sin 12 x
(Hinweis: ben¨ utze die Formel 2 cos(nx) sin( 12 x) = − sin(n − 21 )x + sin(n + 12 )x aus Kapitel 5.3) (ii) F¨ ur jedes π > ² > 0 konvergiert die Funktionenfolge In : [0, 2π] → R mit Z
x
In (x) = π
sin(n + 21 )t dt 2 sin 12 t
auf [², 2π − ²] gleichm¨ aßig gegen Null. (Hinweis: Partielle Integration) (iii) F¨ ur alle x ∈]0, 2π[ gilt ∞ X sin kx π−x = . k 2
k=1
(Hinweis: Integriere die Formel in (i)) P cos kx (iv) Die Reihe ∞ konvergiert gleichm¨ aßig auf [0, 2π] gegen eine differenzierbare Grenzfunktion H(x). k=1 k2 (v) Es gilt f¨ ur jedes x ∈]0, 2π[ ∞
H(x) = −
(π − x)2 X (−1)k−1 + . 4 k2 k=1
(Hinweis: Leite die Reihe in (iv) ab) (vi) 1 1 1 π2 + 2 + 2 + ... = 2 1 3 5 8 (Hinweis: Betrachte den Grenzwert von (v) f¨ ur x → 0) (vii) 1 1 1 π2 + 2 + 2 + ... = 2 1 2 3 6 (Hinweis: Ben¨ utze (vi))
9.4. EINIGE SPEZIELLE INTEGRALE
9.4
189
Einige spezielle Integrale
Betrachte die Funktion f : ]0, ∞[→ R, x 7→ xα mit α ∈ R beliebig, aber fest. 1 2
1x
x^2 1
75 50
0.8
1.5
25 -1
0.6
-0.5
0.5
1
1
0.4
-25
0.5
-50
0.2
-75
-1
-100
-0.5
0.5
1
-1
-0.5
0.5
1
Wenn α > 0, dann ist f streng monoton wachsend und mit f (0) = 0 auf [0, ∞[ stetig fortsetzbar. Mit Proposition 8.4.5 stellt man fest, daß dann f auf jedem beschr¨ankten Teilintervall [a, b] von [0, ∞[ 1 integrierbar ist. Da F : ]0, ∞[→ R, x 7→ α+1 xα+1 eine Stammfunktion von f ist, erh¨alt man f¨ ur das entsprechende Integral Z b 1 f= (bα+1 − aα+1 ). α+1 a Andererseits kann f nicht auf ganz [0, ∞[ integrierbar sein, weil lim bα+1 = ∞.
b→∞
Der Fall α = 0 liefert die charakteristischen Funktion von ]0, ∞[, die ebenfalls auf jedem beschr¨ankten Teilintervall [a, b] von [0, ∞[ integrierbar ist und als Integral b − a hat. Sei jetzt α < 0. Dann ist f strikt monoton fallend und es gilt limx→0+ xα = ∞. Also ist a priori nicht klar, ob f u ¨ber ein Teilintervall der Form ]0, b] oder auch u ¨ber ein Teilintervall der Form [b, ∞[ integrierbar ist. Wenn dem f¨ ur ein b > 0 so ist, dann auch f¨ ur alle anderen, weil f auf ]0, ∞[ auch f¨ ur negative α stetig ist. Es gen¨ ugt also, den Fall b = 1 zu betrachten. Proposition 9.4.1 : Die Funktion f : ]0, 1] → R, x 7→ xα mit α < 0 ist genau dann integrierbar, wenn α > −1. In diesem Fall gilt Z 1 1 xα = . α+1 0 Beweis: 1 n
Idee: Starte die Integration zun¨achst bei
statt 0 und ben¨ utze dann Satz 8.4.2 von der monotonen
Konvergenz.
Wir nehmen zun¨achst an, daß α 6= −1. Betrachte die Funktionen ½ α x x ≥ n1 fn : ]0, 1] → R, x 7→ 0 sonst
1/n
Dann sind die fn integrierbar mit Z Z fn = R
1
f= 1 n
1
1 (1 − n−α−1 ). α+1
1 Wenn α > −1, dann folgt fn < α+1 und weil (fn )n∈N punktweise gegen f konvergiert, folgt die Integrierbarkeit und auch der Wert des Integrals aus dem Satz 8.4.2 von der monotonen Konvergenz.
190
KAPITEL 9. VERBINDUNG ZWISCHEN INTEGRAL- UND DIFFERENTIALRECHNUNG Umgekehrt, wenn f integrierbar ist, folgt aus fn ≤ f , daß Z 1 (1 − n−α−1 ) ≤ f α+1 f¨ ur alle n ∈ N. Dies impliziert aber α > −1. Schließlich betrachten wir noch den Fall α = −1. Dann gilt Z Z 1 1 1 dx = − ln( ) = ln(n) fn = 1 x n n und wie oben sieht man, daß f nicht integrierbar sein kann.
Proposition 9.4.2 : Die Funktion f : [1, ∞[→ R, x 7→ xα mit α < 0 ist genau dann integrierbar, wenn α < −1. In diesem Fall gilt Z ∞ 1 xα = − . α+1 1 Beweis: Idee: Beende die Integration zun¨achst bei n statt ∞ und ben¨utze dann Satz 8.4.2 von der monotonen Konvergenz. Wir nehmen zun¨achst an, daß α 6= −1. Betrachte die Funktionen ½ α x x≤n fn : ]1, ∞] → R, x 7→ 0 sonst
1
Dann sind die fn integrierbar mit Z Z fn =
n
n
f=
1
1 (nα+1 − 1). α+1
R 1 Wenn α < −1, dann folgt fn < − α+1 und weil (fn )n∈N punktweise gegen f konvergiert, folgt die Integrierbarkeit und auch der Wert des Integrals aus dem Satz 8.4.2 von der monotonen Konvergenz. Umgekehrt, wenn f integrierbar ist, folgt aus fn ≤ f , daß Z 1 (nα+1 − 1) ≤ f α+1 f¨ ur alle n ∈ N. Dies impliziert aber α < −1. Schließlich betrachten wir noch den Fall α = −1. Dann gilt Z Z n 1 fn = dx = ln(n) 1 x und wie oben sieht man, daß f nicht integrierbar sein kann.
9.4. EINIGE SPEZIELLE INTEGRALE
191
Als n¨achstes betrachten wir die Funktion f : ]0, ∞[→ R, x 7→ xα e−x 0.5 0.4 0.3 0.2 0.1
4
2
6
8
10
mit α > −1 beliebig, aber fest. Wegen Proposition 8.4.5 ist f u ¨ber jedes Teilintervall der Form [a, b] integrierbar. Weil aber f (x) ≤ xα f¨ ur alle x > 0 folgt wie zuvor aus dem Satz 8.4.3 von der dominierten Konvergenz, daß f u ¨ber jedes Intervall der Form ]0, b] integrierbar ist. Sei jetzt β < −1 so gew¨ahlt, daß α − β = k ∈ N. Dann gilt wegen xα−β = xk ≤ k!ex 0 < f (x) ≤ k!xβ
∀x ∈]0, ∞[.
β
Weil aber x nach Proposition 9.4.2 u ¨ber [1, ∞[ integrierbar ist, folgt wie gehabt mit dem Satz von der dominierten Konvergenz, daß f integrierbar ist. Damit k¨onnen wir durch die Formel Z ∞ xp−1 e−x dx Γ(p) = 0
eine Funktion Γ : ]0, ∞[→ R definieren, die Eulersche Gamma-Funktion. Die Gamma-Funktion
30
20
10
1
2
3
4
5
Die Gamma-Funktion spielt in verschiedensten Zusammenh¨angen eine wichtige Rolle. Hier wollen wir nur eine Eigenschaft nachweisen: Sie interpoliert die Fakult¨at: Proposition 9.4.3 : Die Gamma-Funktion erf¨ ullt Γ(1) = 1 und die Funktionalgleichung (∀p ∈]0, ∞[)
pΓ(p) = Γ(p + 1).
Beweis: Indem man jeweils die Integrale f¨ ur endliche Intervalle berechnet und dann den Satz von der dominierten Konvergenz anwendet, findet man Z n Γ(1) = lim e−x dx = lim (−e−n + e0 ) = 1 n→∞
und, mit partieller Integration, Γ(p) = = = =
n→∞
0
Z
n
xp−1 e−x dx ¶ µ Z 1 p −n 1 n p −x n e + x e dx lim n→∞ p p 0 Z 1 ∞ p −x x e dx p 0 1 Γ(p + 1). p lim
n→∞
0
192
KAPITEL 9. VERBINDUNG ZWISCHEN INTEGRAL- UND DIFFERENTIALRECHNUNG
Kapitel 10
Topologische R¨ aume 10.1
Umgebungen
Sei M eine (nichtleere) Menge und ρ : M × M → R eine Funktion. Das Paar (M, ρ) heißt ein metrischer Raum, wenn f¨ ur alle x, y, z ∈ M gilt: (M1) ρ(x, y) = 0
⇔
x = y,
(M2) ρ(x, y) − ρ(x, z) ≤ ρ(y, z) (Dreiecksungleichung).
x z y
M
Wir nennen die Funktion ρ eine Metrik auf M . Wenn die Metrik ρ aus dem Kontext klar ist oder ihre speziellen Eigenschaften nicht gebraucht werden, sagen wir einfach: M ist ein metrischer Raum. Sei K der K¨orper der reellen oder der komplexen Zahlen und V ein K-Vektorraum. F¨ ur eine Funktion k · k: V → R betrachte die folgenden Eigenschaften: (a) kx + yk ≤ kxk + kyk f¨ ur alle x, y ∈ V , (b) kλxk = |λ|kxk f¨ ur alle λ ∈ K, x ∈ V , (c) kxk = 0 ⇐⇒ x = 0. Wenn k · k die Eigenschaften (a) und (b) erf¨ ullt, heißt k · k eine Halbnorm auf V . Eine Halbnorm, die (c) erf¨ ullt, heißt eine Norm auf V . In diesem Fall heißt (V, k · k) ein normierter Vektorraum. Beispiel 10.1.1 : Sei V ein K-Vektorraum (K = R, C) und k · k : V → R eine Norm. Dann nimmt k · k wegen 0 = k0k = kx + (−1)xk ≤ kxk + k − xk = 2kxk nur nichtnegative Werte an und ρ : V × V → R,
(x, y) 7→ kx − yk
ist eine Metrik auf V . Insbesondere sind also R und C metrische R¨aume bzgl. ρ(x, y) = |x − y|. 193
¨ KAPITEL 10. TOPOLOGISCHE RAUME
194
Wir betrachten normierte Vektorr¨aume immer automatisch auch als metrische R¨aume (ausgestattet mit der kanonischen Metrik aus Beispiel 10.1.1), ohne dies gesondert zu erw¨ahnen. Proposition 10.1.2 : Sei (M, ρ) ein metrischer Raum, dann gilt f¨ ur alle x, y, z ∈ M (i) ρ(x, y) ≥ 0. (ii) ρ(x, y) = ρ(y, x). (iii) ρ(x, y) ≥ |ρ(x, z) − ρ(y, z)|. Beweis: Idee: Dies folgt direkt aus den Definitionen. (M1)
(M2)
(i): Dies folgt aus 0 = ρ(x, x) ≤ ρ(x, y) + ρ(x, y). (M2)
(M1)
(ii): Es gilt ρ(y, x) ≤ ρ(y, y) + ρ(x, y) = ρ(x, y). Durch Vertauschen der Rollen von x und y in diesem Argument folgt die Behauptung. (M2)
(ii)
(iii): Aus ρ(x, z) ≤ ρ(x, y)+ρ(z, y) = ρ(x, y)+ρ(y, z) folgt ρ(x, y) ≥ ρ(x, z)−ρ(y, z). Wieder folgt die Behauptung, indem man in diesem Argument die Rollen von x und y vertauscht und (ii) ausnutzt.
Sei (M, ρ) ein metrischer Raum, x ∈ M und r > 0. Dann heißt die Menge Bρ (x; r) := {y ∈ M | ρ(x, y) < r} die offene Kugel um x mit Radius r. Wenn die Metrik aus dem Kontext klar ist, schreiben wir lediglich B(x; r) statt Bρ (x; r).
x r
Es sei x ∈ M . Eine Teilmenge U ⊆ M heißt eine Umgebung von x in M , wenn es ein r > 0 gibt mit B(x; r) ⊆ U . Man beachte, daß x dann automatisch in U enthalten ist. Insbesondere sind also die offenen Kugeln B(x; r) Umgebungen von x in M . Die Menge aller Umgebungen von x in M wird mit U (x) bezeichnet.
r x B(x;r)
U
U M
M
10.1. UMGEBUNGEN
195
Beispiel 10.1.3 : Sei K gleich R oder C. (i) Sei V = Kn . Dann ist x = (x1 , . . . , xn ) 7→ maxj=1,...,n |xj | =: kxk∞ eine Norm, die Maximumsnorm oder Supremumsnorm. (ii) Sei V = Kn . Dann ist f¨ ur 1 ≤ p < ∞ n X 1 x = (x1 , . . . , xn ) 7→ ( |xj |p ) p =: kxkp j=1
¨ eine Norm, die H¨ older p–Norm. (vgl. Ubung 10.1.1)
¨ Ubung 10.1.1 : Zeige, daß die in Beispiel 10.1.3 definierte H¨ older p-Norm tats¨ achlich eine Norm ist. Schwierig ist dabei nur die Dreiecksungleichung (und die ist leicht f¨ ur p = 1). Beweise zun¨ achst die H¨ oldersche Ungleichung in Rn . Genauer: Zeige, daß f¨ ur x = (x1 , . . . , xn ) ∈ Rn , y = n (y1 , . . . , yn ) ∈ R gilt: n X |xj yj | ≤ kxkp kykq , j=1
wobei p, q ∈]1, ∞[ mit p−1 + q −1 = 1 und à kxkp =
n X
!1
p
|xj |
p
.
j=1
Hinweis: Zeige zun¨ achst mit dem Mittelwertsatz die Ungleichung ab ≤
1 p 1 q a + b , p q
(a, b ≥ 0, p−1 + q −1 = 1).
Damit l¨ aßt sich dann die Minkowski–Ungleichung in Rn beweisen, d.h. f¨ ur p ∈ [1, ∞], x = (x1 , . . . , xn ) ∈ R , y = (y1 , . . . , yn ) ∈ Rn gilt: kx + ykp ≤ kxkp + kykp . n
Proposition 10.1.4 : Sei (M, ρ) ein metrischer Raum und x ∈ M . Dann gilt (U1) x ∈ U f¨ ur alle U ∈ U (x).
x
U M
(U2) M ∈ U (x).
x
M
¨ KAPITEL 10. TOPOLOGISCHE RAUME
196 (U3) Aus U1 ∈ U (x) und U1 ⊆ U2 ⊆ M folgt U2 ∈ U(x).
U2
x
U1 M
(U4) Aus U1 , U2 ∈ U(x) folgt U1 ∩ U2 ∈ U (x).
U2
x
U1 M
(U5) Wenn U1 ∈ U (x) ist, dann gibt es ein U2 ∈ U (x) mit U1 ∈ U (y) f¨ ur alle y ∈ U2 .
U2 x
y
U1 M
Beweis: Idee: Dies folgt direkt aus den Definitionen. Man denke dabei in Kugeln. (U1), (U2) und (U3) folgen unmittelbar aus den Definitionen. Wenn B(x; r1 ) ⊆ U1 und B(x; r2 ) ⊆ U2 sind, gilt f¨ ur jedes 0 < r ≤ min(r1 , r2 ) B(x; r) ⊆ U1 ∩ U2 , was (U4) zeigt. Um (U5) zu zeigen, w¨ahlen wir eine Kugel B(x; r) ⊆ U1 und setzen U2 := B(x; r). Zu jedem y ∈ U2 m¨ ussen wir nun eine Kugel B(y; r0 ) um y finden, die ganz in U1 liegt. Es sei also y ∈ U2 . Als r0 w¨ahle r − r0 mit ρ(x, y) < r0 < r. F¨ ur z ∈ B(y; r − r0 ) gilt nun, daß ρ(x, z) ≤ ρ(x, y) + ρ(y, z) < r0 + (r − r0 ) = r, also ist z ∈ B(x; r) ⊆ U1 . Insgesamt haben wir B(y; r − r0 ) ⊆ U1 , folglich U1 ∈ U (y).
In der Analysis einer reellen Variablen entwickelt man eine Theorie der Konvergenz und Stetigkeit, die wesentlich auf den Eigenschaften der u ¨ber den Absolutbetrag definierten Abstandsmetrik beruht. Diese Theorie l¨aßt sich problemlos auf allgemeine metrische R¨aume u ¨bertragen. Da aber nicht alle Mengen, auf denen man Konvergenz und Stetigkeit beschreiben m¨ochte, mit einer Metrik versehen sind (man denke z.B. an R¨aume von differenzierbaren Funktionen), sucht man nach alternativen Formulierungen. Es stellt sich heraus, daß die in Proposition 10.1.4 aufgef¨ uhrten Eigenschaften (U1) - (U5) des Systems aller Umgebungen von Punkten in metrischen R¨aumen ausreichen, um eine Theorie von Konvergenz und Stetigkeit aufzubauen, die die Theorie f¨ ur metrische R¨aume subsumiert. Auch wenn zun¨achst alle Mengen,
10.1. UMGEBUNGEN
197
auf denen wir Konvergenz und Stetigkeit untersuchen wollen, metrische R¨aume sein werden (manchmal ist die Metrik aber auch alles andere als kanonisch), rechtfertigen sp¨atere Anwendungen daher die folgende Definition: Sei M eine Menge und P(M ) := {N ⊆ M } die Potenzmenge von M , d.h. die Menge aller Teilmengen von M . Ein Paar (M, U), f¨ ur das ¡ ¢ U : M → P P(M ) = {N ⊆ P(M )} x 7→ U (x) jedem x ∈ M eine Menge von Teilmengen von M zuordnet, heißt ein topologischer Raum, wenn f¨ ur jedes x ∈ M das System U(x) die Eigenschaften (U1)-(U5) aus Proposition 10.1.4 erf¨ ullt. Wir nennen die Elemente von U(x) wieder Umgebungen von x in M . Wenn zus¨atzlich die Bedingung ¡ ¢ ∀x1 , x2 ∈ M : x1 6= x2 ⇒ ∃U1 ∈ U(x1 ) ∃U2 ∈ U (x2 ) : U1 ∩ U2 = ∅ gilt, dann heißt der topologische Raum nach dem Mathematiker Felix Hausdorff (1868–1942) ein Hausdorff–Raum.
U1 x1
x2
U2 M
Bemerkung 10.1.5 : Nach Proposition 10.1.4 ist jeder metrische Raum M zusammen mit der durch U(x) := {U ⊆ M | ∃r > 0 : B(x; r) ⊆ U } gegebenen Abbildung ein topologischer Raum. Wenn x 6= y ist und r ∈ R die Ungleichung 0 < 2r < ρ(x, y) erf¨ ullt, dann gilt f¨ ur z ∈ B(x; r) ρ(y, z) ≥ ρ(y, x) − ρ(z, x) ≥ 2r − r = r. Das zeigt B(x; r) ∩ B(y; r) = ∅. Also ist jeder metrische Raum, betrachtet als topologischer Raum, hausdorffsch. Wir betrachten in Zukunft jeden metrischen Raum auch als topologischen Raum.
Bemerkung 10.1.6 : Seien (M1 , U1 ) und (M2 , U2 ) topologische R¨aume. F¨ ur (x, y) ∈ M1 × M2 definiere B(x, y) := {U1 × U2 | U1 ∈ U1 (x), U2 ∈ U2 (y)} sowie U(x, y) := {V ⊆ M1 × M2 | ∃ B ∈ B(x, y) : B ⊆ V }. ¨ Es ist nicht schwer zu zeigen, daß (M1 × M2 , U) ein topologischer Raum ist (Ubung!). Man nennt diesen Raum das topologische Produkt von (M1 , U1 ) und (M2 , U2 ) und U die Produkttopologie auf der Produktmenge M1 × M2 . Es ebenfalls kein Problem, diese Konstruktion auf das Produkt endlich vieler topologischer R¨aume zu u ¨bertragen.
¨ Ubung 10.1.2 :
¨ KAPITEL 10. TOPOLOGISCHE RAUME
198
(i) Sei (M, U) ein topologischer Raum und N ⊆ M eine beliebige Teilmenge. Zeige, daß durch V(x) := {V ⊆ N | (∃U ∈ U (x)) V = U ∩ N } f¨ ur x ∈ N ein topologischer Raum (N, V) definiert wird. (ii) Sei (M, ρ) ein metrischer Raum und U aus (i) u ¨ber die Metrik gegeben. Zeige, daß V(x) = {V ⊆ N | (∃r > 0) BρN (x; r) ⊆ V }, wobei BρN (x; r) := {y ∈ N | ρ(x, y) < r} ist. ¨ Ubung 10.1.3 : Sei (M, ρ) ein metrischer Raum, und sei f : [0, ∞[→ R zweimal stetig differenzierbar mit f (0) = 0, f 0 (t) > 0 und f 00 (t) ≤ 0 f¨ ur alle t > 0 . Zeige, daß durch d(x, y) := f (ρ(x, y)) eine Metrik auf M erkl¨ art wird. ¨ Ubung 10.1.4 : Seien ρn Metriken auf M . Zeige, daß dann auch ρ(x, y) :=
X
2−n
n∈N
ρn (x, y) 1 + ρn (x, y)
¨ eine Metrik auf M ist. Tip: Ubung 10.1.3. ¨ Ubung 10.1.5 : (Topologie der punktweisen Konvergenz auf X) Es sei X eine beliebige Menge, X 6= ∅. Mit F (X) sei der Vektorraum aller Funktionen f : X → R mit punktweisen Verkn¨ upfungen bezeichnet. F¨ ur ² > 0, {x1 , . . . , xn } ⊂ X eine endliche Teilmenge und f ∈ F (X) definiere U(x1 ,...,xn );² (f ) := {g ∈ F (X) | ∀ k = 1, . . . , n : |g(xk ) − f (xk )| < ²} und U(f ) := {U ⊂ F (X) | ∃ ² > 0 ∃ {x1 , . . . , xn } ⊂ X endlich : U(x1 ,...,xn );² (f ) ⊂ U }. Zeige: (F (X), U) ist ein topologischer Raum.
Sei (M, U) ein topologischer Raum. Eine Teilmenge U ⊆ M heißt offen, wenn sie Umgebung jedes Punktes ist, den sie enth¨alt, d.h. ∀x ∈ U : U ∈ U(x). Eine Teilmenge A ⊆ M heißt abgeschlossen, wenn ihr Komplement {A := M \ A offen ist. ¨ Ubung 10.1.6 : Sei M = R, versehen mit der Metrik ρ(x, y) = |x − y|. Zeige: ein Intervall I in R ist genau dann offen (abgeschlossen), wenn es offen (abgeschlossen) als Intervall ist.
Satz 10.1.7 : Wenn man f¨ ur einen topologischen Raum (M, U) die Menge T := {V ⊆ M | V offen} aller offenen Teilmengen kennt, kann man die Funktion U rekonstruieren: U(x) = {U ⊆ M | ∃V ∈ T : x ∈ V ⊆ U }.
x V
U M
(10.1)
10.1. UMGEBUNGEN
199
Beweis: Idee: Die Inklusion ⊇“ folgt sofort aus den Definitionen. F¨ur die andere Inklusion betrachte zu ” U ∈ U (x) die Menge U o := {y ∈ U | U ∈ U (y)} und zeige, daß sie offen ist. ⊆“: Wenn U ∈ U (x), dann setze ” U o := {y ∈ M | U ∈ U(y)}. U y V x
Es gilt x ∈ U o ⊆ U wegen (U1), also bleibt zu zeigen, daß U o offen ist: Sei also y ∈ U o . Dann gibt es nach der Eigenschaft (U5) in der Definition eines topologischen Raums (vgl. Proposition 10.1.4) ein V ∈ U(y) derart, daß ∀z ∈ V :
U ∈ U (z).
Dann gilt V ⊆ U o und daher U o ∈ U (y). ⊇“: Bezeichne die rechte Seite der Gleichung (10.1) mit U 0 (x). Wenn U ∈ U 0 (x) und V ∈ T ” mit x ∈ V ⊆ U , dann gilt V ∈ U (x) und nach (U3) auch U ∈ U (x).
¨ Beispiel 10.1.8 : Wenn eine Teilmenge N eines topologischen Raumes (M, U) wie in Ubung 10.1.2 als topologischer Raum betrachtet wird, nennt man die zugeh¨orige Topologie auf N die Relativtopologie oder auch induzierte Topologie von M auf N (auch der Name Spurtopologie ist u ¨blich). Sie besteht genau aus den Schnitten von N mit offenen Teilmengen von M .
N
M
Beispiel 10.1.9 : Sei M eine beliebige Menge. Die Topologie auf M , f¨ ur die alle Teilmengen von M offen sind, heißt diskrete Topologie. Die Topologie auf M , f¨ ur die nur ∅ und M offene Mengen sind, nennt man indiskrete Topologie. Beispiel 10.1.10 : F¨ ur jede Menge M mit |M | = ∞, d.h. unendlich vielen Elementen, ist {U ⊆ M | U = ∅ oder |{U | < ∞} eine Topologie, die man die kofinite Topologie nennt. Sei M ein topologischer Raum und B ⊆ M beliebig. Die Menge \ B := {A | A ⊇ B, A abgeschlossen}
¨ KAPITEL 10. TOPOLOGISCHE RAUME
200
ist die kleinste abgeschlossene Menge, die B enth¨alt. B heißt der Abschluß von B. Die Menge [ B ◦ := {U | U ⊆ B, U offen} = {y ∈ M | B ∈ U(y)} (vgl. Beweis von Satz 10.1.7) ist die gr¨oßte offene Menge, die in B enthalten ist. B ◦ heißt das Innere von B. Die Differenz B \ B ◦ heißt der Rand von B und wird mit ∂B bezeichnet. Sei M ein topologischer Raum und (xn )n∈N eine Folge in M . Dann heißt x ein H¨ aufungspunkt der Folge, wenn f¨ ur jede Umgebung U von x gilt: Es gibt unendlich viele n ∈ N mit xn ∈ U . Proposition 10.1.11 : Sei (M, U) ein topologischer Raum und A ⊆ M eine abgeschlossene Menge. Wenn (xn )n∈N eine Folge in A ist, dann enth¨ alt A alle H¨ aufungspunkte der Folge (xn )n∈N . Beweis: Idee: Betrachte f¨ur einen H¨aufungspunkt x von (xn )n∈N , der nicht in A liegt, eine zu A disjunkte Umgebung von x. Sei x ein H¨aufungspunkt der Folge (xn )n∈N . Dann gibt es zu jedem U ∈ U (x) ein n ∈ N mit xn ∈ U . Wenn x 6∈ A, dann gibt es eine Umgebung U von x, die disjunkt zu A ist, weil {A offen ist. Da die xn in A sind, liefert dies einen Widerspruch. Also gilt x ∈ A.
¨ Ubung 10.1.7 : Wahr oder falsch: A ∪ B = A ∪ B. ¨ Ubung 10.1.8 : Wahr oder falsch: B ◦ = B. ¨ Ubung 10.1.9 : Sei ρ die euklidische Metrik in R2 , und sei B := Q × Q = {(x, y) ∈ R2 : x ∈ Q, y ∈ Q} ⊂ R2 . Berechne das Innere und den Abschluß von B. ¨ Ubung 10.1.10 : x0 ∈ M mit
Finde ein Beispiel eines metrischen Raumes (M, ρ) mit folgender Eigenschaft: Es gibt ein {x ∈ M | ρ(x, x0 ) < 1} 6= {x ∈ M | ρ(x, x0 ) ≤ 1}.
¨ Ubung 10.1.11 : Bestimme alle Topologien auf M = {0, 1}. ¨ Ubung 10.1.12 : Seien (M1 , U1 ) und (M2 , U2 ) topologische R¨ aume und (M1 ×M2 , U) ihr topologisches Produkt (vgl. Bemerkung 10.1.6). Zeige, daß die Produkttopologie wie folgt gegeben ist: U ⊆ M1 × M2 ist offen genau dann, wenn es zu jedem (x, y) ∈ U offene Mengen U1 ⊆ M1 und U2 ⊆ M2 mit (x, y) ∈ U1 × U2 ⊆ U gibt. ¨ Ubung 10.1.13 : Sei (M, T ) ein Hausdorffraum. Zeige, daß jede endliche Menge abgeschlossen ist. ¨ Ubung 10.1.14 : Zeige, daß ein topologischer Raum genau dann hausdorffsch ist, wenn jeder Punkt gleich dem Durchschnitt aller seiner abgeschlossenen Umgebungen ist. ¨ Ubung 10.1.15 : Seien (M, T1 ) und (N, T2 ) topologische R¨ aume und f : M → N eine Abbildung. Wahr oder falsch? ¯ = f (A), (i) f (A) (ii) f¨ ur jede offene Menge U ⊂ M ist f (U ) offen in N . ¨ Ubung 10.1.16 : Es sei M ein topologischer Raum und U ⊆ M eine Teilmenge. Dann gilt (M \ U )◦ = M \ U . ¨ Ubung 10.1.17 : Es sei M ein topologischer Raum und A, B ⊆ M mit A ∩ B = ∅. Zeige ∂(A ∪ B) = ∂(A) ∪ ∂(B).
10.2. KONVERGENZ UND STETIGKEIT
10.2
201
Konvergenz und Stetigkeit
Sei (M, U ) ein topologischer Raum und (xn )n∈N eine Folge in M . Man sagt, die Folge konvergiert gegen einen Punkt x ∈ M , wenn ∀U ∈ U (x) ∃n0 ∈ N : (n > n0 ⇒ xn ∈ U ). U x
M
Wir nennen x einen Grenzwert von (xn )n∈N und schreiben xn → x, wenn xn gegen x konvergiert. Beispiel 10.2.1 : Sei (M, ρ) ein metrischer Raum, (xn )n∈N eine Folge in M und x0 ∈ M . (i) (xn )n∈N konvergiert genau dann gegen x0 , wenn ∀² > 0 ∃n0 ∈ N ∀n > n0 : ρ(xn , x0 ) < ².
ε
x
M
¨ (ii) Wenn M der metrische Raum R ist, dann f¨allt obiger Konvergenzbegriff mit dem Ublichen f¨ ur ¨ Folgen in R zusammen. (Ubung!)
Im Kontext von Funktionen einer reellen Variablen ben¨ utzt man die Notation limn→∞ xn = x, die deshalb sinnvoll ist, weil es in R h¨ochstens einen Grenzwert f¨ ur eine Folge geben kann. In allgemeinen topologischen R¨aumen ist das nicht immer so. Proposition 10.2.2 : Sei (M, U) ein hausdorffscher topologischer Raum. Dann hat jede Folge in M h¨ ochstens einen Grenzwert. Beweis: Idee: Folgt sofort aus den Definitionen. Sei (xn )n∈N eine Folge in M mit den Grenzwerten x ∈ M und y ∈ M . Wenn x 6= y, dann gibt es Umgebungen U ∈ U(x) und U 0 ∈ U(y) mit U ∩ U 0 = ∅. Wenn jetzt n0 , n00 ∈ N so gew¨ahlt sind, daß xn ∈ U f¨ ur alle n > n0 und xn ∈ U 0 f¨ ur alle n > n00 , dann f¨ uhrt das f¨ ur 0 n > max(n0 , n0 ) auf einen Widerspruch.
Mit Proposition 10.2.2 als Rechtfertigung ben¨ utzen wir f¨ ur Hausdorff–R¨aume (z.B. metrische R¨aume) die Notation limn→∞ xn = x f¨ ur xn → x. Seien (M, U ) und (N, V) topologische R¨aume und f : M → N eine Abbildung. Dann heißt f stetig in x0 ∈ M , wenn ∀V ∈ V(f (x0 )) ∃U ∈ U (x0 ) : f (U ) ⊆ V.
¨ KAPITEL 10. TOPOLOGISCHE RAUME
202 U
V oo x
f
M
oo f(x)
f(U)
N
Wenn f in jedem Punkt von M stetig ist, dann sagt man einfach, f ist stetig. Die Menge der stetigen Abbildungen f : M → N wird mit C(M, N ) oder auch mit C 0 (M, N ) bezeichnet. Beispiel 10.2.3 : Seien (M, ρ) und (N, µ) metrische R¨aume, f : M → N eine Funktion und x0 ∈ M . (i) f ist stetig in x0 genau dann, wenn ¡ ¢ ∀² > 0 ∃δ > 0 ∀x ∈ M : ρ(x, x0 ) < δ ⇒ µ(f (x), f (x0 )) < ² . In Analogie zur Definition des Grenzwerts oder Limes f¨ ur Funktionen einer reellen Variablen schreibt man daf¨ ur auch lim f (x) = f (x0 ). M 3x→x0
(ii) Wenn N der metrische Raum R ist und M ein Intervall in R, dann f¨allt obiger Stetigkeitsbegriff ¨ mit dem f¨ ur Funktionen einer reellen Variablen zusammen (Ubung!).
Proposition 10.2.4 : Seien (M, ρ) und (N, µ) metrische R¨ aume und f : M → N . Dann sind folgende Aussagen ¨ aquivalent: (1) f ist stetig in x0 ∈ M . (2) F¨ ur jede Folge (xn )n∈N in M mit limn→∞ xn = x0 gilt limn→∞ f (xn ) = f (x0 ). Beweis: Idee: Folgt direkt aus den Definitionen. (2)⇒(1)“: Wenn f in x nicht stetig ist, dann gibt es ein ² > 0 mit ” 1 ∀n ∈ N, ∃xn ∈ M : ρ(xn , x0 ) < und µ(f (xn ), f (x0 )) > ². n Insbesondere konvergiert die Folge (f (xn ))n∈N f¨ ur n → ∞ nicht gegen f (x0 ), obwohl die Folge (xn )n∈N gegen x0 konvergiert. (1)⇒(2)“: Wenn f in x0 stetig ist und eine Folge (xn )n∈N in M gegen x0 konvergiert, dann gibt es ” zu jedem ² > 0 ein δ > 0 mit ¡ ¢ ∀x ∈ M : ρ(x, x0 ) < δ ⇒ µ(f (x), f (x0 )) < ² und zu δ ein n0 ∈ N mit ¡ ¢ ∀n ∈ N : n > n0 ⇒ ρ(xn , x0 ) < δ . Zusammen gibt es also zu ² > 0 ein n0 mit ¡ ¢ ∀n ∈ N : n > n0 ⇒ µ(f (xn ), f (x0 )) < ² , d.h., limn→∞ f (xn ) = f (x0 ).
10.2. KONVERGENZ UND STETIGKEIT
203
Proposition 10.2.5 : Seien (M, U) und (N, V) topologische R¨ aume, x0 ∈ M und f : M → N eine Abbildung. Dann sind folgende Aussagen ¨ aquivalent: (1) f ist stetig in x0 . (2) Wenn V ∈ V(f (x0 )), dann ist f −1 (V ) = {x ∈ M | f (x) ∈ V } ∈ U(x0 ), d.h. Urbilder von Umgebungen von f (x0 ) sind Umgebungen von x0 . Beweis: Idee: V o x
f
o f(x)
-1
f (V)
M
N
(2)⇒(1)“: Wenn aus V ∈ V(f (x0 )) folgt f −1 (V ) ∈ U(x0 ), dann zeigt f (f −1 (V )) ⊆ V , daß f in x0 ” stetig ist. (1)⇒(2)“: Umgekehrt, wenn f in x0 stetig ist und V ∈ V(f (x0 )), dann gibt es ein U ∈ U (x0 ) mit ” f (U ) ⊆ V . Also haben wir U ⊆ f −1 (V ), was f −1 (V ) ∈ U (x0 ) zur Folge hat.
Proposition 10.2.6 : Seien (M, U) und (N, V) topologische R¨ aume sowie f : M → N eine Abbildung. Dann sind folgende Aussagen ¨ aquivalent: (1) f ist stetig. (2) Wenn V ⊆ N offen ist, dann ist f −1 (V ) ⊆ M offen. (3) Wenn V ⊆ N abgeschlossen ist, dann ist f −1 (V ) ⊆ M abgeschlossen. Beweis: Idee: Ben¨utze Proposition 10.2.5. (2)⇔(3)“: Dies folgt sofort aus der Mengengleichheit ” f −1 (N \ A) = M \ f −1 (A), die f¨ ur jede Teilmenge A ⊆ N und ohne jede Voraussetzung an f gilt. (2)⇒(1)“: Wenn x ∈ M und V ∈ V(f (x)), dann gilt f (x) ∈ V ◦ , d.h. x ∈ f −1 (V ◦ ), und V ◦ ” ist offen. Nach Voraussetzung ist f −1 (V ◦ ) offen, also eine Umgebung von x. Damit ist f −1 (V ) ∈ U (x), also ist f nach Proposition 10.2.5 stetig in x. (1)⇒(2)“: Sei f stetig in jedem x ∈ M . Wenn V ⊆ N offen ist, dann gilt f¨ ur x ∈ f −1 (V ), daß ” f (x) ∈ V ist und folglich ist V ∈ V(f (x)). Wegen der Stetigkeit von f in x gibt es nach Definition ein U ∈ U(x) mit f (U ) ⊆ V , also U ⊆ f −1 (V ). Damit ist f −1 (V ) ∈ U(x). Da x ∈ f −1 (V ) beliebig war, ist f −1 (V ) offen.
¨ KAPITEL 10. TOPOLOGISCHE RAUME
204
Beispiel 10.2.7 : Sei (M, ρ) ein metrischer Raum und y ∈ M beliebig. Dann ist die Funktion f : M → R,
x 7→ ρ(x, y)
stetig: Sei x0 ∈ M und ² > 0. Dann gilt mit Proposition 10.1.2 ¡ ¢ ∀x ∈ M : ρ(x, x0 ) < ² ⇒ |f (x) − f (x0 )| = |ρ(x, y) − ρ(x0 , y)| ≤ ρ(x, x0 ) < ² . Als Konsequenz finden wir, daß f¨ ur jedes y ∈ M und jedes r ≥ 0 die abgeschlossene Kugel um y mit Radius r {x ∈ M | ρ(x, y) ≤ r} = f −1 ([0, r]) tats¨achlich abgeschlossen ist. Sei (M, ρ) ein metrischer Raum. Eine Folge (xn )n∈N in M heißt Cauchy–Folge, wenn es zu jedem ² > 0 ein n0 ∈ N gibt mit ∀n, m ∈ N : (n, m > n0 ⇒ ρ(xn , xm ) < ²). Der Raum (M, ρ) heißt vollst¨ andig, wenn jede Cauchy–Folge gegen ein Element von M konvergiert. Eine Teilmenge E ⊆ M heißt vollst¨ andig, wenn (E, ρ) als metrischer Raum vollst¨andig ist, d.h., wenn jede Cauchy–Folge in E gegen ein Element von E konvergiert. Die Definition der Cauchy–Folgen und der Vollst¨andigkeit l¨aßt sich nicht ohne weiteres auf allgemeine topologische R¨aume u ¨bertragen. Man braucht dazu zus¨atzlich das Konzept des uniformen Raumes, das wir an dieser Stelle nicht behandeln wollen. Proposition 10.2.8 : Der Raum Rn mit der Norm kxk∞ = max{|xj | | j = 1, . . . , n} ist vollst¨ andig. Beweis: Idee: Argumentiere u¨ber die Komponenten und die Vollst¨andigkeit von R.
x
Man rufe sich zun¨achst in Erinnerung, daß R vollst¨andig ist (Cauchy-Folgen sind beschr¨ankt, haben also nach dem Satz 4.1.11 von Bolzano-Weierstraß eine konvergente Teilfolge und die Cauchy-Bediungung zeigt dann, daß die gesamte Folge gegen den Grenzwert der Teilfolge konvergiert). Sei (x(k) )k∈N eine Cauchy-Folge in Rn . Wegen (k)
|xj
(m)
− xj
| ≤ kx(k) − x(m) k∞ (k)
ist dann auch f¨ ur jedes j = 1, . . . , n die Folge (xj )k∈N eine Cauchy-Folge in R, also konvergent gegen ein xj ∈ R. Setze x = (x1 , . . . , xn ). Dann gilt wegen ¯ © (k) ª kx(k) − xk∞ = max |xj − xj | ¯ j = 1, . . . , n , daß
lim x(k) = x.
k→∞
10.3. KOMPAKTE MENGEN
205
¨ Ubung 10.2.1 : F¨ ur x, y ∈ R definiere d(x, y) := | arctan x − arctan y| und zeige: (i) d ist eine Metrik, (ii) die durch d erzeugte Topologie auf R stimmt mit der euklidischen Topologie u ¨berein, (iii) (R, d) ist nicht vollst¨ andig.
¨ Ubung 10.2.2 : Zeige (i) Abgeschlossene Teilmengen vollst¨ andiger metrischer R¨ aume sind vollst¨ andig. (ii) Vollst¨ andige Teilmengen metrischer R¨ aume sind abgeschlossen.
¨ Ubung 10.2.3 : Sei K gleich R oder C und X ein K-Vektorraum. Zwei Normen k · k1 und k · k2 auf X heißen aquivalent auf X , wenn es Konstanten C1 , C2 > 0 mit ¨ C1 kxk1 ≤ kxk2 ≤ C2 kxk1
∀x∈X
¨ gibt. Zeige: Aquivalente Normen liefern dieselbe Topologie und dieselben Cauchy-Folgen.
10.3
Kompakte Mengen
Sei (X, T ) ein topologischer Raum und Y ⊆ X eine beliebige Teilmenge. Eine Menge F von Teilmengen ¨ von X heißt eine Uberdeckung von Y , wenn [ Y ⊆ F. F ∈F
Y X
¨ Eine Uberdeckung F heißt offen, wenn alle F ∈ F offen in X sind. Die Menge Y heißt kompakt, ¨ wenn jede offene Uberdeckung F von Y eine endliche Teilu ¨ berdeckung hat, d.h. wenn es eine endliche ¨ Teilmenge F 0 von F gibt, die selbst eine Uberdeckung von Y ist. In einem topologischen Raum X sagt man, eine Familie {Fα }α∈A von Teilmengen von X habe die T endliche Schnitteigenschaft, wenn f¨ ur alle endlichen Teilmengen B ⊆ A gilt Fβ = 6 ∅. β∈B
Satz 10.3.1 :
Seien (X, T ) und (X 0 , T 0 ) topologische R¨ aume. Dann gilt:
(i) Ist X kompakt und Y ⊆ X abgeschlossen, so ist auch Y kompakt. (ii) Ist X hausdorffsch und Y ⊆ X kompakt, so ist Y abgeschlossen. (iii) Ist X kompakt und f : X → X 0 stetig, so ist f (X) ⊆ X 0 kompakt. (iv) Ist X kompakt, X 0 hausdorffsch sowie f : X → X 0 stetig und bijektiv, so ist auch die Umkehrabbildung f −1 : X 0 → X stetig. Beweis: Idee: Die Aussagen (i)-(iii) folgen direkt aus den Definitionen. Teil (iv) leitet man mithilfe von Proposition 10.2.6 her.
¨ KAPITEL 10. TOPOLOGISCHE RAUME
206
S (i) {Uα }α∈A eine Familie von offenen Teilmengen von X mit Y ⊆ Uα . Dann gilt X = α∈A S {Y ∪ Uα und davon gibt es eine endliche Teil¨ uberdeckung, die dann auch eine endliche α∈A
Teil¨ uberdeckung von Y ist. (ii) Zu x ∈ X \ Y und S y ∈ Y gibt es Umgebungen Uy und Vy von x und y mit Uy ∩ Vy = ∅. Dann gilt Y ⊆ Vy und es existiert eine endliche Teil¨ uberdeckung Vy1 , . . . , Vyk von Y . y∈Y
Setze U :=
k \
Uyi
und V :=
i=1
k [
Vy i .
i=1
Dann ist U eine Umgebung von x und V ⊇ Y . Außerdem gilt U ∩ V = ∅. Dies zeigt x ∈ U ⊆ X \ Y und damit ist X \ Y offen. S (iii) Sei f (X) ⊆ Vα , wobei die Vα ⊆ X 0 offen sind. Dann sind auch die f −1 (Vα ) offen α∈A S in X und es gilt X ⊆ α∈A f −1 (Vα ). Also existiert eine endliche Teil¨ uberdeckung X ⊆ f −1 (Vα1 ) ∪ . . . ∪ f −1 (Vαk ) so, daß f (X) ⊆ Vα1 ∪ . . . ∪ Vαk endliche Teil¨ uberdeckung ist. (iv) Wir zeigen (vgl. Proposition 10.2.6) F ⊆ X abgeschlossen
⇒
f (F ) ⊆ X 0 abgeschlossen.
Wenn also F ⊆ X abgeschlossen ist, so liefert (i), daß F kompakt ist. Nach (iii) ist dann auch f (F ) kompakt und (ii) zeigt schließlich, daß f (F ) abgeschlossen ist.
Wir haben im Beweis von Proposition 10.3.1 stillschweigend das Auswahlaxiom ben¨ utzt. Sei (M, ρ) ein metrischer Raum. Eine Teilmenge B ⊆ M heißt beschr¨ ankt, wenn es ein x ∈ M und ein r > 0 mit B ⊆ B(x; r) gibt. Proposition 10.3.2 : beschr¨ ankt.
Sei (M, ρ) ein metrischer Raum. Dann ist jede kompakte Teilmenge von M
Beweis: ¨ Idee: Uberdecke M durch offene Kugeln mit Radius n ∈ N und festem Mittelpunkt.
Sei C ⊆ M kompakt und x ∈ M beliebig. Dann bilden die offenen Kugeln B(x; n) mit n ∈ N ¨ eine offene Uberdeckung von M , also auch von C. Wegen der Kompaktheit reichen endlich viele Kugeln aus, um C zu u ¨berdecken. Da die Kugeln aber alle ineinander liegen, gibt es ein n0 ∈ N mit C ⊆ B(x; n0 ).
Satz 10.3.3 (Heine–Borel): Betrachte den Raum Rn mit der Norm kxk∞ = max{|xj | | j = 1, . . . , n}. F¨ ur eine Teilmenge C ⊆ Rn sind folgende Aussagen ¨ aquivalent: (1) C ist kompakt. (2) C ist abgeschlossen und beschr¨ ankt. Beweis:
10.3. KOMPAKTE MENGEN
207
Idee: Satz 10.3.1 und Proposition 10.3.2 liefern (1)⇒(2)“. F¨ur die Umkehrung nimmt man an, man
” ¨ h¨ atte eine Uberdeckung von C, die keine endliche Teil¨ uberdeckung zul¨ aßt, teilt einen W¨ urfel, der C enth¨ alt, in 2n Teilw¨ urfel auf und schaut f¨ ur welchen Teil immer noch unendlich viele u ¨berdeckende Mengen n¨ otig sind. Diesen Teil teilt man erneut auf und findet durch Iteration und Grenzwertbildung einen Punkt in C, der einerseits u ¨berdeckt wird, aber andererseits beliebig kleine Umgebungen hat, die nicht u uhrt zum Widerspruch. ¨berdeckt werden. Das f¨
Die Implikation (1)⇒(2)“ folgt sofort aus Satz 10.3.1 und Proposition 10.3.2. ” Sei also C abgeschlossen und beschr¨ankt. Dann gibt es ein x ∈ Rn und ein r > 0 mit C ⊆ B(x; r). Setze B1 := {y ∈ Rn | kx − yk∞ ≤ r} = {y ∈ Rn | |xj − yj | ≤ r f¨ ur alle j = 1, . . . , n}. Nach Beispiel 10.2.7 ist diese Menge abgeschlossen. Wir nehmen jetzt an, daß C nicht kompakt ¨ ist. Dann gibt es eine offene Uberdeckung F von C, die keine endliche Teil¨ uberdeckung hat. Induktiv konstruieren wir jetzt eine Folge von abgeschlossenen Kugeln Bk := {y ∈ Rn | kx(k) − yk∞ ≤
r } 2k−1
(k)
= {y ∈ Rn | |xj
− yj | ≤
r 2k−1
f¨ ur alle j = 1, . . . , n}
in Rn mit folgenden Eigenschaften: (i) Bk+1 ⊆ Bk (ii) Bk ∩ C wird nicht von endlich vielen Elementen von F u ¨berdeckt.
C
Wenn Bk gegeben ist, dann l¨aßt sich Bk als die Vereinigung der 2n abgeschlossenen Kugeln r (die hier eher Quader“ sind) vom Radius 2k−1 mit den Mittelpunkten ” n X r x(k) + (±) k ej 2 j=1 schreiben, wobei ej = (0, . . . , 0, 1, 0, . . . , 0) mit der Eins an der j-ten Stelle.
F¨ ur mindestens eine dieser abgeschlossenen Kugeln ist der Schnitt mit C nicht mit endlich vielen Elementen von F zu u ¨berdecken. Eine solche w¨ahlen wir als Bk+1 . Dementsprechend ist x(k+1) der Mittelpunkt von Bk+1 . Dann gilt f¨ ur k, m ≥ n0 kx(k) − x(m) k∞ ≤ kx(k) − x(n0 ) k∞ + kx(n0 ) − x(m) k∞ ≤ 2
r 2n0 −1
=
r 2n0 −2
,
d.h (x(k) )k∈N eine Cauchy-Folge, also nach Proposition 10.2.8 konvergent gegen ein x ∈ Rn . Wir wollen zeigen, daß x ∈ C. Dazu w¨ahlen wir x e(k) ∈ Bk ∩ C und stellen fest, daß mit (k) (k) (x )k∈N auch (e x )k∈N f¨ ur k → ∞ gegen x konvergiert. Weil C abgeschlossen ist, folgt x ∈ C (vgl. Proposition 10.1.11). Also gibt es ein U ∈ F mit x ∈ U .
¨ KAPITEL 10. TOPOLOGISCHE RAUME
208
U C Bk
Nach Bemerkung 10.1.5 gibt es eine offene Kugel B(x; s) in U . Wenn kx − x(k) k∞ < 2s f¨ ur alle r k > n0 , dann gilt Bk ⊆ B(x; s) ⊆ U f¨ ur alle k > n0 mit 2k−1 < 2s . Also gibt es ein Bk , das im Widerspruch zur Konstruktion von einem einzigen Element von F u ¨berdeckt wird. Also muß C kompakt gewesen sein.
¨ Ubung 10.3.1 : Sei (X, d) ein metrischer Raum und A ⊆ X, A 6= ∅. Zeige, daß die Abstandsfunktion fA : X → R,
x 7→ inf d(x, y) y∈A
stetig ist.
¨ Ubung 10.3.2 : Sei (M, ρ) ein metrischer Raum und f : M → R eine stetige Abbildung. Die Abbildung f heißt gleichm¨ aßig stetig, wenn es zu jedem ² > 0 ein δ > 0 gibt, so daß f¨ ur x, y ∈ M aus ρ(x, y) < δ folgt |f (x) − f (y)| < ². Zeige: wenn M kompakt ist, dann ist f automatisch gleichm¨ aßig stetig. ¨ Ubung 10.3.3 : Sei f : R2 → R definiert durch f (x, y) = x2 + y 4 . Zeige, daß f¨ ur jedes c ∈ R die Niveaumenge Nc := {(x, y) ∈ R2 |f (x, y) = c} eine kompakte Teilmenge von R2 ist. ¨ Ubung 10.3.4 : Es sei (M, %) ein kompakter metrischer Raum. Dann gilt (i) Zu jedem ² > 0 existieren endlich viele x1 , . . . , xn ∈ M so, daß M=
n [
B(xj ; ²).
j=1
(M heißt dann totalbeschr¨ ankt oder pr¨ akompakt.) (ii) M ist vollst¨ andig.
¨ ¨ 10.3.4) Es sei (M, %) ein metrischer Raum. Ubung 10.3.5 : (Umkehrung von Ubung Zeige: Ist M totalbeschr¨ ankt und vollst¨ andig, dann ist M kompakt. ¨ Ubung 10.3.6 : Sei (M, ρ) ein metrischer Raum. Zeige, daß M genau dann kompakt ist, wenn jede Folge aus M eine konvergente Teilfolge enth¨ alt. ¨ Anleitung: F¨ ur die Implikation ⇐“ sei {Uγ , γ ∈ Γ} eine offene Uberdeckung von M . Zeige zun¨ achst, daß ein ” δ > 0 existiert, so daß es f¨ ur jedes x ∈ X ein γ ∈ Γ gibt mit B(x, δ) ⊆ Uγ . ¨ Ubung 10.3.7 : Sei (X, ρ) ein metrischer Raum und T die von ρ erzeugte Topologie auf X. Zeige, daß X genau dann endlich ist, wenn (X, ρ) kompakt und T die diskrete Topologie auf X ist. ¨ Ubung 10.3.8 : Sei (X, d) ein kompakter metrischer Raum und f : X → X eine isometrische Abbildung, d.h. es gilt d(x, y) = d(f (x), f (y)) f¨ ur alle x, y ∈ X. Zeige, daß f bijektiv ist.
10.3. KOMPAKTE MENGEN
209
Satz 10.3.4 : Sei (M, ρ) ein metrischer Raum und f : M → R eine stetige Funktion. Dann nimmt f auf jeder kompakten Teilmenge von M sein Minimum und sein Maximum an. Insbesondere ist f auf jeder kompakten Teilmenge beschr¨ ankt. Beweis: Idee: Das Bild ist kompakt, also abgeschlossen und beschr¨ankt. daher enth¨alt es Infimum und Maximum.
Sei C ⊆ M kompakt. Nach Satz 10.3.1 ist f (C) ⊆ R kompakt. Mit Satz 10.3.1 und Proposition 10.3.2 sehen wir, daß f (C) abgeschlossen und beschr¨ankt ist. Sei R := sup f (C). Dann gibt es zu jedem n ∈ N ein yn ∈ f (C) mit R − n1 ≤ yn ≤ R. Aber dann gilt limn→∞ yn = R und Proposition 10.1.11 zeigt R ∈ f (C). Also gibt es ein x ∈ C mit f (x) = R und wir haben sup f (C) = maxf (C). F¨ ur das Infimum von f (C) argumentiert man genauso.
Proposition 10.3.5 : Sei k · k eine Norm auf Rn . Dann gibt es zwei Konstanten r, R > 0 mit ∀x ∈ Rn :
rkxk∞ ≤ kxk ≤ Rkxk∞ .
Beweis: Idee: Die R¨ander von Normkugeln bleiben (wegen Satz 10.3.3 und Satz 10.3.1) weg von der Null, daher kann man unterschiedliche Normkugeln skaliert ineinanderpacken.
Nach Satz 10.3.3 ist die abgeschlossene (und beschr¨ankte) Menge S := {x ∈ Rn | kxk∞ = 1} (vgl. Beispiel 10.2.7) kompakt. Außerdem ist k · k : Rn → R stetig: um das zu sehen, setze M := max{kej k | j = 1, . . . , n}, wobei e1 , . . . , en die kanonische Basis f¨ ur Rn ist. F¨ ur x = (x1 , . . . , xn ) = kxk ≤
n X
Pn j=1
xj ej gilt dann
|xj |M ≤ M nkxk∞ .
j=1
Wenn also eine Folge (x(k) )k∈N in Rn bzgl. der Norm k·k∞ gegen ein x ∈ Rn konvergiert, dann konvergiert sie auch bzgl. k · k gegen x und dies zeigt mit Proposition 10.2.4, daß k · k : Rn → R (und damit auch die Einschr¨ankung auf S) stetig ist. Also nimmt diese Funktion auf S ihr Maximum R und ihr Minimum r an (vgl. Satz 10.3.4). Weil alle x ∈ S ungleich Null sind, gilt R, r > 0. Sei jetzt x ∈ Rn \ {0}. Dann gilt kxk1 ∞ x ∈ S, also ° ° ° ° 1 ° x r≤° ° kxk∞ ° ≤ R und schließlich rkxk∞ ≤ kxk ≤ Rkxk∞ . Da die Ungleichung f¨ ur x = 0 trivialerweise erf¨ ullt ist, folgt die Behauptung.
¨ KAPITEL 10. TOPOLOGISCHE RAUME
210
Wir sagen, zwei Normen k · k(1) und k · k(2) auf einem Vektorraum V (reell oder komplex) sind aquivalent, wenn es zwei positive Konstanten r, R > 0 mit ¨ ∀x ∈ V :
rkxk(1) ≤ kxk(2) ≤ Rkxk(1) .
gibt. Wir zeigen, wie man Proposition 10.3.5 auf beliebige endlich dimensionale Vektorr¨aume u ¨bertragen kann: Bemerkung 10.3.6 : (i) Sei V ein endlich dimensionaler R-Vektorraum und k · k1 , k · k2 seien zwei Normen auf V . W¨ahle eine Basis v1 , . . . , vn f¨ ur V und betrachte den R-linearen Isomorphismus φ : Rn → V, x = (x1 , . . . , xn ) 7→
n X
xj vj .
j=1
Dann definiert kxk10 := kφ(x)k1
und kxk20 := kφ(x)k2
zwei Normen auf Rn , die nach Proposition 10.3.5 ¨aquivalent sind. D.h., es gibt R, r > 0 mit rkvk1 = rkφ−1 (v)k10 ≤ kφ−1 (v)k20 = kvk2 ≤ Rkφ−1 (v)k10 = Rkvk1 , ¨ was die Aquivalenz der Normen k · k1 und k · k2 zeigt. Also sind je zwei Normen auf V a¨quivalent. ¨ (ii) (vgl. Ubung 10.2.3) Seien T1 und T2 die Topologien von V bzgl. der Normen k · k1 und k · k2 . Die Ungleichung kvk2 ≤ Rkvk1 zeigt wie im Beweis von Proposition 10.3.5, daß die Identit¨at idV : (V, k · k1 ) → (V, k · k2 ) stetig ist. Also sind Urbilder offener Mengen offen (Proposition 10.2.6) und das bedeutet f¨ ur die identische Abbildung einfach, daß T2 ⊆ T1 . Umgekehrt zeigt kvk1 ≤ 1r kvk2 , daß idV : (V, k · k2 ) → (V, k · k1 ) stetig ist. Also gilt T1 = T2 ; verschiedene Normen auf einem endlich dimensionalen Vektorraum liefern immer dieselbe Topologie. Das bedeutet insbesondere, daß wir uns f¨ ur Fragen der Stetigkeit und der Konvergenz auf endlich dimensionalen normierten Vektorr¨aumen immer eine uns genehme Norm aussuchen d¨ urfen. (iii) Das Argument in (i) zeigt auch, daß f¨ ur eine Folge (vk )k∈N in V die Aussagen vk → v und φ−1 (vk ) → −1 φ (v) (f¨ ur jede der betrachteten Normen) ¨aquivalent sind. Also sind φ : Rn → V und φ−1 : V → Rn stetig (wieder mit Proposition 10.2.4). Da φ und φ−1 außerdem beschr¨ankte Mengen auf beschr¨ankte Mengen abbilden, erhalten wir mit dem Satz 10.3.3 von Heine–Borel: Eine Teilmenge C ⊆ V ist genau dann kompakt, wenn sie bzgl. einer beliebigen Norm auf V abgeschlossen und beschr¨ankt ist.
¨ Beachte, daß sich die Uberlegungen aus Bemerkung 10.3.6 problemlos auf C-Vektorr¨aume u ¨bertragen lassen, da diese ja insbesondere auch R-Vektorr¨aume sind.
Proposition 10.3.7 : Seien (V, k · kV ) und (W, k · kW ) endlich-dimensionale normierte K-Vektorr¨ aume und φ ∈ HomK (V, W ) = {φ : V → W | φ ist K − linear}. Dann ist φ stetig. Beweis:
10.3. KOMPAKTE MENGEN
211
Idee: F¨uhre die Stetigkeit auf die Beschr¨anktheit der Bilder von Kugeln zur¨uck und zeige diese durch Entwicklung nach einer Basis.
W¨ahle eine Basis v1 , . . . vn f¨ ur V und eine Basis w1 , . . . wm f¨ ur W . Wir k¨onnen o.B.d.A. annehmen, daß k
n X
xj vj kV = max{xj | j = 1, . . . , n}
und k
j=1
m X
yk wk kW = max{yk | k = 1, . . . , m}.
k=1
Sei (ajk ) die darstellende Matrix von φ bzgl. der gew¨ahlten Basen, d.h. φ(vj ) =
m X
akj wk .
k=1
Dann gilt kφ(vj )kW ≤ max{|ajk | | j = 1, . . . , n; k = 1, . . . , m} =: M und folglich f¨ ur alle v ∈ V mit kvkV ≤ 1 kφ(v)kW ≤ nM. Aber dann gilt f¨ ur alle v ∈ V , daß kφ(v)kW ≤ kvkV nM. Jetzt zeigt wieder das Argument aus dem Beweis von Proposition 10.3.5, daß φ stetig ist.
Satz 10.3.1, Proposition 10.3.7 und Bemerkung 10.3.6 erlauben eine effiziente Herleitung der Operatornorm und ihrer grundlegenden Eigenschaften. Proposition 10.3.8 : Seien (V, k · kV ) und (W, k · kW ) endlich dimensionale normierte K-Vektorr¨ aume und φ ∈ HomK (V, W ). Dann gilt (i) Die Menge {kφ(v)kW | kvkV ≤ 1} ist beschr¨ ankt und kφkop := sup{kφ(v)kW | kvkV ≤ 1} liefert (∀v ∈ V )
kφ(v)kW ≤ kφkop kvkV .
(ii) k · kop ist eine Norm auf HomK (V, W ). Beweis: Idee: V
W
Φ
(i) {v ∈ V | kvkV ≤ 1} ist nach Satz 10.3.1 kompakt, also ist wegen Proposition 10.3.7 auch {kφ(v)kW | kvkV ≤ 1} kompakt und damit nach Bemerkung 10.3.6 beschr¨ankt. Damit gilt v )kW ≤ kφkop , (∀v ∈ V \ {0}) kφ( kvkV was sofort die Behauptung liefert.
¨ KAPITEL 10. TOPOLOGISCHE RAUME
212
(ii) Wenn kφkop = 0, dann gilt kφ(v)kW = 0 f¨ ur alle v ∈ V mit kvkV ≤ 1, also φ(v) = 0
∀v ∈ V
mit
kvkV ≤ 1
und daher φ(v) = 0 f¨ ur alle v ∈ V . F¨ ur c ∈ K rechne kcφkop =
sup
kcφ(v)kW =
kvkV ≤1
sup
|c| kφ(v)kW = |c| sup
kvkV ≤1
kφ(v)kW = |c| kφkop
kvkV ≤1
Um die Dreiecksungleichung zu zeigen, w¨ahlen wir φ, ψ ∈ HomK (V, W ) und rechnen f¨ ur kvkV ≤ 1: k(φ + ψ)(v)kW
= ≤ ≤ = ≤
kφ(v) + ψ(v)kW kφ(v)kW + kψ(v)kW kvkV kφkop + kvkV kψkop kvkV ( kφkop + kψkop ) kφkop + kψkop .
Weil aber kφ + ψkop =
sup
k(φ + ψ)(v)kW ,
kvkV ≤1
folgt damit die Dreiecksungleichung.
Die in Proposition 10.3.8 beschriebene Norm auf HomK (V, W ) heißt die Operatornorm . Proposition 10.3.9 : Seien (V, k · kV ), (W, k · kW ) und (U, k · kU ) endlich dimensionale normierte KVektorr¨ aume. Wenn φ ∈ HomK (V, W ) und ψ ∈ HomK (W, U ), dann gilt ψ ◦ φ ∈ HomK (V, U ) und die zugeh¨ origen Operatornormen erf¨ ullen die Ungleichung kψ ◦ φkop ≤ kψkop kφkop . Beweis: Wegen kφ ◦ ψkop =
sup
k(φ ◦ ψ)(v)kW
kvkV ≤1
gilt f¨ ur kvkV ≤ 1: k(φ ◦ ψ)(v)kW
=
kφ(ψ(v))kW ≤ kψ(v)kU kφkop |{z}
≤
kvkV kψkop kφkop ≤ kψkop kφkop
∈U
und daher kφ ◦ ψkop ≤ kψkop kφkop .
Bemerkung 10.3.10 : Sei 0 < kvkV ≤ 1, dann gilt kφ( Also haben wir sup kv 0 kV =1
1 v )kW = kφ(v)kW ≥ kφ(v)kW . kvkV kvkV
kφ(v 0 )kW ≥
Dies zeigt kφkop = sup kvkV =1 kφ(v)kW .
sup kvkV ≤1
kφ(v)kW ≥
sup kvkV =1
kφ(v)kW .
Kapitel 11
Differenzierbarkeit 11.1
Differenzierbarkeit und Ableitung
Seien (V, k · kV ) und (W, k · kW ) endlichdimensionale normierte R-Vektorr¨aume und U ⊆ V eine offene Teilmenge. Eine Abbildung f : U → W heißt differenzierbar im Punkt x ∈ U , wenn es eine lineare Abbildung φ ∈ HomR (V, W ) gibt mit ¢ 1 ¡ f (x + h) − f (x) − φ(h) = 0 V 3h→0 khkV lim
(11.1)
Bemerkung 11.1.1 : (i) Der Ausdruck (11.1) ist sinnvoll, weil x + h f¨ ur kleine h in U liegt. (ii) Man kann in (11.1) die Normen auf V und W durch beliebige andere (die automatisch ¨aquivalent sind) ersetzen, ohne etwas am Wahrheitsgehalt zu ¨andern. D.h. (11.1) gilt entweder f¨ ur jedes oder ¨ f¨ ur kein Paar von Normen auf V und W .(Ubung!) (iii) Die Abbildung φ wird durch (11.1) eindeutig bestimmt: Sei n¨amlich ψ ∈ HomR (V, W ) mit 1 (f (x + h) − f (x) − ψ(h)) = 0, V 3h→0 khkV lim
dann gilt limV 3h→0
1 khkV
(ψ(h) − φ(h)) = 0. F¨ ur ein festes y ∈ V \ {0} folgt
kψ(y) − φ(y)kW 1 = lim kψ(ty) − φ(ty)kW = 0, R3t→0 ktykV kykV also ψ(y) − φ(y) = 0. Dies zeigt ψ = φ.
Mit Bemerkung 11.1.1 ist es jetzt sinnvoll, die lineare Abbildung φ aus (11.1) die Ableitung von f in x zu nennen und mit f 0 (x) zu bezeichnen. Wenn f : U → W in jedem x ∈ U differenzierbar ist, sagen wir f : U → W ist differenzierbar und nennen die resultierende Abbildung f 0 : U → HomR (V, W ) die Ableitung von f . Beispiel 11.1.2 : Seien (V, k · kV ) und (W, k · kW ) endlichdimensionale normierte R-Vektorr¨aume. 213
214
KAPITEL 11. DIFFERENZIERBARKEIT
(i) Sei f : V → W konstant. Wegen f (x + h) − f (x) − 0 = 0 f¨ ur alle x, h ∈ V ist f differenzierbar und es gilt ∀x ∈ V : f 0 (x) = 0. (ii) Sei φ : V → W linear. Wegen φ(x + h) − φ(x) − φ(h) = 0 f¨ ur alle x, h ∈ V ist φ differenzierbar und es gilt ∀x ∈ V : φ0 (x) = φ. (iii) Seien (Wj , k·kj ), j = 1, . . . , k endlichdimensionale normierte R-Vektorr¨aume mit W = W1 ×. . .×Wk und k(w1 , . . . , wk )kW = max{kwj kj | j = 1, . . . , k}. Wenn jetzt U ⊆ V offen ist und fj : U → Wj in x ∈ U differenzierbar, dann ist die Abbildung f : U → W,
v 7→ (f1 (v), . . . , fk (v))
differenzierbar in x und es gilt f 0 (x) : V → W,
v 7→ (f10 (x)v, . . . , fk0 (x)v).
In dieser Situation schreiben wir f = (f1 , . . . , fk ) und f 0 (x) = (f10 (x), . . . , fk0 (x)) oder, wenn die fj auf ganz U differenzierbar sind, f 0 = (f10 , . . . , fk0 ).
Die folgenden Rechenregeln lassen sich ¨ahnlich wie im Eindimensionalen beweisen: Proposition 11.1.3 : Seien (V, k · kV ) und (W, k · kW ) endlichdimensionale normierte R-Vektorr¨ aume und U ⊆ V eine offene Teilmenge. Wenn die Abbildungen f, g : U → W in x ∈ U differenzierbar sind und r ∈ R, dann sind auch f ± g : U → W und rf : U → W in x differenzierbar und es gilt (f ± g)0 (x) = f 0 (x) ± g 0 (x),
(rf )0 (x) = rf 0 (x).
Beweis: Wegen (f ± g)(x + h) − (f ± g)(x) − (f 0 (x) ± g 0 (x))h = khkV f (x + h) − f (x) − f 0 (x)h g(x + h) − g(x) − g 0 (x)h = ± khkV khkV und
(rf )(x + h) − (rf )(x) − (rf 0 (x))h f (x + h) − f (x) − f 0 (x)h =r khkV khkV
folgt dies sofort aus den Definitionen.
Insbesondere sehen wir, daß die Menge der in x ∈ U (bzw. in ganz U ) differenzierbaren Funktionen f : U → W ein Vektorraum ist. Proposition 11.1.4 (Kettenregel): Seien (V1 , k · k1 ), (V2 , k · k2 ) und (V3 , k · k3 ) endlichdimensionale normierte R-Vektorr¨ aume sowie U1 ⊆ V1 und U2 ⊆ V2 offene Teilmengen. Wir nehmen an, daß die Abbildung f1 : U1 → V2 in x ∈ U1 differenzierbar ist und f1 (x) ∈ U2 gilt. Wenn die Abbildung f2 : U2 → V3 in f1 (x) in differenzierbar ist, dann ist f2 ◦ f1 : U1 → V3 in x differenzierbar und es gilt (f2 ◦ f1 )0 (x) = f20 (f1 (x)) ◦ f10 (x).
11.1. DIFFERENZIERBARKEIT UND ABLEITUNG
215
Beweis: Idee: In den definierenden Ausdruck der Ableitung von f2 ◦f1 den Term f20 (f1 (x))(f1 (x+h)−f1 (x)) mit + und − einbauen, das Ganze in zwei Summen aufteilen und dann f¨ ur f20 (f1 (x)) die Operatornorm ben¨ utzen.
F¨ ur hinreichend kleines h ∈ V1 setzen wir k(h) := f1 (x + h) − f1 (x) und rechnen mit Proposition 10.3.8 k(f2 ◦ f1 )(x + h) − (f2 ◦ f1 )(x) − f20 (f1 (x)) ◦ f10 (x)hk3 = ≤ k(f2 (f1 (x) + k(h)) − f2 (f1 (x)) − f20 (f1 (x))k(h) + f20 (f1 (x))(k(h) − f10 (x)h)k3 ≤ k(f2 (f1 (x) + k(h)) − f2 (f1 (x)) − f20 (f1 (x))k(h)k3 +kf20 (f1 (x))kop kf1 (x + h) − f1 (x) − f10 (x)h)k2 . Beachte, daß kk(h)k2 kf1 (x + h) − f1 (x) − f10 (x)hk2 + kf10 (x)kop khk1 ≤ khk1 khk1 f¨ ur h → 0 gegen kf10 (x)kop konvergiert, also beschr¨ankt ist. Damit sieht man, daß k(f2 ◦ f1 )(x + h) − (f2 ◦ f1 )(x) − f20 (f1 (x)) ◦ f10 (x)hk3 khk1 f¨ ur h → 0 gegen 0 konvergiert, und dies zeigt die Behauptung.
Die Produktregel ist etwas schwerer zu verallgemeinern als die Kettenregel. Die Schl¨ usselidee daf¨ ur steckt in folgendem Lemma. Lemma 11.1.5 : Seien (V1 , k · k1 ), (V2 , k · k2 ) und (W, k · kW ) endlichdimensionale normierte R-Vektorr¨ aume. Weiter sei β : V1 × V2 → W bilinear, d.h. f¨ ur alle r1 , r10 , r2 , r20 ∈ R, x1 , x01 ∈ V1 , x2 , x02 ∈ V2 gilt β(r1 x1 + r10 x01 , r2 x2 + r20 x02 ) = r1 r2 β(x1 , x2 ) + r10 r2 β(x01 , x2 ) + r1 r20 β(x1 , x02 ) + r10 r20 β(x01 , x02 ). (i) k(x1 , x2 )k := max(kx1 k1 , kx2 k2 ) definiert eine Norm auf V1 × V2 . (ii) Es gibt eine Konstante M > 0 mit ∀x1 ∈ V1 , x2 ∈ V2 :
kβ(x1 , x2 )kW ≤ M kx1 k1 kx2 k2 .
(iii) β ist differenzierbar mit β 0 (x1 , x2 )(h1 , h2 ) = β(x1 , h2 ) + β(h1 , x2 ). Beweis: Idee: Betrachte die bilineare Abbildung als Element von HomR (V1 , HomR (V2 , W )) und betrachte die passende Operatornorm auf diesem Raum. Damit findet man (ii) und den Rest erh¨ alt man durch nachrechnen. ¨ Die erste Behauptung ist ganz einfach zu verifizieren (Ubung). F¨ ur die zweite stellen wir zun¨achst fest, daß x2 7→ β(x1 , x2 ) f¨ ur jedes x1 ∈ V1 linear ist, also ein Element von HomR (V2 , W ) definiert. Betrachte jetzt die ebenfalls lineare Abbildung βˆ : V1 → HomR (V2 , W ),
x1 7→ (x2 7→ β(x1 , x2 ))
216
KAPITEL 11. DIFFERENZIERBARKEIT Wenn wir die Operatornorm auf HomR (V2 , W ) mit k · kop2 und die Operatornorm auf dem Raum HomR (V1 , HomR (V2 , W )) mit k · kop1 bezeichnen, finden wir mit Proposition 10.3.8 ˆ 1 )(x2 )kW ≤ kβ(x ˆ 1 )kop2 kx2 k2 ≤ kβk ˆ op1 kx1 k1 kx2 k2 kβ(x1 , x2 )kW = kβ(x ˆ op1 . und die Behauptung folgt mit M = kβk Um (iii) zu zeigen, rechnen wir wie folgt: 1 kβ(x1 + h1 , x2 + h2 ) − β(x1 , x2 ) − (β(x1 , h2 ) + β(h1 , x2 ))kW = k(h1 , h2 )k 1 kβ(h1 , h2 )kW = max(kh1 k1 , kh2 k2 ) 1 ≤ M kh1 k1 kh2 k2 max(kh1 k1 , kh2 k2 ) ≤ M max(kh1 k1 , kh2 k2 ) = M k(h1 , h2 )k Wenn (h1 , h2 ) gegen Null geht, dann geht auch dieser Ausdruck gegen Null und das beweist auch den letzten Teil des Lemmas.
Beispiel 11.1.6 : F¨ ur n, m ∈ N und K gleich R oder C sei Mat(n × m; K) der Vektorraum der n × mMatrizen mit Eintr¨agen in K, jeweils betrachtet als reeller (endlichdimensionaler) Vektorraum. Dann ist die Matrizenmultiplikation µ : Mat(n × m; K) × Mat(m × l; K) → Mat(n × l; K),
(A, B) 7→ AB
differenzierbar.
Proposition 11.1.7 (Produktregel): Seien (V, k · kV ), (V1 , k · k1 ), (V2 , k · k2 ) und (W, k · kW ) endlichdimensionale normierte R-Vektorr¨ aume sowie β : V1 × V2 → W bilinear. Weiter seien f1 : U → V1 und f2 : U → V2 differenzierbar in x ∈ U , wobei U ⊆ V offen ist. Dann ist die Abbildung µ : U → W, in x differenzierbar mit
y 7→ β(f1 (y), f2 (y))
µ0 (x)v = β(f10 (x)v, f2 (x)) + β(f1 (x), f20 (x)v).
Beweis: Idee: Schreibe µ als Hintereinanderschaltung der linearen Abbildung y 7→ (y, y), der bilinearen Abbildung β und der durch die Komponenten f1 und f2 gegebenen Abbildung und verwende die Kettenregel. Betrachte µ als Hintereinschaltung der Abbildungen d: f:
U → V × V, y 7→ (y, y) U × U → V1 × V2 , (u1 , u2 ) 7→ (f (u1 ), f (u2 ))
β:
V1 × V2 → W, (x1 , x2 ) 7→ β(x1 , x2 )
Die Abbildung d ist linear, also differenzierbar nach Beispiel 11.1.2(ii) mit d0 (x)v = d(v) = (v, v).
11.1. DIFFERENZIERBARKEIT UND ABLEITUNG
217
F¨ ur f weiß man aus Beispiel 11.1.2(iii), daß f in (x, x) differenzierbar ist mit Ableitung f 0 (x, x)(v1 , v2 ) = (f10 (x)v1 , f20 (x)v2 ). Die Ableitung von β ist nach Lemma 11.1.5 durch β 0 (x1 , x2 )(v1 , v2 ) = β(x1 , v2 ) + β(v1 , x2 ) gegeben. Jetzt liefert die Kettenregel 11.1.4 µ0 (x)v
= =
(β ◦ f ◦ d)0 (x)v (β ◦ f )0 (d(x))(v, v)
= =
β 0 (f1 (x), f2 (x))(f10 (x)v, f20 (x)v) β(f1 (x), f20 (x)v) + β(f10 (x)v, f2 (x)).
¨ Ubung 11.1.1 : Seien V1 , . . . , Vk und W endlichdimensionale Vektorr¨ aume. Eine Abbildung β : ×kj=1 Vj → W heißt k-linear, wenn f¨ ur jedes j ∈ {1, . . . , k} und alle v1 ∈ V1 , . . . , vj−1 ∈ Vj−1 , vj+1 ∈ Vj+1 , . . . , vk ∈ Vk die Abbildung Vj → W,
v 7→ β(v1 , . . . , vj−1 , v, vj+1 , . . . vk )
linear ist. (i) Zeige, daß det : Mat(k × k, R) → R,
A 7→ detA
eine k-lineare Abbildung ist. (ii) Sei β : R3 × R3 × R3 → R eine 3-lineare Abbildung. Zeige, daß es eine Konstante c ≥ 0 gibt mit |β(v1 , v2 , v3 )| ≤ ckv1 kkv2 kkv3 k. (iii) Sei β : R3 × R3 × R3 → R eine 3-lineare Abbildung. Zeige, daß β differenzierbar ist mit β 0 (v1 , v2 , v3 )(h1 , h2 , h3 ) = β(v1 , v2 , h3 ) + β(v1 , h2 , v3 ) + β(h1 , v2 , v3 ). (iv) Zeige, daß det : Mat(3 × 3, R) → R,
A 7→ detA
differenzierbar ist und berechne die Ableitung. (v) Zeige, daß jede k-lineare Abbildung β : ×kj=1 Vj → W differenzierbar ist und berechne die Ableitung. (vi) Berechne die Ableitung der Abbildung Mat(k × k; R) → R,
A 7→ detA.
¨ Ubung 11.1.2 : Sei C = (cij )i,j=1,...n eine symmetrische n × n Matrix und f (x) := hx, Cxi =
n X
cij xi xj
i,j=1
die zugeh¨ orige quadratische Form f : Rn → R. Zeige, daß f auf ganz Rn differenzierbar ist.
218
KAPITEL 11. DIFFERENZIERBARKEIT
¨ Ubung 11.1.3 : Sei f : R → R eine Abbildung. Zeige, daß f genau dann differenzierbar ist, wenn f differenzierbar im Sinne der Definition aus Kapitel 3 ist. ¨ Ubung 11.1.4 : Definiere f : Rn \ {0} → R durch f (x) =
1 x, kxk2
wobei k · k die euklidische Norm ist. Zeige:
(i) Die Funktion f ist an jeder Stelle x 6= 0 differenzierbar. (ii) Die Abbildung kxk2 f 0 (x) ist orthogonal. ¨ Ubung 11.1.5 : Sei V ein endlichdimensionaler Vektorraum. Eine Funktion f : V → R heißt homogen vom Grade p, wenn f¨ ur jedes reelle λ > 0 und f¨ ur jedes x ∈ V die Beziehung f (λx) = λp f (x) gilt. Zeige: Ist f homogen vom Grade p und differenzierbar, so gilt f 0 (x)x = pf (x) ¨ Ubung 11.1.6 : Definiere
Sei V ein endlichdimensionaler Vektorraum, W := HomR (V, V ) und φ ∈ W fest gew¨ ahlt.
F : W → W, (i) Zeige, daß F differenzierbar ist und berechne F 0 , (ii) Zeige, daß detF 0 (ψ) = (det(φ))n .
ψ 7→ φ ◦ ψ.
Lemma 11.1.8 (Mittelwertsatz fu ¨ r vektorwertige Funktionen): Sei (W, k · kW ) ein endlichdimensionaler normierter R-Vektorraum, [a, b] ⊆ R ein kompaktes Intervall sowie f : [a, b] → W stetig und differenzierbar auf ]a, b[. Wenn ∀x ∈ ]a, b[ : kf 0 (x)kop ≤ M, dann gilt kf (b) − f (a)kW ≤ M (b − a). Beweis: Idee: Zeige kf (b) − f (e a)kW ≤ M (b − e a) + ²(b − e a) f¨ ur ² > 0 und e a ∈]a, b[. Dann betrachte e a→a und ² → 0.
Wir zeigen, daß f¨ ur jedes ² > 0 und jedes e a ∈]a, b[ gilt (∗)
kf (b) − f (e a)kW ≤ M (b − e a) + ²(b − e a).
Betrachte dazu die Menge X := {x ∈ [e a, b] | (∀y ∈ [e a, x]) kf (y) − f (e a)kW ≤ M (y − e a) + ²(y − e a)}, die wegen der Stetigkeit von f nach Proposition 10.2.6 abgeschlossen ist. Es gilt e a ∈ X, d.h. X 6= ∅, und c := sup X ∈ X. Wir wollen zeigen, daß c = b. Wenn c < b, dann finden wir nach Voraussetzung ein δ > 0 mit ∀z ∈ [c, c + δ] :
kf (z) − f (c) − f 0 (c)(z − c)kW ≤ ²(z − c).
F¨ ur solche z rechnen wir mit Proposition 10.3.8 kf (z) − f (e a)kW
≤ kf (z) − f (c)kW + kf (c) − f (e a)kW ≤ kf (z) − f (c) − f 0 (c)(z − c)kW + kf 0 (c)(z − c)kW + kf (c) − f (e a)kW ≤ M (z − c) + ²(z − c) + M (c − a) + ²(c − e a) = M (z − e a) + ²(z − e a),
was c + δ ∈ X zeigt. Dieser Widerspruch zur Konstruktion von c beweist, daß c = b ist. Damit ist die Ungleichung (∗) gezeigt und man kann e a gegen a konvergieren lassen um die Ungleichung kf (b) − f (a)kW ≤ M (b − a) + ²(b − a) zu erhalten. Schließlich betrachtet man den Grenzwert f¨ ur ² → 0, der dann kf (b) − f (a)kW ≤ M (b − a) liefert.
11.1. DIFFERENZIERBARKEIT UND ABLEITUNG
219
Wir bemerken, daß in Lemma 11.1.8 f 0 (x) ∈ HomR (R, W ) ∼ = W gilt und mit dieser Identifikation die Operatornorm in die Norm auf W u ¨bergeht. Satz 11.1.9 (Mittelwertsatz): Seien (V, k · kV ) und (W, k · kW ) zwei endlichdimensionale normierte R-Vektorr¨ aume, U ⊆ V eine offene Teilmenge und f : U → W eine differenzierbare Abbildung. Seien x, y ∈ V mit S := {x + t(y − x) | t ∈ [0, 1]} ⊆ U . (i) Wenn kf 0 (z)kop ≤ M f¨ ur alle z ∈ S, dann gilt kf (y) − f (x)kW ≤ M ky − xkV . (ii) F¨ ur alle z ∈ S gilt kf (y) − f (x) − f 0 (z)(y − x)kW ≤ ky − xkV sup kf 0 (ξ) − f 0 (z)kop . ξ∈S
Beweis: Idee: Schr¨anke die Funktion auf die Verbindungsgerade von x nach y ein und ben¨utze Kettenregel sowie Lemma 11.1.8. Das liefert (i) und (ii) erh¨ alt aus (i), angewendet auf die Funktion ξ 7→ f (ξ) − f 0 (z)ξ. (i) Betrachte die Funktion g : [0, 1] → W,
t 7→ f (x + t(y − x)),
die auf ]0, 1[ differenzierbar ist. Nach der Kettenregel 11.1.4 gilt g 0 (t) = f 0 (x + t(y − x))(y − x). Also haben wir kg 0 (t)kW ≤ kf 0 (x + t(y − x))kop ky − xkV ≤ M ky − xkV und Lemma 11.1.8 liefert, daß kf (y) − f (x)kW = kg(1) − g(0)kW ≤ M ky − xkV (1 − 0) = M ky − xkV . (ii) Halte z ∈ S fest und wende (i) auf die Funktion g : U → W,
ξ 7→ f (ξ) − f 0 (z)ξ
an, die differenzierbar mit g 0 (ξ) = f 0 (ξ) − f 0 (z) ist.
¨ Ubung 11.1.7 : Definiere f : R2 → R2 durch f (x, y) := ex1 (cos x2 , sin x2 ). Zeige, daß es i.a. zu x, y ∈ R2 kein ξ = x + t(y − x), t ∈ [0, 1], gibt mit kf (y) − f (x)k = ky − xkkf 0 (ξ)k. 2 Hinweis: Betrachte x, y ∈ R mit y − x = (0, 2π). ¨ ur skalarwertige Funktionen: Sei V ein endlichdimensionaler VekUbung 11.1.8 : Beweise den Mittelwertsatz f¨ torraum, U ⊂ V offen und f : U → R eine differenzierbare Funktion. Weiter sei x, y ∈ U derart, daß die Verbindungsstrecke {x + t(y − x)|t ∈ [0, 1]} in U enthalten ist. Dann gibt es ein t0 ∈ [0, 1], so daß f¨ ur ξ = x + t0 (y − x) gilt: f (y) − f (x) = f 0 (ξ)(y − x). ¨ Ubung 11.1.9 : Eine Teilmenge M eines Vektorraums V heißt konvex, wenn aus x, y ∈ M folgt, daß auch die Verbindungsstrecke {x + t(y − x)|t ∈ [0, 1]} in M enthalten ist. Sei U eine offene und konvexe Teilmenge des endlichdimensionalen normierten R-Vektorraums V und sei f : U → R eine differenzierbare Funktion mit f 0 (x) = 0 f¨ ur alle x ∈ U . (i) Zeige, daß f konstant ist. (ii) Zeige durch Angabe eines Gegenbeispiels, daß diese Aussage falsch wird, wenn U nicht als konvex vorausgesetzt wird.
220
KAPITEL 11. DIFFERENZIERBARKEIT
11.2
H¨ ohere Ableitungen
Seien (V, k · kV ) und (W, k · kW ) endlichdimensionale normierte R-Vektorr¨aume und U ⊆ V eine offene Teilmenge. Eine Abbildung f : U → W heißt zweimal differenzierbar im Punkt x ∈ U , wenn es eine offene Umgebung Uo von x in V gibt, f¨ ur die f |Uo : Uo → W differenzierbar ist und f 0 : Uo → HomR (V, W ) differenzierbar in x. Uo
U
f
W
Die Ableitung von f 0 in x heißt die zweite Ableitung von f in x und wird mit f 00 (x) bezeichnet. Beachte, daß f 00 (x) ∈ HomR (V, HomR (V, W )). Bemerkung 11.2.1 : Seien (V1 , k · k1 ), (V2 , k · k2 ) und (W, k · kW ) endlichdimensionale normierte RVektorr¨aume. Wir bezeichnen den R-Vektorraum aller R-bilinearen Abbildungen V1 × V2 → W mit L(V1 , V2 ; W ). Wenn V1 = V2 , dann schreiben wir einfach L2 (V ; W ). Betrachte die Abbildung ¡ ¢ Φ : HomR (V1 , HomR (V2 , W )) → L(V1 , V2 ; W ), φ 7→ (v1 , v2 ) 7→ φ(v1 )(v2 ) . Man verifiziert sofort, daß Φ linear ist. Weiter stellt man fest, daß sie bijektiv mit Umkehrabbildung Φ−1 : L(V1 , V2 ; W ) → HomR (V1 , HomR (V2 , W )),
β 7→ βˆ
ˆ 1 )(v2 ) = β(v1 , v2 ) wie im Beweis von Lemma 11.1.5 ist. Also ist Φ ein linearer Isomorphisist, wobei β(v mus, den man dazu ben¨ utzen kann, die Operatornorm von HomR (V1 , HomR (V2 , W )) auf L(V1 , V2 ; W ) zu u ¨bertragen: kµkop := kΦ−1 (µ)kop . Es gilt dann (vgl. Lemma 11.1.5) kβkop =
ˆ 1 )kop = sup kβ(v kv1 k1 ≤1
ˆ 1 ))(v2 )kop ) = sup{β(v1 , v2 )kW | kv1 k1 , kv2 k2 ≤ 1}. sup ( sup k(β(v kv1 k1 ≤1 kv2 k2 ≤1
Bemerkung 11.2.1 erlaubt es uns, die normierten R¨aume HomR (V1 , HomR (V2 , W )) und L(V1 , V2 ; W ) identifizieren. Insbesondere betrachten wir die zweite Ableitung einer Funktion f : U → W in x als Element von L2 (V ; W ) und schreiben ¡ ¢ f 00 (x)(v1 , v2 ) := (f 00 (x))(v1 ) (v2 ). aume und Satz 11.2.2 : Seien (V, k · kV ) und (W, k · kW ) endlich dimensionale normierte R-Vektorr¨ U ⊆ V eine offene Teilmenge. Wenn f : U → W in x ∈ U zweimal differenzierbar ist, dann ist f 00 (x) symmetrisch, d.h. ∀v1 , v2 ∈ V : f 00 (x)(v1 , v2 ) = f 00 (x)(v2 , v1 ). Beweis: Idee: Betrachte die Funktion g(t) = f (x + tv1 + v2 ) − f (x + tv1 ) und zeige (mit dem Mittelwertsatz) kg 0 (t) − f 00 (x)(v2 , v1 )kW ≤ 2²(kv1 kV + kv2 kV )kv1 kV f¨ ur ² > 0 dazu passend kleine vi . Wieder mit dem Mittelwertsatz findet man kg(1)−g(0)−f 00 (x)(v2 , v1 )kW ≤ 6²(kv1 kV +kv2 kV )kv1 kV und da g(1)−g(0) in v1 und v2 symmetrisch ist, erh¨ alt man eine Absch¨ atzung f¨ ur kf 00 (x)(v1 , v2 ) − f 00 (x)(v2 , v1 )kW , mit der Bilinearit¨ at f¨ ur ² → 0 die Behauptung liefert.
W¨ahle ein r > 0 mit B(x; 2r) ⊆ U sowie v1 , v2 ∈ B(0; r) ⊆ V und betrachte die Funktion g : ] − 2, 2[→ W, t 7→ f (x + tv1 + v2 ) − f (x + tv1 ).
¨ 11.2. HOHERE ABLEITUNGEN
221
x+v1
x
x+v2
Mit dem Mittelwertsatz 11.1.9 erhalten wir kg(1) − g(0) − g 0 (0)kW ≤ sup kg 0 (t) − g 0 (0)kW . t∈[0,1]
Die Kettenregel 11.1.4 liefert zusammen mit Proposition 11.1.2 g 0 (t) = (f 0 (x + tv1 + v2 ) − f 0 (x + tv1 ))v1 = (f 0 (x + tv1 + v2 ) − f 0 (x) − f 00 (x)(tv1 ))v1 −(f 0 (x + tv1 ) − f 0 (x) − f 00 (x)(tv1 ))v1 Nach Voraussetzung gibt es zu jedem ² > 0 ein 1 ≥ δ > 0 mit der Eigenschaft, daß f¨ ur kv1 kV , kv2 kV ≤ δ und t ∈ [0, 1] gilt kf 0 (x + tv1 + v2 ) − f 0 (x) − f 00 (x)(tv1 + v2 )kop kf 0 (x + tv1 ) − f 0 (x) − f 00 (x)(tv1 )kop
≤ ≤
²ktv1 + v2 kV ≤ ²(kv1 kV + kv2 kV ) ²kv1 kV .
Daraus folgt zun¨achst ¡ ¢ = k f 0 (x + tv1 + v2 ) − f 0 (x) − f 00 (x)(tv1 + v2 ) (v1 ) ¡ ¢ − f 0 (x + tv1 ) − f 0 (x) − f 00 (x)(tv1 ) (v1 )kW ≤ 2²(kv1 kV + kv2 kV )kv1 kV
kg 0 (t) − f 00 (x)(v2 , v1 )kW
und dann, mit g 0 (0) ∈ HomR (R, W ) ∼ = W und Satz 11.1.9(ii)
sup kg 0 (t) − g 0 (0)kW
≤
t∈[0,1]
sup (kg 0 (t) − f 00 (x)(v2 , v1 )kW + kg 0 (0) − f 00 (x)(v2 , v1 )kW ) t∈[0,1]
≤
4²(kv1 kV + kv2 kV )kv1 kV .
Jetzt finden wir kg(1) − g(0) − f 00 (x)(v2 , v1 )kW
≤ kg(1) − g(0) − g 0 (0)kW + kg 0 (0) − f 00 (x)(v2 , v1 )kW ≤ 6²(kv1 kV + kv2 kV )kv1 kV .
Da aber g(1) − g(0) = f (x + v1 + v2 ) − f (x + v1 ) − f (x + v2 ) + f (x) symmetrisch in v1 und v2 ist, k¨onnen wir in obiger Absch¨atzung die Rollen von v1 und v2 vertauschen und erhalten kf 00 (x)(v1 , v2 ) − f 00 (x)(v2 , v1 )kW ≤ ≤ kg(1) − g(0) − f 00 (x)(v2 , v1 )kW + kg(1) − g(0) − f 00 (x)(v1 , v2 )kW ≤ =
6²(kv1 kV + kv2 kV )kv1 kV + 6²(kv1 kV + kv2 kV )kv2 kV 6²(kv1 kV + kv2 kV )2
222
KAPITEL 11. DIFFERENZIERBARKEIT f¨ ur kv1 kV , kv2 kV ≤ δ. Wenn v1 , v2 ∈ V beliebig sind, wenden wir obiges Argument auf und kv2δkV v2 an. Dies liefert µ ° ° 00 °f (x)
δ δ v1 , v2 kv1 kV kv2 kV
¶
µ − f 00 (x)
δ kv1 kV
v1
¶° δ δ ° v2 , v1 ° ≤ 6²(2δ)2 , kv2 kV kv1 kV W
also kf 00 (x)(v1 , v2 ) − f 00 (x)(v2 , v1 )kW ≤ 24²kv1 kV kv2 kV . Da ² > 0 beliebig war, folgt f 00 (x)(v1 , v2 ) = f 00 (x)(v2 , v1 ), also die Behauptung.
F¨ ur h¨ohere Ableitungen gehen wir ausgehend von Satz 11.2.2 induktiv vor: Als erstes verallgemeinern wir die Bemerkung 11.2.1: Bemerkung 11.2.3 : Seien (V1 , k · k1 ), . . . , (Vk , k · kk ) und (W, k · kW ) endlichdimensionale normierte RVektorr¨aume. Wir bezeichnen den R-Vektorraum aller reell k-linearen Abbildungen V1 ×. . .×Vk → W mit L(V1 , . . . , Vk ; W ). Wenn V1 = . . . = Vk , dann schreiben wir einfach Lk (V ; W ). Wie in Bemerkung 11.2.1 haben wir einen Isomorphismus ¡ ¢ Φ : HomR (V1 , L(V2 , . . . , Vk ; W )) → L(V1 , . . . , Vk ; W ), φ 7→ (v1 , . . . , vk ) 7→ φ(v1 )(v2 , . . . , vk ) mit Umkehrabbildung Φ−1 : L(V1 , . . . , Vk ; W ) → HomR (V1 , L(V2 , . . . , Vk ; W )), wobei
ˆ β 7→ β,
ˆ 1 )(v2 , . . . , vk ) = β(v1 , . . . , vk ). β(v
¨ Ubertr¨ agt man die Operatornormen auf L(V1 , . . . , Vk ; W ), so findet man kµkop = sup{kµ(v1 , . . . , vk )kW | kv1 k1 , . . . , kvk kk ≤ 1}. Ganz ¨ahnlich wie im Falle von linearen und bilinearen Abbildung kann man multilineare Abbildung bzgl. gew¨ ahlter Basen durch Zahlentupel darstellen. Diese lassen sich i.a. aber nicht mehr in nat¨ urlicher Weise als Matrizen schreiben: man hat mehr als zwei Indizes (man spricht auch von Tensoren). Damit identifizieren wir die normierten R¨aume HomR (V1 , L(V1 , . . . , Vk ; W )) und
L(V1 , . . . , Vk ; W ).
Seien jetzt wieder (V, k·kV ) und (W, k·kW ) endlichdimensionale normierte R-Vektorr¨aume und U ⊆ V eine offene Teilmenge. Eine Abbildung f : U → W heißt n-mal differenzierbar im Punkt x ∈ U , wenn es eine offene Umgebung Uo von x in V gibt, f¨ ur die f |Uo : Uo → W (n − 1)-mal differenzierbar ist und ihre (n − 1)-te Ableitung f (n−1) : Uo → Ln−1 (V ; W ) differenzierbar in x ist. Die Ableitung von f (n−1) in x heißt die n-te Ableitung von f in x und wird mit f (n) (x) bezeichnet. Beachte, daß f (n) (x) ∈ HomR (V1 , L(V1 , . . . , Vk ; W )) ∼ = Ln (V ; W ). Eine n-mal differenzierbare Funktion f : U → W heißt n-mal stetig differenzierbar, wenn f (n) : U → Ln (V, W ) stetig ist. Mit der Identifikation HomR (V, Ln−1 (V ; W )) ∼ = Ln (V ; W ) gilt dann
¡ ¢ f (n) (x)(v1 , . . . , vn ) = f (n) (x)(v1 ) (v2 , . . . , vn ).
¨ 11.2. HOHERE ABLEITUNGEN
223
Sei U 0 ⊆ W offen. Die Menge der n-mal stetig differenzierbaren Funktionen f : U → U 0 ⊆ W wird mit C n (U, U 0 ) bezeichnet. Mit Proposition 11.1.3 und Induktion sieht man sofort, daß C n (U, W ) ein R-Vektorraum ist. Wenn f ∈ C n (U, U 0 ) eine Umkehrfunktion C n (U 0 , U ) hat, so heißt f ein C n – T∞ in ∞ n Diffeomorphismus. Die Abbildungen in C (U, W ) := n=0 C (U, W ) heißen unendlich oft differenzierbar oder glatt. Wenn der Bildbereich aus dem Kontext klar ist, schreibt man einfach C ∞ (U ).
Bemerkung 11.2.4 : Seien V, W endlichdimensionale normierte Vektorr¨aume, und f : V → W stetig differenzierbar. Mit Bemerkung 7.3.7 und dem Hauptsatz 9.1.4 der Differential- und Integralrechnung sieht man, daß f¨ ur x, y ∈ V gilt: µZ 1 ¶ 0 f (y) − f (x) = f (x + t(y − x))dt (y − x). 0
Satz 11.2.5 (Taylorformel in mehreren Variablen): Seien (V, k · kV ) und (W, k · kW ) endlichdimensionale normierte R-Vektorr¨ aume sowie U ⊆ V eine offene Teilmenge. Weiter sei f ∈ C n (U, W ) und x ∈ U . Setze Z 1 1 Rn (x, h) := (1 + t)n−1 f (n) (x + th) (h, . . . , h) dt. | {z } (n − 1)! 0 n−mal
Dann gilt f¨ ur jedes h ∈ V mit x + [0, 1]h ⊆ U f (x + h) = f (x) +
f 0 (x) f 00 (x) f (n−1) (x) (h) + (h, h) + . . . + (h, . . . , h) +Rn (x, h). 1! 2! (n − 1)! | {z } (n−1)−mal
Wenn kf (n) (x + th)kop ≤ M f¨ ur alle t ∈]0, 1[, dann gilt kRn (x, h)kW ≤ C
M khknV n!
mit einer Konstante C, die nur von der Wahl der Norm k · kW abh¨ angt. Beweis: Idee: F¨uhre den Satz zuerst auf den Fall W = R und x = 0 zur¨uck. Dann betrachte die Funktion g(t) = f (th) und dr¨ ucke die j-te Ableitung von g durch die j-te Ableitung von f aus (Induktion und Kettenregel). Damit folgt der Satz dann aus Taylorformel in einer Variablen und der zugeh¨ origen Absch¨ atzung des Restterms. Indem wir eine Basis f¨ ur W w¨ahlen und den Satz f¨ ur die Komponentenfunktionen beweisen, k¨onnen wir o.B.d.A. annehmen, daß W = R. An dieser Stelle kommt die Konstante C ins Spiel, denn die Absch¨atzung f¨ ur C = 1 erh¨alt man, wenn W die Maximumsnorm bzgl. der Komponenten tr¨agt - jede andere Norm ist aber ¨aquivalent. Ersetzen wir außerdem f durch z 7→ f (z + x), k¨onnen wir außerdem auch noch o.B.d.A. annehmen, daß x = 0. Jetzt betrachten wir f¨ ur ein kleines ² > 0 die Funktion g : ] − ², 1 + ²[→ R,
t 7→ f (th).
Mit der Kettenregel 11.1.4, angewandt auf g = f ◦ φh mit φh : ] − ², 1 + ²[→ V, φ0h :
t 7→ th,
] − ², 1 + ²[→ HomR (R, V ) ∼ = V,
sehen wir, daß g differenzierbar ist mit Ableitung g 0 (t) = f 0 (th)h.
t 7→ h,
224
KAPITEL 11. DIFFERENZIERBARKEIT Wir zeigen mit Induktion, daß g (j) (t) = f (j) (th) (h, . . . , h) . | {z }
(∗j )
j−mal
F¨ ur j = 1 ist das die obige Formel f¨ ur g 0 (t). Wenn (∗j ) gilt, schreiben wir g (j) = evh ◦ f (j) ◦ φh : ] − ², 1 + ²[→ Lj (V ; R) → R mit der linearen Abbildung evh : Lj (V ; R) → R,
β 7→ β(h, . . . , h).
Die Kettenregel 11.1.4 liefert zusammen mit Beispiel 11.1.2 jetzt g (j+1) (t) =
¡ ¢ ev0h f (j) (th) ◦ f (j+1) (th) ◦ φ0h (t) | {z } ¡
f (j+1) (th)(h)
(j+1)
(th)(h) {z }
¢
=
evh f |
=
¡ (j+1) ¢ f (th)h (h, . . . , h) | {z }
∈Lj (V ;R)
(j)−mal
=
f |
(j+1)
{z
(th) (h, . . . , h), } | {z }
∈Lj+1 (V ;R) (j+1)−mal
also (∗j+1 ). Jetzt folgt die Behauptung aus der Taylorformel in einer Variablen (Satz 9.2.2) und der zugeh¨origen Absch¨atzung des Restterms (Korollar 9.2.4), angewendet auf die Funktion g, weil |g (n) (t)| = |f (n) (th) (h, . . . , h) | ≤ M khknV . | {z } n−mal
¨ Ubung 11.2.1 : Berechne die erste und zweite Ableitung der folgenden Funktionen. (i) f : R2 → R2 ,
f (x, y) = (x − y, x2 + y 2 ),
(ii) g : R3 \ {(x, y, z) ∈ R3 |z 2 = xy} → R,
g(x, y, z) = (xy − z 2 )−1 .
¨ Ubung 11.2.2 : Sei V ein endlichdimensionaler Vektorraum und φ ∈ HomR (V, V ). Berechne φ00 . ¨ Ubung 11.2.3 : Berechne die erste und zweite Ableitung der folgenden Funktionen. (i) f : R2 → R2 ,
f (x, y) = (x2 , y 2 ),
(ii) g : Rn → R,
g(x) = ehx,Axi , wobei A eine symmetrische n × n Matrix ist,
(iii) h : Rn → R,
h(x) = sin(kxk2 ), wobei k · k die euklidische Norm auf Rn ist.
11.3. PARTIELLE ABLEITUNGEN
11.3
225
Partielle Ableitungen
Seien (V, k · kV ) und (W, k · kW ) endlichdimensionale normierte R-Vektorraum und V von der Form V = V1 × . . . × Vd , wobei die (Vj , k · kj ) ebenfalls endlichdimensionale normierte R-Vektorr¨aume sind. Weiter sei U ⊆ V offen und a = (a1 , . . . , ad ) ∈ U . Eine Funktion f : U → W heißt in a partiell nach der j-ten Variablen differenzierbar, wenn die Funktion xj 7→ f (a1 , . . . , aj−1 , xj , aj+1 , . . . , ad ) in aj ∈ Vj differenzierbar ist. Diese Funktion ist definiert in der offenen Teilmenge {y ∈ Vj | (a1 , . . . , aj−1 , y, aj+1 , . . . ad ) ∈ U } von Vj . Ihre Ableitung in aj wird mit Dj f (a) bezeichnet und die j-te partielle Ableitung in a genannt. Es gilt dann Dj f (a) ∈ Hom(Vj , W ). Aus den partiellen Ableitungen l¨aßt sich die Ableitung (falls sie existiert) rekonstruieren. Lemma 11.3.1 : Seien V = V1 ×. . .×Vd , W und U wie oben. Wenn f : U → W in a ∈ U differenzierbar ist, dann ist f in a auch in jeder Variablen differenzierbar und wir haben die Formel f 0 (a)(v1 , . . . , vd ) = D1 f (a)(v1 ) + . . . + Dd f (a)(vd ). Beweis: Idee: Betrachte xj 7→ (0, . . . , 0, xj , 0, . . . , 0) und ben¨utze die Kettenregel. |{z} j−te
Betrachte die linearen Abbildungen ιj : Vj → V,
xj 7→ (0, . . . , 0, xj , 0, . . . , 0). |{z} j−te V2
a
V1
Damit gilt f (a1 , . . . , aj−1 , xj , aj+1 , . . . , ad ) = f (a + ιj (xj − aj )). Mit der Kettenregel 11.1.4 und Beispiel 11.1.2 folgt also Dj f (a) = f 0 (a) ◦ ιj . Wegen (v1 , . . . , vd ) =
d X j=1
folgt schließlich die Behauptung.
ιj (vj )
(11.2)
226
KAPITEL 11. DIFFERENZIERBARKEIT
Die Umkehrung von Lemma 11.3.1 ist nicht richtig, wie das folgende Beispiel zeigt. Beispiel 11.3.2 : Betrachte die Funktion ½ 2
f : R → R,
(x, y) 7→
xy x2 +y 2
0
falls (x, y) 6= (0, 0) falls (x, y) = (0, 0)
Dann ist f in (0, 0) in beiden Variablen partiell differenzierbar mit D1 f (0, 0) = D2 f (0, 0) = 0, aber f ist in (0, 0) nicht differenzierbar, ja nicht einmal stetig: Zum Beispiel konvergiert f (x, x) = gegen 0 f¨ ur x → 0.
1 2
nicht
Es ist m¨oglich, eine Umkehrung von Lemma 11.3.1 zu zeigen, wenn man die Voraussetzungen etwas versch¨arft. Was wir hier brauchen, ist die stetige Differenzierbarkeit Satz 11.3.3 : Seien (V, k · kV ) und (W, k · kW ) endlichdimensionale normierte R-Vektorraum und V von der Form V = V1 × . . . × Vd , wobei die (Vj , k · kj ) ebenfalls endlichdimensionale normierte R-Vektorr¨ aume sind. Weiter sei U ⊆ V offen und f : U → W eine Abbildung. Dann sind folgende Aussagen ¨ aquivalent. (1) f ist stetig differenzierbar. (2) f ist in jedem Punkt von U nach jeder Variablen differenzierbar und die partiellen Ableitungen Dj f : U → HomR (Vj , W ) sind f¨ ur alle j = 1, . . . , d stetig. Beweis: Pd j=1 Dj f (v)hj ” in eine Summe von Termen der Form f (v1 , . . . , vk , vk+1 + hk+1 , . . . , vd + hd ) − f (v1 , . . . , vk+1 , vk+2 + hk+2 , . . . , vd +hd )−Dk+1 f (v)hk+1 auf und betrachte die Funktionen y 7→ f (v1 , . . . , vk , y, . . . , vd +hd ), deren Ableitungen dann durch die partiellen Ableitungen von f gegeben sind. Der Mittelwertsatz in Form von Satz 11.1.9 liefert dann den Beweis.
Idee: Nur die Implikation (2)⇒(1)“ ist problematisch. Dazu spalte f (v+h)−f (v)−
Die Implikation (1)⇒(2)“ folgt sofort aus Lemma 11.3.1 und der Gleichung (11.2). ” F¨ ur die Umkehrung reicht es aus zu zeigen, daß f differenzierbar ist, weil dann die Stetigkeit wieder aus Lemma 11.3.1 folgt. Wir betrachten also v = (v1 , . . . , vd ) ∈ U und h = (h1 , . . . , hd ) ∈ V so klein, daß v + h ∈ U . Dann rechnen wir f (v + h) − f (v) −
d X
Dj f (v)hj =
j=1
= f (v1 + h1 , v2 + h2 , . . . , vd + hd ) − f (v1 , v2 + h2 , . . . , vd + hd ) − D1 f (v)h1 +f (v1 , v2 + h2 , v3 + h3 , . . . , vd + hd ) − f (v1 , v2 , v3 + h3 , . . . , vd + hd ) − D2 f (v)h2 .. . +f (v1 , v2 , . . . , vd−1 , vd + hd ) − f (v1 , v2 , . . . , vd ) − Dd f (v)hd
11.3. PARTIELLE ABLEITUNGEN
227 V2
v+h
v
V1
Wir k¨onnen annehmen, daß die Norm auf V von der Form kvkV = max{kvj kj | j = 1, . . . , d} ist. Dann gen¨ ugt es, zu jedem ² > 0 ein η > 0 zu finden, so, daß f¨ ur alle h ∈ V mit khkV ≤ η die W -Norm jeder der obigen Zeilen durch ²khj kj abgesch¨atzt werden kann. Wir zeigen das f¨ ur die erste Zeile, die anderen gehen analog. W¨ahle eine offene Umgebung U1 von v1 , so, daß die Funktion g : U1 → W,
y 7→ f (y, v2 + h2 , . . . , vd + hd ) − D1 f (v)(y − v1 )
definiert ist. Wenn khkV so klein ist, daß v1 + h1 ∈ U1 , dann gilt kg(v1 + h1 ) − g(v1 )kW = = kf (v1 + h1 , v2 + h2 , . . . , vd + hd ) − f (v1 , v2 + h2 , . . . , vd + hd ) − D1 f (v)h1 kW .
v+h-h 1 v+h U
Nach Voraussetzung ist g : U1 → W differenzierbar mit g 0 (y) = D1 f (y, v2 + h2 , . . . , vd + hd ) − D1 f (v). Wegen der Stetigkeit von D1 f gibt es ein η > 0 so, daß f¨ ur ky − v1 k1 ≤ η und khkV ≤ η gilt kD1 f (y, v2 + h2 , . . . , vd + hd ) − D1 f (v)kW ≤ ². Wenn wir jetzt y = v1 + th1 mit t ∈ [0, 1] w¨ahlen, zeigt Satz 11.1.9 (∀khkV < η) kg(v1 + h1 ) − g(v1 )kW ≤ ²kh1 k1 , also die Behauptung.
Sei V = Rn , Vj = R f¨ ur j = 1, . . . , n und W = R. Weiter sei e1 , . . . , en die kanonische Basis f¨ ur Rn . Mit der Notation Dj f f¨ ur die j-te partielle Ableitung einer Funktion f : U → R definieren wir ∂f (x) := Dj f (x) = f 0 (x)(ej ) ∈ HomR (R, R) ∼ =R ∂xj und erhalten so eine Abbildung
∂f :U →R ∂xj
falls f partiell differenzierbar, war, d.h., alle partiellen Ableitungen existieren. In diesem Fall definiert man den Gradienten ∇f : U → Rn durch ¶ µ ∂f ∂f (x), . . . , (x) ∈ Rn ∇f (x) := gradf (x) := ∂x1 ∂xn
228
KAPITEL 11. DIFFERENZIERBARKEIT
Bemerkung 11.3.4 : Sei f : U → R differenzierbar in x und v ∈ Rn mit kvk = 1. Dann gilt nach Lemma 11.3.1 n X ∂f f 0 (x)(v) = (x)vj = h∇f (x) | vi, ∂x j j=1 d.h. das Skalarprodukt mit dem Gradienten beschreibt die Richtungsableitungen d ¯¯ ¯ f (x + tv) := (f ◦ γx,v )0 (0) dt t=0 mit γx,v (t) = x + tv von f . Insbesondere sehen wir ¯ ∇f (x) E ¯ © ª D ¯ max |f 0 (x)(v)| ¯ kvk = 1 = ∇f (x) ¯ = k∇f (x)k. k∇f (x)k
Dies bedeutet, daß ∇f (x) die Richtung des steilsten Anstiegs der Funktion f liefert. Andererseits sind die Richtungsableitungen von f in die auf ∇f (x) senkrecht stehenden Richtungen alle Null. Wenn wir f¨ ur c ∈ R die Menge Nf (c) = {x ∈ U | f (x) = c} als die Niveaumenge zur H¨ohe c bezeichnen, dann liefert dies sp¨ater die geometrische Interpretation, daß der Gradient senkrecht (d.h. orthogonal) auf den Niveaumengen steht.
Beispiel 11.3.5 : (i) f : R2 → R, (ξ, η) 7→ ξ 2 + η 2 . Dann gilt Nf (c) = {(ξ, η) ∈ R2 | c = ξ 2 + η 2 }, d.h. die Niveaumengen sind Kreise f¨ ur c > 0 ein Punkt f¨ ur c = 0 und leer f¨ ur c < 0. η
ξ
Der Graph von f ist also ein Paraboloid.
Γf := {(ξ, η, ζ) ∈ R3 | ξ 2 + η 2 = ζ},
11.3. PARTIELLE ABLEITUNGEN
229
(ii) f : R2 → R, (ξ, η) 7→ ξ 2 − η 2 . Dann gilt Nf (c) = {(ξ, η) ∈ R2 | c = ξ 2 − η 2 }, d.h. die Niveaumengen sind Hyperbeln f¨ ur c 6= 0 ein Achsenkreuz f¨ ur c = 0. 3
2 1
-3
-2
-1
1
2
3
-1
-2 -3
Der Graph von f ist die Sattelfl¨ ache Γf := {(ξ, η, ζ) ∈ R3 | ξ 2 − η 2 = ζ}.
(iii) f : R2 → R, (ξ, η) 7→ ξ 2 + η 3 . Dann gilt Nf (c) = {(ξ, η) ∈ R2 | c = ξ 2 + η 3 } und man stellt fest, daß f von (0, 0) aus in die Richtungen ±ξ und η steigt, aber in Richtung −η f¨allt.
(iv) f : R2 → R, (ξ, η) 7→
p
ξ 2 + η2 . Nf (c) = {(ξ, η) ∈ R2 | c =
p
ξ 2 + η 2 },
d.h. die Niveaumengen sind wieder Kreise f¨ ur c > 0 ein Punkt f¨ ur c = 0 und leer f¨ ur c < 0.
230
KAPITEL 11. DIFFERENZIERBARKEIT η
ξ
Der Graph von f ist Γf := {(ξ, η, ζ) ∈ R3 |
p
ξ 2 + η 2 = ζ},
also ein Kreiskegel.
(v) r : Rn → R, x 7→ kxk. Dies verallgemeinert (iv). F¨ ur x 6= 0 gilt mit der Kettenregel 11.1.4 ∂r(x) 2 xj = xj = , ∂xj 2kxk r(x) also ∇r(x) =
1 x x= r(x) kxk
und k∇r(x)k = 1. D.h. ∇r(x) ist der Einheitsvektor in x-Richtung. Im Ursprung x = 0 ist r nicht partiell differenzierbar.
F¨ ur h¨ohere Ableitungen ben¨ utzen wir die Notation ∂ 2 f (x) ∂2f = (x) f¨ ur ∂xi ∂xj ∂xi ∂xj
Es gilt
was mit Satz 11.2.2
∂f ∂ ∂x j
∂xi
(x).
∂f 0 (x)(ej ) ∂ 2 f (x) = = f 00 (x)(ei , ej ), ∂xi ∂xj ∂xi ∂ 2 f (x) ∂ 2 f (x) = ∂xi ∂xj ∂xj ∂xi
impliziert. Um die zweite Gleichheit in (11.3) einzusehen, definiere eine Funktion g : U → R,
x 7→ f 0 (x)(ej )
und beachte, daß 1 1 (g(x + h) − g(x) − f 00 (x)(ei , ej )) = (f 0 (x + h) − f 0 (x) − f 00 (x)(ei ))(ej ) −→ 0. h→0 khk khk
(11.3)
11.3. PARTIELLE ABLEITUNGEN
231
Wenn f ∈ C 2 (U, R), dann heißt die Matrix µ 2
D f (x) :=
∂ 2 f (x) ∂xi ∂xj
¶ i,j=1,...,n
die Hesse–Matrix von f . Nach (11.3) ist also die Hesse–Matrix symmetrisch. Sei jetzt f : U → R irgendeine Funktion. Dann heißt x ∈ U ein lokales Maximum, wenn es eine Umgebung Uo von x in U gibt mit (∀y ∈ U0 ) f (x) ≥ f (y).
Analog heißt x ∈ U ein lokales Minimum, wenn es eine Umgebung Uo von x in U gibt mit (∀y ∈ U0 ) f (x) ≤ f (y). Wenn einer der beiden F¨alle vorliegt, sprechen wir von einem lokalen Extremum. Proposition 11.3.6 : Sei f : U → R in x ∈ U partiell differenzierbar. Wenn f ein lokales Extremum in x hat, dann gilt ∇f (x) = 0. Beweis: Idee: Betrachte t 7→ f (x + tej ) und ben¨utze den Satz 3.1.4 u¨ber Extremwerte in einer Variablen. Es gibt ein ² > 0 so, daß die Funktionen φj : ] − ², ²[→ R,
t 7→ f (x + tej )
f¨ ur j = 1, . . . , n definiert und in 0 differenzierbar sind. Nach Voraussetzung hat jede dieser Funktionen ein lokales Extremum in 0, also gilt mit Satz 3.1.4, daß φ0j (0) = 0 f¨ ur alle j = 1, . . . , n. Schließlich folgt die Behauptung aus φ0j (0) = f 0 (x)(ej ) =
∂f (x) . ∂xj
Eine Umkehrung von Proposition 11.3.6 l¨aßt mithilfe von Definitheitseigenschaften der Hesse-Matrix finden. Lemma 11.3.7 : Sei A ∈ Mat(n × n; R). Dann sind folgende Aussagen ¨ aquivalent. (1) A positiv definit. (2) Es gibt ein λ > 0 mit Beweis:
(∀v ∈ Rn )
hv | Avi ≥ λkvk2 .
232
KAPITEL 11. DIFFERENZIERBARKEIT Idee: Betrachte die Einschr¨ankung von v 7→ hv | Avi auf die Sph¨are und n¨utze deren Kompaktheit aus.
Die Implikation (2)⇒(1)“ ist trivial. F¨ ur die Umkehrung betrachte die Sph¨ are ” S n−1 := {v ∈ Rn | kvk = 1}, die abgeschlossen und beschr¨ankt, also nach dem Satz 10.3.3 von Heine-Borel kompakt, ist. Die stetige Funktion f : S n−1 → ]0, ∞[, v 7→ hv | Avi nimmt nach Satz 10.3.4 ihr Minimum an. Sei λ > 0 dieses Minimum. Dann gilt f¨ ur jedes 0 6= v ∈ Rn ³ v ´ 1 λ≤f hv | Avi, = kvk kvk2 was sofort (2) impliziert.
Satz 11.3.8 : Sei f ∈ C 2 (U, R) mit ∇f (x) = 0 f¨ ur x ∈ U ⊆ Rn und H die Hesse-Matrix von f in x. Dann gilt: (i) Wenn H positiv definit ist, dann gibt es eine Umgebung Uo von x in U mit ∀x 6= y ∈ Uo :
f (x) < f (y).
(ii) Wenn H negativ definit ist, dann gibt es eine Umgebung Uo von x in U mit ∀x 6= y ∈ Uo :
f (x) > f (y).
(iii) Wenn H indefinit ist, dann hat f kein lokales Extremum in x. Beweis: Idee: Schreibe f (x+v) = f (x)+ 12 f 00 (x)(v, v)+r3 (v) mit der Taylorformel und beachte f 00 (x)(v, v) = hv | Hvi. Mit Lemma 11.3.6 und der Absch¨ atzung f¨ ur das Taylorrestglied folgt dann die Behauptung.
(i) Wegen f 0 (x) = 0 und der Stetigkeit von f 00 liefert die Taylorformel 11.2.5 f¨ ur ein v ∈ Rn mit x + [0, 1]v ⊆ U eine Konstante c > 0 1 f (x + v) = f (x) + f 00 (x)(v, v) + r3 (v) 2 mit |r3 (v)| ≤ ckvk3 . Wenn jetzt v = (v1 , . . . , vn ), dann gilt f 00 (x)(v, v) =
n X ∂ 2 f (x) vi vj = hv | Hvi. ∂xi ∂xj i,j=1
Sei jetzt λ > 0 die von Lemma 11.3.7 garantierte Konstante zu H. Dann gilt hv | Hvi ≥ λkvk2 und es existiert ein δ > 0 mit ∀v ∈ Rn , kvk ≤ δ :
|r3 (v)| ≤
λ kvk2 . 4
Zusammen erhalten wir f¨ ur kvk ≤ δ f (x + v) ≥ f (x) + was die Behauptung beweist.
λ λ λ kvk2 − kvk2 = f (x) + kvk2 , 2 4 4
11.3. PARTIELLE ABLEITUNGEN
233
(ii) Hier wendet man einfach (i) auf die Funktion −f an, deren Hesse-Matrix −H ist. (iii) W¨ ahle v± ∈ Rn mit hv+ | Hv+ i > 0 und hv− | Hv− i < 0. Dann kann man die Funktion auf eine Strecke x + ] − ², ²[v± einschr¨anken und (i) bzw. (ii) auf beide Einschr¨ankungen anwenden um zu sehen, daß f kein lokales Extremum in x hat.
Beispiel 11.3.9 : Wir greifen die Beispiele aus 11.3.5 wieder auf. (i) Sei f (ξ, η) = ξ 2 + η 2 , dann ist ∇f (ξ, η) = (2ξ, 2η) und ∇f verschwindet nur in (ξ, η) = (0, 0). Die Hesse-Matrix in (0, 0) ist µ ¶ 2 0 , 0 2 also positiv definit.
(ii) Sei f (ξ, η) = ξ 2 − η 2 , dann ist ∇f (ξ, η) = (2ξ, −2η) und ∇f verschwindet nur in (ξ, η) = (0, 0). Die Hesse-Matrix in (0, 0) ist µ ¶ 2 0 , 0 −2 also indefinit.
(iii) Sei f (ξ, η) = ξ 2 + η 3 , dann ist ∇f (ξ, η) = (2ξ, 3η 2 ) und ∇f verschwindet nur in (ξ, η) = (0, 0). Die Hesse-Matrix in (0, 0) ist µ ¶ 2 0 , 0 0 also positiv semidefinit. Andererseits hat f in (0, 0) kein lokales Extremum.
234
KAPITEL 11. DIFFERENZIERBARKEIT
(iv) Sei f (ξ, η) = ξ 2 + η 4 , dann ist ∇f (ξ, η) = (2ξ, 4η 3 ) und ∇f verschwindet nur in (ξ, η) = (0, 0). Wieder ist die Hesse-Matrix in (0, 0) ist µ ¶ 2 0 , 0 0 also positiv semidefinit. Diesmal allerdings hat f in (0, 0) ein striktes lokales Minimum, d.h., erf¨ ullt die Bedingung aus Satz 11.3.8(i).
(v) Sei f (ξ, η) = ξ 2 , dann ist ∇f (ξ, η) = (2ξ, 0) und ∇f verschwindet f¨ ur alle (0, η). Die Hesse-Matrix in (0, η) ist wieder µ ¶ 2 0 , 0 0 also positiv semidefinit. In diesem Fall f in (0, η) ein lokales Minimum, allerdings kein striktes.
Sei U ⊆ Rn offen und f : U → Rm eine Funktion. Wir schreiben f = (f1 , . . . , fm ), wobei die fj die Komponentenfunktionen sind, d.h. f (x) = (f1 (x), . . . , fm (x)) ∈ Rm . Seien e1 , . . . , en und ee1 , . . . , eem die kanonischen Basen f¨ ur Rn und Rm . Wenn f in x ∈ U differenzierbar ist, dann ist f 0 (x) : Rn → Rm linear und es gilt f 0 (x)ei
0 (f10 (x)ei , . . . , fm (x)ei ) µ ¶ ∂f1 (x) ∂fm (x) = ,..., ∂xi ∂xi m X ∂fj (x) = eej ∂xi j=1
=
Das bedeutet gerade, daß die Jacobi-Matrix µ Df (x) :=
∂fi (x) ∂xj
¶ i=1,...,m
j=1,...,n
die darstellende Matrix von f 0 (x) bez¨ uglich der kanonischen Basen auf Rn und Rm ist (stellt man die Koeffizientenvektoren als Spaltenvektoren dar, so besteht jede Zeile der Jacobi-Matrix aus den partiellen Ableitungen einer Komponentenfunktion). Beachte, daß f¨ ur die Komposition f
g
Rn −→ Rm −→ Rl
11.3. PARTIELLE ABLEITUNGEN
235
zweier differenzierbarer Abbildungen aus (g ◦ f )0 (x) = g 0 (f (x)) ◦ f 0 (x) und der Definition der Matrizenmultiplikation f¨ ur y = f (x) folgt D(g ◦ f )(x) = Dg(y)Df (x) und dementsprechend Jg◦f (x) = Jg (y)Jf (x). F¨ ur den Spezialfall, daß m = n, nennt man f = (f1 , . . . , fn ) : U → Rn auch ein Vektorfeld. Dem liegt die Intuition zugrunde, daß an jedes x ∈ U ein Vektor des umgebenden Raumes Rn “angeklebt” ist.
U
Solche Vektorfelder modellieren z.B. Str¨omungsverh¨altnisse oder Kraftfelder. Quellen und Senken solcher Felder kann man durch die zugeordnete Funktion divf (x) :=
n X ∂fi (x) i=1
∂xi
modellieren, die man die Divergenz des Vektorfeldes f nennt (falls f partiell differenzierbar ist). Wirbel in einem Vektorfeld f : U → R3 (und das geht nur f¨ ur n = 3!) modelliert man durch die Rotation µ ¶ ∂f3 ∂f2 ∂f1 ∂f3 ∂f2 ∂f1 rotf := − , − , − . ∂x2 ∂x3 ∂x3 ∂x1 ∂x1 ∂x2
U
Allerdings werden diese Interpretationen erst mit den sogenannten Integrals¨atzen von Gauß, Green und Stokes einsichtig. ¨ Ubung 11.3.1 : Sei U ⊂ Rn offen und f, g : U → R zwei differenzierbare Funktionen. Zeige, daß grad(f g) = g gradf + f gradg.
¨ Ubung 11.3.2 : Untersuche, an welchen Stellen die Funktion p f : R2 → R, (x, y) 7→ y 2x2 + y 2 partiell differenzierbar ist und berechne dort die partiellen Ableitungen. ¨ Ubung 11.3.3 : Die Funktion F : R2 → R sei definiert durch ( 2 2 , falls (x, y) 6= (0, 0), xy xx2 −y +y 2 F (x, y) = 0, falls (x, y) = (0, 0). Zeige, daß F u ¨berall zweimal partiell differenzierbar ist, daß aber ∂ ∂ ∂ ∂ F (0, 0) 6= F (0, 0). ∂x1 ∂x2 ∂x2 ∂x1
236
KAPITEL 11. DIFFERENZIERBARKEIT
¨ Ubung 11.3.4 : F¨ ur ein ideales Gas mit Druck P , Volumen V und absoluter Temperatur T gilt die Gleichung P V = cT, wobei c ∈ R eine Konstante ist. Zeige, daß
∂V ∂T ∂P = −1. ∂T ∂P ∂V
¨ Ubung 11.3.5 : Sei U ⊂ Rn offen und f : U → R eine stetig differenzierbare Funktion. Sei x ∈ U und c := f (x). Zeige, daß der Gradient gradf (x) auf der Niveaufl¨ ache Nf (c) = {z ∈ U : f (z) = c} senkrecht steht, d.h. daß folgendes gilt: Ist
φ :] − ², ²[→ Rn
eine beliebige stetig differenzierbare Kurve mit φ(0) = x und φ(] − ², ²[) ⊂ Nf (c), so folgt hφ0 (0) | gradf (x)i = 0.
¨ Ubung 11.3.6 : Bestimme Lage und Art der lokalen Extrema der folgenden Funktionen: (i) f : R2 → R, 2
(ii) f : R → R,
(x, y) 7→ x2 + xy + y 2 + x + y + 1, (x, y) 7→
1 y
−
1 x
− 4x + y,
2
(iii) f : {(x, y) ∈ R : 0 < x ≤ y < π/2} → R, 2
(iv) f : R → R,
2
(x, y) 7→ sin x + sin y + sin(x + y),
2
(x, y) 7→ x + y − 2xy + 1.
¨ Ubung 11.3.7 : In Rn seien m Punkte a1 , . . . , am gegeben. Zeige, daß die Summe der Abstandsquadrate f (x) =
m X
kx − aj k2 ,
(euklidische Norm)
j=1
ein Minimum im Mittelpunkt ξ = m−1
Pm j=1
aj besitzt.
¨ Ubung 11.3.8 : Bestimme drei positive Zahlen, deren Summe gleich 60 und deren Produkt maximal ist. ¨ Ubung 11.3.9 : Die Wirkung W (x, t), die x Einheiten eines Medikaments t Stunden nach der Einnahme auf einen Patienten haben, wird in vielen F¨ allen durch W (x, t) = x2 (a − x)t2 e−t
(0 < x < a, t > 0)
dargestellt. Bestimme die Dosis x und die Zeit t so, daß W (x, t) maximal ist. ¨ Ubung 11.3.10 : Sei f (x, y) :=
µ (x2 + y 2 ) sin
¶ √
1
,
x2 +y 2
0,
falls (x, y) 6= (0, 0), falls (x, y) = (0, 0).
Zeige, daß die Funktion f im Nullpunkt differenzierbar ist und daß ihre beiden partiellen Ableitungen dort unstetig sind. ¨ Ubung 11.3.11 : Beweise die Taylorsche Formel in der Multiindexschreibweise. F¨ ur ein n-Tupel α = (α1 , . . . , αn ) ∈ Nn 0 nat¨ urlicher Zahlen sei |α| := α1 + · · · + αn
und
α! = α1 !α2 ! · · · · · αn !.
Ist f eine |α|-mal stetig differenzierbare Funktion, so setzt man Dα f = D1α1 D2α2 · · · Dnαn f =
∂ |α| f , n · · · ∂xα n
1 ∂xα 1
11.3. PARTIELLE ABLEITUNGEN
237
wobei
α
Dj j = Dj · · · Dj . | {z } |αj |-mal F¨ ur x = (x1 , . . . , xn ) ∈ Rn sei
αn 1 α2 xα = xα 1 x2 · · · · · xn .
In dieser Schreibweise lautet der Satz von Taylor wie folgt: Sei U ⊂ Rn offen, x ∈ U ein Punkt und ξ ∈ Rn ein Vektor, so daß x + tξ ∈ U f¨ ur alle t ∈ [0, 1]. Weiter sei f : U → R eine (k + 1)-mal stetig differenzierbare Funktion. Dann existiert ein θ ∈ [0, 1], so daß X Dα f (x) α ξ + α!
f (x + ξ) =
|α|≤k
X |α|=k+1
Dα f (x + θξ) α ξ . α!
Hinweise: 1) Es darf die Tatsache benutzt werden, daß es f¨ ur α ∈ Nn 0 mit |α| = k genau k!/α! k-Tupel (i1 , . . . , ik ) mit 1 ≤ ij ≤ n gibt, bei denen die Zahl ν genau αν mal vorkommt. 2) F¨ ur das Restglied erinnere man sich an den Mittelwertsatz der Integralrechnung und die daraus resultierende ¨ Lagrange-Form des Restglieds (vgl. Ubung 9.2.3).
¨ Ubung 11.3.12 : Sei U ⊂ Rn offen, f = (f1 , . . . , fn ) : U → Rn ein partiell differenzierbares Vektorfeld und φ : U → R eine partiell differenzierbare Funktion. Zeige: (i) Wenn gradφ selbst stetig differenzierbar ist, dann gilt div(gradφ) = ∆φ, wobei ∆φ :=
∂2φ ∂2φ + ... + . 2 ∂x1 ∂xn 2
(ii) Sei n = 3. Wenn und rotf und gradφ stetig differenzierbar sind, dann gilt div(rotf ) = 0,
und
rot(gradφ) = 0.
¨ Ubung 11.3.13 : Betrachte das Vektorfeld v : Rn \ {0} → Rn ,
v(x) :=
1 x, kxk
wobei kxk die euklidische Norm von x bezeichnet. Zeige, daß divv =
n−1 . kxk
¨ Ubung 11.3.14 : Berechne alle partiellen Ableitungen erster Ordnung von folgenden Funktionen. (i) f : R2 → R2 , (ii) g : R2 → R,
f (x, y) = x3 − 2x2 y 2 + 4xy 3 + y 4 + 10, g(x, y) = (x2 + y 2 )exy ,
3
(iii) h : R \ {(x, y, z) ∈ R3 |z = 0} → R,
h(x, y, z) =
xey z
.
¨ Ubung 11.3.15 : Sei U ⊂ Rn offen, und seien f, g : U → R2 zweimal stetig differenzierbar mit ∂f ∂g ∂f ∂g = und =− . ∂x ∂y ∂y ∂x Zeige, daß auf U gilt:
∂2f ∂2f ∂2g ∂2g + = 0 und + = 0. 2 2 2 ∂x ∂y ∂x ∂y 2
¨ Ubung 11.3.16 : Berechne die Jacobi Matrix der Abbildung F : R3 → R3 ,
F (r, θ, φ) := (r sin θ cos φ, r sin θ sin φ, r cos θ).
238
KAPITEL 11. DIFFERENZIERBARKEIT
Kapitel 12
Implizite Funktionen 12.1
Der Banachsche Fixpunktsatz
Satz 12.1.1 (Banachscher Fixpunktsatz): und f : M → M eine stetige Abbildung mit ∀x, y ∈ M :
Sei (M, ρ) ein vollst¨ andiger metrischer Raum, q ∈ [0, 1[
ρ(f (x), f (y)) ≤ qρ(x, y).
Dann gibt es genau ein x∞ ∈ M mit f (x∞ ) = x∞ .
x
f
y
f
f(x)
f(y) M
Beweis: Idee: Die Kontraktionseigenschaft liefert sofort die Eindeutigkeitsaussage. Um auch die Existenz von Fixpunkten zu erhalten setzt man induktiv xn := f (xn−1 ), n¨ utzt die Kontraktionseigenschaft aus um zu zeigen, daß dies eine Cauchy–Folge liefert, schließt mit der Vollst¨ andigkeit auf die Existenz eines Grenzwerts, der dann der gesuchte Fixpunkt ist.
Wir zeigen zun¨achst die Eindeutigkeit des Fixpunkts. Wenn f (y) = y und f (z) = z gilt, dann haben wir ρ(y, z) = ρ(f (y), f (z)) ≤ qρ(y, z), was wegen q ∈ [0, 1[ nur f¨ ur ρ(y, z) = 0, also f¨ ur y = z m¨oglich ist. Um die Existenz des Fixpunktes zu zeigen, w¨ahlt man ein x0 ∈ M und setzt induktiv xn := f (xn−1 ) f¨ ur n ∈ N. Wir zeigen, daß (xn )n∈N eine Cauchy-Folge ist: Dazu rechnen wir ρ(xn+1 , xn ) ≤ qρ(xn , xn−1 ) ≤ . . . ≤ q n ρ(x1 , x0 ) 239
240
KAPITEL 12. IMPLIZITE FUNKTIONEN und ρ(xn+k , xn ) ≤
k X
ρ(xn+j , xn+j−1 )
j=1
≤
k X
q n+j−1 ρ(x1 , x0 )
j=1
= ≤
1 − qk ρ(x1 , x0 ) 1−q qn ρ(x1 , x0 ) 1−q
qn
Wegen der Vollst¨andigkeit von M hat die Folge einen Grenzwert x∞ und es bleibt zu zeigen, daß f (x∞ ) = x∞ . Dies folgt aber aus der Stetigkeit von f : f (x∞ ) = f ( lim xn ) = lim f (xn ) = lim xn+1 = x∞ . n→∞
n→∞
n→∞
Sei (A, U) ein topologischer Raum und (M, ρ) ein metrischer Raum. Eine Folge (fn )n∈N von Abbildungen fn : A → M heißt gleichm¨ aßig konvergent gegen eine Abbildung f : A → M , wenn es zu jedem ² > 0 ein n0 ∈ N gibt mit ∀a ∈ A, ∀n > n0 :
ρ(fn (a), f (a)) < ².
Die Folge (fn )n∈N heißt lokal gleichm¨ aßig konvergent gegen f , wenn es zu jedem a ∈ A eine Umgebung U ∈ U(a) gibt, f¨ ur die die Folge (fn |U )n∈N gleichm¨aßig gegen f |U konvergiert. Satz 12.1.2 : Sei (A, U) ein topologischer Raum und (M, ρ) ein metrischer Raum. Die Folge (fn )n∈N von stetigen Abbildungen fn : A → M konvergiere lokal gleichm¨ aßig gegen die Funktion f : A → M . Dann ist f stetig. Beweis: Idee: 3²-Argument der Form ρ(f (a), f (a0 )) ≤ ρ(f (a), fn (a)) + ρ(fn (a), fn (a0 )) + ρ(fn (a0 ), f (a0 )) < 3².
Halte a0 ∈ A fest und w¨ahle ² > 0. Dann gibt es eine Umgebung U von a0 in A, auf der die fn gleichm¨aßig gegen f konvergieren und wir finden ein n0 ∈ N mit ∀n > n0 , ∀a ∈ U :
ρ(fn (a), f (a)) < ².
Halte ein n > n0 fest. Wegen der Stetigkeit von fn k¨onnen wir U so klein w¨ahlen, daß ∀a ∈ U :
ρ(fn (a), fn (a0 )) < ²
gilt. Dann erhalten wir f¨ ur a ∈ U ρ(f (a), f (a0 )) ≤ ρ(f (a), fn (a)) + ρ(fn (a), fn (a0 )) + ρ(fn (a0 ), f (a0 )) < 3², was die Stetigkeit von f in a0 beweist.
F¨ ur den folgenden Satz erinnern wir an die Produkttopologie, die es erlaubt, von Konvergenz und Stetigkeit auf Produkten topologischer R¨aume zu sprechen.
12.1. DER BANACHSCHE FIXPUNKTSATZ
241
Satz 12.1.3 : Sei (A, U) ein topologischer Raum und (M, ρ) ein vollst¨ andiger metrischer Raum. Weiter sei q ∈ [0, 1[ und f : M × A → M stetig mit ∀x, y ∈ M, a ∈ A :
ρ(f (x, a), f (y, a)) ≤ qρ(x, y).
Wenn g∞ (a) ∈ M den von Satz 12.1.1 garantierten Fixpunkt von x 7→ f (x, a) bezeichnet, dann ist die Abbildung g∞ : A → M, a 7→ g∞ (a) stetig. Beweis: Idee: F¨ur x0 ∈ M setze g0 (a) = x0 und gn (a) := f (gn−1 (a), a). Dann zeige mit Satz 12.1.1, angewandt auf x 7→ f (x, a), daß gn (a) → g∞ (a) (lokal gleichm¨ aßig). Die Behauptung folgt dann aus Satz 12.1.2. W¨ahle ein x0 ∈ M und betrachte die Abbildungen gn : A → M mit g0 (a) = x0 und gn (a) := f (gn−1 (a), a) f¨ ur n ∈ N. Mit Induktion folgt sofort, daß die gn alle stetig sind und das Argument im Beweis von Satz 12.1.1, angewandt auf die Abbildung x 7→ f (x, a) zeigt, daß gn (a) → g∞ (a). Nach Satz 12.1.2 gen¨ ugt es also zu zeigen, daß die Folge (gn )n∈N lokal gleichm¨aßig gegen g∞ konvergiert. W¨ahle ² > 0. Der Beweis von Satz 12.1.1 zeigt ρ(gn+k (a), gn (a)) ≤
qn qn ρ(g1 (a), g0 (a)) = ρ(f (x0 , a), x0 ). 1−q 1−q
Wegen der Stetigkeit von f in der zweiten Variablen gibt es zu a0 ∈ A eine Umgebung U ∈ U(a0 ) mit ∀a ∈ U : ρ(f (x0 , a), f (x0 , a0 )) ≤ ². Insbesondere gibt es eine Konstante c > 0 mit ∀a ∈ U : also ρ(gn+k (a), gn (a)) ≤
ρ(f (x0 , a), x0 ) ≤ c, qn qn ρ(g1 (a), g0 (a)) ≤ c. 1−q 1−q
f(x 0,a)
<ε f(x 0,a 0)
c
x0
M
Also gibt es ein n0 ∈ N mit ∀n, m > n0 :
ρ(gn (a), gm (a)) ≤ ².
Außerdem findet man zu a ∈ U ein na ∈ N mit ∀n > na :
ρ(gn (a), g∞ (a)) ≤ ².
Also gilt ∀n > n0 , a ∈ U, m > na :
ρ(gn (a), g∞ (a)) ≤ ρ(gn (a), gm (a)) + ρ(gm (a), g∞ (a)) ≤ 2²
und insbesondere ∀n > n0 , a ∈ U : und das zeigt die Behauptung.
ρ(gn (a), g∞ (a)) ≤ 2²
242
KAPITEL 12. IMPLIZITE FUNKTIONEN
¨ Ubung 12.1.1 : Beweise folgende Versch¨ arfung des Banachschen Fixpunktsatzes: Sei X eine nichtleere Teilmenge des Banachraumes E und A : X → E eine kontrahierende Abbildung, d.h. f¨ ur alle x, y ∈ X gelte kAx − Ayk ≤ qkx − yk mit einem festen positiven q < 1. Ferner sei x0 ∈ X und r > 0 so, daß die abgeschlossene Kugel vom Radius r um x0 ganz in X liegt, und es gelte kAx0 − x0 k ≤ (1 − q)r. Dann existiert die Folge der Elemente xn+1 := Axn und konvergiert gegen einen Fixpunkt x ˆ ∈ X. Der Punkt x ˆ ist der einzige Fixpunkt von A in X, und x ˆ liegt in der oben angegebenen Kugel. Außerdem gilt die Fehlerabsch¨ atzung kxn − x ˆk ≤
qn kx1 − x0 k. 1−q
¨ aume. Ubung 12.1.2 : Seien (X1 , ρ1 ) und (X2 , ρ2 ) metrische R¨ (i) Durch
d((x1 , x2 ), (x01 , x02 )) := ρ1 (x1 , x01 ) + ρ2 (x2 , x02 )
wird eine Metrik auf X1 × X2 erkl¨ art, (ii) die durch d erzeugte Topologie auf X1 × X2 stimmt mit der Produkttopologie u ¨berein.
12.2
Der Satz u ¨ ber implizite Funktionen
Seien (V1 , k · k1 ), (V2 , k · k2 ) und (W, k · kW ) endlich dimensionale normierte R-Vektorr¨aume. Weiter sei U ⊆ V1 × V2 offen (bzgl. der Produkttopologie) und F : U → W stetig differenzierbar. Wir stellen uns folgende Frage: Angenommen, man gibt einen Funktionswert c ∈ W vor, kann man dann die Gleichung F (x, y) = c
(12.1)
nach y aufl¨osen? Wenn ja, dann ist y = g(x) eine Funktion von x und man sagt, g sei durch (12.1) implizit gegeben. Der Satz u ¨ber implizite Funktionen sagt aus, daß (12.1) lokal nach y aufgel¨ost werden kann, wenn die partiellen Ableitungen von F nach der zweiten Variablen invertierbar in Hom(V2 , W ) sind. Satz 12.2.1 (Implizite Funktionen): Seien (V1 , k · k1 ), (V2 , k · k2 ) und (W, k · kW ) endlich dimensionale normierte R-Vektorr¨ aume. Weiter sei U ⊆ V1 × V2 offen und F : U → W stetig differenzierbar (d.h., die Ableitung von F ist stetig). Wenn F (xo , yo ) = 0 und D2 F (xo , yo ) : V2 → W invertierbar ist, dann gilt: (i) Es gibt offene Umgebungen U1 ⊆ V1 und U2 ⊆ V2 von xo und yo mit U1 × U2 ⊆ U , ∀(x, y) ∈ U1 × U2 :
D2 F (x, y) : V2 → W ist invertierbar,
und ∀x ∈ U1 ∃!y ∈ U2 :
F (x, y) = 0.
V2
y
x
V1
¨ 12.2. DER SATZ UBER IMPLIZITE FUNKTIONEN
243
(ii) Die Abbildung g : U1 → U2 , die durch F (x, g(x)) = 0 definiert ist, ist differenzierbar mit ∀x ∈ U1 :
¡ ¢−1 g 0 (x) = − D2 F (x, g(x)) ◦ D1 F (x, g(x)).
Beweis: Idee: Setze Lo := D2 F (xo , yo ) und G(x, y) := y − L−1 o F (x, y). Dann zeigt die stetige Differenzierbarkeit von F , daß kG(x, y1 ) − G(x, y2 )k2 ≤ 21 ky2 − y1 k2 f¨ ur y1 , y2 hinreichend nahe an yo . F¨ ur ein hinreichend kleines δ2 > 0 setzt man dann M := {y ∈ V2 | ky − yo k ≤ δ2 } und findet G : B(yo ; δ2 ) × M → M , auf das man dann den Satz 12.1.3 anwenden kann. Der Fixpunkt liefert den Beweis f¨ ur (i). F¨ ur (ii) setze K := D1 F (x1 , y1 ) und L := D2 F (x1 , y1 ). Die Funktion Φ(x, y) = F (x, y) − K(x − x1 ) − L(y − y1 ) erf¨ ullt g(x) − g(x1 ) = −L−1 K(x − x1 ) − L−1 Φ(x, g(x)) und daraus erh¨ alt man durch passende Absch¨ atzungen f¨ ur ψ(x) := L−1 Φ(x, g(x)) die Gleichheit ¡ ¢−1 0 −1 g (x1 ) = −L K = − D2 F (x1 , y1 ) D1 F (x1 , y1 ).
(i) Wir setzen Lo := D2 F (xo , yo ) und G(x, y) := y − L−1 o F (x, y) f¨ ur (x, y) ∈ U . Dann ist die Gleichung F (x, y) = 0 ¨aquivalent zu G(x, y) = y. Wir wollen Satz 12.1.3 auf die Abbildung G anwenden. Dazu bemerken wir als erstes ¡ ¢ G(x, y1 ) − G(x, y2 ) = L−1 F (x, y1 + (y2 − y1 )) − F (x, y1 ) − D2 F (xo , yo )(y2 − y1 ) . o Da F stetig differenzierbar ist und L−1 o ∈ HomR (W, V2 ) stetig, gibt es δ1 > 0 und δ2 > 0 mit folgender Eigenschaft: Wenn kx−xo k1 ≤ δ1 sowie ky1 −yo k2 ≤ δ2 und ky2 −yo k2 ≤ δ2 , dann gilt (∗)
kG(x, y1 ) − G(x, y2 )k2 ≤
Die Funktion
1 ky2 − y1 k2 . 2
U → R, (x, y) 7→ det(L−1 o ◦ D2 F (x, y))
ist stetig und in (xo , yo ) von Null verschieden. Deshalb k¨onnen wir o.B.d.A. δ1 und δ2 so klein w¨ahlen, daß mit Lo = D2 F (xo , yo ) auch alle D2 F (x, y) invertierbar sind. Wir k¨onnen an dieser Stelle (∗) noch nicht dazu ben¨ utzen den Satz 12.1.3 anzuwenden, weil wir noch nichts u ¨ber das Bild von G wissen. Wegen der Stetigkeit von G : U → V2 finden wir ein δ1 ≥ δ10 > 0 mit δ2 . 4 Nach Voraussetzung ist G(xo , yo ) = yo . Also k¨onnen wir f¨ ur ky − yo k2 < δ2 und kx − xo k1 < δ10 rechnen ∀x ∈ B(xo , δ10 ) :
kG(x, y) − yo k2
kG(x, yo ) − G(xo , yo )k2 <
= kG(x, y) − G(xo , yo )k2
≤ kG(x, y) − G(x, yo )k2 + kG(x, yo ) − G(xo , yo )k2 1 δ2 ≤ ky − yo k2 + 2 4 3 δ2 < 4 Wir setzen U1 := B(xo ; δ10 ), U2 := B(yo ; δ2 ) und M := {y ∈ V2 | ky − yo k ≤ δ2 }. Dann ist M ⊆ V2 abgeschlossen, also ein vollst¨andiger metrischer Raum, und wegen der Stetigkeit von G gilt 3 G(U1 × M ) ⊆ {y ∈ V2 | ky − yo k ≤ δ2 } ⊆ U2 ⊆ M. 4 Diese Inklusion zeigt wegen (∗) mit Satz 12.1.3 zun¨achst, daß es zu jedem x ∈ U1 genau ein y ∈ M mit G(x, y) = y gibt, aber dann auch, daß dieser Fixpunkt in U2 liegen muß. Dies beweist (i).
244
KAPITEL 12. IMPLIZITE FUNKTIONEN (ii) W¨ ahle (x1 , y1 ) ∈ U1 × U2 mit y1 = g(x1 ), setze K := D1 F (x1 , y1 ) ∈ HomR (V1 , W )
und L := D2 F (x1 , y1 ) ∈ HomR (V2 , W )
und betrachte die Funktion Φ : U → W,
(x, y) 7→ F (x, y) − K(x − x1 ) − L(y − y1 ).
Dann gilt wegen F (x1 , y1 ) = 0 mit Lemma 11.3.1 (∗∗)
lim
(x,y)→(x1 ,y1 )
Φ(x, y) =0 kx − x1 k1 + ky − y1 k2
und wegen F (x, g(x)) = 0 Φ(x, g(x)) = −K(x − x1 ) − L(g(x) − y1 ), also
g(x) − g(x1 ) = −L−1 K(x − x1 ) − L−1 Φ(x, g(x)).
Jetzt finden wir mit (∗∗) r1 , r2 so, daß f¨ ur kx − x1 k1 ≤ r1 und ky − y1 k2 ≤ r2 gilt kΦ(x, y)kW ≤
1 2kL−1 k
op
(kx − x1 k1 + ky − y1 k2 ).
Wegen der Stetigkeit von g (nach Satz 12.1.3) und g(x1 ) = y1 k¨onnen wir r1 so klein w¨ahlen, daß aus kx − x1 k1 ≤ r1 die Ungleichung kg(x) − y1 k1 ≤ r2 folgt. Es folgt kΦ(x, g(x))kW ≤
1 2kL−1 k
op
(kx − x1 k1 + kg(x) − g(x1 )k2 )
und 1 1 kg(x) − g(x1 )k2 ≤ kL−1 Kkop kx − x1 k1 + kx − x1 k1 + kg(x) − g(x1 )k2 2 2 f¨ ur alle x ∈ U1 mit kx − x1 k1 ≤ r1 . Wenn jetzt c := 2kL−1 Kkop + 1, dann erhalten wir kg(x) − g(x1 )k2 ≤ ckx − x1 k1 f¨ ur diese x. Betrachte jetzt die Abbildung ψ : U1 → V2 ,
x 7→ L−1 Φ(x, g(x)),
f¨ ur die wir mit x ∈ B(x1 ; r1 ) rechnen kψ(x)k2 kx − x1 k1
kL−1 kop
≤
(c + 1)kL−1 kop
→ 0 Wegen
kΦ(x, g(x))kW kx − x1 k1
≤
kΦ(x, g(x))kW (kx − x1 k1 + kg(x) − g(x1 )k2 )
f¨ ur x → x1
g(x) − g(x1 ) + L−1 K(x − x1 ) = −ψ(x)
zeigt dies, daß g in x1 differenzierbar ist mit ¡ ¢−1 g 0 (x1 ) = −L−1 K = − D2 F (x1 , y1 ) D1 F (x1 , y1 ) ∈ HomR (V1 , V2 ), also die Behauptung (ii).
¨ 12.2. DER SATZ UBER IMPLIZITE FUNKTIONEN
245
¨ Ubung 12.2.1 : Finde Beispiele von Funktionen F1 , F2 : R2 → R mit (i) Es gibt ein (x0 , y0 ) ∈ F1−1 (0), f¨ ur das es keine lokale Aufl¨ osung gibt, d.h. es gibt keine Abbildung g : ]x0 − ², x0 + ²[→ R mit F2 (x, g(x)) = 0 f¨ ur alle x ∈]x0 − ², x0 + ²[, (ii) F1−1 (0) = ∅. ¨ Ubung 12.2.2 : gegebenenfalls.
In welchen Punkten haben die folgenden Funktionen lokale Aufl¨ osungen? Bestimme diese
(i) F (x, y) = 3x2 + 5y, (ii) F (x, y) = x2 − y 2 − 1. √ ¨ Ubung 12.2.3 : Bestimme die Ableitung von g : [−1, 1] → R, g(x) := arcsin 1 − x2 ohne Benutzung der 0 2 −1/2 2 2 Tatsache, daß arcsin(x) = (1 − x ) . Tip: Betrachte F : R → R, F (x, y) = sin (y) + x2 − 1.
Satz 12.2.2 (Lokale Umkehrfunktion): Seien (V, k · kV ) und (W, k · kW ) endlichdimensionale normierte R-Vektorr¨ aume und U ⊆ V offen. Wenn f : U → W stetig differenzierbar ist und f 0 (xo ) ∈ HomR (V, W ) invertierbar, dann gibt es offene Umgebungen U 0 ⊆ U und Ω ⊆ W von xo und yo = f (xo ) mit (i) f |U 0 : U 0 → Ω hat eine differenzierbare Umkehrfunktion g : Ω → U 0 ⊆ V . (ii) Die Ableitung von g in yo ist g 0 (yo ) = f 0 (xo )−1 ∈ HomR (W, V ). Beweis: Idee: L¨ose f¨ur F (y, x) = f (x) − y mit Satz 12.2.1 die implizite Gleichung F (y, g(y)) = 0 und zeige, daß g die gesuchte Umkehrfunktion ist.
Betrachte die stetig differenzierbare Funktion F : W × U → W, (y, x) 7→ f (x) − y mit der invertierbaren partiellen Ableitung D2 F (yo , xo ) = f 0 (xo ) ∈ HomR (V, W ). Nach dem Satz 12.2.1 u ¨ber implizite Funktionen gibt es eine Umgebung Ω ⊆ W von yo und eine differenzierbare Funktion g : Ω → U mit ∀y ∈ Ω :
F (y, g(y)) = 0,
e 0 ⊆ U von xo so gew¨ahlt also f (g(y)) = y. Dar¨ uber hinaus kann neben Ω eine Umgebung U 0 e und zu jedem y ∈ Ω existiert genau ein x ∈ U e 0 mit F (y, x) = 0. Setze werden, daß g(Ω) ⊆ U e 0 ∩ f −1 (Ω). Dann ist U 0 offen mit f (U 0 ) ⊆ Ω. Wegen f ◦ g|Ω = idΩ gilt auch g(Ω) ⊆ U 0 . U 0 := U Da F (f (x), g ◦ f (x)) = f (g ◦ f (x)) − f (x) = f (x) − f (x) = 0 = F (f (x), x), gilt auch g ◦ f |U 0 = idU 0 , d.h. g : Ω → U 0 ist die Umkehrfunktion von f : U 0 → Ω. Die Kettenregel 11.1.4 liefert schließlich idW = f 0 (xo ) ◦ g 0 (yo ).
246
KAPITEL 12. IMPLIZITE FUNKTIONEN
Beispiel 12.2.3 : (Polarkoordinaten) Betrachte die Abbildung f : ]0, ∞[×R → R2 , (r, φ) 7→ (r cos φ, r sin φ). π
−π
Dann ist die Jacobi-Matrix bzgl. der Standardbasis auf R2 gerade µ ¶ cos φ −r sin φ sin φ r cos φ (wir betrachten ]0, ∞[×R als offene Teilmenge von R2 ). Die Funktionaldeterminante ist also einfach r und somit f¨ ur jedes φ von Null verschieden. Nach Satz 12.2.2 hat f an jeder Stelle (x, y) = (r cos φ, r sin φ) im Bild von f ein lokales Inverses g : Ω → R2 mit Ableitung µ ¶−1 µ ¶ cos φ sin φ cos φ −r sin φ g 0 (x, y) = = sin φ r cos φ − 1r sin φ 1r cos φ Wegen
x = cos φ und r
finden wir r=
p x2 + y 2
falls x 6= 0. Insbesondere gilt
à g 0 (x, y) =
y = sin φ r
y und φ = arctan , x √
x x2 +y 2
√
y − x2 +y 2
y
!
x2 +y 2
x x2 +y 2
Es bleibt festzustellen, daß f kein globales Inverses hat, weil ∀k ∈ Z :
f (r, φ + 2πk) = f (r, φ).
¨ Ubung 12.2.4 : Es sei F : R2 → R2 , F (x, y) = (x2 − y 2 , 2xy). (i) Berechne die Jacobi-Matrix von F . (ii) Bestimme die Punkte, in denen die Jacobi-Matrix von F invertierbar ist, und dort ihre Inverse. (iii) Zeige, daß F surjektiv ist. (iv) Zeige, daß jeder Punkt (ξ, η) ∈ R2 \ {(0, 0)} genau zwei Urbildpunkte besitzt.
¨ Ubung 12.2.5 : Es sei U := {(x1 , x2 , x3 ) ∈ R3 |x1 + x2 + x3 6= −1}, und die Funktion f : U → R3 sei gegeben durch ¶ µ x2 x3 x1 , , . f (x1 , x2 , x3 ) := 1 + x1 + x2 + x3 1 + x1 + x2 + x3 1 + x1 + x2 + x3 (i) Berechne f 0 (x1 , x2 , x3 ). (ii) Zeige, daß f auf U injektiv ist und gib die Umkehrabbildung f −1 : f (U ) → U explizit an. (iii) Zeige, daß die Umkehrabbildung f −1 auf f (U ) differenzierbar ist und berechne ihre Ableitung.
¨ ur jedes Ubung 12.2.6 : Sei U ⊂ Rn offen. Die Funktion f : U → Rn sei stetig differenzierbar, und f 0 (x) sei f¨ x ∈ U invertierbar. Zeige:
¨ 12.2. DER SATZ UBER IMPLIZITE FUNKTIONEN
247
(i) f bildet offene Mengen auf offene Mengen ab, (ii) die auf U definierte Funktion x 7→ kf (x)k besitzt kein Maximum.
Wir wenden den Satz 12.2.1 u ¨ber implizite Funktionen auf folgende Problemstellung an: Gegeben seien eine offene Menge U ⊆ Rn , eine Funktion F : U → Rk mit k < n und eine Funktion h : U → R. Gesucht werden (lokale) Extrema der Funktion h|F −1 (0) : F −1 (0) → R, d.h. Extremwerte unter der Nebenbedingung F (x) = 0. Pr¨aziser gesagt werden wir notwendige Bedingungen daf¨ ur bestimmen, daß die Funktion h in einem Punkt xo ∈ U ein lokales Extremum unter der Nebenbedingung F (x) = 0 hat. F¨ ur lokale Maxima bedeutet dies: Es gibt eine Umgebung U 0 ⊆ U von x mit ∀x ∈ U 0 ∩ F −1 (0) : h(x) ≤ h(xo ) und analog f¨ ur lokale Minima. Beachte, daß diese Fragestellung mit den Methoden, die zu Proposition 11.3.6 f¨ uhren, nicht behandelbar ist, weil F −1 (0) in der Regel keine offene Teilmenge eines Vektorraums ist. Als Beispiel stelle man sich einfach die Funktion F : R3 → R, x 7→ kxk2 − r mit fest gew¨ahltem r > 0 vor, die als F −1 (0) die Kugeloberfl¨ache im Raum liefert. Satz 12.2.4 (Lagrange-Multiplikator):
Sei U ⊆ Rn eine offene Menge und
F = (F1 , . . . , Fk ) : U → Rk mit k < n und h : U → R stetig differenzierbare Funktionen. Wir nehmen an, daß h in xo ∈ U ein lokales Extremum unter der Nebenbedingung F (xo ) = 0 hat. Wenn F 0 (xo ) ∈ HomR (Rn , Rk ) den vollen Rang k hat, dann gibt es ein lineares Funktional Λ ∈ HomR (Rk , R) mit h0 (xo ) = Λ ◦ F 0 (xo ). Beweis: Idee: O.B.d.A. ist der rechte k×k-Block der Jacobi-Matrix invertierbar. Spalte U lokal entsprechend Rn−k × Rk auf und l¨ ose die implizite Gleichung F (z, g(z)) = 0 (entsprechend dieser Aufspaltung). Dann ist Λ := D2 h(zo , g(zo )) ◦ D2 F (zo , g(zo ))−1 das gesuchte lineare Funktional. Durch Umbenennung der Koordinaten k¨onnen wir o.B.d.A. annehmen, daß Ãµ ! ¶ ∂Fi (xo ) (∗) det 6= 0. ∂xj i=1,...,k j=n−k+1,...,n
Wir schreiben z = (x1 , . . . , xn−k )
und
y = (xn−k+1 , . . . , xn )
und analog zo = (xo ,1 , . . . , xo ,n−k ) 0
W¨ahle Umgebungen U ⊆ R
n−k
und yo = (xo ,n−k+1 , . . . , xo ,n ).
von zo und U 00 ⊆ Rk von yo mit U 0 × U 00 ⊆ U und schreibe F : U 0 × U 00 → Rk .
Dann sagt (∗), daß D2 F (zo , yo ) ∈ HomR (Rk , Rk ) invertierbar ist und der Satz 12.2.1 u ¨ber implizite Funktionen zeigt, daß f¨ ur U 0 und U 00 klein genug die L¨osungen von F (z, y) = 0 durch eine differenzierbare Funktion g : U 0 → U 00 via ∀ (z, g(z)) ∈ U 0 × U 00 :
F (z, g(z)) = 0
248
KAPITEL 12. IMPLIZITE FUNKTIONEN gegeben sind. Damit hat aber die Funktion H : U 0 → R,
z 7→ h(z, g(z))
in zo ein lokales Extremum (ohne Nebenbedingung!) und wir finden mit der Kettenregel und dem Satz u ¨ber implizite Funktionen 0
= = = =
H 0 (zo ) D1 h(zo , g(zo )) + D2 h(zo , g(zo )) ◦ g 0 (zo ) D1 h(zo , g(zo )) − D2 h(zo , g(zo )) ◦ D2 F (zo , g(zo ))−1 ◦ D1 F (zo , g(zo )) D1 h(zo , g(zo )) − Λ ◦ D1 F (zo , g(zo )),
wobei
Λ := D2 h(zo , g(zo )) ◦ D2 F (zo , g(zo ))−1 ∈ HomR (Rk , R)
ist. Andererseits liefert die Definition von Λ D2 h(zo , g(zo )) = Λ ◦ D2 F (zo , g(zo )). Addiert man beide Gleichungen, findet man h0 (xo )
= h0 (zo , g(zo )) = D1 h(zo , g(zo )) + D2 h(zo , g(zo )) = Λ ◦ (D1 F (zo , g(zo )) + D2 F (zo , g(zo ))) = Λ ◦ F 0 (zo , g(zo )) = Λ ◦ F 0 (xo )
Wenn man HomR (Rk , R) mit Rk identifiziert, indem man (λ1 , . . . , λk ) durch Λ(x1 , . . . , xk ) =
k X
λj xj
j=1
definiert, erh¨alt man die Gleichung h0 (xo ) =
k X
λj Fj0 (xo ).
j=1
Insbesondere, wenn k = 1, l¨aßt sich dies nochmal umschreiben als grad h(xo ) = λ grad F (xo ). In diesem Kontext nennt man die Zahlen λ1 , . . . , λk , die Lagrange-Multiplikatoren. Beispiel 12.2.5 : Betrachte die Funktionen h : R3 → R, (x1 , x2 , x3 ) 7→ x1 + x2 + x3 und
F : R3 → R, (x1 , x2 , x3 ) 7→ x21 + x22 + x23 − 1.
Dann ist F −1 (0) die Sph¨are vom Radius 1 in R3 . Aus (1, 1, 1) = gradh(x) = λgradF (x) = 2λx und
x21 + x22 + x23 − 1 = F (x) = 0
folgt
1 1 1 x = ±( √ , √ , √ ). 3 3 3 Da die stetige Funktion h auf der kompakten Menge F −1 (0) sowohl ihr Maximum als auch ihr Minimum annehmen muß, sind beide Punkte lokale Extrema. 3
1 =1 (2λ)2
und
¨ 12.2. DER SATZ UBER IMPLIZITE FUNKTIONEN
249
¨ Ubung 12.2.7 : Seien a, b ∈ R. Bestimme den Abstand der Geraden y = ax + b vom Nullpunkt. ¨ Ubung 12.2.8 : Sei A = (aij ) eine symmetrische n × n Matrix und h : Rn → R die zugeh¨ orige quadratische Form. Bestimme die Extrema von h unter der Nebenbedingung kxk = 1. ¨ Ubung 12.2.9 : Bestimme die Maxima und die Minima der Funktion F : R2 → R,
F (x, y) = 4x2 − 3xy
auf der abgeschlossenen Kreisscheibe K := {(x, y) ∈ R2 |x2 + y 2 ≤ 1}. Anleitung: Berechne zun¨ achst die lokalen Extrema von f im Innern von K und dann auf dem Rand ∂K := {(x, y) ∈ R2 |x2 + y 2 = 1}. ¨ Ubung 12.2.10 : Bestimme den Punkt der Ebene z = x+y, der vom Punkt (1, 0, 0) den kleinsten (euklidischen) Abstand hat. ¨ Ubung 12.2.11 : Bestimme das Minimum und das Maximum der Funktion f (x, y, z) := 5x + y − 3z auf dem Schnitt der Ebene x + y + z = 0 mit der Kugeloberfl¨ ache x2 + y 2 + z 2 = 1. ¨ Ubung 12.2.12 : (i) Sei Q ein Quader im R3 mit dem Volumen V . Zeige, daß die Oberfl¨ ache von Q genau dann minimal ist, wenn Q ein W¨ urfel ist. (ii) Sei Q ein Quader im R3 mit der Oberfl¨ ache F . Zeige, daß das Volumen von Q genau dann maximal ist, wenn Q ein W¨ urfel ist.
250
KAPITEL 12. IMPLIZITE FUNKTIONEN
Analysis III
251
Vorbemerkung Sei Ω ⊆ R×Rn und f : Ω → Rn , (x, y) 7→ f (x, y) eine stetige Funktion. Dann nennt man den Ausdruck y 0 = f (x, y)
(∗)
ein System von n gew¨ ohnlichen Differentialgleichungen erster Ordnung (f¨ ur n = 1 einfach eine gew¨ohnliche Differentialgleichung erster Ordnung). Eine L¨ osung eines solchen Systems ist eine auf einem offenen Intervall I definierte differenzierbare Funktion ϕ : I → Rn , x 7→ ϕ(x) mit folgenden Eigenschaften: (a) Der Graph von ϕ ist in Ω enthalten. (b) F¨ ur alle x ∈ I gilt: ϕ0 (x) = f (x, ϕ(x)). Wenn ϕ(xo ) = yo , dann sagen wir, ϕ ist eine L¨ osung, die durch den Punkt (xo , yo ) geht. Wenn man y = (y1 , . . . , yn ) und f (x, y) = (f1 (x, y1 , . . . , yn ), . . . , fn (x, y1 , . . . , yn )) schreibt, dann geht (∗) in y10 yn0
= .. . =
f1 (x, y1 , . . . , yn )
fn (x, y1 , . . . , yn )
u ¨ber, was den Namen System von Gleichungen erkl¨art. Einer stetigen Funktion f : Ω → R, (x, y) 7→ f (x, y) kann man auch eine gew¨ ohnliche Differentialgleichung n-ter Ordnung zuordnen: y (n) = f (x, y, y 0 , . . . , y (n−1) ). Eine L¨ osung einer solchen Gleichung ist eine auf einem offenen Intervall I definierte n-mal differenzierbare Funktion ϕ : I → R, x 7→ ϕ(x) mit folgenden Eigenschaften: (a) {(x, ϕ(x), ϕ0 (x), . . . , ϕ(n−1) (x)) ∈ I × Rn | x ∈ I} ⊆ Ω. (b) F¨ ur alle x ∈ I gilt: ϕ(n) (x) = f (x, ϕ(x), . . . , ϕ(n−1) (x)).
253
254
KAPITEL 12. IMPLIZITE FUNKTIONEN
Zu einer gew¨ohnlichen Differentialgleichung n-ter Ordnung y (n) = f (x, y, y 0 , . . . , y (n−1) ) kann man leicht ein System gew¨ohnlicher Differentialgleichungen erster Ordnung Y 0 = F (x, Y ) angeben, aus dessen L¨osungen man L¨osungen der Gleichung n-ter Ordnung konstruieren kann: y00 y10
= = .. . = =
0 yn−2 0 yn−1
y1 y2
yn−1 f (x, y0 , y1 , . . . , yn−1 ),
d.h., wir setzen Y := (y0 , y1 , . . . , yn−1 ) und
F (x, Y ) := (y1 , . . . , yn−1 , f (x, y0 , y1 , . . . , yn−1 )).
Wenn ϕ : I → R eine L¨osung von y (n) = f (x, y, y 0 , . . . , y (n−1) ) ist, dann setzen wir Φ(x) := (ϕ(x), ϕ0 (x), . . . , ϕ(n−1) (x)) und rechnen sofort nach, daß Φ : I → Rn eine L¨osung von Y 0 = F (x, Y ) ist: (b)
Φ0 (x) = (ϕ0 (x), ϕ00 (x), . . . , ϕ(n) (x)) = F (x, Φ(x)) Umgekehrt, wenn
Φ : I → Rn , x 7→ (ϕ0 (x), . . . , ϕn−1 (x))
eine L¨osung von Y 0 = F (x, Y ) ist, dann folgt f¨ ur ϕ = ϕ0 : ϕ1 ϕ2
ϕn−1
= ϕ00 = ϕ0 = ϕ01 = ϕ00 .. . = ϕ0n−2 = ϕ(n−1) ,
was die n-fache Differenzierbarkeit von ϕ beweist, und die letzte Gleichung von Y 0 = F (x, Y ) zeigt, daß ϕ eine L¨osung von y (n) = f (x, y, y 0 , . . . , y (n−1) ) ist. Dieses Wechselspiel zwischen gew¨ohnlichen Differentialgleichungen n-ter Ordnung (mit L¨osungen) und Systemen von gew¨ohnlichen Differentialgleichungen erster Ordnung (mit L¨osungen) erkl¨art, warum wir uns in diesem Teil der Vorlesung in erster Linie mit (Systemen von) Gleichungen erster Ordnung besch¨aftigen werden. Dabei ist klar, daß auch Systeme von gew¨ohnlichen Differentialgleichungen h¨oherer Ordnung betrachtet und auf (gr¨oßere) Systeme von gew¨ohnlichen Differentialgleichungen erster Ordnung zur¨ uckgef¨ uhrt werden k¨onnen. Gew¨ohnliche Differentialgleichungen spielen in vielen Bereichen der Natur- und Wirtschaftswissenschaften eine wesentliche Rolle. Das vielleicht prominenteste Beispiel sind die Newtonschen Bewegungsgleichungen f¨ ur Massepunkte: Wenn x = x(t) ∈ R3 die Position eines Teilchens der Masse m im Raum beschreibt (in Abh¨angigkeit von der Zeit t), dann beschreibt x0 (t) seine Geschwindigkeit und x00 (t) seine Beschleunigung. Wirkt jetzt auf den Massepunkt am Ort x zur Zeit t eine Kraft F , die auch von der Geschwindigkeit abh¨angen darf (wie im Falle von Reibungskr¨aften), dann besagt Newtons Gesetz mx00 (t) = F (t, x(t), x0 (t)). Dies ist ein System von drei gew¨ohnlichen Differentialgleichungen 2-ter Ordnung, das durch x0
=
v0
=
v 1 F (t, x, v) m
¨ 12.2. DER SATZ UBER IMPLIZITE FUNKTIONEN
255
auf ein System von sechs gew¨ohnlichen Differentialgleichungen erster Ordnung zur¨ uckgef¨ uhrt wird. Es stellt sich heraus, daß die Gleichungen y 0 = f (x, y) f¨ ur nicht zu “wilde” f zu jedem (Anfangs-) Wert yo genau eine L¨osung ϕ mit ϕ(xo ) = yo gibt. Im Falle der Newtonschen Bewegungsgleichungen bedeutet dies, daß f¨ ur “anst¨andige” Kraftfelder die Bewegung eines Teilchens durch Ort und Geschwindigkeit zu einem Zeitpunkt schon vollst¨andig festgelegt sind. Im allgemeinen ist es unm¨oglich, explizit eine L¨osung einer vorgegebenen gew¨ohnlichen Differentialgleichung anzugeben. Um das plausibel zu machen, betrachten wir den Fall y 0 = f (x), d.h., die rechte Seite der Differentialgleichung soll gar nicht von y abh¨angen. Dann ist eine L¨osung ϕ mit ϕ(xo ) = yo durch Z x ϕ(x) = yo + f (t)dt xo
gegeben und bekanntlich ist so ein Integral in der Regel nicht explizit bestimmbar. F¨ ur spezielle Typen von gew¨ohnlichen Differentialgleichungen lassen sich (so wie f¨ ur Integrale auch) dennoch L¨osungen berechnen. Wir beginnen diesen Teil der Vorlesung auch mit der Untersuchung verschiedener spezieller Typen von gew¨ohnlichen Differentialgleichungen, f¨ ur die man elementare L¨osungsmethoden angeben kann (Kapitel 13). In der Regel f¨ uhren solche Methoden die Angabe von L¨osungen auf die Berechnung von Integralen zur¨ uck, sind also so (wenig) explizit wie die Integralberechnung. Nach den bisherigen Bemerkungen sollte klar sein, daß es f¨ ur die Anwendungen entscheidend sein wird, gute N¨aherungsl¨osungen f¨ ur Differentialgleichungen zu finden. Daf¨ ur ist es sehr wichtig, allgemeine Aussagen u ber die Existenz und Eindeutigkeit von L¨ o sungen zu haben, aber auch dar¨ uber, wie die L¨osungen ¨ von Schwankungen in den Anfangswerten und eventuellen Parametern abh¨angen. Mit diesen Themen besch¨aftigen wir uns in Kapitel 14 u ¨ber die lokale Theorie von gew¨ohnlichen Differentialgleichungen. Ein besonders wichtiger Typ von gew¨ohnlichen Differentialgleichungen sind die linearen Differentialgleichungen y 0 = f (x, y), in denen f linear in der Variablen y ist. Diesen Gleichungen, u ¨ber die man sehr viel detaillierte Aussagen machen kann, ist ein Extrakapitel gewidmet (Kapitel 15).
256
KAPITEL 12. IMPLIZITE FUNKTIONEN
Kapitel 13
Elementare L¨ osungsmethoden fu ¨r Differentialgleichungen In diesem Kapitel behandeln wir verschiedene Typen von gew¨ ohnlichen Differentialgleichungen, in denen die Bestimmung von L¨ osungen auf die Berechnung von Integralen zur¨ uckgef¨ uhrt werden kann.
13.1
Differentialgleichungen mit getrennten Variablen
Seien I und J offene Intervalle in R sowie f : I → R und g : J → R stetige Funktionen. Wir setzen voraus, daß g(y) 6= 0 f¨ ur alle y ∈ J. Die Differentialgleichung y 0 = f (x)g(y),
(x, y) ∈ I × J
heißt eine Differentialgleichung mit getrennten Variablen. Satz 13.1.1 : (Trennung der Variablen) Mit den obigen Bezeichnungen sei (xo , yo ) ∈ I × J und die Funktionen F : I → R und G : J → R seien definiert durch Z x Z y 1 F (x) := f (t)dt, G(y) := dt. g(t) xo yo Es sei I 0 ⊆ I ein offenes Intervall mit xo ∈ I 0 und F (I 0 ) ⊆ G(J). Dann existiert genau eine L¨ osung ϕ : I 0 → R von y 0 = f (x)g(y) mit ϕ(xo ) = yo . Diese L¨ osung erf¨ ullt (∀x ∈ I 0 )
(∗)
G(ϕ(x)) = F (x).
Beweis: Idee: Zuerst zeigt man, daß jede L¨osung die Gleichung (∗) erf¨ullt. Dann beweist man, daß die Funktion G invertierbar ist, also die L¨ osung durch (∗) vollst¨ andig bestimmt wird. Schließlich ben¨ utzt man (∗) zur Konstruktion der L¨ osung.
Wir zeigen zun¨achst, daß jede L¨osung ϕ : I 0 → R von y 0 = f (x)g(y) mit ϕ(xo ) = yo die Beziehung (∗) erf¨ ullt: Wenn S : J → R eine Stammfunktion der stetigen Funktion g1 ist (vgl. Korollar 9.1.3), dann gilt (∀x ∈ I 0 ) (S ◦ ϕ)0 (x) = S 0 (ϕ(x))ϕ0 (x) =
1 f (x)g(ϕ(x)) = f (x) g(ϕ(x))
d.h. S ◦ϕ ist eine Stammfunktion von f |I 0 (vgl. Formel 6.5). Speziell f¨ ur S = G gilt S ◦ϕ(xo ) = G(yo ) = 0, d.h. G ◦ ϕ ist die eindeutig bestimmte Stammfunktion von f |I 0 , die in xo den Wert 0 annimmt. Aber das ist gerade F |I 0 . 257
¨ ¨ DIFFERENTIALGLEICHUNGEN 258 KAPITEL 13. ELEMENTARE LOSUNGSMETHODEN FUR 1 Da G0 (y) = g(y) 6= 0 f¨ ur alle y ∈ J, ist G streng monoton, besitzt also eine stetig differenzierbare Umkehrfunktion H : G(J) → R (vgl. Satz 2.3.4 und Satz 3.2.7). Aus (∗) folgt jetzt
(∀x ∈ I 0 ) ϕ(x) = H ◦ F (x).
(∗∗)
Also gibt es h¨ochstens eine solche L¨ osung ϕ. Um die Existenz einer passenden L¨osung zu zeigen, ben¨ utzen wir (∗∗) als Definition f¨ ur ϕ. Dann gilt ϕ(xo ) = H(F (xo )) = H(0) = yo und ϕ0 (x) = H 0 (F (x))F 0 (x) =
1 f (x) = g(ϕ(x))f (x). G0 (H ◦ F (x))
Also ist ϕ in der Tat eine L¨osung der gesuchten Art.
Beispiel 13.1.2 : F¨ ur die Differentialgleichung y0 = y2 suchen wir eine L¨osung ϕ : R → R mit ϕ(0) = c (c ∈ R). Ist c = 0, so ist eine L¨osung durch ϕ : R → R, x 7→ 0 gegeben. Sei jetzt c > 0. Mit den Bezeichnungen aus Satz 13.1.1 ist f : R → R, f (x) = 1 Wir erhalten
Z
und
Z
x
F (x) =
y
1 dt = x und G(y) = 0
c 1 c [;
0
g(y) = y 2 .
g : ]0, ∞[ → R,
Es gilt dann G(]0, ∞[) = ] − ∞, also ist I = ] − ∞, F¨ ur die L¨osung ϕ auf I 0 gilt nach Satz 13.1.1
1 c[
· ¸y 1 1 1 dt = − = − . t2 t c c y
das maximale Intervall mit F (I 0 ) ⊆ G(]0, ∞[).
¡ ¢ 1 1 x = G ϕ(x) = − , c ϕ(x) d.h. ϕ(x) =
1 c
1 c = 1 − cx −x
f¨ ur x <
1 . c
F¨ ur c < 0 ergeben sich analog die L¨osungen ϕ : ] 1c , ∞[ → R, ϕ(x) =
c . 1 − cx
40 20
-2
-1
1 -20 -40
2
13.2. VARIATION DER KONSTANTEN
259
Beachte, daß wir nur im Falle c = 0 wirklich eine L¨osung gefunden haben, die auf ganz R definiert ist. Die Eindeutigkeitsaussagen aus Satz 13.1.1 zeigt, daß wir keine L¨osungen vergessen“ haben. Es ist also ” i.a. nicht m¨oglich, L¨osungen f¨ ur y 0 = f (x, y) zu finden, die f¨ ur alle denkbaren x definiert sind: L¨osungen k¨onnen explodieren“! ” √ Beispiel 13.1.3 : Betrachte die Funktion f : ]0, ∞[→ R, die durch f (x) := 2x definiert wird. Dann ist y(x) = 0 f¨ ur x ∈]0, ∞[ eine L¨osung der Differentialgleichung y 0 (x) = f (x). Aber auch die Funktionen ( 0 f¨ ur x ∈ [0, x0 ] φx0 (x) = 1 2 f¨ ur x ∈ [x0 , ∞] 2 (x − x0 ) sind L¨osungen, d.h. man kann nicht immer damit rechnen, daß die L¨osungen durch einen Anfangswert eindeutig bestimmt werden. Beispiel 13.1.4 : Seien I ⊆ R ein offenes Intervall und a, b : I → R zwei stetige Funktionen. Dann heißt y 0 = a(x)y + b(x) lineare Differentialgleichung erster Ordnung. Die Differentialgleichung heißt homogen, wenn b die konstante Nullfunktion ist, sonst inhomogen. Wir besch¨aftigen uns zuerst mit der homogenen Gleichung (∗)
y 0 = a(x)y.
Sei y0 ∈ I und c ∈ R. Dann existiert eine L¨osung ϕ : I → R der Differentialgleichung (∗) mit ϕ(x0 ) = c, n¨amlich ³Z x ´ Rx a(t) dt ϕ(x) = c · exp a(t) dt = ce x0 , x0
wie man durch Nachrechnen sofort u uft. Die Differentialgleichung (∗) ist eine Gleichung mit ge¨berpr¨ trennten Variablen. Also ist die L¨osung auch eindeutig. Im Spezialfall der Differentialgleichung y 0 = ky,
k∈R
haben die L¨osungen ϕ : R → R mit der Anfangsbedingung ϕ(x0 ) = c die Gestalt ϕ(x) = c · ek(x−x0 ) .
13.2
Variation der Konstanten
Satz 13.2.1 : (Variation der Konstanten) Sei I ein offenes Intervall und a, b : I → R stetige Funktionen. Dann gibt es zu beliebigem xo ∈ I und yo ∈ R genau eine L¨ osung ψ : I → R der Differentialgleichung y 0 = a(x)y + b(x) mit der Anfangsbedingung ψ(xo ) = yo , n¨ amlich µ Z ψ(x) = ϕ(x) yo +
x
xo
wobei
µZ
x
ϕ(x) = exp xo
Beweis:
¶ b(t) dt , ϕ(t)
¶ a(t)dt .
¨ ¨ DIFFERENTIALGLEICHUNGEN 260 KAPITEL 13. ELEMENTARE LOSUNGSMETHODEN FUR Wenn man in der L¨ osung der homogenen Gleichung y 0 = a(x)y aus Beispiel 13.1.4 die Konstante durch eine passende Funktion c(x) ersetzt, dann ergibt sich eine L¨ osung der inhomogenen Gleichung (daher der Name des Verfahrens).
Idee:
¡Rx ¢ Setze ϕ(x) = exp x0 a(t) dt 6= 0. F¨ ur eine L¨osung ψ der inhomogenen Gleichung y 0 = a(x)y + b(x) machen wir den Ansatz ψ(x) = c(x)ϕ(x).
Wir suchen nun nach Bedingungen, die die Funktion c erf¨ ullen muß, damit ψ die Differentialgleichung y 0 = a(x)y + b(x) erf¨ ullt. Zun¨achst einmal gilt ψ 0 = cϕ0 + c0 ϕ = aψ + c0 ϕ. Also ist ψ genau dann eine L¨osung von y 0 = a(x)y + b(x) mit ψ(xo ) = yo , wenn c0 ϕ = b und c(xo ) = yo gilt, d.h. wenn Z x b(t) dt. c(x) = yo + ϕ(t) xo
Beispiel 13.2.2 : Wir betrachten die Differentialgleichung y 0 = 2xy + x3 , d.h. es ist a(x) = 2x und b(x) = x3 . Die homogene Gleichung hat die L¨osungen ³Z x ´ 2 ϕ(x) = c · exp 2t dt = c · ex . 0
Die L¨osung der inhomogenen Gleichung mit der Anfangsbedingung ψ(0) = c ist nach Satz 13.2.1: Z x ³ ´ 2 2 ψ(x) = ex · c + t3 · e−t dt . 0
Wir rechnen das Integral mit Hilfe der Substitution s(t) = t2 aus: Z x Z x 2 3 −t2 1 t ·e dt = 2 t2 · e−t · s0 (t) dt 0
Hiermit ergibt sich
0
Z =
1 2
=
1 2
=
1 2
x2
0
³
Z x2 ´ ¤x2 − s · e−s 0 + e−s ds 0 ´ £ −s ¤x2 ´ 1 ³ 2 2 2 − e 0 = 2 1 − x · e−x − e−x
s · e−s ds =
−x2 · e−x
2
1 2
³£
2
− 12 (1 + x2 )e−x . 2
ψ(x) = (c + 12 )ex − 12 (1 + x2 ).
13.3
Homogene Differentialgleichungen
Sei I ein offenes Intervall, f : I → R eine stetige Funktion und Ω := {(x, y) ∈ R× × R |
y ∈ I}. x
13.3. HOMOGENE DIFFERENTIALGLEICHUNGEN
261
y
x
Dann heißt
y y 0 = f ( ), (x, y) ∈ Ω x eine homogene Differentialgleichung. Man kann solche Gleichungen behandeln, indem man sie auf Gleichungen mit getrennten Variablen zur¨ uckf¨ uhrt. Satz 13.3.1 : Sei I ⊆ R× eine offenes Intervall und mit den obigen Bezeichnungen (xo , yo ) ∈ Ω wobei xo ∈ I. Dann gilt: Eine Funktion ϕ : I → R ist genau dann eine L¨ osung der Differentialgleichung y 0 = y f ( x ) mit Anfangsbedingung ϕ(xo ) = yo , wenn die Funktion ψ : I → R,
x 7→
ϕ(x) x
eine L¨ osung der Differentialgleichung 1 (f (z) − z), x
z0 = mit Anfangsbedingung ψ(xo ) =
yo xo
(x, z) ∈ R× × J
ist.
Beweis: Sei zun¨achst ϕ eine L¨osung von y 0 = f ( xy ). Dann gilt ψ 0 (x)
= =
ϕ0 (x) ϕ(x) − 2 x x ³ ¢ 1 ϕ(x) ´ ϕ(x) 1¡ f − 2 = f (ψ(x)) − ψ(x) . x x x x
Also ist ψ eine L¨osung von z 0 = x1 (f (z) − z) mit den entsprechenden Anfangsbedingungen. Sei jetzt ψ eine L¨osung von z 0 = x1 (f (z) − z). Dann gilt ϕ0 (x) =
³ ϕ(x) ´ ¢ ¡ ¢ d ¡ , xψ(x) = ψ(x) + xψ 0 (x) = ψ(x) + f ψ(x) − ψ(x) = f dx x
d.h., ϕ ist L¨osung von y 0 = f ( xy ).
Man kann den Sachverhalt aus Satz 13.3.1 auch so formulieren: Die Differentialgleichung y 0 = f ( xy ) geht durch die Substitution z = xy in die Differentialgleichung z 0 = x1 (f (z) − z) u ¨ber. Etwas salopp kann man dann wie folgt rechnen: Aus y = xz folgt y 0 = z + xz 0 , also geht y 0 = f ( xy ) u ¨ber in z0 =
¢ y0 − z 1¡ = f (z) − z . x x
¨ ¨ DIFFERENTIALGLEICHUNGEN 262 KAPITEL 13. ELEMENTARE LOSUNGSMETHODEN FUR Beispiel 13.3.2 : Wir betrachten die Differentialgleichung y ³ y ´2 y0 = 1 + + in R× + × R. x x Durch die Substitution z =
y x
geht sie u ¨ber in die Gleichung 1 (1 + z 2 ) x
z0 =
mit getrennten Variablen. F¨ ur die L¨osung ψ dieser Gleichung mit der Anfangsbedingung ψ(xo ) = zo = gilt daher in der Notation von Satz 13.1.1 Z z dt G(z) = = arctan z − arctan z0 1 + t2 z0 und
Z
x
F (x) = x0
yo xo
x dt = log , t x0
d.h.,
³ ´ x y0 ψ(x) = tan log +α mit α = arctan . x0 x0 Die urspr¨ ungliche Differentialgleichung wird also gel¨ost durch ³ ´ x ϕ(x) = x tan log +α . x0 Man sieht der expliziten Form insbesondere an, daß sie in einer ausreichend kleinen Umgebung von x0 definiert ist.
13.4
Gleichungen vom Typ y 00 = f (y)
In der Physik tritt die Differentialgleichung y 00 = f (y) auf als die eindimensionale Bewegungsgleichung eines Punktes, der einer Kraft ausgesetzt ist, die nur vom Ort, aber nicht von der Zeit abh¨angt. Daher benennen wir die Variablen hier suggestiver mit (t, x) statt (x, y) und schreiben, wie in der Physik u ¨blich, x(t) ˙ und x ¨(t) statt x0 (t) und x00 (t). Wir betrachten die Differentialgleichung x00 = f (x)
auf
R × J,
wobei f : J → R eine stetige Funktion sei. Die physikalische Interpretation ist, daß auf ein Teilchen der Masse m = 1 am Ort x die Kraft f (x) wirkt. Wir definieren nun eine Stammfunktion U : J → R von −f durch Z x U (x) := −
f (ξ) dξ, a
wobei a ∈ J ein beliebiger (aber fest gew¨ ahlter) Punkt ist. Die Funktion U hat dann die physikalische Bedeutung einer potentiellen Energie. Die Differentialgleichung x ¨ = f (x) geht dann u ¨ber in x ¨=−
dU (x). dx
Eine L¨osung dieser Gleichung bezeichnen wir mit x(t). Die Gesamtenergie des Massenpunktes ist definiert als: E(t) :=
1 2 (x(t)) ˙ + U (x(t)). 2
Der erste Summand steht f¨ ur die Bewegungsenergie (kinetische Energie) und der zweite f¨ ur die potentielle Energie. Wir erhalten mit der Kettenregel ³ ´ dU dU ˙ (x(t))x(t) ˙ = x(t) ˙ x ¨(t) + (x(t)) = 0. E(t) = x(t)¨ ˙ x(t) + dx dx
13.4. GLEICHUNGEN VOM TYP Y 00 = F (Y )
263
Also ist die Funktion E konstant (Energieerhaltungssatz). Wir betrachten E daher als eine reelle Zahl. Wegen U (x(t)) ≤ E sehen wir, daß die L¨osung in einem Bereich verlaufen muß, in dem U ≤ E gilt. Die Bewegung gen¨ ugt dann der Gleichung 2 (x(t)) ˙ = 2(E − U (x(t))).
Ist x(t) ˙ ≥ 0, so erhalten wir (∗)
x(t) ˙ =
p
2(E − U (x(t)))
und andernfalls p x(t) ˙ = − 2(E − U (x(t))). p Die beiden Differentialgleichung x˙ = ± 2(E − U (x)) sind Gleichungen mit getrennten Variablen. Sei J 0 ⊆ J ein offenes Intervall mit U (x) < E f¨ ur alle x ∈ J 0 und xo ∈ J 0 ein fester Punkt. F¨ ur x ∈ J 0 setzen wir Z x dξ p G(x) := . 2(E − U (ξ)) xo (∗∗)
Wenn jetzt I ⊆ R ein Interval mit I ⊆ G(J 0 ) ist, dann zeigt Satz 13.1.1, daß die Gleichung (∗) mit der Anfangsbedingung x(to ) = xo genau eine L¨osung ϕ : I → R hat, f¨ ur die dann gilt G(x(t)) = t − to . Durch Ableiten nach t in (∗) sieht man, daß x(t) eine L¨osung von x ¨ = f (x) ist. Man kann dann das Integral G(x) als die Zeit interpretieren, die das Teilchen ben¨otigt, um von xo nach x zu gelangen. Wir betrachten nun die folgende Situation: Es seien xA < xB zwei Punke mit U (xA ) = U (xB ) = E dU und U (x) < E f¨ ur xA < x < xB . Ferner nehmen wir an, daß dU dx (xA ) = −f (xA ) 6= 0 6= −f (xB ) = dx (xB ) dU dU ist. Dies bedeutet automatisch, daß dx (xA ) < 0 < dx (xB ).
U
E
xA
xB
x
Dann k¨onnen wir in obiger Analyse J 0 =]xA , xB [ setzen und finden L¨osungen von x ¨ = f (x) solange xo ∈ J 0 gilt und t so klein ist, daß x(t) ∈ J 0 bleibt. Da nach Voraussetzung die Funktion E − U (x) in den Punkten xA und xB verschwindet und das Vorzeichen wechselt, ist die rechte Seite von (∗) und (∗∗) in diesen Punkten nicht in einer ganzen Umgebung definiert. Also kann man Satz 13.1.1 nicht anwenden, um eine L¨osung x(t) von x ¨ = f (x) mit x(to ) = xA (oder x(to ) = xB ) zu finden. Wenn wir annehmen, daß so eine L¨osung x : I 0 → R mit x(to ) = xB existiert, dann gilt (x(t ˙ o ))2 = 2(E − U (x(to ))) = 0 und
dU (xA ) > 0, dx d.h. x(t) hat in to ein striktes lokales Minimum. Zusammen mit der Stetigkeit von x(t) zeigt dies, daß es ein δ > 0 mit (∀t ∈]to , to + δ[) x(t) ∈]xA , xB [ x ¨(to ) = −
¨ ¨ DIFFERENTIALGLEICHUNGEN 264 KAPITEL 13. ELEMENTARE LOSUNGSMETHODEN FUR gibt. Mit der Stetigkeit von f finden wir ein ² > 0 mit (∀x ∈ [xA , xA + δ]) f (x) > ². Analoge Aussagen gelten f¨ ur xB statt xA . Dies bedeutet, daß obige Analyse mithilfe der Trennung der Variablen uns die L¨osung ϕ f¨ ur t ∈]to , to + δ[ beschreibt. Beachte, daß Z xB dx p T := < ∞. 2(E − U (x)) xA Dies ergibt sich mit der Substitution s = 2(E − U (x)) aus Z
xA +δ
Z
dx
p
2(E − U (x))
xA
2(E−U (xA +δ))
= 0
ds 2p (−2f (x))−1 √ ≤ 2(E − U (xA + δ)) ² s
sowie der analogen Aussage f¨ ur xB . Damit sehen wir, daß die L¨osung ϕ in endlicher Zeit T vom Punkt xA zum Punkt xB wandert. Zusammen ergibt sich folgende Interpretation: Wenn es eine lokale L¨osung von x ¨ = f (x) um jeden Punkt gibt, dann gibt es eine globale L¨osung, die zwischen den Punkten xA und xB periodisch hin und her schwingt. Die Periode ist 2T . Beispiel 13.4.1 : Der harmonische Oszillator gen¨ ugt der Differentialgleichung x ¨ = −kx,
k > 0.
Wir suchen eine L¨osung mit der Anfangsbedingung x(to ) = 0,
x(t ˙ o ) = vo > 0.
Mit den obigen Bezeichnungen erhalten wir Z
x
U (x) =
kξ dξ = 0
k 2 x . 2
Aus der Anfangsbedingung ergibt sich: E=
1 1 x(t ˙ o )2 + U (xo ) = vo2 . 2 2
Die Bewegung verl¨auft daher in dem Intervall h vo vo i {x ∈ R | U (x) ≤ E} = − √ , √ . k k Wir setzen zur Abk¨ urzung
vo A := √ , k
ω :=
√
k.
F¨ ur |x| < A ist dann Z 0
Substituieren wir u =
ξ A,
x
p
G(x) =
Z
dξ 2(E − U (ξ))
x
dξ 1 = 2 2 Aω vo − kξ
Z
p
= 0
q 0
so erhalten wir 1 G(x) = ω
Also ist wegen Satz 13.1.1:
Z 0
x A
√
¡x¢ 1 du = arcsin . 2 ω A 1−u
¡ x(t) ¢ 1 arcsin = t − to ω A
x
dξ ¡ ξ ¢2 . 1− A
13.4. GLEICHUNGEN VOM TYP Y 00 = F (Y )
265
und somit x(t) = A sin(ω(t − to )). Diese Beziehung gilt zun¨achst nur f¨ ur |ω(t − to )| < π2 , aber man sieht durch Einsetzen, daß diese Funktion die Differentialgleichung f¨ ur alle t l¨ost. Die Bewegung ist also die Schwingung um den Nullpunkt mit v0 2π 2π √ Amplitude A = √ und Schwingungsdauer . ω = k k
¨ Ubung 13.4.1 : Eine Differentialgleichung y 0 = f (x, y) in einem Gebiet G ⊆ R2 bestimmt ein Richtungsfeld: In jedem Punkt (x, y) ∈ G wird durch y 0 = f (x, y) eine Steigung vorgegeben. Gesucht sind differenzierbare Funktionen, deren Graph an jedem seiner Punkte die vorgegebene Steigung hat. Skizziere diese Interpretation anhand der Differentialgleichungen y 0 = y/x und y 0 = −x/y. ¨ Ubung 13.4.2 : L¨ ose die Differentialgleichung y 0 = f (x, y) f¨ ur folgende Funktionen f : Ω → R. (i) Ω :=]0, ∞[×]0, ∞[, (ii) Ω =]0, ∞[×R,
f (x, y) = y/x, −y α
f (x, y) = e
x ,
y(1) = 2, y(1) = 0,
α 6= −1.
¨ Ubung 13.4.3 : An einer Batterie mit der konstanten Spannung U > 0 sind u ¨ber einen Schalter ein Ohmscher Widerstand R > 0 und eine Induktivit¨ at L > 0 in Reihe geschaltet. Der zeitliche Stromverlauf I(t) gen¨ ugt nach dem Einschalten der Differentialgleichung U = RI(t) + LI 0 (t) F¨ ur t = 0 gilt I(0) = 0. Bestimme I(t). ¨ Ubung 13.4.4 : Berechne die allgemeine L¨ osung der linearen Differentialgleichung y 0 = a(x)y + b(x), wobei a, b :]0, ∞[→ R,
a(x) = −1/x,
b(x) = 1 + x.
¨ Ubung 13.4.5 : Bestimme die allgemeine L¨ osung von y 0 + 2y/x = 4x auf dem Intervall ]0, ∞[. ¨ Ubung 13.4.6 : Bestimme die L¨ osung der Differentialgleichung y0 =
y 2 + 2xy , x2
(x > 0),
die der Anfangsbedingung y(2) = −8/3 gen¨ ugt. ¨ Ubung 13.4.7 : Einer Population von Protozoen (Urtierchen) werden ab dem Zeitpunkt t0 = 0 pro Sekunde a2 > 0 Bakterien als Futter zugef¨ uhrt. Die Protozoen verleiben sich die Bakterien mit einer Rate ein, die proportional zu dem Quadrat der momentanen Bakterienzahl x(t) ist; der Proportionalit¨ atsfaktor werde mit b2 bezeichnet (b > 0). Bestimme x(t) und den Gleichgewichtszustand limt→∞ x(t). ¨ Ubung 13.4.8 : Beweise das Lemma von Gronwall: Seien φ, ψ : [a, b] → [0, ∞[ stetig. Es gebe Konstanten α, γ > 0, so daß f¨ ur alle t ∈ [a, b] gilt: Z t φ(t) ≤ γ + α ψ(s)φ(s)ds. a
Dann gilt f¨ ur alle t ∈ [a, b]
µ Z φ(t) ≤ γ exp α
t
¶ ψ(s)ds .
a
¨ Ubung 13.4.9 : Sei h(t) die H¨ ohe einer Pflanze zur Zeit t. Bei vielen Pflanzen ist im Fr¨ uhstadium ihres Wachs¨ tums die zeitliche Anderungsrate von h(t) direkt proportional zu h(t) und umgekehrt proportional zu t3 . Bestimme h(t), wenn die Maßeinheiten so gew¨ ahlt sind, daß h(1) = 1. ¨ Ubung 13.4.10 : Bestimme die allgemeine L¨ osung der Differentialgleichung y 0 = (x + y)2 . Tip: Verwende die Substitution: z = x + y.
¨ ¨ DIFFERENTIALGLEICHUNGEN 266 KAPITEL 13. ELEMENTARE LOSUNGSMETHODEN FUR ¨ Ubung 13.4.11 : Betrachte f¨ ur x > 0 das Differentialgleichungssystem y10
=
y20
=
1 y2 , x (1 − x)y1 + y2 . −y1 +
(i) Schreibe dieses System in Matrizenschreibweise, µ ¶ 1 (ii) Zeige, daß φ(x) := dieses System l¨ ost, x ¨ (iii) Berechne mit der Methode aus Ubung 13.4.18 eine zweite L¨ osung.
¨ Ubung 13.4.12 : Sei I ⊆ R ein Intervall und A : I → Mat(n × n, R) eine matrixwertige Funktion, deren Komponenten beliebig oft differenzierbar seien. Zeige, daß alle L¨ osungen φ : I → Rn der Differentialgleichung 0 y = A(x)y beliebig oft differenzierbar sind. ¨ Ubung 13.4.13 : Die Bev¨ olkerung einer Stadt verdoppele sich in 50 Jahren. In wie vielen Jahren wird sie sich verdreifacht haben, wenn die Wachstumsrate zur Einwohnerzahl proportional ist. ¨ Ubung 13.4.14 : Betrachte einen elektrischer Stromkreis, der einen Widerstand von R = 10 Ohm und einen Kondensator der Kapazit¨ at C = 10−3 Farad sowie eine elektromotorische Kraft von E(t) = 100 sin(120πt) Volt besitzt. Dann ist die Kondensatorladung q(t) gegeben durch R
q(t) dq (t) + = E(t). dt C
Bestimme q(t) unter der Annahme q(0) = 0. ¨ Ubung 13.4.15 : Zeige, daß die Differentialgleichung x2 cos(y)y 0 = −2x sin y ¨ exakt ist (vgl. Ubung 13.4.20) und berechne die L¨ osung zur Anfangsbedingung y(1) = π/4. ¨ Ubung 13.4.16 : Gegeben sei die Bernoullische Differentialgleichung y0 +
1 x y + y 4 = 0, 3 3
y(0) = 2.
(i) F¨ uhre die Bernoullische Differentialgleichung durch die Substitution z := y −3 auf die lineare Differentialgleichung z 0 − z = x zur¨ uck, (ii) L¨ ose diese lineare Differentialgleichung und bestimme daraus eine L¨ osung der Bernoullischen Differentialgleichung.
¨ orper der Masse m falle ohne Luftwiderstand zur Erde. Im Zeitpunkt t0 = 0 habe er Ubung 13.4.17 : Ein K¨ die Geschwindigkeit v0 . Welchen Weg legt er in der Zeit t zur¨ uck? ¨ Ubung 13.4.18 : Sei I ⊆ R ein Intervall und µ a11 A= a21
a12 a22
¶ : I → Mat(2 × 2, R)
¡ ¢ eine stetige Abbildung. Die Differentialgleichung y 0 = Ay besitze die spezielle L¨ osung φ = φφ12 : I → R2 . Im Teilintervall J ⊆ I gelte φ1 (x) 6= 0 f¨ ur alle x ∈ J. Zeige: Man erh¨ alt eine zweite L¨ osung ψ : J → R2 durch den Ansatz à ! à ! φ1 (x) 0 ψ(x) = u(x) + , φ2 (x) g(x) wobei u, g : J → R differenzierbare Funktionen sind, die folgenden Differentialgleichungen gen¨ ugen: ¶ µ a12 φ2 g, u0 = g. g 0 = a22 − a12 φ1 φ1
13.4. GLEICHUNGEN VOM TYP Y 00 = F (Y )
267
¨ Ubung 13.4.19 : Nach einem Gesetz von Newton ist das Maß der Abk¨ uhlung einer Substanz in bewegter Luft der Temperaturdifferenz von Substanz und Luft proportional. Bestimme den Zeitpunkt, in dem eine Temperatur von 40◦ herrscht, falls die Temperatur der Luft 30◦ betr¨ agt und sich die Substanz in 15 Minuten von 100◦ auf ◦ 70 abk¨ uhlt. ¨ Ubung 13.4.20 : Seien P, Q : R2 → R stetig. Die implizit gegebene Differentialgleichung Q(x, y)y 0 = −P (x, y) heißt exakt, wenn es eine differenzierbare Funktion F : R2 → R gibt mit gradF (x, y) = (P (x, y), Q(x, y)) f¨ ur alle (x, y) ∈ R2 . Sei Q(x, y)y 0 = −P (x, y) exakt, I ⊆ R ein Intervall und y : I → R stetig differenzierbar. Zeige, daß y genau dann L¨ osung obiger Differentialgleichung ist, wenn die Funktion I → R,
x 7→ F (x, y(x))
konstant ist. ¨ Ubung 13.4.21 : Sei r > 0, I :=] − r, r[, a, b : I → R stetig. Es sei a eine ungerade, b eine gerade Funktion (d.h. f¨ ur jedes x ∈] − r, r[ gilt a(x) = −a(−x) und b(x) = b(−x)). Die Differentialgleichung y 00 + a(x)y 0 + b(x)y = 0 habe eine gerade L¨ osung φ1 . Benutze den Ansatz φ2 (x) = φ1 (x) · u(x) mit µ Z x ¶ 1 u0 (x) = exp − a(t)dt . φ1 (x)2 0 Zeige dann, daß φ2 eine ungerade L¨ osung ist. ¨ ose die folgenden Differentialgleichungen durch Zur¨ uckf¨ uhrung auf Differentialgleichungen Ubung 13.4.22 : L¨ mit getrennten Variablen. (i) y0 =
x2 (y + 1) , (1 − x)y 2
(ii) y0 =
x2 y . 1 + x3
¨ Ubung 13.4.23 : Bestimme eine L¨ osung der folgenden Anfangswertaufgabe y0 =
2y − x + 5 , 2x − y − 4
y(0) = 0.
¨ Ubung 13.4.24 : Bestimme die allgemeine L¨ osung der folgenden Differentialgleichungen (i) y 0 = 2y + 1 + x2 , (ii) y 0 = 3y + e2x , (iii) y 0 = −2y + sin x. ¨ ose die Differentialgleichung Ubung 13.4.25 : L¨ y 0 = (sin x)y + sin(x),
y(0) = 0
mit der Formel Variation der Konstanten. ¨ ahlen eins, zwei, drei. . . sei N (t) die Zahl, die eine Person nach der Ubung 13.4.26 : Bei ununterbrochenem Z¨ Zeit t erreicht. Wir idealisieren N (t) als eine differenzierbare Funktion von ]0, ∞[ nach ]0, ∞[. Dann kommt man unter begr¨ undbaren Annahmen dazu, daß N der Differentialgleichung a y0 = b + ln y mit individuellen Konstanten a, b gen¨ ugt, wobei a > 0.
¨ ¨ DIFFERENTIALGLEICHUNGEN 268 KAPITEL 13. ELEMENTARE LOSUNGSMETHODEN FUR (i) Bestimme eine L¨ osung dieser Differentialgleichung (implizite Form). (ii) Erm¨ udungserscheinungen lassen sich durch eine Zeitabh¨ angigkeit von a ber¨ ucksichtigen, etwa durch a(t) := a0 exp(−λt),
t, λ, a0 > 0.
L¨ ose die so entstehende Differentialgleichung.
¨ Ubung 13.4.27 : L¨ ose das Anfangswertproblem y0 =
cos x , cos2 y
y(π) = π/4.
¨ Ubung 13.4.28 : Bestimme alle Kurven, deren Steigung in jedem ihrer Punkte (x, y) gleich der doppelten Koordinatensumme des Punktes ist. ¨ Ubung 13.4.29 : Sei g ∈ C[a, b] derart, daß f¨ ur alle η ∈ C 2 [a, b] mit η(a) = η(b) = 0 gilt: Z b η(t)g(t)dt = 0. a
Zeige, daß g ≡ 0. ¨ Ubung 13.4.30 : Sei [a, b] ⊂ R ein Intervall, F : [a, b] × R × R → R,
(t, y, p) 7→ F (t, y, p)
eine zweimal stetig differenzierbare Funktion, und Mc,d := {f ∈ C 2 [a, b]|f (a) = c, f (b) = d}, Definiere J : Mc,d → R durch
Z
b
J(f ) :=
c, d ∈ R.
F (t, f (t), f 0 (t))dt.
a
Fragen nach der Minimierung von J auf Mc,d sind Gegenstand der sogenannten Variationsrechnung. Hat J in g ∈ Mc,d ein Minimum, so nennt man g eine L¨ osung des Variationsproblems. (i) Formuliere die Frage nach der k¨ urzesten Verbindung zweier Punkte (a, b), (c, d) ∈ R2 als Variationsproblem. (ii) Beweise das Fundamentallemma der Variationsrechnung: Ist g eine L¨ osung der Variationsproblems, so gilt µ ¶ ∂F d ∂F (t, g(t), g 0 (t)) = (t, g(t), g 0 (t)) . ∂y dt ∂p ¨ Hinweis: Ubung 13.4.29. (iii) L¨ ose das Variationsproblem aus (i).
¨ Ubung 13.4.31 : Skizziere das Richtungsfeld der Differentialgleichung y0 =
x y
in R×]0, ∞[ und rate so die L¨ osung, die der Anfangsbedingung y(0) = c > 0 gen¨ ugt.
Kapitel 14
Lokale Theorie gew¨ ohnlicher Differentialgleichungen In diesem Kapitel beweisen wir den Satz von Picard-Lindel¨ of, der unter gewissen Voraussetzungen die Existenz und Eindeutigkeit von lokalen L¨ osungen f¨ ur Systeme von gew¨ ohnlichen Differentialgleichungen erster Ordnung nahe bei vorgegebenen Anfangswerten garantiert. Dar¨ uber hinaus studieren wir, wie diese lokalen L¨ osungen von Anfangswerten und Parametern abh¨ angen.
14.1
Der Satz von Picard–Lindelo ¨f
Um die Voraussetzungen im Satz von Picard–Lindel¨of zu motivieren, betrachten wir zun¨achst ein Beispiel f¨ ur eine Differentialgleichung, deren L¨osungen nicht eindeutig bestimmt sind. Beispiel 14.1.1 : 2
f : R2 → R, f (x, y) = y 3 =
¡ √ ¢2 3 y .
F¨ ur die hierdurch gegebene Differentialgleichung y 0 = f (x, y) ist zum einen ϕ0 (x) = 0 eine L¨osung. F¨ ur jedes a ∈ R erhalten wir eine weitere L¨osungen durch ψa (x) =
1 (x − a)3 , 27
¡ ¢2 denn ψa0 (x) = 19 (x − a)2 = 13 (x − a) = ψa (x)2/3 . F¨ ur jedes a ∈ R sind ϕ0 und ψa also zwei verschiedene L¨osungen, die in dem Punkt a u ¨bereinstimmen, denn es gilt ϕ0 (a) = 0 = ψa (a). Man kann durch Zusammensetzen aus den ψa sogar noch weitere L¨osungen machen: F¨ ur a < b l¨osen auch die Funktionen x≤a ψa (x), 0, a<x
2 -0.05 -0.1 -0.15
269
4
6
8
¨ KAPITEL 14. LOKALE THEORIE GEWOHNLICHER DIFFERENTIALGLEICHUNGEN
270
Der allgemeinste Existenzsatz, den man f¨ ur gew¨ohnliche Differentialgleichungen hat, ist der folgende Satz von Peano: Satz 14.1.2 : (Peano) Sei Ω ⊆ R × Rn eine offene Menge und f : Ω → Rn eine stetige Funktion. Dann existiert zu jedem Punkt (xo , yo ) ∈ Ω ein ² > 0 und eine L¨ osung ϕ : [xo − ², xo + ²] → Rn der 0 Differentialgleichung y = f (x, y) mit Anfangsbedingung ϕ(xo ) = yo . Wie wir an Beispiel 14.1.1 sehen, darf man in diesem Kontext keine Eindeutigkeit erwarten. Wir beweisen Satz 14.1.2 an dieser Stelle nicht, sondern konzentrieren uns auf eine Situation, in der Existenz und Eindeutigkeit garantiert werden. Satz 14.1.3 : (Picard–Lindel¨of) Sei U ⊆ Rn offen und I ein offenes Intervall. Wenn eine stetige Funktion f : I × U → Rn die Bedingung (L)
(∀y1 , y2 ∈ U, x ∈ I)
kf (x, y1 ) − f (x, y2 )k ≤ Lky1 − y2 k
erf¨ ullt, wobei k · k eine Norm auf Rn ist und L eine positive Konstante, dann gibt es zu jedem (xo , yo ) ∈ I × U und zu jedem hinreichend kleinen ² > 0 und jedem z ∈ U mit kz − yo k < ² genau eine L¨ osung ϕz : ]xo − ², xo + ²[→ Rn von y 0 = f (x, y) mit ϕz (xo ) = z. Genauer: es gibt eine stetige Funktion ψ : {z ∈ Rn | kz − yo k < ²}×]xo − ², xo + ²[→ Rn , f¨ ur die gilt
(∀(z, x) ∈ {y ∈ Rn | ky − yo k < ²}×]xo − ², xo + ²[)
ϕz (x) = ψ(z, x),
d.h. die L¨ osungen h¨ angen stetig von den Anfangswerten ab. Beweis: Idee: Wenn ϕz : I → Rn eine L¨osung von y 0 = f (x, y) mit ϕz (xo ) = z ist, dann folgt durch Integration von ϕ0z (x) = f (x, ϕz (x)), daß Z x (∗) ϕz (x) = z + f (t, ϕz (t))dt xo
und umgekehrt folgt aus (∗) auch ϕ0z (x) = f (x, ϕz (x)). Wenn man jetzt eine Menge M von Funktionen ψ : U × I → Rn hat, die unter Z x (∗∗) (T ψ)(z, x) = z + f (t, ψ(z, t))dt xo
invariant ist, dann liefern die Fixpunkte ψ von T : M → M die Kandidaten f¨ ur L¨ osungen ϕz von y 0 = f (x, y) mit Anfangswert ϕz (xo ) = z via ϕz (x) = ψ(z, x). An dieser Stelle erinnert man sich an den Banachschen Fixpunktsatz 12.1.1. Es ist also M so zu bestimmen, daß es zusammen mit einer Metrik ρ ein vollst¨ andiger metrischer Raum wird, auf dem T strikt kontrahierend wirkt, d.h. es existiert eine Konstante q ∈ [0, 1[ mit ρ(T ψ1 , T ψ2 ) ≤ qρ(ψ1 , ψ2 ).
1. Schritt: Konstruktion von (M, ρ). Wegen der Stetigkeit von f gibt es ein r > 0 mit Ir :=]xo − r, xo + r[⊆ I und B(yo ; r) := {z ∈ Rn | kz − yo k < r} ⊆ U sowie (∀(x, y) ∈ Ir × B(yo ; r))
kf (x, y) − f (xo , yo )k ≤ 1
Also gibt es ein c > 0 (man kann z.B. c = kf (xo , yo )k + 1 w¨ahlen) mit (∀(x, y) ∈ Ir × B(yo ; r)) kf (x, y)k ≤ c.
¨ 14.1. DER SATZ VON PICARD–LINDELOF W¨ahle ² > 0 so klein, daß
271
r r 1 ² < min{ , , }. 2 2c 2L
Jetzt setzen wir M := {ψ : B(yo ; ²) × I² → B(yo ; r) | ψ stetig und (∀z ∈ B(yo ; ²)) ψ(z, xo ) = z}. Auf M definieren wir die Metrik ρ(ψ1 , ψ2 ) := sup{kψ1 (z, x) − ψ2 (z, x)k | (z, x) ∈ B(yo ; ²) × I² }, ¨ die M zu einem vollst¨andigen metrischen Raum macht (Ubung: verifiziere diese Behauptung!). 2. Schritt: Verifikation der Voraussetzungen des Banachschen Fixpunksatzes. Wir zeigen jetzt zwei Aussagen: (1) Mit ψ ist auch die durch (∗∗) definierte Funktion T ψ in M . (2) Die Abbildung T : M → M ist strikt kontrahierend. Klar ist zun¨achst, daß T ψ : B(yo ; ²) × I² → Rn die Gleichung T ψ(z, xo ) = z erf¨ ullt. Weiter gilt kT ψ(z, x) − zk
= kT ψ(z, x) − T ψ(z, xo )k ¯Z x ¯ ¯ ¯ ≤ ¯¯ kf (t, ψ(z, t))kdt¯¯ xo
≤ c|x − xo | r , ≤ 2 was wegen kz − yo k < 2r die erste Behauptung beweist, wenn wir nachweisen k¨onnen, daß T ψ stetig ist. Dazu rechnen wir kT ψ(z, x) − T ψ(e z, x e)k = ° ° Z x Z xe ° ° ° ° = °z − ze + f (t, ψ(z))dt − f (t, ψ(e z ))dt° ° ° xo xo ° ° Z Z ° ° x x e ° ° = °z − ze + (f (t, ψ(z)) − f (t, ψ(e z )))dt − f (t, ψ(e z ))dt° ° ° xo x ¯ ¯Z x ¯ ¯¯Z xe ¯ ¯ ¯ ¯ ¯ ¯ ¯ ≤ kz − zek + ¯ kf (t, ψ(z, t)) − f (t, ψ(e z , t))kdt¯ + ¯ kf (t, ψ(e z , t))kdt¯ . ¯ x ¯ xo ¨ Die letzte Zeile wird beliebig klein f¨ ur z nahe an ze und x nahe an x e (Ubung: verifiziere diese Behauptung!), also ist T ψ in der Tat stetig und (1) bewiesen. F¨ ur die zweite Behauptung rechnen wir kT ψ1 (z, x) − T ψ2 (z, x)k
≤ ≤
¯Z x ¯ ¯ ¯ ¯ ¯ kf (t, ψ (z, t)) − f (t, ψ (z, t))kdt 1 2 ¯ ¯ xo ¯Z x ¯ ¯ ¯ L ¯¯ kψ1 (z, t) − ψ2 (z, t)kdt¯¯ xo
≤ ≤ und das zeigt (2). 3. Schritt: Existenz der L¨osungen
L²ρ(ψ1 , ψ2 ) 1 ρ(ψ1 , ψ2 ) 2
272
¨ KAPITEL 14. LOKALE THEORIE GEWOHNLICHER DIFFERENTIALGLEICHUNGEN Mit (1) und (2) sehen wir, daß man den Banachschen Fixpunktsatz auf T : M → M anwenden kann und erhalten so einen eindeutig bestimmten T -Fixpunkt ψ ∈ M . Wenn also z ∈ B(yo ; ²), dann ist ϕz : I² → Rn , x 7→ ψ(z, x) eine L¨osung von y 0 = f (x, y) mit ϕz (xo ) = z, weil (∀x ∈ I² ) (x, ϕz (x)) = (x, ψ(z, x)) ∈ I × U. Damit haben wir die Existenz von L¨osungen der geforderten Art gezeigt. 4. Schritt: Eindeutigkeit der L¨osungen Wir m¨ ussen nachweisen, daß eine L¨osung ϕ ez : I² → Rn
(∗ ∗ ∗)
von y 0 = f (x, y) mit ϕ ez (xo ) = z f¨ ur x nahe an xo immer von der Form ϕ ez (x) = ψ(z, x) ist, wobei ψ der eindeutig bestimmte Fixpunkt von T : M → M ist. Dazu setzen wir ∆z (x) := sup{kϕ ez (t) − ψ(z, t)k | |t − xo | ≤ |x − xo |} und w¨ahlen ein ²0 > 0 mit ϕ ez (I²0 ) ⊆ U . Dann liefert die Absch¨atzung Z xe kϕ ez (e x) − ψ(z, x e)k ≤ L kϕ ez (t) − ψ(z, t)k dt xo
e I mit |e f¨ ur ∈ x − xo | ≤ |x − xo | ≤ ² die Ungleichungen 0
kϕ ez (e x) − ψ(z, x e)k ≤ L|e x − xo |∆z (e x) ≤ L|x − xo |∆z (x). Insbesondere finden wir 0 ≤ ∆z (x) ≤ L|x − xo |∆z (x) und dies impliziert (∀|x − xo | ≤ min{²0 ,
²0 }) ϕz (x) − ψ(z, x) = ∆z (x) = 0. 2L
Der Beweis des Satzes liefert auch Informationen dar¨ uber, wie groß das ² gew¨ahlt werden kann! Beachte, daß die Funktion f aus Beispiel 14.1.1 f¨ ur yo = 0 die Bedingung (L) nicht erf¨ ullt. In der Tat ist 1 f (0, y) − f (0, 0) = y− 3 y−0
f¨ ur y in einer Umgebung von 0 nicht beschr¨ankt. Bemerkung 14.1.4 : Es ist auch m¨oglich, unendliche Systeme von gew¨ohnlichen Differentialgleichungen zu betrachten. Man kann z.B. den Raum Rn durchwegs durch einen beliebigen Banachraum V ersetzen: y 0 = f (x, y), (x, y) ∈ Ω ⊆ R × V wobei f : Ω → V eine stetige Abbildung ist. Daß dies ein durchaus nat¨ urlicher Rahmen w¨are, sieht man schon daran, daß der Satz von Picard–Lindel¨of zusammen mit dem angegebenen Beweis g¨ ultig bleibt, wenn man die in Kapitel ?? implizit schon angelegte Differentialrechnung auf Banachr¨aumen zugrundelegt. Wir werden sp¨ater in nat¨ urlicher Weise auf Differentialgleichungen stoßen, die in endlich dimensionalen ¨ normierten R¨aumen (z.B. von Matrizen) leben. In solchen F¨allen hat man in den obigen Uberlegungen in der Tat nur Rn durch den entsprechenen Raum zu ersetzen.
¨ 14.1. DER SATZ VON PICARD–LINDELOF
273
Seien (V, k · kV ) und (W, k · kW ) normierte Vektorr¨aume und Ω ⊆ R × V . Man sagt f : Ω → W erf¨ ullt eine Lipschitz–Bedingung, wenn es eine Konstante L ≥ 0 gibt mit (∀(x, y), (x, ye) ∈ Ω)
kf (x, y) − f (x, ye)kW ≤ Lky − yekV .
In diesem Falle heißt L eine Lipschitz–Konstante f¨ ur f . Man sagt f : Ω → W erf¨ ullt eine lokale Lipschitz–Bedingung, falls es zu jedem (xo , yo ) ∈ Ω eine Umgebung U gibt, f¨ ur die f |U eine Lipschitz-Bedingung erf¨ ullt. Da die Schlußfolgerung von Satz 14.1.3 sich nur auf kleine Umgebungen bezieht, reicht es in diesem Satz aus zu fordern, daß f eine lokale Lipschitz–Bedingung erf¨ ullt. Wenn V und W endlich dimensional sind und die partielle Ableitung D2 f (x, y) nach y u ¨berall auf Ω existiert und stetig ist, dann gibt es zu jedem Punkt (xo , yo ) ∈ Ω eine kompakte konvexe Umgebung U und eine positive Konstante L mit (∀(x, y) ∈ U ) kD2 f (x, y)k < L (Operatornorm), so daß der Mittelwertsatz 11.1.9 gerade (∀(x, y), (x, ye) ∈ U )
kf (x, y) − f (x, ye)kW ≤ Lky − yekV
liefert. Das bedeutet insbesondere, daß f eine lokale Lipschitz-Bedingung erf¨ ullt.
Algorithmus 14.1.5 : Der Beweis des Banachschen Fixpunktsatzes ist konstruktiv, d.h. er gibt ein N¨aherungsverfahren an, das den Fixpunkt als Grenzwert liefert. Wenn wir mit der Funktion ψ0 ∈ M , die durch ψ0 (z, x) = z definiert ist, starten, dann liefert das Verfahren mit ψk+1 = T ψk die L¨osung ψ = limk→∞ ψk . Man nennt dieses Verfahren das Picard–Lindel¨ ofsche Iterationsverfahren. Mit der Notation aus dem Beweis von Satz 14.1.3 findet man induktiv (∀(z, x) ∈ B(yo ; r) × Ir )
kψk+1 (z, x) − ψk (z, x)k ≤
cLk |x − xo |k+1 . (k + 1)!
Dies folgt aus der Absch¨atzung Z
x
kψ1 (z, x) − ψ0 (z, x)k = k
f (t, z)dtk ≤ c|x − xo | xo
und der Rechnung kψk+2 (z, x) − ψk+1 (z, x)k
≤ ≤ ≤ =
¯Z x ¯ ¯ ¯ ¯ kf (t, ψk+1 (z, t)) − f (t, ψk (z, t))kdt¯¯ ¯ ¯xZo x ¯ ¯ ¯ ¯ L¯ kψk+1 (z, t) − ψk (z, t)kdt¯¯ xo ¯Z ¯ ¯ cLk+1 ¯¯ x k+1 ¯ |t − xo | dt¯ ¯ (k + 1)! xo cLk+1 |x − xo |k+2 (k + 2)!
Wir spielen dieses Verfahren f¨ ur den Fall f (x, y) = Ay mit einer konstanten quadratischen Matrix A und
274
¨ KAPITEL 14. LOKALE THEORIE GEWOHNLICHER DIFFERENTIALGLEICHUNGEN
xo = 0 durch: ψ0 (z, x) =
z
ψ1 (z, x) =
z+
Z
x
Azdt = z + xAz 0
Z ψ2 (z, x) =
x
A(z + tAz)dt = z + xAz +
z+ 0
.. . ψk (z, x) =
Z
x
z+
A xo
k−1 X j j=0
x2 2 A z 2
k
X tj t j A zdt = Aj z j! j! j=0
Dies f¨ uhrt auf die Matrizenexponentialfunktion eA := linearer Differentialgleichungen im Detail studiert wird.
P∞
tj j j=0 j! A ,
die im Kontext der Systeme
¨ Ubung 14.1.1 : Sei f :]a, b[→ R differenzierbar mit beschr¨ ankter Ableitung. Zeige, daß f einer LipschitzBedingung gen¨ ugt. ¨ ose iterativ das Anfangswertproblem y 0 = xy, y(0) = 1. Ubung 14.1.2 : L¨ ¨ Ubung 14.1.3 : Eine Funktion f : [a, b] → R heißt global Lipschitz–stetig der Ordnung α > 0 mit Konstante L > 0, falls f¨ ur alle x, y ∈ [a, b] gilt |f (x) − f (y)| ≤ L|x − y|α Zeige: Ist f global Lipschitz-stetig der Ordnung α > 1, so ist f konstant. ¨ Ubung 14.1.4 : Sei f : R × R → R eine stetige Funktion, die lokal einer Lipschitz-Bedingung gen¨ uge. Es gelte f (−x, y) = −f (x, y) f¨ ur alle (x, y) ∈ R2 . Beweise: Ist r > 0, so geht jede L¨ osung φ : [−r, r] → R der Differentialgleichung y 0 = f (x, y) bei Spiegelung an der y-Achse in sich u ¨ber. ¨ ugt. Zeige, daß f Ubung 14.1.5 : Sei f : [a, b] → R eine stetige Funktion, die einer Lipschitz-Bedingung gen¨ von beschr¨ ankter Variation ist, d.h. daß eine Konstante M > 0 existiert, so daß f¨ ur alle Partitionen P = {t0 , t1 , . . . , tn } von [a, b] gilt: n X |f (tk ) − f (tk−1 )| ≤ M. k=1
¨ Ubung 14.1.6 : Welche der folgenden Funktionen erf¨ ullen eine lokale Lipschitz-Bedingung ? (i) f (x, y) = 1 + y 2 , (ii) f (x, y) = (1 + y 2 )−1 , (iii) f (x, y) = (1 + y 2 )−1 x, (iv) f (x, y) = |ty|.
¨ Ubung 14.1.7 : Gegeben sei das Anfangswertproblem y 0 = x2 + xy 2 , y(0) = 0. (i) Berechne, ausgehend von ψ0 = 0, die sukzessiven Approximationen ψn gem¨ aß dem Picard-Lindel¨ ofschen Iterationsverfahren. (ii) Zeige, daß (ψn )n∈N auf [− 12 , 12 ] gegen die auf [− 21 , 12 ] existierende L¨ osung y des obigen Anfangswertproblems konvergiert.
14.2. DIFFERENTIALGLEICHUNGEN MIT PARAMETERN
275
¨ Ubung 14.1.8 : Seien (M, ρ) und (N, µ) metrische R¨ aume. Eine Abbildung T : M → N heißt Lipschitz–stetig mit Konstante L, wenn f¨ ur alle f, g ∈ M gilt µ(T (f ), T (g)) ≤ Lρ(f, g). Sei M = N = C[0, 1], versehen mit der Metrik ρ(f, g) := sup |f (x) − g(x)|e−x . x∈[0,1]
Zeige, daß
Z T : M → M,
x
T f (x) :=
f (t)dt 0
Lipschitz stetig mit Konstante 1 ist. ¨ Ubung 14.1.9 : Die Bernoullische Differentialgleichung hat die Gestalt y 0 = a(x)y + b(x)y ρ . F¨ ur ρ = 0, 1 ist sie linear, wir nehmen daher an, daß ρ 6= 0 und ρ 6= 1. Zeige: Sind a und b auf dem Intervall I stetig, so besitzt die Bernoullische Anfangswertaufgabe y 0 = a(x)y + b(x)y ρ ,
y(x0 ) = y0 > 0,
(x0 ∈ I)
genau eine L¨ osung auf einem x0 enthaltenden Teilintervall von I. Man erh¨ alt sie durch die Substitution z := y 1−ρ . ¨ Ubung 14.1.10 : Gegeben sei das Anfangswertproblem y 0 = 1 + (y − x)2 , y(0) = 0. (i) Begr¨ unde die (lokale) eindeutige L¨ osbarkeit, (ii) Berechne die L¨ osung mittels sukzessiver Approximation.
14.2
Differentialgleichungen mit Parametern
Eine parameterabh¨ angige Differentialgleichung in einem endlich dimensionalen normierten Vektorraum (V, k · k) wird gegeben durch eine stetige Funktion f : Ω × P → V,
(x, y, η) 7→ f (x, y, η),
wobei Ω eine Teilmenge von R × V und P ein metrischer (Parameter-) Raum ist. Die Gleichung lautet dann y 0 = f (x, y, η) und eine L¨ osung zum Parameter η dieser Gleichung ist eine, auf einem offenen Intervall I definierte, differenzierbare Funktion ϕ : I → V , deren Graph in Ω enthalten ist und die (∀x ∈ I) ϕ0 (x) = f (x, ϕ(x), η) erf¨ ullt. In der Praxis tauchen parameterabh¨angige Differentialgleichungen z.B. in der Kontrolltheorie auf, wo die Ver¨anderung der Gleichung mit dem Parameter η als eine Steuerung interpretiert wird. Mit etwas Vorsicht lassen sich viele Resultate f¨ ur gew¨ohnliche Differentialgleichungen auf Differentialgleichungen mit Parametern u ur geben wir eine parameterabh¨angige Version ¨bertragen. Als Beispiel daf¨ des Satzes von Picard-Lindel¨of an:
¨ KAPITEL 14. LOKALE THEORIE GEWOHNLICHER DIFFERENTIALGLEICHUNGEN
276
Satz 14.2.1 : (Picard–Lindel¨of mit Parametern) Sei U ⊆ V offen, I ein offenes Intervall und (P, µ) ein metrischer Raum. Wenn eine stetige Funktion f : I × U × P → V die Bedingung (∀y, ye ∈ U, η ∈ P )
kf (x, y, η) − f (x, ye, η)k ≤ Lky − yek
erf¨ ullt, wobei L eine positive Konstante ist, dann gibt es zu jedem (xo , yo , ηo ) ∈ I × U × P und zu jedem hinreichend kleinen ² > 0, jedem z ∈ U mit kz − yo k < ² und jedem η ∈ P mit µ(η, ηo ) < ² genau eine L¨ osung ϕz,η : ]xo − ², xo + ²[→ V von y 0 = f (x, y, η) mit ϕz,η (xo ) = z. Genauer: es gibt eine stetige Funktion ψ : {z ∈ V | kz − yo k < ²} × {η ∈ P | µ(η, ηo ) < ²}×]xo − ², xo + ²[→ V, f¨ ur die gilt (∀(z, η, x) ∈ {y ∈ V | ky − yo k < ²} × {η ∈ P | µ(η, ηo ) < ²}×]xo − ², xo + ²[)
ϕz,η (x) = ψ(z, η, x),
d.h. die L¨ osungen h¨ angen stetig von den Anfangswerten und den Parametern ab. Beweis: Idee: Modifiziere den Beweis von Satz 14.1.3. Der Beweis von Satz 14.1.3 u ¨bertr¨agt sich praktisch w¨ortlich, wenn man folgende Modifikationen einbaut: In der Konstruktion von (M, ρ) muß r so gew¨ahlt werden, daß (∀(x, y, η) ∈ Ir × B(yo ; r) × {ξ ∈ P | µ(ξ, ηo ) < r}) kf (x, y, η)k ≤ c und dann setzt man M := {ψ : B(yo ; ²) × {η ∈ P | µ(η, ηo ) < ²} × I² → B(yo ; r) |
ψ stetig und (∀z ∈ B(yo ; ²)) ψ(z, η, xo ) = z}.
sowie ρ(ψ1 , ψ2 ) := sup{kψ1 (z, η, x) − ψ2 (z, η, x)k | (z, η, x) ∈ B(yo ; ²) × {η ∈ P | µ(η, ηo ) < ²} × I² }. Die kontrahierende Abbildung ist dann durch Z
x
(T ψ)(z, η, x) = z +
f (t, ψ(z, η, t))dt xo
¨ gegeben. (Ubung: F¨ uhre die Details aus!)
Wie in Satz 14.1.3 kommt es in Satz 14.2.1 nur darauf an, eine lokale Lipschitz–Bedingung zu haben, d.h. zu jedem (xo , yo , ηo ) ∈ I × U × P gibt es eine Umgebung Ω und ein Konstante L mit (∀(x, y, η), (x, ye, η) ∈ Ω) kf (x, y, η) − f (x, ye, η)k ≤ Lky − yek. Diese lokale Lipschitz–Bedingung garantiert dann schon die lokale Existenz und Eindeutigkeit von L¨osungen. Die Eindeutigkeitsaussage aus dem Satz von Picard–Lindel¨of kann allerdings noch versch¨arft werden: Proposition 14.2.2 : Sei U ⊆ V offen, I ein offenes Intervall und (P, µ) ein metrischer Raum. Wenn eine stetige Funktion f : I × U × P → V eine lokale Lipschitz-Bedingung erf¨ ullt, dann gibt es zu jedem (xo , yo , η) ∈ I × U × P h¨ ochstens eine L¨ osung ϕyo ,η : I → V von y 0 = f (x, y, η) mit ϕyo ,η (xo ) = yo . Beweis:
14.2. DIFFERENTIALGLEICHUNGEN MIT PARAMETERN
277
Idee: Die Menge, auf der zwei L¨osungen u¨bereinstimmen, ist offen und abgeschlossen. Seien ϕyo ,η : I → V und ϕ eyo ,η : I → V L¨osungen von y 0 = f (x, y, η) mit ϕyo ,η (xo ) = yo = ϕ eyo ,η (xo ). Wir zeigen, daß (∀t ≥ xo ) ϕyo ,η (t) = ϕ eyo ,η (t) (der Fall t ≤ xo geht analog). Setze x1 := sup{t ∈ I | ϕyo ,η |[xo ,t] = ϕ eyo ,η |[xo ,t] }. Wenn x1 gleich dem rechten Rand von I (oder ∞) ist, sind wir fertig. Wenn x1 ∈ I liegt, gilt wegen der Stetigkeit von ϕyo ,η und ϕ eyo ,η , daß ϕyo ,η (x1 ) = ϕ eyo ,η (x1 ) =: y1 . Aber dann sagt die lokale Eindeutigkeitsaussage f¨ ur den Punkt (x1 , y1 , η), daß ϕyo ,η (x) = ϕ eyo ,η (x) auch ein St¨ uck rechts von x1 gelten muß. Dieser Widerspruch zur Definition von x1 zeigt, daß x1 nicht in I gelegen haben kann und damit die Eindeutigkeit.
Wir werden in Abschnitt 14.3 die Aussage von Satz 14.2.1 bzgl. der Abh¨angigkeit der L¨osungen von Parametern und Anfangswerten noch versch¨arfen: Es stellt sich n¨amlich heraus, daß die L¨osungen nicht nur stetig, sondern sogar differenzierbar (in beliebiger Ordnung) von Parametern und Anfangswerten abh¨angen, wenn das f¨ ur f so ist. Daf¨ ur ben¨otigen wir die folgende Versch¨arfung des Satzes von PicardLindel¨of f¨ ur lineare Differentialgleichungen mit Parametern, die auch von unabh¨angigem Interesse ist. Lemma 14.2.3 : Sei I ein offenes Intervall und P ein metrischer (Parameter-) Raum, sowie A : I×P → End(V ) eine stetige Abbildung. Die parameterabh¨ angige Differentialgleichung y 0 = A(x, η)y,
(x, y, η) ∈ I × V × P
hat bei vorgegebenem xo ∈ I eine eindeutig bestimmte stetige L¨ osungsschar ψ : V × P × I → V. Das bedeutet, zu jedem Punkt (yo , η) ∈ V × P gibt es genau eine L¨ osung ϕyo ,η : I → V von y 0 = A(x, η)y mit ϕyo ,η (xo ) = yo und diese L¨ osung ist von der Form ϕyo ,η (x) = ψ(yo , η, x). Beweis: Idee: Ben¨utze die Linearit¨at in y um zu zeigen, daß man die lokalen Lipschitzkonstanten kontrollieren kann. Dann k¨ onnen die L¨ osungen nicht auf kompakten Intervallen explodieren und globale L¨ osungen lassen sich aus lokalen L¨ osungen zusammenst¨ uckeln.
Wegen der Stetigkeit von A gibt es zu jedem (x, η) ∈ I × P eine offene Umgebung Ux,η = Ix,η × Px,η und eine Konstante Lx,η mit (∀(t, ξ) ∈ Ux,η ) kA(t, ξ)k < Lx,η . Dies liefert kA(t, ξ)y − A(t, ξ)e y k ≤ Lx,η ky − yek f¨ ur alle y, ye ∈ V , also eine lokale Lipschitz–Bedingung und damit nach Satz 14.2.1 lokal um jeden Punkt von V × P × I eine L¨osungsschar der geforderten Art. Damit folgt die Eindeutigkeit der L¨osungen aus Proposition 14.2.2.
¨ KAPITEL 14. LOKALE THEORIE GEWOHNLICHER DIFFERENTIALGLEICHUNGEN
278
Um die Existenz der L¨osungen zu zeigen, betrachten wir ein beliebiges kompaktes Teilintervall J von I, das xo in seinem Inneren enth¨alt, und ein festes η ∈ P . Da die offenen Mengen Ix,η die kompakte Menge J u ¨berdecken, gibt es t1 , . . . , tk ∈ J mit J ⊆ It1 ,η ∪ . . . ∪ Itk ,η . Setze k \
Pη :=
Ptm ,η .
m=1
Dieses ist eine offene Umgebung von η in P und sie erf¨ ullt (∗)
(∀(x0 , η 0 ) ∈ J × Pη ) kA(x0 , η 0 )k < Lη
mit Lη = max1≤m≤k Ltm ,η . P
η
Pη
x
J
Die Strategie ist es jetzt, das Picard–Lindel¨ofsche Iterationsverfahren aus Bemerkung 14.1.5 auf den Startwert ψ0 : B(0; R) × Pη × J → V, (z, ξ, x) 7→ z anzuwenden, wobei R mindestens so groß sein soll wie die L¨ange des Intervalls J. Wegen (∗) haben wir (∀(z, ξ, x) ∈ B(0; R) × Pη × J) kA(x, ξ)zk < Lη R und die Rechnung aus Bemerkung 14.1.5 liefert (∀(z, x) ∈ B(0; R) × Pη × J) kψk+1 (z, ξ, x) − ψk (z, ξ, x)k ≤
Lk+1 η Rk+2 . (k + 1)!
Damit konvergiert die Folge ψk gleichm¨aßig auf B(0; R) × Pη × J gegen eine stetige Grenzfunktion ψ (vgl. Satz 12.1.2), die Z x ψ(z, ξ, x) = z + A(t, ξψ(z, ξ, t) dt xo
erf¨ ullt (vgl. die Idee zum Beweis von Satz 14.1.3). Also ist die Einschr¨ankung von ϕz,ξ : J → V,
x 7→ ψ(z, ξ, x)
auf das Innere J ◦ von J (d.h. J ohne die Randpunkte) eine L¨osung von y 0 = A(x, ξ)y mit ϕz,ξ (xo ) = z, d.h. ψ ist eine stetige L¨ osungsschar auf B(0; R) × Pη × J ◦ im Sinne des Lemmas. Wenn man J durch ein gr¨oßeres Intervall Je und R durch einen entsprechend gr¨oßeren Radius e ersetzt, erh¨alt man eine L¨osungsschar R e × Peη × J, e ψe : B(0; R) wobei Peη eine evtl. kleinere Umgebung von η in P ist als Pη (die Konstruktion hing von J ab!). Die oben schon gezeigte Eindeutigkeit der L¨osungen zeigt aber, daß e ψ| eη )×J = ψ. B(0;R)×(Pη ∩P
¨ 14.3. DIFFERENZIERBARE ABHANGIGKEIT VON DEN ANFANGSWERTEN
279
Indem man jetzt J beliebig groß werden l¨aßt, findet man also eine L¨osung ϕyo ,η : I → V mit ϕyo ,η (xo ) = yo . Es bleibt jetzt noch zu zeigen, daß die eindeutig bestimmten L¨osungen in der angegebenen Weise von einer stetigen L¨osungsschar herr¨ uhren. Dazu definieren wir die Funktion ψ : V ×I × P → V durch die Forderung, daß ψ(yo , η, x) der Wert an der Stelle x der eindeutig bestimmten L¨osung von y 0 = A(x, η)y durch den Punkt (xo , yo ) ist. Wenn jetzt (e y , ηe, x e) ∈ V × P × I ein beliebiger Punkt ist, dann findet man ein J und dazu passend ein R so, daß B(0; R) × Pηe × J eine Umgebung von (e y , ηe, x e) enth¨alt. Da aber die eindeutigen L¨osungen auf B(0; R) × Pηe × J durch eine stetige L¨osungsschar gegeben sind, ist also ψ in der Tat stetig in (e y , ηe, x e).
14.3
Differenzierbare Abh¨ angigkeit von den Anfangswerten
Sei (V, k · k) ein endlich dimensionalen normierten Vektorraum und y 0 = f (x, y) eine gew¨ohnliche Differentialgleichung mit einer stetigen Funktion f : I × U → V , wobei I ein offenes Intervall und U ⊆ V offen ist. Dann heißt ψ : U1 × I → V (mit U1 ⊆ U offen und xo ∈ I) eine stetige L¨ osungsschar f¨ ur y 0 = f (x, y) wenn ϕz : I → V, x 7→ ψ(z, x) f¨ ur z ∈ U1 eine L¨osung der Gleichung durch (xo , z) ist. Dann ist wegen ϕ0z (x) = f (x, ϕz (x)) = f (x, ψ(z, x)) die Abbildung ψ nach der zweiten Variablen (d.h. nach x) partiell differenzierbar und die partielle Ableitung D2 ψ : U1 × I → V ∼ = Hom(R, V ) ist stetig. Wir machen nun die zus¨ atzliche Annahme, daß f nach der zweiten Variablen (d.h. nach y) partiell differenzierbar ist und die partielle Ableitung D2 f : I × U → End(V ) stetig ist. Wir werden Lemma 14.2.3 ben¨ utzen, um zu zeigen, daß unter diesen Voraussetzungen ψ auch nach der ersten Variablen (d.h. nach y) partiell differenzierbar ist und die partielle Ableitung D1 ψ : U1 × I → End(V ) stetig ist. Die Beweisidee ist ganz einfach: Wenn D1 ψ existiert, rechnet man mit D2 ψ(z, x) = f (x, ψ(z, x)) (D2 D1 ψ)(z, x) = (D1 D2 ψ)(z, x) =
∂f (x, ψ(z, x)) = D2 f (x, ψ(z, x)) ◦ D1 ψ(z, x) ∂z
und dies resultiert in der parameterabh¨angigen matrizenwertigen Differentialgleichung (vgl. Bemerkung 14.1.4) Y 0 = D2 f (x, ψ(z, x))Y f¨ ur D1 ψ, die man die Variationsgleichung der vorgegebenen Gleichung nennt. Jetzt dreht man den Spieß um und weist nach, daß die durch Lemma 14.2.3 garantierte L¨osung der Variationsgleichung tats¨achlich die partielle Ableitung von ψ ist.
¨ KAPITEL 14. LOKALE THEORIE GEWOHNLICHER DIFFERENTIALGLEICHUNGEN
280
Lemma 14.3.1 : Unter den angegebenen Voraussetzungen ist die L¨ osung Φz : I → End(V ) der Variationsgleichung Y 0 = D2 f (x, ψ(z, x))Y mit Φz (xo ) = id gerade die partielle Ableitung D1 ψ(z, x). Insbesondere ist D1 ψ stetig. Beweis: Idee: Leite eine Differentialgleichung f¨ur den “Differenzenquotienten” mit h als Parameter her. Halte ein y ∈ U1 fest, w¨ahle h ∈ V so klein, daß y + h ∈ U1 und setze f¨ ur x ∈ I ∆ψ(h, x)
:=
A(h, x)
:=
ψ(y + h, x) − ψ(y, x), Z 1 D2 f (x, ψ(y, x) + t∆ψ(h, x))dt. 0
Dann rechnet man D2 ∆ψ(h, x)
= f (x, ψ(y + h, x)) − f (x, ψ(y, x)) Z 1 d = (f (x, ψ(y, x) + t∆ψ(h, x)))dt dt 0 Z 1 D2 f (x, ψ(y, x) + t∆ψ(h, x))dt · ∆ψ(h, x) = 0
= A(h, x)∆ψ(h, x). Außerdem gilt ∆ψ(h, xo ) = y + h − y = h. Sei andererseits x 7→ B(h, x) die L¨osung der linearen Differentialgleichung Y 0 = A(h, x)Y,
Y ∈ End(V )
durch (xo , id). Dann gilt (B(h, ·)h)0 = A(h, ·)B(h, ·)h
und B(h, xo )h = h.
Wegen der Eindeutigkeit der L¨osungen gilt also ∆ψ(h, x) = B(h, x)h f¨ ur alle x ∈ I, d.h. ψ(y + h, x) = ψ(y, x) + B(0, x)h + (B(h, x) − B(0, x))h. Da B stetig im Parameter h ist, finden wir 0 ≤ lim
h→0
1 k(B(h, x) − B(0, x))hk ≤ lim kB(h, x) − B(0, x)k = 0. h→0 khk
Damit folgt B(0, x) = D1 ψ(y, x), was die Existenz und Stetigkeit der partiellen Ableitung D1 ψ zeigt. Wegen A(0, x) = D2 f (x, ψ(y, x)) und folgt dann aber die Behauptung.
B(0, ·)0 = A(0, ·)B(0, ·)
¨ 14.3. DIFFERENZIERBARE ABHANGIGKEIT VON DEN ANFANGSWERTEN
281
Satz 14.3.2 : Besitzt die Differentialgleichung y 0 = f (x, y) stetige partielle Ableitungen nach der yVariablen bis zur Ordnung k, dann ist die L¨ osungsschar ψ(z, x) auch k-mal stetig nach den Anfangswerten z differenzierbar. Beweis: Idee: Betrachte das System aus Gleichung und Variationsgleichung. Dann ergibt sich mit Lemma 14.3.1 die M¨ oglichkeit zur Induktion u ¨ber die Ordnung der Ableitungen.
Betrachte das System von Differentialgleichungen y0 Y0
= f (x, y), y ∈ U = D2 f (x, y)Y, Y ∈ End(V )
Dieses System hat eine stetige L¨osungsschar (ψ, Ψ) : U1 × End(V ) × I → V × End(V ),
(z, Z, x) 7→ (ψ(z, x), Ψ(z, Z, x))
zu xo ∈ I: Man setzt die vorgegebene L¨osungsschar ψ : U1 × I → V f¨ ur die erste Gleichung in die zweite Gleichung ein, die dann die Form Y 0 = D2 f (x, ψ(z, x))Y erh¨alt und nach Lemma 14.2.3 durch eine stetige Schar Ψ : U1 × End(V ) × I → End(V ) gel¨ost werden kann (die z-Variable in U1 spielt die Rolle eines Parameters). F¨ ur k = 1 ist die Behauptung gerade der Inhalt von Lemma 14.3.1. Mit Induktion u ¨ber k d¨ urfen wir annehmen, daß (ψ, Ψ) mindestens (k − 1)-mal nach den Anfangswerten stetig partiell differenzierbar ist. Insbesondere ist also Ψ mindestens (k − 1)-mal nach z stetig differenzierbar. Lemma 14.3.1 sagt aber, daß Ψ(z, id, x) = D1 ψ(z, x), was die Behauptung beweist.
Bemerkung 14.3.3 : Mit einem kleinen Trick kann man den Satz 14.3.2 dazu ben¨ utzen, die differenzierbare Abh¨angigkeit der L¨osungen auch von den Parametern zu beweisen, falls P eine offene Teilmenge eines endlich dimensionalen normierten Vektorraums ist: Man ersetzt einfach die Differentialgleichung y 0 = f (x, y, η),
(x, y, η) ∈ I × U × P
durch das System y0
=
f (x, y, η),
η0
=
0
(x, y, η) ∈ I × U × P
Dann fungieren die Parameter als Anfangswerte und die differenzierbare Abh¨angigkeit folgt aus Satz 14.3.2 angewandt auf das System. Wir setzen Satz 14.3.2 noch mit der automatischen Differenzierbarkeit nach der x-Variablen zusammen und erhalten Satz 14.3.4 : Ist f : I × U → V eine k-mal stetig differenzierbare Funktion, so ist jede stetige L¨ osungsschar ψ : U1 × I → V von y 0 = f (x, y) automatisch auch k-mal stetig differenzierbar.
¨ KAPITEL 14. LOKALE THEORIE GEWOHNLICHER DIFFERENTIALGLEICHUNGEN
282 Beweis:
Idee: Kopiere den Beweis von Satz 14.3.2 f¨ur eine Induktion u¨ber k. k = 1: Es gilt D2 ψ(z, x) = f (x, ψ(z, x)), d.h. insbesondere existiert D2 ψ und ist stetig. Nach Lemma 14.3.1 existiert D1 ψ und ist auch stetig. Jetzt zeigt Satz 11.3.3 u ¨ber den Zusammenhang zwischen der Stetigkeit der partiellen Ableitungen und der Ableitung, daß ψ 0 existiert und stetig ist. k − 1 =⇒ k: Um den Induktionsschritt durchzuf¨ uhren, betrachten wir wieder das System y0 Y0
= f (x, y), y ∈ U = D2 f (x, y)Y, Y ∈ End(V )
und seine stetige L¨osungsschar (ψ, Ψ) : U1 × End(V ) × I → V × End(V ),
(z, Z, x) 7→ (ψ(z, x), Ψ(z, Z, x)).
Wir wenden den Fall k − 1 auf dieses System an und finden, daß die Abbildung (z, Z, x) 7→ (ψ(z, x), Ψ(z, Z, x)) (k − 1)-mal stetig differenzierbar ist, weil die Abbildung (x, y, Y ) 7→ (f (x, y), D2 f (x, y)Y ) (k − 1)-mal stetig differenzierbar ist. Dann zeigt Ψ(z, id, x) = D1 ψ(z, x), daß D1 ψ (k − 1)-mal stetig differenzierbar ist. Da aber D2 ψ(z, x) = f (x, ψ(z, x)) auch die (k − 1)-fache stetige Differenzierbarkeit von D2 ψ liefert, haben wir zusammen, daß alle partiellen Ableitungen von ψ bis zur Ordnung k existieren und stetig sind. Wieder mit Satz 11.3.3 erhalten wir sukkzesive, daß ψ k-mal stetig differenzierbar ist.
¨ orper f¨ allt vertikal in einem Medium mit kleinem Widerstand, der von Lage und GeUbung 14.3.1 : Ein K¨ schwindigkeit des K¨ orpers abh¨ angt: x00 = −g + ²F (x, x0 ), wobei g = 9.81m/s2 die Erdbeschleunigung ist, und F : R2 → R als beliebig oft differenzierbar angenommen werde. Sei x² die L¨ osung dieser Differentialgleichung und x0 die L¨ osung zum Parameter ² = 0. Zeige, daß es ein M ≥ 0 gibt mit ¯ µ ¶¯ Z tZ τ ¯ ¯1 0 ¯≤M ¯ F (x (ξ, x (ξ)dξdτ x (t) − x (t) − ² 0 ² 0 0 ¯ ¯ ²2 0 0 f¨ ur alle hinreichend kleinen ² > 0 und t > 0. ¨ osung Ubung 14.3.2 : Sei Ω ⊆ Rn offen und H ∈ C 2 (Ω, R). Wenn die Differentialgleichung x˙ = ∇H(x) eine L¨ φ : R × Ω → Ω zul¨ aßt, dann nennt man φ einen Gradientenfluß. (i) Sei A ∈ Sym(n, R). Zeige, daß H(x) = 21 (x, Ax) den Gradientenfluß φ(t, x) = exp(tA)x induziert, wobei ( · , · ) das euklidische innere Produkt ist. (ii) Zeige, daß jeder Gradientenfluß entlang seiner Bahnen monoton wachsend ist.
¨ Ubung 14.3.3 : Sei Ω ⊆ Rn offen und H ∈ C 2 (Ω, R). Differentialgleichungen der Form x˙ = J∇H(x) mit µ ¶ 0 −1 J= ∈ Mat(2n × 2n, R), 1 0 wobei 1 und 0 die n × n Einheits- bzw. Nullmatrix sind, heißen Hamilton-Gleichungen. Sei A ∈ Sym(n, R) und H(x) = 12 (x, Ax). Zeige
¨ 14.3. DIFFERENZIERBARE ABHANGIGKEIT VON DEN ANFANGSWERTEN
283
(i) H ist konstant auf den Bahnen des Flusses φ(t, x) = exp(tJA)x von H. (ii) Die Abbildungen x 7→ φ(t, x) = exp(tJA)x sind f¨ ur jedes t volumenerhaltend.
¨ Ubung 14.3.4 (Hopf-Verzweigung): F¨ ur einen reellen Parameter p betrachte in R2 die Differentialgleichung ¡ ¢ ¡ ¢ x˙ 1 = x1 p − (x21 + x22 ) − x2 , x˙ 2 = x2 p − (x21 + x22 ) + x1 . Zeige, daß die Gleichung f¨ ur p > 0 nichtkonstante periodische L¨ osungen hat (Hinweis: Polarkoordinaten). ¨ Ubung 14.3.5 (Legendre-Transformierte): Sei J ⊆ R ein offenes Intervall, f ∈ C 2 (J, R) und f 00 (x) > 0 f¨ ur alle x ∈ J. Zeige: ¡ ¢ (i) Durch g(p) := maxx∈J xp − f (x) wird eine Funktion g ∈ C 2 (I, R) auf I := f 0 (J) mit g 00 (p) > 0 f¨ ur alle p ∈ J definiert (insbesondere ist I offen). Man nennt g die Legendre-Transformierte von f . (ii) Die in (i) definierte Legendre-Transformation ist involutiv, d.h. die Legendre-Transformation von g ist f . 2
(iii) Sei L ∈ C 2 (R × R, R) mit ∂∂vL2 (q, v) > 0 und p := p(q, v) = ∂L (q, v). Dann ist H(p, q) := pv − L(q, v) in ∂v C 2 (R×R, R) die Legendre-Transformation bzgl. der zweiten Variablen. Die Funktion L erf¨ ullt die LagrangeGleichung d ∂L ∂L (q, q) ˙ − (q, q) ˙ =0 dt ∂ q˙ ∂q enau dann, wenn H die Hamilton-Gleichungen p(p, ˙ q) = − erf¨ ullt.
∂H (p, q), ∂q
q(p, ˙ q) =
∂H (p, q) ∂p
284
¨ KAPITEL 14. LOKALE THEORIE GEWOHNLICHER DIFFERENTIALGLEICHUNGEN
Kapitel 15
Lineare gew¨ ohnliche Differentialgleichungen In diesem Kapitel studieren wir die L¨ osungsmengen von Differentialgleichungssystemen, in denen die rechte Seite linear von y abh¨ angt, sowie von Differentialgleichungen h¨ oherer Ordnung, deren zugeordnete Systeme von dieser Art sind.
15.1
Homogene Gleichungen
Sei I ein offenes Intervall und (V, k · k) ein endlich dimensionaler normierter Vektorraum (¨ uber K gleich R oder C). Wenn A : I → EndK (V ) eine stetige Abbildung ist, dann heißt y 0 = A(x)y,
y∈V
eine homogene lineare Differentialgleichung auf V . In Lemma 14.2.3 wurde schon gezeigt, daß homogene lineare Differentialgleichungen zu jedem Anfangswert eindeutig l¨osbar sind. Wir bezeichnen die Menge aller L¨osungen ϕ : I → V der homogenen Gleichung y 0 = A(x)y mit LH . Satz 15.1.1 : Sei dimK V = n. Dann ist LH ein n-dimensionaler Unterraum von C(I, V ). F¨ ur ein k-Tupel von L¨ osungen ϕ1 , . . . , ϕk ∈ LH sind folgende Aussagen ¨ aquivalent: (1) ϕ1 , . . . , ϕk sind linear unabh¨ angig u ¨ber K. (2) Es gibt ein xo ∈ I, so daß die Vektoren ϕ1 (xo ), . . . , ϕk (xo ) linear unabh¨ angig u ¨ber K sind. (3) F¨ ur jedes xo ∈ I sind die Vektoren ϕ1 (xo ), . . . , ϕk (xo ) linear unabh¨ angig u ¨ber K. Beweis: Idee: Die meisten Aussagen sind elementar. Wesentlich ist die Implikation “(1) ⇒ (3)”, die man mit Lemma 14.2.3 beweist. Wir zeigen zun¨achst, daß LH ein Untervektorraum des Vektorraums aller Abbildungen I → Kn ist. Daß die Nullfunktion eine L¨osung der homogenen Differentialgleichung ist, ist klar. Seien nun ϕ, ϕ e ∈ LH , es gilt also ϕ0 = Aϕ und ϕ e0 = Aϕ. e Dann gilt auch (ϕ − ϕ) e 0 = ϕ0 − ϕ e0 = Aϕ − Aϕ e = A(ϕ − ϕ), e so daß ϕ − ϕ e ∈ LH ist. Sei schließlich ϕ ∈ LH und λ ∈ K. Dann ist ϕ0 = Aϕ und (λϕ)0 = 0 λϕ = λAϕ = A(λϕ), also λϕ ∈ LH . 285
¨ KAPITEL 15. LINEARE GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
286
¨ Wir zeigen nun die Aquivalenz der Punkte (1) bis (3). Die Implikationen (3) ⇒ (2) ⇒ (1) sind trivial. Es bleibt (1) ⇒ (3) zu zeigen. Seien also ϕ1 , . . . , ϕk ∈ LH und xo ∈ I. Sind die Vektoren ϕ1 (xo ), . . . , ϕk (xo ) linear abh¨angig, so gibt es Skalare λ1 , . . . , λk ∈ K mit k X
λj ϕj (xo ) = 0.
j=1
Pk Sei nun ϕ := j=1 λj ϕj . Dann ist ϕ eine L¨osung der Differentialgleichung mit ϕ(xo ) = 0. Nach Lemma 14.2.3 gilt ϕ ≡ 0, d.h. die Funktionen ϕ1 , . . . , ϕk sind linear abh¨angig. Damit ist (1) ⇒ (3) gezeigt. ¨ Nun m¨ ussen wir noch dim LH = n zeigen. Dazu bemerken wir, daß nach obigen Uberlegungen dim LH ≤ n gilt. Sind andererseits e1 , . . . , en Basisvektoren f¨ ur V , so folgt aus Lemma 14.2.3 die Existenz von L¨osungen ϕ1 , . . . , ϕn ∈ LH mit ϕj (xo ) = ej . Damit sind ϕ1 , . . . , ϕn linear unabh¨angige L¨osungen der Differentialgleichung, also dim LH ≥ n und somit dim LH = n.
Man bezeichnet jede Basis ϕ1 , . . . , ϕn f¨ ur LH als ein Fundamentalsystem von L¨osungen f¨ ur y 0 = A(x)y. Wenn V = Kn (interpretiert als Spaltenvektoren) und A : I → Mat(n × n, K), dann l¨aßt sich ein Fundamentalsystem als Funktion Φ : I → Mat(n × n, K) interpretieren, die det Φ(xo ) 6= 0 erf¨ ullt und eine L¨osung der linearen Differentialgleichung Y 0 = A(x)Y,
Y ∈ Mat(n × n, K)
(Matrizenprodukt) auf Mat(n × n, K) ist. Umgekehrt liefert nach Satz 15.1.1 jede solche L¨osung als Spaltenvektoren ein Fundamentalsystem von L¨osungen. Beispiel 15.1.2 : Wir betrachten das Differentialgleichungssystem
µ
y10 y20
= −ωy2 = ωy1
¶ −ω d.h. y = A(x)y mit A(x) = sowie I = R, K = R und n = 2. Man rechnet nach, daß 0 µ ¶ µ ¶ cos ωx − sin ωx ϕ1 (x) = und ϕ2 (x) = sin ωx cos ω 0
0 ω
L¨osungen sind. Diese L¨osungen sind linear unabh¨angig, denn f¨ ur Φ = (ϕ1 , ϕ2 ) gilt µ ¶ ¡ ¢ cos ωx − sin ωx det Φ(x) = det =1 sin ωx cos ωx f¨ ur alle x ∈ R.
¨ Ubung 15.1.1 : Seien I, J ⊆ R Intervalle mit I ⊆ J. Zeige: (i) Sind φ1 , φ2 auf J linear abh¨ angig, so auch auf I. (ii) Teil (i) wird falsch, wenn man linear abh¨ angig“ durch linear unabh¨ angig“ ersetzt. ” ”
15.2. INHOMOGENE GLEICHUNGEN
15.2
287
Inhomogene Gleichungen
Sei I ein offenes Intervall und (V, k · k) ein endlich dimensionaler normierter Vektorraum (¨ uber K gleich R oder C). Weiter seien A : I → EndK (V ) und b : I → V stetige Abbildungen. Dann heißt y 0 = A(x)y + b(x),
y∈V
eine inhomogene lineare Differentialgleichung auf V . Als Verallgemeinerung der Methode der Variation der Konstanten erhalten wir den folgenden Satz, der die L¨osbarkeit auch inhomogener linearer Differentialgleichungen garantiert. Die Eindeutigkeit dieser L¨osungen werden wir dann gleich im Anschluß sehen. Satz 15.2.1 : (Variation der Konstanten) Sei V = Kn und Φ : I → Mat(n × n, K) ein Fundamentalsystem der homogenen Gleichung y 0 = A(x)y, y ∈ Kn . Dann erh¨ alt man eine L¨ osung ψ : I → Kn der inhomogenen Gleichung y 0 = A(x)y + b(x),
y ∈ Kn
durch den Ansatz ψ(x) = Φ(x)u(x). Dabei ist u : I → Kn eine differenzierbare Funktion mit Φ(x)u0 (x) = b(x), d.h. Z x u(x) := Φ(t)−1 b(t)dt. xo
Beweis: Gilt u0 (x) = Φ(x)−1 b(x), so erhalten wir mit der Produktregel ψ 0 (x)
= Φ0 (x)u(x) + Φ(x)u0 (x) = A(x)Φ(x)u(x) + Φ(x)Φ(x)−1 b(x) = A(x)ψ(x) + b(x),
d.h. ψ ∈ LI .
F¨ ur allgemeines V w¨ahlt man jetzt einfach eine Basis f¨ ur V , identifiziert so V mit Kn und findet damit eine L¨ osung der inhomogenen Gleichung y 0 = A(x)y + b(x),
y ∈ V.
Satz 15.2.2 : Sei LI die Menge der L¨ osungen ψ : I → V der inhomogenen Gleichung y 0 = A(x)y + b(x),
y ∈ V.
Wenn ψ0 ∈ LI , dann gilt LI = ψ 0 + LH , wobei LH der L¨ osungsraum der homogenen Gleichung y 0 = A(x)y, ist.
y∈V
¨ KAPITEL 15. LINEARE GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
288 Beweis:
Sei ψ0 ∈ LI eine spezielle L¨osung der inhomogenen Differentialgleichung. Wir zeigen zuerst LI ⊆ ψ0 + LH . Sei also ψ ∈ LI . Dann gilt (ψ − ψ0 )0 = ψ 0 − ψ00 = Aψ + b − (Aψ0 + b) = A(ψ − ψ0 ), d.h. ψ − ψ0 ∈ LH , also ψ ∈ ψ0 + LH . Nun zeigen wir die umgekehrte Inklusion ψ0 + LH ⊆ LI . Sei dazu ϕ ∈ LH . Dann gilt (ψ0 + ϕ)0 = ψ00 + ϕ0 = Aψ0 + b + Aϕ = A(ψ0 + ϕ) + b, was offensichtlich ψ0 + ϕ ∈ LI bedeutet. Damit ist die Gleichheit gezeigt.
Da nach Satz 15.2.1 die Menge LI nicht leer ist und die L¨osungen der homogenen Gleichungen durch den Anfangswert eindeutig bestimmt sind, zeigt Satz 15.2.2 insbesondere, daß die inhomogene Gleichung y 0 = A(x)y + b(x) ebenso wie die homogene Gleichung bei vorgegebenem xo ∈ I eine eindeutig bestimmte stetige L¨osungsschar V × I → V hat. Beispiel 15.2.3 : Wir betrachten das Differentialgleichungssystem y10 y20
= =
−y2 y1 + x,
d.h. y 0 = A(x)y + b(x) mit µ A(x) = Nach Beispiel 15.1.2 ist
0 1
¶
−1 0
und
b(x) =
µ ¶ 0 . x
µ ¶ cos x − sin x Φ(x) = sin x cos x
ein L¨osungsfundamentalsystem des homogenen Systems y 0 = A(x)y. Mit µ ¶ cos x sin x Φ(x)−1 = − sin x cos x erhalten wir
µ Φ(x)−1 b(x) =
also
Z
x
u(x) = u(0) + 0
¶ x sin x , x cos x
µ
t · sin t t · cos t
¶ dt.
Durch partielle Integration erhalten wir Z x Z x £ ¤x t sin t dt = − t cos t 0 + cos t dt = −x cos x + sin x 0 0 Z x Z x £ ¤x sin t dt = x sin x + cos x − 1. t cos t dt = t sin t 0 − 0
0
Es folgt
µ u(x) = u(0) +
¶ −x cos x + sin x . x sin x + cos x − 1
15.3. LINEARE DIFFERENTIALGLEICHUNGEN N -TER ORDNUNG µ Eine spezielle L¨osung ist etwa f¨ ur u(0) =
0 1
289
¶ :
ψ0 (x) = Φ(x)u(x) =
µ ¶ µ ¶ −x cos x + sin x −x = . x sin x + cos x 1
Die allgemeine L¨osung des inhomogenen Systems ist daher µ ¶ µ ¶ µ ¶ −x cos x − sin x + c2 ψ(x) = + c1 1 sin x cos x µµ ¶ µ ¶¶ c1 −x cos x + sin x = Φ(x) + c2 x sin x + cos x mit Konstanten c1 , c2 ∈ K.
¨ Ubung 15.2.1 : Bestimme alle L¨ osungen des folgenden Differentialgleichungssystems auf ]0, ∞[. 0 y1 = −y1 + x1 y2 + ln x + x1
y20 = (1 − x)y1 + y2 + (x − 1) ln x
¨ Ubung 15.2.2 : Sei I ⊆ R ein Intervall, A : I → Mat(n × n, R), f : I → Rn stetig. Weiter seien z1 , z2 ∈ Rn . Zeige: Ist f¨ ur i = 1, 2 die Funktion xi : I → Rn L¨ osung der Anfangswertaufgabe x0 = A(t)x + f (t),
x(t0 ) = zi ,
so gilt
µZ
t
kx1 (t) − x2 (t)k ≤ kz1 − z2 k exp
¶ kA(s)kds .
t0
Hinweis: Lemma von Gronwall.
15.3
Lineare Differentialgleichungen n-ter Ordnung
In diesem Abschnitt u ¨bertragen wir die bewiesenen Resultate u ¨ber lineare Differentialgleichungen erster Ordnung auf lineare Differentialgleichungen n-ter Ordnung. Sei I ⊆ R ein Intervall und ak : I → K, k = 0, . . . , n − 1, stetige Funktionen. Dann heißt (∗)
y (n) + an−1 (x)y (n−1) + . . . + a1 (x)y 0 (x) + a0 (x)y(x) = 0
homogene lineare Differentialgleichung n-ter Ordnung. Ist b : I → K eine weitere stetige Funktion (von Null verschieden), so heißt (∗∗)
y (n) + an−1 (x)y (n−1) + . . . + a1 (x)y 0 (x) + a0 (x)y(x) = b(x)
inhomogene lineare Differentialgleichung n-ter Ordnung. Die Gleichung (∗) heißt die (∗∗) zugeordnete homogene Differentialgleichung. Satz 15.3.1 : Mit den obigen Bezeichnungen gilt (a) Sei LH die Menge aller L¨ osungen ϕ : I → K der homogenen Differentialgleichung (∗). Dann ist LH ein n-dimensionaler K-Vektorraum. (b) Sei LI die Menge aller L¨ osungen ψ : I → K der inhomogenen Differentialgleichung (∗∗). Dann gilt f¨ ur jedes ψ0 ∈ LI die Beziehung LI = ψ 0 + LH .
¨ KAPITEL 15. LINEARE GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
290
(c) Ein n-Tupel (ϕ1 , . . . , ϕn ) von L¨ osungen der homogenen Gleichung (∗) ist genau dann linear unabh¨ angig, wenn f¨ ur ein und damit f¨ ur alle x ∈ I die sog. Wronski–Determinante ϕ1 (x) ϕ2 (x) ··· ϕn (x) ϕ01 (x) ϕ02 (x) ··· ϕ0n (x) W (x) := det .. .. .. . . . (n−1)
ϕ1
(x)
(n−1)
ϕ2
(x) · · ·
(n−1)
ϕn
(x)
von Null verschieden ist. Beweis: Idee: Betrachte das zugeh¨orige System erster Ordnung. Die Differentialgleichung (∗∗) ist zu folgendem inhomogenen linearen Differentialgleichungssystem ¨aquivalent: y00 y10
y1 y2
0 yn−2
= = .. . =
0 yn−1
=
−a0 (x)y0 − a1 (x)y1 − . . . − an−1 (x)yn−1 + b(x)
yn−1
Jeder L¨osung ϕ : I → K von (∗∗) entspricht die L¨osung ϕ ϕ0 f = .. : I → Kn . ϕ(n−1) des Systems. Entsprechendes gilt f¨ ur die homogene Gleichung (b = 0). Damit folgt die Behauptung aus Satz 15.2.2 und Satz 15.1.1, weil die Korrespondenz ϕ ←→ f linear ist.
Wie im Falle der Systeme erster Ordnung nennen wir jede Basis von LH ein Fundamentalsystem von L¨osungen. Beispiel 15.3.2 : Die homogene lineare Differentialgleichung zweiter Ordnung y 00 −
1 0 1 y + 2y = 0 2x 2x
auf I = ]0, ∞[ besitzt die L¨osungen ϕ1 (x) = x
und
ϕ2 (x) =
√
x
(Nachrechnen!). Die zugeh¨orige Wronskideterminante ist √ ¶ √ µ ¶ µ x x 1√ x √ ϕ1 (x) ϕ2 (x) = x 6= 0 W (x) = det − x=− = det 1 0 0 √ 1 ϕ1 (x) ϕ2 (x) 2 2 2 x f¨ ur alle x ∈ I :=]0, ∞[. Folglich ist (ϕ1 , ϕ2 ) ein L¨osungsfundamentalsystem. Die allgemeine L¨osung der Differentialgleichung hat daher die Gestalt √ ϕ = c1 ϕ1 + c2 ϕ2 = c1 x + c2 x mit c1 , c2 ∈ K.
15.3. LINEARE DIFFERENTIALGLEICHUNGEN N -TER ORDNUNG
291
Beispiel 15.3.3 : Die Legendresche Differentialgleichung ist f¨ ur n ∈ N definiert auf dem Intervall I :=] − 1, 1[ durch (1 − x2 )y 00 − 2xy 0 + n(n + 1)y = 0.
Le(n)
Da 1 − x2 auf I nicht verschwindet, kann man die Differentialgleichung durch Division durch 1 − x2 in eine explizite Gestalt bringen. Die Hermitesche Differentialgleichung ist f¨ ur n ∈ N definiert auf I = R durch y 00 − 2xy 0 + 2ny = 0.
He(n)
Die Laguerresche Differentialgleichung ist f¨ ur n ∈ N definiert auf I =]0, ∞[ durch xy 00 + (1 − x)y 0 + ny = 0.
La(n)
Diese Differentialgleichungen besitzen die folgenden Polynome als L¨osungen: Die Legendre–Polynome der Ordnung n sind definiert durch Pn (x) :=
1 ³ d ´n 2 (x − 1)n . 2n n! dx
Die Hermite–Polynome der Ordnung n sind definiert durch Hn (x) := (−1)n ex
2
³ d ´n 2 e−x . dx
Die Laguerre–Polynome der Ordnung n sind definiert durch Ln (x) := ex
³ d ´n (xn e−x ). dx
Man zeigt leicht durch vollst¨andige Induktion, daß die angegebenen Funktionen wirklich Polynome ¨ vom Grad n sind (Ubung). Daß sie L¨osungen der jeweiligen Differentialgleichung sind, zeigen wir am Beispiel der Hermite-Polynome: 2 2 d Sei D := dx . Wir haben zu zeigen, daß die Funktionen y(x) := ex Dn e−x die Gleichung He(n) erf¨ ullen. In der folgenden Rechnung verwenden wir die Formel Dn+1 (xf ) = xDn+1 (f ) + (n + 1)Dn (f ), 2 2 ¨ die aus der Leibniz–Regel f¨ ur h¨ohere Ableitungen von Produkten folgt (Ubung!). Aus e−x y = Dn e−x erhalten wir nun: 2
D2 (e−x y) =
2
2
2
Dn+2 (e−x ) = Dn+1 (De−x ) = Dn+1 (−2xe−x ) 2
2
=
−2xDn+1 (e−x ) − 2(n + 1)Dn (e−x )
=
−2xD(e−x y) − 2(n + 1)e−x y
=
4x2 e−x y − 2xe−x y 0 − 2(n + 1)e−x y
=
e−x (4x2 y − 2xy 0 − 2(n + 1)y).
2
2
2
2
2
2
Weiter gilt 2
D2 (e−x y) =
Durch Vergleich erhalten wir
2
2
2
e−x y 00 + 2D(e−x )y 0 + (D2 e−x )y 2
2
2
=
e−x y 00 − 4xe−x y 0 + (4x2 − 2)e−x y
=
e−x (y 00 − 4xy 0 + (4x2 − 2)y).
2
y 00 − 2xy 0 + 2ny = 0.
¨ KAPITEL 15. LINEARE GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
292
Die angegebenen Polynome stellen jeweils nur eine L¨osung der angegebenen homogenen linearen Differentialgleichung zweiter Ordnung dar. Um die Gesamtheit aller L¨osungen zu kennen, ben¨otigen wir daher noch eine zweite linear unabh¨angige L¨osung. Der folgende Satz ist ein wichtiges Werkzeug bei der Konstruktion von Fundamentall¨osungen f¨ ur Differentialgleichungen zweiter Ordnung, da er es erlaubt, bei Kenntnis einer L¨osung das Problem auf die L¨osung einer Differentialgleichung erster Ordnung zu reduzieren. Satz 15.3.4 : (Reduktion der Ordnung) Sei I ⊆ R ein Intervall und a, b : I → K zwei stetige Funktionen. Weiter sei ϕ : I → K eine L¨ osung der Differentialgleichung y 00 + a(x)y 0 + b(x)y = 0.
(†)
Im Intervall J ⊆ I gelte ϕ(x) 6= 0. Dann erh¨ alt man auf J eine zweite von ϕ lineare unabh¨ angige L¨ osung ψ : J → K durch den Ansatz ψ(x) = ϕ(x)u(x), wobei u eine nicht-konstante L¨ osung der Differentialgleichung ³ ϕ0 (x) ´ u00 + 2 + a(x) u0 = 0 ϕ(x)
(††) ist.
Die Gleichung (††) ist eine lineare Differentialgleichung erster Ordnung f¨ ur u0 . Sie kann gem¨aß Beispiel 13.1.4 gel¨ost werden durch ³ Z x ´ 1 u0 (x) = exp − a(t) dt ϕ(x)2 x0 und man erh¨alt u durch eine weitere Integration. Beweis: Aus ψ = ϕu folgt ψ 0 = ϕ0 u + ϕu0
und
ψ 00 = ϕ00 u + 2ϕ0 u0 + ϕu00 .
Damit erhalten wir unter Benutzung von ϕ00 + aϕ0 + bϕ = 0: ψ 00 + aψ 0 + bψ = ϕu00 + (2ϕ0 + aϕ)u0 . Die Funktion ψ erf¨ ullt also die Differentialgleichung (†), wenn ³ ϕ0 ´ u00 + 2 + a u0 = 0 ϕ ist. Ist u nicht konstant, so ist ψ = ϕu von ϕ u ¨ber dem Intervall J linear unabh¨angig.
Beispiel 15.3.5 : F¨ ur n = 1 lautet die Legendresche Differentialgleichung y 00 −
2 2x 0 y + y=0 1 − x2 1 − x2
f¨ ur |x| < 1. Sie besitzt die L¨osung ϕ(x) = x. Wir suchen nun eine linear unabh¨angige L¨osung mit dem Ansatz ψ(x) := xu(x), x ∈]0, 1[, wobei u00 +
³2 x
−
2x ´ 0 u =0 1 − x2
15.3. LINEARE DIFFERENTIALGLEICHUNGEN N -TER ORDNUNG
293
−2x gilt. Zun¨achst betrachten wir die Stammfunktion ln(1 − x2 ) von 1−x 2 . Nach Satz 15.3.4 erhalten wir eine L¨osung durch 1 1 1³ 1 1 ´ u0 (x) = 2 = + + . x (1 − x2 ) x2 2 1−x 1+x
Also ist
1 1 ³1 + x´ + ln x 2 1−x eine L¨osung der Gleichung f¨ ur u. Hiermit erhalten wir die zweite, von x linear unabh¨angige, L¨osung x ³1 + x´ ψ(x) = xu(x) = ln − 1. 2 1−x u(x) = −
Die G¨ ultigkeit unserer Ableitung beschr¨ankt sich zun¨achst auf das Intervall ]0, 1[, aber man sieht sofort, daß ψ auf ganz ] − 1, 1[ eine L¨osung ist. Beispiel 15.3.6 : Es ist keineswegs so, daß sich die L¨osungen von Differentialgleichungen immer durch elementare Funktionen ausdr¨ ucken lassen. Vielmehr st¨oßt man dabei oft auf neue transzendente Funktionen, d.h. Funktionen, die keiner Polynomgleichung gen¨ ugen. Dies ist zum Beispiel der Fall bei der Besselschen Differentialgleichung y 00 +
1 0 ³ p2 ´ y + 1 − 2 y = 0, x x
x > 0.
Dabei ist p eine reelle Zahl. Ihre L¨osungen heißen Zylinderfunktionen der Ordnung p. Gem¨aß der allgemeinen Theorie bilden sie einen zweidimensionalen Vektorraum. Eine spezielle Basis bildet die sogenannte Besselfunktion Jp der Ordnung p zusammen mit der Neumannschen Funktion p-ter Ordnung Np . Speziell f¨ ur p = 0 sind diese Funktionen gegeben durch J0 (x) =
∞ X
(−1)k
k=0
1 ³ x ´2k (k!)2 2
und
" # ∞ ³ x ´2k X 2 x c k N0 (x) = (ln + C)J0 (x) + (−1)k−1 , π 2 (k!)2 2 k=1 Pn ¨ wobei C = limn→∞ (− ln n + k=1 k1 ) = 0, 577 . . . die Euler–Mascheronische Konstante ist (Ubung: verifiziere, daß dieser Grenzwert existiert!) und ck := 1 +
1 1 + ... + 2 k
(f¨ ur n¨ahere Informationen zu diesen Gleichungen vgl. Heuser, “Gew¨ohnliche Differentialgleichungen”, Abschnitt 27 ). Aus dem Quotientenkriterium folgt, daß die beiden Reihen ∞ X
(−1)k
k=0
1 ³ x ´2k (k!)2 2
und
∞ X
(−1)k−1
k=1
ck ³ x ´2k (k!)2 2
f¨ ur alle x ∈ R konvergieren. Man darf also gliedweise differenzieren und kann so die Differentialgleichung verifizieren. Schließlich zeigen wir noch, daß die Funktionen J0 und N0 linear unabh¨angig sind. W¨are dies nicht der Fall, so g¨abe es Konstanten d1 , d2 , nicht beide 0, so daß d1 J0 (x) + d2 N0 (x) = 0 f¨ ur alle x > 0 gilt. Wegen limx→0 J0 (x) = 1 und limx→0 N0 (x) = −∞ folgt hieraus ein Widerspruch. Also ist (J0 , N0 ) eine Basis des L¨osungsraums der Besselschen Differentialgleichung f¨ ur p = 0.
¨ KAPITEL 15. LINEARE GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
294
¨ Ubung 15.3.1 : Die Funktionen v1 , . . . , vn : R → R seien (n − 1)-mal differenzierbar. F¨ ur x ∈ R heißt die Zahl W (v1 , . . . , vn )(x) := det
v1 (x) v10 (x) .. . (n−1) v1 (x)
... ... .. . ...
vn (x) vn0 (x) .. . (n−1) vn (x)
Wronski-Determinante von v1 , . . . , vn an der Stelle x. Berechne die Wronski-Determinante der folgenden Funktionen (i) er1 x , er2 x mit r1 6= r2 , (ii) cos2 (x), x
x
1 (1 + 2 2 x
cos 2x),
(iii) e , xe , x e .
¨ Ubung 15.3.2 : Seien a, b : R → R stetig. Zeige, daß zwei L¨ osungen der Differentialgleichung y 00 + a(x)y 0 + b(x)y = 0
(x ∈ R)
genau dann linear abh¨ angig sind, wenn es ein x0 ∈ R gibt, so daß ihre Wronski-Determinante in x0 verschwindet. ¨ Ubung 15.3.3 : Es sei φ1 , φ2 : R → R,
φ2 (x) = x2
φ1 (x) = x · |x|,
(i) Sind φ1 , φ2 linear abh¨ angig? (ii) Berechne die Wronski-Determinante von φ1 , φ2 . (iii) Warum steht das Ergebnis aus (ii) nicht im Widerspruch zur Aussage aus Aufgabe 15.3.2? Was ist die Folgerung daraus?
¨ osungs-Fundamentalsystem der Differentialgleichung Ubung 15.3.4 : Bestimme ein L¨ µ ¶ 1 1 y 00 + y 0 + 1 − 2 y = 0, x > 0 x 4x (Besselsche Differentialgleichung f¨ ur den Parameter p = 12 ). Tip: Benutze den Ansatz z =
√ xy.
¨ Ubung 15.3.5 : Gegeben sei die folgende lineare, inhomogene Differentialgleichung y 00 + ay 0 + by = s, wobei a, b ∈ R und s : R → R stetig sei. Das zugeh¨ orige charakteristische Polynom t2 + at + b besitze die doppelte Nullstelle µ. Zeige, daß µ Z y(x) := eµx x
x
Z e−µt s(t)dt −
x0
x
¶ te−µt s(t)dt
x0
eine L¨ osung der gegebenen Differentialgleichung ist. ¨ Ubung 15.3.6 : L¨ ose f¨ ur x > 0 die Eulersche Differentialgleichung x2 y 00 + 5xy 0 + 4y = 0.
¨ Ubung 15.3.7 : Zeige, daß die Hermiteschen, Laguerreschen und Legendreschen Polynome tats¨ achlich Polynome sind. ¨ Ubung 15.3.8 : (i) Zeige, daß die Legendreschen Polynome die Legendreschen Differentialgleichungen l¨ osen.
15.3. LINEARE DIFFERENTIALGLEICHUNGEN N -TER ORDNUNG
295
(ii) Zeige, daß die Laguerreschen Polynome die Laguerreschen Differentialgleichungen l¨ osen.
¨ Ubung 15.3.9 : Gegeben sei die Differentialgleichung y 00 +
a 0 b y + 2 y = 0, x x
(x > 0, a, b ∈ C).
Zeige: Eine Funktion φ :]0, ∞[→ C ist genau dann eine L¨ osung, wenn die Funktion ψ : R → C,
ψ(ξ) := φ(eξ )
eine L¨ osung der Differentialgleichung y 00 + (a − 1)y 0 + by = 0 ist. ¨ Ubung 15.3.10 : Bei der Untersuchung der Abh¨ angigkeit des Preises P einer bestimmten Ware vom Angebot A ist es plausibel, folgende Annahmen zu machen: (a) Die Preis¨ anderung P 0 gen¨ ugt der Differentialgleichung P 0 = α − λ(A − A0 ), wobei α als Inflationsrate, A0 als Gleichgewichtsangebot und λ > 0 als Proportionalit¨ atsfaktor interpretiert werden k¨ onnen. (b) Die Angebots¨ anderung A0 gen¨ ugt der Differentialgleichung A0 = µ(P − P0 ), wobei µ > 0 sei, und P0 als Gleichgewichtspreis interpretiert werden kann. L¨ ose dieses Differentialgleichungssystem zu den Anfangswerten P (0) = P0 und A(0) = A0 . ¨ Ubung 15.3.11 : Seien p, q : R → R zweimal stetig differenzierbare Funktionen mit p(x) > 0 f¨ ur alle x ∈ R. Die Differentialgleichung −py 00 − p0 y 0 + qy = 0 heißt Sturm–Liouville’sche Differentialgleichung. Zeige, daß f¨ ur jedes Fundamentalsystem φ1 , φ2 einer Sturm–Liouville’schen Differentialgleichung die Funktion p(x) · detW (φ1 , φ2 ) konstant ist. Hier bezeichnet det W (φ1 , φ2 ) die Wronski–Determinante von φ1 , φ2 . ¨ Ubung 15.3.12 : Die Eulersche Differentialgleichung n-ter Ordnung ist allgemein durch an xn y (n) + an−1 xn−1 y (n−1) + · · · + a1 xy 0 + a0 y = 0,
(ak ∈ R, an 6= 0, x > 0)
gegeben. Zeige: Man erh¨ alt alle auf ]0, ∞[ definierten L¨ osungen y der Eulerschen Differentialgleichung, indem man in den L¨ osungen u der linearen Differentialgleichung à ! n X D u(t) = 0, k!ak k k=0
t = ln x setzt. Hier bezeichnet à ! à ! D 1 D u := (D − k + 1)(D − k + 2) · · · (D − 1)Du, f¨ ur k ≥ 1 und u := u, k k! 0 sowie (D − j)u := u0 − ju.
¨ KAPITEL 15. LINEARE GEWOHNLICHE DIFFERENTIALGLEICHUNGEN
296
¨ Ubung 15.3.13 : Sei U : R2 → R definiert durch U (x1 , x2 ) :=
5 2 x1 + 2x1 x2 + 4x22 . 2
Bestimme die allgemeine L¨ osung der Differentialgleichung d2 x = −grad U (x), wobei x = dt2
Ã
! x1 (t) . x2 (t)
¨ Ubung 15.3.14 : Sei C ∞ (]0, ∞[) der Vektorraum aller beliebig oft differenzierbaren Funktionen auf positiven Zahlen ]0, ∞[. Lineare Abbildungen Tp , Sp , Bp : C ∞ (]0, ∞[) → C ∞ (]0, ∞[) seien wie folgt definiert: (Tp f )(x)
:=
(Sp f )(x)
:=
(Bp f )(x)
:=
p f (x), x p −f 0 (x) + f (x), x µ ¶ p2 1 f 00 (x) + f 0 (x) + 1 − 2 f (x). x x f 0 (x) +
(i) Zeige: F¨ ur jedes f ∈ C ∞ (]0, ∞[) gilt (a) Tp+1 Sp f = f − Bp f , (b) Sp−1 Tp f = f − Bp f , (c) Tp Bp f = Bp−1 Tp f , (d) Sp Bp f = Bp+1 Sp f . (ii) Sei Vp := {f ∈ C ∞ (]0, ∞[)|Bp f = 0} der Vektorraum der Zylinderfunktionen der Ordnung p. Zeige: (a) Tp (Vp ) ⊆ Vp−1 , (b) Sp (Vp ) ⊆ Vp+1 , (c) Die Abbildungen Sp : Vp → Vp+1 und Tp+1 : Vp+1 → Vp sind Isomorphismen und Umkehrungen voneinander. ¨ (iii) Bestimme mittels (b) und des Ergebnisses aus der großen Ubung 15.3.4 alle Zylinderfunktionen der Ordnung 23 . ¨ osungen von Ubung 15.3.15 : Seien p, q stetig auf ]a, b[, x0 ∈]a, b[ und φ1 , φ2 :]a, b[→ R L¨ y 00 + p(x)y 0 + q(x)y = 0. Zeige, daß es ein c ∈ R gibt mit
µ Z W (φ1 , φ2 )(x) = c exp −
x
¶ p(t)dt .
x0
¨ osungen der Differentialgleichung Ubung 15.3.16 : Auf ]a, b[ seien φ1 , φ2 L¨ y 00 + p(x)y 0 + q(x)y = f (x), wobei p, q, f :]a, b[→ R stetig seien und f nicht identisch Null sei. (i) Unter welchen Bedingungen an c1 , c2 ∈ R ist c1 φ1 + c2 φ2 wieder eine L¨ osung? (ii) Begr¨ unde das Ergebnis aus (i) geometrisch. Tip: affiner Raum, Affinkombination. ¨ Ubung 15.3.17 : L¨ ose die Differentialgleichung x2 y 00 − 2xy 0 + 2y = 6x4 ,
x > 0.
Kapitel 16
Konstante Koeffizienten In diesem Kapitel betrachten wir lineare Differentialgleichungen und Systeme mit konstanten Koeffizienten. In diesem Falle l¨ aßt sich die Suche nach L¨ osungen auf die Probleme der linearen Algebra reduzieren, wenn man einmal davon absieht, daß die lineare Algebra selbst nicht sagt, wie man die Nullstellen eines charakteristischen Polynoms findet. Das entscheidende Werkzeug f¨ ur Systeme ist die Exponentialfunktion f¨ ur Matrizen, mit deren Hilfe man die L¨ osungen explizit hinschreiben kann. Zur Berechnung der Exponentialfunktion geben wir eine Methode an, die die Jordan-Normalform der Matrizen ben¨ utzt. Falls das betrachtete System von einer Gleichung h¨ oherer Ordnung kommt, ist die resultierende Matrix von spezieller Gestalt und die Berechnung der Jordan-Normalform l¨ aßt sich durch geeignete Ans¨ atze umgehen.
16.1
Die Exponentialfunktion fu ¨ r Matrizen
In diesem Abschnitt lernen wir die Exponentialfunktion f¨ ur Matrizen kennen. Sie ist ein sehr vielseitiges Werkzeug und spielt in der Theorie der Matrizengruppen (Lie-Gruppen) eine wichtige Rolle. Wir werden sie dazu verwenden, die L¨osungen von linearen Differentialgleichungen erster Ordnung mit konstanten Koeffizienten zu beschreiben. Auch in diesem Abschnitt bezeichne K immer R oder C. Wir betrachten hier End(Kn ) mit der Operatornorm. Dies ist ein vollst¨andiger normierter Vektorraum und es ist wichtig zu bemerken, daß alle Definitionen, S¨atze und Beweise aus Kapitel 4 und Abschnitt 5.1, in denen nicht explizit von Division oder Gr¨oßenvergleich die Rede ist, ihre G¨ ultigkeit behalten, wenn man den Betrag auf R durch die Norm ersetzt. Insbesondere kann man von konvergenten Folgen und Reihen in End(Kn ) sprechen, von Nullfolgen und von absoluter Konvergenz. Es gilt sogar noch mehr: In End(Kn ) hat man eine Multiplikation, f¨ ur die gilt kXY k ≤ kXk kY k. Damit bleiben auch die Begriffe und S¨atze aus Abschnitt 5.2 sinnvoll und die Beweise (mutatis mutandis) richtig. P∞ Bemerkung 16.1.1 : Sei (V, k · k) ein normierter Vektorraum. Eine Reihe k=0 vk in V heißt konverPn P∞ gent, falls die Folge (sn )n∈N der Partialsummen s := v in V konvergiert. Die Reihe k=0 k k=0 vk in P∞n V heißt absolut konvergent, falls die Reihe k=0 kvk k in R konvergiert. Es gilt: P∞ P∞ P∞ (a) Wenn k=0 vk konvergiert, dann gilt k k=0 vk k ≤ k=0 kvk k. P∞ (b) Wenn die Reihe k=0 vk absolut konvergiert, dann konvergiert sie.
Betrachte End(Kn ) als normierten Vektorraum bzgl. der Operatornorm. Dann gilt kXY k ≤ kXk kY k f¨ ur alle X, Y ∈ End(Kn ). Satz 16.1.2 : F¨ ur jedes X ∈ End(Kn ) konvergiert die Exponentialreihe exp(X) := eX := 297
∞ X 1 n X . n! n=0
298
KAPITEL 16. KONSTANTE KOEFFIZIENTEN
Weiter gilt (i) Die Reihe konvergiert gleichm¨ aßig auf jeder beschr¨ ankten Teilmenge von End(Kn ). (ii) Die Exponentialfunktion exp : End(Kn ) → End(Kn ) ist stetig. (iii) Es gelten e0 = id und f¨ ur XY = Y X weiter eX · eY = eX+Y . (iv) F¨ ur alle g ∈ GL(n, K) ist g · eX · g −1 = exp(gXg −1 ). (v) F¨ ur alle X ∈ End(Kn ) ist eX ∈ GL(n, K) und (eX )−1 = e−X . Beweis: Idee: Ben¨utze die Operatornorm um die absolute Konvergenz der Exponentialreihe zu zeigen und argumentiere dann immer gliedweise.
(i), (ii) : Sei B ⊆ End(Kn ) eine beschr¨ankte Teilmenge und kXk ≤ M f¨ ur alle X ∈ B. Dann gilt f¨ ur alle X ∈ B: ° 1 n° ° X ° ≤ 1 kXkn ≤ 1 M n . n! n! n! P∞ Die Funktionenreihe n∈N fn mit fn : B → End(Kn ), X 7→
1 n X n!
ist also auf B gleichm¨aßig konvergent, da ∞ X ¡ n=0
∞ ¢ X Mn sup kfn (X)k ≤ = eM < ∞ n! X∈B n=0
(vgl. Korollar 4.2.7). Aus der gleichm¨aßigen Konvergenz der Exponentialreihe auf beschr¨ankten Mengen folgt nun die lokal gleichm¨aßige Konvergenz und damit die Stetigkeit der Exponentialfunktion mit Satz 12.1.2. (iii) : Mit der Definition X 0 := id ist die Aussage e0 = id ist trivial. Gilt XY = Y X, d.h. die linearen Abbildungen vertauschen miteinander, so ist n µ ¶ X n (X + Y ) = X k · Y n−k . k n
k=0
Zusammen mit dem Umordnungssatz 4.3.1 (angewendet auf Reihen in End(Kn )) rechnen wir µ ¶ ∞ ∞ X n X X 1 1 n eX+Y = (X + Y )n = X k Y n−k n! n! k n=0 n=0 k=0
∞ X n ∞ ∞ X X X k Y n−k Xn X Y k = = = eX · eY . k! (n − k)! n! k! n=0 n=0 k=0
k=0
¡ ¢n (iv) : F¨ ur X ∈ Mat(n × n, K) und g ∈ GL(n, K) gilt gX n g −1 = gXg −1 , und somit folgt aus der Stetigkeit der Matrizenmultiplikation: geX g −1
= g· =
∞ ∞ ³X 1 n ´ −1 X 1 X ·g = gX n g −1 n! n! n=0 n=0
∞ X ¢n 1¡ gXg −1 = exp(gXg −1 ). n! n=0
¨ MATRIZEN 16.1. DIE EXPONENTIALFUNKTION FUR
299
¡ ¢−1 (v) : Aus Punkt (iii) folgt eX · e−X = id, also eX ∈ GL(n, K) mit e−X = eX .
Beispiel 16.1.3 : (a) F¨ ur Diagonalmatrizen d1 D= 0 0 .. . (b) F¨ ur A = ... . ..
0 ..
.
k gilt D =
dn
1
0
0
1 .. .
0 ... ... erh¨alt hieraus die folgende
dk1
..
dkn 0 .. .
1 .. .
..
.
..
..
.
.
0
..
... ...
etA
D , also e
.
0
... 0 0 .. .. .. . . . .. 2 .. ist A = . . 0 . .. .. . 1 ... 0 0 Formel
0
n−1 ∞ X X 1 1 k k (tA) = (tA) = = k! k! k=0 k=0
1
. ...
0 ..
.
.
edn
, etc. und schließlich An = 0. Man 1 0 0
t2 2
t
d e 1 = 0
... .. .
1 ..
.. .
t2 2
.
0
tn−1 (n−1)!
1
t 1
;
so ergibt sich beispielsweise f¨ ur die Matrix 0 A=
1 0
0 1 0 µ
als Funktionswert etA ¶
µ n B gilt A = 0
1 t = 0 1 0 0
t2 2
t . 1
¶ µ B 0 e A , also e = Cn 0
¶ 0 (c) F¨ ur Blockdiagonalmatrizen A = . eC λ 1 0 0 1 . . .. .. .. . (d) F¨ ur A = (ein Jordank¨astchen) ist A = λ · id + N mit N = . . . 1 0 0 λ Wegen (λid) · N = N · (λid) gilt also B 0
0 C
n
0 ..
.
..
.
. 1 0
eA = eλid · eN = eλ · eN . Wegen Satz 16.1.2(4) l¨aßt sich die Berechnung von eA auf den Fall zur¨ uckf¨ uhren, wo A in Jordan-
300
KAPITEL 16. KONSTANTE KOEFFIZIENTEN
Normalform vorliegt, d.h. folgende Form hat: A=
λ1
1 .. .
..
.
0
..
.
0 0 1 λ1 ..
. ..
0
. λn
1 .. .
..
.
0
..
.
0 1 λn
Mittels (a)–(d) l¨ aßt sich ¶etA nun direkt µ µ berechnen. ¶ 0 1 −1 0 2 (e) F¨ ur A = ist A = und somit −1 0 0 −1 etA
= = =
∞ X 1 (tA)k k!
k=0 ∞ X
µ ¶ X µ ∞ (−1)m 2m (−1)m 2m+1 1 0 −1 t · + t · 0 1 0 (2m)! (2m + 1)! m=0 m=0 µ ¶ µ ¶ µ ¶ cos t 0 0 sin t cos t sin t + = . 0 cos t − sin t 0 − sin t cos t
¶
0 −1
Lemma 16.1.4 : Die Abbildung exp : Mat(n × n, K) → Mat(n × n, K) ist in 0 differenzierbar, und es gilt exp0 (0) = idMat(n×n,K) . Beweis: Aus exp X = eX =
P∞
1 n n=0 n! X
X
ke − id − Xk = kXk
folgt °P ° ∞ ° n=2
°
1 n° n! X °
kXk
∞ X 1 ≤ kXkn−1 −→kXk→0 0, n! n=2
das heißt, wir erhalten keX − id − Xk = 0, X→0 kXk lim
also exp X = exp(0) + X + ϕ(X)
mit
ϕ(X) −→ 0. kXk X→0
Hieraus folgt, daß die Exponentialfunktion in 0 differenzierbar ist mit exp0 (0)X = X, also exp0 (0) = id.
¨ MATRIZEN 16.1. DIE EXPONENTIALFUNKTION FUR
301
Satz 16.1.5 : Sei A ∈ Mat(n × n, K) und ΦA : R → GL(n, K),
t 7→ exp(tA).
Dann gelten folgende Aussagen: (1) Die Abbildung ΦA ist ein differenzierbarer Gruppenhomomorphismus von (R, +) in (GL(n, K), ·), d.h. ΦA (t) · ΦA (s) = ΦA (t + s) f¨ ur alle t, s ∈ R. (2) F¨ ur alle t ∈ R gilt Φ0A (t) = A · ΦA (t). (3) Die Abbildung ΦA ist ein Fundamentalsystem der homogenen linearen Differentialgleichung y 0 = A · y,
y ∈ Kn
mit konstanten Koeffizienten. Beweis: Idee: Mit dem Exponentialgesetz 16.1.2(3) kann man t nach 0 verschieben und Lemma 16.1.4 anwenden.
(1) Wegen tX · sX = sX · tX f¨ ur reelle s, t folgt aus Satz 16.1.2(3), daß ΦA (t) · ΦA (s) = ΦA (t + s) gilt. Wegen ΦA (0) = id ist ΦA daher ein Gruppenhomomorphismus. Aus Lemma 16.1.4 folgt weiter Φ0A (0) = exp0 (0)(A) = A. Also gilt Φ0A (t) = =
ΦA (t + h) − ΦA (t) ΦA (h)ΦA (t) − ΦA (t) lim = lim h→0 h h ³ ΦA (h) − id ´ lim · ΦA (t) = Φ0A (0)ΦA (t) = A · ΦA (t) h→0 h h→0
Folglich ist ΦA eine differenzierbare Kurve in GL(n, K), und die Aussage (2) gilt. (3) folgt aus (2) und der Tatsache, daß ΦA (t) invertierbar ist.
Da wir durch die Exponentialfunktion lineare Differentialgleichungen mit konstanten Koeffizienten sehr explizit l¨osen k¨onnen, liefert uns Satz 15.2.1 u ¨ber die Variation der Konstanten folgendes Ergebnis: Satz 16.1.6 : Man erh¨ alt eine L¨ osung Ψ : R → Kn des inhomogenen Systems y 0 = Ay + b(x) durch den xA Ansatz Ψ(x) = e · c(x) mit Z x c(x) = e−tA · b(t) dt. 0
Damit ist
Z Ψ(x) = exA 0
x
Z e−tA · b(t) dt = 0
x
e(x−t)A · b(t) dt.
302
KAPITEL 16. KONSTANTE KOEFFIZIENTEN
Beispiel 16.1.7 : (Bewegung eines Teilchens in einem Potentialfeld nahe bei einem Minimum) Gegeben sei eine zweimal stetig differenzierbare Funktion U : R3 → R. Wir betrachten die folgende Differentialgleichung zweiter Ordnung: (∗)
x ¨ = −∇U (x)
d.h. x ¨j = −
∂U (x). ∂xj
Gesucht sind L¨osungskurven x : I → R3 . Die Differentialgleichung (∗) beschreibt die Bewegung eines Massepunkts (der Masse 1) im R3 unter dem Einfluß des Potentials U . Wir interessieren uns f¨ ur die Bewegung nahe bei einem Minimum a des Potentials. Ist a ein lokales Minimum von U , so ist a ein kritischer Punkt von U , d.h. es gilt ∇U (a) = 0. Dann ist die konstante Kurve x : R → R3 , t 7→ a eine L¨osung der Differentialgleichung (∗). Man nennt den Punkt a daher einen Gleichgewichtspunkt. Wir setzen nun voraus, daß die Hessematrix A := Ha (U ) positiv definit ist. Nach dem Satz u ¨ber die Taylorentwicklung gilt dann U (a + h) = U (a) + 21 hAh, hi + ϕ(h) ϕ(h) mit limh→0 khk 2 = 0. Um die Situation etwas zu vereinfachen, nehmen wir o.B.d.A. a = 0 an. Da wir uns f¨ ur L¨osungen in der N¨ahe des Nullpunkts interessieren, vernachl¨assigen wir das Restglied ϕ. Wir betrachten also nur noch e (h) := U (0) + 1 hAh, hi. U 2
Wegen
e 0 (x)y = 1 (hAx, yi + hAy, xi) = hAx, yi U 2
f¨ uhrt dies zu der folgenden linearen Differentialgleichung zweiter Ordnung: e (x) = −Ax. x ¨ = −∇U Da A symmetrisch ist, existiert eine orthogonale Matrix S ∈ O(3) mit λ1 0 0 S −1 AS = D := 0 λ2 0 , 0 0 λ3 und da A positiv definit war, sind alle λj > 0. Ersetzen wir x durch y := S −1 x, so f¨ uhrt dies zur Differentialgleichung y¨ = S −1 x ¨ = −S −1 Ax = −DS −1 x = −Dy (Reduktion auf Diagonalgestalt). Explizit bedeutet das y¨j = −λj yj , F¨ ur ωj :=
j = 1, 2, 3.
p
λj ergibt sich die allgemeine L¨osung zu yj (t) = αj cos(ωj t) + βj sin(ωj t)
¨ MATRIZEN 16.1. DIE EXPONENTIALFUNKTION FUR
303
mit αj , βj ∈ R. Das Teilchen f¨ uhrt also Schwingungen um die Ruhelage aus (drei Schwingungen in Richtung der Hauptachsen von A werden u ¨berlagert). Wir k¨onnen diese Differentialgleichung auch durch Reduktion auf ein System erster Ordnung l¨osen. Dann wird x ¨ = −Ax zu x˙ (1) x˙ (2) und
= =
x(2) −Ax(1)
¶ µ (1) ¶ µ (1) ¶• µ x 0 id x . = −A 0 x(2) x(2)
F¨ ur y = S −1 x ergibt sich entsprechend: µ (1) ¶• µ ¶ µ (1) ¶ y 0 id y . = −D 0 y (2) y (2) | {z } e =:D
Mittels der Gleichung
µ
0 −D
id 0
¶µ
0 −D
id 0
¶
µ −D = 0
0 −D
¶
berechnet man nun µ µ
0 −D
0 −D
f¨ ur alle n ∈ N. Man erh¨alt cos tω1 0 0 e e tD = −ω1 · sin tω1 0 0
id 0
¶2n id 0 ¶2n+1
µ = µ =
(−1)n Dn 0
0 (−1)n Dn
0 (−1)n+1 Dn+1
¶
(−1)n Dn 0
¶
0 cos tω2 0
0 0 cos tω3
sin tω1 ω1
0 0
sin tω2 ω2
0
sin tω3 ω3
0 −ω2 · sin tω2 0
0 0 −ω3 · sin tω3
cos tω1 0 0
0 cos tω2 0
0 0 cos tω3
0
0 0
α1 ω1 β1 und somit f¨ ur y(0) = α2 und y(0) ˙ = ω2 β2 die L¨osung durch α3 ω3 β3
α1 cos tω1 + β1 sin tω1 µ ¶ µ ¶ α2 cos tω2 + β2 sin tω2 y(t) y(0) α3 cos tω3 + β3 sin tω3 e = e tD · = y(t) ˙ y(0) ˙ ∗ ∗ ∗
Beispiel 16.1.8 : (Zweidimensionale lineare Differentialgleichungen) Wir betrachten das homogene lineare Differentialgleichungssystem y 0 = Ay Es treten drei F¨alle auf.
mit A ∈ Mat(2 × 2, R) und y ∈ R2 .
304
KAPITEL 16. KONSTANTE KOEFFIZIENTEN
• A ist reell diagonalisierbar mit Eigenwerten λ1 , λ2 ∈ R. Seien a1 und a2 die Eigenvektoren zu diesen Eigenwerten. Dann bilden die Funktionen ϕk : R → R2 mit ϕ1 (x) = eλ1 x a1 ,
ϕ2 (x) = eλ2 x a2
xA xλj ein Fundamentalsystem, ur eine j = λj aj folgt µ ¶ denn aus Aa µ xλ ¶ e aj = e aj . Das Bild der L¨osungskurven f¨ 1 λ1 0 e 0 Matrix A = mit exA = sieht dann z.B. so aus, 0 λ2 0 exλ2
-2
7.5
3
3
0.75
2
2
0.5
5
1
1
0.25
2.5
-1
1
-1
2
-0.5
1
0.5
-1
-0.5
0.5
1
-6
-4
-1
-1
-0.25
-2 -2.5
-2
-2
-0.5
-5
-3
-3
-0.75
-7.5
2
4
6
je nach dem ob λ1 = λ2 , λ1 > λ2 > 0, 0 < λ1 < λ2 oder λ1 > 0 > λ2 • Die Matrix A hat keine reellen Eigenwerte. Dann hat sie zwei konjugiert-komplexe Eigenwerte, etwa λ1 = µ + iω, λ2 = µ − iω, µ ∈ R, ω ∈ R \ {0}. Seien a1 , a2 ∈ C2 zugeh¨orige Eigenvektoren. Auch sie kann man in Real- und Imagin¨arteil zerlegen; dann ist (o.B.d.A.) a1 = b + ic b, c ∈ R2 . a2 = b − ic Man bekommt dann komplexe Fundamentall¨osungen (siehe den ersten Fall): ϕj (x) = = =
exA aj = exλj aj ¡ ¢ exµ eixω b ± eixω ic exµ (cos xω · b ∓ sin xω · c) + iexµ (sin xω · b ± cos xω · c),
und aus diesen dann reelle Fundamentall¨osungen ψ1 := Re ϕ1 = Re ϕ2 ,
ψ2 := Im ϕ1 = − Im ϕ2 ,
d.h. ψ1 (x) = exµ (cos xω · b − sin xω · c) und ψ2 (x) = exµ (sin xω · b + cos xω · c). µ ¶ µ ω Die Diagramme f¨ ur die Matrix A = geben wir unten an; in diesem Fall ist −ω µ a1 =
µ ¶ µ ¶ µ ¶ µ ¶ 1 1 1 0 und a2 = , d.h. b = und c = . i −i 0 1
Die reellen Fundamentall¨osungen sind dann µ ¶ µ ¶ cos xω sin xω ψ1 (x) = exµ · und ψ2 (x) = exµ · . − sin xω cos xω 4 3 2 1 -4
-2
2 -1 -2 -3
¨ MATRIZEN 16.1. DIE EXPONENTIALFUNKTION FUR
305
• Die Matrix A hat einen reellen Eigenwert und einen eindimensionalen Eigenraum. Dann ist die Jordansche Normalform µ ¶ λ 1 −1 B := S AS = 0 λ f¨ ur eine Matrix S ∈ GL(2, R). Durch die Substitution z := S −1 y erhalten wir die Differentialgleichung z 0 = Bz. Wegen e
xB
¶ µ ¶¸ ³ ·µ λ 0 0 1 ´ exp x + 0 λ 0 0 µ ¶ µ ¶ 0 x 1 x xλ xλ e · exp =e · 0 0 0 1
= =
bilden die beiden Kurven
µ ¶ µ ¶ 1 x und ψ2 (x) = eλx 0 1 µ ¶ ¡ ¢ 1 ein Fundamentalsystem mit ψ1 (0) = und ψ2 (0) = 01 . Die Kurven 0 ψ1 (x) = eλx
ϕj (x) := S · ψj (x) bilden nun ein Fundamentalsystem der urspr¨ unglichen Gleichung. Die Flußlinien f¨ ur A =
µ λ 0
1 λ
¶ sehen
folgendermaßen aus, 3
3 4
2
2 2
1 -3
-2
-1
1
2
3
-10
-5
-1
1 5
10
-2
-2
-3
-2
-1
1
2
3
-1 -2
-4 -3
-3
je nachdem, ob λ < 0, λ = 0 oder λ > 0.
¨ Ubung 16.1.1 µ 2 (i) A = 0 µ 1 (ii) A = 3
: Berechne eA f¨ ur folgende Matrizen A. ¶ 1 , 2 ¶ −2/3 . 4
¨ Ubung 16.1.2 : Eine radioaktive Ausgangssubstanz S1 zerfalle in eine radioaktive Substanz S2 , welche wiederum in die stabile Substanz S3 zerfalle. Bezeichnet man die Zerfallskonstanten mit λ1 und λ2 , so ergibt sich folgendes System von Differentialgleichungen: m01
=
−λ1 m1 ,
m02 m03
=
λ1 m1 − λ2 m2 ,
=
λ2 m2 .
(i) Begr¨ unde diesen Ansatz, (ii) L¨ ose das System zu den Anfangswerten m1 (0) = M > 0, m2 (0) = m3 (0) = 0 unter der Annhame, daß λ1 , λ2 6= 0 und λ1 6= λ2 .
306
KAPITEL 16. KONSTANTE KOEFFIZIENTEN
¨ Ubung 16.1.3 : Bei einer Inversion liegen in Umkehrung normaler Verh¨ altnisse warme Luftmassen auf kalten, so daß der vertikale Luftaustausch behindert wird. Sind auch noch die horizontalen Windgeschwindigkeiten gering, so kommt es zu einer Ansammlung luftverschmutzender Komponenten in der Atmosph¨ are, insbesondere von Schwefelwasserstoff H2 S und Schwefeldioxid SO2 , denn diese Stoffe werden aus Kaminen und Auspuffen in die unteren Luftschichten emittiert. Hierbei oxidiert H2 S zu SO2 und SO2 zu einem uns nicht interessierenden Sulfat. Die zur Zeit t vorhandene Menge an H2 S werde mit m1 (t) bezeichnet, und m2 (t) bezeichne die vohandene Menge an SO2 zur Zeit t. Die Emissionsraten von H2 S bzw. SO2 seien ²1 bzw. ²2 . Der Verschmutzungsprozeß unterliegt dann dem inhomogenen System m01
=
−k1 m1 + ²1 ,
m02
=
k1 m1 − k2 m2 + ²2 ,
wobei k1 , k2 > 0 und k1 6= k2 angenommen werde. (i) Begr¨ unde diesen Ansatz, (ii) Finde die allgemeine L¨ osung dieses Systems, (iii) Analysiere das Langzeitverhalten der L¨ osung und interpretiere das Ergebnis. ¨ Ubung 16.1.4 : Sei
µ A=
1 3
4 2
¶ .
(i) Berechne die Jordansche Normalform von A, (ii) Berechne eA , (iii) Definiere in Analogie zu eA eine Matrix sin A und berechne sie. ¨ Ubung 16.1.5 : Sei A ∈ Mat(n × n, R) und λ1 , . . . λn ∈ C die Eigenwerte von A, sowie γ := max1≤k≤n Reλk . Zeige: (i) Ist γ < 0, so gibt es c ≥ 0, µ > 0, so daß f¨ ur jede L¨ osung x : R → Rn von x0 = Ax gilt: kx(t)k ≤ ce−µt kx(0)k, (ii) Ist γ = 0 und sind die Eigenwerte λk mit Reλk = γ paarweise verschieden, so gibt es c ≥ 0, so daß f¨ ur jede L¨ osung x : R → Rn gilt kx(t)k ≤ ckx(0)k, (iii) Ist γ > 0, so gibt es f¨ ur jede Umgebung U von 0 ∈ Rn eine L¨ osung x : R → Rn mit x(0) ∈ U und lim kx(t)k = ∞.
t→∞
¨ Ubung 16.1.6 : Beweise den Stabilit¨ atssatz von Liapunov: F¨ ur jedes A ∈ Mat(n × n, R) sind folgende Aussagen ¨ aquivalent: (a) Es gilt limt→∞ ketA k = 0, (b) Alle Eigenwerte von A haben negativen Realteil. Man nennt A (bzw. die durch A erzeugte Halbgruppe) in diesem Fall stabil. ¨ ur jedes A = (aij )i,j=1,...n ∈ Mat(n × n, R) folgende Aussagen ¨ aquivalent sind: Ubung 16.1.7 : Zeige, daß f¨ (a) F¨ ur jedes t ≥ 0 sind alle Eintr¨ age von etA nichtnegativ, (b) Alle aij mit i 6= j sind nichtnegativ. ¨ Ubung 16.1.8 : Bestimme f¨ ur die folgenden Differentialgleichungs-Systeme ein Fundamentalsystem. λ 1 0 (i) y 0 = 0 λ 1 y, (λ ∈ C) 0 0 λ (ii)
y0
=
1 1 1
1 1 1
1 1 y. 1
¨ 16.2. DIFFERENTIALGLEICHUNGEN HOHERER ORDNUNG
16.2
307
Differentialgleichungen h¨ oherer Ordnung
Im Prinzip k¨onnte man lineare Differentialgleichungen h¨oherer Ordnung mit konstanten Koeffizienten behandeln, indem man sie auf ein System erster Ordnung zur¨ uckf¨ uhrt und die Methoden aus Abschnitt 16.1 ben¨ utzt. Da die entstehenden Koeffizientenmatrizen aber sehr speziell sind, ist es nicht sehr verwunderlich, daß man die allgemeine Berechnung der Jordannormalformen vermeiden kann. Es stellt sich heraus, daß man mit geeigneten Ans¨atzen nur noch Nullstellen (mit Vielfachheiten) bestimmter Polynome zu bestimmen braucht. Selbstverst¨andlich ließen sich die Ans¨atze aus Abschnitt 16.1 gewinnen und die Parallelit¨at unserer Vorgehensweise in diesem Abschnitt zur Berechnung der Jordannormalform ist nicht zu u ¨bersehen. Wir schreiben C[Z] f¨ ur die Menge der Polynome in einer Unbestimmten Z, d.h., die Elemente von C[Z] sind Ausdr¨ ucke der Gestalt P (Z) = a0 + a1 Z + · · · + an Z n mit komplexen Koeffizienten ak und der Unbestimmten Z. Hierbei denken wir uns P (Z) weniger als eine Funktion C → C, sondern viel eher als einen formalen Ausdruck, der durch die Folge der Koeffizienten kodiert wird. d Ersetzt man hierin die Unbestimmte Z durch den Ableitungsoperator D := dx , so erh¨alt man einen linearen Differentialoperator P (D) = a0 + a1 D + · · · + an Dn . Ist I ⊆ R ein offenes Intervall, so erhalten wir durch P (D) eine Abbildung, die einer n-mal differenzierbaren Funktion f : I → C die Funktion P (D)f = a0 f + a1 Df + · · · + an Dn f = a0 + a1 f 0 + · · · + an f (n) zuordnet. Wir erhalten so eine homogene lineare Differentialgleichung n-ter Ordnung: P (D)y = 0, wobei P (Z) eine Polynom vom Grad n ist, d.h., an 6= 0 und aj = 0 f¨ ur alle j > n.
Lemma 16.2.1 : Seien P1 (Z), P2 (Z) ∈ C[Z] Polynome vom Grad n bzw. m. (i) Sei P (Z) := P1 (Z) + P2 (Z) und f mindestens max(n, m)-mal differenzierbar. Dann gilt P (D)f = P1 (D)f + P2 (D)f. (ii) Sei P (Z) := P1 (Z)P2 (Z) und f mindestens nm-mal differenzierbar. Dann gilt ¡ ¢ P (D)f = P1 (D) P2 (D)f . Beweis: Idee: Elementares Nachrechnen. (i) : Das folgt sofort daraus, daß der Ausdruck P (D)f = a0 f + a1 Df + · · · + an Dn f = a0 f + a1 f 0 + · · · + an f (n) linear von den Koeffizienten aj von P (Z) abh¨angt.
308
KAPITEL 16. KONSTANTE KOEFFIZIENTEN (ii) . Seien P1 (Z) = a0 + a1 Z + · · · + an Z n , Dann ist P (Z) =
n+m X
cj Z j
P2 (Z) = b0 + b1 Z + · · · + bm Z m .
mit
cj =
j=0
X
al bk ,
l+k=j
wobei wir al = 0 setzen f¨ ur l > n und entsprechend f¨ ur bk . Daher ergibt sich P (D)f
=
n+m X
X
al bk Dj f =
n+m X
j=0 l+k=j
=
n X
al D l
l=0
X
al bk Dl Dk f =
j=0 l+k=j
m ³X
m n X X
al Dl (bk Dk f )
l=0 k=0
´
¡ ¢ bk Dk f = P1 (D) P2 (D)f .
k=0
Bemerkung 16.2.2 : Aus Lemma 16.2.1(ii) folgt insbesondere die Beziehung P1 (D)P2 (D)f = P2 (D)P1 (D)f, da die Multiplikation von Polynomen kommutativ ist. Eine entsprechende Rechenregel gilt nicht f¨ ur Differentialoperatoren der Gestalt n X P (D) = aj D j , j=0
bei denen die Koeffizienten nicht konstant, sondern Funktionen aj : I → C sind (I ein offenes Intervall in R). Eine einfaches Beispiel ist (L1 f )(x) = Df (x) Dann ist und
und
(L2 f )(x) = xDf (x).
(L2 L1 f )(x) = x(D2 f )(x) (L1 L2 f )(x) = D(xDf (x)) = x(D2 f )(x) + (Df )(x).
Im allgemeinen gilt also nicht L1 L2 f = L2 L1 f.
Die Wirkung der Differentialoperatoren P (D) ist besonders einfach auf Exponentialfunktionen, d.h. Funktionen der Gestalt f (x) = eλx . Lemma 16.2.3 : F¨ ur λ ∈ C gilt
P (D)eλx = P (λ)eλx .
Beweis: Mit D(eλx ) = λeλx und Induktion folgt sofort Dk (eλx ) = λk eλx , also gilt f¨ ur P (Z) = a0 + a1 Z + · · · + an Z n P (D)eλx = a0 eλx + a1 λeλx + · · · + an λn eλx = P (λ)eλx .
¨ 16.2. DIFFERENTIALGLEICHUNGEN HOHERER ORDNUNG
309
Mit Lemma 16.2.3 sehen wir sofort, wie wir L¨osungen der Differentialgleichung P (D)f = 0 finden k¨onnen. F¨ ur jede komplexe Nullstelle λ des Polynoms P ist eλx eine L¨osung. Der folgende Satz zeigt, daß wir f¨ ur den Fall, daß P nur einfache Nullstellen hat, damit schon alles erledigt haben. Satz 16.2.4 : Sei P (Z) = Z n + an−1 Z n−1 + · · · + a1 Z + a0 ∈ C[Z] ein Polynom mit den einfachen Nullstellen λ1 , . . . , λn ∈ C. Dann bilden die Funktionen ϕm (x) = eλm x ,
ϕm : R → C,
m = 1, . . . , n
ein Fundamentalsystem von L¨ osungen der Differentialgleichung P (D)y = y (n) + an−1 y (n−1) + · · · + a1 y 0 + a0 y = 0. Beweis: Idee: Kombiniere Lemma 16.2.3 und den Test D.4.4 auf lineare Unabh¨angigkeit. F¨ur letzteres Q ben¨ utze die Differentialoperatoren Pj (D) := l6=j (D − λl ). Aus Lemma 16.2.3 folgt, daß die Funktionen ϕk L¨osungen der Differentialgleichung sind. Wir haben daher nur noch ihre lineare Unabh¨angigkeit zu zeigen. Seien also c1 , . . . , cn ∈ C mit n X
cm ϕm = 0.
m=1
Wir betrachten das Polynom Pj (Z) :=
Y
(Z − λl ).
l6=j
Dann gilt 0 = Pj (D)
n X
cm ϕm =
m=1
n X
cm Pj (λm )ϕm = cj Pj (λj )ϕj ,
m=1
da alle λm , m 6= j, Nullstellen von Pj sind. Andererseits ist Y Pj (λj ) = (λj − λl ) 6= 0, l6=j
und wir erhalten cj = 0. Damit ist die lineare Unabh¨angigkeit der Funktionen ϕ1 , . . . , ϕn gezeigt.
Beispiel 16.2.5 : (a) Die Differentialgleichung y 000 − y 00 − 2y 0 = 0 l¨aßt sich schreiben als P (D)y = 0 mit P (D) = D3 − D2 − 2D. Das Polynom P (Z) = Z 3 − Z 2 − 2Z = Z(Z 2 − Z − 2) = Z(Z + 1)(Z − 2) hat die Nullstellen λ1 = 0,
λ2 = −1
und
λ3 = 2.
Daher bilden die Funktionen ϕ1 (x) = 1, ein Fundamentalsystem von L¨osungen.
ϕ2 (x) = e−x
und
ϕ3 (x) = e2x
310
KAPITEL 16. KONSTANTE KOEFFIZIENTEN
(b) Die Schwingungsgleichung
y 00 + ω 2 y = 0,
ω ∈ R× ,
l¨aßt sich schreiben als P (D)y = 0 mit P (D) = D2 + ω 2 . Das Polynom P (Z) = Z 2 + ω 2 = (Z − iω)(Z + iω) hat die Nullstellen λ1 = iω
und
λ2 = −iω.
ϕ1 (x) = eiωx
und
ϕ2 (x) = e−iωx
Daher bilden die Funktionen
ein Fundamentalsystem von L¨osungen. Hieraus gewinnt man leicht ein reelles Fundamentalsystem von L¨osungen durch ψ1 (x) :=
¢ 1¡ ϕ1 (x) + ϕ2 (x) = cos ωx, 2
ψ2 (x) :=
¢ 1¡ ϕ1 (x) − ϕ2 (x) = sin ωx. 2i
Wegen ϕ1 = ψ1 +iψ2 und ϕ2 = ψ1 −iψ2 sind die Funktionen ψ1 und ψ2 ebenfalls linear unabh¨angig, bilden also ein Fundamentalsystem.
Wir wenden uns dem Fall mehrfacher Nullstellen zu. Hier besteht der Extremfall nat¨ urlich in den Polynomen mit nur einer Nullstelle, z.B. P (Z) = Z n . In diesem Fall sind die L¨osungen der Differentialgleichung P (D)y = 0 gerade die Polynome vom Grad ≤ n − 1. Ein allgemeiner Ansatz wird beide Extremf¨alle verbinden m¨ ussen, d.h. Polynome und Exponentialfunktionen beinhalten. Ein Polynom P (Z) = Z n + an−1 Z n−1 + · · · + a1 Z + a0 vom Grad n l¨ aßt sich nach dem Fundamentalsatz der Algebra (der in der Funktionentheorie bewiesen wird) stets in Linearfaktoren zerlegen: P (Z) = (Z − λ1 )k1 (Z − λ2 )k2 · · · (Z − λr )kr mit paarweise verschiedenen komplexen Zahlen λ1 , . . . , λP urlichen Zahlen k1 , . . . , kr , die man r ∈ C und nat¨ die Vielfachheiten der Nullstellen nennt. Nat¨ urlich gilt j kj = n. Wie wir schon in Lemma 16.2.3 gesehen haben, bilden die Funktionen eλj x L¨osungen der Differentialgleichung P (D)y = 0, aber falls mindestens ein kj gr¨oßer als 1 ist, erhalten wir so weniger als n L¨osungen. Um den richtigen Ansatz zu finden, betrachten wir zuerst Polynome der Gestalt (Z − λ)k . Lemma 16.2.6 : Sei λ ∈ C und k ∈ N. Dann gilt f¨ ur jede auf jedem Intervall I ⊆ R mindestens k-mal differenzierbare Funktion f : I → C die Beziehung (D − λ)k (f (x)eλx ) = f (k) (x)eλx . Beweis: Idee: Elementare Induktion. Wir beweisen die Behauptung durch vollst¨andige Induktion nach k. Der Fall k = 0 ist trivial. Wir betrachten daher den Fall k > 0 und nehmen an, daß die Formel f¨ ur k − 1 anstelle von k gilt. Damit erhalten wir (D − λ)k (f (x)eλx ) = = =
(D − λ)(f (k−1) (x)eλx ) f (k) (x)eλx + λf (k−1) (x)eλx − λf (k−1) (x)eλx f (k) (x)eλx .
¨ 16.2. DIFFERENTIALGLEICHUNGEN HOHERER ORDNUNG
311
Lemma 16.2.7 : Sei P (Z) ∈ C[Z] ein Polynom und λ ∈ C mit P (λ) 6= 0. Ist dann g : R → C eine Polynomfunktion vom Grad k, so gilt ¢ ¡ P (D) g(x)eλx = h(x)eλx , wobei h : R → C wieder eine Polynomfunktion vom Grad k ist. Beweis: Idee: Schreibe P (D) in der Form
Pn j=0
cj (D − λ)j und ben¨ utze Lemma 16.2.6.
Zuerst schreiben wir das Polynom P (Z) als Linearkombination von Potenzen von (Z − λ)k : P (Z) =
n X
cj (Z − λ)j ,
cj ∈ C, cn 6= 0
j=0
¨ (Ubung: Zeige, daß das immer geht - man muß das lineare Gleichungssystem ak =
n X j=k
µ ¶ j cj λj−k k
f¨ ur P (Z) = Z n + an−1 Z n−1 + · · · + a1 Z + a0 f¨ ur die cj l¨osen.) Da P (λ) 6= 0 gilt, ist c0 6= 0. Nach Lemma 16.2.6 gilt dann n n ¡ ¢ X ¡ ¢ X λx j λx P (D) g(x)e = cj (D − λ) g(x)e = cj g (j) (x)eλx = h(x)eλx j=0
j=0
mit h(x) :=
n X
cj g (j) (x).
j=0
Wegen c0 6= 0 und da der Grad der Polynome g (j) , j > 0, echt kleiner ist als n, ist h wieder ein Polynom vom Grad n.
Satz 16.2.8 : Das Polynom P (Z) = Z n + an−1 Z n−1 + · · · + a1 Z + a0 ∈ C[Z] habe verschiedenen Nullstellen λ1 , . . . , λr mit den Vielfachheiten k1 , . . . , kr , d.h. P (Z) = Qr die paarweise kj (Z − λ ) . Dann besitzt die Differentialgleichung j j=1 P (D)y = 0 ein L¨ osungs-Fundamentalsystem aus folgenden Funktionen ϕjm (x) := xm eλj x ,
1 ≤ j ≤ r,
0 ≤ m ≤ kj − 1.
Beweis: Idee: Schreibe P (D) in der Form Q(D)(D −λj )kj und ben¨utze Lemma 16.2.7 um nachzuweisen, daß die angegebenen Funktionen L¨ osungen sind. Die lineare Unabh¨ angigkeit testet man mit Satz D.4.4 via Induktion unter Zuhilfenahme von (D − λr )kr .
312
KAPITEL 16. KONSTANTE KOEFFIZIENTEN Wir zeigen zuerst, daß alle angegebenen Funktionen die Differentialgleichung l¨osen. Dazu schreiben wir P (Z) = Q(Z)(Z − λj )kj und erhalten mit Lemma 16.2.7 f¨ ur m < kj : P (D)(xm eλj x ) = Q(D)(D − λj )kj (xm eλj x ) = Q(D)Dkj (xm )eλj x = 0. Es bleibt nur noch zu zeigen, daß die Funktionen ϕjm linear unabh¨angig sind, denn ihre Anzahl ist n = k1 + . . . + kr . Eine Linearkombination der ϕjm hat die Gestalt j −1 r kX X
cjm eλj x =
j=1 m=0
r X
gj (x)eλj x ,
j=1
Pkj −1 mit die gj (x) = m=0 cjm xm Polynome vom Grad < kj sind. Wir haben zu zeigen, daß, wenn eine solche Linearkombination verschwindet, dann auch alle Polynome gj verschwinden. Dies zeigen wir durch Induktion nach r. Der Fall r = 1 ist klar. Sei jetzt
r X
gj (x)eλj x ≡ 0.
j=1
Falls eines der Polynome gj identisch Null ist, sind wir fertig, da wir die Induktionsvoraussetzung anwenden k¨onnen. Andernfalls wenden wir auf die Gleichung den Differentialoperator (D − λr )kr an und erhalten nach Lemma 16.2.6 und Lemma 16.2.7: r−1 X
hj (x)eλj x ,
j=1
wobei die hj Polynome vom gleichen Grad wie die gj sind, insbesondere also nicht verschwinden. Dies ist ein Widerspruch zur Induktionsannahme.
Beispiel 16.2.9 : (a) Die Differentialgleichung
y (4) + 8y 00 + 16y = 0
geh¨ort zum Differentialoperator
P (D) = D4 + 8D2 + 16.
Das Polynom P (Z) = Z 4 + 8Z 2 + 16 = (Z 2 + 4)2 = (Z − 2i)2 (Z + 2i)2 hat die Nullstellen λ1 = 2i
und
λ2 = −2i
mit den Vielfachheiten k1 = k2 = 2. Daher bilden die Funktionen ϕ10 (x) = e2ix ,
ϕ11 (x) = xe2ix ,
ϕ20 (x) = e−2ix ,
ϕ21 (x) = xe−2ix
eine Fundamentalsystem von L¨osungen. Ein reelles Fundamentalsystem erh¨alt man wieder durch geeignete Linearkombinationen ψ1m =
1 (ϕ1m + ϕ2m ), 2
ψ2m =
1 (ϕ1m − ϕ2m ). 2i
Dann ist ψ10 (x) = cos 2x,
ψ11 (x) = x cos 2x,
ψ20 (x) = sin 2x,
ψ21 (x) = x sin 2x.
¨ 16.2. DIFFERENTIALGLEICHUNGEN HOHERER ORDNUNG
313
(b) Wir betrachten die Differentialgleichung der ged¨ ampften Schwingung: ω0 ∈ R× +,
x ¨ + 2µx˙ + ω02 x = 0,
µ ∈ R+ .
Dabei ist µ der D¨ ampfungsfaktor. F¨ ur µ = 0 besitzt die Differentialgleichung eine L¨osungsfundamentalsystem x1 (t) = cos ω0 t und x2 (t) = sin ω0 t (vgl. Beispiel 16.2.5(b)). Die Zahl ω0 ist also die Kreisfrequenz der unged¨ampften Schwingung. Im folgenden setzen wir µ > 0 voraus. Wir schreiben dann die Differentialgleichung als P (D)x = 0,
P (D) = D2 + 2µD + ω02 ,
D=
d . dt
Die komplexen Nullstellen des Polynoms P (Z) = Z 2 + 2µZ + ω02 = (Z + µ)2 + ω02 − µ2 ergeben sich zu
q µ2 − ω02 ,
λ1/2 = −µ ± wobei
p
p µ2 − ω02 f¨ ur µ2 < ω02 f¨ ur i ω02 − µ2 steht.
1. Fall: 0 < µ < ω0 . In diesem Fall k¨onnen wir ω := Nullstellen
p ω02 − µ2 setzen und erhalten die beiden konjugiert komplexen λ1/2 = −µ ± iω.
Also haben wir ein L¨osungs-Fundamentalsystem ϕ1 (t) = e−µt eiωt ,
ϕ2 (t) = e−µt e−iωt .
Hieraus erhalten wir das reelle Fundamentalsystem ψ1 (t) = e−µt cos ωt,
ψ2 (t) = e−µt sin ωt.
Wir beobachten hierbei, daß durch die D¨ampfung die Kreisfrequenz der L¨osungen kleiner wird. Die beobachtete Kreisfrequenz ist ω < ω0 . 2. Fall: µ = ω0 . In diesem Fall haben wir eine doppelte Nullstelle λ1/2 = µ. Also haben wir ein Fundamentalsystem ϕ1 (t) = e−µt ,
ϕ2 (t) = te−µt
von L¨osungen. In diesem Fall tritt also gar keine echte Schwingung mehr auf. 3. Fall: µ > ω0 . In diesem Fall haben wir die beiden reellen Nullstellen q λ1/2 = −µ ± µ2 − ω02 . Wegen
p
µ2 − ω02 < µ sind beide negativ. Daher erhalten wir als L¨osungs-Fundamentalsystem: ϕ1 (t) = eλ1 t ,
ϕ2 (t) = eλ2 t .
¨ ur die folgenden Differentialgleichungen. Ubung 16.2.1 : Bestimme ein Fundamentalsystem f¨ (i) y 00 − 4y 0 + 4y = 0,
314
KAPITEL 16. KONSTANTE KOEFFIZIENTEN
(ii) y 000 − 2y 00 + 2y 0 − y = 0, (iii) y 000 − y = 0, (iv) y 0000 + y = 0.
¨ Ubung 16.2.2 : Ein unged¨ ampfter und ungest¨ orter harmonischer Oszillator mit Masse m und Federkonstante k beginne zur Zeit t0 = 0 mit der Auslenkung x(0) = x0 und der Geschwindigkeit x0 (0) = x00 zu schwingen. Was ist sein Weg-Zeitgesetz? ¨ Ubung 16.2.3 : Sei P (Z) = a0 + a1 Z + · · · + an−1 Z n−1 + Z n . (i) Schreibe die Differentialgleichung P (D) = 0 als System erster Ordnung, d.h. in der Form y 0 = Ay mit einer n × n Matrix A. (ii) Zeige, daß f¨ ur das charakteristische Polynom χ(λ) = det(A − λ1) gilt: χ(λ) = (−1)n P (λ).
16.3
Anwendungen auf nichtkonstante Inhomogenit¨ aten
Sei
P (D) = Dn + an−1 Dn−1 + · · · + a1 D + a0
ein linearer Differentialoperator mit konstanten komplexen Koeffizienten ak und b : I → C eine stetige Funktion auf dem Intervall I ⊆ R. Dann kann man die inhomogene Differentialgleichung P (D)y = b(x) prinzipiell folgendermaßen l¨osen. Man bestimmt zun¨achst mittels Satz 16.2.8 ein Fundamentalsystem von L¨osungen der homogenen Gleichung P (D)y = 0. Dann f¨ uhrt man die Gleichung n-ter Ordnung auf eine Sytem erster Ordnung zur¨ uck und bestimmt so eine spezielle L¨osung der inhomogenen Gleichung mit der Methode der Variation der Konstante (vgl. Satz 15.2.1). F¨ ur spezielle Formen der Funktion b kann man schneller zum Ziel kommen, indem man einen geeigneten L¨osungsansatz macht. Bemerkung 16.3.1 : Sei P (Z) = Z n + an−1 Z n−1 + · · · + a1 Z + a0 ∈ C[Z] und µ ∈ C eine Zahl mit P (µ) 6= 0. Dann besitzt die inhomogene Differentialgleichung P (D)y = eµx die spezielle L¨osung ψ(x) :=
1 µx e . P (µ)
Dies ist klar mit Lemma 16.2.3.
Beispiel 16.3.2 : Wir suchen eine spezielle L¨osung der inhomogenen Differentialgleichung (∗)
(D3 − 2D2 − 2D + 2)y = 2 sin x.
Wegen 2 sin x = Re(−2ieix ), betrachten wir zuerst die Gleichung (∗∗)
P (D)y = −2ieix
mit
P (D) = D3 − 2D2 − 2D + 2.
Wegen P (i) = i3 − 2i2 − 2i + 2 = 4 − 3i besitzt (∗∗) die spezielle L¨osung ψ(x) =
−2i ix −2i(4 + 3i) ix 6 − 8i ix e = e = e . P (i) 25 25
¨ 16.3. ANWENDUNGEN AUF NICHTKONSTANTE INHOMOGENITATEN
315
Da alle Koeffizienten von P (D) reell sind, gilt Re(P (D)ψ(x)) = P (D) Re ψ(x). Also hat (∗) die spezielle L¨osung 6 8 ϕ(x) := Re ψ(x) = cos x + sin x. 25 25
Satz 16.3.3 : Sei P (Z) = Z n + an−1 Z n−1 + · · · + a1 Z + a0 ∈ C[Z] und b : R → C eine Funktion der Gestalt b(x) = f (x)eµx , wobei f ein Polynom in x mit komplexen Koeffizienten vom Grad m ist. Die Zahl µ ∈ C sei Nullstelle k-ter Ordnung von P . Dann besitzt die Differentialgleichung P (D)y = f (x)eµx eine spezielle L¨ osung ϕ : R → C der Gestalt ϕ(x) = h(x)eµx , wobei h ein Polynom vom Grad m + k ist. Beweis: Idee: Induktion u¨ber m: F¨ur m = 0 und P (D) = Q(D)(D − µ)k findet man die spezielle L¨osung c ϕ(x) := k!Q(µ) xk eµx . F¨ ur den Induktionsschritt setzt man an P (D)(xk+m eµx ) := g(x)eµx und l¨ ost mit Induktion P (D)(h1 (x)eµx ) = (f − cg)(x)eµx wobei c ∈ C passend gew¨ ahlt wird, damit f − cg geringeren Grad hat als f . Die gesuchte L¨ osung ist dann h(x) := h1 (x) + cxm+k .
Nach Voraussetzung ist P (D) = Q(D)(D − µ)k mit Q(µ) 6= 0. Wir zeigen die Behauptung durch Induktion nach m. Induktionsanfang: m = 0. Dann ist die Differentialgleichung P (D)y = ceµx zu l¨osen. Eine spezielle L¨osung ist ϕ(x) :=
c xk eµx , k!Q(µ)
denn nach Lemmas 16.2.6 und 16.2.7 gilt P (D)(xk eµx ) = =
Q(D)(D − µ)k (xk eµx ) = Q(D)(Dk (xk ))(eµx ) k!Q(D)(eµx ) = k!Q(µ)eµx .
Induktionsschritt: m → m + 1. Mit Lemmas 16.2.6 und 16.2.7 erhalten wir P (D)(xk+m eµx ) = =
Q(D)(D − µ)k (xk+m eµx ) = Q(D)(Dk (xk+m ))(eµx ) (m + k)! Q(D)(xm eµx ) = g(x)eµx , m!
wobei g ein Polynom vom Grad m ist. F¨ ur geeignetes c ∈ C ist daher f1 := f −cg ein Polynom vom Grad l ≤ m − 1. Nach Induktionsvoraussetzung existiert ein Polynom h1 vom Grad l + k mit P (D)(h1 (x)eµx ) = f1 (x)eµx . Setzen wir h(x) := h1 (x) + cxm+k , so gilt daher ¡ ¡ ¢ P (D) h(x)eµx ) = f1 (x) + cg(x) eµx = f (x)eµx .
316
KAPITEL 16. KONSTANTE KOEFFIZIENTEN
Beispiel 16.3.4 : (a) Wir betrachten die Differentialgleichung (D3 + 2D2 + D)y = x + 2e−x . Dann ist
P (D) = D3 + 2D2 + D = D(D + 1)2 .
Die Nullstellen des zugeh¨origen Polynoms sind also λ1 = −1 mit Vielfachheit 2 und λ2 = 0. Infolgedessen besitzt die homogene Gleichung P (D)y = 0 das folgende Fundamentalsystem von L¨osungen: ϕ1 (x) = e−x , ϕ2 (x) = xe−x , ϕ3 (x) = 1. Um die inhomogene Gleichung zu l¨osen, betrachten wir die beiden Gleichungen: (1) P (D)y = x = xe0x . (2) P (D)y = 2e−x . Die Gleichung (1) besitzt eine spezielle L¨osung der Gestalt ψ1 (x) = f (x)e0x = f (x) mit einem Polynom f vom Grad 2. Da alle Konstanten bereits die homogene Gleichung l¨osen, d¨ urfen wir f (x) = c1 x + c2 x2 annehmen. Dann ist P (D)f (x) = (c1 + 4c2 ) + 2c2 x. Die Gleichung (1) wird also genau dann von f gel¨ost, wenn c2 =
1 2
und c1 = −2 gelten, d.h.
1 ψ1 (x) = −2x + x2 . 2 Die Gleichung (2) besitzt eine spezielle L¨osung der Gestalt ψ2 (x) = g(x)e−x mit einem Polynom zweiten Grades g. Durch Abziehen einer geeigneten Linearkombination der L¨osungen ϕ1 und ϕ2 der homogenen Gleichung d¨ urfen wir annehmen, daß ψ2 (x) = cx2 e−x ,
c ∈ C,
gilt. Anwendung von P (D) f¨ uhrt zu P (D)(x2 e−x ) = −2e−x . Wir haben also c = −1 zu setzen, um eine L¨osung von (2) zu erhalten. Eine spezielle L¨osung der Gleichung P (D)y = x + 2e−x ist daher 1 ψ(x) := ψ1 (x) + ψ2 (x) = −2x + x2 − x2 e−x . 2 (b) Die Differentialgleichung (∗)
x ¨ + ω02 x = a cos ωt,
ω0 , ω ∈ R × +,
a ∈ R,
beschreibt die Bewegung eines harmonischen Oszillators der Eigenfrequenz ω0 unter der Wirkung einer periodischen ¨außeren Kraft a cos ωt. Zur Vereinfachung betrachten wir wieder zuerst die komplexe Differentialgleichung (∗∗) In diesem Fall ist
x ¨ + ω02 x = aeiωt . P (D) = D2 + ω02 = (D − iω0 )(D + iω0 ).
¨ 16.3. ANWENDUNGEN AUF NICHTKONSTANTE INHOMOGENITATEN
317
Um eine spezielle L¨osung der inhomogenen Gleichung zu finden, unterscheiden wir zwei F¨alle: 1. Fall: ω 6= ω0 . Dann erhalten wir eine L¨osung von (∗∗) durch den Ansatz ψ(t) = ceiωt . Es ist P (D)ψ(t) = c(ω02 − ω 2 )eiωt , also ist ψ(t) =
a eiωt ω02 − ω 2
eine L¨osung von (∗∗) und somit ϕ(t) = Re ψ(t) =
a cos ωt ω02 − ω 2
eine L¨osung von (∗). 2. Fall: ω = ω0 . Man nennt dies den Resonanzfall, da die Frequenz der ¨außeren Kraft gleich der Eigenfrequenz ist. Wegen P (iω0 ) = 0 besitzt (∗) in diesem Fall eine L¨osung der Form ψ(t) = cteiω0 t . Einsetzen ergibt
P (D)(teiω0 t ) = 2iω0 eiω0 t .
Die Differentialgleichung P (D)x = aeiω0 t ist also erf¨ ullt f¨ ur die Funktion ψ(t) =
a teiω0 t . 2iω0
Folglich besitzt (∗) die L¨osung ϕ(t) = Re
³ a ´ a teiω0 t = t sin ω0 t. 2iω0 2ω0
Man sieht insbesondere, daß die Amplitude der L¨osungen im Resonanzfall unbeschr¨ankt w¨achst (wenn a 6= 0 ist).
¨ osung der folgenden inhomogenen Differentialgleichungen. Ubung 16.3.1 : Finde die allgemeine L¨ (a) y 000 − 3y 00 + 2y 0 = ex , (b) y 00 + 9y = x cos x
¨ Ubung 16.3.2 : Bestimme alle reellen L¨ osungen der Differentialgleichung y 00 − 5y 0 + 6y = 4xex − sin x.
¨ osung φ : R → R2 der Differentialgleichung Ubung 16.3.3 : Bestimme die L¨ Ã ! µ ¶ x 1 2 0 y = y+ 3 6 sin x mit der Anfangsbedingung y(0) = 0.
318
KAPITEL 16. KONSTANTE KOEFFIZIENTEN
Kapitel 17
Meßbare Mengen und Funktionen In diesem Kapitel legen wir den Rahmen f¨ ur eine allgemeine Integrationstheorie fest, indem wir angeben, welchen Mengen wir ein Maß“ oder Volumen“ zuordnen wollen, und welche Funktionen wir integrieren ” ” wollen. Diese Mengen und Funktionen heißen dann meßbar. Daß man u ¨berhaupt Mengen aussondert und nicht alle Mengen und Funktionen als meßbar behandelt, liegt daran, daß man sp¨ ater ja Vorschriften angeben will, die jeder meßbaren Menge und jeder meßbaren Funktion eine Zahl (das Maß bzw. das Integral) zuordnet, und solche Vorschriften umso schwieriger zu finden sind, je komplizierter die Mengen und Funktionen aussehen. Die Strategie ist daher, von m¨ oglichst einfachen Mengen auszugehen (wie z.B. Intervallen) und weitere meßbare Mengen durch elementare Operationen wie Schneiden, Vereinigen oder Komplementbilden dazuzugewinnen. So st¨ oßt man auf den Begriff einer Algebra von Mengen, von dem sich aber herausstellt, daß er nicht ausreichend ist. Man verallgemeinert ihn auf den Begriff der σ-Algebra, in dem auch abz¨ ahlbar unendliche Schnitte und Vereinigungen inkorporiert sind. Als meßbare Funktionen nimmt man dann, in Analogie zur Stetigkeit, solche, deren Urbilder von meßbaren Mengen meßbar sind.
17.1
Meßbare Mengen
Seien M eine beliebige, nichtleere Menge und P(M ) := {N | N ⊆ M } die Potenzmenge von M , d.h., die Menge aller Teilmengen von M . Eine nichtleere Menge M ⊆ P(M ) von Teilmengen von M heißt eine Algebra, wenn E1 , . . . , En ∈ M ⇒ E1 ∪ . . . ∪ En ∈ M und E∈M
⇒
M \ E ∈ M.
Wenn sogar Ej ∈ M, j ∈ N
⇒
[
Ej ∈ M
j∈N
gilt, dann heißt die Algebra M eine σ-Algebra. Ein Paar (M, M), wobei M eine nichtleere Menge und M ⊆ P(M ) eine σ-Algebra ist, heißt ein meßbarer Raum oder kurz ein Meßraum. Die Elemente der σ-Algebra heißen meßbare Mengen. Bemerkung 17.1.1 : Nach den de Morganschen Gesetzen gilt ³[ ´ \ Ej = M \ (M \ Ej ) , also gelten in einer Algebra bzw. einer σ-Algebra M auch die Gesetze E1 , . . . , En ∈ M
⇒ 319
E1 ∩ . . . ∩ En ∈ M
320
KAPITEL 17. MESSBARE MENGEN UND FUNKTIONEN
bzw. Ej ∈ M, j ∈ N
⇒
\
Ej ∈ M.
j∈N
Außerdem gilt wegen E ∪ (M \ E) = M und E ∩ (M \ E) = ∅ automatisch ∅, M ∈ M.
Beispiel 17.1.2 : Sei M eine beliebige, nichtleere Menge. (i) P(M ) ist eine σ-Algebra. (ii) {∅, M } ist eine σ-Algebra.
Seien M und ATbeliebige, nichtleere Mengen. Wenn Ma ⊆ P(M ) f¨ ur jedes a ∈ A eine σ-Algebra ist, dann ist auch a∈A Ma ⊆ P(M ) eine σ-Algebra. Wenn jetzt E ⊆ P(M ) eine beliebige, nichtleere Teilmenge ist, dann ist \ σ(E) := M E⊆M
M σ−Algebra
ebenfalls eine σ-Algebra, und zwar die kleinste, die E enth¨alt. Man nennt sie die von E erzeugte σAlgebra. Beispiel 17.1.3 : Sei (M, U) ein topologischer Raum und E = {U ∈ P(M ) | U offen in M }. Dann heißt die von E erzeugte σ-Algebra die Borel–σ-Algebra von (M, U). Wir bezeichnen sie mit BM . Die Elemente von BM heißen die Borel–meßbaren Teilmengen von M . Seien jetzt M1 , . . . , Mn nichtleere Mengen und Mj ⊆ P(Mj ) σ-Algebren f¨ ur j = 1, . . . , n. Dann heißt die von {E1 × . . . × En | Ej ∈ Mj , j = 1, . . . , n} Nn erzeugte σ-Algebra die Produkt-σ-Algebra der Mj . Sie wird mit j=1 Mj bezeichnet. Proposition 17.1.4 : Seien M1 , . . . , Mn nichtleere Mengen und Mj ∈ Ej ⊆ P(Mj ) f¨ ur j = 1, . . . , n. Dann gilt n O σ(Ej ) = σ({E1 × . . . × En | Ej ∈ Ej , j = 1, . . . , n}). (17.1) j=1
Beweis: Idee: Um ⊆“ zu zeigen, nenne die rechte Seite von (17.1) einfach M und betrachte M0j := {Fj ⊆ ” Mj | πj−1 (Fj ) ∈ M} mit den Projektionen πj auf den j-ten Faktor. Die M0j sind σ-Algebren und T −1 enthalten mit Ej auch σ(Ej ). Damit erh¨ alt man E1 × . . . × En = n ur alle j=1 πj (Ej ) ∈ M f¨ Nn Ej ∈ σ(Ej ), also j=1 σ(Ej ) ⊆ M. Die Inklusion ⊇“ ist klar. F¨ ur die Umkehrung nennen wir die rechte Seite von (17.1) einfach ” M und betrachten die Mengensysteme M0j := {Fj ⊆ Mj | πj−1 (Fj ) ∈ M},
17.1. MESSBARE MENGEN
321
wobei πj : M1 × . . . × Mn → Mj die Projektion auf den j-ten Faktor ist. Da die Urbildoperation mit Schnitten und Komplementbildung vertauscht: \ \ πj−1 ( Ea ) = πj−1 (Ea ), πj−1 (Mj \ E) = M \ πj−1 (E), a∈A
a∈A
ist M0j ⊆ P(Mj ) eine σ-Algebra, die Ej also auch σ(Ej ) enth¨alt. Wenn jetzt Ej ∈ σ(Ej ), dann gilt πj−1 (Ej ) ∈ M, also n \ πj−1 (Ej ) ∈ M, E1 × . . . × En = j=1
was wiederum
Nn j=1
σ(Ej ) ⊆ M impliziert.
Ein metrischer Raum (M, ρ) heißt separabel, wenn er eine abz¨ahlbare Teilmenge Q ⊆ M enth¨ alt, die einen nichtleeren Schnitt mit jeder nichtleeren, offenen Teilmenge von M hat: ∀ ∅ 6= U ⊆ M offen :
Q ∩ U 6= ∅.
(17.2)
Als Beispiel betrachte Rk und darin die abz¨ahlbare Teilmenge Qk , die jede ²-Kugel, also auch jede nichtleere, offene Menge schneidet. Man nennt Teilmengen Q eines topologischen Raumes M , die (17.2) erf¨ ullen, dicht. Proposition 17.1.5 : Seien M1 , . . . , Mn separable metrische R¨ aume und M = M1 × . . . × Mn , versehen mit der Produkttopologie. Dann gilt n O BMj = BM . j=1
Beweis: (k) Idee: W¨ahle jeweils eine dichte Folge {x(k) | k ∈ N} ⊆ Mj und setze Ej := {B(xj ; r) | k ∈ N, 0 < j (k ) (k ) r ∈ Q}. Dann findet man BMj = σ(Ej ), und weil {(x1 1 , . . . , xn n ) | kj ∈ N, j = 1, . . . , n} abz¨ ahlbar und dicht in M ist, ergibt sich auch BM = σ({E1 × . . . × En | Ej ∈ Ej }). Jetzt folgt die Behauptung
mit Proposition 17.1.4. (k)
Seien {xj
| k ∈ N} ⊆ Mj abz¨ahlbare, dichte Mengen in Mj f¨ ur j = 1, . . . , n und (k)
Ej := {B(xj ; r) | k ∈ N, 0 < r ∈ Q}. Behauptung: BMj = σ(Ej ). Wenn n¨amlich U ⊆ Mj offen ist und x ∈ U , dann gibt es ein ² > 0 mit B(x; ²) ⊆ U und ein (k) k ∈ N mit xj ∈ B(x; 4² ). F¨ ur r ∈ Q mit 4² < r < 2² gilt dann (k)
x ∈ B(xj ; r) ⊆ B(x; ²) ⊆ U. Damit sehen wir aber, daß jede offene Menge in Mj eine (automatisch abz¨ahlbare) Vereinigung von Elementen von Ej sein muß. Analog finden wir auch BM = σ({E1 × . . . × En | Ej ∈ Ej }), weil die Menge (k1 )
{(x1
n) , . . . , x(k ) | kj ∈ N, j = 1, . . . , n} n
322
KAPITEL 17. MESSBARE MENGEN UND FUNKTIONEN abz¨ahlbar und dicht in M ist. Zusammen mit Proposition 17.1.4 erhalten wir BM =
n O
n O
σ(Ej ) =
j=1
BMj .
j=1
Das folgende Lemma erleichtert die Identifizierung der von einer Algebra erzeugten σ-Algebra. Lemma 17.1.6 : Seien M eine nichtleere Menge und A ⊆ P(M ) eine Algebra. Weiter sei C die kleinste Familie von Mengen, die A enth¨ alt und folgende Eigenschaften hat: S∞ (a) F¨ ur E1 ⊆ E2 ⊆ . . . mit Ej ∈ C gilt j=1 Ej ∈ C. T∞ (b) F¨ ur E1 ⊇ E2 ⊇ . . . mit Ej ∈ C gilt j=1 Ej ∈ C. Dann haben wir C = σ(A). Beweis: Idee: Zun¨achst verifiziert man, daß es so ein kleinstes Mengensystem gibt (alle schneiden!). Dann setzt man f¨ ur E ∈ C C(E) := {F ∈ C | E \ F, F \ E, E ∩ F ∈ C} und beweist mit der Minimalit¨ at von C, daß C(E) ⊇ C gilt. Weiter folgert man, daß C eine Algebra ist. Wegen (a) ist C dann sogar eine σ-Algebra.
Indem man alle Mengensysteme, die A enthalten und sowohl (a) als auch (b) erf¨ ullen, schneidet, sieht man, daß es in der Tat ein kleinstes solches Mengensystem gibt. Die Inklusion C ⊆ σ(A) ist klar. F¨ ur die Umkehrung definiert man zu E ∈ C das Mengensystem C(E) := {F ∈ C | E \ F, F \ E, E ∩ F ∈ C}. Dann erf¨ ullt C(E) die Bedingungen (a) und (b) mit C(E) statt C. Wenn E ∈ A, dann gilt außerdem A ⊆ C(E). Wegen der Minimalit¨at von C haben wir dann also C ⊆ C(E). Nun gilt aber nach der Definition f¨ ur alle E, F ∈ C F ∈ C(E)
⇔
E ∈ C(F ).
Das bedeutet, wir haben ∀E ∈ A, F ∈ C :
E ∈ C(F ).
Wieder mit der Minimalit¨at von C folgern wir C ⊆ C(F ). Insbesondere bedeutet dies, daß ∀E, F ∈ C :
E ∩ F, E \ F, F \ E ∈ C,
d.h., C ist eine Algebra. Wenn Ej ∈ C f¨ ur j ∈ N, dann betrachten wir Fn := ∞ [ j=1
Ej =
∞ [
Sn j=1
Ej ∈ C und schließen mit (a)
Fn ∈ C.
n=1
Also ist C eine σ-Algebra, und das beweist die Behauptung.
17.1. MESSBARE MENGEN
323
¨ Ubung 17.1.1 : Seien (M1 , M1 ), . . . , (Mn , Mn ) meßbare R¨ aume. Eine Teilmenge E ⊆ M1 × . . . × Mn heißt ein meßbarer Quader, wenn sie von der Form E = A1 × . . . × An mit Ai ∈ Mi f¨ ur i = 1, . . . , n ist. Sei A die Menge aller endlichen Vereinigungen von meßbaren Quadern. Zeige: (i) A ist die kleinste Algebra in M1 ⊗ . . . ⊗ Mn , die alle meßbaren Quader enth¨ alt. (ii) Jedes Element von A l¨ aßt sich als disjunkte Vereinigung endlich vieler meßbarer Quader schreiben.
¨ Ubung 17.1.2 : Die Borel-σ-Algebra BR wird von jedem der folgenden Mengensysteme erzeugt: (a) E1 = {]a, b[| a < b}, (b) E2 = {[a, b] | a < b}, (c) E3 = {]a, b] | a < b}, (d) E4 = {[a, b[| a < b}, (e) E5 = {]a, ∞[| a ∈ R}, (f) E6 = {]− ∞, b[| b ∈ R}, (g) E7 = {[a, ∞[| a ∈ R}, (h) E8 = {]− ∞, b] | b ∈ R}.
¨ Ubung 17.1.3 : Seien M eine nichtleere Menge und E ⊆ P(M ) eine beliebige, nichtleere Teilmenge der Potenzmenge von M . Zeige, daß σ(E) tats¨ achlich eine σ-Algebra ist. ¨ Ubung 17.1.4 : Sei M eine u ahlbare Menge. Setze ¨berabz¨
M := {E ⊆ M | E oder M \ E ist h¨ochstens abz¨ahlbar}. Zeige, daß M eine σ-Algebra auf M ist. ¨ Ubung 17.1.5 : F¨ ur jede nat¨ urliche Zahl n ∈ N bezeichne Mn die vom System
En := {{1}, {2}, . . . , {n}} auf N erzeugte σ-Algebra. Zeige, daß Mn aus allen Mengen A ⊆ N besteht, welche entweder A ⊆ S {1, . . . , n} oder m ∈ A f¨ ur alle m ≥ n + 1 erf¨ ullen. Offenbar gilt Mn ⊆ Mn+1 f¨ ur alle n ∈ N. Warum ist dennoch ∞ n=1 Mn keine σ-Algebra auf N? ¨ Ubung 17.1.6 : Seien M eine σ-Algebra auf einer nichtleeren Menge M und N ∈ M. Zeige, daß
MN := {N ∩ A : A ∈ M} eine σ-Algebra auf N ist. Man nennt MN die Spur-σ-Algebra auf N . ¨ Ubung 17.1.7 : Seien (M, M) ein meßbarer Raum, (X, T ) ein topologischer Raum und f : M → X eine Abbildung. Zeige, daß das System aller Teilmengen E ⊆ X mit f −1 (E) ∈ M eine σ-Algebra auf X ist. ¨ aquivalent sind. Ubung 17.1.8 : Sei (M, ρ) ein metrischer Raum und D ⊆ M . Zeige, daß folgende Aussagen ¨ (i) D ist dicht. (ii) D = M . (iii) F¨ ur alle x ∈ M und f¨ ur alle ² > 0 existiert ein y ∈ D mit ρ(x, y) < ².
324
KAPITEL 17. MESSBARE MENGEN UND FUNKTIONEN
17.2
Meßbare Funktionen
Seien (M, M) und (N, N) meßbare R¨aume und f : M → N eine Abbildung. Dann heißt f (M, N)meßbar, wenn ∀A ∈ N : f −1 (A) ∈ M, (17.3) d.h., wenn Urbilder meßbarer Mengen wieder meßbar sind. Wir lassen den Zusatz (M, N)- weg, wenn klar ist, welche σ-Algebren gemeint sind. Wenn die σ-Algebra N von dem Mengensystem E ⊆ P(N ) erzeugt wird, dann k¨ onnen wir (17.3) auch durch f −1 (N ) ∈ M
∀N ∈ E : ersetzen.
Beispiel 17.2.1 : Seien (M, U) und (N, V) topologische R¨aume und f : M → N stetig. Da Urbilder offener Mengen unter f offen sind, ist die Abbildung (BM , BN )-meßbar.
Bemerkung 17.2.2 : Seien (M, M), (N, N) und (L, L) meßbare R¨aume sowie f : M → N und g : N → L meßbare Abbildungen. Dann ist auch g ◦ f : M → L meßbar: ¡ ¢ ∀E ∈ L : (g ◦ f )−1 (E) = f −1 g −1 (E) ∈ M.
Proposition 17.2.3 : Seien (M, M) ein meßbarer Raum und f, g : M → C meßbare, d.h. (M, BC )meßbare Abbildungen. Dann sind auch f + g und f g meßbar. Beweis: Idee: Verkn¨upfe die meßbare Abbildung h : M → C2 , x 7→ (f (x), g(x)) mit der Addition bzw. der Multiplikation auf C (beides stetig, also meßbar).
Betrachte die Abbildung h : M → C2 ,
x 7→ (f (x), g(x)).
Die Borel-σ-Algebra BC2 von C2 wird von den Mengen der Form U × U 0 mit U, U 0 ⊆ C offen, erzeugt. Wegen h−1 (U × U 0 ) = f −1 (U ) ∩ g −1 (U 0 ) ist also h meßbar. Weil aber f + g und f g durch Verkn¨ upfung von h mit den stetigen, also meßbaren Abbildungen C × C → C, (z, w) 7→ z + w und C × C → C,
(z, w) 7→ zw
entstehen, folgt die Behauptung aus Bemerkung 17.2.2.
Die n¨achste Proposition wird bei der Konstruktion von Maßen auf Rn = R × . . . × R n¨ utzlich sein. Proposition 17.2.4 : Seien (M, M), (N, N) und (L, L) meßbare R¨ aume.
17.2. MESSBARE FUNKTIONEN
325
(i) Wenn E ∈ M ⊗ N, dann gilt Ex Ey
:= {y ∈ N | (x, y) ∈ E} ∈ N, := {x ∈ M | (x, y) ∈ E} ∈ M. y
E
E Ex
y
x Ey
Ey
x
(ii) Wenn f : M × N → L meßbar ist, dann sind auch die Abbildungen fx : N → L, f y : M → L,
y 7→ f (x, y), x 7→ f (x, y)
f¨ ur alle x ∈ M und y ∈ N meßbar.
Beweis: Idee: Zeige, daß {E ∈ M ⊗ N | (∀x ∈ M, y ∈ N ) Ex ∈ N, E y ∈ M} eine σ-Algebra ist, die alle meßbaren Quader A × B ∈ M ⊗ N enth¨ alt. Betrachte das Mengensystem C := {E ∈ M ⊗ N | (∀x ∈ M, y ∈ N ) Ex ∈ N, E y ∈ M}. Dann gilt ∀A ∈ M, B ∈ N :
A × B ∈ C.
Außerdem verifiziert man f¨ ur E, E1 , E2 , . . . ∈ C und x ∈ M, y ∈ N sofort ∞ ³[ j=1 ∞ ³[
´ Ej Ej
x
´y
j=1
= =
∞ [
(Ej )x ,
j=1 ∞ [
(Ej )y ,
j=1 y
M \ Ey
= ((M × N ) \ E) ,
N \ Ex
= ((M × N ) \ E)x .
Also ist C eine σ-Algebra, die alle meßbaren Quader A × B mit A ∈ M und B ∈ N enth¨alt. Daraus folgt aber M ⊗ N ⊆ C und somit (i). Um (ii) zu beweisen, m¨ ussen wir nur noch feststellen, daß f¨ ur C ∈ L gilt ¡ ¢ ¡ ¢y fx−1 (C) = f −1 (C) x und (f y )−1 (C) = f −1 (C) .
326
KAPITEL 17. MESSBARE MENGEN UND FUNKTIONEN
Beispiel 17.2.5 : Seien (M, M) ein meßbarer Raum und E ⊆ M eine meßbare Menge. Dann ist die durch ( 1 f¨ ur m ∈ E χE (m) := 0 f¨ ur m 6∈ E definierte charakteristische Funktion χE : M → R M E −1 χE (]a, b[) = M \E ∅
meßbar, weil falls a < 0 < 1 < b, falls 0 ≤ a < 1 < b, falls a < 0 < b ≤ 1, sonst.
Also sind auch endliche (komplexe) Linearkombinationen von charakteristischen Funktionen meßbarer Mengen meßbar. Solche Funktionen nennen wir einfache Funktionen. Die einfachen Funktionen M → C lassen sich charakterisieren als diejenigen meßbaren Funktionen, die nur endlich viele Werte annehmen: Wenn n¨amlich f (M ) = {z1 , . . . , zn }, dann ist jedes Ej := f −1 (zj ) f¨ ur j = 1, . . . , n meßbar, und es gilt f=
n X
zj χEj .
j=1
Diese Zerlegung von f als Linearkombination von charakteristischen Funktionen nennt man die Standardzerlegung von f . Sie erf¨ ullt insbesondere Ei ∩ Ej = ∅ f¨ ur i 6= j. Um sich l¨astige Fallunterscheidungen in den Betrachtungen reellwertiger meßbarer Funktionen zu ersparen, erg¨ anzen wir die Menge R um zwei Punkte, die die Rolle von plus und minus Unendlich“ ” spielen sollen: [−∞, ∞] := {−∞} ∪ R ∪ {∞}. Hier sind −∞ und ∞ einfach Symbole. Wir erg¨anzen die Ordnung auf R durch ∀r ∈ R :
−∞ < r < ∞
und erhalten so eine Ordnung auf [−∞, ∞]. Mit dieser Ordnung kann man Begriffe wie untere und obere Schranke sowie Supremum und Infimum leicht auf Teilmengen von [−∞, ∞] u ¨bertragen. Der einzige Unterschied zum Fall R ist, daß auch in R unbeschr¨ankte Mengen in [−∞, ∞] ein Supremum haben. Analog erh¨alt man auch den Limes superior und den Limes inferior f¨ ur Folgen in [−∞, ∞]. Addition und Multiplikation lassen sich nicht in vern¨ unftiger Weise auf ganz [−∞, ∞] fortsetzen. Wir setzen jedoch x + y f¨ ur x, y ∈ R, ∞ f¨ ur x ∈ ]− ∞, ∞] und y = ∞, x + y := ∞ f¨ ur x = ∞ und y ∈ ]− ∞, ∞], −∞ f¨ ur x ∈ [−∞, ∞[ und y = −∞, −∞ f¨ ur x = −∞ und y ∈ [−∞, ∞[, wobei [−∞, ∞[ := {−∞} ∪ R und ] − ∞, ∞] := R ∪ {∞}. Wenn insbesondere [0, ∞] := [0, ∞[ ∪{∞}, dann definiert dies eine Addition auf [0, ∞]. Analog setzt man xy f¨ ur x, y ∈ R, ±∞ f¨ u r x ∈ ]0, ∞] und y = ±∞, xy := ±∞ f¨ ur x = ±∞ und y ∈ ]0, ∞], ∓∞ f¨ ur x ∈ [−∞, 0[ und y = ±∞, ∓∞ f¨ ur x = ±∞ und y ∈ [−∞, 0[.
17.2. MESSBARE FUNKTIONEN
327
Bemerkung 17.2.6 : Setze B[−∞,∞] := {E ⊆ [−∞, ∞] | E ∩ R ∈ BR } ⊆ P([−∞, ∞]) . Dann sieht man leicht, daß B[−∞,∞] eine σ-Algebra ist, die von den Halbstrahlen ]a, ∞] := ]a, ∞[ ∪ {∞} mit a ∈ R erzeugt wird. Sei jetzt (M, M) ein meßbarer Raum, und seien f, g : M → [−∞, ∞] meßbare Abbildungen. Wenn f + g : M → [−∞, ∞] definiert ist, d.h., wenn f (x) + g(x) f¨ ur jedes x ∈ M definiert ist, dann ist f + g auch meßbar: (f + g)−1 (]a, ∞])
= (f + g)−1 (]a, ∞[) ∪ (f + g)−1 ({∞}) = (f + g)−1 (]a, ∞[) ∪ g −1 ({∞}) ∪ f −1 ({∞})
und (f +g)−1 (]a, ∞[) ist meßbar, weil es mit h−1 (]a, ∞[) zusammenf¨allt, wobei h die Summe der meßbaren Funktionen f |M 0 , g|M 0 : M 0 → R mit M 0 = f −1 (R) ∩ g −1 (R) ist.
Proposition 17.2.7 : Seien (M, M) ein meßbarer Raum und (fn )n∈N eine Folge meßbarer Funktionen fn : M → [−∞, ∞]. Dann gilt: (i) sup fn : M → [−∞, ∞] ist meßbar. (ii) inf fn : M → [−∞, ∞] ist meßbar. (iii) lim sup fn : M → [−∞, ∞] ist meßbar. (iv) lim inf fn : M → [−∞, ∞] ist meßbar. (v) Wenn der punktweise Limes f = lim fn : M → [−∞, ∞] existiert, dann ist er meßbar. Beweis: Idee: (i) folgt aus (sup fn )−1 (]a, ∞]) =
S∞ n=1
fn−1 (]a, ∞]), der Rest dann aus (i).
=
{m ∈ M | sup fn (m) > a}
=
{m ∈ M | ∃n mit fn (m) > a} ∞ [ fn−1 (]a, ∞]).
Beachte, daß (sup fn )−1 (]a, ∞])
=
n
n=1
Dies zeigt (i). Der zweite Teil folgt mit (i) und inf fn = − sup(−fn ). Die Teile (iii) und (iv) folgen jetzt, weil Limes superior und Limes inferior durch sukzessives Bilden von Suprema und Infima entstehen. Der letzte Teil ist dann wegen lim fn = lim sup fn f¨ ur konvergente Folgen klar.
Mit Proposition 17.2.7 k¨onnen wir zu einer meßbaren Funktion f : M → [−∞, ∞] den positiven Teil f + := max(f, 0) und den negativen Teil f − := − min(f, 0) definieren, die beide wieder meßbar sind. ¨ Ubung 17.2.1 : Seien (M, M) ein meßbarer Raum und f, g : M → [−∞, ∞] meßbar. Zeige, daß dann auch die folgenden Funktionen meßbar sind. (i) max{f, g},
(ii) min{f, g},
(iii) f + ,
(iv) f − .
328
KAPITEL 17. MESSBARE MENGEN UND FUNKTIONEN
¨ Ubung 17.2.2 : Seien (an )n∈N und (bn )n∈N Folgen in [−∞, ∞]. Zeige: (i) lim supn→∞ (−an ) = − lim inf n→∞ an , (ii) Aus an ≤ bn f¨ ur alle n ∈ N folgt lim inf n→∞ an ≤ lim inf n→∞ bn .
¨ Ubung 17.2.3 : Seien M eine σ-Algebra auf M und fn : M → R eine Folge meßbarer Funktionen. Zeige, daß die Menge A := {x ∈ M | ∃ lim fn (x)} n→∞
eine meßbare Teilmenge von M ist. ¨ Ubung 17.2.4 : Sei M eine σ-Algebra auf M , und sei f : M → C eine meßbare Funktion. Zeige, daß es eine meßbare Funktion α : M → C gibt mit |α| = 1 und f = α|f |. ¨ Ubung 17.2.5 : Sei R das System aller Teilmengen von R, die sich als endliche Vereinigung von Intervallen schreiben lassen. Eine Abbildung µ : R → [0, ∞] heißt additiv, wenn f¨ ur disjunkte Mengen E1 , . . . , En ∈ R gilt µ(E1 ∪ . . . ∪ En ) = µ(E1 ) + . . . + µ(En ), sie ist σ-additiv, wenn f¨ ur disjunkte Mengen E1 , E2 , . . . ∈ R gilt Ã∞ ! ∞ [ X µ Ej = µ(Ej ), j=1
j=1
ferner wird sie endlich genannt, wenn µ(A) < ∞ f¨ ur alle A ∈ R ist. Zeige, daß die Abbildung µ : R → [0, ∞] mit ½ 1 falls es ein ² > 0 gibt mit ]0, ²[ ⊆ A, µ(A) := 0 sonst additiv und endlich, aber nicht σ-additiv ist. ¨ Ubung 17.2.6 : Sei M eine nichtleere Menge. Ein Dynkin-System u ¨ber M ist ein nichtleeres System D von Teilmengen von M mit (a) M ∈ D, (b) A, B ∈ D, A ⊆ B ⇒ B \ A ∈ D, S (c) An ∈ D disjunkt ⇒ ∞ n=1 An ∈ D. Zeige: (i) Jede σ-Algebra ist ein Dynkin-System. (ii) Sei R ⊆ P(M ). Dann existiert ein kleinstes Dynkin-System, das R umfaßt. (iii) Ein Dynkin-System D ist genau dann eine σ-Algebra, wenn es schnittstabil ist, d.h., wenn aus A, B ∈ D folgt, daß A ∩ B ∈ D ist.
Kapitel 18
Maß und Integral In diesem Kapitel f¨ uhren wir den Begriff des Maßes auf beliebigen, meßbaren R¨ aumen und den zugeh¨ origen Integralbegriff ein. Zentrale Ergebnisse sind die Analoga der schon f¨ ur die reelle Gerade bewiesenen, fundamentalen Konvergenzs¨ atze. Dar¨ uber hinaus zeigen wir, wie man Maße und Integrale auf Produktr¨ aumen konstruiert. Das entscheidende Ergebnis in diesem Kontext ist der Satz von Fubini, der besagt, daß Integrale auf Produktr¨ aumen durch iteriertes Integrieren berechnet werden k¨ onnen und die Reihenfolge dabei keine Rolle spielt.
18.1
Maße
Sei (M, M) ein meßbarer Raum. Eine Abbildung µ : M → [0, ∞] heißt ein Maß auf (M, M), wenn µ(∅) = 0 ist und f¨ ur jede disjunkte, abz¨ahlbare Familie E1 , E2 , . . . von meßbaren Mengen gilt ∞ ∞ [ X µ( Ej ) = µ(Ej ). j=1
j=1
P∞
Hier ist j=1 µ(Ej ) als der Grenzwert der entsprechenden Reihe zu lesen, wenn alle µ(Ej ) endlich (d.h. P∞ in [0, ∞[) sind und die Reihe konvergiert; falls dem nicht so ist, setzt man j=1 µ(Ej ) := ∞. Das Tripel (M, M, S µ) heißt ein Maßraum. Ein Maß µ heißt endlich, wenn µ(M ) ∈ [0, ∞[ , und σ-endlich, wenn M = k∈N Ek mit µ(Ek ) < ∞. Beachte, daß aus E ⊆ E 0 wegen µ(E 0 ) = µ(E 0 \ E) + µ(E) sofort folgt µ(E) ≤ µ(E 0 ). Insbesondere nimmt ein endliches Maß nur endliche Werte an.
Beispiel 18.1.1 : Sei M 6= ∅ eine beliebige Menge. (i) Sei M = P(M ) 3 E. Dann definiert µ(E) := Z¨ ahlmaß.
P x∈E
f (x) mit f : M → {1}, x 7→ 1 ein Maß, das
(ii) Sei M = P(M ) und x0 ∈ M . Dann definiert ½ µ(E) :=
1 0
ein Maß, das Dirac- oder Punktmaß in x0 ∈ M . 329
f¨ ur x0 ∈ E sonst
330
KAPITEL 18. MASS UND INTEGRAL M E1 xo
E2
Beispiel 18.1.2 : Betrachte den meßbaren Raum (R, BR ). Dann ist f¨ ur jedes A ∈ BR die charakteristische Funktion χA lokal integrierbar im Sinne der Integrationstheorie einer Variablen und durch Z 1 λ (A) := χA wird ein Maßraum (R, BR , λ1 ) definiert. Das so definierte Maß λ1 nennt man Lebesgue-Maß auf R. Bei der Konstruktion von Maßen ist es in der Sn Regel nicht Pnso schwer, eine passende Algebra A ⊆ P(M ) ¨ zu finden, auf der die endliche Additivit¨at µ( j=1 Ej ) = j=1 µ(Ej ) gilt. Dagegen ist der Ubergang zu der von A erzeugten σ-Algebra oft schwierig. Umso angenehmer ist der folgende Satz, der zeigt, daß es nur eine gute“ Fortsetzung einer endlich additiven Funktion µ : A → [0, ∞] zu einem Maß auf (M, σ(A)) ” geben kann. Satz 18.1.3 : Seien M eine nichtleere Menge, A ⊆ P(M ) eine Algebra und M := σ(A). Weiter sei µ ein Maß auf (M, M) mit ∃A1 , A2 , . . . ∈ A :
∞ [
Aj = M und (∀j ∈ N : µ(Aj ) < ∞).
j=1
Wenn ν ein Maß auf (M, M) ist, das auf A mit µ u ¨bereinstimmt, dann gilt µ = ν. Beweis: Idee: F¨ur endliches µ betrachte C := {E ∈ M | µ(E) = ν(E)} und zeige, daß C die Bedingungen (a) und (b) aus Lemma 17.1.6 erf¨ ullt. Mit dem Lemma folgt dann C = M, d.h., die Behauptung. F¨ ur σ-endliche Maße schneide alle Mengen mit einer Familie von Mengen endlichen Maßes.
Spezialfall: µ(M ) < ∞. Wir setzen C := {E ∈ M | µ(E) = ν(E)} ⊆ M. Beachte, daß wegen µ(F \ E) = µ(F ) − µ(E) f¨ ur meßbare Mengen E ⊆ F und der analogen Aussage f¨ ur ν gilt E ∈C ⇒ F \E ∈C sofern F ∈ C. Dann erf¨ ullt C die Bedingungen (a) und (b) aus Lemma 17.1.6: Wenn E1 ⊆ E2 ⊆ . . . mit Ej ∈ C, setze C1 := E1 ,
C2 := E2 \ E1 ,
C3 := E3 \ E2 , . . .
Dann sind die Cj alle disjunkt, und es gilt µ(
∞ [
j=1
Ej ) = µ(
∞ [
j=1
Cj ) =
∞ X j=1
µ(Cj ) =
∞ X j=1
ν(Cj ) = ν(
∞ [
j=1
Cj ) = ν(
∞ [
Ej ).
j=1
S∞ Also ist auch j=1 Ej ∈ C, und dies zeigt (a). Bedingung (b) folgt durch Komplementbildung sofort aus (a), da M ∈ A ⊆ C .
18.2. INTEGRALE
331
Wegen A ⊆ C k¨onnen wir Lemma 17.1.6 anwenden und erhalten M = C. Dies beweist den Satz f¨ ur den Spezialfall. Allgemeiner Fall: Wir stellen zun¨ achst fest, daß wir eine disjunkte Familie Aj ∈ A, j ∈ N mit ∞ [ Aj = M und (∀j ∈ N : µ(Aj ) < ∞) j=1
finden k¨onnen: Wenn n¨amlich A0j ∈ A, j ∈ N irgendeine Familie mit ∞ [
A0j = M und (∀j ∈ N : µ(A0j ) < ∞)
j=1
ist, setzt man einfach A00n :=
n [
A0j und An := A00n \ A00n−1 .
j=1
P∞ P∞ Wegen µ(E) = j=1 µ(E ∩ Aj ) und ν(E) = j=1 µ(E ∩ Aj ) f¨ ur E ∈ M gen¨ ugt es also zu zeigen, daß f¨ ur N ∈ A mit µ(N ) < ∞ gilt µ(E ∩ N ) = ν(E ∩ N ). Dazu betrachten wir die Algebra e := {A ∩ N | A ∈ A} ⊆ P(N ), A die die σ-Algebra
f := {E ∩ N | E ∈ M} ⊆ P(N ) M
f die Voraussetzungen des erzeugt. Dann erf¨ ullen die Einschr¨ankungen von µ und ν auf M Spezialfalls, und dieser zeigt dann µ(E ∩ N ) = ν(E ∩ N ).
¨ Ubung 18.1.1 : Sei µ ein Maß auf einer σ-Algebra M. Zeige: (i) Aus An ∈ M, A1 ⊆ A2 ⊆ . . . folgt
à lim µ(An ) = µ
n→∞
[
! An
.
n∈N
(ii) Aus An ∈ M, A1 ⊇ A2 ⊇ . . . und µ(A1 ) < ∞ folgt à lim µ(An ) = µ
n→∞
\
! An
.
n∈N
(iii) Die Voraussetzung µ(A1 ) < ∞ in Teil (ii) ist nicht u ussig. ¨berfl¨ (iv) In (ii) kann die Vorausetzung µ(A1 ) < ∞ weggelassen werden, wenn µ ein σ-endliches Maß ist. (Hierzu ben¨ otigt man den Umordnungssatz).
18.2
Integrale
Sei jetzt (M, M, µ) ein Maßraum. Wir bezeichnen die Menge der meßbaren Funktionen f : M → [0, ∞] mit L+ (M ). Wenn f ∈ L+ (M ) einfach ist und f=
n X j=1
aj χEj
332
KAPITEL 18. MASS UND INTEGRAL
die Standardzerlegung von f ist, dann definieren wir das Integral von f bzgl. µ durch Z f dµ := M
n X
aj µ(Ej ).
j=1
Hier setzen wir 0 · ∞ = 0 und beachten ferner, daß in der obigen Standardzerlegung aj ≥ 0 f¨ ur alle j gilt. F¨ ur A ∈ M setzen wir Z n X f dµ := aj µ(Ej ∩ A). A
j=1
RFalls M und das Maß µ aus dem Kontext klar sind, schreiben wir einfach f dµ. A
R
f f¨ ur
R M
f dµ und
E3 E2
E4 E1 A
Proposition 18.2.1 : Seien (M, M, µ) ein Maßraum und f, g ∈ L+ (M ) einfache Funktionen. R R (i) Wenn c ≥ 0, dann gilt cf = c f . R R R (ii) (f + g) = f + g. R R (iii) Wenn f ≤ g, dann gilt f ≤ g. Beweis: Idee: Betrachte die Standardzerlegungen der einfachen Funktionen. (i) folgt unmittelbar aus den Definitionen. F¨ ur (ii) betrachte die Standardzerlegungen f=
n X
aj χAj ,
und g =
j=1
m X
bk χBk
k=1
von f und g. Zus¨atzlich setzen wir A0 := M \
n [
Aj ,
B0 := M \
j=1
Dann gilt f=
aj χAj ,
und g =
j=0
Aj =
Bk ,
a0 := 0 =: b0 .
k=1
n X
sowie
m [
m X
bk χBk
k=0
m [
(Aj ∩ Bk ) ∀j = 0, 1, . . . , n
k=0
und Bk =
n [
(Aj ∩ Bk )
j=0
∀k = 0, 1, . . . , m.
R A
f f¨ ur
18.2. INTEGRALE
333
Jetzt rechnet man Z Z m n X m n X X X aj µ(Aj ) + bk µ(Bk ) = (aj + bk )µ(Aj ∩ Bk ). f+ g= j=0
j=0 k=0
k=0
Wenn {c1 , . . . , cl } = {aj + bk | j = 0, . . . , n; k = 0, . . . , m} \ {0} und [ Ci := (Aj ∩ Bk ), aj +bk =ci
dann ist f +g =
l X
ci χCi
i=1
die Standardzerlegung von f + g, und (ii) folgt aus Z (f + g) =
l X
ci µ(Ci ) =
i=1
l X
X
(aj + bk )µ(Aj ∩ Bk ).
i=1 aj +bk =ci
Wenn jetzt f ≤ g, dann gilt aj ≤ bk wenn immer Aj ∩ Bk 6= ∅. Also findet man Z f=
n X m X
aj µ(Aj ∩ Bk ) ≤
j=0 k=0
n X m X
Z bk µ(Aj ∩ Bk ) =
g.
j=0 k=0
Proposition 18.2.2 : Seien (M, M, µ) ein Maßraum und f ∈ L+ (M ) eine einfache Funktion. Dann ist die Abbildung Z M → [0, ∞], A 7→ f A
ein Maß. Beweis: R P ur jede disjunkte Familie f = ∞ i=1 Ei f f¨ E1 , E2 , . . . von meßbaren Mengen in M zu zeigen. Daf¨ ur braucht man den Umordnungssatz f¨ ur Reihen.
Idee: Die Arbeit besteht darin, die Gleichheit
R
S∞
i=1
Ei
R Pn aj χEj die Standardzerlegung von f . Wir stellen zun¨achst fest, daß ∅ f = Sei f = j=1 Pn ahlen eine disjunkte, abz¨ahlbare Familie E1 , E2 , . . . von meßbaren j=1 aj µ(∅) = 0 ist und w¨ Mengen in M . Dann gilt Z n ∞ ³ ´ X [ f = a µ A ∩ E j j i S ∞ i=1
Ei
j=1
= = = =
n X j=1 n X
i=1
aj µ
∞ ³[
´ (Aj ∩ Ei )
i=1 ∞ X
aj j=1 i=1 ∞ X n X
µ(Aj ∩ Ei )
aj µ(Aj ∩ Ei )
i=1 j=1 ∞ Z X i=1
Ei
f.
334
KAPITEL 18. MASS UND INTEGRAL Beachte, daß wir hier die Umordnung der Summierung rechtfertigen m¨ ussen: Wenn die Reihen P∞ µ(A ∩ E ) konvergieren, geht das nach dem Umordnungssatz f¨ u r Reihen.Wenn eine der j i i=1 Reihen nicht konvergiert, verifizieren wir direkt, daß beide Seiten ∞ sind.
F¨ ur beliebige f ∈ L+ (M ) und A ∈ M definieren wir jetzt das Integral von f u ¨ber A bzgl. µ durch Z R f dµ := sup{ A φdµ | 0 ≤ φ ≤ f, φ einfach}. A
Es folgt unmittelbar aus Aussagen f¨ ur einfache Funktionen (vgl. Proposition R R den entsprechenden R R 18.2.1), daß A cf dµ = c A f dµ f¨ ur Rf ∈ L+R(M ) und c ≥ 0 sowie A f dµ ≤ A gdµ f¨ ur f, g ∈ L+ (M ) + und f ≤ g. Genauso R sieht man, daß A f−1≤ B f , falls f ∈ L (M ) und A ⊆ B meßbar sind. Außerdem erkennt man, daß A f dµ = 0 ist, falls f (]0, ∞]) ∩ A eine Nullmenge ist. Die Additivit¨at des Integrals ergibt sich nicht automatisch, weil nicht klar ist, ob man jede einfache Funktion φ, die 0 ≤ φ ≤ f + g erf¨ ullt, als Summe φ1 + φ2 mit 0 ≤ φ1 ≤ f und 0 ≤ φ2 ≤ g schreiben kann. Das folgende Lemma wird uns helfen, die Additivit¨at des Integrals zu beweisen. Lemma 18.2.3 : Seien (M, M) ein meßbarer Raum und f : M → [0, ∞] eine meßbare Funktion. Dann gibt es eine Folge (φn )n∈N einfacher Funktionen mit folgenden Eigenschaften: (a) 0 ≤ φ1 ≤ φ2 ≤ . . . ≤ f . (b) (φn )n∈N konvergiert punktweise gegen f . Beweis: Idee: Mit Enk := f −1 (] 2kn , k+1 ]) und Fn := f −1 (]2n , ∞]) f¨ ur n, k ∈ N und 0 ≤ k ≤ 22n − 1 ist die 2n gesuchte Folge durch φn :=
P22n −1 k=0
k χ k 2n En
+ 2n χFn gegeben.
F¨ ur n, k ∈ N mit 0 ≤ k ≤ 22n − 1 setze Enk := f −1 (] und
k k+1 , ]) 2n 2n
Fn := f −1 (]2n , ∞]).
Dann ist φn :=
22n −1 X k=0
k χ k + 2n χFn 2n En
eine einfache Funktion. Jetzt gen¨ ugt es, f¨ ur jedes n ∈ N die folgenden Eigenschaften zu zeigen: (a’) φn ≤ φn+1 , (b’) 0 ≤ f (x) − φn (x) ≤ 2−n f¨ ur jedes x ∈ M mit f (x) ≤ 2n . Daf¨ ur m¨ ussen wir mehrere F¨alle unterscheiden: 2k 2k 1) Wenn x ∈ Enk und f (x) ∈ ] 2n+1 , 2k+1 2n+1 ], dann gilt x ∈ En+1 und
φn (x) =
k 2k = n+1 = φn+1 (x). 2n 2
2k+1 2k+2 2) Wenn x ∈ Enk und f (x) ∈ ] 2k+1 2n+1 , 2n+1 ], dann gilt x ∈ En+1 und
φn (x) =
k 2k + 1 < n+1 = φn+1 (x). 2n 2
18.2. INTEGRALE
335
3) Wenn x ∈ Fn und f (x) ∈ ]2n , 2n+1 ], dann gilt f¨ ur ein 22n+1 ≤ k ≤ 22n+2 − 1, daß k x ∈ En+1 und k φn (x) = 2n ≤ n+1 = φn+1 (x). 2 4) Wenn x ∈ Fn und f (x) ∈ ]2n+1 , ∞[, dann gilt x ∈ Fn+1 und φn (x) = 2n < 2n+1 = φn+1 (x). ¨ Damit haben wir (a’). Die Bedingung (b’ ) folgt analog durch Nachrechnen (Ubung!).
Der n¨achste Satz ist eine Variante des Satzes von der Monotonen Konvergenz und an dieser Stelle der Schl¨ ussel zur Additivit¨at des Integrals. Satz 18.2.4 (Monotone Konvergenz): Seien (M, M, µ) ein Maßraum und (fn )n∈N eine Folge in L+ (M ) mit fn ≤ fn+1 f¨ ur alle n ∈ N. Dann gilt Z Z Z Z lim fn = sup fn = sup fn = lim fn . n→∞
n∈N
n→∞
n∈N
Beweis: R
Idee: Die Ungleichung supn∈N fn ≤
R
f f¨ ur f = supn fn ist unmittelbar einsichtig. F¨ ur die Umkehrung betrachte En = {x ∈ M | fn (x) ≥ tφ(x)}, wobei 0 < t < 1 fest gew¨ ahlt ist, und schließe R R R R ¨ mit Proposition 18.2.2 (und Ubung 18.1.1), daß φ = supn∈N En φ gilt. Es folgt t φ ≤ supn∈N fn und damit die Behauptung mit t → 1.
R Wegen der Monotonie von (fn )n∈N und ( fn )n∈N sind gleich den Limiten. Setze R die Suprema R f := supn∈N fn ∈ L+ (M ). Dann zeigt fn ≤ f sofort fn ≤ f und somit Z Z sup fn ≤ f. n∈N
Um auch die Umkehrung zu zeigen, w¨ahle ein t ∈ ]0, 1[. Wenn jetzt φ eine einfache Funktion mit 0 ≤ φ ≤ f ist, betrachte En := {x ∈ M | fn (x) ≥ tφ(x)}. Da fn und φ meßbar sind, ist auch En meßbar. Sei x ∈ M beliebig mit f (x) > 0, dann gilt wegen φ(x) ≤ f (x) und φ(x) < ∞, daß tφ(x) < f (x). Also finden wir ein n ∈ N mit fn (x) ≥ tφ(x). Also gilt [ En = M. n∈N
¨ Wegen En ⊆ En+1 folgt mit Proposition 18.2.2 und Ubung 18.1.1 Z Z φ = sup φ, n∈N
und wir k¨onnen rechnen t
En
fn ≤ sup
tφ ≤ sup
φ = sup n∈N
En
n∈N
Weil t ∈]0, 1[ beliebig war, erhalten wir Z
En
Z fn
φ ≤ sup n∈N
und schließlich
Z
Z
Z
Z
Z
Z f ≤ sup n∈N
fn .
n∈N
fn .
336
KAPITEL 18. MASS UND INTEGRAL
+ Korollar Pn 18.2.5 : Seien (M, M, µ) ein Maßraum und (fn )n∈N eine Folge in L (M ). Wir setzen f := sup{ j=1 fj | n ∈ N}. Dann gilt Z ∞ Z X fj . f= j=1
Beweis: R
R h+ g f¨ ur h, g ∈ L+ (M ) zu zeigen. Mit Induktion u ¨ber die Anzahl der Summanden und dann erneut Satz 18.2.4 folgt schließlich die Behauptung.
Idee: Ben¨utze zun¨achst Proposition 18.2.1 und Satz 18.2.4, um (h+g) =
R
Wir zeigen zun¨achst, daß f¨ ur h, g ∈ L+ (M ) gilt Z Z Z (h + g) = h + g. Dazu seien zu h und g Folgen (φn )n∈N und (ψn )n∈N einfacher Funktionen wie in Lemma 18.2.3 gew¨ahlt. Dann ist (φn + ψn )n∈N eine monoton steigende Folge einfacher Funktionen mit supn∈N (φn + ψn ) = h + g und Satz 18.2.4 liefert zusammen mit Proposition 18.2.1 Z Z Z Z Z Z Z Z (h+g) = lim (φn +ψn ) = lim ( φn + ψn ) = ( lim φn )+( lim ψn ) = h + g. n→∞
n→∞
Mit Induktion folgt jetzt sofort
n→∞
Z X n
fj =
n Z X
j=1
Die Funktionen gn := 18.2.4 schließen wir
Pn j=1
n→∞
fj .
j=1
fj konvergieren punktweise monoton gegen f und erneut mit Satz
Z
Z f = lim
n→∞
gn = lim
n→∞
n Z X j=1
fj =
∞ Z X
fj .
j=1
Seien (M, M, µ) wie zuvor ein Maßraum und f : M → [−∞, ∞] eine meßbare Funktion sowie f = fR + − f − die Zerlegung von f in ihren positiven und ihren negativen Teil. Wenn eines der beiden Integrale f ± endlich ist, dann definieren wir Z Z Z f dµ := f + dµ − f − dµ (18.1) R R R und nennen f dµ das Integral von f . Wenn sowohl f + dµ als auch f − dµ endlich sind, nennen wir f µ-integrierbar. Wenn aus dem Kontext klar ist, welches Maß gemeint ist, lassen wir das µ weg. Eine meßbare Funktion fR: M → C heißt integrierbar, wenn Re f : M → R und Im f : M → R integrierbar sind. Das Integral f ist dann durch Z Z Z f := Re f + i Im f definiert. F¨ ur K gleich R oder C sei L1 (M, µ, K) oder (wenn das Maß aus dem Kontext klar ist) L1 (M, K) die Menge der integrierbaren Funktionen f : M → K. Statt L1 (M, C) schreibt man oft nur L1 (M ).
18.2. INTEGRALE
337
Satz 18.2.6 : Seien (M, M, µ) ein Maßraum und f : M → [−∞, ∞] meßbar, dann sind folgende Aussagen ¨ aquivalent: (1) f ist µ-integrierbar. (2) f + und f − sind µ-integrierbar. (3) Es gibt eine µ-integrierbare Funktion g mit |f | ≤ g. (4) |f | ist µ–integrierbar. Beweis: (1)⇔(2)“: Dies folgt unmittelbar aus den Definition der Integrierbarkeit. ” (2)⇒(3)“: Sind f + und f − µ-integrierbar, dann sind f + , f − und g = |f | = f + + f − meßbar (vgl. ” Bemerkung 17.2.6) und nach Korollar 18.2.5 gilt Z Z Z Z g dµ = (f + + f − ) dµ = f + dµ + f − dµ < ∞. Somit ist auch g µ-integrierbar und wegen |f | = g = f + + f − folgt die Behauptung. (3)⇒(4)“: Existiert eine µ-integrierbare Funktion g mit |f | ≤ g, so gilt, wieder mit Korollar 18.2.5, ” aufgrund von g = |f | + (g − |f |): Z Z |f | dµ ≤ g dµ. Die Behauptung folgt nun aus der Annahme, daß +
R
g dµ < ∞.
−
(4)⇒(2)“: Sei nun |f | µ-integrierbar. Es gilt: f ≤ |f | und f ≤ |f |. Außerdem sind f + , f − und ” |f | meßbar und nichtnegativ. Damit wird Z Z Z Z f + dµ ≤ |f | dµ < ∞ und f − dµ ≤ |f | dµ < ∞.
Proposition 18.2.7 : L1 (M, K) ist ein K-Vektorraum, und die Abbildung Z Z : L1 (M, K) → K, f 7→ f ist K-linear, bildet nichtnegative Funktionen auf nichtnegative Zahlen ab und erf¨ ullt die Ungleichung Z Z ¯ ¯ ¯ ¯ f¯ ≤ |f |. ¯ M
M
Beweis: Idee: Zerlege erst in Real- und Imagin¨arteil, dann in positiven und negativen Teil. Wir zeigen zun¨achst die Linearit¨at. Dabei behandeln wir nur den Fall K = R. Der Fall K = C ¨ sei dem Leser als (einfache) Ubung u ¨berlassen. Seien also f, h ∈ L1 (M, R) und r ∈ R. Es gen¨ ugt jetzt zu zeigen, daß f + h, rf ∈ L1 (M, R) und Z Z Z Z Z (f + h) = f + h, rf = r f.
338
KAPITEL 18. MASS UND INTEGRAL Die Funktionen f + h und (vgl. Bemerkung 17.2.6). Wenn r ≥ 0, dann gilt R f sind meßbar R rf ± = (rf )± , also sind (rf )± = r f ± endlich (vgl. Proposition 18.2.1). Dies zeigt, daß rf integrierbar ist mit Z Z Z Z Z Z + − + − rf = rf − rf = r f − r f = r f. Der Fall r < 0 liefert (rf )± = −rf ∓ und geht ansonsten analog. Zun¨achst gilt wegen Korollar 18.2.5 Z
Z f−
Z h=
Z 0
f −
h0
f¨ ur alle f, f 0 , h, h0 ∈ L+ (M ) mit f − h = f 0 − h0 , falls die betrachteten Integrale endlich sind. Wegen Satz 18.2.6 und der Dreiecksungleichung folgt die Integrierbarkeit von f +h, und somit gilt mit obigem Z Z Z + (f + h) = (f + h) − (f + h)− Z Z = (f + + h+ ) − (f − + h− ) Z Z Z Z + − + = f − f + h − h− Z Z = f + h. Damit ist die Linearit¨at des Integrals gezeigt. Die R Positivit¨at ist nach Definition unmittelbar klar, und f¨ ur die letzte Behauptung setzen wir M f = reiγ mit r ≥ 0 und γ ∈ [0, 2π[. Dann rechnen wir nach: Z Z Z Z Z Z ¯ ¯ ¯ f ¯ = e−iγ f= e−iγ f = Re(e−iγ f ) ≤ |e−iγ f | = |f |, M
weil
R
M
M
M
M
M
Im(e−iγ f ) = 0 ist.
¨ Ubung 18.2.1 : Sei (M, M, µ) ein Maßraum, und sei M∗ die Familie aller E ⊆ M , f¨ ur die es A, B ∈ M gibt mit A ⊆ E ⊆ B und µ(B \ A) = 0. F¨ ur E ∈ M∗ definiere µ∗ (E) := µ(A). Zeige: (i) M∗ ist eine σ-Algebra, die M enth¨ alt, (ii) µ∗ ist wohldefiniert, (iii) µ∗ ist ein Maß auf M , (iii) µ∗ ist eine Fortsetzung von µ, d.h. µ∗ (E) = µ(E) f¨ ur alle E ∈ M. Man nennt den Maßraum (M, M∗ , µ∗ ) die Vervollst¨ andigung von (M, M, µ). ¨ Ubung 18.2.2 : Seien (M, M, µ) ein Maßraum und (M, M∗ , µ∗ ) seine Vervollst¨ andigung. (i) Beweise, daß eine Funktion f : M → [−∞, ∞] genau dann M∗ -meßbar ist, wenn es M-meßbare Funktionen f1 , f2 : M → [−∞, ∞] gibt, mit f1 ≤ f ≤ f2 und f1 = f2 µ-fast u ¨berall gilt (d.h. µ({x ∈ M | f1 (x) 6= f2 (x)}) = 0). (ii) Sei f : M → R eine M∗ -meßbare Funktion. Zeige, daß die Funktionen f1 , f2 aus Teil (i) i.a. nicht u ¨berall endlich gew¨ ahlt werden k¨ onnen.
18.3. PRODUKTMASSE
339
¨ Ubung 18.2.3 : Seien (M, M, µ) ein Maßraum und f : M → [0, ∞] eine meßbare Funktion. Definiere Z ν(E) := f dµ, E ∈ M. E
Zeige, daß ν ein Maß ist. ¨ ¨ Ubung 18.2.4 : Sei M die σ-Algebra aus Ubung 17.1.4. Definiere f¨ ur E ∈ M ½ 0, falls E abz¨ ahlbar ist, µ(E) := 1, sonst. Zeige, daß µ ein Maß auf M ist. ¨ Ubung 18.2.5 : Finde ein Beispiel eines Maßes, das nicht σ-endlich ist. ¨ Ubung 18.2.6 : Seien (M, M) ein meßbarer Raum, µ ein endliches Maß auf M und f ∈ L1 (M, C, µ). Weiter sei S ⊆ C eine abgeschlossene Menge mit der Eigenschaft, daß R f dµ AE (f ) := E ∈S µ(E) f¨ ur jedes E ∈ M mit µ(E) > 0. Zeige, daß f (x) ∈ S f¨ ur fast alle x ∈ M . Hinweis: Jede offene Teilmenge von C l¨ aßt sich als abz¨ ahlbare Vereinigung offener Kugeln schreiben, vgl. Proposition 17.1.5. ¨ Ubung 18.2.7 : Seien (M, M, µ) ein Maßraum und (En )n∈N eine Folge meßbarer Teilmengen von M mit ∞ X
µ(En ) < ∞.
n=1
Zeige, daß fast alle x ∈ M in h¨ ochstens endlich vielen En liegen (d.h., die Menge derjenigen x ∈ M , f¨ ur die dies nicht gilt, hat das Maß 0). ¨ Ubung 18.2.8 : Charakterisiere diejenigen einfachen Funktionen, die integrierbar sind. ¨ Ubung 18.2.9 : Ist die Dirichletsche Sprungfunktion ½ 1 f : [0, 1] → R f (x) := 0
falls x ∈ Q, sonst.
integrierbar? ¨ Ubung 18.2.10 : Sei (M, M, µ) ein Maßraum, und sei (fn )n∈N eine Folge integrierbarer Funktionen fn : M → R, die gleichm¨ aßig gegen eine Funktion f konvergiert (d.h. f¨ ur jedes ² > 0 gibt es ein n0 ∈ N, so daß f¨ ur alle x ∈ M gilt: |f (x) − fn (x)| < ²). Zeige: (i) Wenn µ(M ) < ∞, dann ist f integrierbar. (ii) Die Aussage aus Teil (i) ist falsch f¨ ur Maßr¨ aume mit µ(M ) = ∞.
18.3
Produktmaße
Gegeben seien zwei Maßr¨aume (M, M, µ) und (N, N, ν). Wir wollen daraus ein Maß auf (M ×N, M⊗N) konstruieren. Die Grundidee ist, Funktionen in zwei Variablen nacheinander in den beiden Variablen zu integrieren. F¨ ur E ∈ M ⊗ N sind nach Proposition 17.2.4 die Mengen Ex Ey
:= {y ∈ N | (x, y) ∈ E} ∈ N := {x ∈ M | (x, y) ∈ E} ∈ M
340
KAPITEL 18. MASS UND INTEGRAL
f¨ ur alle x ∈ M und y ∈ N meßbar. Damit kann man die Funktionen fE : M → [0, ∞], gE : N → [0, ∞],
x 7→ ν(Ex ) y 7→ µ(E y )
definieren. Lemma 18.3.1 : Falls µ und ν σ-endlich sind, sind die Funktionen fE und gE sind f¨ ur jedes E ∈ M⊗N meßbar. Beweis: Idee: Betrachte C := {E ∈ M ⊗ N | fE meßbar} und zeige, daß C die Bedingungen (a) und (b) aus Lemma 17.1.6 erf¨ ullt. Da außerdem endliche, disjunkte Vereinigungen von Quadern der Form A × B mit A ∈ M, B ∈ N in C sind, folgt die Behauptung. Wir f¨ uhren den Beweis f¨ ur fE , der andere Fall geht analog. Betrachte das Mengensystem C := {E ∈ M ⊗ N | fE meßbar}. Wenn E = A × B mit A ∈ M, B ∈ N ein meßbarer Quader ist, dann gilt ½ B falls x ∈ A, Ex = ∅ sonst und
½ fE (x) =
ν(B) 0
falls x ∈ A, sonst.
B
A
Also ist fE in diesem Fall meßbar und E ∈ C. Wenn E die disjunkte Vereinigung endlich vieler, meßbarer Quader E1 , . . . , Ek ist, dann ist fE = fE1 + . . . + fEk ¨ meßbar und Ubung 17.1.1 zeigt, daß die von den meßbaren Quadern erzeugte Algebra A in C enthalten ist. A2 B2 B1
A1
Damit reicht es jetzt, zu zeigen, daß C die Bedingungen (a) und (b) aus Lemma 17.1.6 erf¨ ullt: S∞ ¨ Sei E1 ⊆ E2 ⊆ . . . mit Ej ∈ C und E = Ej . Dann gilt f¨ ur x ∈ M (vgl. Ubung 18.1.1) j=1
fE (x) = ν(Ex ) = ν
∞ [
(Ej )x = lim ν((Ej )x ) = lim fEj (x),
j=1
j∈N
j∈N
18.3. PRODUKTMASSE
341
was die Meßbarkeit von fE zeigt (vgl. Proposition 17.2.7). T∞ ¨ Analog, wenn E1 ⊇ E2 ⊇ . . . mit Ej ∈ C und E = j=1 Ej , dann gilt f¨ ur x ∈ M (vgl. Ubung 18.1.1(iv) - an dieser Stelle braucht man die σ-Endlichkeit) ∞ \ fE (x) = ν(Ex ) = ν (Ej )x = lim ν((Ej )x ) = lim fEj (x), j∈N
j=1
j∈N
was wiederum die Meßbarkeit von fE zeigt (vgl. Proposition 17.2.7).
Satz 18.3.2 : (M, M, µ) und (N, N, ν) seien zwei σ-endliche Maßr¨ aume. Dann ist Abbildung Z µ ⊗ ν : M ⊗ N → [0, ∞], E 7→ ν(Ex )dµ(x) M
ein Maß. Weiter ist µ ⊗ ν σ-endlich und es gilt Z Z ¡ ¢ (µ ⊗ ν) E = ν(Ex )dµ(x) = µ(E y )dν(y). M
N
Beweis: P∞ Ej ) = j=1 µ ⊗ ν(Ej ) folgt aus dem Satz 18.2.4 von der Montonen Konvergenz. Die σ-Endlichkeit des Maßes folgt mit Satz 18.1.3 durch zur¨ uckschneiden mit Quadern endlichen Volumens. Die letzte Formel folgt durch Vertauschen der Rollen von µ und ν sowie erneut dem Eindeutigkeitssatz 18.1.3.
Idee: Die σ-Additivit¨at µ ⊗ ν(
Es ist klar, daß
S∞
j=1
¡ ¢ (µ ⊗ ν) ∅ =
Z ν(∅)dµ(x) = 0 M
gilt. Wenn E1 , E2 , . . . eine disjunkte Familie von Mengen in M ⊗ N ist und E = dann gilt ∞ X ¡ ¢ ν(Ex ) = ν (Ej )x
S∞ j=1
Ej ,
j=1
und mit dem Satz 18.2.4 von der Monotonen Konvergenz folgt Z ∞ Z ∞ X X ¡ ¢ ¡ ¢ (µ ⊗ ν) E = ν(Ex )dµ(x) = ν((Ej )x )dµ(x) = (µ ⊗ ν) Ej . M
j=1
M
j=1
Dies zeigt, daß µ ⊗ ν ein Maß ist. Wenn jetzt µ und S ν σ-endlich sind, dann gibt es Mengen A1 , A2 , . . . mit Aj ∈ M, µ(Aj ) < ∞ f¨ u r j ∈ N und ur j ∈ N und j∈N Aj = M sowie Mengen B1 , B2 , . . . mit Bj ∈ N, ν(Bj ) < ∞ f¨ S j∈N Bj = N . Es folgt [ Aj × Bk = M × N j,k∈N
mit ¡ ¢ (µ ⊗ ν) Aj × Bk =
Z ν((Aj × Bk )x )dµ(x) ZM
=
ν(Bk )dµ(x) Aj
= <
ν(Bk )µ(Aj ) ∞.
342
KAPITEL 18. MASS UND INTEGRAL
N
M
Dies zeigt, daß µ ⊗ ν σ-endlich ist und sogar die etwas st¨arkere Bedingung aus Satz 18.1.3 erf¨ ullt. Wir wiederholen jetzt das ganze Argument f¨ ur die Abbildung Z µ(E y )dν(y) M ⊗ N → [0, ∞], E 7→ N
und finden, daß auch diese Abbildung ein σ-endliches Maß ist, f¨ ur das die Mengen Aj × Bk das Maß µ(Aj )ν(Bk ) haben. Aber dann zeigt Satz 18.1.3 die Gleichheit Z Z ¡ ¢ (µ ⊗ ν) E = ν(Ex )dµ(x) = µ(E y )dν(y). M
N
Das Maß µ ⊗ ν heißt das Produktmaß von µ und ν. Man will das Verfahren aus Satz 18.3.2 iterieren und so Produktmaße von endlich vielen σ-endlichen Maßen konstruieren. In diesem Kontext ist das folgende Korollar sehr wichtig. Korollar 18.3.3 : Seien (Mi , Mi , µi ) f¨ ur i = 1, 2, 3 drei σ-endliche Maßr¨ aume. Dann gilt: (i) (M1 ⊗ M2 ) ⊗ M3 = M1 ⊗ (M2 ⊗ M3 ) = M1 ⊗ M2 ⊗ M3 . (ii) (µ1 ⊗ µ2 ) ⊗ µ3 = µ1 ⊗ (µ2 ⊗ µ3 ). Beweis: Idee: Kombiniere Satz 18.3.2 mit Satz 18.1.3. Der erste Teil folgt sofort aus der Tatsache, daß alle drei σ-Algebren von den Mengen der Form E1 × E2 × E3 mit Ei ∈ Mi und i = 1, 2, 3 erzeugt werden. Da die von den Mengen der Form E1 × E2 × E3 erzeugte Algebra A mit Ei ∈ Mi und ¨ i = 1, 2, 3 gerade die Menge der disjunkten Vereinigungen solcher Mengen ist (vgl. Ubung 17.1.1), folgt der zweite Teil aus Satz 18.3.2 und Satz 18.1.3, weil die Maße auf Elementen von A u ¨bereinstimmen.
Mit diesem Korollar k¨onnen wir jetzt zu einer endlichen Familie (Mi , Mi , µi ), i = 1, . . . , k von σendlichen Maßr¨aumen ein Produktmaß µ1 ⊗ . . . ⊗ µk auf (M1 × . . . × Mk , M1 ⊗ . . . ⊗ Mk ) durch µ1 ⊗ . . . ⊗ µk (M ) = µ1 ⊗ (µ2 ⊗ (. . . ⊗ µk ) . . .)(E) definieren.
18.3. PRODUKTMASSE
343
Beispiel 18.3.4 : Betrachte den meßbaren Raum (Rn , BRn ) = (R × . . . × R, BR ⊗ . . . ⊗ BR ). Dann heißt das Produktmaß λn = λ1 ⊗ . . . ⊗ λ1 der Lebesgue-Maße auf R das Lebesgue-Maß auf Rn .
Satz 18.3.5 (Fubini - 1. Version): Seien (M, M, µ) und (N, N, ν) zwei σ-endliche Maßr¨ aume. Sei f : M × N → [0, ∞] eine meßbare Abbildung. Dann gilt ¶ ¶ Z µZ Z µZ Z f (x, y)dν(y) dµ(x) = f (x, y)dµ(x) dν(y) = f (x, y)d(µ ⊗ ν)(x, y). M
N
N
M
M ×N
Beweis: Idee: F¨ur charakterische Funktionen ist dies gerade der Satz 18.3.2. Dann bildet man Linearkombinationen und approximiert durch einfache Funktionen gem¨ aß Lemma 18.2.3. Die Behauptung folgt dann aus dem Satz 18.2.4 von der Monotonen Konvergenz.
Wenn f die charakteristische Funktion einer meßbaren Menge ist, dann ist die Aussage gerade die Gleichheit in Satz 18.3.2 plus die Definition des Produktmaßes. Da man Summen und positive Konstanten aus den Integralen herausziehen kann, ist die Behauptung auch f¨ ur einfache Funktionen richtig. W¨ahle jetzt eine approximierende Folge (φn )n∈N f¨ ur f wie in Lemma 18.2.3. Dann gilt Z Z f (x, y)d(µ ⊗ ν)(x, y) = lim φn (x, y)d(µ ⊗ ν)(x, y). (18.2) n→∞
M ×N
M ×N
Jetzt setzt man Z
Z
gn (x) :=
φn (x, y)dν(y) und
hn (y) :=
φn (x, y)dµ(x)
N
sowie
M
Z g(x) :=
Z f (x, y)dν(y)
und
h(y) :=
N
f (x, y)dµ(x). M
Dann sind die Folgen (gn )n∈N und (hn )n∈N monoton steigende Folgen meßbarer Funktionen und Satz 18.2.4 zeigt gn (x) → g(x) und hn (y) → h(y). Wieder mit Satz 18.2.4 rechnen wir jetzt Z Z g(x)dµ(x) = lim gn (x)dµ(x) n→∞ M M ¶ Z µZ = lim φn (x, y)dν(y) dµ(x) n→∞ M N Z = lim φn (x, y)d(µ ⊗ ν)(x, y) n→∞ M ×N ¶ Z µZ = lim φn (x, y)dµ(x) dν(y) n→∞ N M Z = lim hn (y)dν(y) n→∞ N Z = h(y)dν(y). N
Wegen (18.2) beweist diese Rechnung die Behauptung.
344
KAPITEL 18. MASS UND INTEGRAL
Beispiel 18.3.6 : Die Eulersche Beta–Funktion B : [0, ∞[×[0, ∞[→ [0, ∞[ ist durch Z ∞ tp−1 dt B(p, q) := (1 + t)p+q 0 definiert. Mit Satz 18.3.5 zeigt man die Identit¨at B(p, q) = Dazu f¨ uhrt man in der Definition
Z Γ(p) =
∞
Γ(p)Γ(q) . Γ(p + q)
(18.3)
xp−1 e−x dx
0
der Gamma–Funktion f¨ ur p > 0 die Substitution x = ty durch und findet Z ∞ Γ(p) y p−1 e−ty dy = tp 0 f¨ ur t > 0. Damit rechnet man unter Zuhilfenahme von Satz 18.3.5 Z ∞ tp−1 Γ(p + q)B(p, q) = Γ(p + q) dt (1 + t)p+q 0 Z ∞ Z ∞ = tp−1 dt y p+q−1 e−(1+t)y dy 0 0 Z ∞ Z ∞ q−1 −y = y e dy (ty)p−1 e−ty y dt 0
0
= Γ(q)Γ(p). In der Wahrscheinlichkeitstheorie wird die folgende Darstellung der Betafunktion ben¨ utzt, die man aus t der Substitution x = 1+t erh¨alt: Z 1 B(p, q) = xp−1 (1 − x)q−1 dx. 0
Durch Auswertung von (18.3) in ( 12 , 21 ) leitet man die Formel Z ∞ Z ∞ −t √ 2 e √ dt = Γ( 12 ) = π e−x dx = t 0 0 her: Γ( 21 )Γ( 12 ) = = = = =
B( 12 , 21 ) Z 1 dt p t(1 − t) 0 Z 1 dt q 1 1 2 0 4 − (t − 2 ) ¢¯¯1 ¡ arcsin 2(t − 12 ) ¯ 0 π π + . 2 2
¨ Ubung 18.3.1 : Sei ν ein endliches Maß auf dem meßbaren Raum ([0, ∞[, B[0,∞[ ), und sei φ : [0, ∞[→ R definiert durch φ(t) = ν([0, t[). Weiter sei (M, M, µ) ein Maßraum und f : M → [0, ∞[ meßbar. Dann gilt Z Z F (t)dν(t) (φ ◦ f )(x)dµ(x) = M
[0,∞[
f¨ ur die Funktion F : [0, ∞[→ [0, ∞[, t 7→ µ({x ∈ M | f (x) > t}).
18.4. NULLMENGEN UND KONVERGENZ
18.4
345
Nullmengen und Konvergenz
Sei (M, M, µ) ein Maßraum. Eine Menge E ∈ M heißt eine µ-Nullmenge, wenn µ(E) = 0. Eine Aussage u ur das Komplement einer ¨ber die Punkte x ∈ M heißt µ-fast u ¨ berall (µ-f.u ¨ .) wahr, wenn sie f¨ Nullmenge wahr ist. Manchmal sagt man auch, die Aussage gelte f¨ ur µ-fast alle (f.µ-f.a.) x. Wenn das Maß aus dem Kontext klar ist, lassen wir das µ in den obigen Bezeichnungen weg. Seien insbesondere (M, M, µ) ein Maßraum und (N, N) ein meßbarer Raum. Dann heißen zwei meßbare Abbildungen f, g : M → N µ–fast u ¨ berall gleich, wenn {m ∈ M | f (m) 6= g(m)} eine µ–Nullmenge ist. Wir schreiben dann f = g (f.¨ u.)
Beispiel 18.4.1 : Eine Folge von Funktionen fn : M → C konvergiert (f.¨ u.) gegen eine Funktion f : M → C, wenn es eine Nullmenge A ⊆ M gibt mit ∀x ∈ M \ A :
lim fn (x) = f (x).
n→∞
Proposition 18.4.2 : Sei (M, M, µ) ein Maßraum und f ∈ L+ (M ). Dann sind folgende Aussagen aquivalent: ¨ R (1) M f dµ = 0. (2) f = 0 (f.¨ u.). Beweis: Idee: F¨ur einfache Funktionen ist das klar und f¨ur allgemeines f folgt (2) ⇒ (1)“ sofort, weil jede ” f approximierende, einfache Funktion fast u ur die Umkehrung zeigt man, daß ¨berall Null sein muß. F¨ alle Ek := {x ∈ M | f (x) ≥ k1 } Nullmengen sind.
Pk Wenn f = j=1 aj χEj eine einfache Funktion ist, dann folgt die Behauptung sofort aus R Pk f = j=1 aj µ(Ej ).
F¨ ur allgemeines f nehmen wir zun¨achst an, daß f =R0 (f.¨ u.). Wenn φ eine Reinfache Funktion mit 0 ≤ φ ≤ f ist, dann ist φ = 0 (f.¨ u.), also gilt φ = 0. Damit folgt f = 0 nach der Definition des Integrals. R Umgekehrt sei f = 0, dann setze Ek := {x ∈ M | f (x) ≥ k1 }. Es gilt f¨ ur jedes k ∈ N
Z
Z
µ(Ek ) = k Ek
1 k
≤k
f = 0,
also impliziert M = {x ∈ M | f (x) = 0} ∪
[
Ek
k∈N
die Behauptung, weil die abz¨ahlbare Vereinigung von Nullmengen selbst eine Nullmenge ist ¨ (Ubung!).
346
KAPITEL 18. MASS UND INTEGRAL
Nach Proposition 18.4.2 ist die Menge N der meßbaren Funktionen f : M → K, die µ-fast u ¨berall 1 gleich Null sind, ein Untervektorraum von L (M, K), auf dem das Integral verschwindet. Daher definiert R : L1 (M, K) →R K auch ein lineares Funktional auf dem Quotientenraum L1 (M, K) := L1 (M, K)/N . Es wird auch mit bezeichnet. Da es im Kontext der Integrationstheorie meist unerheblich ist, wenn man eine Funktion auf einer Nullmenge ab¨andert, wird oft der Unterschied zwischen L1 und L1 nicht extra erw¨ahnt. Man betrachtet dann ein Element von L1 (M, K) als eine Funktion, die man aber nach Belieben auf Nullmengen ab¨andern darf. Wenn wir betonen wollen, u ¨ber welches Maß wir integrieren, schreiben wir L1 (M, µ, K) und L1 (M, µ, K). Wenn aus dem Kontext klar ist, u ¨ber welchen Raum wir integrieren oder in welchem K¨orper die Werte der Funktionen liegen sollen, schreiben wir auch L1 (C, µ) oder L1 (µ) etc. Lemma 18.4.3 (Fatou):
Sei (fn )n∈N eine Folge in L+ (M ). Dann gilt Z Z lim inf fn ≤ lim inf fn . n→∞
n→∞
Beweis: Idee: Betrachte die monoton steigende Folge (inf n≥k fn )k∈N mit punktweisem Grenzwert lim inf k→∞ fk und ben¨ utze den Satz 18.2.4 von der Monotonen Konvergenz.
F¨ ur alle k ∈ N gilt ∀j ≥ k : also
inf fn ≤ fj ,
n≥k
Z ∀j ≥ k :
Dies wiederum zeigt
Z inf fn ≤
n≥k
Z
fj .
Z inf fn ≤ inf
n≥k
j≥k
fj .
Weil die Folge (inf n≥k fn )k∈N monoton steigend mit punktweisem Grenzwert lim inf k→∞ fk ist, zeigt Satz 18.2.4 jetzt Z Z Z Z lim inf fk = lim inf fn ≤ lim inf fj = lim inf fk . k→∞
k→∞
n≥k
k→∞ j≥k
k→∞
Satz 18.4.4 (Dominierte Konvergenz): Sei (M, M, µ) ein Maßraum und (fn )n∈N eine Folge meßbarer Funktionen M → C, die (f.¨ u.) gegen eine meßbare Funktion f : M → C konvergiert. Wenn es eine Funktion g ∈ L1 (M, R) mit ∀n ∈ N : |fn | ≤ g (f.¨ u.) gibt, dann ist f ∈ L1 (M, C), und es gilt Z
Z f = lim
n→∞
fn .
Beweis: Idee: Aufspaltung in Real- und Imagin¨arteil und anschließend in Positiv- und Negativteil reduziert die Behauptung auf nichtnegative Funktionen. Durch Ab¨ anderung der Funktionen auf einer Nullmenge kann man außerdem annehmen, daß die Konvergenz punktweise ist. Anwendung des Lemmas 18.4.3 von Fatou auf (fn )n∈N und auf (g − fn )n∈N liefert dann die Behauptung.
18.4. NULLMENGEN UND KONVERGENZ
347
Nach Satz 18.2.6 und der Voraussetzung gilt fn ∈ L1 (M, C) f¨ ur alle n gilt. Wegen | Im fn |, | Re fn | ≤ |fn | gelten die Voraussetzungen automatisch auch f¨ ur Real- und Imagin¨arteile der Funktionen. Man kann daher annehmen, daß alle involvierten Funktionen reellwertig sind. Jetzt zeigt man mit demselben Argument, daß wir o.B.d.A. annehmen k¨onnen fn , f ∈ L+ (M ). Sei jetzt A ∈ M eine Nullmenge mit ∀x ∈ M \ A :
lim fn (x) = f (x)
n→∞
und ∀n ∈ N, x ∈ M \ A : |fn (x)| ≤ g(x). ¡ ¢ ¡ ¢ Indem wir fn durch min fn , g(1 − χA ) und f durch min f, g(1 − χA ) ersetzen, k¨onnen wir jetzt annehmen, daß A = ∅. Jetzt sagt das Lemma 18.4.3 von Fatou, daß Z Z Z f ≤ lim inf fn ≤ g. n→∞
Andererseits zeigt dasselbe Lemma Z Z Z Z Z Z g − f = (g − f ) ≤ lim inf (g − fn ) = g − lim sup fn . n→∞
n→∞
Zusammen sehen wir Z lim sup n→∞
Z fn ≤
Z f ≤ lim inf n→∞
Z fn ≤ lim sup n→∞
fn ,
was die Behauptung beweist.
Ein Maß µ heißt vollst¨ andig, wenn jede Teilmenge einer Nullmenge meßbar ist. Beachte, daß der punktweise Grenzwert einer Folge von meßbaren Funktionen meßbar ist (vgl. Proposition 17.2.7). Wenn also die Folge (fn )n∈N u ¨berall gegen f konvergiert, so ist im Satz 18.4.4 von der dominierten Konvergenz die Annahme, daß f meßbar ist, u ussig. Sei jetzt A ⊆ M eine µ-Nullmenge ¨berfl¨ mit ∀x ∈ M \ A : lim fn (x) = f (x). n→∞
Wir definieren fe: M → C durch
½ fe(x) =
f (x) f¨ ur x 6∈ A, 0 f¨ ur x ∈ A.
Dann gilt fe = limn→∞ fn · (1 − χA ), also ist fe meßbar. F¨ ur E ∈ BC gilt f −1 (E) ∩ (M \ A) = fe−1 (E) ∩ (M \ A), d.h.
f −1 (E) = (fe−1 (E) ∩ (M \ A)) ∪ (f −1 (E) ∩ A).
Wenn µ vollst¨andig ist, dann ist f automatisch meßbar. Satz 18.4.5 (Fubini - 2. Version): Seien (M, M, µ) und (N, N, ν) zwei σ-endliche Maßr¨ aume und f : M × N → C eine meßbare Abbildung. Wenn Z |f (x, y)|d(µ ⊗ ν)(x, y) < ∞, M ×N
dann gilt
348
KAPITEL 18. MASS UND INTEGRAL
(i) Die Funktionen fx : N → C,
y 7→ f (x, y)
sind f¨ ur fast alle x ∈ M integrierbar. (ii) Die Funktionen f y : M → C,
x 7→ f (x, y)
sind f¨ ur fast alle y ∈ N integrierbar. (iii) Es gilt
Z
µZ
Z f (x, y)d(µ ⊗ ν)(x, y) = M ×N
M
N
N
M
Z µZ =
¶ f (x, y)dν(y) dµ(x) ¶ f (x, y)dµ(x) dν(x).
Beweis: Idee: Man zeigt, daß man sich auf nicht negative Funktionen beschr¨anken kann, und beachtet, daß ein Integral nur endlich sein kann, wenn der Integrand fast u ¨berall endlich ist. Dann folgt die Behauptung aus dem Satz 18.3.5 von Fubini. Indem wir zun¨achst nach Real- und Imagin¨arteil und dann nach positivem und negativem Teil aufspalten, k¨onnen wir o.B.d.A. annehmen, daß f ∈ L+ (M ). Jetzt ben¨ utzen wir R die Bezeichnungen aus dem Beweis von Satz 18.3.5. Dort wird gezeigt, daß f¨ ur g(x) = N f (x, y)dν(y) gilt Z g(x)dµ(x) < ∞. M
Dann kann es aber keine Menge positiven Maßes geben, auf der g : M → [0, ∞] den Wert ∞ annimmt. Dies beweist (i). Die Behauptung (ii) folgt ganz analog. Der dritte Teil wurde schon in Satz 18.3.5 bewiesen.
Satz 18.4.6 (Parameterabh¨ angige Integrale): Seien (M, M, µ) ein Maßraum und R f : M ×[a, b] → C eine Funktion, f¨ ur die f ( ·, t) : M → C f¨ ur jedes t ∈ [a, b] integrierbar ist. Setze F (t) := M f (x, t) dµ(x). (i) Wenn es eine integrierbare, nichtnegative Funktion g auf M mit |f (x, t)| ≤ g(x) f¨ ur alle x ∈ M und t ∈ [a, b] gibt und limt→t0 f (x, t) = f (x, t0 ) f¨ ur alle x ∈ M ist, dann gilt auch lim F (t) = F (t0 ).
t→t0
(ii) Wenn die partielle Ableitung ∂f ∂t existiert, und es außerdem eine integrierbare, nichtnegative Funk(x, t)| ≤ g(x) f¨ ur alle x ∈ M und t ∈ [a, b] gibt, so ist F differenzierbar in tion g auf M mit | ∂f ∂t ]a, b[, und es gilt Z ∂f F 0 (t) = (x, t) dµ(x). M ∂t Beweis: Idee: Wende den Satz 18.4.4 u¨ber die dominierte Konvergenz auf die Folgen fn (x) = f (x, tn ) und f (x,tn )−f (x,t0 ) tn −t0
mit tn → t0 an (f¨ ur letzteres braucht man den Mittelwertsatz).
18.4. NULLMENGEN UND KONVERGENZ
349
(i) Setze fn (x) = f (x, tn ), wobei tn → t0 f¨ ur n → ∞. Mit dem Satz 18.4.4 u ¨ber die dominierte Konvergenz rechnen wir Z F (t0 ) = f (x, t0 ) dµ(x) ZM = lim fn (x) dµ(x) M n→∞ Z = lim fn (x) dµ(x) n→∞ M Z f (x, tn ) dµ(x) = lim n→∞
=
M
lim F (tn ).
n→∞
(x,t0 ) ∂f (ii) Mit hn (x) := f (x,tntn)−f gilt limn→∞ hn (x) = ∂f −t0 ∂t (x, t0 ), also ist ∂t ( ·, t0 ) meßbar (vgl. Proposition 17.2.7). Mit dem Mittelwertsatz sieht man, daß f¨ ur jedes x ∈ M gilt ¯ ¯ ¯ ¯ |hn (x)| ≤ sup ¯ ∂f ∂t (x, t)¯ ≤ g(x). t∈[a,b]
Jetzt rechnen wir wieder mit dem Satz 18.4.4 u ¨ber die dominierte Konvergenz: Z Z ∂f (x, t0 ) dµ(x) = lim hn (x) dµ(x) n→∞ M M ∂t Z 1 (f (x, tn ) − f (x, t0 )) dµ(x) = lim n→∞ tn − t0 M F (tn ) − F (t0 ) = lim . n→∞ tn − t0
¨ ur f, g : M → [−∞, ∞] gelte f = g µ-fast u Ubung 18.4.1 : Sei (M, M, µ) ein Maßraum. F¨ ¨berall, d.h., die Menge {x ∈ M |f (x) 6= g(x)} ist meßbar und hat das Maß Null. (i) Belege durch ein Beispiel, daß aus der Meßbarkeit von f im allgemeinen nicht die Meßbarkeit von g folgt. (ii) Sei jetzt (M, M, µ) vollst¨ andig. Zeige, daß mit f auch g meßbar ist.
¨ Ubung 18.4.2 : Definiere f : [0, 1] × [0, 1] → R durch ( f (x, y) :=
x2 −y 2 (x2 +y 2 )2
0
falls (x, y) 6= (0, 0), sonst.
(i) Zeige: Z Z
1 0 1 0
µZ µZ
1 0 1 0
(ii) Folgere aus (i), daß f nicht integrierbar ist.
¶ f (x, y)dy dx
=
¶ f (x, y)dx dy
π , aber 4
=
π − . 4
350
KAPITEL 18. MASS UND INTEGRAL
¨ Ubung 18.4.3 : Definiere f : [−1, 1] × [−1, 1] → R durch ½ x falls |y| 6= 1, 1−y 2 f (x, y) := 0 sonst. Zeige, daß
Z
1
µZ
−1
existiert, aber
Z
1
1
¶ f (x, y)dx dy
−1
µZ
−1
1
¶ f (x, y)dy dx
−1
nicht existiert. ¨ Ubung 18.4.4 : Definiere f : [−1, 1] × [−1, 1] → R durch ½ xy (1−|x|)2 +(1−|y|)2 f (x, y) := 0
falls |xy| 6= 1, sonst.
Zeige: (i)
Z
1
µZ
¶
1
Z
1
µZ
f (x, y)dy dx = −1
¶
1
f (x, y)dx dy = 0.
−1
−1
−1
(ii) f ist nicht u ¨ber [−1, 1] × [−1, 1] integrierbar.
¨ Ubung 18.4.5 : Seien (M, M, µ) ein Maßraum und A, B ⊆ M meßbar. Zeige, daß aus µ(A) = 0 folgt, daß A × B eine Nullmenge in (M × M, M ⊗ M, µ ⊗ µ) ist. ¨ Ubung 18.4.6 : Sei f : [0, 1] × [0, 1] → R integrierbar. Zeige: ¶ Z 1 µZ Z 1 µZ x f (x, y)dy dx = 0
0
0
1
¶ f (x, y)dx dy.
y
¨ Ubung 18.4.7 : Die Funktion f : R2 → R sei definiert durch ½ p 1 − x21 − x22 falls x21 + x22 ≤ 1, f (x1 , x2 ) := 0 sonst. Berechne das Integral
Z f (x1 , x2 ) d(x1 , x2 ). R2
¨ Ubung 18.4.8 : Berechne das Volumen des Kugeloktanten K := {(x1 , x2 , x3 ) : x1 , x2 , x3 ≥ 0, x21 + x22 + x23 ≤ 1}.
¨ alfte des Einheiskreises und Ubung 18.4.9 : Sei A ⊆ R2 die rechte H¨ f : R2 → R, Berechne
R A
(x1 , x2 ) 7→ x1 .
f (x1 , xs )d(x1 , x2 ).
¨ ur eine Menge A ⊆ Rn mit λn (A) > 0 heißt der Punkt Ubung 18.4.10 : F¨ Z 1 S := n x dx ∈ Rn λ (A) A der Schwerpunkt von A. Berechne den Schwerpunkt des Kugeloktanten aus Aufgabe 18.4.8. (Hierbei ist die Integration komponentenweise zu verstehen.)
18.4. NULLMENGEN UND KONVERGENZ
351
¨ Ubung 18.4.11 : Berechne die folgenden Grenzwerte: (i)
Z
n
³
lim
n→∞
(ii)
x ´n x/2 e dx, n
1+
x ´n −2x e dx. n
0
Z
n
lim
n→∞
1−
0
³
352
KAPITEL 18. MASS UND INTEGRAL
Analysis IV
353
Kapitel 19
Spezielle Eigenschaften des Lebesgue-Maßes In diesem Kapitel besch¨ aftigen wir uns speziell mit dem Lebesgue-Maß. Als erstes betrachten wir Regularit¨ atseigenschaften, die im Verlauf n¨ utzliche Anwendungen haben. Insbesondere ben¨ otigen wir die Aussage, daß das Lebesgue-Maß einer Borelmenge E als das Infimum aller Maße der offenen Mengen, die E enthalten, geschrieben werden kann. Damit l¨ aßt sich dann das Lebesgue-Maß aus Kapitel 8 als die Vervollst¨ andigung des Lebesgue-Maßes aus Kapitel 18 identifizieren. Das eigentliche Hauptergebnis dieses Kapitels ist der Transformationssatz, der eine Verallgemeinerung der Substitutionsregel ist und beschreibt, wie sich Integrale unter stetig differenzierbaren Abbildungen verhalten.
19.1
Regularit¨ at
F¨ ur Funktionen auf R betrachten wir hier den Integrierbarkeitsbegriff, wie er in der Integralrechnung einer reellen Variablen entwickelt wurde. Lemma 19.1.1 : Sei E ⊆ R beschr¨ ankt, und sei χE integrierbar. Dann ist E meßbar im Sinne von ¨ Ubung 8.4.1 und es gilt Z χE = inf{λ1 (U ) | E ⊆ U, U offen in R}. Beweis: Idee: Mit Lemma 8.1.2 findet man eine Entwicklung χE als Reihe von Stufenfunktionen, deren R
Betragsintegrale sich zu wenig mehr als χE aufsummieren. Zerlege die Stufenfunktionen in Linearkombinationen von Funktionen der Form χ[ak ,bk [ . Dann w¨ ahlt man α ek < αk so nah an αk , daß R P∞ P 1 |αk |λ1 (]e ak , bk [) < χE + ². Mit Um = {x ∈ R | m |αk |χ]eak ,bk [ (x) > 1+² } findet man dann k=1 k=1 R S∞ 1 S∞ E ⊆ m=1 Um und λ ( m=1 Um ) ≤ (1 + ²)(² + χE ).
Da χE integrierbar ist, P∞gibt es nach Lemma 8.1.2 zu ² > 0 eine Folge (fk )k∈N von Stufenfunktionen mit χE ' k=1 fk und ∞ Z X
Z |fk | <
k=1
² χE + . 2
Indem wir jedes fk durch die endlich vielen Vielfachen von Elementarfunktionen ersetzen, die in die kanonische Darstellung von fk eingehen, k¨onnen wir o.B.d.A. annehmen, daß (∀k ∈ N) fk = αk χ[ak ,bk [ . 355
356
KAPITEL 19. SPEZIELLE EIGENSCHAFTEN DES LEBESGUE-MASSES W¨ahle jetzt e ak < ak so, daß
X
(ak − e ak )|αk | <
k
Dann gilt
∞ X
² . 2
Z |αk |λ1 (]e ak , bk [) <
χE + ².
k=1
Setze jetzt Um = {x ∈ R |
m X
|αk |χ]eak ,bk [ (x) >
k=1
1 } 1+²
Dann ist Um offen und es gilt Um+1 ⊆ Um . P∞ Sei x ∈ E. Wenn die Reihe k=1 αk χ[ak ,bk [ (x) absolut konvergiert, dann konvergiert sie gegen 1. Also ist wegen χ[ak ,bk [ ≤ χ]eak ,bk [ jedes x ∈ E in einem Um enthalten, d.h. E⊆
∞ [
Um =: U.
m=1
Also finden wir mit 1
λ (Um ) ≤ (1 + ²)
Z X m
Z |αk |χ]eak ,bk [ ≤ (1 + ²)(² +
χE ),
k=1
daß
Z λ1 (U ) ≤ (1 + ²)(² +
χE ).
Betrachte jetzt den Maßraum (Rn , BRn , λn ). Satz 19.1.2 : Sei E ∈ BRn . Es gilt (i) λn (E) = inf{λn (U ) | E ⊆ U, U offen in Rn }. (ii) λn (E) = sup{λn (K) | K ⊆ E, K kompakt in Rn }. Beweis: Idee: Als erstes zeigt man, daß es ausreicht, beschr¨ankte Mengen zu betrachten. Dazu schneidet man mit einer wachsenden Familie (Bk )k∈N von offenen W¨ urfeln und approximiere darin so gut, daß die Fehler sich immer noch zu einer kleinen Zahl summieren (geometrische Reihe). C := {F ⊆ Bk | λn (F ) = inf{λn (U ) | F ⊆ U ⊆ Bk offen} die Eigenschaften (a) und (b) aus Lemma 17.1.6 hat. Dieses Lemma liefert dann (i). Den Teil (ii) beweist man zuerst f¨ ur Mengen, die abgeschlossen und beschr¨ ankt sind (dann folgt die Behauptung trivialerweise aus dem Satz 10.3.3 von Heine–Borel), dann f¨ ur beliebige beschr¨ ankte Mengen (abschließen und (i) auf die Differenz Menge–Abschluß anwenden; das K ist dann der Abschluß ohne die gefundene offen Menge) und schließlich f¨ ur beliebige Mengen (mit Bk+1 \ Bk schneiden, die bisherigen Ergebnisse anwenden und wieder die geometrische Reihe ben¨ utzen).
(i) Wir zeigen zun¨achst, daß wir o.B.d.A. annehmen k¨onnen, daß E beschr¨ankt ist und daher endliches Maß hat. Betrachte dazu die Mengen Bk := {(x1 , . . . , xn ) ∈ Rn | (∀j = 1, . . . , n) |xj | < k}.
¨ 19.1. REGULARITAT
357 E
Bk
Wenn jetzt Uk ⊆ Rn offen ist mit E ∩ Bk ⊆ Uk , und λn (Uk ) − λn (E ∩ Bk ) < dann gilt E ⊆
S∞ j=k
1 , 2k
Uj =: Uk0 , und es folgt
λn (Uk0 \ E) ≤
∞ X
λn (Uk \ (E ∩ Bk )) ≤
j=k
∞ X 1 1 = k−1 . j 2 2 j=k
Dies zeigt aber die Behauptung. Sei also E ⊆ Bk . Wir zeigen, daß die Familie C := {F ⊆ Bk | λn (F ) = inf{λn (U ) | F ⊆ U ⊆ Bk offen} die Eigenschaften (a) und (b) aus Lemma 17.1.6 hat. S Zu (a): Wenn F1 ⊆ F2 ⊆ . . . mit Fj ∈ C und F := j Fj , dann w¨ahle Fj ⊆ Uj ⊆ Bk mit λn (Uj \ Fj ) ≤ 0 := Mit Um
S∞ j=m
1 . 2j
0 und Uj finden wir F ⊆ Um 0 \ F) ≤ λn (Um
∞ X
λn (Uj \ Fj ) ≤
j=m
∞ X 1 1 = m−1 . j 2 2 j=m
Dies zeigt F ∈ C. T Zu (b): Wenn F1 ⊇ F2 ⊇ . . . mit Fj ∈ C und F := j Fj , dann w¨ahle wieder Fj ⊆ Uj ⊆ Bk mit 1 λn (Uj \ Fj ) ≤ . j Tm 0 0 Mit Um := j=1 Uj finden wir F ⊆ Um und 0 0 \ F ) = λn (Um \ Fm ) + λn (Fm \ F ) ≤ λn (Um \ Fm ) + λn (Fm \ F ). λn (Um
Um zu zeigen, daß F ∈ C gen¨ ugt es also, zu zeigen, daß lim λn (Fm \ F ) = 0.
m→∞
Wegen und
λn (Bk \ Fm ) = λn (Bk ) − λn (Fm ) λn (Bk \ F ) = λn (Bk ) − λn (F )
folgt dies aber aus Satz 18.2.4, angewendet auf die monoton steigende Folge der χBk \Fm mit Grenzwert χBk \F . Als n¨achstes stellen wir fest, daß Lemma 17.1.6 tats¨achlich auf C anwendbar ist: Nach Lemma 19.1.1 sind alle meßbaren Quader Elemente von C, weil die Maße der Quader ¨ von oben durch Maße offener Quader approximiert werden k¨onnen. Nach Ubung 17.1.1 besteht die von den meßbaren Quadern in Bk erzeugte Algebra aus endlichen disjunkten Vereinigungen solcher Quader, ist also auch in C enthalten. Jetzt liefert Lemma 17.1.6, daß C alle meßbaren Mengen in Bk , also auch E enth¨alt. Dies beweist (i).
358
KAPITEL 19. SPEZIELLE EIGENSCHAFTEN DES LEBESGUE-MASSES (ii) Wir unterscheiden mehrere F¨alle: Wenn E beschr¨ankt und abgeschlossen ist, dann ist E kompakt nach dem Satz 10.3.3 von Heine–Borel und die Behauptung ist trivial. Wenn E beschr¨ankt ist, aber nicht abgeschlossen, dann ist der Abschluß E von E ebenso wie E \ E kompakt und meßbar. Nach (i) findet man zu ² > 0 ein offenes U ⊇ E \ E mit λn (U ) ≤ λn (E \ E) + ². F¨ ur K := E \ U ⊆ E gilt dann λn (K) = = ≥ ≥
λn (E) − λn (E ∩ U ) λn (E) − (λn (U ) − λn (U \ E)) λn (E) − λn (U ) + λn (E \ E) λn (E) − ².
Schließlich sei E unbeschr¨ankt. Setze Ek := E ∩ (Bk+1 /Bk ). Dann gibt es Kk ⊆ Ek , kompakt mit λn (Kk ) ≥ λn (Ek ) −
² . 2k
e k := Sk Kj ⊆ E kompakt mit Dann ist K j=1 ek) = λ (K n
k X
n
λ (Kj ) ≥
j=1
k X
n
n
λ (Ej ) − 2² = λ (
j=1
k [
Ej ) − 2².
j=1
Sk Wegen λ(E) = supk∈N λn ( j=1 Ej ) folgt die Behauptung.
Die in Satz 19.1.2 beschriebenen Eigenschaften des Lebesgue–Maßes lassen sich allgemein f¨ ur Maße auf lokalkompakten R¨aumen (mit der Borel-σ-Algebra) formulieren: Sei (M, U ) ein topologischer Hausdorff-Raum, der lokalkompakt ist, d.h., f¨ ur den jeder Punkt eine kompakte Umgebung hat. Ein Maß µ : BM → [0, ∞] heißt regul¨ ar, wenn f¨ ur jedes E ∈ BM gilt: (i) µ(E) = inf{µ(U ) | E ⊆ U, U offen in M }. (ii) µ(E) = sup{µ(K) | K ⊆ E, K kompakt in M }.
19.2
Charakterisierung des Lebesgue-Maßes
Wir zeigen, daß die Integrierbarkeit einer Funktion auf R gleichbedeutend ist mit der Integrierbarkeit ¨ bzgl. der in Ubung 18.2.1 behandelten Vervollst¨andigung (λ1 )∗ des Lebesgue-Maßes λ1 . Wir Dabei schreiben R beginnen mit dem Vergleich der beiden verschiedenen Begriffe von Nullmengen. R wir f f¨ ur das Integral im Sinne der Integralrechnung einer Variablen und f d(λ1 )∗ f¨ ur das Integral bzgl. des Maßes. Proposition 19.2.1 : F¨ ur N ⊆ R sind die folgenden Aussagen ¨ aquivalent:
19.2. CHARAKTERISIERUNG DES LEBESGUE-MASSES
359
(1) N ist eine Nullmenge (vgl. Proposition 8.2.2). e ⊆ R mit N ⊆ N e. (2) Es gibt eine λ1 -Nullmenge N (3) N ist eine (λ1 )∗ -Nullmenge. Beweis: Idee: Um die wesentliche Implikation (1) ⇒ (2)“ (die Umkehrung folgt aus Proposition 8.2.2) ” zu zeigen, approximiert man Nullmengen via Lemma 19.1.1 durch offene Mengen vom Maß schneidet diese dann.
1 n
und
(1) ⇒ (2)“: Wenn N Reine Nullmenge im Sinne von Proposition 8.2.2 ist, dann ist χN ” integrierbar, und es gilt χN = 0. Wir k¨onnen o.B.d.A. annehmen, daß N beschr¨ankt ist (andernfalls betrachte N ∩] − k, k[ f¨ ur alle k ∈ N). Jetzt zeigt Lemma 19.1.1, daß es zu jedem ² > 0 ein offenes U² mit N ⊆ U² ⊆ R und Z λ1 (U² ) ≤ χN + ² = ² e ∈ BR und f¨ e =T 1 setzt, dann gilt N ur alle n ∈ N gibt. Wenn man jetzt N n∈N U n e ) ≤ λ1 (U 1 ) ≤ λ1 (N n
1 . n
e aber eine λ1 -Nullmenge, die N enth¨alt. Damit ist N (2) ⇔ (3)“: Dies folgt direkt aus der Definition der Vervollst¨andigung. ” R e ) = χ e ist N e eine Nullmenge im Sinne von Proposition 8.2.2. (2) ⇒ (1)“: Wegen 0 = λ1 (N N ” Dann zeigt diese Proposition, daß N ebenfalls eine Nullmenge im Sinne von Abschnitt 8.2 ist.
Beachte, daß Proposition 19.2.1 insbesondere zeigt, daß (f.¨ u.) im Sinne von (8.3) dasselbe ist wie ((λ1 )∗ -f.¨ u.). Satz 19.2.2 : Sei f : R → R. Dann sind folgende Aussagen ¨ aquivalent: (1) f ist integrierbar (im Sinne von (7.2) und (7.3)). (2) f ist (λ1 )∗ -integrierbar. Wenn die beiden Aussagen zutreffen, dann stimmen auch die beiden Integralbegriffe u ¨berein. Beweis: Idee: Beide Beweisrichtungen beruhen wesentlich auf der M¨oglichkeit, die Funktionen durch Elementarfunktionen bzw. Stufenfunktionen zu approximieren. Dann wendet man jeweils den Satz von der monotonen Konvergenz an.
Wir nehmen zun¨achst an, daß (2) gilt. Nach (18.1) sind dann auch f ± bzgl. (λ1 )∗ integrierbar, und wir k¨onnen annehmen, daß f : R → [0, ∞[. Nach Lemma 18.2.3 gibt es eine monoton steigende Folge (φn )n∈N nichtnegativer einfacher Funktionen, die kleiner gleich f sind und punktweise gegen f konvergieren. Die φn sind nach Beispiel 18.1.2 alle lokal integrierbar (vgl. Proposition 8.4.4), und es gilt Z Z Z φn = φn dλ1 = φn d(λ1 )∗ .
360
KAPITEL 19. SPEZIELLE EIGENSCHAFTEN DES LEBESGUE-MASSES R R Wegen φn d(λ1 )∗ ≤ f d(λ1 )∗ zeigt der Satz 18.2.4 von der monotonen Konvergenz, daß es eine integrierbare Funktion fe: R → R gibt, gegen die (φn )n∈N (f.¨ u.) konvergiert mit Z Z fe = lim φn . n→∞
R Dann gilt auch f = fe (f.¨ u.) und somit ist f − fe eine Nullfunktion (d.h. |f | = 0). Jetzt zeigt Proposition 8.2.3, daß f im integrierbar ist mit Z Z Z Z Z f = fe = lim φn = lim φn d(λ1 )∗ = f d(λ1 )∗ . n→∞
n→∞
P∞ Sei jetzt umgekehrt f integrierbar im Sinne von (7.2) und (7.3). Weiter sei f ' j=1 fj f¨ ur 1 ∗ Stufenfunktionen fj . Mit Beispiel 18.1.2 ist klar, daß Stufenfunktionen (λ ) -integrierbar sind und die beiden Integralbegriffe f¨ ur solche Funktionen zusammenfallen. Setze sn =
n X
|fj |
j=1
und beachte, daß (sn )n∈N eine monoton steigende Folge von (λ1 )∗ -integrierbaren Funktionen ist, f¨ ur die gilt Z Z ∞ Z X sn d(λ1 )∗ = sn ≤ |fj | < ∞. j=1
Dann sagt der Satz 18.2.4 von der Monotonen Konvergenz, daß s := supn∈N sn eine (λ1 )∗ integrierbare Funktion ist, die Z Z 1 ∗ s d(λ ) = sup sn d(λ1 )∗ < ∞ n∈N
Pn
erf¨ ullt. Setze jetzt tn := j=1 fj . Dann ist tn eine (λ1 )∗ -integrierbare Funktion, und es gilt tn ≤ s. Weil tn nach Proposition 8.2.8 (f.¨ u.) gegen f konvergiert, zeigt der Satz 18.4.4 von der Dominierten Konvergenz, daß f (λ1 )∗ -integrierbar ist mit Z Z Z Z f d(λ1 )∗ = lim tn d(λ1 )∗ = lim tn = f. n→∞
n→∞
Korollar 19.2.3 : Sei E ⊆ R. Dann sind folgende Aussagen ¨ aquivalent: (1) E ist meßbar im Sinne von Abschnitt 8.4.1. (2) E ist (λ1 )∗ -meßbar. Beweis: Wende Satz 19.2.2 auf die charakteristischen Funktionen χE∩[−n,n] an.
Dieses Korollar zeigt zusammen mit Satz 19.2.2, daß die Vervollst¨andigung (λ1 )∗ von λ1 tats¨achlich nichts anderes ist als das Lebesgue-Maß aus Abschnitt 8.4.1. ¨ Ubung 19.2.1 : Projekt: Der Satz von Vitali: Es gibt kein translationsinvariantes Maß auf der Potenzmenge ” von R“.
19.3. AFFINE TRANSFORMATIONEN
19.3
361
Affine Transformationen
Betrachte den Maßraum (Rn , BRn , λn ). Wir untersuchen das Verhalten des Lebesgue-Maßes und von Lebesgue-Integralen unter affinen Transformationen des Raums. Wir erinnern daran, daß jede stetige Abbildung Φ : Rn → Rn meßbar ist. Insbesondere sind mit E alle verschobenen Mengen E + x = {y ∈ Rn | y − x ∈ E} mit x ∈ Rn meßbar. Proposition 19.3.1 : (Translationsinvarianz) Sei x ∈ Rn . Dann gilt (∀E ∈ BRn )
λn (E + x) = λn (E).
Beweis: Idee: Man weist die Gleichheit f¨ur Quader nach und argumentiert dann mit Satz 18.1.3. Wir definieren eine Abbildung µ : BRn → [0, ∞], E 7→ λn (E + x). Da die Verschiebung von Mengen mit Vereinigungen vertauscht: ∞ ∞ [ [ (Ej + x) = Ej + x, j=1
j=1
verifiziert man sofort, daß µ ein Maß auf (Rn , BRn ) ist. Wenn E = A1 × . . . × An ein meßbarer Quader ist, gilt E + x = (A1 + x1 ) × . . . × (An + xn ) sowie µ(E) = λ1 (A1 + x1 ) · . . . · λ1 (An + xn )
und λn (E) = λ1 (A1 ) · . . . · λ1 (An ).
Da die von den meßbaren Quadern erzeugte Algebra aus disjunkten Vereinigungen von Quadern besteht, erhalten wir mit Satz 18.1.3 die Gleichheit λn = µ, wenn wir die Behauptung f¨ ur n = 1 zeigen k¨onnen. Sei also n = 1. Wenn E ein Intervall oder eine endliche Vereinigung disjunkter Intervalle ist, ist die Gleichheit µ(E) = λ1 (E) offensichtlich. Also folgt die Behauptung wieder mit Satz 18.1.3, diesmal angewendet auf die von den Intervallen erzeugte Algebra, die offensichtlich aus endlichen Vereinigungen disjunkter Intervalle besteht.
Bemerkung 19.3.2 : Wenn E ∈ BR und 0 6= c ∈ R, dann zeigen dieselben Argumente wie im Beweis von Proposition 19.3.1, daß f¨ ur cE = {cx ∈ R | x ∈ E} gilt λ1 (cE) = |c|λ1 (E), weil dies f¨ ur Intervalle so ist. Also gilt die Formel Z Z 1 f (x)dλ (x) = |c| f (cx)dλ1 (x) f¨ ur alle einfachen Funktionen: Z Z Z 1 1 1 1 χcE (x)dλ (x) = λ (cE) = |c|λ (E) = |c| χE (x)dλ (x) = |c| χcE (cx)dλ1 (x). Durch Supremumsbildung folgt sie dann auch f¨ ur beliebige Funktionen in L+ (R) und schließlich f¨ ur 1 f ∈ L (R, C).
362
KAPITEL 19. SPEZIELLE EIGENSCHAFTEN DES LEBESGUE-MASSES
Satz 19.3.3 : Sei T ∈ HomR (Rn , Rn ) invertierbar. (i) Wenn f : Rn → C meßbar ist, dann ist auch f ◦ T meßbar. (ii) Wenn f ∈ L+ (Rn ) oder f ∈ L1 (Rn , C), dann gilt Z Z n f dλ = | det T | (f ◦ T )dλn . (iii) Wenn E ∈ BRn , dann gilt T (E) ∈ BRn und λn (T (E)) = | det T |λn (E). Beweis: Idee: Wesentlich ist die Formel in (ii). Man beweist sie mit dem Satz 18.3.5 von Fubini f¨ur Streckungen, Scherungen und Permutationen und n¨ utzt dann aus, daß sich jede invertierbare lineare Abbildung als Produkt von solchen schreiben l¨ aßt.
Die erste Aussage folgt mit Beispiel 17.2.1 und Bemerkung 17.2.2 sofort aus der Stetigkeit von T . Die letzte Aussage folgt aus der zweiten mit f = χE . Durch Aufspaltung in Real- und Imagin¨arteil sowie anschließende Aufspaltung in positiven und negativen Teil k¨onnen wir o.B.d.A. annehmen, daß f ∈ L+ (Rn ). Wenn die Gleichung aus (ii) f¨ ur zwei invertierbare lineare Abbildungen T1 , T2 ∈ HomR (Rn , Rn ) gilt, dann auch f¨ ur T1 ◦ T2 : Z Z f = | det T1 | f ◦ T1 Z = | det T1 || det T2 | (f ◦ T1 ) ◦ T2 Z = | det(T1 ◦ T2 )| f ◦ (T1 ◦ T2 ) Der Gaußalgorithmus zeigt, daß sich jede invertierbare lineare Selbstabbildung von Rn als ein Produkt von Abbildungen der Form M (x1 , . . . , xj−1 , xj , xj+1 , . . . , xn ) = (x1 , . . . , xj−1 , cxj , xj+1 , . . . , xn ) mit c 6= 0 und j ∈ {1, . . . , n} (Multiplikation), S(x1 , . . . , xj−1 , xj , xj+1 , . . . , xn ) = (x1 , . . . , xj−1 , xj + dxk , xj+1 , . . . , xn ) mit d ∈ R und j 6= k ∈ {1, . . . , n} (Scherung) sowie P (x1 , . . . , xj−1 , xj , xj+1 , . . . , xk−1 , xk , xk+1 , . . . , xn ) =
(x1 , . . . , xj−1 , xk , xj+1 , . . . , xk−1 , xj , xk+1 , . . . , xn )
mit j 6= k ∈ {1, . . . , n} (Permutation) geschrieben werden kann. Es gen¨ ugt also, die Behauptung f¨ ur diese drei Transformationen zu beweisen. Wir beginnen mit M . Nach dem Satz 18.3.5 von Fubini k¨onnen wir zuerst nach der j-ten Variablen integrieren: Z f dλn = Rn µZ ¶ Z = (x1 , . . . , xj−1 , xj , xj+1 , . . . , xn )dλ1 (xj ) dλn−1 (x1 , . . . , xj−1 , x ˆj , xj+1 , . . . , xn ), Rn−1
R
¨ DIFFEOMORPHISMEN 19.4. DIE TRANSFORMATIONSFORMEL FUR
363
wobei x ˆj bedeutet, daß diese Komponente weggelassen wird. Bemerkung 19.3.2 zeigt, daß Z Z (x1 , . . . , xj−1 , xj , xj+1 , . . . , xn )dλ1 (xj ) = |c| (x1 , . . . , xj−1 , cxj , xj+1 , . . . , xn )dλ1 (xj ), R
was
R
Z
Z f dλn = |c|
Rn
Rn
f (x1 , . . . , xj−1 , cxj , xj+1 , . . . , xn )dλn (x1 , . . . , xn )
zur Folge hat. Wegen det M = c zeigt dies die Behauptung f¨ ur M . F¨ ur S geht man genauso vor, ben¨ utzt aber statt Bemerkung 19.3.2 die Proposition 19.3.1, um Z Z 1 (x1 , . . . , xj−1 , xj , xj+1 , . . . , xn )dλ (xj ) = (x1 , . . . , xj−1 , xj , xj+1 + dxk , . . . , xn )dλ1 (xj ) R
R
zu zeigen, und die Relation det S = 1. Die Behauptung f¨ ur P folgt wegen det P = ±1 sofort aus Satz 18.3.5, weil es gleichg¨ ultig ist, ob man zuerst u ¨ber die Variable xj oder u ¨ber die Variable xk integriert.
¨ Ubung 19.3.1 : Sei A ∈ Mat(n × n, R) symmetrisch und positiv definit. Berechne Z e−hAx,xi dx. Rn
¨ Ubung 19.3.2 : Seien a, b, c > 0. Berechne das Volumen des Ellipsoids ¾ ½ ³ x ´2 ³ y ´2 ³ z ´2 + + ≤1 . E := (x, y, z) ∈ R3 | a b c
¨ Ubung 19.3.3 : Seien a1 , . . . , an Vektoren des Rn . Unter dem von a1 , . . . , an aufgespannten Parallelepiped versteht man die Menge ( n ) X P := λj aj : 0 ≤ λj ≤ 1 f¨ ur j = 1, . . . , n . j=1
Zeige:
19.4
λn (P ) = |det(a1 , . . . , an )|.
Die Transformationsformel fu ¨ r Diffeomorphismen
In diesem Abschnitt beweisen wir den eigentlichen Transformationssatz. Er behandelt folgende Situation: Ω ⊆ Rn ist eine offene Menge, und Φ : Ω → Rn ist eine stetig differenzierbare Abbildung, deren Bild Φ(Ω) ebenfalls offen ist. Außerdem soll die Umkehrabbildung Ψ : Φ(Ω) → Ω von Φ : Ω → Φ(Ω) existieren und selbst stetig differenzierbar sein (eine solche Abbildung nennt man einen Diffeomorphismus). Angestrebt wird die Transformationsformel Z Z f dλn = (f ◦ Φ)|JΦ | dλn , Φ(Ω)
Ω
wobei JΦ die Funktionaldeterminante von Φ ist. Diese Formel reduziert sich f¨ ur n = 1 und stetiges f auf die Substitutionsregel (6.6).
364
KAPITEL 19. SPEZIELLE EIGENSCHAFTEN DES LEBESGUE-MASSES
Die Grundidee f¨ ur den Beweis ist, Φ lokal durch sein Taylorpolynom erster Ordnung, d.h. eine affine Transformation, zu approximieren und die Resultate von Abschnitt 19.3 zu ben¨ utzen. Die Strategie ist, zun¨achst die Ungleichung Z Z f dλn ≤
(f ◦ Φ)|JΦ | dλn
Φ(Ω)
Ω
zu zeigen und diese dann auch f¨ ur Ψ statt Φ zu verwenden. Genauer: Betrachte zun¨achst die konstante Funktion 1. Dann wird die Ungleichung zu Z λn (Φ(Ω)) ≤ |JΦ |. Ω
Wenn man so eine Ungleichung f¨ ur jedes meßbare E statt Ω hat, l¨aßt sich die gesuchte Ungleichung mit Approximation von f durch einfache Funktionen gewinnnen. Proposition 19.4.1 : Sei U ⊆ Rn offen. Dann ist U die Vereinigung einer abz¨ ahlbaren Familie Q1 , Q2 , . . . von meßbaren Quadern Qj der Form (∗)
[a1 , a1 + h] × . . . × [an , an + h]
mit a = (a1 , . . . , an ) ∈ Rn , h > 0 und Qoj ∩ Qok = ∅.
(∀j 6= k ∈ N) Beweis:
Idee: Zerteile den Raum in W¨urfel, die durch benachbarte Punkte des Gitters
1 Zn 2k
aufgespannt werden. Suche diejenigen W¨ urfel heraus, die in U liegen, verfeinere dann durch Vergr¨ oßerung von k und w¨ ahle wieder die W¨ urfel, die nicht in den vorherigen W¨ urfeln, aber noch in U liegen. F¨ ur k → ∞ findet man alle Punkte von U .
F¨ ur k ∈ N sei Dk die Familie der Quader von der Form (∗) mit ai ∈
1 n 1 Z und h = k . k 2 2
S∞ F¨ ur Q 6= Q0 ∈ k=1 Dk mit Qo ∩ (Q0 )o 6= ∅ gilt entweder Q ⊆ Q0 oder Q0 ⊆ Q: Wenn n¨amlich Q ∈ Dk , Q0 ∈ Dk0 und Q 6⊆ Q0 , dann gibt es eine Ecke a von Q0 , die in Qo liegt. Also liegt a ∈ 21k0 Z nicht in dem Gitter 21k Z, und daher gilt k 0 > k. Aber dann liegen auch alle benachbarten Gitterpunkte von a in 21k0 Z immer noch in dem Quader Q, der ja die Kantenl¨ange 21k hat, und folglich gilt Q0 ⊆ Q. Jetzt definiere induktiv: F1 :=
[
Q
Q∈D1
Q⊆U
und
[
Fk :=
Q∈Dk ,Q⊆U S 0 (∀Q0 ∈ k−1 j=1 Dk ,Q ⊆Fk−1 )
Es gen¨ ugt jetzt zu zeigen, daß U=
∞ [
Q. Qo ∩(Q0 )o =∅
Fk ,
k=1
weil man Quader, die zu Fk beitragen, aber schon in einem Quader, der zu einem der F1 , . . . , Fk−1 beigetragen hat, enthalten sind, in der Aufz¨ahlung einfach nicht ber¨ ucksichtigt. Wenn x ∈ U , dann ist δ := inf kx − yk∞ > 0. y6∈U
1 2k
W¨ahle k ∈ N so, daß < δ. S Dann folgt Q ⊆ U f¨ ur alle Q ∈ DkSmit x ∈ Q. Da es immer so ∞ ∞ ein Q gibt und dieses dann in k=1 Fk liegt, sehen wir, daß U ⊆ k=1 Fk . Die Umkehrung ist klar, also folgt die Behauptung.
¨ DIFFEOMORPHISMEN 19.4. DIE TRANSFORMATIONSFORMEL FUR
365
Wir greifen jetzt die Notation vom Anfang des Abschnitts auf und beweisen die Transformationsformel in einer Reihe von Lemmata. Wir betrachten Rn als normierten Vektorraum mit der Maximumsnorm k · k∞ . Lemma 19.4.2 : Seien a = (a1 , . . . , an ) ∈ Ω, h > 0 und Q = {x ∈ Rn | ka − xk∞ ≤ h} ⊆ Ω. Dann gilt f¨ ur jedes invertierbare T ∈ HomR (Rn , Rn ) µ ¶n λn (Φ(Q)) ≤ | det T | λn (Q) sup kT −1 Φ0 (y)kop . y∈Q
Beweis: Idee: Sch¨atze kΦ(x) − Φ(a)k∞ mithilfe des Mittelwertsatz 11.1.9 f¨ur f¨ur x, a ∈ Q ab und kombiniere das Ergebnis mit Satz 19.3.3 und der Kettenregel, 11.1.4 um die Behauptung zu erhalten. Nach dem Mittelwertsatz 11.1.9 gilt f¨ ur alle x ∈ Q kΦ(x) − Φ(a)k∞ ≤ h sup kΦ0 (y)kop . y∈Q
2h sup(...)
Dann gilt λn (Φ(Q)) ≤ (2h sup kΦ0 (y)kop )n = λn (Q)(sup kΦ0 (y)kop )n . y∈Q
y∈Q
Dies beweist die Behauptung f¨ ur T = id. e = T −1 ◦ Φ und rechne mit Satz 19.3.3 und der Kettenregel F¨ ur den allgemeinen Fall setze Φ 11.1.4
=
e λn (T (Φ(Q))) e | det T | λ(Φ(Q))
≤
e 0 (y)kop )n | det T | λn (Q)(sup kΦ
λn (Φ(Q)) =
y∈Q
=
n
| det T | λ (Q)(sup kT −1 Φ0 (y)kop )n y∈Q
Lemma 19.4.3 : Seien a = (a1 , . . . , an ) ∈ Ω, h > 0 und Q = {x ∈ Rn | ka − xk∞ ≤ h} ⊆ Ω. Dann gilt Z n λ (Φ(Q)) ≤ |JΦ |. Q
Beweis: Idee: Zerlege den Quader in kleine Quader, auf denen man JΦ durch konstante lineare Abildungen approximiert. F¨ ur die wendet man dann Lemma 19.4.2 an.
366
KAPITEL 19. SPEZIELLE EIGENSCHAFTEN DES LEBESGUE-MASSES Wegen der Stetigkeit von Φ0 und der Kompaktheit von Q k¨onnen wir zu ² > 0 ein δ > 0 w¨ahlen mit kΦ0 (z)−1 Φ0 (y)knop ≤ 1 + ².
(∀y, z ∈ Q, ky − zk∞ ≤ δ)
Wir schreiben Q als Vereinigung von kompakten Quadern Q1 , . . . , Qm mit Seitenl¨ange kleiner als δ, d.h. (∀y, z ∈ Qj ) ky − zk∞ < δ.
δ
Außerdem nehmen wir an, daß (∀i 6= j ∈ {1, . . . , m}) Qoi ∩ Qoj = ∅. W¨ahle a(j) ∈ Qj f¨ ur j = 1, . . . , m so, daß | det Φ0 (a(j) )| = inf | det Φ0 (x)|. x∈Qj
Wendet man jetzt Lemma 19.4.2 auf Qj und Tj := Φ0 (a(j) ) an, so ergibt sich λn (Φ(Q)) ≤
m X
λn (Φ(Qj ))
j=1
≤
m X
à 0
(j)
| det Φ (a
n
)|λ (Qj )
j=1
≤
(1 + ²)
m X
!n 0
sup kΦ (a y∈Qj
| det Φ0 (a(j) )| λn (Qj )
j=1
Z ≤
(1 + ²)
=
(1 + ²)
| det Φ0 (x)| dλn (x) Z |JΦ (x)| dλn (x),
und dies beweist die Behauptung, weil ² > 0 beliebig war.
Lemma 19.4.4 : F¨ ur jede offene Teilmenge U ⊆ Ω gilt Z λn (Φ(U )) ≤
(j) −1
|JΦ | U
Beweis: Idee: Kombiniere Proposition 19.4.1 und Lemma 19.4.3.
)
0
Φ (y)kop
¨ DIFFEOMORPHISMEN 19.4. DIE TRANSFORMATIONSFORMEL FUR Schreibe U =
S∞ j=1
367
Qj wie in Proposition 19.4.1. Dann rechnet man mit Lemma 19.4.3 [ [ λn (Φ(U )) = λn (Φ( Qj )) = λn ( Φ(Qj )) j
≤
∞ X
j
λn (Φ(Qj ))
j=1
≤
∞ Z X Qj
j=1
=
Z X ∞ Z
∞ Z X
|JΦ | =
U j=1
Qo j
j=1
|JΦ |
χQoj |JΦ |
|JΦ |,
= U
weil alle Qj \ Qoj Nullmengen sind.
Lemma 19.4.5 : F¨ ur meßbare Teilmengen E ∈ BRn von Ω gilt Z n λ (Φ(E)) ≤ |JΦ | E
Beweis: Idee: Sch¨opfe Ω durch kompakte Mengen aus und wende auf diese den Satz 19.1.2 an. Dabei kann R
man die offenen Approximationen so w¨ ahlen, daß die Vereinigung U der offenen Mengen R ullt. Dann folgt die Behauptung aus Lemma 19.4.4. ² + E |JΦ | erf¨
U
|JΦ | ≤
Nach Proposition 19.4.1 l¨aßt sich Ω als Vereinigung von kompakten Mengen K1 , K2 , . . . schreiben, wobei wir o.B.d.A. annehmen k¨onnen, daß K1 ⊆ K2 ⊆ . . . gilt. F¨ ur j ∈ N setze Ej := E ∩ Kj . Zu ² > 0 gibt es nach Satz 19.1.2 offene Umgebungen Uj von Ej in Ω mit à !−1 (∀j ∈ N) λn (Uj \ Ej ) < ² 2j sup |JΦ |
.
x∈Kj
Daraus folgt mit Uj ∩ (Kj \ Kj−1 ) ⊆ (Uj \ Ej ) ∪ (Ej \ Ej−1 ), daß
F¨ ur U :=
Z S∞ j=1
² |JΦ | ≤ j + 2 Uj ∩(Kj \Kj−1 )
Z |JΦ |. Ej \Ej−1
Uj liefert der Satz 18.2.4 von der monotonen Konvergenz Z Z |JΦ | = lim S |JΦ | k→∞
U
≤
≤
lim
k→∞
lim
k→∞
k j=1 (Uj ∩(Kj \Kj−1 ))
k Z X j=1 k X j=1
|JΦ |
Uj ∩(Kj \Kj−1 )
Ã
² + 2j
µ = =
lim ²(1 − 2 Z ²+ |JΦ |. E
|JΦ | Ej \Ej−1
Z
−k
k→∞
!
Z
)+
|JΦ | Ek
¶
368
KAPITEL 19. SPEZIELLE EIGENSCHAFTEN DES LEBESGUE-MASSES
E U
Mit Lemma 19.4.4 finden wir n
Z
Z
n
λ (Φ(E)) ≤ λ (Φ(U )) ≤
|JΦ | ≤ ² + U
|JΦ |, E
und dies beweist die Behauptung, da ² > 0 beliebig war.
Satz 19.4.6 : (Transformationsformel) Sei Ω ⊆ Rn eine offene Menge, und sei Φ : Ω → Rn eine stetig differenzierbare Abbildung mit offenem Bild Φ(Ω) und stetig differenzierbarer Umkehrabbildung Ψ : Φ(Ω) → Ω. (i) Sei f : Φ(Ω) → C nichtnegativ oder integrierbar. Dann gilt Z Z f = (f ◦ Φ)|JΦ |. Φ(Ω)
Ω
(ii) Wenn E ⊆ Ω meßbar ist, dann ist auch Φ(E) meßbar, und es gilt Z λn (Φ(E)) = |JΦ |. E
Beweis: Idee: Wesentlich ist (i), und das folgt f¨ur einfache Funktionen aus Lemma 19.4.5. Nichtnegative Funktionen approximiert man durch einfache und ben¨ utzt den Satz 18.2.4 von der Monotonen Konvergenz. Integrierbare Funktionen spaltet man in Positiv- und Negativteil auf.
(ii) folgt mit f = χΦ(E) sofort aus (i). F¨ ur eine einfache Funktion φ = Lemma 19.4.5, daß Z X φ = aj λn (Aj ∩ Φ(Ω)) Φ(Ω)
j
≤
X
j
aj χAj liefert
Z aj
j
Z =
P
Φ−1 (Aj ∩Φ(Ω))
|JΦ |
(φ ◦ Φ)|JΦ |. Ω
Mit Lemma 18.2.3 k¨onnen wir f durch solche φ monoton approximieren, und dann liefert Satz 18.2.4 Z Z f ≤ (f ◦ Φ)|JΦ |. Φ(Ω)
Ω
Wir wenden diese Ungleichung jetzt auf Ψ und (f ◦ Φ)|JΦ | an, was wegen |JΨ (x)| = |JΦ ◦ Ψ(x)|−1 ergibt Z Z (f ◦ Φ)|JΦ | ≤ (f ◦ Φ ◦ Ψ) |JΦ ◦ Ψ| |JΨ | Ω Φ(Ω) Z = f. Φ(Ω)
¨ DIFFEOMORPHISMEN 19.4. DIE TRANSFORMATIONSFORMEL FUR
369
Damit ist der Satz bewiesen.
Beispiel 19.4.7 : (Polarkoordinaten) Betrachte die Abbildung Φ : ]0, ∞[×]0, π[×]0, 2π[→ R3 , (r, θ, φ) 7→ (r sin θ cos φ, r sin θ sin φ, r cos θ).
θ
r φ
Dann ist die darstellende Matrix von Φ0 (r, θ, φ) bzgl. der Standardbasis von R3 :
−r sin θ sin φ r sin θ cos φ . 0
sin θ cos φ r cos θ cos φ sin θ sin φ r cos θ sin φ cos θ −r sin θ Als Funktionaldeterminante erh¨alt man dann
JΦ (r, θ, φ) = r2 sin θ. Will man jetzt z.B. das Volumen der euklidischen Kugel B(0; R) mit Radius R ausrechnen, so stellt man fest, daß Φ(]0, R[×]0, π[×]0, 2π[) = B(0; R) \ {(x, y, z) ∈ R3 | y = 0 und x > 0}. Letzteres unterscheidet sich von B(0; R) nur durch eine Nullmenge, also gilt Z λ3 (B(0; R)) =
R
Z
0
0
π
Z
2π
r2 sin θ dφ dθ dr =
0
4 3 πR . 3
F¨ ur die Sph¨are S(0; R) = {v ∈ R3 | kvk = R} zeigt dann der Satz von der Monotonen Konvergenz, daß 4 λ3 (S(0; R)) = lim π((R + ²)3 − (R − ²)3 ) = 0. ²→0 3 Also ist die Sph¨are eine Lebesgue-Nullmenge. Beispiel 19.4.8 : (Zylinderkoordinaten) Betrachte die Abbildung Φ : ]0, ∞[×]0, 2π[×R → R3 , (r, φ, h) 7→ (r sin φ, r cos φ, h).
h φ
r
370
KAPITEL 19. SPEZIELLE EIGENSCHAFTEN DES LEBESGUE-MASSES
Dann ist die darstellende Matrix von Φ0 (r, φ, h) bzgl. der Standardbasis von R3 sin φ r cos φ 0 cos φ −r sin φ 0 . 0 0 1 Als Funktionaldeterminante erh¨alt man dann JΦ (r, φ, h) = −r. Will man jetzt z.B. das Volumen des Zylinders Z(R, H) := {(x, y, z) ∈ R3 | 0 < z < H, x2 + y 2 < R2 } ausrechnen, so stellt man fest, daß Φ(]0, R[×]0, 2π[×]0, h[) = Z(R, H) \ {(x, y, z) ∈ R3 | y = 0 und x > 0}. Letzteres unterscheidet sich von Z(H, R) nur durch eine Nullmenge, also gilt Z R Z 2π Z H 1 λ3 (Z(H, R)) = rdr dφ dh = πR2 H. 2 0 0 0 F¨ ur die Mantelfl¨ ache M (H, R) = {(x, y, z) ∈ R3 | 0 < z < H, x2 + y 2 = R2 } zeigt dann der Satz von der Monotonen Konvergenz, daß Hπ ((R + ²)2 − (R − ²)2 ) = 0. ²→0 2
λ3 (M (H, R)) = lim
Also ist die Mantelf¨ache eine Lebesgue-Nullmenge.
¨ Ubung 19.4.1 : (Polarkoordinaten) Betrachte die Abbildung Φ : ]0, ∞[×]0, π[n−2 ×]0, 2π[→ Rn , (r, θ, φ) 7→ x = (x1 , . . . , xn ), die durch x1
=
r cos θ1
x2
=
r sin θ1 cos θ2
x3
= .. .
r sin θ1 sin θ2 cos θ3
xn−1
=
r sin θ1 sin θ2 · . . . · sin θn−2 cos θn−1
xn
=
r sin θ1 sin θ2 · . . . · sin θn−2 sin θn−1
gegeben ist. F¨ ulle die Details der folgenden Rechnung ein: Wir setzen sj = sin θj , cj = cos θj . Dann ist die darstellende Matrix von Φ0 (r, θ1 , . . . , θn−1 ) bzgl. der Standardbasis von Rn : c1 −rs1 0 ... 0 s rc −rs 0 0 1 c2 1 c2 1 s2 .. .. .. .. . . . · . s1 · · · sn−2 cn−1 rc1 s2 · · · rsn−2 cn−1 · · −rs1 · · · sn−1 s1 · · · sn−2 sn−1 rc1 s2 · · · rsn−2 sn−1 · · rs1 · · · sn−2 cn−1
.
Indem man die Determinante dieser Matrix durch Entwicklung nach der ersten Zeile berechnet, kommt mit Induktion auf das Ergebnis JΦ (r, θ, φ) = rn−1 (sin θ1 )n−2 (sin θ2 )n−3 · · · (sin θn−2 ). (Beachte, daß es nicht so ohne weiteres m¨ oglich ist, mit diesem Resultat das Volumen der euklidischen Kugel B(0; R) ⊆ Rn zu bestimmen).
¨ DIFFEOMORPHISMEN 19.4. DIE TRANSFORMATIONSFORMEL FUR
371
¨ Ubung 19.4.2 : (Kugelvolumen) F¨ ur p > 0 und R > 0 setze n X
Bpn (0; R) := {x ∈ Rn |
|xj |p < Rp }
j=1
und zeige λn (Bpn (0; R)) = Rn 2n
Γ( p1 + 1) Γ( np + 1)
durch Nachpr¨ ufen der folgenden Rechnungen: • Es gen¨ ugt, die Formel f¨ ur R = 1 zu verifizieren und dann die die Transformationsformel f¨ ur die Streckung x 7→ Rx anzuwenden. • Setze αp (n) := λn (Bpn (0; 1)) und beachte, daß f¨ ur 0 < t < 1 gilt 1
Bpn−1 (0; (1 − |t|p ) p = {x0 ∈ Rn−1 | (x0 , t) ∈ Bpn (0; 1)} sowie
1
λn−1 (Bpn−1 (0; (1 − |t|p ) p ) = (1 − |t|p )
n−1 p
αp (n − 1).
• Ben¨ utze die Beta-Funktion f¨ ur folgende Rechnung: Z
αp (n)
1
n−1 (1 − |t|p ) dt p µ ¶ 2 n+p−1 1 αp (n − 1)B , p p p
=
αp (n − 1)
1
= =
2αp (n − 1)
• Zeige mit Induktion, daß αp (n) = 2n
+ 1)Γ( p1 + 1) Γ( n−1 p Γ( np + 1)
Γ( p1 + 1) Γ( np + 1)
.
F¨ ur den Fall p = 2 haben wir jetzt das Volumen der n-dimensionalen euklidischen Kugel berechnet: n
λn (B2n (0; 1)) = 2n
Γ( 32 ) π2 = n+2 . Γ( n+2 ) Γ( ) 2 2
Mit diesen Resultaten zeigt man leicht, daß die Mengen Spn (0; R) := {x ∈ Rn |
n X
|xj |p = Rp }
j=1
Lebesgue-Nullmengen sind. ¨ Ubung 19.4.3 : Sei γ > 0. Berechne den Inhalt der Fl¨ ache, die von der positiven x-Achse und der Spur der Archimedischen Spirale f : [0, 2π] → R2 , f (t) := (γt cos t, γt sin t) eingeschlossen wird, d.h., zu berechnen ist der Fl¨ acheninhalt von M := {(r cos φ, r sin φ) ∈ R2 | 0 ≤ r ≤ γφ,
¨ Ubung 19.4.4 : Beweise die bekannte Identit¨ at Z
2
e−x dx =
0 ≤ φ ≤ 2π}.
√ π
R
auf folgende Weise: Sei (r, φ) → (r cos φ, r sin φ) die Transformation auf Polarkoordinaten. Berechne mit der Transformationsformel das Integral Z 2
e−x R2
−y 2
d(x, y).
372
KAPITEL 19. SPEZIELLE EIGENSCHAFTEN DES LEBESGUE-MASSES
¨ Ubung 19.4.5 : Berechne das Volumen des Kugelsektors n o p S := (x, y, z) ∈ R3 : x2 + y 2 + z 2 ≤ r2 ; x2 + y 2 ≤ cz , wobei c und r positive Konstanten sind. ¨ Ubung 19.4.6 : Sei M ein k-dimensionaler Teilraum des Rn mit k < n. Zeige, daß M eine Lebesgue Nullmenge ist.
Kapitel 20
Immersionen und Untermannigfaltigkeiten In diesem Kapitel f¨ uhren wir die mathematische Beschreibung von k-dimensionale “Fl¨ achen” in n-dimensionalen R¨ aumen ein. Zun¨ achst betrachten wir lokale Parametrisierungen durch offene Teilmengen des k-dimensionalen Raumes, sp¨ ater beweisen wir eine Charakterisierung als (lokale) Nullstellenmengen von differenzierbaren Abbildungen. Mit diesen Begriffsbildungen an der Hand studieren wir dann die Tangentialvektoren an die “Fl¨ achen.”
20.1
Immersionen
Sei U ⊆ Rk offen. Eine stetig differenzierbare Abbildung ϕ : U → Rn 0 k n nennen wir eine Immersion, ¡ wenn ¢ die lineare Abbildung ϕ (u) ∈ Hom(R , R ) in jedem Punkt u ∈ U 0 injektiv ist, d.h. es gilt rank ϕ (u) = k. Man beachte, daß dies nur f¨ ur k ≤ n m¨oglich ist. Wir stellen uns hier vor, daß ϕ eine Parametrisierung der Menge ϕ(U ) ⊆ Rn ist. Solche Parametrisierungen haben den Vorteil, daß wir durch sie Integralen u ¨ber die Menge ϕ(U ) einen Sinn geben k¨onnen, indem wir sie als Integrale u ¨ber die offene Menge U ⊆ Rk interpretieren. F¨ ur den Spezialfall k = 1 ist ϕ eine Kurve. In diesem Fall ist ϕ genau dann eine Immersion, wenn ϕ0 (u) 6= 0 ist.
Beispiel 20.1.1 : Ist U ⊆ Rk offen und f : U → R eine differenzierbare Funktion, so ist ¡ ¢ ϕ : U → Rk+1 , x 7→ x, f (x) eine Immersion.
373
374
KAPITEL 20. IMMERSIONEN UND UNTERMANNIGFALTIGKEITEN
In der Tat erhalten wir mit der Spaltenschreibweise f¨ ur Vektoren die (k + 1) × k-Matrix: 1 0 0 ··· 0 0 1 0 ··· 0 .. µ ¶ . 1 k 0 . ϕ (u) = = .. f 0 (u) . 0 0 0 0 ··· 1 ∂f (u) ∂f (u) ··· ∂x1 ∂xn ¡ ¢ 0 Da die ersten k-Zeilen der Matrix von ϕ (u) eine Einheitsmatrix sind, gilt rank ϕ0 (u) = k f¨ ur alle u. Beispiel 20.1.2 : Wir betrachten die Funktion Φ : R2 → R3 ,
r2 cos ϕ (r, ϕ) 7→ r2 sin ϕ . r3
1 0.5 0 -0.5 -1 1 0.5 0 -0.5 -1 -1 -0.5 0 0.5 1
Die Matrix der linearen Abbildung Φ0 (r, ϕ) ist 2r cos ϕ −r2 sin ϕ Φ0 (r, ϕ) = 2r sin ϕ r2 cos ϕ 3r2 0 Man verifiziert leicht, daß Φ0 (r, ϕ) genau dann Rang 2 hat, also injektiv ist, wenn r 6= 0 ist. Man versuche sich die Teilmenge Φ(R2 ) ⊆ R3 vorzustellen. Sie entsteht durch Rotation der Menge {(r2 , 0, r3 ) | r ≥ 0} um die dritte Achse. Solche und ¨ahnliche Singularit¨aten werden durch die Forderung der Injektivit¨at von dΦ in jedem Punkt vermieden. Die Einschr¨ankung von Φ auf R2 \ {(0, 0)} ist eine Immersion. Allerdings ist die Abbildung Φ nicht injektiv. Beispiel 20.1.3 : (Parametrisierung der zweidimensionalen Sph¨are) Wir betrachten die Abbildung cos ϕ cos θ P : R2 → R3 , (ϕ, θ) 7→ sin ϕ cos θ . sin θ 1 0.5 0 -0.5 -1 1 0.5 0 -0.5 -1 -1 -0.5 0 0.5 1
20.1. IMMERSIONEN
375
Die Jacobimatrix von P ist gegeben durch
− sin ϕ cos θ P 0 (ϕ, θ) = cos ϕ cos θ 0
− cos ϕ sin θ − sin ϕ sin θ . cos θ
Diese Matrix hat genau dann den Rang 2, wenn cos θ 6= 0 ist. Die Einschr¨ankung von P auf die offene Menge R×] − π2 , π2 [ ist daher eine Immersion, und £ ¤ P (R × − π2 , π2 ) = {(x, y, z) | x2 + y 2 + z 2 = 1, |z| 6= 1} ist die Einheitssph¨are, aus der wir den Nord- und den S¨ udpol herausgenommen haben, da in diesen Punkten die Ableitung von P nicht injektiv ist. Auch hierbei handelt es sich um eine Rotationsfl¨ache, die durch Rotation des offenen Halbkreisbogens {(cos θ, 0, sin θ) | θ ∈] − π2 , π2 [} = {(x, 0, z) | x2 + z 2 = 1, x > 0} um die z-Achse entsteht. Betrachtet man die Einheitssph¨are als ein Modell f¨ ur die Erdkugel, so lassen sich ϕ und θ folgenderϕ maßen geometrisch deuten. Die Zahl 2π 360 entspricht der (¨ ostlichen) geographischen L¨ ange, die dadurch normiert ist, daß man Greenwich die L¨ange 0 zuordnet. Die Zahl 2θ 90 entspricht der geographischen π ¨ Breite, die dadurch normiert ist, daß der Aquator der nullte Breitengrad ist. Beispiel 20.1.4 : (Allgemeine Rotationsfl¨achen) Sei I ⊆ R ein offenes Intervall und r(t) γ : I → R3 , t 7→ 0 z(t) eine stetig differenzierbare Kurve, die in der x-z-Ebene liegt. Wir nehmen an, daß die Kurve in der rechten Halbebene liegt, d.h. r(t) > 0 gilt f¨ ur alle t ∈ I. Wir erhalten nun eine stetig differenzierbare Abbildung r(t) cos ϕ Φ : I × R → R3 , (t, ϕ) 7→ r(t) sin ϕ z(t) mit dem Bild
¡ ¢ M := Φ(I × R) = { x, y, z(t) | x2 + y 2 = r(t)2 , t ∈ R}.
Das Bild dieser Funktion entsteht durch Rotation des Bildes von γ um die z-Achse. Die Funktionalmatrix von Φ ist 0 r (t) cos ϕ −r(t) sin ϕ Φ0 (t, ϕ) = r0 (t) sin ϕ r(t) cos ϕ . z 0 (t) 0 Wegen r(t) > 0 f¨ ur alle t ∈ I hat diese Matrix genau dann Rang 2, wenn z 0 (t) 6= 0 oder r0 (t) 6= 0 ist, d.h. 0 wenn γ (t) 6= 0 ist. Ist also γ eine Immersion, so u ¨bertr¨agt sich dies auf Φ.
¨ Ubung 20.1.1 : Welche der folgenden Kurven sind Immersionen? (i) f : R → R3 , t 7→ (r cos t, r sin t, ct), r > 0, c 6= 0 (Schraubenlinie), (ii) f : R → R2 , t 7→ (t2 , t3 ) (Neilsche Parabel). ¨ Ubung 20.1.2 : Es sei
Φ :]0, ∞[×]0, 2π[, F¨ ur welche (r, ϕ) ist Φ eine Immersion?
r3 cos ϕ 3 (r, ϕ) 7→ r sin ϕ . r2
376
KAPITEL 20. IMMERSIONEN UND UNTERMANNIGFALTIGKEITEN
20.2
Untermannigfaltigkeiten
Eine Teilmenge M ⊆ Rn heißt k-dimensionale C m -Untermannigfaltigkeit, wenn f¨ ur jeden Punkt p ∈ M eine offene Umgebung U ⊆ Rn und einen C m -Diffeomorphismus ϕ : U → V , V ⊆ Rn offen, so existiert, daß ϕ(U ∩ M ) = V ∩ (Rk × {0}) gilt, wobei wir Rn = Rk × Rn−k schreiben. Die Teilmenge sieht also in einem gewissen Sinn “lokal” so aus wie Rk in Rn . F¨ ur k = n − 1 sprechen wir von Hyperfl¨ achen im Rn .
Um zu erkl¨aren, in welcher Beziehung der Begriff der Immersion zum Begriff der k-dimensionalen Untermannigfaltigkeit des Rn steht, m¨ ussen wir uns Klarheit u ¨ber einige topologische Begriffe verschaffen. Es seien (X, µ) und (Y, ν) metrische R¨aume und ϕ : X → Y eine stetige Abbildung. Wir nennen die Abbildung ϕ eine Einbettung, wenn ϕ injektiv ist und die Umkehrabbildung ψ : ϕ(X) → X,
ϕ(x) 7→ x
bzgl. der von Y auf ϕ(X) induzierten Metrik stetig ist. Beispiel 20.2.1 : (a) Wir betrachten die Abbildung γ : [0, 2π[→ R2 ,
t 7→ (cos t, sin t). 1
0.5
-1
-0.5
0.5
1
-0.5
-1
Dann ist γ eine injektive Immersion mit γ([0, 2π[) = {(x, y) ∈ R2 : x2 + y 2 = 1}. Die Umkehrung η : γ([0, 2π[) → [0, 2π[, ist nicht stetig, denn es gilt γ(2π −
γ(t) 7→ t
1 n)
→ γ(0), aber ¡ ¢ η γ(2π − n1 ) = 2π −
1 n
konvergiert nicht in dem metrischen Raum [0, 2π[. Die Abbildung γ ist also keine Einbettung. (b) Wir betrachten die Abbildung γ : R → R2 ,
t 7→ (sin t, sin 2t).
20.2. UNTERMANNIGFALTIGKEITEN
377 1
0.5
-1
-0.5
0.5
1
-0.5
-1
Wir haben γ(t) ˙ = (cos t, 2 cos 2t) 6= 0 f¨ ur alle t ∈ R, also ist γ eine Immersion. Weiter ist klar, daß γ eine 2π-periodische Kurve ist mit γ(−t) = γ(t). Sind s, t ∈ [0, 2π[ mit γ(s) = γ(t), so haben sin t und sin s das gleiche Vorzeichen. Nehmen wir also t ∈ [0, π] an, so ist auch s ∈ [0, π]. Ist s 6= t, so haben wir s = π − t und daher sin(2t) = sin(2s) = sin(2π − 2t) = − sin(2t), somit sin(2t) = 0 und folglich t = 0 oder t = π, da sich f¨ ur t = π2 die Beziehung s = t ergibt. Hieraus sehen wir, daß γ auf dem offenen Intervall ]0, 2π[ injektiv ist. Es gilt sogar γ(R) = γ(]0, 2π[), da γ(0) = γ(π) = (0, 0) ist. Die Abbildung γ|]0,2π[ ist ebenfalls keine Einbettung. Wir kommen sp¨ater noch auf dieses Beispiel zur¨ uck.
Wir zeigen, daß die Bilder von Immersionen lokal Untermannigfaltigkeiten des Rn sind. Satz 20.2.2 : Sei U ⊆ Rk offen und ϕ : U → Rn eine C m -Immersion. Dann existiert zu jedem p ∈ U eine offene Umgebung V ⊆ U , so daß ϕ(V ) ⊆ Rn eine k-dimensionale C m -Untermannigfaltigkeit und ϕ : V → Rn eine Einbettung ist. Beweis: Idee: Ben¨utze den Satz 12.2.2
ϕ
¡ ¢ Sei ϕ = (ϕ1 , . . . , ϕn ). Wegen rank ϕ0 (p) = k d¨ urfen wir nach einer Umnummerierung der Koordinaten o.B.d.A. annehmen, daß die Matrix ´ ³ ∂ϕ i (p) ∂xj i,j=1,...,k invertierbar ist (das ist der obere k × k-Block der Matrix von ϕ0 (p)). Sei ϕ e := (ϕ1 , . . . , ϕk ) : U → Rk . Dann ist ϕ e0 (p) invertierbar. Nach dem Satz u ¨ber die Umkehrfunktion existiert eine offene Umgebung V von p in U , so daß ϕ| e V ein C m -Diffeomorphismus ist. Wir definieren nun Φ : V × Rn−k → (v, x) = 7→
Rn , (v1 , . . . , vk , xk+1 , . . . , xn ) ¡ ¢ ϕ(v) + x = ϕ1 (v), . . . , ϕk (v), ϕk+1 (v) + xk+1 , . . . , ϕn (v) + xn .
Dann ist Φ ein C m -Diffeomorphismus auf ϕ(V e ) × Rn−k , denn ¡ −1 ¡ −1 ¢ ¡ −1 ¢¢ Φ−1 (w, y) = ϕ e (w), yk+1 − ϕk+1 ϕ e (w) , . . . , yn − ϕn ϕ e (w)
378
KAPITEL 20. IMMERSIONEN UND UNTERMANNIGFALTIGKEITEN ist eine C m -Abbildung. Weiter ist ¡ ¢ Φ−1 ϕ(v) = (v, 0) und somit
¡ ¢ Φ−1 ϕ(V ) = V × {0} ⊆ Rk × Rn−k = Rn .
Also ist ϕ(V ) eine k-dimensionale C m -Untermannigfaltigkeit des Rn . −1 k Wir zeigen noch, daß ϕ : U → Rn eine Einbettung ¡ −1 ¢ist, indem wir zeigen,−1daß ϕ : ϕ(U ) → R −1 stetig ist. Das folgt aber aus Φ (x) = ϕ (x), 0 f¨ ur x ∈ ϕ(V ) da Φ stetig ist.
Lemma 20.2.3 : Sei M ⊆ Rn eine k-dimensionale C m -Untermannigfaltigkeit. Dann existiert zu jedem p ∈ M eine offene Umgebung V ⊆ Rn und eine offene Teilmenge U ⊆ Rk , so daß M ∩ V das Bild einer Immersion ϕ : U → Rn ist, die eine Einbettung ist. Beweis: Zun¨achst finden wir eine offene Umgebung V ⊆ Rn von p und einen C m -Diffeomorphismus Φ : V → Φ(V ) ⊆ Rn , so daß Φ(V ∩ M ) = Φ(V ) ∩ (Rk × {0}) gilt. Sei U := {x ∈ Rk | (x, 0) ∈ Φ(V ∩ M )} und ϕ : U → Rn ,
x 7→ Φ−1 (x, 0).
Dann ist ϕ(U ) = M ∩ V , und f¨ ur x ∈ U ist ϕ0 (x) = (Φ−1 )0 (x, 0) ◦ η, wobei η : Rk → Rn durch η(x) = (x, 0) definiert ist. Hieraus sehen wir, daß ϕ0 (x) f¨ ur alle x ∈ U injektiv ist, d.h. ϕ ist eine Immersion. Da die inverse Abbildung von ϕ : U → ϕ(U ) durch Φ|ϕ(U ) gegeben ist, ist ϕ eine Einbettung.
Satz 20.2.4 : (Parametrisierungssatz) Eine Teilmenge M ⊆ Rn ist genau dann eine k-dimensionale C m -Untermannigfaltigkeit, wenn es zu jedem Punkt p ∈ M eine offene Umgebung V ⊆ Rn , eine offene Teilmenge U ⊆ Rk und eine C m -Immersion ϕ : U → Rn mit ϕ(U ) = M ∩ V gibt, die eine Einbettung ist. Beweis: Ist M eine k-dimensionale C m -Untermannigfaltigkeit und p ∈ M , so wurde die Existenz von ϕ schon in Lemma 20.2.3 gezeigt. Es bleibt daher nur noch die Umkehrung zu zeigen. Sei dazu p ∈ M und V ⊆ Rn eine offene Umgebung von p sowie ϕ : U → Rn eine C m Immersion mit ϕ(U ) = M ∩ V , die eine Einbettung ist. Mit Satz 20.2.2 finden wir eine offene Umgebung W ⊆ U von ϕ−1 (p), so daß ϕ(W ) ⊆ Rn eine k-dimensionale C m -Untermannigfaltigkeit ist. Da ϕ eine Einbettung ist, ist ϕ(W ) offen in M ∩ V . Also existiert eine offene Teilmenge Vp ⊆ V mit ϕ(W ) = Vp ∩ M . Wir haben also f¨ ur jeden Punkt p ∈ M eine Umgebung Vp in Rn gefunden, so daß Vp ∩ M eine k-dimensionale C m -Untermannigfaltigkeit ist. Jetzt folgt direkt aus der Definition, daß M dann auch eine k-dimensionale C m -Untermannigfaltigkeit ist.
20.2. UNTERMANNIGFALTIGKEITEN
379
Die Immersionen ϕ : U → M ⊆ Rn , deren Existenz im Parametrisierungssatz 20.2.4 sichergestellt wird, nennen wir Parametrisierungen oder Karten der offenen Teilmenge ϕ(U ) ⊆ M . Um die Notation zu vereinfachen, schreiben wir auch (ϕ, U ) f¨ ur eine Karte ϕ : U → M . Da U eine offene Teilmenge von Rk −1 ist, stellt man sich die Funktionen (ϕ )j : ϕ(U ) → R, j = 1, . . . , k, als die Koordinaten eines Punktes p ∈ ϕ(U ) vor. F¨ ur p = ϕ(x1 , . . . , xk ) sind also x1 , . . . , xk die Koordinaten von p bzgl. der Karte ϕ. Nat¨ urlich erh¨alt man f¨ ur verschiedene Karten verschiedene Koordinaten f¨ ur gleiche Punkte. Man hat sich daher die Frage vorzulegen, was man u ¨ber die Wechsel von Koordinatensystemen sagen kann. Satz 20.2.5 : (Parameter-Transformation) Sei M ⊆ Rn eine k-dimensionale C m -Untermannigfaltigkeit und ϕj : Uj → Vj := ϕj (Uj ) ⊆ M, j = 1, 2, Karten der Klasse C m mit V := V1 ∩ V2 6= ∅. Dann sind Wj := ϕ−1 j (V ) offene Teilmengen von Uj und ψ := ϕ−1 2 ◦ ϕ1 |W1 : W1 → W2 ist ein C m -Diffeomorphismus. Beweis:
Φ
ϕ1
ϕ2
ψ
Da V eine offene Teilmenge von Vj und ϕj stetig ist, ist Wj als Urbild einer offenen Teilmenge von Vj offen. Nach Konstruktion ist ψ stetig mit der stetigen Umkehrabbildung ψ −1 := ϕ−1 1 ◦ ϕ2 |W2 : W2 → W1 . Wenn wir gezeigt haben, daß ψ eine C m -Abbildung ist, so erhalten wir dies ebenfalls f¨ ur ψ −1 , und der Satz ist bewiesen. Es bleibt daher zu zeigen, daß ψ eine C m -Abbildung ist. Hierzu reicht es einzusehen, daß jeder Punkt in x ∈ W1 eine offene Umgebung hat, auf der ψ eine C m -Abbildung ist. Gem¨aß der Definition einer Untermannigfaltigkeit, existiert eine offene Umgebung Ve von ϕ1 (x) mit M ∩ Ve ⊆ V (das d¨ urfen wir zus¨atzlich annehmen) und ein C m -Diffeomorphismus e e e Φ : V → Φ(V ) mit Φ(M ∩ V ) = Φ(Ve ) ∩ (Rk × {0}). Nun ist Φ ◦ ϕ1 = (g1 , . . . , gk , 0, . . . , 0)
und
Φ ◦ ϕ2 = (h1 , . . . , hk , 0, . . . , 0).
−1 k k e e Seien G := (g1 , . . . , gk ) : ϕ−1 die 1 (M ∩ V ) → R ¡ und H ¢ :=k (h1 , . . k. , hk ) : ϕ2 (M ∩ V ) → R m 0 0 zugeh¨ o rigen C -Abbildungen. Dann ist G ϕ (x) : R → R injektiv weil (Φ ◦ ϕ ) (x) = 1 1 ¡ ¢ Φ0 ϕ1 (x) ◦ ϕ01 (x) : Rk → Rn injektiv ist. Aber dann ist G0 (x) sogar bijektiv und nach dem
380
KAPITEL 20. IMMERSIONEN UND UNTERMANNIGFALTIGKEITEN f1 von x ∈ W1 so, Satz 12.2.2 u ¨ber die lokale Umkehrfunktion gibt es eine offene Umgebung W m f f f2 daß G : W1 → G(W1 ) ein C -Diffeomorphismus ist. Analog gibt es eine offene Umgebung W m f2 → H(W f2 ) ein C -Diffeomorphismus ist. von y = ψ(x) ∈ W2 so, daß H : W f1 ∩ ϕ−1 (H(W f2 )) von W1 und w = ψ(z). Dann Sei jetzt z in der offenen Teilmenge Ux := W 1 gilt ϕ2 (w) = ϕ1 (z), also (G(z), 0) = Φ ◦ φ1 (z) = Φ ◦ φ2 (w) = (H(z), 0) ∈ (Rk × {0}). Dies zeigt, daß ψ|Ux = H −1 ◦ G|Ux : Ux → Rk und damit die Behauptung.
¨ Ubung 20.2.1 : Nach Beispiel 20.2.1 (b) ist γ :]0, 2π[→ R2 ,
t 7→ (sin t, sin 2t)
eine Immersion. Zeige, daß γ keine Einbettung ist. ¨ Ubung 20.2.2 : Die Funktionen fi : R4 → R, i = 1, 2, 3, seien definiert durch f1 (x1 , x2 , x3 , x4 )
:=
x1 x3 − x22 ,
f2 (x1 , x2 , x3 , x4 )
:=
x2 x4 − x23 ,
f3 (x1 , x2 , x3 , x4 )
:=
x1 x4 − x2 x3 .
Zeige, daß M := {x ∈ R4 \ {0}|f1 (x) = f2 (x) = f3 (x) = 0} eine zweidimensionale Untermannigfaltigkeit des R4 ist. ¨ Ubung 20.2.3 : Sei M ⊂ Rm eine k-dimensionale und N ⊂ Rn eine `-dimensionale Untermannigfaltigkeit. Zeige, daß M × N ⊆ Rn+m eine (k + `)-dimensionale Untermannigfaltigkeit ist.
20.3
Nullstellenmengen differenzierbarer Abbildungen
Sei M ⊆ Rn eine k-dimensionale C m -Untermannigfaltigkeit, und p ∈ M . Dann gibt es eine offene Umgebung U ⊆ Rn von p, eine offene Menge V ⊆ Rn und einen C m -Diffeomorphismus ϕ : U → V mit ϕ(U ∩ M ) = V ∩ (Rk × {0}).
(∗)
Wenn wir ϕ = (ϕ1 , . . . , ϕn ) mit ϕj : U → R schreiben, dann zeigt (∗), daß U ∩ M = {x ∈ U | ϕk+1 (x) = . . . = ϕn (x) = 0}. n-k
R
Rn-k
R
n
ϕ
R
U V
k
20.3. NULLSTELLENMENGEN DIFFERENZIERBARER ABBILDUNGEN
381
Wir fassen ϕk+1 , . . . , ϕn zu einer Abbildung F : U → Rn−k zusammen und beschreiben so U ∩ M als Nullstellenmenge von F . Beachte, daß f¨ ur jedes x ∈ U die Ableitung F 0 (x) = (ϕ0k+1 , . . . , ϕ0n ) ∈ Hom(Rn , Rn−k ) surjektiv ist, weil die Ableitung
ϕ0 (x) = (ϕ01 , . . . , ϕ0n ) ∈ End(Rn )
bijektiv ist. Wir wollen zeigen, daß umgekehrt jede Teilmenge von Rn , die sich lokal als Nullstellenmenge einer C -Abbildung mit Werten in Rn−k und surjektiven Ableitungen eine Untermannigfaltigkeit ist. Diese Erkenntnis liefert dann sofort eine Vielzahl von Beispielen von Untermannigfaltigkeiten. Zuerst zeigen wir mit Hilfe des Satzes 12.2.1 u ¨ber implizite Funktionen, daß solche Nullstellenmengen als Funktionsgraphen aufgefaßt werden k¨onnen. m
Lemma 20.3.1 : Sei M ⊆ Rn eine Teilmenge und p ∈ M . Weiter sei U eine offene Umgebung von p in Rn und F : U → Rn−k eine C m -Abbildung mit U ∩ M = {x ∈ U | F (x) = 0} und (∀x ∈ U )
F 0 (x) surjektiv.
Dann gibt es (evtl. nach Umnummerierung der Koordinaten) offene Umgebungen U 0 ⊆ Rk und U 00 ⊆ Rn−k von p0 := (p1 , . . . , pk ) bzw. p00 := (pk+1 , . . . , pn ) sowie eine C m -Abbildung g : U 0 → U 00 mit (U 0 × U 00 ) ∩ M = {(x0 , x00 ) ∈ U 0 × U 00 | x00 = g(x0 )}. Beweis: Betrachte F 0 (p) ∈ Hom(Rn , Rn−k ) als (n − k) × n-Matrix und beachte, daß die Voraussetzung an F 0 bedeutet rank(F 0 (p)) = n − k. Also sind die Zeilen von F 0 (p) linear unabh¨angig und wir finden eine Auswahl von Spalten i1 , . . . , in−k , f¨ ur die à ∂F1 ! 1 . . . ∂x∂F (p) ∂xi1 (p) in−k 6= 0. det ∂Fn−k ∂Fn−k (p) ∂xi (p) . . . ∂xi 1
n−k
Durch Vertauschen der Koordinaten k¨onnen wir annehmen, daß ij = j + k, also ist die Ableitung von F an der Stelle p = (p0 , p00 ) nach den letzten n − k Variablen invertierbar. Jetzt sagt der Satz 12.2.1 u ¨ber implizite Funktion, daß es Umgebungen U 0 und U 00 von p0 bzw. p00 gibt mit (∀x0 ∈ U 0 )(∃!x00 ∈ U 00 ) F (x0 , x00 ) = 0. Außerdem garantiert der Satz die Existenz einer differenzierbaren Abbildung g : U 0 → U 00 mit (∀(x0 , x00 ) ∈ U 0 × U 00 )
F (x0 , g(x0 )) = 0.
Zusammen erh¨alt man, daß (U 0 × U 00 ) ∩ M = {(x0 , x00 ) ∈ U 0 × U 00 | x00 = g(x0 )}. Es bleibt jetzt nur noch zu zeigen, daß g sogar in der Klasse C m ist. Da aber, wieder nach dem Satz 12.2.1 u ¨ber implizite Funktionen, die Ableitung g 0 als eine Kombination von g und ¨ der ersten Ableitung von F ausgedr¨ uckt werden kann, sieht man mit Induktion (Ubung!), daß g genauso oft stetig differenzierbar ist wie F .
382
KAPITEL 20. IMMERSIONEN UND UNTERMANNIGFALTIGKEITEN
Satz 20.3.2 : Sei M ⊆ Rn eine Teilmenge und p ∈ M . Weiter sei U eine offene Umgebung von p in Rn und F : U → Rn−k eine C m -Abbildung mit U ∩ M = {x ∈ U | F (x) = 0} und (∀x ∈ U )
F 0 (x) surjektiv.
Dann ist M eine k-dimensionale C m -Untermannigfaltigkeit von Rn . Beweis: W¨ahle U 0 , U 00 und g wie in Lemma 20.3.1 und setze ϕ : U 0 × U 00 → Rn , (x0 , x00 ) 7→ (x0 , x00 − g(x0 )). Diese Abbildung ist offensichtlich injektiv. Außerdem l¨aßt sich ϕ0 (x) durch die partiellen Ableitungen nach den x0 und den x00 Variablen wie folgt schreiben: µ ¶ idRk −g 0 (x0 ) ϕ0 (x) = 0 idRn−k Damit ist ϕ0 (x) invertierbar und der Satz 12.2.2 u ¨ber das lokale Inverse zeigt jetzt, daß ϕ : U 0 × U 00 → V := ϕ(U 0 × U 00 ) (evtl. nach Verkleinerung von U 0 und U 00 ) ein Diffeomorphismus ist. Die Formel f¨ ur ϕ0 zeigt m auch, daß ϕ sogar von der Klasse C ist. Wegen (U 0 × U 00 ) ∩ M = {(x0 , x00 ) ∈ U 0 × U 00 | x00 = g(x0 )} gilt ϕ((U 0 × U 00 ) ∩ M )
= {(x0 , x00 − g(x0 )) | (x0 , x00 ) ∈ U 0 × U 00 ; F (x0 , x00 ) = 0} = {(x0 , x00 − g(x0 )) | (x0 , x00 ) ∈ U 0 × U 00 ; x00 = g(x0 )} = U 0 × {0}
und
ϕ(U 0 × U 00 ) ∩ Rk × {0} = {(x0 , x00 − g(x0 )) | (x0 , x00 ) ∈ U 0 × U 00 ; x00 = g(x0 )},
also
ϕ((U 0 × U 00 ) ∩ M ) = V ∩ (Rk × {0}),
was die Behauptung beweist.
Bemerkung 20.3.3 : Wenn U ⊆ Rn eine offene Menge ist und F : U → Rn−k eine C m -Abbildung, f¨ ur die c ∈ Rn−k ein regul¨ arer Wert ist, d.h. (∀x ∈ U ∩ F −1 (c)) F 0 (x) surjektiv, dann ist nach Satz 20.3.2 die Menge F −1 (c) eine k-dimensionale Untermannigfaltigkeit von Rn .
Beispiel 20.3.4 : Die n-dimensionale Sph¨are S n = {x ∈ Rn+1 | kxk =
q x21 + . . . + x2n+1 = 1}
entsteht als Nullstellenmenge der Funktion F : Rn → R, x 7→ kxk2 − 1, wobei kxk = die Euklidische Norm ist. Die Ableitung F 0 (x) = 2(x1 , . . . , xn+1 ) : Rn+1 → R ist surjektiv f¨ ur alle x 6= 0.
q
x21 + . . . + x2n+1
20.4. TANGENTIAL- UND NORMALENVEKTOREN
383
¨ Ubung 20.3.1 : Veranschauliche die Aussage von Lemma 20.3.1 anhand der Sph¨ are S n−1 = {x ∈ Rn : kxk = 1}.
¨ Ubung 20.3.2 : Die Funktionen f, g : R3 → R seien definiert durch f (x, y, z) := x2 + xy − y − z, Zeige, daß
g(x, y, z) := 2x2 + 3xy − 2y − 3z.
M := {(x, y, z) ∈ R3 |f (x, y, z) = g(x, y, z) = 0}
eine eindimensionale Untermannigfaltigkeit des R3 ist und daß φ : R → R3 ,
φ(t) := (t, t2 , t3 )
eine globale Karte von M ist.
20.4
Tangential- und Normalenvektoren
Sei M ⊆ Rn eine C m -Untermannigfaltigkeit der Dimension k. Ein Vektor v ∈ Rn heißt Tangentialvektor an M in p, wenn ein ² > 0 und eine stetig differenzierbare Kurve γ : ] − ², ²[→ M ⊆ Rn so existiert, daß γ(0) = p und γ 0 (0) = v gilt. Wir bezeichnen die Menge aller Tangentialvektoren an M in p mit Tp (M ).
Satz 20.4.1 : Die Menge Tp (M ) der Tangentialvektoren in p an M ist ein k-dimensionaler Untervektorraum des Rn . (i) Sei U ⊆ Rk offen und ϕ : U → M eine Karte f¨ ur M . Wenn x ∈ U , dann ist Tϕ(x) (M ) = ϕ0 (x)(Rk ). (ii) Ist V ⊆ Rn offen und g : V → Rn−k eine stetig differenzierbare Funktion mit regul¨ arem Wert 0 und M ∩ V = g −1 (0), so gilt Tp (M ) = ker g 0 (p) f¨ ur alle p ∈ M ∩ V . Beweis: Da es zu jedem p ∈ M eine Karte (ϕ, U ) gibt, deren Bild p enth¨alt, k¨onnen wir annehmen, daß wir in der Situation von (i) sind. Gleichzeitig k¨onnen wir, evtl. nach Verkleinerung der Karte annehmen, daß auch eine Funktion g : V → Rn−k wie in (ii) mit p ∈ V existiert. R
ϕ R
k
g
n-k
384
KAPITEL 20. IMMERSIONEN UND UNTERMANNIGFALTIGKEITEN Da (ϕ, U ) eine Karte ist, ist ϕ0 (x) ∈ Hom(Rk , Rn ) injektiv. Also gilt dimR ϕ0 (x)(Rk ) = k. Andererseits haben wir g 0 (p) ∈ Hom(Rn , Rn−k ) surjektiv, also dimR (ker g 0 (p)) = k. Es gen¨ ugt also f¨ ur ϕ(x) = p zu zeigen, daß ϕ0 (x)(Rk ) ⊆ Tp (M ) ⊆ ker(g 0 (p)). Um die erste Inklusion zu zeigen, w¨ahlen wir einen beliebigen Vektor v = ϕ0 (x)c ∈ ϕ0 (x)(Rk ) und definieren eine Kurve γ : ] − ², ²[→ M, t 7→ ϕ(x + tc). Dann gilt γ(0) = ϕ(x) = p und die Kettenregel 11.1.4 liefert γ 0 (0) = ϕ0 (x)c = v. Damit folgt v ∈ Tp (M ). Sei jetzt umgekehrt v ∈ Tp (M ), d.h. es existiert eine stetig differenzierbare Kurve γ : ] − ², ²[→ M mit γ(0) = p und γ 0 (0) = v. Wenn wir ² klein genug w¨ahlen, k¨onnen wir annehmen, daß das Bild von γ in V enthalten ist. Dann gilt g ◦ γ(t) = 0 f¨ ur alle t ∈] − ², ²[ und daher 0 = (g ◦ γ)0 (0) = g 0 (p)v, d.h. v ∈ ker g 0 (p).
Sei M ⊆ Rn eine C m -Untermannigfaltigkeit der Dimension k. Ein Vektor v ∈ Rn heißt Normalenvektor von M in p, wenn v auf Tp (M ) senkrecht steht, d.h. (v | w) = 0
f¨ ur alle
w ∈ Tp (M ),
wobei ( ·|· ) das Euklidische Skalarprodukt auf Rn ist.
Die Normalenvektoren bilden einen (n − k)-dimensionalen Unterraum Np (M ), und es gilt Tp (M ) ⊕ Np (M ) = Rn f¨ ur alle p ∈ M . Bemerkung 20.4.2 : Wir haben in diesem Kapitel immer k-dimensionale Untermannigfaltigkeiten des Rn betrachtet. Nat¨ urlich auftretende Mengen wie Sl(n, K) = {g ∈ Mat(n × n, K) | det(g) = 1} mit K gleich R oder C lassen es ratsam erscheinen, k-dimensionale Untermannigfaltigkeiten f¨ ur beliebige n-dimensionale Vektorr¨aume V zu definieren. Dies ist in der Tat m¨oglich (sogar f¨ ur Banachr¨aume): Man muß nur u ¨berall dort, wo wir Rn geschrieben haben V schreiben und statt Rk einen (beliebigen) kdimensionalen Untervektorraum W von V nehmen. Damit gehen alle praktisch alle Definitionen, S¨atze und Beweise dieses Kapitels durch. Einzige Ausnahme sind die Normalenvektoren, f¨ ur die man ein inneres Produkt brauchte.
20.4. TANGENTIAL- UND NORMALENVEKTOREN
385
¨ Ubung 20.4.1 : Sei z :]0, 1[×]0, 1[→ R stetig differenzierbar. Definiere φ : [0, 1[×]0, 1[→ R3 durch φ(u, v) := (u, v, z(u, v)). Zeige, daß
¡ ∂z ¢ ∂z − (u, v), − ∂v (u, v), 1 n(u, v) := q¡ ¢∂u ¡ ∂z ¢2 ∂z 2 (u, v) + ∂v (u, v) + 1 ∂u
ein Normalenvektor von M := φ(]0, 1[×]0, 1[) in p := (u, v, z(u, v)) ist. ¨ Ubung 20.4.2 : Sei G := SL(2, R) := {A ∈ Mat(2 × 2, R)}|detA = 1}. (i) Zeige, daß G eine 3-dimensionale Untermannigfaltigkeit des 4-dimensionalen Raumes Mat(2 × 2, R) ist (in den Definitionen und S¨ atzen von Kapitel 25 kann man Rn durch einen beliebigen endlich dimensionalen Vektorraum V und Rk ⊆ Rn durch einen Untervektorraum W ersetzen). (ii) Zeige, daß der Tangentialraum T1 G von 1 ∈ G gegeben ist durch T1 G = sl(2, R) := {A ∈ Mat(2 × 2, R)|spur(A) = 0}. (iii) Zeige, daß f¨ ur g ∈ G gilt Tg G = {gA|A ∈ T1 G}.
386
KAPITEL 20. IMMERSIONEN UND UNTERMANNIGFALTIGKEITEN
Kapitel 21
Oberfl¨ achenmaße von Untermannigfaltigkeiten In diesem Kapitel zeigen wir, wie man auf k-dimensionalen Untermannigfaltigkeiten des Rn ein nat¨ urliches Maß konstruieren kann. Dieses Maß entspricht f¨ ur k = 1 dem intuitiven Verst¨ andnis von Kurvenl¨ ange. In h¨ oheren Dimensionen gewinnt man die Definition zuerst f¨ ur affine Untermannigfaltigkeiten, f¨ ur die man die Invarianz des Volumens unter orthogonalen Abbildungen fordert, durch eine Anwendung des Transformationssatzes. Dann leitet man eine Definition durch lineare Approximation f¨ ur Bilder von Karten ab. Schließlich liefert das Verhalten unter Kartenwechseln eine brauchbare globale Definition.
21.1
Kurvenintegrale in Rn
Wir betrachten eine st¨ uckweise stetig differenzierbare Kurve γ : [a, b] → Rn . Ist γ in t differenzierbar (das ist in allen bis auf endlich vielen Punkten der Fall), so ist der Geschwindigkeitsvektor γ 0 (t) ∈ Rn die Ableitung von γ in t, und seine L¨ange v uX u n 0 0 kγ (t)k = t |γj (t)|2 j=1
deuten wir als die Geschwindigkeit, mit der die Kurve zum Zeitpunkt t durchlaufen wird. γ (t)
Die L¨ ange der Kurve definieren wir durch Z
b
s(γ) :=
kγ 0 (t)k dt.
a
Ist γ ein Polygonzug, d.h. existiert eine Unterteilung a = t0 < t1 < . . . < tN = b f¨ ur die γ(t) = γ(ti ) +
t − ti (γ(ti+1 ) − γ(ti )) ti+1 − ti 387
f¨ ur
t ∈ [ti , ti+1 ]
¨ KAPITEL 21. OBERFLACHENMASSE VON UNTERMANNIGFALTIGKEITEN
388
gilt, so verifiziert man sofort, daß s(γ) =
N −1 X
kγ(tj+1 ) − γ(tj )k
j=0
die anschauliche L¨ange des Polygonzuges ist, die sich als Summe der L¨angen der einzelnen Strecken ergibt.
F¨ ur eine stetige Funktion f : Rn → R definieren wir das Kurvenintegral u ¨ber γ durch Z
Z
b
f := γ
¡ ¢ f γ(t) kγ 0 (t)k dt
a
Man verifiziert, daß es sich das Kurvenintegral nicht ¨andert, wenn man die Kurve umparametrisiert, d.h. wenn man γ durch γ ◦ ϕ ersetzt, wobei ϕ : [c, d] → [a, b] eine stetig differenzierbare Bijektion mit ϕ0 (t) > 0 f¨ ur alle t ∈]c, d[ ist.
¨ Ubung 21.1.1 : Sei f : Rn → Rn eine stetige Funktion (eine solche Funktion nennt man RVektorfeld) und γ : [a, b] → Rn eine st¨ uckweise stetig differenzierbare Kurve. Man definiert das Kurvenintegral γ f durch Z
Z
b
f := γ
hf (γ(t)), γ 0 (t)idt.
a
Zeige, daß das Kurvenintegral wohldefiniert ist, d.h. daß diese Definition unabh¨ angig von der Parametrisierung der Kurve ist. ¨ Ubung 21.1.2 : Berechne die Tangentenvektoren und die Bogenl¨ ange der folgenden Kurven γ : [0, 1] → R3 (i) t 7→ (r cos t, r sin t, ct), wobei c 6= 0, (ii) t 7→ (t, t2 , 23 t3 ).
¨ Ubung 21.1.3 : Berechne die folgenden Kurvenintegrale (i) f : R2 → R2 , 3
3
(ii) f : R → R ,
(x, y) 7→ (y, −x),
γ : [− π2 , π2 ] → R,
(x, y, z) 7→ (yz, xz, xy),
R γ
f.
t 7→ (cos t, sin t),
γ : [0, 1] → R,
t 7→ (t, t2 , 2),
¨ Ubung 21.1.4 : Es sei (i) Berechne
f : R3 → R3 ,
R γ
(x, y, z) 7→ (x2 y, x − z, xyz).
f f¨ ur die Kurven γ : [0, 1] → R3 , t 7→ (t, t2 , 2) und γ : [0, 1] → R3 , t 7→ (t, t, 2).
(ii) Interpretiere das Ergebnis.
21.2. DER MASSTENSOR
21.2
389
Der Maßtensor
Um eine Variante des Kurvenintegrals f¨ ur die h¨oherdimensionalen Analoga der Kurven zu finden, betrachten wir zun¨achst eine lineare Version. Sei hierzu A : Rk → Rn eine lineare Abbildung. Wir stellen uns die Frage, welche Zahl wir als das k-dimensionale Volumen des Bildes A(W ) des kdimensionalen Einheitsw¨ urfels W = [0, 1]k zu interpretieren haben. Diese Zahl sollte sich nicht ¨andern, wenn wir eine orthogonale Abbildung B : Rn → Rn auf A(W ) anwenden. Aus der linearen Algebra wissen ¨ wir, daß wir eine orthogonale Abbildung B so finden k¨onnen, daß B ◦ A(Rk ) ⊆ Rk × {0} gilt (Ubung!). > > Dann ist B durch eine orthogonale Matrix dargestellt, d.h. B B = BB = 1. Beachte hier, daß f¨ ur eine lineare Abbildung A : Rk → Rn die transponierte Abbildung A> : Rn → k R durch (∀z ∈ Rn , v ∈ Rk ) (A> z | v) = (z | Av) definiert ist. Insbesondere ist dann A> A : Rk → Rk und wenn e1 , . . . , ek die kanonische Basis f¨ ur Rk > > ist, dann gilt (A A)ij = (Aei | Aej ), d.h. die darstellende Matrix f¨ ur A A ist zugleich die darstellende Matrix f¨ ur die positive semidefinite symmetrische Bilinearform (v, w) 7→ (A> Av | w) auf Rk . Wenn wir lineare Abbildungen und Bilinearformen bzgl. der kanonischen Basis mit Matrizen identifizieren, dann erhalten wir jeweils die gleiche Matrix f¨ ur A> A, f¨ ur die die Bilinearform dann durch > > w A Av gegeben ist. Ist P : Rn → Rk die orthogonale Projektion, so ist P ◦ B ◦ A : Rk → Rk eine lineare Abbildung, und das k-dimensionale Volumen von (B ◦ A)(W ) = (P ◦ B ◦ A)(W ) ist nach der Transformationsformel in Satz 19.4.6 durch | det(P BA)| gegeben.
A
B
P
Mit dieser Formel k¨onnen wir nat¨ urlich noch nicht viel anfangen, da sie die zuf¨allig gew¨ahlte Matrix B enth¨alt. Der wesentliche Punkt ist folgende Beobachtung: F¨ ur alle v ∈ Rk ist BAv ∈ Rk und daher kP BAvk = kBAvk = kAvk, d.h. kAvk2 = v > A> Av = v > A> B > P > P BAv. Somit stimmen die symmetrischen Matrizen A> A und A> B > P > P BA u ¨berein. Also ist | det(P BA)|2 = det(A> B > P > ) det(P BA) = det(A> B > P > P BA) = det(A> A). Hierdurch haben wir eine brauchbare Formel f¨ ur das k-dimensionale Volumen von A(W ) gefunden: ¡ ¢ q volk A(W ) = det(A> A). Man beachte, daß die Matrix A> A positiv definit ist, also eine positive Determinante hat. Damit ist der Weg zur Definition des k-dimensionalen Volumens von parametrisierten Untermannigfaltigkeiten vorgezeichnet. Sei ϕ : U → Rn eine Immersion.
¨ KAPITEL 21. OBERFLACHENMASSE VON UNTERMANNIGFALTIGKEITEN
390
M ϕ
X U
F¨ ur jedes x ∈ U betrachten wir den Maßtensor G(x) := ϕ0 (x)> ϕ0 (x) : Rk → Rk der bzgl. der kanonischen Basis f¨ ur Rk durch die symmetrische positiv definite Matrix ¡ ¢ gij (x) i,j=1,...,k mit gij (x) = (ϕ0 (x)ei | ϕ0 (x)ej ) gegeben ist, die auch die Gramsche Matrix der Vektoren ϕ0 (x)e1 , . . . , ϕ0 (x)ek genannt wird. Die Funktion g : x 7→ det G(x) heißt daher die Gramsche Determinante. Wir wollen das Integral von Funktionen u ¨ber k-dimensionale Untermannigfaltigkeiten des Rn definieren und beginnen mit dem einfachsten Fall: Sei ϕ : U → Rn eine injektive C 1 -Immersion und M := ϕ(U ). Weiter sei f : M → R eine meßbare Funktion und g : U → R die Gramsche Determinante von ϕ. Dann heißt f bzgl. ϕ integrierbar u ¨ber M , falls die Funktion ¡ ¢p U → R, x 7→ f ϕ(x) g(x) u ¨ber U integrierbar ist. Ist dies der Fall, so setzen wir Z Z ¡ ¢p (∗) f dλϕ := f ϕ(x) g(x) dλk (x). M
U
F¨ ur eine Borelmenge E ⊆ ϕ(U ) definieren wir das k-dimensionale Volumen durch Z Z p volk (E) := λϕ (E) := χE dλϕ = g(x) dλk (x). ϕ−1 (E)
M
Ist B(M ) die σ-Algebra der Borelmengen des metrischen Raumes M , so folgt aus der Stetigkeit von ϕ : U → M , daß ϕ meßbar ist, d.h. ϕ−1 (E) ist f¨ ur jede Borelsche Teilmenge E ⊆ M meßbar. Mit dem Satz 8.4.2 u ber die monotone Konvergenz sieht man schnell, daß ¨ λϕ : B(M ) → [0, ∞],
E 7→ volk (E)
¨ ein Maß ist (siehe Ubung 21.2.1) und das zugeh¨orige Integral gegeben ist durch (∗). Man nennt λϕ das k-dimensionale Oberfl¨ achenmaß von M bzgl. ϕ. Wir betrachten den Fall einer Immersion ϕ : U → Rn mit k = 1. Dann ist ϕ eine Kurve, also G(x) = ϕ0 (x)> ϕ0 (x) = (ϕ0 (x) | ϕ0 (x)) = kϕ0 (x)k2 und somit g(x) = kϕ0 (x)k. Wir erhalten in diesem Fall Z ¡ ¢ vol1 ϕ(U ) = kϕ0 (x)k dλ1 (x) = s(ϕ), U
¡
¢
d.h. vol1 ϕ(U ) ist gerade die Bogenl¨ange des Kurvenst¨ ucks ϕ(U ). Das Integral einer Funktion f u ¨ber ϕ(U ) ist gegeben durch Z Z ¡ ¢ f dλϕ = f ϕ(x) kϕ0 (x)k dλ1 (x). (21.1) ϕ(U )
U
21.2. DER MASSTENSOR
391
Genauso hatten wir das Kurvenintegral einer Funktion definiert. Durch Formel (21.1) ist das k-dimensionale Volumen von Teilmengen einer Untermannigfaltigkeit definiert, die im Bild einer einzigen Immersion liegen. Wir haben noch nachzuweisen, daß die so erhaltenen Volumina nicht von der Parametrisierung abh¨angen, so daß wir schließlich eine Definition erhalten, die nicht mehr von der Wahl einer speziellen Karte abh¨angt. Lemma 21.2.1 : Sei ϕ : U → Rn eine stetig differenzierbare Abbildung, V ⊆ Rk offen, τ : V → U ein C 1 -Diffeomorphismus und f : ϕ(U ) → R eine meßbare Funktion. Wir schreiben ¡ ¢ ¡ ¢ gϕ (x) := det ϕ0 (x)> ϕ0 (x) bzw. gϕ◦τ (x) := det (ϕ ◦ τ )0 (x)> (ϕ ◦ τ )0 (x) f¨ ur die Gramsche Determinante von ϕ bzw. ϕ ◦ τ . Dann existiert Z ¡ ¢q f ϕ(x) gϕ (x) dλk (x) U
genau dann, wenn
Z
¡ ¢q f ϕ ◦ τ (y) gϕ◦τ (y) dλk (y) V
existiert. In diesem Fall stimmen beide Integrale u ¨berein.
f
ϕ oτ
V
ϕ
τ
U
Beweis: ¡ ¢ Mit der Kettenregel erhalten wir (ϕ ◦ τ )0 (y) = ϕ0 τ (y) τ 0 (y) und daher ¡ ¢> ¡ ¢ (ϕ ◦ τ )0 (y)> (ϕ ◦ τ )0 (y) = τ 0 (y)> ϕ0 τ (y) ϕ0 τ (y) τ 0 (y). Also ist
¡ ¢2 ¡ ¢ gϕ◦τ (y) = det τ 0 (y) gϕ τ (y) .
Wir erhalten nun mit der Transformationsformel aus Satz 19.4.6: Z Z ¡ ¢q ¡ ¢q ¡ ¢ k f ϕ ◦ τ (y) gϕ◦τ (y) dλ (y) = (f ◦ ϕ) τ (y) gϕ τ (y) | det τ 0 (y)| dλk (y) V ZV q = (f ◦ ϕ)(x) gϕ (x) dλk (x). U
Satz 19.4.6 zeigt uns weiterhin, daß eines der Integrale genau dann existiert, wenn das andere existiert, und daß in diesem Fall beide gleich sind.
¨ Ubung 21.2.1 :
¨ KAPITEL 21. OBERFLACHENMASSE VON UNTERMANNIGFALTIGKEITEN
392
(a) Sei (X, S, µ) ein Maßraum und ρ : X → [0, ∞] eine meßbare Funktion. Dann wird durch Z Z µρ : E → ρ dµ = χE ρ dµ E
X
ein Maß auf S definiert. Eine meßbare Funktion f : X → R ist genau dann bzgl. µρ integrierbar, wenn |f |ρ bzgl. µ integrierbar ist. In diesem Fall gilt Z Z f dµρ = f ρ dµ. X
X
Hinweis: Man betrachte zuerst Stufenfunktionen und verallgemeinere mit dem Satz u ¨ber monotone Konvergenz auf nichtnegative Funktionen. (b) Ist (µn )n∈N eine Folge von Maßen auf der σ-Algebra S, so ist auch µ :=
∞ X
µn
n=1
ein Maß.
¨ Ubung 21.2.2 : Sei k < n und A : Rk → Rn linear. Zeige, daß es eine orthogonale Abbildung B : Rn → Rn gibt mit B ◦ A(Rk ) ⊆ Rk × {0}. ¨ Ubung 21.2.3 : Sei P :]0, 2π[ × ] − π2 , π2 [→ R3 , (φ, θ) 7→ (cos φ cos θ, sin φ cos θ, sin θ), d.h. P ist eine Parametrisierung der Einheitskugel im R3 , ohne den Nord- und S¨ udpol. Berechne die Gramsche Matrix und die Gramsche Determinante von P . ¨ Ubung 21.2.4 : Sei M ⊆ Rn eine k-dimensionale Untermannigfaltigkeit. Weiter seien U1 , U2 ⊆ Rk und V ⊆ Rn offene Mengen, sowie φ1 : U1 → V und φ2 : U2 → V zwei lokale Parameterdarstellungen von M mit zugeh¨ origen Gramschen Determinanten g1 : U1 → [0, ∞), g2 : U2 → [0, ∞). Beweise die Transformationsformel f¨ ur Gramsche Determinanten: Es ist g2 (ξ) = |detτ 0 (ξ)|2 g1 (τ (ξ)), wobei τ : U2 → U1 , ξ 7→ φ−1 1 ◦ φ2 (ξ).
21.3
Das Oberfl¨ achenmaß einer Untermannigfaltigkeit
Lemma 21.3.1 : Sei M ⊆ Rn eine C 1 -Untermannigfaltigkeit. Dann existiert eine abz¨ ahlbare Familie von Karten (ϕj , Uj )j∈N , so daß [ M= Mj f¨ ur Mj := ϕj (Uj ) j∈N
gilt.
Beweis: Zun¨achst existiert zu jedem p ∈ M eine offene Teilmenge Vp ⊆ Rn , so daß Vp ∩ M = ϕp (Up ) f¨ ur eine Karte ϕp : Up → M gilt (Parametrisierungssatz 20.2.4). Durch Verkleinern von Vp d¨ urfen wir annehmen, daß Vp = B(q; rq ) = {x ∈ Rn : kx − qk < rq } gilt, wobei q ∈ Qn und rq eine rationale Zahl ist. Da es nur abz¨ahlbar viele solcher Mengen gibt, erhalten wir eine abz¨ahlbare Familie von offenen Teilmengen (Mj )j∈N von M , die sich als ϕj (Uj ) f¨ ur Karten ϕj : Uj → M schreiben lassen und deren Vereinigung M ist.
¨ 21.3. DAS OBERFLACHENMASS EINER UNTERMANNIGFALTIGKEIT
393
ej )j∈N Lemma 21.3.2 : Sei M ⊆ Rn eine C 1 -Untermannigfaltigkeit. Es seien (ϕj , Uj )j∈N und (ϕ ej , U zwei abz¨ ahlbare Systeme von Karten von M mit [ [ ej ). M= ϕj (Uj ) = ϕ ej (U j∈N
j∈N
fj := ϕ ej ), Wir setzen Mj := ϕj (Uj ), M ej (U ej := M fj \ (M f1 ∪ . . . ∪ M fj−1 ) N
Nj := Mj \ (M1 ∪ . . . ∪ Mj−1 ),
und erhalten so zwei disjunkte abz¨ ahlbare Familien von Borelmengen in M . Dann gilt f¨ ur jede Borelmenge E ⊆ M die Gleichheit ∞ ∞ X X ei ). λϕj (E ∩ Nj ) = λϕei (E ∩ N j=1
i=1
~ Mi
Mj
ϕ~i
ϕj
Uj
~
-1 ϕ~i o ϕ
Ui j
Beweis: Zun¨achst beachten wir, daß λϕj (E ∩ Nj ) definiert ist, da E ∩ Nj ganz im Bild der Karte ϕj liegt. F¨ ur eine Borelmenge E ⊆ M ist nun E ∩ Nj =
∞ [
ei ). (E ∩ Nj ∩ N
i=1
fi Wegen Satz 20.2.5 u ¨ber die Parametertransformation, den wir auf die offene Teilmenge Mj ∩M anwenden, erhalten wir mit Lemma 21.2.1 ei ) = λϕe (E ∩ Nj ∩ N ei ). λϕj (E ∩ Nj ∩ N i In der folgenden Rechnung verwenden wir den Umordnungssatz 4.3.1: ∞ X
λϕj (E ∩ Nj )
=
j=1
=
∞ X ∞ X
ei ) = λϕj (E ∩ Nj ∩ N
∞ X ∞ X
j=1 i=1
j=1 i=1
∞ X ∞ X
∞ X
i=1 j=1
ei ) = λϕei (E ∩ Nj ∩ N
i=1
ei ) λϕei (E ∩ Nj ∩ N
ei ). λϕei (E ∩ N
394
¨ KAPITEL 21. OBERFLACHENMASSE VON UNTERMANNIGFALTIGKEITEN
n 1 Sei M ⊆ R S eine C -Untermannigfaltigkeit und (ϕj , Uj )j∈N ein abz¨ahlbares System von Karten von M mit M = j∈N ϕj (Uj ). F¨ ur eine Borelmenge E ⊆ M definieren wir
SM (E) :=
∞ X
λϕj (E ∩ Nj ),
j=1
wobei Nj wie in Lemma 21.3.2 definiert ist. Aus Lemma 21.3.2 folgt, daß die rechte Seite dieser Definition nicht von der speziellen Wahl der Familie von Karten abh¨angt. ¨ Die Abbildung SM : B(M ) → [0, ∞] ist ein Maß (siehe Ubung 21.2.1(b)), das man das Oberfl¨ achen¨ maß von M nennt (S steht f¨ ur “surface”). Gem¨aß Ubung 21.2.1 ist das zugeh¨orige Integral einer integrablen Funktion f auf M gegeben durch Z f dSM = M
∞ Z X j=1
ϕ−1 j (Nj )
¡ ¢q f ϕj (x) gϕj (x) dλk (x).
Mit der Definition des Oberfl¨achenmaßes haben wir Integralen u ¨ber Untermannigfaltigkeiten von Rn einen pr¨azisen Sinn gegeben. Beispiel 21.3.3 : Wir erinnern uns an die Rotationsfl¨achen aus Beispiel 20.1.4. In diesem Fall ist 0 r(t) cos ϕ r (t) cos ϕ −r(t) sin ϕ Φ(t, ϕ) = r(t) sin ϕ und Φ0 (t, ϕ) = r0 (t) sin ϕ r(t) cos ϕ , z(t) z 0 (t) 0 also
µ 0 2 r (t) + z 0 (t)2 G(t, ϕ) = 0
und somit
0 r(t)2
¶
p g(t, ϕ) = r(t)kγ 0 (t)k.
Das Oberfl¨achenintegral erh¨alt daher f¨ ur M = Φ(I×]0, 2π[) die einfache Form Z
Z Z f dλϕ = M
I
2π
¡ ¢ f Φ(t, ϕ) r(t)kγ 0 (t)k dϕdt.
0
F¨ ur f = 1 ergibt sich insbesondere Z Z vol2 (M ) = I
2π
Z r(t)kγ 0 (t)k dϕdt = 2π
0
r(t)kγ 0 (t)k dt. I
F¨ ur den speziellen Fall der zweidimensionalen Sph¨are ist I =] − π2 , π2 [, r(t) = cos t und z(t) = sin t. Damit ist kγ 0 (t)k = 1 und daher Z π vol2 (S 2 ) = 2π cos t dt = 4π. 0
Beispiel 21.3.4 : (Funktionsgraphen)¡ Sei U ¢⊆ Rk offen und f : U → R eine stetig differenzierbare Funktion. Dann ist ϕ : U → Rk+1 , x 7→ x, f (x) eine injektive Immersion (siehe Beispiel 20.1.1), und die Umkehrfunktion ϕ(U ) → U, ϕ(x) 7→ x ist stetig, da sie die Projektion auf Rk ist. Also ist M := ϕ(U ) eine C 1 -Untermannigfaltigkeit von Rn . F¨ ur x ∈ U ist µ ¶ ¡ ¢ 1 G(x) = ϕ0 (x)> ϕ0 (x) = 1 f 0 (u)> = 1 + f 0 (u)> f 0 (u), f 0 (u)
¨ 21.3. DAS OBERFLACHENMASS EINER UNTERMANNIGFALTIGKEIT
395
wobei wir das Differential f 0 (u) als Zeilenvektor schreiben. In diesem Sinn ist das Matrizenprodukt f 0 (u)> f 0 (u) eine k × k-Matrix. Um die Gramsche Determinante zu berechnen, betrachten wir die Eigenwerte der symmetrischen Matrix G(x). Ist v ∈ ker f 0 (x), so ist f 0 (x)v = 0 (als Matrizenprodukt), und somit G(x)v = 1v = v. Der Vektor gradf (x) = f 0 (x)> steht also senkrecht auf ker f 0 (x), und es gilt G(x)f 0 (x)>
= = =
f 0 (x)> + f 0 (x)> f 0 (x)f 0 (x)> ¡ ¢ f 0 (x)> 1 + f 0 (x)f 0 (x)> ¡ ¢ 1 + kf 0 (x)k2 f 0 (x)> .
Da die Determinante das Produkt der Eigenwerte ist, folgt hieraus g(x) = 1 + kgradf (x)k2 .
(∗) Hiermit ergibt sich f¨ ur M := ϕ(U )
volk (M ) =
Z p
1 + kgradf (x)k2 dλk (x).
U
Beispiel 21.3.5 : Wir betrachten die obere Halbsph¨are vom Radius r > 0: M := {x ∈ Rn | kxk = r, xn > 0}. Ist U := {x ∈ Rn−1 | kxk < r}, so ist M der Graph der Funktion q p F : U → R, x 7→ r2 − kxk2 = r2 − x21 − . . . − x2n−1 . Aus
∂F xj (x) = − ∂xj F (x)
folgt nun mit (∗) g(x) = 1 + kgradF (x)k2 = 1 +
kxk2 F (x)2 + kxk2 r2 = = 2 . 2 2 F (x) F (x) r − kxk2
F¨ ur die Oberfl¨achenintegrale erhalten wir hiermit Z Z p f dSM = f (x, r2 − kxk2 ) p M
Z
kxk
=
f (ry, r kyk<1
r r2 − kxk2
dλn−1 (x)
p rn−1 1 − kyk2 ) p dλn−1 (y), 1 − kyk2
wobei wir die Transformation y 7→ x = ry verwendet haben.
Satz 21.3.6 : (Verhalten bei Homothetien) F¨ ur r > 0 sei θr : Rn → Rn , x 7→ rx die Homothetie mit dem Faktor r. Ist M ⊆ Rn eine k-dimensionale C m -Untermannigfaltigkeit, so gilt dies auch f¨ ur rM = θr (M ). Eine Funktion f : rM → R ist genau dann u ¨ber rM integrierbar, wenn die Funktion f ◦ θr u ¨ber M integrierbar ist. In diesem Fall gilt Z Z k f (rx) dSM (x). f (x) dSrM (x) = r rM
M
Insbesondere ergibt sich f¨ ur jede Borelmenge E ⊆ M die Beziehung volk (rE) = rk volk (E).
¨ KAPITEL 21. OBERFLACHENMASSE VON UNTERMANNIGFALTIGKEITEN
396 Beweis:
Ist (ϕ, U ) eine Karte von M , so ist ϕ e := θr ◦ ϕ : U → rϕ(U ) ⊆ rM eine Karte von rM .
0 F¨ ur x ∈ U gilt e0 (x) = rϕp (x), und daher ergibt sich f¨ ur die Gramsche Determinante ge(x) = pϕ r2k g(x), d.h. ge(x) = rk g(x). Hieraus folgt die Behauptung unmittelbar.
Satz 21.3.7 : (Polarkoordinaten) Sei f : Rn → R eine integrierbare Funktion. Dann ist f¨ ur fast alle r ∈]0, ∞[ die Funktion f u are S(r) := {x ∈ Rn | kxk = r} integrierbar, und es gilt ¨ber die Sph¨ Z Z ∞Z n f dλ = f (x) dSS(r) (x) dr Rn
Z
0
S(r)
∞
³Z
= 0
S(1)
´ f (ry) dSS(1) (y) rn−1 dr.
Beweis: Sei H± := {x ∈ Rn | ±xn > 0} der offene obere bzw. untere Halbraum. Dann gilt f = f χH+ + f χH− fast u ¨berall, denn die Hyperebene {xn = 0} ist eine Nullmenge. Da der Durchschnitt der Sph¨are S(r) mit der Hyperebene {xn = 0} eine (n − 1)-dimensionale Nullmenge ist (Nachweis!), reicht es aus, die Behauptung f¨ ur die beiden Funktionen f χH± zu zeigen. Wir schr¨anken uns hierbei auf f χH+ ein (der zweite Teil geht analog) und d¨ urfen daher annehmen, daß f = f χH+ gilt, d.h. f verschwindet außerhalb von H+ . Sei U := {x ∈ Rn−1 | kxk < 1} die offene Einheitskugel und Φ : U ×]0, ∞[→ H+ ⊆ Rn−1 × R,
(x, r) 7→ (rx, r
p
1 − kxk2 ).
Dann ist Φ eine injektive C 1 -Abbildung mit der stetig differenzierbaren Umkehrabbildung ³ y ´ yn−1 1 Φ−1 (y) = ,..., , kyk kyk kyk (Nachrechnen!). Also ist Φ ein C 1 -Diffeomorphismus.
¨ 21.3. DAS OBERFLACHENMASS EINER UNTERMANNIGFALTIGKEIT p ¡ ¢ ¡ ¢ x Sei F (x) := 1 − kxk2 . Dann ist Φ(x, r) = rx, rF (x) = r x, F (x) und F 0 (x) = − F (x) (als Zeilenvektor gelesen). Die Funktionalmatrix von Φ hat daher die Gestalt r 0 0 ··· 0 x1 0 r 0 ··· 0 x2 . .. . Φ0 (x, r) = .. . 0 0 0 · · · r xn−1 rF 0 (x) F (x) F¨ ur die Determinante ergibt sich nun mit geeigneten Spaltenumformungen: 1 0 0 ··· 0 x1 0 1 0 ··· 0 x2 .. . 0 n−1 det Φ (x, r) = r det . .. 0 0 0 · · · 1 xn−1 F 0 (x) F (x) 1 0 0 ··· 0 0 0 1 0 ··· 0 0 . .. = rn−1 det .. . 0 0 0 ··· 1 0 F 0 (x) F (x) − (F 0 (x) | x) ³ ¡ ¢ kxk2 ´ = rn−1 F (x) − (F 0 (x) | x) = rn−1 F (x) + F (x) n−1 n−1 rn−1 r r = . (F (x)2 + kxk2 ) = =p F (x) F (x) 1 − kxk2 Aus der Transformationsformel (Satz 19.4.6) und dem Satz 18.4.5 von Fubini ergibt sich daher Z Z p rn−1 f dλn = f (rx, r 1 − kxk2 ) p dλn−1 (x) dr 1 − kxk2 H+ U ×]0,∞[ p Z ∞ ³Z ´ f (rx, r 1 − kxk2 ) p = dλn−1 (x) rn−1 dr. 1 − kxk2 0 U Nach Beispiel 21.3.5 ist das in der Klammer stehende Integral gleich Z f dSS(r) . S(r)
Hieraus folgt die erste Gleichheit, und die zweite ist eine Konsequenz von Satz 21.3.6.
Beispiel 21.3.8 : (Die Oberfl¨ache der Einheitssph¨are) Sei Bn := {x ∈ Rn | kxk ≤ 1}
und
Sn−1 := ∂Bn
¨ die Einheitssph¨are. Aus Ubung 19.4.2 wissen wir, daß das Volumen von Bn durch n
voln (Bn ) = cn =
π2 n Γ( 2 + 1)
397
398
¨ KAPITEL 21. OBERFLACHENMASSE VON UNTERMANNIGFALTIGKEITEN
gegeben ist. Sei ωn := voln−1 (Sn−1 ). Wir wenden Satz 21.3.7 auf die charakteristische Funktion χBn von Bn an und erhalten Z Z 1³Z Z 1 ´ ωn n n−1 cn = dλ (x) = dSSn−1 (y) r dr = ωn rn−1 dr = . n kxk≤1 0 kxk=1 0 Also ist
n
ωn = ncn = n
n
π2 π2 =2 n . n Γ( 2 + 1) Γ( 2 )
Insbesondere ergibt sich ω2 = 2π (die L¨ ange des Einheitskreisbogens), ω3 = 4π (die Oberfl¨ache der zweidimensionalen Einheitssph¨are) und ω4 = 2π 2 (das dreidimensionale Volumen der Einheitssph¨are im R4 ). F¨ ur die Sph¨are Sn−1 (r) := {x ∈ Rn : kxk = r} vom Radius r erhalten wir mit Satz 21.3.6: n ¡ ¢ 2 n−1 n−1 π voln−1 Sn−1 (r) = r ωn = 2r . Γ( n2 )
Mit den Methoden aus diesem Abschnitt sind wir in der Lage, die Oberfl¨achen von krummen Fl¨achen im Rn zu berechnen. F¨ ur den weiteren Ausbau der Theorie wird es allerdings notwendig werden, daß wir nicht nur skalare Funktionen u ¨ber parametrisierte Untermannigfaltigkeiten integrieren, sondern auch Vektorfelder. Im n¨achsten Abschnitt werden wir die zugeh¨orige Geometrie und als Hauptanwendung den Gaußschen Integralsatz diskutieren. ¨ Ubung 21.3.1 : Sei U := {x ∈ Rn−1 | kxk < 1} die offene Einheitskugel und H+ := {x ∈ Rn | xn > 0} der offene obere Halbraum. Definiere p Φ : U ×]0, ∞[→ H+ ⊆ Rn−1 × R, (x, r) 7→ (rx, r 1 − kxk2 ). Zeige, daß Φ ein C 1 -Diffeomorphismus mit Umkehrabbildung ³ y ´ yn−1 1 Φ−1 (y) = ,..., , kyk kyk kyk ist. ¨ Ubung 21.3.2 : Sei f : [0, ∞[→ R eine Funktion derart, daß die Funktion Rn → R, integrierbar ist. Zeige, daß g(r) := r
n−1
x 7→ f (kxk)
f (r) u ¨ber [0, ∞[ integrierbar ist mit Z ∞ Z 1 g(r)dr = f (kxk)dλn , ω n Rn 0
wobei ωn die Oberfl¨ ache der Einheitskugel in Rn ist. ¨ Ubung 21.3.3 : Berechne die Oberfl¨ ache des Kegelmantels des Kegels der H¨ ohe h u ¨ber dem Kreis mit Radius r. ¨ Ubung 21.3.4 : Berechne den Fl¨ acheninhalt des Durchschnittes der beiden Zylinder x2 +y 2 = 1 und x2 +z 2 = 1. ¨ Ubung 21.3.5 : Zeige, daß der Durchschnitt der Einheitssph¨ are S n−1 = {x ∈ Rn : kxk = 1} mit der Hyperebene n {(x1 , . . . , xn ) ∈ R |xn = 0} eine (n − 1)-dimensionale Nullmenge ist. ¨ ache des Kegels der H¨ ohe h u Ubung 21.3.6 : Berechne die Mantelfl¨ ¨ber dem Kreis mit Radius r als Rotationsfl¨ ache der Funktion r f :]0, h[→ R, z 7→ z. h
¨ 21.3. DAS OBERFLACHENMASS EINER UNTERMANNIGFALTIGKEIT
399
¨ Ubung 21.3.7 : Seien 0 ≤ φ1 < φ2 ≤ 2π und 0 ≤ θ1 < θ2 ≤ π. Weiter sei A die bzgl. Polarkoordinaten (φ, θ) auf der Einheitssp¨ are S 2 ⊂ R3 durch die Ungleichungen φ1 ≤ φ ≤ φ2 ,
θ1 ≤ θ ≤ θ2
gegebene Teilmenge. Berechne die Oberfl¨ ache von A. ¨ Ubung 21.3.8 : Sei R > 1. Berechne die Teilf¨ ache F der gesamten Torusfl¨ ache, welche durch die folgende Parameterdarstellung gegeben ist P :]
−π π −π π , [×] , [, 2 2 2 2
(φ, θ) 7→ ((R − cos θ) cos φ, (R − cos θ) sin φ, sin θ).
R ¨ Ubung 21.3.9 : Berechne das Oberfl¨ achenintegral M (x2 + y 2 )dSM , wobei M der Teil des Paraboloids ist, der durch z(x, y) = 2 − x2 − y 2 , 0 ≤ x2 + y 2 < 2 gegeben ist. ¨ Ubung 21.3.10 : Der Zylinder x2 + y 2 = 1 schneidet aus der Ebene z = 3 − 2x + 2y eine Ellipse aus. Welchen Fl¨ acheninhalt hat diese Ellipse? ¨ Ubung 21.3.11 : Aus dem oberen Teil der Kugeloberfl¨ ache x2 + y 2 + z 2 = 4, z ≥ 0 wird durch den elliptischen 2 2 Zylinder x + 4y = 4 ein Fl¨ achenst¨ uck ausgeschnitten. Welchen Fl¨ acheninhalt hat dieses St¨ uck? ¨ ur eine Fl¨ ache M in R3 definiert man den geometrischen Schwerpunkt (xs1 , xs2 , xs3 ) von Ubung 21.3.12 : F¨ M durch Z 1 xsj := xj dSM , j = 1, 2, 3. vol2 (M ) M Berechne den geometrischen Schwerpunkt der oberen H¨ alfte der Einheitskugel. ¨ Ubung 21.3.13 : F¨ ur eine Fl¨ ache M in R3 definiert man das Tr¨ agheitsmoment bzgl. der x3 -Achse durch Z (x21 + x22 ) dSM . M
Berechne das Tr¨ agheitsmoment bzgl. der x3 -Achse der oberen H¨ alfte der Einheitskugel. p ¨ ohe h sei mit der Fl¨ achendichte ρ(x, y, z) = x2 belegt. Ubung 21.3.14 : Der Kegelmantel z = x2 + y 2 der H¨ Welche Masse hat der Kegelmantel? √ ¨ orper, der unten von der Ubung 21.3.15 : Die Ebenen y = 0, x = 3, y = x begrenzen einen prismatischen K¨ x, y-Ebene und oben von der parabolischen Zylinderfl¨ ache z = c − 21 x2 begrenzt werde (c > 0). Berechne den Inhalt der oberen Begrenzungsfl¨ ache.
400
¨ KAPITEL 21. OBERFLACHENMASSE VON UNTERMANNIGFALTIGKEITEN
Kapitel 22
Der Gaußsche Integralsatz Der Gaußsche Integralsatz ist das wichtigste Resultat der Integralrechnung im Rn . Er beschreibt den Zusammenhang zwischen dem Integral der Divergenz eines Vektorfeldes u ¨ber einen Bereich im Rn und einem Oberfl¨ achenintegral u ur n = 1 ergibt sich als Spezialfall der Haupt¨ber den Rand des Bereichs. F¨ satz der Differential- und Integralrechnung. Der Gaußsche Integralsatz hat viele Anwendungen in der mathematischen Physik, insbesondere bei der Formulierung von Erhaltungss¨ atzen.
22.1
Ein Spezialfall
In diesem Unterabschnitt betrachten wir einen Spezialfall des Gaußschen Satzes, den wir im Beweis des allgemeinen Satzes ben¨otigen werden, der aber auch f¨ ur sich von Interesse ist. Sei M ein metrischer Raum und f : M → R stetig. Die Menge supp (f ) := {x ∈ M | f (x) 6= 0} nennt man den Tr¨ ager von f . Wir schreiben C(M ) f¨ ur den Raum der stetigen Funktionen auf M und Cc (M ) f¨ ur den Teilraum der Funktionen mit kompaktem Tr¨ager. Ist U ⊆ Rn offen, so schreiben wir Cck (U ) f¨ ur den Raum der k-mal stetig differenzierbaren Funktionen mit kompaktem Tr¨ager. In dem Konzept der “Funktionen mit kompaktem Tr¨ager” versteckt sich eine Subtilit¨at, die man sich vergegenw¨artigen sollte. Ist U = Rn , so hat eine stetige Funktion f auf Rn genau dann kompakten Tr¨ager, wenn ihr Tr¨ager beschr¨ankt ist, denn der Tr¨ager ist immer abgeschlossen. Ist U 6= Rn , so hat man zu beachten, daß supp (f ) eine kompakte Teilmenge von U sein sollte, d.h. eine kompakte Teilmengen von Rn , die ganz in U liegt. Ist U =]a, b[⊆ R ein offenes Intervall, so gilt f ∈ Cc (U ) genau dann, wenn ein ² > 0 so existiert, daß supp (f ) ⊆ [a + ², b − ²].
Lemma 22.1.1 : Ist U ⊆ Rn offen und f ∈ Cck (U ), so ist die durch ½ f (x) f¨ ur x ∈ U F (x) := 0 f¨ ur x 6∈ U definierte Funktion in Cck (Rn ).
401
402
KAPITEL 22. DER GAUSSSCHE INTEGRALSATZ
Beweis: Ist x ∈ U , so stimmt F auf einer Umgebung von x mit f u ¨berein, ist dort also k-mal stetig differenzierbar. Ist x 6∈ U , so ist x 6∈ supp (f ). Da supp (f ) kompakt ist, ist das Komplement V dieser Menge offen in Rn . Auf V verschwindet die Funktion F , ist dort also beliebig oft differenzierbar. Damit ist gezeigt, daß F ∈ Cck (Rn ) ist.
Aus Lemma 22.1.1 ergibt sich f¨ ur k = 0 insbesondere, daß sich stetige Funktionen mit kompaktem Tr¨ager auf U durch 0 zu stetigen Funktionen auf Rn fortsetzen lassen. Der folgende Satz, insbesondere der erste Teil, ist ein Spezialfall des Gaußschen Integralsatzes. Satz 22.1.2 : Sei U ⊆ Rn offen und 1 ≤ j ≤ n. Dann gilt: R ∂ϕ (i) U ∂x (x) dλn (x) = 0 f¨ ur alle ϕ ∈ Cc1 (U ). j (ii)
Z U
∂ϕ (x)ψ(x) dλn (x) = − ∂xj
Z ϕ(x) U
∂ψ (x) dλn (x) ∂xj
f¨ ur alle ϕ ∈ C 1 (U ) und ψ ∈ Cc1 (U ). Beweis: (i) Da supp (ϕ) kompakt ist, finden wir ein R > 0 mit supp (ϕ) ⊆ [−R, R]n . Insbesondere verschwindet ϕ dann auf dem Rand des W¨ urfels [−R, R]n . Wir nehmen j = 1 an (f¨ ur jedes andere j folgt die Behauptung analog). F¨ ur jedes x ∈ U ist dann Z R ∂ϕ (x) dx1 = ϕ(R, x2 , . . . , xn ) − ϕ(−R, x2 , . . . , xn ) = 0. ∂x 1 −R Damit erhalten wir Z ∂ϕ (x) dλn (x) = U ∂x1 =
Z
∂ϕ (x) dλn (x) [−R,R]n ∂x1 Z Z R ∂ϕ (x) dx1 dλn−1 (x2 , . . . , xn ) = 0. [−R,R]n−1 −R ∂x1
(ii) Wir wenden (i) auf die Funktion ϕψ ∈ Cc1 (U ) an. Die Behauptung folgt dann aus der Produktregel ??: ∂(ϕψ) ∂ϕ ∂ψ = ψ+ϕ ∂xj ∂xj ∂xj
¨ Ubung 22.1.1 : Wahr oder falsch: (Cc (Rn ), k · k∞ ) ist ein Banachraum. ¨ Ubung 22.1.2 : Sei X ein topologischer Raum, B seine Borel-σ-Algebra und µ : B → [0, ∞] ein Maß. Man definiert den Tr¨ ager von µ durch supp(µ) := X \ {x ∈ X | ∃ Umgebung U von x mit µ(U ) = 0}.
22.2. KOMPAKTA MIT GLATTEM RAND
403
Sei µ ein Maß mit supp(µ) = X und sei ρ : X → [0, ∞) stetig. Zeige, daß Zeige, daß supp(ρ) = supp(µρ ), wobei ¨ µρ das Maß aus Ubung 21.2.1 bezeichnet, d.h. es gilt. Z µρ (B) = ρdµ, (B ∈ B). B
¨ Ubung 22.1.3 : Finde ein Beispiel eines Maßes µ mit µ 6= 0, aber supp(µ) = ∅.
22.2
Kompakta mit glattem Rand
Betrachte den Abschluß A und das Innere Ao einer Teilmenge A eines topologischen Raumes X. Der Rand ∂A von A ist dann durch ∂A := A \ Ao definiert. Sei jetzt A ⊆ Rn eine kompakte Teilmenge (ein Kompaktum). Wir sagen A habe glatten Rand, wenn es zu jedem Randpunkt p ∈ ∂A eine offene Umgebung U ⊆ Rn und eine stetig differenzierbare Funktion ψ : U → R mit folgenden Eigenschaften gibt: (1) A ∩ U = {x ∈ U | ψ(x) ≤ 0}. (2) ψ 0 (x) 6= 0 f¨ ur alle x ∈ U .
A
ψ U
Lemma 22.2.1 : Sei A ⊆ Rn ein Kompaktum mit glattem Rand. Dann gilt ∂A ∩ U = {x ∈ U | ψ(x) = 0}. Beweis: “⊆” Sei x ∈ ∂A ∩ U . Da A kompakt ist, ist A insbesondere abgeschlossen. Es gilt also x ∈ ∂A ⊆ A und somit ψ(x) ≤ 0. Ist ψ(x) < 0, so ist die Menge {y ∈ U | ψ(y) < 0} eine offene Teilmenge von Rn , die x enth¨ alt, im Widerspruch zu x ∈ ∂A. Also gilt ψ(x) = 0. “⊇” Sei x ∈ U mit ψ(x) = 0. Dann ist x ∈ A, und wir zeigen, daß x ein Randpunkt ist. Wegen ψ 0 (x) 6= 0 existiert ein v ∈ Rn mit ψ 0 (x)(v) > 0, denn die lineare Abbildung ψ 0 (x) : Rn → R ist surjektiv. Nun ist ψ(x + tv) ψ(x + tv) − ψ(x) = lim . t→0 t→0 t t
ψ 0 (x)(v) = lim
Also existiert ein ² > 0, so daß ψ(x + tv) > 0 f¨ ur alle t ∈]0, ²[ gilt. Damit ist x + n1 v 6∈ A eine Folge, die gegen x konvergiert. Folglich ist x ∈ ∂A.
Korollar 22.2.2 : Der Rand eines Kompaktums mit glattem Rand ist eine (n − 1)-dimensionale C 1 Untermannigfaltigkeit von Rn .
404
KAPITEL 22. DER GAUSSSCHE INTEGRALSATZ
Beweis: Sei A ein Kompaktum mit glattem Rand. Nach Lemma 22.2.1 k¨onnen wir ∂A lokal als Nullstellenmenge der Funktion ψ schreiben, wobei 0 ein regul¨arer Wert von ψ ist. Die Behauptung folgt daher aus Bemerkung 20.3.3.
F¨ ur den Gaußschen Integralsatz ben¨otigen wir noch das Normalenfeld eines Kompaktums mit glattem Rand. Das ist ein Vektorfeld, das jedem Randpunkt p ∈ ∂A einen Normalenvektor von ∂A der L¨ange 1 zuordnet, der “nach außen zeigt”. Was das bedeuten soll, m¨ ussen wir pr¨azisieren.
Satz 22.2.3 : Sei A ⊆ Rn ein Kompaktum mit glattem Rand und a ∈ ∂A. Dann existiert genau ein Vektor ν(a) ∈ Rn mit folgenden Eigenschaften: (1) ν(a) ∈ Na (∂A), d.h. ν(a)⊥Ta (∂A). (2) kν(a)k = 1. (3) Es existiert ein ² > 0, so daß a + tν(a) 6∈ A f¨ ur alle t ∈]0, ²[ gilt. Beweis: Existenz: Zuerst finden wir eine offene Umgebung U von a und eine stetig differenzierbare Funktion ψ ∈ C 1 (U ) mit ψ 0 (a) 6= 0 und U ∩ A = {x ∈ U | ψ(x) ≤ 0}. Dann hat der Vektor ν(a) :=
gradψ(a) kgradψ(a)k
die gew¨ unschten Eigenschaften, denn (1) und (2) folgen direkt aus Ta (∂A) = ker ψ 0 (a) = (gradψ(a))⊥ (Satz 20.4.1). Die Eigenschaft (3) folgt wegen ¡ ¢ (gradψ(a) | gradψ(a)) ψ 0 (a) ν(a) = = kgradψ(a)k > 0 kgradψ(a)k wie im Beweis von Lemma 22.2.1. Eindeutigkeit: Da Ta (∂A) eine Hyperebene in Rn ist, ist Ta (∂A)⊥ ein eindimensionaler Vektorraum. Es gibt also genau zwei Vektoren, ¡die (1) und¢ (2) erf¨ ullen: ν(a) und −ν(a). Wie im Beweis von Lemma 22.2.1 sieht man, daß ψ a − tν(a) < 0 f¨ ur t > 0 ausreichend nahe bei 0 gilt. Also ist a − tν(a) ∈ A. Der Vektor −ν(a) gen¨ ugt also nicht der Bedingung (3).
Korollar 22.2.4 : Ist A ⊆ Rn ein Kompaktum mit glattem Rand, so ist ν : ∂A → Rn eine stetige Funktion. Beweis:
22.2. KOMPAKTA MIT GLATTEM RAND
405
Aus dem Beweis von Satz 22.2.3 folgt, daß ν lokal gegeben ist durch ν(a) :=
gradψ(a) , kgradψ(a)k
wobei ψ auf einer Umgebung von a stetig differenzierbar mit nicht verschwindendem Gradienten ist. Hieraus folgt die Stetigkeit von ν sofort.
Man nennt eine Funktion F : E → Rn , E ⊆ Rn , ein Vektorfeld auf E. In diesem Sinn ist ν ein stetiges Vektorfeld auf ∂A. Man nennt ν das ¨ außere Normalenfeld von A. Beispiel 22.2.5 : (a) Sei A := {x ∈ Rn | kxk ≤ R} die Kugel vom Radius R > 0. Dann ist A ein Kompaktum mit glattem Rand, denn die Funktion ψ : Rn → R,
x 7→ kxk2 − R
hat auf U := Rn \ {0} die gew¨ unschten Eigenschaften. Ist a ∈ ∂A, so ist gradψ(a) = 2a und daher ν(a) =
2a a = k2ak R
der zugeh¨orige Normalenvektor. (b) Wir betrachten den Fall n = 3. Sei dazu U ⊆ R2 offen und ϕ : U → R3 eine injektive Immersion. Dann ist ϕ(U ) lokal eine Hyperfl¨ache im R3 und ϕ eine Parametrisierung dieser Menge. Wir interessieren uns f¨ ur den Normalenvektor an dieser Fl¨ache. Der Tangentialraum an ϕ(U ) im Punkt ϕ(p) ist durch das Bild der linearen Abbildung ϕ0 (p) : R2 → R3 gegeben. Da ϕ eine Immersion ist, ist dies ein zweidimensionaler Unterraum von R3 . Also gibt es genau zwei Vektoren in ¡ ¢ ¡ ¢⊥ Nϕ(p) ϕ(U ) = Tϕ(p) ϕ(U ) mit der L¨ange 1.
¡ ¢ Wir legen den Normalenvektor ν ϕ(p) dadurch fest, daß wir verlangen, daß f¨ ur die Basisvektoren e1 , e2 ∈ R2 gilt ¡ ¡ ¢¢ det ϕ0 (p)e1 , ϕ0 (p)e2 , ν ϕ(p) > 0, d.h. die drei Vektoren X1 (p) := ϕ0 (p)(e1 ),
X2 (p) := ϕ0 (p)(e2 )
und
¡ ¢ ν ϕ(p)
bilden ein Rechtssystem im Sinne der Linearen Algebra. Mit dieser Information k¨onnen wir den Normalenvektor direkt ausrechnen: ¡ ¢ X1 (p) × X2 (p) , ν ϕ(p) = kX1 (p) × X2 (p)k wobei v × w das Vektorprodukt der beiden ¯ ¯e1 v1 ¯ v × w = ¯¯e2 v2 ¯e3 v3
Vektoren v, w ∈ R3 ist: ¯ w1 ¯¯ v2 w3 − v3 w2 w2 ¯¯ = v3 w1 − v1 w3 . w3 ¯ v1 w2 − v2 w1
406
KAPITEL 22. DER GAUSSSCHE INTEGRALSATZ ¡ ¢ Ist ϕ speziell gegeben durch eine Funktion f : U → R, d.h. ϕ(x) = x, f (x) , so ist
1 X1 (p) = 0 ∂f (p) ∂x1
und daher
0 X2 (p) = 1 , ∂f (p) ∂x2
(p) − ∂f ∂x1 X1 (p) × X2 (p) = − ∂f (p) ∂x2 1
und
(p) − ∂f ∂x 1 1 ∂f (p) ¡ ∂f (p) ¢2 ¡ ∂f (p) ¢2 − ∂x2 . + ∂x2 1 + ∂x1 1
¡ ¢ ν ϕ(p) = q
¡ ¢ In diesem Fall ist ν p, f (p) der obere Normalenvektor an den Graphen der Funktion f .
Das folgenden Lemma besagt, daß eine Kurve in einem metrischen Raum, die den Rand einer abgeschlossenen Teilmenge nicht trifft, entweder ganz im Innern der Menge enthalten ist, oder ganz im Komplement. Lemma 22.2.6 : Sei (X, d) ein metrischer Raum, I ein Intervall und γ : I → X eine stetige Funktion, d.h. eine Kurve in X. Ist A ⊆ X eine abgeschlossene Teilmenge mit γ(I) ∩ ∂A = ∅, so gilt entweder γ(I) ⊆ Ao oder γ(I) ∩ A = ∅. Beweis: F¨ ur eine Teilmenge B ⊆ X betrachten wir die Abstandsfunktion dB : X → R,
x 7→ inf{d(x, b) | b ∈ B}
¨ und bemerken, daß diese Funktion stetig ist (vgl. Ubung 10.3.1).
B X x
Es gilt sogar B = {x ∈ X | dB (x) = {0}}, denn dB (x) = 0 ist gleichbedeutend damit, daß B jede ²-Kugel B(x; ²) um x schneidet, was die Punkte in B charakterisiert. Wir betrachten nun die stetige Funktion fA := dA − dX\A : X → R.
22.2. KOMPAKTA MIT GLATTEM RAND
407
F¨ ur x ∈ A ist dann fA (x) = −dX\A (x) ≤ 0 und fA (x) = 0 genau dann, wenn dX\A (x) = 0 ist, also wenn x ∈ ∂A gilt. Ist x 6∈ A, so ist fA (x) = dA (x) > 0, da A abgeschlossen ist. Weil umgekehrt aus dA (x) > 0 sofort x ∈ X \ A folgt, haben wir Ao = f −1 (] − ∞, 0[),
∂A = f −1 (0),
X \ A = f −1 (]0, ∞[)
Nach Voraussetzung hat die Funktion fA ◦ γ : I → R keine Nullstelle, da γ(I) den Rand von A nicht schneidet. Aus dem Zwischenwertsatz 2.3.3 folgt daher fA ◦ γ(I) ⊆]0, ∞[ oder fA ◦ γ(I) ⊆] − ∞, 0[, d.h. γ(I) ⊆ X \ A oder γ(I) ⊆ Ao .
Bemerkung 22.2.7 : (lokale Beschreibung durch Graphen) Sei A ⊆ Rn ein Kompaktum mit glattem Rand und a ∈ ∂A. Wir w¨ahlen eine offene Umgebung U ⊆ Rn von a und eine stetig differenzierbare Funktion ψ : U → Rn mit A ∩ U = {x ∈ U | ψ(x) ≤ 0} und ψ 0 (x) 6= 0 f¨ ur alle x ∈ U . Gem¨aß Lemma 22.2.1 ist dann ∂A ∩ U = {x ∈ U | ψ(x) = 0}. ∂ψ Wegen ψ 0 (a) 6= 0 d¨ urfen wir o.B.d.A. annehmen, daß ∂x (a) 6= 0 ist. Mit dem Satz 12.2.1 u ¨ber implizite n n−1 Funktionen finden wir dann eine offene Menge U1 ⊆ R und eine stetig differenzierbare Funktion g : U1 → R sowie ein Intervall ]b, c[ mit der Eigenschaft, daß ¡ ¢ ∂A ∩ (U1 ×]b, c[) = { x0 , g(x0 ) | x0 ∈ U1 }
genau der Graph der Funktion g ist und V := U1 ×]b, c[⊆ U gilt (vgl. auch Satz 20.3.2). ∂ψ Ist ∂x (a) > 0, so behaupten wir, daß dann n V ∩ A = {x = (x0 , xn ) ∈ V | xn ≤ g(x0 )} gilt. Wegen
∂ψ ∂xn (a)
> 0 zeigt der Normalenvektor “nach oben”, ist also in a = (a0 , an ) gegeben durch ¡
¢ − gradg(a0 ), 1 ν(a) = p , 1 + kgrad(a0 )k2 da
¡ ¢ Ta (∂A) = { v, g 0 (a0 )v | v ∈ Rn−1 }
(vgl. Beispiel 22.2.5(b)). c
V
V
A
b
U1
x’
Definieren wir ϕ : V → R durch ϕ(x) := xn − g(x1 , . . . , xn−1 ), so ist ν(a) =
gradϕ(a) . kgradϕ(a)k
408
KAPITEL 22. DER GAUSSSCHE INTEGRALSATZ
Sei x = (x0 , xn ) ∈ V mit ϕ(x) < 0, d.h. xn < g(x0 ). Wir betrachten die Kurve γ(t) := (x0 , g(x0 ) − t) ¡ ¢ f¨ ur 0 ≤ t < g(x0 ) − b. Dann ist γ 0 (0) = (0, −1) und daher dϕ(γ(0)) γ 0 (0) = −1 < 0. Hieraus schließen −1 wir wie in Lemma 22.2.1, daß γ(t) ∈ Ao f¨ ur alle ausreichend kleinen¡ t > 0 gilt. ¢ Da γ o (∂A) = {0} ist, −1 o 0 folgt jetzt γ (A ) =]0, g(x ) − b[ aus Lemma 22.2.6, insbesondere γ − ϕ(x) = x ∈ A . Also ist {x ∈ V | ϕ(x) < 0} ⊆ Ao . Analog zeigt man {x ∈ V | ϕ(x) > 0} ⊆ X \ A. ∂ψ Gilt ∂x (a) < 0, so erhalten wir analog n V ∩ A = {x ∈ V | g(x0 ) ≤ xn }. In diesem Fall gilt
¡ ¢ gradg(a0 ), −1 ν(a) = p . 1 + kgrad(a0 )k2
Das folgende Lemma ist zentral f¨ ur den Beweis des Gaußschen Satzes. Lemma 22.2.8 : Sei U 0 ⊆ Rn−1 eine offene Menge, I =]α, β[⊆ R ein Intervall und g : U 0 → I stetig differenzierbar. Wir setzen A := {(x0 , xn ) ∈ U 0 × I | xn ≤ g(x0 )} und
M := {(x0 , xn ) ∈ U 0 × I | xn = g(x0 )}.
Dann gilt f¨ ur jedes f ∈ C 1 (U 0 × I) mit kompaktem Tr¨ ager und alle j = 1, . . . , n: Z Z ∂f (x) dλn (x) = f (x) νj (x) dSM (x), A ∂xj M wobei f¨ ur x = (x0 , xn )
¡ ν(x) = p
¢
− gradg(x0 ), 1
1 + kgradg(x0 )k2
.
supp f
c
g
b
U’
x’
Beweis: ¡ ¢ Nach Beispiel 21.3.4 ist das Oberfl¨achenmaß von M bzgl. der Parametrisierung x0 7→ x0 , g(x0 ) durch p dSM (x0 ) = 1 + kgradg(x0 )k2 dλn−1 (x0 ) gegeben. Wir unterscheiden die beiden F¨alle j < n und j = n:
22.2. KOMPAKTA MIT GLATTEM RAND
409
1.Fall: 1 ≤ j < n. Wir definieren Z F : U 0 × I → R,
(x0 , z) 7→
z
f (x0 , xn ) dxn .
α
¨ Dann gilt (vgl. Ubung ??) ∂F 0 (x , z) = f (x0 , z) ∂z
und
∂F 0 (x , z) = ∂xj
Z
z
α
∂f 0 (x , xn ) dxn . ∂xj
Daraus folgt mit der Kettenregel ∂ ∂xj
Z
g(x0 )
f (x0 , xn ) dxn
=
α
= =
¢ ∂ ¡ F •, g(•) ∂xj ¢ ∂F ¡ 0 ¢ ∂g 0 ∂F ¡ 0 x , g(x0 ) + x , g(x0 ) (x ) ∂xj ∂z ∂xj Z g(x0 ) ¡ ¢ ∂g 0 ∂f 0 (x , xn ) dxn + f x0 , g(x0 ) (x ). ∂xj ∂xj α
R g(x0 ) Da mit f auch die Funktion x0 7→ α f (x0 , xn ) dxn kompakten Tr¨ager in U 0 hat, folgt aus Satz 22.1.2(i): 0 Z Z ´ ∂ ³ g(x ) f (x0 , xn ) dxn dλn−1 (x0 ) = 0. U 0 ∂xj α Damit ergibt sich aus der Formel f¨ ur ν(x0 , g(x0 )) Z A
Z
³Z
´ ∂f 0 (x , xn ) dxn dλn−1 (x0 ) ∂xj U0 α Z Z g(x0 ) ³ ´ ∂ f (x0 , xn ) dxn dλn−1 (x0 ) U 0 ∂xj α ¶ Z µ ¡ 0 ¢ ∂g 0 0 (x ) dλn−1 (x0 ) − f x , g(x ) ∂xj U0 Z p f (x0 , g(x0 ))νj (x0 , g(x0 )) 1 + kgradg(x0 )k2 dλn−1 (x0 ) 0 ZU f (x)νj (x) dSM (x).
∂f (x) dλn (x) = ∂xj =
= =
g(x0 )
M
2.Fall: j = n. Da mit f f¨ ur jedes x0 ∈ U 0 auch die Funktion xn 7→ f (x0 , xn ) kompakten Tr¨ager hat, folgt aus dem Hauptsatz der Differential- und Integralrechnung Z
g(x0 )
α
¡ ¢ ∂f 0 (x , xn ) dxn = f x0 , g(x0 ) , ∂xn
also Z A
∂f (x) dλn (x) = ∂xn = = =
Z
³Z
´ ∂f 0 (x , xn ) dxn dλn−1 (x0 ) ∂xn 0 α ZU ¡ 0 ¢ f x , g(x0 ) dλn−1 (x0 ) 0 ZU p f (x0 , g(x0 ))νn (x0 , g(x0 )) 1 + kgradg(x0 )k2 dλn−1 (x0 ) 0 ZU f (x)νn (x) dSM (x). M
Damit ist der Beweis vollst¨andig.
g(x0 )
410
KAPITEL 22. DER GAUSSSCHE INTEGRALSATZ
¨ Ubung 22.2.1 : Berechne das ¨ außere Normalenfeld des Ellipsoids ½ ¾ x2 y2 z2 3 M := (x, y, z) ∈ R | 2 + 2 + 2 = 1 , a b c
a, b, c > 0.
¨ Ubung 22.2.2 : Sei M eine Fl¨ ache in R3 und ν : M → R3 das ¨ außere Normalenfeld. F¨ ur ein Vektorfeld f : R3 → R3 definiert man den Vektorfluß Φ von f durch M wie folgt: Z Φ := (f |ν) dSM . M
(i) Die Fl¨ ache sei durch die Parameterdarstellung P : U → R3 gegeben, wobei U ⊆ R2 eine offene Menge ist. Zeige, daß µ ¶¶ Z µ ∂P ∂P Φ= f (P (u, v))| (u, v) × (u, v) d(u, v). ∂u ∂v U (ii) Berechne den Vektorfluß durch die obere Halbkugelfl¨ ache mit Radius R, wenn das Vektorfeld f gegeben ist durch f (x, y, z) = (0, 0, x2 z 2 ).
22.3
Der Gaußsche Integralsatz
Wir definieren den Durchmesser einer Teilmenge M eines metrischen Raumes (X, d) durch ρ(M ) := sup{d(x, y) | x, y ∈ M }. M
y
x
¨ Lemma 22.3.1 : (Lebesguesches Uberdeckungslemma) Sei K eine kompakte Teilmenge eines metri¨ schen Raumes (X, d) und (U ) eine offene Uberdeckung von K, d.h. eine Familie offener Teilmengen j j∈J S von X mit K ⊆ j∈J Uj . Dann existiert ein λ > 0, so daß jede Teilmenge M ⊆ X mit ρ(M ) ≤ λ und M ∩ K 6= ∅ in einer der Mengen Uj enthalten ist.
Beweis: Zu jedem Punkt k ∈ K existiert ein j ∈ J mit k ∈ Uj . Da Uj offen ist, existiert ein ²k > 0 mit B(k; 2²k ) = {x ∈ X | d(x, k) < 2²k } ⊆ Uj .
22.3. DER GAUSSSCHE INTEGRALSATZ
411
¡ ¢ ¨ Nun bildet die Familie B(k; ²k ) k∈K eine offene Uberdeckung von K. Da K kompakt ist, existiert eine endliche Teil¨ uberdeckung. D.h. wir finden Punkte k1 , . . . km ∈ K mit K⊆
m [
B(ki ; ²ki ).
i=1
Wir setzen λ := min(²k1 , . . . , ²km ). Sei nun M ⊆ X eine Teilmenge, die K schneidet, mit ρ(M ) ≤ λ. Dann existiert ein x ∈ M ∩K. Weiter finden wir ein i mit d(x, ki ) < ²ki . F¨ ur jedes y ∈ M ist dann d(y, ki ) ≤ d(y, x) + d(x, ki ) < λ + ²ki ≤ 2²ki , d.h. M ⊆ B(ki ; 2²ki ), und gem¨aß unserer Konstruktion ist jede der Kugeln B(k; 2²k ), somit auch M , in einer der Mengen Uj enthalten.
¨ Eine Zahl λ mit den Eigenschaften aus Lemma 22.3.1 heißt eine Lebesguesche Zahl der Uberdeckung. ¨ Ubung 22.3.1 : Zeige, daß die Funktion ½ g : R → R,
t 7→
1 exp(− 1−t 2) 0
|t| < 1, |t| ≥ 1
beliebig oft differenzierbar ist. Hinweis: Zeige zuerst, daß auf ] − 1, 1[ die Ableitungen von g die Gestalt g (k) (x) = qk (x)g(x) haben, wobei qk eine rationale Funktion ist.
Bemerkung 22.3.2 : Wir betrachten die Funktion ½ 1 exp(− 1−t f¨ ur |t| < 1 2) g : R → R, t 7→ 0 f¨ ur |t| ≥ 1. ¨ Dann ist g beliebig oft differenzierbar, also in C ∞ (R) (vgl. Ubung 22.3.1). 0.35 0.3 0.25 0.2 0.15 0.1 0.05 -1
-0.5
0.5
1
Da g beliebig oft differenzierbar ist, gilt dies auch f¨ ur die Funktion X G(t) := g(t − k), k∈Z
denn in einer ausreichend kleinen Umgebung eines jeden Punktes x ∈ R liefern nur jeweils endlich viele Summanden einen Beitrag. Weiter gilt G(t − k) = G(t) f¨ ur alle t ∈ R und k ∈ Z sowie G(t) > 0. Also wird auch durch g(t) h(t) := G(t)
412
KAPITEL 22. DER GAUSSSCHE INTEGRALSATZ
eine C ∞ -Funktion definiert. Somit ist h ∈ Cc∞ (R), supp (h) = [−1, 1] und X
h(t − k) =
k∈Z
X g(t − k) 1 X G(t) = g(t − k) = = 1. G(t − k) G(t) G(t)
k∈Z
k∈Z
F¨ ur p ∈ Zn und ² > 0 definieren wir nun αp,² ∈ Cc∞ (Rn ) durch n ³x ´ Y j αp,² (x) := h − pj . ² j=1
Dann ist supp (αp,² ) = {x ∈ Rn | (∀j)|xj − ²pj | ≤ ²}, und wir haben
X
αp,² = 1.
p∈Zn
Die Funktionen (αp,² )p∈Zn nennt man daher eine glatte Teilung der Eins. Wir kommen nun zum Gaußschen Integralsatz. Wir rufen den Begriff der Divergenz in Erinnerung: Sei U ⊆ Rn offen und F : U → Rn eine stetig differenzierbare Funktion, d.h. ein Vektorfeld. Dann heißt die stetige Funktion n X ∂Fj div F := : U →R ∂xj j=1 die Divergenz des Vektorfeldes F . Satz 22.3.3 : (Gaußscher Integralsatz) Sei A ⊆ Rn ein Kompaktum mit glattem Rand, ν : ∂A → Rn das außere Normalenfeld und U ⊇ A eine offene Teilmenge von Rn . Dann gilt f¨ ur jedes stetig differenzierbare ¨ Vektorfeld F : U → Rn die Beziehung Z Z n div F dλ = (F (x) | ν(x)) dS∂A (x). A
∂A
Beweis: Idee: Man verwendet eine Teilung der Eins, um den Satz auf eine lokale Aussage zur¨uckzuf¨uhren. Dann ben¨ utzt man die lokale Beschreibung eines Kompaktums mit Rand durch Graphen von Funktionen, um die lokale Aussage mit den schon gerechneten Spezialf¨ alle Satz 22.1.2 und Lemma 22.2.8 zu erhalten.
Wir haben in Bemerkung 22.2.7 gesehen, daß jeder Punkt a ∈ ∂A eine Umgebung U hat, in der sich ∂A als Graph einer Funktion darstellen l¨aßt und A ∩ U als die Menge der Punkte, die u Graphen liegen. Deshalb existiert eine Familie offener Teilmengen ¨ber oder unter diesem S (Uj )j∈J von Rn mit j∈J Uj ⊇ A, so daß jedes Uj eine der folgenden Bedingungen erf¨ ullt: (1) Uj ⊆ A \ ∂A = Ao . (2) Nach eventueller Umnummerierung der Koordinaten hat Uj die Gestalt Uj = U 0 ×]a, b[, wobei U 0 ⊆ Rn−1 offen ist und eine stetig differenzierbare Funktion g : U 0 → R existiert, so daß Uj ∩ A = {(x0 , xn ) ∈ U 0 ×]a, b[| xn ≤ g(x0 )} bzw. Uj ∩ A = {(x0 , xn ) ∈ U 0 ×]a, b[| xn ≥ g(x0 )}.
22.3. DER GAUSSSCHE INTEGRALSATZ
413 A
¨ Sei λ eine Lebesguesche Zahl der Uberdeckung (Uj )j∈J der kompakten Teilmenge A von Rn (Lemma 22.3.1). Wir setzen λ ² := √ . 2 n Wir erinnern uns nun an die glatte Teilung der Eins (αp,² )p∈Zn aus Bemerkung 22.3.2. √ Der Tr¨ager jedes αp,² ist ein W¨ urfel der Seitenl¨ange 2², hat also einen Durchmesser 2² n ≤ λ. Jeder Tr¨ager supp (αp,² ) ist daher in einer der Mengen Uj enthalten. Sei P := {p ∈ Zn | supp (αp,² ) ∩ A 6= ∅}. Dann ist P beschr¨ankt, weil A beschr¨ ankt ist und jedes supp (αp,² ) h¨ochstens den Durchmesser λ hat. Also gibt es ein N ∈ N so, daß P in einem W¨ urfel der Kantenl¨ange N enthalten ist. So ein W¨ urfel kann aber nicht mehr als (N +1)n Punkte mit ganzzahligen Koordinaten enthalten. Also ist P endlich. Wir verwenden nun die Teilung der Eins, um den Gaußschen Integralsatz auf die F¨alle zur¨ uckzuf¨ uhren, wo sich alles in einer der Mengen Uj abspielt. A
Uj
supp α p, ε
Wir haben Z
Z div F dλn =
A
div ( A
X
αp,² F ) dλn =
p∈P
XZ p∈P
div (αp,² F ) dλn
A
und analog Z (F (x) | ν(x)) dS∂A (x) = ∂A
XZ p∈P
¡ ¢ (αp,² F )(x) | ν(x) i dS∂A (x). ∂A
Wir m¨ ussen den Satz daher nur f¨ ur die Funktionen αp,² F zeigen. Gem¨aß unserer Konstruktion ist supp (αp,² ) f¨ ur jedes p ∈ Zn in einem Uj enthalten. Gilt o Uj ⊆ A , so ist Z (αp,² F (x) | ν(x))i dS∂A (x) = 0, ∂A
da αp,² auf ∂A verschwindet, und die Behauptung folgt aus Z
Z div (αp,² F )dλn =
A
(Satz 22.1.2).
div (αp,² F )dλn = Uj
n Z X i=1
Uj
∂(αp,² Fi ) n dλ = 0 ∂xi
414
KAPITEL 22. DER GAUSSSCHE INTEGRALSATZ Gen¨ ugt Uj der Bedingung (2), so folgt die Behauptung durch Anwendung von Lemma 22.2.8 auf die Komponentenfunktionen f = αp,² Fi , i = 1, . . . , n, und durch Summation n Z X i=1
Uj
∂(αp,² Fi ) n dλ ∂xi
n Z X
=
αp,² (x)Fi (x)νi (x) dS∂A (x) Uj ∩∂A
i=1
Z =
(αp,² (x)F (x) | ν(x)) dS∂A (x) Uj ∩∂A
Z =
(αp,² (x)F (x) | ν(x)) dS∂A (x) ∂A
Beispiel 22.3.4 : Wir betrachten das Vektorfeld F : Rn → Rn ,
x 7→ x.
Dann ist div F (x) = n. F¨ ur jedes Kompaktum A ⊆ Rn mit glattem Rand folgt daher aus dem Gaußschen Integralsatz Z Z nvoln (A) = div F dλn = (x | ν(x)) dS∂A (x), A
also
1 voln (A) = n
∂A
Z (x | ν(x)) dS∂A (x). ∂A
Ist speziell A die n-dimensionale Einheitskugel Bn , so ist ∂Bn = S n−1 die (n − 1)-dimensionale Einheitssph¨are. In diesem Fall ist ν(x) = x f¨ ur alle x ∈ S n−1 , und daher Z Z 1 1 cn = voln (Bn ) = (x | ν(x)) dS∂A (x) = kxk2 dS∂A (x) n ∂A n ∂A Z 1 ωn = dS∂A (x) = . n ∂A n Wir erhalten also erneut die Formel ωn = ncn f¨ ur die Oberfl¨ache der Einheitssph¨are, die wir auch schon in Beispiel 21.3.8 abgeleitet hatten.
Bemerkung 22.3.5 : (Physikalische Interpretation des Gaußschen Integralsatzes) Der Skalarprodukt im Gaußsche Integralsatz Z Z div F dλn = (F (x) | ν(x)) dS∂A (x) A
∂A
l¨aßt sich als (F (x) | ν(x)) = kF (x)k · cos α(x) umschreiben, da ν(x) in jedem Randpunkt ein Einheitsvektor ist. Dabei ist α(x) ∈ [0, π] der Winkel, den der Vektor F (x) mit dem Normalenvektor ν(x) einschließt. In diesem Sinn entspricht (F (x) | ν(x)) der orthogonalen Projektion von F (x) auf ν(x).
22.3. DER GAUSSSCHE INTEGRALSATZ
415 ν (x) α (x) x
F(x)
Ein Physiker stellt sich (F (x) | ν(x)) dS∂A (x) nun als den durch das Oberfl¨achenelement dS∂A (x) austretenden Fluß des Vektorfeldes F vor (vgl. ¨ Ubung 22.2.2). Das Integral Z (F (x) | ν(x)) dS∂A (x) ∂A
wird demzufolge als der Gesamtfluß des Vektorfeldes F durch die Oberfl¨ache ∂A interpretiert. Der Gaußsche Satz liefert also eine Methode, diesen Gesamtfluß als ein Integral der Divergenz von F u ¨ber A zu berechnen. Ist das Vektorfeld divergenzfrei, d.h. gilt div F = 0, so ergibt sich Z (F (x) | ν(x)) dS(x) = 0, ∂A
d.h. der Gesamtfluß durch den Rand eines jeden Kompaktums mit glattem Rand ist 0. (a) Diese Situation tritt zum Beispiel auf, wenn F den Fluß einer inkompressiblen Fl¨ ussigkeit beschreibt. Man kann sich die Tatsache, daß der Gesamtfluß durch ∂A verschwindet, in diesem Fall so veranschaulichen, daß die Fl¨ ussigkeitsmenge, die sich innerhalb von A befindet, wegen der Inkompressibilit¨ at genau dem Volumen von A entspricht, also konstant ist. Daher ist die Fl¨ ussigkeitsbilanz in A ausgewogen, d.h. zu jedem Zeitpunkt fließt gleichviel rein und raus. (b) Eine a¨hnliche Situation liegt vor, wenn F = E ein elektrisches Feld beschreibt und A keine Ladungen enth¨alt. (c) (Das Archimedische Prinzip) Wir betrachten einen K¨orper A ⊆ R3 (ein Kompaktum mit glattem Rand), der sich in einer Fl¨ ussigkeit der konstanten Dichte c > 0 befindet, deren Oberfl¨ache durch die Ebene x3 = 0 gegeben sei. In jedem Randpunkt x ∈ ∂A u ussigkeit auf den K¨orper A einen Druck ¨bt die Fl¨ der Gr¨oße cx3 ν(x) aus, wobei ν(x) der ¨außere Normaleneinheitsvektor im Punkt x ist. Der Druck nimmt linear mit zunehmender Tiefe unter der Oberfl¨ache zu und ist wegen x3 < 0 nach innen gerichtet. Die Gesamtkraft, die auf den K¨orper A wirkt, ist daher durch Z K= cx3 ν(x) dS∂A (x) ∂A 3
gegeben. Dies ist ein R -wertiges Integral, dessen Komponenten gegeben sind durch Z Kj = cx3 νj (x) dS∂A (x), j = 1, 2, 3. ∂A
Mit den Vektorfeldern F(1) (x) = (x3 , 0, 0), gilt dann
F(2) (x) = (0, x3 , 0),
F(3) (x) = (0, 0, x3 )
Z Kj = c ∂A
(F(j) (x) | ν(x)) dS∂A (x),
also liefert der Gaußsche Integralsatz 22.3.3 ½ Z ∂x3 0 Kj = c dλn (x) = cvol(A) A ∂xj
f¨ ur j 6= 3 f¨ ur j = 3,
416
KAPITEL 22. DER GAUSSSCHE INTEGRALSATZ
also
0 K = c 0 . vol(A)
Da dies ein Vektor ist, der nach oben zeigt, ist der K¨orper einem Auftrieb unterworfen, dessen Gr¨oße direkt proportional zu seinem Volumen und der Dichte c der Fl¨ ussigkeit ist – dies entspricht genau dem Gewicht der verdr¨angten Fl¨ ussigkeit.
¨ Ubung 22.3.2 : Berechne die Divergenz der folgenden Vektorfelder v : R3 → R3 . (i) (x, y, z) 7→ (x2 y, ex+z , sin y cos z), (ii) (x, y, z) 7→ (sin(xy), y 3 z, x2 eyz ).
¨ Ubung 22.3.3 : (m + 3)kxkm .
Sei m ∈ Z und v : R3 \ {0} → R3 das Vektorfeld x 7→ kxkm x. Zeige, daß div(v)(x) =
¨ Ubung 22.3.4 : Sei f :]0, ∞[→ R stetig differenzierbar und v : R3 \ {0} → R3 ,
x 7→ f (kxk)x.
Zeige, daß rot(v) = 0. ¨ Ubung 22.3.5 : Bestimme eine differenzierbare Funktion f :]0, ∞[→ R so, daß f¨ ur das Vektorfeld v : R3 \ {0} → R3 ,
x 7→ f (kxk)x
gilt: div(v)(x) = 3 + 5kxk2 .
22.4
Die Greensche Formel
Sei U ⊆ Rn eine offene Menge, A ⊆ U ein Kompaktum mit glattem Rand und ν : ∂A → Rn das ¨außere Normalenfeld von A. F¨ ur eine stetig differenzierbare Funktion f : U → R definieren wir die Ableitung in Normalenrichtung in einem Punkt a ∈ ∂A durch n
X ∂f ∂f (a) := (f 0 (a))(ν(a)) = (a)νj (a) = (grad f (a) | ν(a)). ∂ν ∂xj j=1 Ist f ∈ C 2 (U ), so setzt man ∆f :=
n X ∂2f j=1
∂x2j
und nennt den Operator ∆ den Laplace-Operator. Lemma 22.4.1 : F¨ ur f, g ∈ C 2 (U ) und F ∈ C 1 (U, Rn ) gilt: (i) div (f F ) = f div (F ) + (gradf | F ). (ii) div (gradf ) = ∆f . Beweis:
22.4. DIE GREENSCHE FORMEL
417
(i) folgt direkt aus der Produktregel: ∂f Fj ∂Fj ∂f =f + Fj . ∂xj ∂xj ∂xj (ii) folgt unmittelbar aus der Definition und (gradf )j =
∂f ∂xj .
Satz 22.4.2 : (Greensche Formel) F¨ ur f, g ∈ C 2 (U ) gilt Z Z ³ ∂g ∂f ´ (f ∆g − g∆f ) dλn = f −g dS∂A . ∂ν ∂ν A ∂A Beweis: Wir wenden den Gaußschen Integralsatz auf das Vektorfeld F := f gradg − ggradf an. Mit den Formeln aus Lemma 22.4.1 erhalten wir div (F ) = div (f gradg) − div (g gradf ) = f div (gradg) + (gradf | gradg) − gdiv (gradf ) − (gradf | gradg) = f ∆g − g∆f. Auf dem Rand von A ergibt sich (F | ν) = f (gradg | ν) − g(gradf | ν) = f
∂f ∂g −g . ∂ν ∂ν
Damit folgt die Behauptung aus dem Gaußschen Integralsatz.
¨ Ubung 22.4.1 : Sei f : [a, b] × [c, d] → R stetig. Zeige, daß die Funktion Z d F : [a, b] → R, x 7→ f (x, y)dy c
stetig auf [a, b] ist. ¨ Ubung 22.4.2 : Sei A die obere H¨ alfte der Einheitskugel im R3 und F : R3 → R3 das Vektorfeld (x, y, z) 7→ (xz 2 , x2 y − z 3 , 2xy + y 2 z). Berechne Z (F (x) | ν(x))dS∂A (x). ∂A
¨ Ubung 22.4.3 : Sei A = [0, 1] × [0, 1] × [0, 1]. Berechne das Integral Z ((4xz, −y 2 , yz) | ν(x, y, z))dS∂A (x, y, z). ∂A
¨ Ubung 22.4.4 : Sei A ⊂ Rn ein Kompaktum mit glattem Rand und u, v reellwertige C 2 -Funktionen auf einer offenen, A umfassenden Menge. Zeige, daß Z Z Z ∂v u dS∂A . u∆vdx = (gradu | gradv)dx + ∂ν ∂A A A Hinweis: Betrachte das Vektorfeld F = ugradv.
418
KAPITEL 22. DER GAUSSSCHE INTEGRALSATZ
¨ Ubung 22.4.5 : Best¨ atige den Gaußschen Divergenzsatz f¨ ur den Kreiszylinder x2 + y 2 ≤ R2 , 0 ≤ z ≤ H und das Vektorfeld F : R3 → R3 , (x, y, z) 7→ (xz, yz, 3).
¨ Ubung 22.4.6 : Sei G ⊂ Rn offen, v harmonisch auf G und A ⊂ G ein Kompaktum mit glattem Rand. Zeige, daß Z Z ∂v v dS∂A = |gradv|2 dx. ∂A ∂ν A ¨ Ubung 22.4.7 : Seien f, g : R → R zweimal stetig differenzierbar. Beweise ohne Benutzung von partieller Integration die Formel Z b (f (x)g 00 (x) − f 00 (x)g(x))dx = f (b)g 0 (b) − f 0 (b)g(b) − f (a)g 0 (a) + f 0 (a)g(a). a
¨ Ubung 22.4.8 : Sei G ⊂ Rn offen. Eine Funktion v : G → R heißt harmonisch auf G, wenn sie dort eine C 2 -Funktion ist und der Gleichung ∆v = 0 gen¨ ugt. Zeige: Ist v harmonisch auf G und ist A ⊂ G ein Kompaktum mit glattem Rand, so gilt Z ∂v dS∂A = 0. ∂ν ∂A ¨ Ubung 22.4.9 : Der K¨ orper A werde durch eine Oberfl¨ ache ∂A begrenzt, die sich aus dem Kreis x2 + y 2 ≤ 4 in der xy-Ebene und dem Paraboloid z = 4 − x2 − y 2 zusammensetzt, und das Vektorfeld F : R3 → R3 sei definiert durch F (x, y, z) := (x + y, y + z, x + z). R Berechne das Integral ∂A (F | ν)dS∂A zuerst direkt und dann mit Hilfe des Gaußschen Integralsatzes. Hinweis: ¨ Ubung 22.2.2 ¨ Ubung 22.4.10 : Sei A ⊂ Rn ein Kompaktum mit glattem Rand, das den Nullpunkt im Innern enth¨ alt. F¨ ur x ∈ ∂A sei α(x) der Winkel zwischen dem Ortsvektor x und dem Normalenvektor n(x). Zeige, daß Z cos α(x) dS∂A (x) = ωn , n−1 ∂A kxk wobei ωn die Oberfl¨ ache der n-dimensionalen Einheitskugel ist. Hinweis: Wende den Gaußschen Integralsatz auf das Vektorfeld x F (x) := kxkn an. ¨ ur Ubung 22.4.11 : Sei U ⊆ Rk offen, f ∈ C 2 (U ) und A ⊂ U ein Kompaktum mit glattem Rand. Zeige, daß f¨ jedes a ∈ A und f¨ ur jede Nullfolge (rn )n∈N gilt: Z 1 ∂f dS∂B(a;rn ) . (∆f )(a) = lim n→∞ Vol(B(a; rn )) ∂B(a;r ) dν n
Kapitel 23
Pfaffsche Formen In diesem Kapitel gehen wir einen ersten Schritt in Richtung einer allgemeinen Integrationstheorie auf Mannigfaltigkeiten, die nicht auf die Einbettung der Mannigfaltigkeit in Rn Bezug nimmt. Diese Theorie ben¨ utzt Differentialformen. Weil man f¨ ur allgemeine Differentialformen gewisse Vorarbeiten u otigt, ¨ber multilineare Abbildungen ben¨ beschr¨ anken wir uns in dieser Vorlesung auf den Fall von Kurvenintegralen. Die Differentialformen, die hier aufreten, nennt man Pfaffsche Formen bzw. Differentialformen erster Ordnung. Mit ihnen l¨ aßt sich zum Beispiel die Frage danach, ob ein gegebenes Vektorfeld ein Gradient einer Funktion ist, angemessen diskutieren. In der Sprache der Pfaffschen Formen ist es die Frage nach der Existenz einer Stammfunktion einer gegebenen Pfaffschen Form. Diese wiederum l¨ aßt sich durch das Verschwinden von Integralen der Pfaffschen Form entlang geschlossener Wege charakterisieren.
23.1
Pfaffsche Formen und Kurvenintegrale
Sei U ⊆ Rn offen. Eine Pfaffsche Form auf U ist eine Funktion ω : U → Hom(Rn , R), d.h. f¨ ur jedes x ∈ U ist ω(x) : Rn → R eine lineare Abbildung. Wir schreiben A1 (U ) f¨ ur den Raum der Pfaffschen Formen auf U . Jeder differenzierbaren Funktion F : U → R k¨onnen wir eine Pfaffsche Form zuordnen, denn die Ableitung F 0 : U → Hom(Rn , R) ordnet jedem Punkt x ∈ U eine lineare Abbildung F 0 (x) : Rn → R zu. Man schreibt, gerade in diesem Kontext, sehr oft dF (x) statt F 0 (x). Die Pfaffsche Form dF heißt auch das totale Differential von F . Ist γ : [a, b] → U eine stetig differenzierbare Kurve (d.h. stetig und auf ]a, b[ stetig differenzierbar) und ω auf U eine stetige Pfaffsche Form, so definieren wir das Integral von ω u ¨ber γ durch Z
Z ω := γ
b
¡ ¢ hω γ(t) , γ 0 (t)i dt =
a
Z
n bX a j=1
¡ ¢ fj γ(t) γj0 (t) dt,
wobei ω(x)(ej ) = fj (x) und ej der j-te kanonische Basisvektor von Rn ist. Hier schreiben wir hω(x), vi := (ω(x))(v) f¨ ur v ∈ Rn . 419
420
KAPITEL 23. PFAFFSCHE FORMEN Ist γ lediglich st¨ uckweise stetig differenzierbar und a = x0 < x1 < . . . < xm = b
eine Unterteilung, so daß die Wege γj := γ|[xj ,xj+1 ] : [xj , xj+1 ] → U stetig differenzierbar sind, so definieren wir Z ω :=
m−1 XZ
γ
j=0
ω.
γj
Bemerkung 23.1.1 : (Koordinatendarstellung) M¨ochte man konkret mit Pfaffschen Formen rechnen, so erweist es sich als praktisch, sie in den nat¨ urlichen Koordinaten des Rn zu beschreiben. F¨ ur jedes j ∈ {1, . . . , n} betrachten wir dazu die Funktion xj : Rn → R,
p = (p1 , . . . , pn ) 7→ pj .
Da xj stetig differenzierbar ist, erhalten wir Pfaffsche Formen dxj ∈ A1 (Rn ), j = 1, . . . , n. F¨ ur jedes p ∈ Rn ist dann dxj (p)(v) = vj , d.h. dxj : Rn → Hom(Rn , R) ist die konstante Abbildung, die jedem p die lineare Abbildung xj zuordnet. In diesem Sinn haben wir dxj (p) = xj f¨ ur alle p ∈ Rn . Es ist klar, daß die linearen Abbildungen x1 , . . . , xn eine Basis des n-dimensionalen Vektorraums Hom(Rn , R) bilden. F¨ ur jedes f ∈ Hom(Rn , R) gilt demgem¨aß n X f= f (ej )xj , j=1 n
denn f¨ ur v ∈ R haben wir n n n X X X f (v) = f ( vj ej ) = vj f (ej ) = f (ej )xj (v). j=1
j=1
j=1
Ist nun ω ∈ A1 (U ) eine Pfaffsche Form und definieren wir wie zuvor die Funktionen fj : U → R durch fj (p) := ω(p)(ej ), so erhalten wir f¨ ur jedes p ∈ U : ω(p) =
n X
fj (p)dxj (p),
j=1
also (∗)
ω=
n X
fj dxj .
j=1
Wir k¨onnen daher jede Pfaffsche Form wie in (∗) darstellen, und diese Darstellung ist eindeutig. Stellen wir uns die lineare Abbildung ω(p) als eine (1 × n)-Matrix vor, so ist ω(p) = (f1 (p), . . . , fn (p)). In diesem Sinn entsprechen die Funktionen fj gerade den Eintr¨agen der Matrizen, durch die ω in den einzelnen Punkten von U beschrieben wird. Ist ω = dF das totale Differential einer stetig differenzierbaren Funktion F , so erhalten wir dF = weil dF (x)(ej ) =
∂F ∂xj (x).
n X ∂F dxj , ∂xj j=1
23.1. PFAFFSCHE FORMEN UND KURVENINTEGRALE
421
P Sei ω = j fj dxj eine stetige Pfaffsche Form in der offenen Menge U ⊆ Rn und γ : [a, b] → U eine stetig differenzierbare Kurve. Weiter sei φ : [c, d] → [a, b] eine stetig differenzierbare Bijektion mit φ(c) = a und φ(d) = b. Dann ist γ ◦ φ ebenfalls eine stetig differenzierbare Kurve γ ◦ φ : [c, d] → U mit dem gleichen Bild sowie dem gleichen Anfangs- und Endpunkt wie γ. R R Lemma 23.1.2 : γ ω = γ◦φ ω. Beweis: ¡ ¢ Nach der Kettenregel gilt (γ ◦ φ)0 (t) = φ0 (t)γ 0 φ(t) . Aus der Substitutionsregel (6.5), die nichts anderes ist als die Transformationsformel f¨ ur eindimensionale Integrale, ergibt sich daher Z Z d ¡ ¢ ω = hω γ ◦ φ(t) , (γ ◦ φ)0 (t)i dt γ◦φ
c
Z = =
d
¡ ¡ ¢¢ ¡ ¢ hω γ φ(t) , γ 0 φ(t) iφ0 (t) dt Zc b Z ¡ ¢ hω γ(t) , γ 0 (t)i dt = ω. a
γ
Bemerkung 23.1.3 : Analog zu Lemma 23.1.2 zeigt man, daß f¨ ur eine stetig differenzierbare Bijektion φ : [c, d] → [a, b] mit φ(c) = b und φ(d) = a die Beziehung Z Z ω=− ω γ◦φ
γ
gilt. Wir stellen hier ein interessantes Ph¨anomen fest, das bei der Transformationsformel f¨ ur Integrale nicht sichtbar ist: durch die Umkehrung der Orientierung (φ ist monoton fallend), ¨andert das Kurvenintegral sein Vorzeichen. Anschaulich bedeutet dies, daß beim Durchlaufen der Kurve in umgekehrter Richtung das Kurvenintegral sein Vorzeichen umkehrt. Wir berechnen nun das Kurvenintegral eines totalen Differentials. Proposition 23.1.4 : Sei U ⊆ Rn offen und F : U → R stetig differenzierbar sowie γ : [a, b] → U eine st¨ uckweise stetig differenzierbare Kurve mit γ(a) = x und γ(b) = y. Dann gilt Z dF = F (y) − F (x). γ
Beweis: Wir nehmen zuerst an, daß γ stetig differenzierbar ist. Aus der Kettenregel 3.2.6 und dem Hauptsatz 9.1.4 der Differential- und Integralrechnung folgt Z Z b Z b ¡ ¢ dF = hdF γ(t) , γ 0 (t)i dt = (F ◦ γ)0 (t) dt γ
a
=
a
(F ◦ γ)(b) − (F ◦ γ)(a) = F (y) − F (x).
Der allgemeine Fall eines st¨ uckweise stetig differenzierbaren Weges ergibt sich nun durch Zusammensetzen der einzelnen Integrale.
422
KAPITEL 23. PFAFFSCHE FORMEN
Proposition 23.1.4 besagt insbesondere, daß das Integral eines totalen Differentials nur von Anfangsund Endpunkt des Weges abh¨angt. Ist γ ein geschlossener Weg, d.h. gilt γ(a) = γ(b), so erhalten wir Z dF = 0. γ
Beispiel 23.1.5 : In U := R2 \ {0} betrachten wir die Pfaffsche Form ω=−
x2
y x dx + 2 dy 2 +y x + y2
und den geschlossenen Weg γ : [0, 2π] → U,
t 7→ (cos t, sin t).
0
Dann ist γ (t) = (− sin t, cos t) und daher Z Z 2π Z 2π (sin t)2 + (cos t)2 ω= dt = 1 dt = 2π. (sin t)2 + (cos t)2 γ 0 0 Wir sehen insbesondere, daß ω kein totales Differential sein kann, da das Integral u ¨ber die geschlossene Kurve γ nicht verschwindet. Ein metrischer Raum (U, d) heißt zusammenh¨ angend, wenn er nicht disjunkte Vereinigung von zwei offenen nichtleeren Teilmengen ist. D.h. sind U1 , U2 ⊆ U offen mit U = U1 ∪ U2
und
U1 ∩ U2 = ∅,
so ist eine der Mengen Uj leer. Ist U eine offene Teilmenge von Rn , so ist jede offene Teilmenge von U auch eine offene Teilmenge von Rn . D.h. U ist genau dann zusammenh¨angend, wenn keine zwei nichtleeren offenen Teilmengen U1 , U2 ⊆ Rn so existieren, daß U = U1 ∪ U2 und U1 ∩ U2 = ∅ gelten. Eine nichtleere offene Teilmenge U ⊆ Rn nennen wir ein Gebiet. Bemerkung 23.1.6 : (a) Man nennt einen metrischen Raum (U, d) bogenzusammenh¨ angend, wenn f¨ ur jedes Paar x, y ∈ U eine stetige Kurve γ : [a, b] → U mit γ(a) = x und γ(b) = y existiert, d.h. x und y lassen sich durch die Kurve γ verbinden.
Wir zeigen, daß aus dem Bogenzusammenhang der Zusammenhang folgt: Sei dazu U = U1 ∪ U2 eine disjunkte Zerlegung in nichtleere offene Teilmengen. Dann existieren x ∈ U1 und y ∈ U2 und wir finden eine stetige Kurve γ : [a, b] → U mit γ(a) = x und γ(b) = y. In dem metrischen Raum U sind die beiden Teilmengen U1 und U2 beide auch abgeschlossen, so daß ∂U1 = ∂U2 = ∅. Aus Lemma 22.2.6 folgt γ([a, b]) ⊆ U1 oder γ([a, b]) ⊆ U2 , im Widerspruch dazu, daß x und y beide auf der Kurve liegen. (b) Wir nennen eine Teilmenge U ⊆ Rn sternf¨ ormig bzgl. p ∈ U , wenn f¨ ur jeden Punkt q ∈ U die ganze Verbindungsstrecke [p, q] := {λp + (1 − λ)q | λ ∈ [0, 1]} in U liegt.
23.1. PFAFFSCHE FORMEN UND KURVENINTEGRALE
423
P
Ist U sternf¨ormig bzgl. des Punktes p, so ist U auch bogenzusammenh¨angend, denn sind x und y Punkte in U , so kann man sie durch eine Kurve verbinden, die zuerst die Strecke [x, p] und dann die Strecke [p, y] durchl¨auft. (c) Ist U ⊆ Rn konvex, d.h. liegt mit x, y ∈ U auch deren Verbindungsstrecke [x, y] in U , so ist U sternf¨ormig bzgl. jedem Punkt p ∈ U , insbesondere also auch zusammenh¨angend.
(d) Intervalle I ⊆ R sind zusammenh¨angend, denn sie sind konvex, so daß wir (c) anwenden k¨onnen. (e) Die Menge U :=]0, 1[∪]1, 2[⊆ R ist nicht zusammenh¨angend.
Lemma 23.1.7 : Ist U ⊆ Rn ein Gebiet und x, y ∈ U , so existiert eine st¨ uckweise stetig differenzierbare Kurve γ : [a, b] → U mit γ(a) = x und γ(b) = y. Beweis: Zu x ∈ U betrachten wir die Teilmenge Ux aller derjenigen Punkte p ∈ U , f¨ ur die eine st¨ uckweise stetig differenzierbare Kurve η : [c, d] → U mit η(c) = x und η(d) = p existiert. Ux ist offen: Ist p ∈ Ux , so folgt aus der Offenheit von U die Existenz eines ² > 0, so daß die Kugel B(p; ²) ganz in U enthalten ist. Sei q ∈ B(p; ²) und η : [c, d] → U eine st¨ uckweise stetig differenzierbare Kurve mit η(c) = x und η(d) = p. Wir verl¨angern nun diese Kurve wie folgt: ½ η(t), f¨ ur t ∈ [c, d] ηe : [c, d + 1] → U, t 7→ p + (t − d)(q − p), f¨ ur t ∈]d, d + 1].
q x
p
Dann ist ηe eine st¨ uckweise stetig differenzierbare Kurve in U , die x mit q verbindet. Also ist B(p; ²) ⊆ Ux , folglich Ux offen. U \ Ux ist offen: Ist p 6∈ Ux , so finden wir wie oben ein ² > 0 mit B(p; ²) ⊆ U . W¨are ein Punkt q ∈ B(p; ²) in der Menge Ux enthalten, so k¨onnten wir die Kurve von x nach q durch ein Streckenst¨ uck, das q in B(p; ²) mit p verbindet, verl¨angern und w¨ urden so eine st¨ uckweise stetig differenzierbare Kurve von x nach p erhalten, ein Widerspruch. Also ist B(p; ²) ganz in U \ Ux enthalten und U \ Ux somit offen.
424
KAPITEL 23. PFAFFSCHE FORMEN
q p
x
Nun ist U = Ux ∪ (U \ Ux ) eine Zerlegung von U in zwei offene disjunkte Teilmengen. Da Ux nicht leer ist und U zusammenh¨angend, muß U \ Ux leer sein. Also ist U = Ux . Insbesondere ist y ∈ Ux , und dies war zu zeigen.
Satz 23.1.8 : Sei U ⊆ Rn ein Gebiet. Eine stetig differenzierbare Funktion F : U → R ist genau dann konstant, wenn dF = 0 gilt. Beweis: Ist F konstant, so gilt trivialerweise dF = 0. Wir nehmen nun an, daß dF = 0 gilt, und fixieren einen Punkt x ∈ U . Nach Lemma 23.1.7 existiert zu jedem y ∈ U eine st¨ uckweise stetig differenzierbare Kurve γ : [a, b] → U mit γ(a) = x und γ(b) = y. Mit Proposition 23.1.4 ergibt sich nun Z F (y) − F (x) = dF = 0. γ
Also ist F konstant.
23.2
Stammfunktionen von Pfaffschen Formen
Sei ω eine stetige Pfaffsche Form auf der offenen Teilmenge U ⊆ Rn . Eine stetig differenzierbare Funktion F : U → R heißt Stammfunktion von ω, wenn dF = ω gilt. Bemerkung 23.2.1 : (a) Ist F eine Stammfunktion von ω und c : U → R, p 7→ c die konstante Funktion mit Wert c, so ist auch F + c eine Stammfunktion von ω, da d(F + c) = dF + dc = dF = ω gilt. Sind umgekehrt F1 und F2 zwei Stammfunktionen von ω, so ist d(F1 − F2 ) = 0. Ist U ein Gebiet, so schließen wir mit Satz 23.1.8, daß F1 − F2 konstant ist. Auf einem Gebiet U sind Stammfunktionen also bis auf eine additive Konstante eindeutig bestimmt, sofern sie existieren. (b) Sei n = 1 und U ein offenes Intervall. Ist ω eine stetige Pfaffsche Form auf U , so k¨onnen wir ω schreiben als ω = f dx. Ist F : U → R eine stetig differenzierbare Funktion, so ist dF =
dF dx. dx
Also ist F genau dann eine Stammfunktion der Pfaffschen Form ω, wenn F eine Stammfunktion der Funktion f im Sinne der Differentialrechnung einer Ver¨anderlichen ist.
23.2. STAMMFUNKTIONEN VON PFAFFSCHEN FORMEN
425
Insbesondere folgt aus dem Hauptsatz der Differential- und Integralrechnung die Existenz einer Stammfunktion f¨ ur jede stetige Pfaffsche Form ω auf einem Intervall. Man bekommt sie zum Beispiel durch Z x F (x) := f (t) dt, x0
wobei x0 ∈ U ein fester Punkt ist. (c) Im Gegensatz zum eindimensionalen Fall existiert f¨ ur n = 2 nicht f¨ ur jede stetige Pfaffsche Form eine Stammfunktion. Ein Gegenbeispiel hierzu liefert f¨ ur U := R2 \ {0} die Pfaffsche Form ω=−
x2
y x dx + 2 dy 2 +y x + y2
aus ur die das Integral R Beispiel 23.1.5. Wir haben gesehen, daß eine geschlossene Kurve existiert, f¨ ω nicht verschwindet. Also hat γ keine Stammfunktion. γ
Satz 23.2.2 : Eine stetige Pfaffsche Form ω auf dem Gebiet U besitzt genau dann eine Stammfunktion, wenn f¨ ur jeden geschlossenen Weg γ in U das Integral von ω u ¨ber γ verschwindet. Beweis: Die Notwendigkeit der Bedingung, daß Integrale u ¨ber geschlossene Kurven verschwinden, folgt aus Proposition 23.1.4. Wir nehmen nun an, diese Bedingung sei erf¨ ullt. Wir w¨ahlen einen festen Punkt p ∈ U . Zu jedem Punkt q ∈ U existiert dann eine st¨ uckweise stetig differenzierbare Kurve γ : [0, 1] → U mit γ(0) = p und γ(1) = q (Lemma 23.1.7). Wir definieren Z Fγ (q) := ω. γ
Um so eine Funktion auf U definieren zu k¨onnen, m¨ ussen wir zeigen, daß Fγ (p) nicht von der Wahl der Kurve γ abh¨angt. Sei also η : [0, 1] → U eine weitere st¨ uckweise stetig differenzierbare Kurve mit η(0) = p und η(1) = q. Wir betrachten die Kurve ½ γ(t), f¨ ur t ∈ [0, 1] α : [0, 2] → U, t 7→ η(2 − t), f¨ ur t ∈]1, 2]. γ q
η
p
Dann ist α eine st¨ uckweise stetig differenzierbare Kurve mit α(0) = γ(0) = p = η(0) = α(2), d.h. α ist eine geschlossene Kurve. Gem¨aß unserer Voraussetzung ist daher Z Z Z 0= ω= ω − ω, α
γ
η
da im zweiten Teilst¨ uck von α die Kurve η r¨ uckw¨arts durchlaufen wird (siehe Bemerkung 23.1.3). Hieraus ergibt sich Z Z Fγ (q) = ω = ω = Fη (q). γ
η
426
KAPITEL 23. PFAFFSCHE FORMEN Wir k¨onnen daher durch F : U → R,
q 7→ Fγ (q)
eine Funktion definieren. Da es nicht auf die Kurve ankommt, die p und q verbindet, schreiben wir Z q Z F (q) =
ω := p
ω, γ
wobei γ irgendeine Kurve von pPnach q ist. Wir zeigen jetzt, daß F eine Stammfunktion von n ω ist. Dazu schreiben wir ω = j=1 fj dxj mit stetigen Funktionen fj : U → R. Wir haben zu zeigen, daß F stetig differenzierbar ist mit ∂F = fj , ∂xj
j = 1, . . . , n.
Sei dazu x ∈ U und ² > 0 mit B(x; ²) ⊆ U . F¨ ur y ∈ B(x; ²) haben wir dann Z x Z y Z y Z y ω= ω+ ω = F (x) + ω. F (y) = p
p
x
x
Da die Verbindungsstrecke der Punkte x und y ganz in B(x; ²) und damit auch in U liegt, k¨onnen wir den Weg γy : [0, 1] → U, t 7→ x + t(y − x) betrachten, der x und y verbindet. Damit erhalten wir mit y = x + h und γy0 (t) = h f¨ ur alle t: Z F (x + h) − F (x)
Z
x+h
=
Z
ω= x n Z 1 X
=
γx+h
fj (x j=1 0 n ³Z 1 X
1
ω=
hω(x + th), hi dt 0
+ th)hj dt
´ fj (x + th) dt hj .
=
j=1
0
F¨ ur die Ableitungen ergibt sich hieraus ∂F (x) ∂xj
= = =
¢ 1¡ F (x + hj ej ) − F (x) hj Z ´ 1³ 1 lim fj (x + thj ej ) dt hj hj →0 hj 0 Z 1 Z 1 lim fj (x + thj ej ) dt = fj (x) dt = fj (x), lim
hj →0
hj →0
0
0
wobei wir f¨ ur die letzte Gleichheit den Satz u ¨ber die dominierte Konvergenz verwenden.
Beispiel 23.2.3 : In einem Gebiet U ⊆ R3 sei das Vektorfeld F : U → R3 gegeben. Wir denken uns F als ein zeitlich konstantes Kraftfeld, z.B. ein elektrisches Feld. Sind F1 , F2 , F3 die Komponenten dieses Feldes, so k¨onnen wir diese auch als Komponenten einer Pfaffschen Form interpretieren: ω := F1 dx1 + F2 dx2 + F3 dx3 . Ist nun γ : [a, b] → U eine st¨ uckweise stetig differenzierbare Kurve, so interpretieren wir das Integral Z Z bX Z b ¡ ¢ ¡ ¢ ω= Fj γ(t) γj0 (t) dt = (F γ(t) | γ 0 (t)) dt γ
a j=1
a
23.3. GESCHLOSSENE PFAFFSCHE FORMEN
427
als die Arbeit, die man aufwenden muß, um sich von dem Punkt γ(a) zum Punkt γ(b) entlang des Weges γ zu bewegen. Das ist dadurch gerechtfertigt, daß man f¨ ur ein kleines St¨ uck des Weges n¨aherungsweise annehmen kann, daß F konstant ist und γ(t) = γ(ti ) + gilt. Dann ist
¢ t − ti ¡ γ(ti+1 ) − γ(ti ) ti+1 − ti
¡ ¢ ¡ ¢ (F γ(t) | γ 0 (t)) = (F γ(ti ) | γ(ti+1 ) − γ(ti )).
Dieser Ausdruck ist proportional zu der L¨ange des Weges, die hier durch die Differenz γ(ti+1 ) − γ(ti ) gegeben ist, zu der Gr¨oße des Kraftfelds F im Punkt γ(ti ), und vor allem zum Kosinus cos α des Winkels α zwischen diesen beiden Vektoren, da ³ ¡ ´ ¢ ¡ ¢ F γ(ti ) | γ(ti+1 ) − γ(ti ) = cos α · kF γ(ti ) k · kγ(ti+1 ) − γ(ti )k gilt. Ist das Kraftfeld senkrecht zur Richtung des Weges, so wird keine Arbeit verrichtet; ist es dagegen parallel zum Weg, so kommt es auf seine Richtung an, ob Energie notwendig ist, um dagegen anzuk¨ampfen, oder ob Energie dadurch frei wird, daß man sich in Richtung des Feldes bewegt. Ist F = E ein elektrostatisches Feld, so ist die Arbeit, die man zum Verschieben einer Ladung entlang eines Weges γ verrichten muß, aus physikalischen Gr¨ unden nur abh¨angig von Anfangs- und Endpunkt des Weges, denn sonst w¨ urde sich Energie dadurch billig gewinnen lassen, daß man eine Ladung auf eine geschlossene Bahn schickt, auf der sie Energie gewinnen kann. R In diesem Fall h¨angt das Integral γ ω also nur vom Anfangs- und Endpunkt des Weges ab und verschwindet insbesondere f¨ ur geschlossene Wege. Nach Satz 23.2.2 hat die Pfaffsche Form ω daher auf U eine Stammfunktion, die gegeben ist durch Z p Φ(p) := ω, p0
wobei p0 ∈ U ein fest gew¨ahlter Punkt ist. Die Funktion Φ nennt man ein Potential des Kraftfelds. Ist γ eine Kurve von p nach q, so ist Z ω = Φ(q) − Φ(p), γ
d.h. die Differenz der Werte der Potentialfunktion Φ gibt die Arbeit an, die entlang des Weges verrichtet wurde.
23.3
Geschlossene Pfaffsche Formen
Die Bedingung, daß die Integrale einer Pfaffschen Form u ¨ber alle geschlossenen Kurven verschwinden, kann man in der Regel nicht so leicht nachpr¨ ufen. Die folgende Bedingung ist eng damit verwandt, l¨ aßt sich aber sehr leicht verifizieren. Sei U ⊆ Rn eine offene Teilmenge. Eine stetig differenzierbare Pfaffsche Form ω = heißt geschlossen, wenn f¨ ur alle j, k ∈ {1, . . . , n} gilt:
P j
∂fj ∂fk = . ∂xj ∂xk Besitzt die Pfaffsche Form ω auf U eine Stammfunktion, so ist ω geschlossen, denn aus ω = dF = folgt
X ∂F X dxj = fj dxj ∂xj j j
∂fk ∂2F ∂2F ∂fj = = = . ∂xj ∂xj ∂xk ∂xk ∂xj ∂xk
fj dxj auf U
428
KAPITEL 23. PFAFFSCHE FORMEN
Die Geschlossenheit einer Pfaffschen Form ist also notwendig f¨ ur die Existenz einer Stammfunktion. In der Regel hat eine geschlossene Pfaffsche Form keine Stammfunktion. F¨ ur U := R2 \ {0} und die Pfaffsche Form y x ω=− 2 dx + 2 dy 2 x +y x + y2 ist f1 (x, y) = −
y x2 + y 2
und
f2 (x, y) =
x . x2 + y 2
Damit ergibt sich ∂f1 1 2y 2 2y 2 − x2 − y 2 y 2 − x2 =− 2 + = = ∂y x + y2 (x2 + y 2 )2 (x2 + y 2 )2 (x2 + y 2 )2 und
∂f2 1 2x2 x2 + y 2 − 2x2 y 2 − x2 = 2 − 2 = = 2 . 2 2 2 2 2 2 ∂x x +y (x + y ) (x + y ) (x + y 2 )2
Also ist ω geschlossen. Andererseits haben wir in Bemerkung 23.2.1(d) schon gesehen, daß ω keine Stammfunktion besitzt. Ob die Geschlossenheit einer Pfaffschen Form f¨ ur die Existenz einer Stammfunktion hinreichend ist, entscheidet sich an der geometrischen bzw. topologischen Struktur des Gebietes U . Hier¨ uber kann man in einer Vorlesung u ¨ber “Algebraische Topologie” mehr lernen. Wir diskutieren hier nur eine einfache Bedingung. Satz 23.3.1 : Ist U ein Gebiet, das sternf¨ ormig bzgl. dem Punkt p ∈ U ist, so besitzt jede geschlossene Pfaffsche Form auf U eine Stammfunktion. Beweis: Nach Translation des Koordinatensystems d¨ urfen wir o.B.d.A. p = 0 annehmen. Sei ω = P j fj dxj . Wir definieren eine Funktion F : U → R durch das Integral Z
1
F (x) := 0
n ³X
Z
´ fj (tx)xj
dt =
ω, γx
j=1
wobei γx : [0, 1] → U,
t 7→ tx.
Man beachte, daß wegen der Sternf¨ormigkeit von U bzgl. 0 das Bild der Kurve γx in U liegt. ¨ Mit Ubung ?? sehen wir zun¨achst, daß F differenzierbar ist, und daß wir die Ableitungen durch n Z 1 X ¢ ∂F ∂ ¡ (x) = fj (tx)xj dt ∂xk ∂xk j=1 0 n Z 1 n Z 1 X X ∂fj (tx) ∂xj = txj dt + fj (tx) dt ∂xk ∂xk j=1 0 j=1 0 Z 1 Z 1X n ∂fk (tx) txj dt + fk (tx) dt = ∂xj 0 0 j=1 erhalten. Setzen wir Lk (t) := fk (tx), so folgt aus der Kettenregel L0k (t) =
n X ∂fk (tx) j=1
∂xj
xj ,
23.3. GESCHLOSSENE PFAFFSCHE FORMEN
429
und wir erhalten ∂F (x) = ∂xk
Z
1
0
Z
=
1
Z L0k (t)t dt + ¡
tLk (t)
¢0
1
Lk (t) dt 0
dt = 1Lk (1) − 0Lk (0) = Lk (1) = fk (x).
0
Wir kommen nochmal auf das Beispiel 23.1.5 zur¨ uck. Nat¨ urlich ist das Gebiet U = R2 \ {0} nicht sternf¨ormig bzgl. eines seiner Punkte. Nehmen wir allerdings einen ganzen Strahl, zum Beispiel ]−∞, 0]× {0} = −R+ e1 heraus, so ist das Restgebiet ¡ U1 := R2 \ ] − ∞, 0] × {0}) sternf¨ormig bzgl. des Punktes (1, 0). Nach Satz 23.3.1 hat ω daher auf dem kleineren Gebiet U1 eine Stammfunktion. ¨ Ubung 23.3.1 : Sei v : R3 → R3 ein stetig differenzierbares Vektorfeld und F := rot v. Zeige, daß f¨ ur jedes Kompaktum A ⊂ R3 mit glattem Rand gilt: Z (F | ν)dS∂A = 0. ∂A
¨ Ubung 23.3.2 : Sei U ⊆ Rn offen, und sei V eine offene Teilmenge von U . Zeige, daß V auch offen in Rn ist. ¨ aume zusammenh¨ angend? Ubung 23.3.3 : Sind die folgenden metrischen R¨ (i) Q mit der diskreten Metrik, (ii) Q mit der nat¨ urlichen Metrik.
¨ Ubung 23.3.4 : Vereinigungen?
Zeige, daß der Durchschnitt beliebig vieler konvexer Mengen konvex ist. Gilt dies auch f¨ ur
¨ Ubung 23.3.5 : Sei G ⊆ Rn ein Gebiet. Eine stetige Funktion f : G → R heißt subharmonisch auf G, wenn f¨ ur alle offenen Kugeln B(x0 ; r) ⊆ G gilt: Z 1 f (x)dλn (x) ≥ f (x0 ). λn (B(x0 ; r)) B(x0 ;r) Beweise das Maximumsprinzip f¨ ur subharmonische Funktionen: Gibt es ein x0 ∈ G mit sup |f (x)| = f (x0 ), x∈G
so ist f konstant. Hinweis: Zeige, daß {x ∈ G | f (x) = f (x0 )} zugleich offen und abgeschlossen ist und benutze Tutoren¨ ubung 23.3.10. ¨ Ubung 23.3.6 : Berechne die folgenden Kurvenintegrale R (i) γ (x dy − y dx), wobei γ : [a, b] → R2 , γ(t) = et (cos t, sin t), R (ii) γ (x dx + y dy + z dz), wobei γ : [0, 2π] → R3 , γ(t) = (et sin t , t2 − 2πt, cos(t/2)). ¨ Ubung 23.3.7 : Sei f :]0, ∞[→ R stetig. Zeige, daß die Pfaffsche Form f (kxk)(dx1 + · · · + dxn ) eine Stammfunktion auf Rn \ {0} besitzt.
430
KAPITEL 23. PFAFFSCHE FORMEN
¨ Ubung 23.3.8 : Zeige, daß jede sternf¨ ormige Menge U ⊆ Rn bogenzusammenh¨ angend ist. ¨ Ubung 23.3.9 : F¨ ur q1 , . . . qn ∈ R, ξ1 , . . . ξn ∈ R3 , definiere u : R3 \ {ξ1 , . . . , ξn } → R,
x 7→
n X j=1
qi 4πkx − ξj k
und F := grad u. Sei A ⊂ R3 ein Kompaktum mit glattem Rand, derart, daß ∂A ∩ {ξ1 , . . . , ξn } = ∅. Zeige, daß
Z ∂A
(F | ν)dS∂A = qj1 + · · · + qjk ,
wobei j1 , . . . , jk die Indizes j bezeichnet, f¨ ur die ξj ∈ A. ¨ Ubung 23.3.10 : Zeige, daß ein metrischer Raum (U, ρ) genau dann zusammenh¨ angend ist, wenn außer ∅ und U keine Menge zugleich offen und abgeschlossen ist. ¨ Ubung 23.3.11 : Besitzen die folgenden Pfaffschen Formen eine Stammfunktion? (i) ω = y dx − (y − x) dy, (ii) ω = y dx + (x − y) dy.
¨ ur welche a ∈ R besitzt die auf R3 definierte Pfaffsche Form Ubung 23.3.12 : F¨ µ 2 ¶ x (x2 + xy)dx + + y + z dy + aydz 2 eine Stammfunktion? ¨ Ubung 23.3.13 : Sei G ⊂ R2 ein Gebiet und u : G → R eine zweimal stetig differenzierbar. Weiter sei v : G → R eine stetig differenzierbare Funktion mit ∂u ∂v = ∂x ∂y
und
∂u ∂v =− ∂y ∂x
Zeige, daß v harmonisch ist. ¨ Ubung 23.3.14 : Sei U ⊆ R2 offen. Eine stetig differenzierbare Funktion f : U → C heißt holomorph, wenn sie der folgenden Cauchy–Riemann–Differentialgleichung gen¨ ugt: ∂f ∂f +i = 0. ∂x ∂y Zeige, daß eine stetig differenzierbare Funktion f : U → C genau dann holomorph ist, wenn eine der beiden folgenden Bedingungen erf¨ ullt ist: (a) Es gilt df = gdz mit einer stetigen Funktion g : U → C, wobei z : U → C, (x, y) 7→ x + iy. (b) Die Differentialform ω := f dz ist geschlossen.
¨ Ubung 23.3.15 : Zeige, daß endliche Summen, Produkte und Quotienten (sofern definiert) holomorpher Funktionen wieder holomorph sind.
Kapitel 24
Die Integrals¨ atze von Green und Stokes In diesem Kapitel werden wir den Greenschen Integralsatz f¨ ur Kompakta mit glattem Rand in der Ebene und den Stokesschen Integralsatz f¨ ur Kompakta mit glattem Rand auf Fl¨ achen im Raum diskutieren. Bei beiden S¨ atzen handelt es sich im wesentlichen um Konsequenzen des zweidimensionalen Gaußschen Integralsatzes, bei denen man das auftretende Randintegral, das in diesem Fall ein Kurvenintegral ist, als Integral einer Pfaffschen Form schreibt.
24.1
Der Greensche Integralsatz in der Ebene
In diesem Abschnitt werden wir den Gaußschen Integralsatz f¨ ur den Fall n = 2 etwas genauer anschauen. Da der Rand eines Kompaktums A mit glattem Rand in der Ebene R2 eine Kurve ist, k¨ onnen wir das Randintegral, das im Gaußschen Satz auftritt, auch als ein Kurvenintegral interpretieren, und es durch das Integral einer Pfaffschen Form ausdr¨ ucken. Sei A ⊆ R2 ein Kompaktum mit glattem Rand. Dann ist ∂A eine kompakte eindimensionale Untermannigfaltigkeit von R2 , wir k¨onnen ∂A also in endlich viele St¨ ucke zerlegen, die wir jeweils durch Kurven γj ]aj , bj [→ ∂A, die Immersionen sind, parametrisieren k¨onnen (Satz 20.2.4). Hierbei reicht es aus, nur solche Kurven zu betrachten, f¨ ur die das Kompaktum A jeweils links von der Kurve A liegt. Wir m¨ochten das f¨ u r eine Kurve γ : ]a, b[→ ∂A mathematisch pr¨azisieren. Wir verlangen ¡ ¢ von γ, daß der Normalenvektor ν γ(t) in dem Randpunkt γ(t) durch (∗)
¡ ¢ ν γ(t) =
1 kγ 0 (t)k
µ
γ20 (t) −γ10 (t)
¶
gegeben ist. Die Normierung ist also so gew¨ahlt, daß ¡ ¡ ¢ ¢ kγ 0 (t)k2 = kγ 0 (t)k > 0 det ν γ(t) , γ 0 (t) = kγ 0 (t)k ist. Geometrisch l¨aßt sich das so deuten, daß, wenn man sich die Kurve ∂A als einen Weg vorstellt, der den Bereich A uml¨auft, und man f¨ahrt gem¨aß der durch γ gegebenen Parametrisierung den Weg ∂A entlang, so liegt A st¨andig auf der linken Seite des Weges. 431
¨ KAPITEL 24. DIE INTEGRALSATZE VON GREEN UND STOKES
432
γ ’( t )
A ν(γ( t))
¨ Da ∂A kompakt ist, und die offenen Teilmengen γj (]aj , bj [) eine offene Uberdeckung von ∂A bilden, existiert eine endliche Teil¨ uberdeckung. Endlich viele Kurven γj , j = 1, . . . , k, reichen also schon aus, um ∂A zu parametrisieren. Sind diese Kurven alle so orientiert, daß A jeweils links von γj liegt, und u ¨berlappen sich zwei Bereiche γj (]aj , bj [) und γi (]ai , bi [), so hat die zugeh¨orige Parametertransformation ¡ ¢ ¡ ¢ φij : Uij := γj−1 γi (]ai , bi [) → Uji := γi−1 γj (]aj , bj [) die Eigenschaft, daß sie streng monoton wachsend ist, denn wegen γj ◦ φij = γi , ist ¡ ¢ γi0 (t) = (γj ◦ φij )0 (t) = γj0 φij (t) φ0ij (t), und die Richtung beider Vektoren ist durch (∗) festgelegt. Also ist φ0ij (t) > 0 f¨ ur alle t ∈ Uij . F¨ ur eine stetige Pfaffsche Form ω auf einer offenen Umgebung U von A folgt daher Z Z ω= ω γj ◦φij
γi
aus Lemma 23.1.2. Nun verf¨ahrt man wie in der Definition des Oberfl¨achenmaßes um das Integral zu definieren als Z k Z X ¡ ¢ ω := hω γj (t) , γj0 (t)i dt, ∂A
j=1
R ∂A
ω
Ij
wobei die Teilintervalle Ij ⊆]aj , bj [ so gew¨ ahlt sind, daß ∂A =
[
γj (Ij )
j
¨ eine disjunkte Vereinigung ist. Ahnlich wie in Lemma 21.3.2 sieht man ein, daß dieses Integral nicht von der Wahl der Kurven γj und der Mengen Ij abh¨angt. Satz 24.1.1 : (Greenscher Integralsatz) Sei A ⊆ R2 ein Kompaktum mit glattem Rand, und U ⊇ A eine offene Teilmenge von R2 . Dann gilt f¨ ur jedes stetig differenzierbare Vektorfeld F : U → R2 die Beziehung Z Z div F = F1 dx2 − F2 dx1 . A
∂A
Beweis: Gem¨aß dem Gaußschen Integralsatz 22.3.3 haben wir nur zu zeigen, daß Z Z F1 dx2 − F2 dx1 = (F (x) | ν(x)) dS∂A (x) ∂A
∂A
gilt. Hierzu verwenden wir eine Parametrisierung γ : ]a, b[→ ∂A, wie wir sie oben diskutiert haben. Wir berechnen die beiden Integrale. Zun¨achst ist Z
Z F1 dx2 − F2 dx1 =
γ
a
b
³
´ ¡ ¢ ¡ ¢ F1 γ(t) γ20 (t) − F2 γ(t) γ10 (t) dt
24.1. DER GREENSCHE INTEGRALSATZ IN DER EBENE
433
das Integral auf der linken Seite. Wegen (∗) ist der zugeh¨orige Teil des rechten Integrals Z
Z
b
(F | ν) dS∂A = γ(]a,b[)
¡ ¡ ¢ ¡ ¢¢ F γ(t) | ν γ(t) kγ 0 (t)k dt
a
gegeben durch µ 0 ¶´ ³ ¡ ¢ γ2 (t) = F γ(t) | −γ10 (t) ¡ ¢ 0 ¡ ¢ = F1 γ(t) γ2 (t) − F2 γ(t) γ10 (t).
¡ ¡ ¢ ¡ ¢¢ F γ(t) | ν γ(t) kγ 0 (t)k
Da beiden Integrale u ¨bereinstimmen, folgt die Behauptung nun aus dem Gaußschen Integralsatz.
Bemerkung 24.1.2 : Nimmt man einige Kenntnisse u ¨ber die Struktur von Mannigfaltigkeiten hinzu, so kann man sich die theoretische Seite der Parametrisierung des Randes von A etwas leichter machen. Zun¨achst ist ∂A eine eindimensionale kompakte Untermannigfaltigkeit. Man kann sich nun u ¨berlegen, das ∂A dann eine disjunkte Vereinigung von maximalen zusammenh¨angenden Untermannigfaltigkeiten ¨ ist, die man Zusammenhangskomponenten nennt. Da diese eine offene Uberdeckung von A bilden, gibt es nur endlich viele Zusammenhangskomponenten. Nun muß man noch einsehen, daß jede kompakte eindimensionale Untermannigfaltigkeit M ein Kreis ist, d.h. es existiert eine Kurve γ : [a, b] → M , so daß γ|]a,b[ eine injektive Immersion ist und γ(a) = γ(b) gilt. Die Menge M entsteht in diesem Sinn durch “Verkleben” der beiden Randpunkte a und b des Intervalls [a, b]. Nimmt man obige Hintergrundinformationen zur Hilfe, so sieht man, daß ∂A eine endliche Vereinigung von Kreiskurven ist, was man nat¨ urlich an jedem konkreten Beispiel sofort verifiziert. Ist ∂A die Vereinigung der Bilder der Kurven γ1 , . . . , γk , so ergibt sich direkt Z ω= ∂A
k Z X j=1
ω.
γj
¨ Ubung 24.1.1 : Die Zykloide beschreibt die Bahn eines Punktes auf der Peripherie eines Kreises von Radius 1, der auf der x-Achse abrollt: γ : R → R2 , t 7→ (t − sin t, 1 − cos t). Berechne mit dem Greenschen Integralsatz die Fl¨ ache unter einer Periode der Zykloide. ¨ Ubung 24.1.2 : Berechne mit Hilfe des Greenschen Satzes das Integral Z (x − y 3 )dx + x3 dy, ∂S 2
2
2
wobei S := {(x, y) ∈ R |x + y ≤ 1}. ¨ Ubung 24.1.3 : Beweise den Cauchyschen Integralsatz: Sei U ⊆ C offen und sternf¨ ormig, und sei f : U → C holomorph. Dann gilt f¨ ur jede stetig differenzierbare geschlossene Kurve γ : [a, b] → U Z b Z f dz := f (γ(t))γ 0 (t)dt = 0. γ
a
¨ KAPITEL 24. DIE INTEGRALSATZE VON GREEN UND STOKES
434
24.2
Der Satz von Stokes im Raum
In diesem Abschnitt betrachten wir einen einfachen Spezialfall des Stokesschen Integralsatzes. Sei U ⊆ R2 offen und φ : U → R3 eine injektive Immersion, die eine Einbettung ist. Dann ist M := φ(U ) eine 2-dimensionale Untermannigfaltigkeit des R3 . Nun sei A ⊆ U ein Kompaktum mit glattem Rand. Dann ist G := φ(A) ⊆ M eine kompakte Teilmenge, die von der Kurve ∂G := φ(∂A) berandet wird. In vielen Anwendungen tritt das Problem auf, den Fluß eines Vektorfeldes durch eine geschlossene Kurve im Raum zu berechnen. Wir denken uns die Menge ∂G als eine solche Kurve und somit den Fluß eines Vektorfeldes F “durch” die Kurve als das Integral Z (∗) (F (x) | ν(x)) dSM (x). G
Die Richtung des Normalenvektors legen wir hier dadurch fest, daß ¡ ¡ ¢¢ det φ0 (p)e1 , φ0 (p)e2 , ν φ(p) > 0 f¨ ur die Basisvektoren e1 , e2 im R2 gilt. ν(Φ( p)) Φ’( p)(e 2)
Φ’( p)(e 1)
Man beachte hierbei, daß man dem anschaulichen Konzept des Flusses eines Vektorfelds durch eine geschlossene Kurve im Raum erst dadurch einen mathematischen Sinn geben kann, daß man in die besagte Kurve eine Fl¨ache “einspannt”, und den Fluß wie in (∗) definiert. Das Integral (∗) ist ein Integral der Typs, wie es im Gaußschen Integralsatz auftritt, allerdings wollen wir es als ein Fl¨achenintegral interpretieren und es zu einem Integral u ¨ber die Kurve ∂G in Beziehung setzen. Um dies tun zu k¨onnen, muß man voraussetzen, daß das Vektorfeld F eine spezielle Gestalt hat. Sei U ⊆ R3 offen und F : U → R3 ein stetig differenzierbares Vektorfeld. Das Vektorfeld rotF : U → R3 , definiert durch
¯ ¯ e1 ¯ rotF : = ¯¯ e2 ¯ e3
∂ ∂x1 ∂ ∂x2 ∂ ∂x3
F1 F2 F3
¯ ¯ ¯ ¯ := ¯ ¯
∂F3 ∂x2 ∂F1 ∂x3 ∂F2 ∂x1
− − −
∂F2 ∂x3 ∂F3 ∂x1 ∂F1 ∂x2
,
ist die Rotation von F . Nat¨ urlich ist die Determinantenschreibweise hier nur symbolisch gemeint. Sie ist allerdings hilfreich, um sich die Formel zu merken. Satz 24.2.1 : (Integralsatz von Stokes) Sei U ⊆ R2 offen und φ : U → R3 eine injektive Immersion, die eine Einbettung ist. Weiter sei A ⊆ U ein Kompaktum mit glattem Rand ∂A und G := φ(A) sowie ∂G := φ(∂A). Ist F ein stetig differenzierbares Vektorfeld auf einer offenen Umgebung V von G, so gilt Z Z (rotF | ν) dSM = F1 dx1 + F2 dx2 + F3 dx3 . G
∂G
24.2. DER SATZ VON STOKES IM RAUM
435
Beweis: Wir bezeichnen die Koordinaten in U mit u = (u1 , u2 ). In Beispiel 22.2.5 haben wir gesehen, daß wir den Normalenvektor ν ausdr¨ ucken k¨onnen durch ¡ ¢ X1 (u) × X2 (u) ν φ(u) = , kX1 (u) × X2 (u)k wobei
X1 (u) = φ0 (u)(e1 ) =
∂φ = ∂u1
und
X2 (u) = φ0 (u)(e2 ) =
∂φ = ∂u2
∂φ1 ∂u1 ∂φ2 ∂u1 ∂φ3 ∂u1 ∂φ1 ∂u2 ∂φ2 ∂u2 ∂φ3 ∂u2
gilt. Die Fl¨ache des von den beiden Vektoren X1 (u) und X2 (u) aufgespannten Parallelogramms ist gegeben durch kX1 (p) × X2 (p)k (Nachweis!), so daß wir f¨ ur das Oberfl¨achenmaß SM die Formel dSM (φ(u)) = kX1 (u) × X2 (u)k dλ2 (u) erhalten (vgl. Abschnitt 21.2). Hiermit ergibt sich f¨ ur das Oberfl¨achenintegral u ¨ber A = φ−1 (G): Z Z ³ ´ ¡ ¢ (rotF (x) | ν(x)) dSM (x) = rotF φ(u) | X1 (u) × X2 (u) dλ2 2(u). G
A
Bevor wir weiterrechnen, beachten wir, daß beide Seiten der Integralformel linear von F abh¨angen. Wir k¨onnen daher die F¨alle, wo F jeweils nur eine von 0 verschiedene Komponente hat, getrennt betrachten. Wir nehmen daher o.B.d.A. an, daß F2 = F3 = 0 gilt (die anderen beiden F¨alle gehen analog). In diesem Fall vereinfacht sich die Formel f¨ ur das Oberfl¨achenintegral wegen 0 ∂F rotF = ∂x31 . 1 − ∂F ∂x2 Im folgenden schreiben wir verk¨ urzt ∂j φk := Integral u ¨ber A) ist nun gegeben durch (rotF | X1 × X2 )
= =
=
Der Integrand des Oberfl¨achenintegrals (als
∂F1 ∂F1 (∂1 φ1 ∂2 φ3 − ∂1 φ3 ∂2 φ1 ) − (∂1 φ1 ∂2 φ2 − ∂1 φ2 ∂2 φ1 ) ∂x3 ∂x2 ∂F1 ∂F1 ∂F1 ∂F1 ∂1 φ3 ∂2 φ1 − ∂2 φ3 ∂1 φ1 − ∂2 φ2 ∂1 φ1 + ∂1 φ2 ∂2 φ1 ∂x3 ∂x3 ∂x2 ∂x2 ´ ³ ∂F ´ ³ ∂F ∂F1 ∂F1 1 1 ∂1 φ3 + ∂1 φ2 ∂2 φ1 − ∂2 φ3 + ∂2 φ2 ∂1 φ1 ∂x3 ∂x2 ∂x3 ∂x2 ³ ∂F ´ ∂F1 ∂F1 1 ∂1 φ3 + ∂1 φ2 + ∂1 φ1 ∂2 φ1 ∂x3 ∂x2 ∂x1 ³ ∂F ´ ∂F1 ∂F1 1 − ∂2 φ1 + ∂2 φ 3 + ∂2 φ2 ∂1 φ1 ∂x1 ∂x3 ∂x2 ∂(F1 ◦ φ) ∂φ1 ∂(F1 ◦ φ) ∂φ1 − . ∂u1 ∂u2 ∂u2 ∂u1
= − =
∂φk ∂uj .
¨ KAPITEL 24. DIE INTEGRALSATZE VON GREEN UND STOKES
436
F¨ ur das Kurvenintegral auf der rechten Seite erhalten wir mit einer geeigneten Parametrisierung γ : [a, b] → ∂A des Randes von A: Z Z b ¡ ¢ F1 dx1 = F1 φ ◦ γ(t) (φ1 ◦ γ)0 (t) dt φ◦γ
a
Z
= =
¡ ¢³ ∂φ1 (γ(t)) 0 ∂φ1 (γ(t)) 0 ´ F1 φ ◦ γ(t) γ1 (t) + γ2 (t) dt ∂u1 ∂u2 Za ∂φ1 ∂φ1 du1 + (F1 ◦ φ) du2 . (F1 ◦ φ) ∂u1 ∂u2 γ b
Da wir den Greenschen Satz 24.1.1 verwenden wollen, ist nun klar, daß wir die beiden folgenden Funktionen als die Komponenten eines Vektorfelds betrachten m¨ ussen: H1 = (F1 ◦ φ)
∂φ1 ∂u2
und
H2 = −(F1 ◦ φ)
∂φ1 . ∂u1
Dann ist div H
∂(F1 ◦ φ) ∂φ1 ∂ 2 φ1 ∂(F1 ◦ φ) ∂φ1 ∂ 2 φ1 + (F1 ◦ φ) − − (F1 ◦ φ) ∂u1 ∂u2 ∂u1 ∂u2 ∂u2 ∂u1 ∂u1 ∂u2 ∂(F1 ◦ φ) ∂φ1 ∂(F1 ◦ φ) ∂φ1 − , ∂u1 ∂u2 ∂u2 ∂u1
= =
d.h. ((rotF ) ◦ φ | X1 × X2 ) = div H. Der Greensche Integralsatz 24.1.1 liefert uns nun Z Z H1 du2 − H2 du1 = div H. ∂A
A
Setzen wir die obigen Formeln hier ein, so erhalten wir den Stokesschen Satz.
RBemerkung 24.2.2 : Auf dem Weg zum allgemeinen Stokesschen Satz wird man sp¨ater das Integral (rotF | ν) dSM als ein Integral Ru ¨ber eine 2-Form interpretieren, so wie man im Gaußschen Divergenzsatz G 22.3.3 in der Ebene das Integral ∂A (F | ν) dS∂A als Integral u ¨ber eine 1-Form interpretiert hat, was den Greenschen Satz 24.1.1 lieferte.
¨ Ubung 24.2.1 : Sei U ⊆ R3 offen und sternf¨ ormig und ω = f1 dx + f2 dy + f3 dz eine stetig differenzierbare Pfaffsche Form auf U . Zeige, daß ω genau dann eine Stammfunktion besitzt, wenn f¨ ur das Vektorfeld F := (f1 , f2 , f3 ) : U → R3 gilt: rotF = 0. ¨ Ubung 24.2.2 : Sei F (x, y, z) := (−y, x, 1). Berechne mit Hilfe des Stokesschen Satzes das Integral Z (rotF | ν) dSG 3
2
2
wobei G := {(x, y, z) ∈ R |x + y ≤ 4, z =
p
G
4 − x2 − y 2 }.
¨ Ubung 24.2.3 : Berechne die Rotation der folgenden Vektorfelder F : R3 → R3 . (i) F (x, y, z) = (xy, x2 z, y), (ii) F (x, y, z) = (2, xz 2 , x sin y), (iii) F (x, y, z) = (exy , xyz, x2 yez ).
Kapitel 25
Kru ¨ mmung von Untermannigfaltigkeiten des Euklidischen Raumes In diesem Kapitel sei V ein endlich dimensionaler Vektorraum u ¨ber R mit einem Euklidischen Skalarprodukt, d.h. einem positiv definitem inneren Produkt (x, y) 7→ (x|y) und der zugeh¨origen Norm x 7→ kxk = (x|x)1/2 . Als Motivation f¨ ur die verschiedenen Ans¨atze zur Behandlung gekr¨ ummter Teilmengen von V betrachten wir zuerst den eindimensionalen Fall, die Kurven.
25.1
Kru ¨ mmung von Kurven
Sei I ⊆ R ein Intervall und I → V, t → x(t) eine Immersion Die Funktion s : I → R, t → s(t), die 0 ange von x. (bis auf eine additive Konstante) durch ds dt (t) = kx (t)k definiert ist, heißt die Bogenl¨ Bemerkung 25.1.1 : (i) Sei J ⊆ R ein weiteres Intervall in R und ϕ : J → I eine C k -Bijektion mit ϕ0 > 0, dann wollen wir x ◦ ϕ als dieselbe Kurve wie x nur mit einer anderen Parametrisierung betrachten. ¡ ¢ (ii) s−1 : s(I) → I is so eine Umparametrisierung: Wir setzen X s(t) = x(t). Es gilt kX 0 (s)k = 1. Man sagt, X ist auf Bogenl¨ange parametrisiert. Beachte, daß es bis auf eine additive Konstante nur eine solche Parametrisierung gibt.
Bemerkung 25.1.2 : Leite die Gleichung ¡ ¢ 1 = kX 0 (s)k2 = X 0 (s)|X 0 (s) nach s ab. Man erh¨alt
¡ ¢ 0 = 2 X 00 (s)|X 0 (s) .
D.h. die zweite Ableitung steht senkrecht auf der Tangente an die Kurve. Um auch die L¨ange von X 00 (s) geometrisch zu interpretieren, geben wir zwei aufeinander senkrecht stehende Einheitsvektoren y, z ∈ V vor und betrachten die Kurve ³s´ ³s´ + zy sin , X(s) = Xo + y cos R R 437
¨ 438KAPITEL 25. KRUMMUNG VON UNTERMANNIGFALTIGKEITEN DES EUKLIDISCHEN RAUMES wobei Xo ∈ V fest und R ∈ R+ ist. Dann ist s 7→ X(s) ein Kreis um Xo mit Radius R in der affinen Ebene X0 + span{y, z}. Wir berechnen die ersten zwei Ableitungen von X(s): ³s´ z ³s´ y X 0 (s) = − sin + y cos , R R R R so daß kX 0 (s)k = 1, d.h. X(s) ist auf Bogenl¨ange parametrisiert. ³s´ ³ s ´ X − X(s) z y o − 2 y sin = X 0 (s) = − 2 cos , R R R R R2 Die L¨ange von X 00 (s) is 1/R. Man interpretiert daher ganz allgemein die Zahl kX 00 (s)k−1 als einen Radius eines Kreises, der sich bestm¨oglich an die Kurve anschmiegt. Sei x 7→ X(s) eine auf Bogenl¨ange parametrisierte C 2 -Kurve. Wenn X 00 (s) 6= 0, dann heißt n(s) =
X 00 (s) kX 00 (s)k
die Hauptnormale der Kurve in X(s). Die Zahl kX 00 (s)k−1 heißt der Kru ¨ mmungsradius und der Kreis mit Zentrum X 00 (s) X0 = X(s) + kX 00 (s)k2 und Radius kX 00 (s)k−1 in der affinen Ebene X0 + span{X 0 (s), X 00 (s)} heißt der oskulierende Kreis oder auch Schmiegekreis. Die Zahl κ(s) := kX 00 (s)k heißt die Kr¨ ummung der Kurve in X(s). Beachte, daß diese Definitionen nur sinnvoll sind, weil s 7→ X(s) als auf Bogenl¨ange parametrisiert vorausgesetzt sind. F¨ ur allgemeine parametrisierte Kurven ergeben sich folgende Zusammenh¨ange zwischen den Ableitungen der Kurve und den Ableitungen der zugeh¨origen auf Bogenl¨ange parametrisierten ¡ ¢ Kurve: Sei X s(t) = x(t). Dann gilt x0 (t) x00 (t)
ds (t) dt ¶2 µ d2 s ds 00 (t) + X 0 (s) 2 (t). = X (s) dt dt
= X 0 (s)
¡ ¢ Mit 0 = X 00 (s)|X 0 (s) ergibt sich ¡
¢ d2 s x00 (t)|X 0 (s) = 2 , dt und damit ¡ ¢ x0 (t) x00 (t)|x0 (t) x00 (t) 00 X (s) = 0 − . kx (t)k2 kx0 (t)k4 Diese Gleichung l¨aßt sich umschreiben zu x00 (t) =
¡ ¢ ¡ ¢ d2 s x0 (t) (t) + kx0 (t)k2 κ s(t) n s(t) . dt2 kx0 (t)k
(25.1)
(25.2)
Alle bisherigen Aussagen, die wir u ¨ber parametrisierte Kurven gemacht haben, sind von strikt lokaler Natur. Hier bezieht sich “lokal” nicht nur darauf, daß man das Verhalten einer Kurve t 7→ x(t) nur in einer Umgebung eines vorgegebenen Punktes x(to ) betrachtet, sondern sogar darauf, daß man nur Parameter t nahe bei to ber¨ ucksichtigt. Die nachfolgende Beispiele beleuchteten diese Problematik: Beispiel 25.1.3 : Selbstdurchdringung.
Hier ist offensichtlich zur Beschreibung des lokalen Verhaltens der Kurve am Schnittpunkt Parameterwerte aus zwei lokalen Umgebungen n¨otig.
¨ 25.1. KRUMMUNG VON KURVEN
439
Beispiel 25.1.4 : Selbstann¨aherung.
In diesem Beispiel braucht man zur Beschreibung des lokalen Verhaltens der Kurve am angen¨aherten Punkt auch sehr große Parameterwerte. Ein etwas subtileres Beispiel, das in verschiedensten Zusammenh¨angen immer wieder auftaucht, sind die irrationalen Wicklungen auf dem Torus: Beispiel 25.1.5 : (Irrationale Rotation) Sei V = C2 mit dem inneren Produkt ¡ ¢ ¡ (z1 , z2 )|(w1 , w2 ) = Re z1 w1 + z2 w2 ). Das heißt gerade V = R4 mit dem Euklidischen Skalarprodukt, wenn man R4 und C2 via (z1 , z2 ) 7→ (Re z1 , Im z1 , Re z2 , Im z2 ) identifiziert. Betrachte jetzt die Kurve R → V, t 7→ x(t) := (e2πit , e2πiat ), √ wobei a eine irrationale Zahl, z.B. 2, ist.
1 0.5 0 -0.5 -1
2 0 -2 0
-2 2
Mit etwas elementarer Zahlentheorie kann man zeigen, daß x(R) dicht in der abgeschlossenen Menge T2 = {(e2πit , e2πis ) : (t, s) ∈ R2 } ⊆ C2 √ ist (in Proposition ?? wurde das f¨ ur a = 2 durchgef¨ uhrt). Die Menge T2 ist ein Torus . Wenn man einen Punkt x(to ) auf der Kurve betrachtet, dann findet man zu jeder Umgebung dieses Punktes in V beliebig große Parameter t, f¨ ur die x(t) auch in dieser Umgebung liegt. D.h., man kann das lokale Verhalten von x(R) in keinem Punkt mit lokalen Parametern erfassen! Der Grund f¨ ur die Pathologien in unseren Beispielen liegt darin, daß die von der Parametrisierung induzierte Topologie auf x(R) (d.h. die Topologie, die t → x(t) lokal zu einem Hom¨oomorphismus macht) nicht mit der von der Inklusionsabbildung x(R) ,→ V u ¨bereinstimmt, d.h. die Kurve ist keine Einbettung. Sei M ⊆ V eine eingebettete Untermannigfaltigkeit. Die Familie p 7→ (·|·)p von inneren Produkten (oder gleichwertig dazu, von den entsprechenden quadratischen Formen), die vom Euklidischen Skalarprodukt auf den Tangentialr¨aumen Tp (M ) induziert wird, heißt die erste Fundamentalform von M . Wenn f : O → M eine lokale Parametrisierung von M ist, bezeichnet man die darstellende Matrix von (·|·)p f¨ ur p = f (x) mit gij (x), d.h. es gilt ¡ ¢ gij (x) = fi (x)|fj (x) ∀x ∈ O. Mit diesen Bezeichnungen l¨aßt sich die Bogenl¨ange s(t) einer Kurve t 7→ γ(t) auf M wie folgt beschreiben: µ ¶2 n X ¡ ¢ dxi dxj ds (t) = gij x(t) (t) (t). dt dt dt i,j=1
¨ 440KAPITEL 25. KRUMMUNG VON UNTERMANNIGFALTIGKEITEN DES EUKLIDISCHEN RAUMES Bemerkung 25.1.6 : Geometrische Eigenschaften von M , die sich durch L¨angen- und Winkelmessung beschreiben lassen, nennt man intrinsisch . Man spricht auch von der inneren Geometrie. Der entscheidende Punkt dabei ist, daß man zur Beschreibung solcher Eigenschaft nicht zu wissen braucht, wie die Einbettung von M in V aussieht. Nur intrinsische Eigenschaften wird man sp¨ater f¨ ur allgemeine Riemannsche Mannigfaltigkeiten definieren k¨ onnen.
25.2
Kru ¨ mmung von Untermannigfaltigkeiten
In Analogie zum Fall der Kurven versucht man, die Kr¨ ummung von Untermannigfaltigkeiten u ¨ber die zweite Ableitung einer vorgegebenen Parametrisierung zu beschreiben. Dabei wird man, wie f¨ ur die Definition des Tangentialraums auf Kurven in der Untermannigfaltigkeit zur¨ uckgreifen. Sei also M eine eingebettete Untermannigfaltigkeit in V der Dimension n und f : U → M eine lokale Parametrisierung. Dann ist die Ableitung von f eine Abbildung f 0 : U → HomR (Rn , V ). Dementsprechend ist die zweite Ableitung von f eine Abbildung ¡ ¢ f 00 : U → HomR Rn , HomR (Rn , V ) ∼ = Bil(Rn , V ). Beachte, daß die Bilinearformen f 00 (x) nach Satz 11.2.2 automatisch symmetrisch sind. Wir ben¨ utzen die Notation fij (x) := ∂i ∂j f (x) = f 00 (x)(ei , ej ) ∈ V = Tf (x) (M ) ⊕ Nf (x) (M ). Wir zerlegen fij (x) in einen tangentialen und einen normalen Anteil: fij (x) :=
n X
Γkij (x)fk (x) + hij (x)
(25.3)
k=1
mit hij (x) ∈ Nf (x) (M ). Die Funktionen Γkij : U → R heißen die Christoffelsymbole von M . Beachte, daß die Zuordnung n n n X X ¡X ¢ ai fi (x), bi fi (x) 7→ hij (x)ai bj i=1
i=1
i,j=1
eine symmetrische Bilinearform h(x) : Tf (x) (M ) × Tf (x) (M ) → Nf (x) (M ) definiert. Das nachfolgende Lemma zeigt, daß diese Bilinearform nicht von der Wahl der lokalen Parametrisierung abh¨angt: Lemma 25.2.1 : Sei γ : I → V eine auf Bogenl¨ ange parametrisierte C 2 -Kurve in M und f : U → M eine lokale Parametrisierung. Wir bezeichnen die orthogonale Projektion V → Np (M ) mit prNp (M ) und die orthogonale Projektion V → Tp (M ) mit prTp (M ) . Weiter sei κ(s) die Kr¨ ummung von γ in γ(s) und n(s) die Hauptnormale von γ in γ(s). Dann gilt (i)
¡ ¢ ¢ ¡ ¢ h γ(s) (γ 0 (s), γ 0 (s) = κ(s)prNγ(s) (M ) n(s) .
¡ ¢ (ii) Wenn γ(s) = f x(s) , dann gilt n X k=1
Beweis:
n 2 X ¡ ¢ ¡ ¢ ¡ ¢ d x dx dx k j i (s) + Γkij x(s) (s) (s) fk x(s) = κ(s)prTγ(s) (M ) n(s) . ds2 ds ds i,j=1
¨ 25.2. KRUMMUNG VON UNTERMANNIGFALTIGKEITEN
441
¡ ¢ Da alle Aussagen lokal sind, k¨onnen wir von vorneherein γ(s) = f x(s) schreiben. Dann gilt γ 00 (s) = κ(s)n(s), und die Kettenregel liefert erst γ 0 (s) =
n X dxi i=1
ds
¡ ¢ (s)fi x(s) ,
dann ¡ ¢ d2 f x(s) ds2 n n X d2 xk ¡ ¢ X ¡ ¢ dxj dxi = (s)f x(s) + (s) (s)fij x(s) k 2 ds ds ds i,j=1 k=1 n n n 2 X X ¡ ¢ X ¡ ¢ ¡ ¢ dxj dx dxi d x dx j k i = (s) (s)hij x(s) + (s) (s) fk x(s) (s) + Γkij x(s) 2 ds ds ds ds ds i,j=1 i,j=1 k=1 n n 2 X ¡ ¢¡ ¢ X ¡ ¢ dxi ¢ dxj ¡ d xk (s) + = h γ(s) γ 0 (s), γ 0 (s) + (s) (s) fk x(s) . Γkij x(s) 2 ds ds ds i,j=1
γ 00 (s) =
k=1
Die Behauptung folgt jetzt einfach durch Anwendung der beiden komplement¨aren orthogonalen Projektionen.
Bemerkung 25.2.2 : (Hyperfl¨achen) Wenn M die Dimension n = N1 hat, nennen wir M eine Hyperfl¨ ache . Lokal ist M dann die Nullstellenmenge einer skalarwertigen differenzierbaren Funktion. Der Normalenraum Np (M ) ist f¨ ur jedes p ∈ M eindimensional. Sei f : U → M eine lokale Parametrisierung. Wir nehmen an, daß wir eine differenzierbare Funktion n : f (U ) → V mit n(p) ∈ Np (M ) und kn(p)k = 1 finden ¡ ¢ k¨onnen. Dann l¨aßt sich die Abbildung p → h(p) als h(p) = e h(p)n(p) schreiben, wobei e h(p) ∈ Bil Tp (M ) . ¡ ¢ ¡ ¢ Sei e hij (x) i,j=1,...,n die darstellende Matrix von e h f (x) bzgl. der Basis {f1 (x), . . . , fn (x)} f¨ ur Tf (x) (M ). Pn Lemma 25.2.1 ur v = ange parametrisierte Kurve γ mit i=1 ai fi (x) und eine auf Bogenl¨ ¡ ¢ zeigt, daß f¨ γ(s) = f x(s) und γ 0 (s) = v/kvk gilt Pn ¡ ¡ ¢¢¡ e e h f x(s) v, v) i,j=1 hij (x(s))ai aj P = κ(s). = n kvk2 i,j=1 gij (x(s))ai aj ¡ ¢ Man nennt die Eigenwerte K1 , . . . , Kn von e hij (x) i,j=1,...,n die Hauptkru ¨ mmungen von M in f (x). ¡ ¢ Qn ¡ ¢ Pn e hij (x) = i=1 Ki Weiter heißt det hij (x) = i=1 Ki die totale oder Gaußsche Kru ¨ mmung und tr e die mittlere Kru ¨ mmung . Man sieht aus Lemma 25.2.1 auch, daß der Vektor n n 2 X X ¡ ¢ ¡ ¢ d x dx dx k j i ∇γ 0 γ(s) := + Γkij x(s) (s) (s) fk x(s) ds2 ds ds i,j=1 k=1
nicht von der lokalen Parametrisierung abh¨angt. ¡ ¢ Die Familie p 7→ h(p) ∈ Bil Tp (M ), Np (M ) von Bilinearformen heißt zweite Fundamentalform von M . Sei γ : I → V eine auf Bogenl¨ange parametrisierte C 2 -Kurve in M . Dann heißt κgd (s) = k∇γ 0 γ(s)k = kprTγ(s) (M ) (γ 00 (s))k
¨ 442KAPITEL 25. KRUMMUNG VON UNTERMANNIGFALTIGKEITEN DES EUKLIDISCHEN RAUMES die geod¨ atische Kr¨ ummung und ngd (s) =
prTγ(s) (M ) (γ 00 (s)) ∇γ 0 γ(s) = k∇γ 0 γ(s)k kprTγ(s) (M ) (γ 00 (s))k
die geod¨ atische Hauptnormale . Die Notation ∇γ 0 γ(s) ist ein Vorgriff auf die sogenannte kovariante Ableitung von Vektor- und allgemeiner Tensorfeldern. Die obige Rechnung ist n¨amlich nur ein Spezialfall einer viel allgemeineren ¨ Uberlegung: Sei zus¨atzlich zu der Kurve γ : I ¡→ M¢ auch noch eine C 1 -Abbildung v : U → V auf einer Umgebung U von γ(I) gegeben, f¨ ur die gilt v γ(s) ∈ Tγ(s) (M ). Man stellt sich dabei vor, daß v eine Familie von Tangentialvektoren an M auf einer Umgebung ¡der Kurve γ ist. Kurz:¡ein Vektorfeld ¢ ¢ ¡ auf ¢ der Umgebung U von γ. Schreibt man jetzt wieder γ(s) = f x(s) , dann hat man v γ(s) = v ◦ f x(s) . Wir schreiben n ¡ ¢ X ¡ ¢ ¡ ¢ v ◦ f x(s) = vj x(s) fj x(s) . j=1
Die Ketten und Produktregel liefern ¡ ¢ ¶ n µ X ¡ ¢ dxk ¡ ¢ ¡ ¢ ¡ ¢ dxk d(v ◦ f ) x(s) = ∂k vj x(s) (s)fj x(s) + vj x(s) fjk x(s) (s) ds ds ds =
∈
j,k=1 n X
¡
¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢¢ dxk ∂k vj x(s) fj x(s) + vj x(s) fjk x(s) (s) ds j,k=1 Ã ! n n X ¡ ¢ X ¢ ¡ ¢ dxk ¡ ¢ j ¡ ∂k vj x(s) + Γik x(s) vi x(s) (s)fj x(s) + Nγ(s) (M ). ds i=1
j,k=1
In Kurzfassung schreibt man f¨ ur die tangentiale Komponente von v 0 (s): Ã ! n n X X j ∇γ 0 v := ∂k vj + Γik vi x0k fj j,k=1
i=1
und nennt dies die kovariante Ableitung des Vektorfeldes v entlang γ. Beachte, daß man den Vektor ∇γ 0 v auch definieren kann (n¨amlich als tangentialen Anteil von v 0 ), wenn v nur auf γ(I) definiert ist, auch wenn der Ausdruck ∂k vj dann keinen Sinn mehr macht. Wir halten an dieser Stelle fest, daß wir auf die Christoffelsymbole gestoßen sind, als wir versucht haben, Ableitungen von (Tangential)vektorwertigen Funktionen in den entsprechenden Tangentialraum zu zwingen. Dies ist nichts anderes als der Versuch Gr¨oßen, zu deren Bestimmung man die Einbettung von M in V braucht, durch in M allein definierte Gr¨oßen zu beschreiben. Es stellt sich heraus, daß die Christoffelsymbole intrinsische Gr¨oßen im Sinne von Bemerkung 25.1.6 sind: Dabei h¨angen die Christoffelsymbole sehr wohl von der Wahl der lokalen Parametrisierung ab. Dies is nicht weiter verwunderlich, weil sie nichts anderes sind als Koeffzienten bzgl. einer von der Parametrisierung abh¨angigen Basiswahl f¨ ur den Tangentialraum. Sei f : U → M eine lokale Parametrisierung. Wir definieren ¡ ¢ Γijl (x) := fij (x)|fl (x) . Der durch die Notation angedeutete Zusammenhang mit den Christoffelsymbolen wird durch das folgende Lemma gegeben: Lemma 25.2.3 : (i) Γijl =
1 (∂j gil + ∂i glj − ∂l gij ). 2
¨ 25.2. KRUMMUNG VON UNTERMANNIGFALTIGKEITEN
443
¡ ¢ ¡ ¢ (ii) Sei g kl (x) k,l=1,...,n die inverse Matrix von gij (x) i,j=1,...,n , d.h. n X
g kl glj = δkj .
l=1
Dann gilt Γkij
=
n X
g kl Γijl =
l=1
1 X kl g (∂j gil + ∂i glj − ∂l gij ). 2 l=1
Beweis: Die erste Gleichung folgt durch die Addition der folgenden drei Gleichungen: ∂j gil ∂i glj −∂l gij
= (fij |fl ) + (fi |flj ) = (fli |fj ) + (fl |fji ) = −(fil |fj ) − (fi |fjl )
Aus der Gleichung (25.3) erh¨alt, indem man das innere Produkt mit fl bildet Γijl = (fij |fl ) =
X
Γkij gkl ,
k=1
also
n X
g kl Γijl =
n X n X
kl Γm ij g gml =
m=1 l=1
l=1
n X
k Γm ij δkm = Γij
m=1
Wir nehmen jetzt an, daß M mindestens eine C 3 -Untermannigfaltigkeit ist, und wiederholen unsere Analyse der zweiten Ableitungen einer lokalen Parametrisierung f¨ ur die dritten Ableitungen. Dazu schreiben wir fijk = ∂i ∂j ∂k f. P m Mit fij = Γij fm + hij erh¨alt man f¨ ur den Tangentialanteil von fkij fkij
= = ∈ = =
∂k fij = n X
Ã
n X ¡ ¢ m ∂k Γ m ij fm + Γij fkm + ∂k hij m=1
∂k Γ m ij fm
m=1 Ã n X
∂k Γ m ij fm
m=1 Ã n X
∂k Γ m ij fm
+
Γm ij
!! Γlkm fl
l=1
+ +
n X l=1 n X
m=1 Ã n X
n X
m=1
l=1
∂k Γ m ij +
à n X
+ hkj
+ ∂k hij
!
Γlkm Γm ij fl
+ ∂k hij + Nf (x) (M ) !
l Γm kl Γij fm
l=1 l Γm kl Γij
+ ∂k hij + Nf (x) (M )
! fm + ∂k hij + Nf (x) (M )
Um also den Tangentialanteil von fkij vollst¨andig zu bestimmen, muß man noch den Tangentialanteil von ∂k hij bestimmen. Dazu machen wir das folgende Lemma:
¨ 444KAPITEL 25. KRUMMUNG VON UNTERMANNIGFALTIGKEITEN DES EUKLIDISCHEN RAUMES Lemma 25.2.4 : Sei x 7→ n ◦ f (x) ∈ Nf (x) (M ) ⊆ V eine differenzierbares (C 1 ) Normalen-Vektorfeld. Dann gilt n X ¡ ¢ ¡ ¡ ¢¢ hij (x)|n f (x) g kj (x)fk (x) + Nf (x) (M ). ∂i n f (x) ∈ − j,k=1
Beweis: ¡ ¡ ¢ ¢ Leite die Gleichung n f (x) |fj (x) = 0 ab. Man erh¨alt (∂i n|fj ) + (n|fij ) = 0, d.h. die Koeffizienten nik von fk in ∂i n erf¨ ullen n X
nik gik = −(hij |n).
k=1
Aber dann folgt sofort nik = −
n X
(hij |n)g kj .
j=1
Jetzt wenden wir das Lemma auf n = hij an und erhalten à ! n n n X X X m m l lm fkij ∈ ∂k Γij + Γkl Γij − (hij |hkl )g fm + Nf (x) (M ) m=1
l=1
l=1
Die Symmetrie fkij = fjik liefert jetzt Satz 25.2.5 : (Gauß-Gleichungen) m ∂j Γm ik − ∂k Γij +
n n X X m l ) = ((hik |hjl ) − (hij |hkl )) g lm . Γ − Γ (Γlik Γm ij lk lj l=1
l=1
Die Gr¨oße m m Rijk := ∂j Γm ik − ∂k Γij +
n X l m (Γlik Γm lj − Γij Γlk ) l=1
heißt der Riemannsche Kr¨ ummungstensor. An dieser Stelle ist nat¨ urlich nicht recht einzusehen, m warum Rijk eine Kr¨ ummung beschreibt. Es stellt sich aber tats¨achlich heraus, daß man eine Riemannsche Mannigfaltigkeit genau dann lokal l¨angenerhaltend und bijektiv auf einen Euklidischen Raum abbilden kann, wenn die Riemannsche Kr¨ ummung verschwindet. Wir werden sp¨ater begrifflich viel sch¨onere Definitionen der Kr¨ ummung sehen. Dazu m¨ ussen wir aber zuerst Tensoren und Differentialformen auf abstrakten Mannigfaltigkeiten studieren. An dieser Stelle sei nur erw¨ahnt, daß man aus dem Riemannschen Kr¨ ummungstensor zwei weitere Typen von Kr¨ ummung ableitet. Den Riccitensor Rjl =
n X
k Rlkj
k=1
und die skalare Kr¨ ummung S=
X
g jl Rjl .
j,l
Setze Rlijk =
n X m=1
m glm Rijk .
¨ 25.2. KRUMMUNG VON UNTERMANNIGFALTIGKEITEN
445
Dann gilt Rlijk = (hik |hjl ) − (hij |hkl ). Man kann die Gesamtheit der Rlijk als 4-linearform betrachten: ¡ ¢ ¡ ¢ R(v1 , v2 , v3 , v4 ) = h(v1 , v3 )|h(v2 , v4 ) − h(v1 , v4 )|h(v2 , v3 ) In dieser Form k¨onnen wir die Riemannsche Kr¨ ummung f¨ ur Hyperfl¨achen berechnen: Bemerkung 25.2.6 : Wir u aus Bemerkung 25.2.2. Sei {e1 , . . . , en } eine Ortho¨bernehmen¡ die Notation ¢ normalbasis f¨ ur Tf (x) (M ), die die Form e h f (x) diagonalisiert. Dann gilt (wir unterdr¨ ucken die Argumente f (x)) n X e h(v, v) = Ki (v|ei )2 ∀v ∈ Tf (x) (M ). i=1
Daraus erh¨alt man µ ¶ µ ¶ n 1 X (v1 |ei ) (v1 |ej ) (v3 |ei ) (v3 |ej ) R(v1 , v2 , v3 , v4 ) = Ki Kj det det (v2 |ei ) (v2 |ej ) (v4 |ei ) (v4 |ej ) 2 i,j=1 Die Ricci Kr¨ ummung, die man auch als Bilinearform interpretieren kann (man nimmt die Spur u ¨ber zwei der vier Variablen in R) entspricht der quadratischen Form X v 7→ Ki Kj (v|ej )2 i6=j
und die skalare Kr¨ ummung ist S=
X
Ki Kj .
i6=j
Im Spezialfall n = 2 vereinfacht sich die Formel f¨ ur R zu ¶ ¶ µ µ (v3 |e1 ) (v3 |e2 ) (v1 |e1 ) (v1 |e2 ) det R(v1 , v2 , v3 , v4 ) = K1 K2 det (v4 |e1 ) (v4 |e2 ) (v2 |e1 ) (v2 |e2 ) Der Determinantenanteil ist nichts anderes als das Produkt der Fl¨achen der Parallelogramme die von v1 , v2 bzw. v3 , v4 aufgespannt werden. Wenn also {v1 , v2 } und {v3 , v4 } jeweils Orthonormalbasen f¨ ur Tf (x) (M ) sind, erh¨alt man die Gaußsche Kr¨ ummung: R(v1 , v2 , v3 , v4 ) = K1 K2 = S. Insbesondere erh¨alt man das sogenannte Theorema Egregium von Gauß, das besagt, daß die Gaußsche Kr¨ ummung eine intrinsische Gr¨oße ist. Es bleibt zu erw¨ahnen, daß die mittlere Kr¨ ummung keine intrinsische Gr¨oße ist. Dies macht man sich am leichtesten klar, wenn man ein St¨ uck eines gew¨ohnlichen Zylinders in R3 betrachtet, das man zu einem Ebenenst¨ uck geradebiegen kann, ohne die Metrik zu ver¨andern.
¨ 446KAPITEL 25. KRUMMUNG VON UNTERMANNIGFALTIGKEITEN DES EUKLIDISCHEN RAUMES
Anhang
447
Anhang A
Die natu ¨ rlichen Zahlen In diesem Kapitel charakterisieren wir die nat¨ urlichen Zahlen durch ein Axiomensystem und zeigen, wie man Addition und Multiplikation sowie die wichtigsten Rechenregeln aus diesen Axiomen ableitet. Wir f¨ uhren die Menge der nat¨ urlichen Zahlen nicht durch eine Konstruktion ein, sondern wir fordern die Existenz einer Menge N mit gewissen (sehr plausiblen) Eigenschaften und zeigen, wie man aus diesen Grundeigenschaften (Axiomen) die u ¨blichen Eigenschaften und Rechenregeln ableitet. Im Grunde reden wir also auch nicht von den nat¨ urlichen Zahlen, sondern von beliebigen Mengen, die die Axiome erf¨ ullen und die dann alle die entsprechenden Eigenschaften haben. Daß es keine essentiell verschiedenen Mengen ¨ dieser Art gibt wird in Ubung A.1.1 nachgewiesen. Die Konstruktion einer solchen Menge f¨allt in den Bereich der Mengenlehre, den wir hier nicht eingehend studieren wollen (vgl. aber Bemerkung A.1.10, die einen Hinweis auf so eine Konstruktion enth¨alt).
A.1
Die Axiome
Sei jetzt N eine nichtleere Menge und < eine Relation auf N, d.h. eine Teilmenge von N × N. Wir stellen uns die Relation < als Gr¨oßenvergleich vor und schreiben x < y (lies: x kleiner y) f¨ ur (x, y) ∈<. Beachte: Wir ben¨ utzen hier zwar die aus der Schule bekannte Notation (und letztendlich soll auch herauskommen, daß wir hier gerade die bekannten Dinge beschreiben), aber wir wollen keinerlei Wissen verwenden. Im Moment k¨onnte N auch eine Schulklasse (mit den Sch¨ ulern als Elementen) sein und die Relation x < y bedeuten: x schreibt bei y ab. Wir nehmen zun¨achst an, daß N und < die folgenden drei Axiome erf¨ ullen. Sp¨ater wird noch ein viertes Axiom dazukommen. Axiom A.1.1 (Asymmetrie): Wenn x, y ∈ N und x < y, dann gilt nicht y < x. Axiom A.1.2 (Minimalprinzip): Jede nichtleere Teilmenge X ⊆ N hat ein kleinstes Element, d.h., es gibt ein x ∈ X so, daß f¨ ur alle y ∈ X gilt: x < y oder x = y. Wir sagen, eine Teilmenge X ⊆ N ist beschr¨ ankt, wenn es ein m ∈ N gibt so, daß f¨ ur alle x ∈ X gilt: x < m oder x = m. Axiom A.1.3 (Maximalprinzip): Jede nichtleere beschr¨ankte Teilmenge X ⊆ N hat ein gr¨ oßtes Element, d.h., es gibt ein x ∈ X so, daß f¨ ur alle y ∈ X gilt: y < x oder y = x. ¨ Um sich die Schreibarbeit zu vereinfachen und um sp¨ater bei komplizierteren Aussagen den Uberblick zu behalten, f¨ uhrt man einige abk¨ urzende Schreibweisen ein: • Statt f¨ ur alle“ (oder zu jedem“) schreibt man ∀“ ” ” ” 449
¨ ANHANG A. DIE NATURLICHEN ZAHLEN
450
• Statt gibt es“ (oder existiert“) schreibt man ∃“ ” ” ” • Statt x < y oder x = y“ schreibt man x ≤ y“ (dann betrachtet man die Menge {(x, y) ∈ N × N | ” ” x ≤ y} als eine neue Relation kleiner gleich“) ” Mit diesen Schreibweisen lesen sich das Minimal- und das Maximalprinzip wie folgt: Minimalprinzip: ∀X ⊆ N, X 6= ∅ : ∃x ∈ X mit (∀y ∈ X : x ≤ y). Maximalprinzip: ∀X ⊆ N, X 6= ∅, X beschr¨ankt : ∃x ∈ X mit (∀y ∈ X : y ≤ x). Die folgende erste Schlußfolgerung aus den Axiomen A.1.1 und A.1.2 wird immer wieder nutzbringend eingesetzt werden. Satz A.1.4 (Trichotomie):
F¨ ur x, y ∈ N gilt genau eine der folgenden Beziehungen: x < y,
x = y,
y < x.
Beweis: Idee: Betrachte die F¨alle x 6= y und x = y separat. Wenn x 6= y, setzt man X := {x, y}. Nach dem Minimalprinzip (Axiom A.1.2) gibt es ein kleinstes Element in X. Wenn x ein kleinste Element ist, dann gilt x ≤ y, also x < y, weil wir x = y ausgeschlossen haben. Wenn y das kleinste Element von X ist, gilt analog y < x. Wegen der Asymmetrie kann nur eine der beiden Beziehungen x < y und y < x gelten. Wenn x = y, dann folgt aus x < y automatisch y < x, weil man x und y austauschen kann. Wegen Axiom A.1.1 ist das aber nicht m¨oglich, also kann x < y nicht gelten. Analog schließt man y < x aus.
Beachte, daß das Argument im Beweis von Satz A.1.4 auch zeigt, daß jede nichtleere Teilmenge von N ein eindeutig bestimmtes kleinstes Element hat. Ganz analog sieht man außerdem, daß jede nichtleere beschr¨ankte Teilmenge von N ein eindeutig bestimmtes gr¨oßtes Element hat. Noch zwei neue Schreibweisen: • Statt existiert genau ein“ schreibt man ∃!“ ” ” • Statt folgt“ oder impliziert“ schreibt man ⇒“ ” ” ” • Statt dann und nur dann“, d.h. ⇐ und ⇒“ schreibt man ⇔“ ” ” ” Mit der Trichotomie (Satz A.1.4) lassen sich Minimalprinzip und Maximalprinzip wie folgt formulieren: Minimalprinzip: ∀X ⊆ N, X 6= ∅, ∃!x ∈ X mit ∀y ∈ X : x ≤ y. Maximalprinzip: ∀X ⊆ N, X 6= ∅, X beschr¨ankt, (∃!x ∈ X) mit ∀y ∈ X : y ≤ x. Das kleinste Element von N heißt Eins und wird mit 1 bezeichnet. Proposition A.1.5 (Transitivit¨ at):
Sei x, y, z ∈ N. Dann gilt
x < y und y < z
⇒
x < z.
A.1. DIE AXIOME
451
Beweis: Idee: Betrachte das kleinste Element von X = {x, y, z}. Sei X = {x, y, z}. Wegen x < y und y < z ist nach Satz A.1.4 weder y noch z das kleinste Element von X. Also muß x das kleinste Element von X sein (dessen Existenz nach Axiom A.1.2 garantiert wird) und daher x ≤ z gelten. W¨are x = z, so h¨atte man nach Voraussetzung x < y und y < x, was nach Axiom A.1.1 nicht m¨oglich ist. Damit folgt x < z.
Bemerkung A.1.6 : Die leere Menge ∅ erf¨ ullt die Axiome A.1.1, A.1.2 und A.1.3. Um das einzusehen, u ullen (das ¨berlegt man sich, daß es unm¨oglich ist, die Voraussetzungen der jeweiligen Implikation zu erf¨ wenn“ im wenn, dann“ tritt nicht auf); also ist die Implikation automatisch richtig. ” ” Beispiel A.1.7 : Sei M = {a, b, c} eine beliebige Menge mit drei Elementen. Wir definieren eine Relation < auf M durch < := {(a, b), (b, c), (a, c)}. Dann erf¨ ullt M mit < die Axiome A.1.1, A.1.2 und A.1.3. Unser Ziel ist es, die nat¨ urlichen Zahlen unserer Erfahrung durch ein Axiomensystem zu beschreiben. Bemerkung A.1.6 zeigt, daß wir gut daran getan haben, N als nichtleere Menge vorauszusetzen. Das Beispiel A.1.7 zeigt, daß die Axiome A.1.1, A.1.2 und A.1.3 noch nicht alle der gewohnten Eigenschaften der nat¨ urlichen Zahlen liefern. Insbesondere garantieren sie nicht, daß es zu jeder nat¨ urlichen Zahl eine noch gr¨oßere gibt. Dies m¨ ussen wir in einem zus¨atzlichen Axiom fordern! Axiom A.1.8 (Unbeschr¨ anktheit): N ist nicht beschr¨ankt. Wenn x ∈ N, dann liefert Axiom A.1.8, daß die Menge {y ∈ N | x < y} nicht leer ist (denn sonst h¨atte man wegen Satz A.1.4 ∀z ∈ N : z ≤ x“, d.h. N w¨are beschr¨ankt). Man ” bezeichnet das kleinste Element von {y ∈ N | x < y} mit x + 1. Beachte: x + 1 ist hier nur ein (komplizierter) Name f¨ ur das kleinste Element min({y ∈ N | x < y}) von {y ∈ N | x < y}, den man deshalb w¨ahlt, weil die (noch nicht definierte) Addition auf N sp¨ater gerade so gemacht wird, daß min({y ∈ N | x < y}) die Summe von x und 1 ist! Mit A.1.8 l¨aßt sich eines der n¨ utzlichsten Beweisprinzipien der Mathematik formulieren: Satz A.1.9 (Vollst¨ andige Induktion): Sei N 6= ∅ eine Menge, die die Axiome A.1.1, A.1.2, A.1.3 und A.1.8 erf¨ ullt, sowie X ⊆ N eine Teilmenge mit folgenden Eigenschaften: (a) 1 ∈ X. (b) Wenn x ∈ X, dann gilt auch x + 1 ∈ X. Dann ist X = N. Beweis:
¨ ANHANG A. DIE NATURLICHEN ZAHLEN
452
Idee: Man zeigt N \ X = ∅, indem man die Existenz eines kleinsten Elements von N \ X auf einen Widerspruch f¨ uhrt.
Sei Y ⊆ N das Komplement N \ X := {y ∈ N | y 6∈ X} von X in N. Wir m¨ ussen zeigen, daß Y leer ist. Wenn Y 6= ∅, dann hat Y ein kleinstes Element y ∈ Y . Sei Z := {x ∈ X | x < y}. Dann ist 1 ∈ Z, weil 1 ≤ y und y 6= 1 ∈ X. Da Z (durch y) beschr¨ankt ist, hat Z nach Axiom A.1.3 ein gr¨oßtes Element z ∈ Z. Wegen Z ⊆ X und (b) haben wir z + 1 ∈ X. Da aber z < z + 1, kann z + 1 nicht in Z sein, d.h., es muß wegen Satz A.1.4 gelten y ≤ z + 1. Die Gleichheit y = z + 1 ist nicht m¨oglich, weil y 6∈ X, aber z + 1 ∈ X gilt. Andererseits steht z < y und y < z + 1 im Widerspruch dazu, daß z + 1 das kleinste Element von {x ∈ N | z < x} ist. Also kann die Menge Y keine Elemente enthalten haben.
¨ ¨ Ubung A.1.1 : In dieser Ubung soll nachgewiesen werden, daß die Axiome A.1.1, A.1.2, A.1.3 und A.1.8 die e <) e zwei Mengen Menge der nat¨ urlichen Zahlen im wesentlichen eindeutig“ festlegen. Seien also (N, <) und (N, ” mit Relationen, die den Axiomen A.1.1, A.1.2, A.1.3 und A.1.8 gen¨ ugen. e wobei 1 die Eins in N und e e ist. Wenn Ax f¨ (i) Setze A1 = {(1, e 1)} ⊆ N × N, 1 die Eins in N ur x ∈ N definiert ist, dann setze e | (y, ye) ∈ Ax }. Ax+1 := {(y + 1, ye + e 1) ∈ N × N e ist f¨ Zeige mit Induktion: Ax ⊆ N × N ur alle x ∈ N definiert und jedes Ax hat genau ein Element. Dieses Element ist von der Form (x, ye). (ii) Wenn M eine Menge ist, deren Elemente wieder Mengen sind, dann ist [ A := {a | (∃A ∈ M) a ∈ A}. A∈M
die Vereinigungsmenge der Mengen A ∈ M. Setze M := {Ax | x ∈ N} und definiere eine Relation e durch f ⊆N×N [ f := A. A∈M
e ist eine Abbildung f : N → N e f¨ Zeige: f ⊆ N × N ur die gilt f (x + 1) = f (x) + e 1. (iii) Eine Abbildung g : A → B von A nach B heißt injektiv, wenn zu jedem b ∈ B h¨ ochstens ein a ∈ A mit e aus (ii) injektiv ist. (Hinweis: Betrachte die Menge g(a) = b existiert. Zeige, daß die Abbildung f : N → N X := {x ∈ N | (∀x0 ∈ N) x < x0 ⇒ f (x) < f (x0 )} und zeige mit Induktion, daß X = N.) (iv) Eine Abbildung g : A → B von A nach B heißt surjektiv, wenn zu jedem b ∈ B mindestens ein a ∈ A mit e aus (ii) surjektiv ist. (Hinweis: Betrachte die Menge g(a) = b existiert. Zeige, daß die Abbildung f : N → N e | (∃x ∈ N) f (x) = ye} Ye := {e y∈N e und zeige mit Induktion, daß Ye = N.) e aus (ii) (v) Eine Abbildung, die injektiv und surjektiv ist, heißt bijektiv. Zeige, daß die Abbildung f : N → N bijektiv ist und außerdem gilt e (x0 ). x < x0 ⇔ f (x)
A.2. RECHENREGELN
453
¨ Ubung A.1.2 : Beweise f¨ ur n ∈ N die folgenden Formeln mit Induktion: Pn n−1 1 (i) = . k=2 k(k−2) n Pn (ii) k · k! = (n + 1)! − 1. k=1 ¨ Ubung A.1.3 : Beweise f¨ ur n ∈ N die folgende Aussage mit Induktion: 5n − 1 ist durch 4 teilbar.
Bemerkung A.1.10 : Die Existenz einer Menge, die den Axiomen A.1.1, A.1.2, A.1.3 und A.1.8 gen¨ ugt, ist ein mengentheoretisches Problem und soll hier nicht im Detail behandelt werden. Eine g¨angige Konstruktionsmethode basiert auf folgender Idee: Man startet mit der leeren Menge ∅ und setzt n © ª © ªo 1 := {∅}, 2 := ∅, {∅} , 3 := ∅, {∅}, ∅, {∅} , . . . Details dazu findet man zum Beispiel in [Ha72], Kap. 11. Wir nehmen die Existenz einer Menge an, die die Axiome A.1.1, A.1.2, A.1.3 und A.1.8 erf¨ ullt, w¨ahlen uns eine solche Menge, bezeichnen sie mit N und nennen sie die Menge der nat¨ urlichen Zahlen.
A.2
Rechenregeln
Mit der Einf¨ uhrung der Zahl x + 1 ∈ N zu einer Zahl x ∈ N ist der Anfang f¨ ur eine Addition gemacht. Wir definieren eine Abbildung a1 : N → N (man denke: addiere 1“) durch a1 (x) := x + 1, d.h. a1 ⊆ N × N ” ist die Relation a1 = {(x, y) ∈ N × N | y = x + 1}. Wenn f¨ ur y ∈ N die Abbildung ay : N → N (man¡ denke: ¢ addiere y“) gegeben ist, dann definiert man eine Abbildung ay+1 : N → N durch ay+1 (x) = a1 ay (x) , ” d.h. ay+1 ⊆ N × N ist die Relation ay+1 = {(x, z + 1) ∈ N × N | (x, z) ∈ ay }. Wir schreiben x + y := ay (x). Durch Anwendung von Induktion (Satz A.1.9) auf die Menge {y ∈ N | ay ist definiert} sieht man, daß ay f¨ ur alle y ∈ N definiert ist. Damit k¨onnen wir eine neue Abbildung a : N × N → N durch a(x, y) := x + y definieren, d.h. a ⊆ (N × N) × N ist die Relation ¡ ¢ a = { (x, y), z ∈ (N × N) × N | x + y = z}. Diese Abbildung ist die Addition auf N. Proposition A.2.1 : Wenn x, y ∈ N, dann gilt x < x + y. Beweis: Idee: Halte x fest und zeige mit Induktion, daß die Menge der y ∈ N, f¨ur die x < x + y gilt, ganz N ist.
Sei x ∈ N und Y := {y ∈ N | x < x + y}. Dann gilt 1 ∈ Y nach der Definition von x + 1. Wenn y ∈ Y , dann haben wir x < x+y < (x + y) + 1 ¡ ¢ = a1 ay (x) = ay+1 (x) =
x + (y + 1)
und wegen der Transitivit¨at (Proposition A.1.5) x < x + (y + 1), also y + 1 ∈ Y . Mit Induktion (Satz A.1.9) folgt also Y = N, d.h. die Behauptung.
¨ ANHANG A. DIE NATURLICHEN ZAHLEN
454
Um Platz zu sparen, schreibt man so eine Kette von Gleichungen und Ungleichungen wie im Beweis von Proposition A.2.1 auch einfach als ¡ ¢ x < x + y < (x + y) + 1 = a1 ay (x) = ay+1 (x) = x + (y + 1). Wir k¨onnen jetzt die entscheidenden Rechenregeln f¨ ur die Addition in N beweisen: Satz A.2.2 : Sei x, y, z ∈ N. Dann gilt (i) x + (y + z) = (x + y) + z (Assoziativit¨ at). (ii) x + y = y + x (Kommutativit¨ at). (iii) Aus x + z = y + z folgt x = y (Ku ¨ rzungseigenschaft). Beweis: Idee: W¨ahle eine Variable und zeige mit Induktion, daß die Menge der nat¨urlichen Zahlen, die das entsprechende Gesetz erf¨ ullen, ganz N ist.
(i) Sei X := {z ∈ N | (∀x, y ∈ N) x + (y + z) = (x + y) + z}. Nach Definition der Addition gilt x + (y + 1) = (x + y) + 1, also 1 ∈ X. Wenn z ∈ X, rechnet man x + (y + (z + 1))
= = = =
x + ((y + z) + 1) (x + (y + z)) + 1 ((x + y) + z) + 1 (x + y) + (z + 1)
und man hat z + 1 ∈ X. Mit Induktion (Satz A.1.9) folgt also X = N. (ii) Wir zeigen zun¨achst (∀y ∈ N) 1 + y = y + 1
(∗)
Dazu betrachten wir die Menge Y := {y ∈ N | 1 + y = y + 1} und halten fest, daß 1 ∈ Y . Wenn y ∈ Y , rechnet man mit (i) 1 + (y + 1) = (1 + y) + 1 = (y + 1) + 1 also y + 1 ∈ Y , so daß mit Induktion folgt Y = N. Jetzt setzt man X = {x ∈ N | (∀y ∈ N) x + y = y + x} und stellt fest, daß nach (∗) 1 ∈ X gilt. Wenn x ∈ X, rechnet man (x + 1) + y
=
(i)
x + (1 + y)
(∗)
=
x + (y + 1)
(i)
=
(x + y) + 1
x∈X
=
(y + x) + 1
(i)
y + (x + 1)
=
und findet x + 1 ∈ X. Mit Induktion folgt wieder X = N, also (ii). (iii) Betrachte die Menge X := {z ∈ N | (∀x, y ∈ N) x + z = y + z ⇒ x = y}. Man zeigt zun¨achst, daß 1 ∈ X gilt. Dazu nehmen wir x + 1 = y + 1 an und zeigen, daß weder x < y noch y < x gelten kann (dann folgt mit Satz A.1.4 x = y). Wenn x < y gilt, finden wir x
A.2. RECHENREGELN
455
was im Widerspruch zu x+1 = min{z ∈ N | x < z} steht. Die Ungleichung y < x schließt man genauso aus, indem man die Rollen von x und y in obigem Argument vertauscht. Wenn z ∈ X und x + (z + 1) = y + (z + 1) gilt, dann rechnen wir (i)
(ii)
(i),(ii)
(x + 1) + z = x + (1 + z) = x + (z + 1) = y + (z + 1) = (y + 1) + z und findet x + 1 = y + 1. Weil aber auch 1 ∈ X ist, folgt weiter x = y und schließlich z + 1 ∈ X. Also haben wir mit Induktion X = N und (iii).
Proposition A.2.3 : Wenn f¨ ur a, b ∈ N die Relation a < b gilt, dann gibt es genau ein x ∈ N mit a + x = b, d.h. die Gleichung a + x = b ist f¨ ur gegebene a < b in N und gesuchtes x ∈ N eindeutig l¨ osbar. Beweis: Idee: 1 ist eine L¨osung von a + x ≤ b und x ist die gr¨oßte solche L¨osung. Existenz einer L¨osung: Betrachte die Menge X := {u ∈ N | a + u ≤ b}. Da aus a < b folgt a + 1 ≤ b, sehen wir, daß 1 ∈ X. Wenn u ∈ X, rechnen wir A.2.1
u < u+a
A.2.2(ii)
=
a + u ≤ b,
was mit der Transitivit¨at (Proposition A.1.5) u < b liefert. Insbesondere ist X beschr¨ankt und hat daher (vgl. Axiom A.1.3) ein eindeutig bestimmtes gr¨oßtes Element x := max(X). Wir zeigen a + x = b indem wir a + x < b und b < a + x ausschließen (vgl. Satz A.1.4): b < a + x steht im Widerspruch zu x ∈ X. Aus a + x < b folgt a + (x + 1) = (a + x) + 1 ≤ b (vgl. Satz A.2.2), was im Widerspruch zu x = max(X) steht. Damit ist die Existenzaussage gezeigt. Um die Eindeutigkeit zu zeigen, nehmen wir an, daß a + x1 = b = a + x2 . Dann folgt aber x1 = x2 aus Proposition A.2.2(iii).
Als n¨achstes f¨ uhren wir die Multiplikation auf den nat¨ urlichen Zahlen ein. Die Multiplikation ist eine iterierte Addition. Wir gehen bei ihrer Definition analog vor wie bei der Einf¨ uhrung der Addition, die eine iterierte Addition der Eins ist. Wir definieren eine Abbildung m1 : N → N (man denke multipliziere mit 1“) durch m1 (x) := x. ” Wenn f¨ ur y ∈ N die Abbildung my : N → N (man denke multipliziere mit y“) gegeben ist, dann definiert ” man eine Abbildung my+1 : N → N durch my+1 (x) := my (x) + x. Wir schreiben xy := x · y := my (x). Mit ¨ Induktion sieht man, daß my f¨ ur alle y ∈ N definiert ist (Ubung). Damit k¨onnen wir eine neue Abbildung m : N × N → N durch m(x, y) := x · y definieren. Diese Abbildung ist die Multiplikation auf N. Satz A.2.4 : Sei x, y, z ∈ N. Dann gilt (Punkt vor Strich) (i) (x + y)z = xz + yz (Distributivit¨ at). (ii) xy = yx (Kommutativit¨ at). (iii) x(yz) = (xy)z (Assoziativit¨ at). (iv) xz = yz ⇒ x = y (Ku ¨ rzungseigenschaft).
¨ ANHANG A. DIE NATURLICHEN ZAHLEN
456 Beweis:
Idee: W¨ahle eine Variable und zeige mit Induktion, daß die Menge der nat¨urlichen Zahlen, die das entsprechende Gesetz erf¨ ullen, ganz N ist.
(i) Betrachte X := {z ∈ N | (∀x, y ∈ N) (x + y)z = xz + yz}. Dann gilt wegen a · 1 = a f¨ ur alle a ∈ N, daß 1 ∈ X. Wenn z ∈ X, rechnet man Def
(x + y)(z + 1)
=
(x + y)z + (x + y)
z∈X
=
(xz + yz) + (x + y)
A.2.2
=
(xz + x) + (yz + y)
Def
x(z + 1) + y(z + 1)
=
und erh¨alt z + 1 ∈ X. Mit Induktion (Satz A.1.9) folgt jetzt X = N und (i). (ii) Wir zeigen zun¨achst (∀y ∈ N) 1 · y = y · 1
(∗)
Dazu betrachten wir die Menge Y := {y ∈ N | 1 · y = y · 1} und halten fest, daß 1 ∈ Y . Wenn y ∈ Y rechnet man Def
y∈Y
1 · (y + 1) = 1 · y + 1 = y · 1 + 1 = y + 1 = (y + 1) · 1 und findet y + 1 ∈ Y , so daß mit Induktion folgt Y = N. Jetzt setzt man X = {x ∈ N | (∀y ∈ N) xy = yx} und stellt fest, daß nach (∗) gilt 1 ∈ X. Wenn x ∈ X, rechnet man y(x + 1)
Def
=
yx + y
x∈X
xy + y
=
(∗)
=
xy + 1 · y
(i)
(x + 1)y
=
und findet x + 1 ∈ X. Mit Induktion folgt wieder X = N, also (ii). (iii) Sei X := {z ∈ N | (∀x, y ∈ N) x(yz) = (xy)z}. Es folgt unmittelbar, daß 1 ∈ X. Wenn z ∈ X, rechnet man (xy)(z + 1)
Def
=
(xy)z + xy
z∈X
=
x(yz) + xy
(ii)
=
(yz)x + yx
(i)
=
(yz + y)x
(ii)
=
x(yz + y)
Def
x(y(z + 1))
=
und man hat z + 1 ∈ X. Mit Induktion folgt also X = N und (iii). (iv) Sei xz = yz. Wir zeigen x = y indem wir x < y und y < x ausschließen: Wenn x < y, dann existiert nach Proposition A.2.3 ein u ∈ N mit x + u = y und man kann rechnen (i)
xz + uz = (x + u)z = yz = xz so, daß nach Proposition A.2.1 xz < xz folgt. Dies steht aber in Widerspruch zu Satz A.1.4. Also kann x < y nicht gelten. Durch Vertauschen der Rollen von x und y in obigem Argument schließt man auch y < x aus und zeigt so x = y.
A.2. RECHENREGELN
457
Bemerkung A.2.5 : Das erste Axiomensystem f¨ ur die nat¨ urlichen Zahlen geht auf G. Peano (1858– 1932) zur¨ uck. Man findet es z.B. in [Ha72], Kap. 12. Es ben¨ utzt keine Ordnung, beinhaltet aber schon das Element x + 1, das der Nachfolger von x genannt wird. ¨ Ubung A.2.1 : (i) Zeige, daß f¨ ur jedes n ∈ N die Zahl 11n+1 + 122n−1 ein Vielfaches von 133 ist. (ii) Beweise die Bernoulli’sche Ungleichung: F¨ ur n, m ∈ N gilt (1 + n)m ≥ 1 + nm. (iii) Zeige, daß es in N keine Null geben kann, d.h. kein Element n mit x + n = x f¨ ur alle x ∈ N. (iv) Zeige, daß die Gleichung a + x = b mit a, b ∈ N genau dann in N l¨ osbar ist, wenn b > a. (v) Seien a, b, c, d ∈ N mit a < b und c < d. Zeige, daß gilt: (a) a + c < b + d, (b) ac < bc, (c) ac < bd. (vi) Sind die folgenden Relationen Abbildungen? (a) f := {(n, m) ∈ N × N | n2 = 1 + m} (b) f := {(n, m) ∈ N × N | m2 = 1 + n} (c) f := {(n, m) ∈ N | m2 + 4 = n + 4m} (vii) Zeige, daß f¨ ur jede nat¨ urliche Zahl n gilt: n X
j := 1 + 2 + 3 + · · · + n =
j=1
n(n + 1) . 2
(viii) Zeige, daß f¨ ur jede nat¨ urliche Zahl n gilt: n X j=1
j3 =
1 (n(n + 1))2 . 4
(ix) Sei X ⊂ N eine nichtleere, beschr¨ ankte Menge mit der Eigenschaft, daß das kleinste Element von X mit dem gr¨ oßten Element von X u alt. ¨bereinstimmt. Zeige, daß X genau ein Element enth¨ ¨ Ubung A.2.2 : (i) F¨ ur welche n ∈ N gilt n4 < 4n , f¨ ur welche nicht? (Beweis!) (ii) Zeige, daß f¨ ur jede nat¨ urliche Zahl n n X
j 2 := 12 + 22 + · · · + (n − 1)2 + n2 =
j=1
1 n(n + 1)(2n + 1) 6
gilt. ¨ Ubung A.2.3 : Satz. Alle auf der Erde lebenden Pferde haben dieselbe Farbe. Beweis. Es gibt nur endlich viele Pferde auf der Erde, daher wird der Beweis per Induktion gef¨ uhrt. Es sei X := {n ∈ N | Je n Pferde haben dieselbe Farbe.}. Da jedes Pferd dieselbe Farbe hat wie es selbst, gilt 1 ∈ X. Nun sei n ∈ X und wir m¨ ussen zeigen, dass auch n + 1 ∈ X ist. Man nehme eines der n + 1 Pferde heraus; die restlichen n Pferde haben dieselbe Farbe (da n ∈ X). Nun f¨ uge man das herausgenommene Pferd hinzu und nehme ein anderes heraus. Dann ist der Rest wieder einfarbig. Also haben alle n + 1 Pferde dieselbe Farbe. Wo steckt der Fehler?
Literatur: [Eb92], [Ha72], [If86]
458
¨ ANHANG A. DIE NATURLICHEN ZAHLEN
Anhang B
Konstruktion der reellen und komplexen Zahlen In diesem Kapitel konstruieren wir, ausgehend von den nat¨ urlichen Zahlen N, ein Modell der reellen ¨ Zahlen R. Nach einer Einf¨ uhrung in den Begriff der Aquivalenzrelation skizzieren wir die algebraische Konstruktion der ganzen Zahlen aus den nat¨ urlichen Zahlen und der rationalen Zahlen aus den ganzen Zahlen. Die Hauptarbeit ist dann, die reellen Zahlen aus den rationalen Zahlen mit analytischen Methoden durch Grenzwertprozesse zu konstruieren. Zum Schluß erh¨ alt man dann die komplexen Zahlen mit ¨ einfachen algebraischen Uberlegungen aus den reellen Zahlen.
B.1
Von den natu ¨ rlichen zu den ganzen Zahlen
Wenn M eine Menge ist und ∼ ⊆ M × M eine Relation auf M (wir schreiben wieder a ∼ b f¨ ur (a, b) ∈∼), dann heißt ∼ symmetrisch, wenn (∀a, b ∈ M )
a∼b
⇒
b∼a
und transitiv, wenn (∀a, b, c ∈ M )
a ∼ b, b ∼ c
⇒
a ∼ c.
Weiter heißt ∼ reflexiv, wenn (∀a ∈ M )
a ∼ a.
¨ Eine schwache Aquivalenzrelation auf M ist eine Relation, die symmetrisch und transitiv ist. Wenn ∼ ¨ eine schwache Aquivalenzrelation auf M ist und a ∼ b gilt, dann heißen die Elemente a und b ¨ aquivalent. Die Menge [a] := {b ∈ M | a ∼ b} ¨ aller zu a ∈ M ¨aquivalenten Elemente heißt die Aquivalenzklasse von a ∈ M und jedes Element b ∈ [a] heißt ein Repr¨ asentant von [a]. ¨ Bemerkung B.1.1 : Aquivalenzklassen k¨onnen leer sein. Wenn a 6∼ a (d.h. wenn a ∼ a nicht gilt), dann kann wegen a ∼ b ⇒ (a ∼ b und b ∼ a) ⇒ a ∼ a auch f¨ ur kein anderes b ∈ M die Relation b ∼ a gelten. Also haben wir [a] = ∅
⇔
459
a 6∼ a.
460
ANHANG B. KONSTRUKTION DER REELLEN UND KOMPLEXEN ZAHLEN
¨ ¨ Eine Aquivalenzrelation ist eine schwache Aquivalenzrelation, die zus¨atzlich reflexiv ist. Nach Be¨ ¨ merkung B.1.1 ist also eine schwache Aquivalenzrelation genau dann eine Aquivalenzrelation, wenn alle ¨ Aquivalenzklassen nichtleer sind. ¨ Proposition B.1.2 : Sei ∼ eine schwache Aquivalenzrelation auf M und a, b ∈ M . (i) a ∼ b ⇒ [a] = [b]. (ii) a 6∼ b ⇒ [a] ∩ [b] = ∅. Beweis: (i) Wenn c ∈ [a], dann gilt c ∼ a und wegen der Transitivit¨at hat man c ∼ b, also c ∈ [b]. Also gilt [a] ⊆ [b] und die umgekehrte Inklusion [b] ⊆ [a] folgt analog durch vertauschen der Rollen von a und b. Damit sind [a] und [b] gleich. (ii) Wenn c ∈ [a] ∩ [b] w¨are, dann h¨atte man a ∼ c und b ∼ c, was wegen der Transitivit¨at a ∼ b zur Folge h¨atte.
¨ Ubung B.1.1 : Sei 4 die folgende, auf N \ {1} definierte Relation: x 4 y, falls es m, n, k ∈ N mit k 6= 1, x = mk, y = nk gibt. ¨ Ist 4 eine Aquivalenzrelation? ¨ ¨ ¨ Ubung B.1.2 : Gib ein Beispiel einer schwachen Aquivalenzrelation, die eine leere Aquivalenzklasse besitzt.
¨ Intuitiver Hintergrund f¨ ur unsere Konstruktion ist folgende Uberlegung: Jede ganze Zahl ist die Differenz zweier nat¨ urlicher Zahlen. Allerdings kann man eine ganze Zahl auf verschiedene Weisen als Differenz nat¨ urlicher Zahlen schreiben (z.B. ist −3 = 5 − 8 = 7 − 10). Wir stellen uns eine ganze Zahl also als ein Paar von nat¨ urlichen Zahlen vor und wollen solche Paare als gleich“ betrachten, die dieselbe ” Differenz liefern. Wir definieren eine Relation ∼ auf N × N durch (a, b) ∼ (c, d)
:⇔
a + d = c + b.
Satz B.1.3 : ¨ (i) Die Relation ∼ auf N × N ist eine Aquivalenzrelation. (ii) Sei Z := {[(a, b)] | (a, b) ∈ N × N}. Dann ist j: N → a 7→ eine injektive Abbildung. Beweis:
Z [(a + 1, 1)]
¨ B.1. VON DEN NATURLICHEN ZU DEN GANZEN ZAHLEN
461
(i) Die Symmetrie der Relation ∼ folgt aus (a, b) ∼ (c, d)
⇔
a+d=c+b
⇔
c+b=a+d
⇔
(c, d) ∼ (a, b).
Die Transitivit¨at ist eine Konsequenz von (a, b) ∼ (c, d) (c, d) ∼ (e, f )
a+d=c+b c+f =e+d a+d+f =c+b+f =c+f +b=e+d+b
⇔ ⇒ A.2.2(iii)
⇒ ⇒
a+f =e+b (a, b) ∼ (e, f )
und die Reflexivit¨at sieht man aus (a, b) ∼ (a, b)
⇔
a + b = a + b.
(ii) Wenn [(a+1, 1)] = [(b+1, 1)], dann gilt (a+1, 1) ∼ (b+1, 1), also (a+1)+1 = (b+1)+1. Wieder mit der K¨ urzungseigenschaft folgt daraus a = b und das zeigt die Injektivit¨at von j : N → Z.
Wir nennen Z die Menge der ganzen Zahlen und schreiben a − b statt [(a, b)]. (Beachte: a − b ist an dieser Stelle nur ein Name!) Wir wollen auf Z eine kleiner“-Relation, eine Addition und eine Multiplikation einf¨ uhren. Als erstes ” setzen wir
⇔
a0 + d0 < c0 + b0
Wenn dem so ist, dann sagen wir
462
ANHANG B. KONSTRUKTION DER REELLEN UND KOMPLEXEN ZAHLEN
Bemerkung B.1.4 : Sowohl +Z als auch ·Z sind wohldefinierte Abbildungen Z × Z → Z. Um das einzusehen, zeigt man zun¨achst, daß f¨ ur (a, b), (c, d), (a0 , b0 ), (c0 , d0 ) ∈ N × N gilt (a, b) ∼ (a0 , b0 ) (c, d) ∼ (c0 , d0 )
⇒
(a + c, b + d) ∼ (a0 + c0 , b0 + d0 ) (ac + bd, bc + ad) ∼ (a0 c0 + b0 d0 , b0 c0 + a0 d0 )
Wir wollen uns die nat¨ urlichen Zahlen u ¨ber die injektive Abbildung j : N → Z als Teilmenge von Z vorstellen. Das ist nat¨ urlich nur dann angebracht, wenn Ordnung, Addition und Multiplikation in N durch die Identifizierung von a ∈ N mit j(a) ∈ Z nicht durcheinander gebracht werden. Die folgende Bemerkung zeigt, daß dem nicht so ist: Bemerkung B.1.5 : F¨ ur die Abbildung j : N → Z und a, b ∈ N gilt (i) a < b ⇔ j(a)
B.2. VON DEN GANZEN ZU DEN RATIONALEN ZAHLEN
463
Mit der Proposition B.1.6 haben wir die G¨ ultigkeit der Axiome 1.1.1, 1.1.2, 1.1.3 f¨ ur die Addition auf den ganzen Zahlen und auch die G¨ ultigkeit der Axiome 1.1.7, 1.1.8 und 1.1.13 nachgewiesen. Man nennt eine Menge mit Addition und Multiplikation, die diesen Axiomen gen¨ ugt auch einen kommutativen Ring. Verzichtet man auf das Axiom 1.1.7, so spricht man einfach von einem Ring. Die ganzen Zahlen sind also ein kommutativer Ring und haben alle Eigenschaften, die aus diesen Axiomen hergeleitet werden k¨onnen. Insbesondere k¨onnen wir die Differenz x − y von zwei ganzen Zahlen x und y bilden und es gilt nach Bemerkung 1.1.15(ii) f¨ ur Z mit Addition und Multiplikation die Proposition 1.1.14. Bemerkung B.1.7 : Es folgt direkt aus der Definition der Ordnung <, daß f¨ ur jedes z ∈ Z eine der Beziehungen z = 0, z > 0, z < 0 gelten muß. Wenn z = a − b > 0, dann heißt dies a > b und es gibt wegen Satz A.2.3 ein x ∈ N mit b + x = a. Weil aber b + z = a, zeigt Satz 1.1.5, daß z = x ∈ N. Umgekehrt gilt f¨ ur z ∈ N, daß z > 0. Damit erh¨alt man {z = a − b ∈ Z | z > 0} = N.
B.2
Von den ganzen zu den rationalen Zahlen
Die ganzen Zahlen haben bez¨ uglich der Multiplikation das gleiche Manko, wie die nat¨ urlichen Zahlen bez¨ uglich der Addition: Man kann Gleichungen in der Regel nicht l¨osen. Um dies beheben zu k¨onnen, m¨ ußte man durch (von Null verschiedene) ganze Zahlen teilen k¨onnen, und das erreicht man am leichtesten, indem man Br¨ uche einf¨ uhrt. Auf diese Weise landet man bei den rationalen Zahlen, wobei man sich daran erinnern sollte, daß verschiedene Br¨ uche dieselbe rationale Zahl liefern k¨onnen ( 13 = 26 !). Die Situation ist also sehr ¨ahnlich der Situation, die man bei der Konstruktion der ganzen Zahlen aus den nat¨ urlichen Zahlen vorfindet, und wir behandeln sie mit den gleichen Methoden. Sei Z× := Z \ {0} = {a ∈ Z | a 6= 0}. Z 6 p p p p p p p p p p p p p ×pHp p p p p p p p p p p p p pH p ×p ×p p p p p p p p p ³ ³ p p p Hp H ×p ³p p p ×p p p p³p ³ H p p p p p ³ p × p p p p p p -p Z ³ p p p³ p³ p p H p pH × ×p p p p p p p ³p p p p p p p Hp H ׳ ×p p p H p p p p p p p p p p pH p ×p p p p p p p p p p p p p p
Wir definieren eine Relation auf Z × Z× durch (a, b) ∼ (c, d)
⇔
ad = cb.
Das folgende Lemma brauchen wir, um zu zeigen, daß die Relation transitiv ist: Lemma B.2.1 : Seien x, y ∈ Z und z ∈ Z× . Dann gilt xz = yz ⇒ x = y (K¨ urzungseigenschaft). Insbesondere ist xy 6= 0, wenn x 6= 0 und y 6= 0 gilt, d.h. Z ist nullteilerfrei.
464
ANHANG B. KONSTRUKTION DER REELLEN UND KOMPLEXEN ZAHLEN
Beweis: Wir zeigen x = y indem wir x < y und x > y ausschließen (vgl. Bemerkung B.1.7). Wegen der Symmetrie in x und y reicht es, x < y auszuschließen. Wir nehmen also an, daß x < y. Wenn z > 0, dann gilt z, y −x ∈ N, also auch (y −x)z ∈ N, im Widerspruch zu (y − x)z = 0. Wenn z < 0, dann gilt y − x, −z ∈ N, also auch (y − x)(−z) ∈ N, im Widerspruch zu (y − x)(−z) = −(y − x)z = −0 = 0.
Satz B.2.2 : ¨ (i) Die Relation ∼ auf Z × Z× ist eine Aquivalenzrelation. (ii) Sei Q := {[(a, b)] | (a, b) ∈ Z × Z× }. Dann ist j: Z → Q a 7→ [(a, 1)] eine injektive Abbildung. Beweis: Dieser Beweis ist sehr ¨ahnlich zu dem von Satz B.1.3. (i) Die Symmetrie der Relation ∼ folgt aus (a, b) ∼ (c, d)
⇔
ad = cb
⇔
cb = ad
⇔
(c, d) ∼ (a, b).
Die Transitivit¨at ist eine Konsequenz von (a, b) ∼ (c, d) (c, d) ∼ (e, f )
⇒ ⇒ B.2.1
⇒ ⇒
ad = cb cf = ed af d = adf = cbf = cf b = edb = ebd af = eb (a, b) ∼ (e, f )
und die Reflexivit¨at sieht man aus (a, b) ∼ (a, b)
⇔
ab = ab.
(ii) Wenn [(a, 1)] = [(b, 1)], dann gilt (a, 1) ∼ (b, 1), also a · 1 = b · 1. Wieder mit der K¨ urzungseigenschaft folgt daraus a = b und das zeigt die Injektivit¨at von j : Z → Q.
Wir nennen Q die Menge der rationalen Zahlen und schreiben a statt [(a, b)]. b
B.2. VON DEN GANZEN ZU DEN RATIONALEN ZAHLEN
465
Wir wollen auf Q zun¨achst nur eine Addition und eine Multiplikation einf¨ uhren (die kleiner“-Relation ” ist hier etwas komplizierter und wir behandeln sie erst hinterher). F¨ ur die Addition auf Q setzen wir a c ad + bc +Q := b d bd und f¨ ur die Multplikation
a c ac ·Q := b d bd Selbstverst¨andlich taucht auch hier wieder das Problem der Wohldefiniertheit auf: Proposition B.2.3 : Die Funktionen +Q : Q × Q → Q und ·Q : Q × Q → Q sind wohldefiniert. Beweis: ¨ Ubung.
Wir wollen uns die ganzen Zahlen u ¨ber die injektive Abbildung j : Z → Q als Teilmenge von Q vorstellen. Das ist nat¨ urlich wieder nur dann angebracht, wenn Addition und Multiplikation in Z durch die Identifizierung von a ∈ Z mit j(a) = a1 ∈ Q nicht durcheinander gebracht werden (¨ uber die Ordnung sprechen wir sp¨ater). Die folgende Proposition zeigt, daß dem nicht so ist: Proposition B.2.4 : F¨ ur die Abbildung j : Z → Q und a, b ∈ Z gilt (i) j(a + b) = j(a) +Q j(b). (ii) j(a · b) = j(a) ·Q j(b). Beweis: ¨ Ubung.
Jetzt, wo wir wissen, daß Addition und Multiplikation von Q jeweils Erweiterungen“ der entspre” chenden Relationen f¨ ur Z sind, lassen wir den Index Q weg und schreiben auch f¨ ur Elemente in Q einfach x + y und x · y = xy. Die Rechenregeln, die sich f¨ ur Addition und Multiplikation in Q ergeben, sind genau die K¨orperaxiome (vgl. Seite 23) Proposition B.2.5 : Sei x, y, z ∈ Q. Dann gilt (i) x + (y + z) = (x + y) + z (Assoziativit¨at). (ii) x + y = y + x (Kommutativit¨at). (iii) Aus x + z = y + z folgt x = y (K¨ urzungseigenschaft). (iv) x + 0 = x (Null). (v) xy = yx (Kommutativit¨at). (vi) x(yz) = (xy)z (Assoziativit¨at). (vii) Aus xz = yz folgt x = y (K¨ urzungseigenschaft). falls z 6= 0 (viii) x · 1 = x (Eins).
466
ANHANG B. KONSTRUKTION DER REELLEN UND KOMPLEXEN ZAHLEN
(ix) (x + y)z = xz + yz (Distributivit¨at). Beweis: ¨ Ubung.
An dieser Stelle k¨onnen wir die Ordnung auf Q einf¨ uhren. Als erstes definieren wir die Menge der positiven rationalen Zahlen durch Q+ := {
a ∈ Q | ab > 0} b
und stellen fest, daß Q+ wohldefiniert ist und die Axiome 1.2.1 und 1.2.2 erf¨ ullt: Bemerkung B.2.6 : (i) Seien a, a0 ∈ Z und b, b0 ∈ Z× . Zeige, daß aus ab > 0
a b
=
a0 b0
⇔
folgt a0 b0 > 0.
(ii) (∀a ∈ Q) gilt genau eine der folgenden Beziehungen a ∈ Q+ ,
a = 0,
−a ∈ Q+ .
(iii) (∀a, b ∈ Q+ ) gilt a + b ∈ Q+ und ab ∈ Q+ .
Wir definieren eine Relation
:⇔
b − a ∈ Q+ .
An dieser Stelle k¨onnen wir sehen, daß die Einschr¨ankung von
⇔
j(a)
Damit k¨onnen wir auch in der Bezeichnung
Q
weglassen.
Die S¨atze B.1.3, B.2.2 und die Bemerkungen B.1.5, B.2.7 zeigen, daß es m¨oglich ist, die nat¨ urlichen Zahlen mit Ordnung, Addition und Multiplikation in einen Zahlbereich Q, genannt die rationalen Zahlen, einzubetten, der die K¨orperaxiome (vgl. Seite 23) erf¨ ullt, nicht aber die Vollst¨andigkeitsaxiome 1.3.1 und 1.3.2.
B.3
Von den rationalen zu den reellen Zahlen
Bis jetzt haben wir noch nicht wirklich nachgewiesen, daß die rationalen Zahlen das Axiom 1.3.1 nicht erf¨ ullen (wir werden das sp¨ater nachholen). Das macht aber nichts, denn unsere Konstruktion w¨ urde schlimmstenfalls nichts neues liefern, wenn Q schon vollst¨andig w¨are.
B.3. VON DEN RATIONALEN ZU DEN REELLEN ZAHLEN
467
W¨ahrend die Methoden der Konstruktion von Z aus N und von Q aus Z algebraisch“ waren (und ” unter dem Namen Quotientenk¨ orper in Algebravorlesungen in verallgemeinerter Form wieder auftauchen werden), erfordert die Konstruktion der reellen Zahlen aus Q genuin analytische Methoden, d.h. Grenzwertprozesse. Die intuitive Vorstellung hinter unserer Konstruktion ist, daß man gr¨oßte untere Schranken f¨ ur nach unten beschr¨ankte Mengen in Q ann¨aherungsweise“ durch Folgen von unteren ” Schranken bekommen kann, dabei aber verschiedene Folgen denselben Grenzwert“ haben k¨onnen und ” daher als gleich betrachtet werden sollten. Eine Folge a von Elementen in einer Menge M ist eine Abbildung N → M, n 7→ a(n). Im Einklang mit der traditionellen Notation schreibt man auch an statt a(n) und (an )n∈N
statt
a : N → M.
Wir definieren eine Relation ∼ auf der Menge FQ der Folgen von Elementen in Q durch (an )n∈N ∼ (bn )n∈N gilt, wenn ∀² ∈ Q, ² > 0 ∃K ∈ N : (∀n, m ∈ N, n > K, m > K : −² < am − bn < ²) In Worten: Zu jeder positiven rationalen Zahl ² existiert eine nat¨ urliche Zahl K so, daß f¨ ur alle nat¨ urlichen Zahlen, die gr¨oßer sind als K, die Ungleichung −² < am − bn < ² gilt. x × 6 p p × p p ×p p × × p × × p p × ×p × p × p × p ××p p ××p ² × × p ×p -N p× p K
Satz B.3.1 : ¨ (i) Die Relation ∼ ist eine schwache Aquivalenzrelation. (ii) Sei R := {[a] | a ∈ FQ , [a] 6= ∅}. Dann ist j: Q → a 7→
R [(an )n∈N ]
mit an = a f¨ ur alle n ∈ N eine injektive Abbildung. Beweis: ¨ (i) Die Symmetrie der Relation ∼ folgt aus der Aquivalenz −² < am − bn < ²
⇔
−² < bn − am < ².
Um die Transitivit¨at zu zeigen, nehmen wir an, daß (an )n∈N ∼ (bn )n∈N und (bn )n∈N ∼ (cn )n∈N gilt. Zu ² > 0 finden wir nat¨ urliche Zahlen K1 und K2 mit ² ² ∀n, m ∈ N, n > K1 , m > K1 : − < am − bn < 2 2 and ² ² ∀n, k ∈ N, n > K2 , k > K2 : − < bn − ck < . 2 2 W¨ ahle eine nat¨ urliche Zahl K > K1 , K2 . Dann erh¨alt man durch Addition der beiden obigen Ungleichungen ∀m, k ∈ N, m > K, k > K : −² < am − ck < ². Damit ist (an )n∈N ∼ (cn )n∈N gezeigt.
468
ANHANG B. KONSTRUKTION DER REELLEN UND KOMPLEXEN ZAHLEN (ii) Als erstes stellen wir fest, daß j wohldefiniert ist, weil aus an = a folgt an − am = 0, und somit (an )n∈N ∼ (an )n∈N , d.h. [(an )n∈N ] 6= ∅, also [(an )n∈N ] ∈ R. Wenn [(an )n∈N ] = [(bn )n∈N ] mit an = a und bn = b f¨ ur alle n ∈ N und a, b ∈ Q, dann gilt f¨ ur jedes ² > 0, daß −² < a − b < ². Schreibe c := a − b und falls c 6= 0, w¨ahle ² := −
|c| 2 .
Dann gilt
|c| |c|
was nach Satz 1.2.6 zun¨achst |c| < |c| 2 , dann 2|c| < |c|, und schließlich |c| < 0 zur Folge hat. Das ist aber nicht m¨oglich, also muß c = 0 gelten. Dies zeigt die Injektivit¨at von j : Q → R.
¨ Wir halten fest, daß die Relation ∼ auf FQ keine Aquivalenzrelation ist. Um das einzusehen, betrachtet man z.B. die Folge (an )n∈N mit an = n, f¨ ur die (an )n∈N 6∼ (an )n∈N gilt. Wir nennen eine Folge a eine Fundamentalfolge, wenn [a] 6= ∅. Wir nennen R die Menge der reellen Zahlen und wollen auf R zun¨achst nur eine Addition und eine Multiplikation einf¨ uhren. F¨ ur die Addition auf R setzen wir [(an )n∈N ] +R [(bn )n∈N ] := [(cn )n∈N ], wobei f¨ ur jedes n ∈ N gilt cn = an + bn . Wir schreiben einfach (an + bn )n∈N f¨ ur diese Folge und f¨ ur die Multplikation [(an )n∈N ] ·R [(bn )n∈N ] := [(cn )n∈N ], wobei f¨ ur jedes n ∈ N gilt cn = an · bn . F¨ ur diese Folge schreiben wir (an bn )n∈N . taucht auch hier wieder das Problem der Wohldefiniertheit auf:
Selbstverst¨andlich
Lemma B.3.2 : +R und ·R sind wohldefinierte Funktionen R × R → R. Beweis: Wir halten zun¨achst fest, daß [(an )n∈N ], [(bn )n∈N ] ∈ R insbesondere (an )n∈N ∼ (an )n∈N und (bn )n∈N ∼ (bn )n∈N impliziert. Wenn (an )n∈N ∼ (a0n )n∈N und (bn )n∈N ∼ (b0n )n∈N gilt, dann finden wir zu ² > 0 nat¨ urliche Zahlen K1 und K2 mit ∀n, m ∈ N, n > K1 , m > K1 : −
² ² < am − a0n < 2 2
und
² ² < bm − b0n < . 2 2 W¨ahle eine nat¨ urliche Zahl K > K1 , K2 . Dann erh¨alt man durch Addition der beiden obigen Ungleichungen ∀m, n ∈ N, m > K2 , n > K2 : −
∀m, n ∈ N, m > K, n > K : −² < (am + bm ) − (a0n + b0n ) < ². Damit ist (cn )n∈N ∼ (c0n )n∈N gezeigt, wobei c0n := a0n +b0n ist. Dies zeigt insbesondere (cn )n∈N ∼ (cn )n∈N , also [(cn )n∈N ] 6= ∅ und [(cn )n∈N ] ∈ R. Dann folgt aber auch die Wohldefiniertheit von +R . Um die Wohldefiniertheit von ·R zu zeigen, stellt man zun¨achst fest, daß es wegen (an )n∈N ∼ (an )n∈N ein K ∈ N mit −1 < an − aK < 1 f¨ ur alle n > K gibt. Damit findet man ein s ∈ N
B.3. VON DEN RATIONALEN ZU DEN REELLEN ZAHLEN
469
¨ mit −s < an < s f¨ ur alle n ∈ N. Ahnliches gilt f¨ ur (bn )n∈N , (a0n )n∈N und (b0n )n∈N , also k¨onnen wir gleich annehmen, daß gilt ∀n ∈ N : −s < an , a0n , bn b0n < s. Zu ² > 0 finden wir nat¨ urliche Zahlen K1 und K2 mit ∀n, m ∈ N, n > K1 , m > K1 : −
² ² < am − a0n < 3s 3s
∀m, n ∈ N, m > K2 , n > K2 : −
² ² < bm − b0n < . 3s 3s
and Wir schreiben
an bn − a0m b0m = (an − a0n )bn + a0n (bn − b0m ) + b0m (a0n − a0m ). W¨ahle eine nat¨ urliche Zahl K > K1 , K2 . Dann gilt f¨ ur n, m > K |an bn − a0m b0m | ≤ |an − a0n |s + s|bn − b0m | + s|a0n − a0m | < 3s
² = ². 3s
Wegen Satz 1.2.6 zeigt dies wie im Falle der Addition die Wohldefiniertheit.
Wir wollen uns die rationalen Zahlen u ¨ber die injektive Abbildung j : Q → R als Teilmenge von R vorstellen. Dazu muß man wieder nachweisen, daß Addition und Multiplikation in Q durch die Identifizierung von a ∈ Q mit j(a) ∈ R nicht durcheinander gebracht werden. Bemerkung B.3.3 : F¨ ur die Abbildung j : Q → R und a, b ∈ Q gilt (i) j(a + b) = j(a) +R j(b). (ii) j(a · b) = j(a) ·R j(b). Beide Eigenschaften folgen unmittelbar aus den Definitionen. Mit dem Wissen, daß Addition und Multiplikation von R jeweils Erweiterungen“ der entsprechenden ” Relationen f¨ ur Q sind, lassen wir den Index R weg und schreiben auch f¨ ur Elemente in R einfach x + y und x · y = xy. Außerdem schreiben 1 f¨ ur j(1) und 0 f¨ ur j(0). Die Rechenregeln, die sich f¨ ur Addition und Multiplikation in R ergeben, sind genau die K¨orperaxiome (vgl. Seite 23). Satz B.3.4 : Sei x, y, z ∈ R. Dann gilt (i) x + (y + z) = (x + y) + z (Assoziativit¨at). (ii) x + y = y + x (Kommutativit¨at). (iii) Aus x + z = y + z folgt x = y (K¨ urzungseigenschaft). (iv) x + 0 = x (Null). (v) xy = yx (Kommutativit¨at). (vi) x(yz) = (xy)z (Assoziativit¨at). (vii) Aus xz = yz folgt x = y (K¨ urzungseigenschaft) falls z 6= 0. (viii) x · 1 = x (Eins).
470
ANHANG B. KONSTRUKTION DER REELLEN UND KOMPLEXEN ZAHLEN
(ix) (x + y)z = xz + yz (Distributivit¨at). Beweis: Stellvertretend f¨ ur die Punkte (i), (ii), (v), (vi), (ix) zeigen wir (ii): Sei x = [(xn )n∈N ] und y = [(yn )n∈N ]. Es gilt dann x + y = [(xn + yn )n∈N ] und y + x = [(yn + xn )n∈N ], also folgt x + y = y + x sofort aus der Kommutativit¨at von Q. Als n¨achstes zeigen wir (iii): Sei x = [(xn )n∈N ], y = [(yn )n∈N ] und z = [(zn )n∈N ]. Wenn x + z = y + z, dann gilt (xn + zn )n∈N ∼ (yn + zn )n∈N . Also gibt es zu ² > 0 ein K ∈ N mit ∀n, m > K : |(xn − ym ) + (zn − zm )| < ². Ebenso kann man annehmen ∀n, m > K : |zn − zm | < ². Zusammen liefert dies (vgl. Satz 1.2.6) ∀n, m > K : |xn − ym | ≤ |(xn − ym ) + (zn − zm )| + |zm − zn | < 2², d.h. (xn )n∈N ∼ (yn )n∈N und somit also x = y. (iv) ist offensichtlich. Um die K¨ urzungseigenschaft (vii) zu sehen, betrachten wir wieder x = [(xn )n∈N ], y = [(yn )n∈N ] und z = [(zn )n∈N ]. Die Aussage z 6= 0 bedeutet, daß (zn )n∈N nicht ¨aquivalent zur konstanten Nullfolge ist. Daher gibt es ein c ∈ Q+ und beliebig große n ∈ N mit |zn | > c (d.h. zu jedem m ∈ N gibt es ein n > m mit |zn | > c). Wenn jetzt xz = yz, dann gilt (xn zn )n∈N ∼ (yn zn )n∈N , d.h. |xn zn − ym zm | < ² f¨ ur vorgegebenes ² und große n, m. Wir k¨onnen weiter annehmen, daß auch |xm − xn | < ² f¨ ur große n, m gilt. Damit finden wir ¯ ¯ ¯ 1 ¯ ² |xn − ym | ≤ |xn − xm | + |xm − ym | ≤ ² + |xm zm − ym zm | ¯¯ ¯¯ ≤ ² + zm c f¨ ur vorgegebenes ² und große n, m, also (xn )n∈N ∼ (yn )n∈N und x = y. Da auch (viii) offensichtlich ist, ist damit der Satz bewiesen.
An dieser Stelle k¨onnen wir die Ordnung auf R einf¨ uhren. Als erstes definieren wir die Menge der positiven reellen Zahlen durch R+ := {[(an )n∈N ] | (∃² ∈ Q, ² > 0, ∃K ∈ N) mit (∀n ∈ N, n > K) an > ²}. In Worten: Es existieren eine positive rationale Zahl ² und eine nat¨ urliche Zahl K so, daß f¨ ur alle nat¨ urlichen Zahlen n, die gr¨oßer sind als K, gilt an > ². Wir nennen die Elemente von R+ die positiven reellen Zahlen. Wie im Falle der rationalen Zahlen stellt man fest, daß R+ wohldefiniert ist und die Axiome 1.2.1 und 1.2.2 erf¨ ullt: Satz B.3.5 : (i) R+ ist wohldefiniert.
B.3. VON DEN RATIONALEN ZU DEN REELLEN ZAHLEN
471
(ii) (∀a ∈ R) gilt genau eine der folgenden Beziehungen a = 0,
a ∈ R+ ,
−a ∈ R+ .
(iii) (∀a, b ∈ R+ ) gilt a + b ∈ R+ und ab ∈ R+ . Beweis: (i) Wenn [(an )n∈N ] = [(a0n )n∈N ] und die definierende Eigenschaft von R+ f¨ ur (an )n∈N gilt, dann finden wir K1 ∈ N mit |an − a0n | < 2² f¨ ur alle n > K1 . F¨ ur n > K, K1 gilt dann a0n = an + (a0n − an ) ≥ an − |a0n − an | > ² −
² ² = . 2 2
Damit sieht man, daß f¨ ur (a0n )n∈N die Bedingung ∃K ∈ N mit (∀n ∈ N, n > K : a0n >
² ) 2
gilt, was die Wohldefiniertheit von R+ beweist. (ii) Wenn a = [(an )n∈N ] = 0, dann gibt es zu ² > 0 ein K ∈ N mit |an | < ² f¨ ur alle n > K. Damit sieht man, daß sich die drei Beziehungen a = 0,
a ∈ R+ ,
−a ∈ R+
gegenseitig ausschließen. Sei jetzt a = [(an )n∈N ] ∈ R. Wegen [(an )n∈N ] 6= ∅ gilt (an )n∈N ∼ (an )n∈N , d.h. zu jedem ² > 0 gibt es ein K ∈ N mit ² |an − am | < 2 f¨ ur alle n, m > K. Wenn a 6∈ R+ , dann gibt es ein n > K mit an < 2² . Dann folgt aber am = (am − an ) + an <
² ² + =² 2 2
f¨ ur alle m > K. Analog folgt aus −a 6∈ R+ die Existenz eines K 0 ∈ N mit −am < ² f¨ ur alle m > K 0 . Zusammen erh¨alt man, daß a, −a 6∈ R+ impliziert (an )n∈N ∼ 0, also [a] = 0. (iii) a = [(an )n∈N ] ∈ R+ und b = [(bn )n∈N ] ∈ R+ , dann gibt es ein ² > 0 und ein K ∈ N mit an , bn > ² f¨ ur alle n > K. Damit gilt aber an + bn > 2²
und an bn > ² · ²
f¨ ur alle n > K. Wegen ² · ² > 0 liefert dies a + b ∈ R+ und ab ∈ R+ .
Mit Satz B.3.5 k¨onnen wir den Betrag |a| einer reellen Zahl durch falls a ∈ PR a |a| := 0 falls a = 0 −a falls − a ∈ PR definieren. Wie im Falle der rationalen Zahlen definieren wir eine Relation
:⇔
b − a ∈ R+ .
An dieser Stelle k¨onnen wir sehen, daß die Einschr¨ankung von
472
ANHANG B. KONSTRUKTION DER REELLEN UND KOMPLEXEN ZAHLEN
Bemerkung B.3.6 : F¨ ur a, b ∈ Q gilt a
⇔
j(a)
¨ Dies ist unmittelbar klar, weil j(b) − j(a) = j(b − a) die Aquivalenzklasse der konstanten Folge b − a ist, also in R+ genau dann, wenn b > a. Damit k¨onnen wir auch in der Bezeichnung
R
weglassen.
Es ist nach Bemerkung B.3.6 und den vorangehenden Ergebnissen m¨oglich, die rationalen Zahlen mit Ordnung, Addition und Multiplikation in einen Zahlbereich R, genannt die reellen Zahlen, einzubetten, der die K¨orperaxiome (vgl. Seite 23) sowie die Ordnungsaxiome 1.2.1 und 1.2.2 erf¨ ullt. Im Unterschied zum Fall der rationalen Zahlen kann man f¨ ur R bewiesen, daß auch die Vollst¨andigkeitsaxiome 1.3.1 und 1.3.2 gelten. Zuerst zeigen wir zwei Lemmata: Lemma B.3.7 : (i) Zu jeder reellen Zahl a > 0 gibt es ein ² ∈ Q mit 0 < ² < a. (ii) Zu jeder reellen Zahl a gibt es ein k ∈ N mit |a| < k. Beweis: (i) Wenn a = [(an )n∈N ], dann gibt es eine rationale Zahl ² > 0 und ein no ∈ N mit an > 2² f¨ ur n > no . Dann gilt aber an − ² > ² f¨ ur alle n > no , also a − ² > 0 und daher a > ². (ii) Im Beweis von Lemma B.3.2 wurde gezeigt, daß es ein k ∈ N mit (∀n ∈ N) 1 − k < an < k − 1, also (∀n ∈ N) k ± an > 1 gibt. Aber das heißt insbesondere k > ±a, woraus wiederum k > |a| folgt.
Die zweite Aussage aus Lemma B.3.7 wird auch oft Archimedisches Axiom genannt.
Lemma B.3.8 : Sei b ∈ Q und (an )n∈N eine Folge in Q mit an ≤ an+1 ≤ b f¨ ur alle n ∈ N, dann gilt a := [(an )n∈N ] 6= ∅ und am ≤ a ≤ b in R f¨ ur alle m ∈ N. b6
Beweis:
B.3. VON DEN RATIONALEN ZU DEN REELLEN ZAHLEN
473
Wenn (an )n∈N 6∼ (an )n∈N , dann finden wir ein ² > 0 und zu jedem k ∈ N nat¨ urliche Zahlen pk , qk mit pk−1 < qk < pk und apk − aqk ≥ ². Damit rechnet man apk − aq1
= ≥ ≥
(apk − aqk ) + (aqk − apk−1 ) + (apk−1 − aqk−1 ) + . . . + (ap1 − aq1 ) (apk − aqk ) + (apk−1 − aqk−1 ) + . . . + (ap1 − aq1 ) k²
im Widerspruch (vgl. Lemma B.3.7) zur Beschr¨anktheit der an . Damit ist gezeigt, daß [(an )n∈N ] 6= ∅, also a ∈ R. Um die Ungleichung an ≤ a ≤ b zu zeigen, beachte zun¨achst, daß an und b durch die konstanten Folgen (ck )k∈N und (dk )k∈N mit ck = an und dk = b definiert sind und an = ck ≤ ak ≤ dk = b f¨ ur k > n gilt. Dies schließt die Beziehungen an > a und a > b aus, also folgt die Ungleichung aus Satz B.3.5.
Satz B.3.9 : Jede nicht-leere nach unten beschr¨ ankte Teilmenge von R hat eine gr¨ oßte untere Schranke. M
∧∧∧∧∧∧∧∧∧∧∧ 1
Beweis: Sei M ⊆ R nach unten beschr¨ankt. W¨ahle eine nat¨ urliche Zahl q1 ∈ N und betrachte die Menge p S1 := {p ∈ Z | (∀x ∈ M ) ≤ x}. q1 Da mit M auch die Menge q1 · M := {q1 x | x ∈ M } nach unten beschr¨ankt ist, ist nach Lemma B.3.7(ii) die Menge S1 nach oben beschr¨ankt, hat also ein gr¨oßtes Element p1 . Induktiv definieren wir qn+1 := 2qn und Sn+1 := {p ∈ Z | (∀x ∈ M )
p qn+1
≤ x}.
Wie zuvor stellt man fest, daß Sn+1 ein gr¨oßtes Element pn+1 hat. Da aus pqnn ≤ x die n+1 n Ungleichung q2p ≤ x folgt, erhalten wir pn+1 ≥ 2pn und pqn+1 ≥ pqnn . Dann definiert die Folge n+1 pn ( qn )n∈N nach Lemma B.3.8 ein Element a ∈ R, f¨ ur das gilt (∀x ∈ M ) a ≤ x. Wir behaupten, daß dieses a die gr¨oßte untere Schranke von M ist. Dazu nehmen wir an, daß es ein b ∈ R mit (∀x ∈ M ) a < b ≤ x gibt. Nach Lemma B.3.7 gibt es ein rationales ² > 0 mit ² < b − a, d.h. a + ² < b. Wegen 2n > n + 1 f¨ ur alle n ∈ N \ {1} (Induktion) ist die Menge {qn ∈ N | n ∈ N} nicht beschr¨ankt. Also gibt es ein n ∈ N mit qn > 1² . Sei no das kleinste solche n. Wieder wegen Lemma B.3.8 p gilt qnno ≤ a und daher o
pno + 1 pn 1 pn = o + < o + ² ≤ a + ² < b. qno qno qno qno p
+1
Aber dann ist nqon eine untere Schranke f¨ ur M im Widerspruch zur Definition von pno . Also o war a schon die gr¨oßte untere Schranke von M .
474
ANHANG B. KONSTRUKTION DER REELLEN UND KOMPLEXEN ZAHLEN
Bemerkung B.3.10 : Die erste Konstruktion der reellen Zahlen wurde von R. Dedekind (1831–1916) angegeben.
¨ Ubung B.3.1 : Zeige, daß (an )n∈N ∼ ((−1)n an )n∈N genau dann gilt, wenn [(an )n∈N ] = 0. ¨ Ubung B.3.2 : Zeige, daß gilt (i) ( n1 )n∈N ∼ ( n2n+1 )n∈N , (ii) ( 2n+1 )n∈N ∼ ( 4n−3 ) . n 2n+1 n∈N
¨ Ubung B.3.3 : Zeige, daß es beschr¨ ankte (d.h., ∃M > 0 mit (∀n ∈ N) |an | < M ) Folgen (an )n∈N mit [(an )n∈N ] = ∅ gibt. ¨ Ubung B.3.4 : Seien a1 , a2 , . . . und b rationale Zahlen mit an ≥ an+1 > b f¨ ur alle n ∈ N. (i) Zeige, daß die Folge (an )n∈N eine reelle Zahl definiert, (ii) Zeige, daß f¨ ur jedes m ∈ N gilt: am ≥ [(an )n∈N ].
¨ Ubung B.3.5 : Beweise oder widerlege: Sei (an )n∈N eine Folge rationaler Zahlen, die eine reelle Zahl a definiert. Dann folgt aus an > 0 f¨ ur alle n ∈ N, daß a > 0.
√ ¨ 2 ∈ R gibt, deren Quadrat 2 ist (das zeigt man mit Mitteln Ubung B.3.6 : Wir setzen voraus, daß es√eine Zahl √ der Analysis). Betrachte die √ Teilmenge Q[ 2] := {x + 2y | x, y ∈ Q} von R mit den in R u ¨blichen Operationen + und ·. Man zeige, daß (Q[ 2], +, ·) ein K¨ orper ist.
B.4
Von den reellen zu den komplexen Zahlen
Sei C := {(a, b) | a, b ∈ R}. Betrachte die Abbildungen ¡
+: C × C → C ¢ (a, b), (a0 , b0 ) 7→ (a + a0 , b + b0 )
und ¡
·: C × C → C ¢ (a, b), (a0 , b0 ) 7→ (aa0 − bb0 , ab0 + ba0 )
¨ Es ist dann eine leichte Ubung, zu zeigen, daß + auf C eine Addition im Sinne der Axiome 1.1.1, 1.1.2 und 1.1.3 ist und analog · auf C eine Multiplikation im Sinne der Axiome 1.1.7,1.1.8 und 1.1.9. Die Null ¨ ist gegeben durch (0, 0) und die Eins durch (1, 0) (Ubung). Man nennt C zusammen mit dieser Addition und dieser Multiplikation die komplexen Zahlen. Um die Schreibweise zu erleichtern, f¨ uhrt man die Notation a + ib f¨ ur (a, b) ein. Die Zahl a nennt man den Realteil Re(a + ib) von a + ib und die Zahl b den Imagin¨ arteil Im(a + ib) von a + ib.
B.4. VON DEN REELLEN ZU DEN KOMPLEXEN ZAHLEN
475
Man betrachtet R als Teilmenge von C, indem man a mit (a, 0) = a + i0 identifiziert. Definiert man die imagin¨ are Einheit i := (0, 1), so erh¨ alt man zun¨achst (a, 0) + i · (b, 0) = (a, 0) + (0, 1) · (b, 0) = (a, 0) + (0, b) = (a, b) = a + ib (also entstehen durch die Identifikation a = (a, 0) keine Zweideutigkeiten). Außerdem gilt i · i = (0, 1) · (0, 1) = (−1, 0) = −1. Die Multiplikation
(a + ib) · (a0 + ib0 ) = (aa0 − bb0 ) + i(ab0 + ba0 )
entsteht also durch formales Ausmultiplizieren. Auch hier l¨aßt man normalerweise den Multiplikationspunkt weg und schreibt zz 0 statt z · z 0 . Wir schreiben C× f¨ ur C \ {0}. z
b
a
Satz B.4.1 : Die komplexen Zahlen C sind bzgl ihrer Addition und ihrer Multiplikation ein K¨ orper. Beweis: ¨ Ubung.
¨ Ubung B.4.1 : Auf R2 := {(a, b)|a, b ∈ R} definiere man die Addition und die Multiplikation komponentenweise: (a, b) + (a0 , b0 ) := (a + a0 , b + b0 ) (a, b) · (a0 , b0 ) := (aa0 , bb0 ). Ist (R2 , +, ·) ein K¨ orper? Welche K¨ orperaxiome sind dann f¨ ur (R2 , +, ·) erf¨ ullt oder nicht erf¨ ullt?
Literatur: [Eb92], [Ha72]
476
ANHANG B. KONSTRUKTION DER REELLEN UND KOMPLEXEN ZAHLEN
Anhang C
Naive Mengenlehre Dieser Text ist weitestgehend aus [Ha72] u ¨bernommen: Es wird keine Definition einer Menge gegeben, sondern beschrieben, welche Operationen mit Mengen als zul¨ assig betrachtet werden sollen. Das heißt, wir beschreiben, wie man aus gegebenen Mengen neue Mengen bauen kann und welche Relationen zwischen Mengen bestehen k¨ onnen. Dabei werden wir gewisse Forderungen aufstellen, die wir Axiome nennen und die eine erste Ann¨ aherung an eine wirklich axiomatische Mengenlehre sind.
C.1
Die Axiome
Der Hauptbegriff der Mengenlehre, n¨amlich derjenige, der bei vollst¨andiger Axiomatik (undefinierter) Grundbegriff ist, ist die Elementbeziehung. Wenn x Element von A ist (zu A geh¨ort, in A liegt), schreiben wir x ∈ A. Eine m¨ogliche Relation zwischen Mengen, elementarer als die Elementbeziehung, ist die Gleichheit. Die Gleichheit von zwei Mengen A und B wird generell durch das vertraute Symbol A = B bezeichnet; die Tatsache, daß A und B nicht gleich sind, wird durch A 6= B ausgedr¨ uckt. Die wichtigste Grundeigenschaft der Elementbeziehung ist ihr Verh¨altnis zur Gleichheit, das folgendermaßen formuliert werden kann: Axiom C.1.1 (Extensionalit¨ atsaxiom): dieselben Elemente haben.
Zwei Mengen sind dann und nur dann gleich, wenn sie
Anspruchsvoller, aber nicht so klar: eine Menge ist durch ihren Umfang bestimmt. Es ist wichtig zu verstehen, daß das Extensionalit¨atsaxiom keine logisch notwendige Eigenschaft der Gleichheit ist, sondern eine nichttriviale Feststellung u ¨ber die Elementbeziehung. Um dies einzusehen, betrachte man eine zum Teil analoge Situation, in welcher die dem Extensionalit¨atsaxiom entsprechende Aussage nicht gilt: Angenommen, wir betrachten Menschen anstelle von Mengen und schreiben x ∈ A, wenn x ein Vorfahr von A ist. (Die Vorfahren eines Menschen sind seine Eltern, die Eltern seiner Eltern, deren Eltern usw.) Das Analogon zum Extensionalit¨atsaxiom w¨ urde hier besagen: wenn zwei Menschen gleich sind, so haben sie dieselben Vorfahren (dies ist der nur dann“-Teil, und er ist wahr), und wenn zwei ” Menschen dieselben Vorfahren haben, dann sind sie gleich (dies ist der dann“-Teil, und er ist falsch). ” Wenn A und B Mengen sind und jedes Element von A auch Element von B ist, so sagen wir, A ist Teilmenge von B und schreiben A ⊆ B oder B ⊇ A. Wenn A ⊆ B und A 6= B gilt, so spricht man von einer echten Teilmenge und schreibt A $ B. Bemerkung C.1.2 : ur jede Menge A. (i) ⊆“ ist reflexiv, d.h. A ⊆ A f¨ ” (ii) Wenn A,B und C Mengen sind, f¨ ur die A ⊆ B und B ⊆ C gilt, so ist auch A ⊆ C (die Inklusion ist transitiv) . 477
478
ANHANG C. NAIVE MENGENLEHRE
(iii) Wenn A und B Mengen sind mit A ⊆ B und B ⊆ A, so haben sie dieselben Elemente und sind daher nach dem Extensionalit¨atsaxiom C.1.1 gleich: A = B (die Inklusion ist antisymmetrisch). Es gibt zwei fundamentale Typen von Aussagen, n¨amlich die Behauptung der Zugeh¨origkeit x ∈ A und die Behauptung der Gleichheit A = B. Alle anderen Aussagen werden aus solchen atomaren Aussagen durch wiederholte Anwendung der u ¨blichen logischen Operationen“ erzeugt: ” • und, • oder (im Sinne von entweder-oder - oder beides“), ” • nicht, • wenn –, dann –, • es gibt ein –, • fu ¨ r alle – . Die Regeln der Satzkonstruktion k¨onnen folgendermaßen beschrieben werden: (1) Setze nicht“ vor eine in Klammern eingeschlossene Aussage. (Das Einklammern soll die Eindeu” tigkeit sichern. Bei dieser Gelegenheit sei erw¨ahnt, daß Klammern jede weitere Interpunktion u ¨berfl¨ ussig machen. Die vollst¨andige Ausstattung der zusammengesetzten Aussagen mit Klammern ist selten erforderlich. Wir werden jeweils nur so viele Klammern setzen, wie zur Vermeidung von Mehrdeutigkeiten notwendig sind. In der normalen mathematischen Praxis - der auch wir hier folgen werden Klammern von unterschiedlicher Gr¨oße und Gestalt benutzt, das geschieht jedoch nur, um dem Text ein angenehmeres Gesicht zu geben.) (2) Setze und“ bzw. oder“ bzw. dann und nur dann, wenn“ zwischen zwei eingeklammerte Aussagen. ” ” ” (3) Ersetze die Gedankenstriche in wenn –, dann –“ durch eingeklammerte Aussagen. ” (4) Ersetze den Gedankenstrich in es gibt ein –“ bzw. in f¨ ur alle –“ durch einen Buchstaben und ” ” lasse eine eingeklammerte Aussage folgen. (Auch wenn der benutzte Buchstabe in der Aussage nicht vorkommt, ist das v¨ollig ungef¨ ahrlich, denn es gibt ein y (x ∈ A)“ bedeutet nach u ¨blicher ” und nat¨ urlicher Konvention dasselbe wie x ∈ A“. Es ist gleichfalls harmlos, wenn der fragliche ” Buchstabe bereits f¨ ur es gibt ein –“ oder f¨ ur alle –“ herangezogen wurde, denn es gibt ein ” ” ” x (x ∈ A)“ bedeutet dasselbe wie es gibt ein y (y ∈ A)“; ein geeigneter Buchstabenwechsel wird ” also stets alphabetische Kollision abwenden.)
Axiom C.1.3 (Aussonderungsaxiom): Zu jeder Menge A und jeder Bedingung S(x) gibt es eine Menge B, deren Elemente genau jene x aus A sind, f¨ ur die S(x) gilt. Eine Bedingung“ ist hier eben gerade eine Aussage. Das Symbol S(x) soll deutlich machen, daß der ” Buchstabe x in der betreffenden Aussage frei vorkommt; das heißt, x kommt in S(x) mindestens einmal an einer Stelle vor, wo es nicht durch einen Ausdruck es gibt ein x“ oder f¨ ur alle x“ gebunden ist. ” ” Nach dem Extensionalit¨atsaxiom C.1.1 ist die Menge B im Aussonderungsaxiom eindeutig bestimmt. Um anzuzeigen, wie B aus A und S(x) entsteht, schreibt man gew¨ohnlich B = {x ∈ A | S(x)}. (Der Buchstabe B bekommt hiermit erst seine Bedeutung, darf also nicht schon etwa in S(x) vorkommen.) Betrachte im Aussonderungsaxiom f¨ ur S(x) die Aussage nicht(x ∈ x). Wir schreiben daf¨ ur x 6∈ A . In dieser Schreibweise spielt nun x 6∈ x die Rolle von S(x). Unabh¨angig von der vorgegebenen Menge A folgt: wenn B = {x ∈ A | x 6∈ x}, so gilt f¨ ur alle y y∈B
genau dann, wenn (y ∈ A und y 6∈ y).
(C.1)
C.1. DIE AXIOME
479
Kann B ∈ A gelten? Die Antwort heißt nein! Selbstverst¨andlich gilt entweder B ∈ B (ungew¨ohnlich, aber nicht offenkundig unm¨oglich) oder B 6∈ B; im Falle B ∈ A w¨ urde aber aus B ∈ B auf Grund von (C.1) B 6∈ B folgen, also ein Widerspruch, andererseits aus B 6∈ B ebenfalls nach (C.1) B ∈ B, also abermals ein Widerspruch. Demnach kann auf keinen Fall B ∈ A gelten, also haben wir B 6∈ A. Das Interessante an dieser Folgerung ist die Feststellung, daß es etwas gibt (n¨amlich B), das nicht zu A geh¨ort; die Menge A war bei dieser Betrachtung v¨ ollig beliebig. Damit haben wir mit anderen Worten bewiesen: keine Menge enth¨alt alles Man sagt auch, es gibt keine Allmenge. Noch anders gewendet: eine Gesamtheit, die alle Objekte (Mengen) unserer Theorie enthalten w¨ urde, k¨onnte nicht selbst Objekt unserer Theorie sein. In ¨alteren (pr¨aaxiomatischen) Zug¨angen zur Mengenlehre hatte man die Existenz einer Allmenge als selbstverst¨andlich angenommen und damit auch naiv geglaubt, daß jede Aussage S(x) im absoluten Sinne, n¨amlich in der vermeintlichen Allmenge, eine Erf¨ ullungs“-Menge bestimme. In obiger Argumentation ” f¨allt dann aber bei der Definition von B, also auch in (C.1), der Zusatz x ∈ A (bzw. y ∈ A) fort, und es offenbart sich an der Frage, ob B ∈ B oder B 6∈ B, ein eklatanter Widerspruch in der Theorie, bekannt als das Russelsche Paradoxon. Die Nutzanwendung liegt darin, daß es - insbesondere in der Mathematik unm¨oglich ist, aus dem Nichts etwas zu schaffen. Zur Beschreibung einer Menge gen¨ ugt es also nicht, ein paar magische Worte auszusprechen (selbst wenn sie eine formal richtig gebildete Aussage wie x 6∈ x“ ” darstellen), sondern man muß schon eine Menge zur Verf¨ ugung haben (in unserer Argumentation hieß sie A) auf deren Elemente sich die magischen Worte anwenden lassen. Proposition C.1.4 : Zu jeder Menge x existiert ein y, das nicht Element von x ist. (Also existiert eine Menge, von der x eine echte Teilmenge ist.) Beweis: Angenommen, dies w¨are nicht der Fall. Dann gibt es eine Menge x so, daß y ∈ x f¨ ur alle y . Betrachte z = {y ∈ x | y 6∈ y} . Nach dem Aussonderungsaxiom C.1.3 ist z eine Menge. Aber es gilt z ∈ z ⇔ z 6∈ z , was eine falsche Aussage ist. Somit hat die Annahme zu einem Widerspruch gef¨ uhrt und die Behauptung ist bewiesen.
Axiom C.1.5 : Es existiert eine Menge.
Bemerkung C.1.6 : Als unmittelbare Konsequenz von Axiom C.1.5 und des Aussonderungsaxioms C.1.3 finden wir eine Menge, die keine Elemente enth¨alt: Wenn A eine Menge ist, kann {x ∈ A | x 6= x} keine Elemente enthalten. Nach dem Extensionalit¨atsaxioms C.1.1 kann es nur eine Menge ohne Elemente geben. Das u ur diese Menge ist ∅. Man nennt sie die leere Menge. ¨bliche Zeichen f¨ Die leere Menge ist Teilmenge jeder Menge, mit anderen Worten, es gilt ∅ ⊆ A f¨ ur jedes A. Um dies einzusehen, formuliert man die Aussage einfach zu Wenn x ∈ ∅, dann x ∈ A“ und stellt fest, daß diese ” Implikation richtig ist, weil die Voraussetzung immer falsch ist.
480
ANHANG C. NAIVE MENGENLEHRE
Axiom C.1.7 (Paarbildungsaxiom): Zu je zwei Mengen gibt es stets eine Menge, die jene beiden als Elemente enth¨alt. In Verbindung mit dem Aussonderungsaxiom C.1.3 erh¨alt man folgende Versch¨arfung des Paarbildungsaxioms: Proposition C.1.8 : Zu irgend zwei Mengen gibt es stets genau eine Menge, die jene beiden als Elemente enth¨ alt, sonst aber nichts. Beweis: Sind a und b Mengen und ist zudem A eine Menge mit a ∈ A und b ∈ A, so wende man das Aussonderungsaxiom C.1.3 auf A mit der Aussage x = a oder x = b“ an. Das Ergebnis ist ” die Menge {x ∈ A | x = a oder x = b}, die genau a und b enth¨alt. Nach dem Extensionalit¨atsaxiom C.1.1 kann es nur eine Menge mit dieser Eigenschaft geben.
Das u ur die in Proposition C.1.8 aus a und b konstruierte Menge ist {a, b}. Sie wird ¨bliche Zeichen f¨ die durch a und b gebildete Paarmenge genannt. Zu einer Menge a kann man die Paarmenge {a, a} bilden. F¨ ur dieses ungeordnete Paar schreiben wir kurzerhand {a} und nennen es die Einermenge von a sie ist auf Grund der Feststellung, daß a ihr einziges Element ist, eindeutig charakterisiert. Daher sind beispielsweise ∅ und {∅} grundverschiedene Mengen; die erste hat keine Elemente, die zweite dagegen genau ein Element, n¨amlich ∅. Beachte, daß a ∈ A ¨aquivalent ist mit {a} ⊆ A. Das Paarbildungsaxiom C.1.7 stellt sicher, daß jede Menge auch als Element einer Menge vorkommt und daß es zu je zwei Mengen stets eine dritte gibt, in der sie beide als Elemente enthalten sind. Zudem kann man aus den bisher gemachten Voraussetzungen in der Tat auf die Existenz sehr vieler Mengen schließen. Beispielshalber betrachte man die Mengen ∅, {∅}, {{∅}}, {{{∅}}}, usw.. Axiom C.1.9 (Vereinigungsmengenaxiom): Zu jedem Mengensystem (d.h. einer Menge von Mengen) gibt es eine Menge, welche alle Elemente enth¨alt, die zu mindestens einer Menge des gegebenen Systems geh¨ oren. Anders gesagt: Zu jedem Mengensystem S existiert eine Menge U derart, daß aus x ∈ X f¨ ur ein gewisses X in S stets x ∈ U folgt. Die im Vereinigungsmengenaxiom C.1.9 beschriebene umfassende Menge U ist noch nicht die Vereinigungsmenge der Mengen aus S: sie kann Elemente enthalten, die zu keiner der Mengen X im System geh¨oren. Dem ist leicht abzuhelfen; man bilde mit dem Aussonderungsaxiom C.1.3 die Menge {x ∈ U | ∃X : x ∈ X und X ∈ S}. F¨ ur alle x gilt: Notwendig und hinreichend daf¨ ur, daß x zu der eben gebildeten Menge geh¨ort, ist die ¨ Bedingung, daß x zu X geh¨ort f¨ ur mindestens ein X ∈ S. Andern wir die Bezeichnung und nennen die neue Menge wieder U , so haben wir also U = {x | x ∈ X f¨ ur mindestens ein X ∈ S}. Diese Menge U wird die Vereinigung des Mengensystems S genannt; man beachte, S daß das Extensionalit¨ a tsaxiom C.1.1 ihre Eindeutigkeit sichert. Die u blichen Schreibweisen f¨ u r U sind {X | X ∈ S} ¨ S oder X∈S X. Wenn S = {A, B}, dann schreibt man stattdessen A ∪ B. Das bedeutet A ∪ B = {x | x ∈ A oder x ∈ B}.
Bemerkung C.1.10 :
C.1. DIE AXIOME (i) (ii)
S S
481
{X | X ∈ ∅} = ∅. {X | X ∈ {A}} = A.
(iii) A ∪ ∅ = A. (iv) A ∪ B = B ∪ A. (v) A ∪ (B ∪ C) = (A ∪ B) ∪ C. (vi) A ∪ A = A. (vii) A ⊆ B genau dann, wenn A ∪ B = B.
Zu gegebenen Mengen A und B versteht man unter dem Durchschnitt von A und B die Menge A ∩ B := {x | x ∈ A und x ∈ B}. Wenn A ∩ B = ∅ gilt, dann nennt man A und B disjunkt. Bemerkung C.1.11 : (i) A ∩ ∅ = ∅. (ii) A ∩ B = B ∩ A. (iii) A ∩ (B ∩ C) = (A ∩ B) ∩ C. (iv) A ∩ A = A. (v) A ⊆ B dann und nur dann, wenn A ∩ B = A.
Proposition C.1.12 (Distributivgesetze): (i) A ∩ (B ∩ C) = (A ∩ B) ∪ (A ∩ C). (ii) A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C). Beweis: ¨ Wir leiten wir die zweite her (die erste sei dem Leser zur Ubung u ¨berlassen). Wenn x zur linken Seite“ geh¨ort, dann geh¨ort x entweder zu A oder aber gleichzeitig zu B und C; liegt ” nun x in A, so geh¨ort x sowohl zu A ∪ B als auch zu A ∪ C; liegt x andererseits gleichzeitig in B und in C, so geh¨ort x wieder sowohl zu A ∪ B als auch zu A ∪ C; in jedem Fall geh¨ort x also zur rechten Seite“. Damit ist gezeigt, daß die rechte Seite die linke umfaßt. Um die ” umgekehrte Inklusion zu beweisen, beachte man lediglich: wenn x sowohl zu A ∪ B als auch zu A ∪ C geh¨ort, dann liegt x entweder in A oder aber gleichzeitig in B und in C.
Die Bildung des Durchschnitts von zwei Mengen A und B oder wie wir auch sagen k¨onnen die Bildung des Durchschnitts der Paarmenge {A, B} ist ein Spezialfall iner sehr viel allgemeineren Operation. (Auch in dieser Hinsicht l¨aßt sich die Theorie der Durchschnitte jener der Vereinigungen nachbilden.) Die Existenz der allgemeinen Durchschnittsoperation beruht auf der Tatsache, daß es zu jedem nichtleeren Mengensystem eine Menge gibt, die genau diejenigen Elemente enth¨alt, welche zu jeder Menge des gegebenen Systems geh¨oren:
482
ANHANG C. NAIVE MENGENLEHRE
Satz C.1.13 : Zu jedem von ∅ verschiedenen Mengensystem S gibt es eine Menge V derart, daß x ∈ V dann und nur dann, wenn x ∈ X f¨ ur jedes X ∈ S. Beweis: Man nehme irgendeine Menge A aus S (wegen S 6= ∅ ist das ja m¨oglich) und schreibe V = {x ∈ A | x ∈ X f¨ ur jedes X ∈ S}. (Die aussondernde Bedingung bedeutet dasselbe wie f¨ ur alle X (wenn X ∈ S, so x ∈ X)“.) ” Die Menge V h¨angt nur scheinbar von der willk¨ urlichen Wahl der Menge A ab; in Wirklichkeit ist V = {x | x ∈ X f¨ ur jedes X ∈ S}.
Die Menge V aus Satz C.1.13 wird der Durchschnitt des Mengensystems S genannt; T das Extensionalit¨aT tsaxiom C.1.1 sichert seine Eindeutigkeit. Die u ur V sind {X | X ∈ S} ¨blichen Schreibweisen f¨ oder X∈S X. Zu gegebenen Mengen A und B versteht man unter der Differenzmenge zwischen A und B die Menge A \ B := {x ∈ A | x 6∈ B}. Sie wird oft auch das relative Komplement von B in A genannt. Man beachte, daß es f¨ ur die Definition nicht notwendig ist, B ⊆ A vorauszusetzen. Wenn man ausschließlich u ¨ber Teilmengen einer festen Menge E spricht, k¨ urzt man die Differenzmenge E \ A auch durch –A ab und nennt sie das Komplement von A in E. Bemerkung C.1.14 : (i) –(–A) = A. (ii) – ∅ = E und –E = ∅. (iii) A ∩ –A = ∅ und A ∪ –A = E. (iv) A ⊆ B dann und nur dann, wenn –B ⊆ –A.
Bemerkung C.1.15 : Die wichtigsten Aussagen u ¨ber Komplemente sind die sogenannten De Morganschen Gesetze: –(A ∪ B) = (–A) ∩ (–B), –(A ∩ B) = (–A) ∪ (–B).
S¨atze der Mengenlehre treten gew¨ohnlich paarweise auf: Wenn wir n¨amlich in einer aus Vereinigungen, Durchschnitten und Komplementen von Teilmengen der Grundmenge E gebildeten g¨ ultigen Inklusion oder Gleichung jeweils E durch ∅ und ∅ durch E ersetzen, außerdem Vereinigungen und Durchschnitte gegeneinander auswechseln und die Inklusion umkehren, so ist das Ergebnis wieder eine g¨ ultige Aussage. Diesen Sachverhalt nennt man das Dualit¨ atsprinzip fu ¨ r Mengen. Bemerkung C.1.16 :
C.1. DIE AXIOME
483
(i) A \ B = A ∩ –B. (ii) A ⊆ B dann und nur dann, wenn A \ B = ∅. (iii) A \ (A \ B) = A ∩ B. (iv) A ∩ (B \ C) = (A ∩ B) \ (A ∩ C). (v) A ∩ B ⊆ (A ∩ C) ∪ (B ∩ –C). (vi) (A ∪ C) ∩ (B ∪ –C) ⊆ A ∪ B.
Zu gegebenen Mengen A und B versteht man unter der symmetrischen Differenz von A und B die Menge A M B := (A \ B) ∪ (B \ A). Diese Operation ist kommutativ: A M B = B M A, assoziativ: A M (B M C) = (A M B) M C, und es gilt A M ∅ = A sowie A M A = ∅. Bemerkung C.1.17 : Durchschnitte wurden nur f¨ ur nichtleere Mengensysteme definiert. Das hat seinen Grund darin, daß derselbe Ansatz f¨ ur das leere Mengensystem ∅ keine Menge definiert. Wir m¨ ussen n¨amlich fragen: Welche Objekte x erf¨ ullen die Bedingung x ∈ X f¨ ur jedes X in ∅? Wie das h¨aufig bei Fragen u ¨ber die leere Menge der Fall ist, so ist auch hier die Antwort leichter auf die zugeh¨orige negative Frage zu finden, also: Welche Objekte x erf¨ ullen nicht die angegebene Bedingung? Wenn es nicht stimmt, daß x ∈ X f¨ ur jedes X in ∅, dann muß es ein X in ∅ geben derart, daß x 6∈ X; da es jedoch u ¨berhaupt keine X in ∅ gibt, kann dies nicht sein. Folglich verletzt kein x die fragliche Bedingung, das heißt alle x gen¨ ugen ihr; mit anderen Worten: Die Objekte x, welche der Bedingung gen¨ ugen, sch¨ opfen die (nichtexistente) Allmenge aus. Dahinter verbirgt sich kein tiefgr¨ undiges Problem; es ist bloß ¨argerlich, st¨andig Einschr¨ankungen und Ausnahmen machen zu m¨ ussen, nur weil irgendeine Menge irgendwo bei irgendeiner Konstruktion sich am Ende als leer erweisen k¨onnte. Dagegen kann man nichts machen; das ist eben so. Beschr¨anken wir unsere Aufmerksamkeit auf die Teilmengen einer festen Menge E, so verschwinden die beschriebenen Unannehmlichkeiten: In diesem Fall k¨onnen wir n¨amlich den Durchschnitt eines Mengensystems S (von Teilmengen von E) definieren als die Menge {x ∈ E | x ∈ X f¨ ur jedes X in S}. Das ist nichts grunds¨atzlich Neues; f¨ ur jedes nichtleere Mengensystem stimmt die neue Definition mit der alten u ¨berein. Der Unterschied liegt nur in der Art und Weise, wie die T alte und die neue Definition das leere Mengensystem behandeln; und nach der neuen Definition ist X∈∅ X gleich E, denn man frage: Welche Elemente x von E gen¨ ugen nicht der Bedingung, daß x ∈ X f¨ ur jedes X in ∅? Der Unterschied ist ¨ genaugenommen nur sprachlicher Natur. Eine kleine Uberlegung zeigt n¨amlich, daß die neue“, auf ein ” System S von Teilmengen von E bezogene Definition des Durchschnitts in Wirklichkeit dasselbe liefert wie die alte Definition des Durchschnitts des Systems S ∪ {E}, und das zuletzt genannte Mengensystem ist niemals leer. Wir waren bei der Betrachtung der Teilmengen einer Menge E. Bilden alle diese Teilmengen zusammengenommen selbst eine Menge 1 Das folgende Mengenbildungsprinzip garantiert eine positive Antwort. Axiom C.1.18 (Potenzmengenaxiom): Zu jeder Menge existiert ein Mengensystem, das unter seinen Elementen alle Teilmengen der gegebenen Menge enth¨alt.
484
ANHANG C. NAIVE MENGENLEHRE
Mit anderen Worten, zu gegebener Menge E existiert stets eine Menge (ein Mengensystem) P derart, daß mit X ⊆ E stets X ∈ P. Die gerade beschriebene Menge P kann gr¨oßer sein als erw¨ unscht; sie kann noch andere Elemente enthalten als nur die Teilmengen von E. Dem ist leicht abzuhelfen; man bilde mit dem Aussonderungsaxiom C.1.3 die Menge {X ∈ P | X ⊆ E}. (Man erinnere sich, daß die aussondernde Bedingung X ⊆ E“ dasselbe besagt wie f¨ ur alle x (wenn ” ” x ∈ X, so x ∈ E)“.) F¨ ur alle X gilt: Notwendig und hinreichend daf¨ ur, daß X zu der eben gebildeten ¨ Menge geh¨ort, ist die Bedingung, daß X Teilmenge von E ist. Andern wir die Bezeichnung und nennen die neue Menge P(E), so haben wir also P(E) = {X | X ⊆ E}. Diese Menge wird die Potenzmenge von E genannt; das Extensionalit¨atsaxiom C.1.1 sichert ihre Eindeutigkeit. Da die Menge P(E) im Vergleich zu E sehr umfangreich ist, kann man Beispiele nur in Trivialf¨allen leicht angeben. Die Situation ist ganz einfach, wenn E = ∅; die Menge P(∅) ist die Einermenge {∅}. Die Potenzmengen von Einermengen und Paarmengen sind gleichfalls leicht zu beschreiben; wir haben © ª P({a}) = ∅, {a} und
© ª P({a, b}) = ∅, {a}, {b}, {a, b} .
Proposition C.1.19 : F¨ ur jede Menge X ist die Potenzmenge P(X) echt m¨ achtiger als X . Beweis: Zu zeigen ist, dass jede Abbildung f : X → P(X) nicht surjektiv ist. Sei also f so eine Abbildung. Betrachte Y = {x ∈ X | x 6∈ f (x)} . Nach dem Aussonderungsaxiom ist dies eine Teilmenge von X , also ein Element von P(X) . Wir behaupten, dass Y 6∈ f (X) . W¨are n¨amlich f (y) = Y , so w¨ urde gelten y ∈ f (y) ⇔ y ∈ Y ⇔ y 6∈ f (y) . Dies ist falsch, also kann nicht f (y) = Y gelten. Folglich ist f nicht surjektiv und die Behauptung ist bewiesen.
Bemerkung C.1.20 : Das obige Beweisprinzip ist eine Variante der Russellschen Antinomie (oder eher umgekehrt), das so genannte Cantorsche Diagonalfolgenargument. Zu jedem System S von Teilmengen einer Menge E, also zu jedem Untersystem von P(E), k¨onnen wir die Menge D = {X ∈ P(E) | –X ∈ S} bilden. (Um sicherzustellen, daß die zur Definition von D benutzte Bedingung eine Aussage im pr¨azisen technischen Sinne darstellt, m¨ ußte sie etwa auf folgende Gestalt umgeformt werden: Es gibt ein Y (Y ∈ S ” und f¨ ur alle x (x ∈ X genau dann, wenn (x ∈ E und x 6∈ Y )))“. ¨ Ublicherweise schreibt man f¨ ur die Vereinigung bzw. den Durchschnitt des Mengensystems D \ [ –X. –X bzw. X∈S
X∈S
In dieser Symbolik sehen die allgemeinen Formen der De Morganschen Gesetze folgendermaßen aus:
C.1. DIE AXIOME Proposition C.1.21 : ³S ´ T (i) – X∈S X = X∈S –X. (ii) –
³T
´ S X = X∈S –X. X∈S
Beweis: ¨ Ubung.
485
486
ANHANG C. NAIVE MENGENLEHRE
Anhang D
Hintergrundmaterial zur Linearen Algebra D.1
Lineare Gleichungssysteme
Sei K ein K¨orper. Eine lineare Gleichung u ¨ber K ist eine Gleichung der Form a1 x1 + ... + an xn = b.
(LG)
Dabei sind a1 , . . . an , b ∈ K als bekannt vorausgesetzte Zahlen und x1 , . . . , xn die Unbekannten. Ein lineares Gleichungssystem ist eine endliche Menge von linearen Gleichungen: a11 x1 .. .
+ ... +
am1 x1
+ ... +
a1n xn .. .
=
b1 .. .
amn xn
= bm .
(LGS)
Eine Matrix ist ein rechteckiges Zahlenschema der Form a11 . . . a1n .. .. . . . am1
...
amn
Die ai1 , . . . , ain f¨ ur i = 1, . . . , m heißen die Zeilen der Matrix und die a1j .. . amj f¨ ur j = 1, . . . , n die Spalten der Matrix. Wir f¨ uhren einige neue Bezeichnungen f¨ ur die Daten eines linearen Gleichungssystems (LGS) ein: Koeffizientenmatrix:
erweiterte Koeffizientenmatrix:
a11 .. . am1
a11 .. . am1
a12
a1n .. . ... amn
...
am2 a12
...
am2
... amn
487
a1n .. .
b1 .. . bm
488
ANHANG D. HINTERGRUNDMATERIAL ZUR LINEAREN ALGEBRA
F¨ ur eine Matrix betrachtet man folgende elementare Zeilenumformungen: Typ
I Vertauschen zweier Zeilen (p) und (q): I(p, q)
Typ II Multiplikation einer Zeile (p) mit c 6= 0: II(p; c) Typ III Addition des c-fachen einer Zeile (p) zu einer anderen Zeile (q): III(c, p; q) Selbstverst¨andlich lassen sich auch die analogen elementare Spaltenumformungen betrachten. Mithilfe von Koeffizientenmatrix und elementare Zeilenumformungen l¨aßt sich der Gaußalgorithmus wie folgt darstellen: Algorithmus D.1.1 : (Gaußalgorithmus) 1.Schritt: Streiche alle Spalten, die nur aus Nullen bestehen. Die u ¨brig bleibenden Spalten seien j1 < . . . < ju . Ergebnis:
a1j1 .. . amj1
a1j2 .. .
...
a1ju .. .
amj2
... amju
b1 .. . bm
2.Schritt: Wenn apj1 6= 0 und aij1 = 0 f¨ ur i < p, dann I(1, p). Ergebnis:
a01j1 .. . a0mj1
a01ju .. . ... a0mju
b01 .. . 0 bm
a001ju a02ju .. . ... a0mju
b001 b02 .. . b0m
a01j2 .. . a0mj2
...
a001j2 a02j2 .. . a0mj2
... ...
3.Schritt: II(1; a01 ). 1j1
Ergebnis:
1
a02j 1 .. . a0mj1 4.Schritt: III(−a0ij1 , 1; i),
i = 2, . . . , m.
Ergebnis:
1 0 .. . 0
a001j2 a002j2 .. . a00mj2
a001ju a002ju .. . ... a00mju ... ...
b001 b002 .. . b00m
Iteration: Starte das Verfahren mit
a002j2 .. . a00mj2
a002ju .. . ... a00mju ...
b002 .. . 00 bm
Der erste Schritt des Gaußalgorithmus (Streichen der Nullspalten) kann bei der Iteration zu Verwirrung f¨ uhren. Darum schleppt man oft die Nullspalten mit, ignoriert sie aber im Algorithmus. Als Ergebnis erh¨alt man die folgende Proposition:
D.1. LINEARE GLEICHUNGSSYSTEME
489
Proposition D.1.2 : Jede (Koeffizienten-) Matrix eine Zeilenstufenform bringen: 0 ··· 0 1 ∗ ··· ··· .. .. . . 0 0 ··· 0 .. .. .. .. .. . . . . . . . . . .. .. .. .. .. . . . . . .. .. .. .. .. . 0 ··· 0 0 0 ··· 0
l¨ aßt sich durch elementare Zeilenumformungen auf ···
···
···
···
∗ ···
1
∗
···
···
∗
0 .. . .. . 0
0 .. . .. . 0
···
0 .. . .. . 0
1
···
0 .. . 0
··· ··· ··· .. . ···
Die Stellen einer Matrix in Zeilenstufenform, an denen in einer Zeile zum ersten Mal eine 1 steht, nennen wir die Stufen der Matrix. Die Anzahl der Spalten, die man von einer Stufe aus nach links gehen muß, um eine Zeile h¨oher die vorhergehende Stufe zu finden, heißt die Stufenl¨ ange der Stufe. Die Stufenl¨ange ist 1, falls die erste Spalte des betreffenden Iterationsschritts keine Nullspalte ist. Auf jeden Fall ist die Anzahl der Stufen kleiner gleich der Anzahl der Zeilen bzw. der Spalten (je nach dem, was kleiner ist). Bemerkung D.1.3 : Betrachte jetzt ein lineares Gleichungssystem (LGS) und bringe die erweiterte Koeffizientenmatrix durch elementare Zeilenumformungen auf Zeilenstufenform(vgl. Proposition D.1.2). Sei S = {s1 , . . . , sk } die Menge der Spalten, in denen eine Stufe vorkommt, d.h. zu sl existiert ein il so, daß ail sl = 1 und aij = 0 f¨ ur (i, j) 6= (il , sl ) mit i ≥ il und j ≤ sl . Dann lassen sich verschiedene Informationen aus der Zeilenstufenform sofort ablesen: • L¨ osbarkeit: Das System (LGS) ist dann und nur dann l¨osbar, wenn sk ≤ n. In anderen Worten, wenn h die Anzahl der Stufen der Zeilenstufenform der Koeffizientenmatrix ist und k die Anzahl der Stufen der Zeilenstufenform der erweiterten Koeffizientenmatrix, dann muß f¨ ur die L¨osbarkeit von (LGS) gelten h = k. Wenn sk = n + 1, d.h. in der letzten Spalte gibt es eine Stufe, dann hat man die Gleichung 0x1 + ... + 0xn = 1 zu l¨osen, was offensichtlich nicht geht. Umgekehrt, wenn sk ≤ n, dann ist jede Gleichung des Systems entweder von der Form 0 = 0 oder von der Form xj + aj+1 xj+1 + ... + an xn = bi , was f¨ ur beliebige xj+1 , . . . , xn mit passendem xj gel¨ost werden kann. • Bestimmung der L¨ osungsmenge: Wenn nehmen jetzt an, daß das (LGS) in Zeilenstufenform gegeben ist und sk ≤ n. Ziel ist es, diejenigen (x1 , . . . , xn ) zu bestimmen, die L¨osungen von (LGS) sind. (A) Alle xj mit j 6∈ S sind frei w¨ahlbar (in K). (B) Die Zahlen xs1 , . . . , xsk m¨ ussen dann das Gleichungssystem xs1 + a1,s1 +1 xs1 +1 + . . . + a1,n xn xs2 + a2,s2 +1 xs2 +1 + . . . + a1,n xn
= = .. .
b1 b2
xsk−1 + ak−1,sk−1 +1 xsk−1 +1 + . . . + a1,n xn xsk + ak,sk +1 xsk +1 + . . . + a1,n xn
= =
bk−1 bk
l¨osen (alle anderen Zeilen von (LGS) liefern nur Nullen und keine Bedingungen).
490
ANHANG D. HINTERGRUNDMATERIAL ZUR LINEAREN ALGEBRA 1. Schritt: Da keine der Spalten sk + 1, . . . , n eine Stufe enth¨alt, sind alle xj mit j = sk + 1, . . . , n schon in (A) bestimmt worden (durch freie Wahl). Die Zahl xsk wird dann eindeutig durch die Gleichung xsk = bk − (ak,sk +1 xsk +1 + . . . + a1,n xn ) festgelegt. 2.Schritt: Da mit Ausnahme von sk keine der Spalten sk−1 + 1, . . . , n eine Stufe enth¨alt, sind alle xj mit j = sk−1 + 1, . . . , n schon entweder in (A) (durch freie Wahl) oder in Schritt B1 bestimmt worden. Die Zahl xsk−1 wird dann eindeutig durch die Gleichung xsk−1 = bk−1 − (ak−1,sk−1 +1 xsk−1 +1 + . . . + a1,n xn ) festgelegt. .. . k.Schritt: Da mit Ausnahme von s2 , . . . , sk keine der Spalten s1 +1, . . . , n eine Stufe enth¨alt, sind alle xj mit j = s1 +1, . . . , n schon entweder in (A) (durch freie Wahl) oder in den Schritten (B1) bis (B(k − 1)) bestimmt worden. Die Zahl xsk−1 wird dann eindeutig durch die Gleichung xs1 = b1 − (a1,s1 +1 xs1 +1 + . . . + a1,n xn ) festgelegt. Zusammen liefern (A) und (B) alle m¨oglichen L¨osungen von (LGS). • Nicht-triviale L¨ osungen: Wenn bi = 0, i = 1, . . . , m, dann ist (LGS) immer l¨osbar. Z.B. ist (0, . . . , 0) eine L¨osung. Wenn n > m (mehr Unbekannte als Gleichungen), dann ist n−k ≥ n−m > 0 und es existieren auch von Null verschiedene L¨osungen.
F¨ ur jede Menge M schreibt man M n := {(m1 , . . . , mn ) | mj ∈ M }.
D.2
Vektorr¨ aume von Zahlentupeln
Sei K ein K¨orper. Dann heißt Kn := {x = (x1 , ..., xn ) | xj ∈ K, j = 1, ..., n} heißt der n-dimensionale Zahlenraum u ¨ber K. Seine Elemente werden auch als Vektoren bezeichnet. Auf Kn gibt es zwei Rechenoperationen, die (Vektor)Addition und die Multiplikation mit Skalaren (d.h. Zahlen) • Addition:
(x1 , ..., xn ) + (y1 , ..., yn ) = (x1 + y1 , ..., xn + yn )
• Multiplikation mit einem Skalar:
c(x1 , ..., xn ) = (cx1 , ..., cxn )
Es gelten folgende Rechenregeln, wie man (unter Verwendung der K¨orperaxiome) leicht verifiziert: (x + y) + z
= x + (y + z)
∀x, y, z ∈ Kn
(Assoziativgesetz)
n
x+y c(x + y)
= y + x ∀x, y ∈ K (Kommutativgesetz) n = cx + cy ∀x, y ∈ K , c ∈ K (1. Distributivgesetz)
(c + d)x c(dx)
= cx + dx ∀x ∈ Kn , c, d ∈ K = (cd)x ∀x ∈ Kn , c, d ∈ K
1x 0x
= x = (0, ..., 0) =: 0 ∈ Kn
(2. Distributivgesetz)
¨ D.2. VEKTORRAUME VON ZAHLENTUPELN Proposition D.2.1 : Sei
n P j=1
491
aij xj = 0, i = 1, . . . , m, ein homogenes lineares Gleichungssystem mit
L¨ osungsmenge U . Dann gilt: (a) v, w ∈ U ⇒ v + w ∈ U (b) v ∈ U, t ∈ K ⇒ tv ∈ U Beweis: Gegeben seien t, s ∈ K und v, w ∈ U . Zu zeigen ist tv + sw ∈ U . n X
aij (tvj + swj )
j=1
=
n X
taij vj +
j=1
n X
saij wj
j=1
n n X X = t ( aij wj ) aij vj ) +s ( j=1
| =
{z
}
0 nach Vor.
j=1
| =
{z } 0 nach Vor.
= 0
Eine Teilmenge ∅ 6= U ⊆ Kn heißt linearer Unterraum, wenn gilt: a) ∀u, v ∈ U gilt u + v ∈ U b) ∀t ∈ K, ∀u ∈ U gilt tu ∈ U
(Abgeschlossenheit unter der Addition) (Abgeschlossenheit unter Multiplikation mit Skalaren)
Sei A ⊆ Kn beliebige (nicht leere) Teilmenge. Die Menge k X cj aj ∈ Kn | k ∈ N, aj ∈ A, cj ∈ K span(A) := j=1
heißt der lineare Spann oder die lineare Hu ¨ lle von A. Man sagt auch, A spannt span(A) auf. Ein Element der Form k X v= cj aj ∈ Kn j=1
heißt Linearkombination der a1 , . . . , ak , d.h., der lineare Spann von A ist gerade die Menge der Linearkombinationen von Elementen aus A. Um l¨astige Fallunterscheidungen zu vermeiden, setzt man span(∅) := {0}. Eine Teilmenge A ⊆ Kn heißt linear abh¨ angig, wenn schon eine echte Teilmenge von A ausreicht, um span(A) aufzuspannen: (∃∅ 6= A0 & A) span(A0 ) = span(A). Ansonsten heißt A linear unabh¨ angig. Beispiel D.2.2 : (i) {e1 , e2 , e1 + e2 } ist linear abh¨angig.
492
ANHANG D. HINTERGRUNDMATERIAL ZUR LINEAREN ALGEBRA
(ii) {e1 , e2 } ist linear unabh¨angig: {e1 } ⊆ {e1 , e2 }, span(e1 ) = {(x1 , 0) | x1 ∈ K} & K2 = span(e1 , e2 ). Analog f¨ ur {e2 } ⊆ {e1 , e2 }. (iii) Wenn 0 ∈ A ⊆ Kn dann ist A linear abh¨angig, weil span(A) = span(A \ {0}). (iv) A ⊆ Kn . Wenn ∃a ∈ A mit a ∈ span(A \ {a}), dann ist A linear abh¨angig, denn: Setze A0 := A \ {a} ⊂ A. m P Nach Voraussetzung haben wir: a = cj a0j wobei a0j ∈ A \ {a} = A0 j=1
( span(A)
=
=
ta + m X
k X
) 0
di bi | bi ∈ A , t, di ∈ K, k ∈ N
i=1
tcj a0j +
k X
j=1
di bi | a0j , bi ∈ A0 , cj , t, di ∈ K, k ∈ N
i=1
⊆ span(A0 ) ⊆ span(A) Also gilt span(A) = span(A0 ). (v) Wenn v1 , . . . , vk ∈ A verschieden und c1 , . . . , ck ∈ K nicht alle 0 sind, jedoch k X
cj vi = 0
(NLR)
j=1
gilt (so eine Gleichung nennt man eine nicht-triviale lineare Relation), dann ist A linear abh¨angig. Um das zu sehen, kann man o.B.d.A. (ohne Beschr¨ankung der Allgemeinheit) annehmen, daß c1 6= 0. Also gilt ¶ k µ X cj v1 = − vj ∈ span(A \ {v1 }) c1 j=2 und dies zeigt nach (iv) die lineare Abh¨angigkeit von A.
Satz D.2.3 : Eine Teilmenge A ⊆ Kn ist genau dann linear abh¨ angig, wenn es eine nicht-triviale lineare Relation der Form (NLR) zwischen Elementen von A gibt. Beweis: “⇐” folgt sofort aus (v) in Beispiel D.2.2. “⇒”: Wenn A linear abh¨angig ist, dann gibt es A0 & A mit span(A0 ) = span(A). Sei v ∈ A\A0 k P und v = cj vj , vj ∈ A0 , cj ∈ K. Dann ist j=1
1v +
k X
(−cj )vj = 0
j=1
die gew¨ unschte nicht-triviale lineare Relation.
¨ D.2. VEKTORRAUME VON ZAHLENTUPELN
493
Korollar D.2.4 : (Test auf lineare Unabh¨angigkeit) A ⊆ Kn ist linear unabh¨ angig genau dann, wenn gilt: k P F¨ ur v1 , . . . , vk ∈ A verschieden und c1 , . . . , ck ∈ K mit cj vj = 0 folgt, daß c1 = . . . = ck = 0. j=1
Beispiel D.2.5 : Sei v1 = (1, 0, 0), v2 = (1, 1, 0), v3 = (1, 1, 1) ∈ R3 und A = {v1 , v2 , v3 }. 0 = c1 v1 + c2 v2 + c3 v3 = (c1 + c2 + c3 , c2 + c3 , c3 ) impliziert erst c3 = 0, dann c2 = 0 und schließlich c1 = 0. Also ist A linear unabh¨angig. Beispiel D.2.6 : Die Teilmenge A ⊆ Kn habe mehr als n Elemente. Dann ist A ist linear abh¨angig, denn: Seien v1 , . . . , vn+1 ∈ A verschieden und vj = (vj,1 , . . . , vj,n ). Betrachte das homogene Gleichungssystem n+1 X xj vj,i = 0 i = 1, . . . , n. j=1
Es hat mehr Unbekannte als Gleichungen, l¨aßt daher (vgl. Bemerkung D.1.3) eine von 0 verschiedene L¨osung (c1 , . . . , cn+1 ) zu. D.h., es gilt n+1 X cj vj = 0 j=1
und wir haben eine nicht-triviale lineare Relation. Beispiel D.2.7 : Betrachte eine Matrix in Zeilenstufenform mit k Stufen. Weiter seien v1 , . . . , vk ∈ Kn die ersten k Zeilenvektoren der Matrix. Dann ist die Menge {v1 , . . . , vk } linear unabh¨angig: Wir wenden Korollar D.2.4 an: k X cj vj = 0. j=1
Seien s1 < . . . < sk die Spaltennummern, in denen Stufen auftauchen. Dann gilt ½ 1 i=1 vi,s1 = 0 i = 2, . . . , k, also folgt c1 = 0 und
was dann c2 = 0 und
Pk
i=2 ci vi
Pk
i=3 ci vi
= 0. Genauso finden wir ½ 1 i=2 vi,s2 = 0 i = 3, . . . , k, = 0 zeigt. Wir fahren so fort und finden analog c1 = . . . = ck = 0.
Eine Basis f¨ ur einen linearen Unterraum ist eine minimale Teilmenge des Unterraums, die diesen Unterraum aufspannt: Sei U ⊆ Kn ein linearer Unterraum. Eine Basis f¨ ur U ist eine Menge {v1 , . . . , vk } ⊆ U mit a) span(v1 , . . . , vk ) = U b) {v1 , . . . , vk } ist linear unabh¨angig ¨ Die Zahl k heißt die L¨ ange der Basis. Ahnlich wie im Fall des linearen Spanns definiert man: ∅ ist eine Basis f¨ ur {0}.
494
ANHANG D. HINTERGRUNDMATERIAL ZUR LINEAREN ALGEBRA
Beispiel D.2.8 : (a) 0 6= v ∈ Kn , {v} ist eine Basis f¨ ur Kv. (b) {e1 , . . . , en } ist eine Basis f¨ ur Kn (Standardbasis oder auch kanonische Basis).
Satz D.2.9 : Sei U ⊆ Kn ein linearer Unterraum und v1 , . . . , vk ∈ U . Dann sind folgende Aussagen aquivalent: ¨ (1) {v1 , . . . , vk } ist eine Basis f¨ ur U . (2) Jedes u ∈ U l¨ aßt sich in eindeutiger Weise als Linearkombination der v1 , . . . , vk schreiben. Beweis: Sei u ∈ U . Die Existenz der Linearkombination ist nach Definition ¨aquivalent zu span(v1 , . . . , vk ) = U. Die Eindeutigkeit der P Linearkombination Pk zur linearen Unabh¨angigkeit von Pk ist ¨aquivalent k d v folgt c v = {v1 , . . . , vk }: Aus u = j j j j j=1 (cj − dj )vj = 0 und daher (vgl. j=1 j=1 Korollar D.2.4) cj = dj f¨ ur alle j falls {v1 , . . . , vk } linear unabh¨angig ist. Umgekehrt, wenn Pk ur alle j, dann folgt (wieder aus Korollar D.2.4) die lineare aus j=1 cj vj = 0 folgt cj = 0 f¨ Unabh¨angigkeit von {v1 , . . . , vk }.
Satz D.2.10 : (Basisauswahlsatz) Sei U = span(v1 , . . . , vk ) ⊆ Kn . Dann gibt es {vi1 , . . . , vir } ⊆ {v1 , . . . , vk }, so daß {vi1 , . . . , vir } eine Basis f¨ ur U ist. Beweis: Wir testen {v1 , . . . , vk } auf lineare Unabh¨angigkeit. 1. Fall: Wenn {v1 , . . . , vk } linear unabh¨angig ist, gibt es nichts zu zeigen. 2. Fall: {v1 , . . . , vk } linear abh¨angig. Dann existiert eine echte Teilmenge {vi1 , . . . , vir } & {v1 , . . . , vk } mit span(vi1 , . . . , vir ) = span(v1 , . . . , vk ) = U Wiederhole den Test mit der kleineren Menge: Dieses Verfahren bricht ab, weil man in jedem Schritt mindestens ein Element streicht. Man ist dann in Fall 1 und hat die gew¨ unschte Basis.
Satz D.2.11 : (Invarianz der Basisl¨ange) Die L¨ ange einer Basis f¨ ur einen linearen Unterraum U ⊆ Kn h¨ angt nicht von der Basis, sondern von nur U ab. Beweis:
¨ D.2. VEKTORRAUME VON ZAHLENTUPELN
495
Seien {v1 , . . . , vr } und {u1 , . . . , us } zwei Basen f¨ ur U . Zu zeigen ist: r = s. Aus Symmetriegr¨ unden (vertausche die Rollen von r und s, d.h., von {v1 , . . . , vr } und {u1 , . . . , us }) reicht es zu zeigen: s ≤ r : r X i = 1, . . . , s ui = cij vj j = 1, . . . , r j=1
(geht, weil span{vj | j = 1, . . . , r} = U ) s X i=1
cij xi = 0
r s
Zeilen Unbekannte
Wenn r < s, dann hat das System eine von Null verschiedene L¨osung (x1 , . . . , xs ) 6= 0. Es gilt: Ã s ! s s r r X X X X X X xi ui = xi cij vj = xi cij vj = vj cij xi = 0. i=1
i=1
j=1
i = 1 , ... , s j = 1 , ... , r
j=1
|
i=1
{z
}
0
Dies steht im Widerspruch zur linearen Unabh¨angigkeit von {u1 , . . . , us } (vgl. Satz D.2.9) und liefert daher s ≤ r.
Wir bezeichnen die Menge aller Matrizen mit m Zeilen, n Spalten und Koeffizienten in K mit Mat(m× n, K). An dieser Stelle machen wir einen kleinen Exkurs zum Thema Abbildungen. Grob gesprochen, haben Abbildungen den Zweck, Definitions und Wertebereich zu vergleichen. Betrachte die folgenden Definitionen: Sei ϕ : N → M eine Abbildung. (a) ϕ heißt injektiv, wenn es zu jedem m ∈ M h¨ochstens ein n ∈ N mit ϕ(n) = m gibt, d.h. aus ϕ(n) = ϕ(n0 ) folgt n = n0 . (b) ϕ heißt surjektiv, wenn zu jedem m ∈ M mindestens ein n ∈ N mit ϕ(n) = m gibt. (c) ϕ heißt bijektiv, wenn ϕ injektiv und surjektiv ist, d.h. zu jedem m ∈ M existiert genau ein n ∈ N mit ϕ(n) = m. (d) Sei N 0 eine Teilmenge von N . Dann heißt ϕ(N 0 ) := {ϕ(n) | n ∈ N 0 } das Bild von N 0 unter ϕ. Man nennt ϕ(N ) auch einfach das Bild von ϕ. (e) Sei M 0 eine Teilmenge von M . Dann heißt ϕ−1 (M 0 ) := {n ∈ N | ϕ(n) ∈ M 0 } das Urbild von M 0 unter ϕ. Die Interpretation von Abbildungen als Vergleichsmaßstab liefert dann, daß N “kleiner” als M ist, falls es eine injektive Abbildung ϕ : N → M gibt. Dagegen ist N “gr¨oßer” als M , falls es eine surjektive Abbildung ϕ : N → M gibt. Diese Art von Vergleich kann man u ¨ber Abbildungen auch sehr gut quantitativ fassen. Abbildungen mit zueinander passenden Definitions- und Wertebereichen kann man verkn¨ upfen: F¨ ur zwei Abbildungen ϕ : N → M und ψ : M → L definiert man ψ ◦ ϕ : N → L durch ¡ ¢ (ψ ◦ ϕ)(n) = ψ ϕ(n) ∀n ∈ N. Wenn ρ : L → P eine weitere Abbildung ist, dann folgt aus dieser Definition der Verknu ¨ pfung (Hintereinanderausfu ¨ hrung) von Abbildungen sofort (ρ ◦ ψ) ◦ ϕ = ρ ◦ (ψ ◦ ϕ),
496
ANHANG D. HINTERGRUNDMATERIAL ZUR LINEAREN ALGEBRA
d.h. die Verkn¨ upfung von Abbildungen ist eine assoziative Operation. Eine Abbildung ψ : M → N heißt Umkehrabbildung, von ϕ : N → M , wenn ψ ◦ ϕ = idN und ϕ ◦ ψ = idM . Eine Abbildung ϕ : N → M hat h¨ochstens eine Umkehrabbildung: Wenn ψ1 , ψ2 : M → N beides Umkehrabbildungen sind, dann gilt ψ1 = ψ1 ◦ idM = ψ1 ◦ (ϕ ◦ ψ2 ) = (ψ1 ◦ ϕ) ◦ ψ2 = idN ◦ ψ2 = ψ2 . Man bezeichnet die Umkehrabbildung von ϕ (wenn sie existiert - in diesem Fall nennen wir ϕ umkehrbar oder invertierbar) mit ϕ−1 : M → N . Wenn ϕ eine Umkehrabbildung hat, dann ist ϕ bijektiv: Aus ϕ(n) = ϕ(n0 ) folgt n = ϕ−1 ◦ ϕ(n) = ϕ−1 ◦ ϕ(n0 ) = n0 ¡ ¢ und f¨ ur m ∈ M gilt m = ϕ ϕ−1 (m) . Umgekehrt, wenn ϕ : N → M eine bijektive Abbildung ist, dann gibt es eine Umkehrabbildung ϕ−1 : M → N zu ϕ, die durch ϕ(n) 7→ n definiert ist.
Die beiden folgenden Lemmata sind n¨ utzlich, wenn es darum geht, nachzuweisen, daß eine Abbildung ψ : M → N die Umkehrabbildung von ϕ ist: Lemma D.2.12 : Seien ϕ : N → M und ψ : M → N Abbildungen. Wenn ϕ injektiv ist, dann folgt aus ϕ ◦ ψ = idM die Gleichheit ψ ◦ ϕ = idN . Beweis: ¡ ¢ F¨ ur n ∈ N gilt ϕ ψ ◦ ϕ(n) = ϕ(n) also ψ ◦ ϕ(n) = n, weil ϕ injektiv ist.
Lemma D.2.13 : Sei ϕ : N → M eine bijektive Abbildung und ψ : M → N eine weitere Abbildung. Dann sind folgende Aussagen ¨ aquivalent: (1) ϕ ◦ ψ = idM . (2) ψ ◦ ϕ = idN . Beweis: “(1) ⇒ (2)” folgt aus Lemma D.2.12 “(2) ⇒ (1)”: Wegen Lemma D.2.12 gen¨ ugt es zu zeigen, daß ψ injektiv ist. Dazu sei ψ(m) = ψ(m0 ) mit m, m0 ∈ M . Da ϕ surjektiv ist, gibt es n, n0 ∈ N mit ϕ(n) = m und ϕ(n0 ) = m0 . Aber dann gilt n = ψ ◦ ϕ(n) = ψ ◦ ϕ(n0 ) = n0 und somit m = m0 .
F¨ ur A ∈ Mat(m × n, K) und x ∈ Kn f¨ uhren folgende Schreibweise ein: Ax := ϕA (x). Wenn man alle Vektoren (als Spaltenvektoren) ausschreibt, liest sich das wie folgt: a11 · · · a1n x1 a11 x1 + · · · + a1n xn .. .. .. = .. .. . . . . . am1 · · · amn xn am1 x1 + · · · + amn xn
¨ D.2. VEKTORRAUME VON ZAHLENTUPELN
497
Lemma D.2.14 : Sei A ∈ Mat(m × n, K). Dann gilt ϕA (rx + sy) = rϕA (x) + sϕA (y),
∀r, s ∈ K
∀x, y ∈ Kn .
Beweis: Dies folgt sofort aus folgender Rechnung (vgl. Satz D.2.1) ai1 (rx1 + sy1 ) + . . . + ain (rxn + syn ) = r(ai1 x1 + . . . + ain xn ) + s(ai1 y1 + . . . + ain yn )
Eine Abbildung ϕ : Kn 7→ Km heißt K-linear, wenn ∀r, s ∈ K ∀x, y ∈ Kn .
ϕ(rx + sy) = rϕ(x) + sϕ(y)
Die Menge aller K-linearen Abbildungen von Kn → Km wird mit HomK (Kn , Km ) bezeichnet. Wenn aus dem Kontext klar ist, mit welchem K¨orper man arbeitet, spricht man P einfach von linearen Abbildungen. s Mit Induktion sieht man sofort, daß f¨ ur jede Linearkombination j=1 cj vj ∈ Kn mit vj ∈ Kn und n m cj ∈ K sowie jede lineare Abbildung ϕ : K → K gilt ϕ(
s X
cj vj ) =
j=1
s X
cj ϕ(vj ).
j=1
Satz D.2.15 : Jede lineare Abbildung ϕ : Kn 7→ Km ist von der Form ϕA mit A ∈ Mat(m × n, K). Das A ist dabei eindeutig bestimmt, d.h. die Abbildung HomK (Kn , Km ) ϕA
Φ : Mat(m × n, K) → A 7→ ist bijektiv. Beweis: Gegeben sei ϕ ∈ HomK (Kn , Km ). 0 .. . 0 n K 3 ej = 1 0 . ..
Betrachte die Bilder der Standardbasis f¨ ur Kn unter ϕ
ϕ
7→
a1j .. m . := ϕ(ej ) ∈ K . amj
0 F¨ ur die Matrix
gilt dann
a11 .. A= . am1
··· ···
a1n .. . amn
a1j ϕA (ej ) = ... = ϕ(ej ). amj
498
ANHANG D. HINTERGRUNDMATERIAL ZUR LINEAREN ALGEBRA Da jedes x als Linearkombination x = und wegen der Linearit¨at von ϕ ϕA (x) =
n X
Pn
j=1 cj ej
cj ϕA (ej ) =
j=1
der Standardbasis geschrieben werden kann n X
cj ϕ(ej ) = ϕ(x)
j=1
gilt, folgt daraus, daß ϕA (x) = ϕ(x) f¨ ur alle x ∈ Kn . Um die Eindeutigkeit von A mit ϕA = ϕ zu zeigen, nehmen wir an, daß ϕA = ϕA0 . Wenn A = (aij )j=1,...,n und A0 = (a0ij )j=1,...,n , dann ist der i–te Eintrag von ϕA (ej ) gleich aij i=1,...,m
i=1,...,m
und der i–te Eintrag von ϕA0 (ej ) gleich a0ij . Also gilt aij = a0ij f¨ ur alle i ∈ {1, . . . , m} und j ∈ {1, . . . , n}.
Die Verkn¨ upfung ϕB ◦ ϕA : Kn → Kl zweier linearer Abbildungen ϕA
ϕB
Kn −→ Km −→ Kl ist wieder linear: ϕB ◦ ϕA (rx + sy) = = = =
ϕB (ϕA (rx + sy)) ϕB (rϕA (x) + sϕA (y)) rϕB (ϕA (x)) + sϕB (ϕA (y)) rϕB ◦ ϕA (x) + sϕB ◦ ϕA (y).
Daher findet man nach Satz D.2.15 eine eindeutig bestimmte Matrix P ∈ Mat(l×n, K) mit ϕB ◦ϕA = ϕP . Wir bezeichnen dieses P mit BA und nennen es das Matrizenprodukt von B und A. Wenn zus¨atzlich C ∈ Mat(k × l, K), d.h. ϕC ∈ HomK (Kl , Kk ), dann hat man ϕC ◦ (ϕB ◦ ϕA ) = (ϕC ◦ ϕB ) ◦ ϕA , also gilt (CB)A = C(BA), d.h., das Matrizenprodukt ist assoziativ. Wir geben eine explizite Formel f¨ ur das Matrizenprodukt an: Satz D.2.16 : Seien A ∈ Mat(m × n, K), B ∈ Mat(l × m, K). Dann gilt ϕB ◦ ϕA = ϕP
mit
P = BA ∈ Mat(l × n, K),
wobei
pij =
m X k=1
Schema:
“ Zeile × Spalte” l
=
B A m
m n
n Beweis:
BA
l
bik akj
¨ D.2. VEKTORRAUME VON ZAHLENTUPELN
ϕA (ej ) =
499
a1j .. = a 1j . amj |
0 .. + . . . + amj . 0 0 1 {z } | {z } 1 0 .. .
=:f1
=:fm
m
d.h. {f1 , . . . , fm } ist die Standardbasis f¨ ur K . Analog erh¨alt man: b1k ϕB (fk ) = ... = b1k g1 + . . . + blk gl , blk wobei {g1 , . . . , gl } ist die Standardbasis f¨ ur Kl ist. ϕB ◦ ϕA (ej )
= = = =
ϕB (a1j f1 + . . . + amj fm ) a1j ϕB (f1 ) + . . . + amj ϕB (fm ) a1j (b11 g1 + . . . + bl1 gl ) + . . . + amj (b1m g1 + . . . + blm gl ) (a1j b11 + . . . + amj b1m )g1 + . . . + (a1j bl1 + . . . + amj blm )gl m m X X = (b1k akj )g1 + . . . + (blk akj )gl k=1
k=1
d.h. die j–te Spalte von BA ist:
b1k akj k=1 .. . m P blk akj m P
k=1
Damit folgt die Behauptung.
Beispiel D.2.17 : (i) Die Elemente des n-dimensionalen Zahlenraumes (Spaltenvektoren) lassen sich als Matrizen interpretieren: Kn = Mat(n × 1, K). Wenn also A ∈ Mat(m × n, K) und x ∈ Kn , dann gilt F¨ ur das Matrizenprodukt Ax a11 · · · a1n x1 .. .. Ax = ... . . am1 · · · amn xn a11 x1 + · · · + a1n xn .. .. = . . am1 x1 =
+ ···
+
amn xn
ϕA (x),
d.h., die Notation f¨ ur das Matrizenprodukt ist kompatibel mit unserer vorherigen Setzung Ax = ϕA (x) und das lineare Gleichungssystem (LGS) mit erweiterter Koeffizientenmatrix (A, b) l¨aßt sich schreiben: Ax = b. (ii) F¨ ur alle A ∈ Mat(m × n, K) gilt 1m A = A, d.h. 1 0 a11 · · · a1n a11 . . . .. .. = ... .. 0 1 am1 · · · amn am1
··· ···
a1n .. , . amn
500
ANHANG D. HINTERGRUNDMATERIAL ZUR LINEAREN ALGEBRA und A1n = A.
(iii) F¨ ur y ∈ Mat(1× n, K) (= Kn als Zeilenvektoren) und x ∈ Mat(n ×1, K) (= Kn als Spaltenvektoren) gilt x1 yx = (y1 , . . . , yn ) ... = y1 x1 + . . . + yn xn xn (iv)
µ
0 1 0 0
¶µ
0 0 1 0
¶
µ =
1 0
¶
0 0
µ 6=
0 0
0 1
¶
µ =
0 0 1 0
¶µ
0 1 0 0
¶
Beispiel D.2.18 : Die elementaren Zeilenumformungen k¨onnen durch Multiplikationen mit bestimmten Elementarmatrizen von links beschrieben werden. Die entsprechenden elementaren Spaltenumformungen erreicht man durch Multiplikation mit Elementarmatrizen von rechts. (i)
1
|
0 ..
. 1 0 0 0 .. . 1
0 1 .. . 0
...
0
..
.
..
.
1 0 .. .
...
1 0
0 0 1 ..
0
. 1
{z
a11 .. .
···
ap1 .. .
···
aq1 .. .
···
am1
···
}
EI(p,q) ∈Mat(m×m,K)
(ii)
a11 .. . aq1 = ... ap1 . ..
···
am1
···
0 0 1 2 0 1 0 2 1 0 0 7 | {z } EI(1,3) ∈Mat(3×3,R)
··· ···
1 3 8
a1n .. . aqn .. . apn .. . amn
3 7 1 = 2 9 2
8 3 1
9 1 3
a1n .. . apn .. = . aqn .. . amn
¨ D.2. VEKTORRAUME VON ZAHLENTUPELN (iii)
1 ..
a11 ap1 am1
. 1 c 1 ..
. 1
{z
|
EII(p;c)
(iv)
501
··· : ··· : ···
a1n
a1n
capn amn
}
1 ..
. 1 1 . . . 0
. 1
. ..
.
. .
.
1 .
c . . . 1 ..
. 1
{z
1 0 (v) 2 1 0 0
··· : ··· : ···
apn = cap1 amn am1
a11 .. .
···
ap1 .. .
···
aq1 .. .
···
am1
···
0 2 1 0 2 3 1 7 8
a11 .. .
ap1 + caq1 .. = . a q1 .. . am1 3 2 1 3 1 = 6 5 7 9 7 8 9
···
a1n .. . apn .. = . aqn .. . amn
}
EIII(c,q;p) ∈M at(m×m,K)
a11
c6=0
|
a1n .. .
···
apn + caqn .. .
···
aqn .. .
···
amn
Proposition D.2.19 : Seien ϕ ∈ HomK (Kn , Km ) eine lineare Abbildung und U ⊆ Kn , V ⊆ Km lineare Unterr¨ aume. Dann gilt: (i) ϕ(U ) ⊆ Km ist ein linearer Unterraum. (ii) ϕ−1 (V ) = {x ∈ Kn | ϕ(x) ∈ V } ⊆ Kn ist ein linearer Unterraum. (iii) Wenn {v1 , . . . , vk } ⊆ Km linear unabh¨ angig ist und f¨ ur {u1 , . . . , uk } ⊆ Kn gilt ϕ(uj ) = vj , dann ist auch {u1 , . . . , uk } linear unabh¨ angig. Beweis: (i) F¨ ur y = ϕ(x), y 0 = ϕ(x0 ), r, r0 ∈ K und x, x0 ∈ U gilt ry + r0 y 0 = rϕ(x) + r0 ϕ(x0 ) = ϕ(rx + r0 x0 ) ∈ ϕ(U ). | {z } ∈U
502
ANHANG D. HINTERGRUNDMATERIAL ZUR LINEAREN ALGEBRA (ii) F¨ ur x, x0 ∈ ϕ−1 (V ) und r, r0 ∈ K gilt ϕ(rx + r0 x0 ) = rϕ(x) + r0 ϕ(x0 ) ∈ V (iii) Wenn 0 =
Pn
j=1 cj uj ,
dann gilt
n n n X X X 0 = ϕ(0) = ϕ( cj uj ) = cj ϕ(uj ) = cj vj , j=1
j=1
j=1
also c1 = . . . = cn = 0 (vgl. Korollar ßrefunabhtest).
Proposition D.2.20 : Sei ϕ ∈ HomK (Kn , Km ). Dann sind ¨ aquivalent: (1) ϕ ist injektiv. (2) ker(ϕ) := ϕ−1 ({0}) = {0}. (Man nennt ker(ϕ) den Kern von ϕ.) (3) {ϕ(v1 ), . . . , ϕ(vn )} ist linear unabh¨ angig f¨ ur jede Basis {v1 , . . . , vn } von Kn . (4) {ϕ(v1 ), . . . , ϕ(vn )} ist linear unabh¨ angig f¨ ur eine Basis {v1 , . . . , vn } von Kn . Beweis: “(2) ⇒ (1)”: Wenn ϕ(x) = ϕ(x0 ), dann gilt wegen der Linearit¨at ϕ(x − x0 ) = 0 und dann nach (2) auch x − x0 = 0. Also ist ϕ injektiv. “(1) ⇒ (3)”: Aus 0= folgt 0 =
P
X
cj ϕ(vj ) = ϕ(
X
cj vj )
cj vj und damit c1 = . . . = cn = 0.
“(3) ⇒ (4)”: Offensichtlich. “(4) ⇒ (2)”: Sei v ∈ ϕ−1 ({0}) und {v ur Kn P . Dann kann man v we1 , . . . , vn } eine Basis f¨ P n gen Satz D.2.9 in der Form v = c v schreiben. Aus ϕ( j j j=1 P P cj vj ) = 0 folgt dann cj ϕ(vj ) = 0, damit c1 = . . . = cn = 0, und schließlich v = cj vj = 0.
Satz D.2.21 : Sei ϕ ∈ HomK (Kn , Kn ). Dann sind folgende Aussagen ¨ aquivalent: (1) ϕ ist injektiv. (2) ϕ ist surjektiv. (3) ϕ ist bijektiv. (4) ϕ hat eine K-lineare Umkehrabbildung ψ. Beweis:
¨ D.2. VEKTORRAUME VON ZAHLENTUPELN
503
“(1) ⇒ (2)”: Sei {e1 , . . . , en } die Standardbasis f¨ ur Kn . Nach Proposition D.2.20 ist die Menge {ϕ(e1 ), . . . , ϕ(en )} linear unabh¨angig. Wegen dimK (Kn ) = n ist also {ϕ(e1 ), . . . , ϕ(en )} eine Basis f¨ ur Kn . Wenn jetzt x ∈ Kn beliebig ist, k¨onnen wir schreiben x=
n X
n X dj ϕ(ej ) = ϕ( dj ej )
j=1
j=1
und sehen die Surjektivit¨at von ϕ. “(2) ⇒ (1)”: Wegen der Surjektivit¨at gibt es vj ∈ Kn mit ϕ(vj ) = ej . Nach Proposition D.2.19 ist {v1 , . . . , vn } ⊆ Kn linear unabh¨angig, also eine Basis f¨ ur Kn . Damit folgt die Behauptung aus Proposition D.2.20. ¨ Damit haben wir die Aquivalenz der ersten drei Aussagen. “(3) ⇒ (4)”: Wir wissen, daß ϕ eine eindeutig bestimmte Umkehrabbildung ψ hat. Zu zeigen ist nur noch, daß ψ auch linear ist. Dazu:
ψ(ry1 + sy2 ) = =
ψ(rϕ(ψ(y1 )) + sϕ(ψ(y2 ))) ψ ◦ ϕ(rψ(y1 ) + sψ(y2 )) | {z } id
=
rψ(y1 ) + sψ(y2 )
“(4) ⇒ (3)”: Klar.
Satz D.2.22 : Sei A ∈ Mat(n × n, K). Dann sind folgende Aussagen ¨ aquivalent: (1) ϕA ist bijektiv. (2) Es gibt ein B ∈ Mat(n × n, K) mit BA = 1n . (3) Es gibt ein B ∈ Mat(n × n, K) mit AB = 1n . (4) Es gibt ein B ∈ Mat(n × n, K) mit BA = AB = 1n . 1 .. (5) A hat eine Zeilenstufenform mit n Stufen: .
∗
1 (6) Jede Zeilenstufenform von A hat n Stufen. Beweis: Schreibe ψ f¨ ur ϕA und setze B = Aψ−1 (vgl. Satz D.2.15). Dann gilt ϕB = ϕ(Aψ−1 ) = ψ −1 . “(1) ⇒ (2)”: Wegen ϕ1n = idKn = ϕB ◦ ϕA = ϕBA . zeigt Satz D.2.15, daß BA = 1n . “(2) ⇒ (1)”: Beachte, daß idKn = ϕ1n = ϕBA = ϕB ◦ ϕA . Wenn ϕA (x) = ϕA (y), dann gilt x = ϕB (ϕA (x)) = ϕB (ϕA (y)) = y. Also ist ϕA injektiv, mit Satz D.2.21 daher sogar bijektiv.
504
ANHANG D. HINTERGRUNDMATERIAL ZUR LINEAREN ALGEBRA “(1) ⇒ (3)”: Analog zum Schritt “(1) ⇒ (2)” folgt die Identit¨at AB = 1n aus idKn = ψ ◦ ψ −1 = ϕA ◦ ϕB . “(3) ⇒ (1)”: Beachte, daß idKn = ϕA ◦ ϕB die Surjektivit¨at von ϕA impliziert, also mit Satz D.2.21 auch die Injektivit¨at. “(1) ⇔ (4)”: Dies folgt jetzt sofort aus den bisherigen Beweisschritten. “(5) ⇔ (6)”: Da die Anzahl der Stufen einer Zeilenstufenform durch die Dimension des L¨osungsraums der Gleichung Ax = 0 bestimmt wird, ist sie f¨ ur jede Zeilenstufenform gleich. “(1) ⇔ (6)”: ϕA ist genau dann bijektiv, wenn die Gleichung Ax = b f¨ ur jedes b ∈ Kn eindeutig l¨osbar ist. Die analoge Aussage gilt f¨ ur jede Zeilenstufenform Z von A. Also ist ϕA bijektiv genau dann, wenn ϕZ bijektiv ist. Da die Gleichung Zx = b genau dann f¨ ur jede rechte Seite l¨osbar ist, wenn sie n Stufen enth¨alt, folgt die Behauptung.
Bemerkung D.2.23 : In der Situation von Satz D.2.22(4) nennt man die Matrix A invertierbar. Beachte, daß die Matrix B in Satz D.2.22(2-4) eindeutig bestimmt ist. Wenn zum Beispiel B1 , B2 ∈ Mat(n × n, K) die Identit¨aten AB1 = AB2 = B1 A = B2 A = 1n erf¨ ullen, dann gilt B1 = B1 1n = B1 (AB2 ) = (B1 A)B2 = B2 . Die anderen F¨alle zeigt man ganz analog. Insbesondere ist das B in allen drei F¨allen das Gleiche. Die so bestimmte Matrix B heißt dann die inverse Matrix von A und man schreibt A−1 daf¨ ur. Der Satz D.2.22 zeigt insbesondere noch einmal, daß f¨ ur A, B ∈ Mat(n×n, K) die Gleichungen AB = 1 und BA = 1 ¨aquivalent sind. Es muß also nur eine von beiden nachgewiesen werden, um zu zeigen, daß die Matrizen A und B zueinander invers sind. Beispiel D.2.24 : (vgl. Beispiel D.2.18) −1 (i) EI(p,q) = EI(p,q) . −1 (ii) EII(p;c) = EII(p;c−1 ) . −1 (iii) EIII(c;q,p) = EIII(−c;q,p) .
Bemerkung D.2.25 : Zur Berechnung der inversen Matrix A−1 von A ∈ Mat(n × n, R) kann man die Gleichung AX = 1 als Familie von linearen Gleichungssystemen lesen, indem man jede Spalte von X als Variablensatz und jede Spalte von 1 als rechte Seite auffaßt. Dann l¨ost man diese Gleichungen simultan, indem man die Matrix (A, 1) auf Zeilenstufenform bringt und diese anschließend durch weitere elementare Zeilenumformungen auf die Gestalt (1, B) umformt. Wenn die elementaren Zeilenumformungen durch die Matrizen E1 , . . . , Er beschrieben werden, haben wir: (Er · · · E1 A, Er · · · E1 ) = Er · · · E1 (A, 1) = (1, B). Dies zeigt A−1 = Er . . . E1 = B. Beispiel D.2.26 :
3 0 3
1 3 0
1 1 3
1 0 0
0 1 0
0 1 1/3 0 ; 0 3 0 −1 1
1/3 1/3 0 0 0 1 0 1 2 −1 0 1
¨ D.2. VEKTORRAUME VON ZAHLENTUPELN
1 1/3 1/3 1/3 0 0 1 1 1/3 0 1/3 0 ; 0 ; 0 0 0 7/3 −1 1/3 1 0 1 1/3 0 10/21 1/21 −1/7 1 0 1/7 6/21 −1/7 ; ; 0 0 0 1 −3/7 1/7 3/7
505 1/3 1/3 1/3 0 0 1 1/3 0 1/3 0 0 1 −3/7 1/7 3/7 1 0 0 0 1 0 0 0 1
3/7 −2/21 1/7 6/21 −3/7 1/7
−2/21 −1/7 3/7
F¨ ur nicht-quadratische Matrizen muß man die Injektivit¨at und Surjektivit¨at der zugeh¨origen linearen Abbildungen separat charakterisieren. Sei a11 · · · a1n .. ∈ Mat(m × n, K) A = ... . Die Matrix
am1
···
a11 .. t A := . a1n
···
···
amn am1 .. ∈ Mat(n × m, K) . amn
heißt die transponierte Matrix von A. Die aus den Zeilen von A gewonnenen Vektoren aZeile := (ai1 , . . . , ain ), i
i = 1, . . . , m
heißen die Zeilenvektoren von A und die aus den Spalten von A gewonnenen Vektoren a1j aSpalte := ... , j = 1, . . . , n j amj heißen die Spaltenvektoren von A. Man nennt dim(span{aZeile | i = 1, . . . , m}) den Zeilenrang von i Spalte A und dim(span{aj | j = 1, . . . , n}) den Spaltenrang von A. Bemerkung D.2.27 : (i) (AB)t = B t At . (ii) Zeilenrang(A) = Spaltenrang(At ). (iii) Der Zeilenrang ¨andert sich bei elementaren Zeilenumformungen nicht: Typ I: klar Typ II: klar Typ III: span(a1 , . . . , an ) = span(a1 , . . . , ai−1 , ai + cak , ai+1 , . . . , an ) (iv) Der Zeilenrang einer Matrix in Zeilenstufenform ist gleich der Anzahl der Stufen (siehe Beispiel D.2.7). (v) Der Spaltenrang a¨ndert sich bei elementaren Zeilenumformungen auch nicht: Weil elementare Zeilenumformungen durch ebensolche wieder r¨ uckg¨angig gemacht werden k¨onnen, reicht es zu zeigen, daß der Spaltenrang bei solchen Umformungen nicht gr¨ oßer wird. Seien jetzt v1 , . . . , vn die Spaltenvektoren von A und E eine Elementarmatrix. Dann gilt EA = E(v1 , . . . , vn ) = (Ev1 , . . . , Evn ),
506
ANHANG D. HINTERGRUNDMATERIAL ZUR LINEAREN ALGEBRA d.h., die Evj sind die Spaltenvektoren von EA, und span( Ev1 , . . . , Evn ) = |{z} |{z} ϕE (v1 )
ϕE (span(v1 , . . . , vn ))
ϕE (vn )
Nach Satz D.2.10 gibt es Evi1 , . . . , Evik , die zusammen eine Basis f¨ ur span(Ev1 , . . . , Evn ) bilden. Nach Proposition D.2.19(iii) ist {vi1 , . . . , vik } linear unabh¨angig. Also gilt dim span(Ev1 , . . . , Evn ) = k ≤ dim span(v1 , . . . , vn ).
D.3
Determinanten
Eine Permutationsmatrix ist eine Matrix p11 · · · .. P = . pn1 Pn
···
p1n .. ∈ Mat(n × n, K) . pnn
Pn
mit pij ∈ {0, 1} und j=1 pij = 1 = i=1 pij , d.h., in jeder Zeile und in jeder Spalte steht genau eine Eins und sonst lauter Nullen. Die Menge der Permutationsmatrizen in Mat(n × n, K) wird mit PMn bezeichnet. Proposition D.3.1 : M und N seien endliche Mengen mit gleich vielen Elementen. Sei ϕ : M → N eine Abbildung. Dann sind folgende Aussagen ¨ aquivalent: (1) ϕ ist injektiv. (2) ϕ ist surjektiv. (3) ϕ ist bijektiv. Beweis: Sei k die Anzahl der Elemente in M (und N ). “(1) ⇒ (2)”: Wenn M = {m1 , . . . , mk } und L := {ϕ(m1 ), . . . , ϕ(mk )} ⊆ N , dann sind wegen (1) alle Elemente von L verschieden, d.h. diese Menge hat k Elemente und ist daher gleich N . “(2) ⇒ (1)”: Wenn ϕ nicht injektiv ist, gibt es m 6= m0 in M mit ϕ(m) = ϕ(m0 ), also hat ϕ(M ) h¨ochstens k − 1 Elemente. Dann kann ϕ aber nicht surjektiv sein. ¨ Mit diesen beiden Beweisschritten folgt dann auch die Aquivalenz von (1) und (2) mit (3).
Die Proposition D.3.1 zeigt, daß die Abbildung ϕP |{e1 ,...en } : {e1 , . . . en } → {e1 , . . . en } f¨ ur jedes vorgegebene P ∈ PMn bijektiv ist, weil sie die Einschr¨ankung einer injektiven Abbildung, also selbst injektiv ist. Also erh¨alt man zu jeder Permutationsmatrix P ∈ PMn eine bijektive Abbildung σP : {1, . . . , n} → {1, . . . , n}
D.3. DETERMINANTEN
507
durch eσP (j) = ϕP (ej ), d.h. σP (j) = k wenn ϕP (ej ) = ek . Allgemein heißt eine bijektive Abbildung σ : {1, . . . , n} → {1, . . . , n} eine Permutation von {1, . . . , n}. Die Menge aller Permutationen von {1, . . . , n} wird mit Sn bezeichnet (S f¨ ur symmetrische Gruppe, siehe Bemerkung D.3.2). Wir ben¨ utzen die folgende Schreibweise f¨ ur σ : {1, . . . , n} → {1, . . . , n}: µ ¶ 1 ··· n . σ(1) · · · σ(n)
Bemerkung D.3.2 : Eine Menge G zusammen mit einer Verkn¨ upfung ∗ : G × G → G heißt eine Gruppe, wenn folgende Bedingungen erf¨ ullt sind: (a) a ∗ (b ∗ c) = (a ∗ b) ∗ c ∀a, b, c ∈ G (Assoziativgesetz). (b) ∃e ∈ G mit e ∗ a = a ∀a ∈ G (Neutrales Element oder Einselement). (c) ∀a ∈ G existiert b ∈ G mit b ∗ a = e (inverses Element von a). Aus diesen Axiomen lassen sich sofort einige Folgerungen ziehen: (i) Wenn a ∗ b = e f¨ ur a, b ∈ G, dann gilt auch b ∗ a = e. Um das zu sehen, beachte zun¨achst, daß (b ∗ a) ∗ (b ∗ a) = b ∗ (a ∗ b) ∗ a = b ∗ e ∗ a = b ∗ a gilt. Außerdem gibt es ein c ∈ G mit c ∗ (b ∗ a) = e. Damit rechnet man e = c ∗ (b ∗ a) = c ∗ (b ∗ a) ∗ (b ∗ a) = e ∗ (b ∗ a) = b ∗ a. (ii) a ∗ e = a f¨ ur alle a ∈ G: Es gibt ein b ∈ G mit b ∗ a = e und mit (i) rechnet man a ∗ e = a ∗ (b ∗ a) = (a ∗ b) ∗ a = e ∗ a = a. (iii) e ist eindeutig bestimmt: e0 = e ∗ e0 = e. (iv) Das Inverse b zu a ist eindeutig bestimmt: b = b ∗ e = b ∗ (a ∗ b0 ) = (b ∗ a) ∗ b0 = e ∗ b0 = b0 . In vielen B¨ uchern wird e ∗ a = a ∗ e und b ∗ a = e = a ∗ b gleich mit in die Definition einer Gruppe geschrieben. Sei σ ∈ Sn . Ein Paar (i, j) ∈ {1, . . . , n} × {1, . . . , n} heißt ein Fehlstand von σ, wenn gilt: i<j
und σ(i) > σ(j)
Sei fσ die Anzahl der Fehlst¨ande von σ. (D.h., fσ ist die Anzahl Kreuzungen in der graphischen Darstellung von σ, oder auch die Anzahl der Paare von Einsen in Pσ , f¨ ur die die obere Eins rechts von der unteren Eins steht). 1
1 2 3 4 5 6 1
1 1 1 1
508
ANHANG D. HINTERGRUNDMATERIAL ZUR LINEAREN ALGEBRA
Dann heißt
½ fσ
sign(σ) := (−1)
=
1 −1
fσ gerade fσ ungerade
das Signum von σ. Die sign-Funktion f¨ ur Permutationen ist ein wichtiger Baustein in der Definition der Determinante einer quadratischen Matrix A = (aij ) ∈ Mat(n × n, K): Die Determinante von A ist definiert durch X det(A) := sign(σ)a1σ(1) · a2σ(2) · . . . · anσ(n) . σ∈Sn Satz D.3.3 : Sei A ∈ Mat(n × n, K) (i) Vertauscht man in A zwei Zeilen, so ¨ andert sich nur das Vorzeichen der Determinante. (ii) Multipliziert man eine Zeile mit einer Zahl t ∈ K, so multipliziert sich die Determinante auch mit t. (iii) Addiert man das Vielfache einer Zeile zu einer anderen Zeile, so ¨ andert sich die Determinante nicht. (iv) det(1n ) = 1. Beweis: (i)
ak1 A= al1
.. . ··· .. . ··· .. .
akn , aln
al1 A0 = ak1
.. . ··· .. . ··· .. .
aln akn
In der folgenden Rechnung ben¨ utzt man zweimal, daß die Abbildung Sn → Sn , σ 7→ σ ◦ σk,l bijektiv ist.
= = = = =
det(A) X sign(σ)a1σ(1) · . . . · akσ(k) · . . . · alσ(l) · . . . · anσ(n) σ∈Sn X sign(σσk,l )a1(σ◦σk,l )(1) · . . . · ak(σ◦σk,l )(k) · . . . · al(σ◦σk,l )(l) · . . . · an(σ◦σk,l )(n) σ◦σk,l ∈Sn X − sign(σ)a1σ(1) · . . . · akσ(l) · . . . · alσ(k) · . . . · anσ(n) σ◦σk,l ∈Sn X sign(σ)a1σ(1) · . . . · alσ(k) · . . . · akσ(l) · . . . · anσ(n) − σ◦σk,l ∈Sn − det(A0 )
(ii), (iii) Setze ak1 0 A = tal1 + sak1
.. . ··· .. . ··· .. .
akn taln + sakn
,
ak1 00 A = ak1
.. . ··· .. . ··· .. .
akn akn
D.3. DETERMINANTEN
509
Dann gilt det(A0 )
=
X
sign(σ)a1σ(1) · . . . · (talσ(l) + sakσ(l) ) · . . . · anσ(n)
σ∈Sn
= t
X
sign(σ)a1σ(1) · . . . · alσ(l) · . . . · anσ(n)
σ∈Sn
+ s
X
sign(σ)a1σ(1) · . . . · akσ(k) · . . . · akσ(l) · . . . · anσ(n)
σ∈Sn
= t det(A) + s det(A00 ). Es gen¨ ugt daher zu zeigen, daß det(A00 ) = 0 ist. Beachte, daß man durch Vertauschen der k-ten und der l-ten Zeilen A00 nicht ¨andert, also det(A00 ) = − det(A00 ) gilt. Wenn 2 6= 0 in K, dann folgt det(A00 ) = 0. Wenn dagegen 2 = 0, dann ist sign konstant gleich Eins und man findet jeden Summanden in det(A00 ) zweimal. Also folgt auch hier det(A00 ) = 0. (iv) det(1n ) = = =
X
sign(σ)δ1σ(1) · . . . · δnσ(n)
σ∈Sn sign(id)1 1
Satz D.3.4 : Die Eigenschaften (i)—(iv) aus Satz D.3.3 legen die Determinante fest. Beweis: Sei f : Mat(n × n, K) → K mit (i)–(iv) aus Satz D.3.3. Dann ist zu zeigen, daß f (A) = det(A) f¨ ur alle A ∈ Mat(n × n, K). Nach Satz D.3.3 und den Voraussetzungen an f gen¨ ugt es zu zeigen, daß f (A) = det(A) f¨ ur A in Zeilenstufenform gilt. 1. Fall: A nicht invertierbar. Dann gibt es eine Nullzeile und (ii) zeigt, daß det(A) = 0 = f (A). 2. Fall: A invertierbar. Dann ist A nach Satz D.2.22 von der Form 1 ∗ .. A= . 0 1 und l¨aßt sich durch Umformungen vom Typ III auf die Form 1 0 .. . 0
1
bringen. Also gilt det(A) = det(1n ) = 1 und f (A) = f (1n ) = 1.
510
ANHANG D. HINTERGRUNDMATERIAL ZUR LINEAREN ALGEBRA
Satz D.3.5 : Seien A, B ∈ Mat(n × n, K) (i) det(A) = 0
⇔
Rang(A) < n
⇔
A ist nicht invertierbar.
(ii) det(AB) = det(A) det(B) (iii) det(At ) = det(A) ¡ ¢−1 (iv) det(A−1 ) = det(A) . Beweis: ¨ (i) Die Aquivalenz Rang(A) < n
⇔
A ist nicht invertierbar
folgt aus Satz D.2.22. ¨ Um auch die erste Aquivalenz zu zeigen, stellen wir fest, daß det(A) mit einer von Null verschiedenen Zahl multipliziert wird, wenn A durch eine elementare Zeilenumformung ver¨andert wird. Also gilt det(A) = 0 genau dann, wenn jede Zeilenstufenform A0 Determinante Null hat. Aber auch der Rang einer Matriz ¨andert sich nach Bemerkung D.2.27 bei elementaren Zeilenumformungen nicht. Damit k¨onnen wir o.B.d.A. annehmen, daß A in Zeilenstufenform ist. Aber dann zeigt der Beweis von Satz D.3.4, daß det(A) = 0, wenn A nicht invertierbar ist und det(A) = 1, wenn A invertierbar ist. Damit folgt die Behauptung. (ii) 1. Fall: A = EI(p,q) . Dann ensteht AB durch Umformung vom Typ I aus B, d.h. det(AB) = − det(B) = det(A) det(B). 2. Fall: A = EII(c;p) . Dann ensteht AB durch Umformung vom Typ II(c; p) aus B, d.h., det(AB) = c det(B) = det(A) det(B). 3. Fall: A = EIII(c;p,q)
analog
4. Fall: Rang (A) = n. In diesem Fall ist A invertierbar, also gibt es nach Bemerkung D.2.25 Elementarmatrizen E1 , . . . , Er mit Er · · · E1 A = 1n . Also gilt A = E1−1 · · · Es−1 (Wir sehen insbesondere: Jede invertierbare (n × n)–Matrix ist ein Produkt von Elementarmatrizen.) Da die Inverse einer Elementarmatrix nach Beispiel D.2.24 wieder eine Elementarmatrix ist, erlauben die ersten drei F¨alle folgende Rechnung det(AB) = det(E1−1 · · · Es−1 B) = det(E1−1 ) det(E2−1 · · · Es−1 B) =
det(E1−1 ) det(E2−1 ) · · · det(Es−1 ) det(B) {z } | det(A)
=
det(A) det(B)
5. Fall: A nicht invertierbar. W¨are jetzt AB invertierbar, so h¨atte man A(B(AB)−1 ) = (AB)(AB)−1 = 1n und mit Bemerkung D.2.23 die Invertierbarkeit von A. Also ist AB nicht invertierbar und wir haben det(AB) = 0 = det(A), also auch det(AB) = det(A) det(B) = 0.
¨ D.4. VEKTORRAUME
511
(iii) Beachte: sign(σ) = sign(σ −1 ) det(At )
X
=
sign(σ)aσ(1),1 · · · aσ(n),n
σ∈Sn
(Umordnen der Faktoren)
X
=
sign(σ)a1,σ−1 (1) · · · an,σ−1 (n)
σ∈Sn
(setze τ = σ −1 )
X
=
τ −1 ∈Sn
(beachte, daß
Sn τ
−→ Sn 7−→ τ −1
= sign(τ −1 ) a1,τ (1) · · · an,τ (n) | {z } sign(τ )
bijektiv ist.) X
=
sign(τ )a1,τ (1) · · · an,τ (n)
τ ∈Sn
= det(A) (iv) Folgt sofort aus (ii) und det(1n ) = 1.
Wir sehen also, daß man u ¨berall, wo in diesem Abschnitt mit Zeilenvektoren gearbeitet wurde, auch mit Spaltenvektoren arbeiten kann, indem man A durch At ersetzt.
D.4
Vektorr¨ aume
Sei K ein K¨orper. Ein K–Vektorraum ist eine Menge V zusammen mit zwei Abbildungen K×V (c, v)
→ V 7 → c·v
und
V ×V (v, w)
→ 7 →
V v + w,
f¨ ur die folgende Gesetze gelten: (u + v) + w = v+w = ∃0 ∈ zu v ∈ V ∃w ∈
u + (v + w) ∀u, v, w ∈ V (Assoziativgesetz). w + v ∀v, w ∈ V (Kommutativgesetz). V mit 0 + v = v ∀v ∈ V (Null). V mit v + w = 0 (Inverses Element oder Negatives von v).
(cd) · v = c · (d · v) ∀v ∈ V, c, d ∈ K (Assoziativgesetz). c · (v + w) = c · v + c · w ∀v, w ∈ V, c ∈ K (1. Distributivgesetz). (c + d) · v 1·v
= =
c·v+d·v v ∀v ∈ V
∀v ∈ V, c, d ∈ K
(2. Distributivgesetz).
Sei (V, +, ·) ein K–Vektorraum. Eine nichtleere Teilmenge U ⊆ V heißt Untervektorraum (oder auch ein linearer Unterraum), wenn: (1) u + v ∈ U f¨ ur alle u, v ∈ U . (2) c · u ∈ U f¨ ur alle c ∈ K, u ∈ U .
512
ANHANG D. HINTERGRUNDMATERIAL ZUR LINEAREN ALGEBRA
Seien (V, +, ·) und (W, ⊕, ¯) zwei K–Vektorr¨aume. Eine Abbildung ϕ : V → W heißt K–Vektorraum– Homomorphismus oder auch K–linear, wenn gilt: ϕ(c1 v1 + c2 v2 ) = c1 ¯ ϕ(v1 ) ⊕ c2 ¯ ϕ(v2 )
∀c1 , c2 ∈ K, v1 , v2 ∈ V.
Die Menge aller K–Vektorraum–Homomorphismen von V nach W wird mit HomK (V, W ) bezeichnet. Wenn V = W , schreiben wir auch EndK (V ) f¨ ur HomK (V, V ) und nennen die Elemente dieser Menge Endomorphismen von V . Ein K–Vektorraum–Homomorphismus ϕ heißt K–Vektorraum–Isomorphismus, wenn ϕ bijektiv ist. In der Regel werden wir den Punkt in der skalaren Multiplikation einfach weglassen. Proposition D.4.1 : Seien V und W zwei K–Vektorr¨ aume. Dann ist HomK (V, W ) ein Untervektorraum des K–Vektorraumes aller Abbildungen von V nach W . Beweis: Seien ϕ, ψ ∈ HomK (V, W ) und r, s ∈ K. Dann rechnet man f¨ ur c1 , c2 ∈ K und v1 , v2 ∈ V : (rϕ + sψ)(c1 v1 + c2 v2 )
= rϕ(c1 v1 + c2 v2 ) + sψ(c1 v1 + c2 v2 ) = = =
rc1 ϕ(v1 ) + rc2 ϕ(v2 ) + sc1 ψ(v1 ) + sc2 ψ(v2 ) c1 (rϕ(v1 ) + sψ(v1 )) + c2 (rϕ(v2 ) + sψ(v2 )) c1 (rϕ + sψ)(v1 ) + c2 (rϕ + sψ)(v2 ).
Die folgende Proposition ist eine Verallgemeinerung der ersten beiden Teile von Proposition D.2.19 und wird auch genauso bewiesen wie D.2.19(i) und D.2.19(ii). Proposition D.4.2 : Sei ϕ ∈ HomK (V, W ) eine K-lineare Abbildung und E ⊆ V, F ⊆ W lineare Unterr¨ aume. Dann gilt: (i) ϕ(E) ⊆ W ist ein linearer Unterraum. (ii) ϕ−1 (F ) = {x ∈ V | ϕ(v) ∈ F } ⊆ V ist ein linearer Unterraum. Zwei Spezialf¨alle von Proposition D.4.2 spielen eine besondere Rolle und erhalten eigene Namen. Sei ϕ : V → W ein K–Vektorraum–Homomorphismus. Dann heißt ϕ(V ) das Bild von ϕ und ϕ−1 ({0}) der Kern von ϕ. Die beiden R¨aume werden mit im (ϕ) und ker (ϕ) bezeichnet. Proposition D.4.3 : Sei ϕ : V → W ein K–Vektorraum–Homomorphismus. Dann gilt (i) ϕ ist surjektiv genau dann, wenn im (ϕ) = W . (ii) ϕ ist injektiv genau dann, wenn ker (ϕ) = {0} (vgl. Proposition D.2.20). Beweis: Der erste Teil folgt sofort aus der Definition. Wenn ϕ injektiv ist, hat die Null in W nur ein Urbild, also besteht der Kern von ϕ nur aus der Null in V . Umgekehrt sei ker (ϕ) = {0} und ϕ(v) = ϕ(v 0 ). Dann gilt ϕ(v − v 0 ) = ϕ(v) − ϕ(v 0 ) = 0 und somit v = v 0 . Dies zeigt, daß ϕ injektiv ist.
¨ D.4. VEKTORRAUME
513
Die Existenz von Addition Pm und skalarer Multiplikation erlaubt es, auf beliebigen K-Vektorr¨aumen Linearkombinationen j=1 cj vj zu bilden. Dies erm¨oglicht die Verallgemeinerung der Begriffe linearer Spann, Lineare Abh¨angigkeit und Basis auf allgemeine K–Vektorr¨aume. Sei (V, +, ·) ein K–Vektorraum und A ⊆ V eine Teilmenge. Dann heißt m X
span(A) = {
cj aj | m ∈ N, aj ∈ A, cj ∈ K}
j=1
der lineare Spann (oder die lineare Hu angig , wenn es eine echte ¨ lle) von A. Weiter heißt A linear abh¨ Teilmenge A0 & A mit span(A0 ) = span(A) gibt. Andernfalls heißt A linear unabh¨ angig. Schließlich ist A eine Basis f¨ ur V , wenn A linear unabh¨ angig ist und V aufspannt (d.h span(A) = V ). Der folgende Satz kann w¨ortlich wie Satz D.2.3 bewiesen werden: Satz D.4.4 : (Test auf lineare Unabh¨angigkeit) Sei V ein K-Vektorraum und A ⊆ V . Dann sind folgende Aussagen ¨ aquivalent: (1) A ist linear unabh¨ angig. (2) F¨ ur v1 , . . . , vk ∈ A verschieden und c1 , . . . , ck ∈ K mit
k P j=1
cj vj = 0 folgt, daß c1 = . . . = ck = 0.
Mit Satz D.4.4 erh¨alt man auch eine Verallgemeinerung von Satz D.2.9: Satz D.4.5 : Sei V ein K–Vektorraum und B ⊆ V . Dann sind folgende Aussagen ¨ aquivalent: (1) B ist eine Basis f¨ ur V . (2) Jedes v ∈ V l¨ aßt sich in eindeutiger Weise als Linearkombination von Elementen aus B schreiben. Beweis: Sei v ∈ V . Die Existenz der Linearkombination ist ¨aquivalent zu span(B) = V . Wegen Satz D.4.4 ist die Eindeutigkeit der Linearkombination ¨aquivalent zur linearen Unabh¨angigkeit von B.
Beispiel D.4.6 : Sei Eij ∈ Mat(m × n, K) die Matrix, die als Eintr¨age nur Nullen hat, außer an der Stelle ij, wo sie eine Eins hat. Dann ist {Eij | i = 1, . . . m; j = 1, . . . n} eine Basis f¨ ur Mat(m × n, K), weil jede Matrix sich in eindeutiger Weise als Linearkombination der Eij schreiben l¨aßt. Die Koeffizienten sind dabei gerade die Eintr¨age der Matrix.
Lemma D.4.7 : Sei ϕ : V → W ein K–Vektorraum–Isomorphismus und A ⊆ V . Dann gilt: (i) span(ϕ(A)) = ϕ(span(A)). (ii) A ist linear (un)abh¨ angig genau dann, wenn ϕ(A) ⊆ W linear (un)abh¨ angig ist. (iii) A ist eine Basis f¨ ur V genau dann, wenn ϕ(A) eine Basis f¨ ur W ist. Beweis: Idee: Elementare Verifikationen.
514
ANHANG D. HINTERGRUNDMATERIAL ZUR LINEAREN ALGEBRA (i) ϕ(span(A)) =
m X
ϕ {
cj aj | m ∈ N, aj ∈ A, cj ∈ K}
j=1
= =
m X
cj ϕ(aj ) | m ∈ N, aj ∈ A, cj ∈ K
j=1
span(ϕ(A))
(ii) Wegen der Bijektivit¨at von ϕ ist A0 & A ¨aquivalent zu ϕ(A0 ) & ϕ(A). Mit dem ersten Teil sind dann auch span(A0 ) = span(A) und span(ϕ(A0 )) = span(ϕ(A)) ¨aquivalent und die Behauptung folgt. (iii) Dieser Teil ist eine unmittelbare Konsequenz der beiden ersten Teile.
Proposition D.4.8 : L (i) Die Abbildung ϕ : j∈M Vj → V ist immer ein K-Vektorraum-Homomorphismus. Die Betonung in der Definition liegt also auf “injektiv”. ´ ³S (ii) Die Injektivit¨ at ist ¨ aquivalent zu folgender Bedingung: Jede Menge von Vektoren in j∈M Vj \{0}, die aus jedem Vj h¨ ochstens ein Element enth¨ alt, ist linear unabh¨ angig. (iii) V ist genau dann die innere direkte Summe der Vj , j ∈ M , wenn jedes v ∈ V in eindeutiger Weise als Summe von Elementen aus den Vj geschrieben werden kann. Beweis: (i) Ist durch einfaches Nachrechnen zu zeigen. (ii) Wir ur vj ∈ Vj \{0} und eine Linearkombination P nehmen zun¨achst an, daß ϕ injektiv ist. F¨ cj vj = 0 mit vj ∈ Vj \ {0} folgt dann aus ϕ((cj vj )j∈M ) = 0 sofort cj vj = 0 f¨ ur alle j ∈ M . Damit gilt aber wegen vj 6= 0 schon cj = 0. Also sind die vj linear unabh¨angig. ³S ´ Umgekehrt, wenn jede Menge von Vektoren in j∈M Vj \ {0}, die aus jedem Vj h¨ochstens ein Element enth¨ alt, linear unabh¨angig ist, gilt f¨ ur (vj )j∈M ∈ ker (ϕ) wegen P ur alle j ∈ M . der Relation ϕ((vj )j∈M ) = j∈M 1 · vj = 0 schon vj = 0 f¨ (iii) Sei V die direkte innere Summe der Vj . DannPist ϕ ein Isomorphismus. Wegen der Surjektivit¨atPl¨aßt sich jedes v ∈ VP als Summe j∈M vj mit vj ∈ Vj schreiben. Wenn P 0 0 0 j∈M vj = j∈M vj , dann folgt j∈M (vj − vj ) = 0, d.h. (vj − vj )j∈M ∈ ker ϕ = {0}, was die Eindeutigkeit der Summendarstellung zeigt. Umgekehrt folgt dann genauso aus der Existenz der Summendarstellung die Surjektivit¨at von ϕ und aus der Eindeutigkeit der Summendarstellung die Injektivit¨at von ϕ.
Die Vektorraum-Axiome erfassen alle bisher ben¨ utzten Eigenschaften der n-dimensionalen Zahlenr¨aume bis auf eine: Die Existenz einer Basis der L¨ange n. Der folgende Satz zeigt, daß man durch Hinzunahme dieser Eigenschaft den Kn im wesentlichen charakterisiert hat.
¨ D.4. VEKTORRAUME
515
Satz D.4.9 : Sei V ein K–Vektorraum. Dann sind folgende Aussagen ¨ aquivalent: (1) V hat eine Basis mit n Elementen. (2) Jede Basis f¨ ur V hat n Elemente. (3) V ist isomorph zu Kn , d.h. es gibt einen K–Vektorraum–Isomorphismus ϕ : V → Kn . Beweis: Idee: Zeige mit dem Argument aus dem Beweis von D.2.11, daß zwei Basen, von denen eine endlich ist, nicht unterschiedliche L¨ ange haben k¨ onnen. Dann definiere mithilfe einer Basis eine lineare Abbildung V → Kn , die einem Vektor die Koeffizienten bzgl. der Basis zuordnet.
“(1) ⇒ (2)”: Sei {v1 , . . . , vn } eine Basis und {w1 , . . . } eine weitere Basis. W¨ortlich wie im Beweis von D.2.11 sieht man, daß {w1 , . . . } nicht mehr als n Elemente hat. Insbesondere ist die zweite Basis endlich: {w1 , . . . , wm } mit m ≤ n. Jetzt vertauscht man die Rollen der Basen: n ≤ m, also n = m. “(2) ⇒ (3)”: Sei {v1 , . . . , vn } eine Basis f¨ ur V . Wegen Satz D.4.5 kann man durch n n X X ϕ( cj vj ) := (c1 , . . . , cn ) = cj ej ∈ Kn j=1
j=1
eine Abbildung ϕ : V → Kn definieren. Diese Abbildung ist bijektiv mit Umkehrabbildung ψ : Kn → V Pn (c1 , . . . , cn ) 7→ j=1 cj vj . Pn Pn Bleibt zu zeigen, daß ϕ linear ist: F¨ ur v = j=1 cj vj und w = j=1 dj vj rechnet man ϕ(rv + sw)
n X = ϕ( (rcj + sdj )vj ) j=1
= = =
(rc1 + sd1 , . . . , rcn + sdn ) r(c1 , . . . , cn ) + s(d1 , . . . , dn ) rϕ(v) + sϕ(w)
“(3) ⇒ (1)”: Dies folgt unmittelbar aus Lemma D.4.7.
Ein K–Vektorraum V, der eine endliche Basis hat, heißt endlich dimensional. Die L¨ange der Basis (und damit jeder Basis) heißt die Dimension von V (schreibe: dimK (V ) oder dim(V ), wenn K aus dem Kontext klar ist). Wenn V nicht endlich dimensional ist, dann schreibt man dim(V ) = ∞ und sagt, V ist unendlich dimensional. Bemerkung D.4.10 : Sei V ein K–Vektorraum und U, U 0 lineare Unterr¨aume von V mit V = U + U 0 := {u + u0 | u ∈ U, u0 ∈ U 0 }. Dann ist V genau dann die innere direkte Summe von U und U 0 , wenn U ∩ U 0 = {0} ist. Wenn n¨amlich U ∩ U 0 = {0} und v = u + u0 = w + w0 mit u, w ∈ U und u0 , w0 ∈ U 0 , dann gilt u − w = w0 − u0 ∈ U ∩ U 0 = {0}, d.h. u = w und u0 = w0 . Wegen V = U + U 0 und Proposition D.4.8(iii) liefert dies V = U ⊕ U 0 . Umgekehrt, wenn V = U ⊕ U 0 , dann gilt f¨ ur v ∈ U ∩ U 0 sowohl v = 0 + v mit 0 ∈ U und v ∈ U 0 als 0 auch v = v + 0 mit v ∈ U und 0 ∈ U . Wieder mit Proposition D.4.8(iii) folgt also v = 0.
516
ANHANG D. HINTERGRUNDMATERIAL ZUR LINEAREN ALGEBRA
Proposition D.4.11 : Seien V und W K–Vektorr¨ aume und B eine Basis f¨ ur V . (i) Jede K-lineare Abbildung ϕ : V → W ist durch ihre Einschr¨ ankung auf B vollst¨ andig bestimmt. (ii) Jede Abbildung φ : B → W l¨ aßt sich in eindeutiger Weise zu einer K-linearen Abbildung ϕ : V → W fortsetzen (d.h. ϕ|B = φ). Beweis: Idee: Schreibe die Elemente der Vektorr¨aume als Linearkombination der Basen. (i) Sei v ∈ V . Dann Pl¨aßt sich v nach Satz D.4.5 als Linearkombination der Elemente von B schreiben: v = b∈B cb b. Also gilt X ϕ(v) = cb ϕ(b) b∈B
und ϕ ist durch seine Werte auf B vollst¨andig bestimmt. (ii) Die Eindeutigkeit folgt sofort aus dem ersten Teil. Zur Existenz zieht man wieder Satz D.4.5 heran, P um v in eindeutiger Weise als Linearkombination der Elemente von B schreiben: v = b∈B cb b. Dann definiert man eine Abbildung ϕ : V → W durch X cb φ(b) ϕ(v) := b∈B
und muß zeigen, daß P ϕ K-linear ist. Dies ist aber eine elementare Rechnung. Mit v = P c b und w = b∈B db b findet man b∈B b X ϕ(rv + sw) = ϕ( (rcb + sdb )b) b∈B
=
X
(rcb + sdb )φ(b)
b∈B
=
X
rcb φ(b) +
b∈B
=
r(
X
X
cb φ(b)) + s(
X
db φ(b))
b∈B
b∈B
=
sdb φ(b)
b∈B
rϕ(v) + sϕ(w)
F¨ ur zwei endlich dimensionale K–Vektorr¨aume V und W ist der Raum HomK (V, W ) ein K-Vektorraum (vgl. Proposition D.4.1). Der folgende Satz liefert zusammen mit Beispiel D.4.6, daß dimK (HomK (V, W )) = dimK (Mat(m × n, K)) = nm, falls n = dimK (V ) und m = dimK (W ) gilt. Satz D.4.12 : Seien V und W endlich dimensionale K–Vektorr¨ aume mit den Basen {v1 , . . . , vn } und {w1 , . . . , wm }. Dann definiert die Gleichung ϕ(vj ) =
m X
aij wi
(∗)
i=1
einen K-Vektorraum–Isomorphismus Φ : HomK (V, W ) → Mat(m × n, K) ϕ 7→ Aϕ := (aij ) i = 1 , ... , m j = 1 , ... , n
D.5. BILINEARFORMEN
517
Die Umkehrabbildung Φ−1 : Mat(m × n, K) A ist durch ϕA (vj ) =
→ 7 →
m X
HomK (V, W ) ϕA
aij wi
(∗∗)
i=1
gegeben. Beweis: Idee: Schreibe die Elemente der Vektorr¨aume als Linearkombination der Basen. Die Abbildung Φ ist nach Satz D.4.5 wohldefiniert. Wir zeigen zun¨achst, daß Φ K-linear ist. m P Pm Mit ϕ(vj ) = aij wi und ψ(vj ) = i=1 bij wi rechnet man i=1
(rϕ + sψ)(vj ) = =
r
m X
aij wi + s
i=1 m X
m X
bij wi
i=1
(raij + sbij )wi
i=1
Also gilt Φ(rϕ + sψ) =
(raij + sbij ) i = 1 , ... , m j = 1 , ... , n
=
r(aij ) i = 1 , ... , m + s(bij ) i = 1 , ... , m
=
rΦ(ϕ) + sΦ(ψ).
j = 1 , ... , n
j = 1 , ... , n
Nach Proposition D.4.11 definiert (∗∗) eine Abbildung Ψ : Mat(m × n, K) → A 7→
HomK (V, W ) ϕA
Es bleibt zu zeigen, daß Ψ die Umkehrfunktion von Φ ist. Aus (∗) folgt, daß ker (Φ) = {0} und aus (∗∗) folgt, daß Φ(ϕA ) = A. Also ist Φ bijektiv und es gilt Φ ◦ Ψ = id. Damit folgt die Behauptung aus Lemma D.2.13.
Bemerkung D.4.13 : F¨ ur V = Kn , W = Km mit jeweils der Standardbasis erh¨alt man in Satz D.4.12 gerade die Korrespondenz A 7→ ϕA ϕ 7→ Aϕ aus Satz D.2.15. Sei V ein K–Vektorraum, dann heißt V ∗ := HomK (V, K) der Dualraum von V und die Elemente von V heißen Linearformen oder auch lineare Funktionale auf V . ∗
D.5
Bilinearformen
Sei K ein K¨orper. Eine Bilinearform auf einem K-Vektorraum V ist eine Abbildung Φ : V × V → K, die die Bedingungen
518
ANHANG D. HINTERGRUNDMATERIAL ZUR LINEAREN ALGEBRA
(a) Φ(cv + c0 v 0 , w) = cΦ(v, w) + c0 Φ(v 0 , w)
∀c, c0 ∈ K,
v, v 0 , w ∈ V
(b) Φ(v, cw + c0 w0 ) = cΦ(v, w) + c0 Φ(v, w0 )
∀c, c0 ∈ K,
v, w0 , w ∈ V
erf¨ ullt. Wir schreiben Bil(V ) f¨ ur die Menge der Bilinearformen auf V .
Beispiel D.5.1 : Die folgenden Beispiele sind lauter Bilinearformen: (i) Sei K beliebig und V = Kn (Spaltenvektoren)
Φ(v, w) = v t w =
n X
x1 v = ... , xn
xi yi ,
i=1
y1 w = ... yn
F¨ ur K = R ist dies das euklidische Skalarprodukt. (ii) (Minkowski–Form) K = R, V = R4 Φ((t, x, y, z), (t0 , x0 , y 0 , z 0 )) = −tt0 + xx0 + yy 0 + zz 0 (iii) K beliebig, V = Kn , A ∈ Mat(n × n, K), A =(aij ) i = 1 , ... , n j = 1 , ... , n
Φ(v, w) = v t Aw =
n X
xi
i=1
n X
aij yj =
n X n X
j=1
xi aij yj .
i=1 j=1
Das hier zugrundeliegende Schema ist:
=
Man rechnet Φ(cv + c0 v 0 , w)
= (cv + c0 v 0 )t Aw = ((cv)t + (c0 v 0 )t )Aw = (cv)t Aw + (c0 v 0 )t Aw t
= c(v t Aw) + c0 (v 0 Aw) = cΦ(v, w) + c0 Φ(v 0 , w) und analog f¨ ur Φ(v, cw + c0 w0 ). Dieses Beispiel verallgemeinert die Beispiele (i) und (ii). So ist das richtige A im ersten Beispiel gerade Matrix 1 0 .. A = 1n = . 0 und im zweiten Beispiel
−1 A= 0
1 0
1 1 1
D.5. BILINEARFORMEN
519
(iv) Sei V := {v : [a, b] → R | stetig} und k : [a, b] × [a, b] → R stetig. Dann definiert Z
b
Z
b
Φ(v, w) =
v(x)k(x, y)w(y)dydx a
a
eine Bilinearform auf V . (v) F¨ ur V = Mat(r × s, K) definiert Φ(A, B) = tr(At B) eine Bilinearform auf V .
Sei V ein K-Vektorraum mit Basis {v1 , . . . , vn } und Φ ∈ Bil(V ), dann heißt die Matrix BΦ = (bij ) i = 1 , ... , n j = 1 , ... , n
mit bij = Φ(vi , vj ) die darstellende Matrix von Φ bzgl. der Basis {v1 , . . . , vn }. n n P P Sei jetzt Φ ∈ Bil(V ). Dann gilt f¨ ur v = xi vi und w = y j vj : i=1
j=1
Φ(v, w) =
Φ(
n X
xi vi ,
i=1 n X
=
i=1 n X
=
yj vj )
j=1 n X
xi (Φ(vi ,
yj vj ))
j=1
xi (
i=1 n X
=
n X
n X
yj Φ(vi , vj ))
j=1
xi bij yj
i = 1 j = 1
Umgekehrt sei V ein K–Vektorraum mit Basis {v1 , . . . , vn } und (bij ) i = 1 , ... , n = B ∈ Mat(n × n, K). j = 1 , ... , n
Definiere ΦB (v, w) ∈ Bil(V ) durch ΦB (v, w) :=
n X
xi bij yj
wobei
v=
n X
xi vi ,
i=1
i = 1 j = 1
(v, w) 7→ v t Aw
bzgl. der Standardbasis e1 , . . . , en ist A: Φ(ei , ej ) = eti Aej = aij ,
n X j=1
Beispiel D.5.2 : Die darstellende Matrix von Φ : Kn × Kn → K,
w=
A = (aij ).
yj vj .
520
ANHANG D. HINTERGRUNDMATERIAL ZUR LINEAREN ALGEBRA
Satz D.5.3 : (Basiswechsel f¨ ur Bilinearformen) Sei V ein K-Vektorraum, Φ ∈ Bil(V ), und {v1 , . . . , vn }, ¨ {v10 , . . . , vn0 } Basen f¨ ur V . Weiter sei C ∈ GL(n, K) die Ubergangsmatrix von {v1 , . . . , vn } zu {v10 , . . . , vn0 }, d.h. n X vj0 = cij vi , C = (cij ) i = 1 , ... , n j = 1 , ... , n
i=1
Wenn B die darstellende Matrix von Φ bzgl. {v1 , . . . , vn } ist, dann ist B 0 = C t BC die darstellende Matrix von Φ bzgl. {v10 , . . . , vn0 }. Beweis: Idee: Entwickle die vj0 bzgl. der Basis {v1 , . . . , vn }. Seien B = (bij ) und B 0 = (b0ij ) definiert durch bij = Φ(vi , vj ) und b0ij = Φ(vi0 , vj0 ). Dann rechnet man b0ij
= Φ(vi0 , vj0 ) n n X X = Φ( cri vr , csj vs ) r=1
= =
n X r=1 n X r=1
=
n X r=1
s=1
cri Φ(vr ,
n X
csj vs )
s=1 n X cri ( csj Φ(vr , vs )) s=1 n X cri ( brs csj ) s=1
und erh¨alt B 0 = C t BC.
Ein Bilinearform Φ ∈ Bil(V ) heißt symmetrisch, wenn Φ(v, w) = Φ(w, v)
∀v, w ∈ V
gilt und schiefsymmetrisch, wenn Φ(v, w) = −Φ(w, v)
∀v, w ∈ V.
Wir bezeichnen die Menge der symmetrischen Bilinearformen auf V mit Sym(V ). Die Menge {A ∈ Mat(n×n, K) | At = A} der symmetrischen Matrizen in Mat(n×n, K) bezeichnen wir mit Sym(n, K). Eine symmetrische Bilinearform Φ ∈ Sym(V ) auf einem R–Vektorraum heißt • positiv definit , falls Φ(v, v) > 0
∀v ∈ V \ {0}
• positiv semidefinit , falls Φ(v, v) ≥ 0 • negativ definit , falls Φ(v, v) < 0
∀v ∈ V
∀v ∈ V \ {0}
D.5. BILINEARFORMEN
521
• negativ semidefinit , falls Φ(v, v) ≤ 0
∀v ∈ V \ {0}
• indefinit, sonst Ein Skalarprodukt (oder auch inneres Produkt) auf einem R-Vektorraum V ist eine positiv definite symmetrische Bilinearform. Wir schreiben auch hv | wi statt Φ(v, w). Der Vektorraum V zusammen mit dem Skalarprodukt hv | wi heißt dann auch ein euklidischer Vektorraum. Sei V ein R-Vektorraum und h· | ·i ein inneres Produkt auf V (auch f¨ ur unendliche Dimensionen). Eine Folge {v1 , v2 , . . .} von Vektoren in V heißt Orthogonalsystem, wenn hvi | vj i = 0
∀ i 6= j
und ein Orthonormalsystem (ONS), wenn zus¨atzlich hvj | vj i = 1
∀j
gilt. Eine Basis, die ein Orthonormalsystem ist, nennt man eine Orthonormalbasis (ONB). Sei V ein R-Vektorraum und Φ ∈ Sym(V ). F¨ ur M ⊂ V betrachte M ⊥ := {v ∈ V | Φ(v, w) = 0
∀w ∈ M }
(lies: M senkrecht oder M orthogonal). Wenn Φ ein inneres Produkt ist, d.h. positiv definit, dann nennt man M ⊥ das orthogonale Komplement von M . In diesem Falle ist das Wort “Komplement” gerechtfertigt, weil aus v ∈ M ∩ M ⊥ sofort Φ(v, v) = 0, also v = 0, folgt. Seien V und W R-Vektor¨aume mit inneren Produkten h· | ·iV und h· | ·iW . Betrachte zwei lineare Abbildungen ϕ ∈ HomR (V, W ), ψ ∈ HomR (W, V ). Dann heißt ψ zu ϕ adjungiert, wenn gilt: hϕ(v) | wiW = hv | ψ(w)iV
∀v ∈ V, w ∈ W
Satz D.5.4 (Hauptminoren–Kriterium): Sei B ∈ Mat(n × n, R) symmetrisch. Weiter sei Bl f¨ ur l ≤ n der linke obere l × l Block in B, d.h. b11 · · · b1l · · · b1n .. .. .. b11 · · · b1l . . . . .. . B= . bl1 · · · bll · · · bln und Bl = .. . .. .. . bl1 · · · bll . . . bn1 · · · bnl · · · bnn Dann sind folgende Aussagen ¨ aquivalent: (1) B ist positiv definit (d.h. ΦB ist pos. def. f¨ ur eine beliebige Basis) (2) det Bl > 0 f¨ ur l = 1, . . . , n. Die Determinanten det Bl heißen die Hauptminoren von B. Beweis: Idee: Die Richtung “(1) ⇒ (2)” reduziert man auf die Aussage, daß positiv definite Matrizen positive Determinante haben, in dem man xt Bx f¨ ur Vektoren x mit vielen Nullen testen. Die Umkehrung “(2) ⇒ (1)” beweist man mit Induktion, indem man die linke obere (n − 1 × (n − 1)-Ecke Bn−1 mit t Bn−1 7→ Cn−1 Bn−1 Cn−1 auf 1n−1 transformiert.
522
ANHANG D. HINTERGRUNDMATERIAL ZUR LINEAREN ALGEBRA (1) ⇒ (2) Sei B positiv definit, d.h. xt Bx > 0 f¨ ur alle x ∈ Rn \ {0}. Dann ist Bl ist ebenfalls positiv definit, d.h. y t Bl y = xt Bx > 0 f¨ ur
µ x=
y 0
¶ mit y ∈ Rl \ {0}, 0 ∈ Rn−l .
Das bedeutet, es ist nur det B > 0 f¨ ur jede positiv definite Matrix B zu zeigen. Dazu: IndexΦB = (n, 0), d.h. es existiert eine invertierbare Matrix C ∈ GL(n, R) mit C t BC = 1n : 1 = det(1n ) = det(C t BC) = det(C t ) det(B) det(C) = | det(C)|2 det(B) | {z } >0
und das zeigt det(B) > 0. (2) ⇒ (1) Induktion u ¨ber n. n = 1: klar, weil det(B) = B n > 1: Die Induktion zeigt, daß Bn−1 positiv definit ist, d.h. es existiert eine Matrix t Cn−1 ∈ GL(n − 1, R) mit Cn−1 Bn−1 Cn−1 = 1n−1 . Setze µ ¶ Cn−1 0 C := ∈ GL(n, R), 0 1 dann gilt µ C t BC
= µ = µ = =
t Cn−1 0
0 1
¶µ
t Bn−1 Cn−1 ∗
∗ ∗
Bn−1 ∗ ¶µ
¶µ
∗ ∗
Cn−1 0 ¶
t Bn−1 Cn−1 ∗ Cn−1 ∗ ∗ µ ¶ 1n−1 v , v ∈ Rn−1 , vt r
0 1
Cn−1 0 ¶
0 1
r ∈ R.
Dabei gilt r ∈ R, weil C t BC hermitesch ist. µ ¶µ ¶µ ¶ 1n−1 0 1n−1 v 1n−1 −v −v t 1 vt r 0 1 {z }| {z }| {z } | µ = µ =
Dt
C t BC
1n−1 0
v r − vt v
1n−1 0
0 r − vt v
¶µ ¶
1n−1 0
D
−v 1
¶
Es bleibt also noch zu zeigen, daß r − v t v > 0 ist: r − v t v = det(Dt C t BCD) = | det(CD)|2 det(B) . | {z } | {z } >0
>0
¶
Index µ
¶ 1 ··· n , 311 σ(1) · · · σ(n) (an )n∈N , Folge, 71 (an )n∈N , Folge, 271 (an )n∈N , Folge, 71 (apn )n∈N , Teilfolge, 76 −a, Negatives einer Zahl, 18 0, Null in Z , 266 0, Null in einem Zahlbereich, 18 1, Eins in Z , 266 1, Eins in N, 254 1, Eins in einem Zahlbereich, 20 :=, definierende Gleichheit, 11 A M B, symmetrische Differenz, 287 A ∩ B, Schnitt von Mengen, 11 A ∪ B, Vereinigung von Mengen, 11 A ∪. B, disjunkte Vereinigung von Mengen, 11 A 6⊆ B, A ist nicht Teilmenge von B , 11 A \ B, Differenzmenge, 286 A ⊆ B, A ist Teilmenge von B , 10 A ⊆ B, Inklusion, 281 A $ B, strikte Inklusion, 281 A × B, kartesisches Produkt, 11 A−1 , 308 Ax, 300 B(0; 1), Einheitskreisscheibe in C, 97 B(0; r), Kreisscheibe in C, 97 B(x; r), offene Kugel um x mit Radius r, 194 BA, 302 B \ A, B ohne A, 11 B ◦ , Inneres von B , 200 Bρ (x; r), offene Kugel um x mit Radius r, 194 BΦ , 323 C(I, R), stetige Funktionen auf I mit Werten in R, 45 C(M, N ), stetige Abbildungen von N nach M , 202 C 0 (M, N ), stetige Abbildungen von N nach M , 202 C 1 (I, R), 62 C ∞ (U, W ), 223 C n –Diffeomorphismus, 223 C n (U, U 0 ), 223 D2 f , 231 Dj f (a), 225 H(M ), H¨aufungspunkte von M , 33 Jf (x), 234 L(V1 , V2 ; W ), 220 L(V1 , . . . , Vk ; W ), 222
L1 (R), integrierbare Funktionen modulo Nullfunktionen, 159 L2 (V ; W ), 220, 222 N ◦ , Inneres von N in R, 32 Nf (c), 228 [a, b[, Intervall, 31 [a, b], Intervall, 31 ¨ [a], Aquivalenzklasse von a, 263 Bil(V ), 322 C, komplexe Zahlen, 29, 278 C× , komplexe Zahlen ohne Null, 279 EndK (V ), 316 Γf , 228 HomK (V, W ), 316 HomK (Kn , Km ), 301 Im, Imagin¨arteil, 278 Kn , 294 ⇔, dann und nur dann, 254 Mat(m × n, K), 299 ∂f ∂xj , 227 PMn , 310 ΦB , 323 P(M ), Potenzmenge von M , 11 Q+ , positive rationale Zahlen, 270 Re, Realteil, 278 ⇒, impliziert, 254 Sn , 311 span, 295 Sym(V ), 324 Sym(n, K), 324 ∂ 2 f (x) ∂xi ∂xj , 230 arccos, Arkuskosinus, 118 arcsin, Arkussinus, 118 arctan, Arkustangens, 119 C, komplexe Zahlen, 2 N, nat¨urliche Zahlen, 2, 253, 257 N0 , nat¨urliche Zahlen mit Null, 98 Q, rationale Zahlen, 2, 268 R, reelle Zahlen, 2, 271 R+ , positive reelle Zahlen, 274 Z, ganze Zahlen, 2, 264 × Z T , ganze Zahlen ohne Null, 267 T{X | X ∈ S}, Durchschnitt der X ∈ S, 286 TX∈S X, Durchschnitt der X ∈ S, 286 Sj∈J Aj , Schnitt von Mengen, 11 {X | X ∈ S}, Vereinigung der X ∈ S, 284
523
524 S SA∈M A, 256 SX∈S X, Vereinigung der X ∈ S, 284 j∈J Aj , Vereinigung von Mengen, 11 –A, Komplement von A, 11, 198, 286 cos, Kosinus, 102, 115 cosh, Kosinus hyperbolikus, 102 cot, Kotangens, 119 det(A), 312 dim(V ), 319 S . A j∈J j , disjunkte Vereinigung von Mengen , 11 ∅, leere Menge, 11, 283 ∃, es existiert, 13, 254 exp, Exponentialfunktion, 102, 110 ∀, f¨ur alle, 13, 253 1 a , multiplikatives Inverses, 20 inf(∅), 98 inf(X), Infimum von X , 28 R f (t)dt, 178 R f , 169 A ker(ϕ), ½ ¾ 306 n , Stirling-Zahl, zweiter Art, 124 k bac, ganzahliger Anteil von a, 33 limn→∞ an = a, Grenzwert einer Folge, 72 limn→∞ an = −∞, 74 limn→∞ an = ∞, 74 limn→∞ xn = x, Grenzwert einer Folge, 201 limx→x0 + , Limes f¨ur x von rechts gegen x0 , 32 limx→x0 − , Limes f¨ur x von links gegen x0 , 33 limx→x0 , Limes f¨ur x gegen x0 , 34 limx→±∞ , Limes f¨ur x gegen ± Unendlich, 39 lim inf n→∞ an , Limes inferior, 98 lim supn→∞ an , Limes superior, 98 ln, nat¨urlicher Logarithmus, 111 loga , Logarithmus zur Basis a, 113 max, Maximum, 259 max({a1 , . . . , an }), Maximum einer endlichen Menge von Zahlen, 25 max(f, g) = f + (g − f )+ , 155 min, Minimum, 255 min({a1 , . . . , an }), Minimum einer endlichen Menge von Zahlen, 25 min(a, b), Minimum zweier Zahlen, 25 min(f, g) = f − (f − g)+ , 155 M , Abschluß von m in R, 32 B, Abschluß von B , 200 B(z0 ; R), abgeschlossene Kreisscheibe in C, 100 ∂B, Rand von B , 200 π, Kreiszahl, 116 σP , 310 sign, 312 sin, Sinus, 102, 115 sinh, Sinus hyperbolikus, 102 √ x, Wurzel, 64 √ n x, n-te Wurzel, 51, 64
INDEX P∞ ak , Reihe, 80 Pk=1 ∞ k=1 fk = f (i.N.), 163 sup(∅), 98 sup(X), Supremum von X , 29 tan, Tangens, 119 ]a, b[, Intervall, 31 ]a, b], Intervall, 31 a < b, Ordnung auf geordnetem K¨orper, 24 a ∈ M , a ist Element von M , 10 a 6∈ M , a ist nicht Element von M , 10 ax , verallgemeinerte Exponentialfunktion, 112 a−1 , multiplikatives Inverses, 20 an → −∞, 74 an → ∞, 74 an → a, Grenzwert einer Folge, 72 b(n), Bellsche Zahl, 125 b − a, Differenz von Zahlen, 18 e, Eulersche Zahl, 110 ex , Exponentialfunktion, 110 eix , Exponentialfunktion, 102 f 0 , Ableitung, 57 f 00 (x), 220 f 0 (x), 213 f (x0 +), Limes f¨ur x von rechts gegen x0 , 32 f (x0 −), Limes f¨ur x von links gegen x0 , 33 f = g f.¨ u., Gleichheit fast u¨berall, 159 f ◦ g,PVerkn¨upfung von f und g , 63 ∞ f ' k=1 fk , Entwicklung in integrierbare Funktion, P∞ 153 f ' k=1 fk , Entwicklung in Stufenfunktionen , 146 f (n) (x), 222 f −1 , Umkehrfunktion von f , 50 fσ , 311 fn → f (f.¨ u.), fast u¨berall Konvergenz, 159 fn → f (i.N.), 162 g|A , 175 i, imagin¨are Einheit, 279 pn , Potenzfunktionen, 45, 102 x + y, Addition auf N, 257 x 6∈ A, x ist nicht Element von A, 282 1 x 2 , Wurzel, 64 1 x n , n-te Wurzel, 51, 64 xn → x, Konvergenz einer Folge, 201 F(A, R), Funktionen auf A mit Werten in R, 35 FK , Folgen in K, 71, 72 FSt (R, R), Raum der Stufenfunktionen, 137 Fint,0 (R), 157 L1 (R), Raum der komplexwertigen integrierbaren Funktionen, 148 L1 (R, R), Raum der integrierbaren Funktionen, 146 P(M ), Potenzmenge von M , 197 U(x), Menge der Umgebungen von x, 194 III(c, p; q), 292 II(p; c), 292 I(p, q), 292
INDEX Pol(R), reelle Polynomfunktionen auf R, 46 Abbildung, 8, 11 K-lineare, 301 Abel -Grenzwertsatz, 105 -Konvergenzkriterium, 85 Abel, Niels Hendrik (1802–1829), 85, 105 abgeschlossen in R, 32 abgeschlossene Kugel, 204 Teilmenge, 198 Abgeschlossenheit unter Addition, 295 unter Multiplikation mit Skalaren, 295 Ableitung, 57 n-te, 222 einer Abbildung, 213 der Umkehrfunktion, 63, 245 einer skalaren Funktion, 57 einer vektorwertigen Funktion, 58 h¨ohere, 181, 222 partielle, 225 zweite, 220 Abschluß in R, 32 Abschluß einer Menge, 200 Absolutbetrag, 26 absolute Konvergenz von Reihen, 82 Abstandsfunktion, 208 abz¨ahlbar, 85 Abz¨ahlbarkeit, 157 Addition, 17 auf N, 257 der ganzen Zahlen, 265 der komplexen Zahlen, 278 der rationalen Zahlen, 269 der reellen Zahlen, 272 von Vektoren, 294 adjungiert, 325 ¨aquivalente Elemente, 263 ¨ Aquivalenz, 7 von Normen, 205, 210 ¨ Aquivalenzklasse, 7, 263 ¨ Aquivalenzrelation, 264 schwache, 263 algebraische Struktur, 7 Anfangswert, 110 Antisymmetrie der Inklusion, 282 Antisymmetrie einer Relation, 12 Archimedes (287–212 v.Chr.), 276 archimedisches
525 Axiom, 276 Arkuskosinus, 118 Arkussinus, 118 Arkustangens, 119 Assoziativgesetz der Addition, 315 der skalaren Multiplikation, 315 Assoziativit¨at, 266 der Addition in Kn , 294 der Addition in Q, 269 der Addition in R, 273 der Addition in N, 258 der Addition in Z, 17 der Gruppenoperation, 311 der Multiplikation in Q, 269 der Multiplikation in R, 273 der Multiplikation in N, 259 der Multiplikation in Z, 19 des Matrizenprodukts, 302 von Verkn¨ upfungen, 300 Asymmetrie-Axiom der nat¨ urlichen Zahlen, 253 asymptotische Gleichheit, 123 Aussonderungsaxiom, 282 Auswahlaxiom, 12, 13 Banach -Fixpunktsatz, 239 Banach, Stefan (1892–1945), 239 Basis, 298, 317 eines linearen Unterraums, 297 kanonische, 298 Standard-, 298 Basisauswahlsatz f¨ ur lineare Unterr¨aume, 298 Basiswechsel Bilinearformen, 324 Bell -Zahl, 125 Bell, Eric (1883–1960), 125 Berechnung der inversen Matrix, 308 Bernoulli -Ungleichung, 29, 79 Bernoulli, Jakob (1654–1705), 29 beschr¨ankt, 253 nach oben, 28 nach unten, 28 beschr¨ankte Folgen in C, 74 Folgen in R, nach oben, 75 Folgen in R, nach unten, 75 Funktion, 51 Mengen, in metrischen R¨aumen, 206 Bessel -Funktion, erster Art, 109 Bessel, Friedrich Wilhelm (1784–1846), 109
526 Betrag einer komplexen Zahl, 71 einer reellen Zahl, 275 einer Zahl, 26 bijektiv, 50, 256 bijektive Abbildung, 299 Bild, 316 einer Abbildung, 299 bilineare Abbildung, 215, 220 Bilinearform, 321 schiefsymmetrische, 324 symmetrische, 324 Binomial -Formel, 122 -Funktion, 121 -Koeffizient, 121, 122 Bolzano, Bernhard (1781–1848), 77 Bolzano–Weierstraß Satz von, 77 Borel, Emile (1871–1956), 206 Brouncker -Reihe, 106 Brouncker, William (1620–1684), 106 Cantor -Menge, 162 Cantor, Georg (1845–1918), 10 Carleson, Lennart (geb. 1928), 187 Cauchy -Bedingung, 166 -Faltung, 108 -Folge, 78 -Folge, in einem metrischen Raum, 204 -Funktionalgleichung, 42 -Kriterium, f¨ ur Reihen, 81 Cauchy, Augustin Louis (1789–1857), 42, 204 Cauchy-Hadamard-Formel, 99 charakteristische Funktion einer Menge, 149 darstellende Matrix einer Bilinearform, 323 Darstellung einer Funktion durch eine Potenzreihe, 97 De Morgan -Gesetze, 286 Dedekind, Richard (1831–1916), 278 definit in-, 325 negativ, 324 negativ semi-, 325 positiv, 324 positiv semi-, 324 Determinante einer quadratischen Matrix, 312 Dezimalbruch, 84
INDEX Dezimalbruchentwicklung, 84 endliche, 84 dicht Q in R, 30 Differentialgleichung, 109 Differenz, 18 von Funktionen, 35 Differenzenquotient, 57 differenzierbar n-mal, 222 partiell, 225, 227 unendlich oft, 223 zweimal, 220 Differenzierbarkeit einer Abbildung, 213 einer skalaren Funktion, 57 einer vektorwertigen Funktion, 58 Differenzmenge, 286 Dimension, 319 endlich dimensional, 319 unendlich dimensional, 319 disjunkte Mengen, 11, 285 diskrete Topologie, 199 Diskriminante, 134 Distributivgesetz erstes, 315 zweites, 315 Distributivit¨at, 21, 266, 270, 274, 294 in N, 259 divergente Folge, 74 Divergenz, 235 einer Reihe, 97 dominierte Konvergenz, 167 Dreiecksungleichung, 72, 193 in R, 27 Dsitributivgesetze f¨ ur Mengen, 285 Dualit¨atsprinzip f¨ ur Mengen, 286 Dualraum, 321 Durchschnitt, 285 dyadische Entwicklung einer reellen Zahl, 85, 150 echte Teilmenge, 281 Eins, 266 in N, 254 in einem Zahlbereich, 19 Einschr¨ankung einer Funktion, 175 Einselement einer Gruppe, 311 Element einer Menge, 10 elementare
INDEX Spaltenumformung, 304 Spaltenumformungen, 292 Zeilenumformung, 304 Zeilenumformungen, 292 Elementarfunktion, 137 Elementarmatrizen, 304 endliche Schnitteigenschaft, 205 Endomorphismen eines Vektorraums, 316 Entropie, 114 Entwickelbarkeit in integrierbare Funktionen, 153 in Stufenfunktionen, 146 erzeugende Funktion einer Folge, 123 exponentiell, 125 Euklid (ca. 325–265 v.Chr.), 322 euklidischer Vektorraum, 325 Euler -Formel, 102 -Zahl, 110 Euler, Leonhard (1707–1783), 110 Euler-Mascheroni -Konstante, 173 Exponentialfunktion, 110 Exponentialreihe, 110 komplex, 101 exponentiell erzeugende Funktion, 125 Extensionalit¨atsaxiom, 281 Extremum, 53, 59 lokales, 231 unter Nebenbedingungen, 247 Fakult¨at, 110 fast u ¨berall Gleichheit, 159 Konvergenz, 159 Fehlstand einer Permutation, 311 Fermat, Pierre de (1601–1665), 1 Fibonacci -Zahlen, 123 Fibonacci, Leonardo (1170–1250), 123 Folge, 71, 271 Fourier -Koeffizienten, 187 -Reihe, 186 Fourier, Jean–Baptiste–Joseph (1768–1830), 186 Fraenkel, Adolf Abraham (1891–1965), 12 Fundamentalfolge, 272 Fundamentalsatz der Algebra, 2 Funktion, 11 Funktionalgleichung der Exponentialfunktion, 110
527 Gamma-Funktion, 191 ganze Zahlen, 265 ganzzahliger Anteil, 33 Gauß -Algorithmus, 5, 292 Gauß, Carl Friedrich (1777–1855), 5, 235 geometrische Reihe, 80 geordneter K¨orper, 24 glatte Funktion, 223 Gleichheit von Mengen, 10 gleichm¨aßige Konvergenz, 93, 240 von Potenzreihen, 101 gleichm¨aßige Stetigkeit, 68 gleichmaßige Stetigkeit, 208 Gradient, 227 Graph einer Funktion, 31 Green, George (1793–1841), 235 Grenzwert, 34, 39, 202 einer Folge, 72, 201 linksseitig, 33 rechtsseitig, 32 gr¨oßer, 24 gr¨oßtes Element, 253 Gruppe, 8 Gruppen, 311 H¨aufungspunkt einer Folge, 200 einer Menge in R, 33 Halbnorm, 193 harmonische Reihe, 81 Hauptminoren, 325 -Kriterium, 325 Hauptsatz, 131 der Differential und Integralrechnung, 177 Hausdorff -Raum, 197 Hausdorff, Felix (1868–1942), 197 Heine, Eduard (1821–1881), 206 Hesse, Ludwig Otto (1811–1874), 231 Hesse–Matrix, 231 Hintereinanderausf¨ uhrung von Abbildungen, 299 h¨ ohere Ableitungen, 181, 222 H¨older -Norm, 195 H¨older, Ludwig Otto (1859–1937), 195 Homomorphismus Vektorraum-, 316 H¨ ulle lineare, 295, 317 Hyperbel, 229
528 Identit¨atssatz f¨ ur Potenzreihen, 104 imagin¨are Einheit, 279 Imagin¨arteil, 278 implizite Funktion, 242 indefinite symmetrische Bilinearform, 325 indiskrete Topologie, 199 Induktion, 255 induktiv geordnete Mengen, 13 induzierte Topologie, 199 Infimum, 28 Informationsgehalt, 114 injektiv, 50, 256 injektive Abbildung, 299 Inneres in R, 32 Inneres einer Menge, 200 inneres Produkt, 325 Integral einer Elementarfunktion, 137 einer integrierbaren Funktion, 148 einer komplexwertigen Funktion, 148 einer Stufenfunktion, 140 vektorwertig, 150 Integration formale, 131 von Potenzreihen, 133 integrierbar u ¨ber einer Teilmenge der Definitionsmenge, 175 integrierbare Funktionen, 146 die nicht auf ganz R definiert sind, 169 komplexwertige, 188 Intervall, 31 abgeschlossenes, 31 halboffenes, 31 kompaktes, 53 offenes, 31 Invarianz der Basisl¨ange, 298 inverse Matrix, 308 Berechnung, 308 Inverses additiv, 18 multiplikativ, 20 inverses Element der Addition, 315 in einer Gruppe, 311 invertierbare Abbildung, 300 Matrix, 308 irrationale Zahlen, 30 Isomorphie, 9 Isomorphismus Vektorraum-, 316
INDEX Jacobi -Matrix, 234 Jacobi, Carl-Gustav (1804–1851), 234 kanonische Darstellung von Stufenfunktionen, 140 kartesisches Produkt, 11 Kehrwert, 20 Kern, 316 einer linearen Abbildung, 306 Kette in einer geordneten Menge, 13 Kettenregel, 63, 214 Kirchhoff -Gesetze, 3 Kirchhoff, Gustav (1824–1887), 3 kleiner, 24 kleinstes Element, 253 Koeffizienten einer Potenzreihe, 97 Koeffizientenmatrix eines linearen Gleichungssystems, 291 erweiterte, 291 K¨orper, 23 geordneter, 24 kofinite Topologie, 199 Kommutativgesetz der Addition, 315 Kommutativit¨at, 266 der Addition in Kn , 294 der Addition in Q, 269 der Addition in R, 273 der Addition in N, 258 der Addition in Z, 17 der Multiplikation in Q, 269 der Multiplikation in R, 273 der Multiplikation in N, 259 der Multiplikation in Z, 19 kompakte Menge in einem top. Raum, 205 kompaktes Intervall, 53 Komplement, 198, 256, 286 einer Menge, 11 orthogonales, 325 komplexe Zahlen, 29, 278 Konvergenz f¨ ur Folgen, 72 f¨ ur Funktionen, 32–34, 39 fast u ¨berall, 159 gleichm¨aßige, 93, 240 im quadratischen Mittel, 187 in einem topologischen Raum, 201 lokal gleichm¨aßige, 240 punktweise, 93 von Reihen, 80
INDEX Konvergenzradius, 98 Korollar, 12 Kosinus, 115 Kosinushyperbolikusreihe komplex, 102 Kosinusreihe, 115 komplex, 101 Kotangens, 119 Kreiskegel, 230 Kronecker, Leopold (1823–1891), 28 kubische Parabel, 67 K¨ urzungseigenschaft, 266 der Addition in N, 258 der Multiplikation in N, 259 in Q, 269 in R, 273 in Z, 267 Kugel in einem metrischen Raum, 194 L¨ange einer Basis, 297 Lagrange -Multiplikator, 247 -Restglied, 185 Lagrange, Joseph Louis (1736–1813), 247 Lebesgue -Maß, 171 -meßbare Menge, 171 Lebesgue, Henri (1875–1941), 167 leere Menge, 11, 283 Leibniz -Kriterium, 89 -Reihe, 106 Leibniz, Gottfried Wilhelm (1646–1716), 89 Lemma, 12 von Zorn, 13 Leontief, Wassily (1906–1999), 4 Levi, Beppo (1875–1961), 167 Limes, 32–34, 202 f¨ ur Folgen, 72 inferior, 98 superior, 98 lineare Abbildung, 301, 316 lineare Abh¨angigkeit, 295, 317 lineare Gleichung, 291 lineare H¨ ulle, 295 lineare Relation nicht-triviale, 296 lineare Unabh¨angigkeit, 295, 317 Test, 297, 317 linearer Spann, 295 linearer Unterraum, 315 lineares Funktional, 321 lineares Gleichungssystem, 291
529 Linearformen, 321 Linearit¨at des Integrals, 131 Linearkombination, 295, 317 links–stetig, 43 L¨osbarkeit, 17, 19 Logarithmus -Reihe, 97 nat¨ urlicher, 111 zur Basis a, 113 logische Aussagen, 282 lokal gleichm¨aßige Konvergenz, 240 lokal integrierbare Funktionen, 168 lokale Umkehrfunktion, 245 lokales Extremum, 231 Maximum, 231 Minimum, 231 Majorantenkriterium f¨ ur Reihen, 82 Matrix, 5, 291 darstellende, 323 Matrizenprodukt, 302 maximale Elemente einer Menge, 13 Maximalprinzip, 253, 254 Maximum einer endlichen Menge von Zahlen, 25 einer Funktion, 53 lokales, 231 zweier Funktionen, 155 zweier Zahlen, 25 Maximumsnorm, 195 Menge, 7, 10 Metrik, 193 metrischer Raum, 193 Minimalprinzip, 253, 254 Minimum einer endlichen Menge von Zahlen, 25 einer Funktion, 53 lokales, 231 zweier Funktionen, 155 zweier Zahlen, 25 Minkowski -Form, 322 -Ungleichung, 195 Minkowski, Hermann (1864–1909), 195, 322 Mittelwertsatz, 66 f¨ ur vektorwertige Funktionen, 218 in mehreren Variablen, 219 Mittelwertsatz der Integralrechnung, 184 monoton, 41, 75 fallende Folge, 75 fallende Funktion, 41 steigende Folge, 75
530 steigende Funktion, 40 monotone Konvergenz, 167 multilineare Abbildung, 222 Multiplikation, 19 auf N, 259 der ganzen Zahlen, 265 der komplexen Zahlen, 278 der rationalen Zahlen, 269, 272 mit Skalaren, 294 von Matrizen, 302 n–dimensionaler Zahlenraum, 294 Nachfolger einer nat¨ urlichen Zahl, 261 negativ, 24 negativ definite symmetrische Bilinearform, 324 negativ semidefinite symmetrische Bilinearform, 325 negativer Teil einer Funktion, 144, 155 Negatives, 18 eines Elements, 315 neutrales Element einer Gruppe, 311 Newton, Isaac (1642–1727), 1, 135 Niveaumenge, 228 Norm, 193 H¨older-, 195 Maximums-, 195 p-, 195 Supremums-, 195 Norm-Konvergenz von Folgen integrierbarer Funktionen, 162 von Reihen integrierbarer Funktionen, 163 normierter Vektorraum, 193 Null, 2, 18, 261, 266, 315 Nullfunktion, 157 Nullmenge in R, 157 Nullteilerfreiheit von Z, 267 o.B.d.A., 35, 296 offen in R, 32 offene ¨ Uberdeckung, 205 Teilmenge, 198 Operatornorm, 211 Ordnung auf einem Zahlbereich, 24 partielle, 12 totale, 13, 24 orthogonales Komplement, 325 Orthogonalsystem, 325 Orthonormalbasis (ONB), 325 Orthonormalsystem (ONS), 325
INDEX Paarmenge, 284 Parabel kubische, 67 Paraboloid, 228 Partialbruchzerlegung, 124, 135 Partialsummen, 80 partiell differenzierbar, 225 partielle Ableitung, 225 Integration, 132 Ordnung, 12 Summation, 106 Partielle Summation, 85 Partitionen einer endlichen Menge, 124 Peano, Giuseppe (1858–1932), 261 periodische Funktionen, 117, 185 Permutation, 311 Permutationsmatrix, 310 Polarkoordinaten, 246 Polynom trigonometrisches, 185 Polynomdivision, 134 Polynomfunktion, 46, 102 Polynomgleichung, 2 positiv definite symmetrische Bilinearform, 324 positiv semidefinite symmetrische Bilinearform, 324 positive Zahlen, 24 rational, 270 reell, 274 positiver Teil einer Funktion, 144, 155 Potenzfunktionen, 45, 102, 114 Potenzmenge, 11, 197 Potenzmengenaxiom, 287 Potenzreihe, 97 pr¨akompakt, 208 Produkt topologisches, 197 von Funktionen, 35 Produktregel, 61, 216 Produkttopologie, 197, 200 Proposition, 12 Punkt-vor-Strich-Konvention, 22 punktweise Konvergenz, 93 Quadratfunktion, 64 Quadratwurzel, 64 Quotient, 20 von Funktionen, 35 Quotientenk¨orper, 271 Quotientenkriterium f¨ ur Potenzreihen, 99
INDEX f¨ ur Reihen, 83 Quotientenregel, 62 Rand einer Menge, 200 eines Intervalls, 31 rationale Funktionen, 46 Zahlen, 268 Realteil, 278 rechts–stetig, 43 reelle Zahlen, 28, 272, 276 Reflexivit¨at der Inklusion, 281 Reflexivit¨at einer Relation, 12, 263 Reihe, 80 Arkustangens-, 106 Brouncker, 106 Exponential-, 101 geometrische, 80 harmonische, 81 Kosinus-, 101 Kosinushyperbolikus-, 102 Leibniz-, 106 Logarithmus, 106 Sinus-, 101 Sinushyperbolikus-, 102 Reihe-Integral-Vergleichskriterium, 173 Rekursion, 109 Relation, 11 Relativtopologie, 199 Repr¨asentant ¨ einer Aquivalenzklasse, 263 Riemann, Bernhard (1826–1866), 153 Riesz, Frigyes (1880–1956), 165 Ring, 7, 267 kommutativer, 267 Rotation, 235 Russel -Paradoxon, 283 Sattelfl¨ache, 229 Satz u ¨ber implizite Funktionen, 242 von Abel, 105 von Bolzano–Weierstraß, 77 von der dominierten Konvergenz, 167 von der lokalen Umkehrbarkeit, 245 von der monotonen Konvergenz, 167 von Heine–Borel, 206 von Tauber, 106 schiefsymmetrische Bilinearform, 324 Schnitt von Mengen, 11 Schranke
531 gr¨oßte untere, 28 kleinste obere, 28 obere, 28 obere (f¨ ur partielle Ordnungen), 13 untere, 28 untere (f¨ ur partielle Ordnungen), 13 Signum einer Permutation, 312 Sinus, 115 Sinushyperbolikusreihe komplex, 102 Sinusreihe, 115 komplex, 101 Skalar, 294 skalare Multiplikation f¨ ur Folgen, 71 f¨ ur Funktionen, 35 Skalarprodukt, 325 euklidisches, 322 Spalten einer Matrix, 291 Spaltenrang, 309 Spaltenumformung, 292 Spaltenvektoren einer Matrix, 309 Spann linearer, 295, 317 Sph¨are, 232 Spurtopologie, 199 Stammfunktion, 131 Standardbasis, 298 stetig, 43, 94 stetig differenzierbar n-mal, 222 Stetigkeit, 202 in einem Punkt, 201 Stirling, James (1692–1770), 124 Stokes, George Gabriel (1819–1903), 235 streng monoton fallende Funktion, 41 steigende Funktion, 41 strikt monoton fallende Folge, 75 fallende Funktion, 41 steigende Folge, 75 steigende Funktion, 41 Stufen einer Matrix, 293 Stufenfunktion, 137 Stufenl¨ange, 293 Substitutionsregel, 132 Summe einer Reihe, 80 von Funktionen, 35 Supremum, 29
532 Supremumsnorm, 195 surjektiv, 50, 256 surjektive Abbildung, 299 Symmetrie, 8 einer Relation, 263 symmetrische Bilinearform, 324 Gruppe, 311 Matrix, 324 symmetrische Differenz, 287 Tangens, 119 Tauber, Alfred (1866–1942), 106 Taylor -Entwicklung, 181 -Formel, 181 -Formel, in mehreren Variablen, 223, 236 -Polynom, 181 -Reihe, 185 -Restglied, 181 -Restglied (Lagrange–Form), 185 Taylor, Brook (1685–1731), 181 Teilfolge, 76 Teilmenge, 281 Teilmengen, 10 Tensoren, 222 Topologie diskrete, 199 indiskrete, 199 kofinite, 199 topologischer Raum, 197 total geordnete Teilmengen, 13 totalbeschr¨ankt, 208 totale Ordnung, 13, 24 Transitivit¨at der Inklusion, 281 Transitivit¨at einer Relation, 12, 25, 263 transponierte Matrix, 309 Trichotomie, 25, 254 trigonometrisches Polynom, 185 Tschebyscheff, Pafnuty (1821–1894), 135 u ¨berabz¨ahlbar, 162 ¨ Uberabz¨ ahlbarkeit von R, 85 ¨ Uberdeckung, 205 Umgebung eines Punktes, 194 Umkehrabbildung, 300 umkehrbare Abbildung, 300 Umkehrfunktion, 50 Ableitung, 63, 245 lokale, 245 Umordnungssatz, 86 Unbeschr¨anktheitsaxiom, 255
INDEX uniformer Raum, 204 Unterraum linearer, 295 Urbild, 203 einer Abbildung, 299 Vektor, 294 Vektorfeld, 235 Vektorraum, 315 Unter-, 315 Vereinigung, 284 Vereinigung von Mengen, 11, 256 Verkn¨ upfung von Abbildungen, 299 von Elementen, 7 Vertr¨aglichkeit, 24 vollst¨andige Induktion, 255 Vollst¨andigkeit, 28, 29 eines metrischen Raums, 204 Weierstraß, Karl (1815–1897), 77 Wert einer Reihe, 80 Wohldefiniertheit, 265 wohlgeordnet, 13 Wohlordnungssatz, 13 Wurzel n-te, 51, 64 Wurzelkriterium f¨ ur Potenzreihen, 99 f¨ ur Reihen, 83 Zahlen ganze, 2 komplexe, 2 nat¨ urliche, 2, 257 rationale, 2 reelle, 2 Zeilen einer Matrix, 291 Zeilenrang, 309 Zeilenstufenform, 293 Zeilenumformung, 292 Zeilenvektoren einer Matrix, 309 Zermelo, Ernst (1871–1953), 12 Zorn, Max (1906–1993), 13 zusammengesetzte Reihen, 86 zweite Ableitung, 220 Zwischenwertsatz, 49
Literaturverzeichnis [Be03] Behrends, E., Analysis I,II. Vieweg, Braunschweig 2003 [Bo68] Boyer, C.B., A History of Mathematics. Wiley, 1968 [Br92] Br¨ocker, Th., Analysis I,II. B.I. Wissenschaftsverlag, Mannheim 1992 [DH85] Davis, Ph.J., Hersh, R., Erfahrung Mathematik. Birkh¨auser, Basel, 1985 [Di87] Dieudonn´e, J., Grundz¨ uge der modernen Analysis, Band 1-9. Vieweg, Braunschweig, 1987 [Eb92] Ebbinghaus, H.-D., et al., Zahlen. Springer, Berlin, 1992 [Ed79] Edwards, C.H., The Historical Developements of the Calculus. Springer, New York, 1979 [Fo83] Forster, O., Analysis I,II. Vieweg, Braunschweig 1983 [Ge90] Gelbaum, B., Olmsted, J., Theorems and counterexamples in mathematics. Springer, New York, 1990 [GH70] Griffith, H.B., Hilton, P.J., Classical Mathematics. Springer, New York, 1970 [Ha72] Halmos, P.R., Naive Mengenlehre. Vandenhoeck und Rupprecht, G¨ottingen, 1972 [HW96] Hairer, E., Wanner, G., Analysis by its History. Springer, New York, 1996 [Heu80] Heuser, H., Lehrbuch der Analysis, Teil 1 und 2. Teubner, Stuttgart 1980 [Hol98] Holdgr¨ un, H.S., Analysis I,II. Leins Verlag, G¨ottingen 1998 [If86] Ifrah, G., Universalgeschichte der Zahlen. Campus Verlag, Frankfurt, 1986 [J¨a96] J¨anich, K.: Lineare Algebra. 6.Auflage, Springer, Berlin, 1996 [Kat98] Katz, V.J., A History of Mathematics. Addison-Wesley, 1998 [Kl72] Kline, M., Mathematical Thought from Ancient to Modern Times. Oxford University Press, 1972 [Ko86] Koch, H., Einf¨ uhrung in die klassische Mathematik I. Springer, Berlin, 1986 [K¨o90] K¨onigsberger, K. Analysis I,II. Springer, Berlin 1990 [Mar92] Martensen, E., Analysis I,II. B.I. Wissenschaftsverlag, Mannheim 1992 [MM93] Mikusinski, J., Mikusinski, P., An introduction to analysis. Wiley, New York 1993 [Noeb76] N¨obeling, G., Einf¨ uhrung in die nichteuklidischen Geometrien der Ebene, de Gruyter, Berlin, 1976 [Ru98] Rudin, W., Analysis. Oldenbourg Verlag, M¨ unchen 1998 [Si98] Singh, S., Fermats letzter Satz. Hanser, M¨ unchen, 1998 [Wi95] Wickert, J., Isaac Newton. Rowohlt, 1995
533