Springer-Lehrbuch
Dirk Werner
Funktionalanalysis 7., korrigierte und erweiterte Auflage
123
Prof. Dr. Dirk Werner Freie Universität Berlin Fachbereich Mathematik und Informatik Arnimallee 6 14195 Berlin Deutschland
[email protected]
ISSN 0937-7433 ISBN 978-3-642-21016-7 e-ISBN 978-3-642-21017-4 DOI 10.1007/978-3-642-21017-4 Springer Heidelberg Dordrecht London New York Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. Mathematics Subject Classification (2010): 46-01, 47-01 c Springer-Verlag Berlin Heidelberg 1995, 1997, 2000, 2002, 2005, 2007, 2011 Dieses Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte, insbesondere die der Übersetzung, des Nachdrucks, des Vortrags, der Entnahme von Abbildungen und Tabellen, der Funksendung, der Mikroverfilmung oder der Vervielfältigung auf anderen Wegen und der Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Eine Vervielfältigung dieses Werkes oder von Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen der gesetzlichen Bestimmungen des Urheberrechtsgesetzes der Bundesrepublik Deutschland vom 9. September 1965 in der jeweils geltenden Fassung zulässig. Sie ist grundsätzlich vergütungspflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des Urheberrechtsgesetzes. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Einbandentwurf: WMXDesign GmbH, Heidelberg Gedruckt auf säurefreiem Papier Springer ist Teil der Fachverlagsgruppe Springer Science+Business Media (www.springer.com)
Fu ¨r Irina, Felix und Nina
Vorwort
Die Grundidee der Funktionalanalysis ist es, Folgen oder Funktionen als Punkte in einem geeigneten Vektorraum zu interpretieren und Probleme der Analysis durch Abbildungen auf einem solchen Raum zu studieren. Zu nichttrivialen Aussagen kommt man aber erst, wenn man Vektorr¨aume mit einer Norm versieht und analytische Eigenschaften wie Stetigkeit etc. der Abbildungen untersucht. Es ist dieses Zusammenspiel von analytischen und algebraischen Ph¨ anomenen, das die Funktionalanalysis auszeichnet und reizvoll macht. Der Ursprung der Funktionalanalysis liegt Anfang dieses Jahrhunderts in Arbeiten von Hilbert, Schmidt, Riesz und anderen; sp¨ater wurde sie durch Banach und von Neumann, die die heute gel¨aufigen Begriffe des normierten Raums und des Hilbertraums pr¨ agten, kanonisiert. Funktionalanalytische Kenntnisse sind mittlerweile in vielen Disziplinen der Mathematik wie Differentialgleichungen, Numerik, Wahrscheinlichkeitstheorie oder Approximationstheorie sowie in der theoretischen Physik unabdingbar. Dieses Buch bietet eine Einf¨ uhrung in Methoden und Ergebnisse der Funktionalanalysis. Seine ersten sieben Kapitel widmen sich den normierten R¨aumen und den zwischen ihnen wirkenden linearen Abbildungen; die letzten beiden Kapitel studieren allgemeinere Situationen. Wie jede ausgereifte Theorie entwickelt auch die Funktionalanalysis eine F¨ ulle nichttrivialer Resultate aus ganz wenigen Grundbegriffen. Es ist ein Anliegen dieses Textes, diese Resultate ausf¨ uhrlich darzustellen und an vielen Beispielen zu veranschaulichen. Im einzelnen werden in den Kapiteln I und II Beispiele und elementare Eigenschaften normierter R¨ aume und stetiger sowie kompakter linearer Abbildungen vorgestellt, Kapitel III enth¨alt Existenzs¨atze f¨ ur stetige Funktionale, und Kapitel IV bringt die Haupts¨atze u ¨ber Operatoren auf vollst¨andigen normierten R¨ aumen. Kapitel V studiert den f¨ ur die Anwendungen besonders wichtigen Fall der R¨aume mit Skalarprodukt (Hilbertr¨aume), und die n¨ achsten beiden Kapitel widmen sich der Eigenwert-
viii
Vorwort
theorie. Schließlich kommt in Kapitel VIII mit den lokalkonvexen R¨aumen eine allgemeinere Raumklasse zur Sprache; die Notwendigkeit hierf¨ ur wird sowohl von der Theorie als auch von den Anwendungen diktiert. Das abschließende Kapitel IX behandelt Banachalgebren. Vieles, was hier dargestellt wird, ist klassischer Bestand aller Funktionalanalysisvorlesungen. Dar¨ uber hinaus wird noch manches speziellere Thema angesprochen, z.B. das Problem der Approximation kompakter Operatoren durch endlichdimensionale und der Interpolationssatz von Riesz und Thorin in Kapitel II, Existenz und Nichtexistenz stetiger Projektionen auf Banachr¨aumen in Kapitel IV, die Einbettungss¨atze von Sobolev und Rellich in Kapitel V, eine Einf¨ uhrung in die Theorie der nuklearen und HilbertSchmidt-Operatoren in Kapitel VI, einen Abriß der Schwartzschen Distributionentheorie auf der Basis der lokalkonvexen R¨aume in Kapitel VIII oder die GNS-Konstruktion f¨ ur nichtkommutative C ∗ -Algebren in Kapitel IX. Zu jedem Kapitel gibt es Aufgaben (viele mit L¨osungshinweisen) und eine Rubrik namens Bemerkungen und Ausblicke“; dort findet man ” neben historischen Anmerkungen noch diverse weitere Ergebnisse, die mit dem dargestellten Material verwandt sind, jedoch nicht bewiesen werden. So bleibt dem Gesamtleser (hoffentlich) auch beim wiederholten Aufschla¨ gen noch etwas Neues und Interessantes zu entdecken. Ubrigens ist die Geschichte der Funktionalanalysis in viel gr¨ oßerem Detail in den B¨ uchern von Dieudonn´e [1981] und Monna [1973] nachzulesen. Das vorliegende Buch ist aus Skripten zu zweisemestrigen Vorlesungen entstanden, die ich mehrfach an der Freien Universit¨at Berlin gehalten habe. Es wendet sich an Studierende der Mathematik und Physik, die die Vorlesungen u ¨ ber Analysis und lineare Algebra absolviert haben, womit im wesentlichen die erwarteten Vorkenntnisse definiert sind. Zum Verst¨andnis des Textes ist etwas Erfahrung mit dem Begriff des metrischen Raums hilfreich; metrische R¨aume werden heute ja u ¨blicherweise schon in der Analysisvorlesung behandelt, und im Anhang B sind die notwendigen Informationen dazu noch einmal zusammengestellt. Den Begriff des topologischen Raums braucht man erst in Kapitel VIII; auch hierzu findet man eine Einf¨ uhrung im Anhang B. W¨ unschenswert sind Grundkenntnisse der Maß- und Integrationstheorie etwa im Umfang des Anhangs A. An ganz wenigen Stellen werden funktionentheoretische Kenntnisse herangezogen. Abschließend m¨ ochte ich mich bei allen bedanken, die mit Rat und Tat zu diesem Buch beigetragen haben, insbesondere bei J. Averdunk, E. Behrends, J. Brasche, A. Defant, U. Fuchs, P. Harmand, W. Hensgen, H. Jarchow, R. Pay´a, L. Seifert sowie mehreren Jahrg¨angen von Studierenden, die an meinen Vorlesungen teilgenommen haben. Berlin, im April 1995
Dirk Werner
Vorwort zur siebten Auflage
Die neue Auflage enth¨ alt in Kapitel VIII zwei neue Abschnitte u ¨ber schwach kompakte Mengen und schwach kompakte Operatoren; außerdem habe ich die Gelegenheit genutzt, Tippfehler und mathematische Ungenauigkeiten zu verbessern sowie neuere Literaturhinweise einzuarbeiten. Eine besonders ausf¨ uhrliche Errataliste erhielt ich von Daniel Lengeler; ihm und allen anderen Leserinnen und Lesern, die mir ihre Kommentare geschickt haben, m¨ochte ich herzlich danken. Wenn auch Sie auf etwaige Umgereimtheiten stoßen, informieren Sie mich bitte. Die schwerwiegenderen F¨ alle werde ich wie bisher auf meiner Homepage http://www.math.fu-berlin.de/∼werner bzw. http://page.mi.fu-berlin.de/∼werner dokumentieren. (Letzteres ist die offizielle“ Adressierung derselben Seite.) ” Weil dieses Buch zuerst 1995 und damit vor der Rechtschreibreform erschienen ist, ist es auch in dieser Neuauflage bei daß statt dass, meßbar statt messbar etc. (und bei Weierstraß sowieso) geblieben. Berlin, im Mai 2011
Dirk Werner
Inhaltsverzeichnis
I. Normierte R¨ aume . . . . . . . . . . . . . . . . . . . . I.1 Beispiele normierter R¨ aume . . . . . . . . . . . . . I.2 Eigenschaften normierter R¨ aume . . . . . . . . . . I.3 Quotienten und Summen von normierten R¨aumen I.4 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . I.5 Bemerkungen und Ausblicke . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
1 1 23 34 35 40
II. Funktionale und Operatoren . . . . . . . . . . . . . . . . II.1 Beispiele und Eigenschaften stetiger linearer Operatoren II.2 Dualr¨aume und ihre Darstellungen . . . . . . . . . . . . II.3 Kompakte Operatoren . . . . . . . . . . . . . . . . . . . II.4 Interpolation von Operatoren auf Lp -R¨aumen . . . . . . II.5 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . II.6 Bemerkungen und Ausblicke . . . . . . . . . . . . . . . .
. . . . . . .
. . . . . . .
45 45 58 65 72 80 87
III. Der Satz von Hahn-Banach und seine Konsequenzen III.1 Fortsetzungen von Funktionalen . . . . . . . . . . . . . . III.2 Trennung konvexer Mengen . . . . . . . . . . . . . . . . III.3 Schwache Konvergenz und Reflexivit¨at . . . . . . . . . . III.4 Adjungierte Operatoren . . . . . . . . . . . . . . . . . . III.5 Differentiation nichtlinearer Abbildungen . . . . . . . . III.6 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . III.7 Bemerkungen und Ausblicke . . . . . . . . . . . . . . . .
. . . . . . . .
. . . . . . . .
93 93 100 104 109 112 126 131
IV. Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen IV.1 Vorbereitung: Der Bairesche Kategoriensatz . . . . . . IV.2 Das Prinzip der gleichm¨ aßigen Beschr¨anktheit . . . . . IV.3 Der Satz von der offenen Abbildung . . . . . . . . . .
. . . .
. . . .
139 139 142 153
. . . .
xii
Inhaltsverzeichnis
IV.4 IV.5 IV.6 IV.7 IV.8 IV.9
Der Satz vom abgeschlossenen Graphen Der Satz vom abgeschlossenen Bild . . . Projektionen auf Banachr¨ aumen . . . . Fixpunkts¨ atze . . . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . Bemerkungen und Ausblicke . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
156 160 163 166 187 195
V. Hilbertr¨ aume . . . . . . . . . . . . . . . . . . V.1 Definitionen und Beispiele . . . . . . . . . V.2 Fouriertransformation und Sobolevr¨aume V.3 Orthogonalit¨ at . . . . . . . . . . . . . . . V.4 Orthonormalbasen . . . . . . . . . . . . . V.5 Operatoren auf Hilbertr¨ aumen . . . . . . V.6 Aufgaben . . . . . . . . . . . . . . . . . . V.7 Bemerkungen und Ausblicke . . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
203 203 212 224 232 238 243 251
VI. Spektraltheorie kompakter Operatoren . . . VI.1 Das Spektrum eines beschr¨ ankten Operators . VI.2 Die Theorie von Riesz . . . . . . . . . . . . . VI.3 Kompakte Operatoren auf Hilbertr¨ aumen . . VI.4 Anwendungen auf Integralgleichungen . . . . VI.5 Nukleare Operatoren . . . . . . . . . . . . . . VI.6 Hilbert-Schmidt-Operatoren . . . . . . . . . . VI.7 Aufgaben . . . . . . . . . . . . . . . . . . . . VI.8 Bemerkungen und Ausblicke . . . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
257 257 262 270 276 286 298 308 312
VII. Spektralzerlegung selbstadjungierter Operatoren VII.1 Der Spektralsatz f¨ ur beschr¨ ankte Operatoren . . . . VII.2 Unbeschr¨ ankte Operatoren . . . . . . . . . . . . . . VII.3 Der Spektralsatz f¨ ur unbeschr¨ ankte Operatoren . . VII.4 Operatorhalbgruppen . . . . . . . . . . . . . . . . . VII.5 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . VII.6 Bemerkungen und Ausblicke . . . . . . . . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
319 319 343 356 359 380 385
VIII. Lokalkonvexe R¨ aume . . . . . . . . . . . . . . . . . . VIII.1 Definition lokalkonvexer R¨ aume; Beispiele . . . . . . VIII.2 Stetige Funktionale und der Satz von Hahn-Banach VIII.3 Schwache Topologien . . . . . . . . . . . . . . . . . VIII.4 Extremalpunkte und der Satz von Krein-Milman . . VIII.5 Einf¨ uhrung in die Distributionentheorie . . . . . . . VIII.6 Schwache Kompaktheit . . . . . . . . . . . . . . . . VIII.7 Schwach kompakte Operatoren . . . . . . . . . . . . VIII.8 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . VIII.9 Bemerkungen und Ausblicke . . . . . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
395 395 402 409 420 429 438 448 455 464
xiii
Inhaltsverzeichnis
IX. Banachalgebren . . . . . . . . . . . . . IX.1 Grundbegriffe und Beispiele . . . . . IX.2 Die Gelfandsche Darstellungstheorie IX.3 C ∗ -Algebren . . . . . . . . . . . . . . IX.4 Aufgaben . . . . . . . . . . . . . . . IX.5 Bemerkungen und Ausblicke . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
475 475 479 485 496 499
Anhang A. Maß- und Integrationstheorie . . . . . . . . . . . . A.1 Das Lebesgueintegral f¨ ur Funktionen auf einem Intervall . . A.2 Das d-dimensionale Lebesguemaß und abstrakte Integration A.3 Konvergenzs¨ atze . . . . . . . . . . . . . . . . . . . . . . . . A.4 Signierte und komplexe Maße . . . . . . . . . . . . . . . . .
505 505 513 515 517
Anhang B. Metrische und topologische R¨ aume . . . . . . . . 519 B.1 Metrische R¨ aume . . . . . . . . . . . . . . . . . . . . . . . . 519 B.2 Topologische R¨ aume . . . . . . . . . . . . . . . . . . . . . . 525 Symbolverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . 533 Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . 537 Namen- und Sachverzeichnis . . . . . . . . . . . . . . . . . . . . 543
Kapitel I
Normierte R¨ aume
I.1
Beispiele normierter R¨ aume
Im folgenden werden Vektorr¨ aume u ¨ ber den K¨orpern K = R oder K = C betrachtet. Außerdem wird stillschweigend gelegentlich der triviale Vektorraum {0} ausgeschlossen. Wir verwenden die Bezeichnung K-Vektorraum, um anzudeuten, daß sowohl ein reeller als auch ein komplexer Vektorraum gemeint sein kann. Definition I.1.1 Sei X ein K-Vektorraum. Eine Abbildung p: X → [0, ∞) heißt Halbnorm, falls (a) p(λx) = |λ|p(x) ∀λ ∈ K, x ∈ X, (b) p(x + y) ≤ p(x) + p(y) ∀x, y ∈ X gilt. ((b) heißt Dreiecksungleichung.) Gilt zus¨atzlich (c) p(x) = 0 ⇒ x = 0, so heißt p eine Norm. Normen werden u ¨ blicherweise mit dem Symbol . (statt p) bezeichnet. Man nennt das Paar (X, p) einen halbnormierten bzw. gegebenenfalls einen normierten Raum. Ist es aus dem Zusammenhang klar oder selbstverst¨andlich, welche (Halb-)Norm gemeint ist, spricht man von X selbst als (halb-)normiertem Raum. Beachte, daß aus (a) allein bereits p(0) = 0 folgt; dazu wende (a) mit λ = 0 und x = 0 an: p(0) = p(0 · 0) = 0 · p(0) = 0. Auf einem normierten Raum (X, . ) wird in nat¨ urlicher Weise eine Metrik induziert; setze n¨ amlich d(x, y) = x − y
∀x, y ∈ X.
In der Tat verifiziert man leicht die Axiome (x, y, z ∈ X beliebig)
D. Werner, Funktionalanalysis, 7. Aufl., Springer-Lehrbuch, DOI 10.1007/978-3-642-21017-4_1, © Springer-Verlag Berlin Heidelberg 2011
2
I.
(a) (b) (c) (d)
Normierte R¨ aume
d(x, y) ≥ 0, d(x, y) = d(y, x), d(x, z) ≤ d(x, y) + d(y, z), d(x, y) = 0 ⇐⇒ x = y.
(Z.B. folgt (c) aus d(x, z) = x − z = (x − y) + (y − z) ≤ x − y + y − z = d(x, y) + d(y, z).) In einem halbnormierten Raum erh¨ alt man bloß eine Halbmetrik, d.h., in (d) gilt nur die Implikation ⇐. Damit sind in einem (halb-)normierten Raum topologische Begriffe wie konvergente Folge, Cauchyfolge, Stetigkeit, Kompaktheit etc. definiert, mit denen wir uns demn¨ achst n¨ aher besch¨ aftigen werden. (Die wichtigsten Tatsachen u aume sind im Anhang B zusammengestellt.) Einst¨ ber metrische R¨ weilen sei daran erinnert, daß eine Folge (xn ) von Elementen eines (halb-) normierten Raums X eine Cauchyfolge ist, falls ∀ε > 0 ∃N (ε) ∈ N ∀n, m ≥ N (ε) xn − xm < ε gilt. Ferner konvergiert (xn ) gegen x ∈ X (in Zeichen limn→∞ xn = x), falls ∀ε > 0 ∃N (ε) ∈ N ∀n ≥ N (ε) xn − x < ε gilt (wobei jeweils auch ≤ ε“ h¨ atte stehen d¨ urfen). ” F¨ ur Folgen des Kn mit seiner nat¨ urlichen Metrik gilt bekanntlich die ¨ Aquivalenz von Cauchy-Eigenschaft und Konvergenz; in allgemeinen normierten R¨aumen ist das jedoch nicht mehr richtig (siehe S. 6). Nat¨ urlich sind konvergente Folgen stets Cauchyfolgen. Definition I.1.2 Ein metrischer Raum, in dem jede Cauchyfolge konvergiert, heißt vollst¨andig. Ein vollst¨ andiger normierter Raum heißt Banachraum. Ein nicht vollst¨ andiger normierter Raum X kann stets in einen Banachraum eingebettet“ werden. Dazu betrachte die Menge CF (X) aller ” ¨ Cauchyfolgen in X, erkl¨ are eine Aquivalenzrelation ∼ auf CF (X) durch (xn ) ∼ (yn ) ⇐⇒ xn − yn → 0, als Menge aller Aquivalenzklassen. ¨ und definiere X Man zeigt dann, daß X die Struktur eines Vektorraums tr¨ agt, auf dem [(xn )] = lim xn n→∞
I.1
3
Beispiele normierter R¨ aume
eine vollst¨andige Norm induziert. Identifiziert man X mit den konstanten so wird X in nat¨ dicht eingebettet. X wird Folgen in X, urlicher Weise in X Vervollst¨andigung von X genannt; man kann außerdem zeigen, daß eine solche Vervollst¨andigung im wesentlichen (d.h. bis auf Isometrie“) eindeutig ” bestimmt ist. Dieses Verfahren erinnert an eine der Konstruktionen von R als Vervollst¨andigung von Q. In Kapitel III wird eine elegantere Methode vorgestellt, die Vervollst¨ andigung eines normierten Raums zu definieren. Wir werden im weiteren Verlauf sehen, daß die Vollst¨andigkeit zum Beweis vieler nichttrivialer Aussagen wesentlich ist (vgl. Kapitel IV). Im Rest dieses Abschnitts diskutieren wir einige Beispiele normierter R¨aume. Beispiele. (a) In der Analysis werden auf Kn die Normen (x = (x1 , . . . , xn )) x 1 = x 2 =
n
|xi |,
i=1 n
1/2 |xi |2
,
i=1
x ∞ =
max |xi |
i=1,...,n
betrachtet. Diese Normen sind insofern gleichwertig, als eine Folge genau dann bez¨ uglich einer dieser Normen konvergiert, wenn sie auch bez¨ uglich der u ¨brigen Normen konvergiert. (b) T sei eine Menge. ∞ (T ) sei der Vektorraum (!) aller beschr¨ankten Funktionen von T nach K. F¨ ur x ∈ ∞ (T ) setze x ∞ = sup |x(t)| (< ∞). t∈T
Man nennt . ∞ die Supremumsnorm. Es gilt: • (∞ (T ), . ∞ ) ist ein Banachraum. Um das einzusehen, u ¨ berzeugen wir uns zuerst, daß . ∞ in der Tat eine Norm ist. Nur die Dreiecksungleichung ist hier eventuell nicht ganz offensichtlich. Seien also x, y ∈ ∞ (T ), t0 ∈ T . Dann ist |x(t0 ) + y(t0 )| ≤ |x(t0 )| + |y(t0 )| ≤ sup |x(t)| + sup |y(t)| t∈T
= x ∞ + y ∞. ¨ Nach Ubergang zum Supremum u ¨ ber alle t0 ∈ T folgt x + y ∞ ≤ x ∞ + y ∞ .
t∈T
4
I.
Normierte R¨ aume
Wir kommen jetzt zur behaupteten Vollst¨andigkeit. Sei (xn ) eine Cauchyfolge in ∞ (T ). Es ist die Existenz eines Elements x ∈ ∞ (T ) mit xn − x ∞ → 0 zu zeigen. Dazu beachte die Ungleichung |y(t)| ≤ y ∞ ∞ f¨ ur alle t ∈ T , y ∈ (T ). Sie impliziert, daß bei beliebigem t ∈ T die Zahlenfolge xn (t) eine Cauchyfolge ist, die auf Grund der Vollst¨andigkeit des Skalarenk¨ orpers einen Limes besitzt, den wir mit x(t) bezeichnen. Auf diese Weise wird eine Funktion x: T → K definiert. Wir zeigen jetzt, daß x beschr¨ankt ist und daß (xn ) bez¨ uglich der Supremumsnorm gegen x konvergiert. Zun¨ achst w¨ ahle bei gegebenem ε > 0 eine nat¨ urliche Zahl N mit xn − xm ∞ ≤ ε ∀n, m ≥ N. Sei t ∈ T . Wegen xn (t) → x(t) existiert m0 = m0 (ε, t) mit |xm0 (t) − x(t)| ≤ ε. Ohne Einschr¨ankung darf m0 ≥ N angenommen werden, es gilt also f¨ ur alle n ≥ N |xn (t) − x(t)| ≤ |xn (t) − xm0 (t)| + |xm0 (t) − x(t)| ≤ xn − xm0 ∞ + ε ≤ 2ε. F¨ ur beliebiges t ∈ T ergibt sich nun zum einen |x(t)| ≤ |xN (t)| + |x(t) − xN (t)| ≤ xN ∞ + 2ε, d.h., x ist beschr¨ ankt, zum anderen folgt xn − x ∞ ≤ 2ε
∀n ≥ N,
d.h., limn→∞ xn = x. Konvergenz bzgl. der Supremumsnorm ist gleichbedeutend mit gleichm¨aßiger Konvergenz. Sp¨ ater werden auch noch weitere Konvergenzbegriffe behandelt, die mit anderen Normen zusammenh¨angen. ∞ (T ) ist der gr¨ oßte Raum von Funktionen auf T , auf dem die Supremumsnorm definiert ist. Es u ¨berrascht daher nicht, daß ∞ (T ) vollst¨andig ist (denn was sollte fehlen?). Wir werden als n¨achstes einige Untervektorr¨aume betrachten. Dabei wird sich das folgende Lemma als n¨ utzlich erweisen. Lemma I.1.3 (a) Ist X ein Banachraum und U ein abgeschlossener Untervektorraum von X, so ist U vollst¨ andig.
I.1
5
Beispiele normierter R¨ aume
(b) Ist X ein normierter Raum und U ein vollst¨ andiger Untervektorraum von X, so ist U abgeschlossen. Beweis. (a) Sei (xn ) eine Cauchyfolge in U . Da X vollst¨andig ist, existiert limn→∞ xn =: x ∈ X. Wegen der Abgeschlossenheit von U muß x sogar in U liegen. (b) Seien xn ∈ U und gelte limn→∞ xn = x ∈ X. Wir werden x ∈ U zeigen. Als konvergente Folge ist (xn ) insbesondere eine Cauchyfolge in U . U ist vollst¨andig, weshalb (xn ) einen Grenzwert in U besitzt. Dieser ist jedoch eindeutig bestimmt, also ist x ∈ U , wie behauptet. 2 Das Lemma gestattet es, die Vollst¨ andigkeitsbeweise f¨ ur normierte R¨aume U , die als Unterr¨ aume von Banachr¨ aumen X erkannt sind, zu vereinfachen: Statt die Existenz von limn→∞ xn f¨ ur eine Cauchyfolge in U zu beweisen, braucht nur die Abgeschlossenheit von U gezeigt zu werden, d.h., wenn limn→∞ xn in X existiert, so liegt der Grenzwert bereits in U . Wir illustrieren dieses Prinzip in den folgenden Beispielen (c)–(f). Beispiel. (c) R¨aume stetiger Funktionen. Sei T ein metrischer (oder auch bloß topologischer) Raum. (Als einfachstes Beispiel denke man an Teilmengen von R.) C b (T ) bezeichne die Menge der stetigen beschr¨ankten Funktionen von T nach K. Da Summen und Vielfache stetiger Funktionen wieder stetig sind, ist C b (T ) ein Untervektorraum von ∞ (T ). Wir zeigen nun: • C b (T ), versehen mit der Supremumsnorm, ist ein Banachraum. Nach Lemma I.1.3(a) ist nur zu zeigen, daß C b (T ) abgeschlossen in (T ) ist. Zu zeigen ist also: Konvergiert die Folge (xn ) stetiger beschr¨ankter Funktionen gleichm¨ aßig gegen die beschr¨ ankte Funktion x, so ist x ebenfalls stetig. Das ist jedoch ein bekannter Satz der Analysis! Der Vollst¨andigkeit halber folgt hier der Beweis, es handelt sich um ein sog. 3ε -Argument. Zu ε > 0 w¨ahle N ∈ N mit xN − x ∞ ≤ 3ε . Sei t0 ∈ T . Wegen der Stetigkeit von xN existiert δ > 0 mit (d bezeichne die Metrik von T ) ∞
d(t, t0 ) < δ
⇒ |xN (t) − xN (t0 )| ≤
ε . 3
Dann gilt f¨ ur t mit d(t, t0 ) < δ |x(t) − x(t0 )| ≤ |x(t) − xN (t)| + |xN (t) − xN (t0 )| + |xN (t0 ) − x(t0 )| ≤ 2 x − xN ∞ + |xN (t) − xN (t0 )| ε ε ≤ 2 + = ε, 3 3 also ist x stetig bei t0 .
6
I.
Normierte R¨ aume
Ist T sogar ein kompakter metrischer (oder kompakter topologischer) Raum, so ist jede stetige Funktion von T nach K beschr¨ankt; man schreibt in diesem Fall C(T ) statt C b (T ). Das Symbol C leitet sich u ¨ brigens von dem franz¨osischen Wort f¨ ur stetig, continu, her. Des weiteren ist der Raum C0 (T ) (speziell C0 (Rn )) von Interesse, der aus den im Unendlichen verschwindenden“ stetigen Funktionen f auf ei” nem lokalkompakten Raum T besteht. Damit ist gemeint, daß f¨ ur alle ε > 0 die Menge {t ∈ T : |f (t)| ≥ ε} kompakt ist. Es ist leicht zu sehen, daß C0 (T ) in C b (T ) abgeschlossen, also mit der Supremumsnorm versehen ein Banachraum ist. Beispiel. (d) R¨aume differenzierbarer Funktionen. C 1 [a, b] sei der Vektorraum der stetig differenzierbaren Funktionen auf dem kompakten Intervall [a, b]; C 1 [a, b] ist also ein Untervektorraum von C[a, b]. C 1 [a, b] ist aber nicht abgeschlossen in der Supremumsnorm, nach Lemma I.1.3(b) ist (C 1 [a, b], . ∞ ) kein Banachraum. (In der Tat definiert – etwa f¨ ur a = −1, b = 1 – die Vorschrift xn (t) = (t2 + n1 )1/2 eine Folge stetig differenzierbarer Funktionen, die gleichm¨ aßig gegen die nicht differenzierbare Funktion | . | konvergiert.) Betrachte nun jedoch f¨ ur x ∈ C 1 [a, b] die Normen x =
sup max{|x(t)|, |x (t)|} = max{ x ∞ , x ∞ }, t∈[a,b]
|||x||| = x ∞ + x ∞ . Es ist leicht zu sehen, daß . und ||| . ||| Normen sind; z.B. sieht man die Dreiecksungleichung f¨ ur ||| . ||| so: |||x + y||| = x + y ∞ + (x + y) ∞ = x + y ∞ + x + y ∞ ≤ x ∞ + y ∞ + x ∞ + y ∞ = |||x||| + |||y|||. Außerdem sieht man sofort die Ungleichung x ≤ |||x||| ≤ 2 x
∀x ∈ C 1 [a, b];
(I.1)
man sagt, . und ||| . ||| seien ¨ aquivalente“ Normen (mehr dazu in Ab” schnitt I.2). Die Ungleichung (I.1) zeigt, daß eine Folge genau dann eine Cauchyfolge bzgl. . ist (bzw. konvergiert), wenn sie bzgl. ||| . ||| eine Cauchyfolge ist (bzw. konvergiert). Deshalb ist die Vollst¨andigkeit von (C 1 [a, b], . ) ¨aquivalent zur Vollst¨ andigkeit von (C 1 [a, b], ||| . |||), und Konvergenz bzgl. . oder ||| . ||| ist jeweils ¨ aquivalent zur gleichm¨aßigen Konvergenz sowohl der Funktionenfolge (xn ) als auch der Folge der Ableitungen
I.1
7
Beispiele normierter R¨ aume
(xn ). Ist daher (xn ) eine . - (oder ||| . |||-)Cauchyfolge, so sind (xn ) und (xn ) . ∞ -Cauchyfolgen, die wegen der Vollst¨andigkeit von C[a, b] jeweils Limiten x bzw. y besitzen. Ein bekannter Satz der Analysis besagt nun, daß dann x differenzierbar ist mit x = y. Es folgt also in der Tat x ∈ C 1 [a, b] und xn − x → 0. Wir fassen zusammen: • C 1 [a, b] ist bzgl. der Normen . und ||| . ||| ein Banachraum, jedoch nicht bzgl. der Supremumsnorm. Analoges gilt f¨ ur C r [a, b] := {x ∈ C[a, b]: x ist r-mal stetig differenzierbar}. r • C r [a, b], versehen mit der Norm |||x||| = i=0 x(i) ∞ , ist ein Banachraum. Es sollen noch R¨ aume von Funktionen mehrerer Ver¨anderlicher besprochen werden. Dazu f¨ uhren wir die Multiindexschreibweise ein. Sei Ω ⊂ Rn r offen und ϕ ∈ C (Ω), d.h., ϕ: Ω → K ist r-mal stetig differenzierbar. F¨ ur α = (α1 , . . . , αn ) ∈ Nn0 mit |α| := α1 + · · · + αn ≤ r existiert dann die partielle Ableitung ∂ α1 · · · ∂ αn D α ϕ = α1 ϕ n ∂t1 · · · ∂tα n der Ordnung |α| und ist stetig; dabei ist die Differentiationsreihenfolge unerheblich. Sei nun Ω ⊂ Rn offen und beschr¨ ankt. Man setzt ⎧ ⎫ ϕ ist r-mal stetig differenzierbar, ⎨ ⎬ ur jeden Multiindex α mit |α| ≤ r C r (Ω) = ϕ: Ω → K: und f¨ . ⎩ ⎭ kann D α ϕ stetig auf Ω fortgesetzt werden Insbesondere ist f¨ ur |α| ≤ r die Ableitung Dα ϕ beschr¨ankt und deshalb |||ϕ||| := Dα ϕ ∞ |α|≤r
endlich. Wie im Eindimensionalen zeigt man: • C r (Ω), versehen mit der Norm ||| . |||, ist ein Banachraum. Beispiel. (e) R¨aume holomorpher (= analytischer) Funktionen. Sei D = {z ∈ C: |z| < 1} die offene Einheitskreisscheibe in C. Wir bezeichnen mit H ∞ den Vektorraum aller beschr¨ ankten holomorphen Funktionen von D nach C. Wir k¨ onnen H ∞ mit der Supremumsnorm versehen und H ∞
8
I.
Normierte R¨ aume
als Unterraum von ∞ (D) oder C b (D) ansehen. Ein Satz der Funktionentheorie besagt, daß gleichm¨ aßige Limiten holomorpher Funktionen wieder holomorph sind; daher ist H ∞ abgeschlossen. Ein verwandter Raum ist die sog. Disk-Algebra A(D) := {f ∈ C(D): f |D ist holomorph}. Auch hier sieht man, daß A(D) in C(D) . ∞ -abgeschlossen ist. Also erh¨ alt man • H ∞ und A(D) sind mit der Supremumsnorm Banachr¨aume. Dieses Resultat steht in schroffem Gegensatz zu Beispiel (d), wo wir gesehen haben, daß der Raum C 1 der reell-differenzierbaren Funktionen bzgl. . ∞ nicht vollst¨andig ist. Beispiel. (f) Die Folgenr¨ aume d, c0 , c, ∞ . Wir betrachten die Vektorr¨ aume d = {(tn ): tn ∈ K, tn = 0 f¨ ur h¨ ochstens endlich viele n} c0 = {(tn ): tn ∈ K, limn→∞ tn = 0} c = {(tn ): tn ∈ K, (tn ) konvergiert} ∞ = ∞ (N) = {(tn ): tn ∈ K, (tn ) beschr¨ankt} und verwenden jeweils die Supremumsnorm (tn ) ∞ = sup |tn |. n∈N
(Der Raum d der abbrechenden Folgen kann als diskretes Analogon zu dem sp¨ater zu diskutierenden Raum D der Testfunktionen“ angesehen werden.) ” F¨ ur diese Vektorr¨ aume gilt d ⊂ c0 ⊂ c ⊂ ∞ . Dabei sind c0 und c in ∞ abgeschlossen, nicht jedoch d. Um das zu beweisen, m¨ ussen wir Folgen von Folgen betrachten; die Verwendung von Doppelindizes ist also unvermeidlich. Sei nun (xn ) eine Folge in c, und es gelte xn − x ∞ → 0 f¨ ur ein x ∈ ∞ . Wir haben x ∈ c zu ε zeigen und verwenden dazu ein 3 -Argument wie auf S. 5. Wir schreiben (n) (n) xn = t(n) m m∈N , x = (tm )m∈N , t∞ = lim tm . m→∞
(n) Wegen |limm→∞ sm | ≤ (sm ) ∞ f¨ ur (sm ) ∈ c ist t∞ n∈N eine Cauchyfolge in K (denn (xn ) ist eine Cauchyfolge in c). Folglich existiert t∞ := (n) limn→∞ t∞ . Um x ∈ c zu zeigen, gen¨ ugt es, limm→∞ tm = t∞ zu beweisen. Zum Beweis hierf¨ ur w¨ ahle zu ε > 0 eine nat¨ urliche Zahl N mit ε ε ) xN − x ∞ ≤ , |t(N ∞ − t∞ | ≤ . 3 3
I.1
9
Beispiele normierter R¨ aume
Dann bestimme m0 ∈ N mit m ≥ m0
) (N) ⇒ |t(N m − t∞ | ≤
ε . 3
Folglich ist f¨ ur m ≥ m0 ) (N ) (N) (N ) |tm − t∞ | ≤ |tm − t(N m | + |tm − t∞ | + |t∞ − t∞ | ε ε ≤ xN − x ∞ + + ≤ ε. 3 3
Jetzt zur Abgeschlossenheit von c0 . Gelte wieder xn − x ∞ → 0 f¨ ur ein x ∈ ∞ . Nach dem bereits Bewiesenen ist x ∈ c, d.h., in den obigen Bezeichnungen existiert t∞ = limm→∞ tm , und es ist t∞ = 0 zu zeigen. Das (n) ist jedoch im obigen Beweis schon geschehen, denn t∞ = limn→∞ t∞ = 0, da xn ∈ c0 . Betrachten wir zum Schluß d. Daß d nicht abgeschlossen ist, kann man so sehen: Zu n ∈ N setze 1 xn = (1, 12 , . . . , n1 , 0, 0, . . .), x = (1, 12 , . . . , n1 , n+1 , . . .) = ( n1 )n∈N .
Dann gilt xn ∈ d, xn − x ∞ = Zusammengefaßt gilt:
1 n+1
→ 0, aber x ∈ / d.
• Die Folgenr¨ aume c0 , c und ∞ sind bzgl. der Supremumsnorm Banachr¨ aume, d ist kein Banachraum. ¨ Ubrigens ist c0 nichts anderes als der Raum C0 (N) aus Beispiel (c). Wir behandeln jetzt von der Supremumsnorm wesentlich verschiedene Normen. Beispiel. (g) Die Folgenr¨ aume p (1 ≤ p < ∞). Man setzt
p
=
(tn ): tn ∈ K,
∞
|tn | < ∞ p
n=1
sowie f¨ ur x = (tn ) ∈ p x p =
∞
1/p |tn |
p
;
n=1
dabei sei 1 ≤ p < ∞ (diese Einschr¨ ankung ist wesentlich, um zu zeigen, daß . p tats¨achlich eine Norm ist). Wir werden sehen, daß (p , . p ) ein Banachraum ist.
10
I.
Normierte R¨ aume
F¨ urs erste ist jedoch nicht einmal klar, daß p u ¨ berhaupt ein Vektorraum ist! Zum Beweis dieser Tatsache seien x = (sn ) und y = (tn ) zwei p -Folgen. Dann ist ∞
|sn + tn |p ≤
n=1
≤
∞ n=1 ∞
p |sn | + |tn | 2 max{|sn |, |tn |}
n=1 ∞ p
= 2
≤ 2p
n=1 ∞
max{|sn |p , |tn |p } |sn |p + |tn |p
n=1
= 2p
p
∞
|sn |p +
n=1
∞
|tn |p ,
n=1
also x + y ∈ p . Daß mit λ ∈ K und x ∈ p auch λx ∈ p ist, ist klar; mithin ist p ein Vektorraum. Als n¨achstes weisen wir die Normeigenschaften f¨ ur . p nach. Hier macht (außer im Fall p = 1) die Dreiecksungleichung Schwierigkeiten. Wir beweisen zuerst eine wichtige Ungleichung. F¨ ur zwei Folgen x = (sn ) und y = (tn ) setzen wir dabei xy = (sn tn ). Satz I.1.4 (H¨oldersche Ungleichung, Version f¨ ur Folgen) 1 ∞ 1 (a) F¨ ur x ∈ und y ∈ ist xy ∈ , und es gilt xy 1 ≤ x 1 y ∞ . p (b) Sei 1 < p < ∞ und q = p−1 (also q 1 y ∈ ist xy ∈ , und es gilt
1 p
+
1 q
= 1). F¨ ur x ∈ p und
xy 1 ≤ x p y q . Man kann beide Teile gleichzeitig formulieren, indem man f¨ ur p = 1 den konjugierten Exponenten“ q = ∞ definiert; auf diese Weise erscheint ” die Bezeichnung ∞ f¨ ur den Raum der beschr¨ankten Folgen nat¨ urlich. (Ein weiteres Indiz daf¨ ur: Es gilt limp→∞ x p = x ∞ , siehe Aufgabe I.4.11.) Beweis. (a) ist trivial. Um (b) zu beweisen, erinnern wir zun¨achst an die gewichtete Ungleichung vom geometrischen und arithmetischen Mittel“: ” σ r τ 1−r ≤ rσ + (1 − r)τ
∀σ, τ ≥ 0, 0 < r < 1
(I.2)
I.1
11
Beispiele normierter R¨ aume
[Beweis hierf¨ ur: Die Behauptung ist klar, falls σ = 0 oder τ = 0. F¨ ur σ, τ > 0 ist sie jedoch ¨ aquivalent zur Konkavit¨at der Logarithmusfunktion: log(σ r τ 1−r ) = r log σ + (1 − r) log τ ≤ log rσ + (1 − r)τ
log τ log(rσ+(1−r)τ ) r log σ+(1−r) log τ σ rσ+(1−r)τ
τ
log σ
Eine C 2 -Funktion f ist aber genau dann konkav, wenn f ≤ 0 gilt; und die zweite Ableitung von log ist t → −t−2 , also in der Tat negativ.] Zum Beweis der H¨ olderschen Ungleichung setzen wir zur Abk¨ urzung A = x pp , B = y qq . O.E. darf A, B > 0 angenommen werden (sonst ist nichts zu zeigen). Wir schreiben nun x = (sn ), y = (tn ) und setzen in (I.2) bei beliebigem n ∈ N r=
1 1 |sn |p |tn |q , also 1 − r = , σ = , τ= p q A B
und erhalten
|sn |p A
1/p
|tn |q B
1/q ≤
1 |sn |p 1 |tn |q + . p A q B
Summieren u ¨ber n liefert |sn tn | 1 |sn |p 1 |tn |q 1 1 ≤ + = + = 1. p A q B p q A1/p B 1/q Folglich gilt xy 1 =
|sn tn | ≤ A1/p B 1/q = x p y q .
2
Als Korollar erhalten wir die Dreiecksungleichung f¨ ur . p , die einen eigenen Namen tr¨ agt.
12
I.
Normierte R¨ aume
Korollar I.1.5 (Minkowskische Ungleichung, Version f¨ ur Folgen) F¨ ur x, y ∈ p , 1 ≤ p < ∞, gilt x + y p ≤ x p + y p . Beweis. Der Fall p = 1 ist trivial, daher nehmen wir p > 1 an. Statt der Minkowskischen zeigen wir die dazu ¨ aquivalente Ungleichung x + y pp ≤ ( x p + y p) x + y p−1 . p 1 p
Wir schreiben wieder x = (sn ), y = (tn ). Dann gilt mit H¨olderschen Ungleichung x + y pp = ≤ ≤
∞ n=1 ∞
|sn | |sn + tn |p−1 + |sn |p
n=1
+
1/p ∞
∞
= 1 nach der
|tn | |sn + tn |p−1
n=1
q |sn + tn |p−1
|tn |
= ( x p + y p) x + =
∞
n=1 1/p ∞ p
n=1
1 q
1 q
|sn + tn |p
n=1 ∞
denn (p − 1)q = p und
+
1/q
p−1 q
1/q
|sn + tn |
n=1 y p−1 , p
2
p−1 . p
Da λx p = |λ| x p und x p = 0 ⇔ x = 0 offensichtlich gelten, ist (p , . p ) ein normierter Raum. Wir beweisen jetzt die Vollst¨andigkeit von ¨ p . Ahnlich wie im Fall ∞ versucht man, die Vollst¨andigkeit von K an entscheidender Stelle im Beweis heranzuziehen. (n) Sei (xn ) eine Cauchyfolge in p . Wir schreiben xn = tm m∈N . Da f¨ ur alle x = (tm ) ∈ p und alle m ∈ N die Ungleichung |tm | ≤ x p gilt, sind (n) (n) bei beliebigem m die tm n∈N skalare Cauchyfolgen. Sei tm = limn→∞ tm und x = (tm )m∈N . Es ist nun noch x ∈ p und xn − x p → 0 nachzuweisen. Zu ε > 0 w¨ahle N = N (ε) mit xn − xn p ≤ ε
∀n, n ≥ N.
Insbesondere folgt f¨ ur alle M ∈ N M m=1
(n) p ) tm − t(n m
1/p ≤ xn − xn p ≤ ε
∀n, n ≥ N.
I.1
13
Beispiele normierter R¨ aume
Mache nun den Grenz¨ ubergang n → ∞, um f¨ ur alle M ∈ N, n ≥ N M
(n) tm − tm p
1/p ≤ε
m=1
zu erhalten. Da M beliebig war, impliziert das ∞
(n) t − tm p
1/p
m
≤ε
∀n ≥ N,
m=1
und daraus folgt zun¨ achst x − xN ∈ p und deshalb x = (x − xN ) + xN ∈ p sowie xn − x p → 0. Zusammengefaßt gilt: • (p , . p ) ist f¨ ur 1 ≤ p < ∞ ein Banachraum. Man kann nat¨ urlich die p -Normen auch auf dem endlichdimensionalen Raum Kn einf¨ uhren; so normiert, wird Kn mit p (n) bezeichnet. Beispiel. (h) Die Lp -R¨ aume (1 ≤ p < ∞). Bei dem Versuch, analog zu den p -Folgenr¨ aumen Banachr¨aume integrierbarer Funktionen zu definieren, st¨ oßt man auf große Schwierigkeiten. Wir werden sie jedoch alle in diesem Abschnitt u ¨berwinden. b Betrachte zun¨ achst auf C[a, b] die Norm f 1 = a |f (t)| dt. In dieser Norm ist C[a, b] nicht vollst¨ andig. O.E. nehmen wir a = 0, b = 2 an und setzen fn(t) = tn f¨ ur 0 ≤ t ≤ 1, fn (t) = 1 f¨ ur 1 < t ≤ 2. Dann ist (fn ) eine Cauchyfolge in C[0, 2] bzgl. . 1 , denn f¨ ur n ≥ m ist
1
fn − fm 1 =
(tm − tn ) dt ≤ 0
1 . m+1
Die Folge (fn ) scheint nun gegen f , definiert durch f (t) = 0 f¨ ur 0 ≤ t < 1, f (t) = 1 f¨ ur 1 ≤ t ≤ 2 zu konvergieren, und f ist nicht stetig. (In der 2 1 Tat ist 0 |fn (t) − f (t)| dt = n+1 → 0.) Mit dem gleichen Recht k¨onnte man f˜ mit f˜(t) = 0 f¨ ur 0 ≤ t ≤ 1, f˜(t) = 1 f¨ ur 1 < t ≤ 2 als (freilich ebenfalls unstetigen) Limes von (fn ) ansehen. K¨onnte man vielleicht doch einen Limes in C[0, 2] finden, wenn man nur lange genug sucht? Wir werden uns u oglich ist. ¨ berlegen, daß das nicht m¨ Zun¨achst k¨onnte man . 1 auf R[0, 2], dem Raum der Riemann-integrierbaren Funktionen, betrachten. Dort definiert . 1 aber nur noch eine Halbnorm, so daß konvergente Folgen keinen eindeutig bestimmten Limes mehr besitzen. (Oben hatten wir f und f˜ als Limiten von (fn ) ausgemacht!)
14
I.
Normierte R¨ aume
Wir betrachten deshalb die lineare H¨ ulle von {f } und C[0, 2] und bezeichnen diesen Untervektorraum von R[0, 2] mit X. Auf X ist . 1 aber eine Norm: Seien n¨amlich g ∈ C[0, 2] und λ ∈ K mit g + λf 1 = 0. Dann ist 1 2 |g(t)| dt = 0 = |g(t) + λ| dt. 0
1
Wegen der Stetigkeit von g folgt nun g(t) = 0 f¨ ur 0 ≤ t ≤ 1 und g(t) = −λ f¨ ur 1 ≤ t ≤ 2. Also ist λ = 0 und g = 0. Jetzt schließen wir, daß C[0, 2] kein bzgl. . 1 abgeschlossener Unterraum des normierten Raums X ist (in der Tat hat die Folge (fn ) den in X eindeutig bestimmten Grenzwert f∈ / C[0, 2]), und erhalten mit Lemma I.1.3(b): • C[0, 2] (und allgemeiner C[a, b]) ist bez¨ uglich . 1 kein Banachraum. Man k¨onnte nun abstrakt die Vervollst¨ andigung definieren (vgl. S. 3), das liefert jedoch wenig Aufschluß u ¨ ber die konkrete Gestalt des so erhaltenen Banachraums. Z.B. ist nicht klar, ob dessen Elemente als Funktionen aufgefaßt werden k¨ onnen, und wenn ja, als welche. Eine andere Idee w¨are es, . 1 auf R[a, b] zu definieren, evtl. auch uneigentlich Riemannintegrierbare Funktionen zuzulassen. Wie bereits festgestellt, erh¨alt man so nur einen halbnormierten Raum. Schlimmer noch: die gew¨ unschte Vollst¨andigkeit stellt sich immer noch nicht ein. (Der erstgenannte Defekt l¨aßt sich in der Tat auch bei dem jetzt vorzustellenden Weg nicht vermeiden.) Man muß sich also etwas g¨ anzlich Neues einfallen lassen. Die wesentliche Neuerung besteht darin, die Lebesguesche Integrationstheorie zu verwenden, deren Grundz¨ uge im Anhang A dargestellt sind. Wir betrachten zun¨achst ein Intervall I ⊂ R, das offen, halboffen oder abgeschlossen, beschr¨ ankt oder unbeschr¨ ankt sein darf, die σ-Algebra Σ der Borelmengen und das Lebesguemaß λ. F¨ ur 1 ≤ p < ∞ setzt man (beachte: wenn f meßbar ist, ist |f |p meßbar) p p L (I) = f : I → K: f meßbar, |f | dλ < ∞ , f ∗p =
1/p p |f | dλ I
I
f¨ ur f ∈ L p (I).
(Wer m¨ochte, kann das Symbol f dλ durch das traditionellere f (t) dt ersetzen; das wird im Laufe des Texts des ¨ ofteren geschehen.) Wir werden zeigen, daß L p (I) ein vollst¨ andiger halbnormierter Raum ist. Genau wie im Fall der p -R¨ aume wird zuerst begr¨ undet, daß L p (I) ein Vektorraum ist (das ist ja nicht offensichtlich), anschließend werden die H¨oldersche und die Minkowskische Ungleichung gezeigt und zum Schluß die Vollst¨andigkeit von L p (I) bewiesen.
I.1
15
Beispiele normierter R¨ aume
Seien also f, g ∈ L p (I). Dann ist f +g als Summe meßbarer Funktionen selbst meßbar. Außerdem gilt p p |f + g| dλ ≤ |f | + |g| dλ I I p ≤ 2 max{|f (t)|, |g(t)|} dt I p = 2 max |f (t)|p , |g(t)|p dt I ≤ 2p |f (t)|p + |g(t)|p dt I p p p = 2 |f | dλ + |g| dλ < ∞ I
I
Damit ist f + g ∈ L (I). Schließlich ist trivialerweise αf ∈ L p (I) f¨ ur alle α ∈ K, und L p (I) ist ein Vektorraum. Als n¨achstes zeigen wir die H¨ oldersche Ungleichung im Kontext der Funktionenr¨aume; wie im Fall von p werden wir daraus die Dreiecksungleichung f¨ ur . ∗p ableiten. p
Satz I.1.6 (H¨oldersche Ungleichung, Version f¨ ur L p (I)) p 1 1 Sei 1 < p < ∞ und q = p−1 , also p + q = 1. F¨ ur f ∈ L p (I) und g ∈ L q (I) ist f g ∈ L 1 (I), und es gilt f g ∗1 ≤ f ∗p g ∗q .
p Beweis. Wir verwenden wieder (I.2), vgl. S. 10. Setze A = f ∗p , B = q g ∗q , und nimm ohne Einschr¨ ankung A, B > 0 an. (Ist etwa A = 0, so ist f = 0 fast u ¨berall und deshalb auch f g = 0 fast u ¨ berall.) Sei t ∈ I beliebig. Dann folgt aus (I.2) mit r = 1p
|f (t)|p A
1/p
|g(t)|q B
1/q ≤
1 |f (t)|p 1 |g(t)|q + , p A q B
und Integration liefert (wie die Summation im Beweis von Satz I.1.4) die Behauptung. 2 Korollar I.1.7 (Minkowskische Ungleichung, Version f¨ ur L p (I)) F¨ ur 1 ≤ p < ∞ und f, g ∈ L p (I) gilt f + g ∗p ≤ f ∗p + g ∗p. Beweis. Der Fall p = 1 ist trivial, und f¨ ur p > 1 gilt mit der H¨olderschen Ungleichung p f + g ∗p = |f (t) + g(t)|p dt I
1 p
+
1 q
= 1 wegen
16
I.
Normierte R¨ aume
|f (t)| |f (t) + g(t)|p−1 dt I + |g(t)| |f (t) + g(t)|p−1 dt I ∗ ∗ ≤ f ∗p |f + g|p−1 q + g ∗p|f + g|p−1 q p−1 = f ∗p + g ∗p f + g ∗p , ≤
2
woraus die Behauptung folgt. ∗
Im Gegensatz zu den p -R¨ aumen ist . p auf L p (I) nur eine Halbnorm, ∗ denn f p = 0 ⇔ f = 0 fast u ¨ berall. (Dazu sp¨ater mehr.) Als n¨achstes wird die Vollst¨andigkeit von L p (I) gezeigt; dabei verwenden wir die Begriffe vollst¨andig“ und Cauchyfolge“ wie f¨ ur normierte R¨aume. ” ” Wollte man analog zum p -Fall vorgehen, w¨ urde man eine Cauchyfolge (fn ) in L p (I) und anschließend f¨ ur festes t ∈ I die skalare Folge fn (t) betrachten. Im allgemeinen braucht fn (t) jedoch nicht zu konvergieren, und man muß einen anderen Weg einschlagen. Das folgende Lemma wird von Nutzen sein. Lemma I.1.8 F¨ ur einen halbnormierten Raum (X, . ) sind ¨ aquivalent: (i) X ist vollst¨ andig. (ii) Jede absolut konvergente Reihe konvergiert. (Ausf¨ uhrlich: F¨ ur jede Folge in X mit ∞ x < ∞ existiert ein Element x ∈ X mit n N n=1 limN →∞ x − n=1 xn = 0.) N Beweis. (i) ⇒ (ii): Das ist klar, denn ( n=1 xn )N ∈N ist eine Cauchyfolge. (ii) ⇒ (i): Sei (xn ) eine Cauchyfolge. W¨ ahle zu εk = 2−k ein Nk ∈ N mit xn − xm ≤ 2−k ∀n, m ≥ Nk . Daraus ergibt sich die Existenz einer Teilfolge (xnk )k∈N mit xnk+1 − xnk ≤ 2−k ∀k ∈ N. F¨ ur yk = xnk+1 − xnk ist also k yk < ∞. Nach (ii) existiert y ∈ X mit (Teleskopsumme!) K yk = y − (xnK+1 − xn1 ) → 0 f¨ ur K → ∞. y − k=1
Eine Teilfolge von (xn ) konvergiert daher. Da eine Cauchyfolge, die eine konvergente Teilfolge besitzt, selbst konvergiert (Beweis?), folgt die Konvergenz von (xn ), und der Beweis ist vollst¨ andig. 2 Beweis der Vollst¨ andigkeit von L p (I): ∞ Wir benutzen Lemma I.1.8. Seien f1 , f2 , . . . ∈ L p (I) mit a := n=1 fn ∗p
I.1
17
Beispiele normierter R¨ aume
< ∞. Betrachte die (evtl. ∞-wertige) nichtnegative Funktion t → g(t) = ∞ |f (t)|. Als Summe meßbarer Funktionen ist g meßbar. Ferner sei i i=1 n gn (t) = i=1 |fi (t)|. Es folgt dann gn ∈ L p (I), da L p (I) ein Vektorraum ist, sowie n gn ∗p ≤ fi ∗p ≤ a < ∞ i=1
wegen der Minkowskischen Ungleichung. Nach Konstruktion konvergiert ( gnp ) monoton gegen gp ; der Satz von Beppo Levi (Satz A.3.1) liefert daher g p dλ = lim gnp dλ ≤ ap . n→∞
I
I
Insbesondere ist g p (und daher auch g) fast u ¨ berall endlich; d.h., nach Ab¨anderung von g auf einer Nullmenge N ∈ Σ erh¨alt man eine reellwertige meßbare Funktion g mit g(t) =
∞
|fi (t)|
fast u ¨ berall
i=1
(n¨amlich f¨ ur t ∈ I \ N ). Es folgt (jetzt geht die Vollst¨andigkeit von K ein!), daß ∞ f (t) := fi (t) f¨ ur t ∈ /N i=1
existiert. Setzt man noch f (t) = 0 f¨ ur t ∈ N , so hat man ∞ eine meßbare p Funktion f : I → K definiert. Es bleibt f ∈ L (I) und i=1 fi = f bzgl. p dλ → 0 f¨ . ∗p , d.h. I ∞ f u r n → ∞, zu zeigen. i i=n Nach Konstruktion ist |f | ≤ g, also (s.o.) p |f | dλ ≤ g p dλ < ∞, I
I
∞
folglich f ∈ L p (I). Um schließlich n=1 fn = f zu zeigen, benutzen ∞ p wir den Lebesgueschen Konvergenzsatz (Satz A.3.2): Sei hn = i=n fi ; dann gilt hn → 0 fast u ¨berall und p ∞ 0 ≤ hn ≤ |fi | ≤ gp . i=n
Wegen I gp dλ ≤ ap ist gp integrierbar. Also impliziert der Lebesguesche Konvergenzsatz hn dλ → 0, I
was zu zeigen war.
18
I.
Normierte R¨ aume
L p (I) ist damit als vollst¨ andiger halbnormierter Raum ausgewiesen. Limiten sind in diesem Raum nicht mehr eindeutig bestimmt, sondern nur ∗ noch modulo Elementen des Kerns der Halbnorm . p , n¨amlich Np = {f : f = 0 fast u ¨berall}. (Beachte, daß Np in Wirklichkeit gar nicht von p abh¨angt!) Es liegt daher nahe, Funktionen zu identifizieren, die fast u ¨berall u ¨bereinstimmen. Das angemessene mathematische Verfahren besteht darin, ¨ statt Funktionen f ihre Aquivalenzklassen [f ] in dem zugeh¨origen Quotientenvektorraum Lp (I) := L p (I)/Np zu betrachten. Dieses Verfahren schildert das folgende Lemma. ∗
Lemma I.1.9 (X, . ) sei ein halbnormierter Raum. (a) N := {x: x ∗ = 0} ist ein Untervektorraum von X. (b) [x] := x ∗ definiert eine Norm auf X/N . (c) Ist X vollst¨ andig, so ist X/N ein Banachraum. Beweis. (a) ist trivial. (b) Zun¨achst mache man sich klar, daß [x] = x ∗ wohldefiniert ist, ¨ d.h. nicht vom Repr¨ asentanten der Aquivalenzklasse [x] abh¨angt. Homogenit¨at und Dreiecksungleichung folgen dann unmittelbar aus den entsprechenden Eigenschaften von . ∗ . Schließlich gilt [x] = 0 ⇔ x ∈ N ⇔ [x] = [0]. (c) Bemerke nur: Bildet die Folge der Klassen [xn ] eine Cauchy- bzw. konvergente Folge, so gilt dies auch f¨ ur die Folge (xn ) der Repr¨asentanten – und umgekehrt. 2 Die Quotientennorm auf Lp(I) bezeichnen wir mit . p (endlich kann das Sternchen verschwinden) oder mit . Lp . Insgesamt haben wir gezeigt: • Die R¨aume Lp (I), . p sind Banachr¨ aume f¨ ur p ≥ 1. Obwohl die Lp -R¨ aume eigentlich keine R¨ aume von Funktionen, sondern ¨ von Aquivalenzklassen von Funktionen sind, behandelt man ihre Elemente, als w¨aren es Funktionen. Man schreibt also f ∈ Lp statt [f ] ∈ Lp usw. In der auf. Beispielsweise ist f → Regel treten dadurch keine Komplikationen 1 f dλ eine wohldefinierte Abbildung auf L (I), nicht jedoch f → f (t0 ). I p Ferner brauchen die Repr¨ asentanten der f ∈ L nur fast u ¨ berall definiert √ zu sein; in diesem Sinn ist etwa t → 1/ t in L1 [0, 1]. Wir haben oben die Lp -R¨ aume u ur das Lebesgue¨ber reellen Intervallen f¨ maß betrachtet; alles ließe sich genauso f¨ ur meßbare Teilmengen Ω ⊂ Rn (mit der entsprechenden Borel-σ-Algebra und dem n-dimensionalen Lebesguemaß) durchf¨ uhren. Noch allgemeiner k¨onnen beliebige Maßr¨aume (Ω, Σ, μ) behandelt werden. Die entstehenden Lp -R¨aume werden mit dem Symbol Lp (Ω, Σ, μ) oder k¨ urzer mit Lp (μ) bezeichnet. Die Notation Lp geht auf Riesz zur¨ uck (siehe Abschnitt I.5); L erinnert hier an Lebesgue und p an Potenz oder puissance. Jedesmal gilt:
I.1
19
Beispiele normierter R¨ aume
• Die R¨aume Lp (μ), . p sind Banachr¨ aume f¨ ur p ≥ 1. Im Fall Ω = N, Σ = Potenzmenge von N, μ = z¨ahlendes Maß erh¨alt man u ¨brigens Lp (Ω, Σ, μ) = p . Von besonderer Bedeutung sind die R¨ aume L2 (μ); sie sind sogenannte Hilbertr¨ aume und werden in Kapitel V detailliert untersucht. Beispiel. (i) Die L∞ -R¨ aume. Der Anschaulichkeit halber f¨ uhren wir zun¨ achst L∞ (I) f¨ ur ein Intervall I, ∞ sp¨ater L (μ) f¨ ur beliebige Maßr¨ aume ein. Vergleicht man die H¨ olderschen Ungleichungen in den S¨atzen I.1.4 und I.1.6, so f¨allt auf, daß der Fall p = 1 in der Integralversion noch nicht behandelt wurde. Der Grund ist, daß der entsprechende Raum beschr¨ankter Funktionen auf I noch nicht eingef¨ uhrt wurde. (Der Raum ∞ (I) ist dazu nicht angemessen.) Man setzt f meßbar, ∞ L (I) = f : I → K: , ∃N ∈ Σ, λ(N ) = 0: f |I\N beschr¨ankt f ∗L∞ =
inf
sup |f (t)| =
N ∈Σ t∈I\N λ(N )=0
inf
N ∈Σ λ(N )=0
f |I\N ∞ .
Es ist klar, daß f ∗L∞ < ∞ f¨ ur f ∈ L ∞ (I) gilt. Es ist diesmal recht leicht ∗ ∞ zu sehen, daß L (I) ein Vektorraum und . L∞ eine Halbnorm ist. Zum Beweis bemerken wir zuerst, daß es zu f ∈ L ∞ (I) eine meßbare Nullmenge N = N (f ) mit f ∗L∞ = f |I\N ∞ gibt. Denn zu r ∈ N w¨ahle eine Nullmenge Nr mit f |I\Nr ∞ ≤ f ∗L∞ + 1r . N := r Nr ist dann eine meßbare Nullmenge, und es gilt f ∗L∞ ≤ f |I\N ∞ ≤ f |I\Nr ∞ ≤ f ∗L∞ +
1 r
f¨ ur alle r ∈ N, also leistet N das Geforderte. Sind nun f1 , f2 ∈ L ∞ (I) und dazu N1 und N2 nach der Vorbemerkung gew¨ahlt, so folgt f1 + f2 ∗L∞ ≤ (f1 + f2 )|I\(N1 ∪N2 ) ∞ ≤ f1 |I\(N1 ∪N2 ) ∞ + f2 |I\(N1 ∪N2 ) ∞ ≤ f1 |I\N1 ∞ + f2 |I\N2 ∞ = f1 ∗L∞ + f2 ∗L∞ .
Die u ¨ brigen behaupteten Eigenschaften sind klar. Als n¨achstes wird die Vollst¨ andigkeit von L ∞ (I) gezeigt. Sei (fn ) eine Cauchyfolge in L ∞ (I). Nach der obigen Bemerkung k¨onnen wir meßbare Nullmengen Nn,m mit fn − fm ∗L∞ = (fn − fm )|I\Nn,m ∞
20
I.
Normierte R¨ aume
∞ w¨ahlen. Sei N = n,m=1 Nn,m . Da N × N abz¨ahlbar ist, ist auch N eine meßbare Nullmenge, und es gilt fn − fm ∗L∞ = (fn − fm )|I\N ∞ . Deshalb ist fn |I\N eine . ∞ -Cauchyfolge im Banachraum ∞ (I \ N ), ergo konvergent, etwa gegen g. Setzt man noch f (t) = g(t) f¨ ur t ∈ / N, f (t) = 0 f¨ ur t ∈ N , so ist f meßbar und beschr¨ankt (als gleichm¨aßiger Limes der meßbaren und beschr¨ ankten Funktionen fn χI\N , wo χA (t) = 1 f¨ ur t ∈ A, χA (t) = 0 f¨ ur t ∈ / A), und es gilt fn − f ∗L∞ ≤ (fn − f )|I\N ∞ → 0. Wie bei den Lp -R¨ aumen geht man nun zum normierten Quotienten L∞ (I) := L ∞ (I)/N∞ ∗
nach dem Kern N∞ der Halbnorm . L∞ u ¨ber; wieder besteht dieser Kern aus den meßbaren Funktionen, die fast u ¨berall verschwinden. Die entsprechende Norm werde mit . L∞ bezeichnet, sie heißt wesentliche Supremumsnorm. Die Elemente von L∞ (I) werden wir im allgemeinen wieder ¨ als Funktionen (statt als Aquivalenzklassen von Funktionen, wie es eigentlich korrekt w¨are) ansehen, die bzgl. fast u ¨berall bestehender Gleichheit identifiziert werden. Zusammengefaßt ist gezeigt: • L∞ (I), versehen mit der wesentlichen Supremumsnorm, ist ein Banachraum. Statt des Lebesguemaßes auf I h¨ atte auch das n-dimensionale Lebesguemaß auf einem Gebiet Ω ⊂ Rn oder ein abstrakter Maßraum (Ω, Σ, μ) behandelt werden k¨ onnen; auch dann gilt: • L∞ (μ), versehen mit der wesentlichen Supremumsnorm, ist ein Banachraum. Wir bringen nun noch die abschließende Version der H¨olderschen Ungleichung; der Spezialfall p = q = 2 wird Cauchy-Schwarz-Ungleichung genannt. Satz I.1.10 (H¨oldersche Ungleichung, allgemeine Version) 1 Sei 1 ≤ p ≤ ∞ und sei 1p + 1q = 1 (mit der Konvention ∞ = 0). (Ω, Σ, μ) p q sei ein Maßraum, und es seien f ∈ L (μ), g ∈ L (μ). Dann ist f g ∈ L1 (μ), und es gilt f g L1 ≤ f Lp g Lq .
I.1
21
Beispiele normierter R¨ aume
Beweis. Der Fall 1 < p < ∞ ist im wesentlichen (n¨amlich f¨ ur Ω = I) in Satz I.1.6 behandelt worden. Wir betrachten nun p = 1, q = ∞; der Fall p = ∞, q = 1 ist nat¨ urlich dazu symmetrisch. f und g k¨onnen als meßbare Funktionen angesehen werden, so daß f g jedenfalls meßbar ist. Es folgt f¨ ur alle Nullmengen N |f g| dμ = |f | |g| dμ Ω Ω\N ≤ |f | dμ sup |g(t)| t∈N / Ω\N = |f | dμ g |Ω\N ∞ . Ω
Nach Definition der L∞ -Norm heißt das aber f g L1 ≤ f L1 g L∞ .
2
Beispiel. (j) R¨aume von Maßen. Ist T eine Menge und Σ eine σ-Algebra auf T , so heißt eine Abbildung μ: Σ → R (bzw. C) signiertes bzw. komplexes Maß, falls f¨ ur jede Folge paarweiser disjunkter Ai ∈ Σ ∞ ∞ μ Ai = μ(Ai ) i=1
(I.3)
i=1
gilt. Hier wird also nicht μ(A) ≥ 0 gefordert. Da μ nur endliche Werte annimmt (nicht aber +∞ oder −∞), folgt μ(∅) = 0, denn μ(∅) = μ(∅ ∪ ∅ ∪ . . .) = μ(∅) + μ(∅) + · · ·. In diesem Beispiel werden wir kurz Maß statt signiertes oder komplexes Maß sagen. (Vergleiche zu diesen Begriffen auch Anhang A.4.) Beispiele f¨ ur Maße sind die Punktmaße μ = λ1 δt1 +· · ·+λn δtn , wo ti ∈ T und λi ∈ K. (Zur Erinnerung: δt (A) = 1, falls t ∈ A, und δt (A) = 0 sonst.) Weitere Beispiele Maße auf R, das sind Maße der sind die absolutstetigen Form μ(A) = A f (t) dt f¨ ur ein f ∈ L1 (R). Da Summen und Vielfache von Maßen wieder Maße sind, tr¨ agt die Menge M (T, Σ) aller Maße auf Σ die Struktur eines Vektorraums. Ist T ein metrischer (oder topologischer Raum), wird in der Regel die von den offenen Mengen erzeugte σ-Algebra, die sog. Borel-σ-Algebra, betrachtet. Jedem Maß μ wird durch die Vorschrift |μ|(A) = sup |μ(E)|, Z
E∈Z
22
I.
Normierte R¨ aume
wobei das Supremum u ¨ber alle Zerlegungen von A in endlich viele paarweise disjunkte Mengen aus Σ zu bilden ist, ein positives Maß |μ| zugeordnet, die sog. Variation von μ. Man kann außerdem zeigen, daß |μ|(T ) < ∞ ist (siehe z.B. Rudin [1986], S. 117). Im Beispiel der Punktmaße ist |μ| = |λ1 |δt1 + · · · + |λn |δtn , wenn die δtj verschieden sind, und im Beispiel der absolutstetigen Maße ist |μ|(A) = A |f (t)| dt. Nun assoziieren wir zu einem Maß μ seine Variationsnorm μ = |μ|(T ) und behaupten: • M (T, Σ), versehen mit der Variationsnorm, ist ein Banachraum. Von den Normeigenschaften von . ist nur die Dreiecksungleichung nicht ganz offensichtlich. Seien μ1 , μ2 ∈ M (T, Σ), und sei Z eine Zerlegung von T , wie oben beschrieben. Dann ist (μ1 + μ2 )(E) ≤ μ1 (E) + μ2 (E) ≤ μ1 + μ2 . E∈Z
E∈Z
E∈Z
Wenn man jetzt das Supremum u ¨ber alle Z nimmt, erh¨alt man μ1 +μ2 ≤ μ1 + μ2 . Nun zur Vollst¨ andigkeit. Sei (μn ) eine Cauchyfolge in M (T, Σ). F¨ ur A ∈ Σ und μ ∈ M (T, Σ) gilt stets |μ(A)| ≤ μ (betrachte die Zerlegung Z = {A, T \A}). Also existiert f¨ ur alle A ∈ Σ μ(A) := lim μn (A). n→∞
Es ist klar, daß μ additiv ist, d.h. μ(A ∪ B) = μ(A) + μ(B) f¨ ur paarweise disjunkte A und B ist, und deshalb eine zu (I.3) analoge Gleichung f¨ ur endliche Folgen gilt. Sei jetzt ε > 0 vorgegeben, und sei Z = {E1 , . . . , Er } eine Zerlegung von T in paarweise disjunkte Mengen aus Σ. W¨ahle N0 = N0 (ε) mit μn − μm ≤ ε ∀n, m ≥ N0 . Alsdann w¨ahle m = m(ε, Z ) mit m ≥ N0 und r μm (Ei ) − μ(Ei ) ≤ ε. i=1
F¨ ur n ≥ N0 ist dann r r r μn (Ei ) − μ(Ei ) ≤ μn (Ei ) − μm (Ei ) + μm (Ei ) − μ(Ei ) i=1
i=1
≤ μn − μm + ε ≤ 2ε.
i=1
23
I.2 Eigenschaften normierter R¨ aume
Akzeptiert man f¨ ur den Moment das Symbol . auch f¨ ur bloß additive Mengenfunktionen (wir haben noch nicht gezeigt, daß μ ein Maß ist), so ergibt sich jedenfalls μ < ∞ und μn − μ → 0. Es bleibt, (I.3) f¨ ur μ zu zeigen. Seien A1 , A2 , . . . ∈ Σ paarweise disjunkt, und sei ε > 0. W¨ ahle k mit μk − μ ≤ ε. Dann folgt ∞ n Ai − μ(Ai ) = μ Ai μ i=1 i=1 i>n ≤ (μ − μk ) Ai + μk Ai i>n i>n ≤ μ − μk + μk (Ai ) i>n
≤ 2ε f¨ ur hinreichend großes n, da μk ein Maß ist.
I.2
Eigenschaften normierter R¨ aume
Wir beginnen mit einem einfachen Satz, der besagt, daß Addition, Skalarmultiplikation und . stetige Abbildungen auf normierten R¨aumen sind. Satz I.2.1 Sei X ein normierter Raum. (a) Aus xn → x und yn → y folgt xn + yn → x + y. (b) Aus λn → λ in K und xn → x folgt λn xn → λx. (c) Aus xn → x folgt xn → x . Beweis. W¨ortlich wie im Endlichdimensionalen, also: (a) Klar wegen (xn + yn ) − (x + y) ≤ xn − x + yn − y → 0. (b) Klar wegen λn xn − λx ≤ λn xn − λn x + λn x − λx = |λn | xn − x + |λn − λ| x → 0. (c) Zuerst u ¨ berlegen wir, daß die umgekehrte Dreiecksungleichung gilt: x − y ≤ x − y ∀x, y ∈ X; diese folgt aus der Ungleichung x − y ≤ x − y + y − y = x − y und der dazu symmetrischen Ungleichung y − x ≤ y − x . Die umgekehrte Dreiecksungleichung impliziert sofort xn − x ≤ xn − x → 0. 2
Insbesondere ist eine konvergente Folge (xn ) beschr¨ankt, d.h., die Folge xn der Normen ist beschr¨ ankt.
24
I.
Normierte R¨ aume
Korollar I.2.2 Ist U ein Untervektorraum des normierten Raums X, so ist sein Abschluß U ebenfalls ein Untervektorraum. Beweis. Seien x, y ∈ U. Dann existieren xn , yn ∈ U mit xn → x und yn → y. Es folgt U xn + yn → x + y, so daß x + y ∈ U gilt. F¨ ur λ ∈ K konvergiert (λxn ) gegen (λx), also liegt auch λx in U . 2 1 In Beispiel (d) von Abschnitt I.1 hatten wir auf C [a, b] die beiden Normen x = max x ∞ , x ∞ und |||x||| = x ∞ + x ∞ eingef¨ uhrt und als ¨aquivalent“ erkannt. Diesen Begriff werden wir nun eingehender ” studieren.
Definition I.2.3 Zwei Normen . und ||| . ||| auf einem Vektorraum X heißen ¨ aquivalent, falls es Zahlen 0 < m ≤ M mit m x ≤ |||x||| ≤ M x
∀x ∈ X
(I.4)
gibt. Satz I.2.4 Seien . und ||| . ||| zwei Normen auf X. Dann sind folgende Aussagen ¨ aquivalent: (i) . und ||| . ||| sind ¨ aquivalent. (ii) Eine Folge ist bzgl. . konvergent genau dann, wenn sie es bzgl. ||| . ||| ist; außerdem stimmen die Limiten ¨ uberein. (iii) Eine Folge ist . -Nullfolge genau dann, wenn sie eine ||| . |||-Nullfolge ist. Beweis. Die Implikationen (i) ⇒ (ii) ⇒ (iii) sind klar. (iii) ⇒ (i): Nehmen wir etwa an, daß f¨ ur kein M > 0 die Ungleichung |||x||| ≤ M x f¨ ur alle x ∈ X gilt. F¨ ur jedes n ∈ N gibt es dann xn ∈ X mit |||xn ||| > n xn . Setze yn = xn /(n xn ); dann ist yn = n1 → 0, also (yn ) eine . -Nullfolge, aber |||yn ||| > 1 f¨ ur alle n, folglich (yn ) keine ||| . |||-Nullfolge, was (iii) widerspricht. Die Existenz von m zeigt man entsprechend. 2 ¨ Aquivalente Normen erzeugen also vom topologischen Standpunkt denselben metrischen Raum. Es folgt außerdem aus der Definition, daß dann (X, . ) und (X, ||| . |||) dieselben Cauchyfolgen besitzen. Daher sind die R¨aume (X, . ) und (X, ||| . |||) entweder beide vollst¨andig oder beide unvollst¨andig. Versieht man jedoch eine Menge T mit zwei Metriken derart, daß (T, d1 ) dieselben konvergenten Folgen wie (T, d2 ) besitzt, so brauchen diese Metriken nicht dieselben Cauchyfolgen zu besitzen. Ein Beispiel ist R mit den
I.2
25
Eigenschaften normierter R¨ aume
Metriken d1 (s, t) = |s − t|, d2 (s, t) = |arctan s − arctan t|; hier ist die Folge (n) der nat¨ urlichen Zahlen eine d2 -Cauchyfolge, und (R, d2 ) ist nicht vollst¨andig. Dieses Gegenbeispiel wird dadurch erm¨oglicht, daß die identische Abbildung von (T, d2 ) nach (T, d1 ) zwar stetig ist, aber nicht gleichm¨aßig stetig. Hingegen impliziert (I.4), daß ||| . ||| auf (X, . ) sogar gleichm¨aßig stetig ist. Geometrisch bedeutet Definition I.2.3, daß die ||| . |||-Einheitskugel {x: 1 |||x||| ≤ 1} eine . -Kugel vom Radius M enth¨alt und in einer solchen vom 1 Radius m enthalten ist: {x: x ≤
{x: x ≤ 1/m}
1 M}
⊂ {x: |||x||| ≤ 1} ⊂ {x: x ≤
{x: |||x||| ≤ 1}
1 m }.
{x: x ≤ 1/M }
Beispiele. (a) In Beispiel I.1(d) wurde gezeigt, daß . und . ∞ auf C 1 [a, b] nicht ¨aquivalent sind. (b) Ebensowenig sind . ∞ und . 1 auf C[0, 1] ¨aquivalent. Zwar gilt die Ungleichung x 1 ≤ x ∞ f¨ ur alle x (d.h., gleichm¨aßig konvergente Folgen konvergieren im Mittel), aber xn (t) = tn definiert eine . 1 -Nullfolge, die nicht gleichm¨ aßig konvergiert. Man k¨onnte auch argumentieren, daß C[0, 1] in der Supremumsnorm vollst¨ andig ist, bzgl. . 1 jedoch nicht. (c) Betrachte nun f¨ ur α > 0 die Norm |||x|||α = sup x(t)e−αt 0≤t≤1
auf C[0, 1]. Dann sind . ∞ und ||| . |||α ¨ aquivalent, denn es gilt |||x|||α ≤ x ∞ ≤ eα |||x|||α . ¨ Der Ubergang zu einer ¨ aquivalenten Norm gestattet es h¨aufig, Eigenschaften der gegebenen Norm zu verbessern, etwa Abbildungen zu Kontraktionen zu machen, die es urspr¨ unglich nicht waren, und so den Banachschen
26
I.
Normierte R¨ aume
Fixpunktsatz anzuwenden. Zu diesem Zweck werden die Normen des Beispiels (c) in der Theorie der gew¨ ohnlichen Differentialgleichungen verwandt. Bekanntlich sind die euklidische, die Maximums- und die Summennorm auf Kn ¨aquivalent. Tats¨ achlich gilt: Satz I.2.5 Auf einem endlichdimensionalen Raum sind je zwei Normen aquivalent. ¨ Beweis. Gelte etwa dim X = n. Sei {e1 , . . . , en } eine Basis von X und . eine Norm auf X. Wir werden zeigen, daß . zur euklidischen Norm n n 2 1/2 i=1 αi ei 2 = aquivalent ist. ¨ i=1 |αi | Setze K = max{ e1 , . . . , en } > 0. Dann folgt aus der Dreiecksungleichung f¨ ur . und der H¨ olderschen Ungleichung n 1/2 1/2 n n n 2 2 ≤ α e |α | e ≤ |α | e , i i i i i i i=1
so daß
i=1
i=1
√ x ≤ K n x 2
i=1
∀x ∈ X.
Damit ist . bzgl. . 2 stetig, da aus xk − x 2 → 0 √ xk − x ≤ xk − x ≤ K n xk − x 2 → 0 folgt. Ferner ist S := {x: x 2 = 1} in (X, . 2 ) abgeschlossen, denn S ist abgeschlossenes Urbild . −1 {1} der abgeschlossenen Menge {1} 2 unter der stetigen Abbildung . 2 (vgl. Lemma I.2.1(c)), und S ist beschr¨ankt bzgl. . 2 , also kompakt nach dem Satz von Heine-Borel. (Beachte, daß . 2 die u ¨ bliche Topologie auf dem endlichdimensionalen Raum X erzeugt.) Die stetige Funktion . nimmt daher auf S ihr Minimum m ≥ 0 an, und da . eine Norm und nicht nur eine Halbnorm ist, muß m > 0 gelten. Also folgt m x 2 ≤ x
∀x ∈ X,
denn x/ x 2 ∈ S f¨ ur x = 0. Damit ist jede Norm zu . 2 ¨ aquivalent, und das zeigt die Behauptung des Satzes. 2 Wir werden uns in Korollar II.2.7 noch mit der Frage besch¨aftigen, wie ” ¨aquivalent“ zwei Normen auf Kn sind. Speziell erh¨alt man aus Satz I.2.5, daß in jedem endlichdimensionalen normierten Raum abgeschlossene und beschr¨ankte Mengen kompakt sind, daß alle endlichdimensionalen R¨ aume vollst¨ andig sind und deshalb (Lemma I.1.3) endlichdimensionale Unterr¨ aume von normierten R¨aumen abgeschlossen sind. Als n¨ achstes zeigen wir, daß die erstgenannte Eigenschaft endlichdimensionale R¨ aume charakterisiert. Dazu benutzen wir das folgende Lemma, das von unabh¨ angigem Interesse ist.
I.2
27
Eigenschaften normierter R¨ aume
Lemma I.2.6 (Rieszsches Lemma) Sei U ein abgeschlossener Unterraum des normierten Raums X, und sei U = X. Ferner sei 0 < δ < 1. Dann existiert xδ ∈ X mit xδ = 1 und xδ − u ≥ 1 − δ
∀u ∈ U.
Beweis. Sei x ∈ X \ U . Da U abgeschlossen ist, gilt d := inf{ x − u : u ∈ U } > 0, denn andernfalls g¨ abe es eine Folge (un ) in U mit un −x → 0, d und x l¨age in U = U . Deshalb ist d < 1−δ , und es existiert uδ ∈ U mit d x − uδ < 1−δ . Setze x − uδ xδ := , x − uδ so daß xδ = 1. Sei nun u ∈ U beliebig. Dann ist x uδ xδ − u = − − u x − uδ x − uδ 1 x − (uδ + x − uδ u) = x − uδ d ≥ (denn uδ + x − uδ u ∈ U ) x − uδ > 1−δ nach Wahl von uδ .
2
Satz I.2.7 F¨ ur einen normierten Raum X sind ¨ aquivalent: (i) dim X < ∞. (ii) BX := {x ∈ X: x ≤ 1} ist kompakt. (iii) Jede beschr¨ ankte Folge in X besitzt eine konvergente Teilfolge. Beweis. (i) ⇒ (ii): Das haben wir bereits im Anschluß an Satz I.2.5 bemerkt. (ii) ⇒ (iii): In einem kompakten metrischen Raum besitzt jede Folge eine konvergente Teilfolge, vgl. Satz B.1.7. (iii) ⇒ (i): Wir nehmen dim X = ∞ an. Sei x1 ∈ X mit x1 = 1 beliebig. Setze U1 = lin{x1 }; dann ist U1 endlichdimensional, folglich abgeschlossen und von X verschieden. Nach dem Rieszschen Lemma (Lemma I.2.6), angewandt mit δ = 12 , existiert x2 ∈ X mit x2 = 1 und x2 − x1 ≥ 12 . Nun betrachte U2 = lin{x1 , x2 } und wende das Rieszsche Lemma erneut an, um x3 mit x3 = 1, x3 − x1 ≥ 12 , x3 − x2 ≥ 12 zu erhalten. Dann betrachte U3 = lin{x1 , x2 , x3 }, etc. Auf diese Weise wird induktiv eine Folge (xn ) mit xn = 1 und xn − xm ≥ 12 f¨ ur alle m, n ∈ N, m = n definiert. Die Folge (xn ) ist beschr¨ ankt, hat aber keine Cauchy-, erst recht keine konvergente Teilfolge. 2 Es gibt noch einen h¨ ubschen direkten Beweis f¨ ur die Implikation (ii) ⇒ (i) in Satz I.2.7: Zu x ∈ BX betrachte die offene Kugel Ux um x mit dem
28
I.
Normierte R¨ aume
Radius12 . Wenn BX kompakt ist, existieren endlich viele x1 , . . . , xn mit BX ⊂ ni=1 Uxi . Dann muß X = lin{x1 , . . . , xn }, also endlichdimensional, sein. W¨are n¨amlich U := lin{x1 , . . . , xn } von X verschieden, so existierte nach dem Rieszschen Lemma x ∈ BX mit x − xi > 12 f¨ ur i = 1, . . . , n im Widerspruch zur Wahl der xi . Gilt das Rieszsche Lemma auch f¨ ur δ = 0? Das folgende Gegenbeispiel zeigt, daß das nicht zutrifft. Setze X = {x ∈ C[0, 1]: x(1) = 0} und U = 1 {x ∈ X: 0 x(t) dt = 0}. Versieht man X mit der Supremumsnorm, so ist U ein echter abgeschlossener Unterraum. G¨ abe es ein Element x ∈ X mit x − u ∞ ≥ x ∞ = 1 f¨ ur alle u ∈ U , so erhielte man folgendermaßen einen Widerspruch. Setze xn (t) = 1 − tn . Dann ist xn ∈ X, xn ∞ = 1, und 1 1 x (t) dt = 1 − n+1 . Mit 0 n 1 λn =
x(t) dt 0 , 1 1 − n+1
un = x − λn xn ∈ U
1 gilt dann nach Annahme x − un ∞ ≥ 1, d.h. |λn | ≥ 1. Es folgt 0 x(t) dt ≥ 1. Da jedoch x stetig und x(1) = 0 ist, ergibt sich aus x ∞ = 1 der 1 Widerspruch 0 x(t) dt < 1. Zu der hier aufgeworfenen Frage siehe auch Aufgabe I.4.21 und Aufgabe II.5.19. Als n¨achstes diskutieren wir die Separabilit¨at normierter R¨aume. Die Definition lautet: Definition I.2.8 Ein metrischer (oder topologischer) Raum heißt separabel, wenn er eine abz¨ ahlbare dichte Teilmenge besitzt. Dabei heißt D dicht in T , wenn D = T gilt; also ist eine Menge D genau dann dicht, wenn jede nichtleere offene Menge einen Punkt von D enth¨alt. Eine ¨aquivalente Formulierung im Fall metrischer R¨aume ist: Jeder Punkt von T ist Limes einer Folge aus D. Die Separabilit¨at eines Raums erleichtert dessen Analyse oft erheblich. Es ist nicht schwer zu zeigen, daß jede Teilmenge eines separablen metrischen Raums selbst separabel ist, siehe Aufgabe I.4.26. Da Rn separabel ist (Qn liegt dicht), sind alle T ⊂ Rn separable R¨aume. Zur Entscheidung der Separabilit¨at normierter R¨ aume ist das folgende Kriterium n¨ utzlich. Lemma I.2.9 F¨ ur einen normierten Raum X sind ¨ aquivalent: (i) X ist separabel. (ii) Es gibt eine abz¨ ahlbare Menge A mit X = lin A := lin A. Beweis. (i) ⇒ (ii) ist klar, denn X = A impliziert X = lin A. (ii) ⇒ (i): Wir betrachten zuerst den Fall K = R. Setze n B= λi xi : n ∈ N, λi ∈ Q, xi ∈ A . i=1
I.2
29
Eigenschaften normierter R¨ aume
Dann ist B abz¨ahlbar, und wir werden B = X, genauer • ∀x ∈ X ∀ε > 0 ∃y ∈ B
x − y < ε n zeigen. Zun¨achst w¨ ahle y0 ∈ lin A, also y0 = i=1 λi xi mit λi ∈ R, xi ∈ A, n so daß x − y0 ≤ ε/2. W¨ a hle dann λ ∈ Q mit |λ − λ | ≤ ε/ 2 x . i i i i i=1 n Dann gilt f¨ ur y = i=1 λi xi ∈ B x − y ≤ x − y0 + y0 − y ≤ ε/2 + max |λi − λi | i
n
xi ≤ ε.
i=1
Im Fall K = C verwende Q + iQ statt Q.
2
Beispiele. (a) p ist separabel f¨ ur 1 ≤ p < ∞. Sei n¨amlich en der n-te Einheitsvektor en = (0, . . . , 0, 1, 0, . . .)
(1 an der n-ten Stelle)
und A = {en: n ∈ N}. Dann ist p = lin A = d, wo der Abschluß nat¨ urlich bzgl. . p zu bilden ist. F¨ ur x = (tn )n ∈ p gilt n¨amlich 1/p n ∞ ti e i = |ti |p → 0. x − i=1
p
i=n+1
(b) Genauso zeigt man die Separabilit¨ at von c0 . (c) Hingegen ist ∞ nicht separabel. (Man mache sich klar, daß die Methode aus (a) f¨ ur p = ∞ nicht funktioniert!) F¨ ur M ⊂ N betrachte n¨amlich die Folge χM ∈ ∞ , wo χM (n) = 1 f¨ ur n ∈ M und χM (n) = 0 sonst. Dann ist Δ := {χM : M ⊂ N} u ahlbar, und es gilt χM − χM ∞ = ¨ berabz¨ 1 f¨ ur M = M . Ist nun A irgendeine abz¨ ahlbare Teilmenge von ∞ , so ∞ kann f¨ ur jedes x ∈ A die Menge {y ∈ : x − y ∞ ≤ 14 } wegen der Dreiecksungleichung h¨ ochstens ein y ∈ Δ enthalten, so daß A nicht dicht liegen kann. Ein ¨ahnliches Argument zeigt die Inseparabilit¨at von L∞[0, 1]. Zum Nachweis der Separabilit¨ at der R¨ aume C[a, b] und Lp [a, b], 1 ≤ p < ∞, ben¨otigen wir einen wichtigen Satz der Analysis. Satz I.2.10 (Weierstraßscher Approximationssatz) Der Unterraum P [a, b] der Polynomfunktionen auf [a, b], a, b ∈ R, liegt dicht in (C[a, b], . ∞ ). Beweis. O.E. sei a = 0, b = 1; ferner reicht es, sich mit reellwertigen Funktionen zu besch¨ aftigen.
30
I.
Normierte R¨ aume
Sei x ∈ C[0, 1] beliebig. Wir betrachten das n-te Bernsteinpolynom pn (s) := Bn (s; x) :=
n n i=0
i
si (1 − s)n−i x(i/n).
Wir werden pn − x ∞ → 0 zeigen. Da x gleichm¨ aßig stetig ist, existiert zu ε > 0 ein δ > 0 mit √ |s − t| ≤ δ ⇒ |x(s) − x(t)| ≤ ε.
(I.5)
Daraus ergibt sich mit α = 2 x ∞ /δ die Ungleichung |x(s) − x(t)| ≤ ε + α(t − s)2 ∀s, t ∈ [0, 1]; √ denn falls |t − s| ≤ δ, folgt das aus (I.5), und sonst ist
(I.6)
ε + α(t − s)2 > ε + 2 x ∞ > |x(s)| + |x(t)| ≥ |x(s) − x(t)|. Setze yt (s) = (t − s)2 . Dann kann (I.6) in der Form −ε − αyt ≤ x − x(t) ≤ ε + αyt
∀t ∈ [0, 1]
(I.7)
geschrieben werden. Um die diesen Funktionen assoziierten Bernsteinpolynome zu bestimmen, berechnen wir zuerst Bn ( . ; xj ) f¨ ur xj (s) = sj , j = 0, 1, 2, mit Hilfe des binomischen Satzes: n n i Bn (s; x0 ) = s (1 − s)n−i i i=0 n = s + (1 − s)
= 1; n n i i s (1 − s)n−i i n i=0 n n−1 = si (1 − s)n−i i − 1 i=1 n i n−1 da = i n i−1 n−1 n−1 = si+1 (1 − s)n−(i+1) i i=0 n−1 = s + (1 − s) s
Bn (s; x1 ) =
= s;
I.2
31
Eigenschaften normierter R¨ aume n i 2 n i Bn (s; x2 ) = s (1 − s)n−i i n i=0 n−1 n − 1 i+1 = si+1 (1 − s)n−(i+1) i n i=0 n−1 s n−1 i i = + s (1 − s)(n−1)−i s n i=0 i n
(wie oben) s n−1 2 = + s n n s(1 − s) = + s2 . n Bilden wir nun zu den in (I.7) auftauchenden Funktionen die Bernsteinpolynome, so ergibt sich −Bn ( . ; ε + αyt ) = Bn ( . ; −ε − αyt ) ≤ Bn ( . ; x − x(t)) ≤ Bn ( . ; ε + αyt ). Daher folgt f¨ ur alle s, t ∈ [0, 1] |pn (s) − x(t)| ≤ Bn (s; ε + αyt )
≤ ε + αt2 − 2αts + α
s(1 − s) + s2 , n
und setzt man s = t, so erh¨ alt man |pn (t) − x(t)| ≤ ε + α
t(1 − t) α ≤ε+ n n
∀t ∈ [0, 1],
woraus die gleichm¨ aßige Konvergenz von (pn ) gegen x folgt.
2
Dieselbe Methode wird zum Beweis von Satz IV.2.6 herangezogen werden. In Kapitel VIII werden wir eine weitreichende Verallgemeinerung des Weierstraßschen Approximationssatzes kennenlernen, den Satz von StoneWeierstraß (Satz VIII.4.7). Korollar I.2.11 C[a, b] ist separabel. Beweis. Nach Satz I.2.10 ist C[a, b] = lin{xn : n ∈ N0 }, wo xn (t) = tn . Nun zu den Lp -R¨ aumen. Satz I.2.12 F¨ ur 1 ≤ p < ∞ ist C[a, b] dicht in Lp [a, b]. Zum Beweis ben¨ otigen wir:
2
32
I.
Normierte R¨ aume
Definition I.2.13 Sei T ein metrischer (oder auch topologischer) Raum, Σ die σ-Algebra der Borelmengen (also die von den offenen Mengen erzeugte σ-Algebra). Ein Maß μ auf Σ heißt Borelmaß. Ein positives Borelmaß μ heißt regul¨ ar, falls (a) μ(C) < ∞ f¨ ur alle kompakten C, (b) f¨ ur alle A ∈ Σ gilt μ(A) = sup{μ(C): C ⊂ A, C kompakt}, = inf{μ(O): A ⊂ O, O offen}. Ein signiertes oder komplexes Borelmaß heißt regul¨ar, wenn seine Variation (vgl. Beispiel I.1(j)) regul¨ ar ist. M (T ) bezeichnet die Gesamtheit der signierten oder komplexen regul¨ aren Borelmaße. F¨ ur nicht endliche Maße ist der Regularit¨ atsbegriff in der Literatur nicht einheitlich. Die obige Definition werden wir jedoch im wesentlichen nur f¨ ur endliche Maße ben¨ otigen. Einige wichtige Tatsachen u ¨ber regul¨are Maße werden im folgenden Satz zitiert. Satz I.2.14 (a) Ist T ein kompakter metrischer Raum oder allgemeiner ein vollst¨andiger separabler metrischer Raum oder eine offene Teilmenge des Rn , so ist jedes endliche Borelmaß auf T regul¨ar. Auch das Lebesguemaß auf Rn ist regul¨ ar. (b) Ist T ein kompakter topologischer Raum, so ist M (T ) ein (im allgemeinen echter) abgeschlossener Untervektorraum von M (T, Σ). Zum Beweis von (a) sei etwa auf Rudin [1986], S. 50, oder Behrends [1987], S. 200, verwiesen. Die in (a) genannten R¨aume sind allesamt sog. polnische R¨ aume. F¨ ur ein Beispiel eines nicht regul¨aren Maßes auf einem kompakten Raum siehe Cohn [1980], S. 215. Der Beweis von (b) sei zur ¨ Ubung u ¨berlassen. Wir k¨onnen nun den Beweis von Satz I.2.12 f¨ uhren. Sei Σ die Borel-σAlgebra von [a, b]. In der Maßtheorie wird gezeigt, daß lin{χA : A ∈ Σ}, der Raum der Treppenfunktionen, dicht in Lp liegt. Aus der Regularit¨at des Lebesguemaßes folgt, daß lin{χO : O offen} bereits dicht liegt; denn es ist ja χA − χO p = λ(O\A)1/p < ε f¨ ur geeignetes offenes O ⊃ A. Eine offene Menge O ist abz¨ahlbare Vereinigung von paarweise disjunkten offenen Intervallen Ij ; wegen λ(O) = ∞ ur j=1 λ(Ij ) gilt χO ∈ lin{χI : I ein offenes Intervall}. Daher reicht es f¨ den Beweis des Satzes I.2.12 zu zeigen, daß es f¨ ur alle offenen Intervalle I ⊂ [a, b] und alle ε > 0 eine stetige Funktion f mit f − χI p < ε gibt. Und das sieht man nat¨ urlich so:
I.2
33
Eigenschaften normierter R¨ aume
f
a
I
Damit ist die Dichtheit von C[a, b] in Lp [a, b] bewiesen.
b 2
Wegen Satz I.2.12 kann man Lp [a, b] als Vervollst¨andigung des Raums (C[a, b], . p ) ansehen. F¨ ur Erweiterungen und Beweisalternativen dieses Satzes siehe Aufgabe II.5.6 und Lemma V.1.10. Korollar I.2.15 Lp [a, b] ist separabel f¨ ur 1 ≤ p < ∞. Beweis. Es reicht zu zeigen, daß die Polynomfunktionen dicht in Lp [a, b] sind. Sei dazu f ∈ Lp [a, b]. Zun¨ achst existiert nach Satz I.2.12 eine Folge stetiger Funktionen (fn ) mit fn − f p → 0. Nach Satz I.2.10 gibt es Polynomfunktionen gn mit fn − gn ∞ ≤ n1 . Wegen g p ≤ (b − a)1/p g ∞ f¨ ur alle g ∈ C[a, b] folgt fn − gn p → 0 und daher gn − f p → 0. Damit ist die Behauptung gezeigt. 2 Hier noch eine kleine Sammlung weiterer Aussagen u ¨ber R¨aume vom Typ C oder Lp : • F¨ ur einen kompakten metrischen Raum T ist (C(T ), . ∞ ) separabel. • Definiert man C(T ) auch f¨ ur kompakte topologische (Hausdorff-) R¨aume T , so ist C(T ) genau dann separabel, wenn T metrisierbar ist. • Ist μ ein endliches regul¨ ares Borelmaß auf dem kompakten metrischen (oder auch nur topologischen) Raum T , so liegt C(T ) dicht in Lp (μ) f¨ ur 1 ≤ p < ∞. • Ist T ein kompakter metrischer Raum oder eine offene Teilmenge des Rn sowie μ ein regul¨ ares Borelmaß auf T , so ist Lp(μ) separabel f¨ ur 1 ≤ p < ∞. (Diese Aussage gilt nicht mehr f¨ ur kompakte topologische R¨ aume.) Speziell ist Lp(Rn ) separabel f¨ ur diese p. Die Beweise sind zum Teil erheblich aufwendiger als im Fall eines kompakten Intervalls; der Fall des Raums Lp (Rn ) wird in Lemma V.1.10 (siehe auch Aufgabe II.5.6) behandelt.
34
I.
I.3
Normierte R¨ aume
Quotienten und Summen von normierten R¨ aumen
In diesem Abschnitt beschreiben wir die Konstruktion neuer normierter R¨aume aus bereits gegebenen. Wir wenden uns zuerst den normierten Quotienten zu. Definition I.3.1 Sei X ein normierter Raum und A ⊂ X. Der Abstand von x ∈ X zu A ist d(x, A) := inf{ x − y : y ∈ A}. Es folgt stets d(x, A) = 0 ⇐⇒ x ∈ A. Satz I.3.2 Sei X ein normierter Raum und U ⊂ X ein Unterraum. F¨ ur ¨ x ∈ X bezeichne mit [x] = x + U ∈ X/U die entsprechende Aquivalenzklasse. (a) [x] := d(x, U ) definiert eine Halbnorm auf X/U . (b) Ist U abgeschlossen, so ist . eine Norm. (c) Ist X vollst¨ andig und U abgeschlossen, so ist X/U ein Banachraum. Beweis. (a) Zun¨ achst ist . wohldefiniert, denn [x1 ] = [x2 ] impliziert x1 = x2 + u f¨ ur ein u ∈ U , und deshalb gilt d(x1 , U ) = d(x2 , U ). Die Gleichung λ[x] = |λ| [x] folgt f¨ ur λ = 0 sofort daraus, daß mit u auch λu den Unterraum U durchl¨ auft, und f¨ ur λ = 0 ist sie trivial. Um schließlich die Dreiecksungleichung zu beweisen, betrachten wir x1 , x2 ∈ X. W¨ahle zu ε > 0 Elemente u1 , u2 ∈ U mit xi − ui ≤ [xi ] + ε (i = 1, 2). Es folgt [x1 ] + [x2 ] = [x1 + x2 ] ≤ (x1 + x2 ) − (u1 + u2 ) ≤ x1 − u1 + x2 − u2 ≤ [x1 ] + [x2 ] + 2ε, denn u1 + u2 ∈ U . Da ε > 0 beliebig war, folgt die Dreiecksungleichung. (b) [x] = 0 ⇐⇒ d(x, U ) = 0 ⇐⇒ x ∈ U = U ⇐⇒ [x] = [0]. ∞ (c) Wir verwenden Lemma I.1.8. Seien xk ∈ X mit k=1 [xk ] < ∞. Nach Definition der Quotientennorm darf man ohne Beschr¨ankung der Allgemeinheit xk ≤ [xk ] + 2−k f¨ ur alle k ∈ N annehmen. Dann ist ∞ ∞ x < ∞, und nach Voraussetzung existiert x := x . k k=1 k=1 k Es folgt n n n [xk ] = x − xk ≤ x − xk → 0, [x] − k=1
k=1
k=1
35
I.4 Aufgaben
denn stets gilt [z] ≤ z . Also existiert war.
∞
k=1 [xk ]
in X/U , was zu zeigen 2
Beispiel. Sei D ⊂ [0, 1] abgeschlossen, und betrachte den Quotientenraum C[0, 1]/U , wo U = {x ∈ C[0, 1]: x|D = 0}. Die Quotientenbildung bedeutet, daß Funktionen, die auf D u ¨bereinstimmen, identifiziert werden. Es liegt daher nahe, die Elemente von C[0, 1]/U als Funktionen auf D anzusehen. Im n¨achsten Kapitel wird ausgef¨ uhrt werden, daß C[0, 1]/U und C(D) in der Tat isometrisch isomorph“ sind (Satz II.1.10). ” Beachte, daß Lemma I.1.9 als Spezialfall von Satz I.3.2 aufgefaßt werden kann, wenn man diesen auch f¨ ur halbnormierte R¨aume formuliert. Die Summenbildung normierter R¨ aume gestaltet sich wesentlich einfacher. Im folgenden werden wir sowohl die Norm des Raums X als auch die Norm des Raums Y mit demselben Symbol . bezeichnen. Satz I.3.3 Seien X und Y normierte R¨ aume. (a) Sei 1 ≤ p ≤ ∞. Dann definiert 1/p x p + y p (x, y) = p max x , y
f¨ ur p < ∞ f¨ ur p = ∞
eine Norm auf der direkten Summe X ⊕Y . Die so normierte direkte Summe wird mit X ⊕p Y bezeichnet. (b) All diese Normen sind ¨ aquivalent und erzeugen die Produkttopologie auf X × Y , d.h., (xn , yn ) → (x, y) bzgl. . p genau dann, wenn xn → x und yn → y. (c) Mit X und Y ist auch X ⊕p Y vollst¨ andig. ¨ Der einfache Beweis sei allen Leserinnen und Lesern zur Ubung u ¨berlassen.
I.4
Aufgaben
Aufgabe I.4.1 (a) In einem metrischen Raum (M, d) sind die Mengen (x ∈ M, ε > 0) U (x, ε) := {y ∈ M : d(x, y) < ε}
offen,
B(x, ε) := {y ∈ M : d(x, y) ≤ ε}
abgeschlossen,
S(x, ε) := {y ∈ M : d(x, y) = ε}
abgeschlossen.
(b) In einem normierten Raum (X, . ) gilt (x ∈ X, ε > 0) {y ∈ X: x − y < ε} = {y ∈ X: x − y ≤ ε}. Gib ein Beispiel eines metrischen Raums mit U (x, ε) = B(x, ε) f¨ ur geeignete x ∈ X, ε > 0.
36
I.
Normierte R¨ aume
Aufgabe I.4.2 Ein kompakter metrischer Raum ist vollst¨ andig. Aufgabe I.4.3 (a) Sei (Bn ) eine Folge abgeschlossener Kugeln in einem Banachraum mit ∞ B1 ⊃ B2 ⊃ . . . . Folgt dann n=1 Bn = ∅? (Hinweis: Falls B(x, r) ⊂ B(y, s), was kann man dann u ¨ber x−y sagen?) (b) Beantworte die gleiche Frage f¨ ur eine absteigende Folge abgeschlossener Kugeln in einem vollst¨ andigen metrischen Raum. n (Hinweis: Versuche M = {x1 , x2 , . . .} ⊂ c0 mit xn = a e und j=1 j j passenden aj .) Aufgabe I.4.4 Sei X ein Vektorraum u ¨ ber R oder C und p: X → [0, ∞) eine Abbildung mit (a) p(x) = 0 ⇐⇒ x = 0, (b) ∀λ ∈ K ∀x ∈ X p(λx) = |λ|p(x). Dann ist p eine Norm genau dann, wenn {x ∈ X: p(x) ≤ 1}, die p-Einheitskugel“, ” konvex ist. Aufgabe I.4.5 Konvergiert die Reihe
∞ n=1
(−t)n /n in der Norm von C[0, 1]?
Aufgabe I.4.6 Sei X der Vektorraum (!) aller Lipschitz-stetigen Funktionen von [0, 1] nach R. F¨ ur x ∈ X setze xLip
x(s) − x(t) . = |x(0)| + sup s−t s=t
(a) . Lip ist eine Norm, und es gilt x∞ ≤ xLip f¨ ur x ∈ X. (b) (X, . Lip ) ist ein Banachraum. Aufgabe I.4.7 F¨ ur x = (sn ) ∈ 1 setze
n x = sup sj . n j=1
Zeige, daß ( , . ) ein normierter Raum ist. Ist es ein Banachraum? 1
Aufgabe I.4.8 F¨ ur x = (sn ) ∈ c0 setze xJ :=
sup n1
r−1
1/2 |snk+1 − snk |2 + |snr − sn1 |2
∈ [0, ∞].
k=1
Betrachte nun J := {x ∈ c0 : xJ < ∞} . Zeige, daß (J, . J ) ein Banachraum ist. [Dieser Banachraum wurde 1951 von R. C. James konstruiert als ein Beispiel eines nichtreflexiven Banachraums, der zu seinem Bidual isometrisch isomorph ist. Diese Begriffe werden in Kapitel III erkl¨ art.]
I.4
37
Aufgaben
Aufgabe I.4.9 F¨ ur welche s, t ∈ R gilt (ns ) ∈ p bzw. ns (log(n + 1))t ∈ p ? Aufgabe I.4.10 (a) Zeige f¨ ur 1 ≤ p ≤ q < ∞ die Inklusion p ⊂ q , genauer xq ≤ xp
∀x ∈ p .
(Hinweis: Behandle zun¨ achst den Fall xp = 1 !) p (b) ⊂ c0 , und diese Inklusion ist echt. p<∞ Aufgabe I.4.11 F¨ ur alle x ∈ 1 gilt limp→∞ xp = x∞ . Aufgabe I.4.12 Gelte p1 + 1q + 1r = 1 sowie x ∈ p , y ∈ q , z ∈ r . xyz sei punktweise definiert, also (xyz)n = xn yn zn . Dann ist xyz ∈ 1 mit xyz1 ≤ xp yq zr . Aufgabe I.4.13 (a) Sei 1 < p < ∞, seien ferner x1 , x2 ∈ p oder ∈ Lp (μ) mit xi p = 1. Zeige: x1 + x2 = 1 =⇒ x1 = x2 . 2 p (Diese Eigenschaft nennt man strikte Konvexit¨ at. Was bedeutet sie f¨ ur die Gestalt der Einheitskugel?) (b) Folgende R¨ aume sind nicht strikt konvex (in ihrer u ¨ blichen Norm): 1 , ∞ , c0 , C[0, 1], L1 [0, 1], L∞ [0, 1]. (Hinweis zu (a): Studiere genau die Beweise der Minkowski- und H¨ olderungleichungen!) Aufgabe I.4.14 (a) Seien a, b ∈ R und 1 ≤ p ≤ q < ∞. Dann ist Lq [a, b] ⊂ Lp [a, b]; genauer gilt f¨ ur f ∈ Lq [a, b] f p f q ≤ . (b − a)1/p (b − a)1/q (Tip: H¨ oldersche Ungleichung!) (b) Sei I ein unbeschr¨ anktes Intervall. F¨ ur 1 ≤ p < q < ∞ gilt weder Lp (I) ⊂ q q p L (I) noch L (I) ⊂ L (I). Aufgabe I.4.15 (a) F¨ ur a, b ∈ R und 1 ≤ p < ∞ gilt L∞ [a, b] ⊂ Lp [a, b], genauer f Lp ≤ (b − a)1/p f L∞ (b) L∞ [a, b] ⊂
p<∞
∀f ∈ L∞ [a, b].
Lp [a, b], und diese Inklusion ist echt.
(c) F¨ ur 1 ≤ p < ∞ gilt weder Lp (R) ⊂ L∞ (R) noch L∞ (R) ⊂ Lp (R). (d) F¨ ur f ∈ C[0, 1] ist f ∞ = f L∞ .
38
I.
Aufgabe I.4.16 (Lyapunovsche Ungleichung) Seien 1 ≤ p0 , p1 < ∞ und 0 < θ < 1, und sei p durch Dann ist Lp0 (R) ∩ Lp1 (R) ⊂ Lp (R), genauer gilt θ f p ≤ f 1−θ p0 · f p1
1 p
=
Normierte R¨ aume
1−θ p0
+
θ p1
definiert.
∀f ∈ Lp0 (R) ∩ Lp1 (R).
(Tip: H¨ oldersche Ungleichung!) Aufgabe I.4.17 Betrachte die durch xn (t) = tn −tn+1 , yn (t) = n(tn −tn+1 ) und zn (t) = n3/2 (tn − tn+1 ) auf [0, 1] definierten Funktionen. Pr¨ ufe die Folgen (xn ), (yn ) und (zn ) auf Beschr¨ anktheit und Konvergenz in C[0, 1] sowie in Lp [0, 1]. (Tip f¨ ur (zn ): Behandle zun¨ achst die F¨ alle p = 1 und p = 2 und benutze Aufgabe I.4.16.) Aufgabe I.4.18 In dieser Aufgabe soll die sog. gleichm¨ aßige Konvexit¨ at der Lp p p R¨ aume f¨ ur 2 ≤ p < ∞ bewiesen werden. Sei 2 ≤ p < ∞ und L := L (I), wo I irgendein Intervall ist. (a) Zeige die folgenden Ungleichungen f¨ ur nichtnegative reelle Zahlen:
ap + bp ≤ (a2 + b2 )p/2 c2 d2 + 2 2
p/2
≤
1 p (c + dp ) 2
(Hinweis: F¨ ur welche α ist t → tα konvex? Bedenke auch Aufgabe I.4.10.) (b) Folgere die Clarksonsche Ungleichung
1 f + g p f − g p f pp + gpp + ≤ 2
2
p
2
p
f¨ ur f, g ∈ L . (c) F¨ ur alle 0 < ε < 2 existiert ein δ > 0, so daß f¨ ur alle f, g ∈ Lp mit f = g = 1 gilt: p
f + g > 1−δ 2
p
⇒
f − gp < ε
Was bedeutet das f¨ ur die Gestalt der Einheitskugel? Ein normierter Raum mit der in (c) beschriebenen Eigenschaft heißt gleichm¨ aßig konvex. Es ist ebenfalls richtig (aber schwieriger zu beweisen), daß Lp f¨ ur 1 < p < 2 gleichm¨ aßig konvex ist; siehe Satz IV.7.11. Die gleiche Schlußfolgerung gilt f¨ ur p , jedoch ist keiner der R¨ aume 1 , ∞ , L1 oder L∞ gleichm¨ aßig konvex. Man mache sich klar, daß die gleichm¨ aßige Konvexit¨ at die strikte Konvexit¨ at (Aufgabe I.4.13) impliziert, jedoch gilt die Umkehrung nicht (Aufgabe IV.8.35). Aufgabe I.4.19 F¨ ur x ∈ C 1 [0, 1] setze |||x|||1 = |x(0)| + x ∞ , |||x|||2
1 = max x(t) dt , x ∞ , 0 1 1/2 1 |x (t)|2 dt
|x(t)|2 dt +
|||x|||3 = 0
0
.
I.4
39
Aufgaben
(a) ||| . |||j ist jeweils eine Norm auf C 1 [0, 1] (j = 1, 2, 3). (b) Welche ||| . |||j sind ¨ aquivalent zu ||| . |||, definiert durch |||x||| = x∞ + x ∞ ? (Hinweis: Hauptsatz der Differential- und Integralrechnung) Aufgabe I.4.20 (Orliczr¨ aume) Sei M : [0, ∞) → [0, ∞) stetig und konvex, und es gelte M (t) = 0 ⇐⇒ t = 0. Die Menge L M (R) ist als die Menge aller meßbaren Funktionen f : R → R definiert, f¨ ur die ein c > 0 mit M (|f (t)|/c) dt < ∞ R
existiert. Zeige, daß L M (R) ein Vektorraum ist, und betrachte dann den Quotientenvektorraum LM (R) := L M (R)/{f : f = 0 fast u ¨ berall}. LM (R) heißt Orliczraum. Als n¨ achstes definiere f¨ ur f ∈ LM (R)
f M := inf
M (|f (t)|/c) dt ≤ 1 .
c > 0: R
Zeige, daß das eine Norm ist (begr¨ unde insbesondere, warum f M < ∞ gilt) und daß (LM (R), . M ) ein Banachraum ist. Betrachte nun
HM (R) :=
f ∈ LM (R):
M (|f (t)|/c) dt < ∞
∀c > 0 .
R
¨ Zeige, daß HM (R) ein abgeschlossener Unterraum von LM (R) ist. Uberlege, ob HM (R) = LM (R) gilt in den F¨ allen M (t) = tp , 1 ≤ p < ∞, bzw. M (t) = exp(t2 ) − 1. Aufgabe I.4.21 Setze d(x, A) = inf a∈A x −a f¨ ur eine abgeschlossene Teilmenge A eines normierten Raums X (Definition I.3.1). (a) x → d(x, A) ist stetig auf X, und A = {x ∈ X: d(x, A) = 0}. (b) Ist dim X < ∞, so darf im Rieszschen Lemma δ = 0 zugelassen werden. Aufgabe I.4.22 In einem unendlichdimensionalen normierten Raum sei O eine offene beschr¨ ankte Menge mit kompaktem Rand. Was kann man u ¨ber O aussagen? Aufgabe I.4.23 Betrachte die Unterr¨ aume U := {(sn ) ∈ 1 : s2n = 0 ∀n ∈ N}, 1 V := {(sn ) ∈ : s2n−1 = ns2n ∀n ∈ N}. Zeige, daß U und V abgeschlossen sind, aber daß die direkte Summe U ⊕ V nicht abgeschlossen ist. (Tip: Zeige zuerst, daß d ⊂ U ⊕ V gilt.) Aufgabe I.4.24 Ist X ein unendlichdimensionaler separabler normierter Raum, so enth¨ alt X eine linear unabh¨ angige abz¨ ahlbare dichte Teilmenge. Hinweise: (a) Kein echter Unterraum von X enth¨ alt eine offene Kugel. (b) Falls {xn : n ∈ N} = X und xn − yn ≤ 1/n f¨ ur alle n, so gilt auch {yn : n ∈ N} = X. (c) Konstruiere die gew¨ unschte Menge induktiv.
40
I.
Normierte R¨ aume
Aufgabe I.4.25 Sei X ein normierter Raum und Y ⊂ X ein abgeschlossener Unterraum. Zeige, daß X genau dann separabel ist, wenn es Y und X/Y sind. Aufgabe I.4.26 (a) M sei ein separabler metrischer Raum, und es sei A ⊂ M . Dann ist auch A separabel. (Achtung: Diese Aussage gilt nicht mehr, wenn M ein separabler topologischer Raum ist.) (b) F¨ ur einen normierten Raum X sind ¨ aquivalent: (i) X ist separabel. (ii) BX (= {x: x ≤ 1}) ist separabel. (iii) SX (= {x: x = 1}) ist separabel. Aufgabe I.4.27 Gib eine beschr¨ ankte Folge ohne eine konvergente Teilfolge in den Banachr¨ aumen C[0, 1] und Lp [0, 1] an! Aufgabe I.4.28 Sei xn (t) = tn , n ≥ 1. Geh¨ oren die konstanten Funktionen zur abgeschlossenen linearen H¨ ulle von x1 , x2 , . . . in Lp [0, 1]? ¨ Aufgabe I.4.29 F¨ ur x = (sn ) ∈ ∞ sei [x] die zugeh¨ orige Aquivalenzklasse in ∞ /c0 . Zeige [x] = lim sup |sn |, wenn ∞ die Supremumsnorm tr¨ agt.
I.5
Bemerkungen und Ausblicke
Der letzte Abschnitt eines jeden Kapitels versucht unter anderem, die historische Entwicklung der Funktionalanalysis nachzuvollziehen. Die an diesem Aspekt interessierten Leserinnen und Leser seien hierzu auf die B¨ ucher von Dieudonn´e [1981] und Monna [1973] sowie die umfassende Darstellung von Pietsch [2007] hingewiesen. Der Begriff des Banachraums hat sich Anfang der zwanziger Jahre herausgesch¨alt; hier sind Arbeiten von Helly (Monatshefte f. Math. u. Physik 31 (1921) 60–91), Hahn (Monatshefte f. Math. u. Physik 32 (1922) 3–88), Wiener (Fund. Math. 4 (1923) 136–143) sowie Banachs Dissertation (Fund. Math. 3 (1922) 133–181) zu nennen.1 Diese Autoren st¨ utzen sich u.a. auf Arbeiten von Hilbert und Schmidt, u ¨ber die in Kapitel V und VI zu sprechen sein wird, und F. Riesz. W¨ ahrend Hilbert und Schmidt sich den R¨aumen 2 und L2 widmen, ist es Riesz, der 1910 (Math. Ann. 69 (1910) 449– 497) die Funktionenr¨ aume Lp [a, b] und wenig sp¨ater die Folgenr¨aume p f¨ ur p = 2 studiert. Er zeigt die S¨ atze I.1.6 und I.1.7, deren endlichdimensionale Varianten auf H¨ older und Minkowski zur¨ uckgehen, und insbesondere die 1 Die Arbeiten der bedeutenden Mathematiker aus der ersten H¨ alfte dieses Jahrhunderts sind manchmal im Original schwer erh¨ altlich; sie sind jedoch h¨ aufig in Gesammelten Werken dieser Autoren erneut publiziert worden. So gibt es Gesammelte Werke von Banach, von Neumann, Riesz, Wiener und vielen anderen Mathematikern, die uns noch begegnen werden.
I.5
Bemerkungen und Ausblicke
41
Vollst¨andigkeit von Lp . Das war nat¨ urlich erst m¨oglich, nachdem Lebesgue Anfang des Jahrhunderts seine Integrationstheorie entwickelt hatte. Riesz benutzt zun¨achst noch nicht das heute u ¨bliche Normsymbol . , das man zuerst bei Schmidt findet (Rend. Circ. Mat. Palermo 25 (1908) 53–77) und es nahelegt, x − y als Abstand zwischen den Punkten x und y zu interpretieren. (Fr´echet hatte 1906 metrische R¨aume eingef¨ uhrt.) Eine solche Interpretation gestattet es, zur L¨ osung analytischer Probleme geometrische Intuition einzusetzen, was typisch f¨ ur die Methoden der Funktionalanalysis ist. Diese Sichtweise war damals jedoch noch nicht weit verbreitet; in der Tat war der Begriff des Vektorraums, mit dessen Hilfe ja Funktionen oder Folgen als Punkte eines abstrakten Ensembles angesehen werden k¨onnen, praktisch unbekannt. Der Vektorraumbegriff setzte sich erst in den zwanziger Jahren durch. In einer 1918 erschienenen Arbeit von Riesz (Acta Math. 41 (1918) 71– 98; wir kommen darauf in Kapitel VI zur¨ uck) treten die Banachraumaxiome schon klar zu Tage, auch wenn Riesz sich weigert, diese abstrakt zu formulieren, und stets im Rahmen der Supremumsnorm auf C[a, b] argumentiert, f¨ ur die jetzt systematisch das Symbol . verwandt wird. Er schreibt n¨amlich: Die in der Arbeit gemachte Einschr¨ ankung auf stetige Funktionen ist nicht von Belang. Der in den neueren Untersuchungen u ¨ ber diverse Funktionalr¨ aume bewanderte Leser wird die allgemeinere Verwendbarkeit der Methode sofort erkennen [. . .].
(Ebd. S. 71.) Diese Arbeit enth¨ alt auch das Rieszsche Lemma“ I.2.6. ” W¨ahrend sich Hellys bereits genannte Arbeit Folgenr¨aumen widmet, geben Banach, Hahn und Wiener die heute u ¨bliche Definition eines Banachraums als vollst¨andigen normierten Vektorraum, wobei sie sich allerdings der M¨ uhe unterziehen m¨ ussen, diesen letzteren Begriff zu erkl¨aren. Bemerkenswert ist, daß Wiener gleich komplexe Banachr¨aume zul¨aßt, w¨ahrend sie bei Banach nur reell sein d¨ urfen. Das ist mehr als eine Marginalie, da f¨ ur bestimmte Aussagen der Funktionalanalysis, insbesondere in der Spektraltheorie (siehe Kapitel VI und IX), komplexe Skalare notwendig sind; außerdem sind funktionalanalytische Techniken in der Funktionentheorie bedeutsam geworden. In seiner Autobiographie findet Wiener u ¨ brigens wenig schmeichelhafte Worte f¨ ur die Banachsche Schule: It is thus in an aesthetic rather than in any strictly logical sense that, in those years after Strasbourg, Banach space did not seem to have the physical and mathematical texture I wanted for a theory on which I was to stake a large part of my future reputation. Nowadays it seems to me that some aspects of the theory of Banach space are taking on a sufficiently rich texture and have been endowed with a sufficiently unobvious body of theorems to come closer to satisfying me in these respects.
42
I.
Normierte R¨ aume
At that time, however, the theory seemed to me to contain for the immediate future nothing but some decades of rather formal and thin work. By this I do not mean to reproach the work of Banach himself but rather that of the many inferior writers, hungry for easy doctors’ theses, who were drawn to it. As I foresaw, it was this class of writers that was first attracted to the theory of Banach spaces.
(Wiener [1956], S. 63f.) Stefan Banach (1892–1945) ist sicherlich eine der schillerndsten Gestalten der Mathematik des 20. Jahrhunderts. Er wurde in Krakau geboren, verbrachte jedoch sein wissenschaftliches Leben in Lemberg (poln. Lw´ow, frz. L´eopol, ukrain. Lwiw), das jetzt in der Ukraine liegt. Mathematisch war er im wesentlichen Autodidakt, aber heute sind Dutzende Begriffe und S¨atze mit seinem Namen verkn¨ upft. Ein von H. Steinhaus, Banachs Entdecker, verfaßter biographischer Abriß ist in Banachs Gesammelten Werken (Band 1, S. 13–22) zu finden (siehe auch Heuser [1992], S. 661ff.), und k¨ urzlich ist eine Biographie Stefan Banachs erschienen (Kalu˙za [1996]). Weitere biographische Artikel sind K. Ciesielski, Banach J. Math. Anal. 1 (2007) 1–10, und R. Duda, Jahresber. DMV 112 (2010) 3–24. Auch Ulam, einer von Banachs Sch¨ ulern, hat u ¨ber ihn geschrieben und ihn so geschildert (Mauldin [1981], S. 5.): Banach, by the way, was a very eccentric person in his habits and his personal life. He would not take any examinations at all, disliking them intensely. But he wrote so many original papers and proposed so many new ideas that he was granted a doctor’s degree several years later without passing any of the regular exams.
Die Umst¨ande, wie Banach seinen Doktortitel erlangte, sind kurios. Schon am Anfang seiner Karriere zeigte er wenig Neigung, seine neuen Resultate auch aufzuschreiben. Als die Lemberger Professoren den Eindruck hatten, er habe gen¨ ugend Material f¨ ur eine Dissertation beisammen, schickten sie einen Assistenten aus, um Banach diskret nach dem Stand seiner Forschungen auszuhorchen. Dieser Assistent mußte dann die S¨atze und Beweise, die Banach ihm erkl¨ art hatte, zu Papier bringen, und nach geraumer Zeit blieb f¨ ur letzteren nur noch die Aufgabe, den gesammelten Text zu redigieren; im Juni 1920 wurde die Dissertation eingereicht, und zwei Jahre sp¨ater erschien die eingangs zitierte franz¨ osische Fassung in Fundamenta Mathematicae. Aber es gab noch eine m¨ undliche Pr¨ ufung, und wieder mußten die Professoren zu einem Trick greifen. Eines Tages bat einer von ihnen Banach in einen Seminarraum unter dem Vorwand, es seien gerade ein paar ausw¨artige Mathematiker da, die bei einem bestimmten Problem nicht weiterk¨amen; ob er mit ihnen vielleicht ein paar Fragen diskutieren wolle? Das tat Banach nur zu gerne, und als nach einiger Zeit alle Fragen zur Zufriedenheit der G¨ aste – man ahnt es bereits, es handelte sich um die Pr¨ ufungskommission – beantwortet waren, stand der Promotion nichts
I.5
Bemerkungen und Ausblicke
43
mehr im Wege. 1922 folgte die Habilitation; die pr¨ ufungstechnischen Details sind leider nicht u ¨berliefert. Teil der Banachschen Exzentrizit¨ at war gewiß seine Vorliebe, im Caf´e zu arbeiten statt in der Universit¨ at, und zwar zuerst im Caf´e Roma ( He ” used to spend hours, even days there, especially towards the end of the month before the university salary was paid.“ (Mauldin [1981], S. 7)) und dann, als die Kreditsituation im Roma prek¨ ar wurde, im Schottischen Caf´e direkt gegen¨ uber. Dort haben endlose mathematische Diskussionen stattgefunden, haupts¨ achlich zwischen Banach, Mazur und Ulam ( It was hard ” to outlast or outdrink Banach during these sessions“, schreibt letzterer), deren wesentliche Punkte in einer vom Kellner des Schottischen Caf´es verwahrten Kladde festgehalten wurden; bevor sie angeschafft wurde, schrieb ¨ man – sehr zum Arger des Personals – direkt auf die Marmortische. Diese Kladde ist heute allgemein als das Schottische Buch“ bekannt; es ist, mit ” einleitenden Artikeln und Kommentaren versehen, von Mauldin als Buch herausgegeben worden (Mauldin [1981]). Im Schottischen Buch werden Probleme der Funktionalanalysis, der Theorie der reellen Funktionen und der Maßtheorie diskutiert; manche sind bis heute ungel¨ost geblieben. F¨ ur einige Probleme wurden Preise ausgesetzt, die von einem kleinen Glas Bier u ¨ ber eine Flasche Wein (siehe S. 254) bis zu einem kompletten Abendessen und einer lebenden Gans (siehe S. 88) reichten. Zu den Sch¨ ulern von Banach z¨ahlen außer Mazur und Ulam u.a. Auerbach, Eidelheit, Orlicz und Schauder, die uns im Laufe des Buches noch begegnen werden. Das Ende der Lemberger Schule kam 1941 mit dem Einmarsch der deutschen Truppen. Viele ihrer Mitglieder wurden von SS oder Gestapo ermordet; eine Liste get¨oteter polnischer Mathematiker findet man in Fund. Math. 33 (1945). Banach starb kurz nach Kriegsende an Lungenkrebs. 1932 erschien Banachs Monographie Th´eorie des Op´erations Lin´eaires (Banach [1932]), die die Erkenntnisse der Lemberger und anderer Mathematiker zusammenfaßt. Banach spricht dort u ¨ brigens von R¨aumen vom ” Typ (B)“ statt von Banachr¨ aumen; dieser Terminus wurde zuerst 1928 von Fr´echet gebraucht. Nun noch eine Erg¨ anzung im Zusammenhang mit dem Beweis des Satzes I.2.7. Dort wurde im Prinzip gezeigt, daß es in der Einheitskugel eines unendlichdimensionalen Banachraums zu jedem δ > 0 eine Folge mit xn − xm ≥ 1 − δ f¨ ur n = m gibt. (Wer den Beweis genau analysiert und Aufgabe I.4.21 beachtet, stellt fest, daß solch eine Folge selbst f¨ ur δ = 0 existiert.) Elton und Odell (Coll. Math. 44 (1981) 105–109) haben mit modernen kombinatorischen Methoden bewiesen, daß es sogar zu jedem unendlichdimensionalen Banachraum eine Konstante η > 1 und eine Folge (xn ) in der Einheitskugel mit xn − xm ≥ η f¨ ur n = m gibt. Der Beweis dieser Aussage ist hochgradig nichttrivial. Der Weierstraßsche Approximationssatz legt folgendes Problem nahe. Setzt man xn (t) = tn , so gilt ja C[0, 1] = lin{xn : n ≥ 0}. Kann man auf
44
I.
Normierte R¨ aume
einige dieser Monome verzichten, ohne diese Eigenschaften zu verlieren? (Sicherlich braucht man x0 , da ja xn (0) = 0 f¨ ur n ≥ 1 ist.) Mit anderen Worten: Wie muß eine Teilfolge (nk ) der nat¨ urlichen Zahlen beschaffen sein, damit die lineare H¨ ulle der xnk in C[0, 1] dicht liegt? Diese Frage wird auf h¨ochst einfache Weise im Satz von M¨ untz-Sz´ asz beantwortet: • Ist 0 = n0 < n1 < n2 < . . . eine Teilfolge ∞ von N0 , so gilt C[0, 1] = lin{xnk : k ≥ 0} genau dann, wenn k=1 1/nk = ∞ ist. Rudin [1986], S. 313, gibt einen funktionalanalytischen Beweis, der auf dem in Kapitel III zu diskutierenden Satz von Hahn-Banach sowie auf Aussagen u ankter analytischer Funktionen beruht. ¨ ber die Nullstellenlage beschr¨ Direktere Argumente findet man bei Cheney [1982], S. 198, oder bei von Golitschek, J. Approximation Theory 39 (1983) 394–395, der einen sehr ein fachen Beweis der Hinl¨ anglichkeit der Bedingung 1/nk = ∞ vorschl¨agt. ¨ Ubrigens kann man auch nicht ganze Exponenten und die Frage der Approximation in Lp betrachten. In diesem Kontext wurden entsprechende M¨ untz-Sz´ asz-Theoreme von Borwein und Erd´elyi (J. London Math. Soc. 54 (1996) 102–110), Operstein (J. Approximation Theory 85 (1996) 233–235), Erd´elyi und Johnson (J. d’Analyse Math. 84 (2001) 145–172) und Erd´elyi (Studia Math. 155 (2003) 145–152 und Constr. Appr. 21 (2005) 319–335) bewiesen. Ein anderes Problem ist die quantitative Untersuchung der G¨ ute der Approximation einer stetigen Funktion durch Polynome bestimmten Grades, d.h., man m¨ ochte die Gr¨ oßenordnung des Fehlers En (f ) = inf{ f − p ∞ : p ein Polynom vom Grad < n} f¨ ur f ∈ C[a, b] absch¨ atzen. (Das ist nichts anderes als die Quotientennorm ¨ der Aquivalenzklasse von f , wenn nach dem n-dimensionalen Unterraum der Polynome vom Grad < n gefasert wird.) Es gilt hier der Satz von Jackson, wonach f¨ ur eine k-mal stetig differenzierbare Funktion En (f ) ≤
C(k) (k) f ∞ nk
∀n ∈ N
mit einer nur von k abh¨ angigen Konstanten C(k) ist. ¨ Abschließend sei auf einen Uberblicksartikel zum Weierstraßschen Approximationssatz von Lubinsky hingewiesen (Quaest. Math. 18 (1995) 91– 130).
Kapitel II
Funktionale und Operatoren
II.1
Beispiele und Eigenschaften stetiger linearer Operatoren
In diesem Kapitel beginnen wir die Untersuchung linearer Abbildungen zwischen normierten R¨ aumen. Die folgende Sprechweise ist u ¨ blich. Definition II.1.1 Eine stetige lineare Abbildung zwischen normierten R¨aumen heißt stetiger Operator. Ist der Bildraum der Skalarenk¨orper, sagt man Funktional statt Operator. Ein stetiger Operator T : X → Y erf¨ ullt also eine der ¨aquivalenten Bedingungen: (i) Falls limn→∞ xn = x, so gilt limn→∞ T xn = T x. (ii) F¨ ur alle x0 ∈ X und alle ε > 0 existiert δ > 0 mit x − x0 ≤ δ
⇒ T x − T x0 ≤ ε.
(iii) F¨ ur alle offenen O ⊂ Y ist T −1 (O) = {x ∈ X: T x ∈ O} offen in X. Wir haben hier, einer verbreiteten Konvention folgend, T x statt T (x) geschrieben. Die folgende Charakterisierung stetiger Operatoren ist zwar elementar zu beweisen, aber von gr¨ oßter Bedeutung. Zur Erinnerung: Wir haben es in diesem Buch (fast) stets mit linearen Abbildungen zu tun. Satz II.1.2 Seien X und Y normierte R¨ aume, und sei T : X → Y linear. Dann sind folgende Aussagen ¨aquivalent: (i) T ist stetig. (ii) T ist stetig bei 0. (iii) Es existiert M ≥ 0 mit T x ≤ M x
∀x ∈ X.
D. Werner, Funktionalanalysis, 7. Aufl., Springer-Lehrbuch, DOI 10.1007/978-3-642-21017-4_2, © Springer-Verlag Berlin Heidelberg 2011
46
II.
Funktionale und Operatoren
(iv) T ist gleichm¨ aßig stetig. Beweis. (iii) ⇒ (iv) ⇒ (i) ⇒ (ii) ist trivial; in der Tat folgt aus (iii) die Lipschitzstetigkeit von T , denn T x − T x0 = T (x − x0 ) ≤ M x − x0 . (ii) ⇒ (iii) (vgl. den Beweis von Satz I.2.4): W¨are (iii) falsch, so existierte zu jedem n ∈ N ein xn ∈ X mit T xn > n xn . Setze yn = xn /(n xn ) (warum ist xn = 0?), dann ist yn = n1 , aber T yn =
T xn > 1. n xn
Mit anderen Worten: (yn ) ist eine Nullfolge, ohne daß (T yn ) gegen T (0) = 0 konvergiert, was (ii) widerspricht. 2 Definition II.1.3 Die kleinste in (iii) von Satz II.1.2 auftauchende Konstante wird mit T bezeichnet, d.h. T := inf{M ≥ 0: T x ≤ M x ∀x ∈ X}. Zur Rechtfertigung dieser Bezeichnung siehe den folgenden Satz. Es gilt offensichtlich: T = sup x =0
T x = sup T x = sup T x x
x =1
x ≤1
sowie die fundamentale Ungleichung T x ≤ T x
∀x ∈ X.
(II.1)
x
Um etwa die erste Gleichung einzusehen, setze M0 = supx =0 T , so daß
x
sofort T x ≤ M0 x f¨ ur alle x ∈ X folgt; daher gilt T ≤ M0 . W¨ahlt man andererseits zu ε > 0 ein xε = 0 mit T xε ≥ M0 (1 − ε) xε , so ergibt sich T ≥ M0 (1 − ε). Zusammen folgt T = M0 und daraus (II.1). Da stetige Operatoren nach Satz II.1.2 die Einheitskugel {x ∈ X: x ≤ 1} auf eine beschr¨ ankte Menge abbilden, spricht man auch von beschr¨ ankten Operatoren. Wir betrachten nun
L(X, Y ) := {T : X → Y : T ist linear und stetig}. Da Summen und skalare Vielfache von Nullfolgen wieder Nullfolgen sind, ist L(X, Y ) bez¨ uglich der algebraischen Operationen (S + T )(x) = Sx + T x (λT )(x) = λ T x ein Vektorraum. (Stets liegt der Nulloperator x → 0 in L(X, Y ), also ist L(X, Y ) = ∅.) Wir setzen noch L(X) = L(X, X).
II.1
Beispiele und Eigenschaften stetiger linearer Operatoren
47
Satz II.1.4 (a) T = sup x ≤1 T x definiert eine Norm auf L(X, Y ), die sog. Operatornorm. (b) Falls Y vollst¨andig ist, ist – unabh¨ angig von der Vollst¨ andigkeit von X – der Operatorraum L(X, Y ) vollst¨ andig. Beweis. (a) Scharfes Hinsehen liefert λT = |λ| T und T = 0 ⇒ T = 0. Nun zur Dreiecksungleichung. Sei x ≤ 1. Dann gilt (S + T )x = Sx + T x ≤ Sx + T x ≤ S + T . ¨ Der Ubergang zum Supremum zeigt S + T ≤ S + T . (b) Sei (Tn ) eine Cauchyfolge in L(X, Y ). F¨ ur alle x ∈ X ist dann (Tn x) eine Cauchyfolge im Banachraum Y . Wir bezeichnen ihren Limes mit T x. Die so definierte Abbildung T : X → Y ist linear, denn T (λx1 + μx2 ) = lim Tn (λx1 + μx2 ) = lim (λTn x1 + μTn x2 ) n→∞
n→∞
= λ lim Tn x1 + μ lim Tn x2 = λT x1 + μT x2 . n→∞
n→∞
Wir zeigen jetzt T ∈ L(X, Y ) (also T < ∞) und Tn − T → 0. Zu ε > 0 w¨ahle n0 ∈ N mit Tn − Tm ≤ ε
∀n, m ≥ n0 .
Sei x ∈ X, x ≤ 1. W¨ ahle m0 = m0 (ε, x) ≥ n0 mit Tm0 x − T x ≤ ε. Es folgt f¨ ur alle n ≥ n0 , daß Tn − T ≤ 2ε, denn Tn x − T x ≤ Tn x − Tm0 x + Tm0 x − T x ≤ Tn − Tm0 + ε ≤ 2ε. Daher gilt T < ∞ (sogar T ≤ lim inf Tn ) und Tn − T → 0.
2
Es ist an der Zeit, eine Bezeichnung einzuf¨ uhren. F¨ ur einen normierten Raum X setze BX = {x ∈ X: x ≤ 1}, SX = {x ∈ X: x = 1}. BX wird Einheitskugel, SX Einheitssph¨ are genannt. Die Konvergenz Tn → T bzgl. der Operatornorm ist dann ¨ aquivalent zur gleichm¨aßigen Konvergenz Tn x → T x auf BX ; das ist nat¨ urlich st¨ arker als die punktweise Konvergenz. (Ist etwa Tn das Funktional (tm )m → tn auf c0 , so gilt Tnx → 0 f¨ ur alle x ∈ c0 , aber Tn = 1.) Das n¨achste Ergebnis zeigt, daß stetige Operatoren von dichten Teilr¨aumen auf den Abschluß fortgesetzt werden k¨onnen.
48
II.
Funktionale und Operatoren
Satz II.1.5 Ist D ein dichter Unterraum des normierten Raums X, Y ein Banachraum und T ∈ L(D, Y ), so existiert genau eine stetige Fortsetzung T ∈ L(X, Y ), d.h. ein stetiger Operator mit T|D = T . Zus¨atzlich gilt T = T . Beweis. Sei x ∈ X. W¨ ahle eine Folge (xn ) in D mit xn → x. (xn ) ist dann eine Cauchyfolge, und da T nach Satz II.1.2 gleichm¨aßig stetig ist, ist auch (T xn ) eine Cauchyfolge. Bezeichnet man deren Limes mit Tx, so ist es leicht zu beweisen, daß T wohldefiniert ist und die geforderten Eigenschaften hat. Umgekehrt ist klar, daß jede stetige Fortsetzung S die Eigenschaft Sx = lim Sxn = lim T xn = Tx hat, so daß die behauptete Eindeutigkeit folgt. 2 Bevor einige Beispiele besprochen werden, bemerken wir noch ein einfaches Lemma. Lemma II.1.6 F¨ ur S ∈ L(X, Y ) und T ∈ L(Y, Z) gilt T S ∈ L(X, Z) mit T S ≤ T S . Beweis. Die Linearit¨ at von T S ist klar, und die Stetigkeit folgt sofort aus Satz II.1.2: T (Sx) ≤ T Sx ≤ T S x also T S ≤ T S .
∀x ∈ X, 2
Einfache Beispiele zeigen, daß im allgemeinen T S < T S gilt (etwa S: (s, t) → (s, 0) und T : (s, t) → (0, t) auf R2 ). Beispiele. Es ist in allen folgenden Beispielen trivial oder elementar, die Linearit¨at der untersuchten Abbildung zu zeigen; Linearit¨at wird daher stillschweigend als erwiesen angenommen. (a) Ist X = Y und T = Id, der identische Operator, so gilt T = 1. (b) Ist X endlichdimensional und Y ein beliebiger normierter Raum, so ist jede lineare Abbildung T : X → Y stetig. Zum Beweis mache zun¨achst die wichtige Bemerkung, daß die Stetigkeit von T erhalten bleibt, wenn man zu einer ¨aquivalenten Norm auf X oder Y u ¨ bergeht; die Gr¨oße der Zahl T h¨angt hingegen sehr wohl von der konkreten Wahl der Normen ab. n Nach urfen wir annehmen, daß X mit der Norm i=1 αi ei = n Satz I.2.5 d¨ i=1 |αi | versehen ist, wo {e1 , . . . , en } irgendeine Basis von X ist. Es folgt n n n αi e i = αi T ei ≤ |αi | T ei T i=1 i=1 i=1 n ≤ max T ei αi e i . i=1,...,n i=1
II.1
49
Beispiele und Eigenschaften stetiger linearer Operatoren
(c) Sind . und ||| . ||| zwei Normen auf dem Vektorraum X, so sind . und ||| . ||| genau dann ¨ aquivalent, wenn Id: X, . → X, ||| . ||| und
Id: X, ||| . ||| → X, .
stetig sind (vgl. Satz I.2.4). Gilt nur die obere Stetigkeit, also |||x||| ≤ M x , so nennt man . feiner und ||| . ||| gr¨ ober. (d) Setze T : C[0, 1] → K, T x = x(0). Dann ist T stetig mit T = 1. (Dabei wird auf C[0, 1] die Supremumsnorm betrachtet.) Um das einzusehen, u achst, daß ¨berlege zun¨ |T x| = |x(0)| ≤ sup |x(t)| = x ∞
∀x ∈ C[0, 1]
t∈[0,1]
und daher T ≤ 1 gilt. Andererseits betrachte die konstante Funktion 1, f¨ ur die 1 ∞ = 1 = T 1 ist; es folgt T = 1. (e) Setze T : C 1 [0, 1] → K, x → x(0) + x (1). Dann ist T stetig (bzgl. x C 1 = x ∞ + x ∞ ) mit T = 1. Denn es gilt |T x| = |x(0) + x (1)| ≤ |x(0)| + |x (1)| ≤ x ∞ + x ∞ = x C 1 , daher T ≤ 1. Andererseits gilt 1 C 1 = 1 sowie |T 1| = 1, also T ≥ 1. Betrachtet man jetzt auf dem Raum C 1 [0, 1] die ¨aquivalente Norm |||x||| = max{ x ∞ , x ∞ }, so ist T = 2: Zum einen zeigt n¨amlich |T x| ≤ x ∞ + x ∞ ≤ 2|||x|||, daß T ≤ 2. Andererseits sieht man f¨ ur x(t) = (t − 12 )2 + 34 sofort |T x| = 2 und x ∞ = x ∞ = 1, d.h. |||x||| = 1; also ist T ≥ 2. 1 (f) Es ist einfach zu sehen, daß T : C[0, 1] → K, T x = 0 x(t) dt, stetig ist mit T = 1. Wir betrachten nun X := {x ∈ C[0, 1]: x(1) = 0}, ebenfalls mit . ∞ versehen, und S := T |X . Dann gilt S = 1: Die Ungleichung S ≤ T ist offensichtlich, da S eine Restriktion von T ist. Sei anderer1 seits xn (t) = 1 − tn , also xn ∈ X mit xn ∞ = 1. Es ist |Sxn | = 1 − n+1 , d.h. S ≥ 1. Dieses Beispiel zeigt, daß in der Formel S = sup{ Sx : x ≤ 1} das Supremum nicht angenommen zu werden braucht, denn kein x ∈ BX erf¨ ullt |Sx| = 1. (Siehe dazu auch Aufgabe II.5.19.) (g) Allgemeiner als in (f) betrachte zu g ∈ C[0, 1] das Funktional Tg : C[0, 1] → K mit 1 Tg (x) = x(t)g(t) dt. 0
1 Dann gilt Tg = 0 |g(t)| dt. In der Tat ergibt sich ≤“ aus ” 1 1 1 |Tg (x)| = x(t)g(t) dt ≤ |x(t)| |g(t)| dt ≤ |g(t)| dt x ∞ . 0
0
0
50
II.
Funktionale und Operatoren
Umgekehrt setze zu ε > 0 xε (t) =
g(t) . |g(t)| + ε
Dann gilt xε ∈ C[0, 1], xε ∞ ≤ 1 sowie 1 1 1 |g(t)|2 |g(t)|2 − ε2 |Tg (xε )| = dt ≥ dt = |g(t)| dt − ε, |g(t)| + ε 0 |g(t)| + ε 0 0 daher erhalten wir Tg =
1
sup |Tg (x)| ≥ sup |Tg (xε )| ≥
x ∞ ≤1
ε>0
|g(t)| dt. 0
(h) Betrachte T : c → K, T x = limn→∞ tn f¨ ur x = (tn ). Man sieht leicht, daß T = 1. Da c0 = T −1 {0} gilt, liefert die Stetigkeit von T einen eleganten Beweis f¨ ur die Abgeschlossenheit von c0 in c, denn die einpunktige Menge {0} ist abgeschlossen. ∞(i) Auf d (vgl. Beispiel I.1(f)) betrachte die lineare Abbildung T x = ur x = (tn ). Da die Folge (tn ) abbricht, ist die Summe eine endn=1 ntn f¨ liche Summe, und T ist wohldefiniert. Betrachtet man die Supremumsnorm auf d, so ist T unstetig: Setzt man n¨ amlich en = (0, . . . , 0, 1, 0, . . .), wo die 1 an der n-ten Stelle steht, so ist en ∞ = 1, aber T en = n, so daß T auf Bd unbeschr¨ankt ist. Dasselbe Argument zeigt, daß T auf (d, . p ) unstetig ist. Es ist nicht ganz einfach zu zeigen, daß es auf einem vollst¨ andigen normierten Raum unstetige Funktionale gibt (siehe Aufgabe II.5.2); bemerke, daß d in keiner der Normen . p vollst¨ andig ist. (j) Die H¨oldersche Ungleichung I.1.10 zeigt, daß f¨ ur g ∈ Lq (μ) durch T : Lp (μ) → K, Tg (f ) = f g dμ, ein stetiges Funktional mit Tg ≤ g Lq definiert wird; hier ist 1 ≤ p ≤ ∞ 1 und p1 + 1q = 1 mit der Konvention ∞ = 0. Es gilt sogar Tg = g Lq , denn f¨ ur q/p g |g| f= |g| g Lq gilt f Lp = 1 und f g dμ = g Lq ; dieses Argument ist f¨ ur p = 1 und p = ∞ entsprechend zu modifizieren. In Satz II.2.4 wird gezeigt, daß f¨ ur p < ∞ jedes stetige lineare Funktional auf Lp auf diese Weise entsteht, wenn μ ein σ-endliches Maß ist. (k) Eine bedeutende Klasse linearer Abbildungen der Analysis besteht aus den Differentialoperatoren und den Integraloperatoren. Zun¨achst zu den Differentialoperatoren.
II.1
Beispiele und Eigenschaften stetiger linearer Operatoren
51
Wir betrachten den Ableitungsoperator D: C 1 [0, 1] → C[0, 1], der wohldefiniert und linear ist. Wir betrachten die Supremumsnorm auf C[0, 1] und C 1 [0, 1]. Dann ist D nicht stetig; denn f¨ ur xn (t) = tn gilt xn ∞ = 1, aber n−1 Dxn ∞ = supt nt = n. Versehen wir C 1 [0, 1] jedoch mit der Norm x C 1 = x ∞ + x ∞ , so ist D wegen Dx ∞ ≤ x C 1 stetig. Allgemeiner ist auf C r (Ω), Ω ⊂ Rn offen und beschr¨ankt, versehen mit der in Beispiel Norm . C r , jeder partielle Differential I.1(d) diskutierten α operator a D mit a ∈ C(Ω) ein stetiger Operator von C r (Ω) α α |α|≤r nach C(Ω). (l) Es sei k: [0, 1]× [0, 1] → K stetig und x ∈ C[0, 1]. Betrachte die durch
1
(Tk x)(s) :=
k(s, t)x(t) dt 0
definierte Funktion. Aus der gleichm¨ aßigen Stetigkeit von k folgt die Stetigkeit von Tk x. W¨ ahle n¨ amlich zu ε > 0 eine positive Zahl δ = δ(ε) mit (s, t) − (s , t ) ≤ δ
⇒ |k(s, t) − k(s , t )| ≤ ε,
wo . die euklidische Norm auf R2 ist. Dann gilt f¨ ur |s − s | ≤ δ |(Tk x)(s) − (Tk x)(s )| ≤
1
|k(s, t) − k(s , t)| |x(t)| dt
0
≤ ε
1
|x(t)| dt ≤ ε x ∞ .
(II.2)
0
Tk definiert also eine lineare Abbildung von C[0, 1] in sich. Diese Abbildung ist bzgl. der Supremumsnorm stetig, denn Tk = =
sup Tk x ∞
x ∞ ≤1
sup |(Tk x)(s)|
sup
x ∞ ≤1 s∈[0,1]
=
sup
sup
s∈[0,1] x ∞ ≤1
=
k(s, t)x(t) dt
1
|k(s, t)| dt
sup s∈[0,1]
0
1
0
nach Beispiel (g) mit g(t) = k(s, t), s fest. Wir erhalten daher eine explizite Formel f¨ ur die Norm von Tk : 1 Tk = sup |k(s, t)| dt ≤ k ∞ (II.3) s∈[0,1]
0
52
II.
Funktionale und Operatoren
Der Operator Tk heißt Fredholmscher Integraloperator und k sein Kern. (m) Integraloperatoren k¨ onnen auf diversen Funktionenr¨aumen definiert werden; z.B. zeigt das Argument unter (l), daß ein Fredholmscher Integraloperator mit stetigem Kern auch von L1 [0, 1] nach C[0, 1] und von Lp [0, 1] in sich wohldefiniert und stetig ist. Besonders wichtig ist die L2 -Theorie. Seien k ∈ L2 ([0, 1]2 ) und f ∈ L2 ([0, 1]). (Genau genommen sind in den folgenden Bemerkungen f und k beliebige Repr¨asentanten der entsprechen¨ den Aquivalenzklassen.) Aus dem Satz von Fubini (Satz A.2.4) folgt, daß k(s, . ) ∈ L2 ([0, 1]) f¨ ur fast alle s, und nach der H¨olderschen Ungleichung existieren die Integrale k(s, t)f (t) dt f¨ ur fast alle s. Man erh¨alt so eine meßbare Funktion 1 (Tk f )(s) := k(s, t)f (t) dt, 0
die zun¨achst nur fast u ¨ berall definiert ist und auf der fehlenden Nullmenge = 0 gesetzt wird. Wir werden zeigen, daß Tk ein stetiger Operator von L2 ([0, 1]) in sich ist. Es gilt n¨ amlich nach der H¨olderschen Ungleichung (mit p = q = 2) und dem Satz von Fubini 1 2 ds k(s, t)f (t) dt 0 0 2 1 1 ≤ |k(s, t)| |f (t)| dt ds
1
Tk f 2L2 =
0
0
1
≤
1
1
|k(s, t)|2 dt 0
1
0
|f (t)|2 dt ds
0
1
|k(s, t)|2 ds dt f 2L2 ,
= 0
0
also Tk ≤ k L2([0,1]2 ) . (Im allgemeinen gilt keine Gleichheit in dieser Absch¨atzung.) Analog definiert ein Kern k ∈ L2 (μ ⊗ ν) einen stetigen Integraloperator Tk : L2 (ν) → L2 (μ). (n) Manche unstetige Kerne geben trotzdem Anlaß zu stetigen Operatoren auf R¨aumen stetiger Funktionen. Als Beispiel betrachten wir den Kern |s − t|−α f¨ ur s = t k(s, t) = 0 sonst auf [0, 1] × [0, 1]. Wir werden zeigen, daß k f¨ ur 0 < α < 1 zu einem stetigen Integraloperator Tk : C[0, 1] → C[0, 1] f¨ uhrt. Operatoren mit Kernen des obigen Typs werden schwach singul¨ ar genannt.
II.1
53
Beispiele und Eigenschaften stetiger linearer Operatoren
Sei x ∈ C[0, 1]. Wegen α < 1 ist die Funktion t → k(s, t)x(t) f¨ ur alle s integrierbar, also ist 1 x(t) (Tk x)(s) = dt α 0 |s − t| stets wohldefiniert. Ferner ist Tk x beschr¨ ankt, denn 1 dt |(Tk x)(s)| ≤ x ∞ sup |s − t|α s 0 1 dt ≤ 2 x ∞ α t 0 2 ≤ x ∞ . 1−α 2 Daher ist Tk : C[0, 1] → ∞ [0, 1] stetig mit Tk ≤ 1−α . Es bleibt zu zeigen, daß mit x auch Tk x stetig ist. Wir werden beweisen, daß es zu jedem ε > 0 ein δ = δ(ε) > 0 mit der Eigenschaft
|(Tk x)(s) − (Tk x)(s )| ≤ x ∞ ε
∀x ∈ C[0, 1], |s − s | ≤ δ
gibt. Zun¨achst ist |(Tk x)(s) − (Tk x)(s )| ≤ x ∞
1
(II.4)
|k(s, t) − k(s , t)| dt,
0 4 und es reicht, das letzte Integral abzusch¨ atzen. Sei η > 0 mit 1−α (3η)1−α ≤ ε/2; wir zerlegen alsdann das Integral in |k(s, t) − k(s , t)| dt + |k(s, t) − k(s , t)| dt. (II.5) {t: |t−s|≥2η}
{t: |t−s|<2η}
Da k auf Dη := {(s, t) ∈ [0, 1]2 : |t − s| ≥ η} gleichm¨aßig stetig ist, existiert 0 < δ ≤ η, so daß f¨ ur |s − s | ≤ δ und (s, t), (s , t) ∈ Dη |k(s, t) − k(s , t)| ≤ ε/2 gilt. Da aus |s − s | ≤ η und |t − s| ≥ 2η auch |t − s | ≥ η, d.h. (s , t) ∈ Dη , folgt, l¨aßt sich das erste Integral in (II.5) durch ε/2 absch¨atzen. F¨ ur das zweite Integral hat man f¨ ur |s − s | ≤ δ (≤ η) dt dt |k(s, t) − k(s , t)| dt ≤ + α α {...} |s − t| {...} |s − t| {t: |t−s|<2η}
3η
≤ 4 0
nach Wahl von η. Damit ist (II.4) gezeigt.
dt 4 ε = (3η)1−α ≤ tα 1−α 2
54
II.
Funktionale und Operatoren
Wir definieren nun einige Klassen von Operatoren. Definition II.1.7 Seien X und Y normierte R¨aume. Eine lineare Abbildung T : X → Y heißt Quotientenabbildung, wenn T die offene Kugel {x ∈ X: x < 1} auf die offene Kugel {y ∈ Y : y < 1} abbildet. Speziell ist eine Quotientenabbildung surjektiv und stetig mit T = 1. Quotientenabbildungen brauchen u ¨brigens abgeschlossene Kugeln nicht auf abgeschlossene Kugeln abzubilden, vgl. Aufgabe II.5.19. Der Ursprung des Namens Quotientenabbildung wird im Anschluß an Satz II.1.10 erkl¨art; einstweilen wird gezeigt: Satz II.1.8 Sei U ein abgeschlossener Unterraum des normierten Raums X. Dann ist die nat¨ urliche Abbildung ω: X → X/U , x → [x], eine Quotientenabbildung. Beweis. Sei [x] ∈ X/U mit [x] < 1. Nach Definition der Quotientennorm existiert u ∈ U mit x − u < 1, und es gilt ω(x − u) = [x]. Ist umgekehrt x < 1, so folgt sofort [x] ≤ x < 1. 2 Bemerke, daß Satz II.1.8 und sein Beweis nur eine abstrakte Umformulierung des Rieszschen Lemmas I.2.6 sind. Als n¨achstes betrachten wir das Problem der Invertierbarkeit von Operatoren. Sind X und Y normierte R¨ aume und ist T : X → Y eine bijektive stetige lineare Abbildung, so existiert die Umkehrabbildung T −1 : Y → X, und T −1 ist linear. T −1 braucht z.B. jedoch nicht stetig zu sein; betrachte den identischen Operator Id: C[0, 1], . ∞ → C[0, 1], . 1 . Die Stetigkeit von T −1 ist jedoch von gr¨ oßter Bedeutung. Ist n¨amlich etwa x1 L¨osung der Gleichung T x1 = y1 und x2 L¨ osung der Gleichung T x2 = y2 (mit anderen Worten xi = T −1 yi ), so ist in Anwendungen die Eigenschaft y1 ≈ y2 ⇒ x1 ≈ x2 , d.h. die Stetigkeit von T −1 , h¨ochst w¨ unschenswert (stetige Abh¨angigkeit der L¨ osung von den Daten). In Kapitel IV werden S¨atze bewiesen, die unter recht allgemeinen Voraussetzungen die Stetigkeit der Inversen garantieren (Korollar IV.3.4, Satz IV.4.4); dabei wird sich die Vollst¨andigkeit der beteiligten R¨ aume als entscheidend herausstellen. Die Existenz von stetigen und stetig invertierbaren Operatoren zwischen normierten R¨aumen X und Y ist auch unter strukturellen Aspekten von Interesse, da in diesem Fall X und Y im wesentlichen identifiziert werden k¨onnen. Man setzt daher: Definition II.1.9 Ein stetiger linearer Operator T : X → Y heißt Isomorphismus, falls T bijektiv und T −1 stetig ist. Gilt f¨ ur einen linearen Operator T x = x f¨ ur alle x ∈ X, so heißt T isometrisch. Normierte R¨aume, zwischen denen ein (isometrischer) Isomorphismus existiert, heißen (isometrisch) isomorph, in Zeichen X Y (bzw. X ∼ = Y ).
II.1
Beispiele und Eigenschaften stetiger linearer Operatoren
55
Isomorphismen sind also lineare Surjektionen, die die Bedingung ∃m, M > 0 ∀x ∈ X
m x ≤ T x ≤ M x
erf¨ ullen. Ferner ist klar, daß Isometrien injektiv sind. Zur Illustration zeigen wir: Satz II.1.10 (a) c c0 . (b) Ist D ⊂ [0, 1] abgeschlossen und JD := {x ∈ C[0, 1]: x|D = 0}, so gilt C(D) ∼ = C[0, 1]/JD . Beweis. (a) Zu x = (sn ) ∈ c assoziieren wir (x) = limn→∞ sn und eine Folge y = (tn ) gem¨ aß t1 = (x) und tn = sn−1 − (x) f¨ ur n ≥ 2. Es ist klar, daß die Abbildung T : x → y linear ist und Werte in c0 annimmt. Der Operator T : c → c0 ist stetig wegen T x ∞ = sup |tn | ≤ sup |sn | + |(x)| ≤ 2 x ∞ , n
n
denn = 1 nach Beispiel II.1(h). Umgekehrt assoziiere zu y = (tn ) ∈ c0 eine Folge x = (sn ) gem¨aß sn = tn+1 + t1 f¨ ur n ≥ 1. Die Abbildung S: y → x nimmt Werte in c an, und der Operator S: c0 → c ist stetig mit S ≤ 2, denn Sy ∞ = sup |tn+1 + t1 | ≤ 2 y ∞. n
Man best¨atigt schließlich durch scharfes Hinsehen, daß T S = Idc0 und ST = Idc gelten. Daher ist S = T −1 , und T ist ein Isomorphismus. (b) Betrachte die Abbildung T : C[0, 1]/JD → C(D), T [x] = x|D . Dann ist T wohldefiniert, denn f¨ ur [x1 ] = [x2 ] gilt x1 − x2 ∈ JD , daher x1 |D = x2 |D . Es ist klar, daß T linear ist, und die Stetigkeit von T sieht man so: Seien x ∈ C[0, 1], y ∈ JD . Dann gilt T [x] ∞ = sup |x(t)| = sup |x(t) − y(t)| ≤ x − y ∞ ; t∈D
t∈D
nach Definition der Quotientennorm folgt T [x] ∞ ≤ [x] , d.h. T ≤ 1. Als n¨achstes wird die Surjektivit¨ at von T bewiesen. Sei z ∈ C(D). W¨ahle y ∈ C[0, 1] mit y ∞ = z ∞ und y |D = z. Die Existenz einer solchen Funktion y ist im Fall eines abgeschlossenen Intervalls D klar; im allgemeinen folgt sie aus dem Satz von Tietze-Urysohn (Korollar B.1.6 bzw. B.2.6). Nach Konstruktion gilt T [y] = z. Es bleibt zu zeigen, daß T isometrisch ist. Sei x ∈ C[0, 1]. Es ist noch T [x] ∞ ≥ [x] zu zeigen, denn wir wissen bereits, daß T ≤ 1 gilt. Wie
56
II.
Funktionale und Operatoren
oben w¨ahle y ∈ C[0, 1], welches z := T [x] = x|D normerhaltend fortsetzt. Insbesondere ist [x] = [y], da x − y ∈ JD , und es gilt T [x] ∞ = T [y] ∞ = z ∞ = y ∞ ≥ [y] = [x] .
2
Eine Analyse des Beweises von Teil (b) zeigt die folgenden Aussagen: • Ist K ein kompakter metrischer (oder topologischer) Raum sowie D ⊂ K abgeschlossen, so ist die Einschr¨ ankungsabbildung C(K) → C(D), x → x|D , eine Quotientenabbildung. • F¨ ur eine Quotientenabbildung T : X → Y ist X/ ker(T ) ∼ =Y. Die letzte Aussage erkl¨ art den Namen Quotientenabbildung. Zum Schluß behandeln wir eine Methode, mit der inverse Operatoren in einigen Spezialf¨ allen explizit berechnet werden k¨onnen. Die im folgenden Satz auftauchende Reihe wird die Neumannsche Reihe genannt. F¨ ur einen Operator T ∈ L(X) setzt man T 0 = Id und T n = T ◦ · · · ◦ T (n Faktoren). Satz Sei X ein normierter Raum und T ∈ L(X). Konvergiert ∞ II.1.11 n n=0 T in L(X), so ist Id − T invertierbar mit −1
(Id − T )
=
∞
T n.
n=0
Speziell ist die Voraussetzung erf¨ ullt, falls X ein Banachraum und T < 1 ist. In diesem Fall ist (Id − T )−1 ≤ (1 − T )−1 . m Beweis. Setze Sm = n=0 T n . Dann ist (Teleskopreihe) (Id − T )Sm = Sm (Id − T ) = Id − T m+1 . Nun bemerke, daß in jedem normierten Raum die Glieder einer konvergenten Reihe eine Nullfolge bilden (Beweis wie im skalaren Fall) und daß f¨ ur festes R die linearen Abbildungen S → RS und S → SR nach Lemma II.1.6 stetig auf L(X) sind. Es folgt Id = lim (Id − T m+1 ) = lim (Id − T )Sm = (Id − T ) lim Sm m→∞
m→∞
und genauso Id = lim Sm (Id − T ), also (Id − T )−1 =
∞ n=0
m→∞
T n.
m→∞
II.1
Beispiele und Eigenschaften stetiger linearer Operatoren
57
∞ ∞ ∞ F¨ ur T < 1 gilt n=0 T n ≤ n=0 T n < ∞, also ist dann n=0 T n absolut konvergent. Ist X vollst¨ andig, so folgt daraus wegen Lemma I.1.8 ∞ und Satz II.1.4(b) die Konvergenz von n=0 T n . Aus ∞ ∞ n T ≤ T n = (1 − T )−1 n=0
n=0
2
ergibt sich die behauptete Normabsch¨ atzung. Beispiel. Wir betrachten eine Integralgleichung 1 x(s) − k(s, t)x(t) dt = y(s) (s ∈ [0, 1]), 0
wo y ∈ C[0, 1] und k ∈ C [0, 1]2 gegeben sind. Gesucht ist eine L¨osung x ∈ C[0, 1]. (Dieses Problem ist einem Randwertproblem f¨ ur eine gew¨ohnliche Differentialgleichung ¨ aquivalent.) Wir f¨ uhren den Integraloperator 1 Tk : C[0, 1] → C[0, 1], Tk x = k( . , t)x(t) dt 0
ein, f¨ ur den ja
Tk = sup s
1
|k(s, t)| dt 0
gilt, vgl. Beispiel II.1(l). Die Integralgleichung kann dann als Operatorgleichung (Id − Tk )x = y geschrieben werden. Wir setzen nun Tk < 1 voraus. Nach Satz II.1.11 existiert dann der inverse Operator (Id − Tk )−1 , und es gilt ∞ −1 n x = (Id − Tk ) y = Id + Tk y. n=1
In diesem Fall besitzt die gegebene Integralgleichung f¨ ur jede rechte ∞ Seite y genau eine L¨osung x. Diese kann durch genauere Analyse von n=1 Tkn explizit bestimmt werden. Dazu definiert man induktiv die iterierten Kerne k1 (s, t) = k(s, t) 1 kn (s, t) = k(s, u)kn−1 (u, t) du. 0
Man zeigt nun ohne große M¨ uhe, daß die kn stetige Funktionen sind (dazu benutze die gleichm¨ aßige Stetigkeit von k und kn−1 ) und daß Tkn = Tkn ist (benutze den Satz von Fubini). Ferner gilt die Absch¨atzung 1 |kn (s, t)| ≤ |k(s, u)| du · kn−1 ∞ , 0
58
II.
Funktionale und Operatoren
woraus induktiv mit (II.3) kn ∞ ≤ Tk n−1 k ∞ folgt. Wegen Tk < 1 konvergiert also die Reihe h(s, t) =
∞
kn (s, t)
n=1
gleichm¨aßig auf [0, 1]2 ; es folgt h ∈ C [0, 1]2 . Da die Abbildung f → Tf , die einer stetigen Kernfunktion den zugeh¨ origen Integraloperator auf C[0, 1] zuordnet, linear und nach (II.3) stetig ist, erh¨alt man Th =
∞ n=1
Tkn =
∞
Tkn .
n=1
Die Funktion h heißt der aufl¨ osende Kern, und die L¨osung der Integralgleichung ist von der Form x = (Id + Th )y.
II.2
Dualr¨ aume und ihre Darstellungen
Es stellt sich als ein wesentliches Prinzip der Funktionalanalysis heraus, Informationen u aume mittels der auf ihnen definierten li¨ber normierte R¨ nearen stetigen Funktionale zu gewinnen. Deshalb wird der folgende Begriff eingef¨ uhrt. Definition II.2.1 Der Raum L(X, K) der stetigen linearen Funktionale auf einem normierten Raum X heißt der Dualraum von X und wird mit X bezeichnet. Als Spezialfall von Satz II.1.4 erh¨ alt man sofort: Korollar II.2.2 Der Dualraum eines normierten Raums, versehen mit der Norm x = sup x ≤1 |x (x)|, ist stets ein Banachraum. Bevor wir in Kapitel III nichttriviale Existenzs¨atze f¨ ur Funktionale beweisen, sollen in diesem Abschnitt konkrete Darstellungen der Dualr¨aume einiger Banachr¨aume angegeben werden. Die Elemente eines Dualraums werden wir mit x , y etc. bezeichnen, was nicht mit dem Ableitungsstrich bei differenzierbaren Funktionen zu verwechseln ist.
II.2
59
Dualr¨ aume und ihre Darstellungen
Satz II.2.3 (a) Sei 1 ≤ p < ∞ und
1 p
+ 1q = 1 (mit
T : q → (p ) ,
1 ∞
= 0). Dann ist die Abbildung ∞
(T x)(y) =
s n tn
n=1
(wo x = (sn ) ∈ q , y = (tn ) ∈ p ) ein isometrischer Isomorphismus. (b) Dieselbe Abbildungsvorschrift vermittelt einen isometrischen Isomorphismus zwischen 1 und (c0 ) . Beweis. Wir betrachten nur 1 < p < ∞ in (a). Der Fall p = 1 und Teil (b) lassen sich ¨ahnlich beweisen. ∞ Zun¨achst folgt aus der H¨ olderschen Ungleichung I.1.4, daß n=1 sn tn tats¨achlich konvergiert (sogar absolut) und daß |(T x)(y)| ≤ x q y p ist. Da die Linearit¨ at von T x und T klar ist, folgt die Wohldefiniertheit von T sowie T x ≤ x q . Außerdem ist T injektiv, denn aus T x = 0 folgt sn = (T x)(en ) = 0 f¨ ur alle n ∈ N (wo en wie u ¨blich den n-ten Einheitsvektor bezeichnet) und deshalb x = 0. Wir zeigen jetzt die Surjektivit¨ at von T und – en passant – die Isometrie. Sei y ∈ (p ) . Zu n ∈ N setze sn := y (en ) und x = (sn ). Es ist zu zeigen: T x = y,
x ∈ q ,
x q ≤ y .
Zu diesem Zweck definiere tn =
|sn |q /sn f¨ ur sn = 0, 0 f¨ ur sn = 0.
Nun gilt f¨ ur alle N ∈ N N
|tn |p =
n=1
N
|sn |p(q−1) =
n=1
N
|sn |q
n=1
sowie N n=1
|sn |
q
=
N
s n tn =
n=1
≤ y
N n=1
N
tn y (en ) = y
n=1
1/p
|tn |p
= y
N
N n=1
tn e n
n=1
|sn |q
1/p .
60
II.
Es folgt
N
1/q |sn |q
≤ y
Funktionale und Operatoren
∀N ∈ N,
n=1
daher x ∈ q und x q ≤ y . Um schließlich T x = y einzusehen, beachte, daß nach Konstruktion (T x)(en ) = y (en ) f¨ ur alle n ∈ N gilt. Da T x und y linear sind, stimmen sie auch auf lin{en : n ∈ N} = d u ¨berein, und da sie stetig sind, auf d = p (vgl. Beispiel I.2(a)). Daher gilt T x = y . 2 Kurz gesagt behauptet p c0
Satz II.2.3 ∼ = q ∼ = 1 .
f¨ ur 1 ≤ p < ∞,
Hingegen wird in Satz III.1.11 gezeigt, daß (∞ ) echt gr¨oßer als 1 ist. Der obige Beweis funktioniert auch ur die n-dimensionalen p -R¨aume f¨ p (n). In diesem Kontext gilt p (n) ∼ ur p = ∞, q = 1. = q (n) selbst f¨ Wir wollen als n¨ achstes den Dualraum der Lp -R¨aume bestimmen. Dazu ben¨otigen wir ein wichtiges Resultat der Maßtheorie, den Satz von RadonNikod´ ym (Satz A.4.6). Wir formulieren den folgenden Satz f¨ ur abstrakte Maßr¨aume (σ-endliche Maßr¨ aume werden in Definition A.2.1 erkl¨art); wer in der abstrakten Maßtheorie nicht so bewandert ist, betrachte statt μ beim ersten Lesen das Lebesguemaß. Satz II.2.4 Sei 1 ≤ p < ∞ und (Ω, Σ, μ) ein σ-endlicher Maßraum. Ferner gelte 1p + 1q = 1. Dann definiert T : L (μ) → L (μ) , q
p
(T g)(f ) =
f g dμ Ω
einen isometrischen Isomorphismus. Beweis. In Beispiel II.1(j) ist T bereits als wohldefiniert und isometrisch erkannt worden. Um die Surjektivit¨ at zu zeigen, sei y ∈ Lp (μ) gegeben. Um maßtheoretischen Komplikationen aus dem Weg zu gehen, werden wir nur den Fall eines endlichen Maßes im Detail untersuchen, woraus sich der allgemeine Fall ergibt; siehe Aufgabe II.5.28. Betrachte die Funktion ν: Σ → K,
ν(E) = y (χE ).
Da μ momentan als endlich angenommen wurde, liegt die Indikatorfunktion χE in Lp (μ), und ν ist wohldefiniert. Es ist klar, daß ν additiv ist, und die Voraussetzung p < ∞ impliziert, daß ν sogar σ-additiv ist. ν ist also ein signiertes (oder komplexes) Maß. Aus der Konstruktion von ν folgt, daß
II.2
61
Dualr¨ aume und ihre Darstellungen
ν absolutstetig bzgl. μ ist, denn aus μ(E) = 0 ergibt sich χE = 0 μ-fast u ¨berall, also χE = 0 ∈ Lp (μ) und ν(E) = y (χE ) = 0. Nach dem Satz von Radon-Nikod´ ym existiert eine μ-integrierbare Dichte g mit ν(E) = g dμ = χE g dμ ∀E ∈ Σ. E
Ω
Als n¨achstes beweisen wir y (f ) = f g dμ
∀f ∈ L∞ (μ).
(II.6)
Nach Konstruktion ist n¨ amlich y (f ) = f g dμ f¨ ur alle Indikatorfunktionen f und daher auch f¨ ur Linearkombinationen von Indikatorfunktionen, da y linear ist. Deshalb gilt diese Formel auch f¨ ur Treppenfunktionen. Da ∞ schließlich die identische Abbildung von L (μ) nach Lp (μ) stetig ist, ist y ∞ 1 bzgl. . L∞ stetig; und f → f g dμ ist stetig auf L (μ), da g ∈ L (μ). Folglich gilt y (f ) = f g dμ auch auf dem . L∞ -Abschluß der Treppenfunktionen, d.h. auf L∞ (μ). Jetzt kann mit einer ¨ ahnlichen Methode wie im p -Fall g ∈ Lq (μ) gezeigt werden, so daß T g definiert ist. Falls q < ∞, definiere hierzu (mit der Vereinbarung 00 = 0) |g(ω)|q f (ω) = . g(ω) Die Funktion f ist meßbar, und es gilt |g|q = f g = |f |p . Nun betrachte zu n ∈ N die meßbare Menge En = {ω: |g(ω)| ≤ n}. Dann ist χEn f ∈ L∞ (μ), und ferner liefert (II.6) |g|q dμ = (χEn f )g dμ = y (χEn f ) ≤ y χEn f Lp En
Ω
= y
1/p |f | dμ p
En
folglich
= y
1/p |g| dμ , q
En
1/q |g|q dμ
≤ y
En
∀n ∈ N.
1/q Da nach dem Satz von Beppo Levi (Satz A.3.1) supn En |g|q dμ = g Lq gilt, ist damit g ∈ Lq (μ) bewiesen. Im Fall q = ∞ (also p = 1) betrachte E = {ω: |g(ω)| > y } und setze f = χE |g|/g ∈ L∞ (μ). W¨ are μ(E) > 0, folgte μ(E) y < |g| dμ = f g dμ = y (f ) ≤ y f L1 E
Ω
62
II.
Funktionale und Operatoren
im Widerspruch zu μ(E) = f L1 . Also gilt |g| ≤ y fast u ¨berall, d.h. g ∈ L∞ (μ). Da beide Funktionale y und T g auf Indikatorfunktionen und daher auf deren linearer H¨ ulle, den Treppenfunktionen, u ¨ bereinstimmen und die Treppenfunktionen in Lp (μ) dicht liegen, gilt schließlich y = T g. 2 Man kann zeigen, daß im Fall p > 1 die Voraussetzung der σ-Endlichkeit unerheblich ist; siehe z.B. Behrends [1987], S. 175. H¨angen p und q gem¨ aß p1 + 1q = 1 zusammen, nennt man q u ¨ brigens den zu p konjugierten Exponenten. Wie im Fall der Folgenr¨ aume sind (L∞ ) und L1 nicht isomorph (es sei denn, sie sind endlichdimensional). Nun beschreiben wir den Dualraum eines Raums stetiger Funktionen. Der Raum M (K) der regul¨ aren Borelmaße mit der Variationsnorm wurde in Beispiel I.1(j) und Definition I.2.13 eingef¨ uhrt. Theorem II.2.5 (Rieszscher Darstellungssatz) Sei K ein kompakter metrischer (oder topologischer Hausdorff-) Raum. Dann ist C(K) ∼ = M (K) unter der Abbildung T : M (K) → C(K) , (T μ)(x) = x dμ. K
Beweis. Da stetige Funktionen Borel-meßbar sind, ist wegen der Ungleichung x dμ ≤ |x| d|μ| ≤ x ∞ μ K
K
T wohldefiniert. Nach einfachen S¨ atzen der Integrationstheorie ist T linear, und die obige Ungleichung zeigt T ≤ 1. Die Beweise f¨ ur die Isometrie und die Surjektivit¨at von T sind im Kern maßtheoretisch; wir skizzieren sie im Fall K = R. F¨ ur eine vollst¨andige Darstellung sei z.B. auf Rudin [1986], S. 40ff. und S. 129ff. verwiesen. Zun¨achst zur Isometrie. Sei μ ∈ M (K). Wir betrachten die Hahn-Jordan-Zerlegung von μ, schreiben also μ = μ+ − μ− mit positiven Maßen μ+ , μ− und K = E+ ∪ E− mit disjunkten Borelmengen E+ , E− , f¨ ur die μ± (F ) = 0 f¨ ur alle Borelmengen F ⊂ E∓ gilt; siehe Satz A.4.4. Da μ und daher μ+ und μ− regul¨ar sind, existieren zu ε > 0 kompakte Mengen C+ ⊂ E+ , C− ⊂ E− mit μ(E+ ) − ε ≤ μ(C+ ) ≤ μ(E+ ), μ(E− ) + ε ≥ μ(C− ) ≥ μ(E− ). Da C+ und C− disjunkt sind (E+ und E− sind es n¨amlich), ist die Funktion 1 falls t ∈ C+ y(t) = −1 falls t ∈ C−
II.2
63
Dualr¨ aume und ihre Darstellungen
stetig auf C+ ∪ C− . Nach dem Satz von Tietze-Urysohn (Satz B.1.5 bzw. Theorem B.2.4) existiert eine Fortsetzung x ∈ C(K) mit x ∞ = 1. F¨ ur dieses x gilt x dμ = dμ + (−1) dμ + x dμ K C+ C− K\(C+ ∪C− ) ≥ μ(C+ ) − μ(C− ) − x dμ K\(C+ ∪C− ) ≥ μ(E+ ) − ε − μ(E− ) − ε − |μ| K \ (C+ ∪ C− ) = |μ|(K) − 2ε − |μ|(K) − |μ|(C+ ) − |μ|(C− ) = μ(C+ ) − μ(C− ) − 2ε ≥ μ(E+ ) − ε − μ(E− ) − ε − 2ε = |μ|(K) − 4ε. Daher gilt T μ ≥ μ − 4ε f¨ ur alle ε > 0 und folglich T μ ≥ μ . Da T μ ≤ μ bereits gezeigt ist, ist der Beweis f¨ ur die Isometrie von T vollst¨andig. Um die Surjektivit¨ at von T zu zeigen, betrachten wir ein Funktional x ∈ C(K) und setzen zun¨ achst zus¨ atzlich voraus, daß x positiv in dem Sinn ist, daß x (x) ≥ 0 gilt, falls x ≥ 0, d.h., falls x(t) ≥ 0 f¨ ur alle t gilt. Wir skizzieren, wie ein regul¨ ares Borelmaß mit T μ = x konstruiert werden kann. Man strebt nat¨ urlich die Definition μ(E) = x (χE ) an; aber da χE im allgemeinen nicht stetig ist, kann man nicht so vorgehen. Statt dessen setzt man f¨ ur eine offene Menge O μ∗ (O) = sup x (x): 0 ≤ x ≤ 1, {t: x(t) = 0} ⊂ O sowie anschließend f¨ ur beliebiges E ⊂ K μ∗ (E) = inf{μ∗ (O): E ⊂ O, O offen}. Als n¨achstes beweist man, daß μ∗ ein ¨ außeres Maß ist, d.h., μ∗ (E) ≥ 0 ∗ ∗ f¨ ur alle E ⊂ K, μ (∅) = 0, μ (E) ≤ μ∗ (F ) f¨ ur E ⊂ F und schließlich ∞ ∗ ∗ μ ( ∞ E ) ≤ μ (E ). F¨ u r offene Mengen V best¨atigt man n n n=1 n=1 μ∗ (V ∩ F ) + μ∗ (V ∩ F ) ≤ μ∗ (F )
∀F ⊂ K.
(II.7)
Setze nun Σμ = {V ⊂ K: V erf¨ ullt (II.7)}. Nach dem Fortsetzungssatz von Carath´eodory (siehe z.B. Behrends [1987], S. 19, oder Cohn [1980], S. 18) ist Σμ eine σ-Algebra und μ∗ |Σμ ein Maß. Da nach (II.7) offene Mengen in Σμ liegen, ist Σ ⊂ Σμ und μ := μ∗ |Σ ein positives Borelmaß; nach Konstruktion ist μ regul¨ar. Abschließend kann x (x) = x dμ f¨ ur alle x ∈ C(K) gezeigt werden.
64
II.
Funktionale und Operatoren
Der allgemeine Fall eines beliebigen x ∈ C(K) kann auf den eines positiven Funktionals zur¨ uckgef¨ uhrt werden. Dazu definiere zu x ∈ C(K) die Funktionen x+ (t) = max{0, x(t)}, x− (t) = max{0, −x(t)}. Ferner setze f¨ ur x ≥ 0 x+ (x) = sup{x (y): 0 ≤ y ≤ x} sowie f¨ ur beliebiges x ∈ C(K) x+ (x) = x+ (x+ ) − x+ (x− ). Dann ist x+ linear und stetig, und es gilt x+ ≥ 0 sowie x− := x+ − x ≥ 0. Wendet man das soeben Bewiesene auf die positiven Funktionale x+ und x− an, so erh¨alt man positive regul¨ are Borelmaße μ+ , μ− mit x (x) = x+ (x) − x− (x) = x dμ+ − x dμ− ∀x ∈ C(K). K
K
F¨ ur μ = μ+ − μ− gilt daher T μ = x .
2
Im Fall eines kompakten Intervalls K = [a, b] existiert eine ¨aquivalente Formulierung von Theorem II.2.5, die stetige Funktionale auf C[a, b] mit b Stieltjes-Integralen a x(t) dg(t) identifiziert; das ist die Originalfassung des Rieszschen Satzes. (Siehe dazu Aufgabe III.6.8.) Abschließend soll ein quantitativer Aspekt der Theorie endlichdimensionaler R¨aume und ihrer Dualr¨ aume behandelt werden. F¨ ur einen n-dimensionalen normierten Raum (X, . ) haben wir in Satz I.2.5 gezeigt, daß es f¨ ur jede Basis {e1 , . . . , en } mit ei = 1 eine Konstante m mit n n n m |αi | ≤ αi ei ≤ |αi | ∀(α1 , . . . , αn ) ∈ Kn i=1
i=1
i=1
gibt. Wir werden jetzt zeigen, daß man durch geschickte Wahl der Basis m = n1 erreichen kann. Dazu ben¨ otigen wir das folgende Resultat, das von eigenem Interesse ist. Mit δij wird wie u ¨blich das Kroneckersymbol bezeichnet: δij = 1 f¨ ur i = j, δij = 0 f¨ ur i = j. Satz II.2.6 Ist X ein n-dimensionaler normierter Raum, so existieren Basen {b1 , . . . , bn } von X und {b1 , . . . , bn} von X mit bj (bi ) = δij , bi = bj = 1 f¨ ur alle i, j = 1, . . . , n. Beweis. Nach Wahl irgendeiner Basis k¨ onnen wir X mit Kn identifizieren. n Sei V : X → K die Abbildung, die der Matrix mit den Spaltenvektoren x1 , . . . , xn ihre Determinante zuordnet. Die Abbildung |V | ist nach Konstruktion stetig, denn sie setzt sich aus Summen von Produkten von Linearformen zusammen (beachte noch Beispiel II.1(b)), und nimmt daher auf
65
II.3 Kompakte Operatoren
der kompakten Menge {(x1 , . . . , xn ): xi = 1 ∀i} ihr Supremum an, etwa bei (b1 , . . . , bn ). Die Vektoren b1 , . . . , bn sind dann linear unabh¨angig und bilden deshalb eine Basis. Definiere nun bj (x) =
V (b1 , . . . , bj−1 , x, bj+1 , . . . , bn ) . V (b1 , . . . , bn )
Es ist klar, daß die b1 , . . . , bn die gew¨ unschten Eigenschaften haben.
2
Eine Basis wie in Satz II.2.6 wird nach ihrem Entdecker Auerbachbasis genannt. Korollar II.2.7 Ist {b1 , . . . , bn } eine Auerbachbasis des n-dimensionalen Raums X, so gilt n n n 1 |αi | ≤ αi bi ≤ |αi | ∀(α1 , . . . , αn ) ∈ Kn . (II.8) n i=1
i=1
i=1
Beweis. Die rechte Ungleichung ist eine triviale Konsequenz der Dreiecksungleichung. Zum Beweis der linken schreibe mit bj wie in Satz II.2.6 n n n |αj | |αi | = b αi bi αj j i=1 j=1 i=1 n n |αj | ≤ bj αi bi j=1 αj i=1 n ≤ n αi bi , i=1
2
was zu zeigen war.
Eine andere ucken, ist, daß der Operator T : 1 (n) → Art, (II.8) auszudr¨ X, (αi ) → i αi bi ein Isomorphismus mit T ≤ 1,
T −1 ≤ n
(II.9)
ist; mehr dazu in Abschnitt II.6.
II.3
Kompakte Operatoren
In Satz I.2.7 wurde gezeigt, daß nur in endlichdimensionalen R¨aumen die Aussage Jede beschr¨ ankte Folge besitzt eine konvergente Teilfolge“ gilt. ” Dieser Mangel an kompakten Mengen kann in gewissen F¨allen dadurch kompensiert werden, daß die betrachteten Operatoren st¨arkere Eigenschaften als die bloße Stetigkeit besitzen. Das erkl¨ art die Bedeutung der folgenden Definition.
66
II.
Funktionale und Operatoren
Definition II.3.1 Eine lineare Abbildung T zwischen normierten R¨aumen X und Y heißt kompakt, wenn T (BX ) relativkompakt ist (d.h., wenn T (BX ) kompakt ist). Die Gesamtheit der kompakten Operatoren wird mit K(X, Y ) bezeichnet; ferner setzen wir K(X) = K(X, X). Offenbar ist eine lineare Abbildung T : X → Y genau dann kompakt, wenn T beschr¨ankte Mengen auf relativkompakte Mengen abbildet, bzw. wenn f¨ ur jede beschr¨ ankte Folge (xn ) in X die Folge (T xn ) ⊂ Y eine konvergente Teilfolge enth¨ alt; vgl. Satz B.1.7. Da kompakte Mengen beschr¨ankt sind (Beweis?), sind kompakte Operatoren stetig; es gilt also stets K(X, Y ) ⊂ L(X, Y ). ¨ Ublicherweise werden kompakte Operatoren zwischen Banachr¨ aumen betrachtet. Der Grund ist, daß dann der Abschluß von T (BX ) im richtigen“ ” Raum gebildet wird. Die Vollst¨ andigkeit von Y ist in Teil (a) des n¨achsten Satzes wesentlich; f¨ ur X und Teil (b) w¨ urde es reichen, normierte R¨aume vorauszusetzen. Satz II.3.2 (a) Seien X und Y Banachr¨ aume. Dann ist K(X, Y ) ein abgeschlossener Teilraum von L(X, Y ). Speziell ist K(X, Y ) selbst ein Banachraum. (b) Sei Z ein weiterer Banachraum. Sind T ∈ L(X, Y ) und S ∈ L(Y, Z) und ist T oder S kompakt, so ist ST kompakt. Beweis. (a) Es ist klar, daß mit T auch λT kompakt ist (λ ∈ K). Seien nun S, T ∈ K(X, Y ), und sei (xn ) eine beschr¨ ankte Folge in X. W¨ahle eine Teilfolge (xnk ), so daß (Sxnk )k∈N konvergiert, und w¨ahle dann eine Teilteilfolge (xnkl )l∈N , die wir kurz als (xn )n∈M notieren, so daß (T xn )n∈M konvergiert. Dann konvergiert auch (Sxn + T xn )n∈M , und S + T ist kompakt. K(X, Y ) ist also ein Untervektorraum von L(X, Y ). Zum Beweis der Abgeschlossenheit verwenden wir ein Diagonalfolgenargument. Seien Tn ∈ K(X, Y ) und T ∈ L(X, Y ) mit Tn − T → 0. Sei (xn ) eine beschr¨ankte Folge in X. Da T1 kompakt ist, existiert eine konvergente Teilfolge (T1 xn1 , T1 xn2 , T1 xn3 , . . .). (1)
Schreibe xi
Beachte, daß
= xni . Da T2 kompakt ist, gibt es eine konvergente Teilfolge (1) (1) T2 x(1) m1 , T2 xm2 , T2 xm3 , . . . .
(1) (1) T1 x(1) m1 , T1 xm2 , T1 xm3 , . . . (2)
(1)
nach wie vor konvergiert. Nun schreibe xi = xmi . Nochmalige Ausd¨ unnung liefert eine konvergente Teilfolge (2) (2) T3 x(2) p1 , T3 xp2 , T3 xp3 , . . . ;
II.3
67
Kompakte Operatoren
(2) (2) und auch T1 xpi i und T2 xpi i konvergieren. So fortfahrend, erh¨alt man N ⊃ N1 ⊃ N2 ⊃ . . ., so daß (Tk xi )i∈Nr f¨ ur k ≤ r konvergiert. Betrachte nun die Diagonalfolge, also in der obigen Bezeichnung (2) ξ1 = xn1 , ξ2 = x(1) m2 , ξ3 = xp3 , etc.
Da die Folge der ξi vom k-ten Glied an Teilfolge der k-ten Ausd¨ unnung ist, haben wir erreicht: (Tn ξi )i∈N konvergiert f¨ ur alle n ∈ N. Wir werden jetzt die Konvergenz von (T ξi )i∈N und dazu die Cauchyeigenschaft f¨ ur diese Folge nachweisen. Sei ε > 0. O.E. nehmen wir xn ≤ 1 f¨ ur alle n und folglich ξi ≤ 1 f¨ ur alle i an. W¨ahle n ∈ N mit Tn − T ≤ ε. W¨ahle nun i0 mit Tn ξi − Tn ξj ≤ ε
∀i, j ≥ i0 .
F¨ ur diese i und j gilt dann T ξi − T ξj ≤ T ξi − Tn ξi + Tn ξi − Tn ξj + Tnξj − T ξj ≤ T − Tn + ε + T − Tn ≤ 3ε. (b) Ist (xn ) eine beschr¨ ankte Folge und ist S kompakt, so ist auch (T xn ) beschr¨ankt, und (ST xn ) besitzt eine konvergente Teilfolge. Ist S stetig, T kompakt und (T xnk ) konvergent, so ist auch (ST xnk ) konvergent. 2 Beispiele. (a) Ist X endlichdimensional, so ist jede lineare Abbildung T : X → Y kompakt. T ist n¨ amlich stetig (Beispiel II.1(b)) und bildet deshalb die kompakte Menge BX auf eine kompakte Menge ab. (b) Ist T ∈ L(X, Y ) und der Bildraum ran(T ) endlichdimensional, so ist T kompakt, denn T (BX ) ist beschr¨ ankt, und beschr¨ankte Teilmengen endlichdimensionaler R¨ aume sind relativkompakt. Diese Bemerkung f¨ uhrt zusammen mit Satz II.3.2(a) zu folgendem Korollar. Korollar II.3.3 Seien X und Y Banachr¨ aume, und sei T ∈ L(X, Y ). Falls eine Folge (Tn ) stetiger linearer Operatoren mit endlichdimensionalem Bild und Tn − T → 0 existiert, ist T kompakt. Es war lange Zeit ein offenes Problem der Funktionalanalysis, ob die Umkehrung von Korollar II.3.3 gilt, bis 1973 ein Gegenbeispiel gefunden wurde. Wir kommen in II.3.5 und II.3.6 noch einmal auf diese Frage zur¨ uck. Beispiel. (c) Betrachte den Fredholmschen Integraloperator Tk : L2 (R) → L2 (R), (Tk f )(s) = k(s, t)f (t) dt R
68
II.
Funktionale und Operatoren
mit k ∈ L2 (R2 ); vgl. Beispiel II.1(m). Dort wurde bereits Tk ≤ k L2 gezeigt. In der Maßtheorie wird bewiesen, daß man k durch Treppenfunktionen, deren Stufen meßbare Rechtecke“ sind, approximieren kann. Genauer ” heißt das, daß meßbare Funktionen der Gestalt kn (s, t) =
(n) N
(n)
αij χE (n) (s)χF (n) (t) i
i,j=1
j
mit kn − k L2 → 0 existieren. Es folgt Tkn − Tk = Tk−kn ≤ k − kn L2 → 0. Aber Tkn hat die Gestalt (den Index halber weg) (Tkn f )(s) =
N N i=1
j=1
(n)
¨ lassen wir der Ubersichtlichkeit
αij
f (t) dt χEi (s), Fj
also gilt Tkn f ∈ lin{χE1 , . . . , χEN }
∀f ∈ L2 (R).
Daher haben alle Tkn endlichdimensionales Bild, und nach Korollar II.3.3 ist Tk kompakt. Mit ¨ahnlichen Methoden kann man die Kompaktheit eines Fredholmschen Integraloperators mit stetigem Kern auf C[a, b] beweisen. Wir werden dieses Resultat jedoch als Konsequenz des folgenden n¨ utzlichen Kompaktheitskriteriums erhalten. Satz II.3.4 (Satz von Arzel` a-Ascoli) Sei (S, d) ein kompakter metrischer Raum, und sei M ⊂ C(S), wobei C(S) wie u ¨blich mit der Supremumsnorm versehen wird. Die Teilmenge M habe die Eigenschaften (a) M ist beschr¨ankt, (b) M ist abgeschlossen, (c) M ist gleichgradig stetig, d.h. ∀ε > 0 ∃δ > 0 ∀x ∈ M Dann ist M kompakt.
d(s, t) ≤ δ
⇒
|x(s) − x(t)| ≤ ε.
II.3
69
Kompakte Operatoren
Beweis. Zuerst wird gezeigt, daß S separabel ist.Da S kompakt ist, be¨ sitzt – bei gegebenem ε > 0 – die Uberdeckung s∈S {t ∈ S: d(s, t) < ε} eine endliche Teil¨ uberdeckung. Es existieren also zu n ∈ N endlich viele mn (n) (n) (n) s1 , . . . , smn ∈ S mit S = k=1 {t ∈ S: d(sk , t) < n1 }. Es folgt, daß die (n) abz¨ahlbare Menge {sk : 1 ≤ k ≤ mn , n ∈ N} dicht liegt. Nun zum eigentlichen Beweis, der wie der Beweis von Satz II.3.2 ein Diagonalfolgenargument benutzt. Wir betrachten eine dichte abz¨ahlbare Menge {s1 , s2 , . . .} ⊂ S und eine Folge (xn ) in M . Wir zeigen, daß es eine gleichm¨aßig konvergente Teilfolge gibt. Da M beschr¨ ankt ist, ist die Folge xn (s1 ) in K beschr¨ankt und besitzt daher eine konvergente Teilfolge xn1 (s1 ), xn2 (s1 ), xn3 (s1 ), . . . . Auch die Folge xni (s2 ) ist beschr¨ ankt, und eine geeignete Teilfolge dieser Folge, etwa xm1 (s2 ), xm2 (s2 ), xm3 (s2 ), . . . konvergiert. Nochmalige Ausd¨ unnung beschert uns eine konvergente Teilfolge xp1 (s3 ), xp2 (s3 ), xp3 (s3 ), . . . , etc. Die Diagonalfolge y1 = xn1 , y2 = xm2 , y3 = xp3 , . . . hat daher die Eigenschaft yi (sn ) i∈N konvergiert f¨ ur alle n ∈ N. Wir werden nun die gleichgradige Stetigkeit benutzen, um die gleichm¨aßige Konvergenz von (yi )i∈N zu zeigen. Dazu beweisen wir, daß (yi ) bzgl. der Supremumsnorm eine Cauchyfolge bildet. Sei ε > 0, und w¨ ahle δ > 0 gem¨ aß (c). Dann existieren endlich viele offene Kugeln vom Radius δ/2, etwa U1 , . . . , Up , die S u ¨berdecken (siehe oben). Jede Kugel enth¨ alt dann eines der sn , sagen wir snk ∈ Uk . Nun w¨ahle i0 = i0 (ε) mit |yi (snk ) − yj (snk )| ≤ ε
∀i, j ≥ i0 , k = 1, . . . , p.
(II.10)
Jetzt betrachte ein beliebiges s ∈ S; s liegt dann in einer der u ¨berdeckenden Kugeln, etwa s ∈ Uκ . Es folgt d(s, snκ ) < δ und daher nach (c) |yi (s) − yi (snκ )| ≤ ε
∀i ∈ N.
(II.11)
Also implizieren (II.10) und (II.11) f¨ ur i, j ≥ i0 |yi (s)−yj (s)| ≤ |yi (s)−yi (snκ )|+|yi (snκ )−yj (snκ )|+|yj (snκ )−yj (s)| ≤ 3ε. Das zeigt yi − yj ∞ ≤ 3ε f¨ ur i, j ≥ i0 , und (yi ) ist eine Cauchyfolge. Da M abgeschlossen ist, liegt ihr Limes in M , und die Kompaktheit von M ist bewiesen. 2
70
II.
Funktionale und Operatoren
Derselbe Beweis liefert: • (a) & (c) ⇒ M relativkompakt. Der Satz von Arzel`a-Ascoli gilt auch f¨ ur allgemeine kompakte topologische R¨aume, siehe Dunford/Schwartz [1958], S. 266; gleichgradige Stetigkeit wird dann punktweise erkl¨ art. Beispiele. (d) Betrachte den Integraloperator Tk : C[0, 1] → C[0, 1],
1
(Tk x)(s) =
k(s, t)x(t) dt 0
mit k ∈ C [0, 1]2 . Dann ist Tk kompakt. In der Tat ist M := Tk (BC[0,1] ) beschr¨ankt (Beispiel II.1(l)), und (II.2) auf S. 51 zeigt die gleichgradige Stetigkeit von M . Nach dem Satz von Arzel`a-Ascoli (bzw. der ihm folgenden Bemerkung) ist M relativkompakt. Genauso sieht man, daß ein Integraloperator Tk : C(S) → C(S), (Tk x)(s) = k(s, t)x(t) dμ(t) S
mit k ∈ C(S × S) kompakt ist, wenn S ein mit einem endlichen Borelmaß μ versehener kompakter metrischer Raum ist. (e) Auch der schwach singul¨ are Integraloperator aus Beispiel II.1(n) ist kompakt; dieses Mal k¨ onnen wir den Satz von Arzel` a-Ascoli wegen (II.4) anwenden. Zum Schluß dieses Abschnitts soll die Umkehrung von Korollar II.3.3 untersucht werden. Bezeichnet man mit F (X, Y ) den Raum der stetigen linearen Operatoren von X nach Y mit endlichdimensionalem Bild (F steht f¨ ur finite rank“), so besagt Korollar II.3.3 F (X, Y ) ⊂ K(X, Y ) f¨ ur alle ” Banachr¨aume X und Y . Wir zeigen jetzt, daß f¨ ur die bis jetzt diskutierten separablen Banachr¨ aume Y sogar stets Gleichheit gilt. Zun¨achst ein allgemeiner Satz. Satz II.3.5 Sei X ein beliebiger Banachraum und Y ein (separabler) Banachraum mit der Eigenschaft: Es existiert eine beschr¨ ankte Folge (Sn ) in F (Y ) mit lim Sn y = y
n→∞
∀y ∈ Y.
Dann gilt F (X, Y ) = K(X, Y ). Beweis. Sei T ∈ K(X, Y ). Dann ist Sn T ∈ F (X, Y ), und es reicht, Sn T − T → 0
(II.12)
II.3
71
Kompakte Operatoren
zu zeigen. Zum Beweis hierf¨ ur sei ε > 0 gegeben. Setze K = sup Sn < ∞. Wegen der Kompaktheit von T existieren endlich viele y1 , . . . , yr mit T (BX ) ⊂
r
{y ∈ Y : y − yi < ε}.
i=1
Auf Grund von (II.12) gibt es N ∈ N mit Sn yi − yi ≤ ε
∀n ≥ N, i = 1, . . . , r.
Wir zeigen jetzt Sn T x − T x ≤ (K + 2)ε f¨ ur alle x ∈ BX , n ≥ N . F¨ ur x ∈ BX w¨ahle n¨ amlich j ∈ {1, . . . , r} mit T x − yj < ε. Dann gilt f¨ ur n≥N Sn T x − T x ≤ Sn (T x − yj ) + Sn yj − yj + yj − T x ≤ Kε + ε + ε = (K + 2)ε, 2
was den Beweis abschließt.
Hier noch einige Bemerkungen: (1) Es ist nicht schwer zu sehen, daß ein Raum Y mit der in (II.12) genannten Eigenschaft separabel sein muß. (2) (II.12) ist nat¨ urlich schw¨ acher als Sn − Id → 0; nach Satz I.2.7 und Korollar II.3.3 w¨ urde daraus dim Y < ∞ folgen. (3) Wir werden in Kapitel IV sehen, daß (II.12) automatisch die Beschr¨anktheit der Folge (Sn ) impliziert (Satz von Banach-Steinhaus, Theorem IV.2.1). Korollar II.3.6 Sei X ein beliebiger Banachraum und Y einer der separablen Banachr¨ aume c0 , p , C[0, 1], Lp [0, 1] (1 ≤ p < ∞). Dann gilt F (X, Y ) = K(X, Y ). Beweis. Es ist nur (II.12) zu verifizieren. F¨ ur Y = c0 oder p betrachte Sn (t1 , t2 , . . .) = (t1 , . . . , tn , 0, 0, . . .), und f¨ ur Y = C[0, 1] setze n n i (Sn y)(t) = t (1 − t)n−i y(i/n). i i=0
Sn ordnet y also das n-te Bernsteinpolynom zu, vgl. den Beweis des Weierstraßschen Approximationssatzes I.2.10. Dort wurde auch Sn y → y gezeigt. Im Fall Y = Lp [0, 1] sei Sn ein bedingter Erwartungsoperator der Form Sn y =
n 2 −1
i=0
1 2−n
(i+1)2−n
i2−n
y(t) dt χ[i2−n ,(i+1)2−n ] .
72
II.
Funktionale und Operatoren
Es ist allen Leserinnen und Lesern u ufen, daß die Sn jeweils ¨berlassen zu pr¨ (II.12) erf¨ ullen. 2 Die Aussage von Korollar II.3.6 gilt auch f¨ ur die nichtseparablen Banachr¨aume ∞ und L∞ . Es ist hingegen ein offenes Problem, ob sie f¨ ur H ∞ (Beispiel I.1(e)) gilt.
II.4
Interpolation von Operatoren auf Lp -R¨ aumen
Es sei p0 < p1 und T : Lp0 [0, 1] → Lq0 [0, 1] eine stetige lineare Abbildung. Da Lp1 [0, 1] ⊂ Lp0 [0, 1] (Aufgabe I.4.14), ist T f insbesondere f¨ ur f ∈ Lp1 [0, 1] q1 definiert. Wir wollen annehmen, daß dann T f ∈ L [0, 1] gilt und so ein stetiger Operator von Lp1 [0, 1] nach Lq1 [0, 1] erkl¨art ist. Die Aufgabenstellung der Interpolationstheorie ist es, den Operator T auf den Lp -R¨aumen zwischen Lp0 und Lp1 zu studieren. Insbesondere sollen Normabsch¨atzungen f¨ ur T auf Lp aus den Normen T : Lp0 → Lq0 und T : Lp1 → Lq1 hergeleitet werden. In diesem Abschnitt werden wir einen allgemeinen Interpolationssatz f¨ ur die Skala der Lp -R¨ aume beweisen, den Satz von Riesz-Thorin (Theorem II.4.2). Dabei werden wir auch unendliche Maßr¨aume zulassen. Da jedoch dann die Lp -R¨ aume nicht mehr der Inklusion nach angeordnet sind (vgl. Aufgabe I.4.14), darf die Vorstellung, Lp (μ) liege zwischen Lp0 (μ) und Lp1 (μ), falls p zwischen p0 und p1 liegt, sicher nicht w¨ortlich genommen werden. Trotzdem spricht einiges f¨ ur diese Idee, z.B. die Lyapunovsche Ungleichung aus Aufgabe I.4.16. Diese Ungleichung soll hier – etwas allgemeiner formuliert – noch einmal wiederholt werden, da wir sie in der folgenden Diskussion ben¨otigen. Lemma II.4.1 (Lyapunovsche Ungleichung) Sei 1 ≤ p0 , p1 ≤ ∞ und 0 ≤ θ ≤ 1. Definiere p durch gilt Lp0 (μ) ∩ Lp1 (μ) ⊂ Lp (μ); genauer ist θ f Lp ≤ f 1−θ Lp0 f Lp1
1 p
=
1−θ p0
+
θ p1 .
Dann
∀f ∈ Lp0 (μ) ∩ Lp1 (μ).
Ferner liegt Lp0 (μ) ∩ Lp1 (μ) dicht in Lp (μ), falls p < ∞. Beweis. Die Ungleichung folgt aus der H¨ olderschen Ungleichung. F¨ ur die Dichtheitsaussage beachte, daß Lp0 (μ) ∩Lp1 (μ) die integrierbaren Treppenfunktionen enth¨alt. 2 Daß eine lineare Abbildung als stetiger Operator von Lp0 (μ) nach Lq0 (ν) und von Lp1 (μ) nach Lq1 (ν) wirkt, kann man allgemein so formulieren. Die Abbildung figuriert einerseits als T0 ∈ L Lp0 (μ), Lq0 (ν) , andererseits als
II.4
Interpolation von Operatoren auf Lp -R¨ aumen
73
T1 ∈ L Lp1 (μ), Lq1 (ν) , und daß es sich um dieselbe“ Abbildung handelt, ” wird durch die Forderung T0 |Lp0 (μ)∩Lp1 (μ) = T1 |Lp0 (μ)∩Lp1 (μ) ausgedr¨ uckt. Die soeben beschriebene Situation werden wir schlichter damit umschreiben, daß wir sagen, ein Operator T sei stetig als Operator T : Lp0 (μ) → Lq0 (ν) und als Operator T : Lp1 (μ) → Lq1 (ν). Nun k¨onnen wir das Hauptergebnis dieses Abschnitts formulieren. Theorem II.4.2 (Interpolationssatz Seien 1 ≤ p0 , p1 , q0 , q1 ≤ ∞. Ferner definiert durch 1 1−θ θ = + , p p0 p1
von Riesz-Thorin) sei 0 < θ < 1, und es seien p und q 1 1−θ θ = + . q q0 q1
(II.13)
Es seien μ und ν σ-endliche Maße. Ist dann T eine lineare Abbildung mit T : Lp0 (μ) → Lq0 (ν) stetig mit Norm M0 , T : Lp1 (μ) → Lq1 (ν) stetig mit Norm M1 , so gilt T f Lq ≤ M01−θ M1θ f Lp
∀f ∈ Lp0 (μ) ∩ Lp1 (μ)
(II.14)
∀f ∈ Lp0 (μ) ∩ Lp1 (μ)
(II.15)
f¨ ur K = C und T f Lq ≤ 2M01−θ M1θ f Lp
f¨ ur K = R. Der Operator l¨ aßt sich also zu einer stetigen linearen Abbildung T : Lp (μ) → Lq (ν)
mit Norm ≤ cM01−θ M1θ
(c = 1 f¨ ur K = C und c = 2 f¨ ur K = R) ausdehnen. Beachte, daß auch p ein Lp (μ)-Raum ist (mit μ = z¨ahlendes Maß auf N), so daß der obige Interpolationssatz ebenfalls auf Folgenr¨aume anwendbar ist. Denkt man sich die Lp -R¨ aume als Funktion“ von p1 statt von p, so ” sagt der Satz von Riesz-Thorin, daß C := {(α, β): T : L1/α → L1/β stetig} eine konvexe Menge ist, denn mit zwei Punkten liegt auch die Verbindungsstrecke darin. Ferner besagt (II.14), daß die Funktion (α, β) → log T : L1/α → L1/β eine konvexe Funktion auf C ist.
74
II.
Funktionale und Operatoren
β C
1/q1 1/q0
α 1/p0
1/p1
Wir beweisen Theorem II.4.2 zuerst f¨ ur den komplexen Fall; anschließend wird der reelle daraus durch Komplexifizierung gewonnen. Der Beweis beruht auf folgendem funktionentheoretischen Resultat. Wir bezeichnen mit S den Streifen S = {z ∈ C: 0 ≤ Re z ≤ 1}. (II.16) Satz II.4.3 (Drei-Geraden-Satz) Es sei F : S → C eine beschr¨ankte stetige Funktion, die auf int S analytisch ist. F¨ ur 0 ≤ θ ≤ 1 setze Mθ = sup |F (θ + iy)|. y∈R
Dann gilt Mθ ≤ M01−θ M1θ . Dieser Satz vergleicht also das Supremum von |F | auf den drei Geraden Re z = 0, Re z = θ, Re z = 1. Beachte, daß die Beschr¨anktheit von F gefordert wurde; sie folgt nicht allein aus M0 < ∞, M1 < ∞. (In der Tat ist z → exp exp((z − 12 )πi) eine unbeschr¨ankte Funktion auf S mit M0 = M1 = 1.) Beweis. Wir nehmen zuerst M0 , M1 ≤ 1 an und zeigen in diesem Fall Mθ ≤ 1. Sei z0 = x0 + iy0 ∈ int S beliebig. Zu ε > 0 betrachte die Hilfsfunktion Fε (z) =
F (z) . 1 + εz
Die Funktion Fε ist ebenfalls beschr¨ ankt und stetig auf S sowie analytisch auf int S. Ferner gilt lim|y|→∞ |Fε (x + iy)| = 0 gleichm¨aßig f¨ ur 0 ≤ x ≤ 1,
II.4
Interpolation von Operatoren auf Lp -R¨ aumen
75
da |Fε (x + iy)| ≤ |F (x + iy)|/(ε|y|) und da F beschr¨ankt ist. W¨ahle nun r > |y0 |, so daß |Fε (x + iy)| ≤ 1 f¨ ur 0 ≤ x ≤ 1 und |y| = r. Bezeichnet R das kompakte Rechteck [0, 1] × i[−r, r], so gilt |Fε (z)| ≤ 1 auf ∂R. Das Maximumprinzip f¨ ur analytische Funktionen (siehe etwa Rudin [1986], S. 253) liefert |Fε (z)| ≤ 1 f¨ ur alle z ∈ R; insbesondere |Fε (z0 )| ≤ 1 und folglich |F (z0 )| = lim |Fε (z0 )| ≤ 1, ε→0
was zu zeigen war. Im Fall beliebiger M0 und M1 betrachte G(z) = F (z)/(α1−z β z ), wo α > M0 und β > M1 beliebig sind. Dann ist G stetig und beschr¨ankt auf S sowie analytisch auf int S, und es gilt |G(z)| ≤ 1 auf ∂S. Nach dem gerade Bewiesenen gilt |G(z)| ≤ 1 auch auf S. Das heißt Mθ ≤ α1−θ β θ und folglich Mθ ≤ M01−θ M1θ . (α und β wurden nur eingef¨ uhrt, um Schwierigkeiten im Fall M0 = 0 oder M1 = 0 aus dem Wege zu gehen. A posteriori zeigt sich, daß dann F = 0 gewesen sein muß.) 2 Kommen wir nun zum Beweis des Satzes von Riesz-Thorin im komplexen Fall. Zun¨ achst gilt nach Voraussetzung T f ∈ Lq0 (ν) ∩ Lq1 (ν) f¨ ur p0 p1 f ∈ L (μ) ∩ L (μ), also ist nach Lemma II.4.1 T f ∈ Lq (ν) f¨ ur solche f . Wir nehmen zuerst p < ∞ und q > 1 an; dann reicht es, (II.14) f¨ ur integrierbare Treppenfunktionen nachzuweisen, denn diese liegen dicht. Dazu werden wir (T f )g dν ≤ M 1−θ M1θ (II.17) 0 f¨ ur alle integrierbaren Treppenfunktionen f , g mit f Lp = 1 = g Lq beweisen, wo q der zu q konjugierte Exponent, also 1q + q1 = 1 ist. Das reicht aus, da (II.17) f¨ ur das Funktional (g) = (T f )g dν auf Lq (ν) die Absch¨atzung ≤ M01−θ M1θ impliziert (wegen q < ∞ liegen die in (II.17) auftauchenden g dicht); und nach Satz II.2.4 ist = T f Lq . Wir k¨onnen nun die Treppenfunktionen f und g als f=
J
aj χAj ,
g=
j=1
K
bk χBk
(II.18)
k=1
mit f pLp =
J
|aj |p μ(Aj ) = 1,
g qLq =
j=1
K
|bk |q ν(Bk ) = 1,
k=1
und paarweise disjunkten Aj bzw. Bk darstellen. F¨ ur eine komplexe Zahl z definiere p(z) und q (z) durch 1 1−z z = + , p(z) p0 p1
1 q (z)
=
1−z z + ; q0 q1
(II.19)
76
II.
Funktionale und Operatoren
also ist p(0) = p0 , p(θ) = p und p(1) = p1 sowie q (0) = q0 , q (θ) = q , q (1) = q1 . Mit der Konvention 00 = 0 setze nun fz = |f |p/p(z)
f , |f |
gz = |g|q /q (z)
g ; |g|
fz und gz sind integrierbare Treppenfunktionen, insbesondere ist T fz erkl¨art. Schließlich definieren wir F : C → C, F (z) = (T fz )gz dν. Nach (II.18) gilt die Darstellung F (z) =
J K
|aj |p/p(z)
j=1 k=1
aj bk |bk |q /q (z) |aj | |bk |
Bk
T χAj dν.
Sie zeigt, daß F eine Linearkombination von Termen der Form γ z mit γ > 0 ist; F ist also analytisch. F erf¨ ullt die Voraussetzungen des Drei-GeradenSatzes II.4.3, denn jede Funktion γ z ist im Streifen S beschr¨ankt: |γ x+iy | = γ x ≤ max{1, γ}
∀x + iy ∈ S.
Als n¨achstes werden wir |F (iy)| und |F (1 + iy)| absch¨atzen. Es gilt nach der H¨olderschen Ungleichung und nach Voraussetzung u ¨ber T |F (iy)| ≤ T fiy Lq0 giy
L
q 0
≤ M0 fiy Lp0 giy
L
q 0
,
und (II.19) liefert (beachte |γ z | = γ Re z f¨ ur γ > 0) fiy p0p0 = L
J J (p/p(iy))p0 | μ(A ) = |aj |p μ(Aj ) = 1, |aj j j=1
j=1
und analog ist giy
q0 L
q 0
= 1.
Daher erh¨alt man sup |F (iy)| ≤ M0 y∈R
und entsprechend sup |F (1 + iy)| ≤ M1 . y∈R
Nun liefert Satz II.4.3 (T f )g dν = |F (θ)| ≤ sup |F (θ + iy)| ≤ M 1−θ M1θ . 0 y∈R Damit ist (II.17) und folglich (II.14) im Fall p < ∞, q > 1 bewiesen.
Interpolation von Operatoren auf Lp -R¨ aumen
II.4
77
Nehmen wir nun den Fall p = ∞ an. Dann muß auch p0 = p1 = ∞ sein. Im Fall q = q0 = q1 = 1 ist nichts zu zeigen. Im Fall q > 1 argumentiere wie oben (f braucht nun nicht mehr integrierbar zu sein), setze aber fz = f f¨ ur alle z. Analog wird der Fall q = 1, p < ∞ behandelt. Nun zum reellen Fall. Dieser ergibt sich aus (II.14) und der folgenden ¨ Uberlegung. Sei U : LrR → LsR ein stetiger Operator zwischen reellen Funktionenr¨aumen. U hat verm¨ oge UC (f + ig) = U f + i U g eine kanonische Fortsetzung zu einer C-linearen Abbildung UC : LrC → LsC , f¨ ur die UC ≤ 2 U gilt (Aufgabe II.5.4). Die behauptete Ausdehnbarkeit auf Lp (μ) ist wegen Satz II.1.5 trivial. Damit ist der Satz von Riesz-Thorin vollst¨ andig bewiesen. 2 Das folgende Beispiel zeigt, daß im reellen Fall (II.14) nicht zu gelten braucht. Wir betrachten auf R2 die lineare Abbildung T (s, t) = (s+t, s−t). Man best¨atigt schnell, daß T : ∞ (2) → 1 (2) = 2 und T : 2 (2) → 2 (2) = 21/2 ist. (II.14) w¨ urde dann f¨ ur p0 = ∞, q0 = 1, p1 = q1 = 2, θ = 12 (also p = 4, q = 43 ) (s + t, s − t) 4/3 ≤ 23/4 (s, t) 4 lauten, was aber nicht stimmt (setze etwa s = 2, t = 1). Nun beschreiben wir eine Anwendung des Satzes von Riesz-Thorin; eine weitere wird in Satz V.2.10 gegeben. Es sei T = {z ∈ C: |z| = 1} = {eit : dt 0 ≤ t ≤ 2π}; wir betrachten auf T das normalisierte Lebesguemaß 2π . F¨ ur 1 zwei komplexwertige Funktionen f, g ∈ L (T) setze
2π
(f ∗ g)(eis ) =
f (eit )g(ei(s−t) ) 0
dt . 2π
Die Funktion f ∗ g heißt Faltung (engl. convolution) von f und g. Sie ist meßbar, und die Absch¨ atzung
2π
ds |(f ∗ g)(e )| ≤ 2π
2π 2π
|f (eit )| |g(ei(s−t) )|
is
0
0
0 2π
0
≤
2π
|g(ei(s−t) )| 0
2π
|f (eit )| 0
= f L1 g L1 zeigt f ∗ g ∈ L1 (T).
|f (eit )|
=
dt ds 2π 2π
dt g L1 2π
ds dt 2π 2π
(Fubini)
78
II.
Funktionale und Operatoren
Satz II.4.4 (Youngsche Ungleichung) Seien 1 ≤ p, q ≤ ∞ und 1r := p1 + 1q −1 ≥ 0. Falls f ∈ Lp (T) und g ∈ Lq (T), so ist f ∗ g ∈ Lr (T), und es gilt f ∗ g Lr ≤ f Lp g Lq . Beweis. Bemerke zuerst, daß f ∗g wegen Lp (T), Lq (T) ⊂ L1 (T) wohldefiniert ist. Sei nun f ∈ L1 (T) fest. Dann gilt (siehe oben) f ∗ g L1 ≤ f L1 g L1 , mit anderen Worten, der Operator T g = f ∗ g gen¨ ugt der Ungleichung T : L1 → L1 ≤ f L1 . Es ist klar, daß außerdem T : L∞ → L∞ ≤ f L1 gilt. Also impliziert (II.14) f¨ ur θ = nenten bezeichnet, daß
1 q ,
wo q den zu q konjugierten Expo-
T : Lq → Lq ≤ f L1 . Das bedeutet f ∗ g Lq ≤ f L1 g Lq
∀f ∈ L1 (T), g ∈ Lq (T).
(II.20)
Nun halten wir g ∈ Lq (T) fest und variieren f . Die H¨oldersche Unglei chung liefert f¨ ur f ∈ Lq (T) und eis ∈ T 2π dt is |(f ∗ g)(e )| ≤ |f (eit )| |g(ei(s−t) )| 2π 0 2π 1/q 2π 1/q it q dt it q dt ≤ |f (e )| |g(e )| 2π 2π 0 0 = f Lq g Lq . F¨ ur den Operator Sf = f ∗ g gilt daher nach (II.20) und der obigen Absch¨atzung S: L1 → Lq ≤ g Lq ,
S: Lq → L∞ ≤ g Lq . W¨ahle θ so, daß sich p1 = 1−θ + qθ ergibt; Aufl¨osen liefert θ = 1 1 1 0 ≤ θ ≤ 1, da p + q ≥ 1. Mit dieser Wahl von θ ist dann 1−θ θ 1 1 1 + = − = . q ∞ q p r
q . p
Es ist
II.4
Interpolation von Operatoren auf Lp -R¨ aumen
79
Daher liefert der Satz von Riesz-Thorin S: Lp → Lr ≤ g Lq , das heißt f ∗ g Lr ≤ f Lp g Lq
∀f ∈ Lp (T), g ∈ Lq (T).
2
Abschließend wird die Frage er¨ ortert, ob durch Interpolation kompakter Operatoren wieder kompakte Operatoren entstehen. Es zeigt sich, daß es in der Tat ausreicht, daß einer der Operatoren, zwischen denen interpoliert wird, kompakt ist. Satz II.4.5 Es seien die Voraussetzungen und Bezeichnungen des Satzes von Riesz-Thorin angenommen. Zus¨ atzlich sei T : Lp0 (μ) → Lq0 (ν) komp q pakt. Dann ist T : L (μ) → L (ν) kompakt. Beweis. Wir geben den Beweis nur f¨ ur den Spezialfall, daß ν das Lebesguemaß auf [0, 1] oder R ist, und wir nehmen noch q0 < ∞ an. F¨ ur den allgemeinen Fall sei z.B. auf Bennett/Sharpley [1988] oder Persson (Arkiv Mat. 5 (1964) 215–219) verwiesen, wo die Idee ¨ ahnlich wie in unserem Spezialfall, technisch aber etwas verwickelter ist. Unter den gemachten Zusatzvoraussetzungen wissen wir n¨amlich, daß es eine Folge (Sn ) linearer Abbildungen mit endlichdimensionalem Bild gibt, die simultan auf allen Lr -R¨ aumen definiert sind und sup Sn : Lq1 → Lq1 < ∞,
(II.21)
n∈N
Sn T − T : Lp0 → Lq0 → 0 erf¨ ullen (siehe Korollar II.3.6 und Aufgabe II.5.29). Interpolieren wir nun die Operatoren Sn T − T , so erh¨ alt man aus (II.14) bzw. (II.15) Sn T − T : Lp → Lq ≤ 2 Sn T − T : Lp0 → Lq0 1−θ Sn T − T : Lp1 → Lq1 θ ≤ 2 Sn T − T : Lp0 → Lq0 1−θ T : Lp1 → Lq1 θ × Sn − Id: Lq1 → Lq1 θ → 0, da der letzte Faktor wegen (II.21) beschr¨ ankt bleibt. Weil Sn T ein Operator mit endlichdimensionalem Bild ist, ist T ∈ F (Lp , Lq ); nach Korollar II.3.3 ist T deshalb kompakt. 2
80
II.
II.5
Funktionale und Operatoren
Aufgaben
Aufgabe II.5.1 Sei P der Vektorraum aller Polynome auf R. F¨ ur reellwertigen n n ein Polynom p(t) = k=0 ak tk setze p = k=0 |ak |. (a) (P, . ) ist ein normierter Raum. Ist er vollst¨ andig? (b) Untersuche, ob folgende lineare Abbildungen : P → R stetig sind, und bestimme gegebenenfalls :
(p) =
1
p(t) dt,
(p) = p (0),
(p) = p (1).
0
(c) Untersuche, ob folgende lineare Abbildungen T : P → P stetig sind, und bestimme gegebenenfalls T :
(T p)(t) = p(t + 1),
t
(T p)(t) =
p(s) ds. 0
Aufgabe II.5.2 Auf jedem unendlichdimensionalen normierten Raum existiert eine unstetige lineare Abbildung nach K. (Hinweis: Man muß mit einer Basis des Vektorraums (im Sinn der linearen Algebra) arbeiten.) Aufgabe II.5.3 Sei X ein normierter Raum, und seien S, T : X → X lineare Abbildungen mit ST − T S = Id. Dann ist S oder T unstetig. (Hinweis: Zeige zuerst ST n+1 −T n+1 S = (n+1)T n . Fortgeschrittene Leser k¨ onnen die Aussage auch aus Lemma IX.1.5 herleiten.) Ist X der Raum der C ∞ -Funktionen auf einem Intervall (mit irgendeiner Norm) und (Sf )(t) = f (t), (T f )(t) = t f (t), so ist die Voraussetzung erf¨ ullt; f¨ ur diese Wahl von S und T ist ST − T S = Id eine Umformulierung der Heisenbergschen Unsch¨ arferelation. Die typischen Operatoren der Quantenmechanik sind daher unbeschr¨ ankt. Aufgabe II.5.4 Sei U : LpR (μ) → LqR (μ) ein stetiger linearer Operator zwischen den R¨ aumen reellwertiger Funktionen LpR und LqR . Definiere UC : LpC (μ) → LqC (μ) durch UC (f + ig) = U f + i U g. Zeige UC ≤ 2U . Gib ein Beispiel, wo UC > U . Aufgabe II.5.5 (a) Sei
K (R) = f : R → K: f stetig, supp(f ) := {t: f (t) = 0} kompakt
der Vektorraum aller stetigen Funktionen mit kompaktem Tr¨ ager. (Die abgeschlossene Menge supp(f ) heißt der Tr¨ ager von f .) Dann ist K (R) dicht in Lp (R) f¨ ur 1 ≤ p < ∞. (b) F¨ ur f ∈ Lp (R) (1 ≤ p ≤ ∞) und s ∈ R setze (Ts f )(t) = f (t − s).
II.5
81
Aufgaben
Es ist leicht zu glauben (und auch nicht schwer, mit den Ergebnissen des Anhangs zu zeigen), daß stets Ts f Lp = f Lp f¨ ur f ∈ L (R) gilt. Offensichtlich sind die Ts lineare Operatoren auf Lp (R). Zeige: F¨ ur p < ∞ ist p
lim Ts f − f Lp = 0
s→0
∀f ∈ Lp (R),
(II.22)
aber es gilt nicht lim Ts − Id = 0.
s→0
(Hier ist . nat¨ urlich die Operatornorm.) F¨ ur p = ∞ gilt nicht einmal lim Ts f − f L∞ = 0
s→0
∀f ∈ L∞ (R).
Wegen der Bedingung Ts+t = Ts ◦ Tt , T0 = Id bilden die Ts eine Gruppe von linearen Operatoren. Bedingung (II.22) wird starke Stetigkeit genannt. Solche Operatorgruppen bzw. -halbgruppen sind von großer Bedeutung in der Theorie der Evolutionsgleichungen; siehe Abschnitt VII.4. (Hinweis: Zum Beweis von (II.22) verwende (a)!) Aufgabe II.5.6 (Friedrichsscher Gl¨ attungsoperator) In dieser Aufgabe sei 1 ≤ p < ∞. Setze D (R) = {ϕ ∈ C ∞ (R): supp(ϕ) kompakt}.
(Hier ist C ∞ (R) = n C n (R); supp(ϕ) wurde in Aufgabe II.5.5 definiert.) Definiere Funktionen ψ, ϕ, ϕε zu ε > 0 durch
ψ(t) = wobei a =
e−1/t falls t > 0, 0 falls t ≤ 0,
R
ψ(1 − s2 ) ds
−1
ϕ(t) = a ψ(1 − t2 ),
.
ϕ1/4
ϕ1/2
ϕ1
ϕε (t) =
1 ϕ(t/ε), ε
82
II.
Funktionale und Operatoren
(a) ψ ∈ C ∞ (R), folglich ϕε ∈ D (R) mit R ϕε (s) ds = 1 und supp(ϕε ) ⊂ [−ε, ε]. (Hinweis: Zeige induktiv ψ (n) (t) = P2n (1/t)e−1/t f¨ ur t > 0, wo P2n ein Polynom vom Grade ≤ 2n ist.) (b) F¨ ur f ∈ Lp (R) setze
f (s)ϕε (t − s) ds.
(Tε f )(t) = R
(Man nennt Tε f die Faltung von f und ϕε .) Die Maßtheorie lehrt, daß Tε f wohldefiniert und meßbar ist und daß ebenfalls die Darstellung
f (t − s)ϕε (s) ds
(Tε f )(t) = R
gilt. Zeige durch Anwendung der H¨ olderschen Ungleichung (beachte ϕε = 1/p 1/q ϕε ϕε ) Tε f Lp ≤ f Lp ∀f ∈ Lp (R). (c) lim Tε f − f ∞ = 0 f¨ ur alle f ∈ K (R) und lim Tε f − f Lp = 0 f¨ ur alle ε→0
ε→0
f ∈ Lp (R). (Hinweis: Aufgabe II.5.5(a).) (d) F¨ ur f ∈ Lp (R) ist Tε f ∈ C ∞ (R), und gilt zus¨ atzlich ∃N > 0
f (t) = 0 f¨ ur fast alle t mit |t| ≥ N
(z.B. f ∈ K (R)), so ist sogar Tε f ∈ D (R). (e) D (R) liegt dicht in Lp (R), falls 1 ≤ p < ∞. Aufgabe II.5.7 Betrachte eine 2 × 2-Matrix (aij ) als lineare Abbildung auf K2 . Wenn K2 die euklidische Norm tr¨ agt, gilt
√ 1 √ τ + 2δ + τ − 2δ , 2
(aij ) =
wo τ := |a11 |2 + |a12 |2 + |a21 |2 + |a22 |2 , δ := |a11 a22 − a12 a21 |. Aufgabe II.5.8 Eine lineare Abbildung A: Km → Kn werde als (n × m)-Matrix (aij ) dargestellt. (a) Tragen Km und Kn die Summennorm (ti )1 = |ti |, so ist A = max
n
j≤m
|aij |
(Spaltensummennorm).
i=1
(b) Tragen Km und Kn die Maximumsnorm (ti )∞ = max |ti |, so ist A = max
m
i≤n
j=1
|aij |
(Zeilensummennorm).
II.5
83
Aufgaben
Aufgabe II.5.9 Sei A ∈ Rn×n eine symmetrische Matrix, und es sei r(A) = max{|λ|: λ Eigenwert von A}. Betrachte A als eine lineare Abbildung auf Rn . (a) Sei . eine Norm auf Rn , und sei A die zugeh¨ orige Operatornorm. Zeige, daß A ≥ r(A) und A2 = r(A) f¨ ur die euklidische Norm . 2 . (b) An → 0 (bzgl. irgendeiner Norm) genau dann, wenn r(A) < 1. Aufgabe II.5.10 Betrachte den identischen Operator Idp,q : p (n) → q (n) und 1−1 zeige Idp,q = n q p , falls q ≤ p. Aufgabe II.5.11 (a) Zu z ∈ ∞ betrachte Tz : p → p , (Tz x)(n) = z(n)x(n). Berechne Tz . (b) Seien 0 ≤ t1 < . . . < tn ≤ 1 und α1 , . . . , αn ∈ K. Betrachte : C[0, 1] → K, n (x) = i=1 αi x(ti ). Berechne . Aufgabe II.5.12 Zeige p ∼ = p /U , wo U = {(sn ) ∈ p : s2k−1 = 0 ∀k ∈ N}. Aufgabe II.5.13 (a) Seien X und Y normierte R¨ aume, E ⊂ X ein dichter Unterraum und T ∈ L(X, Y ). Falls T |E eine Isometrie ist, ist T ebenfalls eine Isometrie. (b) Betrachte insbesondere X = L1 [0, 1], Y = (C[0, 1]) sowie (T f )(x) = 1 x(t)f (t) dt. Berechne T f . 0 (Hinweis: Beispiel II.1(g).) Aufgabe II.5.14 Seien g1 , g2 , . . . unabh¨ angige standardnormalverteilte Zufallsvariablen auf einem Wahrscheinlichkeitsraum (Ω, Σ, P). daß f¨ ur 1 ≤ p < ∞ Zeige, ∞ und eine geeignete Konstante cp der durch (an ) → cp n=1 an gn definierte Operator J: 2 → Lp (P) wohldefiniert und isometrisch ist. [Hinweis: Diese Aufgabe setzt Grundkenntnisse der Wahrscheinlichkeitstheorie voraus; nutze aus, daß die Verteilung des Zufallsvektors (g1 , . . . , gn ) rotationsin¨ variant ist. Ubrigens sind Lp (P), Lp [0, 1] und Lp (Rd ) isometrisch isomorph (siehe etwa Guerre-Delabri`ere [1992], S. 134), so daß jeder dieser Lp -R¨ aume einen zu 2 isometrischen abgeschlossenen Unterraum enth¨ alt.] Aufgabe II.5.15 . 1 und . 2 seien Normen auf dem Vektorraum X. (a) Sind . 1 und . 2 ¨ aquivalent, so sind (X, . 1 ) und (X, . 2 ) isomorph. (b) Die Umkehrung gilt nicht. Betrachte dazu den Vektorraum d der abbrechenden Folgen und die Normen (sn )1 = sup{|s1 |, 2|s2 |, |s3 |, 4|s4 |, |s5 |, . . .}, (sn )2 = sup{|s1 |, |s2 |, 3|s3 |, |s4 |, 5|s5 |, . . .}. Aufgabe II.5.16 (Satz von Mazur-Ulam) Sei X ein reeller normierter Raum und Φ: X → X eine surjektive Funktion mit Φ(0) = 0 und Φ(x) − Φ(y) = x − y f¨ ur alle x, y ∈ X. Dann ist Φ linear. Beweise diese Aussage unter der Zusatzvoraussetzung, daß X strikt konvex ist (vgl. Aufgabe I.4.13); dazu zeige zuerst, daß in diesem Fall z = 12 (x + y) der einzige Punkt mit z − x = z − y = 12 x − y ist. [Der Beweis des Satzes von Mazur-Ulam im allgemeinen Fall ist schwieriger und bei Banach [1932], S. 166, oder V¨ ais¨ al¨ a (Amer. Math. Monthly 110 (2003) 633–635) zu finden.]
84
II.
Funktionale und Operatoren
Aufgabe II.5.17 L¨ ose die Integralgleichung
1
x(s) −
2st x(t) dt = sin πs,
s ∈ [0, 1],
0
(a) mit der Methode der Neumannschen Reihe (begr¨ unde insbesondere, warum diese konvergiert, obwohl hier Tk = 1 ist), (b) durch scharfes Hinsehen“. ” Aufgabe II.5.18 Seien X und Y normierte R¨ aume, und sei T ∈ L(X, Y ).
(a) Es existiert ein wohldefinierter linearer Operator T, so daß das folgende Diagramm kommutiert (d.h. T = T ◦ ω): T -Y X
@
T
ω@
@ R @
X/ ker(T ) Hier ist ω die kanonische Abbildung x → [x] von X auf X/ ker(T ).
(b) T = T, und T ist injektiv.
(c) T ist genau dann kompakt, wenn T kompakt ist.
(d) Falls T eine Quotientenabbildung ist, ist T eine Isometrie. Also gilt in diesem Fall Y ∼ = X/ ker(T ). Aufgabe II.5.19 (a) Sei ∈ X mit = 1. Dann ist eine Quotientenabbildung. (b) Schließe mit Hilfe von Aufgabe II.5.18 die Formel von Ascoli : |(x)| = d(x, ker())
∀ ∈ X , = 1.
(c) Teil (b) gestattet es, leicht Beispiele zu konstruieren, um zu zeigen, daß im Rieszschen Lemma I.2.6 im allgemeinen δ = 0 nicht zul¨ assig ist. Sei n¨ amlich wie oben, und setze U = ker(). Dann ist δ = 0 genau dann zul¨ assig, wenn es ein x0 ∈ BX mit = |(x0 )| gibt. (In diesem Fall sagt man, daß seine Norm annimmt.) (d) Folgende Funktionale nehmen ihre Norm nicht an:
• X = c0 , (sn ) =
∞
• X = C[0, 1], (x) =
n=1
1/2 0
2−n sn
x(t) dt −
1 1/2
x(t) dt
Aufgabe II.5.20 Zeige Satz II.2.3(a) f¨ ur p = 1 und Satz II.2.3(b). Aufgabe II.5.21 Sei 1 < p < ∞ und k ∈ C([0, 1]2 ). Zeige, daß der Integraloperator 1
Tk f (s) =
k(s, t)f (t) dt 0
II.5
85
Aufgaben
ein stetiger Operator von Lp [0, 1] in sich ist, f¨ ur dessen Norm
Tk ≤ sup s
1/q
1
|k(s, t)| dt
t
0
1/p
1
|k(s, t)| ds
sup 0
p p gilt, wo 1/p + 1/q = 1. Ferner ist Tk : L [0, q1] → L [0, 1] kompakt. (Tip: Betrachte (Tk f )(s)g(s) ds f¨ ur g ∈ L [0, 1], oder benutze (II.2).)
Aufgabe II.5.22 Sei M ⊂ C[a, b] relativkompakt. Dann ist M gleichgradig stetig. Aufgabe II.5.23 Sei 1 ≤ p < ∞ und A ⊂ p . Dann sind ¨ aquivalent: (i) A ist relativkompakt. (ii) A ist beschr¨ ankt und lim sup
∞
n→∞ x∈A
1/p |x(i)|
p
= 0.
i=n
(Hinweise: (i) ⇒ (ii): Versuche einen Widerspruchsbeweis. (ii) ⇒ (i): Benutze die Beschr¨ anktheit, um aus einer Folge in A eine punktweise konvergente Teilfolge auszusondern (Diagonalfolgentrick!); zeige mit Hilfe der Limesbedingung, daß die Teilfolge auch in p konvergiert.) Aufgabe II.5.24 (a) Sei z ∈ ∞ und Tz : p → p , Tz (x) = z · x (vgl. Aufgabe II.5.11). Tz ist kompakt dann und nur dann, wenn z ∈ c0 ist. (b) C 1 [0, 1] trage (wie u ¨blich) die Norm f = f ∞ + f ∞ . Dann ist die Inklusionsabbildung (C 1 [0, 1], . ) → (C[0, 1], . ∞ ) kompakt. (Tip: Arzel` a-Ascoli!) Aufgabe II.5.25 Betrachte die Kernfunktion k(s, t) = |s − t|−α f¨ ur s = t bzw. k(s, s) = 0 auf [0, 1]2 . (a) Sei 0 < α < 1/2. Dann ist der zugeh¨ orige Integraloperator Tk ein kompakter Operator von L2 [0, 1] nach L2 [0, 1]. (b) Was passiert im Fall 1/2 ≤ α < 1? (Tip: H¨ oldersche Ungleichung.) Aufgabe II.5.26 Sei k ∈ C([0, 1]2 ). Der Integraloperator Tk : C[0, 1] → C[0, 1],
s
(Tk x)(s) =
k(s, t)x(t) dt, 0
heißt dann Volterrascher Integraloperator. Zeige, daß Tk wohldefiniert und kompakt ist. Aufgabe II.5.27 Betrachte die normierte Summe Z = X⊕p Y zweier normierter R¨ aume X und Y , wo 1 ≤ p ≤ ∞. Beschreibe den Dualraum von Z mit Hilfe der Dualr¨ aume von X und Y .
86
II.
Funktionale und Operatoren
Aufgabe II.5.28 Sei E1 , E2 , . . . eine Folge von Banachr¨ aumen, und sei 1 ≤ p ≤ ∞. Man setzt
p
En =
(xn ): xn ∈ En , (xn )p =
∞
1/p
xn
p
<∞
n=1
f¨ ur p < ∞ und
∞
(a)
!
En =
(xn ): xn ∈ En , (xn )∞ = sup xn < ∞
.
n
p
En , . p ist ein Banachraum.
!
!
E n ) ∼ En . = q ∞ (c) Sei (Ω, Σ, μ) ein Maßraum, und sei Ω = n=1 Ωn mit paarweise disjunkten Ωn ∈ Σ. Dann gilt (mit naheliegenden Bezeichnungen)
(b) F¨ ur 1 ≤ p < ∞ und
1 p
+
1 q
= 1 ist (
p
p
p Lp (Ωn ) ∼ = L (Ω).
(d) Im Text wurde Satz II.2.4 nur f¨ ur endliche Maßr¨ aume bewiesen. Mit Hilfe von (b) und (c) komplettiere den Beweis f¨ ur den σ-endlichen Fall.
Aufgabe II.5.29 Zeige F X, Lp (R) = K X, Lp (R) f¨ ur alle Banachr¨ aume X und 1 ≤ p < ∞. Aufgabe II.5.30 (Approximationszahlen) Seien X und Y Banachr¨ aume sowie T ∈ L(X, Y ). Die n-te Approximationszahl von T ist definiert als an (T ) := inf{T − A: A ∈ F (X, Y ), dim(ran A) < n}. Zeige (W und Z bezeichnen weitere Banachr¨ aume): (a) T = a1 (T ) ≥ a2 (T ) ≥ . . . . (b) an+k−1 (T1 + T2 ) ≤ an (T1 ) + ak (T2 ), ∀k, n ∈ N, T1 , T2 ∈ L(X, Y ). (c) an+k−1 (ST ) ≤ an (S)ak (T ), ∀k, n ∈ N, T ∈ L(X, Y ), S ∈ L(Y, Z). (d) an (RT S) ≤ Ran (T )S ∀S ∈ L(W, X), R ∈ L(Y, Z). (e) an (IdX ) = 1, falls dim X ≥ n. (Tip: A = IdX − (IdX − A); beachte die Neumannsche Reihe.) (f) Falls an (T ) → 0, ist T kompakt. Aufgabe II.5.31 (Lemma von Ehrling) Seien X, Y und Z Banachr¨ aume und T ∈ K(X, Y ) sowie J ∈ L(Y, Z); J sei injektiv. Dann existiert f¨ ur alle ε > 0 eine Konstante Cε mit T x ≤ εx + Cε JT x
∀x ∈ X.
(Hinweis: Versuche einen Widerspruchsbeweis!) Aufgabe II.5.32 Sei X ein Banachraum und T ∈ K(X).
87
II.6 Bemerkungen und Ausblicke
(a) Dann ist der Kern von Id − T endlichdimensional. (b) Ist Id − T bijektiv, so ist (Id − T )−1 stetig. (Bemerkung: Das gilt auch f¨ ur bloß stetige T , ist aber wesentlich schwieriger zu beweisen; siehe Korollar IV.3.4.) (c) Falls X unendlichdimensional ist, ist d(Id, K(X)) = 1. (Tip: K = Id − (Id − K); beachte die Neumannsche Reihe.) Aufgabe II.5.33 Sei (amn )m,n∈N eine unendliche Matrix u ¨ber C mit α := sup |amn | < ∞, m,n ∞
amn apn = δmp =
1 0
n=1
Sei 1 ≤ p ≤ 2 und
1 p
+
1 p p
m = p. m = p.
= 1. Dann definiert A: (sn )n → ( p
stetigen Operator von nach
n
amn sn )m einen
mit
A: p → p ≤ α1/p−1/p . (Tip: Betrachte zuerst A: 1 → ∞ , A: 2 → 2 und interpoliere.) Aufgabe II.5.34 Sei Y ein Banachraum und T eine lineare Abbildung, die stetig als Operator T : L1 (μ) → Y mit Norm M0 und als Operator T : L∞ (μ) → Y mit 1/p 1−1/p Norm M1 wirkt. Dann ist T : Lp (μ) → Y stetig mit Norm ≤ M0 M1 . p Anleitung: Betrachte eine Treppenfunktion f mit f L = 1. Sei λ > 0 ein noch freier Parameter. Setze g = f χ{|f |≤λ} ∈ L∞ = f − g ∈ L1 (μ). Schließe (μ) und h1−p T f ≤ M1 λ + M0 hL1 und hL1 = {|f |>λ} |f | |f |p dμ ≤ λ1−p . Durch 1/p
geschickte Wahl von λ erziele T f ≤ M0
II.6
1−1/p
M1
.
Bemerkungen und Ausblicke
Die Untersuchung von Integraloperatoren stand von Anfang an im Zentrum der Funktionalanalysis. Hilbert und Schmidt befaßten sich – im Prinzip – in ihren im Kapitel VI genauer vorgestellten Arbeiten mit Operatoren auf L2 [a, b]. F. Riesz studierte 1918 (Acta Math. 41 (1918) 71–98) kompakte Operatoren – pars pro toto – auf C[a, b]; aber er erkannte bereits, daß die in der Arbeit gemachte Einschr¨ ankung [. . .] auf stetige Funktionen oh” ne Belang“ ist, wie bereits in Abschnitt I.5 zitiert wurde. Die Arbeit von Riesz kann also als Ausgangspunkt der Theorie kompakter Operatoren auf Banachr¨aumen angesehen werden. Die ¨ altere Nomenklatur f¨ ur kompakte Operatoren lautet u ¨brigens vollstetige Operatoren; mehr dazu in den Bemerkungen zum n¨ achsten Kapitel. Das Problem, ob kompakte Operatoren stets durch endlichdimensionale approximiert werden k¨ onnen, mit anderen Worten, ob Korollar II.3.6 f¨ ur jeden Banachraum Y gilt, wurde erst 1973 von Enflo (Acta Math. 130 (1973)
88
II.
Funktionale und Operatoren
309–317) durch ein Gegenbeispiel gel¨ ost. Es ist dazu ¨aquivalent, ob f¨ ur k ∈ C([0, 1]2 ) stets 1 1 k(s, t)k(t, u) dt = 0 ∀s, u ∈ [0, 1] ⇒ k(s, s) ds = 0 (II.23) 0
0
gilt. (Ist k ein Gegenbeispiel hierzu, so ist Y = lin{k(s, . ): s ∈ [0, 1]} ⊂ C[0, 1] ein Gegenbeispiel zum Approximationsproblem, siehe Lindenstrauss/ Tzafriri [1977], S. 35.) Die Frage nach (II.23) wurde schon im Schottischen Buch aufgeworfen (Problem 153, datiert von 6. November 1936; Mauldin [1981], S. 231); als Preis f¨ ur die Antwort war eine lebende Gans“ ausgesetzt ” worden. In der Tat wurde Enflo sein Preis 1972 in Warschau u ¨berreicht, das Ereignis ist auf einem Foto in Kalu˙za [1996] abgebildet. Gilt Korollar II.3.6 f¨ ur einen Banachraum Y , so sagt man nach Grothendieck1 (Mem. Amer. Math. Soc. 16 (1955)), Y habe die Approximationseigenschaft. Alle klas” sischen“ Funktionen- und Folgenr¨ aume besitzen diese Eigenschaft, wie in Korollar II.3.6 festgestellt wurde, und es ist auch heute nicht einfach, Gegenbeispiele zu produzieren; man vergleiche dazu etwa Lindenstrauss/Tzafriri [1977], S. 87–90. Es ist ein außerordentlich bemerkenswertes Resultat von Szankowski (Acta Math. 147 (1981) 89–108), daß der nicht separable Raum Y = L(2 ) nicht die Approximationseigenschaft besitzt; Pisiers Darstellung des sehr schwierigen Beweises im S´eminaire Bourbaki (Lecture Notes in Math. 770, S. 312–327) ist die einzige mir bekannte mathematische Arbeit, die mit dem Ausruf Uff!“ endet. ” Die Neumannsche Reihe ist nach C. Neumann (nicht J. von Neumann) benannt, der eine solche Reihe im Jahre 1877 in der Potentialtheorie verwandte (Dieudonn´e [1981], S. 43). Die im Text skizzierte Anwendung auf Integralgleichungen verdankt man E. Schmidt (Math. Ann. 64 (1907) 161– 174). Eine allgemeinere Variante der Neumannschen Reihe zeigt, daß Id− T nicht nur f¨ ur einen Banachraumoperator T mit T < 1 ein Isomorphismus ist, sondern auch, wenn bloß ein λ < 1 mit T x ≤ λ( x + x − T x ) f¨ ur alle x existiert (Hilding, Ann. Math. 49 (1948) 953–955; dazu siehe auch Casazza/Kalton, Proc. Amer. Math. Soc. 127 (1999) 519–527). Riesz war es auch, der bemerkte, daß man es in der Lp -Theorie, die er in Math. Ann. 69 (1910) 449–497 initiierte, f¨ ur p = 2 nicht nur mit einem Funktionenraum zu tun hat, sondern der Raum Lq mit dem konjugierten p Exponenten q = p−1 auf vollkommen nat¨ urliche Weise ebenfalls ins Spiel kommt; im Fall p = 2 wird diese Tatsache dadurch verschleiert, daß L2 zu 1 Eine Biographie uber diesen wahrlich bemerkenswerten Mathematiker von W. Schar¨ lau ist in Vorbereitung; siehe www.math.uni-muenster.de/math/u/scharlau/scharlau oder www.grothendieckcircle.org. Band 1 und 3 sind bereits erschienen (Scharlau [2007] und [2010]); f¨ ur eine Kurzfassung siehe das Septemberheft 2008 der Notices of the American Mathematical Society. Ein ebenfalls sehr informativer biographischer Artikel von A. Jackson wurde im Oktober- bzw. Novemberheft des Jahrgangs 2004 der Notices of the American Mathematical Society ver¨ offentlicht.
II.6
Bemerkungen und Ausblicke
89
sich selbst dual ist. Insbesondere bewies er Lp [a, b] ∼ = Lq [a, b], wodurch die Grundlage der Dualit¨ atstheorie gelegt wurde, die allerdings erst in dem Moment wirklich befriedigend wird, wo der Dualraum eines allgemeinen normierten Raums als hinreichend umfassend erkannt wird. Das werden wir in Kapitel III mit dem Satz von Hahn-Banach erreichen. Wieder stellt Riesz fest, daß der von ihm diskutierte partikul¨are Fall der Lp -R¨aume u ¨ ber kompakten Intervallen im Kern den allgemeinen enth¨alt: Unsere Resultate gelten f¨ ur alle entsprechenden Klassen von Funktionen, die f¨ ur eine meßbare Menge beliebiger Dimension von nicht verschwindendem Inhaltsmaße erkl¨ art werden; es ist nat¨ urlich auch der Begriff des Inhaltsmaßes entsprechend zu deuten.
(Ebd., S. 496.) Daß L∞ [a, b] zu L1 [a, b] dual ist, ist ein Resultat von Steinhaus (Math. Zeitschrift 5 (1919) 186–221). Um allgemein L1 (μ) als L∞ (μ) darstellen zu k¨onnen, muß man wirklich eine Endlichkeitsvoraussetzung an den Maßraum stellen; wie im Text bereits bemerkt, ist das f¨ ur p > 1 u ussig. ¨ berfl¨ Hier ein Beispiel: Sei Ω = [0, 1], Σ die σ-Algebra aller Teilmengen von [0, 1], die selbst oder deren Komplemente h¨ ochstens abz¨ahlbar sind, und μ 1 das z¨ahlende Maß. Dann ist (f ) = 0 f (t)t dμ(t) ein wohldefiniertes stetiges lineares Funktional auf L1 (μ). Es kann aber nicht durch ein g ∈ L∞(μ) dargestellt werden; dazu k¨ ame n¨ amlich als einziges die Funktion g(t) = t in Frage, aber die ist nicht meßbar. (Gleichwohl definieren die Produkte f (t)t f¨ ur f ∈ L1 (μ) meßbare Funktionen, denn dann istf (t) = 0 f¨ ur h¨ochstens abz¨ahlbar viele t.) Eine genaue Untersuchung von L1 (μ) findet man bei Behrends [1987], S. 184ff. Man kann auch f¨ ur die Dualr¨ aume von ∞ und L∞ konkrete Darstellungen angeben, n¨ amlich durch R¨ aume additiver (aber nicht σ-additiver) Mengenfunktionen; siehe Dunford/Schwartz [1958], S. 296. Diese Darstellungen sind aber bei weitem nicht so n¨ utzlich wie die in Abschnitt II.2 vorgestellten. Der Rieszsche Darstellungssatz II.2.5 wurde von ihm zun¨achst f¨ ur K = [0, 1] bewiesen (C. R. Acad. Sc. Paris 149 (1909) 1303–1305), wobei er die Funktionale durch Stieltjes-Integrale darstellte; die endg¨ ultige Fassung stammt von Kakutani (Ann. of Math. 42 (1941) 994–1024). Der Satz gilt genauso, wenn K bloß lokalkompakt ist und statt C(K) der Raum der im ” Unendlichen verschwindenden“ stetigen Funktionen C0 (K) = f : K → K: f stetig; {t: |f (t)| ≥ ε} kompakt ∀ε > 0 mit der Supremumsnorm betrachtet wird. Eine andere Variante des Rieszschen Darstellungssatzes stellt die positiven linearen Funktionale auf K (K) = {f : K → K: f stetig, supp(f ) kompakt},
90
II.
Funktionale und Operatoren
K lokalkompakt, durch positive regul¨ are Borelmaße, die aber nicht endlich zu sein brauchen, dar; Beweise findet man bei Rudin [1986], S. 40ff., oder Behrends [1987], S. 217ff. Dies ist umgekehrt der Ausgangspunkt f¨ ur die Integrationstheorie `a la Bourbaki. F¨ ur Bourbaki ist ein Maß ein Funktional auf K (K) und keine σ-additive Mengenfunktion; eine konzise Darstellung gibt Pedersen [1989]. Korollar II.2.7 motiviert folgendes quantitative Konzept zur Untersuchung der Isomorphie von Banachr¨ aumen. Der Banach-Mazur-Abstand zwischen zwei isomorphen Banachr¨ aumen X und Y ist erkl¨art als d(X, Y ) = inf{ T T −1 : T : X → Y Isomorphismus}. Die Funktion d erf¨ ullt die multiplikative Dreiecksungleichung d(X, Z) ≤ d(X, Y )d(Y, Z); eigentlich sollte also log d Abstand“ genannt werden. Das ” Argument von Satz II.1.10(a) zeigt in dieser Sprechweise, daß d(c, c0 ) ≤ 4 gilt; der pr¨azise Wert ist d(c, c0 ) = 3 (Cambern, Studia Math. 30 (1968) 73–77). Insbesondere ist es wichtig, den Banach-Mazur-Abstand zwischen endlichdimensionalen aumen als Funktion ihrer Dimension abzusch¨atzen. R¨ (II.9) zeigt d X, 1 (n) ≤ n f¨ ur alle n-dimensionalen R¨aume, also d(X, Y ) ≤ n2 , falls dim X = dim Y = n. Ein wesentlich sch¨arferes Resultat stellt der Satz von F. John aus dem Jahre 1948 dar, der z.B. in Bollob´as [1990] bewiesen wird. Er lautet: √ • F¨ ur alle n-dimensionalen R¨ aume gilt d X, 2 (n) ≤ n; also folgt d(X, Y ) ≤ n, falls dim X = dim Y = n. Erst Anfang der 80er Jahre zeigte Gluskin (Funct. Anal. Appl. 15 (1981) 72– 73) mit wahrscheinlichkeitstheoretischen Methoden, daß der Satz optimal ist, indem er die Existenz einer Skala von n-dimensionalen R¨aumen mit 1 ∞ inf d(Xn , Yn )/n > 0 nachwies; √ bemerkenswerterweise ist d (n), (n) nur von der Gr¨oßenordnung n und nicht n. In den Beispielen II.1(n) und II.3(e) wurde ein schwach singul¨arer Integraloperator diskutiert. Allgemeiner sei Ω ⊂ Rn offen (oder eine n-dimensionale Mannigfaltigkeit). Eine Kernfunktion auf Ω × Ω der Gestalt ⎧ ⎨ r(s, t) falls s = t, k(s, t) = |s − t|α ⎩ 0 falls s = t mit einer auf (Ω × Ω) \ {(t, t): t ∈ Ω} stetigen und beschr¨ankten Funktion r gibt Anlaß zu einem schwach singul¨ aren Integraloperator, falls α < n ist. Solche Operatoren sind auf den meisten Funktionenr¨aumen kompakt, wenn Ω beschr¨ankt ist. Im Fall α = n spricht man von singul¨ aren Integraloperatoren; sie sind in der Regel nicht kompakt, schlimmer noch, sie brauchen nicht einmal stetig oder auch nur wohldefiniert zu sein. Paradebeispiel ist
II.6
91
Bemerkungen und Ausblicke
die Hilberttransformation
∞
(Hf )(s) = −∞
f (t) dt, s−t
f ∈ L2 (R).
Dieses Integral konvergiert im allgemeinen nicht, da t → t−1 in einer Umgebung von 0 nicht integrierbar ist. Es existiert jedoch im Sinn des Cauchyschen Hauptwerts ∞ f (t) f (t) CHdt = lim dt; ε→0 s − t s −∞ {|s−t|≥ε} − t und in diesem Sinn ist H ein beschr¨ ankter, aber nicht kompakter Operator auf L2 (R) (siehe etwa Bennett/Sharpley [1988], S. 139). Theorem II.4.2 wurde von M. Riesz, F. Riesz’ Bruder, im Fall pk ≤ qk bewiesen (Acta Math. 49 (1926) 465–497). Er verwendete dazu nichts als die H¨oldersche Ungleichung, und es stellt sich heraus, daß in diesem Fall (II.14) auch f¨ ur reelle Skalare gilt. Geometrisch im Sinn der Skizze von S. 74 bedeutet die Einschr¨ ankung pk ≤ qk , daß man nur im unteren Teildreieck {(α, β): 0 ≤ β ≤ α ≤ 1} statt im gesamten Quadrat [0, 1]2 interpolieren darf. Der Rieszsche Satz wurde von Thorin (Kungl. Fys. Saell. i Lund For. 8 (1939) #14) in voller Allgemeinheit gezeigt; sein Beweis f¨ uhrt den Interpolationssatz auf den Drei-Geraden-Satz II.4.3, der von Hadamard stammt, zur¨ uck. Dieser Beweisansatz wurde laut Bennett/Sharpley [1988], S. 195, von Littlewood bewundernd die frechste Idee in der Analysis“ genannt. Im ” reellen Fall wurde ein elementarer Beweis von Kruglyak (Contemp. Math. 445 (2007) 179–182) gefunden. Eine andere Interpolationsmethode wurde von Marcinkiewicz ersonnen, um ein qualitativ allgemeineres Resultat zu erzielen. Um es zu formulieren, f¨ uhren wir ein paar Vokabeln ein. Eine lineare Abbildung zwischen R¨aumen meßbarer Funktionen heißt vom starken Typ (p, q), falls f¨ ur eine geeignete Konstante cpq T f Lq ≤ cpq f Lp ∀f ∈ Lp (II.24) gilt, mit anderen Worten, falls T : Lp → Lq < ∞ ist. Der Satz von RieszThorin impliziert also mit den dortigen Bezeichnungen, daß ein Operator vom starken Typ (p0 , q0 ) und vom starken Typ (p1 , q1 ) auch vom starken Typ (p, q) ist. Nun gilt trivialerweise f¨ ur g ∈ Lq (ν) g qLq = |g|q dν ≥ |g|q dν ≥ ν{|g| ≥ λ} λq {|g|≥λ}
f¨ ur alle λ ≥ 0 (das ist die Chebyshev-Ungleichung), daher impliziert (II.24) sup λ ν{|T f | ≥ λ}1/q ≤ cpq f Lp λ≥0
∀f ∈ Lp .
(II.25)
92
II.
Funktionale und Operatoren
Nun erf¨ ullen diverse Operatoren der Analysis f¨ ur geeignete Exponenten zwar (II.25), aber nicht (II.24). Erf¨ ullt T die Ungleichung (II.25), so wird T vom schwachen Typ (p, q) genannt; schwacher Typ (p, ∞) werde als starker Typ (p, ∞) verstanden. Ein einfaches Beispiel ist der Operator 1 s (T f )(s) = f (t) dt (II.26) s 0 auf L1 [0, 1], der vom schwachen Typ (1, 1), aber nicht vom starken Typ (1, 1) ist, wie man leicht u uft. Es gilt nun der folgende Satz. ¨berpr¨ • (Interpolationssatz von Marcinkiewicz) Seien 1 ≤ p0 ≤ q0 ≤ ∞, 1 ≤ p1 ≤ q1 ≤ ∞ und q0 = q1 . Sei T ein Operator vom schwachen Typ (p0 , q0 ) und vom schwachen Typ (p1 , q1 ). Ist 0 < θ < 1 und sind p und q wie in (II.13), so ist T vom starken Typ (p, q). Beachte die einschr¨ ankende Voraussetzung pk ≤ qk , die hier wirklich wesentlich ist. Da der in (II.26) definierte Operator trivialerweise vom starken Typ (∞, ∞) ist, schließt man aus dem Interpolationssatz von Marcinkiewicz, daß T f¨ ur alle 1 < p < ∞ ein stetiger Operator von Lp [0, 1] in sich ist. Dies folgt nicht aus dem Satz von Riesz-Thorin, und die Aussage direkt zu beweisen ist nicht offensichtlich. Ein weiterer Vorzug des Marcinkiewiczschen Interpolationssatzes gegen¨ uber dem Riesz-Thorinschen ist, daß er auch auf quasilineare Operatoren anwendbar ist, d.h. solche Abbildungen, die bloß |T (f + g)| ≤ c(|T f | + |T g|),
|T (λf )| = |λ| |T f |
erf¨ ullen. Sein Nachteil ist, daß er schwieriger zu beweisen ist, siehe Zygmund [1959], vol. II, S. 112ff., oder f¨ ur eine etwas allgemeinere Version Bennett/Sharpley [1988], S. 225ff. Sowohl die Methode von Thorin als auch die von Marcinkiewicz haben zu abstrakten Interpolationsverfahren zwischen Paaren von Banachr¨aumen Anlaß gegeben, n¨ amlich zur komplexen bzw. reellen Interpolationsmethode. So kann man etwa zwischen C[0, 1] und C 1 [0, 1] interpolieren und auf diese Weise R¨aume h¨olderstetiger Funktionen gewinnen, Interpolation zwischen Sobolevr¨aumen (siehe Abschnitt V.2) liefert die sog. Besovr¨aume, Interpolation zwischen K(H) und N (H) (siehe Abschnitt VI.5) liefert die Schattenklassen etc. Die Interpolationstheorie wird umfassend in Bennett/Sharpley [1988], Bergh/L¨ofstr¨ om [1976] und Triebel [1978] dargestellt.
Kapitel III
Der Satz von Hahn-Banach und seine Konsequenzen
III.1
Fortsetzungen von Funktionalen
Im letzten Kapitel wurde die Darstellung von stetigen linearen Funktionalen f¨ ur eine Reihe normierter R¨ aume angegeben. Es ist jedoch bis jetzt nicht klar, ob es u ¨ berhaupt auf jedem normierten Raum ein stetiges lineares Funktional = 0 gibt (versuche z.B. den Quotientenraum ∞ /c0 ). Die Existenz von Funktionalen mit vorgeschriebenen Eigenschaften zu beweisen ist das Thema dieses Kapitels. Der grundlegende Existenzsatz III.1.2 geh¨ort von der Aussage her in die lineare Algebra. Wir formulieren ihn zun¨achst f¨ ur reelle Vektorr¨aume. Die folgende Definition bezieht sich jedoch auf reelle oder komplexe Vektorr¨aume. Definition III.1.1 Sei X ein Vektorraum. Eine Abbildung p: X → R heißt sublinear, falls (a) p(λx) = λp(x) f¨ ur alle λ ≥ 0, x ∈ X, (b) p(x + y) ≤ p(x) + p(y) f¨ ur alle x, y ∈ X. Beachte, daß diese Definition rein algebraisch ist (es ist nicht von einem normierten Raum die Rede) und daß sublineare Abbildungen negative Werte annehmen d¨ urfen. Hingegen sind sie auch f¨ ur komplexe Vektorr¨aume reellwertig. Beispiele. (a) Jede Halbnorm ist sublinear. (b) Jede lineare Abbildung auf einem reellen Vektorraum ist sublinear. (c) (tn ) → lim sup tn ist sublinear auf dem reellen Raum ∞ ; (tn ) → lim sup Re tn ist sublinear auf dem komplexen Raum ∞ . Weitere Beispiele (Minkowskifunktionale) werden im n¨achsten Abschnitt vorgestellt.
D. Werner, Funktionalanalysis, 7. Aufl., Springer-Lehrbuch, DOI 10.1007/978-3-642-21017-4_3, © Springer-Verlag Berlin Heidelberg 2011
94
III.
Der Satz von Hahn-Banach und seine Konsequenzen
Satz III.1.2 (Satz von Hahn-Banach; Version der linearen Algebra) Sei X ein reeller Vektorraum, und sei U ein Untervektorraum von X. Ferner seien p: X → R sublinear und : U → R linear mit (x) ≤ p(x)
∀x ∈ U.
Dann existiert eine lineare Fortsetzung L: X → R, L|U = , mit L(x) ≤ p(x)
∀x ∈ X.
Beweis. Der Beweis besteht aus zwei Teilen. Zuerst wird gezeigt, wie man so ein L findet, wenn X eine Dimension mehr als U hat, wenn also dim X/U = 1 ist. Dann folgt ein Induktionsschritt. Von U ausgehend nimm eine Dimension zu U hinzu und l¨ ose das Fortsetzungsproblem nach Schritt 1, nimm eine weitere Dimension hinzu und l¨ ose das Fortsetzungsproblem usw. Die mathematische Pr¨ azisierung des usw.“-Schritts besteht in der Verwendung ” des Zornschen Lemmas. Im ersten Schritt zeigen wir also, daß das Fortsetzungsproblem l¨osbar ist, wenn dim X/U = 1 ist. Sei x0 ∈ X \ U beliebig. Jedes x ∈ X l¨aßt sich dann eindeutig als x = u + λx0
(u ∈ U, λ ∈ R)
schreiben. Sei r ∈ R ein noch freier Parameter. Der Ansatz Lr (x) = (u) + λr definiert dann eine lineare Abbildung, die fortsetzt. Durch passende Wahl von r werden wir Lr ≤ p sicherstellen. In der Tat gilt Lr ≤ p genau dann, wenn (u) + λr ≤ p(u + λx0 )
∀u ∈ U, λ ∈ R
(III.1)
gilt. Nach Voraussetzung gilt (III.1) f¨ ur λ = 0 und alle u ∈ U . Sei λ > 0. Dann gilt (III.1) genau dann, wenn
⇔ ⇔
λr ≤ p(u + λx0 ) − (u) ∀u ∈ U u u r ≤ p + x0 − ∀u ∈ U λ λ r ≤ inf p(v + x0 ) − (v) . v∈U
Analog ist im Fall λ < 0 die Bedingung (III.1) a¨quivalent zu
⇔ ⇔
λr ≤ p(u + λx0 ) − (u) ∀u ∈ U u u −r ≤ p − x0 − ∀u ∈ U −λ −λ r ≥ sup (w) − p(w − x0 ) . w∈U
III.1
95
Fortsetzungen von Funktionalen
Daher existiert r ∈ R mit Lr ≤ p genau dann, wenn (w) − p(w − x0 ) ≤ p(v + x0 ) − (v)
∀v, w ∈ U
gilt, also dann und nur dann, wenn (v) + (w) ≤ p(v + x0 ) + p(w − x0 )
∀v, w ∈ U
(III.2)
gilt. Da die Absch¨ atzung (v) + (w) = (v + w) ≤ p(v + w) ≤ p(v + x0 ) + p(w − x0 ) (III.2) beweist, ist der erste Schritt gezeigt. Im zweiten Schritt wenden wir das Zornsche Lemma an. Es lautet: Sei (A, ≤) eine teilweise geordnete nichtleere Menge, in der jede Kette (das ist eine total geordnete Teilmenge, also eine Teilmenge, f¨ ur deren Elemente stets a ≤ b oder b ≤ a gilt) eine obere Schranke besitzt. Dann liegt jedes Element von A unter einem maximalen Element von A, also einem Element m mit m ≤ a ⇒ a = m. Wir verwenden V Unterraum von X mit U ⊂ V ; A := (V, LV ): LV : V → R linear mit LV ≤ p|V , LV |U = mit der Ordnung (V1 , LV1 ) ≤ (V2 , LV2 ) ⇔ V1 ⊂ V2 , LV2 |V1 = LV1 . Es ist A = ∅, da (U, ) ∈ A. Ist (Vi , LVi )i∈I total geordnet, so ist in der Tat (V, LV ) mit V = Vi , LV (x) = LVi (x) f¨ ur x ∈ Vi i∈I
eine obere Schranke; LV ist wohldefiniert, da (Vi , LVi )i∈I total geordnet ist. Sei nun m = (X0 , LX0 ) ein maximales Element. W¨are X0 = X, so g¨abe es nach dem ersten Schritt eine echte Majorante von m, und m k¨onnte nicht maximal sein. Es folgt X0 = X, und L := LX0 l¨ost das Fortsetzungsproblem. Damit ist Satz III.1.2 bewiesen. 2 Beachte, daß der Parameter r im ersten Beweisschritt im allgemeinen nicht eindeutig bestimmt ist. Daher ist auch L im allgemeinen nicht eindeutig bestimmt.
96
III.
Der Satz von Hahn-Banach und seine Konsequenzen
Als n¨achstes formulieren wir Satz III.1.2 f¨ ur komplexe Vektorr¨aume. F¨ ur C-wertige Abbildungen ergibt (x) ≤ p(x)“ jedoch keinen Sinn. Ein ” C-Vektorraum X ist aber nat¨ urlich auch ein R-Vektorraum; beachte, daß f¨ ur x = 0 dann x und ix linear unabh¨ angig u ¨ber R sind. Satz III.1.2 kann daher auf X sowie R-lineare Funktionale angewandt werden. Es gibt nun einen engen Zusammenhang zwischen R-linearen und C-linearen Funktionalen, den wir zuerst beschreiben. Lemma III.1.3 Sei X ein C-Vektorraum. (a) Ist : X → R ein R-lineares Funktional, d.h. ∀λi ∈ R, xi ∈ X,
(λ1 x1 + λ2 x2 ) = λ1 (x1 ) + λ2 (x2 ) und setzt man ˜ := (x) − i (ix), (x)
˜ X → C ein C-lineares Funktional und = Re . ˜ so ist : (b) Ist h: X → C ein C-lineares Funktional, = Re h und ˜ wie unter (a), so ist R-linear und ˜ = h. (c) Ist p: X → R eine Halbnorm und : X → C C-linear, so gilt die ¨ Aquivalenz |(x)| ≤ p(x)
∀x ∈ X
⇔
|Re (x)| ≤ p(x)
∀x ∈ X.
(d) Ist X ein normierter Raum und : X → C C-linear und stetig, so ist = Re . Mit anderen Worten ist → Re eine bijektive R-lineare Abbildung zwischen dem Raum der C-linearen und dem der R-wertigen R-linearen Funktionale. Im normierten Fall ist sie isometrisch. Beweis. (a) Als Kompositum R-linearer Abbildungen (auch x → ix ist Rlinear) ist ˜ R-linear, und Re ˜ = gilt nach Konstruktion. Es ist nur noch ˜ ˜ (ix) = i (x) zu zeigen: ˜ (ix) = (ix) − i (i ix) = (ix) − i (−x) ˜ = i (x) − i (ix) = i (x). (b) Nat¨ urlich ist = Re h R-linear. Beachte nun Im z = −Re iz f¨ ur alle z ∈ C. Daher ist f¨ ur x ∈ X h(x) = Re h(x) + i Im h(x) = Re h(x) − i Re ih(x) = Re h(x) − i Re h(ix) ˜ = (x) − i (ix) = (x).
(h ist C-linear)
III.1
97
Fortsetzungen von Funktionalen
(c) Wegen |Re z| ≤ |z| f¨ ur alle z ∈ C gilt ⇒“. F¨ ur die andere Implika” tion schreibe (x) = λ|(x)| f¨ ur ein λ = λx mit |λ| = 1. Dann gilt f¨ ur alle x ∈ X: |(x)| = λ−1 (x) = (λ−1 x) = |Re (λ−1 x)| ≤ p(λ−1 x) = p(x). (d) ist eine unmittelbare Konsequenz von (c).
2
Satz III.1.4 (Satz von Hahn-Banach; Version der linearen Algebra; komplexe Fassung) Sei X ein komplexer Vektorraum, und sei U ein Untervektorraum von X. Ferner seien p: X → R sublinear und : U → C linear mit Re (x) ≤ p(x)
∀x ∈ U.
Dann existiert eine lineare Fortsetzung L: X → C, L|U = , mit Re L(x) ≤ p(x)
∀x ∈ X.
Beweis. Wende Satz III.1.2 auf Re an, um ein R-lineares Funktional F : X → R mit F |U = Re und F (x) ≤ p(x) f¨ ur alle x ∈ X zu erhalten. Nach Lemma III.1.3(a) ist F = Re L f¨ ur ein gewisses C-lineares Funktional L: X → C. Daß von L fortgesetzt wird, folgt aus Lemma III.1.3(b). 2 Wir wenden nun die algebraischen Hahn-Banach-S¨atze auf normierte R¨aume an. Theorem III.1.5 (Satz von Hahn-Banach; Fortsetzungsversion) Sei X ein normierter Raum und U ein Untervektorraum. Zu jedem stetigen linearen Funktional u : U → K existiert dann ein stetiges lineares Funktional x : X → K mit x |U = u ,
x = u .
Jedes stetige Funktional kann also normgleich fortgesetzt werden. Beweis. Wir unterscheiden, ob X ein reeller oder komplexer Raum ist. Im reellen Fall setze p(x) = u x f¨ ur x ∈ X. Dann folgt aus Satz III.1.2 die Existenz einer linearen Abbildung x : X → R mit x |U = u und x (x) ≤ p(x)
∀x ∈ X.
Da auch x (−x) ≤ p(−x) = p(x) ist, folgt |x (x)| ≤ u x
∀x ∈ X,
d.h. x ≤ u . Umgekehrt gilt trivialerweise u = sup |u (u)| = sup |x (u)| ≤ sup |x (x)| = x . u∈BU
u∈BU
x∈BX
98
III.
Der Satz von Hahn-Banach und seine Konsequenzen
Im komplexen Fall kombiniere den ersten Beweisschritt mit Satz III.1.4, um ein lineares Funktional x : X → C mit x |U = u und Re x = u zu erhalten. Nach Lemma III.1.3(d) gilt Re x = x . 2 Es sollte wieder bemerkt werden, daß eine solche Fortsetzung x im allgemeinen nicht eindeutig bestimmt ist und daß das Analogon von Theorem III.1.5 f¨ ur Operatoren im allgemeinen falsch ist. So werden wir im Anschluß an Satz IV.6.5 bemerken, daß es keinen stetigen Operator T : ∞ → c0 gibt, der die Identit¨ at Id: c0 → c0 fortsetzt. F¨ ur ein positives Resultat in dieser Richtung siehe Aufgabe III.6.22(a); vgl. auch Satz II.1.5 f¨ ur den Fall, daß U dicht liegt. Die folgenden Korollare besagen, daß der Dualraum eines normierten Raums X umfassend genug ist, um Eigenschaften von X und seinen Elementen kodieren zu k¨ onnen. Dadurch werden Probleme u ¨ ber Vektoren letztendlich auf Probleme u uckgespielt; die x (x), wo x den Dual¨ber Zahlen zur¨ raum von X durchl¨ auft, k¨ onnen somit als Koordinaten“ von x angesehen ” werden. Korollar III.1.6 In jedem normierten Raum X existiert zu jedem x ∈ X, x = 0, ein Funktional x ∈ X mit x = 1
und
x (x) = x .
Speziell trennt X die Punkte von X; d.h., zu x1 , x2 ∈ X, x1 = x2 , existiert x ∈ X mit x (x1 ) = x (x2 ). Beweis. Setze das Funktional u : lin{x} → K, u (λx) = λ x , normgleich auf X fort. Zum Beweis des Zusatzes betrachte einfach x = x1 − x2 . 2 Korollar III.1.7 In jedem normierten Raum gilt x = sup |x (x)| x ∈BX
∀x ∈ X.
(III.3)
Beweis. ≥“ gilt nach Definition von x , und ≤“ nach Korollar III.1.6 ” ” (der Fall x = 0 ist trivial). 2 Bemerke die Symmetrie der Formel (III.3) zur Definition x = sup |x (x)|
∀x ∈ X .
x∈BX
Im Gegensatz hierzu wird das Supremum in (III.3) sogar stets angenommen. Korollar III.1.8 Seien X ein normierter Raum, U ein abgeschlossener Unterraum und x ∈ X, x ∈ / U . Dann existiert x ∈ X mit x | U = 0
und
x (x) = 0.
III.1
99
Fortsetzungen von Funktionalen
Beweis. Sei ω: X → X/U die kanonische Quotientenabbildung. Dann ist ω(u) = 0 f¨ ur alle u ∈ U und ω(x) = 0. W¨ ahle nach Korollar III.1.6 ∈ (X/U ) mit ω(x) = 0. Das Funktional x := ◦ ω leistet dann das Gew¨ unschte. 2 Unmittelbar aus Korollar III.1.8 und Satz II.1.5 folgt: Korollar III.1.9 Ist X ein normierter Raum und U ein Untervektorraum, so sind ¨ aquivalent: (i) U ist dicht in X. (ii) Falls x ∈ X und x |U = 0, so gilt x = 0. Es folgen noch einige weitere Anwendungen. Zun¨achst eine Bezeichnung. Ist X ein normierter Raum und sind Teilmengen U ⊂ X und V ⊂ X gegeben, so setzen wir U ⊥ := {x ∈ X : x (x) = 0 ∀x ∈ U }, V⊥ := {x ∈ X: x (x) = 0 ∀x ∈ V }.
(III.4) (III.5)
U ⊥ und V⊥ sind stets abgeschlossene Unterr¨ aume von X bzw. X. U ⊥ heißt der Annihilator von U in X und V⊥ der Annihilator von V in X. Satz III.1.10 Sei X ein normierter Raum und U ein abgeschlossener Unterraum. Es existieren kanonische isometrische Isomorphismen (X/U ) ∼ = U ⊥, ∼ U = X /U ⊥ .
(III.6) (III.7)
Beweis. Wir begn¨ ugen uns damit, die fraglichen Isomorphismen anzugeben, ¨ und u F¨ ur (III.6) ordne ∈ ¨berlassen die Verifikation der Details zur Ubung. (X/U ) das Funktional x = ◦ ω, ω: X → X/U die Quotientenabbildung, zu; und f¨ ur (III.7) betrachte x + U ⊥ → x |U . 2 ∞ 1 ∞ Satz III.1.11 Die Abbildung T : → ( ) , (T x)(y) = ur n=1 sn tn f¨ x = (sn ), y = (tn ), ist isometrisch, aber nicht surjektiv. Beweis. Der Beweis der Isometrie ist einfach und wird den Lesern u ¨berlassen. Um zu zeigen, daß T nicht surjektiv ist, betrachte das Funktional lim: c → K und setze es mit dem Satz von Hahn-Banach zu einem ∞stetigen Funktional x : ∞ → K fort. H¨ atte x eine Darstellung x (y) = n=1 sn tn , so w¨are (ek = k-ter Einkeitsvektor) sk = x (ek ) = lim ek = 0 also x = 0. Widerspruch!
∀k ∈ N, 2
Daß es u ¨berhaupt keinen Isomorphismus zwischen 1 und (∞ ) geben kann, zeigt der folgende Satz. (Zur Erinnerung: 1 ist separabel, ∞ aber nicht; Beispiel I.2(a) und (c).)
100
III.
Der Satz von Hahn-Banach und seine Konsequenzen
Satz III.1.12 Ein normierter Raum X mit separablem Dualraum ist selbst separabel. Beweis. Mit X ist SX = {x ∈ X : x = 1} separabel (Aufgabe I.4.26). Sei also die Menge {x1 , x2 , . . .} dicht in SX . W¨ahle xi ∈ SX mit |xi (xi )| ≥ 1 2 . Wir setzen U := lin{x1 , x2 , . . .} und werden zeigen, daß U dicht in X liegt. Sei x ∈ X mit x |U = 0. W¨ are x = 0, k¨onnte ohne Einschr¨ankung x = 1 angenommen werden. Dann existiert xi0 mit x − xi0 ≤ 14 . Es folgt 1 1 ≤ |xi0 (xi0 )| = |xi0 (xi0 ) − x (xi0 )| ≤ xi0 − x xi0 ≤ . 2 4 Also muß x = 0 sein, und wegen Korollar III.1.9 liegt U dicht. Nach Lemma I.2.9 ist X separabel. 2 Satz III.1.13 Sei X ein normierter Raum und I eine Indexmenge. Seien xi ∈ X und ci ∈ K f¨ ur i ∈ I. Dann sind folgende Bedingungen ¨ aquivalent: (i) Es existiert x ∈ X mit x (xi ) = ci f¨ ur alle i ∈ I. (ii) Es existiert M ≥ 0 derart, daß f¨ ur alle endlichen Teilmengen F ⊂ I die Ungleichung λi ci ≤ M λi xi (III.8) i∈F
i∈F
erf¨ ullt ist. Beweis. (i) ⇒ (ii) ist klar; w¨ ahle M = x . (ii) ⇒ (i): (III.8) impliziert, daß
i∈F
λi xi
=
λi ci
i∈F
ein wohldefiniertes stetiges lineares Funktional auf lin{xi : i ∈ I} definiert. W¨ahle nun eine Hahn-Banach-Fortsetzung x von . 2
III.2
Trennung konvexer Mengen
In diesem Abschnitt wird die geometrische Version des Satzes von HahnBanach vorgestellt. Ziel ist die Trennung konvexer Mengen eines normierten Raums durch stetige lineare Funktionale.
III.2
101
Trennung konvexer Mengen
V ⊂ {x: Re x (x) > α}
U ⊂ {x: Re x (x) < α}
{x: Re x (x) = α}
Das Trennungsproblem ist also folgendes: Existiert zu konvexen U und V ⊂ X ein Funktional x ∈ X , x = 0, mit sup x (x) ≤ inf x (x)
x∈U
bzw.
x∈V
sup Re x (x) ≤ inf Re x (x)
x∈U
x∈V
(K = R)
(K = C)?
Zur Erinnerung: U heißt konvex, wenn λx + (1 − λ)y ∈ U f¨ ur alle x, y ∈ U , 0 ≤ λ ≤ 1. Die folgende Definition ist rein algebraisch, wie der Konvexit¨atsbegriff auch. Definition III.2.1 Sei X ein Vektorraum und A ⊂ X eine Teilmenge mit {λa: |λ| ≤ 1, a ∈ A} ⊂ A. Das Minkowskifunktional pA : X → [0, ∞] wird durch " # x pA (x) := inf λ > 0: ∈ A λ definiert. A heißt absorbierend, falls pA (x) < ∞ f¨ ur alle x ∈ X. Ist z.B. A die offene Einheitskugel eines normierten Raums, so ist pA (x) = x . Lemma III.2.2 Sei X ein normierter Raum und U ⊂ X eine konvexe Teilmenge mit 0 ∈ int U . Dann gilt: (a) U ist absorbierend, genauer: Falls {x: x < ε} ⊂ U , so gilt pU (x) ≤ 1ε x . (b) pU ist sublinear.
102
III.
Der Satz von Hahn-Banach und seine Konsequenzen
(c) Ist U offen, so gilt U = p−1 U [0, 1) . Beweis. (a) ist klar. (b) pU (λx) = λpU (x) f¨ ur λ ≥ 0 ist auch klar. Zum Beweis der Ungleichung pU (x + y) ≤ pU (x) + pU (y) sei ε > 0 gegeben. W¨ahle λ, μ > 0 mit λ ≤ pU (x) + ε, μ ≤ pU (y) + ε, so daß λx ∈ U , μy ∈ U . Da U konvex ist, folgt λ x μ y x+y + = ∈ U, λ+μλ λ+μμ λ+μ folglich pU (x + y) ≤ λ + μ ≤ pU (x) + pU (y) + 2ε. Da ε > 0 beliebig war, folgt die Behauptung. (c) Falls pU (x) < 1 ist, existiert λ < 1 mit xλ ∈ U . Wegen 0 ∈ U folgt x = λ λx + (1 − λ)0 ∈ U . (Diese Richtung benutzt nicht die Offenheit von U .) Ist pU (x) ≥ 1, so ist λx ∈ / U f¨ ur alle λ < 1. Da U abgeschlossen ist, folgt nun x x = lim ∈ U. 2 λ→1 λ λ<1
Das folgende Lemma ist die Basis der Hahn-Banach-Trennungss¨atze. Lemma III.2.3 Ist X ein normierter Raum und V ⊂ X konvex und offen mit 0 ∈ / V , so existiert x ∈ X mit Re x (x) < 0
∀x ∈ V.
Im Beweis verwenden wir die suggestive Schreibweise A ± B := {a ± b: a ∈ A, b ∈ B} f¨ ur Teilmengen A, B ∈ X. Mit A und B ist dann auch A + B bzw. A − B konvex, wie unmittelbar aus der Definition folgt. Beweis. Betrachte zun¨ achst den Fall K = R. U V . 0
. y0 . x0
. 0
Sei x0 ∈ V beliebig. Setze y0 = −x0 und U = V − {x0 }. Dann ist U offen (warum?) und konvex, und es gilt y0 ∈ / U , 0 ∈ U . Betrachte das Minkowskifunktional pU zu U . Nach Lemma III.2.2 ist pU R-wertig, sublinear, und es gilt pU (y0 ) ≥ 1.
III.2
103
Trennung konvexer Mengen
Auf dem Unterraum Y = lin{y0 } definiere das Funktional y (ty0 ) = t pU (y0 )
(t ∈ R).
Es folgt y (y) ≤ pU (y)
∀y ∈ Y,
denn f¨ ur t ≤ 0 ist y (ty0 ) ≤ 0 ≤ pU (ty0 ), und f¨ ur t > 0 ist y (ty0 ) = pU (ty0 ). W¨ahle nun mit Satz III.1.2 eine lineare Fortsetzung x von y mit x ≤ pU . Lemma III.2.2(a) impliziert, daß x stetig ist, denn mit den dortigen Bezeichnungen gilt f¨ ur x ∈ X |x (x)| = max{x (x), x (−x)} ≤ max{pU (x), pU (−x)} ≤
1 x . ε
Insbesondere ist x (y0 ) = pU (y0 ) ≥ 1, und f¨ ur x ∈ V , das ja als x = u − y0 mit u ∈ U dargestellt werden kann, folgt x (x) = x (u) − x (y0 ) ≤ pU (u) − 1 < 0, letzteres nach Lemma III.2.2(c). Daher leistet x das Gew¨ unschte. Der Fall K = C folgt aus dem ersten Teil und Lemma III.1.3.
2
Auf die Offenheit von V kann in Lemma III.2.3 im allgemeinen nicht verzichtet werden. Als Beispiel betrachte den normierten Raum (d, . ∞ ) u ¨ber R. Setze V = (sn ) ∈ d\{0}: sN > 0 f¨ ur N := max{i: si = 0} . Es ist leicht zu sehen, daß V konvex ist, und es gilt 0 ∈ / V . Trotzdem existiert kein x ∈ d mit x |V < 0. Identifiziert man n¨amlich x mit einer Folge (tn ) ∈ 1 (Satz II.1.5 und Satz II.2.3), so k¨onnen zwei F¨alle eintreten. Ist tk ≥ 0 f¨ ur ein k, so gilt ek ∈ V , aber x (ek ) = tk ≥ 0. Sind hingegen alle tn < 0, so betrachte x = − tt21 e1 +e2 ∈ V ; es gilt dann x (x) = − tt21 t1 +t2 = 0. Theorem III.2.4 (Satz von Hahn-Banach; Trennungsversion I) Sei X ein normierter Raum, V1 , V2 ⊂ X seien konvex und V1 offen. Es gelte V1 ∩ V2 = ∅. Dann existiert x ∈ X mit Re x (v1 ) < Re x (v2 )
∀v1 ∈ V1 , v2 ∈ V2 .
Beweis. Wir f¨ uhren Theorem III.2.4 auf Lemma III.2.3 zur¨ uck. Sei V = V1 − V2 . Als Differenzmenge konvexer Mengen ist V konvex, und aus der Darstellung V = x∈V2 V1 − {x} erkennt man die Offenheit von V . Wegen V1 ∩ V2 = ∅ ist 0 ∈ / V . Nach Lemma III.2.3 existiert ein Funktional x ∈ X mit Re x (v1 − v2 ) < 0 f¨ ur alle vi ∈ Vi , also Re x (v1 ) < Re x (v2 ). 2
104
III.
Der Satz von Hahn-Banach und seine Konsequenzen
Theorem III.2.5 (Satz von Hahn-Banach; Trennungsversion II) Sei X ein normierter Raum, V ⊂ X sei abgeschlossen und konvex, und sei x∈ / V . Dann existiert x ∈ X mit Re x (x) < inf{Re x (v): v ∈ V }. Es existiert also ein ε > 0 mit Re x (x) < Re x (x) + ε ≤ Re x (v)
∀v ∈ V ;
man sagt, x k¨ onne von V strikt getrennt werden. Beweis. Da V abgeschlossen ist, existiert eine offene Nullumgebung U mit ({x} + U ) ∩ V = ∅; U kann und soll als Kugel mit dem Radius r gew¨ahlt werden. Nach Theorem III.2.4 existiert x ∈ X mit Re x (x + u) < Re x (v)
∀u ∈ U, v ∈ V.
Es ergibt sich nacheinander Re x (x) + Re x (u) < Re x (v)
∀u ∈ U, v ∈ V,
Re x (x) + Re x r ≤ Re x (v) ∀v ∈ V, Re x (x) + r x ≤ inf{Re x (v): v ∈ V }, was zu zeigen war.
2
¨ Nach Ubergang von x zu −x kann in den Trennungss¨atzen jeweils >“ ” erzielt werden (mit sup statt inf in Theorem III.2.5). Die Korollare III.1.6–III.1.9 k¨ onnen auch aus den Trennungss¨atzen hergeleitet werden (versuche es!). Eine weitere Anwendung folgt im n¨achsten Abschnitt in Satz III.3.8.
III.3
Schwache Konvergenz und Reflexivit¨ at
Sei X ein normierter Raum, X sein Dualraum und X := (X ) dessen Dualraum. Man nennt X den Bidualraum von X. Ist x ∈ X, so kann auf kanonische Weise eine Abbildung i(x): X → K, i(x) (x ) = x (x) definiert werden; man betrachtet also im Ausdruck x (x) diesmal x als variabel und h¨alt x fest. Es ist klar, daß i(x) linear ist. Auch die Stetigkeit von i(x) ist klar, sie folgt aus |x (x)| ≤ x x . Insbesondere ist i(x) ≤ x . Der Satz von Hahn-Banach liefert die weitaus sch¨arfere Aussage i(x) = x , siehe Korollar III.1.7. Da die so definierte Abbildung i: X → X offensichtlich linear ist, haben wir gezeigt:
III.3
Schwache Konvergenz und Reflexivit¨ at
105
Satz III.3.1 Die Abbildung i: X → X , i(x) (x ) = x (x), ist eine (im allgemeinen nicht surjektive) lineare Isometrie. Wir nennen i die kanonische Abbildung eines normierten Raums X in seinen Bidualraum; um die Abh¨ angigkeit von X zu betonen, schreibt man bisweilen auch iX . Auf diese Weise wird X mit einem Unterraum von X identifiziert. Mit X ist auch i(X) vollst¨ andig; also wird ein Banachraum X mit einem abgeschlossenen Unterraum von X identifiziert. Auf jeden Fall ist f¨ ur einen normierten Raum X der Unterraum i(X) im Banachraum X abgeschlossen und ergo vollst¨ andig. Daher gilt folgendes Korollar, das eine elegante Konstruktion der Vervollst¨ andigung eines normierten Raums liefert. Korollar III.3.2 Jeder normierte Raum ist isometrisch isomorph zu einem dichten Unterraum eines Banachraums. Beispiele. (a) Sei X = c0 . Nach Satz II.2.3 ist“ X = 1 , X = ∞ . Unter ” dieser Identifizierung gilt ic0 (x) = x, denn identifiziert man y = (tn) ∈ 1 mit dem Funktional x = (sn ) → ic0 (x) (y) = n sn tn , so sieht man y(x) = n sn tn = z(y), wo z ∈ ∞ das Funktional (tn ) → n sn tn darstellt, also z = x = ic0 (x). Insbesondere ist ic0 nicht surjektiv. (b) Nach Satz III.1.11 ist auch i 1 nicht surjektiv. (c) Wie unter (a) sieht man, daß f¨ ur 1 < p < ∞ die kanonische Einbettung i p mit dem identischen Operator Id: p → p u ¨ bereinstimmt und ¨ deswegen surjektiv ist. Die gleichen Uberlegungen gelten f¨ ur Lp (μ). Definition III.3.3 Ein Banachraum X heißt reflexiv, wenn iX surjektiv ist. (Nat¨ urlich hat ein unvollst¨ andiger Raum keine Chance, reflexiv zu sein.) F¨ ur reflexive R¨aume gilt nach Definition X ∼ = X , aber diese Bedingung ist nicht hinreichend: Der in Aufgabe I.4.8 beschriebene Banachraum J hat die Eigenschaft J ∼ = J , aber iJ ist nicht surjektiv. Dieses Ph¨anomen wurde 1950 von James entdeckt, zum Beweis siehe z.B. Lindenstrauss/Tzafriri [1977], S. 25. Aus den obigen Beispielen folgt: • p und Lp (μ) sind f¨ ur 1 < p < ∞ reflexiv. • c0 und 1 sind nicht reflexiv. • Ferner sind endlichdimensionale R¨ aume X trivialerweise reflexiv, da nach Beispiel II.1(b) dim X = dim X = dim X . Satz III.3.4 (a) Abgeschlossene Unterr¨ aume reflexiver R¨ aume sind reflexiv. (b) Ein Banachraum X ist genau dann reflexiv, wenn X reflexiv ist.
106
III.
Der Satz von Hahn-Banach und seine Konsequenzen
Beweis. (a) Sei X reflexiv und U ⊂ X ein abgeschlossener Unterraum. Sei nun u ∈ U . Dann liegt die Abbildung x → u (x |U ) in X , denn |u (x |U )| ≤ u x |U ≤ u x . Da X reflexiv ist, existiert x ∈ X mit x (x) = u (x |U )
∀x ∈ X .
(III.9)
W¨are x ∈ / U , so g¨ abe es nach Korollar III.1.8 ein Funktional x ∈ X mit x (x) = 1 und x |U = 0. Im Widerspruch zu (III.9) w¨ urde u (x |U ) = 0 folgen. Es muß also x ∈ U sein, und aus notationstechnischen Gr¨ unden werden wir u statt x schreiben. Es ist noch u (u ) = u (u)
∀u ∈ U
zu zeigen. In der Tat: Sei u ∈ U gegeben, und sei x ∈ X irgendeine Hahn-Banach-Fortsetzung gem¨ aß Theorem III.1.5. Dann gilt (III.9)
u (u ) = u (x |U ) = x (u) = u (u). Daher ist u = iU (u), und U ist reflexiv. (Wo ging die Abgeschlossenheit von U in diesem Beweis ein?) (b) Sei X reflexiv. Wir m¨ ussen zeigen, daß iX : X → X surjektiv ist. Sei also x ∈ X . Dann ist x : X → K, x → x iX (x) , linear und stetig, also x ∈ X . Wir beweisen jetzt, daß x = iX (x ) gilt. Da X reflexiv ist, hat jedes x ∈ X die Gestalt x = iX (x). Also gilt x (x ) = x iX (x) = x (x) = iX (x) (x ) = x (x ), was zu zeigen war. Sei X reflexiv. Nach dem gerade Gezeigten ist X reflexiv, nach Teil (a) auch der abgeschlossene Unterraum iX (X) und deshalb X. 2 Aus Satz III.3.4 folgt, daß auch ∞ , L1 [0, 1], L∞ [0, 1] und C[0, 1] nicht reflexiv sind (Aufgabe III.6.15). Wir notieren noch eine unmittelbare Konsequenz von Satz III.1.12. Korollar III.3.5 Ein reflexiver Raum ist genau dann separabel, wenn es sein Dualraum ist. Als n¨achstes wird der Begriff der schwachen Konvergenz einer Folge eingef¨ uhrt und anschließend insbesondere in reflexiven R¨aumen studiert. Definition III.3.6 Eine Folge (xn ) in einem normierten Raum X heißt schwach konvergent gegen x, wenn lim x (xn ) = x (x)
n→∞
gilt.
∀x ∈ X
III.3
107
Schwache Konvergenz und Reflexivit¨ at
Da X die Punkte von X trennt (Korollar III.1.6), ist der schwache Limes, falls u ¨ berhaupt existent, eindeutig bestimmt. Schreibweise: σ
xn → x
oder
σ- lim xn = x. n→∞
Selbstverst¨andlich sind konvergente Folgen schwach konvergent. Die Umkehrung gilt nicht: Betrachte etwa die Folge (en ) der Einheitsvektoren in p f¨ ur 1 < p < ∞ oder in c0 . Dann gilt σ- limn→∞ en = 0, aber en = 1. In Korollar IV.2.3 werden wir die nicht offensichtliche Tatsache beweisen, daß schwach konvergente Folgen notwendig beschr¨ankt sind. Beispiel. F¨ ur beschr¨ ankte Folgen (xn ) in C[0, 1] sind folgende Aussagen ¨aquivalent: (i) (xn ) konvergiert schwach gegen 0. (ii) (xn ) konvergiert punktweise gegen 0, d.h. limn→∞ xn (t) = 0 f¨ ur alle t ∈ [0, 1]. Beweis. (i) ⇒ (ii): Nach Voraussetzung gilt xn dμ → 0 f¨ ur alle μ ∈ M [0, 1]; vgl. Theorem II.2.5. Ist μ = δt ein Diracmaß, so zeigt das die punktweise Konvergenz. (ii) ⇒ (i): Das folgt unmittelbar aus dem Rieszschen Darstellungssatz II.2.5 und dem Lebesgueschen Konvergenzsatz A.3.2. 2 Im n¨achsten Satz wird eine Form der schwachen Kompaktheit“ be” wiesen. (Zur Erinnerung: Genau in endlichdimensionalen R¨aumen ist die abgeschlossene Einheitskugel kompakt; Satz I.2.7.) Theorem III.3.7 In einem reflexiven Raum X besitzt jede beschr¨ankte Folge eine schwach konvergente Teilfolge. Beweis. Wir nehmen zun¨ achst zus¨ atzlich an, daß X separabel ist; nach Korollar III.3.5 ist dann auch X separabel, etwa X = {x1 , x2 , . . .}. Sei nun (xn ) eine beschr¨ankte Folge in X. Mit Hilfe des Diagonalfolgentricks (siehe den Beweis des Satzes von Arzel` a-Ascoli II.3.4) findet man eine Teilfolge, genannt (yn ), so daß xi (yn ) n∈N f¨ ur alle i konvergiert. Als n¨achstes wird gezeigt, daß x (yn ) n∈N f¨ ur alle x ∈ X konvergiert. Sei ε > 0 und x ∈ X . W¨ ahle i ∈ N mit xi − x ≤ ε. Es folgt (mit M := supn xn ) |x (yn ) − x (ym )| ≤ 2M xi − x + |xi (yn ) − xi (ym )| ≤ (2M + 1)ε f¨ ur hinreichend große m und n. Daher ist x (yn ) n∈N eine Cauchyfolge und ergo konvergent. Es ist noch nicht gezeigt, daß (yn ) schwach konvergiert; es muß noch der Grenzwert angegeben werden. Betrachte dazu die Abbildung : x → lim x (yn ) n→∞
108
III.
Der Satz von Hahn-Banach und seine Konsequenzen
auf X , die nach dem ersten Beweisschritt wohldefiniert und linear ist. Wegen (M wie oben) |(x )| = lim x (yn ) = lim |x (yn )| ≤ x M n→∞
n→∞
liegt in X . Da X reflexiv ist, existiert x ∈ X mit = i(x), also tats¨achlich x (x) = lim x (yn ) n→∞
∀x ∈ X ,
und (yn ) konvergiert schwach gegen x. Im Fall eines beliebigen reflexiven Raumes betrachte wieder eine beschr¨ankte Folge (xn ) und Y := lin{x1 , x2 , . . .}. Dann ist Y separabel (Lemma I.2.9) und reflexiv (Satz III.3.4). Nach dem soeben Bewiesenen existieren eine Teilfolge (yn ) und y ∈ Y mit limn→∞ y (yn ) = y (y) f¨ ur alle y ∈ Y . Sei x ∈ X . Dann ist x |Y ∈ Y und deshalb auch limn→∞ x (yn ) = x (y). Das zeigt, daß (yn ) schwach gegen y konvergiert. 2 σ
Wir haben bereits bemerkt, daß f¨ ur die Einheitsvektoren in 2 en → 0 gilt. Die en liegen in der abgeschlossenen Einheitssph¨are S 2 , der schwache Limes jedoch nicht! Abgeschlossene Mengen brauchen also nicht schwach ” abgeschlossen“ zu sein. F¨ ur konvexe Mengen gilt jedoch der folgende Satz. Satz III.3.8 Sei X ein normierter Raum und V ⊂ X eine abgeschlossene konvexe Teilmenge. Ist dann (xn ) eine schwach konvergente Folge in V mit σ xn → x, so gilt x ∈ V . Beweis. W¨are x ∈ / V , so k¨ onnte x nach dem Satz von Hahn-Banach (Theorem III.2.5) strikt von V getrennt werden. Es existierten also x ∈ X und ε > 0 mit Re x (x) < Re x (x) + ε ≤ inf Re x (v). v∈V
Speziell w¨are Re x (xn − x) ≥ ε f¨ ur alle n, im Widerspruch zu x (x) = limn→∞ x (xn ). 2 σ
Korollar III.3.9 Gilt xn → x, so existiert eine Folge von Konvexkombinationen (n) N (n) (n) (n) yn = λi xi λi ≥ 0, =1 i λi i=1
mit yn − x → 0. Beweis. Wende Satz III.3.8 auf V = co{x1 , x2 , . . .} an.
2
Die Untersuchung der schwachen Konvergenz (sowie allgemeiner der schwachen Topologien) wird in Kapitel VIII fortgesetzt.
109
III.4 Adjungierte Operatoren
III.4
Adjungierte Operatoren
¨ Ahnlich wie einem normierten Raum mit dem Dualraum kanonisch ein zweiter normierter Raum zugeordnet wird, soll nun zu einem stetigen linearen Operator ein weiterer Operator assoziiert werden. Definition III.4.1 Seien X und Y normierte R¨aume und T ∈ L(X, Y ). Der adjungierte Operator T : Y → X ist durch (T y )(x) = y (T x) definiert. Man best¨atigt unmittelbar, daß wirklich T y ∈ X gilt und daß T ∈ L(Y , X ) ist. Beispiele. (a) Sei 1 ≤ p < ∞ und X = Y = p . Betrachte den Shiftoperator (genauer Linksshift) T : (s1 , s2 , . . .) → (s2 , s3 , . . .). Was ist T ? Wir identifizieren X und Y mit q gem¨aß Satz II.2.3, so daß q q T ein Operator auf ist. Mit der Identifizierung y = (tn ) ∈ , n¨amlich y (sn ) = n sn tn , k¨ onnen wir nun schreiben: y (T x) =
∞ n=1
sn+1 tn =
∞
sn t˜n
n=2
mit t˜n = tn−1 f¨ ur n ≥ 2. Daher ist T der Rechtsshift T : (t1 , t2 , . . .) → (0, t1 , t2 , . . .). Beachte im Fall p = 2, daß T T = Id, aber T T = Id. (b) Sei 1 ≤ p < ∞ und X = Y = Lp [0, 1]. Zu h ∈ L∞ [0, 1] betrachten wir den Multiplikationsoperator f → hf auf Lp [0, 1] und bezeichnen ihn, um die Abh¨angigkeit von p zu betonen, mit T(p) . Wieder identifizieren wir X mit dem Funktionenraum Lq [0, 1], 1p + 1q = 1, (Satz II.2.4). Dann gilt T(p) = T(q) ; in der Tat ist (T(p) g)(f )
1
=
(T(p) f )(t) g(t) dt = 0
=
1
f (t)g(t)h(t) dt 0
1
f (t)(T(q) g)(t) dt = (T(q) g)(f ) 0
f¨ ur f ∈ Lp [0, 1], g ∈ Lq [0, 1]. (c) Betrachte den Integraloperator T mit L2 -Kern k auf L2 [0, 1]: 1 (T f )(s) = k(s, t)f (t) dt (fast u ¨berall). 0
110
III.
Der Satz von Hahn-Banach und seine Konsequenzen
Wie unter (b) sieht man, daß T ein Integraloperator mit dem Kern k (s, t) = k(t, s) ist. (d) Zu einem normierten Raum X betrachte die kanonische Einbettung i: X → X . Was ist i ? Nach Definition gilt i : X → X , i (x ) (x) = x i(x) , d.h., i ist die Einschr¨ ankungsabbildung x → x |i(X) . In der amerikanischen Literatur ist die Bezeichnung T ∗ statt T vorherrschend; wir werden jedoch mit T ∗ den in Kapitel V zu diskutierenden Hilbertraum-Adjungierten bezeichnen. Satz III.4.2 (a) Die Abbildung T → T von L(X, Y ) nach L(Y , X ) ist linear und isometrisch, d.h. T = T . Sie ist im allgemeinen nicht surjektiv. (b) (ST ) = T S f¨ ur T ∈ L(X, Y ), S ∈ L(Y, Z). Beweis. (a) Die Linearit¨ at ist klar, und aus der Definition ergibt sich sofort T y = y ◦ T ≤ y T , also T ≤ T . Die Gleichheit ergibt sich aus dem Satz von Hahn-Banach: T =
sup T x =
x ≤1
=
sup
(Korollar III.1.7)
x ≤1 y ≤1
sup
y ≤1
=
sup |y (T x)| sup |y (T x)|
x ≤1
sup T y = T .
y ≤1
Ein Gegenbeispiel zur Surjektivit¨ at folgt im Anschluß an Lemma III.4.3. (b) Nachrechnen! 2 Lemma III.4.3 F¨ ur T ∈ L(X, Y ) gilt T ◦ iX = iY ◦ T. Beweis. Einfaches Nachrechnen: $ % $ % T iX (x) (y ) = iX (x) (T y ) = (T y )(x) = y (T x) = iY (T x) (y ).
2
Faßt man also X (bzw. Y ) als Unterraum von X (bzw. Y ) auf, so ist T eine Fortsetzung von T ∈ L(X, Y ), allerdings mit Werten in dem gr¨oßeren Raum Y .
III.4
111
Adjungierte Operatoren
X
T Y
iX ? X
iY T
? - Y
Des weiteren ergibt sich (unter Beibehaltung der Identifizierung X ⊂ X , Y ⊂ Y ): • S ∈ L(Y , X ) ist genau dann ein adjungierter Operator, wenn S (X) ⊂ Y gilt. Mit dieser Beobachtung l¨ aßt sich leicht ein Gegenbeispiel zur Surjektivit¨at in Satz III.4.2(a) finden. Sei X = Y = c0 , also (Satz II.2.3) ∞ X = Y = 1 ∞ 1 , X = Y = , und sei S ∈ L( ) durch (tn ) → ( n=1 tn , 0, 0, . . .) definiert. Man best¨ atigt f¨ ur (un ) ∈ ∞ , daß S (un ) = (u1 , u1 , u1 , . . .). Also gilt S (c0 ) ⊂ c0 , und S kann kein adjungierter Operator sein. Satz III.4.4 (Satz von Schauder) Seien X und Y Banachr¨aume und T : X → Y ein stetiger linearer Operator. Dann ist T genau dann kompakt, wenn T kompakt ist. Beweis. Sei T kompakt und (yn ) eine beschr¨ankte Folge in Y . Dann ist K := T (BX ) ⊂ Y ein kompakter metrischer Raum. Die Folge (fn ), fn := yn |K ∈ C(K), ist beschr¨ ankt und gleichgradig stetig; letzteres folgt aus |fn (y1 ) − fn (y2 )| ≤ sup yk y1 − y2 . k
Nach dem Satz von Arzel`a-Ascoli (Satz II.3.4) existiert eine gleichm¨aßig konvergente Teilfolge (fnk ). Es folgt T yn k − T yn l = sup |yn k (T x) − yn l (T x)| = fnk − fnl ∞ ; x∈BX
die letzte Gleichheit gilt, weil T (BX ) dicht in K liegt. Also konvergiert (T yn k )k∈N im Banachraum X , und T ist kompakt. Ist T kompakt, so ist nach dem ersten Beweisteil auch T kompakt, also auch T iX . Aber nach Lemma III.4.3 gilt T iX = iY T , daher ist der Operator iY T : X → Y kompakt. Da Y in Y abgeschlossen ist, ist auch T kompakt. 2 Wir verwenden nun adjungierte Operatoren, um die L¨osbarkeit von Operatorgleichungen zu diskutieren. F¨ ur einen Operator T : X → Y bezeichnen wir mit ker T := {x ∈ X: T x = 0} seinen Kern und mit ran T :=
112
III.
Der Satz von Hahn-Banach und seine Konsequenzen
{T x: x ∈ X} sein Bild. Die Annihilatoren U ⊥ und V⊥ sind in (III.4) und (III.5) eingef¨ uhrt worden. F¨ ur lineares T sind ker T und ran T stets Untervektorr¨aume; f¨ ur stetiges T ist ker T = T −1 ({0}) stets abgeschlossen. Hingegen braucht ran T nicht abgeschlossen zu sein; betrachte zum Beispiel die identische Abbildung von C[0, 1] nach L1 [0, 1]. Es gilt jedoch folgender Satz. Satz III.4.5
ran T = (ker T )⊥ .
Beweis. ⊂“: Sei y = T x ∈ ran T . Ist y ∈ ker T , so folgt ” y (y) = y (T x) = (T y )(x) = 0 wegen T y = 0. Daher ist ran T ⊂ (ker T )⊥ . Da (ker T )⊥ abgeschlossen ist, gilt ⊂“. ” ⊃“: Setze U := ran T ; dies ist ein abgeschlossener Unterraum von Y . ” Sei y ∈ / U ; wir werden dann y ∈ / (ker T )⊥ zeigen. Nach dem Satz von Hahn-Banach (genauer Korollar III.1.8) existiert y ∈ Y mit y |U = 0 und y (y) = 0. Insbesondere ist y (T x) = 0 f¨ ur alle x ∈ X, d.h. y ∈ ker T . Daher ist y ∈ / (ker T )⊥ , da ja sonst y (y) = 0 gelten m¨ ußte. 2 Korollar III.4.6 Sei T : X → Y ein stetiger Operator mit abgeschlossenem Bild. Dann ist die Operatorgleichung T x = y genau dann l¨ osbar, wenn die Implikation T y = 0
⇒
y (y) = 0
gilt. In Kapitel VI wird gezeigt, daß Operatoren der Gestalt T = Id − S mit S ∈ K(X) ein abgeschlossenes Bild haben (Satz VI.2.1). Der Vorzug des Korollars III.4.6 besteht darin, daß die Existenz einer L¨osung durch eine Bedingung an den Kern von T garantiert wird; und der Kern eines Operators ist h¨ aufig relativ leicht zu bestimmen. Insbesondere ist die obige Implikation stets erf¨ ullt, wenn T injektiv ist.
III.5
Differentiation nichtlinearer Abbildungen
In diesem Abschnitt soll ein kurzer Abstecher in die nichtlineare Funktionalanalysis unternommen werden. Zuerst besch¨aftigen wir uns mit dem Begriff der Ableitung. Wir werden im folgenden nur reelle Vektorr¨aume betrachten, und h steht f¨ ur eine (hinreichend kleine) reelle Zahl. Definition III.5.1 Seien X und Y normierte R¨aume, U ⊂ X offen und f : U → Y eine Abbildung.
III.5
113
Differentiation nichtlinearer Abbildungen
(a) f heißt Gˆ ateaux-differenzierbar bei x0 ∈ U , falls ein stetiger linearer Operator T ∈ L(X, Y ) mit lim
h→0
f (x0 + hv) − f (x0 ) = Tv h
∀v ∈ X
(III.10)
existiert. (Es ist klar, daß f (x0 + hv) f¨ ur betragsm¨aßig hinreichend kleine h ∈ R erkl¨ art ist, n¨ amlich f¨ ur |h| ≤ α/ v , falls {x: x−x0 ≤ α} ⊂ U .) (b) f heißt Fr´echet-differenzierbar bei x0 ∈ U , falls die Konvergenz in (III.10) gleichm¨ aßig bez¨ uglich v ∈ BX ist. (c) f heißt Gˆateaux- bzw. Fr´echet-differenzierbar auf U , falls f an jeder Stelle x0 ∈ U Gˆ ateaux- bzw. Fr´echet-differenzierbar ist. Der Grenzwert in (III.10) h¨ angt dann von x0 ab; wir schreiben Df (x0 ) statt T . Df heißt die Gˆ ateaux- bzw. Fr´echet-Ableitung von f . Beachte: Die Ableitung von f an einer Stelle ist ein linearer Operator, die Ableitung von f als Funktion ist eine operatorwertige Abbildung Df : U → L(X, Y ). Die Fr´echet-Ableitung reflektiert die Idee der linearen Approximation, wie das n¨achste Lemma zeigt. Lemma III.5.2 Mit den Bezeichnungen von Definition III.5.1 ist eine Abbildung f : U → Y genau dann Fr´echet-differenzierbar bei x0 ∈ U , falls ein stetiger linearer Operator T ∈ L(X, Y ) mit f (x0 + u) = f (x0 ) + T u + r(u), wo
lim
u →0
r(u) = 0, u
(III.11)
existiert. In diesem Fall ist Df (x0 ) = T . Ausf¨ uhrlich lautet die Grenzwertbeziehung in (III.11) ∀ε > 0 ∃δ > 0 u ≤ δ ⇒ r(u) ≤ ε u . Beweis. Gelte gleichm¨ aßige Konvergenz in (III.10). Setze dann r(u) = f (x0 + u) − f (x0 ) − T u; mit v = u/ u und u → 0 folgt u f (x + u v) − f (x ) r(u) f (x0 + u) − f (x0 ) 0 0 = −T = − T v → 0. u u u u Gelte umgekehrt (III.11). F¨ ur v ∈ BX und h → 0 hat man dann f (x0 + hv) − f (x0 ) = v f (x0 + hv) − f (x0 ) − T (hv) − T v h h v r(hv) = v → 0, hv und zwar gleichm¨ aßig in v ∈ BX .
2
114
III.
Der Satz von Hahn-Banach und seine Konsequenzen
In Worten ist die Aussage von (III.11), daß man f (x0 +u) durch f (x0 )+ Df (x0 )(u) mit einem Fehler ≤ ε u approximieren kann, wenn nur u ≤ δ ist. Sind X und Y endlichdimensional, ist die Fr´echet-Differenzierbarkeit also nichts anderes als die totale Differenzierbarkeit, w¨ahrend die Gˆ ateauxDifferenzierbarkeit mit der Existenz der Richtungsableitungen verwandt ist. (Manche Autoren verlangen nicht die Linearit¨at der Gˆ ateaux-Ableitung.) Wie im Endlichdimensionalen impliziert die Fr´echet-Differenzierbarkeit die Stetigkeit, die Gˆ ateaux-Differenzierbarkeit jedoch nicht (Beispiel?). Beispiele. (a) Ist f konstant, so ist klar, daß f Fr´echet-differenzierbar mit Ableitung Df (x0 ) = 0 f¨ ur alle x0 ist. (b) Ist f : X → Y eine lineare Abbildung, so ist f genau dann Gˆ ateauxdifferenzierbar, wenn f stetig ist, da ja f¨ ur lineares f f (x0 + hv) − f (x0 ) = f (v). h In diesem Fall ist f auch Fr´echet-differenzierbar mit Df (x0 ) = f f¨ ur alle x0 ; Df ist also eine konstante operatorwertige Abbildung. (c) Sei f : C[0, 1] → C[0, 1] durch f (x) = x2 definiert. Dann ist f (x0 + hv) − f (x0 ) x2 + 2hx0 v + h2 v2 − x20 = 0 = 2x0 v + hv 2 . h h Es folgt, daß der Grenzwert f¨ ur h → 0 gleichm¨aßig in v ∈ BC[0,1] existiert, und zwar ist lim
h→0
f (x0 + hv) − f (x0 ) = 2x0 v =: M2x0 v. h
f ist daher Fr´echet-differenzierbar mit Ableitung Df (x0 ) = M2x0 = Multiplikationsoperator mit 2x0 . (d) Die gleiche Rechnung funktioniert f¨ ur den Quadratoperator f : L2 → 1 2 L , f (x) = x ; f ist wohldefiniert nach der H¨ olderschen Ungleichung. Auch hier ist Df (x0 ) = M2x0 , aber der Multiplikationsoperator wird diesmal als Operator von L2 nach L1 aufgefaßt. (e) Sei f : Lp (μ) → R durch f (x) = Ω |x(t)|p dμ(t) definiert. Wir untersuchen die Differenzierbarkeit dieses nichtlinearen Funktionals im Fall 1 < p < ∞ und setzen wie u ¨blich 1/p + 1/q = 1. Sei x0 ∈ Lp (μ) fest. Zu p v ∈ L (μ) assoziiere die Hilfsfunktion ϕ(h) = f (x0 + hv); wir zeigen, daß ϕ differenzierbar ist. Differenziert man formal unter dem Integral, erh¨alt man d ϕ (h) = |x0 (t) + hv(t)|p dμ(t) dh Ω ∂ (∗) = |x0 (t) + hv(t)|p dμ(t) ∂h Ω = p|x0 (t) + hv(t)|p−1 sgn(x0 (t) + hv(t))v(t) dμ(t); Ω
III.5
Differentiation nichtlinearer Abbildungen
115
beachte, daß f¨ ur p > 1 die reelle Funktion s → |s|p differenzierbar ist mit der Ableitung s → p|s|p−1 sgn(s). Wenn man (∗) legitimieren kann, folgt die Gˆateaux-Differenzierbarkeit von f mit Df (x0 )(v) = ϕ (0) = p |x0 (t)|p−1 sgn(x0 (t))v(t) dμ(t); Ω
Df (x0 ) ist also das durch p|x0 | sgn(x0 ) ∈ Lq (μ) ∼ = (Lp (μ)) dargestellte lineare Funktional. Zur Begr¨ undung von (∗) verwenden wir Korollar A.3.3; f¨ ur |h| ≤ 1 hat man n¨amlich die Absch¨ atzung ∂ |x0 (t) + hv(t)|p = p|x0 (t) + hv(t)|p−1 |v(t)| ≤ p(|x0 (t)| + |v(t)|)p−1 |v(t)|; ∂h p−1
und das ist nach der H¨ olderschen Ungleichung eine L1 -Funktion, denn w := |x0 | + |v| ∈ Lp (μ) impliziert wegen (p − 1)q = p, daß wp−1 ∈ Lq (μ). f ist sogar Fr´echet-differenzierbar. Dazu sei (vn ) eine Folge in der Einheitskugel von Lp (μ) und hn → 0, dann ist |x0 (t) + hn vn (t)|p − |x0 (t)|p − p|x0 (t)|p−1 sgn(x0 (t))vn (t) dμ(t) → 0 hn Ω zu zeigen. Stellt man den Bruch an jeder Stelle t mit Hilfe des Mittelwertsatzes dar, lautet die Aufgabe, x0 (t) + ϑn (t)hn vn (t)p−1 sgn x0 (t) + ϑn (t)hn vn (t) − p Ω |x0 (t)|p−1 sgn(x0 (t)) vn (t) dμ(t) → 0 zu beweisen, wo 0 < ϑn (t) < 1. Nach der H¨olderschen Ungleichung kann dieser Ausdruck nach oben durch p |x0 + hn ϑn vn |p−1 sgn(x0 + hn ϑn vn ) − |x0 |p−1 sgn(x0 ) q vn p abgesch¨atzt werden; beachte, daß ϑ aufgrund seiner Konstruktion meßbar ist. Schreibe nun xn = x0 +hn ϑn vn und Φ(x) = |x|p−1 sgn(x) f¨ ur x ∈ Lp (μ). p Es gilt dann xn → x0 in der Norm von L (μ), und es muß Φ(xn ) → Φ(x0 ) in der Norm von Lq (μ) geschlossen werden. Eine Teilfolge (xnk ) konvergiert fast u ¨berall gegen x0 (vgl. z.B. Rudin [1986], Theorem 3.12); es folgt Φ(xnk ) → Φ(x0 ) fast u ¨berall sowie Φ(xnk ) q = xnk p → x0 p = Φ(x0 ) q , und die Integrationstheorie lehrt, daß dann Φ(xnk )−Φ(x0 ) q → 0 (siehe Rudin [1986], S. 73). Daraus ergibt sich die gew¨ unschte Konvergenz, und die Fr´echet-Differenzierbarkeit von f ist gezeigt. (f) Wir untersuchen die kanonische Norm des Folgenraums 1 auf Diffe∞ renzierbarkeit, betrachten also f (x0 ) = x0 1 = n=1 |sn | f¨ ur x0 = (sn ) ∈
116
III.
Der Satz von Hahn-Banach und seine Konsequenzen
1 . Sei ek der k-te Einheitsvektor in 1 . Die Frage, ob der Grenzwert in (III.10) f¨ ur v = ek existiert, l¨ auft dann darauf hinaus, lim
h→0
f (x0 + hek ) − f (x0 ) |sk + h| − |sk | = lim h→0 h h
zu bestimmen; und man erkennt, daß der Grenzwert genau dann existiert, wenn sk = 0 ist, und dann betr¨ agt er sgn sk . Daraus folgt als notwendige Bedingung f¨ ur die Differenzierbarkeit der Norm bei x0 = (sn ), daß alle sn = 0 sind. Diese Bedingung ist auch hinreichend f¨ ur die Gˆ ateauxDifferenzierbarkeit; als Kandidat f¨ ur die Ableitung kommt nach unseren Vor¨ uberlegungen n¨ amlich nur das durch (sgn sn ) ∈ ∞ ∼ = (1 ) dargestellte lineare Funktional in Frage, und in der Tat gilt f¨ ur jedes v = (tn ) ∈ 1 ∞ ∞ |sn + htn | − |sn | = (v) = (sgn sn )tn . h→0 h n=1 n=1
lim
Zun¨achst hat man n¨ amlich f¨ ur jedes n die Absch¨atzung |sn + htn | − |sn | − h(sgn sn )tn |1 + htn /sn | − 1 − htn /sn = ≤ 2|tn |, h h/|sn | da |1 + x| − (1 + x) = 0 f¨ ur x ≥ −1 und = −2 − 2x f¨ ur x < −1. W¨ahlt man nun zu ε > 0 eine nat¨ urliche Zahl N so, daß n>N |tn | ≤ ε ausf¨allt, erh¨alt man ∞ N ∞ |sn + htn | − |sn | − h(sgn sn )tn ≤ |...| + | . . . |, h n=1
n=1
n=N+1
und die erste, endliche Summe strebt mit h → 0 gegen 0, da alle sn = 0 sind, wohingegen die zweite Summe unabh¨ angig von h durch 2ε majorisiert wird. Andererseits ist die 1 -Norm nach Lemma III.5.2 an keiner Stelle Fr´echet-differenzierbar, da f¨ ur x0 = (sn ) und vk = −2sk ek x0 + vk 1 − x0 1 − (vk ) = 1. vk 1
Es ist h¨aufig wichtig zu wissen, ob die Norm eines normierten Raums differenzierbar ist. Dies kann folgendermaßen geometrisch charakterisiert werden.
III.5
117
Differentiation nichtlinearer Abbildungen
Satz III.5.3 Die Normfunktion f : x → x auf einem normierten Raum X ist bei x0 mit x0 = 1 genau dann Gˆ ateaux-differenzierbar, wenn es genau ein stetiges lineares Funktional x0 ∈ X mit x0 = x0 (x0 ) = 1 gibt; in diesem Fall ist Df (x0 ) = x0 . Die Normfunktion ist bei x0 genau dann Fr´echet-differenzierbar, wenn das obige x0 zus¨ atzlich die Eigenschaft xn ∈ X , xn ≤ 1, xn (x0 ) → 1
⇒
xn − x0 → 0
(III.12)
besitzt. Beweis. Sei zun¨achst f bei x0 Gˆ ateaux-differenzierbar mit Ableitung x0 ∈ X . Aus (III.10) ergibt sich dann sofort x0 (x0 ) = 1 und x0 ≤ 1 wegen der umgekehrten Dreiecksungleichung, also sogar x0 = 1. Sei x1 ein weiteres Funktional mit diesen Eigenschaften. F¨ ur v ∈ X und h > 0 gilt dann x0 (x0 + hv) + x1 (x0 − hv) − 2 h x0 + hv − 1 x0 − hv − 1 ≤ + , h h
x0 (v) − x1 (v) =
was mit h → 0 gegen x0 (v) + x0 (−v) = 0 konvergiert. Daher ist x0 (v) − x1 (v) ≤ 0 f¨ ur alle v ∈ X und deshalb (ersetze v durch −v) x0 = x1 . Ist f bei x0 Fr´echet-differenzierbar und ist (xn ) eine Folge wie in (III.12), gilt nach Lemma III.5.2 x0 (v) − xn (v) = x0 (x0 + v) + xn (x0 − v) − 1 − xn (x0 ) ≤ x0 + v − x0 + x0 − v − x0 + 1 − xn (x0 ) = x0 (v) + r(v) + x0 (−v) + r(−v) + 1 − xn (x0 ) = r(v) + r(−v) + 1 − xn (x0 ). Mit r(v) / v → 0 erh¨ alt man zu ε > 0 ein δ > 0, so daß r(v) ≤ ε v
∀ v ≤ δ.
W¨ahlt man n0 so, daß 1 − xn (x0 ) ≤ δε
∀n ≥ n0 ,
so folgt f¨ ur diese n und alle v = δ x0 (v) − xn (v) ≤ 3δε und deshalb xn − x0 =
1 sup x (δv) − xn (δv) ≤ 3ε δ v =1 0
∀n ≥ n0 .
118
III.
Der Satz von Hahn-Banach und seine Konsequenzen
Wir beweisen jetzt die Umkehrungen. Sei x0 = 1. Als erstes beobachten wir, daß f¨ ur jedes v ∈ X die einseitigen Grenzwerte x0 + hv − 1 h x + hv − 1 0 p− (v) = lim − h h→0 p+ (v) =
lim
h→0+
existieren. Die auf R \ {0} erkl¨ arte Funktion ϕ: h → ( x0 + hv − 1)/h ist n¨amlich monoton wachsend: F¨ ur 0 < h1 < h2 zeigt eine Anwendung der Dreiecksungleichung, daß h1 h1 x0 + h1 v − 1 = (x0 + h2 v) + 1 − x0 −1 h2 h2 h1 h1 ≤ x0 + h2 v + 1 − −1 h2 h2 x0 + h2 v − 1 = h1 , h2 weswegen ϕ auf (0, ∞) monoton w¨ achst. Analog sieht man die Monotonie auf (−∞, 0), und schließlich gilt ϕ(−h) ≤ ϕ(h) f¨ ur positive h, denn diese Ungleichung ist zu 2 ≤ x0 + hv + x0 − hv a quivalent, was nach der Drei¨ ecksungleichung richtig ist. Damit ist die Existenz der obigen Grenzwerte gezeigt, und außerdem sieht man, daß p− (v) ≤ p+ (v)
∀v ∈ X.
Ferner ergibt sich – wieder aus der Dreiecksungleichung –, daß p+ sublinear ist; beachte noch p+ (v) = −p− (−v) nach Definition dieser Gr¨oßen. Um die Gˆateaux-Differenzierbarkeit der Norm bei x0 zu beweisen, muß man nur p− = p+ zeigen. Sei dazu v0 ∈ X fest gew¨ahlt. F¨ ur p− (v0 ) ≤ α ≤ + p (v0 ) definiert λv0 → λα ein lineares Funktional auf lin{v0 }, das dort von p+ majorisiert wird; beachte (−v0 ) = −α ≤ −p− (v0 ) = p+ (−v0 ). Mit dem Satz von Hahn-Banach (Satz III.1.2) existiert ein lineares Funktional x ≤ p+ , das fortsetzt. Dieses ist stetig mit Norm ≤ 1, da nach der umgekehrten Dreiecksungleichung x (v) ≤ p+ (v) ≤ |p+ (v)| ≤ v Schließlich ist
∀v ∈ X.
−x (x0 ) = x (−x0 ) ≤ p+ (−x0 ) = −1,
so daß sich aus x ≤ 1 auch x (x0 ) = 1 ergibt. Wenn es nur ein Funktional mit diesen Eigenschaften gibt, muß notwendig p− (v0 ) = α = p+ (v0 )
III.5
119
Differentiation nichtlinearer Abbildungen
gewesen sein; da v0 beliebig war, ist p− = p+ und damit die Gˆ ateaux-Differenzierbarkeit bei x0 gezeigt. Wir kommen zum Schluß zur Fr´echet-Differenzierbarkeit unter der Bedingung (III.12). Sei (vn ) eine Nullfolge; es ist nach Lemma III.5.2 x0 + vn − 1 − x0 (vn ) →0 vn zu zeigen. Da x0 (x0 ) = 1 = x0 , ist der Ausdruck ≥ 0. W¨ahle gem¨aß Korollar III.1.6 Funktionale xn ∈ BX mit xn (x0 + vn ) = x0 + vn . Da dann wegen vn → 0 xn (x0 ) = xn (x0 + vn ) − xn (vn ) = x0 + vn − xn (vn ) → 1, folgt nach Voraussetzung (III.12) xn − x0 → 0 und deshalb x0 + vn − 1 − x0 (vn ) vn (xn − x0 )(vn ) + xn (x0 ) − 1 = vn (xn − x0 )(vn ) ≤ ≤ xn − x0 → 0, vn
0 ≤
2
was zu beweisen war. '
A $ A A A A A A A
&
%
A @A A @ A@ A @ A A A
Hier sind die Einheitskugeln zweier Normen sowie einige St¨ utzhyper” ebenen“ {x: x0 (x) = 1 = x0 } skizziert; die linke Norm ist an jeder Stelle = 0 Gˆateaux-differenzierbar (eine solche Norm nennt man glatt ), die rechte nicht, wie man aus Satz III.5.3 schließt; man kann regelrecht f¨ uhlen, daß sie nicht glatt ist. Zur Dualit¨ at von Konvexit¨ ats- und Glattheitseigenschaften vgl. Aufgabe III.6.31. Beispiel. (g) Die kanonische Norm von L2 (μ) ist an jeder Stelle x0 = 0 Fr´echet-differenzierbar. Wegen der positiven Homogenit¨at der Norm reicht es,
120
III.
Der Satz von Hahn-Banach und seine Konsequenzen
den Fall x0 2 = 1 zu betrachten. Nach Satz II.2.4 kann jedes Funktional durch ein normgleiches y0 gem¨ aß y0 (x) = xy0 dμ dargestellt werden. Das durch x0 dargestellte Funktional hat dann die Eigenschaft x0 (x0 ) = 1 = x0 , und aus Aufgabe I.4.13 folgt, daß es bzgl. dieser Eigenschaften eindeutig bestimmt ist. Seien nun xn ∈ L2 (μ) mit xn 2 ≤ 1, xn (x0 ) → 1. Dann folgt 2 xn − x0 2 = (x2n − 2xn x0 + x20 ) dμ ≤ 1 − 2xn (x0 ) + 1 → 0. Ω
Nach Satz III.5.3 ist die L2 -Norm an der Stelle x0 Fr´echet-differenzierbar mit Ableitung x0 . Wer sich mit dem abstrakten Begriff des Hilbertraums aus Kapitel V bereits vertraut gemacht hat, sollte mit allgemeinen Hilbertraummethoden beweisen, daß jede Hilbertraumnorm außer bei 0 Fr´echet-differenzierbar ist; vgl. Aufgabe V.6.29. Auch die Norm von Lp (μ) ist im Fall 1 < p < ∞ an jeder von 0 verschiedenen Stelle Fr´echet-differenzierbar, siehe Aufgabe III.6.32. Als n¨achstes werden einige S¨ atze u ¨ber differenzierbare Abbildungen zusammengestellt. Satz III.5.4 Seien X, Y, Z normierte R¨ aume und U ⊂ X sowie V ⊂ Y offene Teilmengen. (a) Sind f, g: U → Y Gˆ ateaux- bzw. Fr´echet-differenzierbar bei x0 ∈ U , so sind es auch f + g sowie λf (λ ∈ R) mit Ableitungen D(f + g)(x0 ) = Df (x0 ) + Dg(x0 ),
D(λf )(x0 ) = λ Df (x0 ).
(b) (Mittelwertsatz) Sei f : U → Y Gˆ ateaux-differenzierbar; das Intervall“ I = {x0 + ” λu: 0 ≤ λ ≤ 1} liege in der offenen Menge U . Dann gilt f (x0 + u) − f (x0 ) ≤ sup Df (ξ) u . ξ∈I
(c) Ist f : U → Y Gˆ ateaux-differenzierbar und ist Df : U → L(X, Y ) stetig, so ist f sogar Fr´echet-differenzierbar; man sagt, f sei stetig differenzierbar, und schreibt f ∈ C 1 (U, Y ). (d) (Kettenregel) Seien f : U → Y und g: V → Z, wo f (U ) ⊂ V , Fr´echet-differenzierbar bei x0 ∈ U bzw. f (x0 ) ∈ V ; dann ist g◦f Fr´echet-differenzierbar bei x0 mit Ableitung D(g ◦ f )(x0 ) = Dg(f (x0 )) ◦ Df (x0 ).
III.5
Differentiation nichtlinearer Abbildungen
121
(e) (Satz u ¨ ber implizite Funktionen) Es seien X, Y und Z vollst¨ andig und F : X ⊕Y ⊃ U ×V → Z stetig differenzierbar mit F (x0 , y0 ) = 0. Die Ableitung der Funktion y → F (x0 , y) bei y0 sei ein Isomorphismus von Y auf Z. Dann existieren Umgebungen U0 von x0 und V0 von y0 , so daß f¨ ur jedes x ∈ U0 die Gleichung F (x, y) = 0 genau eine L¨ osung y =: f (x) ∈ V0 besitzt, und die so definierte Funktion f : U0 → Y ist stetig differenzierbar. Beweis. (a), (d) und (e) beweist man genauso wie im Endlichdimensionalen; im Satz u ¨ber implizite Funktionen wird die Vollst¨andigkeit ben¨otigt, da man im Beweis den Banachschen Fixpunktsatz anwendet. III.1.6 ein lineares Funktional y ∈ BY mit (b) W¨ahle mit Korollar y f (x0 + u) − f (x0 ) = f (x0 + u) − f (x0 ) , und wende den klassischen Mittelwertsatz auf die Hilfsfunktion ϕ: [0, 1] → R, ϕ(λ) = y f (x0 + λu) − f (x0 ) mit der Ableitung ϕ (λ) = y Df (x0 + λu)(u) an. Das liefert sofort die gew¨ unschte Absch¨ atzung. (c) Seien x0 ∈ U und ε > 0. Dann existiert ein δ > 0 mit Df (x0 + y) − Df (x0 ) ≤ ε f¨ ur y ≤ δ. Seien nun u ≤ δ und y ∈ BY so, daß y f (x0 + u) − f (x0 ) − Df (x0 )(u) = f (x0 + u) − f (x0 ) − Df (x0 )(u) . Wendet man den Mittelwertsatz auf die gleiche Hilfsfunktion wie unter (b) an, folgt f¨ ur ein ϑ ∈ (0, 1) f (x0 + u) − f (x0 ) − Df (x0 )(u) = y f (x0 + u) − f (x0 ) − Df (x0 )(u) ≤ y Df (x0 + ϑu)(u) − Df (x0 )(u) ≤ ε u . Lemma III.5.2 zeigt die Fr´echet-Differenzierbarkeit bei x0 .
2
Mit der Kettenregel l¨ aßt sich die Fr´echet-Differenzierbarkeit der Norm von L2 (μ) erneut begr¨ unden: Setze f : L2 (μ) → L1 (μ), x → x2 , g: L1 (μ) → R, y→ √y dμ, h: (0, ∞) → R, z → z. Ist 0 = x0 ∈ L2 (μ), so ist . 2 = h ◦ g ◦ f bei x0 Fr´echet-differenzierbar mit Ableitung $ % x → Dh g(f (x0 )) ◦ Dg(f (x0 )) ◦ Df (x0 ) (x) x0 x dμ 1 & = · g ◦ M2x0 (x) = 1/2 ; 2 g(f (x0 )) x20 dμ benutze Beispiel (b) und (d) und die dortigen Bezeichnungen.
122
III.
Der Satz von Hahn-Banach und seine Konsequenzen
Man kann auch h¨ ohere Ableitungen einf¨ uhren. Ist f : X ⊃ U → Y Fr´echet-differenzierbar, so ist Df eine Funktion von U nach L(X, Y ). Falls diese Fr´echet-differenzierbar ist, nennt man f zweimal Fr´echet-differenzierbar; die zweite Ableitung ist eine Abbildung D 2 f : U → L(X, L(X, Y )). Dieser monstr¨ose normierte Raum l¨ aßt sich als ein Raum bilinearer Abbildungen darstellen. Ist n¨ amlich T ∈ L(X, L(X, Y )), kann man eine Abbildung φT : X × X → Y, φT (x1 , x2 ) = (T x1 )(x2 ) assoziieren. Diese ist bilinear (also linear in x1 , wenn man x2 festh¨alt, und umgekehrt) und beschr¨ ankt in dem Sinn, daß φT :=
sup
x1 ,x2 ∈BX
φT (x1 , x2 ) < ∞
ist. Auf diese Weise wird der Raum L(2) (X, Y ) der beschr¨ankten bilinearen Abbildungen von X × X nach Y zu einem normierten Raum, der zu L(X, L(X, Y )) isometrisch isomorph ist; denn offensichtlich ist φT = T , und eine gegebene beschr¨ ankte bilineare Abbildung φ kann durch den gem¨aß (T x1 )(x2 ) = φ(x1 , x2 ) wohldefinierten Operator T ∈ L(X, L(X, Y )) als φ = φT dargestellt werden. Mit dieser Identifikation operiert die zweite Ableitung als D 2 f : U → L(2) (X, Y ). Induktiv k¨onnen jetzt h¨ ohere Ableitungen als Abbildungen D n f : U → L(n) (X, Y ) ∼ = L(X, L(n−1) (X, Y )) definiert werden; Dn f (x0 ) ist also eine n-fach multilineare Abbildung. Damit kann man den Satz von Taylor formulieren, der wie im Endlichdimensionalen auf den reellen Fall zur¨ uckgef¨ uhrt werden kann; nur die Notation ist etwas komplizierter. Satz III.5.5 (Satz von Taylor) Sei f : X ⊃ U → R (n + 1)-mal Fr´echet-differenzierbar; es liege {x0 + λv: 0 ≤ λ ≤ 1} in der offenen Menge U . Dann existiert ein ϑ ∈ (0, 1) mit D2 f (x0 ) (v, v) + · · · 2 Dn f (x0 ) D n+1 f (x0 + ϑv) + (v, . . . , v) + (v, . . . , v, v). n! (n + 1)!
f (x0 + v) = f (x0 ) + Df (x0 )(v) +
III.5
Differentiation nichtlinearer Abbildungen
123
Das klassische Anwendungsfeld der Differentialrechnung ist das L¨osen von Extremwertaufgaben. Das ist im unendlichdimensionalen Fall nicht anders; das Teilgebiet der Mathematik, das sich dem Studium von Extremalproblemen auf unendlichdimensionalen R¨aumen widmet, wird traditionell Variationsrechnung genannt. Ein fundamentales Problem, das sich im Endlichdimensionalen nicht stellt, ist das der fehlenden Kompaktheit abgeschlossener beschr¨ ankter Mengen; daher ist die Existenz einer L¨osung eines unendlichdimensionalen Extremalproblems eine wesentlich heiklere Sache. Als Beispiel betrachte das Problem, das Minimum des Funktionals
1 2 (tx(t)) ˙ dt
f (x) = −1
auf der Menge A = {x ∈ C 1 [−1, 1]: x(−1) = −1, x(1) = 1} zu bestimmen; x˙ bezeichnet die Ableitung dx/dt. Es ist klar, daß f durch 0 nach unten beschr¨ankt ist, und mit Hilfe der Funktionen xε (t) = arctan(t/ε)/ arctan(1/ε) erkennt man inf x∈A f (x) = 0. Da f (x) = 0 nur f¨ ur konstante Funktionen gilt und diese in A nicht zugelassen sind, hat das Minimumproblem keine L¨osung. Es ist jedoch leicht, eine notwendige Bedingung f¨ ur das Vorliegen eines Extremums aufzustellen. Satz III.5.6 Ist U ⊂ X offen, f : U → R Gˆ ateaux-differenzierbar und besitzt f bei x0 ∈ U ein lokales Extremum, so gilt notwendig Df (x0 ) = 0. Beweis. Sei v ∈ X. Auf einem hinreichend kleinen Intervall (−α, α) ist die Hilfsfunktion ϕ(h) = f (x0 + hv) definiert und differenzierbar. Sie besitzt nach Voraussetzung bei h = 0 ein lokales Extremum, also folgt ϕ (0) = 0, was Df (x0 )(v) = 0 impliziert. Da v beliebig war, folgt die Behauptung. 2 In der klassischen Variationsrechnung studiert man die notwendige Bedingung Df (x0 ) = 0, die in vielen Anwendungen in eine Differentialgleichung transformiert werden kann, die Euler-Gleichung oder Euler-LagrangeGleichung des Problems genannt wird. Dazu ein einfaches Beispiel. Was ist die k¨ urzeste Verbindung zwischen den Punkten mit den Koordinaten (0, 0) und (1, 0) in der Ebene? Die Antwort lautet nat¨ urlich: die Gerade. Um dieses Problem mit Hilfe von Satz III.5.6 anzugehen, definieren wir das Funktional 1& f (x) = 1 + x(t) ˙ 2 dt 0
auf dem Banachraum C01 [0, 1] = {x ∈ C 1 [0, 1]: x(0) = x(1) = 0}; dieses Integral gibt bekanntlich die Bogenl¨ ange der Kurve {(t, x(t)): 0 ≤ t ≤ 1} an. Notwendig f¨ ur eine Minimalstelle ist Df (x0 ) = 0, das heißt hier (verwende
124
III.
Der Satz von Hahn-Banach und seine Konsequenzen
Beispiel (c) und die Kettenregel) 1 x˙ 0 (t)v(t) ˙ Df (x0 )(v) = dt = 0 ˙ 0 (t)2 )1/2 0 (1 + x
∀v ∈ C01 [0, 1].
Falls x0 sogar zweimal stetig differenzierbar ist, kann man partiell integrieren und erh¨alt, da die Randterme verschwinden, 1 x ¨0 (t) v(t) dt = 0 ∀v ∈ C01 [0, 1]. (1 + x ˙ 0 (t)2 )3/2 0 Nun gilt f¨ ur stetige Funktionen w 1 w(t)v(t) dt = 0 ∀v ∈ C01 [0, 1]
⇒
w=0
0
(Beweis?); diese obwohl einfache, doch ¨ außerst n¨ utzliche Aussage wird Fundamentallemma der Variationsrechnung genannt. Hier ergibt sich als EulerGleichung des Variationsproblems deshalb x ¨0 = 0. Mit anderen Worten: Die einzigen zweimal stetig differenzierbaren Kandidaten f¨ ur unser Minimalproblem sind die Geraden. In diesem speziellen Beispiel ist die notwendige ¨ Bedingung auch hinreichend. Uber allgemeine hinreichende Bedingungen f¨ ur Extrema kann man z.B. in den Monographien von Troutman [1996], Buttazzo/Giaquinta/Hildebrandt [1998] und Jost/Li-Jost [1999] nachlesen; vgl. jedoch Aufgabe III.6.35. F¨ ur Extremalprobleme, die mit mehrdimensionalen Integralen zusammenh¨angen, f¨ uhrt der Weg u ¨ber die Euler-Gleichung auf partielle Differentialgleichungen. Insbesondere hier ist ein anderer Zugang, die sog. direkte Methode der Variationsrechnung, n¨ utzlich. Die Idee, eine Minimalstelle f¨ ur ein Funktional f zu finden, ist einfach: W¨ahle eine Folge (xn ) mit f (xn ) → inf f . Unter geeigneten Voraussetzungen existiert eine Teilfolge (xnk ), die in einem ad¨ aquaten Sinn gegen einen Punkt x0 konvergiert. Wenn auch (f (xn )) gegen f (x0 ) konvergiert, hat man die Existenz einer Minimalstelle bewiesen. Um die Funktionale, f¨ ur die dieses Programm funktioniert, zu beschreiben, f¨ uhren wir einige Begriffe ein. Definition III.5.7 Sei f : X → R ein Funktional auf einem normierten Raum X. (a) f heißt [schwach] halbstetig von unten, falls stets xn → x [schwach], f (xn ) ≤ c
⇒
f (x) ≤ c.
(b) f heißt koerzitiv, falls xn → ∞
⇒
f (xn ) → ∞.
III.5
125
Differentiation nichtlinearer Abbildungen
(c) f heißt konvex, falls f (λx + (1 − λ)y) ≤ λf (x) + (1 − λ)f (y)
∀x, y ∈ X, 0 ≤ λ ≤ 1.
Die so definierte Halbstetigkeit m¨ ußte eigentlich Folgenhalbstetigkeit“ ” genannt werden; im Fall der Normkonvergenz ist sie zur topologischen Definition aus Lemma B.2.5 ¨ aquivalent. Manchmal ist es sinnvoll, diese Definitionen auf Funktionale mit Werten in R∪{∞} auszudehnen; die folgenden Resultate gelten dann entsprechend. Satz III.5.8 Sei X ein reflexiver Banachraum, und sei f : X → R schwach halbstetig von unten und koerzitiv. Dann existiert eine Stelle x0 mit f (x0 ) = inf x∈X f (x). Beweis. Sei m = inf x∈X f (x), der Fall m = −∞ ist an dieser Stelle (noch) nicht ausgeschlossen. W¨ ahle eine Folge (xn ) in X mit f (xn ) → m. Da f koerzitiv ist, ist (xn ) beschr¨ ankt, und da X reflexiv ist, besitzt (xn ) nach Theorem III.3.7 eine schwach konvergente Teilfolge, etwa xnk → x0 schwach. Wir zeigen jetzt f (x0 ) = m (> −∞). Sei c > m. Dann existiert ein k0 ∈ N mit f (xnk ) ≤ c f¨ ur k ≥ k0 . Da f schwach halbstetig von unten ist, folgt auch f (x0 ) ≤ c. Weil c > m beliebig war, muß m ≤ f (x0 ) ≤ m sein. 2 Das n¨achste Lemma liefert ein hinreichendes Kriterium f¨ ur die schwache Halbstetigkeit von unten. Lemma III.5.9 Ist X ein normierter Raum und f : X → R konvex und stetig oder bloß halbstetig von unten, so ist f schwach halbstetig von unten. Beweis. Die Voraussetzung impliziert, daß f¨ ur jedes c die Menge {x: f (x) ≤ c} konvex und abgeschlossen ist. Die Behauptung folgt dann sofort aus Satz III.3.8. 2 Beispiel. Sei F : R2 → R stetig. Es m¨ ogen a ∈ L1 (R), b ∈ R und p > 1 mit p F (t, u) ≥ a(t) + b|u| existieren. Dann definiert f (x) = F (t, x(t)) dt R
ein Funktional auf Lp (R) mit Werten in R ∪ {∞}, da f (x) ≥ a(t) dt + b x pp; R
diese Absch¨atzung zeigt auch die Koerzitivit¨at von f . F¨ ur alle t sei u → F (t, u) eine konvexe Funktion; dann ist auch f ein konvexes Funktional,
126
III.
Der Satz von Hahn-Banach und seine Konsequenzen
wie man durch Einsetzen unmittelbar erkennt. Zeigen wir noch die Halbstetigkeit von f : Sei (xn ) eine Folge in Lp (R) mit xn → x in Lp (R) und ¨ f (xn ) ≤ c. Nach Ubergang zu einer Teilfolge d¨ urfen wir annehmen, daß (xn ) auch fast u ¨berall gegen x konvergiert1. Wegen der Stetigkeit von F folgt F (t, xn (t)) → F (t, x(t)) fast u ¨berall und weiter nach dem Lemma von Fatou2 f (x) ≤ lim inf f (xn ) ≤ c. Nach Lemma III.5.9 und Satz III.5.8 besitzt f eine Minimalstelle in Lp (R).
III.6
Aufgaben
Aufgabe III.6.1 Gib die Details des Beweises von Satz III.1.10. Aufgabe III.6.2 Sei X ein normierter Raum und U ein abgeschlossener Unterraum. Sei x ∈ X \ U . Dann existiert ein Funktional x ∈ U ⊥ mit x ≤ 1 und x (x) = d(x, U). (Hinweis: Benutze Satz III.1.10!) Aufgabe III.6.3 Sei X ein normierter Raum und K ⊂ X konvex. (a) Die Mengen K und int K sind ebenfalls konvex. (b) Ist int K = ∅, so gilt K = int K. Aufgabe III.6.4 Seien K und L konvexe absorbierende Teilmengen des normierten Raums X, und seien pK und pL die zugeh¨ origen Minkowski-Funktionale. (a) Zeige pK ≥ pL , falls K ⊂ L. (b) pK ist genau dann stetig, wenn 0 ∈ int K gilt. −1 (c) Wenn pK stetig ist, gelten K = p−1 K ([0, 1]) und int K = pK ([0, 1)). (d) Gilt zus¨ atzlich λK ⊂ K, falls |λ| ≤ 1 (d.h. ist K kreisf¨ ormig“), so ist ” pK eine Halbnorm, und pK ist eine Norm dann und nur dann, wenn K keinen nichttrivialen Unterraum von X enth¨ alt. (e) Gilt f¨ ur eine konvexe Menge K K absorbierend ⇒ 0 ∈ int K“? ” Aufgabe III.6.5 (Banachlimiten) Wir betrachten K = R. Eine lineare Abbildung : ∞ → R heißt Banachlimes, falls ∞ • (T ist, der x = x) = (x) f¨ur alle x∞ ∈ , wo T der Shiftoperator x(1), x(2), x(3), . . . ∈ auf x(2), x(3), x(4), . . . abbildet.
• Falls x(n) ≥ 0 f¨ ur alle n ∈ N, so gilt (x) ≥ 0. • (1) = 1, wo 1 = (1, 1, 1, . . .). (a) Sei ein Banachlimes. Dann gelten: • ∈ (∞ ) und = 1,
• lim inf x(n) ≤ (x) ≤ lim sup x(n) f¨ ur x = x(n) ∈ ∞ , speziell (x) = limn→∞ x(n) f¨ ur x ∈ c, 1 Siehe 2 Siehe
z.B. Theorem 3.12 in Rudin [1986]. z.B. Lemma 1.28 in Rudin [1986].
III.6
127
Aufgaben
• ist nicht multiplikativ, d.h., es gilt nicht (x · y) = (x) (y) f¨ ur alle x, y ∈ ∞ . (b) Es existiert ein Banachlimes . (Hinweis: Variante I: Betrachte p(x) = supn x(n), zeige dann 0 ≤ p|U , wo U = {T x − x: x ∈ ∞ }, und nsetze mit Hahn-Banach fort. Variante II: Betrachte p(x) = lim sup n1 x(j). Zeige die Sublinearit¨ at von p und j=1 beachte (Analysis I!) p|c = lim. Setze mit Hahn-Banach fort.) Aufgabe III.6.6 Sei ∈ (∞ ) . Zeige, daß eindeutig zweier Funktio als Summe ∞ nale 1 und 2 geschrieben werden kann, wo 1 (sn ) = n=1 sn tn und 2 |c0 = 0 ist. Zeige ferner, daß = 1 + 2 gilt. Schließe, daß jedes Funktional auf c0 eindeutig zu einem normgleichen Funktional auf ∞ fortgesetzt werden kann. (Hinweise: (1) Betrachte (en ). (2) W¨ ahle x, y ∈ ∞ mit x∞ = y∞ = 1, so daß 1 (x) ≈ 1 und 2 (y) ≈ 2 . Sei z die Folge mit z(n) = x(n) f¨ ur n ≤ N und z(n) = y(n) f¨ ur n > N. F¨ ur passendes N versuche (z) ≈ 1 + 2 zu zeigen.) Aufgabe III.6.7 Sei X strikt konvex (Aufgabe I.4.13). Dann gilt Eindeutigkeit im Fortsetzungssatz von Hahn-Banach. Aufgabe III.6.8 (Rieszscher Darstellungssatz f¨ ur (C[0, 1]) ) Sei ∈ (C[0, 1]) und L eine Hahn-Banach-Fortsetzung zu einem Funktional L ∈ (∞ [0, 1]) . Setze yt = χ[0,t] ∈ ∞ [0, 1]. Zeige C[0, 1] ⊂ lin{yt : t ∈ [0, 1]}. Setze g(t) = L(yt ) und zeige, daß g von beschr¨ ankter Variation ist. Beweise schließlich die Darstellung des Funktionals als Stieltjes-Integral
(x) =
1
∀x ∈ C[0, 1].
x(t) dg(t) 0
(Zum Begriff des Stieltjes-Integrals siehe z.B. Rudin [1976], S. 122.) Dieser Beweis stammt von Banach. Aufgabe III.6.9 Seien V1 und V2 konvexe Teilmengen des normierten Raums X, und es gelte int V1 = ∅, int V1 ∩ V2 = ∅. Dann existiert x ∈ X , x = 0, mit Re x (v1 ) ≤ Re x (v2 )
∀v1 ∈ V1 , v2 ∈ V2 .
Aufgabe III.6.10 Seien K und L disjunkte abgeschlossene konvexe Teilmengen eines normierten Raums X, zus¨ atzlich sei eine von beiden kompakt. Zeige, daß ein stetiges Funktional x ∈ X existiert, f¨ ur das gilt sup Re x (x) < inf Re x (x). x∈K
x∈L
(Es gibt Beispiele, die zeigen, daß diese Aussage ohne die vorausgesetzte Kompaktheit falsch ist, selbst, wenn man nur ≤ fordert.) Aufgabe III.6.11 Seien U und V disjunkte abgeschlossene beschr¨ ankte konvexe Teilmengen eines reflexiven Banachraums X. Dann k¨ onnen U und V strikt getrennt werden. (Tip: Zeige zuerst inf{u − v: u ∈ U, v ∈ V } > 0; dazu beachte Theorem III.3.7 und Satz III.3.8.)
128
III.
Der Satz von Hahn-Banach und seine Konsequenzen
Aufgabe III.6.12 Sei K eine konvexe Menge. Eine Funktion f : K → R heißt konvex (bzw. affin bzw. konkav ), wenn f (λx + (1 − λ)y) ≤ λf (x) + (1 − λ)f (y) f¨ ur alle x, y ∈ K, 0 ≤ λ ≤ 1 (bzw. = bzw. ≥). Sei nun f : Rn → R eine konkave stetige Funktion sowie g: Rn → R eine konvexe stetige Funktion mit f ≤ g. Dann existiert eine affine stetige Funktion h: Rn → R mit f ≤ h ≤ g. (Hinweis: Betrachte die Teilmengen {(x, r): x ∈ Rn , r < f (x)} und {(x, r): x ∈ Rn , r > g(x)} von Rn+1 .) Aufgabe III.6.13 Sei P[0, 1] (bzw. Pn [0, 1]) der Vektorraum aller Polynomfunktionen (h¨ ochstens n-ten Grades) auf [0,1]. Existiert ein signiertes bzw. komplexes Borelmaß μ auf [0,1] mit 1 (a) p (0) = 0 p dμ f¨ ur alle p ∈ P[0, 1]? (b) p (0) =
1 0
p dμ f¨ ur alle p ∈ Pn [0, 1]?
Aufgabe III.6.14 Ist X ein Banachraum und A ⊂ X kompakt, so auch co A. (Hinweis: Satz B.1.7.) Aufgabe III.6.15 Keiner der R¨ aume ∞ , C[0, 1], L1 [0, 1], L∞ [0, 1] ist reflexiv. Aufgabe III.6.16 Seien X und Y Banachr¨ aume. σ σ (a) xn → x, T ∈ L(X, Y ) ⇒ T xn → T x. σ (b) xn → x, T ∈ K(X, Y ) ⇒ T xn → T x. (Hinweis: Benutze hier im Vorgriff die in Kapitel IV bewiesene Tatsache, daß (xn ) beschr¨ ankt ist.) (c) X sei reflexiv, und T ∈ L(X, Y ) erf¨ ulle σ
xn → x
⇒
T xn → T x.
Dann ist T kompakt. Aufgabe III.6.17 Zeige, daß eine beschr¨ ankte Folge (xn ) in einem normierten Raum X genau dann gegen x ∈ X schwach konvergiert, wenn es eine Teilmenge D ⊂ X mit lin D = X und limn→∞ x (xn ) = x (x) f¨ ur alle x ∈ D gibt. Aufgabe III.6.18 Sei X ein separabler normierter Raum und (xn ) eine beschr¨ ankte Folge in X . Dann existieren eine Teilfolge (xnk ) und ein Funktional x ∈ X mit limk→∞ xnk (x) = x (x) f¨ ur alle x ∈ X. Kann man auf die Separabilit¨ at verzichten? (Tip: Imitiere den Beweis von Theorem III.3.7.) Aufgabe III.6.19 Sei X ein reflexiver Banachraum, und sei K ⊂ X abgeschlossen, konvex und nicht leer. Dann gibt es zu jedem x ∈ X eine beste Approxima” tion“ in K, d.h. ein y ∈ K mit x − y = d(x, K) := inf x − z. z∈K
Aufgabe III.6.20 Sei 1 < p < ∞ und en der n-te Einheitsvektor in p . σ (a) Es gilt en → 0.
III.6
129
Aufgaben
(b) Aus Korollar III.3.9 folgt die Existenz einer Folge (yn ) von Konvexkombinationen der en mit yn → 0. Gib solche Konvexkombinationen explizit an! Aufgabe III.6.21 (a) Ist T : X → Y ein [isometrischer] Isomorphismus zwischen normierten R¨ aumen, so ist T : Y → X ebenfalls ein [isometrischer] Isomorphismus. Sind X und Y Banachr¨ aume, so gilt auch die Umkehrung. (b) Ist ein normierter Raum Y isomorph zu einem reflexiven Banachraum X, so ist Y ebenfalls ein reflexiver Banachraum. Aufgabe III.6.22 Seien X und Y Banachr¨ aume, und sei U ⊂ X ein abgeschlossener Unterraum. Sei S ∈ L(U, Y ). (a) Im Fall Y = ∞ gestattet S eine normerhaltende Fortsetzung zu einem Operator auf X, d.h., es existiert T ∈ L(X, Y ) mit T |U = S und S = T . (Hinweis: Wende den Satz von Hahn-Banach auf die Funktionale n : u → (Su)(n) an!) (b) Falls U = Y = c0 , X = c und S = Idc0 , so hat jede Fortsetzung T von S auf X eine Norm ≥ 2. Um das zu beweisen, zeige zuerst f¨ ur M = {x ∈ c0 : |x(n) − 1| ≤ 1 ∀n ∈ N}, daß der Radius jeder abgeschlossenen Kugel in c0 , die M enth¨ alt, mindestens 2 ist. (c) Falls U = Y = {(x, y, z) ∈ R3 : x + y + z = 0}, X = ∞ (3) und S = IdU , dann hat jede Fortsetzung T von S auf X eine Norm ≥ 4/3. (Hinweis: Die Matrix von T muß die Gestalt
'
a a−1 a−1 b b+1 b −a − b −a − b −a − b + 1
(
haben. Nun benutze Aufgabe II.5.8.) Aufgabe III.6.23 Sei X ein separabler Banachraum. Dann existiert ein isometrischer linearer Operator von X nach ∞ . Jeder separable Banachraum ist also isometrisch isomorph zu einem abgeschlossenen Teilraum von ∞ . (Tip: Sei {xn : n ∈ N} dicht in X. Definiere den gesuchten Operator durch ¨ x → xn (x) f¨ ur passend zu w¨ ahlende Funktionale xn ∈ X . Ubrigens ist jeder separable Banachraum sogar zu einem abgeschlossenen Teilraum von C[0, 1] isometrisch isomorph. Dieser Satz von Banach und Mazur ist aber weit schwieriger zu zeigen.) Aufgabe III.6.24 Gib die Details des Beispiels III.4(c). Aufgabe III.6.25 (Momentenoperator) Zu f ∈ L1 [0, 1] betrachte die Folge der Momente (fn# )n≥0 , wo
fn#
1
f (t)tn dt.
= 0
Zeige, daß die Abbildung T : f → (fn# ) ein stetiger linearer Operator von L1 [0, 1] nach c0 ist. Gib die Darstellung des adjungierten Operators T : 1 → L∞ [0, 1].
130
III.
Der Satz von Hahn-Banach und seine Konsequenzen
Aufgabe III.6.26 Untersuche die Abbildung F : L2 [0, 1] → L2 [0, 1], (F (x))(t) = sin x(t), auf Gˆ ateaux- bzw. Fr´echet-Differenzierbarkeit an der Stelle x = 0. Aufgabe III.6.27 Sei U = {x ∈ C[0, 1]: x(t) = 0 ∀t}. Untersuche die Abbildung f : U → C[0, 1], f (x) = 1/x, auf Differenzierbarkeit. Aufgabe III.6.28 An welchen Stellen ist die Supremumsnorm auf C[0, 1] bzw. c0 Gˆ ateaux- oder Fr´echet-differenzierbar? Aufgabe III.6.29 Seien f, g: U → Y Gˆ ateaux-differenzierbar und φ: Y ×Y → Z bilinear und beschr¨ ankt. Bestimme die Ableitung von x → φ(f (x), g(x)). Aufgabe III.6.30 Finde Beispiele f¨ ur (a) eine Abbildung f : X → Y , die an einer Stelle Gˆ ateaux-differenzierbar, aber nicht stetig ist; (b) eine Abbildung f : X → Y , die an einer Stelle x0 Gˆ ateaux-differenzierbar ist, und eine Abbildung g: Y → Z, die bei f (x0 ) Gˆ ateaux-differenzierbar ist, so daß g ◦ f : X → Z bei x0 nicht Gˆ ateaux-differenzierbar ist; (c) eine Funktion f : R2 → R, f¨ ur die an einer Stelle s¨ amtliche Richtungsableitungen existieren, die dort aber nicht Gˆ ateaux-differenzierbar ist. Aufgabe III.6.31 Eine Norm heißt lokal gleichm¨ aßig konvex, wenn es zu jedem x mit x = 1 und jedem ε > 0 ein δ = δ(x, ε) > 0 gibt, so daß
x + y > 1−δ
y ≤ 1,
2
⇒
x − y < ε.
(a) Ist die Norm von X lokal gleichm¨ aßig konvex, so ist die Norm von X an jeder Stelle x0 = 0 Fr´echet-differenzierbar. (b) Ist die Norm von X strikt konvex (siehe Aufgabe I.4.13), so ist die Norm von X an jeder Stelle x0 = 0 Gˆ ateaux-differenzierbar. (c) Ist die Norm von X an jeder Stelle x0 = 0 Gˆ ateaux-differenzierbar, so ist die Norm von X strikt konvex. [Bemerkung: Die entsprechende Umkehrung von (a) gilt nicht.] Aufgabe III.6.32 Zeige, daß die kanonische Norm von Lp (μ) an jeder Stelle x0 = 0 Fr´echet-differenzierbar ist, (a) mit Hilfe von Beispiel III.5(e), (b) im Fall p ≥ 2 mittels der Aufgaben III.6.31 und I.4.18. Aufgabe III.6.33 Wenn die Norm eines normierten Raums X auf X \ {0} Fr´echet-differenzierbar ist, ist die Ableitung dort stetig. Aufgabe III.6.34 Sei f : X → R ein Funktional auf einem normierten Raum. Der Epigraph von f ist die Teilmenge epi(f ) := {(x, t): f (x) ≤ t} von X ⊕ R. (a) f ist genau dann konvex, wenn epi(f ) konvex ist. (b) f ist genau dann halbstetig von unten, wenn epi(f ) abgeschlossen ist. Aufgabe III.6.35 Sei f : X → R ein Gˆ ateaux-differenzierbares konvexes Funktional und x0 ∈ X mit Df (x0 ) = 0. Dann besitzt f bei x0 ein globales Minimum. Aufgabe III.6.36 Bestimme das Minimum des Funktionals f (x) = et x(t) dt auf C[0, 1].
1 0
x(t)4 +
III.7 Bemerkungen und Ausblicke
III.7
131
Bemerkungen und Ausblicke
Der Satz von Hahn-Banach ist eines der fundamentalen Prinzipien der Funktionalanalysis; wie Pedersen ([1979], S. 25) in a¨hnlichem Zusammenhang sagt, it can be used every day, and twice on Sundays“. Theorem III.1.5 ” wurde unabh¨angig voneinander von Hahn (J. f. reine u. angew. Math. 157 (1927) 214–229) und Banach (Studia Math. 1 (1929) 211–216) f¨ ur reelle R¨aume bewiesen, und kurze Zeit darauf bemerkte Banach (Studia Math. 1 (1929) 223–239) die allgemeinere Version des Satzes III.1.2. Es dauerte jedoch vier weitere Jahre, bis Mazur (Studia Math. 4 (1933) 70–84) diese geschmeidigere Variante erfolgreich anwendete, um damit die Trennungss¨atze zu beweisen. Die komplexen Hahn-Banach-S¨atze wurden unabh¨angig voneinander von Soukhomlinov (Mat. Sbornik 3 (1938) 353–358) und jenseits des Atlantiks von Murray (Trans. Amer. Math. Soc. 39 (1936) 83–100; f¨ ur Lp ) und Bohnenblust/Sobczyk (Bull. Amer. Math. Soc. 44 (1938) 91–93) gefunden. Satz III.1.13, den wir auf simple Weise aus dem Hahn-Banachschen Fortsetzungssatz abgeleitet haben, ist historisch als Katalysator bei der Entwicklung des Satzes von Hahn-Banach anzusehen. Er beinhaltet die L¨osung des allgemeinen Momentenproblems. Diese Bezeichnung stammt aus der Wahrscheinlichkeitstheorie, wo man die Zahlen tn dμ(t) die Momente der Verteilung μ nennt; die Wahrscheinlichkeitstheorie hat sie ihrerseits aus der Mechanik entlehnt. F¨ ur X = C[a, b] und xn (t) = tn gibt also (III.8) eine notwendige und hinreichende Bedingung f¨ ur die Existenz eines signierten (oder komplexen) Maßes mit vorgeschriebenen Momenten. ´ In dieser Form stammt Satz III.1.13 von F. Riesz (Ann. Sci. Ecole Norm. Sup. 28 (1911) 33–62); ein anderer Beweis stammt von Helly (Sitzungsber. math. nat. Kl. Akad. Wiss. Wien 121 (1912) 265–297). Ein weiterer Vorg¨anger von Satz III.1.13 ist der Fischer-Rieszsche Satz V.4.14, der besagt, ur X = L2 und orthonormale“ Elemente xi die Bedingung 2daß f¨ ” |ci | < ∞ notwendig und hinreichend f¨ ur (III.8) ist. Riesz bewies III.1.13 p p auch f¨ ur L [0, 1] und (Math. Ann. 69 (1910) 449–497; Les syst`emes ” d’´equations lin´eaires a` une infinit´e d’inconnues“, Paris 1913); er argumentierte, ohne eine Verbindung zu einem Fortsetzungsproblem zu ziehen, mit Hilfe des Theorems III.3.7, das er f¨ ur diese R¨ aume aufstellte. Diese Verbindung zieht Helly in seiner bereits in Kapitel I genannten Arbeit (Monatshefte f. Math. u. Physik 31 (1921) 60–91), und er geht einen entscheidenden Schritt weiter, indem er Satz III.1.13 f¨ ur abstrakte Folgenr¨aume herleitet, bevor Hahn darauf aufbauend 1927 die endg¨ ultige Version findet und den Fortsetzungssatz III.1.5 beweist. Hahn f¨ uhrt in seiner Arbeit explizit den Begriff des Dualraums (unter der Bezeichnung polarer Raum“) und des ” reflexiven Raums ( regul¨ arer Raum“) ein; zur Erinnerung sei noch einmal ” erw¨ahnt, daß sich erst 1922 der abstrakte Begriff des normierten Raums heraussch¨alte, siehe Abschnitt I.5. Banach formuliert Satz III.1.13 in seiner Arbeit ebenfalls explizit.
132
III.
Der Satz von Hahn-Banach und seine Konsequenzen
Auch in der Lemberger Schule gab es Vorarbeiten zum Hahn-Banachschen Satz. Banach selbst bewies 1923 einen speziellen Fortsetzungssatz, um ein maßtheoretisches Problem (siehe Fußnote auf S. 509) zu l¨osen, und Mazur 1927 einen weiteren, um die Existenz von Banachlimiten (Aufgabe III.6.5) zu zeigen, die also eigentlich Mazurlimiten heißen sollten. Sowohl Hahn als auch Banach benutzten in ihren Beweisen f¨ ur den Fortsetzungssatz die Methode der transfiniten Induktion; diese Technik ist heute in der Analysis etwas aus der Mode gekommen und wird durch das Zornsche Lemma ersetzt. Ironischerweise verwendet man mit dem Zornschen Lemma dasselbe Beweismittel, um im Satz von Hahn-Banach allgemein die Existenz stetiger Funktionale auf normierten R¨aumen zu zeigen, das man – via Existenz einer Vektorraumbasis – heranziehen muß, um die Existenz unstetiger Funktionale zu begr¨ unden, siehe Aufgabe II.5.2. Im Lauf der Zeit sind verschiedene alternative Beweise f¨ ur den Satz von Hahn-Banach gefunden worden; z.B. f¨ uhrt ihn Kakutani auf einen von ihm gezeigten Fixpunktsatz zur¨ uck (Proc. Acad. Japan 14 (1938) 242–245). Eine Beweisvariante des Satzes von Hahn-Banach in der Version der linearen Algebra (Satz III.1.2) verwendet das Zornsche Lemma auf andere Weise als im Text. Man benutzt es, um zu zeigen, daß auf jedem reellen Vektorraum X unterhalb eines sublinearen Funktionals p stets ein lineares Funktional existiert, n¨amlich ein minimales Element der Menge {q: X → R: q ≤ p, q sublinear}. (Der Beweis, daß solch ein minimales Element linear ist, ist nicht ganz offensichtlich.) Um den Beweis von Satz III.1.2 zu erbringen, assoziiert man zu dem dort gegebenen sublinearen Funktional p zun¨achst das Hilfsfunktional p˜ auf X gem¨ aß p˜(x) = inf{p(x − u) + (u): u ∈ U }, zeigt, daß p˜ sublinear ist, und betrachtet dann eine lineare Abbildung L ≤ p˜ gem¨aß dem ersten Schritt. Das ist die gesuchte Fortsetzung. Eine Reihe von Anwendungen, unter anderem auf Differentialgleichungen, in der Approximationstheorie und der Maßtheorie, wird bei Heuser ¨ [1992], S. 272ff., und Mukherjea/Pothoven [1986], S. 24, genannt. Ein Ubersichtsartikel von Buskes zum Satz von Hahn-Banach ist in Dissertationes Math. 327 (1993) erschienen, und ein weiterer von Narici in M.V. Velasco et al. (Hg.), Advanced Courses of Mathematical Analysis 2, World Scientific 2007, S. 87–122. Es sei außerdem auf die Arbeiten von K¨onig und seinen Sch¨ ulern hingewiesen; als erste Orientierung diene sein Artikel On some ” basic theorems in convex analysis“ in B. Korte (Hg.), Modern Applied Mathematics – Optimization and Operations Research, North-Holland 1982, S. 107–144. Wie bereits erw¨ ahnt, stammen die Hahn-Banach-Trennungss¨atze von Mazur; einige der S¨ atze in Abschnitt III.2 sind auf Eidelheit (Studia Math. 6 (1936) 104–111) zur¨ uckgehende Varianten, die eine im Schottischen Buch gestellte Frage beantworten (Problem 64, Mauldin [1981], S. 136). Wichtiger noch als f¨ ur normierte R¨ aume sind die Trennungss¨atze f¨ ur die in Kapitel VIII studierten lokalkonvexen R¨ aume. Dieudonn´e hat Beispiele f¨ ur
III.7
Bemerkungen und Ausblicke
133
disjunkte abgeschlossene konvexe beschr¨ ankte Teilmengen von 1 , die nicht durch ein stetiges Funktional getrennt werden k¨onnen, konstruiert, was nat¨ urlich viel st¨arker als das auf S. 103 gegebene Beispiel ist; selbstverst¨andlich kann keine der beiden Mengen einen inneren Punkt haben. Tats¨achlich gibt es solche Gegenbeispiele in allen nichtreflexiven Banachr¨aumen (siehe K¨othe [1966], S. 325), w¨ ahrend in reflexiven R¨aumen die Trennung disjunkter abgeschlossener konvexer beschr¨ ankter Teilmengen immer m¨oglich ist (Aufgabe III.6.11). Der Begriff der schwachen Konvergenz geh¨orte von Anfang an zu den Eckpfeilern der Funktionalanalysis, ist sie doch ein Hilfsmittel, die fehlende Kompaktheit der Kugeln im Unendlichdimensionalen zu kompensieren. Hilbert (f¨ ur 2 ) (Nachr. Kgl. Gesellsch. Wiss. G¨ ottingen, Math.-phys. Kl. (1906) 157–227) und Riesz (f¨ ur p und Lp ; a.a.O.) haben die Aussage von Theorem III.3.7 als erste bewiesen und auf Integralgleichungen angewandt; die allgemeine Fassung stammt von Banach. In der Tat werden reflexive R¨aume durch die in Theorem III.3.7 ausgesprochenen Eigenschaft charakterisiert ; dies ist ein Satz von Eberlein, siehe Abschnitt VIII.7. Satz III.3.8 wurde von Mazur bewiesen. Der Folgenraum 1 zeigt ein merkw¨ urdiges Ph¨anomen, was die schwache Konvergenz angeht, n¨ amlich: • (Lemma von Schur) In 1 ist jede schwach konvergente Folge konvergent. Der Beweis kann mit der Methode des gleitenden Buckels gef¨ uhrt werden (Banach [1932], S. 137). In Kapitel VIII werden wir noch einmal von einem allgemeineren Standpunkt, n¨ amlich dem der schwachen Topologie, auf die schwache Konvergenz zur¨ uckkommen. Dort (Satz VIII.6.11) wird dann ein anderer Beweis f¨ ur das Schursche Lemma gef¨ uhrt, der auf dem Baireschen Kategoriensatz aus Abschnitt IV.1 beruht. Hilbert nannte solche Operatoren auf 2 vollstetig, die schwach konvergente Folgen auf konvergente Folgen abbilden. Aufgabe III.6.16 zeigt, daß diese Operatoren auf reflexiven Banachr¨ aumen genau die kompakten sind, und Riesz (Acta Math. 41 (1918) 71–98) nennt in der Folge unsere kompakten Operatoren vollstetig. Das Lemma von Schur impliziert aber, daß jeder stetige Operator auf 1 vollstetig im Hilbertschen Sinn ist. Achtung: Manche Autoren benutzen auch heute noch die Begriffe vollstetig“ und ” kompakt“ synonym, ohne die obige Differenzierung zu treffen. ” Adjungierte Operatoren wurden auf Lp zuerst von Riesz (wem sonst?) betrachtet, die allgemeine Definition konnte sinnvoll erst mit der Erkenntnis getroffen werden, daß der Dualraum eines normierten Raums hinreichend reichhaltig ist, also nachdem der Satz von Hahn-Banach bewiesen wurde. Diese allgemeine Definition stammt von Banach (Studia Math. 1 (1929) 223–239). Schauder (Studia Math. 2 (1930) 185–196) bewies Satz III.4.4 und
134
III.
Der Satz von Hahn-Banach und seine Konsequenzen
wandte ihn in der Potentialtheorie an; wir kommen in Kapitel VI darauf zur¨ uck. Im Zusammenhang mit Aufgabe III.6.21 ist bemerkenswert, daß es sehr wohl nicht isomorphe Banachr¨ aume gibt, deren Dualr¨aume isomorph sind; der Isomorphismus der Dualr¨ aume kann dann nat¨ urlich kein adjungierter Operator sein. Prominentestes Beispiel ist das Paar 1 , L1 [0, 1]. Daß diese R¨aume nicht isomorph sind, l¨ aßt sich aus dem Lemma von Schur oder folgendem auch f¨ ur sich interessanten Ergebnis ableiten (siehe K¨othe [1979], S. 208, oder Fabian/Zizler, Proc. Amer. Math. Soc. 131 (2003) 3693–3694): • (Satz von Pitt) F¨ ur 1 ≤ q < p < ∞ ist jeder stetige Operator von p nach q kompakt; ferner ist jeder stetige Operator von c0 nach q kompakt. Speziell ist jeder stetige Operator von 2 nach 1 kompakt, aber (T x)(t) = ∞ n=1 x(n) sin 2πnt definiert einen nicht kompakten stetigen Operator von 2 nach L1 [0, 1]. Andererseits hat Pelczy´ nski das u ¨berraschende Resultat bewiesen, daß ∞ und L∞ [0, 1] isomorph sind (Lindenstrauss/Tzafriri [1977], S. 111). Auf der isometrischen Seite sei das wesentlich einfachere Gegen¨ beispiel c ∼ c0 , erw¨ ahnt. Ubrigens impliziert der Satz = (c0 ) , obwohl c ∼ = p q von Pitt die Reflexivit¨ at von L( , ) f¨ ur 1 < q < p < ∞; Kaltons Arbeit Math. Ann. 208 (1974) 267–278 enth¨ alt dieses Resultat als Spezialfall. In Aufgabe III.6.22(a) war die Operatorversion des Satzes von HahnBanach f¨ ur Y = ∞ zu zeigen. Solch ein Satz gilt ebenfalls f¨ ur Y = L∞ (μ), μ σ-endlich, und kann f¨ ur K = R nach Nachbin (Trans. Amer. Math. Soc. 68 (1950) 28–46) so gezeigt werden. Wie im skalaren Fall besteht der Kern des Beweises darin, um eine einzige Dimension fortzusetzen. Sei also X = U ⊕ R{x0 }. Wir m¨ ussen y0 ∈ Y finden, so daß der Operator T (u + λx0 ) = Su + λy0 dieselbe Norm wie S besitzt, die o.E. = 1 sei. Der Vektor y0 muß also Su + λy0 ≤ u + λx0 f¨ ur alle u ∈ U , λ ∈ R erf¨ ullen, was man unschwer als ¨aquivalent zu Su − y0 ≤ u − x0
∀u ∈ U
(III.13)
erkennt. (III.13) verlangt daher, daß y0 in allen abgeschlossenen Kugeln Ku mit Mittelpunkt Su und Radius u − x0 liegt; solch ein y0 kann genau dann gefunden werden, wenn u∈U Ku = ∅ ist. Um den Beweis abzuschließen, gen¨ ugt es nun zu bemerken, daß (1) je zwei der Ku sich schneiden, da S = 1, und (2) dem Raum L∞ die Eigenschaft zukommt, daß jedes System abgeschlossener Kugeln, die sich paarweise schneiden, einen gemeinsamen Punkt besitzt. Zum Nachweis von (2) benutzt Nachbin den in Kapitel VIII bewiesenen Satz von Alaoglu. F¨ ur komplexe Skalare ist das Argument nicht so einfach; Weiteres zu diesem Themenkreis findet man ¨ bei Lacey [1974], §11, und in einem Ubersichtsartikel von Fuchssteiner und ¨ Horv´ath (Jahrbuch Uberblicke Mathematik 1979, S. 107–122).
III.7
Bemerkungen und Ausblicke
135
Der in Abschnitt III.5 pr¨ asentierte Zugang zur Differentiation in normierten R¨aumen ist vom heutigen Standpunkt aus sehr nat¨ urlich; vor ca. 100 Jahren war diese Sichtweise freilich revolution¨ar. Volterra schlug 1887 zum ersten Mal die Idee vor, z.B. die Bogenl¨ange als Funktion der Kurve aufzufassen, er sprach in diesem Zusammenhang von Funktionen, die ” von anderen Funktionen abh¨ angen“; der Begriff des Funktionals taucht erst 1903 bei Hadamard auf. Die abstrakte Differentialrechnung wurde um 1910 von Fr´echet vorgestellt und in zwei postum ver¨offentlichten fundamentalen Arbeiten (1919, 1922) von Gˆateaux, der im I. Weltkrieg get¨otet wurde, weiterentwickelt. Daß die elementaren“ Resultate u ¨ber differenzierbare Funk” tionen nichts weiter als ein Abziehbild der Beweise aus der Analysisvorlesung sind, liegt nat¨ urlich daran, daß wir heute den richtigen“ Begriff der ” Differenzierbarkeit f¨ ur Funktionen von Rn nach Rm besitzen. Aber die Idee der linearen Approximation als Definition der Differenzierbarkeit, selbst f¨ ur Funktionen von R2 nach R, verdankt man ebenfalls erst Fr´echet (1911) sowie unabh¨angig von ihm Young (1909), und von dort zur Differentialrechnung in normierten R¨ aumen ist es nur ein vergleichsweise kleiner Schritt. Zum Satz u ¨ber implizite Funktionen ist noch anzumerken, daß der Version im Text harte“ S¨ atze u uberstehen, die auf ¨ ber implizite Funktionen gegen¨ ” raffinierteren Absch¨ atzungen beruhen und viel schw¨achere Voraussetzungen haben; siehe etwa Schwartz [1969]. Detaillierte historische Kommentare fin¨ den sich in Nasheds Ubersichtsartikel Differentiability and related proper” ties of nonlinear operators“, in L. B. Rall, Nonlinear Functional Analysis and Applications (Academic Press 1971), S. 103–309. Die geometrische Charakterisierung der Fr´echet-Differenzierbarkeit der Norm in Satz III.5.3 stammt von Shmulyan (1940), der außerdem unter Zusatzvoraussetzungen bewies, daß ein Banachraum, dessen Dualraumnorm Fr´echet-differenzierbar ist3 , notwendig reflexiv sein muß. Tats¨achlich gilt diese Aussage ohne weitere Zusatzvoraussetzungen, wie in den f¨ unfziger Jahren gezeigt werden konnte. Umgekehrt zeigte Troyanski (Studia Math. 37 (1971) 173–180), daß jeder reflexive Banachraum eine ¨aquivalente Fr´echet-differenzierbare Norm besitzt, und M. Kadets (Uspekhi Mat. Nauk 20.3 (1965) 183–187) und Klee (Fund. Math. 49 (1960) 25–34) erhielten unabh¨angig voneinander das Resultat, daß ein separabler Banachraum genau dann eine ¨aquivalente Fr´echet-differenzierbare Norm besitzt, wenn sein Dualraum separabel ist. Da jeder separable Banachraum eine ¨aquivalente Gˆ ateaux-differenzierbare Norm besitzt (Day 1955), ist die Existenz einer Fr´echet-differenzierbaren Norm eine erhebliche Einschr¨ankung, die jedoch weitreichende Konsequenzen hat. So gilt etwa: • Besitzt ein Banachraum X eine ¨ aquivalente Fr´echet-differenzierbare Norm, so ist jedes stetige konvexe Funktional auf X auf einer dichten Teilmenge Fr´echet-differenzierbar. 3 Hier
wie im folgenden ist an jeder Stelle = 0 Fr´echet-differenzierbar“ gemeint. ”
136
III.
Der Satz von Hahn-Banach und seine Konsequenzen
Dieses Resultat geht im wesentlichen auf Asplunds bahnbrechende Arbeit in Acta Math. 121 (1968) 31–47 zur¨ uck. Banachr¨aume, in denen die Aussage dieses Satzes gilt, werden heute Asplundr¨ aume genannt; sie k¨onnen auf vielf¨altige Art charakterisiert werden. Z.B. ist X genau dann ein Asplundraum, wenn jeder separable Unterraum einen separablen Dualraum hat. Ersetzt man im Satz von Asplund Fr´echet“ durch Gˆ ateaux“, erh¨alt man ” ” ebenfalls eine wahre Aussage – dies ist ein tiefliegender Satz von Preiss (Israel J. Math. 72 (1990) 257–279), der eine jahrzehntealte Frage beantwortet. (Daß auf separablen Banachr¨ aumen stetige konvexe Funktionale auf einer dichten Teilmenge Gˆateaux-differenzierbar sind, wurde schon 1933 von Mazur gezeigt.) Ein weiteres gefeiertes Resultat von Preiss bezieht sich auf Lipschitzstetige Funktionen. Nach einem Satz von Rademacher ist jede Lipschitzstetige Funktion f : Rn → R fast u ¨ berall bzgl. des Lebesguemaßes und insbesondere auf einer dichten Teilmenge differenzierbar. Es war lange Zeit ein offenes Problem, ob eine analoge Aussage auf unendlichdimensionalen R¨aumen Bestand hat. In der Literatur waren verschiedene Beispiele von Lipschitz-stetigen Funktionalen f : 2 → R angegeben worden, die angeblich nirgends Fr´echet-differenzierbar waren; leider waren all diese Beispiele inkorrekt. So blieb das Problem offen, bis Preiss zeigen konnte (J. Funct. Anal. 91 (1990) 312–345): • Ist X ein Asplundraum (z.B. reflexiv), so ist jedes Lipschitz-stetige Funktional f : X → R auf einer dichten Teilmenge Fr´echet-differenzierbar. Detaillierte Informationen zu diesem Themenkreis findet man bei Deville/Godefroy/Zizler [1993], Habala/H´ ajek/Zizler [1996] und Phelps [1993]. Das vor Satz III.5.6 beschriebene Beispiel eines Minimumproblems ohne L¨osung wurde 1870 von Weierstraß zur Kritik des Dirichletschen Prinzips konstruiert. Das ist die von Riemann benutzte Methode, das Dirichletproblem (Ω ⊂ Rn ein beschr¨ anktes Gebiet) −Δu = h in Ω,
u = 0 auf ∂Ω
(III.14)
zul¨osen, indem man ankte) Dirichletintegral J(u) = das (nach unten beschr¨ 1 2 2 2 Ω grad u dx− Ω u(x)h(x) dx unter allen C -Funktionen, die die Randbedingung erf¨ ullen, minimiert. Riemann war ohne weitere Begr¨ undung von der Existenz des Minimums ausgegangen; seine Schlußweise war nun durch Weierstraß’ Beispiel ins Wanken geraten. Das Dirichletsche Prinzip wurde erst nach 1900 von Hilbert in zwei Arbeiten (Math. Ann. 59 (1904) 161– 186, J. Reine Angew. Math. 129 (1905) 63–67) rehabilitiert, in denen er die direkte Methode der Variationsrechnung entwickelt; er schreibt (a.a.O., S. 65):
III.7
Bemerkungen und Ausblicke
137
Eine jede regul¨ are Aufgabe der Variationsrechnung besitzt eine L¨ osung, sobald hinsichtlich der Natur der gegebenen Grenzbedingungen geeignete einschr¨ ankende Annahmen erf¨ ullt sind und n¨ otigenfalls der Begriff der L¨ osung eine sinngem¨ aße Erweiterung erf¨ ahrt.
Die moderne Fassung des Dirichletschen Prinzips fußt auf der Theorie der Hilbert- und insbesondere der Sobolevr¨ aume; siehe Kapitel V und speziell Aufgabe V.6.20. Damit werden in (III.14) die einschr¨ankenden Annahmen ” hinsichtlich der Grenzbedingungen“ durch die Zugeh¨origkeit von u zu einem Sobolevraum formuliert, und der erweiterte L¨osungsbegriff“ ist der der ” schwachen L¨osung, vgl. S. 230f. Zum Umfeld des Dirichletschen Prinzips ist Monna [1975] lesenswert.
Kapitel IV
Die Haupts¨ atze fu ¨r Operatoren auf Banachr¨ aumen
IV.1
Vorbereitung: Der Bairesche Kategoriensatz
Die Resultate u ¨ ber Operatoren auf Banachr¨aumen, die in diesem Kapitel vorgestellt werden, beruhen auf einem Prinzip u ¨ ber vollst¨andige metrische R¨aume, das 1899 von R. Baire (im Fall des Rn ) entdeckt wurde. Dieses Bairesche Kategorienprinzip wird nun als erstes vorgestellt. Es ist leicht zu sehen, daß in jedem metrischen Raum der Schnitt zweier offener und dichter Mengen dicht ist. Baire zeigte, daß f¨ ur Rn mehr gilt. Satz IV.1.1 (Satz von Baire) Sei (T, d) ein vollst¨ andiger metrischer Raum und (On )n∈N eine Folge offe ner und dichter Teilmengen. Dann ist n∈N On dicht. Beweis. Setze D = n∈N On . Es ist zu zeigen, daß jede offene ε-Kugel in T ein Element von D enth¨ alt. Sei Uε (x0 ) = {x ∈ T : d(x, x0 ) < ε} eine solche Kugel. Da O1 offen und dicht ist, ist O1 ∩ Uε (x0 ) offen und nicht leer. Es existieren also x1 ∈ O1 , ε1 > 0 (o.E. ε1 < 12 ε) mit Uε1 (x1 ) ⊂ O1 ∩ Uε (x0 ). Nach eventueller weiterer Verkleinerung von ε1 erh¨alt man sogar Uε1 (x1 ) ⊂ O1 ∩ Uε (x0 ). Betrachte nun O2 . Auch O2 ist offen und dicht, daher ist O2 ∩ Uε1 (x1 ) offen und nicht leer. Wie oben existieren x2 ∈ O2 , ε2 < 12 ε1 mit Uε2 (x2 ) ⊂ O2 ∩ Uε1 (x1 ) ⊂ O1 ∩ O2 ∩ Uε (x0 ).
D. Werner, Funktionalanalysis, 7. Aufl., Springer-Lehrbuch, DOI 10.1007/978-3-642-21017-4_4, © Springer-Verlag Berlin Heidelberg 2011
140
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
Auf diese Weise werden induktiv Folgen (εn ) und (xn ) mit folgenden Eigenschaften definiert: (a) εn < 12 εn−1 , folglich εn < 2−nε. (b) Uεn (xn ) ⊂ On ∩ Uεn−1 (xn−1 ) ⊂ · · · ⊂ O1 ∩ . . . ∩ On ∩ Uε (x0 ). Es folgt insbesondere xn ∈ UεN (xN ) ⊂ U2−N ε (xN )
∀n > N,
(IV.1)
d.h., (xn ) ist eine Cauchyfolge. Da T vollst¨ andig ist, existiert der Grenzwert x := limn→∞ xn . Eine unmittelbare Konsequenz von (IV.1) ist dann x ∈ UεN (xN )
∀N ∈ N.
Mit Hilfe von (b) ergibt sich daraus x ∈ D ∩ Uε (x0 ).
2
Daß die vorausgesetzte Vollst¨ andigkeit wesentlich f¨ ur die G¨ ultigkeit von Satz IV.1.1 ist, sieht man an folgendem Beispiel. Betrachte eine Aufz¨ahlung {x1 , x2 , . . .} von Q und die in Q offenen und dichten Mengen On = Q\{xn}. Dann ist n∈N On = ∅. Bemerke, daß nicht die Offenheit von n∈N On in Satz IV.1.1 behauptet wurde, die i.a. auch gar nicht gilt. (Beispiel?) Nennt man einen abz¨ahlbaren Schnitt von offenen Mengen eine Gδ -Menge (wobei G an Gebiet“ und δ ” an Durchschnitt“ erinnern soll), so l¨ aßt sich Satz IV.1.1 so formulieren: ” • In einem vollst¨ andigen metrischen Raum ist der abz¨ ahlbare Schnitt von dichten Gδ -Mengen eine dichte Gδ -Menge. H¨aufig ist eine weitere Umformulierung von Nutzen. Dazu wird folgende Terminologie ben¨ otigt; sie stammt von Baire und ist leider etwas unanschaulich, hat sich aber in der Literatur fest eingeb¨ urgert. Definition IV.1.2 (a) Eine Teilmenge M eines metrischen Raums heißt nirgends dicht, wenn M keinen inneren Punkt besitzt. (b) M heißt von 1. Kategorie, wenn es eine Folge (Mn ) nirgends dichter Mengen mit M = n∈N Mn gibt. (c) M heißt von 2. Kategorie, wenn M nicht von 1. Kategorie ist. Nirgends dichte Mengen liegen in der Tat in keiner offenen Menge ( nir” gends“) dicht. Einfaches Beispiel: Q ist von1. Kategorie in R. Durch Komplementbildung, n¨ amlich ( n Mn) = n Mn ⊃ n Mn , erh¨alt man aus Satz IV.1.1: Korollar IV.1.3 (Bairescher Kategoriensatz) In einem vollst¨andigen metrischen Raum liegt das Komplement einer Menge 1. Kategorie dicht.
IV.1
141
Vorbereitung: Der Bairesche Kategoriensatz
H¨aufig wird nur folgende schw¨ achere Form ben¨otigt. Korollar IV.1.4 Ein nicht leerer vollst¨ andiger metrischer Raum ist von 2. Kategorie in sich. Der Bairesche Kategoriensatz gestattet h¨aufig relativ einfache (aber nichtkonstruktive) Beweise f¨ ur Existenzaussagen. Das geschieht nach folgendem Muster: Gesucht ist ein Objekt mit einer gewissen Eigenschaft (E). Zeige dann, daß die Gesamtheit der zu untersuchenden Objekte einen vollst¨andigen metrischen Raum bildet, worin die Objekte ohne Eigenschaft (E) eine Teilmenge 1. Kategorie formen. Folglich gibt es Objekte mit Eigenschaft (E), und diese liegen sogar dicht! Der Beweis des n¨ achsten Satzes veranschaulicht diese Methode. Satz IV.1.5 Es gibt stetige Funktionen auf [0, 1], die an keiner Stelle differenzierbar sind. Beweis. Zu n ∈ N setze On =
x(t + h) − x(t) >n x ∈ C[0, 1]: sup h 0<|h|≤1/n
∀t ∈ [0, 1] .
(Um Definitionsl¨ ucken zu vermeiden, setze x rechts von 1 und links von 0 konstant stetig fort.) Wir versehen C[0, 1] mit der Supremumsnorm.Dann sind alle On offen und dicht (Beweis folgt). Nach Satz IV.1.1 ist D := n On dicht, und jedes x ∈ D ist an keiner Stelle differenzierbar. Zeigen wir zun¨ achst die Offenheit der On . Sei x ∈ On . W¨ahle zu t ∈ [0, 1] eine Zahl δt > 0 mit x(t + h) − x(t) > n + δt . sup h 0<|h|≤1/n Folglich existiert ht mit 0 < |ht | ≤ 1/n und x(t + ht ) − x(t) > n + δt . ht Da x stetig ist, gilt noch f¨ ur s ∈ Ut , einer hinreichend kleinen Umgebung von t, x(s + ht ) − x(s) > n + δt . ht ¨ Uberdecke nun das kompakte Intervall [0, 1] durch endlich viele Ut1 , . . . , Utr ; setze noch δ = min{δt1 , . . . , δtr }, h = min{|ht1 |, . . . , |htr |}. Es folgt f¨ ur s ∈ Uti x(s + hti ) − x(s) > n + δ. ht i
142
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
Seien nun 0 < ε < 12 hδ und y − x ∞ < ε. Wir werden y ∈ On zeigen. Sei dazu t ∈ [0, 1], etwa t ∈ Uti . Dann ist y(t + hti ) − y(t) ≥ x(t + hti ) − x(t) − 2 x − y ∞ hti hti |hti | ε > n+δ−2 h > n. Daher ist On offen. Es bleibt zu zeigen, daß On dicht ist. Sei dazu O = ∅ eine offene Menge. Nach dem Weierstraßschen Approximationssatz (Satz I.2.10) existieren ein Polynom p und ε > 0 mit x − p ∞ ≤ ε
⇒
x ∈ O.
Sei ym eine S¨agezahnfunktion, die [0, 1] auf [0, ε] abbildet und deren auf(bzw. ab-)steigende Zacken die Steigung +m bzw. −m aufweisen.
ε
1 Dann ist stets xm := p + ym ∈ O. F¨ ur m > n + p ∞ erh¨alt man jedoch f¨ ur alle t ∈ [0, 1], 0 < |h| ≤ 1/n xm (t + h) − xm (t) ym (t + h) − ym (t) p(t + h) − p(t) ≥ − , h h h wo der letzte Term wegen des Mittelwertsatzes ≤ p ∞ ausf¨allt. Daher gilt xm (t + h) − xm (t) ≥ m − p ∞ > n, sup h 0<|h|≤1/n d.h., xm ∈ On , und On ∩ O = ∅. Daher ist On dicht, und der Beweis ist vollst¨andig. 2
IV.2
Das Prinzip der gleichm¨ aßigen Beschr¨ anktheit
In diesem und den folgenden Abschnitten wenden wir den Baireschen Kategoriensatz im funktionalanalytischen Kontext an. Das erste Resultat in
IV.2
Das Prinzip der gleichm¨ aßigen Beschr¨ anktheit
143
dieser Richtung wird Prinzip der gleichm¨ aßigen Beschr¨anktheit“ genannt ” oder auch als Satz von Banach-Steinhaus bezeichnet (zur Berechtigung dieser Nomenklatur siehe die Bemerkungen am Schluß des Kapitels). Theorem IV.2.1 (Satz von Banach-Steinhaus) Seien X ein Banachraum, Y ein normierter Raum, I eine Indexmenge und Ti ∈ L(X, Y ) f¨ ur i ∈ I. Falls sup Ti x < ∞
∀x ∈ X
i∈I
gilt, so gilt sogar sup Ti < ∞. i∈I
Beweis. Zu n ∈ N setze En = {x ∈ X: supi∈I Ti x ≤ n}. Die Voraussetzung besagt dann X = n∈N En . Da die Ti stetig sind, ist jedes En = i∈I Ti ( · ) −1 [0, n] abgeschlossen. Nach dem Baireschen Kategoriensatz (es reicht sein Korollar IV.1.4) enth¨ alt mindestens eine der Mengen En einen inneren Punkt. Es existieren also N ∈ N, y ∈ EN und ε > 0 mit x − y ≤ ε
⇒
x ∈ EN .
Da EN symmetrisch ist (d.h., z ∈ EN ⇔ −z ∈ EN ), hat −y dieselbe Eigenschaft; es folgt nun aus der Konvexit¨ at von EN die Implikation u ≤ ε
⇒
u=
1 1 (u + y) + (u − y) ∈ (EN + EN ) ⊂ EN . 2 2
Das heißt: Wenn u ≤ ε ist, dann gilt Ti u ≤ N f¨ ur alle i ∈ I; also folgt sup Ti ≤ i∈I
N < ∞. ε
2
Beachte, daß der Beweis keinen Aufschluß u ¨ber die Gr¨oße von supi Ti gibt, nur die Endlichkeit dieser Zahl wird bewiesen. Daß die Vollst¨ andigkeit von X wesentlich f¨ ur die G¨ ultigkeit von Theorem IV.2.1 ist, sieht man an folgendem Beispiel. Betrachte den normierten Raum (d, . ∞ ) und Tn : d → K, (sm )m∈N → nsn . Da nur endlich viele sm von 0 verschieden sind, erf¨ ullt (Tn ) die Voraussetzungen des Satzes von Banach-Steinhaus; aber es ist Tn = n. Korollar IV.2.2 F¨ ur eine Teilmenge M eines normierten Raums X sind a quivalent: ¨ (i) M ist beschr¨ankt. (ii) F¨ ur alle x ∈ X ist x (M ) ⊂ K beschr¨ ankt.
144
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
Beweis. (i) ⇒ (ii): Klar! (ii) ⇒ (i): Betrachte die Funktionale iX (x) f¨ ur x ∈ M , die auf dem Banachraum X definiert sind. Nach Voraussetzung gilt sup |x (x)| = sup |iX (x)(x )| < ∞ x∈M
∀x ∈ X .
x∈M
Theorem IV.2.1 liefert nun sup x = sup iX (x) < ∞. x∈M
2
x∈M
Insbesondere gilt: Korollar IV.2.3 Schwach konvergente Folgen sind beschr¨ ankt.
Beweis. Konvergiert (xn ) schwach, so ist f¨ ur x ∈ X die Folge x (xn ) beschr¨ankt, da konvergent. 2 F¨ ur die duale Version von Korollar IV.2.2 muß die Vollst¨andigkeit gefordert werden. Korollar IV.2.4 Sei X ein Banachraum und M ⊂ X . Dann sind folgende Aussagen ¨ aquivalent: (i) M ist beschr¨ankt. (ii) F¨ ur alle x ∈ X ist {x (x): x ∈ M } beschr¨ankt. Beweis. (i) ⇒ (ii) ist klar, und die Umkehrung ein Spezialfall von Theorem IV.2.1. 2 Wir behandeln nun die punktweise Konvergenz von Operatorfolgen. Bekanntlich reicht die punktweise Konvergenz einer Folge stetiger Funktionen nicht aus, um die Stetigkeit der Grenzfunktion zu garantieren. Deshalb ist das folgende Resultat bemerkenswert. Korollar IV.2.5 Sei X ein Banachraum und Y ein normierter Raum, ferner seien Tn ∈ L(X, Y ) f¨ ur n ∈ N. F¨ ur x ∈ X existiere T x := limn→∞ Tn x. Dann ist T ∈ L(X, Y ). Beweis. Die Linearit¨ at von T ist klar, siehe den Beweis von Satz II.1.4(b). Nun zur Stetigkeit von T . Da (Tn x) f¨ ur alle x ∈ X konvergiert, ist stets supn Tn x < ∞. Der Satz von Banach-Steinhaus liefert supn Tn =: M < ∞. Es folgt T x = lim Tnx ≤ M x . 2 n→∞
In bestimmten F¨ allen folgt die punktweise Konvergenz einer Operatorfolge aus relativ schwachen Voraussetzungen. Der n¨achste Satz behandelt Operatoren auf dem reellen Banachraum C[0, 1], die positive Funktionen auf positive Funktionen abbilden, und zeigt die punktweise Konvergenz Tn → Id, falls sie nur an drei Stellen vorliegt.
IV.2
145
Das Prinzip der gleichm¨ aßigen Beschr¨ anktheit
Satz IV.2.6 (Erster Korovkinscher Satz) Sei Tn ∈ L(C[0, 1]), und Tn sei positiv (d.h., Tn x ≥ 0 f¨ ur x ≥ 0). Setze xi (t) = ti , i = 0, 1, 2. Gilt dann Tn xi → xi f¨ ur i = 0, 1, 2, so gilt Tnx → x f¨ ur alle x ∈ C[0, 1]. Beweis. Sei x ∈ C[0, 1] beliebig. Da x gleichm¨aßig stetig ist, existiert zu ε > 0 ein δ > 0 mit √ |s − t| ≤ δ ⇒ |x(s) − x(t)| ≤ ε. (IV.2) Daraus ergibt sich mit α = 2 x ∞ /δ die Ungleichung |x(s) − x(t)| ≤ ε + α(t − s)2 ∀s, t ∈ [0, 1]; √ denn falls |t − s| ≤ δ, folgt das aus (IV.2), und sonst ist
(IV.3)
ε + α(t − s)2 > ε + 2 x ∞ > |x(s)| + |x(t)| ≥ |x(s) − x(t)|. Setze yt (s) = (t − s)2 . Dann kann (IV.3) in der Form −ε − αyt ≤ x − x(t) ≤ ε + αyt
∀t ∈ [0, 1]
geschrieben werden; die Positivit¨ at von Tn liefert dann −εTn x0 − αTn yt ≤ Tn x − x(t)Tn x0 ≤ εTn x0 + αTn yt
∀t ∈ [0, 1],
d.h., f¨ ur alle t ∈ [0, 1] gilt |Tn x − x(t)Tn x0 | ≤ εTn x0 + αTn yt ; insbesondere |(Tn x)(t) − x(t)(Tn x0 )(t)| ≤ ε(Tnx0 )(t) + α(Tn yt )(t)
∀t ∈ [0, 1].
Wegen yt ∈ lin{x0 , x1 , x2 } konvergiert die rechte Seite gegen εx0 (t) + αyt (t) = ε, und zwar gleichm¨ aßig in t, denn Tn yt − yt = (Tn x2 − x2 ) − 2t(Tn x1 − x1 ) + t2 (Tn x0 − x0 ). Eine weitere Anwendung der Voraussetzung Tn x0 → x0 liefert daher, daß Tnx − x ∞ ≤ 2ε f¨ ur hinreichend große n, und es folgt Tn x → x. 2 Der Approximationssatz von Weierstraß folgt offenbar aus dem Satz von Korovkin, wenn man Tn x = n-tes Bernsteinpolynom von x setzt (vgl. die Rechnung auf S. 30). Andererseits ist der Beweis des Weierstraßschen Satzes im Text nichts anderes als eine Kopie des obigen Beweises. Wir ben¨otigen noch die trigonometrische Version des Satzes von Korovkin. Betrachte den reellen Banachraum (unter . ∞ ) der 2π-periodischen stetigen Funktionen auf R. Dieser kann mit C2π = {x ∈ C[−π, π]: x(−π) = x(π)} identifiziert werden.
146
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
Satz IV.2.7 (Zweiter Korovkinscher Satz) F¨ ur n ∈ N sei Tn ∈ L(C2π ), und Tn sei positiv. Setze x0 (t) = 1, x1 (t) = cos t, x2 (t) = sin t. Gilt Tn xi → xi f¨ ur i = 0, 1, 2, so folgt Tn x → x f¨ ur alle x ∈ C2π . Beweis. Der Beweis verl¨ auft analog zum vorherigen, wenn man von der Hilfsfunktion yt (s) = sin2 t−s ausgeht und zu x ∈ C2π und ε > 0 ein δ > 0 2 mit yt (s) ≤ δ ⇒ |x(s) − x(t)| ≤ ε w¨ahlt; bemerke, daß wegen yt (s) =
1 (1 − cos s cos t − sin s sin t) 2
wieder yt ∈ lin{x0 , x1 , x2 } gilt.
2
Wir werden den zweiten Satz von Korovkin zum Beweis von Satz IV.2.11 benutzen. Zum Schluß dieses Abschnitts folgen noch einige Anwendungen. Zu1 n¨achst geht es um Quadraturformeln. Um das Integral 0 x(t) dt f¨ ur eine stetige Funktion x angen¨ ahert zu berechnen, bedient man sich h¨aufig N¨aherungsformeln der Gestalt Qn (x) =
n
(n)
(n)
αi x(ti )
i=0
1 und fragt nach der Konvergenz Qn (x) → 0 x(t) dt f¨ ur x ∈ C[0, 1]. In der Regel kann man f¨ ur gen¨ ugend oft differenzierbare x diese Konvergenz beweisen (z.B. Sehnentrapezregel f¨ ur x ∈ C 2 , Simpsonregel f¨ ur x ∈ C 4 ). Allgemein gilt der folgende Satz, dessen funktionalanalytisch interessantester Aspekt die Notwendigkeit von (ii) ist. Satz IV.2.8 (Satz von Szeg˝ o) Sei Qn wie oben. Dann sind ¨ aquivalent: 1 (i) Qn (x) → 0 x(t) dt f¨ ur alle x ∈ C[0, 1]. n 1 (n) (ii) Qn (x) → 0 x(t) dt f¨ ur alle Polynome und sup |αi | < ∞. n i=0
Beweis. Der Schl¨ ussel zum Verst¨ andnis des Satzes von Szeg˝ o liegt in der Gleichheit n (n) Qn = |αi |, i=0
wo wir Qn ∈ (C[0, 1]) aufgefaßt haben. (i) ⇒ (ii) folgt dann aus dem Satz von Banach-Steinhaus und die umgekehrte Implikation aus dem Satz
IV.2
Das Prinzip der gleichm¨ aßigen Beschr¨ anktheit
147
von Weierstraß mit Hilfe eines einfachen Approximationsarguments (vgl. Aufgabe III.6.17 f¨ ur einen ¨ ahnlichen Schluß). 2 F¨ ur die Trapezregel gilt beispielsweise 1 x(t0 ) + x(tn ) Qn (x) = + x(t1 ) + . . . + x(tn−1 ) n 2 1 mit ti = ni , also Qn = 1. Da Qn (x) → 0 x(t) dt f¨ ur x ∈ C 2 gilt, also insbesondere f¨ ur Polynome, gilt nach (der einfachen H¨alfte von) Satz IV.2.8 die Konvergenz f¨ ur alle stetigen Funktionen auf [0, 1]. Satz IV.2.8 gibt allerdings keinen Aufschluß u ¨ber eine Fehlerabsch¨atzung. Abschließend diskutieren wir die Konvergenz von Fourierentwicklungen. Sei x: R → R eine 2π-periodische und u ¨ ber [−π, π] integrierbare Funktion. Die Fourierreihe von x ist dann die (formale) Reihe ∞
a0 + (ak cos kt + bk sin kt) 2
(IV.4)
k=1
mit 1 π x(t) cos kt dt π −π 1 π = x(t) sin kt dt π −π
ak =
(k = 0, 1, 2, . . .),
bk
(k = 1, 2, . . .).
Die ak und bk heißen die Fourierkoeffizienten von x. Die Fourierreihe (IV.4) ist insofern zun¨achst eine formale Reihe, als noch nichts u ¨ber ihre Konvergenz ausgesagt ist, geschweige denn, daß sie gegen x(t) konvergiert. (Vergleiche mit dem Vorgehen bei Taylorreihen!) Wenn aber eine Reihe der Form (IV.4) gleichm¨aßig gegen x konvergiert, folgt durch Multiplikation mit cos k0 t bzw. sin k0 t und gliedweise Integration, daß die Koeffizienten ak und bk notwendig die angegebene Form haben. Das Konvergenzproblem von Fourierreihen werden wir mit Hilfe der S¨atze von Banach-Steinhaus und Korovkin n¨aher analysieren. Als erstes bringen wir eine hinreichende Bedingung f¨ ur die gleichm¨aßige Konvergenz. Dazu ben¨otigen wir eine Integraldarstellung der n-ten Partialsumme a0 + (ak cos kt + bk sin kt) 2 n
sn (x, t) =
k=1
mit ak und bk wie oben. Funktionalanalytische Methoden kommen dann durch die Untersuchung der Funktionale x → sn (x, t) (t fest) ins Spiel.
148
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
Durch Einsetzen der Integrale f¨ ur ak und bk erh¨alt man n 1 π 1 sn (x, t) = x(s) + (cos ks cos kt + sin ks sin kt) ds π −π 2 k=1 n 1 π 1 = x(s) + cos k(s − t) ds π −π 2 k=1 n 1 π 1 = x(s + t) + cos ks ds π −π 2 k=1 sin(n + 12 )s 1 π = x(s + t) ds, π −π 2 sin 2s wo nacheinander die Definition der ak und bk , die Additionstheoreme der trigonometrischen Funktionen sowie die 2π-Periodizit¨at von x ausgenutzt wurden. Die letzte Gleichheit sieht man, indem man ins Komplexe geht und die Formeln eit = cos t + i sin t, eit − e−it = 2i sin t sowie die Summenformel f¨ ur die (endliche) geometrische Reihe verwendet: n n 1 1 + cos ks = cos ks 2 2 k=1
=
1 2
k=−n n
eiks
k=−n
1 −ins e(2n+1)is − 1 e 2 eis − 1 1 (n+ 12 )is 1e − e−(n+ 2 )is = 1 1 2 e 2 is − e− 2 is 1 sin(n + 12 )s = . 2 sin 2s =
Man nennt die hier auftauchende Funktion Dn (s) :=
1 sin(n + 12 )s , 2 sin 2s
die man durch Dn (0) = n + 12 an der Stelle s = 0 stetig erg¨anzt, den n-ten Dirichletkern. Die obige Darstellung f¨ ur sn l¨ aßt sich also kurz als π 1 sn (x, t) = x(s + t)Dn (s) ds π −π schreiben.
IV.2
149
Das Prinzip der gleichm¨ aßigen Beschr¨ anktheit
Satz IV.2.9 Ist x: R → R 2π-periodisch und stetig differenzierbar, so konvergiert die Fourierreihe von x gleichm¨ aßig gegen x. Beweis. Da f¨ ur x = 1 alle Partialsummen = 1 sind, folgt aus der obigen Darstellung 1 π 1= Dn (s) ds. π −π Damit ist f¨ ur alle x und alle 0 ≤ h ≤ π π 1 |sn (x, t) − x(t)| = x(s + t) − x(t) Dn (s) ds π −π h π 1 −h ≤ (. . .) + (. . .) + (. . .) . −h h π −π Sei ε > 0 gegeben. W¨ ahle h < π mit 0 < h ≤ ε/(π x ∞ ). Dann ist nach dem Mittelwertsatz h h |x(s + t) − x(t)| (. . .) ≤ |sin(n + 12 )s| ds −h 2 sin |s| −h 2 h x ∞ |s| ≤ ds |s| −h 2 sin 2 π ≤ 2h x ∞ , 2 denn sin u ≥
2 πu
f¨ ur alle 0 ≤ u ≤ π2 . Folglich gilt h (. . .) ≤ ε ∀t. −h
Betrachten wir nun
π h
(. . .). Wir setzen
ft (s) =
x(s + t) − x(t) , 2 sin 2s
m=n+
1 2
und bemerken, daß ft ∈ C 1 [h, π] mit supt∈R ft ∞ < ∞, supt∈R ft ∞ < ∞. Durch partielle Integration folgt π s=π π −1 −1 ≤ c, f (s) sin ms ds = f (s) cos ms − f (s) cos ms ds t t t m m m h h s=h wo die Konstante c von t unabh¨ angig ist. Also existiert n0 (ε) mit π c (. . .) ≤ <ε ∀n ≥ n0 (ε), ∀t. n+ 1 h
2
150
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
Zusammen ergibt sich f¨ ur hinreichend große n (das Integral genauso behandelt) |x(t) − sn (x, t)| ≤
1 {ε + ε + ε} < ε π
−h −π
(. . .) wird
∀t, 2
und das zeigt die Behauptung.
Die Stetigkeit von x ist allerdings nicht hinreichend, um auch nur die punktweise Konvergenz der Fourierreihe gegen x zu erzwingen. Dies werden wir nun mit Hilfe des Satzes von Banach-Steinhaus zeigen. Satz IV.2.10 Es gibt stetige 2π-periodische Funktionen, deren Fourierreihen nicht in jedem Punkt konvergieren. Beweis. Eine 2π-periodische stetige Funktion kann mit einem Element des Raums C2π = {x ∈ C[−π, π]: x(π) = x(−π)} identifiziert werden. Versieht man C2π mit der Supremumsnorm, erh¨alt man einen Banachraum. H¨ atten alle x ∈ C2π u Fourierreihen, ¨ berall konvergente so w¨are f¨ ur jedes t ∈ [−π, π] die Folge sn (x, t) n∈N f¨ ur alle x ∈ C2π beschr¨ankt. Der Satz von Banach-Steinhaus liefert dann f¨ ur alle t sup sn( · , t) < ∞;
(IV.5)
n∈N hier ist sn ( · , t) ∈ C2π aufzufassen. Betrachte nun t = 0 (jedes andere t w¨ urde es auch tun). Die Norm von sn ( · , 0) ∈ C[−π, π] hatten wir in Beispiel (g) von Abschnitt II.1 ausgerechnet. Eine leichte Modifikation liefert auch hier 1 π sn ( · , 0) C2π = |Dn (s)| ds =: ln . π −π
(Das folgt auch aus der im Rieszschen Darstellungssatz II.2.5 behaupteten Isometrie.) (IV.5) ist daher im Fall t = 0 ¨ aquivalent zu sup ln < ∞.
(IV.6)
n
Andererseits ist 1 ln = π
π −π
|sin(n + 12 )s| 1 ds ≥ |2 sin 2s | π
π
−π
|sin(n + 12 )s|
Mit der Variablensubstitution σ = (n + 12 )s ergibt sich nun ln ≥
2 π
0
(n+ 12 )π
|sin σ|
dσ σ
ds . |s|
IV.2
151
Das Prinzip der gleichm¨ aßigen Beschr¨ anktheit n 2 kπ dσ ≥ |sin σ| π σ k=1 (k−1)π kπ n 2 1 ≥ |sin σ| dσ π kπ (k−1)π k=1
n 2 2 1 = , π k k=1
also folgt ln → ∞ im Widerspruch zu (IV.6). Daher kann sn (x, 0) n∈N nicht f¨ ur alle x ∈ C2π konvergieren. 2 Damit ist nat¨ urlich noch kein solches x konstruiert. Das erste konkrete Beispiel einer stetigen Funktion x mit bei t = 0 divergierender Fourierreihe wurde 1876 von DuBois-Reymond angegeben; man kann Funktionen der Gestalt x(t) = A(t) sin ω(t)t mit geeigneten A(t) → 0 und ω(t) → ∞ f¨ ur t → 0 w¨ahlen. Im Unterschied zur Theorie der Taylorreihen gilt f¨ ur Fourierreihen u ¨brigens: Wenn die Folge sn (x, t) konvergiert, ist ihr Limes notwendig = x(t) f¨ ur stetiges x. Außerdem gilt der sehr tiefliegende Satz von Carleson: • F¨ ur x ∈ L2 [−π, π] konvergiert die Fourierreihe fast ¨ uberall. F¨ ur stetige Funktionen gilt stets folgendes Resultat. Wir betrachten sn (x, t) wie oben und dazu die arithmetischen Mittel Tn x =
n−1 1 sk (x, · ). n k=0
Satz IV.2.11 (Satz von Fej´er) F¨ ur x ∈ C2π ist (Tn x) gleichm¨ aßig gegen x konvergent. Mit anderen Worten: Die Fourierreihe von x konvergiert gleichm¨ aßig gegen x im Sinn von Ces` aro. Beweis. Wir verwenden den zweiten Satz von Korovkin, Satz IV.2.7. Der Diskussion von S. 148 entnehmen wir die Darstellung n−1 1 sk (x, t) n k=0 n−1 sin(k + 12 )s 11 π = x(s + t) k=0 ds, n π −π 2 sin 2s
(Tn x)(t) =
und es gilt (geometrische Reihe!) n−1 k=0
sin(k + 12 )s = Im
n−1 k=0
1
ei(k+ 2 )s
152
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
eins − 1 = Im eis/2 is e −1 ins e −1 = Im is/2 e − e−is/2 cos ns − 1 + i sin ns = Im 2i sin 2s 1 − cos ns = 2 sin 2s sin2 n 2s sin 2s
= Setzt man Fn (s) =
1 sin2 n 2s 2n sin2 2s
f¨ ur s = 0 und Fn (0) = 12 n, so erh¨ alt man den stetigen Fej´erkern und die Integraldarstellung 1 π (Tn x)(t) = x(s + t)Fn (s) ds, π −π und da Fn (s) ≥ 0 f¨ ur −π ≤ s ≤ π gilt, ist Tn ein positiver linearer Operator auf C2π . F¨ ur x0 (t) = 1, x1 (t) = cos t, x2 (t) = sin t gilt schließlich sk (x0 , · ) = x0
∀k ≥ 0,
s0 (x1 , · ) = s0 (x2 , · ) = 0, sk (x1 , · ) = x1 ,
sk (x2 , · ) = x2
∀k ≥ 1;
folglich
n−1 n−1 x1 , Tn x2 = x2 . n n Somit sind alle Voraussetzungen von Satz IV.2.7 erf¨ ullt, und es folgt, daß Tnx − x ∞ → 0 f¨ ur alle x ∈ C2π . 2 Tn x0 = x0 , Tn x1 =
Ein trigonometrisches Polynom ist eine Funktion der Bauart N
(an cos nt + bn sin nt)
(N ∈ N).
n=0
Korollar IV.2.12 (Zweiter Approximationssatz von Weierstraß) Die trigonometrischen Polynome liegen dicht in (C2π , . ∞ ). Beweis. F¨ ur x ∈ C2π ist Tn x ein trigonometrisches Polynom, wo Tn gem¨aß Satz IV.2.11 definiert ist. Es bleibt, diesen Satz anzuwenden. 2
153
IV.3 Der Satz von der offenen Abbildung
IV.3
Der Satz von der offenen Abbildung
Wir beginnen mit einer Definition. Definition IV.3.1 Eine Abbildung zwischen metrischen R¨aumen heißt offen, wenn sie offene Mengen auf offene Mengen abbildet. Im Gegensatz zur analogen Definition der Stetigkeit kann man hier offene Mengen nicht durch abgeschlossene Mengen ersetzen; mit anderen Worten, eine offene Abbildung braucht abgeschlossene Mengen nicht auf abgeschlossene Mengen abzubilden. Hier ein Beispiel: Die Abbildung p: R2 → R, (s, t) → s, ist offen, bildet aber die abgeschlossene Menge {(s, t): s ≥ 0, st ≥ 1} auf (0, ∞) ab. Die obige Definition ist maßgeschneidert, um die Stetigkeit von inversen Abbildungen zu untersuchen, denn es ist klar, daß eine bijektive Abbildung genau dann offen ist, wenn ihre Inverse stetig ist. Wir sind an der Offenheit linearer Abbildungen zwischen normierten R¨aumen interessiert. Daf¨ ur ist das folgende Kriterium n¨ utzlich. Lemma IV.3.2 F¨ ur eine lineare Abbildung T : X → Y zwischen normierten R¨ aumen X und Y sind ¨ aquivalent: (i) T ist offen. (ii) T bildet offene Kugeln um 0 auf Nullumgebungen ab; m.a.W., mit Ur := {x ∈ X: x < r}, Vε := {y ∈ Y : y < ε} gilt ∀r > 0 ∃ε > 0 (iii)
∃ε > 0
Vε ⊂ T (Ur ).
Vε ⊂ T (U1 ).
Beweis. (i) ⇒ (ii) folgt aus 0 ∈ T (Ur ) und der vorausgesetzten Offenheit dieser Menge. (ii) ⇒ (i): Sei O ⊂ X offen und x ∈ O, also T x ∈ T (O). Da O offen ist, existiert r > 0 mit x + Ur ⊂ O, folglich T x + T (Ur ) ⊂ T (O). Mit (ii) folgt T x + Vε ⊂ T (O). Da x beliebig war, muß T (O) offen sein. (ii) ⇔ (iii): Das ist klar. 2 Beispiele. (a) Jede Quotientenabbildung (Definition II.1.7) ist offen. (b) Die Abbildung T : ∞ → c0 , (tn ) → ( n1 tn ), ist nicht offen, denn T (U1 ) = {(tn ) ∈ c0 : |tn | < n1 ∀n ∈ N}, und diese Menge ist keine Nullumgebung. Offensichtlich ist eine offene lineare Abbildung surjektiv. Der folgende Satz von Banach, der bei vollst¨ andigen R¨ aumen die Umkehrung garantiert, ist einer der wichtigsten S¨ atze der Funktionalanalysis, wie aus seinen zahlreichen Korollaren deutlich werden wird.
154
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
Theorem IV.3.3 (Satz von der offenen Abbildung) Seien X und Y Banachr¨ aume und T ∈ L(X, Y ) surjektiv. Dann ist T offen. Beweis. Wir zeigen (iii) aus Lemma IV.3.2. Der Beweis hierf¨ ur zerf¨allt in zwei Teile. 1. Teil. Zun¨achst wird mit Hilfe der Vollst¨andigkeit von Y gezeigt: ∃ε0 > 0
Vε0 ⊂ T (U1 )
(IV.7)
(Die Bezeichnungen sind wie in Lemma IV.3.2.) Zum Beweis schreiben wir Y = n∈N T (Un ); dies ist m¨ oglich, da T surjektiv ist. Nach dem Baireschen Kategoriensatz (Satz IV.1.3 bzw. IV.1.4) existiert N ∈ N mit int T (UN ) = ∅. Es existieren also y0 ∈ T (UN ) und ε > 0 mit z − y0 < ε ⇒
z ∈ T (UN ).
Nun ist T (UN ) symmetrisch, d.h., diese Menge enth¨alt mit z auch −z, denn T (UN ) ist symmetrisch und daher auch der Abschluß. Deshalb hat −y0 dieselbe Eigenschaft. Sei nun y < ε. Dann gilt (y0 + y) − y0 < ε, also y0 + y ∈ T (UN ). Analog zeigt man −y0 + y ∈ T (UN ). Daraus folgt y=
1 1 (y0 + y) + (−y0 + y) ∈ T (UN ), 2 2
denn T (UN ) ist als Abschluß einer konvexen Menge konvex. Es ist damit Vε ⊂ T (UN ) gezeigt, woraus Vε/N ⊂ T (U1 ) folgt. 2. Teil. Sei ε0 wie in (IV.7). Mit Hilfe der Vollst¨andigkeit von X werden wir nun sogar Vε0 ⊂ T (U1 ) (IV.8) schließen, woraus wegen Lemma IV.3.2 die Offenheit von T folgt. Zum Beweis sei y < ε0 . W¨ ahle ε > 0 mit y < ε < ε0 und betrachte y := εε0 y. Dann ist y < ε0 , und nach (IV.7) gilt y ∈ T (U1 ). Es existiert also y0 = T x0 ∈ T (U1 ) mit y − y0 < αε0 , wobei wir 0 < α < 1 so klein gew¨ ahlt haben, daß ε 1 <1 ε0 1 − α ausf¨allt. Betrachte als n¨ achstes (y − y0 )/α ∈ Vε0 . Es existiert wieder nach (IV.7) y1 = T x1 ∈ T (U1 ) mit y − y0 < αε0 , − y 1 α
IV.3
155
Der Satz von der offenen Abbildung
das heißt y − (y0 + αy1 ) < α2 ε0 . Jetzt behandle y−(y0 +αy1 ) /α2 nach derselben Methode, um y2 = T x2 ∈ T (U1 ) mit y − (y0 + αy1 + α2 y2 ) < α3 ε0
zu erhalten. Auf diese Weise wird induktiv eine Folge (xn )n≥0 in U1 mit n i α xi < αn+1 ε0 y − T i=0 ∞ i definiert. Wegen < 1 konvergiert i=0 α xi absolut, daher (Lemma I.1.8) α ∞ existiert x := i=0 αi xi ∈ X, und nach Konstruktion ist T x = y. Setze noch x := εε0 x; dann ist T x = y und x =
∞ ∞ ε ε i ε i ε 1 x ≤ α xi < α = <1 ε0 ε0 i=0 ε0 i=0 ε0 1 − α
nach Wahl von α. Es folgt y ∈ T (U1 ).
2
Aus der obigen Bemerkung u ¨ ber inverse Abbildungen ergibt sich sofort eine wichtige Konsequenz. Korollar IV.3.4 Sind X und Y Banachr¨aume und ist T ∈ L(X, Y ) bijektiv, so ist der inverse Operator T −1 stetig. Korollar IV.3.5 Sind . und ||| . ||| zwei Normen auf dem Vektorraum X, die beide X zu einem Banachraum machen, und gilt f¨ ur ein M > 0 x ≤ M |||x|||
∀x ∈ X,
so sind . und ||| . ||| ¨ aquivalent. Beweis. Wende Korollar IV.3.4 auf die stetige Identit¨at Id: (X, ||| . |||) → (X, . ) an.
2
Korollar IV.3.6 X und Y seien Banachr¨ aume, und T ∈ L(X, Y ) sei injektiv. Genau dann ist T −1 als Operator von ran(T ) nach X stetig, wenn ran(T ) abgeschlossen ist. Beweis. Ist ran(T ) abgeschlossen, so ist ran(T ) ein Banachraum, und T kann als bijektive Abbildung zwischen den Banachr¨aumen X und ran(T ) angesehen werden. Nach Korollar IV.3.4 ist T −1 stetig. Ist umgekehrt T −1 stetig, so ist T ein Isomorphismus zwischen X und ran(T ). Mit X ist dann auch ran(T ) vollst¨ andig, also abgeschlossen (Lemma I.1.3). 2 Die Resultate der folgenden Abschnitte k¨onnen ebenfalls als Korollare des Satzes von der offenen Abbildung angesehen werden.
156
IV.
IV.4
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
Der Satz vom abgeschlossenen Graphen
Die in diesem Abschnitt besprochenen Operatoren besitzen viele Eigenschaften, die stetigen linearen Abbildungen zukommen, ohne selbst stetig zu sein. Definition IV.4.1 Seien X und Y normierte R¨aume, D ⊂ X sei ein Untervektorraum, T : D → Y sei eine lineare Abbildung. Dann heißt T abgeschlossen, falls gilt: Konvergiert die Folge (xn ), xn ∈ D, gegen x ∈ X und konvergiert (T xn ), etwa gegen y ∈ Y , so folgt x ∈ D und T x = y. Ist T auf D ⊂ X definiert, schreibt man dom(T ) = D bzw. T : X ⊃ dom(T ) → Y . Beachte, wie sich die Abgeschlossenheit von der Stetigkeit von T unterscheidet: F¨ ur den Spezialfall dom(T ) = X betrachte die Aussagen (a) xn → x, (b) (T xn ) konvergiert, etwa T xn → y, (c) T x = y. Dann gilt: • T ist stetig, falls (a) ⇒ (b) & (c)“. ” • T ist abgeschlossen, falls (a) & (b) ⇒ (c)“. ” Eine Bemerkung zur Bezeichnung: Definition IV.4.1 ist nicht als Analogon zu Definition IV.3.1 zu verstehen; ein im Sinne von Definition IV.4.1 abgeschlossener Operator bildet i.a. nicht abgeschlossene Mengen auf abgeschlossene Mengen ab. Pr¨ aziser w¨ are der Begriff graphenabgeschlossen“, ” vgl. Lemma IV.4.2. F¨ ur eine lineare Abbildung T : X ⊃ D → Y (D ⊂ X Untervektorraum) ist der Graph von T definiert als gr(T ) := {(x, T x): x ∈ D} ⊂ X × Y. Lemma IV.4.2 Seien X, Y , D und T wie in Definition IV.4.1. (a) gr(T ) ist ein Untervektorraum von X × Y . (b) T ist genau dann abgeschlossen, wenn gr(T ) in X ⊕1 Y abgeschlossen ist. Beweis. (a) ist trivial, und (b) ist es letztendlich auch: gr(T ) ist genau dann abgeschlossen, wenn (xn , T xn ) → (x, y) ⇒ (x, y) ∈ gr(T )
IV.4
157
Der Satz vom abgeschlossenen Graphen
gilt, und das ist ¨ aquivalent zu xn → x, T xn → y
⇒
x ∈ D, T x = y, 2
d.h. zur Abgeschlossenheit von T .
Beispiele f¨ ur abgeschlossene Operatoren sind viele Differentialoperatoren. Wir behandeln den einfachsten Fall, den Ableitungsoperator f¨ ur Funktionen einer reellen Ver¨ anderlichen. Wir bezeichnen Ableitungen hier mit x˙ statt x . (a) Sei X = Y = C[−1, 1] und D = C 1 [−1, 1]. Der Operator T : X ⊃ D → Y sei durch T x = x˙ definiert. Ein bekannter Satz der Analysis u ¨ ber die Vertauschbarkeit von Differentiation und Limesbildung zeigt, daß T abgeschlossen ist. (b) Seien jetzt X = Y = L2 [−1, 1] und D und T wie oben. Dann ist T nicht abgeschlossen. Betrachte n¨ amlich xn (t) = (t2 + n1 )1/2 , x(t) = |t| und y(t) = 1, 0, −1, je nachdem, ob t > 0, t = 0 oder t < 0. Dann konvergiert (xn ) gleichm¨aßig gegen x, also erst recht in L2 [−1, 1], und (T xn ) konvergiert gegen y in L2 [−1, 1] (aber nicht gleichm¨ aßig), jedoch x ∈ / D. (c) Daß T in Beispiel (b) nicht abgeschlossen ist, liegt weniger an dem Operator als an seinem Definitionsbereich. Betrachten wir statt D = C 1 den Definitionsbereich D0 := {x ∈ L2 [−1, 1]: x ist absolutstetig und x˙ ∈ L2 [−1, 1]}. Zur Definition der Absolutstetigkeit sei auf Definition A.1.9 verwiesen. Nach dem Hauptsatz der Differential- und Integralrechnung in der Lebesgueversion, Satz A.1.10, existiert f¨ ur absolutstetige Funktionen x die Ableitung x˙ fast u berall und kann als Element von L1 [−1, 1] aufgefaßt werden. ¨ Wir werden zeigen, daß T : X ⊃ D0 → Y abgeschlossen ist. Seien dazu xn ∈ D0 , x, y ∈ L2 [−1, 1] mit xn → x und x˙ n → y in L2 [−1, 1]. F¨ ur alle t ∈ [−1, 1] gilt (vgl. Satz A.1.10) t xn (t) = xn (−1) + x˙ n (s) ds. −1
Daraus werden wir schließen, daß (xn ) gleichm¨aßig konvergiert. F¨ ur t ∈ [−1, 1] ist n¨amlich (der dritte Schritt benutzt die H¨oldersche Ungleichung) t t t x ˙ (s) ds − y(s) ds ≤ |x˙ n (s) − y(s)| ds n −1
−1
≤
−1 1 −1
≤
|x˙ n (s) − y(s)| ds 1
12 |x˙ n (s) − y(s)| ds
1
2
−1
−1
2
1 ds
12
158
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
√ = 2 T xn − y L2 → 0. Also gilt
t
−1
x˙ n (s) ds →
t
y(s) ds −1
gleichm¨aßig in t. Außerdem ist xn (−1) − xm (−1) = xn (t) − xm (t) +
t −1
x˙ m (s) − x˙ n (s) ds,
also (einsetzen und Dreiecksungleichung f¨ ur . L2 ) 1 |xn (−1) − xm (−1)| = √ 2 1 ≤ √ 2
1
12 |xn (−1) − xm (−1)| dt 2
−1
1
12 |xn (t) − xm (t)| dt 2
−1
1
+ −1
t −1
12 2 x˙ n (s) − x˙ m (s) ds dt ,
t so daß xn (−1) eine Cauchyfolge ist; denn die Folge −1 x˙ n (s) ds ist nach dem ersten Teil eine Cauchyfolge, und zwar gleichm¨ t aßig in t. Setze α = limn→∞ xn (−1) sowie z(t) = α + −1 y(s) ds. Die Funktion z ist absolutstetig als Integralfunktion einer L1 -Funktion, und es gilt z(t) ˙ = y(t) fast u ¨ berall, vgl. Satz A.1.10. Also gilt z ∈ D0 sowie T z = y. Da jedoch xn → z gleichm¨aßig und xn → x in L2 [−1, 1], ist x(t) = z(t) fast u ¨berall, ¨ also x = z als Aquivalenzklassen in L2 [−1, 1]. Deshalb ist T abgeschlossen. Den Zusammenhang zwischen stetigen und abgeschlossenen Operatoren stellt das folgende Lemma her. Die dort auftauchende Norm wird auch Graphennorm genannt. Lemma IV.4.3 Seien X und Y Banachr¨ aume, D ⊂ X ein Untervektorraum und T : X ⊃ D → Y abgeschlossen. Dann gilt: (a) D, versehen mit der Norm |||x||| = x + T x , ist ein Banachraum. (b) T ist als Abbildung von (D, ||| . |||) nach Y stetig. Beweis. (a) Ist (xn ) ⊂ D eine ||| . |||-Cauchyfolge, so sind (xn ) und (T xn ) jeweils . -Cauchyfolgen, und die Limiten x = lim xn und y = lim T xn existieren. Da T abgeschlossen ist, gilt x ∈ D und y = T x. Daraus folgt |||xn − x||| → 0. Also ist (D, ||| . |||) vollst¨ andig.
IV.4
Der Satz vom abgeschlossenen Graphen
(b) Das ist klar, da T x ≤ x + T x = |||x||| f¨ ur alle x ∈ D.
159 2
Der folgende Satz ist das Analogon zum Satz von der offenen Abbildung f¨ ur abgeschlossene Operatoren. Er zeigt insbesondere die Stetigkeit des inversen Operators eines abgeschlossenen Operators zwischen Banachr¨aumen. Satz IV.4.4 Seien X und Y Banachr¨ aume, D ⊂ X ein Untervektorraum und T : X ⊃ D → Y abgeschlossen und surjektiv. Dann ist T offen. Ist T zus¨ atzlich injektiv, so ist T −1 stetig. Beweis. Nach Lemma IV.4.3 und Theorem IV.3.3 ist T : (D, ||| . |||) → Y offen. Wegen x ≤ |||x||| f¨ ur alle x ∈ D ist jede . -offene Teilmenge von D auch ||| . |||-offen. Also ist T offen bez¨ uglich der Originalnormen, und T −1 ist stetig bez¨ uglich der Originalnormen. 2 Nun beweisen wir den Hauptsatz dieses Abschnitts. Theorem IV.4.5 (Satz vom abgeschlossenen Graphen) Es seien X und Y Banachr¨aume, und T : X → Y sei linear und abgeschlossen. Dann ist T stetig. Beweis. Nach Lemma IV.4.3 ist T stetig bez¨ uglich der Graphennorm ||| . ||| auf X. Nach Korollar IV.3.5 sind . und ||| . ||| ¨aquivalent, denn . ≤ ||| . |||, und beide erzeugen Banachr¨ aume (nach Voraussetzung bzw. Lemma IV.4.3). Also ist T stetig bez¨ uglich der Originalnorm. 2 Kurz formuliert besagt der Satz vom abgeschlossenen Graphen, daß ein auf einem ganzen Banachraum definierter abgeschlossener Operator automatisch stetig ist. Dieser Satz und Korollar IV.2.5 illustrieren, warum es praktisch unm¨oglich ist, einen unstetigen linearen Operator auf einem Banachraum explizit anzugeben. Als Anwendung soll nun ein Satz von Toeplitz u ¨ ber Summierbarkeitsmethoden gezeigt werden. Gegeben sei eine unendliche Matrix (aij )i∈N,j∈N . Einer Folge (si )i∈N kann dann eine Folge (σi )i∈N gem¨aß σi =
∞
aij sj
(IV.9)
j=1
zugeordnet werden, vorausgesetzt, die Reihen in (IV.9) konvergieren. Das bekannteste Beispiel ist die Ces` aro-Methode, wo aij = 1i f¨ ur j ≤ i und aij = 0 f¨ ur j > i. (Diese Summierbarkeitsmethode ist uns im Satz IV.2.11 bereits begegnet.) Toeplitz zeigte 1911 folgenden Satz, f¨ ur den Banach sp¨ater einen funktionalanalytischen Beweis gab.
160
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
Satz IV.4.6 Daf¨ ur, daß mittels (aij ) konvergente Folgen (si ) auf zum selben Limes konvergente Folgen (σi ) abgebildet werden, sind folgende Bedingungen notwendig und hinreichend: (a) limi→∞ ur alle j, ∞aij = 0 f¨ (b) supi j=1 |aij | < ∞, ∞ (c) limi→∞ j=1 aij = 1. Beweis. Wir schreiben Ax = (σi ) f¨ ur eine Folge x = (si ). Zuerst wird gezeigt, daß (a), (b) und (c) zusammen hinreichend sind. Aus (b) folgt n¨amlich unmittelbar, daß A eine stetige lineare Abbildung von ∞ in sich definiert. Ferner zeigen (a) und (b), daß A Nullfolgen auf ¨ Nullfolgen abbildet (f¨ ur die Ces`aro-Methode ist das eine klassische Ubungsaufgabe der Analysis), und (c) liefert die Konvergenz von A1 gegen 1, wo 1 = (1, 1, 1, . . .). Daraus ergibt sich die Hinl¨ anglichkeit. Als n¨achstes wird die Notwendigkeit von (a) und (c) bewiesen. Das ist klar, da (a) ¨aquivalent dazu ist, daß Aej ∈ c0 f¨ ur alle j ∈ N ist (ej = jter Einheitsvektor), und da (c) ¨ aquivalent zu A1 ∈ c mit lim A1 = 1 ist. Kommen wir nun zur Notwendigkeit von (b), die der interessanteste Aspekt dieses Satzes ist. Nach Voraussetzung kann A als lineare Abbildung von c0 nach c0 aufgefaßt werden. Wegen der Isometrie c0 ∼ = 1 ist (b) zur Stetigkeit von A ¨aquivalent; diese ist also zu zeigen. Nach Theorem IV.4.5 gen¨ ugt es, die Abgeschlossenheit von A zu zeigen, die ihrerseits folgt, sobald die Implikation xn → 0, Axn → y ⇒ y=0 bewiesen ist. Zum Beweis ur sei i fixiert. F¨ ur alle Nullfolgen x = (sj ) ∞ hierf¨ konvergiert die Reihe j=1 aij sj =: (x) nach Voraussetzung. Das lineare Funktional : c0 → K ist punktweiser Limes der stetigen linearen Funkn tionale n (x) := j=1 aij sj , also selbst stetig (Korollar IV.2.5). Es folgt ∞ (aij )j∈N ∈ 1 , d.h. ur festes i ∈ N und j=1 |aij | < ∞. Deshalb gilt f¨ (n)
xn = (sj )j∈N → 0 (n)
σi
=
∞
(n)
aij sj
→ 0.
j=1
Daher konvergiert (Axn ) komponentenweise gegen 0. Falls also (Axn ) bez¨ uglich . konvergiert, muß der Limes = 0 sein, was nur zu zeigen war. 2
IV.5
Der Satz vom abgeschlossenen Bild
In Korollar III.4.6 wurde ein Kriterium f¨ ur die L¨osbarkeit der Operatorgleichung T x = y f¨ ur stetige lineare Operatoren mit abgeschlossenem Bild angegeben. Das folgende Kriterium ist n¨ utzlich, um diese Voraussetzung zu u ufen. ¨berpr¨
IV.5
161
Der Satz vom abgeschlossenen Bild
Theorem IV.5.1 (Satz vom abgeschlossenen Bild) X und Y seien Banachr¨ aume, und es sei T ∈ L(X, Y ). Dann sind folgende Aussagen ¨ aquivalent. (i) ran(T ) ist abgeschlossen. (ii) ran(T ) = ker(T )⊥ (iii) ran(T ) ist abgeschlossen. (iv) ran(T ) = ker(T )⊥ Die Bezeichnungen U ⊥ und V⊥ wurden in (III.4) und (III.5) eingef¨ uhrt. Zum Beweis werden zwei Lemmata ben¨ otigt, die von eigenem Interesse sind. Lemma IV.5.2 X und Y seien Banachr¨aume, und T ∈ L(X, Y ) habe abgeschlossenes Bild. Dann existiert K ≥ 0 mit: ∀y ∈ ran(T ) ∃x ∈ X: T x = y und x ≤ K y Beweis. Betrachte die kanonische Faktorisierung T
X @ @
@ R @ X/ ker(T )
- ran(T ) T
Hier ist T bijektiv und stetig zwischen den Banachr¨aumen (!) X/ ker(T ) und ran(T ). Nach Korollar IV.3.4 ist T−1 stetig; nach Definition der Quotientennorm gilt daher die Aussage f¨ ur alle K mit K > T−1 . 2 Lemma IV.5.3 X und Y seien Banachr¨ aume, und es sei T ∈ L(X, Y ). Es existiere c > 0 mit c y ≤ T y
∀y ∈ Y .
Dann ist T offen und insbesondere surjektiv. Beweis. Setze wie in Abschnitt IV.3 Uε = {x ∈ X: x < ε}, Vε = {y ∈ Y : y < ε}. Es reicht nach Lemma IV.3.2, Vc ⊂ T (U1 ) zu zeigen. Dazu gen¨ ugt es, Vc ⊂ T (U1 ) =: D zu zeigen, wie der zweite Teil des Beweises von Theorem IV.3.3 klarmacht. Sei also y0 ∈ Vc , d.h. y0 < c. W¨ are y0 ∈ / D, so existierten nach dem Trennungssatz von Hahn-Banach (Satz III.2.5) y ∈ Y und α ∈ R mit Re y (y) ≤ α < Re y (y0 ) ≤ |y (y0 )|
∀y ∈ D.
162
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
Wegen 0 ∈ D ist α ≥ 0, und man darf α > 0 annehmen; indem man schließlich y durch y /α ersetzt, sieht man, daß ohne Einschr¨ankung sogar α = 1 ist. Da D mit y auch λy f¨ ur |λ| ≤ 1 enth¨alt, erh¨alt man, daß dann sogar |y (y)| ≤ 1 < |y (y0 )| ∀y ∈ D. Es folgt f¨ ur alle x mit x < 1 (so daß T x ∈ D) |(T y )(x)| = |y (T x)| ≤ 1, also T y ≤ 1. Ferner gilt |y (y0 )| ≤ y y0 < c y , also c y > 1 im Widerspruch zur vorausgesetzten Ungleichung. Also muß y0 ∈ D sein, womit das Lemma bewiesen ist. 2 Beachte, wie Lemma IV.5.3 die Aussage von Satz III.4.5 T hat dichtes Bild ⇐⇒ T ist injektiv versch¨arft. Beweis von Theorem IV.5.1: (i) ⇔ (ii): Das ist Satz III.4.5 (⇒) bzw. trivial (⇐). (i) ⇒ (iv): Zun¨ achst gilt (auch ohne Voraussetzung (i)) ran(T ) ⊂ ⊥ ker(T ) , denn T y (x) = y (T x) = 0 f¨ ur x ∈ ker(T ). Sei nun x ∈ ker(T )⊥ . Betrachte die wohldefinierte lineare Abbildung z : ran(T ) → K, y → x (x) falls T x = y. z ist stetig: Sei n¨ amlich K wie in Lemma IV.5.2. Dann ist f¨ ur y ∈ ran(T ) und geeignetes x mit T x = y |z (y)| = |x (x)| ≤ x x ≤ x K y . Sei y ∈ Y eine Hahn-Banach-Fortsetzung von z ; dann ist x = T y , da x (x) = z (T x) = y (T x) = (T y )(x)
∀x ∈ X.
Das zeigt ker(T )⊥ ⊂ ran(T ). (iv) ⇒ (iii): Klar, da Annihilatoren abgeschlossen sind. (iii) ⇒ (i): Betrachte den abgeschlossenen Unterraum Z = ran(T ) von Y und S ∈ L(X, Z), definiert durch Sx = T x. F¨ ur y ∈ Y und x ∈ X ist dann $ % (T y )(x) = y (T x) = y |Z (Sx) = S (y |Z ) (x),
163
IV.6 Projektionen auf Banachr¨ aumen
d.h. T (y ) = S (y |Z ); folglich gilt ran(T ) ⊂ ran(S ). Ist umgekehrt S (z ) ∈ ran(S ), so gilt nach dem obigen Argument S z = T y f¨ ur jede HahnBanach-Fortsetzung y ∈ Y von z ∈ Z , zusammen also ran(T ) = ran(S ). Insbesondere ist nach Voraussetzung ran(S ) abgeschlossen. Da S dichtes Bild hat, ist nach Satz III.4.5 S injektiv; S ist daher eine stetige Bijektion zwischen den Banachr¨ aumen Z und ran(S ). Zwischen diesen R¨aumen wirkt S als Isomorphismus (Korollar IV.3.4), insbesondere gilt f¨ ur ein c > 0 c z ≤ S z
∀z ∈ Z .
Nach Lemma IV.5.3 ist ran(S) = Z, also ran(T ) = Z, und T hat abgeschlossenes Bild. 2 In Abschnitt VIII.9 wird der Satz vom abgeschlossenen Bild erneut von einem allgemeineren Standpunkt aus analysiert; außerdem sei auf Aufgabe VII.5.19 verwiesen.
IV.6
Projektionen auf Banachr¨ aumen
Eine Projektion auf einem Vektorraum ist eine Abbildung mit P 2 = P . In der linearen Algebra wird gezeigt, daß es zu jedem Untervektorraum U eines Vektorraums X einen Komplement¨ arraum V derart gibt, daß X algebraisch isomorph zur direkten Summe U ⊕ V ist. Die zugeh¨orige Projektion von X auf U ist dann linear. (All das folgt aus dem Basiserg¨anzungssatz.) Ist X zus¨atzlich normiert, ist man an der Existenz stetiger linearer Projektionen interessiert. Außerdem m¨ ochte man wissen, ob der normierte Raum X nicht nur algebraisch, sondern auch topologisch isomorph zu U ⊕ V , wie u ¨ blich versehen mit einer der Normen aus Satz I.3.3, ist, mit anderen Worten, ob (un + vn ) genau dann konvergiert, wenn es (un ) und (vn ) tun. Man spricht dann von einer topologisch direkten Zerlegung. Zun¨achst eine einfache Beobachtung. Lemma IV.6.1 Sei P eine stetige lineare Projektion auf dem normierten Raum X. (a) Entweder ist P = 0 oder P ≥ 1. (b) Der Kern ker(P ) und das Bild ran(P ) sind abgeschlossen. (c) Es gilt X ker(P ) ⊕ ran(P ). Beweis. (a) Aus P = P 2 ≤ P 2 folgt sofort P = 0 oder P ≥ 1. (b) Der Kern ker(P ) = P −1 {0} ist abgeschlossen, da P stetig ist. Auch Id − P ist eine stetige Projektion, und ran(P ) = ker(Id − P ) ist ebenfalls abgeschlossen. (c) Es ist klar, daß X algebraisch mit der direkten Summe ker(P ) ⊕ ran(P ) identifiziert werden kann, denn jedes Element x l¨aßt sich als x =
164
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
(Id − P )(x) + P (x) schreiben. Daß die Summe topologisch direkt ist, folgt aus der Stetigkeit von P . 2 Beispiele. (a) Auf Lp (R), 1 ≤ p ≤ ∞, definiert f → χ[0,1] f eine stetige lineare Projektion mit P = 1. Das Bild von P ist zu Lp [0, 1] isometrisch isomorph. (b) Die im Beweis von Korollar II.3.6 definierten Operatoren auf Lp [0, 1] sind ebenfalls kontraktive lineare Projektionen. (c) In Satz IV.6.5 wird gezeigt, daß es keine stetige lineare Projektion von ∞ auf c0 gibt. Satz IV.6.2 Ist U ein endlichdimensionaler Unterraum des normierten Raums X, so existiert eine stetige lineare Projektion P von X auf U mit P ≤ dim U . Beweis. Sei {b1 , . . . , bn } eine Auerbachbasis von U , d.h., eine Basis wie in Satz II.2.6. Setze die Funktionale bi aus diesem normerhaltend zu Satz n Funktionalen xi ∈ X fort; die Abbildung P (x) = i=1 xi (x)bi leistet dann das Geforderte. 2 Im n¨achsten Satz zeigen wir eine Umkehrung von Lemma IV.6.1 im Fall eines Banachraums X. Satz IV.6.3 Sei X ein Banachraum und U ein abgeschlossener Unterraum. Es existiere ein abgeschlossener Komplement¨ arraum V zu U ; X ist also algebraisch isomorph zur direkten Summe U ⊕ V . Dann gelten: (a) X ist topologisch (d.h., als Banachraum) isomorph zu U ⊕1 V . (b) Es existiert eine stetige lineare Projektion von X auf U . (c) Es gilt V X/U . Beweis. (a) Da U und V abgeschlossen im Banachraum X sind, sind es selbst Banachr¨aume, und deshalb ist die normierte Summe U ⊕1 V ein Banachraum. Ferner ist die Abbildung U ⊕1 V → X, (u, v) → u + v linear, bijektiv nach Voraussetzung und stetig wegen der Dreiecksungleichung. Nach Korollar IV.3.4 folgt die Behauptung. (b) Nach Teil (a) existiert M ≥ 0 mit u + v ≤ M u + v f¨ ur alle u ∈ U , v ∈ V . Die wohldefinierte lineare Projektion u + v → u ist also stetig. (c) Die Abbildung V → X/U , v → [v], ist linear, bijektiv und stetig. Da X/U ein Banachraum ist (Satz I.3.2), folgt die Behauptung wieder aus Korollar IV.3.4. 2 In Kapitel V wird gezeigt, daß abgeschlossene Unterr¨aume von L2 oder stets abgeschlossene Komplement¨ arr¨ aume besitzen. Abschließend zeigen 2
IV.6
165
Projektionen auf Banachr¨ aumen
wir nun, daß das im Fall eines beliebigen Banachraums nicht zu gelten braucht. Zur Formulierung des Gegenbeispiels f¨ uhren wir eine neue Sprechweise ein. Definition IV.6.4 Ein abgeschlossener Teilraum U eines Banachraums X heißt komplementiert, falls es eine stetige lineare Projektion von X auf U gibt. Satz IV.6.5 Der Unterraum c0 von ∞ ist nicht komplementiert. Zum Beweis ben¨ otigen wir ein kombinatorisches Lemma. Lemma IV.6.6 Es gibt ¨ uberabz¨ ahlbar viele unendliche Teilmengen Ni von N, so daß Ni ∩ Nj f¨ ur i = j endlich ist. Beweis. Sei {q1 , q2 , . . .} eine Aufz¨ ahlung von Q und I = R \ Q. Zu i ∈ I w¨ahle eine Folge rationaler Zahlen, die gegen i konvergiert. Setze dann Ni = {n ∈ N: qn ist in dieser Folge}. Das System der Ni hat die gew¨ unschten Eigenschaften. 2 Kommen wir nun zum Beweis von Satz IV.6.5. W¨are c0 komplementiert, g¨abe es einen abgeschlossenen Komplement¨arraum V zu c0 , und nach Satz IV.6.3 w¨are V ∞ /c0 . Insbesondere w¨are ∞ /c0 isomorph zu einem abgeschlossenen Unterraum von ∞ . Wir werden zeigen, daß diese Annahme zu einem Widerspruch f¨ uhrt. Auf ∞ gibt es eine punktetrennende abz¨ ahlbare Menge von Funktionalen, etwa die Auswertungen δn : x → x(n), also l¨aßt auch V so eine Menge zu und der nach Annahme dazu isomorphe Banachraum X := ∞ /c0 ebenfalls. Es existiert also eine Folge von Funktionalen xn ∈ X mit xn (x) = 0 ∀n ∈ N
⇒ x = 0.
(IV.10)
Wir w¨ahlen nun Teilmengen Ni ⊂ N, wo i eine u ¨ berabz¨ahlbare Indexmenge ¨ I durchl¨auft, gem¨ aß Lemma IV.6.6 und betrachten die Aquivalenzklassen xi := [χNi ] ∈ X. Hier bezeichnet χN die Folge mit χN (n) = 1 f¨ ur n ∈ N und χN (n) = 0 sonst. Es sind dann alle xi = 0. Als erstes zeigen wir jetzt: • F¨ ur alle x ∈ X ist {i ∈ I: x (xi ) = 0} abz¨ ahlbar.
(IV.11)
Sei x ∈ X . Zum Beweis von (IV.11) ist nur zu zeigen, daß I0 := {i ∈ I: |x (xi )| ≥ ε} f¨ ur jedes ε > 0 endlich ist. In der Tat: Seien i1 , . . . , ir ∈ I0 . W¨ahle α mit |αk | = 1 und x (αk xik ) = |x (xik )|. Nach Konstruktion der k r xi ist k=1 αk xik ≤ 1, da die Ni fast“ disjunkt sind. Also gilt ” r r εr ≤ |x (xik )| = x αk xik ≤ x ,
k=1
k=1
daher enth¨alt I0 h¨ ochstens x /ε Elemente. Nach (IV.11) gilt nun f¨ ur die oben gew¨ ahlte Folge (xn ):
166
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
• {i ∈ I: xn (xi ) = 0 f¨ ur ein n ∈ N} ist abz¨ ahlbar. Folglich existiert xi0 (= 0!) mit xn (xi0 ) = 0 f¨ ur alle n ∈ N im Widerspruch zu (IV.10). 2 Die Aussage von Satz IV.6.5 kann auch so interpretiert werden, daß es keine stetige Fortsetzung des identischen Operators Id: c0 → c0 zu einem stetigen Operator P : ∞ → c0 gibt; in der Tat w¨are eine solche Fortsetzung eine stetige Projektion von ∞ auf c0 . Daher ist im allgemeinen kein Fortsetzungssatz vom Hahn-Banach-Typ f¨ ur Operatoren statt Funktionale zu erwarten.
IV.7
Fixpunkts¨ atze
Unter einem Fixpunktsatz versteht man eine Aussage, die f¨ ur gewisse Klassen von Selbstabbildungen F : M → M auf gewissen (nicht leeren!) Mengen die Existenz von Fixpunkten garantiert, also von Punkten ξ ∈ M mit F (ξ) = ξ. Viele Gleichungen der reinen und angewandten Mathematik k¨onnen in ein ¨ aquivalentes Fixpunktproblem u uhrt werden (siehe ¨berf¨ z.B. Korollar IV.7.19); daher sind Fixpunktmethoden zu einem universellen Mittel zum Beweis der L¨ osbarkeit solcher Gleichungen geworden. In den Analysisvorlesungen begegnet man dem Banachschen Fixpunktsatz und dem Brouwerschen Fixpunktsatz. In diesem Abschnitt wollen wir funktionalanalytische Verallgemeinerungen dieser S¨atze kennenlernen; wir werden hier in der Regel auf konvexen Teilmengen von Banachr¨aumen definierte nichtlineare Abbildungen studieren. Beginnen wir mit Ausdehnungen des Banachschen Fixpunktsatzes; doch zuerst soll an diesen Satz selbst erinnert werden. • (Banachscher Fixpunktsatz) Sei (M, d) ein nicht leerer vollst¨ andiger metrischer Raum, und sei F : M → M eine strikte1 Kontraktion; d.h., es existiert eine Zahl q < 1 mit d(F (x), F (y)) ≤ q d(x, y)
∀x, y ∈ M.
(IV.12)
Dann besitzt F genau einen Fixpunkt. Genauer gilt: Ist x0 ∈ M beliebig, so konvergiert die durch xn+1 = F (xn ), n ≥ 0,
(IV.13)
1 In der Literatur spricht man h¨ aufig bloß von einer Kontraktion, was jedoch mit der Nomenklatur der linearen Funktionalanalysis nicht immer kompatibel ist, wo man lineare Operatoren mit Norm ≤ 1 kontraktiv nennt.
IV.7
167
Fixpunkts¨ atze
definierte Iterationsfolge gegen den eindeutig bestimmten Fixpunkt ξ, und zwar ist qn d(xn , ξ) ≤ d(x1 , x0 ). 1−q Die Grundidee des Beweises, der in praktisch allen Analysisb¨ uchern zu finden ist, soll kurz in Erinnerung gerufen werden. Durch einen Te k−1 leskopsummentrick sch¨ atzt man d(xn+k , xn ) ≤ d(x , x ) n+j+1 n+j ≤ j=0 k−1 n+j d(x1 , x0 ) ab. Das zeigt, daß (xn ) eine Cauchyfolge ist; der Grenzj=0 q wert ξ muß dann ein Fixpunkt sein. Durch Grenz¨ ubergang k → ∞ folgt die behauptete a-priori-Absch¨ atzung f¨ ur d(xn , ξ), und die Eindeutigkeit des Fixpunkts ist eine unmittelbare Konsequenz von (IV.12). Als n¨achstes soll es darum gehen, Abbildungen, die (IV.12) mit q = 1 erf¨ ullen, auf Fixpunkte zu untersuchen. Solche Abbildungen tragen einen speziellen Namen. Definition IV.7.1 Eine Abbildung F : M → M auf einem metrischen Raum (M, d) heißt nichtexpansiv, wenn d(F (x), F (y)) ≤ d(x, y)
∀x, y ∈ M.
Mit anderen Worten ist eine solche Abbildung eine Lipschitzabbildung mit Lipschitzkonstante ≤ 1; insbesondere ist sie stetig. Sehr einfache Beispiele zeigen, daß der Banachsche Fixpunktsatz nicht f¨ ur nichtexpansive Abbildungen zu gelten braucht: Weder die Existenz bleibt gew¨ahrleistet (z.B. F (x) = 1 − x auf M = {0, 1}), noch die Eindeutigkeit (z.B. F (x) = x auf M = {0, 1}), noch die Konvergenz der Iterationsfolge (z.B. F (x) = 1 − x auf M = [0, 1]; hier konvergiert die Iterationsfolge aus (IV.13) genau dann, wenn der Startpunkt der Fixpunkt 1/2 ist). Der Vergleich des ersten Beispiels mit dem dritten legt die Vermutung nahe, daß die mangelnde Konvexit¨ at von {0, 1} etwas mit der Nichtexistenz von Fixpunkten zu tun hat. In der Tat werden wir positive Resultate f¨ ur nichtexpansive Abbildungen, die auf konvexen Teilmengen gewisser Banachr¨aume wie Lp f¨ ur 1 < p < ∞ definiert sind, erzielen. Daß die Konvexit¨at allein nicht weiterhilft, zeigt jedoch das folgende Beispiel. Seien C = {f ∈ C[0, 1]: 0 ≤ f ≤ 1, f (1) = 1} und F : C → C, (F f )(t) = t f (t). Versieht man C[0, 1] mit der Supremumsnorm, so ist C abgeschlossen, beschr¨ ankt und konvex, und F ist nichtexpansiv. Der einzige Kandidat f¨ ur einen Fixpunkt ist aber die Nullfunktion, und die geh¨ort nicht zu C. Also ist F fixpunktfrei. Wir werden im n¨ achsten Satz sehen, daß solche fixpunktfreien Abbildungen im Raum L2 = L2 (Ω, Σ, μ) nicht auftreten k¨onnen. Zuerst formulieren wir ein Lemma, das stets die Existenz von approximativen Fixpunkten“ ” garantiert.
168
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
Lemma IV.7.2 Sei C eine nicht leere, abgeschlossene, konvexe Teilmenge eines Banachraums, und es sei F : C → C nichtexpansiv sowie F (C) beschr¨ankt. Dann existiert eine Folge (xn ) in C mit F (xn ) − xn → 0. Beweis. Sei p ∈ C beliebig, und betrachte zu 0 < λ ≤ 1 die Abbildung Fλ : C → C,
Fλ (x) = λp + (1 − λ)F (x);
da C konvex ist, bildet Fλ die Menge C wirklich in sich ab. Offensichtlich ist Fλ strikt kontraktiv mit der Konstanten q = 1 − λ; nach dem Banachschen Fixpunktsatz besitzt Fλ genau einen Fixpunkt ξλ . Macht man diese ¨ Uberlegung f¨ ur λ = 1/n und setzt man xn = ξ1/n , so erh¨alt man F (xn ) − xn = F (xn ) − F1/n (xn ) =
1 p − F (xn ) → 0, n
da F (xn ) in der beschr¨ ankten Menge F (C) liegt.
2
Hieraus ergibt sich ein sehr einfacher Fixpunktsatz. Lemma IV.7.3 Sei C eine nicht leere, abgeschlossene, konvexe Teilmenge eines Banachraums, und sei F : C → C stetig. Existiert eine Folge mit F (xn ) − xn → 0 und ist F (C) relativkompakt, so besitzt F einen Fixpunkt. Insbesondere besitzt eine nichtexpansive Abbildung F : C → C mit relativkompaktem Bild einen Fixpunkt. Beweis. W¨ahle eine Teilfolge von (xn ), f¨ ur die (F (xnk )) konvergiert, etwa gegen ξ. Dann konvergiert auch (xnk ) gegen ξ, und da C abgeschlossen ist, folgt ξ ∈ C. Die Stetigkeit von F liefert F (xnk ) → F (ξ), und das zeigt F (ξ) = ξ, da der Grenzwert eindeutig ist. Der Zusatz folgt aus Lemma IV.7.2. 2 Eine tiefliegende Verallgemeinerung werden wir im Schauderschen Fixpunktsatz (Theorem IV.7.18) kennenlernen. Nun zu dem bereits angek¨ undigten Satz u ¨ ber nichtexpansive Abbildungen in L2 = L2 (Ω, Σ, μ). Im folgenden Beweis schreiben wir f, g = f g dμ; Ω
wer mit dem Begriff des Hilbertraums aus Kapitel V bereits vertraut ist, wird erkennen, daß sich der n¨ achste Satz samt Beweis w¨ortlich auf den Fall eines beliebigen Hilbertraums statt L2 u ¨ bertragen l¨aßt. Satz IV.7.4 Sei ∅ = C ⊂ L2 abgeschlossen, konvex und beschr¨ankt, und sei F : C → C nichtexpansiv. Dann besitzt F einen Fixpunkt.
IV.7
169
Fixpunkts¨ atze
Beweis. W¨ahle mit Lemma IV.7.2 eine Folge (xn ) in C mit F (xn )−xn 2 → 0. Da L2 reflexiv und (xn ) beschr¨ ankt ist, existiert nach Theorem III.3.7 eine schwach konvergente Teilfolge; ohne Einschr¨ankung nehmen wir an, daß (xn ) selbst schwach konvergiert, etwa gegen ξ. Nach Satz III.3.8 gilt ξ ∈ C; wir werden ξ als Fixpunkt von F erkennen. Zun¨achst hat man xn − F (ξ) 22 = (xn − ξ) + (ξ − F (ξ)) 22 = xn − ξ 22 + 2 Rexn − ξ, ξ − F (ξ) + ξ − F (ξ) 22 . Da (xn − ξ) eine schwache Nullfolge ist, strebt der mittlere Term gegen 0; also folgt xn − F (ξ) 22 − xn − ξ 22 → ξ − F (ξ) 22 . (IV.14) Andererseits gilt xn − F (ξ) 2 ≤ xn − F (xn ) 2 + F (xn ) − F (ξ) 2 ≤ xn − F (xn ) 2 + xn − ξ 2 , da F nichtexpansiv ist. Weil der vorletzte Summand gegen 0 strebt, folgt lim sup( xn − F (ξ) 2 − xn − ξ 2 ) ≤ 0 und deshalb auch lim sup( xn − F (ξ) 22 − xn − ξ 22 ) ≤ 0.
(IV.15)
Vergleicht man (IV.14) mit (IV.15), erkennt man F (ξ) = ξ, wie behauptet. 2 Im Hinblick auf eine weitere Anwendung formulieren wir den Kern des vorstehenden Beweises separat als Lemma. Lemma IV.7.5 Sei ∅ = C ⊂ L2 abgeschlossen, konvex und beschr¨ ankt, und sei F : C → C nichtexpansiv. Ist (xn ) eine schwach konvergente Folge in C mit F (xn ) − xn → 0, so ist ihr schwacher Grenzwert ein Fixpunkt von F . Da man diese Aussage auch durch die Implikation xn → ξ schwach, (Id − F )(xn ) → 0
⇒
ξ ∈ C, (Id − F )(ξ) = 0
ausdr¨ ucken kann, wird deutlich, daß es sich hier um eine Variante der Abgeschlossenheit eines Operators handelt; vergleiche mit Definition IV.4.1. Man nennt diese Eigenschaft die Demiabgeschlossenheit des nichtlinearen Operators Id − F .
170
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
Wir haben bereits oben bemerkt, daß die Iterationsfolge xn+1 = F (xn ) f¨ ur nichtexpansives F nicht zu konvergieren braucht. Die Situation verbessert sich, wenn man statt F die ebenfalls nichtexpansive Abbildung G = 12 (Id + F ) betrachtet, die ja dieselben Fixpunkte wie F besitzt. (Ist F : C → C auf einer konvexen Menge definiert, so bildet auch G die Menge C in sich ab.) Wir wollen nun die durch xn+1 = G(xn ) =
xn + F (xn ) 2
(IV.16)
definierte Iteration auf L2 studieren. Satz IV.7.6 Sei ∅ = C ⊂ L2 abgeschlossen, konvex und beschr¨ankt, und sei F : C → C nichtexpansiv sowie x0 ∈ C beliebig. Dann konvergiert die durch (IV.16) definierte Folge (xn ) schwach gegen einen Fixpunkt von F . Wieder kann ein erfahrener Leser statt L2 einen beliebigen Hilbertraum einsetzen. Dem Beweis schicken wir ein Lemma voraus. Lemma IV.7.7 Unter den obigen Voraussetzungen gilt F (xn ) − xn 2 → 0. Beweis. Wir benutzen die unmittelbar zu verifizierende Parallelogramm” gleichung“ (vgl. Satz V.1.7) u + v 22 + u − v 22 = 2 u 22 + 2 v 22 f¨ ur u, v ∈ L2 . Sei nun ξ ein beliebiger Fixpunkt von F , dessen Existenz nach Satz IV.7.4 gesichert ist. Wir setzen u = F (xn ) − F (ξ),
v = xn − ξ,
so daß u + v = 2(xn+1 − ξ),
u − v = F (xn ) − xn .
Die Parallelogrammgleichung liefert 4 xn+1 − ξ 22 + F (xn ) − xn 22 = 2 F (xn ) − F (ξ) 22 + 2 xn − ξ 22 ≤ 4 xn − ξ 22 . Es folgt F (xn ) − xn 22 ≤ 4( xn − ξ 22 − xn+1 − ξ 22 ). Durch Aufsummieren erh¨ alt man dann (Teleskopsumme) N n=0
F (xn ) − xn 22 ≤ 4( x0 − ξ 22 − xN +1 − ξ 22 ) ≤ 4 x0 − ξ 22 .
IV.7
171
Fixpunkts¨ atze
Daher konvergiert die Summe ist gezeigt.
∞ n=0
F (xn ) − xn 22 , und die Behauptung 2
Wegen F (xn ) − xn = 2(xn+1 − xn ) = 2(Gn+1 (x0 ) − Gn (x0 )) gilt also stets Gn+1 (x0 ) − Gn (x0 ) → 0; diese Eigenschaft von G wird asymptotische Regularit¨ at genannt. Beweis von Satz IV.7.6. Es sei Φ ⊂ C die Menge aller Fixpunkte von F . Dann ist Φ = ∅ nach Satz IV.7.4, Φ ist abgeschlossen, da F stetig ist, und Φ ist gem¨aß Aufgabe IV.8.32 konvex, denn L2 ist strikt konvex. F¨ ur alle y ∈ Φ ist xn+1 − y 2 = G(xn ) − G(y) 2 ≤ xn − y 2 , denn mit F ist auch G nichtexpansiv. Daher kann man eine Funktion ϕ: Φ → R durch ϕ(y) = lim xn − y 2 = inf xn − y 2 n→∞
n
definieren. Die umgekehrte Dreiecksungleichung zeigt, daß ϕ stetig ist, und die Dreiecksungleichung impliziert, daß ϕ eine konvexe Funktion in dem Sinn ist, daß die Mengen Φr = {y ∈ Φ: ϕ(y) ≤ r} konvex (und wegen der Stetigkeit abgeschlossen) sind. Wir wollen begr¨ unden, daß ϕ sein Infimum ρ auf Φ annimmt. Das folgt im Prinzip aus Satz III.5.8 und Lemma III.5.9; wir wollen das Argument noch einmal ausf¨ uhren: W¨ ahle eine Folge (yn ) in Φ mit ϕ(yn ) → ρ. Da L2 reflexiv und Φ als Teilmenge von C beschr¨ ankt ist, existiert eine schwach konvergente Teilfolge (ynk ), etwa mit schwachem Grenzwert ξ. Da die Φr f¨ ur jedes r > ρ abgeschlossen und konvex sind und (ynk ) f¨ ur große k in Φr liegt, folgt mit Satz III.3.8 ξ ∈ Φr und deshalb ξ ∈ r>ρ Φr = Φρ . Daher gilt ϕ(ξ) = ρ. Sei nun (xnk ) eine schwach konvergente Teilfolge von (xn ) mit Grenzwert z. Da nach Lemma IV.7.7 F (xn )− xn 2 → 0 gilt, zeigt Lemma IV.7.5 z ∈ Φ. Wir beweisen nun z = ξ. Es ist ja xnk − ξ 22 = xnk − z 22 + 2 Rexnk − z, z − ξ + z − ξ 22 , wo der mittlere Term gegen 0 strebt. Deshalb ist ϕ(ξ)2 = ϕ(z)2 + z − ξ 22 ≥ ϕ(ξ)2 + z − ξ 22 und in der Tat z = ξ. Das letzte Argument impliziert, daß jede Teilfolge von (xn ) eine weitere Teilfolge hat, die schwach gegen ξ konvergiert; daraus erh¨alt man aber (wie?) die schwache Konvergenz von (xn ) gegen ξ. 2 Korollar IV.7.8 Hat zus¨ atzlich zu den Voraussetzungen des letzten Satzes F relativkompaktes Bild, so ist (xn ) sogar normkonvergent.
172
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
Beweis. Man muß im obigen Beweis nur schwach konvergente Teilfolgen durch normkonvergente Teilfolgen ersetzen; beachte, daß Φ als abgeschlossene Teilmenge von F (C) kompakt ist. 2 Argumentativ ist bei den letzten beiden Resultaten zu bemerken, daß hier ein konstruktives Verfahren zur Bestimmung eines Fixpunkts angegeben wird, der Konvergenzbeweis jedoch auf der zuvor bewiesenen Existenz von Fixpunkten basiert. Die Kenntnis der bloßen Existenz der L¨osung eines Problems kann also bisweilen hilfreich sein, um die Konvergenz eines L¨osungsverfahrens zu zeigen. Das n¨achste Ziel dieses Abschnitts wird es sein, einen Satz IV.7.4 entsprechenden Fixpunktsatz f¨ ur eine gr¨ oßere Klasse von Banachr¨aumen zu beweisen, zu der auch die Lp - und p -R¨ aume f¨ ur 1 < p < ∞ geh¨oren, n¨amlich f¨ ur die gleichm¨ aßig konvexen R¨ aume, die wie folgt definiert sind. Definition IV.7.9 Ein Banachraum (X, . ) heißt gleichm¨ aßig konvex, wenn es zu jedem ε > 0 ein δ > 0 mit der Eigenschaft x + y x , y ≤ 1, x − y ≥ ε ⇒ ≤ 1−δ 2 gibt. Man nennt x + y " # δX : ε → inf 1 − : x , y ≤ 1, x − y ≥ ε 2 den Konvexit¨ atsmodul von X. Beachte, daß diese Eigenschaft isometrischer Natur ist und sich auf die gegebene Norm von X bezieht; die gleichm¨ aßige Konvexit¨at bleibt beim ¨ Ubergang zu einer a quivalenten Norm in der Regel nicht erhalten. ¨ Offensichtlich ist X genau dann gleichm¨ aßig konvex, wenn f¨ ur alle ε > 0 auch δX (ε) > 0 ist, und offensichtlich ist ein gleichm¨aßig konvexer Raum strikt konvex (vgl. Aufgabe I.4.13), d.h. x + y x , y ≤ 1, x = y ⇒ (IV.17) < 1; 2 die Umkehrung gilt jedoch nicht (Aufgabe IV.8.35). Die strikte Konvexit¨at eines Raums bedeutet, daß keine Strecken im Rand der Einheitskugel liegen (sie ist also rund“); die gleichm¨ aßige Konvexit¨at bietet zudem eine ” quantitative Version dieser Idee: In der N¨ ahe des Randes k¨onnen nur kurze Strecken liegen. Ein Beispiel eines gleichm¨ aßig konvexen Raums ist der Raum L2 (oder allgemeiner ein Hilbertraum, siehe Kapitel V), denn dort gilt nach der bereits erw¨ahnten Parallelogrammgleichung x + y 22 + x − y 22 = 2 x 22 + 2 y 22
(IV.18)
IV.7
173
Fixpunkts¨ atze
und deshalb x 2 , y 2 ≤ 1, x − y 2 ≥ ε
⇒ )
sowie δL2 (ε) = 1 −
1−
) x + y ε 2 ≤ 1− 2 2 2 ε 2
> 0. 2 Wir werden nun zeigen, daß die R¨ aume reell- oder komplexwertiger Funktionen Lp = Lp (Ω, Σ, μ) f¨ ur 1 < p < ∞ gleichm¨aßig konvex sind. F¨ ur 2 ≤ p < ∞ findet man ein Argument in Aufgabe I.4.18; der Fall 1 < p < 2 ist aber nicht so einfach. Im folgenden wird eine Beweismethode dargestellt, die f¨ ur alle p ∈ (1, ∞) einheitlich funktioniert. Wir ben¨otigen ein Lemma. Lemma IV.7.10 Es sei 1 < p < ∞. F¨ ur jedes ε > 0 existiert dann eine Zahl τp (ε) > 0 mit w + z p |w|p + |z|p (IV.19) ≤ (1 − τp (ε)) 2 2 f¨ ur alle w, z ∈ C mit |w|, |z| ≤ 1 und |w − z| ≥ ε. Beweis. Es reicht, ein solches τp (ε) zu finden, so daß (IV.19) f¨ ur z = 1 und alle w ∈ C mit |w| ≤ 1 und |w − 1| ≥ ε erf¨ ullt ist. F¨ ur alle w ∈ C gilt w + 1 p |w| + 1 p |w|p + 1 ≤ ; ≤ 2 2 2 hier ist die zweite Ungleichung eine Folge der (strikten) Konvexit¨at der Funktion t → tp f¨ ur 1 < p < ∞. Es gilt Gleichheit in der ersten Ungleichung genau dann, wenn w eine positive reelle Zahl ist, und wegen der strikten Konvexit¨at gilt Gleichheit in der zweiten Ungleichung genau dann, wenn |w| = 1 ist. Daher ist f¨ ur |w| ≤ 1 und w = 1 w + 1 p * |w|p + 1 < 1, 2 2 und da die linke Seite stetig von w abh¨ angt, folgt auf der kompakten Menge {w ∈ C: |w| ≤ 1, |w − 1| ≥ ε} eine Absch¨ atzung w + 1 p * |w|p + 1 ≤ 1 − τp (ε) < 1, 2 2 was zu zeigen war.
2
Satz IV.7.11 Sei (Ω, Σ, μ) ein beliebiger Maßraum und 1 < p < ∞. Dann ist Lp = Lp (Ω, Σ, μ), versehen mit der ¨ ublichen Lp -Norm, gleichm¨aßig konvex.
174
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
Beweis. Seien f, g ∈ Lp mit f p , g p ≤ 1 und f − g p ≥ ε. Leider ergibt sich daraus keine punktweise Absch¨ atzung f¨ ur |f (ω) − g(ω)|; daher setze " # εp Ω0 = ω ∈ Ω: |f (ω) − g(ω)|p ≥ (|f (ω)|p + |g(ω)|p ) 4 ¨ und Ω1 = Ω \ Ω0 . Da f und g eigentlich Aquivalenzklassen von Funktionen sind, ist Ω0 nur bis auf eine Menge vom Maß 0 eindeutig bestimmt, was aber f¨ ur das folgende Argument (wie u ¨blich) unerheblich ist. Weil f (ω)/(|f (ω)|p + |g(ω)|p )1/p und g(ω)/(|f (ω)|p + |g(ω)|p )1/p Zahlen vom Betrag ≤ 1 sind (mit der Konvention 0/0 = 0), liefert Lemma IV.7.10 f¨ ur alle ω ∈ Ω0 f (ω) + g(ω) p |f (ω)|p + |g(ω)|p . (IV.20) ≤ 1 − τp (ε/41/p ) 2 2 Weiter gilt
εp (|f |p + |g|p ) dμ 4 Ω1 p ε ≤ (|f |p + |g|p ) dμ 4 Ω εp εp = f pp + g pp) ≤ . 4 2
|f − g|p dμ ≤ Ω1
Wegen f − g p ≥ ε folgt
|f − g|p dμ ≥ Ω0
εp . 2
Diese Ungleichung kann auch als χΩ0 f − χΩ0 g p ≥ ε2−1/p geschrieben werden, und eine Anwendung der Dreiecksungleichng zeigt 2 max{ χΩ0 f p , χΩ0 g p } ≥ χΩ0 f p + χΩ0 g p ≥ ε2−1/p ,
so daß
|f |p dμ,
max Ω0
Ω0
|g|p dμ ≥
εp . 2 · 2p
Diese Absch¨atzung sowie (IV.20) implizieren dann p f + g p |f | + |g|p f + g p 1− − ≥ dμ 2 2 2 p Ω |f |p + |g|p f + g p ≥ − dμ 2 2 Ω0 |f |p + |g|p ≥ τp (ε/41/p ) dμ 2 Ω0
IV.7
175
Fixpunkts¨ atze
1 max 2 εp ≥ τp (ε/41/p ) p+2 , 2
≥ τp (ε/41/p ) ·
woraus
|f |p dμ,
Ω0
|g|p dμ
Ω0
f + g ≤ 1 − δ(ε) 2 p 2
f¨ ur ein geeignetes δ(ε) > 0 folgt.
Dieser Satz schließt die p -Folgenr¨ aume ein; w¨ahle n¨amlich μ als z¨ahlendes Maß auf der Potenzmenge von N. Daß L1 (μ), L∞ (μ) und C(K) in ihren nat¨ urlichen Normen nicht gleichm¨aßig konvex (nicht einmal strikt konvex) sind, wurde f¨ ur das Lebesguemaß und das Einheitsintervall in Aufgabe I.4.13 beobachtet. Der n¨achste Satz impliziert, daß diese R¨ aume auch keine ¨ aquivalenten gleichm¨aßig konvexen Normen besitzen, wenn sie unendlichdimensional sind. Satz IV.7.12 Jeder gleichm¨ aßig konvexe Raum ist reflexiv. Der Beweis dieses Satzes wird am einfachsten mit den Methoden aus Kapitel VIII gef¨ uhrt und wird auf Seite 420 dargestellt. Einen Beweis, der auf den bislang entwickelten Hilfsmitteln beruht, findet man bei Yosida [1980], Seite 127. Jetzt k¨onnen wir den bereits angek¨ undigten Fixpunktsatz formulieren und beweisen; der Beweis benutzt u ¨ brigens nicht Satz IV.7.12. Theorem IV.7.13 (Fixpunktsatz von Browder-G¨ohde-Kirk) Seien X ein gleichm¨ aßig konvexer Banachraum, ∅ = C ⊂ X abgeschlossen, beschr¨ ankt und konvex sowie F : C → C nichtexpansiv. Dann besitzt F einen Fixpunkt. Beweis. Im ersten Schritt des Beweises zeigen wir die Existenz einer Funktion ϕ mit ϕ(ε) → 0 f¨ ur ε → 0, so daß f¨ ur x, y ∈ C x + y x + y −F ≤ ϕ(ε) 2 2 (IV.21) gilt. Beachte, daß z := (x + y)/2 ∈ C, da C konvex ist. (IV.21) besagt, daß sich F zwischen Beinahe-Fixpunkten“ fast wie ein linearer Operator ” verh¨alt. Zum Beweis beobachten wir als erstes, daß x − F (x) ≤ ε, y − F (y) ≤ ε
⇒
F (z) − x ≤ F (z) − F (x) + F (x) − x ≤ z − x + ε
176
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
nach Voraussetzung u ¨ ber x, und weil F nichtexpansiv ist. Setzt man ρ := ρ(x, y, ε) :=
1 x − y + ε = z − x + ε, 2
so gilt also F (z) − x ≤ ρ, F (z) − y ≤ ρ, letzteres aus Symmetriegr¨ unden. Setze x1 =
F (z) − x F (z) − y , y1 = ; ρ ρ
dann sind x1 ≤ 1, y1 ≤ 1, x1 − y1 =
1 x − y ρ
und deshalb x − y F (z) − z x1 + y1 = . ≤ 1 − δX ρ 2 ρ Nach Definition ist x − y = 2ρ − 2ε, und es folgt ε F (z) − z ≤ ρ 1 − δX 2 − 2 . ρ √ √ Ist ρ√≤ ε, so ist auch die rechte Seite in dieser Absch¨atzung ≤ ε; ist ρ > ε, so ist die rechte Seite wegen der Monotonie von δX durch √ √ ρ 1 − δX (2 − 2 ε) ≤ 12 diam(C) + ε 1 − δX (2 − 2 ε) abzusch¨atzen. Hier bezeichnet diam(C) = sup u − v u,v∈C
den Durchmesser von C. Damit ist gezeigt, daß (IV.21) mit √ √ ϕ(ε) = ε + 12 diam(C) + ε 1 − δX (2 − 2 ε) gilt, und es bleibt zu begr¨ unden, daß limε→0 ϕ(ε) = 0. Dazu reicht es, lim δX (α) = sup δX (α) = 1
α→2
α<2
einzusehen. Wegen der Monotonie von δX ist klar, daß Grenzwert und Supremum u are letzteres < 1, g¨abe es ein β > 0 mit ¨bereinstimmen. W¨
IV.7
177
Fixpunkts¨ atze
δX (α) < 1 − β f¨ ur alle α < 2, und dann existierten zu jedem n ∈ N Punkte xn , yn ∈ BX mit x + y 1 n n xn − yn ≥ 2 − , 1− ≤ 1 − β. n 2 Setzt man yn∗ = −yn , erh¨ alt man daraus x + y∗ 1 n n 1− , xn − yn∗ ≥ 2β. ≤ 2 2n Die zweite Ungleichung impliziert 1 − (xn + yn∗ )/2 ≥ δX (2β) > 0, und dann liefert die erste Ungleichung f¨ ur große n einen Widerspruch. Damit ist der Beweis des ersten Schrittes abgeschlossen; kommen wir zum eigentlichen Beweis der Existenz eines Fixpunkts. Wir setzen η(r) = inf{ F (x) − x : x ∈ C, x ≤ r}, s0 = inf{r ≥ 0: η(r) = 0}. Weil C beschr¨ankt ist, ist f¨ ur hinreichend großes r nach Lemma IV.7.2 η(r) = 0; also ist s0 < ∞. W¨ahle eine Folge (xn ) in C mit xn → s0 und F (xn ) − xn → 0; wir werden zeigen, daß (xn ) konvergiert. Dann folgt sofort, daß ξ := limn xn ein Fixpunkt von F ist, denn 0 = limn (F (xn ) − xn ) = F (ξ) − ξ. W¨are (xn ) nicht konvergent, w¨ are notwendig s0 > 0, und es g¨abe eine Teilfolge (yn ) von (xn ), f¨ ur die mit einem geeigneten τ > 0 stets yn+1 − yn ≥ τ gilt. W¨ahle nun s0 < s1 < 2s0 mit s2 := s1 (1 − δX (τ /(2s0 ))) < s0 . F¨ ur hinreichend große n gilt yn ≤ s1 und daher y y y yn τ n n+1 n+1 − ≤ 1, ≤ 1, ≥ . s1 s1 s1 s1 s1 Eine Anwendung der gleichm¨ aßigen Konvexit¨ at liefert dann die Absch¨atzung y + y n n+1 ≤ s1 (1 − δX (τ /s1 )) ≤ s2 < s0 2 f¨ ur große n. Aber F (yn ) − yn → 0 und (IV.21) implizieren y + y y +y n n+1 n n+1 − F → 0, 2 2 so daß η(s2 ) = 0 im Widerspruch zur Minimalit¨at von s0 folgt. Damit ist Theorem IV.7.13 vollst¨ andig bewiesen.
2
In den Bemerkungen und Ausblicken“ dieses Kapitels werden wir kurz ” auf die Frage eingehen, ob und wann Fixpunkte nichtexpansiver Abbildungen durch Iterationsverfahren gewonnen werden k¨onnen. Der zweite allgemeine Fixpunktsatz, der h¨aufig in den Anf¨angervorlesungen behandelt wird, ist der Brouwersche Fixpunktsatz. Er lautet:
178
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
• (Brouwerscher Fixpunktsatz) Sei Bd = {x ∈ Rd : x ≤ 1} die Einheitskugel im Rd f¨ ur die euklidische Norm, und sei F : Bd → Bd stetig. Dann besitzt F einen Fixpunkt. Der Beweis dieses Satzes liegt ungleich tiefer als der des Banachschen Fixpunktsatzes und kann aus Platzgr¨ unden hier nicht gef¨ uhrt werden. In den Bemerkungen und Ausblicken“ sind jedoch ein paar Literaturhinweise ” gesammelt. Es ist nicht schwierig, den Brouwerschen Fixpunktsatz auf Funktionen, die auf konvexen Teilmengen des Rd definiert sind, auszudehnen. Der erste Schritt dazu ist das folgende Lemma, das im n¨achsten Kapitel noch einmal in allgemeinerer Form behandelt wird (Satz V.3.2 und Aufgabe V.6.15). Lemma IV.7.14 Sei C ⊂ Rd eine kompakte konvexe Menge. Dann gibt es eine stetige Retraktion von Rd auf C, d.h. eine stetige Abbildung R: Rd → C mit R(x) = x f¨ ur alle x ∈ C. Beweis. Sei x0 ∈ Rd ; dann existiert ein eindeutig bestimmtes Element y0 ∈ C mit x0 − y0 = d(x0 , C) = inf x0 − y . y∈C
W¨ahle n¨amlich eine Folge (yn ) in C mit x0 − yn → d(x0 , C). Da C kompakt ist, existiert eine konvergente Teilfolge mit Grenzwert (sagen wir) y0 ∈ C; also gilt x0 − y0 = d(x0 , C). G¨ abe es ein von y0 verschiedenes y0∗ mit derselben Eigenschaft, so erhielte man, da 12 (y0 + y0∗ ) ebenfalls in der konvexen Menge C liegt, den Widerspruch (x − y ) + (x − y ∗ ) y0 + y0∗ 0 0 0 0 d(x0 , C) ≤ x0 − = 2 2 1 < x0 − y0 + x0 − y0∗ = d(x0 , C); 2 hier gilt die <-Beziehung wegen der strikten Konvexit¨at der euklidischen Norm (siehe Aufgabe I.4.13). Daher definiert R: x0 → y0 eine Abbildung von Rd auf C, die auf C identisch operiert. Es ist nun noch die Stetigkeit von R zu zeigen. Tr¨afe sie nicht zu, g¨abe es eine konvergente Folge xn → x∞ , f¨ ur die (R(xn )) nicht gegen R(x∞ ) konvergiert. Da (R(xn )) in der kompakten Menge C ¨ liegt, d¨ urfen wir nach Ubergang zu einer Teilfolge annehmen, daß R(xn ) → y∞ = R(x∞ ). Weil x → d(x, C) stetig ist (Aufgabe I.4.21), ergibt sich nun einerseits lim xn − R(xn ) = lim d(xn , C) = d(x∞ , C)
n→∞
n→∞
IV.7
179
Fixpunkts¨ atze
und andererseits xn − R(xn ) → x∞ − y∞ ; daraus folgt x∞ − y∞ = d(x∞ , C) und deshalb nach Definition von R doch R(x∞ ) = y∞ : Widerspruch! 2 Jetzt k¨onnen wir den allgemeinen Brouwerschen Fixpunktsatz f¨ ur endlichdimensionale R¨ aume formulieren. Satz IV.7.15 Sei C = ∅ eine kompakte konvexe Teilmenge eines endlichdimensionalen normierten Raums X, und sei F : C → C stetig. Dann besitzt F einen Fixpunkt. Beweis. Da alle Normen auf einem endlichdimensionalen Raum ¨aquivalent sind (Satz I.2.5) und Stetigkeit und Kompaktheit nicht von der Wahl einer angen, d¨ urfen wir X = Rd mit der euklidischen ¨aquivalenten Norm abh¨ Norm annehmen. Die Menge C liegt dann in einer Kugel B = {x ∈ Rd : x ≤ r}. Sei R: Rd → C eine stetige Retraktion wie im vorigen Lemma und F0 : B → B, F0 = F ◦ R. Nach der Originalversion des Brouwerschen Fixpunktsatzes2 hat F0 einen Fixpunkt ξ, der wegen ξ = F (R(ξ)) in C liegt. Da ja dann R(ξ) = ξ gilt, ist ξ auch ein Fixpunkt von F . 2 Diese Form des Brouwerschen Fixpunktsatzes u ¨ bertr¨agt sich auf unendlichdimensionale normierte R¨ aume, und man erh¨alt so die erste Version des Schauderschen Fixpunktsatzes, der eines der wichtigsten Resultate der nichtlinearen Funktionalanalysis ist. Theorem IV.7.16 (Schauderscher Fixpunktsatz; 1. Version) Sei C = ∅ eine kompakte konvexe Teilmenge eines normierten Raums X, und sei F : C → C stetig. Dann besitzt F einen Fixpunkt. Beweis. Zu ε > 0 w¨ ahle endlich viele Punkte x1 , . . . , xn in C, so daß C von den offenen ε-Kugeln Uε (xj ) um xj u ¨berdeckt wird, was die Kompaktheit von C erm¨oglicht: n C⊂ Uε (xj ). (IV.22) j=1
Definiere stetige Funktionen ϕj : C → R durch ε − x − xj falls x − xj < ε ϕj (x) = 0 falls x − xj ≥ ε und setze ϕ(x) =
n
ϕj (x).
j=1 2 Offensichtlich
spielt es keine Rolle, daß die Kugel B den Radius r statt 1 hat.
180
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
Wegen (IV.22) ist ϕ(x) > 0 auf C, und deshalb sind λj := ϕj /ϕ, j = 1, .n. . , n, wohldefinierte stetige Funktionen auf C mit 0 ≤ λj (x) ≤ 1 und ur alle x ∈ C. j=1 λj (x) = 1 f¨ Es sei E = lin{x1 , . . . , xn } und C = C ∩ E. Als endlichdimensionaler Unterraum ist E abgeschlossen und deshalb C eine nicht leere, kompakte, konvexe Teilmenge von E. F¨ ur jedes x ∈ C liegt die Konvexkombination Φ(x) =
n
λj (x)xj
j=1
in C , deshalb ist Φ ◦ F |C : C → C eine stetige Selbstabbildung, die nach Satz IV.7.15 einen Fixpunkt ξε besitzt. Da stets n n n Φ(x) − x = λ (x)x − λ (x)x ≤ λj (x) xj − x < ε j j j j=1
j=1
j=1
gilt (in der letzten Summe ist ja λj (x) = 0, wenn xj − x ≥ ε), folgt F (ξε ) − ξε < ε, wenn man insbesondere x = F (ξε ) einsetzt. Eine Anwendung von Lemma IV.7.3 zeigt, daß F einen Fixpunkt besitzt. 2 Wie das folgende Beispiel zeigt, braucht der Schaudersche Fixpunktsatz nicht f¨ ur bloß abgeschlossene und beschr¨ ankte statt kompakte Mengen C zu gelten. Dazu sei C die abgeschlossene Einheitskugel von 2 , und F : C → C sei durch + F : x = (sn ) → 1 − x 22 , s1 , s2 , . . . definiert; beachte, daß stets F (x) 22 = 1 − x 22 + |s1 |2 + |s2 |2 + · · · = 1 ist und F daher tats¨ achlich C in sich abbildet und daß F stetig ist. Bes¨aße F einen Fixpunkt ξ = (tn ), so m¨ ußte notwendig t1 = t2 = . . . sein; die einzige konstante Folge in 2 ist aber 0, und F (0) = 0. Also ist F eine fixpunktfreie Abbildung. Man kann ohne große M¨ uhe eine flexiblere Version des Schauderschen Fixpunktsatzes beweisen. Dazu ben¨ otigt man den folgenden Begriff. Definition IV.7.17 Seien X und Y normierte R¨aume, M ⊂ X sowie F : M → Y eine Abbildung. Dann heißt F eine kompakte Abbildung, wenn F stetig ist und beschr¨ ankte Teilmengen von M auf relativkompakte Teilmengen von Y abbildet. Wie im linearen Fall betrachtet man in der Regel kompakte Abbildungen zwischen (Teilmengen von) Banachr¨ aumen. Beispiele. (a) Sei k: [0, 1] × [0, 1] × R eine stetige Funktion. Zu ϕ ∈ C[0, 1] setze 1
(F ϕ)(s) =
k(s, t, ϕ(t)) dt. 0
IV.7
181
Fixpunkts¨ atze
Wir zeigen, daß so eine kompakte Abbildung von C[0, 1] in sich definiert ist. Zun¨achst beobachten wir, daß F ϕ stetig ist: Da k auf der kompakten Menge [0, 1] × [0, 1] × [−R, R] gleichm¨ aßig stetig ist, kann man zu ε > 0 ein δ = δ(ε, R) > 0 so w¨ ahlen, daß max{|s1 − s2 |, |t1 − t2 |, |u1 − u2 |} ≤ δ, |u1 |, |u2 | ≤ R
⇒
|k(s1 , t1 , u1 ) − k(s2 , t2 , u2 )| ≤ ε gilt. Ist nun ϕ ∞ ≤ R und |s1 − s2 | ≤ δ, so folgt sofort
1
|(F ϕ)(s1 ) − (F ϕ)(s2 )| ≤
|k(s1 , t, ϕ(t)) − k(s2 , t, ϕ(t))| dt ≤ ε. 0
In der Tat zeigt dieses Argument, daß F beschr¨ankte Teilmengen von C[0, 1] auf gleichgradig stetige Teilmengen abbildet. Da k auf [0, 1] × [0, 1] × [−R, R] beschr¨ankt ist, folgt auch sofort, daß F beschr¨ankte Mengen auf beschr¨ankte Mengen abbildet. Daher impliziert der Satz von Arzel` a-Ascoli (Satz II.3.4), daß F beschr¨ ankte Mengen auf relativkompakte Mengen abbildet. Zum Beweis der Kompaktheit von F bleibt, die Stetigkeit dieser Abbildung nachzuweisen. Dazu seien ϕ ∈ C[0, 1] und ε > 0 vorgelegt. Wir w¨ahlen R ≥ 0 so groß, daß ϕ ∞ ≤ R − 1 ist. Ist dann δ = δ(ε, R) wie oben und δ = min{δ, 1} sowie ϕ − ψ ∞ ≤ δ , so ergibt sich f¨ ur jedes s ∈ [0, 1]
1
|(F ϕ)(s) − (F ψ)(s)| ≤
|k(s, t, ϕ(t)) − k(s, t, ψ(t))| dt ≤ ε, 0
da die dritten Argumente um weniger als δ differieren und ≤ R sind. Weil s beliebig war, folgt F ϕ − F ψ ∞ ≤ ε, was die Stetigkeit von F zeigt. (b) Eine Abbildung der Gestalt
1
(F ϕ)(s) =
k(s, t)f (t, ϕ(t)) dt 0
wird Hammerstein-Operator genannt. Sind k: [0, 1] × [0, 1] → R und f : [0, 1] × R → R stetig, handelt es sich um einen Spezialfall von Beispiel (a). In diesem Fall kann man jedoch auch folgendermaßen unter R¨ uckgriff auf die lineare Theorie argumentieren, daß F kompakt ist. Es ist nicht schwer zu sehen, daß der durch (Φϕ)(t) = f (t, ϕ(t)) definierte Superpositionsoperator (auch Nemytski˘ı-Operator genannt) stetig von C[0, 1] in sich operiert und beschr¨ ankte Mengen auf beschr¨ankte
182
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
Mengen abbildet (Aufgabe IV.8.40). Da F die Komposition L ◦ Φ von Φ mit dem kompakten linearen Operator (vgl. Beispiel II.3(d)) 1 L: C[0, 1] → C[0, 1], (Lϕ)(s) = k(s, t)ϕ(t) dt 0
ist, erkennt man die Kompaktheit der Abbildung F . Jetzt k¨onnen wir eine weitere Version des Schauderschen Fixpunktsatzes formulieren. Theorem IV.7.18 (Schauderscher Fixpunktsatz; 2. Version) Sei C = ∅ eine abgeschlossene, konvexe und beschr¨ ankte Teilmenge eines Banachraums, und sei F : C → C eine kompakte Abbildung. Dann besitzt F einen Fixpunkt. Beweis. Nach Aufgabe III.6.14 (siehe auch Lemma IV.7.21 unten) ist C := co F (C) eine kompakte konvexe Menge, und es ist C ⊂ C, da C konvex und abgeschlossen sowie F (C) ⊂ C ist. Ferner ist F (C ) ⊂ F (C) ⊂ C ; nach Theorem IV.7.16 besitzt F |C einen Fixpunkt und folglich auch F . 2 Wir wollen den Schauderschen Fixpunktsatz auf ein Differentialgleichungsproblem anwenden. Es seien f : R2 → R eine stetige Funktion und y0 ∈ R. Gesucht ist eine auf einem Intervall [−T, T ] definierte differenzierbare Funktion y, die dort das Anfangswertproblem y (t) = f (t, y(t)),
y(0) = y0
(IV.23)
erf¨ ullt. Man kann dieses Problem l¨ osen, indem man es in ein ¨aquivalentes Fixpunktproblem u uhrt. Dazu bemerken wir, daß jede L¨osung von ¨ berf¨ (IV.23) automatisch stetig differenzierbar ist, da die rechte Seite stetig von t abh¨angt, und Integration liefert dann t y(t) = y0 + f (τ, y(τ )) dτ (IV.24) 0
f¨ ur alle t ∈ [−T, T ]. Umgekehrt impliziert der Hauptsatz der Differentialund Integralrechnung f¨ ur ein y ∈ C[−T, T ], das (IV.24) erf¨ ullt, die Differenzierbarkeit und (IV.23). Die Gleichung (IV.24) ist nun ein Fixpunktproblem im Banachraum C[−T, T ]. Bezeichnet man die rechte Seite von (IV.24) mit (F y)(t), so kann man wie in Beispiel (b) zeigen, daß F : C[−T, T ] → C[−T, T ] eine kompakte Abbildung ist (vgl. Aufgabe II.5.26). Um den Schauderschen Fixpunktsatz anwenden zu k¨onnen, m¨ ussen wir eine abgeschlossene, beschr¨ankte, konvexe, F -invariante Teilmenge C produzieren. Das gelingt aber nur, wenn man T klein genug w¨ahlt. Macht man n¨ amlich den Ansatz C = {y ∈ C[−T, T ]: |y(t) − y0 | ≤ 1 f¨ ur alle |t| ≤ T }
IV.7
Fixpunkts¨ atze
183
und T ≤ 1, so gilt |(F y)(t) − y0 | ≤ T · M f¨ ur y ∈ C, wenn f auf [−1, 1] × [y0 − 1, y0 + 1] durch M beschr¨ ankt ist und |t| ≤ T ≤ 1 ist. Daher gilt in der Tat F (y) ∈ C, wenn T klein genug ist. Man sieht schnell, daß sich dieses Argument modifizieren l¨aßt, wenn f nur in einer Umgebung von (0, y0 ) definiert und stetig ist. Damit haben wir bewiesen: Korollar IV.7.19 (Existenzsatz von Peano) Unter den obigen Voraussetzungen besitzt das Anfangswertproblem (IV.23) auf einem hinreichend kleinen Intervall [−T, T ] eine L¨ osung. Das Beispiel y (t) = y(t)2 , y(0) = 1 zeigt, daß man im allgemeinen keine globale L¨osbarkeit erwarten kann. Wie in jeder Vorlesung u ohnliche Differentialgleichungen bewie¨ber gew¨ sen wird, kann man mit denselben Ideen wie oben f¨ ur hinreichend kleines T den Banachschen Fixpunktsatz anwenden, falls f zus¨atzlich eine lokale Lipschitzbedingung bzgl. des zweiten Arguments erf¨ ullt; in diesem Fall ist (IV.23) sogar lokal eindeutig l¨ osbar (Satz von Picard-Lindel¨ of ). Ferner u atze unmittelbar auf endlichdimensionale Systeme, ¨bertragen sich diese S¨ d.h. f und y nehmen Werte im Rn an. Ersetzt man jedoch Rn durch einen unendlichdimensionalen Banachraum X, so wird der Satz von Peano f¨ ur jedes solche X falsch (Godunov, Funct. Anal. Appl. 9 (1975) 53–55). Im letzten Teil dieses Abschnitts studieren wir Fixpunkts¨atze f¨ ur nicht kompakte Abbildungen. Wir werden Abbildungen untersuchen, f¨ ur die das ” Bild kompakter als das Urbild“ ist. Um diese Idee zu pr¨azisieren, m¨ ussen wir die Nichtkompaktheit einer Menge quantifizieren. Das geschieht in der n¨achsten Definition. Definition IV.7.20 Das Kuratowskische Nichtkompaktheitsmaß α(A) einer Teilmenge A eines normierten Raumes ist erkl¨art als das Infimum der Zahlen ε > 0, so daß A mit endlich vielen Mengen vom Durchmesser ≤ ε u ¨berdeckt werden kann. Gibt es kein solches ε, setzt man α(A) = ∞. Da jede Menge denselben Durchmesser wie ihr Abschluß hat, darf man bei Bedarf in dieser Definition annehmen, daß die u ¨berdeckenden Mengen abgeschlossen sind. Offensichtlich ur eine kompakte Menge α(A) = 0, denn die offene ist f¨ ¨ Uberdeckung uberdeckung. Hinter x∈A Uε/2 (x) besitzt eine endliche Teil¨ Definition IV.7.20 steckt die Idee, daß eine Menge A um so weniger kompakt ist, je gr¨oßer α(A) ist. Beispielsweise ist f¨ ur die abgeschlossene Einheitskugel BX eines unendlichdimensionalen Banachraums α(BX ) = 2: Da stets α(A) ≤ diam(A) gilt (jede Menge u ¨berdeckt sich selbst), gilt trivialerweise α(BX ) ≤ 2. Zum Beweis der Gleichheit ben¨ otigt man ein Resultat aus der algebraischen Topologie, den Satz von Lyusternik-Shnirelman-Borsuk. Wenn man n¨amlich
184
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
annimmt, daß α(BX ) < 2 ist, gibt es endlich viele abgeschlossene Mengen M1 , . . . , Mn vom Durchmesser < 2, so daß BX ⊂ M1 ∪ . . . ∪ Mn . Betrachte nun einen beliebigen n-dimensionalen Unterraum E des unendlichdimensionalen Raums X und setze Mj = Mj ∩ SE . Dann sind M1 , . . . , Mn abgeschlossene Teilmengen der Sph¨ are SE von E, die SE u ¨berdecken. Der angesprochene Satz von Lyusternik-Shnirelman-Borsuk3 liefert jetzt aber, daß eine dieser Mengen, etwa Mj0 , einen Punkt x0 samt seiner Antipode“ ” −x0 enth¨alt, und das liefert den Widerspruch 2 = x0 − (−x0 ) ≤ diam(Mj0 ) ≤ diam(Mj0 ) < 2. Es folgen einige Eigenschaften des Nichtkompaktheitsmaßes. Lemma IV.7.21 F¨ ur Teilmengen eines Banachraums X gilt: (a) α(A) ≤ α(B) f¨ ur A ⊂ B; (b) α(A) = α(A); (c) α(A ∪ B) = max{α(A), α(B)}; (d) α(A + B) ≤ α(A) + α(B), wobei A + B = {a + b: a ∈ A, b ∈ B}; (e) α(cA) = |c|α(A) f¨ ur c ∈ K, wobei cA = {ca: a ∈ A}; (f) α(A) = 0 genau dann, wenn A relativkompakt ist; (g) α(A) = α(co A) = α(co A); (h) f¨ ur eine absteigende Folgeabgeschlossener Mengen A1 ⊃ A2 ⊃ ∞ . . . = ∅ mit α(An ) → 0 ist n=1 An kompakt und nicht leer. Beweis. Die Teile (a) bis (e) ergeben sich direkt aus der Definition; f¨ ur (b) beachte die auf Definition IV.7.20 folgende Bemerkung. Weiter folgt (f) aus Satz B.1.7. Wegen (a) und (b) ist f¨ ur den Beweis von (g) nur α(co A) ≤ α(A) ¨ zu zeigen. Sei dazu ε > α(A); dann gibt es eine endliche Uberdeckung 0 n A ⊂ j=1 Mj durch Mengen vom Durchmesser diam(Mj ) ≤ ε0 . Weil die konvexe H¨ ulle einer Menge M wie M hat, denn f¨ ur denselben Durchmesser Konvexkombinationen x = pi=1 λi xi und y = rk=1 μk yk gilt p p r x − y = λi (xi − y) = λi μk (xi − yk ) i=1
≤
p i=1
3 Beweise
λi
i=1
r k=1
μk xi − yk ≤
k=1 p i=1
λi
r
μk diam(M ) = diam(M ),
k=1
dieses Satzes findet man z.B. in Granas/Dugundji [2003], S. 91, oder Zeidler [1986], S. 708.
IV.7
185
Fixpunkts¨ atze
darf man M1 , . . . , Mn auch als konvex annehmen. Nun beachte n n co A ⊂ co M1 ∪ Mj ⊂ co M1 ∪ co Mj j=2
j=2
n ⊂ co M1 ∪ co M2 ∪ co Mj ⊂ etc. j=3
Wenn f¨ ur konvexe Mengen C1 und C2 sowie deren konvexe H¨ ulle C = co(C1 ∪ C2 ) α(C) ≤ max{α(C1 ), α(C2 )} (IV.25) gezeigt ist, folgt aus der obigen Darstellung (von unten nach oben gelesen) α(co A) ≤ ε0 und deshalb α(co A) ≤ α(A). Zum Beweis von (IV.25) d¨ urfen wir C1 und C2 als beschr¨ankt voraussetzen, etwa x ≤ R f¨ ur x ∈ C1 ∪ C2 . Jedes x ∈ C kann als x = λx1 + (1 − λ)x2 mit geeigneten x1 ∈ C1 , x2 ∈ C2 und 0 ≤ λ ≤ 1 dargestellt werden (Beweis?). Sei nun N ∈ N beliebig und λk = k/N ; w¨ahle zu λ ein λk mit |λk − λ| ≤ 1/N . Dann kann x als x = λk x1 + (1 − λk )x2 + z mit einem Element z mit z ≤ 2R/N geschrieben werden. Das bedeutet, daß N 2R C⊂ λk C1 + (1 − λk )C2 + BX , N k=0
und eine Anwendung der Teile (a), (d), (c), (e) zusammen mit α(BX ) ≤ 2 liefert 4R α(C) ≤ max λk α(C1 ) + (1 − λk )α(C2 ) + 0≤k≤n N 4R ≤ max{α(C1 ), α(C2 )} + . N Da N ∈ N beliebig war, ist (IV.25) unddamit auch (g) gezeigt. (h) Nach (a) und (f) ist klar, daß n An kompakt ist. Um zu zeigen, daß diese Menge nicht leer ist, w¨ ahle zu n ∈ N Punkte xn ∈ An . Wegen {xn : n ≥ m} ⊂ Am gilt α({xn : n ≥ 1}) = α({xn : n ≥ m}) ≤ α(Am ) → 0, und deshalb ist {xn : n≥ 1} relativkompakt. Aber jeder H¨aufungspunkt der Folge (xn ) liegt in n An ; daher ist diese Menge nicht leer. 2 Die bereits angesprochene Klasse von Abbildungen kann nun wie folgt definiert werden.
186
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
Definition IV.7.22 Seien X und Y Banachr¨aume, M ⊂ X und F : M → Y eine stetige Abbildung. Dann heißt F kondensierend (oder verdichtend), wenn α(F (A)) < α(A) f¨ ur alle beschr¨ ankten A ⊂ M mit α(A) = 0. Beispiel. (c) Offenbar sind jede kompakte Abbildung F1 und jede strikt kontrahierende Abbildung F2 kondensierend; im ersten Fall ist ja α(F1 (A)) = 0 f¨ ur alle beschr¨ankten Mengen A, und im zweiten gilt α(F2 (A)) ≤ q α(A), wenn q die Kontraktionskonstante bezeichnet (Beweis?). Aber auch F = F1 + F2 ist kondensierend, denn α(F (A)) ≤ α(F1 (A)) + α(F2 (A)) ≤ q α(A) nach Lemma IV.7.21(d). Solche Linearkombinationen z¨ahlen zu den wichtigsten Beispielen kondensierender Abbildungen. F¨ ur kondensierende Abbildungen gilt der folgende Fixpunktsatz. Satz IV.7.23 (Fixpunktsatz von Darbo-Sadovski˘ı) Sei X ein Banachraum, und sei C ⊂ X nicht leer, abgeschlossen, beschr¨ ankt und konvex sowie F : C → C kondensierend. Dann besitzt F einen Fixpunkt. Beweis. Die Idee des Beweises ist es, eine kompakte konvexe Teilmenge C von C zu finden, auf die der Schaudersche Fixpunktsatz angewandt werden kann. Zu diesem Zweck fixieren wir einen Punkt p ∈ C und betrachten das System K aller abgeschlossenen konvexen Teilmengen K von C, die p enthalten und F -invariant sind (d.h. F (K) ⊂ K); z.B. ist C ∈ K . Es sei C der Durchschnitt aller K ∈ K . Als Schnitt abgeschlossener und konvexer Mengen ist C nat¨ urlich auch abgeschlossen und konvex, und C ist nicht leer, denn p ∈ C . Da f¨ ur alle K ∈ K aus C ⊂ K auch F (C ) ⊂ F (K) ⊂ K folgt, schließen wir F (C ) ⊂ C ; mithin ist C das kleinste Element von K . Um den Schauderschen Fixpunktsatz auf die Einschr¨ankung F |C anwenden zu k¨onnen, m¨ ussen wir jetzt noch die Kompaktheit von C zeigen. Dazu beobachten wir, daß C := co(F (C ) ∪ {p}) = C ist; hier folgt C ⊂ C aus den obigen Eigenschaften von C , und andererseits ist C ∈ K (die F -Invarianz von C ergibt sich wegen C ⊂ C aus F (C ) ⊂ F (C ) ⊂ C ) und deshalb C ⊂ C . Aus Lemma IV.7.21 erh¨alt man jetzt α(C ) = α(C ) = α(F (C ) ∪ {p}) = α(F (C )), und da F kondensierend ist, muß α(C ) = 0 und deswegen C kompakt sein.
IV.8 Aufgaben
187
Der Schaudersche Fixpunktsatz liefert daher einen Fixpunkt f¨ ur F |C und deshalb erst recht einen Fixpunkt f¨ ur F . 2 Formal schließt der Darbo-Sadovski˘ısche Fixpunktsatz sowohl den Banachschen als auch den Schauderschen als Spezialf¨alle ein (ersteren modulo der Voraussetzung u ¨ ber den Definitionsbereich), aber letzterer ging ja im Beweis ein. Das n¨ achste Korollar kann man unter demselben Vorbehalt als Kombination dieser beiden S¨ atze verstehen. Korollar IV.7.24 (Fixpunktsatz von Krasnoselski˘ı) Seien X ein Banachraum und C ⊂ X abgeschlossen, konvex, beschr¨ ankt und nicht leer. Ferner seien F1 : C → X kompakt und F2 : C → X eine strikte Kontraktion, und F := F1 + F2 bilde C in C ab. Dann besitzt F einen Fixpunkt. Beweis. In Beispiel (c) wurde gezeigt, daß F kondensierend ist.
IV.8
2
Aufgaben
Aufgabe IV.8.1 (Das Banach-Mazur- oder Choquet-Spiel) ¨ Sei T ein topologischer Raum, der, um unliebsame Uberraschungen zu vermeiden, hier wie im folgenden stillschweigend als nicht leer angenommen wird. Zwei Spieler, A und B, spielen folgendes Spiel: Abwechselnd wird eine nichtleere offene Menge gew¨ ahlt, die in der soeben vom Kontrahenten gew¨ ahlten Menge liegen muß; den ersten Zug macht A und hat dabei die freie Wahl. Bei einem Spieldurchgang entsteht so eine absteigende Folge offener nichtleerer Teilmengen von T : V1 ⊃ V2 ⊃ V3 ⊃ . . . . Falls Vn = ∅, gewinnt B, andernfalls A. Wir sagen, daß B eine Gewinnstrategie hat, wenn eine Abbildung Φ: τ → τ auf der Familie τ aller nichtleeren offenen Mengen existiert, so daß stets Φ(V ) ⊂ V gilt und f¨ ur jede Folge ∞V1 , V3 , V5 , . . . ∈ τ mit V1 ⊃ V2 = Φ(V1 ) ⊃ V3 ⊃ V4 = Φ(V3 ) ⊃ . . . der Schnitt n=1 Vn nicht leer ist. (a) Ist T ein vollst¨ andiger metrischer Raum, so hat B eine Gewinnstrategie. (b) Auch in lokalkompakten Hausdorffr¨ aumen hat B eine Gewinnstrategie. (c) Ist T ein topologischer Raum, in dem B eine Gewinnstrategie hat, so gilt in T der Satz von Baire. Aufgabe IV.8.2 Sei P der Vektorraum aller Polynome auf R und . eine Norm auf P. Dann ist (P, . ) kein Banachraum. (Tip: Bairescher Kategoriensatz!) Aufgabe IV.8.3 Es sei f : [0, ∞) → R eine stetige Funktion, so daß f¨ ur alle t ≥ 0 die Bedingung limn→∞ f (nt) = 0 gilt. Dann gilt auch limt→∞ f (t) = 0. Aufgabe IV.8.4 Eine Teilmenge M eines metrischen (oder auch topologischen) Raums heißt Gδ -Menge (bzw. Fσ -Menge), wenn M als abz¨ ahlbarer Schnitt offener Mengen (bzw. als abz¨ ahlbare Vereinigung abgeschlossener Mengen) geschrieben werden kann.
188
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
(a) Q ist keine Gδ -Menge in R. (Tip: Benutze den Satz von Baire!) (b) Sei f : R → R eine Funktion. Dann ist {t ∈ R: f ist stetig bei t}, die Menge der Stetigkeitspunkte, eine Gδ -Menge. (c) Es gibt keine Funktion f : R → R, die bei allen rationalen Zahlen stetig, aber bei allen irrationalen Zahlen unstetig ist. Wohl aber gibt es eine Funktion f : R → R, die bei allen irrationalen Zahlen stetig, jedoch bei allen rationalen Zahlen unstetig ist. Aufgabe IV.8.5 (Funktionen der 1. Baireschen Klasse) Sei (fn ) eine Folge von stetigen Funktionen von R nach R, so daß limn→∞ fn (t) =: f (t) f¨ ur alle t ∈ R existiert. (Man sagt, eine Funktion geh¨ ore zur 1. Baireschen Klasse, wenn sie punktweiser Limes einer Folge stetiger Funktionen ist.) Zeige, daß f mindestens einen Stetigkeitspunkt besitzt. Anleitung: (a) Seien ω(t, δ) = sup{|f (s1 ) − f (s2 )|: |si − t| ≤ δ}, ω(t) = inf δ>0 ω(t, δ) und Aε = {t ∈ R: ω(t) < ε}. F¨ ur alle ε > 0 ist dann Aε offen. (b) Aε ist auch stets dicht. Um das zu zeigen, nimm an, daß Bε := R\Aε ein abgeschlossenes Intervall J positiver L¨ ange enth¨ alt. Betrachte dann En =
,
{t ∈ J: |fi (t) − fj (t)| ≤ ε/5.}
i,j≥n
Schließe, daß f¨ ur ein n0 die Menge En0 ein nichttriviales Intervall I enth¨ alt. Nun folgere, daß |fn0 (t) − f (t)| ≤ ε/5 f¨ ur alle t ∈ I gilt, und leite den Widerspruch I ∩ Aε = ∅ ab. (c) Zum Schluß wende den Satz von Baire an. Gib mit der Aussage dieser Aufgabe einen neuen Beweis von Korollar IV.2.5. Aufgabe IV.8.6 p (a) F¨ in q . ur 1 ≤ pp < q ≤ ∞ ist von 1. Kategorie q (b) ist eine echte Teilmenge von . 1≤p
⇒
T xn → 0 schwach.
Dann ist T stetig. (Zusammen mit Aufgabe III.6.16(a) liefert diese Aussage, daß Stetigkeit zur schwachen Stetigkeit“ ¨ aquivalent ist. Der Begriff der schwachen Ste” tigkeit wird in Kapitel VIII pr¨ azisiert.)
IV.8
Aufgaben
189
(b) Finde Gegenbeispiele, die zeigen, daß die Vollst¨ andigkeit von X in den Korollaren IV.2.4 und IV.2.5 wesentlich ist. Aufgabe IV.8.9 Gib notwendige und hinreichende Bedingungen f¨ ur die schwache Konvergenz einer Folge in p , 1 < p < ∞, oder c0 . Aufgabe IV.8.10 (a) Sei 1 ≤ p < ∞. F¨ ur eine Folge (xn ) in Lp [0, 1] sind ¨ aquivalent: (i) xn → 0 schwach. (ii) supn xn Lp < ∞ und A xn (t) dt → 0 f¨ ur alle Borelmengen A. ¨ (b) Gilt diese Aquivalenz auch f¨ ur p = ∞? (Hinweis: Betrachte xn (t) = tn .) Aufgabe IV.8.11 Eine Folge (xn ) in einem normierten Raum X heißt schwache Cauchyfolge, falls f¨ ur alle x ∈ X die skalare Folge x (xn ) eine Cauchyfolge ist. (a) Gib in c0 und C[0, 1] Beispiele f¨ ur schwache Cauchyfolgen, die nicht schwach konvergieren! (Man kann u ¨brigens beweisen, daß jede schwache Cauchyfolge in L1 [0, 1] schwach konvergiert; siehe Satz VIII.6.10.) (b) Eine schwache Cauchyfolge ist beschr¨ ankt. (c) In einem reflexiven Banachraum ist eine schwache Cauchyfolge schwach konvergent. Aufgabe IV.8.12 Seien X und Y Banachr¨ aume und B: X × Y → K bilinear. B sei partiell stetig, d.h., f¨ ur alle x ∈ X ist y → B(x, y) stetig, und f¨ ur alle y ∈ Y ist x → B(x, y) stetig. Dann ist B stetig. (Tip: Satz von Banach-Steinhaus!) Aufgabe IV.8.13 Seien X und Y Banachr¨ aume. Ist T : X ⊃ dom(T ) → Y abgeschlossen, so ist sein Kern, d.h. {x ∈ dom(T ): T x = 0}, ein abgeschlossener Unterraum von X. Aufgabe IV.8.14 (a) Sei X = Y = 2 . Betrachte T : X ⊃ D → Y , definiert durch T (sn ) = (nsn ), wo (i) D = {(sn ) ∈ 2 : (nsn ) ∈ 2 }, (ii) D = d. Untersuche, ob T abgeschlossen ist. (b) Seien X und Y normierte R¨ aume, D ⊂ X ein Untervektorraum, und sei T : X ⊃ D → Y durch T x = 0 definiert. Ist T abgeschlossen? Aufgabe IV.8.15 (a) Seien U, V, W Banachr¨ aume, D ⊂ V ein Untervektorraum, und sei T : V ⊃ D → W linear. Zeige: • Wenn T injektiv und abgeschlossen ist, dann ist T −1 : W ⊃ ran(T ) → V abgeschlossen. • Ist T abgeschlossen, S ∈ L(U, V ) mit ran(S) ⊂ D, so gilt T S ∈ L(U, W ). Ferner ist ran(T ) abgeschlossen, falls T −1 stetig ist.
190
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
• Ist T abgeschlossen, S ∈ L(V, W ), so ist S + T : V ⊃ D → W abgeschlossen. (b) Seien X, Y, Z Banachr¨ aume, seien K ∈ K(X, Z) und T ∈ L(Y, Z) mit ran(T ) ⊂ ran(K). Dann ist T kompakt. (Hinweis: Verwende Aufgabe II.5.18(c) und Teil (a).) Aufgabe IV.8.16 Seien X, Y und Z Banachr¨ aume, T : X → Y sei linear, J: Y → Z linear, injektiv und stetig und JT : X → Z stetig. Zeige, daß auch T stetig ist. Aufgabe IV.8.17 Ein kompakter Operator zwischen Banachr¨ aumen hat genau dann abgeschlossenes Bild, wenn sein Wertebereich endlichdimensional ist. Aufgabe IV.8.18 Sei Ω ⊂ RN offen und beschr¨ ankt. Betrachte den Banachraum (!)
C
1,b
(Ω) =
f und alle partiellen Ableitungen f ∈ C (Ω): ∂f Di f = ∂x sind beschr¨ ankt i
1
N
unter der Norm f = f ∞ + i=1 Di f ∞ . Sei nun N ≥ 3 und g: Ω × Ω → R eine Funktion, so daß |g(x, y)| ≤ const. |x−y|N −2 falls x = y und Ω g( . , y)f (y) dy f¨ ur alle f ∈ C b (Ω) existiert und in C 1,b (Ω) ist. Dann existiert eine Konstante A, derart daß f¨ ur i = 1, . . . , N
∂ ≤ A · f ∞ g(x, y)f (y) dy ∂xi
∀f ∈ C b (Ω), x ∈ Ω
Ω
gilt. (Hinweis: Benutze Aufgabe IV.8.16.) Aufgabe IV.8.19 Eine Folge (bn ) in einem Banachraum X heißt Schauderbasis, ∞ falls jedes x ∈ X eindeutig als konvergente Reihe x = ξ b , ξn ∈ K, n=1 n n dargestellt werden kann. (a) Die Einheitsvektoren (en ) bilden eine Schauderbasis in p (1 ≤ p < ∞) bzw. c0 , nicht jedoch in ∞ . (b) Wenn X eine Schauderbasis besitzt, ist X separabel. (Die Umkehrung gilt nicht, wie P. Enflo 1973 gezeigt hat, denn Banachr¨ aume mit einer Schauderbasis besitzen die Approximationseigenschaft, vgl. S. 88 und Aufgabe IV.8.20(a).) (c) Die Abbildungen b∗n : x → ξn (die sog. Koeffizientenfunktionale) sind wohldefiniert und linear. (d) Es ist stets b∗n ∈ X . Beweise diesen Satz von Banach nach folgender N Anleitung: Setze |||x||| = supN n=1 b∗n (x)bn . Das ist eine Norm. Zeige b∗n ∈ (X, ||| . |||) und daß ||| . ||| zu . ¨ aquivalent ist. Dazu beweise die Vollst¨ andigkeit von (X, ||| . |||) und benutze den Satz von der offenen Abbildung.
IV.8
191
Aufgaben
Aufgabe IV.8.20 (a) Sei X ein Banachraum mit einer Schauderbasis (bn ) und Koeffizien∗ tenfunktionalen n ∗(bn ) (vgl. Aufgabe IV.8.19). Betrachte die Operatoren Pn (x) = k=1 bk (x)bk . Dann gelten:
(b)
(c)
(d)
(e)
(1) Pn ∈ L(X) und dim ran Pn = n f¨ ur alle n, (2) Pn Pm = Pm Pn = Pmin{m,n} f¨ ur alle m und n (insbesondere sind die Pn Projektionen), (3) Pn (x) → x f¨ ur alle x ∈ X. Ist umgekehrt (Pn ) eine Folge von Projektionen mit den Eigenschaften (1)–(3), so existiert eine Schauderbasis, zu der die Pn wie unter (a) assoziiert sind. Sei (tn ) die Folge 0, 1, 12 , 14 , 34 , 18 , 38 , . . . in [0, 1]. Definiere Projektionen Pn : C[0, 1] → C[0, 1] wie folgt: (P1 f )(t) = f (0) f¨ ur alle t, und f¨ ur n ≥ 2 sei Pn f die st¨ uckweise lineare stetige Funktion mit Knoten bei tj , f¨ ur die (Pn f )(tj ) = f (tj ) gilt (j = 1, . . . , n). Zeige, daß die Pn die Bedingungen (1)–(3) erf¨ ullen, und skizziere die ersten Funktionen einer so erzeugten Schauderbasis von C[0, 1]. (Hierbei handelt es sich um die“ Schauder” basis, die von Schauder selbst konstruiert wurde.) Hingegen bilden die Funktionen tn : t → tn , n ≥ 0, keine Schauderbasis von C[0, 1]. n (Tip: Ist a t → a1 stetig?) k=0 k k Es gibt auch keine Umordnung (tπ(n) ), π eine Bijektion von {0, 1, 2, . . .} auf sich, die eine Schauderbasis bildet.
Aufgabe IV.8.21 (Das Prinzip der Verdichtung der Singularit¨ aten) (a) Sei X ein Banachraum und seien Y1 , Y2 , . . . normierte R¨ aume. F¨ ur jedes n ∈ N sei Gn ⊂ L(X, Yn ) eine unbeschr¨ ankte Teilmenge. Zeige, daß es ein x ∈ X mit sup T x = ∞ ∀n ∈ N T ∈Gn
gibt. In der Tat bilden diese x das Komplement einer Menge 1. Kategorie. (b) Als Anwendung zeige, daß es eine stetige 2π-periodische Funktion gibt, deren Fourierreihe an u ahlbar vielen Stellen divergiert. ¨ berabz¨ (Anleitung: Wir wissen bereits, daß es zu jeder Stelle t ∈ [0, 2π] eine Funktion x ∈ C2π gibt, deren Fourierreihe bei t divergiert, vgl. den Beweis von Satz IV.2.10. Sei nun {t1 , t2 , . . .} dicht in [0, 2π]. Wende (a) auf Gn = {sm ( . , tn ): m ≥ 0} ⊂ C2π an (sm (x, t) = m-te Partialsumme der Fourierreihe von x bei t), um f¨ ur das laut (a) existente x zu erhalten, daß Dk = {t: |sm (x, t)| ≤ k ∀m ≥ 0} f¨ ur jedes k ∈ N abgeschlossen und von 1. Kategorie ist. Daraus schließe die Behauptung.) Aufgabe IV.8.22 (a) Zeige durch ein Gegenbeispiel, daß der Satz vom abgeschlossenen Graphen nicht mehr zu gelten braucht, wenn nur Y als vollst¨ andig vorausgesetzt ist.
192
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
(b) Zeige durch ein Gegenbeispiel, daß der Satz vom abgeschlossenen Graphen nicht mehr zu gelten braucht, wenn nur X als vollst¨ andig vorausgesetzt ist. (Anleitung: Sei X = 2 und (bi )i∈I eine algebraische Basis des Vektorraums 2 mit bi = 1 f¨ ur alle i. Jedes x ∈ X kann also eindeutig in eine Summe x = αi bi entwickelt werden, wobei nur endlich viele Summanden nicht verschwinden. Setze |||x||| = |αi | (endliche Summe!). Y bezeichne den mit der Norm ||| . ||| versehenen Vektorraum 2 . Betrachte nun den identischen Operator Id: X → Y .) Aufgabe IV.8.23 Sei 1 ≤ p < ∞ und f ∈ Lp [0, 2π]. Sei σn (f) das arithmetische Mittel der Partialsummen der Fourierreihe von f . Zeige, daß σn (f ) in Lp [0, 2π] gegen f konvergiert. ¨ (Tip: Vgl. Satz IV.2.11. Ubrigens kann man im Fall 1 < p < ∞ zeigen, daß die Partialsummen selbst gegen f konvergieren; f¨ ur p = 1 ist das jedoch falsch. Der Fall p = 2 wird in Kapitel V abgehandelt.) Aufgabe IV.8.24 Seien V und W abgeschlossene Unterr¨ aume eines Banachraums X. Zeige durch folgendes Gegenbeispiel, daß V + W nicht abgeschlossen zu sein braucht: X = 1 ⊕ 2 , V = 1 ⊕ {0}, W = gr(T ), wo T : 1 → 2 , T x = x. Aufgabe IV.8.25 Sei X ein separabler Banachraum. Konstruiere eine Quotientenabbildung von 1 auf X. Konstruiere anschließend eine Quotientenabbildung von L1 (R) auf X. (Tip: Imitiere den 2. Teil des Beweises des Satzes von der offenen Abbildung.) Aufgabe IV.8.26 Sei X ein Banachraum und U ein zu ∞ isomorpher Unterraum. Schließe mit Hilfe von Aufgabe III.6.22(a), daß U komplementiert ist. Aufgabe IV.8.27 Zeige, daß C[0, 1] einen zu c0 isometrischen komplementierten Unterraum und Lp [0, 1] einen zu p isometrischen komplementierten Unterraum besitzt. Aufgabe IV.8.28 (Strikt singul¨ are Operatoren) Ein stetiger linearer Operator T : X → Y zwischen Banachr¨ aumen heißt strikt singul¨ ar, wenn inf{T x: x ∈ U , x = 1} = 0 auf jedem unendlichdimensionalen Unterraum U ⊂ X gilt. (a) T ist genau dann strikt singul¨ ar, wenn die einzigen abgeschlossenen Unterr¨ aume U ⊂ X, f¨ ur die die Restriktion T |U : U → T (U ) ein Isomorphismus ist, endlichdimensional sind. (b) Ein kompakter Operator ist strikt singul¨ ar. (c) Der identische Inklusionsoperator von 2 nach c0 ist strikt singul¨ ar, aber nicht kompakt. (d) Ein Operator ist strikt singul¨ ar, wenn zu jedem unendlichdimensionalen abgeschlossenen Unterraum U ⊂ X ein weiterer unendlichdimensionaler abgeschlossener Unterraum V ⊂ U existiert, so daß T |V kompakt ist. [Es gilt auch die Umkehrung; vgl. Pietsch [1980], Theorem 1.9.3.]
IV.8
193
Aufgaben
Aufgabe IV.8.29 (Lemma von Zabre˘ıko) Sei p eine Halbnorm auf einem Banachraum X mit p
∞
xk
≤
k=1
f¨ ur alle konvergenten Reihen
∞
p(xk ) (≤ ∞)
k=1
∞ k=1
xk . Dann existiert M ≥ 0 mit
p(x) ≤ M x
∀x ∈ X.
(a) Beweise dieses Lemma. (Tip: Betrachte {x: p(x) ≤ n} und imitiere den Beweis des Satzes von der offenen Abbildung.) (b) Zeige mit Hilfe des Lemmas von Zabre˘ıko den Satz von Banach-Steinhaus. (Tip: p(x) = supi Ti x.) (c) Zeige mit Hilfe des Lemmas von Zabre˘ıko den Satz vom inversen Operator (Korollar IV.3.4). (Tip: p(y) = T −1 y.) (d) Zeige mit Hilfe des Lemmas von Zabre˘ıko den Satz vom abgeschlossenen Graphen. (Tip: p(x) = T x.) Aufgabe IV.8.30 Sei (M, d) ein (nicht leerer) vollst¨ andiger metrischer Raum, und sei F : M → M eine Abbildung, f¨ ur die es eine strikt kontraktive Potenz F n = F ◦ · · · ◦ F gibt. (Beachte, daß eine solche Abbildung nicht stetig zu sein braucht.) Zeige, daß F einen Fixpunkt besitzt. Aufgabe IV.8.31 Es gibt unvollst¨ andige metrische R¨ aume, in denen der Banachsche Fixpunktsatz gilt. (Tip: Der Graph von sin(1/x) mit der Metrik des R2 .) Aufgabe IV.8.32 Sei C eine abgeschlossene, beschr¨ ankte, konvexe Teilmenge eines strikt konvexen Banachraums; ferner sei F : C → C nichtexpansiv. Zeige, daß die Menge der Fixpunkte von F konvex ist, und gib ein Gegenbeispiel zu dieser Aussage in einem nicht strikt konvexen Raum. Aufgabe IV.8.33 Ein Banachraum (X, . ) ist genau dann gleichm¨ aßig konvex, wenn
xn + yn →1
xn → 1, yn → 1,
2
⇒
xn − yn → 0
gilt. Aufgabe IV.8.34 In einem gleichm¨ aßig konvexen Raum folgt aus xn → x σ und der schwachen Konvergenz xn → x die Normkonvergenz xn → x. Aufgabe IV.8.35 Der Raum 1 , versehen mit der Norm |||x||| = x 1 + x 2 , ist strikt konvex, aber nicht gleichm¨ aßig konvex.
194
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
Aufgabe IV.8.36 Es sei X ein gleichm¨ aßig konvexer Banachraum, und es sei F : BX → X nichtexpansiv. (a) Dann hat F entweder einen Fixpunkt, oder es existieren ein x ∈ SX und ein λ > 1 mit F (x) = λx. (b) Falls F (SX ) ⊂ BX , hat F einen Fixpunkt. Aufgabe IV.8.37 Finde eine stetige Abbildung F : 2 → R, die auf der Einheitskugel unbeschr¨ ankt ist. (Hinweis: en − em ≥ 1.) Aufgabe IV.8.38 Sei X ein Banachraum, K ⊂ X kompakt sowie F : BX → X eine kompakte Abbildung. Dann ist auch (Id − F )−1 (K) kompakt. Aufgabe IV.8.39 Seien X und Y Banachr¨ aume und F : BX → Y eine kompakte Abbildung. Dann gibt es eine Folge (Fn ) von kompakten Abbildungen mit endlichdimensionalem Bild (d.h. dim lin Fn (BX ) < ∞ f¨ ur alle n), die auf BX gleichm¨ aßig gegen F konvergiert. Aufgabe IV.8.40 Sei f : [0, 1] × R → R stetig und Φ: C[0, 1] → C[0, 1] der durch (Φϕ)(t) = f (t, ϕ(t)) definierte Superpositionsoperator. Zeige, daß Φ stetig ist und beschr¨ ankte Mengen auf beschr¨ ankte Mengen abbildet. Unter welchen Bedingungen an f ist Φ kompakt? Aufgabe IV.8.41 (Leray-Schauder-Prinzip) Sei F : X → X eine kompakte Abbildung auf einem Banachraum. Es existiere eine Zahl r > 0 mit folgender Eigenschaft: Falls 0 < t < 1 und x0 = t F (x0 ) f¨ ur ein x0 ∈ X, dann ist notwendig x0 ≤ r. (Beachte, daß nicht vorausgesetzt ist, daß x = t F (x) wirklich eine L¨ osung besitzt.) Dann hat F einen Fixpunkt. (Anleitung: Betrachte die durch G(x) = F (x) f¨ ur F (x) ≤ 2r und G(x) = 2r F (x)/F (x) sonst definierte Abbildung.) Aufgabe IV.8.42 Sei X ein Banachraum, und sei F : BX → X eine kompakte Abbildung. (a) Dann hat F einen Fixpunkt, oder es existieren ein x ∈ SX und ein λ > 1 mit F (x) = λx. (b) Falls F (SX ) ⊂ BX , hat F einen Fixpunkt. Aufgabe IV.8.43 Sei C eine nicht leere, abgeschlossene, konvexe, beschr¨ ankte Teilmenge eines Banachraums, und sei ϕ: [0, ∞) → [0, ∞) eine stetige Funktion mit ϕ(r) < r f¨ ur alle r > 0. Es sei F : C → C eine Abbildung, die F (x) − F (y) ≤ ϕ(x − y) erf¨ ullt. Zeige, daß F einen Fixpunkt besitzt.
∀x, y ∈ C
IV.9 Bemerkungen und Ausblicke
IV.9
195
Bemerkungen und Ausblicke
Die Resultate dieses Kapitels geh¨ oren zu den wichtigsten und n¨ utzlichsten S¨atzen der Funktionalanalysis; ebenso z¨ ahlt die Beweismethode des Kategorienarguments zu den elegantesten Hilfsmitteln der abstrakten Analysis. ¨ (Ubrigens bilden die kompakten topologischen Hausdorffr¨aume eine weitere Raumklasse, f¨ ur die der Bairesche Kategoriensatz gilt.) In gewisser Weise ¨ k¨onnen Mengen 1. Kategorie als das topologische Aquivalent zu Mengen ¨ vom Maß Null angesehen werden. Uber Gemeinsamkeiten und Unterschiede dieser Konzepte gibt Oxtoby [1980] Auskunft. Die Existenz stetiger, aber nirgends differenzierbarer Funktionen kann auch wahrscheinlichkeitstheoretisch begr¨ undet werden, weil ein Pfad der Brownschen Bewegung mit Wahrscheinlichkeit 1 diese Eigenschaften besitzt (siehe Bauer [1991], S. 424). Nat¨ urlich kann man solche Funktionen auch konkret hinschreiben; das einfachste Beispiel einer ∞stetigen nirgends differenzierbaren Funktion auf R scheint durch f (t) = n=0 2−n ϕ(2n t) gegeben zu sein, wo ϕ zun¨ achst auf [−1, 1] durch t → |t| definiert ist und dann periodisch mit der Periode 2 auf R fortgesetzt wird. Die abstrakten Existenzbeweise liefern jedoch, daß so gut wie jede“ stetige Funktion ” an keiner einzigen Stelle differenzierbar ist – eine sicherlich u ¨ berraschende Konsequenz! Theorem IV.2.1 – in diesem und vielen anderen Texten Satz von BanachSteinhaus genannt – wurde zuerst von Hahn (Monatshefte f. Math. u. Physik 32 (1922) 3–88) f¨ ur Funktionale und von Banach (Fund. Math. 3 (1922) 133–181) f¨ ur Operatoren bewiesen, und zwar mit der Methode des gleitenden Buckels. 1927 zeigten Banach und Steinhaus (Fund. Math. 9 (1927) 50– 61) eine Versch¨arfung, das Prinzip der Verdichtung der Singularit¨aten, siehe Aufgabe IV.8.21. Offenbar hat Saks vorgeschlagen, den Beweis statt mit der Buckelmethode mit einem Kategorienargument zu f¨ uhren (vgl. Dieudonn´e [1981], S. 141), und so hielt die Bairesche Technik in die Funktionalanalysis Einzug. Korollar IV.2.5 findet sich mit dem heutigen Beweis ebenfalls in dieser Arbeit. Ein sehr elementarer, kurzer Beweis von Theorem IV.2.1 wurde k¨ urzlich von Sokal (Amer. Math. Monthly 118 (2011) 450–457) ver¨offentlicht. Auch der Satz von der offenen Abbildung wurde von Banach zun¨achst ohne einen Kategorienschluß gezeigt (Studia Math. 1 (1929) 223–239) – in der Tat beweist er das dazu ¨ aquivalente Korollar IV.3.4 –, indem er den Satz von Hahn-Banach und Korollar IV.2.3 benutzt und en passant den Satz vom abgeschlossenen Bild zeigt. Der heute u ¨ bliche Kategorienbeweis wurde von Schauder (Studia Math. 2 (1930) 1–6) entdeckt. Der Satz vom abgeschlossenen Graphen stammt ebenfalls von Banach und findet sich erstmals in seinen Op´erations Lin´eaires, S. 41. Der Begriff des abgeschlossenen Operators geht hingegen auf von Neumann (Math. Ann. 102 (1929) 49–131) zur¨ uck.
196
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
Es ist schon im Text bemerkt worden, daß die Haupts¨atze dieses Kapitels deutlich machen, warum es so schwierig ist, auf Banachr¨aumen definierte, aber unstetige Funktionale und Operatoren zu konstruieren. In den Aufgaben II.5.2 und IV.8.22(b) etwa wurde eine Basis des zugrundeliegenden Vektorraums benutzt und damit implizit das Zornsche Lemma verwendet. Es stellt sich die Frage, ob dieses Hilfsmittel wirklich notwendig ist. J. D. M. Wright diskutiert in seinem Artikel Functional analysis for the ” practical man“ (in: K. D. Bierstedt, B. Fuchssteiner (Hg.), Functional Analysis, North Holland 1977, S. 283–290) Modelle der Mengenlehre, in denen das Zornsche Lemma nicht mehr gilt, aber die (in unserem Standardmodell der Mengenlehre falsche) Aussage Jede lineare Abbildung zwischen ” Banachr¨aumen ist stetig“ ein beweisbarer Satz wird. Auch die Anwendungen auf die Theorie der Fourierreihen waren Banach und seiner Schule bereits bekannt. Fej´er bewies seinen Satz (Satz IV.2.11) im Jahre 1900, freilich ohne die Korovkinschen S¨atze zu benutzen, die erst 1953 bewiesen wurden. Der Beweis daf¨ ur im Text folgt H. Bauer, Amer. Math. Monthly 85 (1978) 632–647; siehe auch Uchiyamas Note in Amer. Math. Monthly 110 (2003) 334–336. Die elementare Theorie der Fourierreihen ist gl¨anzend bei K¨ orner [1988] beschrieben; der Klassiker der Theorie der trigonometrischen Reihen ist Zygmunds gleichnamige Monographie (Zygmund [1959]). Der im Text erw¨ ahnte Satz von Carleson erschien in Acta Math. 116 (1966) 135–157. Kurze Zeit darauf u ¨bertrug Hunt den Beweis auf Lp -Funktionen f¨ ur p > 1 und zeigte, daß auch f¨ ur solche Funktionen die Fourierreihe fast u ¨ berall konvergiert; siehe dazu Jørsboe/Mejlbro [1982] oder Arias de Reyna [2002]. F¨ ur p = 1 gilt diese Aussage jedoch nicht, denn Kolmogorov hat 1926 das bemerkenswerte Gegenbeispiel einer integrierbaren Funktion konstruiert, deren Fourierreihe an keinem einzigen Punkt konvergiert (Zygmund [1959], vol. I, S. 310). In Satz IV.6.2 wurde festgestellt, daß endlichdimensionale Unterr¨aume komplementiert sind. Hier ist es von Interesse, Projektionen von minimaler Norm zu finden. Z.B. existiert eine Projektion Pn mit Pn ≤ c log n von C2π auf den Unterraum aller trigonometrischen Polynome vom Grad ≤ n, wo c eine Konstante ist (Wojtaszczyk [1991], S. 124). Sch¨arfer als Satz IV.6.2 ist die Aussage des Satzes von Kadets/Snobar aus dem Jahr 1971, wonach f¨ ur einen beliebigen n-dimensionalen Unterraum stets eine √ Projektion P mit P ≤ n existiert; zum Beweis siehe wieder Wojtasz√ czyk atzung kann noch weiter zu P ≤ n − √ [1991], S. 116. Diese Absch¨ c/ n, c eine universelle Konstante, verbessert werden (K¨onig/TomczakJaegermann, Trans. Amer. Math. Soc. 320 (1990) 799–823). Satz IV.6.5 stammt von Phillips (Trans. Amer. Math. Soc. 48 (1940) 516–541), der dargestellte Beweis jedoch von Whitley (Amer. Math. Monthly 73 (1966) 285–286). Lemma IV.6.6 geht auf Sierpi´ nski zur¨ uck (Monatshefte f. Math. u. Physik 35 (1928) 239–242). In Aufgabe IV.8.26 war zu zeigen, daß ein zu ∞ isomorpher Unterraum stets komplementiert ist. Im se-
IV.9
Bemerkungen und Ausblicke
197
parablen Fall gilt folgendes Analogon (siehe Lindenstrauss/Tzafriri [1977], ¨ S. 106, oder den Ubersichtsartikel von Cabello S´ anchez, Castillo und Yost in Extracta Math. 15 (2000) 391–420): • (Satz von Sobczyk) Ein zu c0 isomorpher Unterraum eines separablen Banachraums ist komplementiert. Beispiele unkomplementierter Teilr¨ aume in p und Lp [0, 1], 1 < p < ∞, p = 2, werden in K¨ othe [1966], S. 431ff., vorgestellt. Dar¨ uber hinaus weiß man heute, daß jeder unendlichdimensionale komplementierte Teilraum von p zu p isomorph ist. Dies hat Pelczy´ nski 1960 f¨ ur p < ∞ gezeigt, und Lindenstrauss hat 1967 den Fall p = ∞ hinzugef¨ ugt, siehe Lindenstrauss/Tzafriri [1977], S. 53–57. Im allgemeinen braucht ein Banachraum keine nichttrivialen komplementierten Unterr¨aume zu besitzen, denn Gowers und Maurey haben k¨ urzlich (J. Amer. Math. Soc. 6 (1993) 851–874) ein spektakul¨ ares Beispiel eines Banachraums X produziert, bei dem bei jeder Zerlegung X = U ⊕ V in abgeschlossene Unterr¨aume entweder U oder V endlichdimensional ist. In der anderen Richtung ist der auf S. 254 zitierte Satz von Lindenstrauss und Tzafriri zu beachten, auf den ¨ bereits an dieser Stelle hingewiesen sei. Uber komplementierte Unterr¨aume ¨ sind Ubersichtsartikel von Mascioni in Expositiones Math. 7 (1989) 3–47 und von Plichko und Yost in Extracta Math. 15 (2000) 335–371 erschienen. Es gibt wohl nur wenige mathematische S¨atze mit einem derart g¨ unstigen Preis-Leistungs-Verh¨ altnis wie beim Banachschen Fixpunktsatz; bei fast trivialem Beweis ist er praktisch universell anwendbar, vom Newtonverfahren bis zu den Fraktalen. Urspr¨ unglich stammt der Satz aus Banachs Dissertation (Fund. Math. 3 (1922) 133–181), wo er unter der Annahme formuliert ist, daß M eine abgeschlossene Teilmenge eines Banachraums ist. Mit diesem Satz hat Banach der im 19. Jahrhundert von Cauchy, Liouville, Picard und anderen entwickelten Methode der sukzessiven Approximationen einen systematischen Rahmen gegeben. Etwas sp¨ater hat Cacciopoli beobachtet, daß der Banachsche Satz bei gleichem Beweis auch auf abstrakten vollst¨andigen metrischen R¨ aumen funktioniert (Atti Accad. Naz. Lincei Rend., Ser. 6, 11 (1930) 794–799), weswegen manche Autoren vom Satz von Banach-Cacciopoli sprechen. [Tats¨ achlich ist diese Version gar nicht allgemeiner: Ist (M, d) ein vollst¨ andiger metrischer Raum und C b (M ) der Banachraum der stetigen beschr¨ ankten Funktionen auf M mit der Supremumsnorm sowie fx die Funktion y → d(x, y) auf M , so ist bei festem x0 ∈ M die Abbildung x → fx − fx0 eine Isometrie von M auf eine abgeschlossene Teilmenge von C b (M ).] Es ist kein Wunder, daß es zu einem solchen Satz Hunderte von Variationen gibt, wovon aber nur wenige tats¨ achlich von Bedeutung sind. Dazu z¨ahlt sicher der Fixpunktsatz von Weissinger, der unter der Voraussetzung, daß die Iterierten F n Absch¨ atzungen der Form d(F n (x), F n (y)) ≤ αn d(x, y) mit
198
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
ugen, dieselbe Aussage wie der Banachsche Fixpunktsatz n αn < ∞ gen¨ macht; er wird auch genauso bewiesen. Eine weitere, auf den ersten Blick wenig naheliegende Variante setzt die Existenz einer positiven Funktion ϕ mit d(x, F (x)) ≤ ϕ(x) − ϕ(F (x)) ∀x ∈ M (IV.26) voraus. (F¨ ur eine strikte Kontraktion kann man ϕ(x) = d(x, F (x))/(1 − q) w¨ahlen.) Der Fixpunktsatz von Caristi besagt dann, daß eine beliebige Selbstabbildung F eines vollst¨ andigen metrischen Raums, ob stetig oder nicht, die (IV.26) mit einer positiven stetigen Funktion ϕ erf¨ ullt, einen Fixpunkt besitzt. Dieser Satz hat einige u ¨ berraschende Anwendungen gefunden. Der Fixpunktsatz von Browder, G¨ ohde und Kirk wurde von diesen Autoren unabh¨angig voneinander im Jahre 1965 gefunden; Browder hat mit diesem Satz die Existenz periodischer L¨ osungen gewisser Differentialgleichungen bewiesen. Kirks Version ist sogar noch etwas allgemeiner als die im Text. Er behandelt abgeschlossene beschr¨ankte konvexe Mengen C mit normaler Struktur. Das bedeutet folgendes: In jeder konvexen Teilmenge C von C, die mindestens zwei Elemente besitzt, gibt es einen Punkt x0 mit supy∈C x0 − y < diam(C ). In einem gleichm¨aßig konvexen Raum haben alle solche Mengen C normale Struktur, aber in c0 hat {(sn ) ∈ c0 : 0 ≤ sn ≤ 1 f¨ ur alle n} keine normale Struktur. Der Satz von Kirk besagt, daß jede nichtexpansive Abbildung F : C → C einen Fixpunkt hat, wenn die abgeschlossene beschr¨ ankte konvexe Menge C normale Struktur hat und jede Folge in C eine schwach konvergente Teilfolge besitzt ( C ist schwach ” kompakt“). Unser Beweis von Theorem IV.7.13 folgt Ideen von Goebel (Michigan Math. J. 16 (1969) 381–383). Eines der gr¨ oßten offenen Probleme in der Theorie der nichtexpansiven Abbildungen ist, ob der Satz von BrowderG¨ohde-Kirk tats¨ achlich in jedem reflexiven Banachraum gilt. Maurey hat gezeigt, daß das f¨ ur reflexive Unterr¨ aume von L1 [0, 1] stimmt. Die umgekehrte Frage, ob ein Raum, in dem der Satz von Browder-G¨ohde-Kirk gilt, notwendig reflexiv ist, wurde k¨ urzlich von Lin (Nonlinear Anal. 68 (2008) 2303–2308) durch eine raffinierte Umnormierung von 1 negativ beantwortet, wenngleich die Antwort f¨ ur Unterr¨ aume von L1 [0, 1] (in der kanonischen Norm) positiv ist (Dowling und Lennart). Die Idee, statt der nichtexpansiven Abbildung F die Abbildung G = 1 ı (Uspekhi Mat. Nauk 10(1) 2 (Id + F ) zu iterieren, stammt von Krasnoselski˘ (1955) 123–127), der gezeigt hat, daß auf einem gleichm¨aßig konvexen Raum X f¨ ur eine kompakte nichtexpansive Abbildung F bei beliebigem Startwert die durch xn+1 = G(xn ) definierte Folge gegen einen Fixpunkt von F konvergiert; unser Korollar IV.7.8 ist der Spezialfall, daß X ein Hilbertraum ist. Sp¨ater hat Ishikawa (Proc. Amer. Math. Soc. 59 (1976) 65–71) diese Aussage f¨ ur einen beliebigen Banachraum bewiesen; aber auf die Kom-
IV.9
199
Bemerkungen und Ausblicke
paktheit von F kann man nicht verzichten, selbst nicht in 2 , wie Genel und Lindenstrauss mittels eines raffinierten Gegenbeispiels gezeigt haben (Israel J. Math. 22 (1975) 81–86). Satz IV.7.6 u ¨ber die schwache Konvergenz dieser Folge stammt von Opial (Bull. Amer. Math. Soc. 73 (1967) 591–597); er bleibt auch in gewissen gleichm¨aßig konvexen R¨aumen wie Lp (μ), 1 < p < ∞, g¨ ultig. Der Beweis im Text l¨aßt sich von Reinermanns Argumenten leiten (Arch. Math. 20 (1969) 59–64), der auch allgemeinere Iterationsverfahren betrachtet. Ein anderes konstruktives Verfahren besteht in der Berechnung der Mit telwerte zn = n1 nk=1 F k (x); hier kann man die schwache Konvergenz der Folge (zn ) gegen einen Fixpunkt der nichtexpansiven Abbildung F z.B. auf Lp -R¨aumen, 1 < p < ∞, zeigen. Der Begriff der gleichm¨ aßigen Konvexit¨ at wurde von Clarkson eingef¨ uhrt (Trans. Amer. Math. Soc. 40 (1936) 396–414), der auch die gleichm¨aßige Konvexit¨at der Lp-R¨ aume gezeigt hat. Sein Argument fußt auf den Clarksonschen Ungleichungen (1/p + 1/q = 1) f f
q + g + f 2 p p + g + f 2 p
q f pp + g pp q/p − g ≤ 2 p 2 p p f p + g pp − g ≤ 2 2 p
f¨ ur 1 < p ≤ 2, f¨ ur 2 ≤ p < ∞,
die f¨ ur p = q = 2 in die Parallelogrammgleichung“ (IV.18) u ¨bergehen. ” Ein einfacher Beweis der gleichm¨ aßigen Konvexit¨at von Lp , der auch die korrekte Gr¨oßenordnung von δLp wiedergibt, n¨amlich p−1 2 ε + o(ε2 ) 8 1 p δLp (ε) = ε + o(εp ) p2p δLp (ε) =
f¨ ur 1 < p ≤ 2, f¨ ur 2 ≤ p < ∞,
stammt von Meir (Illinois J. Math. 28 (1984) 420–424); der Beweis im Text geht auf McShane zur¨ uck. Ein weiterer Beweis der gleichm¨aßigen Konvexit¨at der Lp -R¨aume wurde k¨ urzlich von Hanche-Olsen ver¨offentlicht (Proc. Amer. Math. Soc. 134 (2006) 2359–2362). Die Reflexivit¨at gleichm¨aßig konvexer R¨aume wurde 1938 unabh¨ angig voneinander von Milman und Pettis gefunden, unser Beweis in Kapitel VIII ist der von Ringrose (J. London Math. Soc. 34 (1959) 92). Brouwer4 ver¨ offentlichte seinen Fixpunktsatz im Jahre 1912; jedoch hatten Poincar´e (1886) und der lettische Mathematiker Bohl (1904) bereits vorher Resultate bewiesen, die sich a posteriori als ¨aquivalent zum Brouwerschen Fixpunktsatz erwiesen haben. Der Beweis des Brouwerschen Satzes 4 Die
Mathematiker L.E.J. Brouwer und F. Browder sind zu unterscheiden!
200
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
ist alles andere als offensichtlich, und es gibt verschiedene Zug¨ange. Analytische Beweise findet man z.B. in Dunford/Schwartz [1958], S. 467–470, Ruˇziˇcka [2004], S. 11–17, und Heusers Lehrbuch der Analysis, Teil 2 (Teubner 1981), § 228, siehe auch Werner [2009], S. 273–2765. K¨onigsberger bringt in der 4. Auflage seiner Analysis 2 (Springer 2002) in Abschnitt 13.9 den Beweis, der auf dem Differentialformenkalk¨ ul basiert, und Bollob´ as [1990] in Kapitel 15 den kombinatorischen Beweis, dessen Grundlage das Spernersche Lemma ist. Schließlich findet man in B¨ uchern u ¨ ber algebraische Topologie wie z.B. Rotmans An Introduction To Algebraic Topology (Springer 1988) eine Herleitung, die die Maschinerie der Homologietheorie verwendet; in der Tat ist in diesem Buch der Brouwersche Fixpunktsatz eine wesentliche Motivation, die Homologietheorie zu entwickeln. All diesen Beweisen ist gemein, daß sie nicht konstruktiv sind. Der erste konstruktive Beweis stammt von Scarf (SIAM J. Appl. Math. 15 (1967) 1328–1343), der mit einem kombinatorischen Algorithmus zu jedem ε > 0 Punkte xε mit F (xε ) − xε ≤ ε, also approximative Fixpunkte, findet. Dieser Algorithmus wurde von Eaves mittels Homotopiemethoden verbessert (Math. Programming 3 (1972) 1–22); ein anderer Algorithmus, der auf analytischen Methoden beruht, wurde von Kellogg, Li und Yorke (SIAM J. Num. Anal. 13 (1976) 473–483) vorgeschlagen. Der Schaudersche Fixpunktsatz stammt aus seiner Arbeit in Studia Math. 2 (1930) 171–180. Fast gleichzeitig hatte Cacciopoli (loc. cit.) einen Spezialfall entdeckt und damit den Existenzsatz von Peano neu bewiesen. Wenige Jahre sp¨ater dehnte Tikhonov den Schauderschen Satz (in der Version von Theorem IV.7.16) auf lokalkonvexe Hausdorffr¨aume (siehe Kapitel VIII) aus; aber erst vor kurzem konnte Cauty zeigen, daß der Satz sogar in allen hausdorffschen topologischen Vektorr¨aumen gilt, was bereits von Schauder vermutet worden war (siehe Problem 54 im Schottischen Buch). Seine Arbeit in Fund. Math. 170 (2001) 231–246, die in der letzten Auflage an dieser Stelle zitiert worden war, hat jedoch eine entscheidende L¨ ucke. Inzwischen hat Cauty den Satz mit einem ganz anderen Ansatz bewiesen (Serdica Math. J. 31 (2005) 308–354), gegen den noch kein Protest angemeldet ¨ wurde. Einen Ubersichtsartikel von Cauty findet man in arXiv:1010.2401. Im Unterschied zum Banachschen Fixpunktsatz folgt beim Schauderschen nat¨ urlich nicht die Eindeutigkeit des Fixpunkts. Browder hat jedoch 1970 die Eindeutigkeit unter der Voraussetzung bewiesen, daß C der Abschluß einer offenen konvexen beschr¨ ankten Menge in einem komplexen Banachraum und die kompakte Abbildung F : C → C analytisch ist und keinen Fixpunkt auf ∂C besitzt. Wie in der Funktionentheorie kann man analytisch hier als im komplexen Sinn Fr´echet-differenzierbar (Definition III.5.1) erkl¨aren. 5 Dieser Beweis erscheint auch in der 1. Auflage von Heuser [1992] aus dem Jahre 1975 sowie in Noten von Milnor (Amer. Math. Monthly 85 (1978) 521–524), Rogers (Amer. Math. Monthly 87 (1980) 525–527) und Gr¨ oger (Math. Nachr. 102 (1981) 293–295).
IV.9
Bemerkungen und Ausblicke
201
Man kann die Brouwerschen und Schauderschen S¨atze auch als Nebenprodukt der Theorie des Abbildungsgrads erhalten, die von Brouwer im ´ endlichdimensionalen und von Leray und Schauder (Ann. Sci. Ecole Norm. Sup. 51 (1934) 45–78) im unendlichdimensionalen Fall entwickelt worden ist. Es sei X ein Banachraum, O ⊂ X offen und beschr¨ankt sowie y ∈ X; ferner sei F : O → X eine kompakte Abbildung und G := Id−F (im endlichdimensionalen Fall ist G also einfach eine stetige Abbildung auf O). Leray und Schauder haben gezeigt, daß man jedem solchen Tripel mit y ∈ / G(∂O) auf genau eine Weise eine ganze Zahl d(G, O, y), den Abbildungsgrad, zuordnen kann, so daß gelten: (1) d(Id, O, y) = 1 f¨ ur y ∈ O. (2) d(G, O, y) = d(G, O1 , y) + d(G, O2 , y), falls O1 und O2 disjunkte offene Teilmengen von O sind und y ∈ / G(O \ (O1 ∪ O2 )) ist. (3) Ist h: [0, 1] × O → X kompakt und Gt (x) = x − h(t, x), so gilt d(G0 , O, y) = d(G1 , O, y), falls y ∈ / t Gt (∂O). Dann folgt, daß die Gleichung G(x) = y in O l¨osbar ist, wenn d(G, O, y) = 0 ist; im Fall y = 0 geht es also um die Fixpunkte von F . Die Abbildungsgradtheorie ist, insbesondere dank der Homotopieinvarianz (3), ein m¨achtiges Werkzeug zur L¨osung nichtlinearer Gleichungen. Theorem IV.7.23 wurde 1955 von Darbo f¨ ur Abbildungen mit α(F (A)) ≤ q α(A) f¨ ur ein q < 1 bewiesen; der allgemeine Fall kondensierender Abbildungen stammt aus Sadovski˘ıs Arbeit in Russian Math. Surveys 27(1) (1972) 85–155, die viele Beispiele und Anwendungen enth¨alt. Der Beweis im ¨ Text folgt V¨aths Uberblicksartikel in Jahresber. DMV 106 (2004) 129–147. Sadovski˘ı hat in seiner Arbeit auch eine Abbildungsgradtheorie f¨ ur kondensierende Abbildungen entworfen. Viele singul¨are Integraloperatoren f¨ uhren u ¨brigens auf kondensierende Operatoren, die weder kompakt noch strikt kontraktiv sind. Dann ist weder der Schaudersche noch der Banachsche Fixpunktsatz anwendbar, und der Satz von Darbo-Sadovski˘ı ist das einzige Mittel, das weiterhilft. Konkrete Beispiele solcher Operatoren werden von Appell, de Pascale und Zabre˘ıko (Z. Anal. Anwend. 6 (1987) 193–208) diskutiert. Außer dem Kuratowskischen Nichtkompaktheitsmaß ist das Hausdorffsche Nichtkompaktheitsmaß β von Bedeutung; man definiert β(A), indem man in Definition IV.7.20 Mengen vom Durchmesser ≤ ε“ durch Kugeln ” ” vom Radius ≤ ε“ ersetzt. Es ist also stets β(A) ≤ α(A) ≤ 2β(A). In diesem Kontext gilt der Satz von Darbo-Sadovski˘ı entsprechend. Die Monographien von Aksoy/Khamsi [1990], Goebel/Kirk [1990], Granas/Dugundji [2003] und Zeidler [1986] informieren umfassend aus sehr unterschiedlichen Blickwinkeln u ¨ ber fast alle Aspekte der Fixpunkttheorie.
Kapitel V
Hilbertr¨ aume
V.1
Definitionen und Beispiele
Hilbertr¨aume sind Banachr¨ aume, die – wie der Kn – als zus¨atzliche Struktur ein Skalarprodukt zulassen. Sie geh¨ oren zu den wichtigsten R¨aumen der Analysis. Definition V.1.1 Sei X ein K-Vektorraum. Eine Abbildung . , . : X ×X → K heißt Skalarprodukt (oder inneres Produkt), falls (a) x1 + x2 , y = x1 , y + x2 , y ∀x1 , x2 , y ∈ X, (b) λx, y = λx, y ∀x, y ∈ X, λ ∈ K, (c) x, y = y, x ∀x, y ∈ X, (d) x, x ≥ 0 ∀x ∈ X, (e) x, x = 0 ⇔ x = 0. Eine unmittelbare Konsequenz von (a), (b) und (c) ist (a ) x, y1 + y2 = x, y1 + x, y2 ∀x, y1 , y2 ∈ X, (b ) x, λy = λx, y ∀x, y ∈ X, λ ∈ K. F¨ ur K = R ist . , . also bilinear, f¨ ur K = C m¨ ussen Skalare aus dem zweiten Faktor konjugiert komplex herausgezogen werden; man nennt . , . sesquilinear (sesqui = 1 12 ). Die Eigenschaften (d) und (e) zusammen nennt man positive Definitheit des Skalarproduktes, nach (c) ist stets x, x ∈ R. Wie in der linearen Algebra (oder Analysis) zeigt man die folgende wichtige Ungleichung. Satz V.1.2 (Cauchy-Schwarzsche Ungleichung) Ist X ein Vektorraum mit Skalarprodukt . , . , so gilt |x, y|2 ≤ x, x · y, y
∀x, y ∈ X.
Gleichheit gilt genau dann, wenn x und y linear abh¨ angig sind.
D. Werner, Funktionalanalysis, 7. Aufl., Springer-Lehrbuch, DOI 10.1007/978-3-642-21017-4_5, © Springer-Verlag Berlin Heidelberg 2011
204
V.
Hilbertr¨ aume
Beweis. Sei λ ∈ K beliebig. Dann gilt 0 ≤ x + λy, x + λy
(V.1)
= x, x + λy, x + x, λy + λy, λy = x, x + λx, y + λx, y + |λ|2 y, y. Setze nun λ = − x,y alt y,y , falls y = 0 ist. Man erh¨ 0≤
x, y x, y x− y, x − y y, y y, y
. = x, x −
|x, y|2 |x, y|2 |x, y|2 − + y, y y, y y, y
und daraus die Cauchy-Schwarzsche Ungleichung, die im u ur y = 0 ¨ brigen f¨ trivial ist. Gleichheit gilt genau dann, wenn Gleichheit in (V.1) gilt, was den Zusatz zeigt. 2 Setzt man zur Abk¨ urzung x = x, x1/2 , so lautet Satz V.1.2 |x, y| ≤ x · y . Daß die Bezeichnung x gerechtfertigt ist, zeigt das n¨achste Lemma. Lemma V.1.3 x → x := x, x1/2 definiert eine Norm. Beweis. λx = |λ| x folgt aus (b) und (b ), und x = 0 ⇔ x = 0 folgt aus (d) und (e). Die Dreiecksungleichung ergibt sich so: x + y 2 = x + y, x + y = x, x + x, y + y, x + y, y = x 2 + 2 Rex, y + y 2 (∗)
≤ x 2 + 2 x y + y 2 = ( x + y )2 ;
bei (∗) gehen die Cauchy-Schwarz-Ungleichung und die elementare Ungleichung Re z ≤ |z| ein. 2 Definition V.1.4 Ein normierter Raum (X, . ) heißt Pr¨ ahilbertraum, wenn es ein Skalarprodukt . , . auf X × X mit x, x1/2 = x f¨ ur alle x ∈ X gibt. Ein vollst¨ andiger Pr¨ ahilbertraum heißt Hilbertraum. Wir werden das Skalarprodukt, das die Norm des Pr¨ahilbertraums X erzeugt, stets mit . , . bezeichnen. . wird stets die in Lemma V.1.3
V.1
205
Definitionen und Beispiele
beschriebene Norm sein. (Ist (X, . ) ein Pr¨ahilbertraum und ||| . ||| eine ¨aquivalente Norm auf X, so braucht (X, ||| . |||) kein Pr¨ahilbertraum zu sein!) Die Cauchy-Schwarz-Ungleichung impliziert, daß auf einem Pr¨ahilbertraum die Abbildungen x → x, y und y → x, y stetig sind. Als weitere Konsequenz halten wir ein Lemma fest, das sp¨ater (Korollar V.3.5) noch verallgemeinert wird. Lemma V.1.5 Ist X ein Pr¨ahilbertraum, U ⊂ X ein dichter Unterraum und x ∈ X mit x, u = 0 f¨ ur alle u ∈ U , so ist x = 0. Beweis. Die Menge Y = {y ∈ X: x, y = 0} ist wegen der Stetigkeit von y → x, y abgeschlossen und enth¨ alt den dichten Unterraum U , also muß Y = X sein. Speziell ist x ∈ Y , und das liefert x 2 = x, x = 0 sowie x = 0. 2 In einem Pr¨ahilbertraum kann nicht nur die Norm durch das Skalarprodukt ausgedr¨ uckt werden, sondern auch das Skalarprodukt durch die Norm; eine einfache Rechnung zeigt n¨ amlich f¨ ur K = R x, y =
1 ( x + y 2 − x − y 2 ) 4
(V.2)
und f¨ ur K = C x, y =
1 ( x + y 2 − x − y 2 + i x + iy 2 − i x − iy 2 ). 4
(V.3)
Lemma V.1.6 Das Skalarprodukt eines Pr¨ahilbertraums X ist eine stetige Abbildung von X × X nach K. Beweis. Die Behauptung folgt aus |x1 , y1 − x2 , y2 | = |x1 − x2 , y1 + x2 , y1 − y2 | ≤ x1 − x2 · y1 + x2 · y1 − y2 .
2
Satz V.1.7 (Parallelogrammgleichung) Ein normierter Raum X ist genau dann ein Pr¨ahilbertraum, wenn x + y 2 + x − y 2 = 2 x 2 + 2 y 2
∀x, y ∈ X
(V.4)
gilt. Beweis. In einem Pr¨ ahilbertraum gilt (V.4), wie man sofort sieht. (Der Name Parallelogrammgleichung erkl¨ art sich aus dem Spezialfall X = R2 , versehen mit der euklidischen Norm.) Gelte nun (V.4). Wir behandeln K = R. Setze wie in (V.2) x, y =
1 ( x + y 2 − x − y 2 ). 4
206
V.
Hilbertr¨ aume
Auf jeden Fall ist x = x, x1/2 . Wir werden (V.4) benutzen, um die Skalarprodukteigenschaften von . , . zu zeigen: (a) F¨ ur x1 , x2 , y ∈ X gilt gem¨ aß (V.4) x1 + x2 + y 2 = 2 x1 + y 2 + 2 x2 2 − x1 − x2 + y 2 =: α, x1 + x2 + y 2 = 2 x2 + y 2 + 2 x1 2 − −x1 + x2 + y 2 =: β. Folglich ist α+β 2 = x1 + y 2 + x1 2 + x2 + y 2 + x2 2 1 − x1 − x2 + y 2 + −x1 + x2 + y 2 . 2
x1 + x2 + y 2 =
Analog erh¨alt man x1 + x2 − y 2 = x1 − y 2 + x1 2 + x2 − y 2 + x2 2 1 − x1 − x2 − y 2 + −x1 + x2 − y 2 . 2 Es folgt 1 x1 + x2 + y 2 − x1 + x2 − y 2 4 1 = x1 + y 2 + x2 + y 2 − x1 − y 2 − x2 − y 2 4 = x1 , y + x2 , y.
x1 + x2 , y =
(b) Nach (a) gilt (b) f¨ ur λ ∈ N; und nach Konstruktion gilt (b) f¨ ur λ = 0 und λ = −1, also auch f¨ ur λ ∈ Z. Deshalb gilt (b) auch f¨ ur λ = m n ∈ Q: / x 0 nλx, y = n m , y = mx, y = nλx, y n Die (wegen der Stetigkeit von . ) stetigen Funktionen (von R nach R) λ → λx, y,
λ → λx, y
stimmen auf Q daher u ¨ berein und sind deshalb gleich. Das zeigt (b). (c) ist klar. (d) und (e) folgen aus x, x = x 2 . F¨ ur K = C argumentiere ¨ ahnlich mit Hilfe der in (V.3) definierten Abbildung! 2
V.1
207
Definitionen und Beispiele
Satz V.1.8 (a) Ein normierter Raum ist genau dann ein Pr¨ ahilbertraum, wenn alle zweidimensionalen Unterr¨aume Pr¨ ahilbertr¨ aume (d.h. ∼ = 2 (2)) sind. (b) Unterr¨ aume von Pr¨ ahilbertr¨ aumen sind Pr¨ ahilbertr¨ aume. (c) Die Vervollst¨ andigung eines Pr¨ ahilbertraums ist ein Hilbertraum. Beweis. (a) ist eine Konsequenz aus Satz V.1.7. (b) ist trivial (schr¨ anke das Skalarprodukt ein!). sei die Vervollst¨ (c) X andigung des Pr¨ ahilbertraums X (siehe Korollar III.3.2). Die Parallelogrammgleichung gilt in X und u ¨bertr¨agt sich aus Nach Satz V.1.7 ist X ein Stetigkeitsgr¨ unden auf den Abschluß, d.h. auf X. Hilbertraum. 2 Beispiele. (a) Aus der linearen Algebra sind die Hilbertr¨aume Cn mit dem Skalarprodukt n 1 2 (si ), (ti ) = s i ti i=1
bekannt. (b) 2 ist ein Hilbertraum, dessen Norm vom Skalarprodukt 1
∞ 2 (si ), (ti ) = s i ti i=1
induziert wird. (Die Konvergenz der Reihe folgt aus der H¨olderschen Ungleichung.) (c) Ist Ω ⊂ R ein Intervall oder Ω ⊂ Rn offen (oder allgemeiner meßbar), so ist L2 (Ω) ein Hilbertraum, wobei das Skalarprodukt durch f, g = f g dλ Ω
definiert ist; hier bezeichnet λ das Lebesguemaß. (Daß f g integrierbar ist, folgt wieder aus der H¨ olderschen Ungleichung.) Allgemeiner sind alle R¨aume L2 (μ) Hilbertr¨aume. (d) In der numerischen Mathematik treten h¨aufig Maße der Form μ = w · λ auf. Hier ist w ≥ 0 eine meßbare Funktion auf einem Intervall I und λ wie oben das Lebesguemaß. f, g = f gw dλ I
definiert das Skalarprodukt auf L2 (μ).
208
V.
Hilbertr¨ aume
(e) Einen weiteren Spezialfall erh¨ alt man f¨ ur das z¨ahlende Maß auf einer beliebigen Indexmenge I. Den entsprechenden L2 -Raum bezeichnet man mit 2 (I). (F¨ ur I = N erh¨ alt man 2 .) Eine ¨aquivalente Beschreibung lautet f (s) = 0 f¨ ur h¨ ochstens abz¨ahlbar viele s 2 (I) = f : I → K: und s∈I |f (s)|2 < ∞ Dabei ist die Summe . . .“ im folgenden Sinn zu verstehen. Sei etwa ” s∈I {s1 , s2 , . . .} eine Aufz¨ ahlung von {s: f (s) = 0}. Man setzt
|f (s)|2 =
∞
|f (si )|2 ;
i=1
s∈I
beachte, daß wegen der absoluten Konvergenz die Summationsreihenfolge keine Rolle spielt. F¨ ur f, g ∈ 2 (I) ist f, g = f (s)g(s) s∈I
ein wohldefiniertes Skalarprodukt, die induzierte Norm f =
1/2 |f (s)|
2
s∈I
macht 2 (I) zu einem vollst¨ andigen Raum. (Diese Aussagen k¨onnen auf dieselbe Weise gezeigt werden wie f¨ ur 2 .) (f) Zu λ ∈ R betrachte die Funktion fλ : R → C, fλ (s) = eiλs . Setze X = lin{fλ : λ ∈ R}. Durch den Ansatz 1 T →∞ 2T
f, g = lim
T
f (s)g(s) ds
(V.5)
−T
wird ein Skalarprodukt auf X definiert (Aufgabe V.6.4). Die Vervollst¨andigung von X unter der Norm x = x, x1/2 ist ein Hilbertraum, den wir mit AP2 (R) bezeichnen. Da (Aufgabe V.6.4) √ fλ − fλ = 2 ∀λ = λ gilt, ist AP2 (R) nicht separabel (vgl. den Beweis der Inseparabilit¨at von ∞ , S. 29); darin liegt die Bedeutung dieses Beispiels. Aus den Resultaten des Abschnitts V.4 wird AP2 (R) ∼ ur almost periodic, = 2 (R) folgen. (AP steht f¨ siehe die Bemerkungen und Ausblicke.) (g) Sehr wichtige Beispiele von Hilbertr¨ aumen sind die Sobolevr¨aume, die jetzt definiert werden sollen.
V.1
209
Definitionen und Beispiele
Definition V.1.9 Sei Ω ⊂ Rn offen. Dann sei D(Ω) = {ϕ ∈ C ∞ (Ω): supp(ϕ) := {x: ϕ(x) = 0} ⊂ Ω ist kompakt}. (Hier ist C ∞ (Ω) = m∈N C m (Ω).) supp(ϕ) heißt der Tr¨ ager von ϕ; Elemente von D(Ω) heißen C ∞ -Funktionen mit kompaktem Tr¨ager oder Testfunktionen. Warum Testfunktionen so genannt werden, wird auf S. 432 erkl¨art. Beispiel. | . | sei die euklidische Norm auf Rn und c · exp((|x|2 − 1)−1 ) f¨ ur |x| < 1 ϕ(x) = 0 f¨ ur |x| ≥ 1. Dann ist ϕ ∈ D(Rn ) (vgl. Aufgabe II.5.6). Lemma V.1.10 D(Ω) liegt dicht in Lp(Ω) f¨ ur 1 ≤ p < ∞. Beweis. Der Beweis dieser Aussage ist im Fall n = 1, Ω = R in Aufgabe II.5.6 skizziert worden, und f¨ ur Ω = Rn argumentiert man genauso; man muß jetzt ϕε (x) = ε1n ϕ(x/ε) setzen. Wir betrachten nun den Fall einer beliebigen offenen Menge Ω ⊂ Rn . Sei f ∈ Lp (Ω) und Km = {x ∈ Ω: |x| ≤ m, 2 d(x, ∂Ω) ≥ }. Dann sind die K kompakt, es gilt m m Km = Ω und m p p |f (x)| dx → |f (x)| dx nach dem Satz von Beppo Levi (Satz A.3.1). Km Ω Setzt man fm (x) = f (y)ϕ1/m (x − y) dy, (V.6) Km
so ist (vgl. Aufgabe II.5.6) fm ∈ D(Ω), und es gilt f − fm Lp → 0. Beachte, daß diese Konstruktion eine simultane Approximation in allen Lp -R¨aumen liefert: Ist f ∈ Lp (Ω) ∩ Lq (Ω), so gilt f − fm Lp → 0 und f − fm Lq → 0. 2 Als n¨achstes soll das Konzept der schwachen Ableitungen behandelt werden. Sei zun¨ achst Ω ⊂ R ein offenes Intervall. F¨ ur f ∈ C 1 (Ω) und ϕ ∈ D(Ω) gilt dann f (x)ϕ(x) dx = − f (x)ϕ (x) dx Ω
Ω
nach der Regel der partiellen Integration. (Die Randterme verschwinden, weil der Tr¨ager von ϕ eine kompakte Teilmenge von Ω ist.) Diese Gleichung schreiben wir mit Hilfe des L2 (Ω)-Skalarproduktes als f , ϕ = −f, ϕ .
210
V.
Hilbertr¨ aume
Nun sei Ω = (−1, 1), f (x) = |x| und g(x) = x/|x| f¨ ur x = 0 sowie g(0) = 0. Obwohl f ∈ / C 1 (Ω) ist, gilt eine ¨ ahnliche Gleichung, n¨amlich g, ϕ = −f, ϕ
∀ϕ ∈ D(Ω).
Wir fassen g als schwache“ oder verallgemeinerte“ Ableitung von f auf. ” ” Analog gilt f¨ ur offenes Ω ⊂ Rn und f ∈ C 1 (Ω), ϕ ∈ D(Ω) . . ∂ ∂ f, ϕ = − f, ϕ ∂xi ∂xi als Folgedes Gaußschen Integralsatzes (siehe auch Aufgabe V.6.6); hier ist f, ϕ = Ω f ϕ. Entsprechend erh¨ alt man f¨ ur m-mal stetig differenzierbares f und Multiindizes α, |α| ≤ m D α f, ϕ = (−1)|α| f, Dα ϕ
∀ϕ ∈ D(Ω).
(Die Multiindexschreibweise wurde in Beispiel I.1(d) eingef¨ uhrt.) Definition V.1.11 Sei Ω ⊂ Rn offen, α ein Multiindex und f ∈ L2 (Ω). g ∈ L2 (Ω) heißt schwache oder verallgemeinerte α-te Ableitung von f , falls g, ϕ = (−1)|α| f, D α ϕ
∀ϕ ∈ D(Ω)
gilt. Ein solches g ist eindeutig bestimmt: Ist n¨amlich h ebenfalls schwache Ableitung von f , so ist g − h, ϕ = 0 f¨ ur alle ϕ ∈ D(Ω), und mit Lemma V.1.5 sowie Lemma V.1.10 folgt g = h. Wir bezeichnen die in Definition V.1.11 eindeutig erkl¨arte Funktion g mit D(α) f . Es gilt also D(α) f, ϕ = (−1)|α| f, D α ϕ
∀ϕ ∈ D(Ω).
Definition V.1.12 Sei Ω ⊂ Rn offen. (a) W m (Ω) = {f ∈ L2 (Ω): D(α) f ∈ L2 (Ω) existiert ∀|α| ≤ m} (b) f, gW m = |α|≤m D(α) f, D(α) gL2 (c) H m (Ω) = C m (Ω) ∩ W m (Ω), der Abschluß bezieht sich auf die von . , . W m induzierte Norm. (d) H0m (Ω) = D(Ω) Diese R¨aume werden Sobolevr¨ aume genannt. Es ist klar, daß es sich dabei um Vektorr¨aume handelt, und es ist klar, daß . , . W m ein Skalarprodukt ist. F¨ ur beschr¨ ankte Gebiete mit gen¨ ugend glattem Rand ist u ¨brigens W m (Ω) = H m (Ω) (Adams [1975], S. 54). Hingegen liegt C m (Ω) ∩ W m (Ω) f¨ ur alle Ω dicht in W m (Ω) (Adams [1975], S. 52).
V.1
211
Definitionen und Beispiele
Satz V.1.13 W m (Ω), H m (Ω) und H0m (Ω) sind Hilbertr¨aume. Beweis. Es ist nur die Vollst¨ andigkeit von W m (Ω) zu zeigen. Sei fn eine . W m -Cauchyfolge. Wegen f 2W m =
D(α) f 2L2
∀f ∈ W m
|α|≤m
sind alle (D (α) fn ) . L2 -Cauchyfolgen. Es existieren also fα ∈ L2 (Ω) mit D (α) fn − fα L2 → 0. Wir bezeichnen jetzt f(0,...,0) einfach mit f0 und zeigen D(α) f0 = fα ; dann folgt f0 ∈ W m und fn → f0 bzgl. . W m nach Definition dieser Norm. In der Tat ist f¨ ur ϕ ∈ D(Ω) fα , ϕL2 =
/
0 lim D(α) fn , ϕ
(lim bzgl. . L2 )
L2
n→∞
= lim D(α) fn , ϕL2 n→∞
(Stetigkeit von . , ϕ)
= lim (−1)|α| fn , D α ϕL2 n→∞ / 0 = (−1)|α| lim fn , Dα ϕ
L2
n→∞
(Definition von D(α) ) (Stetigkeit von . , Dα ϕ)
= (−1)|α| f0 , D α ϕL2 . Daher folgt 2
fα = D(α) f0 .
Es ist klar, daß W m (Ω) ⊂ W m−1 (Ω) gilt und der identische Operator W (Ω) → W m−1 (Ω) stetig ist. Mit Hilfe der Sobolevtheorie k¨ onnen Existenzprobleme f¨ ur L¨osungen (insbesondere elliptischer) partieller Differentialgleichungen behandelt werden. Folgende Resultate sind h¨ aufig von Nutzen: m
• Lemma von Sobolev: F¨ ur f ∈ W m (Ω) und m > k + k g ∈ C (Ω) mit f = g fast ¨ uberall.
n 2
existiert
• Satz von Rellich: F¨ ur eine beschr¨ankte offene Menge Ω ⊂ Rn ist m die Einbettung H0 (Ω) → H0m−1 (Ω) kompakt. Diese S¨atze werden im n¨ achsten Abschnitt bewiesen.
212
V.2
V.
Hilbertr¨ aume
Fouriertransformation und Sobolevr¨ aume
Das Ziel dieses Abschnitts ist es, in einem Exkurs die soeben genannten S¨atze von Sobolev und Rellich zu beweisen. Als technisches Hilfsmittel werden wir dazu die Fouriertransformation ben¨ otigen, die auch im folgenden noch eine wesentliche Rolle spielen wird. Wir werden folgende Bezeichnungen verwenden. Sind x, ξ ∈ Rn , so setzen wir 1/2 n n n 2 2 2 xξ = xj ξj , x = xj , |x| = xj . j=1
j=1
j=1
In diesem Abschnitt werden wir stets komplexwertige Funktionen betrachten. Definition V.2.1 F¨ ur f ∈ L1 (Rn ) setze 1 (F f )(ξ) = f (x)e−ixξ dx (2π)n/2 Rn
∀ξ ∈ Rn .
(V.7)
Die Funktion F f heißt Fouriertransformierte von f und die Abbildung F Fouriertransformation. Offensichtlich ist F f wohldefiniert und meßbar, und die Abbildung F ist linear. Wir halten nun einfache Eigenschaften von F fest; der gleich auftauchende Raum C0 (Rn ), . ∞ wurde in Beispiel I.1(c) definiert. Satz V.2.2 F¨ ur f ∈ L1 (Rn ) ist F f ∈ C0 (Rn ). Ferner ist F : L1 (Rn ) → n C0 (R ) ein stetiger linearer Operator mit F ≤ (2π)−n/2 . Beweis. Da die Absch¨ atzung F f ∞ ≤ (2π)−n/2 f L1 klar ist und F f meßbar ist, ist F ein stetiger Operator von L1 (Rn ) nach L∞ (Rn ) mit der gew¨ unschten Norm. Es bleibt zu zeigen, daß die F f stetig sind und im Unendlichen verschwinden. Sei also (ξ (k) ) eine Folge in Rn mit ξ (k) → ξ. Dann gilt f¨ ur jedes x |e−ixξ
(k)
− e−ixξ | → 0
und deshalb nach dem Lebesgueschen Konvergenzsatz A.3.2 (k) 1 |(F f )(ξ (k) ) − (F f )(ξ)| ≤ |f (x)| |e−ixξ − e−ixξ | dx → 0, (2π)n/2 Rn da die Integranden durch die L1 -Funktion 2|f | majorisiert werden. Also ist F f stetig.
V.2
213
Fouriertransformation und Sobolevr¨ aume
Um nun ran F ⊂ C0 (Rn ) zu zeigen, reicht es wegen der Dichtheit von D(Rn ) in L1 (Rn ) (Lemma V.1.10), lim |(F f )(ξ)| = 0
|ξ|→∞
∀f ∈ D(Rn )
n zu beweisen. Seien also f ∈ D(R√ ), R > 0 und |ξ| ≥ R. Dann existiert eine Koordinate ξj mit |ξj | ≥ R/ n. Es folgt durch partielle Integration (beachte, daß die Randterme verschwinden) −1 ∂ 1 −ixξ |(F f )(ξ)| = f (x) e dx −iξj (2π)n/2 Rn ∂xj √ ∂ 1 n ≤ f → 0 mit R → ∞, n/2 ∂xj L1 R (2π)
2
was zu zeigen war.
Aus funktionalanalytischer Sicht ist es g¨ unstig, F auf einen geeigneten Teilraum von L1 (Rn ), der aus glatten Funktionen besteht, einzuschr¨anken. Optimal ist dabei die Wahl des als n¨ achstes definierten Schwartzraums S (Rn ). Definition V.2.3 Eine Funktion f : Rn → C heißt schnell fallend, falls lim xα f (x) = 0
|x|→∞
∀α ∈ Nn0 ;
(V.8)
αn 1 hier ist xα durch xα art. Der Raum 1 · · · xn erkl¨
S (Rn ) = {f ∈ C ∞ (Rn ): Dβ f schnell fallend ∀β ∈ Nn0 } heißt Schwartzraum, seine Elemente Schwartzfunktionen. 2
Ein Beispiel einer Schwartzfunktion ist γ(x) = e−x . Statt (V.8) kann man auch ¨aquivalenterweise lim P (x)f (x) = 0
|x|→∞
∀Polynome P : Rn → C
(V.9)
oder lim |x|m f (x) = 0
|x|→∞
∀m ∈ N0
(V.10)
fordern. (Offensichtlich impliziert (V.8) die Bedingung (V.9), und (V.9) liefert (V.10), da man sich auf gerade m beschr¨anken kann und dann das Polynom P (x) = (x21 +· · ·+x2n )m/2 betrachtet. Schließlich zeigt |xα | ≤ |x||α| die noch fehlende Implikation.) Nach Definition verschwinden Schwartzfunktionen und ihre s¨amtlichen Ableitungen im Unendlichen schneller als das Reziproke jeden Polynoms.
214
V.
Hilbertr¨ aume
Daher ist S (Rn ) ⊂ Lp (Rn ) f¨ ur alle p ≥ 1, da f¨ ur mp − (n − 1) > 1 und f ∈ S (Rn ) p c |f (x)|p dx ≤ dx 1 + |x|m Rn Rn p ∞ 1 = cp ωn−1 rn−1 dr < ∞, m 1 + r 0 wo ωn−1 die Oberfl¨ ache der Sph¨ are {x ∈ Rn : |x| = 1} und c eine geeignete Konstante bezeichnet. Offensichtlich ist S (Rn ) ein Vektorraum, der D(Rn ) umfaßt; also liegt S (Rn ) dicht in Lp (Rn ) f¨ ur 1 ≤ p < ∞. Eine C ∞ -Funktion f ist genau dann eine Schwartzfunktion, wenn sup (1 + |x|m )|D β f (x)| < ∞
x∈Rn
∀m ∈ N0 , β ∈ Nn0 .
(V.11)
Zum Beweis beachte, daß (V.11) |x|m |Dβ f (x)| ≤
(|x|m + |x|m+1 )|Dβ f (x)| c ≤ →0 1 + |x| 1 + |x|
impliziert. Man verwendet hier 1 + |x|m statt des Vorfaktors |x|m , da man dann stets durch diesen Faktor dividieren kann, was sich h¨aufig als n¨ utzlich herausstellt. Die Bedeutung des Schwartzraums liegt darin, daß die Fouriertransformation F eine Bijektion von S (Rn ) auf S (Rn ) vermittelt (Satz V.2.8), was f¨ ur L1 (Rn ) nicht der Fall ist. Um diesen Satz zu beweisen, sind einige Vorbereitungen notwendig. Im folgenden wird die Funktion x → xα ebenfalls mit dem Symbol xα bezeichnet; das ist zwar nicht ganz pr¨azise, gestattet aber, einige Aussagen leichter zu formulieren. Ist f ∈ S (Rn ), so ergibt sich unmittelbar aus der Definition xα f ∈ S (Rn ), Dα f ∈ S (Rn )
∀α ∈ Nn0 .
Im n¨achsten Lemma studieren wir die Wirkung von Differentiation und Fouriertransformation. Lemma V.2.4 Sei f ∈ S (Rn ) und α ein Multiindex. Dann gelten: (a) F f ∈ C ∞ (Rn ) und Dα (F f ) = (−i)|α| F (xα f ). (b) F (Dα f ) = i|α| ξ α F f . Beweis. (a) Die formale Rechnung lautet: ∂α 1 D α (F f )(ξ) = f (x)e−ixξ dx ∂ξ α (2π)n/2 Rn
V.2
215
Fouriertransformation und Sobolevr¨ aume
∂α f (x) α e−ixξ dx ∂ξ Rn 1 = (−i)|α| f (x)xα e−ixξ dx (2π)n/2 Rn
(∗)
=
1 (2π)n/2
= (−i)|α| F (xα f )(ξ). Es ist noch zu begr¨ unden, warum in (∗) die Differentiation unter dem Integral erlaubt ist. Da xα f ∈ S (Rn ) ⊂ L1 (Rn ) ist, folgt das aus dem Konvergenzsatz von Lebesgue; siehe Korollar A.3.3. (b) Durch partielle Integration erh¨ alt man (beachte, daß wegen xβ f ∈ n S (R ) alle Randterme verschwinden) 1 F (Dα f )(ξ) = (D α f )(x)e−ixξ dx (2π)n/2 Rn (−1)|α| ∂α = f (x) α e−ixξ dx n/2 ∂x (2π) Rn = (−1)|α| (−i)|α| ξ α (F f )(ξ), 2
was zu zeigen war.
Lemma V.2.4 dr¨ uckt die wichtige Eigenschaft der Fouriertransformation aus, Ableitungen in Multiplikationen zu verwandeln, also analytische Operationen zu algebraischen zu machen. Lemma V.2.5 Wenn f ∈ S (Rn ) ist, ist auch F f ∈ S (Rn ). Beweis. In Lemma V.2.4(a) wurde F f ∈ C ∞ (Rn ) festgestellt. Es ist zu zeigen, daß ξ α Dβ (F f )(ξ) → 0 f¨ ur |ξ| → ∞ strebt. Nach Lemma V.2.4 ist ξ α Dβ (F f )(ξ) = (−i)|β| (−i)|α| F (D α xβ f )(ξ), und da Dα (xβ f ) ∈ S (Rn ), also integrierbar, ist, folgt die Behauptung aus Satz V.2.2. 2 Wir berechnen nun die Fouriertransformierte der Funktion 2
γ(x) = e−x
/2
∀x ∈ Rn .
Dies ist (bis auf einen Faktor) die Dichte der Standardnormalverteilung der Wahrscheinlichkeitstheorie. Wir setzen noch γa (x) = γ(ax) f¨ ur a > 0. Bekanntlich gilt 1 γ(x) dx = 1. (2π)n/2 Rn
216
V.
Hilbertr¨ aume
Lemma V.2.6 Es gilt (F γ)(ξ) = e−ξ
2
/2
,
(F γa )(ξ) =
ξ 1 (F γ) . an a
Beweis. Die zweite Behauptung ist klar. Wir berechnen jetzt F γ f¨ ur den Fall n = 1. Dann erf¨ ullt γ die gew¨ ohnliche Differentialgleichung y + xy = 0
(V.12)
mit dem Anfangswert y(0) = 1. Nun gilt nach Lemma V.2.4 1 0 = F (γ + xγ) = iξF γ + Fγ , −i d.h. F γ erf¨ ullt ebenfalls (V.12) mit demselben Anfangswert ∞ 2 1 (F γ)(0) = √ e−x /2 dx = 1. 2π −∞ Da Anfangswertprobleme f¨ ur lineare gew¨ ohnliche Differentialgleichungen eindeutig l¨osbar sind, folgt γ = F γ. Der Fall n > 1 wird auf n = 1 zur¨ uckgef¨ uhrt, n¨amlich ∞ ∞3 3 2 1 (F γ)(ξ) = ··· e−xk /2 e−ixk ξk dx1 . . . dxn n/2 (2π) −∞ −∞ 2
2
= e−ξ1 /2 · · · e−ξn /2 = e−ξ
2
/2
2
.
Lemma V.2.7 F¨ ur f ∈ S (Rn ) gilt (F F f )(x) = f (−x)
∀x ∈ Rn .
Beweis. Es gilt F f ∈ S (Rn ) (Lemma V.2.5), so daß die linke Seite wohldefiniert ist. Versucht man, das Doppelintegral (F F f )(x) mittels des Satzes von Fubini direkt auszuwerten, st¨ oßt man auf Schwierigkeiten, da ein nicht konvergentes Integral entsteht. Daher arbeitet man mit den konvergenz” erzeugenden“ Funktionen γa . Wir beobachten zun¨ achst als unmittelbare Konsequenz des Satzes von Fubini (F f )(x)g(x) dx = f (x)(F g)(x) dx ∀f, g ∈ S (Rn ); (V.13) Rn
Rn
hier ist die Integralvertauschung wirklich erlaubt, da (x, ξ) → f (ξ)g(x)e−ixξ integrierbar ist. Das impliziert f¨ ur g(x) = e−ixξ0 γ(ax), wo ξ0 ∈ Rn und a > 0 fest sind, wegen 1 (F g)(ξ) = e−ixξ0 γ(ax)e−ixξ dx = (F γa )(ξ + ξ0 ) (2π)n/2 Rn
V.2
217
Fouriertransformation und Sobolevr¨ aume
0 und Lemma V.2.6 mit der Variablensubstitution u = x+ξ a 1 (F f )(x)e−ixξ0 γ(ax) dx (2π)n/2 Rn x + ξ 1 1 0 = f (x) (F γ) dx an a (2π)n/2 Rn 1 = f (au − ξ0 )γ(u) du. (2π)n/2 Rn
L¨aßt man a → 0 streben, so zeigt der Lebesguesche Konvergenzsatz, daß der erste Term gegen (F F f )(ξ0 ) und der letzte gegen f (−ξ0 ) konvergiert. (Im ersten Term ist |F f | und im letzten f ∞γ eine integrierbare Majorante.) Damit ist das Lemma bewiesen. 2 Satz V.2.8 Die Fouriertransformation ist eine Bijektion von S (Rn ) auf S (Rn ); der inverse Operator ist durch 1 (F −1 f )(x) = f (ξ)eixξ dξ ∀x ∈ Rn (V.14) (2π)n/2 Rn gegeben. Ferner gilt F f, F gL2 = f, gL2
∀f, g ∈ S (Rn ).
Beweis. Nach Lemma V.2.7 gilt F 4 = IdS (Rn ) . Daraus folgt, daß F bijektiv und F −1 = F 3 ist, und das liefert sofort (F −1 f )(x) = F 2 (F f ) (x) = (F f )(−x), was (V.14) zeigt. Ferner gilt nach (V.13) (F f )(ξ)(F g)(ξ) dξ = f (x) F (F g) (x) dx. Rn
Rn
Setzt man abk¨ urzend h = F g, so erh¨ alt man 1 (F h)(x) = h(ξ)e−ixξ dξ (2π)n/2 Rn 1 = h(ξ)eixξ dξ (2π)n/2 Rn = (F −1 h)(x) = g(x)
und daraus F f, F gL2 =
Rn
f (x)g(x) dx = f, gL2 .
2
218
V.
Hilbertr¨ aume
Insbesondere gilt F f L2 = f L2
∀f ∈ S (Rn ).
Der Operator F ist also auf dem Teilraum S (Rn ) von L2 (Rn ) wohldefiniert, bijektiv und bzgl. . L2 isometrisch. Da S (Rn ) nach Lemma V.1.10 dicht in L2 (Rn ) liegt, kann F zu einem isometrischen Operator auf L2 (Rn ) fortgesetzt werden; diese Fortsetzung, genannt Fourier-Plancherel-Transformation, soll einstweilen mit F2 bezeichnet werden. Wegen Satz V.2.8 ist F2 : L2 (Rn ) → L2 (Rn ) ein isometrischer Isomorphismus, und es gilt die Plancherel-Gleichung F2 f, F2 gL2 = f, gL2
∀f, g ∈ L2 (Rn ).
(V.15)
Es ist wichtig zu bemerken, daß F2 f f¨ ur f ∈ L2 (Rn ) nicht durch (V.7) 2 n gegeben ist; ist f ∈ L (R ), so braucht das Integral in (V.7) nicht zu ¨ existieren. Ferner ist F2 f nach Konstruktion eine Aquivalenzklasse von Funktionen, w¨ahrend (V.7) wirklich eine Funktion definiert. Hier ist der Zusammenhang zwischen F und F2 . Wir setzen BR = {x ∈ Rn : |x| ≤ R} und f¨ ur f ∈ L2 (Rn ) 1 gR (ξ) = f (x)e−ixξ dx. (2π)n/2 BR Satz V.2.9 (a) F¨ ur f ∈ L1 (Rn ) ∩ L2 (Rn ) gilt 1 (F2 f )(ξ) = f (x)e−ixξ dx (2π)n/2 Rn (b) F¨ ur f ∈ L2 (Rn ) gilt
fast u ¨berall.
F2 f = lim gR , R→∞
wo die Konvergenz im Sinn von . L2 vorliegt. Beweis. (a) Der Beweis von Lemma V.1.10 zeigt, daß es eine Folge (fk ) in D(Rn ) mit fk − f L1 → 0 und fk − f L2 → 0 gibt. Satz V.2.2 impliziert die gleichm¨aßige Konvergenz von (F fk ) gegen F f , und diese liefert |F fk (ξ) − F f (ξ)|2 dξ → 0 ∀R > 0. BR
Andererseits gilt nach der Plancherel-Gleichung (V.15) F fk − F2 f L2 = F2 (fk − f ) L2 = fk − f L2 → 0,
V.2
219
Fouriertransformation und Sobolevr¨ aume
also
|F fk (ξ) − F2 f (ξ)|2 dξ → 0
∀R > 0.
BR
Daraus folgt F2 f (ξ) = F f (ξ) fast u ¨ berall. (b) Nach Definition und (a) ist gR = F (χBR f ) = F2 (χBR f ) fast u ¨berall (beachte, daß χBR f wegen L2 (BR ) ⊂ L1 (BR ) integrierbar ist). Weil (χBR f ) nach dem Konvergenzsatz von Lebesgue in L2 (Rn ) gegen f konvergiert, liefert die Stetigkeit von F2 , daß gR → F2 f in L2 (Rn ) gilt. 2 Die Aussage von (b) dr¨ uckt man auch durch die Formel 1 (F2 f )(ξ) = l.i.m. f (x)e−ixξ dx R→∞ (2π)n/2 B R aus; hierbei ist nicht die punktweise Konvergenz, sondern die Konvergenz im quadratischen Mittel gemeint. l.i.m. steht f¨ ur Limes im Mittel“. ” Wie in Theorem II.4.2 werden wir ab jetzt F und F2 als dieselben“ ” Operatoren ansehen; das ist durch Satz V.2.9(a) gerechtfertigt. Wir schreiben daher F statt F2 , und die Plancherel-Gleichung lautet nun F f, F gL2 = f, gL2
∀f, g ∈ L2 (Rn ).
(V.16)
Nun untersuchen wir die Fouriertransformation auf Lp (Rn ) f¨ ur 1 ≤ p ≤ 2. Satz V.2.10 (Hausdorff-Young-Ungleichung) Seien 1 ≤ p ≤ 2 und p1 + 1q = 1. F¨ ur f ∈ S (Rn ) ist F f ∈ Lq (Rn ), und es gilt 1 F f Lq ≤ f Lp . (V.17) n/p−n/2 (2π) Die Fouriertransformation F hat eine Ausdehnung zu einem stetigen Operator F : Lp (Rn ) → Lq (Rn ), der durch 1 (F f )(ξ) = l.i.m. f (x)e−ixξ dx R→∞ (2π)n/2 B R beschrieben wird; l.i.m. steht hier f¨ ur die Konvergenz in Lq (Rn ). Beweis. Die Aussage ist richtig f¨ ur p = 1, q = ∞ (Satz V.2.2) und f¨ ur p = 2, q = 2 (V.16): F : L1 → L∞ ≤ (2π)−n/2 , F : L2 → L2 ≤ 1. F¨ ur 1 < p < 2 folgt sie aus dem Satz von Riesz-Thorin (Theorem II.4.2). W¨ahlt man dort n¨ amlich θ mit p1 = 1−θ + θ2 , d.h. θ = 2 − 2p , so ist 1q = 1 1−θ θ ∞ + 2 , und (II.14) liefert (V.17).
220
V.
Hilbertr¨ aume
Daß die Ausdehnung die beschriebene Gestalt hat, beweist man wie Satz V.2.9(b). 2 F¨ ur f ∈ Lp (Rn ) mit p > 2 kann F f nicht mehr als Funktion dargestellt werden, sondern nur noch als Distribution; siehe dazu Abschnitt VIII.5. Als n¨achstes beweisen wir das Analogon zu Lemma V.2.4 f¨ ur schwache Ableitungen (Definition V.1.11). Lemma V.2.11 Sei f ∈ W m (Rn ). Dann gilt f¨ ur |α| ≤ m F (D(α) f ) = i|α| ξ α F f. Beweis. Sei ϕ ∈ S (Rn ). Dann gilt nach der Plancherel-Gleichung (V.16) und Lemma V.2.4 F (D(α) f ), F ϕ = D(α) f, ϕ = (−1)|α| f, D α ϕ = (−1)|α| F f, F Dα ϕ = (−1)|α| F f, i|α| ξ α F ϕ = i|α| ξ α (F f )(ξ)(F ϕ)(ξ) dξ; Rn
im zweiten Schritt muß man sich klarmachen, daß die partielle Integration auch mit Schwartzfunktionen klappt (Aufgabe V.6.7). Da die Fouriertransformation den Schwartzraum auf sich abbildet, gilt f¨ ur die Funktion h = F (D(α) f ) − i|α| ξ α · F f daher insbesondere h(ξ)ψ(ξ) dξ = 0 ∀ψ ∈ D(Rn ). (V.18) Rn
Die Crux ist nun, daß nicht a priori klar ist, daß h in L2 (Rn ) liegt. Gewiß ist aber die Einschr¨ ankung von h auf jede Kugel ΩR = {x: |x| < R} quadratisch integrierbar, und (V.18) liefert h, ψL2 (ΩR ) = 0
∀ψ ∈ D(ΩR ).
Da D(ΩR ) dicht in L2 (ΩR ) liegt, folgt nach Lemma V.1.5 h = 0 fast u ¨berall auf ΩR und deshalb h = 0 fast u 2 ¨berall. Das war zu zeigen. Jetzt stehen alle Hilfsmittel bereit, um die S¨atze von Sobolev und Rellich zu beweisen. Wir erinnern daran, daß C k (Ω) den Vektorraum aller k-mal stetig differenzierbaren Funktionen von Ω nach C bezeichnet. Satz V.2.12 (Lemma von Sobolev) Sei Ω ⊂ Rn offen, und seien m, k ∈ N0 mit m > k + n2 . Ist f ∈ W m (Ω), so existiert eine k-mal stetig differenzierbare Funktion auf Ω, die mit f ¨ fast ¨ uberall ¨ ubereinstimmt. Mit anderen Worten, die Aquivalenzklasse f ∈ m k W (Ω) hat einen Repr¨asentanten in C (Ω).
V.2
221
Fouriertransformation und Sobolevr¨ aume
Beweis. Wir betrachten zuerst den Fall Ω = Rn . Im Beweis von Lemma V.2.4(a) wurde folgende Aussage mitbewiesen: • Falls g ∈ L1 (Rn ) und xα g ∈ L1 (Rn ) f¨ ur |α| ≤ k, so ist F g k-mal stetig differenzierbar. Die Idee ist hier, dieses Kriterium f¨ ur g = F f zu benutzen. Wir werden also zeigen: • Falls f ∈ W m (Rn ), m > k + n2 und |α| ≤ k, so ist ξ α F f ∈ L1 (Rn ). Dazu beobachten wir zun¨ achst, daß Lemma V.2.11 ξ α F f ∈ L2 (Rn ) f¨ ur |α| ≤ m impliziert. Insbesondere gelten ξj2m |F f (ξ)|2 dξ < ∞ ∀j = 1, . . . , n Rn
und
Rn
|F f (ξ)|2 dξ < ∞.
Wegen 1 + ξ 2 = (1, ξ12 , . . . , ξn2 ) 1 (n+1) ≤ (1, . . . , 1) p (n+1) (1, ξ12 , . . . , ξn2 ) m (n+1) = (n + 1)1/p (1 + ξ12m + · · · + ξn2m )1/m , wo
1 p
+
1 m
= 1 (H¨ oldersche Ungleichung I.1.4), folgt (1 + ξ 2 )m |F f (ξ)|2 dξ < ∞. Rn
Ferner gilt trivialerweise |ξ α | ≤ |ξ||α| . Diese Absch¨atzungen und die CauchySchwarz-Ungleichung implizieren nun f¨ ur |α| ≤ k |ξ α F f (ξ)| dξ ≤ (1 + ξ 2 )|α|/2 |F f (ξ)| dξ Rn Rn ≤ (1 + ξ 2 )m/2 |F f (ξ)|(1 + ξ 2 )−(m−k)/2 dξ Rn
≤ < ∞,
Rn
1/2 (1 + ξ 2 )m |F f (ξ)|2 dξ
Rn
1 dξ (1 + ξ 2 )m−k
1/2
denn mit ωn−1 = Oberfl¨ ache der Einheitssph¨are in Rn gilt ∞ 1 1 dξ = ω rn−1 dr < ∞ n−1 2 m−k (1 + r2 )m−k Rn (1 + ξ ) 0 f¨ ur 2(m − k) − (n − 1) > 1, d.h. m > k + n2 .
222
V.
Hilbertr¨ aume
Daher ist ξ α F f ∈ L1 (Rn ) und deshalb F F f ∈ C k (Rn ). Andererseits gilt mit (σg)(x) = g(−x) die Gleichung σg = F F g f¨ ur g ∈ S (Rn ) n (Lemma V.2.7); da σ und F stetig sind und S (R ) dicht liegt, gilt diese Gleichung auch f¨ ur g ∈ L2 (Rn ). Es folgt, daß f mit der C k -Funktion σ(F F f ) fast u ¨berall u ¨ bereinstimmt. Das zeigt die Behauptung des Satzes im Fall Ω = Rn . Sei nun Ω ⊂ Rn eine beliebige offene Teilmenge und f ∈ W m (Ω). Seien y ∈ Ω, r > 0 und B(y, r) = {x ∈ Rn : |x − y| < r}. Es sei r so klein, daß K := B(y, r) ⊂ Ω gilt. W¨ ahle jetzt ϕ ∈ D(Ω) mit ϕ|K = 1. (Setzt man ϕε wie im Beweis von Lemma V.1.10, so ist f¨ ur hinreichend kleines ε ϕ(x) = ϕε (x − z) dz B(y,r+ε)
solch eine Funktion.) Nach Aufgabe V.6.8 ist ϕf ∈ W m (Ω), und da diese Funktion in einer Umgebung von ∂Ω verschwindet, k¨onnen wir sie durch 0 zu einer Funktion in W m (Rn ) fortsetzen. Der erste Teil des Beweises zeigt die Existenz einer k-mal stetig differenzierbaren Funktion gy,r mit gy,r = ϕf fast u ¨berall, insbesondere ist gy,r (x) = f (x)
f¨ ur fast alle x ∈ B(y, r).
Ist f¨ ur zwei solche Parameterpaare (y, r) bzw. (z, s) die Menge B := B(y, r) ∩B(z, s) = ∅, so folgt insbesondere gy,r = gz,s fast u ¨ berall auf B. Da es sich um stetige Funktionen handelt, ist {x ∈ B: gy,r (x) = gz,s (x)} eine offene Nullmenge, also leer. Das zeigt gy,r = gz,s u ¨berall auf B. Daher ist durch g(x) = gy,r (x)
falls x ∈ B(y, r)
eine wohldefinierte C k -Funktion auf Ω erkl¨ art, die fast u ¨ berall mit f u ¨bereinstimmt. 2 Grob gesagt impliziert das Sobolevlemma, daß m-mal schwach differenzierbare Funktionen pro halber Raumdimension eine Differenzierbarkeitsordnung gegen¨ uber klassisch differenzierbaren Funktionen verlieren. Das Sobolevlemma gilt nicht mehr f¨ ur den Grenzexponenten m = k + n2 ; siehe Aufgabe V.6.9. Satz V.2.13 (Rellichscher Einbettungssatz) Ist Ω ⊂ Rn beschr¨ ankt und offen, so ist der identische Operator von H0m (Ω) m−1 nach H0 (Ω) kompakt. Beweis. Es reicht, sich auf den Fall m = 1 zu beschr¨anken. Ist dieser Fall n¨amlich bewiesen und (fj ) eine beschr¨ ankte Folge in H0m (Ω), so sind alle (α) (D fj ), 0 ≤ |α| ≤ m − 1, beschr¨ ankt in H01 (Ω) und besitzen daher . L2 Cauchyteilfolgen. Durch sukzessive Anwendung dieses Schlusses auf alle
V.2
223
Fouriertransformation und Sobolevr¨ aume
solche Multiindizes erh¨ alt man eine in H0m−1 (Ω) konvergente Teilfolge von m−1 (fj ), da H0 (Ω) vollst¨ andig ist. Daher gen¨ ugt es zu zeigen, daß die identische Einbettung von H01 (Ω) nach L2 (Ω) kompakt ist. Dazu ist zu beweisen, daß eine beschr¨ankte Folge (fj ) in H01 (Ω) eine . L2 -konvergente Teilfolge hat. Weil D(Ω) nach Definition dicht in H01 (Ω) liegt, darf man fj ∈ D(Ω) annehmen; diese Funktionen d¨ urfen wir dann auch als Elemente von D(Rn ) ansehen. Wegen Theorem III.3.7 (beachte, daß die Folge (fj ) trivialerweise auch in L2 (Ω) beschr¨ankt ist) besitzt (fj ) eine in L2 (Ω) schwach konvergente Teilfolge. Ohne Einschr¨ankung nehmen wir an, daß (fj ) selbst schwach konvergiert, und zeigen nun, daß (fj ) eine . L2 -Cauchyfolge ist. Nach der Plancherel-Gleichung gilt fk − fj 2L2 = F fk − F fj 2L2 = |F fk (ξ) − F fj (ξ)|2 dξ. Rn
Dieses Integral zerlegen wir in |F fk (ξ) − F fj (ξ)|2 dξ + {|ξ|≤R}
{|ξ|>R}
|F fk (ξ) − F fj (ξ)|2 dξ.
Nun ist nach Lemma V.2.11 f¨ ur l = 1, . . . , n und f ∈ W 1 (Rn ) ∂ ∂ ξl F f L2 (Rn ) = F f = f ≤ f W 1 (Rn ) ∂xl L2 (Rn ) ∂xl L2 (Rn ) (die Ableitungen sind Sinn zu verstehen), also ist hier im verallgemeinerten die Folge |ξ|F fj beschr¨ ankt in L2 (Rn ). Zu gegebenem ε > 0 w¨ahle jetzt R > 0 mit 1 |F fk (ξ) − F fj (ξ)|2 dξ ≤ 2 |ξ|2 |F fk (ξ) − F fj (ξ)|2 dξ R {|ξ|>R} {|ξ|>R} ∀j, k ∈ N.
< ε
(V.19)
Mit eξ (x) = eixξ ist, da Ω beschr¨ ankt ist, eξ ∈ L2 (Ω). Folglich definiert f → f, eξ = f (x)e−ixξ dx Ω
eine nach der Cauchy-Schwarz-Ungleichung stetige auf L2 (Ω). Linearform 2 Weil (fj ) in L (Ω) schwach konvergiert, ist daher (F fj )(ξ) f¨ ur alle ξ ∈ Rn konvergent. Wir m¨ ochten daraus |F fk (ξ) − F fj (ξ)|2 dξ → 0 f¨ ur j, k → ∞ (V.20) {|ξ|≤R}
schließen.
224
V.
Hilbertr¨ aume
Nun ist (fj ) beschr¨ ankt in L2 (Ω), daher auch in L1 (Ω), da Ω beschr¨ankt ist. Satz V.2.2 zeigt, daß (F fj ) in der Supremumsnorm beschr¨ankt ist; deshalb folgt (V.20) aus dem Lebesgueschen Konvergenzsatz. Mit (V.19) und (V.20) ist der Beweis des Satzes vollst¨andig. 2 Der Einbettungssatz von Rellich braucht f¨ ur die R¨aume W m (Ω) nicht zu gelten; ein Gegenbeispiel findet man bei Courant/Hilbert [1968], Band 2, S. 522. Wenn es jedoch einen stetigen linearen Fortsetzungsoperator von W m (Ω) nach W m (Rn ) gibt, folgt aus Satz V.2.13 leicht, daß auch W m (Ω) kompakt in W m−1 (Ω) eingebettet ist. Ein solcher Fortsetzungsoperator existiert, wenn Ω glatt berandet ist oder allgemeiner die gleichm¨aßige Kegel” bedingung“ erf¨ ullt (Adams [1975], S. 91). Zum Schluß dieses Abschnitts sollen die Sobolevr¨aume W m (Rn ) mittels der Fouriertransformation beschrieben werden. Satz V.2.14 Es gilt W m (Rn ) = {f ∈ L2 (Rn ): (1 + |ξ|2 )m/2 F f ∈ L2 (Rn )}.
(V.21)
Beweis. Die Inklusion ⊂“ folgt unmittelbar aus Lemma V.2.11, und ⊃“ ” ” praktisch auch: Der Beweis des Lemmas zeigt n¨amlich f¨ ur f ∈ L2 (Rn ), ϕ ∈ D(Rn ) und |α| ≤ m (−1)|α| f, Dα ϕ = i|α| ξ α F f, F ϕ = g, ϕ, wo g := i|α| (F −1 ξ α F )f ∈ L2 (Rn ), falls (1 + |ξ|2 )m/2 F f ∈ L2 (Rn ).
2
Satz V.2.14 er¨ offnet die M¨ oglichkeit, die Sobolevr¨aume W m (Rn ) f¨ ur beliebige Exponenten m > 0 zu erkl¨ aren; (V.21) dient dann als Definition.1 Traditionell bezeichnet man reelle Exponenten mit s statt mit m.
V.3
Orthogonalit¨ at
Wir kehren nun zur Untersuchung allgemeiner Hilbertr¨aume zur¨ uck. Mit Hilfe des Begriffs des Skalarprodukts kann das elementargeometrische Konzept der Orthogonalit¨ at abstrakt gefaßt werden. Definition V.3.1 Sei X ein Pr¨ ahilbertraum. Zwei Vektoren x, y ∈ X heißen orthogonal, in Zeichen x ⊥ y, falls x, y = 0 gilt. Zwei Teilmengen A, B ⊂ X heißen orthogonal, in Zeichen A ⊥ B, falls x ⊥ y f¨ ur alle x ∈ A, y ∈ B gilt. Die Menge A⊥ := {y ∈ X: x ⊥ y ∀x ∈ A} heißt orthogonales Komplement von A. 1 Auch im Fall negativer Exponenten kann man W m (Rn ) mittels (V.21) definieren, wenn man als Grundmenge der betrachteten f statt des Raums L2 den Raum der temperierten Distributionen (Abschnitt VIII.5) nimmt.
V.3
225
Orthogonalit¨ at
Die folgenden Eigenschaften ergeben sich direkt aus den Definitionen: • (Satz des Pythagoras) x ⊥ y ⇒ x 2 + y 2 = x + y 2 .
(V.22)
• A⊥ ist stets ein abgeschlossener Unterraum von X. • A ⊂ (A⊥ )⊥ • A⊥ = (lin A)⊥ Es wird aus Theorem V.3.6 folgen, daß die Bezeichnung A⊥ aus Definition V.3.1 mit der aus (III.4) konsistent ist. Der n¨achste Satz ist zentral f¨ ur die Hilbertraumtheorie; dabei ist die Vollst¨andigkeit wesentlich. Satz V.3.2 (Projektionssatz) Sei H ein Hilbertraum, K ⊂ H sei abgeschlossen und konvex, und es sei x0 ∈ H. Dann existiert genau ein x ∈ K mit x − x0 = inf y − x0 . y∈K
Beweis. Die Aussage ist trivial, falls x0 ∈ K; dann w¨ahle einfach x = x0 . Also d¨ urfen wir x0 ∈ / K annehmen, und es ist keine Einschr¨ankung, x0 = 0 anzunehmen (sonst verschiebe alles um −x0 ). Zur Existenz: Setze d = inf y∈K y . Dann existiert eine Folge (yn ) in K mit yn → d. Wir zeigen, daß (yn ) eine Cauchyfolge ist. In der Tat folgt aus der Parallelogrammgleichung (Satz V.1.7) yn + ym 2 yn − ym 2 + = 1 yn 2 + ym 2 → d2 f¨ ur n, m → ∞, 2 2 2 und wegen 12 (yn + ym ) ∈ K ist 12 (yn + ym ) 2 ≥ d2 . Daraus ergibt sich die Cauchy-Eigenschaft von (yn ). Da H vollst¨ andig ist, existiert x := lim yn , und da K abgeschlossen ist, ist x ∈ K. Wegen yn → d folgt x = d. Zur Eindeutigkeit: Erf¨ ullen x und x ˜ x = ˜ x = inf y = d y∈K
und gilt x = x ˜, so folgt aus der Parallelogrammgleichung 2 2 2 x + x ˜ ˜ ˜ 1 2 2 2 < x + x + x − x 2 2 2 = 2 d +d =d im Widerspruch zur Definition von d, denn 12 (x + x ˜) ∈ K.
2
Durch Satz V.3.2 wird eine (im allgemeinen nichtlineare) Abbildung P : H → K, P (x0 ) = x, beschrieben. Sie l¨ aßt sich so charakterisieren:
226
V.
Hilbertr¨ aume
Lemma V.3.3 Sei K eine abgeschlossene konvexe Teilmenge des Hilbertraums H, und sei x0 ∈ H. Dann sind f¨ ur x ∈ K ¨ aquivalent: (i) x0 − x = inf y∈K x0 − y (ii) Rex0 − x, y − x ≤ 0 ∀y ∈ K. Anschaulich besagt (ii), daß der Winkel zwischen x0 − x und y − x stets stumpf ist (Kosinussatz!):
K
x
y
x0
Beweis. (ii) ⇒ (i) folgt aus x0 − y 2 = (x0 − x) + (x − y) 2 = x0 − x 2 + 2 Rex0 − x, x − y + x − y 2 ≥ x0 − x 2 . (i) ⇒ (ii): Zu t ∈ [0, 1] setze yt = (1 − t)x + ty ∈ K, falls y ∈ K. Dann gilt wegen (i) x0 − x 2 ≤ x0 − yt 2 = x0 − x + t(x − y), x0 − x + t(x − y) = x0 − x 2 + 2 Rex0 − x, t(x − y) + t2 x − y 2 . Folglich Rex0 − x, y − x ≤ Daraus folgt (ii).
t x − y 2 2
∀t ∈ (0, 1]. 2
Der Fall eines abgeschlossenen Unterraums f¨ ur K ist von allergr¨oßter Bedeutung. Eine Projektion ist, wie in Abschnitt IV.6 erkl¨art, eine Abbildung P mit P 2 = P . Theorem V.3.4 (von der Orthogonalprojektion) Sei U = {0} ein abgeschlossener Unterraum des Hilbertraums H. Dann
V.3
227
Orthogonalit¨ at
existiert eine lineare Projektion PU von H auf U mit PU = 1 und ker(PU ) = U ⊥ . Id − PU ist Projektion von H auf U ⊥ mit Id − PU = 1 (es sei denn, U = H), und es ist H = U ⊕2 U ⊥ . (PU wird Orthogonalprojektion auf U genannt.) Beweis. Zu x0 ∈ H bezeichne mit PU (x0 ) ∈ U denjenigen gem¨aß Satz V.3.2 eindeutig bestimmten Punkt x in U , der die Bedingungen (i) bzw. (ii) in Lemma V.3.3 erf¨ ullt. Dann ist nat¨ urlich PU eine Projektion auf U . Nach Lemma V.3.3 gilt also Rex0 − PU (x0 ), y − PU (x0 ) ≤ 0
∀y ∈ U.
Da mit y auch y − PU (x0 ) den Unterraum U durchl¨auft, ist Rex0 − PU (x0 ), y ≤ 0
∀y ∈ U
und schließlich (betrachte −y sowie iy) x0 − PU (x0 ), y = 0
∀y ∈ U.
(V.23)
Umgekehrt folgt aus (V.23) Bedingung (ii) aus Lemma V.3.3 f¨ ur einen Unterraum U . Also ist PU (x0 ) der eindeutig bestimmte Punkt x ∈ U , f¨ ur den x0 − x ∈ U ⊥ (V.24) gilt. Da U ⊥ ein Unterraum ist, folgt λ1 x1 − λ1 PU (x1 ) + λ2 x2 − λ2 PU (x2 ) ∈ U ⊥ f¨ ur x1 , x2 ∈ H, λ1 , λ2 ∈ K. Also PU (λ1 x1 + λ2 x2 ) = λ1 PU (x1 ) + λ2 PU (x2 ), und PU ist linear. Nach Konstruktion ist ran(PU ) = U , und es ist ker(PU ) = U ⊥ , denn nach (V.24) gilt PU (x0 ) = 0 ⇔ x0 ∈ U ⊥ . Daher ist Id−PU eine Projektion mit ran(Id−PU ) = U ⊥ , ker(Id−PU ) = U . Aus dem Satz des Pythagoras (V.22) folgt schließlich x0 2 = PU x0 + (x0 − PU x0 ) 2 = PU x0 2 + (Id − PU )x0 2 , da PU x0 ∈ U und x0 − PU x0 ∈ U ⊥ . Das zeigt H = U ⊕2 U ⊥ und PU ≤ 1, Id − PU ≤ 1, nach Lemma IV.6.1(a) also = 1 (falls U = {0} bzw. U = H). Damit ist Theorem V.3.4 bewiesen. 2
228
V.
Hilbertr¨ aume
Korollar V.3.5 F¨ ur einen Unterraum U eines Hilbertraums H ist U = (U ⊥ )⊥ Beweis. Aus Theorem V.3.4 folgt Id − PV = PV ⊥ f¨ ur abgeschlossene Unterr¨aume V . Speziell gilt f¨ ur V = U U⊥ = V ⊥
sowie Id − PV ⊥ = PV ⊥⊥ .
Es folgt PV = PV ⊥⊥ , d.h. U = U ⊥⊥ .
2
Der folgende wichtige Satz wird mit Hilfe des Satzes von der Orthogonalprojektion bewiesen. Theorem V.3.6 (Darstellungssatz von Fr´echet-Riesz) Sei H ein Hilbertraum. Dann ist die Abbildung Φ: H → H , y → . , y bijektiv, isometrisch und konjugiert linear (d.h.: Φ(λy) = λΦ(y)). Mit anderen Worten, zu x ∈ H existiert genau ein y ∈ H mit x (x) = x, y f¨ ur x ∈ H, und es gilt x = y . Beweis. Offensichtlich ist Φ konjugiert linear. Aus der Cauchy-Schwarzy Ungleichung folgt Φ(y) ≤ y , und f¨ ur x = y
(y = 0 ist trivial) ist Φ(y)(x) =
y, y = y . y
Deshalb ist Φ isometrisch und folglich injektiv. Sei nun x ∈ H gegeben, ohne Einschr¨ankung sei x = 1. Sei U der Kern von x . Dann gilt nach Theorem V.3.4 H = U ⊕2 U ⊥ , wo U ⊥ eindimensional ist. Es existiert daher y ∈ H mit x (y) = 1 und U ⊥ = lin{y}. F¨ ur x = u + λy ∈ U ⊕2 U ⊥ ist x (x) = λx (y) = λ sowie x, y = λ y 2 . ¨ Daher gilt Φ(y/ y 2) = x , und Φ ist auch surjektiv. Ubrigens liefert die Isometrie von Φ sogar y = 1, so daß man tats¨achlich Φ(y) = x erh¨alt. Damit ist das Theorem bewiesen. 2 Schwach konvergente Folgen und reflexive Banachr¨aume wurden in Definition III.3.6 bzw. Definition III.3.3 eingef¨ uhrt. Korollar V.3.7 Sei H ein Hilbertraum. (a) Eine Folge (xn ) in H konvergiert genau dann schwach gegen x ∈ H, wenn xn − x, y → 0 ∀y ∈ H. (b) H ist reflexiv. (c) Jede beschr¨ ankte Folge in H enth¨ alt eine schwach konvergente Teilfolge.
V.3
229
Orthogonalit¨ at
Beweis. (a) folgt aus Theorem V.3.6 und (c) aus (b) und Theorem III.3.7. Um (b) einzusehen, betrachte die Abbildung Φ: H → H aus Theorem V.3.6, die bijektiv ist. Man best¨ atigt sofort, daß auch H , versehen mit dem Skalarprodukt Φ(x), Φ(y)H = y, xH , ein Hilbertraum ist. Wende nun Theorem V.3.6 auf H an und bezeichne die kanonische Abbildung von H auf H mit Ψ. Es ist dann leicht zu verifizieren, daß die kanonische Einbettung iH : H → H als iH = Ψ ◦ Φ darstellbar und folglich surjektiv ist. 2 Sch¨arfer als (c) ist der folgende Satz. Satz V.3.8 (Satz von Banach-Saks) Ist H ein Hilbertraum und (xn ) eine beschr¨ ankte Folge in H, so existiert eine schwach konvergente Teilfolge (yn ) derart, daß die Folge der arithmetischen Mittel n 1 yk n k=1
bzgl. der Norm konvergiert. Beweis. Man darf erstens annehmen, daß (xn ) selbst schwach konvergiert (Korollar V.3.7(c)), und zweitens, daß der schwache Limes = 0 ist (warum?). W¨ahle M mit xn ≤ M f¨ ur alle n ∈ N, und setze y1 = x1 . Da (xn )n≥1 schwach gegen 0 konvergiert, existiert n2 > 1 mit |xn2 , y1 | ≤ 1; setze y2 = xn2 . Als n¨ achstes w¨ ahle n3 > n2 mit |xn3 , y1 | ≤
1 2
und
|xn3 , y2 | ≤
1 ; 2
setze dann y3 = xn3 . Auf diese Weise wird induktiv eine Teilfolge (yn ) mit |yk+1 , yi | ≤
1 k
∀i = 1, . . . , k, k ∈ N
definiert. Daraus folgt k
|yk+1 , yi | ≤ 1
∀k ∈ N
i=1
sowie
n k−1 k=2 i=1
|yk , yi | ≤ n − 1
∀n ∈ N.
230
V.
Hilbertr¨ aume
Folglich n n n 1 2 1 yk ≤ 2 |yk , yi | n n k=1 k=1 i=1 n n k−1 1 = 2 yk 2 + 2 |yk , yi | n i=1 k=1
k=2
n · M 2 + 2n − 2 ≤ → 0, n2 2
wie gew¨ unscht.
Als Anwendung wird jetzt gezeigt, wie Hilbertraummethoden bei der L¨osung partieller Differentialgleichungen verwandt werden k¨onnen; dabei treten die Sobolevr¨ aume aus Definition V.1.12 auf. Sei Ω ⊂ Rn ein beschr¨anktes Gebiet und f : Ω → R stetig. Betrachte folgendes Randwertproblem: • Finde u ∈ C 2 (Ω) ∩ C(Ω) mit −Δu = f u = 0
in Ω in ∂Ω
(V.25)
Durch partielle Integration folgt f¨ ur eine L¨ osung u der Differentialgleichung aus n − Di2 u, ϕL2 = f, ϕL2 ∀ϕ ∈ D(Ω) i=1
die Gleichung
n
Di u, Di ϕL2 = f, ϕL2
∀ϕ ∈ D(Ω).
i=1
Zur Abk¨ urzung f¨ uhren wir nun auf H01 (Ω) die Sesquilinearform [u, v] :=
n
Di u, Di vL2
i=1
(mit Di = schwache Ableitung) ein, und statt des urspr¨ unglichen Randwertproblems betrachte folgende Abschw¨ achung: • Finde u ∈ H01 (Ω) mit [u, ϕ] = f, ϕL2
∀ϕ ∈ D(Ω).
(V.26)
V.3
231
Orthogonalit¨ at
Die Randbedingung u|∂Ω = 0“ wird hierbei durch die Forderung u ∈ ” H01 (Ω) (= D(Ω) bzgl. . W 1 ) ausgedr¨ uckt. Das Problem (V.26) hat eine L¨ osung nach dem Satz von Fr´echet-Riesz. Um das zu zeigen, beachte zun¨ achst, daß f¨ ur f ∈ L2 (Ω) wegen |f, ϕL2 | ≤ f L2 ϕ L2 ≤ f L2 ϕ W 1 das lineare Funktional ϕ → ϕ, f stetig auf (D(Ω), . W 1 ) ist und daher eine Fortsetzung auf den Abschluß H01 (Ω) zul¨aßt. Um den Zusammenhang von [ . , . ] mit dem Sobolev-Skalarprodukt . , . W 1 zu kl¨aren, ben¨otigen wir die wichtige Ungleichung von Poincar´e-Friedrichs: • Ist Ω ⊂ Rn beschr¨ ankt, etwa Ω ⊂ (−s, s)n , so gilt u L2 ≤ 2s[u, u]1/2
∀u ∈ H01 (Ω).
Beweis hierf¨ ur. Da die rechte und die linke Seite der Ungleichung stetig bzgl. der . W 1 -Norm von u abh¨ angen, reicht es, diese f¨ ur u ∈ D(Ω) zu zeigen. Indem man solch ein u außerhalb von Ω durch 0 fortsetzt, erh¨alt man eine ebenfalls u genannte Funktion in D (−s, s)n , und es gilt f¨ ur x = (x1 , . . . , xn ) ∈ (−s, s)n x1 s ∂u ∂u u(x) = (t, x2 , . . . , xn ) dt = 1(−s,x1 ] (t) (t, x2 , . . . , xn ) dt. ∂x1 −s ∂x1 −s Die Cauchy-Schwarz-Ungleichung liefert s s 2 |u(x)|2 ≤ 1(−s,x1 ] (t) dt −s
−s
2 ∂u (t, x , . . . , x ) 2 n dt, ∂x1
und da das erste Integral durch 2s abgesch¨ atzt werden kann, folgt s s |u(x)|2 dx = dx1 . . . dxn |u(x)|2 Ω
−s
−s
2 ∂u ≤ 2s dx1 . . . dxn ∂x1 (t, x2 , . . . , xn ) dt −s −s −s 2 s s s ∂u = (2s)2 dx2 . . . dxn dt (t, x2 , . . . , xn ) ∂x1 −s −s −s 2 ∂u 2 = 4s2 ∂x1 (x) dx ≤ 4s [u, u]. Ω
s
s
s
Eine Konsequenz dieser Ungleichung ist, daß auf H01 (Ω) die Sesquilinearform [ . , . ] ein Skalarprodukt ist, dessen abgeleitete Norm |||u||| = [u, u]1/2 zur W 1 -Norm ¨aquivalent ist, denn |||u||| ≤ u W 1 ≤ (4s2 + 1)1/2 |||u|||
∀u ∈ H01 (Ω).
232
V.
Hilbertr¨ aume
Nach dem Satz von Fr´echet-Riesz l¨ aßt sich das stetige Funktional ϕ → f, ϕL2 auf dem Hilbertraum (H01 (Ω), [ . , . ]) gem¨aß (V.26) durch ein eindeutig bestimmtes u ∈ H01 (Ω) darstellen. Zusammengefaßt ergibt sich: • F¨ ur alle f ∈ L2 (Ω) existiert genau eine schwache L¨ osung“ u ∈ H01 ” des Randwertproblems (V.25), d.h. des Problems (V.26). Man kann zeigen, daß f¨ ur f ∈ C ∞ (Ω) auch u ∈ C ∞ (Ω) ist (Weylsches Lemma); dazu kann man das Lemma von Sobolev (Satz V.2.12) verwenden.
V.4
Orthonormalbasen
In diesem Abschnitt ist H stets ein Hilbertraum. (Einige der folgenden Aussagen – in der Regel die weniger wichtigen – gelten auch f¨ ur Pr¨ahilbertr¨aume.) Definition V.4.1 Eine Teilmenge S ⊂ H heißt Orthonormalsystem, falls e = 1 und e, f = 0 f¨ ur e, f ∈ S, e = f , gelten. Ein Orthonormalsystem S heißt Orthonormalbasis, falls S ⊂ T, T Orthonormalsystem
⇒
T =S
gilt. Eine Orthonormalbasis wird auch vollst¨ andiges Orthonormalsystem genannt. Warum eine Orthonormalbasis Basis heißt, erkl¨art Satz V.4.9. (Es sei bereits jetzt betont, daß eine Orthonormalbasis keine Vektorraumbasis ist.) Beispiele. (a) In H = 2 ist die Menge S = {en : n ∈ N} der Einheitsvektoren ein Orthonormalsystem. (b) Sei H = L2 [0, 2π] und 1 1 1 S = √ 1 ∪ √ cos n · : n ∈ N ∪ √ sin n · : n ∈ N . π π 2π Dann ist S ein Orthonormalsystem, wie unschwer durch partielle Integration gezeigt werden kann. (c) In H = L2C [0, 2π] ist 1 S = √ ein· : n ∈ Z 2π ein Orthonormalsystem. (d) In H = AP2 (R) (Beispiel V.1(f)) ist S = {fλ : λ ∈ R} ein Orthonormalsystem. All diese Orthonormalsysteme sind sogar Orthonormalbasen, wie gleich gezeigt werden wird.
V.4
233
Orthonormalbasen
Satz V.4.2 (Gram-Schmidt-Verfahren) Sei {xn : n ∈ N} eine linear unabh¨ angige Teilmenge von H. Dann existiert ein Orthonormalsystem S mit lin S = lin{xn : n ∈ N}. Beweis. Setze e1 = xx11 . Betrachte f2 = x2 − x2 , e1 e1 und e2 = ff22 . (Es ist f2 = 0, da {x1 , x2 } linear unabh¨ angig ist.) Dann ist e1 ⊥ e2 . Durch die Vorschrift k fk+1 = xk+1 − xk+1 , ei ei i=1
und ek+1 =
fk+1 fk+1
(beachte fk+1 = 0) wird so eine Folge (ek ) definiert. Nach Konstruktion ist S := {e1 , e2 , . . .} ein Orthonormalsystem mit xn ∈ lin S,
en ∈ lin{xr : r ∈ N}
∀n ∈ N.
(Letzteres folgt durch Induktion.) Daher ist auch lin S = lin{xn : n ∈ N}.
2
Beispiel. (e) Wendet man das Gram-Schmidt-Verfahren auf H = L2 [−1, 1] und xn mit xn (t) = tn , n ≥ 0, an, erh¨ alt man (vgl. Aufgabe V.6.2) + en (t) = n + 12 Pn (t), wo Pn (t) =
n 1 d (t2 − 1)n . 2n n! dt
Die Pn heißen Legendrepolynome. Auch dieses Orthonormalsystem ist eine Orthonormalbasis. Satz V.4.3 (Besselsche Ungleichung) Ist {en : n ∈ N} ein Orthonormalsystem und x ∈ H, so ist ∞
|x, en |2 ≤ x 2 .
n=1
N Beweis. Sei N ∈ N beliebig. Setze xN = x− n=1 x, en en , so daß xN ⊥ ek f¨ ur k = 1, . . . , N gilt. Es folgt aus dem Satz von Pythagoras (V.22) x
2
2 N = xN + x, en en 2
n=1
234
V.
= xN 2 +
N
Hilbertr¨ aume
|x, en |2
n=1
≥
N
|x, en |2 .
n=1
Da N beliebig war, folgt die Behauptung.
2
Wir werden die folgenden unmittelbaren Konsequenzen ben¨otigen. Lemma V.4.4 Sei {en : n ∈ N} ein Orthonormalsystem, und seien x, y ∈ H. Dann gilt ∞ |x, en en , y| < ∞. n=1
Beweis. Das folgt aus der H¨ olderschen Ungleichung (p = q = 2 in Satz I.1.4) und Satz V.4.3. 2 Lemma V.4.5 Sei S ⊂ H ein Orthonormalsystem, und sei x ∈ H. Dann ist Sx := {e ∈ S: x, e = 0} h¨ochstens abz¨ ahlbar. Beweis. Nach der Besselschen Ungleichung ist jede der Mengen " 1# Sx,n := e ∈ S: |x, e| ≥ n endlich und daher Sx = n∈N Sx,n abz¨ ahlbar (oder endlich).
2
Um auch nichtseparable Hilbertr¨ aume behandeln zu k¨onnen, ist es notwendig, das Konzept der unbedingten Konvergenz einer Familie von Vektoren einzuf¨ uhren. Definition V.4.6 Sei X ein normierter Raum und I eine unendliche Indexmenge. Seien xi ∈ X f¨ ur i ∈ I. Man sagt, die Reihe i∈I xi konvergiere unbedingt gegen x ∈ X, falls (a) I0 = {i: xi = 0} h¨ ochstens abz¨ ahlbar ist, ∞ (b) f¨ ur jede Aufz¨ ahlung I0 = {i1 , i2 , . . .} die Gleichung n=1 xin = x gilt. ∞ Der Wert der Reihe n=1 xin h¨ angt also nicht von der Reihenfolge der xin ab. Schreibweise: xi = x i∈I
(vgl. Beispiel V.1(e)).
V.4
235
Orthonormalbasen
∞ Selbst f¨ ur I = N sind die Symbole n∈N und n=1 in diesem Abschnitt zu unterscheiden. ¨ F¨ ur X = K (bzw. Kn ) gilt bekanntlich die Aquivalenz von absoluter und unbedingter Konvergenz. Im Unendlichdimensionalen fallen diese Begriffe hingegen auseinander, denn der Satz von Dvoretzky-Rogers besagt: • In jedem unendlichdimensionalen Banachraum existiert eine unbedingt konvergente Reihe, die nicht absolut konvergiert. Aus Lemma V.4.5 und Satz V.4.3 folgt nun: Korollar V.4.7 (allgemeine Besselsche Ungleichung f¨ ur Orthonormalsysteme) Ist S ⊂ H ein Orthonormalsystem und x ∈ H, so ist |x, e|2 ≤ x 2 . e∈S
Satz V.4.8 Sei S ⊂ H ein Orthonormalsystem. (a) F¨ ur alle x ∈ H konvergiert e∈S x, ee unbedingt. (b) P : x → e∈S x, ee ist die Orthogonalprojektion auf lin S. Beweis. (a) Sei {e ahlung von {e ∈ S: x, e = 0}. Wir 1 , e2 , . . .} eine Aufz¨ ∞ zeigen zuerst, daß n=1 x, en en eine Cauchyreihe ist. Es gilt n¨amlich nach dem Satz von Pythagoras und nach Satz V.4.3 2 M M x, en en = |x, en |2 → 0 n=N n=N f¨ ur N, M → ∞. Damit existiert y := ∞ ur n=1 x, en en in H und analog f¨ eine Permutation π: N → N die umgeordnete Reihe yπ :=
∞
x, eπ(n) eπ(n) .
n=1
Es ist y = yπ zu zeigen. Sei dazu z ∈ H beliebig. Wegen y, z =
∞
x, en en , z =
n=1
∞
x, eπ(n) eπ(n) , z = yπ , z
n=1
gilt y − yπ ∈ H ⊥ = {0}; f¨ ur den mittleren Schritt haben wir die absolute und ergo unbedingte Konvergenz dieser Reihe (Lemma V.4.4) ausgenutzt. (b) Nach Theorem V.3.4 (insbesondere (V.24)) ist x − P x ∈ (lin S)⊥ = ⊥ S zu zeigen, d.h., daß . ∞ x− x, en en , e = 0 ∀e ∈ S n=1
gilt. Das ist jedoch klar f¨ ur x, e = 0, d.h. e, en = 0 f¨ ur alle n, sowie f¨ ur e = en0 . 2
236
V.
Hilbertr¨ aume
Wir behandeln jetzt Orthonormalbasen. Satz V.4.9 Sei S ⊂ H ein Orthonormalsystem. (a) Es existiert eine Orthonormalbasis S mit S ⊂ S . (b) Die folgenden Aussagen sind ¨ aquivalent: (i) S ist eine Orthonormalbasis. (ii) Ist x ∈ H und x ⊥ S, so ist x = 0. (iii) Es gilt H = lin S. (iv) x = x, ee ∀x ∈ H. e∈S (v) x, y = x, ee, y ∀x, y ∈ H. e∈S
(vi) (Parsevalsche Gleichung) x 2 =
|x, e|2
∀x ∈ H.
e∈S
Beweis. (a) ist eine unmittelbare Konsequenz des Zornschen Lemmas. (Ist H separabel, kann eine Orthonormalbasis konstruktiv aus dem GramSchmidt-Verfahren gewonnen werden.) (b) (i) ⇒ (ii): W¨ are x = 0, so w¨ are S ∪ {x/ x } ein Orthonormalsystem. (ii) ⇒ (iii): Korollar V.3.5. (iii) ⇒ (iv): Satz V.4.8. (iv) ⇒ (v): Einsetzen, beachte Korollar V.4.7 und Lemma V.4.4. (v) ⇒ (vi): Setze x = y. (vi) ⇒ (i): Sonst existierte x mit x = 1, so daß S ∪ {x} ein Orthonormalsystem ist; folglich erg¨ abe sich der Widerspruch e∈S |x, e|2 = 0. 2 Die Bedingung (iv) legt die Bezeichnung Basis“ nahe. Es kann sich ” nat¨ urlich nicht um eine Vektorraumbasis handeln (es sei denn dim H < ∞), da bei einer solchen alle Summen endlich viele Summanden haben m¨ ussen. Wir kommen nun zu den obigen Beispielen zur¨ uck. Beispiele. (a) Hier ist nach Definition 2 = lin S, also ist S eine Orthonormalbasis. Allgemeiner ist {ei : i ∈ I} eine Orthonormalbasis von 2 (I), wo ei (j) = δij ist (δij = Kronecker-Symbol). (b) Wir zeigen auch hier lin S = L2 [0, 2π]. Ohne Einschr¨ankung (warum?) sei K = R. lin S ist die Menge der trigonometrischen Polynome, und die liegt nach Korollar IV.2.12 dicht in V = {f ∈ C[0, 2π]: f (0) = f (2π)} bzgl. . ∞ , also erst recht bzgl. . L2 , und V liegt dicht in L2 [0, 2π], denn C[0, 2π] tut es (Satz I.2.12). Deshalb liegt lin S dicht in L2 [0, 2π]. (Daß V L2 -dicht in L2 [0, 2π] liegt, folgt auch aus Lemma V.1.10.)
V.4
237
Orthonormalbasen
(c) Da cos nt = 12 eint + e−int , sin nt = cos nt + i sin nt gilt, ist
1 2i
eint − e−int und eint =
lin S = {f : f ist C-wertiges trigonometrisches Polynom}. Nach (b) liegt lin S dicht, und S ist eine Orthonormalbasis. (d) Nach Definition ist lin S = AP2 (R). (e) Es ist L2 [−1, 1] = lin{xn : n ≥ 0} = lin S nach den S¨atzen I.2.10, I.2.12 und V.4.2. Wir kommen noch einmal auf (b) zur¨ uck. Ist S wie dort und x ∈ L2 [0, 2π], so sind die x, e genau die in (IV.4) vorkommenden Fourierkoeffizienten von x, e∈S x, ee ist die Fourierreihe von x, und Bedingung (iv) in Satz V.4.9(b) besagt, daß f¨ ur x ∈ L2 [0, 2π] die Fourierreihe im quadratischen Mittel gegen x konvergiert. In der Fourieranalysis ist es h¨aufig bequemer, mit der Entwicklung in die Orthonormalbasis aus Beispiel (c) zu arbeiten; so soll im folgenden unter der Fourierreihe einer integrierbaren Funktion f die Reihe ∞ cn eint n=−∞
mit 1 cn = 2π
2π
f (t)e−int dt
0
verstanden werden. Manche Autoren verwenden die Bezeichnung Fourierreihe bei beliebigen Orthonormalbasen in allgemeinen Hilbertr¨ aumen. Korollar V.4.10 F¨ ur einen unendlichdimensionalen Hilbertraum H sind folgende Bedingungen ¨ aquivalent: (i) H ist separabel. (ii) Alle Orthonormalbasen sind abz¨ ahlbar. (iii) Es gibt eine abz¨ ahlbare Orthonormalbasis. √ Beweis. (i) ⇒ (ii): Sei S eine Orthonormalbasis von H. Da e − f = 2 f¨ ur alle e, f ∈ S, e = f , gilt, kann S nicht u ¨ berabz¨ahlbar sein (vgl. den Beweis der Inseparabilit¨ at von ∞ , S. 29). (ii) ⇒ (iii): Das ist klar (beachte noch Satz V.4.9(a)). (iii) ⇒ (i) folgt aus Satz V.4.9(b)(iii) und Lemma I.2.9. 2 Allgemeiner gilt, wenn |S| die Kardinalzahl von S bezeichnet: Lemma V.4.11 Sind S und T Orthonormalbasen von H, so ist |S| = |T |.
238
V.
Hilbertr¨ aume
Beweis. F¨ ur endliche S ist das aus der linearen Algebra klar. Sei also |S| ≥ |N|. Zu x ∈ S setze Tx = {y ∈ T : x, y =0}. Dann ist (Lemma V.4.5) |Tx | ≤ |N|. Nach Satz V.4.9(b)(ii) gilt T ⊂ x∈S Tx , daher |T | ≤ |S| |N| = |S|. Aus Symmetriegr¨ unden gilt auch |S| ≤ |T |, daher ist nach dem Satz von Schr¨oder-Bernstein aus der Mengenlehre |S| = |T |. 2 Man nennt die Kardinalzahl |S| einer Orthonormalbasis die Hilbertraumdimension von H; sie ist nach Lemma V.4.11 wohldefiniert. Satz V.4.12 Ist S eine Orthonormalbasis von H, so ist H ∼ = 2 (S). Beweis. Zu x ∈ H definiere T x ∈ 2 (S) durch (T x)(e) = x, e. (Aus der Besselschen Ungleichung folgt T x ∈ 2 (S).) T : H → 2 (S) ist linear und nach der Parsevalschen Gleichung isometrisch. Ist (fe )e∈S ∈ 2 (S), so defi niert x = e∈S fe e ein Element von H (der Beweis von Satz V.4.8(a) zeigt das), und es gilt T x = (fe )e∈S . Daher ist T ein isometrischer Isomorphismus. 2 Beachte, daß T sogar T x, T y = x, y erf¨ ullt (Satz V.4.9(b)(v)), d.h. T ist unit¨ar“ (siehe Abschnitt V.5). ” Korollar V.4.13 Ist H separabel und unendlichdimensional, so ist H ∼ = 2 . Korollar V.4.14 (Satz von Fischer-Riesz) L2 [0, 1] ∼ = 2 .
V.5
Operatoren auf Hilbertr¨ aumen
Auch in diesem Abschnitt bezeichnet H (oder Hi ) immer einen Hilbertraum. Definition V.5.1 Sei T ∈ L(H1 , H2 ), und sei Φi : Hi → Hi der kanonische konjugiert lineare isometrische Isomorphismus aus Theorem V.3.6. Der zu T (im Hilbertraumsinn) adjungierte Operator T ∗ ist T ∗ = Φ−1 1 T Φ2 . Mit anderen Worten gilt T x, yH2 = x, T ∗ yH1
∀x ∈ H1 , y ∈ H2 .
Satz V.5.2 Seien S, T ∈ L(H1 , H2 ), R ∈ L(H2 , H3 ), λ ∈ K. (a) (S + T )∗ = S ∗ + T ∗ . (b) (λS)∗ = λS ∗ . (c) (RS)∗ = S ∗ R∗ . (d) S ∗ ∈ L(H2 , H1 ) und S = S ∗ . (e) S ∗∗ = S.
V.5
239
Operatoren auf Hilbertr¨ aumen
(f) SS ∗ = S ∗ S = S 2 . (g) ker S = (ran S ∗ )⊥ , ker S ∗ = (ran S)⊥ ; insbesondere ist S genau dann injektiv, wenn ran S ∗ dicht liegt. Die Abbildung S → S ∗ ist also eine konjugiert lineare surjektive Iso¨ metrie zwischen L(H1 , H2 ) und L(H2 , H1 ). Beachte die Ahnlichkeit dieser Abbildung mit λ → λ auf C. Beweis. (a)–(d) folgen sofort aus den entsprechenden Eigenschaften von S → S , und (e) ist klar. (f) Es gilt Sx 2 = Sx, Sx = x, S ∗ Sx ≤ x S ∗ Sx , also S 2 = sup Sx 2 ≤ sup x S ∗ Sx ≤ S ∗ S ≤ S ∗ S = S 2 ,
x ≤1
x ≤1
(letzteres nach (d)). Daher ist S 2 = S ∗ S und folglich S 2 = S ∗ 2 = S ∗∗ S ∗ = SS ∗ . (g) Es gilt ker S = (ran S ∗ )⊥ , denn Sx = 0
⇔
Sx, y = 0 ∀y ∈ H2
⇔ ⇔
x, S ∗ y = 0 ∀y ∈ H2 x ∈ (ran S ∗ )⊥ ,
und daher auch ker S ∗ = (ran S ∗∗ )⊥ = (ran S)⊥ .
2
Wir definieren jetzt wichtige Klassen von Hilbertraumoperatoren. Definition V.5.3 Sei T ∈ L(H1 , H2 ). (a) T heißt unit¨ ar, falls T T ∗ = IdH2 , T ∗ T = IdH1 ; mit anderen Worten, falls T invertierbar ist mit T −1 = T ∗ . . (b) Sei H1 = H2 . T heißt selbstadjungiert (oder hermitesch), falls T = T ∗. (c) Sei H1 = H2 . T heißt normal, falls T T ∗ = T ∗ T . Unit¨are Operatoren sind also durch • T ist surjektiv und T x, T y = x, y selbstadjungierte durch • T x, y = x, T y ∀x, y ∈ H1 ,
∀x, y ∈ H1 ,
240
V.
Hilbertr¨ aume
normale durch • T x, T y = T ∗ x, T ∗ y ∀x, y ∈ H1 gekennzeichnet. Offensichtlich sind selbstadjungierte und (im Fall H1 = H2 ) unit¨are Operatoren normal. Beispiele. (a) Sei H = Kn . Wird T ∈ L(H) durch die Matrix (aij )i,j dargestellt, so wird T ∗ durch (aji )i,j dargestellt. Definition V.5.3 verallgemeinert also bekannte Begriffe der linearen Algebra. (b) Sei H = L2 [0, 1] und Tk ∈ L(H) der Integraloperator 1 (Tk x)(s) = k(s, t) x(t) dt 0
(Beispiel II.1(m)). Dann ist Tk∗ = Tk∗ mit k ∗ (s, t) = k(t, s). (Vgl. Beispiel III.4(c), beachte das Komplexkonjugieren!) Dies kann als kontinuierliches Analogon von Beispiel (a) aufgefaßt werden. Tk ist genau dann selbstadjungiert, wenn k(s, t) = k(t, s) fast u ¨berall gilt; man nennt k dann einen symmetrischen Kern. 2 2 (c) Sei T : → der Shiftoperator (s1 , s2 , . . .) → (s2 , s3 , . . .). Dann ist ∗ T (t1 , t2 , . . .) = (0, t1 , t2 , . . .) (vgl. Beispiel III.4(a)). T ist nicht normal, denn T T ∗ = Id, T ∗ T = PU mit U = {(si ): s1 = 0}. (d) T ∗ T und T T ∗ sind stets selbstadjungiert. (e) Die in Abschnitt V.2 studierte Fouriertransformation F : L2 (Rn ) → 2 L (Rn ) ist nach der Plancherel-Gleichung (V.16) ein unit¨arer Operator, denn F ist surjektiv. Lemma V.5.4 F¨ ur T ∈ L(H1 , H2 ) sind ¨ aquivalent: (i) T ist eine Isometrie. (ii) T x, T y = x, y ∀x, y ∈ H1 . Beweis. (ii) ⇒ (i): Setze x = y. (i) ⇒ (ii): Das folgt sofort aus (V.2) bzw. (V.3).
2
Das Lemma besagt geometrisch, daß ein l¨angenerhaltender Operator winkelerhaltend ist. Im weiteren werden selbstadjungierte Operatoren etwas n¨aher untersucht, nichttriviale Resultate folgen (mit Ausnahme von Satz V.5.5) erst in Kapitel VI. Satz V.5.5 (Satz von Hellinger-Toeplitz) Erf¨ ullt eine lineare Abbildung T : H → H die Symmetriebedingung T x, y = x, T y
∀x, y ∈ H,
so ist T stetig und folglich selbstadjungiert.
V.5
241
Operatoren auf Hilbertr¨ aumen
Beweis. Nach dem Satz von abgeschlossenen Graphen (Theorem IV.4.5) ist zu zeigen: xn → 0, T xn → z ⇒ z = 0. In der Tat ist z, z = lim T xn , z = limT xn , z = limxn , T z = 0.
2
Satz V.5.6 Sei K = C. Dann sind f¨ ur T ∈ L(H) ¨ aquivalent: (i) T ist selbstadjungiert. (ii) T x, x ∈ R ∀x ∈ H. Beweis. (i) ⇒ (ii) gilt wegen T x, x = x, T ∗ x = x, T x = T x, x. (ii) ⇒ (i): F¨ ur λ ∈ C betrachte die reelle Zahl T (x + λy), x + λy = T x, x + λT x, y + λT y, x + |λ|2 T y, y. Durch Bilden des konjugiert Komplexen erh¨ alt man T (x + λy), x + λy = T x, x + λy, T x + λx, T y + |λ|2 T y, y. Indem man λ = 1 und λ = −i einsetzt, folgt T x, y + T y, x = y, T x + x, T y T x, y − T y, x = −y, T x + x, T y und daraus T x, y = x, T y, wie gew¨ unscht.
2
Die im Beweis angewandte Technik, x + λy zu betrachten, nennt man Polarisierung. Satz V.5.7 F¨ ur selbstadjungiertes T ∈ L(H) ist T = sup |T x, x|.
x ≤1
Beweis. ≥“ ist klar. Umgekehrt setze M := sup x ≤1 |T x, x|. Aus T = T ∗ ” folgt durch simples Ausrechnen T (x + y), x + y − T (x − y), x − y = 2T x, y + 2T y, x = 2T x, y + 2x, T y = 4 ReT x, y. Daher gilt wegen der Parallelogrammgleichung 4 ReT x, y ≤ M ( x + y 2 + x − y 2 ) = 2M ( x 2 + y 2 )
242
V.
Hilbertr¨ aume
und folglich ReT x, y ≤ M
∀ x , y ≤ 1.
Nach Multiplikation mit einem geeigneten λ, |λ| = 1, erh¨alt man |T x, y| ≤ M
∀ x , y ≤ 1
und deshalb T ≤ M .
2
Korollar V.5.8 Ist T ∈ L(H) selbstadjungiert und gilt T x, x = 0 f¨ ur alle x ∈ H, so ist T = 0. F¨ ur K = C folgt die Selbstadjungiertheit automatisch aus der zweiten Voraussetzung und Satz V.5.6. Im Fall K = R kann man auf T = T ∗ im allgemeinen nicht verzichten: F¨ ur H = R2 und 0 −1 T = 1 0 (= Drehung um 90◦ ) ist stets T x, x = 0. Abschließend sollen die selbstadjungierten Projektionen charakterisiert werden. Satz V.5.9 Sei P ∈ L(H) eine Projektion mit P = 0. Dann sind folgende Bedingungen ¨ aquivalent: (i) P ist eine Orthogonalprojektion (d.h. ran(P ) ⊥ ker(P )). (ii) P = 1. (iii) P ist selbstadjungiert. (iv) P ist normal. (v) P x, x ≥ 0 ∀x ∈ H. Beweis. (i) ⇒ (ii): Theorem V.3.4. (ii) ⇒ (i): Seien x ∈ ker(P ), y ∈ ran(P ), λ ∈ K; dann gilt P (x + λy) = λy. Folglich ist λy 2 = P (x + λy) 2 ≤ x + λy 2 = x 2 + 2 Re λx, y + λy 2 und deshalb −2λ Rex, y ≤ x 2
∀λ ∈ R.
Also erh¨alt man Rex, y = 0 und genauso, indem man λ ∈ iR betrachtet, Imx, y = 0. Daher folgt (i). (i) ⇒ (iii): Es ist P x, y = P x, P y + (y − P y) = P x, P y, denn y − P y ∈ ker P , und x, P y = P x + (x − P x), P y = P x, P y.
243
V.6 Aufgaben
(iii) ⇒ (iv): Das ist klar. (iv) ⇒ (i): Es ist 0 = (P ∗ P − P P ∗ )x, x = P x 2 − P ∗ x 2
∀x ∈ H,
also ker(P ) = ker(P ∗ ) = ran(P )⊥ (Satz V.5.2(g)). (iii) ⇒ (v): P x, x = P 2 x, x = P x, P x = P x 2 ≥ 0. (v) ⇒ (i): F¨ ur x ∈ ker(P ), y ∈ ran(P ), λ ∈ R gilt 0 ≤ P (x + λy), x + λy = λy, x + λy = λ2 y 2 + λy, x, daher y, x ≥ −λ y 2
∀λ > 0,
y, x ≤ −λ y 2
∀λ < 0,
woraus x, y = 0 folgt.
2
Im Beweis von (iv) ⇒ (i) haben wir folgende Aussage mitbewiesen, die in Kapitel VI von Nutzen sein wird. Lemma V.5.10 Ist T ∈ L(H) ein normaler Operator, so gilt T x = T ∗ x
∀x ∈ H.
Speziell ist ker T = ker T ∗ .
V.6
Aufgaben
Aufgabe V.6.1 Sei w ∈ CR [0, 1]. Betrachte auf C[0, 1] × C[0, 1] die Abbildung
1
. , . w : (x, y) →
x(t)y(t)w(t) dt. 0
Gib notwendige und hinreichende Bedingungen daf¨ ur an, daß . , . w ein Skalarprodukt ist. Wann ist die von . , . w abgeleitete Norm ¨ aquivalent zur vom 1 u ¨blichen Skalarprodukt (x, y) → 0 x(t)y(t) dt abgeleiteten Norm? Aufgabe V.6.2 Gib die Details des Beispiels V.4(e) u ¨ ber Legendrepolynome (S. 233) nach folgender Anleitung. Zeige nacheinander die folgenden Aussagen f¨ ur t ∈ [−1, 1] und n = 0, 1, 2, . . . : (a) Pn (1) = 1. 1 dn+1 2 (b) Pn+1 (t) = n t(t − 1)n . 2 n! dtn+1 (c) Pn+1 (t) = (2n + 1)Pn (t) + Pn−1 (t). (d) Pn+1 (t) = tPn (t) + (n + 1)Pn (t). (e) nPn (t) = tPn (t) − Pn−1 (t).
244
V.
Hilbertr¨ aume
(f) (1 − t2 )Pn (t) = nPn−1 (t) − ntPn (t). (Verwende (d) mit n − 1 statt n und eliminiere Pn−1 mit Hilfe von (e).) d 2 (g) Qn (t) := (1 − t )Pn (t) + n(n + 1)Pn (t) = 0. dt (Differenziere (f) und benutze (e).) (h) F¨ ur n = m sind Pn und Pm orthogonal in L2 [−1, 1]. (Betrachte Qn Pm − Qm Pn und integriere partiell.) (i) Rn (t) := (n + 1)Pn+1 (t) − (2n + 1)tPn (t) + nPn−1 (t) = 0. (Verwende (c), (e) und (a).) 1 1 2n − 1 2 (j) Pn (t) dt = Pn−1 (t)2 dt f¨ ur n = 2, 3, . . . . 2n + 1 −1 −1 (Betrachte (2n + 1)Rn−1 Pn − (2n − 1)Rn Pn−1 , integriere partiell und beachte (h).) & (k) n + 12 Pn ist eine Orthonormalbasis von L2 [−1, 1], die durch Orthonormalisierung der Funktionen xn , xn (t) = tn , entsteht. 2
Aufgabe V.6.3 Die lineare H¨ ulle der durch fn (x) = xn e−x /2 , n ≥ 0, definierten Funktionen liegt dicht in L2 (R). (Hinweis: Zeige dazu, daß die Fouriertrans2 formierte von x → f (x)e−x /2 verschwindet, wenn f zu allen fn orthogonal ist.) Durch Orthonormalisierung erh¨ alt man also eine Orthonormalbasis von L2 (R), 2 die aus Funktionen der Gestalt Hn (x) = Pn (x)e−x /2 besteht, wo Pn ein Polynom vom Grad n ist. Die Pn heißen Hermitepolynome, die Hn Hermitefunktionen. Berechne die ersten Hermitefunktionen. Aufgabe V.6.4 Zeige, daß in Beispiel V.1(f) ein Skalarprodukt auf √ durch (V.5) X definiert wird, und zeige fλ − fλ = 2 f¨ ur λ = λ . ¨ Aufgabe V.6.5 In einem Hilbertraum gilt die Aquivalenz
xn → x ⇐⇒
σ
xn → x xn → x
Aufgabe V.6.6 (Partielle Integration) (a) Sei f : Rn → C stetig differenzierbar mit kompaktem Tr¨ ager. Dann gilt
Rn
∂f (x) dx = 0 ∂xj
∀j = 1, . . . , n.
(Tip: Satz von Fubini.) (b) Seien f, g: Rn → C stetig differenzierbar, und eine der Funktionen besitze einen kompakten Tr¨ ager. Dann gilt
Rn
∂f (x)g(x) dx = − ∂xj
f (x) Rn
∂g (x) dx ∂xj
∀j = 1, . . . , n.
(c) Sei Ω ⊂ Rn offen, seien f, g: Ω → C stetig differenzierbar, und eine der Funktionen besitze einen kompakten Tr¨ ager (in Ω!). Dann gilt
Ω
∂f (x)g(x) dx = − ∂xj
f (x) Ω
∂g (x) dx ∂xj
(Tip: Setze die Funktion f g kanonisch auf Rn fort.)
∀j = 1, . . . , n.
V.6
245
Aufgaben
Aufgabe V.6.7 Sei f ∈ W m (Rn ). Dann gilt f¨ ur |α| ≤ m D(α) f, ϕ = (−1)|α| f, Dα ϕ f¨ ur alle Schwartzfunktionen ϕ. Aufgabe V.6.8 Seien Ω ⊂ Rn offen, f ∈ W m (Ω) und ϕ ∈ D (Ω). Dann ist ϕf ∈ W m (Ω), und es gilt die Leibnizformel D(α) (ϕf ) =
α
β≤α
β
Dβ ϕD(α−β) f ;
hier bedeutet β ≤ α, daß alle βj ≤ αj sind, und
α β
=
α 1
β1
···
α
αn βn
.
Aufgabe V.6.9 Sei Ω = {x ∈ R2 : |x| < 12 }, f (x) = log |x| . F¨ ur welche α ∈ R ist f ∈ L2 (Ω) bzw. f ∈ L∞ (Ω) bzw. f ∈ W 1 (Ω)? Im letzten Fall bestimme ∂ die schwachen Ableitungen ∂x f und ∂x∂ 2 f . Durch passende Wahl von α gib ein 1 Gegenbeispiel f¨ ur das Sobolevlemma im Fall des Grenzexponenten m = k + n2 an. Aufgabe V.6.10 Zeige die Stetigkeit des verallgemeinerten Differentiationsoperators D(α) : W m+|α| (Ω) → W m (Ω). Aufgabe V.6.11 Sei Ω ⊂ Rn offen, H = H0m (Ω). Dann ist f¨ ur jedes f ∈ L2 (Ω) die Abbildung g → g, f L2 (Ω) ein stetiges lineares Funktional auf H. Definiere f −m als Norm dieses Funktionals und zeige, daß die Vervollst¨ andigung von (L2 (Ω), . −m ) isometrisch isomorph zu H ist. Aufgabe V.6.12 W m (Rn ) = H0m (Rn ) [Zeige zuerst wie in Lemma V.1.10, daß W m (Rn ) ∩ C ∞ (Rn ) dicht liegt.] Aufgabe V.6.13 Sei Ω ⊂ Rn beschr¨ ankt [diese Voraussetzung wird nur der Einfachheit halber gemacht] und f eine reellwertige Funktion in H01 (Ω). (a) Ist h: R → R eine C ∞ -Funktion mit beschr¨ ankter Ableitung, h(0) = 0 und sup |h(t)/t| < ∞, so ist h ◦ f ∈ H01 (Ω) mit schwachen Ableitungen Dj (h ◦ f ) = (h ◦ f ) · Dj f . (Hinweis: Es ist hilfreich zu wissen, daß jede L2 -konvergente Folge eine fast u aßt.) ¨ berall konvergente Teilfolge zul¨ (b) Es ist |f | ∈ H01 (Ω) mit schwachen Ableitungen Dj (|f |) = (1{f >0} − 1{f <0} ) · Dj f . Ferner gilt |f | W 1 = f W 1 . (Tip: Approximiere die Betragsfunktion durch Funktionen h wie in (a).) [Ein Banachraum X von Funktionen f : Ω → R mit f ∈ X ⇒ |f | ∈ X & |f | = f heißt ein Banachverband. Auch W 1 (Ω) und Lp (Ω) sind Banachverb¨ ande.] Aufgabe V.6.14 Gib Beispiele f¨ ur Pr¨ ahilbertr¨ aume X und Unterr¨ aume U ⊂ X mit (a) U = U ⊥⊥ , (b) U ⊕ U ⊥ = X.
246
V.
Hilbertr¨ aume
Aufgabe V.6.15 Sei H ein Hilbertraum, und sei K ⊂ H abgeschlossen und konvex. PK bezeichne die Abbildung, die x0 ∈ H die beste Approximation x ∈ K gem¨ aß Satz V.3.2 zuordnet, die sog. metrische Projektion. Zeige PK (x) − PK (y) ≤ x − y
∀x, y ∈ H.
(Tip: Lemma V.3.3.) Aufgabe V.6.16 Zeige den Trennungssatz von Hahn-Banach (Satz III.2.5) in einem Hilbertraum mittels des Projektionssatzes. Aufgabe V.6.17 Seien U und V abgeschlossene Unterr¨ aume des Hilbertraums H und PU und PV die entsprechenden Orthogonalprojektionen. Zeige U ⊂ V ⇐⇒ PU = PV PU = PU PV . Aufgabe V.6.18 (Satz von Lax-Milgram) Sei H ein komplexer Hilbertraum mit Skalarprodukt . , . , und sei B: H ×H → C sesquilinear. (a) Die folgenden Bedingungen sind ¨ aquivalent: (i) B ist stetig. (ii) B ist partiell stetig, d.h. y → B(x, y) ist stetig f¨ ur alle x ∈ H und x → B(x, y) ist stetig f¨ ur alle y ∈ H. (iii) ∃M ≥ 0 ∀x, y ∈ H |B(x, y)| ≤ M x y. (Tip: Satz von Banach-Steinhaus!) (b) Falls B stetig ist, existiert T ∈ L(H) mit B(x, y) = T x, y
∀x, y ∈ H.
(c) Gilt zus¨ atzlich ∃m > 0 ∀x ∈ H so ist T invertierbar mit T −1 ≤
B(x, x) ≥ m x2 , 1 . m
Aufgabe V.6.19 Sei H ein Hilbertraum, der aus auf einer Menge S definierten Funktionen besteht. Ein reproduzierender Kern f¨ ur H ist eine Funktion k: S×S → K mit folgenden Eigenschaften, wobei kt (s) = k(s, t): kt ∈ H, f (t) = f, kt
∀t ∈ S, f ∈ H.
(a) Wenn ein reproduzierender Kern existiert, ist er eindeutig bestimmt. (b) Genau dann existiert ein reproduzierender Kern, wenn alle Funktionale f → f (t) (t ∈ S) stetig auf H sind. (c) Wenn k ein reproduzierender Kern ist, liegt die lineare H¨ ulle der kt , t ∈ S, dicht in H. (d) Bestimme den reproduzierenden Kern f¨ ur den zweidimensionalen Unterraum H von L2 [0, 1], der aus allen Funktionen der Form f (t) = a + bt besteht.
V.6
247
Aufgaben
Aufgabe V.6.20 Es sei H ein reeller Hilbertraum, ∈ H und B: H × H → R eine symmetrische, beschr¨ ankte und koerzitive Bilinearform; es gelte also f¨ ur geeignete Konstanten M, m > 0 und alle x, y ∈ H |B(x, y)| ≤ M x y,
B(x, x) ≥ mx2 .
Setze J: H → R, J(x) = B(x, x) − 2(x). (a) J ist stetig und nach unten beschr¨ ankt. ¨ (b) F¨ ur ein u ∈ H gilt die Aquivalenz J(u) ≤ J(x) ∀x ∈ H ⇔ B(u, x) = (x) ∀x ∈ H. (c) J nimmt sein Minimum an genau einer Stelle an. [Dies ist die abstrakte Fassung des Dirichletschen Prinzips, mit dessen Hilfe elliptische partielle Differentialgleichungen gel¨ ost werden k¨ onnen; siehe etwa Jost [1998].] Aufgabe V.6.21 (a) Die Rademacherfunktionen rn (t) = sign sin(2n πt), n = 0, 1, 2, . . . , bilden ein Orthonormalsystem, aber keine Orthonormalbasis von L2 [0, 1]. n−1 (b) limn→∞ n1 r (t) = 0 f¨ ur fast alle t ∈ [0, 1]. k=0 k (Hinweis: Betrachte Beppo Levi.)
1 $ 1 n−1 0
n
k=0
%4
rk (t) dt und verwende den Satz von
Aufgabe V.6.22 Zu ψ = χ[0,1/2) − χ(1/2,1] setze ψj,k (t) = 2k/2 ψ(2k t − j), j, k ∈ Z. Die Haarschen Funktionen hn : [0, 1] → R sind wie folgt definiert: F¨ ur n = 2k + j ≥ 1 (k = 0, 1, 2, . . . , j = 1, . . . , 2k − 1) setze hn (t) = ψj,k (t) auf [0, 1) und erg¨ anze diese Funktionen stetig bei t = 1; ferner sei h0 (t) = 1 auf [0, 1]. (Skizze!) (a) {hn : n ≥ 0} ist ein Orthonormalsystem in L2 [0, 1], und {ψj,k : j, k ∈ Z} ist ein Orthonormalsystem in L2 (R).
2m −1
(b) f → f, hn hn ist die Orthogonalprojektion auf den Unterraum n=0 der auf den Intervallen [r2−m , (r + 1)2−m ) konstanten Funktionen in L2 [0, 1]. ∞ (c) F¨ ur f ∈ C[0, 1] konvergiert die Reihe f, hn hn gleichm¨ aßig gen=0 gen f . (d) Die hn bilden eine Orthonormalbasis von L2 [0, 1]. (e) Die ψj,k bilden eine Orthonormalbasis von L2 (R). Aufgabe V.6.23 In einem normierten Raum X sind ¨ aquivalent: (i) x konvergiert unbedingt gegen x (Definition V.4.6). i i∈I (ii) F¨ ur alle ε > 0 existiert eine endliche Teilmenge F ⊂ I derart, daß f¨ ur alle F ⊂ G ⊂ I, G endlich, gilt:
xi − x ≤ ε. i∈G
Aufgabe V.6.24 Gib Beispiele f¨ ur unbedingt, aber nicht absolut konvergente Reihen in den Banachr¨ aumen p f¨ ur 1 < p ≤ ∞.
248
V.
Hilbertr¨ aume
Aufgabe V.6.25 Betrachte die Funktion f : [0, 1] → R, f (t) = log(1 + t). (a) Die Taylorreihe von f um t0 = 0 konvergiert gegen f in der Norm von C[0, 1]. (b) Jede in C[0, 1] konvergente Umordnung der Taylorreihe konvergiert ebenfalls gegen f . (c) Die Taylorreihe ist in C[0, 1] nicht unbedingt konvergent. (d) Gelten die Aussagen (a)–(c) auch in L2 [0, 1]? Aufgabe V.6.26 Sei fj,k die Indikatorfunktion des Intervalls (j2−k , (j + 1)2−k ), k = 0, 1, 2, . . . , j = 0, . . . , 2k − 1, und sei gj,k = −fj,k . (a) Die Reihe ∞
xk = f0,0 + g0,0 + f0,1 + g0,1 + f1,1 + g1,1 + f0,2 + · · ·
k=1
konvergiert in L2 [0, 1] gegen 0. (b) Die Umordnung f0,0 + f0,1 + f1,1 + g0,0 + f0,2 + f1,2 + g0,1 + f2,2 + f3,2 + g1,1 + · · · konvergiert gegen die konstante Funktion 1. ∞ (c) Die Menge {x ∈ L2 [0, 1]: es gibt eine Umordnung mit x = x } k=1 π(k) ist nicht konvex. (Tip: Alle xn sind Z-wertig.) Aufgabe V.6.27 Sei (xn )n∈N eine Folge paarweise orthogonaler Elemente eines Hilbertraums H. Dann sind die folgenden Behauptungen ¨ aquivalent: ∞ (i) xn ist konvergent. n=1 ∞ (ii) n=1 xn 2 ist konvergent. ∞ (iii) x ist schwach konvergent (d.h., die Folge der Partialsummen ist n=1 n schwach konvergent). Aufgabe V.6.28 Seien H ein Hilbertraum, {x1 , . . . , xn } ein Orthonormalsystem n und x ∈ H. Finde Zahlen α1 , . . . , αn , so daß x − k=1 αk xk minimal ist. Aufgabe V.6.29 Die Norm eines Hilbertraums ist an jeder Stelle x0 = 0 Fr´echet-differenzierbar. (Tip: Verwende Satz III.5.3.) Aufgabe V.6.30 (Hardyraum) Sei D = {z ∈ C: |z| < 1} (D wie disk“), und sei ”
H 2 (D) =
2π
f : D → C: f analytisch, sup 0≤r<1
|f (reit )|2 0
dt <∞ 2π
.
H 2 (D) heißt Hardyraum (nicht mit dem Sobolevraum H 2 zu verwechseln). ∞ (a) Die analytische Funktion f (z) = a (f )z k geh¨ ort genau dann zu k=0 k 2 H (D), wenn die Folge ak (f ) k≥0 der Taylorkoeffizienten von f zu 2 geh¨ ort.
V.6
249
Aufgaben
(b) F¨ ur f, g ∈ H 2 (D) existiert
2π
f (reit )g(reit )
f, g := lim
r→1
und es ist f, g =
1
0
ak (f ) , ak (g)
2
2
dt , 2π .
(c) (H (D), . , . ) ist ein Hilbertraum, und mit ek (z) := z k ist (ek )k≥0 eine Orthonormalbasis von H 2 (D). (d) Sei z0 ∈ D. Die Abbildung f → f (z0 ) geh¨ ort dann zu (H 2 (D)) . (Tip: Cauchyformel aus der Funktionentheorie!) Finde die nach dem Satz von Fr´echet-Riesz existierende Funktion g ∈ H 2 (D), so daß f, g = f (z0 ) f¨ ur alle f ∈ H 2 (D) gilt. 2
Aufgabe V.6.31 (Bergmanraum) Sei D = {z ∈ C: |z| < 1} und
L2a (D) :=
|f (x + iy)|2 dxdy < ∞
f : D → C: f analytisch,
.
D
L2a (D) heißt Bergmanraum. Zeige, daß L2a (D) ein abgeschlossener Unterraum von L2 (D) und damit ein Hilbertraum ist. Aufgabe V.6.32 Sei H ein Hilbertraum. F¨ ur T ∈ L(H) sind ¨ aquivalent: (i) T ist normal. (ii) T x = T ∗ x ∀x ∈ H. Aufgabe V.6.33 Sei k ∈ L2 ([0, 1]2 ) und Tk : L2 [0, 1] → L2 [0, 1], wie u ¨ blich, der 1 Integraloperator (Tk x)(s) = 0 k(s, t)x(t) dt. Finde Bedingungen an den Kern k, so daß Tk normal ist. Aufgabe V.6.34 (a) Sei h: [0, 1] → C stetig differenzierbar mit h(0) = h(1) = 0. Zeige h ∈ H01 (0, 1). (b) Finde durch L¨ osen eines Randwertproblems f¨ ur eine gew¨ ohnliche Differentialgleichung zu g ∈ D (0, 1) eine Funktion h ∈ H01 (0, 1) mit f , gL2 = f, hW 1
∀f ∈ D (0, 1).
(c) Betrachte den verallgemeinerten Ableitungsoperator auf dem Sobolevraum H01 (0, 1), D: H01 (0, 1) → L2 [0, 1]. Was ist D∗ ? Aufgabe V.6.35 Sei H ein Hilbertraum. Auf S = {T ∈ L(H): T selbstadjungiert} definiere durch S ≤ T ⇐⇒ Sx, x ≤ T x, x
∀x ∈ H
eine Ordnung. Zeige: Jede monoton wachsende beschr¨ ankte Folge in S konvergiert punktweise gegen einen Operator in S. (Hinweis: T ∈ S heiße positiv, falls T x, x ≥ 0 f¨ ur alle x ∈ H gilt. Zeige zuerst f¨ ur positive T die Ungleichung |T x, y|2 ≤ T x, xT y, y.)
250
V.
Hilbertr¨ aume
Aufgabe V.6.36 Sei H ein komplexer Hilbertraum, und sei T ∈ L(H) selbstadjungiert. (a) Die Abbildungen T + i Id und T − i Id sind bijektiv und haben stetige Inverse. (b) UT := (T +i Id)(T −i Id)−1 ist unit¨ ar. UT heißt die Cayley-Transformierte von T . (c) Id − UT hat eine stetige Inverse, und es gilt T = −i(Id + UT )(Id − UT )−1 . (Tip: Zeige zuerst (T ± i Id)x2 = T x2 + x2 .) Aufgabe V.6.37 Sei H ein Hilbertraum, U ein dichter Teilraum, T ∈ K(H) selbstadjungiert, und es gelte T (H) ⊂ U . Zeige oder widerlege: Falls T |U injektiv ist, ist auch T injektiv. Aufgabe V.6.38 (von Neumannscher Ergodensatz) Sei H ein Hilbertraum, T ∈ L(H) mit T ≤ 1, U der Kern von Id − T und n−1 k Sn := n1 T . Ferner bezeichne PU den Orthogonalprojektor auf U . Dann k=0 gilt lim Sn x = PU x ∀x ∈ H. n→∞
Dazu beweise: (a) F¨ ur x ∈ H gilt T x = x genau dann, wenn T ∗ x = x. (b) U ⊥ = ran(Id − T ). (c) Sn x → x f¨ ur x ∈ U , und Sn x → 0 f¨ ur x ∈ U ⊥ . Aufgabe V.6.39 (Diskrete Hausdorff-Young-Ungleichung) Sei 1 ≤ p ≤ 2 und 1/p + 1/q = 1.
2π
1 (a) Sei fn = 2π f (t)e−int dt der n-te komplexe Fourierkoeffizient der 0 Funktion f . Dann ist der Operator
f → (fn )n∈Z stetig von Lp [0, 2π] nach q (Z). (b) Sei γn (t) = eint . Dann ist der Operator (an )n∈Z →
an γ n
n∈Z
stetig von p (Z) nach Lq [0, 2π]. (Tip: Behandle zun¨ achst p = 1 und p = 2 und benutze den Satz von RieszThorin.)
V.7 Bemerkungen und Ausblicke
V.7
251
Bemerkungen und Ausblicke
Zwischen 1904 und 1910 ver¨ offentlichte D. Hilbert in den Nachr. Wiss. Gesellsch. G¨ ottingen, Math.-phys. Kl., sechs Mitteilungen unter dem Titel Grundz¨ uge einer allgemeinen Theorie der linearen Integralgleichun” gen“, in denen er eine Theorie der quadratischen Formen von unendlich vielen Unbekannten entwirft und auf die L¨ osungstheorie von Differentialund Integralgleichungen anwendet. Die ideengeschichtlich bedeutendste ist die 4. Mitteilung aus dem Jahre 1906. Im Kern wird hier die Theorie der selbstadjungierten Operatoren auf Hilbertr¨ aumen entwickelt, die uns in den n¨achsten beiden Kapiteln besch¨ aftigen wird. Aber weder Hilberts Formulierungen noch seine Methoden benutzen die heute u ¨bliche Sprache der Hilbertr¨aume. Der einzige Hilbertraum, der bei Hilbert vorkommt, ist der Folgenraum 2 , und von dem taucht eigentlich auch nur die Einheitskugel auf. (Es wird die Geschichte kolportiert, Hilbert habe Weyl nach einem Vortrag gefragt: Weyl, eine Sache m¨ ussen Sie mir erkl¨ aren: Was ist das, ein Hilbertscher Raum? Das habe ich nicht verstanden.
Siehe L. Young, Mathematicians and their Times, North-Holland 1981, S. 312.) Der Zusammenhang zwischen Integralgleichungen und dem Raum 2 (oder seiner Einheitskugel) wird von Hilbert mittels der Fourierentwicklung hergestellt. (Dies geschieht in der 5. Mitteilung.) Statt einer stetigen Funktion f betrachtet Hilbert die Folge ihrer Fourierkoeffizienten, und die liegt in 2 ; und statt eines Integraloperators wird der assoziierte Operator auf 2 betrachtet. Die Darstellung bei Hilbert wird nun dadurch verkompliziert, daß er tats¨ achlich nicht Operatoren (sn ) → ( m knm sm )n , sondern die unendlichen Matrizen (knm ) als quadratische Formen knm sm tn untersucht, und er versucht, Eigenschaften der unendlichen quadratischen ¨ Formen durch Ubergang zum Limes aus dem endlichdimensionalen Fall herzuleiten. Hilberts Argumentation wird von Weyl laborious“ genannt, und ” Pietsch zieht in diesem Zusammenhang den Vergleich mit einer Brechstan” ge“ heran (Nachwort zu Hilbert/Schmidt [1989]). Es war nun Hilberts Sch¨ uler E. Schmidt, der dessen Resultate vom Kopf auf die F¨ uße stellte, indem er sie in einer geometrischen Sprache formulierte und sie so auf eine sehr durchsichtige und elegante Weise zeigen konnte (Math. Ann. 63 (1907) 433–476, Rend. Circ. Mat. Palermo 25 (1908) ¨ 53–77). Das erste Kapitel seiner Arbeit von 1908 tr¨agt die Uberschrift Geometrie in einem Functionenraum“; insbesondere studiert Schmidt dort ” den Folgenraum 2 und seine abgeschlossenen Untervektorr¨aume ( lineare ” Funktionengebilde“), er erkl¨ art das Skalarprodukt des 2 und spricht explizit von Orthogonalit¨ at, und er interpretiert x (dieses Symbol wird hier eingef¨ uhrt) als L¨ ange des Vektors x ∈ 2 . Außerdem beweist er den
252
V.
Hilbertr¨ aume
Projektionssatz V.3.4 und beschreibt das Orthogonalisierungsverfahren aus Satz V.4.2; in diesem Zusammenhang zitiert er eine Arbeit des d¨anischen Mathematikers Gram aus dem Jahre 1883. Die wichtigsten Arbeiten von Hilbert und Schmidt sind, kommentiert von A. Pietsch, vor kurzem erneut aufgelegt worden (Hilbert/Schmidt [1989]). F. Riesz gelang es, die Dinge noch transparenter zu machen, indem er in seinen Arbeiten den weitaus einfacher zu handhabenden Begriff des Operators an die Spitze stellt. Die Beschr¨ ankung auf stetige Funktionen bei Hilbert und Schmidt r¨ uhrt u ¨brigens daher, daß sie nur mit dem Riemannintegral operierten. Auch hier ging Riesz einen Schritt weiter, indem er zeigte, daß bei Verwendung des Lebesgueschen Integrals (Lebesgues Doktorarbeit erschien 1902) jede 2 -Folge die Fourierkoeffizientenfolge einer quadratisch integrierbaren Funktion ist (C. R. Acad. Sc. Paris 144 (1907) 615–619). Das ist genau die Aussage von Korollar V.4.14. Der dazu ¨aquivalente Satz, daß L2 [0, 1] vollst¨ andig ist, wurde von Fischer in derselben Ausgabe der Comptes Rendus ver¨ offentlicht. Auch Riesz’ und Fr´echets Beweise, daß L2 [0, 1] zu sich selbst dual ist, finden sich in dieser Nummer. Die Beweise des Darstellungssatzes von Fr´echet-Riesz und des Projektionssatzes im Text stammen ebenfalls von Riesz, jedoch aus einer sp¨ateren Zeit (Acta Sci. Math. Szeged 7 (1934–35) 34–38). Bemerkenswerterweise hat Riesz viele seiner grundlegenden funktionalanalytischen Arbeiten geschrieben, w¨ahrend er Gymnasiallehrer in L˝ocse, dem heute slowakischen Levoˇca, und Budapest war; er wurde erst 1912 zum Professor in Kolozsv´ ar, dem heute in Rum¨ anien liegenden Cluj, berufen. Zwar spricht Riesz in seinen fr¨ uhen Arbeiten vom Raum 2 als dem Hil” bertschen Raum“, die abstrakte Definition eines Hilbertraums im Sinn von V.1.4 wurde jedoch erst 1929, angeregt vom Problem der mathematischen Axiomatisierung der Quantenmechanik, von J. von Neumann (Math. Ann. 102 (1929) 49–131) gegeben. Wenig sp¨ ater erfindet auch M. H. Stone den Hilbertraum, und 1932 erscheint dessen Monographie Linear Transformations in Hilbert Space. Beide fordern noch die Separabilit¨at, die in Arbeiten von Rellich (Math. Ann. 110 (1934) 342–356) und L¨owig (Acta Sci. Math. Szeged 7 (1934) 1–33) fallengelassen wird. So ergibt sich die kuriose Situation, daß abstrakte Hilbertr¨ aume erst nach den abstrakten normierten R¨aumen definiert wurden. Dixmier (Acta Sci. Math. Szeged 15 (1953) 29–30) hat einen nichtseparablen Pr¨ahilbertraum konstruiert, in dem jedes Orthonormalsystem abz¨ahlbar oder endlich ist. Der Raum AP2 (R) aus Beispiel V.1(f) ist eines der wenigen nat¨ urlichen“ Beispiele eines nichtseparablen Hilbertraums; Rel” lich war wesentlich durch diesen Raum motiviert, die Hilbertraumtheorie auf nichtseparable Situationen auszudehnen. Dieses Beispiel ist eng mit der Theorie der fastperiodischen Funktionen verwandt (engl. almost periodic, daher die Bezeichnung AP). H. Bohr (Bohr [1932]) zeigte, daß der Abschluß von X aus Beispiel V.1(f) in C b (R) (bzgl. der Supremumsnorm) aus genau
V.7
253
Bemerkungen und Ausblicke
den stetigen komplexwertigen Funktionen auf R besteht, f¨ ur die gilt
∀ ∃ ∀
ε>0 L>0 a∈R
∃τ
a<τ ≤a+L
∀
|f (t + τ ) − f (t)| ≤ ε.
(V.27)
t∈R
Funktionen mit dieser Eigenschaft heißen fastperiodisch. (Periodische Funktionen erf¨ ullen (V.27) mit ε = 0 und L = Periode von f .) Jede fastperiodische Funktion geh¨ ort zu AP2 (R); die Elemente dieses Raums sind von Besicovitch [1932] charakterisiert worden. Der Satz von Hellinger-Toeplitz wurde von ihnen urspr¨ unglich mit der Methode des gleitenden Buckels begr¨ undet. Hilberts Auswahlsatz“, Korol” lar V.3.7(c), findet sich in etwas verklausulierter Form in seiner 4. Mittei2 lung, S. 164ff., f¨ ur H = . Banach und Saks bewiesen ihren Satz sogar f¨ ur Lp [0, 1], 1 < p < ∞ (Studia Math. 2 (1930) 51–57); der Beweis f¨ ur den Lp Fall ist nat¨ urlich schwieriger. F¨ ur p = 1 gilt der folgende Satz von Koml´ os, dessen Beweis man in Wojtaszczyk [1991], S. 102, findet. • Jede beschr¨ankte Folge (fn ) in L1 enth¨alt eine Teilfolge (gn ), so daß n 1 gk n k=1
fast ¨ uberall gegen eine Grenzfunktion g ∈ L1 konvergiert. Im Text wurde bereits der Satz von Dvoretzky-Rogers aus dem Jahre 1950 zitiert, wonach in jedem unendlichdimensionalen Banachraum stets unbedingt, aber nicht absolut konvergente Reihen existieren; der Beweis kann heute mittels der Theorie der absolut summierenden Operatoren gef¨ uhrt werden, siehe Lindenstrauss/Tzafriri [1977], S. 65. Solch eine Reihe in p zu finden ist f¨ ur p > 1 sehr einfach. F¨ ur p = 1 liegt ihre Konstruktion aber nicht auf der Hand; wer einen Hinweis sucht, lese Macphails Arbeit im Bull. Amer. Math. Soc. 121–123. gilt f¨ ur unbedingt 53 (1947) Andererseits p 2 konvergente Reihen f in L noch f < ∞ f¨ u r 1 ≤ p ≤ 2 und n n fn p < ∞ f¨ ur 2 < p < ∞. Dieser Satz wurde 1930 von Orlicz gefunden, ein moderner Beweis reduziert die Aussage auf die sog. Kotypeigenschaft der Lp -R¨aume (Wojtaszczyk [1991], S. 97). Konvergiert eine (konvergente) Reihe xn reeller Zahlen nicht unbedingt, so kann man bekanntlich zu jeder reellen Zahl x eine Umordnung mit xπ(n) = x finden. Anders ausgedr¨ u ckt k¨ o nnen bei konvergenten re ellen Reihen xn f¨ ur die Menge Σ = {x: ∃π xπ(n) = x} nur die F¨alle Σ = {x0 } oder Σ = R auftreten. F¨ ur konvergente Reihen komplexer Zahlen gibt es drei M¨oglichkeiten: Σ = {x0 }, Σ = C, oder Σ ist eine Gerade in der komplexen Ebene. Allgemeiner besagt der Satz von Steinitz f¨ ur Reihen im Rn , daß Σ stets ein affiner Unterraum ist; ein Beweis dieses Satzes
254
V.
Hilbertr¨ aume
wird von P. Rosenthal in Amer. Math. Monthly 94 (1987) 342–351 dargestellt. Im Unendlichdimensionalen liegen die Dinge viel komplizierter. Im Problem 106 des Schottischen Buches (Mauldin [1981], S. 188) fragte Banach, ob Σ stets konvex sei; als Preis setzte er eine Flasche Wein aus. Wie aus Aufgabe V.6.26 hervorgeht, ist das im allgemeinen falsch; das Gegenbeispiel dieser Aufgabe (von Marcinkiewicz) ist ebenfalls im Schottischen Buch verzeichnet. Ein weit drastischeres Gegenbeispiel stammt von Kadets und Wo´zniakowski (Bull. Pol. Acad. Sci. 37 (1989) 15–21): In jedem unendlichdimensionalen Banachraum existiert eine nur bedingt konvergente Reihe, so daß Σ aus genau zwei Punkten besteht; siehe auch [J. O.] Wojtaszczyk, Studia Math. 171 (2005) 261–281. Mehr zu diesem Problemkreis kann man bei Kadets/Kadets [1997] nachlesen. Mit der Parallelogrammgleichung liegt ein einfaches notwendiges und hinreichendes Kriterium (es stammt von Jordan und von Neumann, Ann. Math. 36 (1935) 719–723) vor, um zu u ufen, ob die Norm eines Ba¨berpr¨ nachraums von einem Skalarprodukt abgeleitet werden kann, mit anderen Worten, ob ein gegebener Banachraum zu einem Hilbertraum isometrisch isomorph ist. Ca. 350 weitere findet man bei Amir [1986]. Wesentlich heikler ist die Frage, ob ein gegebener Banachraum zu einem Hilbertraum isomorph ist, d.h., ob es eine ¨ aquivalente Norm gibt, die von einem Skalarprodukt abstammt. Ein tiefliegendes Ergebnis in dieser Richtung ist das Theorem u ¨ ber komplementierte Unterr¨ aume (vgl. Definition IV.6.4 wegen dieses Begriffs) von Lindenstrauss und Tzafriri (Israel J. Math. 9 (1971) 263–269). • Wenn jeder abgeschlossene Unterraum eines Banachraums X komplementiert ist, ist X zu einem Hilbertraum isomorph. (Die Umkehrung folgt nat¨ urlich aus Theorem V.3.4.) Eine weitere Charakterisierung wird in den Bemerkungen zu Kapitel VI genannt. Pr¨ahilbertr¨aume glatter Funktionen (etwa C 2 (Ω) mit der Sobolevnorm . W 2 ) wurden schon in den dreißiger Jahren in G¨ottingen betrachtet (siehe Courant/Hilbert [1968], Band 1, Kapitel V, und Band 2, Kapitel VII), und in diesem Zusammenhang bewies Rellich 1930 seinen Einbettungssatz. ¨ Sobolev (Mat. Sbornik 46 (1938) 471–496, engl. Ubersetzung Amer. Math. Soc. Transl. 34 (1963) 39–68) f¨ uhrte den verallgemeinerten Ableitungsbegriff ein und gelangte so zu Hilbertr¨ aumen (schwach) differenzierbarer Funktionen. (Einen noch schw¨ acheren Ableitungsbegriff vermittelt die Distributionentheorie; siehe Abschnitt VIII.5.) Er bewies dort auch das Sobolevlemma. Sobolevr¨ aume werden auch u ¨ber den R¨aumen Lp (Ω) gebildet; man verlangt dann, daß alle schwachen Ableitungen der Ordnung ≤ m zu Lp (Ω) geh¨oren, und bezeichnet die Gesamtheit dieser Funktionen mit W m,p (Ω). Dann gilt der Einbettungssatz W m,p (Ω) ⊂ C k (Ω), falls m > k + np und Ω ⊂ Rn . Bezeichnet man mit H0m,p den Abschluß von D in W m,p , kann man folgenden auf Kondrachev (1945) zur¨ uckgehenden Kompaktheitssatz f¨ ur beschr¨anktes Ω ⊂ Rn zeigen.
V.7
255
Bemerkungen und Ausblicke
• Falls mp < n und q < np/(n − mp) sind, ist H0m,p (Ω) kompakt in Lq (Ω) eingebettet. • Falls mp > n + kp ist, ist H0m,p (Ω) kompakt in C k (Ω) eingebettet. Unter geeigneten geometrischen Voraussetzungen an Ω (z.B., wenn Ω einen Lipschitzrand hat), darf man H0m,p durch W m,p ersetzen. Die Standardreferenz zu Sobolevr¨ aumen ist Adams [1975]; siehe auch Marti [1986] und Wloka [1982] f¨ ur Anwendungen auf die Theorie partieller Differentialgleichungen. Die klassische Fourieranalyse wurde in Fouriers Th´eorie analytique de ” la chaleur“ von 1822 entwickelt; moderne Darstellungen sind K¨orner [1988] und nat¨ urlich Zygmund [1959]. Plancherel bewies seine Gleichung urspr¨ unglich im Jahre 1910. Der Aufbau der Theorie u ¨ber den Raum S (Rn ) wurde von L. Schwartz vorgeschlagen (Annales Univ. Grenoble 23 (1947–48) 7–24); dieses Vorgehen ist fundamental f¨ ur die Fouriertransformation von Distributionen (Abschnitt VIII.5). Den gemeinsamen Hintergrund der Fourierreihen und der Fouriertransformation kann man mit Hilfe der abstrakten harmonischen Analyse formulieren, was im folgenden skizziert werden soll. Dazu sei (G, +) eine abelsche Gruppe. Gleichzeitig sei G mit einer Topologie versehen, so daß die Gruppenoperation und die Inversenbildung stetig sind, und G sei lokalkompakt; man nennt G dann kurz eine lokalkompakte abelsche Gruppe. Man kann beweisen, daß es – bis auf eine multiplikative Konstante – genau ein regul¨ ares translationsinvariantes Borelmaß m auf G gibt, also ein Maß mit m(a + E) = m(E) f¨ ur alle Borelmengen E. So ein Maß heißt Haarmaß. Ist G = Rn , so ist m ein Vielfaches des Lebesguemaßes. Sei T = {z ∈ C: |z| = 1}; T ist in nat¨ urlicher Weise eine kompakte abelsche Gruppe mit dem (eindimensionalen) Lebesguemaß als Haarmaß. Als n¨achstes definiert man den Begriff des Charakters. Ein Charakter auf G ist ein stetiger Gruppenhomomorphismus von G nach T; die Menge aller Charaktere bildet ihrerseits eine abelsche Gruppe Γ, die, versehen mit der Topologie der gleichm¨ aßigen Konvergenz auf kompakten Teilmengen von G, zu einer lokalkompakten abelschen Gruppe wird und daher ein Haarmaß m zul¨aßt. Γ heißt die zu G duale Gruppe. Ist G = Rn , so hat jeder Charakter die Form γ(x) = eixξ f¨ ur ein ξ ∈ Rn ; ergo ist Γ isomorph zu Rn . Ist G = T, so lauten die Charaktere γ(z) = z n f¨ ur ein n ∈ Z, und Γ ist isomorph zu Z. Sei nun f ∈ L1 (G, dm). Die Fouriertransformierte von f ist die Funktion f: Γ → C, f(γ) = f (x)γ(x) dm(x). G
Es ist stets f ∈ C0 (Γ), und gilt auch f ∈ L1 (Γ, dm), so hat man die Fourierinversionsformel (c bezeichnet eine Konstante) f (x) = c f(γ)γ(x) dm(γ) fast u ¨ berall. Γ
256
V.
Hilbertr¨ aume
Wenn man G = Rn = Γ betrachtet, erh¨ alt man so die Formeln f¨ ur die Fouriertransformation und die inverse Fouriertransformation. F¨ u r G =T und Γ = Z wird Γ einfach n∈Z , und man erh¨alt eine Fourierreihe. Warum man es in den klassischen F¨ allen einmal mit einem Integral und einmal mit einer Reihe zu tun hat, l¨ aßt sich vor diesem abstrakten Hintergrund so beantworten. Ist G kompakt (wie T), so ist Γ eine diskrete Gruppe, und das Haarmaß auf Γ ist das z¨ ahlende Maß. Auch das Beispiel V.4(c) ist der Spezialfall eines allgemeinen Sachverhalts: • (Satz von Peter-Weyl) Wenn G kompakt ist, ist Γ eine Orthonormalbasis von L2 (G, dm). Zu all diesen Dingen siehe z.B. Rudin [1962] und Loomis [1953]. Eine moderne Weiterentwicklung der Fourieranalyse auf R (und in mancher Hinsicht ein Gegenst¨ uck dazu) ist die Theorie der Wavelets. Ein orthogonales Wavelet (frz. ondelette) ist eine Funktion ψ: R → C, f¨ ur die die Funktionen ψj,k (t) = 2k/2 ψ(2k t − j), j, k ∈ Z eine Orthonormalbasis von L2 (R) bilden. (Eigentlich sind die ψj,k die Wavelets, und ψ wird auch Mutterwavelet genannt.) Ein einfaches Beispiel ist die Haarbasis, wo man von ψ = χ[0,1/2) − χ[1/2,1) ausgeht, vgl. Aufgabe V.6.22. Meyer hat 1985 Wavelets ψ ∈ S (R) konstruiert, und Daubechies hat 1988 f¨ ur jedes m ∈ N orthogonale Wavelets der Klasse C m mit kompaktem Tr¨ager gefunden, die gleichzeitig Schauderbasen (Aufgabe IV.8.19) der R¨aume Lp (R), die die wichtige Eigenschaft be 1 < p < ∞, bilden, p sitzen, daß f¨ u r f, ψ ψ ∈ L (R) auch bei jeder Vorzeichenwahl j,k j,k j,k p ±f, ψ ψ ∈ L (R) gilt. Diese Eigenschaft ist zur unbedingten j,k j,k j,k Konvergenz der Reihe ¨ aquivalent, und man spricht dann von einer unbedingten Schauderbasis; das trigonometrische System ist zwar eine Schauderbasis von Lp [0, 2π] f¨ ur 1 < p < ∞, aber keine unbedingte Basis, wenn p = 2 ist. Zu Wavelets und ihren Anwendungen siehe Daubechies [1992], Meyer [1992] und Wojtaszczyk [1997].
Kapitel VI
Spektraltheorie kompakter Operatoren
VI.1
Das Spektrum eines beschr¨ ankten Operators
Die Spektraltheorie verallgemeinert die Eigenwerttheorie f¨ ur Matrizen auf Operatoren auf unendlichdimensionalen Banachr¨aumen. F¨ ur Operatoren (= Matrizen) auf endlichdimensionalen R¨ aumen ist ein Eigenwert bekanntlich durch die Forderung definiert, daß λ Id − T nicht injektiv ist, was dazu ¨aquivalent ist, daß λ Id − T nicht surjektiv ist. Auf unendlichdimensionalen ¨ R¨aumen braucht diese Aquivalenz nicht mehr zu gelten. Man muß daher ein allgemeineres Konzept als das des Eigenwerts zulassen. Im folgenden bezeichnet X stets einen Banachraum und T ∈ L(X) einen stetigen linearen Operator. Statt λ Id − T schreiben wir λ − T . Definition VI.1.1 Sei T ∈ L(X). (a) Die Resolventenmenge von T ist ρ(T ) = {λ ∈ K: (λ − T )−1 existiert in L(X)}. (b) Die Abbildung R: ρ(T ) → L(X),
Rλ := Rλ (T ) := (λ − T )−1
heißt Resolventenabbildung. (c) Das Spektrum von T ist σ(T ) = K \ ρ(T ). Man definiert noch folgende Teilmengen des Spektrums: σp (T ) = {λ: λ − T nicht injektiv}, σc (T ) = {λ: λ − T injektiv, nicht surjektiv, mit dichtem Bild}, σr (T ) = {λ: λ − T injektiv, ohne dichtes Bild}.
D. Werner, Funktionalanalysis, 7. Aufl., Springer-Lehrbuch, DOI 10.1007/978-3-642-21017-4_6, © Springer-Verlag Berlin Heidelberg 2011
258
VI.
Spektraltheorie kompakter Operatoren
Man nennt σp (T ) das Punktspektrum, σc (T ) das stetige Spektrum und σr (T ) das Restspektrum. Aus dem Satz von der offenen Abbildung (genauer Korollar IV.3.4) folgt σ(T ) = σp (T ) ∪ σc (T ) ∪ σr (T ), denn (λ − T )−1 ist automatisch stetig, falls λ − T bijektiv ist. (Zur Erinnerung: der Raum X ist in diesem Kapitel stets ein Banachraum.) Die Elemente von σp (T ) heißen Eigenwerte; ein x = 0 mit T x = λx heißt Eigenvektor (oder Eigenfunktion, wenn X ein Funktionenraum ist). Typischerweise (freilich nicht immer, vgl. die folgenden Beispiele) besteht σp (T ) aus isolierten Punkten, σc (T ) aus einer Vereinigung von Intervallen, und σr (T ) kommt nicht vor. Dies erkl¨art die Nomenklatur. Als erstes machen wir eine einfache Beobachtung. Satz VI.1.2 Es gilt σ(T ) = σ(T ). Ist X ein Hilbertraum, so ist σ(T ∗ ) = {λ: λ ∈ σ(T )}. Beweis. Im Banachraumfall folgt die Aussage aus der Tatsache, daß ein Operator genau dann ein Isomorphismus ist, wenn es sein Adjungierter ist (Aufgabe III.6.21). F¨ ur den Hilbertraumfall beachte (λ − T )−1 ∗ = (λ − T )∗ −1 = (λ − T ∗ )−1 . 2 Beispiele. (a) F¨ ur dim X < ∞ stimmt σ(T ) mit der Menge der Eigenwerte u ¨berein und kann im Fall K = R durchaus leer sein. (b) Ist X ein Hilbertraum und T ein selbstadjungierter Operator, so gilt σ(T ) ⊂ R. Das wird in Korollar VII.1.2 gezeigt. Daher muß nach Satz V.5.2(g) σr (T ) = ∅ sein. s (c) Sei X = C[0, 1] und (T x)(s) = 0 x(t) dt. Dann ist σ(T ) = σr (T ) = {0}. Um das einzusehen, betrachte zuerst λ = 0. Nach dem Hauptsatz der Differential- und Integralrechnung ist T injektiv, und T hat kein dichtes Bild, da stets (T x)(0) = 0 gilt. Also ist 0 ∈ σr (T ). Sei nun λ = 0. Es ist zu zeigen, daß f¨ ur alle y ∈ C[0, 1] die Gleichung λx − T x = y
(VI.1)
eindeutig nach x aufl¨ osbar ist; denn dann ist λ − T bijektiv, und die Stetigkeit des inversen Operators ergibt sich automatisch aus dem Satz von der offenen Abbildung. Schreibt man z = T x, so ist (VI.1) dem Anfangswertproblem 1 1 z(t) ˙ − z(t) = y(t), z(0) = 0 (VI.2) λ λ ¨aquivalent. (Wir verwenden hier die Physikernotation y˙ statt y , um nicht mit der Bezeichnung f¨ ur Funktionale zu kollidieren.) F¨ ur y = 0 hat (VI.2) nur die triviale L¨ osung, also ist λ − T injektiv. Die eindeutig bestimmte L¨osung von (VI.2) kann mit der Methode der Variation der Konstanten
VI.1
259
Das Spektrum eines beschr¨ ankten Operators
ermittelt werden (siehe z.B. Walter [1993], S. 25); sie lautet 1 t −s/λ z(t) = et/λ · e y(s) ds. λ 0 Daher ist x(t) = z(t) ˙ =
1 1 (z(t) + y(t)) = 2 λ λ
t
e(t−s)/λ y(s) ds + 0
1 y(t). λ
¨ Deshalb ist λ − T bijektiv. Ubrigens kann man die Stetigkeit von (λ − T )−1 direkt aus der obigen Formel ablesen. (d) Betrachtet man den Operator T aus Beispiel (c) auf X = {x ∈ C[0, 1]: x(0) = 0}, so gilt σ(T ) = σc (T ) = {0}. In der Tat gilt wie oben λ ∈ ρ(T ) f¨ ur λ = 0, und wieder ist T injektiv. Wegen ran T = {y ∈ C 1 [0, 1]: y(0) = 0, y(0) ˙ = 0} gilt ran T = ran T = X, also ist diesmal 0 ∈ σc (T ). (e) Das folgende etwas k¨ unstliche Beispiel zeigt, daß alle Typen von Spektralpunkten vorkommen k¨ onnen. Sei X = {x ∈ ∞ [0, 1] : x stetig bei 0 und 1, x(0) = 0} und T : X → X, (T x)(t) = tx(t). X wird mit der Supremumsnorm versehen und ist dann ein abgeschlossener Unterraum von ∞ [0, 1] . Es gilt σ(T ) = [0, 1]; genauer σp (T ) = (0, 1),
σc (T ) = {0},
σr (T ) = {1}.
Zum Beweis sei zuerst λ ∈ / [0, 1]. Dann definiert
(λ − T )−1 x (t) =
1 x(t) λ−t
den Umkehroperator, also gilt λ ∈ ρ(T ). Ist λ ∈ (0, 1), so betrachte xλ = χ{λ} ∈ X. Wegen T xλ = λxλ liegt λ im Punktspektrum. Schließlich betrachten wir λ = 1 und λ = 0. Id − T ist injektiv, denn T x = x impliziert tx(t) = x(t) f¨ ur alle t ∈ [0, 1], also x(t) = 0 f¨ ur alle t ∈ [0, 1). Da x bei 1 stetig ist, folgt x = 0. Ferner hat Id − T kein dichtes Bild, da ran(Id − T ) ⊂ {x ∈ X: x(1) = 0}. Zu λ = 0 bemerke, daß T injektiv ist (Beweis wie oben), aber nicht surjektiv (die Wurzelfunktion geh¨ort nicht zu ran T ). T hat jedoch dichtes Bild. Sei n¨ amlich y ∈ X. Zu ε > 0 w¨ahle δ > 0 mit |y(t)| ≤ ε f¨ ur alle t ≤ δ. Setze xε (t) = 0 f¨ ur t ≤ δ und xε (t) = y(t)/t sonst. Dann ist xε ∈ X und T xε − y ∞ ≤ ε. Der folgende Satz ist grundlegend; besonders wichtig ist Teil (d). Satz VI.1.3 (a) ρ(T ) ist offen. (b) Die Resolventenabbildung ist analytisch, d.h., sie wird lokal durch eine Potenzreihe mit Koeffizienten in L(X) beschrieben.
260
VI.
Spektraltheorie kompakter Operatoren
(c) σ(T ) ist kompakt, genauer gilt |λ| ≤ T f¨ ur alle λ ∈ σ(T ). (d) Ist K = C, so ist σ(T ) = ∅. Beweis. (a) Sei λ0 ∈ ρ(T ) und |λ − λ0 | < (λ0 − T )−1 −1 . Dann ist $ % λ − T = (λ0 − T ) + (λ − λ0 ) = (λ0 − T ) Id − (λ0 − λ)(λ0 − T )−1 . Nach Wahl von λ konvergiert die Neumannsche Reihe ∞
(λ0 − λ)(λ0 − T )−1
n
,
n=0
$ % und nach Satz II.1.11 ist Id − (λ0 − λ)(λ0 − T )−1 invertierbar. Daher ist auch λ − T invertierbar. (b) Mit Satz II.1.11 kann jetzt (λ − T )−1 als Reihe geschrieben werden: $
%−1 Id − (λ0 − λ)(λ0 − T )−1 (λ0 − T )−1 ∞ n+1 = (λ0 − λ)n (λ0 − T )−1
Rλ = (λ − T )−1 =
n=0
Das ist die gew¨ unschte Potenzreihenentwicklung f¨ ur Rλ mit den Koeffizi enten (λ0 − T )−1 n+1 . (c) Nach (a) ist σ(T ) abgeschlossen, und f¨ ur |λ| > T ist wieder (λ − T )
−1
−1
=λ
−1 ∞ T −1 Id − =λ λ−n T n λ n=0
(VI.3)
konvergent. Es folgt σ(T ) ⊂ {λ ∈ K: |λ| ≤ T }, und σ(T ) ist beschr¨ ankt, folglich kompakt. (d) Wir nehmen σ(T ) = ∅ an. Dann ist die Resolventenabbildung auf ganz C definiert und lokal analytisch. Sei nun ∈ L(X) beliebig. Die Funktion λ → (Rλ ) hat dann lokal die Gestalt (siehe oben) (Rλ ) =
∞
(−1)n (Rλn+1 )(λ − λ0 )n . 0
(VI.4)
n=0
Diese Funktion ist daher selbst analytisch. Sie ist aber auch beschr¨ankt. F¨ ur |λ| > 2 T gilt n¨ amlich nach (VI.3) |(Rλ )| ≤ |λ−1 |
∞ n T ≤ 1 2 = , λ 2 T T n=0
VI.1
Das Spektrum eines beschr¨ ankten Operators
261
und auf der kompakten Menge {λ: |λ| ≤ 2 T } ist sie aus Stetigkeitsgr¨ unden beschr¨ankt. Der Satz von Liouville der Funktionentheorie besagt, daß eine auf ganz C definierte beschr¨ ankte analytische Funktion konstant ist (siehe z.B. Rudin [1986], S. 212). Betrachten wir nun (VI.4) f¨ ur λ0 = 0, so sieht man, daß alle Koeffizienten der Potenzreihe (bis auf den nullten) verschwinden m¨ ussen. Insbesondere ist (T −2 ) = (R02 ) = 0, und zwar f¨ ur jedes ∈ L(X) . Der Satz von Hahn-Banach impliziert T −2 = 0, was absurd ist, da der Operator 0 nicht zu T 2 invers ist. Also war die urspr¨ ungliche Annahme falsch, und σ(T ) ist nicht leer. 2 Die Absch¨atzung in Teil (c) des Satzes VI.1.3 kann versch¨arft werden. Als Vorbereitung auf den dabei auftretenden Begriff des Spektralradius (Definition VI.1.5) ben¨ otigen wir ein Lemma aus der Analysis. Lemma VI.1.4 Die reelle Zahlenfolge ulle 0 ≤ an+m ≤ an am f¨ ur √ (an ) erf¨ √ alle n, m ∈ N. Dann konvergiert n an gegen a := inf n an . √ Beweis. Sei ε > 0. W¨ ahle N mit N aN < a + ε. Setze b = b(ε) = max{a1 , . . . , aN }, und schreibe eine nat¨ urliche Zahl n in der Form n = kN + r mit 1 ≤ r ≤ N . Dann folgt √ 1/n n an = akN +r ≤ (akN ar )1/n ≤ (a + ε)kN/n b1/n = (a + ε)(a + ε)−r/n b1/n ≤ a + 2ε, falls n groß genug ist. Das zeigt die Behauptung.
2
Definition VI.1.5 r(T ) := inf T n 1/n = limn→∞ T n 1/n wird der Spektralradius von T ∈ L(X) genannt. Daß der Limes existiert und gleich dem Infimum ist, zeigt Lemma VI.1.4 mit an = T n . Satz VI.1.6 (a) |λ| ≤ r(T ) f¨ ur λ ∈ σ(T ). (b) Falls K = C ist, existiert λ ∈ σ(T ) mit |λ| = r(T ). Teil (b) sagt also r(T ) = max{|λ|: λ ∈ σ(T )}, was den Namen Spektralradius erkl¨ art. ∞ Beweis. (a) Es ist nur zu zeigen, daß die Reihe λ−1 n=0 (T /λ)n f¨ ur |λ| > r(T ) konvergiert; vgl. den Beweis zu Satz VI.1.3(c). Daf¨ ur ist offenbar lim sup (T /λ)n 1/n < 1 hinreichend, und in der Tat ist 1/n T n T n 1/n r(T ) lim sup = lim = < 1. λ |λ| |λ|
262
VI.
Spektraltheorie kompakter Operatoren
(b) Sei r0 = sup{|λ|: λ ∈ σ(T )}. Teil (a) zeigt r0 ≤ r(T ). Sei nun |μ| > r0 ; wir werden dann |μ| ≥ r(T ) zeigen, woraus r0 = r(T ) und wegen der Kompaktheit des Spektrums Teil (b) folgt. Zu ∈ L(X) betrachte die in {λ: |λ| > r0 } analytische (da lokal analytische) Funktion f (λ) = (λ − T )−1 . Sie kann nach (a) f¨ ur |λ| > r(T ) durch die konvergente Reihe f (λ) =
∞
(T n )λ−(n+1)
n=0
dargestellt werden. Da diese Reihe nach einem Satz der Funktionentheorie im gr¨oßten offenen Kreisring konvergiert, in dem f analytisch ist, konvergiert sie insbesondere bei μ; speziell ist limn→∞ (T n /μn+1 ) = 0. Weil ein beliebiges stetiges lineares Funktional war, ist daher (T n /μn+1 ) eine schwache Nullfolge und folglich (Korollar IV.2.3) beschr¨ankt. F¨ ur ein geeignetes K > 0 ist also T n 1/n ≤ K 1/n |μ|(n+1)/n → |μ|. Das zeigt r(T ) ≤ |μ|.
2
Im allgemeinen ist r(T ) < T , siehe etwa Beispiel VI.1(c), wo r(T ) = 0 ist. F¨ ur normale Operatoren auf Hilbertr¨ aumen gilt jedoch stets die Gleichheit. Satz VI.1.7 Ist H ein Hilbertraum und T ∈ L(H) normal, so ist r(T ) = T . Beweis. F¨ ur normales T ist T 2 = T 2 , denn nach Satz V.5.2(f) ist 2 (∗) T 2 2 = (T 2 )(T 2 )∗ = (T T ∗)2 = T T ∗ 2 = T 2 ; bei (∗) wurde ausgenutzt, daß T normal ist. Da alle T n ebenfalls normal k k sind, gilt f¨ ur alle k ∈ N die Gleichung T 2 = T 2 , daher k
k
r(T ) = lim T n 1/n = lim T 2 1/2 = T . n→∞
VI.2
k→∞
2
Die Theorie von Riesz
In diesem Abschnitt wird das Spektrum eines kompakten Operators qualitativ vollst¨andig beschrieben. Im großen und ganzen zeigen die Resultate ¨ große Ahnlichkeit mit den entsprechenden Ergebnissen der linearen Algebra.
VI.2
263
Die Theorie von Riesz
Mit X wird nach wie vor ein Banachraum bezeichnet. Im folgenden Satz werden Operatoren der Form Id − T , T kompakt, analysiert. Der entstehende Operator hat dann, wie sich zeigt, qualitativ ¨ahnliche Eigenschaften wie der identische Operator. Also kann man Id − T f¨ ur kompaktes T als qualitativ kleine“ St¨ orung der Identit¨ at ansehen. ” Wir erinnern an den Satz von Schauder (Satz III.4.4), wonach ein Operator auf einem Banachraum genau dann kompakt ist, wenn sein Adjungierter kompakt ist. Satz VI.2.1 (Satz von Riesz-Schauder) Sei T ∈ K(X) und S := Id − T . (a) Der Kern von S ist endlichdimensional. (b) Der Operator S hat abgeschlossenes Bild, und X/ran S ist endlichdimensional. (c) dim(X/ran S) = dim(ker S) = dim(X /ran S ) = dim(ker S ). Ein Operator mit den Eigenschaften aus (a) und (b) wird Fredholmoperator und die Zahl ind(S) = dim(ker S) − dim(X/ran S) sein Index genannt. Satz VI.2.1 besagt also, daß ein Operator der Form S = Id−T , T kompakt, ein Fredholmoperator mit Index 0 ist; das impliziert insbesondere, daß solch ein Operator S genau dann surjektiv ist, wenn er injektiv ist. Mit anderen Worten besitzt die Operatorgleichung Sx = y f¨ ur jede rechte Seite y eine L¨ osung, falls die homogene Gleichung Sx = 0 nur die triviale L¨osung x = 0 besitzt, was sehr viel einfacher zu u ufen ist als ¨berpr¨ die L¨osbarkeit der urspr¨ unglichen Gleichung. Ferner besitzt Sx = y dann genau eine L¨osung. (Genaueres zu diesem Ideenkreis siehe Satz VI.2.4.) Beweis. (a) Sei (xn ) eine beschr¨ ankte Folge in ker S. Da T kompakt ist, konvergiert eine geeignete Teilfolge (T xnk ). Wegen 0 = Sxnk = xnk − T xnk konvergiert (xnk ) in X, und da ker S abgeschlossen ist, auch in ker S. Nach Satz I.2.7 ist ker S endlichdimensional. (b) Zuerst zeigen wir, daß ran S abgeschlossen ist. Betrachte den induzierten Operator S S
X @
@
@ R @ X/ker S
- ran S S
264
VI.
Spektraltheorie kompakter Operatoren
der bijektiv und stetig ist. Wir beweisen, daß S−1 stetig ist; dann ist n¨amlich S ein Isomorphismus zwischen X/ker S und ran S. Da X/ker S vollst¨andig ist, muß dann auch ran S vollst¨ andig und folglich (Lemma I.1.3) abgeschlossen sein. W¨are S−1 nicht stetig, so existierten xn ∈ X mit [xn ] X/ker S = 1,
Sxn → 0.
Nach Definition der Quotientennorm darf ohne Einschr¨ankung xn ≤ 2 f¨ ur ¨ alle n angenommen werden. Nach Ubergang zu einer Teilfolge ist (T xnk ) konvergent, deshalb ist auch (xnk ) = (T xnk +Sxnk ) konvergent, etwa gegen x. Es folgt Sx = 0, also [x] X/ker S = 0; andererseits gilt [x] X/ker S = lim [xnk ] X/ker S = 1. k→∞
Dieser Widerspruch beweist die behauptete Stetigkeit von S−1 . Des weiteren gilt nach Satz III.1.10 (X/U ) ∼ ur abgeschlossene = U ⊥ f¨ Unterr¨aume U ⊂ X. Wendet man das auf U = ran S an und beachtet man noch (ran S)⊥ = ker S , was direkt zu verifizieren ist, so ergibt sich (X/ran S) ∼ = ker S , also dim(X/ran S) = dim(X/ran S) = dim(ker S ) < ∞,
(VI.5)
denn (a) ist auf S anwendbar, weil T ebenfalls kompakt ist. (c) Aus der Isometrie U ∼ ur U = = X /U ⊥ (Satz III.1.10) ergibt sich f¨ ⊥ ker S mit Hilfe von (ker S) = ran S (Theorem IV.5.1) dim(X /ran S ) = dim(ker S) = dim(ker S), so daß dank (VI.5) nur noch dim(X/ran S) = dim(ker S)
(VI.6)
zu zeigen ist. Dazu bedarf es einiger Vorbereitungen, die im folgenden Lemma getroffen werden. Zu m ∈ N setze Nm = ker S m , N0 = {0}, Rm = ran S m , R0 = X. Dann gilt N0 ⊂ N1 ⊂ N2 ⊂ . . . , Da S
m
von der Form S m = (Id − T )m = Id −
R0 ⊃ R1 ⊃ R2 ⊃ . . . .
m m (−1)k+1 T k = Id − T˜ k
k=1
mit kompaktem T˜ ist, sind alle Nm endlichdimensional, sind alle Rm abgeschlossen, und es gilt stets dim X/Rm < ∞ nach dem bereits Bewiesenen. Nun formulieren wir das entscheidende Lemma.
VI.2
Die Theorie von Riesz
265
Lemma VI.2.2 (a) Es existiert eine kleinste Zahl p ∈ N0 mit Np = Np+1 . (b) Es gilt Np+r = Np f¨ ur alle r > 0. (c) Np ∩ Rp = {0}. (d) Es existiert eine kleinste Zahl q ∈ N0 mit Rq = Rq+1 . (e) Es gilt Rq+r = Rq f¨ ur alle r > 0. (f) Nq + Rq = X. (g) p = q. Bevor wir Lemma VI.2.2 beweisen, sollen einige Konsequenzen gezogen und der Beweis von Satz VI.2.1 abgeschlossen werden. Korollar VI.2.3 Ist T ∈ K(X) und S = Id − T , so existieren abgeschlos und R mit sene Unterr¨ aume N < ∞, (a) dim N ⊕R ist eine topologisch direkte Zerlegung (im Sinn von (b) X = N Abschnitt IV.6), ) ⊂ N , S(R) ⊂ R, (c) S(N →R ist ein Isomorphismus. (d) S | : R R = Np , Beweis. W¨ahle p und q (= p) wie in Lemma VI.2.2, und setze N R = Rp . Nach Konstruktion ist N endlichdimensional und R abgeschlos⊕R gilt nach Lemma VI.2.2(c) und (f); sie ist sen. Die Zerlegung X = N topologisch nach Satz IV.6.3. Ferner ist ) = S(Np ) ⊂ Np−1 ⊂ Np = N , S(N = S(Rp ) = Rp+1 = Rp = R. S(R) ˜ R → R, x → Sx, surjektiv. Ist schließlich Sy = 0 f¨ Speziell ist S: ur ein y ∈ R, so folgt, wenn man y = S p x schreibt, S p+1 x = 0, d.h. x ∈ Np+1 = . Daher gilt auch y = S p x = 0. Folglich ist S˜ bijektiv, also nach Np = N dem Satz von der offenen Abbildung ein Isomorphismus. 2 Nun schließen wir den Beweis von Satz VI.2.1(c) ab, indem wir (VI.6) ⊕R aus Korollar VI.2.3 und setze zeigen. Betrachte die Zerlegung X = N S = S | . (VI.6) folgt nun aus folgenden drei Tatsachen. N (1) Es existiert ein kanonischer Vektorraumisomorphismus zwischen /ran S, X/ran S und N /ran S) = dim(ker S), (2) dim(N (3) ker S = ker S.
266
VI.
Spektraltheorie kompakter Operatoren
/ran S → X/ran S durch x + ran S → x + ran S. Zu (1). Definiere Φ: N Wegen ran S ⊂ ran S ist Φ wohldefiniert und linear. Φ ist auch injektiv. mit Φ([x]) = [0], d.h. x ∈ ran S; zu zeigen ist dann Sei n¨amlich x ∈ N ⊕ R. Es folgt x ∈ ran S. Schreibe x = Sy f¨ ur ein y ∈ X und y = y1 + y2 ∈ N Sy2 = Sy − Sy1 = x − Sy1 ∈ N , und da Sy2 ∈ R, ergibt sich Sy2 = 0 und y2 = 0. Daher ist x = Sy1 ∈ S(N ) = ran S. Schließlich weiter, da y2 ∈ R, Dann gilt ist Φ surjektiv. Denn sei x = x1 + x2 ∈ X = N ⊕ R = N ⊕ S(R). = x + ran S. x + ran S = x1 + ran S, also Φ(x1 + ran S) Zu (2). Weil N endlichdimensional ist, ist (2) eine wohlbekannte Aussage der linearen Algebra. ¨ Zu (3). Dies folgt aus der nachstehenden Aquivalenz. ⊕R und Sx = 0 x ∈ ker S ⇔ x = x1 + x2 ∈ N ⇔ Sx2 = −Sx1 ∈ N ∩ R ⇔ Sx2 = Sx1 = 0 ⇔ x2 = Sx1 = 0 und Sx = 0 ⇔ x∈N ⇔ x ∈ ker S Damit ist Satz VI.2.1 vollst¨ andig bewiesen.
2
Satz VI.2.1 gestattet sofort eine wichtige Folgerung. Dazu sei an die Bezeichnung V⊥ aus (III.5) erinnert. Satz VI.2.4 (Fredholmsche Alternative) Sei T ∈ K(X) und sei λ ∈ K, λ = 0. Dann hat entweder die homogene Gleichung λx − T x = 0 nur die triviale L¨ osung, und in diesem Fall ist die inhomogene Gleichung λx − T x = y f¨ ur jedes y ∈ X eindeutig l¨ osbar, oder es existieren n = dim ker(λ − T ) (< ∞) linear unabh¨ angige L¨ osungen der homogenen Gleichung, und auch die adjungierte Gleichung λx − T x = 0 hat genau n linear unabh¨ angige L¨osungen; in diesem Fall ist die inhomogene Gleichung genau dann l¨ osbar, wenn y ∈ (ker(λ − T ))⊥ ist.
VI.2
267
Die Theorie von Riesz
Beweis. Das folgt aus Satz VI.2.1 und Satz III.4.5; beachte nur λ − T = λ(Id − T /λ). 2 Dieser Satz l¨aßt sich in der Theorie der Integralgleichungen anwenden, wo T ein kompakter Integraloperator ist (Beispiele II.3(c) und (d)). Als einfaches Beispiel betrachten wir einen Operator vom Volterra-Typ s T : C[0, 1] → C[0, 1], T x(s) = k(s, t)x(t) dt 0
mit k ∈ C [0, 1]2 . (Beispiel VI.1(c) diskutiert ein einfaches Exemplar eines Volterraschen Integraloperators.) In Aufgabe II.5.26 war die Kompaktheit eines solchen Operators nachzuweisen. Wir betrachten nun eine Operatorgleichung λx − T x = 0, wo λ = 0, eine Integralgleichung zweiter Art. (Integralgleichungen erster Art haben die Form T x = 0 bzw. T x = y und sind wesentlich komplizierter zu analysieren.) F¨ ur λ = 0 ist nun λ − T injektiv. Ohne Einschr¨ankung sei n¨amlich λ = 1 angenommen; sonst betrachte T /λ. Falls T x = x gilt, erh¨alt man die Absch¨atzung s |x(s)| = |T x(s)| ≤ |k(s, t)| |x(t)| dt ≤ s k ∞ x ∞ . 0
Daraus ergibt sich
s
|x(s)| = |T x(s)| ≤
|k(s, t)| t k ∞ x ∞ dt ≤ 0
s2 k 2∞ x ∞ . 2
Durch wiederholtes Einsetzen erh¨ alt man |x(s)| ≤
sn k n∞ x ∞ → 0 mit n → ∞; n!
folglich ist x = 0 und λ − T injektiv. Aus der Eindeutigkeit der L¨ osung der homogenen Gleichung folgt nach Satz VI.2.4 die Existenz der L¨ osung der inhomogenen Gleichung λx − T x = y f¨ ur alle y ∈ C[0, 1]. In Abschnitt VI.4 diskutieren wir eine tieferliegende Anwendung, n¨amlich wie man mittels der Fredholm-Alternative die L¨osbarkeit des Dirichletproblems beweist. Kommen wir nun zum Beweis von Lemma VI.2.2.
268
VI.
Spektraltheorie kompakter Operatoren
(a) G¨abe es so ein p nicht, w¨ are N0 N1 N2 . . . . Da alle Nn abgeschlossen sind, existiert nach dem Rieszschen Lemma I.2.6 zu n ∈ N ein xn ∈ Nn mit d(xn , Nn−1 ) > 12 und xn = 1. F¨ ur n > m ≥ 1 ist aber 1 T xn − T xm = xn − (Sxn + xm − Sxm ) > , 2 denn Sxn + xm − Sxm ∈ Nn−1 , weil S(Nn ) ⊂ Nn−1 ist. Also besitzt (T xn ) keine konvergente Teilfolge im Widerspruch zu T ∈ K(X). (b) Nur ⊂“ ist zu zeigen. Ist r > 0 und x ∈ Np+r , so ist S r−1 (x) ∈ ” Np+1 = Np , daher ist x ∈ Np+r−1 . Dieses Argument wende wiederholt an, um zuletzt x ∈ Np zu erhalten. (c) Ist x ∈ Np ∩Rp , so gelten S p x = 0 und x = S p y f¨ ur ein y ∈ X. Daher ist S 2p y = 0, also y ∈ N2p . Aber N2p = Np nach (b), also folgt S p y = 0 und x = 0. (d) Wie in (a) nimm R0 R1 R2 . . . an, und w¨ahle xn ∈ Rn mit d(xn , Rn+1 ) > 12 und xn = 1; dies ist nach dem Rieszschen Lemma m¨ oglich, weil die Rn abgeschlossen sind. F¨ ur m > n ≥ 1 ist aber T xn − T xm = xn − (Sxn + xm − Sxm ) >
1 , 2
denn Sxn + xm − Sxm ∈ Rn+1 , weil S(Rn ) = Rn+1 ist, und wie oben folgt ein Widerspruch zur Kompaktheit von T . (e) Nur ⊃“ ist zu zeigen, was sukzessive aus Rq+r+1 ⊃ Rq+r folgt. Sei ” also x ∈ Rq+r , d.h. x = S q+r y. Wegen S q y ∈ Rq = Rq+1 ergibt sich, wie behauptet, x = S r (S q y) ∈ Rq+r+1 . (f) Sei x ∈ X. Dann gilt nach (e) S q x ∈ Rq = R2q , d.h. S q x = S 2q y f¨ ur ein y ∈ X. Also kann x als x = (x − S q y) + S q y ∈ Nq + Rq zerlegt werden. (g) W¨are p > q, so w¨ are nach (e) Rp = Rq , und es g¨abe andererseits ein x ∈ Np \ Nq . Schreibe gem¨ aß (f) x = y + z ∈ Nq + Rq . Dann folgt z = x − y ∈ Np + Nq = Np , da p > q, und z ∈ Rq = Rp . (c) zeigt nun z = 0, und folglich liegt x doch in Nq . Es muß also p ≤ q gelten. W¨are p < q, so w¨ are nach (b) Np = Nq , und es g¨abe ein x ∈ Rp \ Rq . Wieder schreiben wir gem¨ aß (f) x = y + z ∈ Nq + Rq . Es folgt y = x − z ∈ Rp + Rq = Rp , da p < q, und y ∈ Nq = Np . (c) zeigt nun y = 0, und folglich liegt x doch in Rq . Damit ist der Beweis von Lemma VI.2.2 komplett. 2 Jetzt k¨onnen wir das Hauptergebnis der Spektraltheorie kompakter Operatoren auf Banachr¨ aumen beweisen.
VI.2
269
Die Theorie von Riesz
Theorem VI.2.5 Sei T ∈ K(X). (a) Ist X unendlichdimensional, so ist 0 ∈ σ(T ). (b) Die (eventuell leere) Menge σ(T )\{0} ist h¨ ochstens abz¨ ahlbar. (c) Jedes λ ∈ σ(T )\{0} ist ein Eigenwert von T , und der zugeh¨ orige Eigenraum ker(λ − T ) ist endlichdimensional. Ferner existiert eine topologisch direkte Zerlegung X = N (λ) ⊕ R(λ) mit T N (λ) ⊂ N (λ), T R(λ) ⊂ R(λ), wobei N (λ) endlichdimensional ist und ker(λ − T ) umfaßt sowie (λ − T )|R(λ) ein Isomorphismus von R(λ) auf R(λ) ist. (d) σ(T ) besitzt keinen von 0 verschiedenen H¨ aufungspunkt. Beweis. (a) Ist 0 ∈ ρ(T ), so ist T stetig invertierbar, und nach Satz II.3.2(b) ist Id = T T −1 kompakt. Aus Satz I.2.7 folgt dim X < ∞. (c) Das folgt wegen λ−T = λ(Id −T /λ) aus Satz VI.2.1, Korollar VI.2.3 und Satz VI.2.4; beachte noch (λ − T )(U ) ⊂ U ⇔ T (U ) ⊂ U f¨ ur einen Unterraum U . (b) & (d) Es reicht, die folgende Behauptung zu zeigen. • F¨ ur alle ε > 0 ist {λ ∈ σ(T ): |λ| ≥ ε} endlich. Nimm das Gegenteil an. Dann existieren ε > 0, eine Folge (λn ) in K und eine Folge (xn ) in X mit (nach (c)) |λn | ≥ ε,
xn = 0,
λn = λm f¨ ur n = m.
T xn = λn xn ,
Die Menge {xn : n ∈ N} ist dann linear unabh¨ angig. W¨are das n¨amlich nicht so, g¨abe es N ∈ N, linear unabh¨ angige x1 , . . . , xN und Skalare α1 , . . . , αN N mit xN +1 = i=1 αi xi , wo nicht alle αi verschwinden. Es folgt T xN +1 =
N
αi T xi =
i=1
N
λi αi xi
i=1
sowie andererseits T xN+1 = λN+1 xN+1 =
N
λN+1 αi xi .
i=1
Es folgt λi = λN +1 f¨ ur ein i im Widerspruch zur Wahl der λn . Setzt man En = lin{x1 , . . . , xn }, so folgt nun E1 E2 E3 . . . . Beachte, daß stets T (En ) ⊂ En gilt. Das Rieszsche Lemma I.2.6 gestattet n (n) es, yn = i=1 αi xi ∈ En mit yn = 1,
d(yn , En−1 ) >
1 2
270
VI.
Spektraltheorie kompakter Operatoren
zu finden. Dann folgt f¨ ur n > m T yn − T ym = λn yn − (T ym + λn yn − T yn ) . Hier ist T ym ∈ Em ⊂ En−1 sowie λn yn − T yn = En−1 ; daher existiert zn−1 ∈ En−1 mit
n
i=1 (λn
(n)
− λi )αi xi ∈
1 T yn − T ym = |λn | yn − zn−1 ≥ ε · , 2 was der Kompaktheit von T widerspricht. Damit ist der Beweis von Theorem VI.2.5 abgeschlossen.
2
Das Spektrum eines kompakten Operators T besteht also bis auf λ = 0 aus einer Nullfolge (oder endlichen Menge) von Eigenwerten λ, und der Operator λ − T kann laut Teil (c) in zwei einfachere Bestandteile zerlegt werden, n¨amlich in einen endlichdimensionalen Anteil (der durch eine Matrix beschrieben werden kann) und einen Isomorphismus. Leider kann es vorkommen, daß es u ¨ berhaupt keine Spektralwerte = 0 gibt, siehe etwa Beispiel VI.1(c) oder (d); in diesem Fall gibt Theorem VI.2.5 keinerlei Aufschluß u ¨ber den Operator. (Diese Beispiele zeigen auch, daß λ = 0 kein Eigenwert zu sein braucht.) Im n¨ achsten Abschnitt zeigen wir, daß kompakte selbstadjungierte Operatoren auf Hilbertr¨ aumen stets durch ihr Spektrum analysiert werden k¨ onnen.
VI.3
Kompakte Operatoren auf Hilbertr¨ aumen
Im Hilbertraumfall kann die Darstellung in Theorem VI.2.5 noch wesentlich verbessert werden. Die weitreichendsten Resultate lassen sich f¨ ur selbstadjungierte Operatoren erzielen. In diesem Abschnitt bezeichnet H einen Hilbertraum; beachte, daß T ∈ L(H) genau dann kompakt ist, wenn T ∗ kompakt ist. Das folgt aus dem Satz von Schauder III.4.4 und der Definition von T ∗ . Lemma VI.3.1 Sei T ∈ L(H). (a) λ ∈ σ(T ) genau dann, wenn λ ∈ σ(T ∗ ). (b) Ist T selbstadjungiert und kompakt, so ist σ(T ) ⊂ R.1 (c) Ist T normal und x Eigenvektor von T zum Eigenwert λ, so ist x auch Eigenvektor von T ∗ zum Eigenwert λ. (d) Ist T normal, so haben verschiedene Eigenwerte orthogonale Eigenvektoren. 1 Diese
Aussage gilt f¨ ur alle selbstadjungierten stetigen Operatoren, ist jedoch in dieser allgemeineren Situation etwas schwieriger zu beweisen; siehe Korollar VII.1.2.
VI.3
271
Kompakte Operatoren auf Hilbertr¨ aumen
(e) Ist K = C und T normal, so existiert λ ∈ σ(T ) mit |λ| = T . (f) Ist K = R oder C und T selbstadjungiert und kompakt, so ist T oder − T Eigenwert von T . Beweis. (a) ist bereits in Satz VI.1.2 gezeigt. (b) Sei λ ∈ σ(T )\{0}. Dann ist λ nach Theorem VI.2.5(c) ein Eigenwert von T . Es gilt also f¨ ur ein x = 0 λx, x = T x, x = x, T x = T x, x = λx, x. Daher ist λ reell. (c) Aus der Normalit¨ at von T folgt die von λ−T und deshalb ker(λ− T ) = ker(λ − T )∗ = ker(λ − T ∗ ) (Lemma V.5.10). (d) Gelte T x = λx und T y = μy mit λ = μ. Dann folgt wegen (c) λx, y = λx, y = T x, y = x, T ∗ y = x, μy = μx, y, also x, y = 0. (e) ist eine unmittelbare Konsequenz von Satz VI.1.7 und Satz VI.1.6(b). (f) Nach Satz V.5.7 existiert eine Folge (xn ) in BH mit |T xn , xn | → ¨ T . Nach evtl. Ubergang zu einer Teilfolge darf die Existenz der Limiten λ := lim T xn , xn , n→∞
y := lim T xn n→∞
angenommen werden, weil T kompakt ist. Nun gilt T xn − λxn 2 = T xn − λxn , T xn − λxn = T xn 2 − 2λT xn , xn + λ2 xn 2 ≤ 2λ2 − 2λT xn , xn → 0. Daher ist y = limn→∞ λxn und T y = λ limn T xn = λy. Wegen |λ| = T ist damit die Behauptung gezeigt, wenn y = 0 ist. W¨are aber y = 0, so w¨are (T xn ) eine Nullfolge, und es folgte T = limT xn , xn = 0. In diesem Fall ist die Behauptung von (f) trivial. 2 Theorem VI.3.2 (Spektralsatz f¨ ur kompakte normale Operatoren) Sei T ∈ K(H) normal (falls K = C) bzw. selbstadjungiert (falls K = R). Dann existieren ein (evtl. endliches) Orthonormalsystem e1 , e2 , . . . sowie eine (evtl. abbrechende) Nullfolge (λ1 , λ2 , . . .) in K \ {0}, so daß H = ker T ⊕2 lin{e1 , e2 , . . .} sowie Tx =
λk x, ek ek
∀x ∈ H;
k
und zwar sind die λk die von 0 verschiedenen Eigenwerte, und ek ist ein Eigenvektor zu λk . Ferner gilt T = supk |λk |.
272
VI.
Spektraltheorie kompakter Operatoren
Erg¨anzt man das Orthonormalsystem {e1 , e2 , . . .} zu einer Orthonormalbasis B von H, so muß man eine Orthonormalbasis von ker T , also Eigenvektoren zum Eigenwert 0 hinzunehmen. ker T kann im Gegensatz zu den Eigenr¨aumen ker(λ − T ) f¨ ur λ = 0 unendlichdimensional, ja sogar nichtseparabel sein. Entwickelt man in eine solche Orthonormalbasis, so nimmt der Operator T eine Diagonalgestalt“ an; es gilt n¨amlich ” x= x, ee ⇒ T x = λe x, ee. e∈B
e∈B
Daher ist der Spektralsatz das Analogon zur Hauptachsentransformation der linearen Algebra. Beweis. Es sei μ1 , μ2 , . . . die Folge der paarweise verschiedenen Eigenwerte von T , die nicht verschwinden; vgl. Theorem VI.2.5. Die zugeh¨origen Eigenr¨aume ker(μi − T ) sind dann endlichdimensional, ihre Dimension, die sog. geometrische Vielfachheit von μi , sei mit di bezeichnet. Die Folge der λk entsteht durch Wiederholung der μi : (λk ) = (μ1 , . . . , μ1 , μ2 , . . . , μ2 , μ3 , . . . , μ3 , . . .), und zwar tauche jedes μi genau di -mal auf. Wegen μi → 0 (Theorem VI.2.5) gilt dann auch λk → 0. Ferner w¨ ahle in jedem Eigenraum ker(μi − T ) eine Orthonormalbasis {ei1 , . . . , eidi } und definiere die ek durch (ek ) = (e11 , . . . , e1d1 , e21 , . . . , e2d2 , e31 , . . . , e3d3 , . . .). Nach Lemma VI.3.1(d) bilden die ek ein Orthonormalsystem, und es gilt T ek = λk ek
∀k ∈ N.
Ferner ist nach dem gleichen Argument ker T ⊥ ek f¨ ur alle k, daher H1 := ker T ⊕2 lin{e1 , e2 , . . .} ein abgeschlossener Unterraum von H. Es ist nun H = H1 zu zeigen. Betrachte dazu H2 = H1⊥ . Es gilt T (H2 ) ⊂ H2 , da f¨ ur y ⊥ ek T y, ek = y, T ∗ ek = y, λk ek = λk y, ek = 0 folgt und ¨ahnlich T y ⊥ ker T , falls y ⊥ ker T , gezeigt werden kann. Wir k¨onnen daher T2 = T |H2 als kompakten Operator von H2 in sich auffassen. W¨are T2 = 0, so existierten nach Lemma VI.3.1(e) und (f) sowie nach Theorem VI.2.5(c) λ = 0 und x ∈ H2 , x = 0, mit T2 x = λx. Es w¨are dann λ ∈ σ(T ) und x ∈ lin{e1 , e2 , . . .} ⊂ H2⊥ , folglich x ∈ H2 ∩ H2⊥ = {0}: Widerspruch! Also ist T2 = 0, daher H2 ⊂ ker T ⊂ H2⊥ und ergo H2 = {0}. Das zeigt die behauptete Darstellung von H.
VI.3
273
Kompakte Operatoren auf Hilbertr¨ aumen
Jedes x ∈ H kann deshalb in der Form x=y+ x, ek ek k
mit y ∈ ker T geschrieben werden; vgl. Satz V.4.9. Die Stetigkeit von T ergibt nun Tx = Ty + x, ek T ek = λk x, ek ek . k
k
Schließlich ist nach Konstruktion T = max |μk | = max |λk |; vgl. Lemma VI.3.1(e) und (f). Damit ist der Spektralsatz bewiesen.
2
Wir werden noch eine Umformung des Spektralsatzes angeben und dabei die Bezeichnungen des obigen Beweises benutzen. Sei Ek die Orthogonalprojektion auf den zu μk geh¨ orenden Eigenraum ker(μk − T ); es ist also dk Ek x = x, eki eki . i=1
Der Spektralsatz zeigt dann Tx =
∞
μk Ek x
∀x ∈ H.
k=1
Diese Reihe konvergiert aber nicht nur punktweise, sondern auch in der Operatornorm. Korollar VI.3.3 (Spektralsatz; Projektionsversion) Unter den Voraussetzungen von Theorem VI.3.2 und mit den obigen Bezeichnungen konvergiert ∞ T = μk Ek k=1
in der Operatornorm. Beweis. Sei Sn =
n k=1
μk Ek ; diese Operatoren bilden wegen
n Sn − Sm = μk Ek max |μk | → 0 = k=m+1,...,n k=m+1
f¨ ur n > m → ∞
274
VI.
Spektraltheorie kompakter Operatoren
eine Cauchyfolge. (Hier wurde benutzt, daß die Norm eines normalen kompakten Operators gleich dem betragsgr¨ oßten Eigenwert ist.) Ihr Grenzwert muß T sein, da die Reihe ja punktweise gegen T konvergiert. 2 Korollar VI.3.3 kann so interpretiert werden, daß ein kompakter normaler bzw. selbstadjungierter Operator aus den einfachsten Operatoren dieses Typs, n¨amlich (Satz V.5.9) den endlichdimensionalen Orthogonalprojektionen, zusammengesetzt werden kann. Als n¨achstes soll der Spektralsatz benutzt werden, um Quadratwurzeln aus Operatoren zu ziehen. Wir nennen einen Operator T ∈ L(H) positiv (in Zeichen T ≥ 0), wenn T x, x ≥ 0
∀x ∈ H
(VI.7)
gilt. Im Fall komplexer Skalare folgt daraus automatisch die Selbstadjungiertheit (Satz V.5.6). Satz VI.3.4 Sei T ∈ K(H) selbstadjungiert und positiv. Dann existiert genau ein positiver selbstadjungierter Operator S ∈ K(H) mit S 2 = T . Man schreibt S = T 1/2 . Beweis. Um die Existenz zu beweisen, schreibe T x = k λk x, ek ek gem¨aß Theorem VI.3.2. Da T positiv ist, sind alle λk ≥ 0. Setze & Sx = λk x, ek ek . k
Direktes Nachrechnen zeigt, daß S selbstadjungiert und positiv ist. Die Kompaktheit folgt aus N & & λk . , ek ek ≤ sup λk → 0 S − k>N k=1
und Korollar II.3.3. Zur Eindeutigkeit: Gelte R ≥ 0, R2 = T und R = R∗ ∈ K(H). Schreibt ∞ 2 man R = k=1 νk Fk wie in Korollar VI.3.3, so folgt T = ∞ k=1 νk Fk und 2 νk ≥ 0, da R ≥ 0. Ferner schließt man, daß die Folge (νk ) die Folge der Eigenwerte von T und Fk die Orthogonalprojektion auf den entsprechenden Eigenraum ist (siehe Aufgabe VI.7.9). Es muß daher S = R sein, da die entsprechenden Reihen punktweise unbedingt konvergieren. 2 Man kann außerdem zeigen, daß die Gleichung S 2 = T auch in L(H) nur eine positive selbstadjungierte L¨ osung besitzt (Korollar VII.1.16). Das folgt nicht automatisch aus Satz VI.3.4, da das Quadrat eines nichtkompakten Operators durchaus kompakt sein kann.
VI.3
Kompakte Operatoren auf Hilbertr¨ aumen
275
Ist nun T : H1 → H2 ein beliebiger kompakter Operator zwischen zwei Hilbertr¨aumen, so ist T ∗ T : H1 → H1 positiv, selbstadjungiert und kompakt. Die eindeutig bestimmte positive Wurzel wird mit |T | = (T ∗ T )1/2 bezeichnet. Satz VI.3.5 (Polarzerlegung) Zu T ∈ K(H1 , H2 ) existiert ein Operator U ∈ L(H1 , H2 ) mit T = U |T |, so daß U |(ker U)⊥ isometrisch ist und daher ein unit¨ arer Operator zwischen ⊥ (ker U ) und ran U ist. U ist durch die Forderung ker U = ker T eindeutig bestimmt. Beweis. Da |T | selbstadjungiert ist, gilt zun¨ achst |T |x2 = x, |T |2 x = x, T ∗ T x = T x 2 . (VI.8) Daher definiert U |T |x = T x einen isometrischen Operator von ran |T | nach ran T , der zu einer ebenfalls mit U bezeichneten Isometrie U : ran |T | → ran T fortgesetzt werden kann. Setze noch U = 0 auf (ran |T |)⊥ = ker |T | (Satz V.5.2(g)). Das zeigt die Existenz von U . Die Eindeutigkeit folgt aus ker |T | = ker T , siehe (VI.8). 2 Ein Operator U mit den Eigenschaften aus Satz VI.3.5 wird partielle Isometrie genannt. Obwohl die Gleichung T = U |T | an die Polarzerlegung λ = eit |λ| komplexer Zahlen erinnert, gibt es entscheidende Unterschiede; so ist z.B. |S + T | ≤ |S| + |T | im allgemeinen falsch. Zum Abschluß dieses Abschnitts geben wir die allgemeine Form eines kompakten, nicht notwendig normalen Operators an. Satz VI.3.6 Zu T ∈ K(H1 , H2 ) existieren Orthonormalsysteme {e1 , e2 , . . .} von H1 und {f1 , f2 , . . .} von H2 sowie Zahlen s1 ≥ s2 ≥ . . . ≥ 0 mit sk → 0, so daß ∞ Tx = sk x, ek fk ∀x ∈ H1 . k=1
Die Zahlen sind die in ihrer Vielfachheit gez¨ ahlten Eigenwerte von T ∗ T , die sk selbst heißen die singul¨ aren Zahlen von T . s2k
Beweis. Schreibe T = U |T | wie in Satz VI.3.5 und zerlege |T | wie in Theorem VI.3.2: |T |x = sk x, ek ek ; k
276
VI.
Spektraltheorie kompakter Operatoren
dann haben die sk die behaupteten Eigenschaften. Setze fk = U (ek ). Da U nach (VI.8) auf ran |T | isometrisch und folglich (Lemma V.5.4) skalarprodukterhaltend ist, bilden die fk ein Orthonormalsystem. 2 Entwickelt man |T | = T = μk U Ek und daher:
μk Ek wie in Korollar VI.3.3, so erh¨alt man
Korollar VI.3.7 Die Operatoren mit endlichdimensionalem Bild liegen dicht in K(H1 , H2 ). Vergleiche hierzu noch einmal Satz II.3.5 und Korollar II.3.6.
VI.4
Anwendungen auf Integralgleichungen
Eine Gleichung der Form 1 λx(s) − k(s, t)x(t) dt = y(s),
s ∈ [0, 1]
0
mit λ = 0 heißt Fredholmsche Integralgleichung zweiter Art. (Gleichungen erster Art entstehen, wenn λ = 0 ist.) Ist der Kern k quadratisch integrierbar, lassen sich solche Gleichungen mit Hilfe des Spektralsatzes studieren. Im folgenden betrachten wir eine Fredholmsche Integralgleichung zweiter Art mit quadratisch integrierbarem symmetrischen Kern. Es sei also H = L2 [0, 1] und 1 T x(s) = k(s, t)x(t) dt 0
f¨ ur fast alle s; dabei gelte k ∈ L2 [0, 1]2 und k(s, t) = k(t, s) fast u ¨berall. Dann ist der Operator T kompakt (Beispiel II.3(c)) und selbstadjungiert (Beispiel V.5(b)). Gesucht ist die (!) L¨ osung von λx − T x = y mit λ ∈ ρ(T ), y ∈ L2 [0, 1]. W¨ahle dazu λk und ek wie in Theorem VI.3.2 sowie eine Orthonormalbasis S von ker T . Dann gilt λx − T x = y genau dann, wenn λ x, ek ek + λ x, ee − λk x, ek ek = y, ek ek + y, ee k
e∈S
k
k
gilt, was wiederum zu 1 y, e ∀e ∈ S λ 1 x, ek = y, ek ∀k ∈ N λ − λk x, e =
e∈S
VI.4
277
Anwendungen auf Integralgleichungen
osung in der Form ¨aquivalent ist, und man kann die L¨ 1 1 x= y, ek ek + y, ee λ − λk λ k
e∈S
angeben. Mit Hilfe des Orthonormalsystems {e1 , e2 , . . .} l¨aßt sich jedoch auch der Kern entwickeln, was interessante Konsequenzen hat. Es ist n¨amlich (T ek )(s) = λk ek (s) fast u ¨berall sowie
(T ek )(s) =
1
k(s, t)ek (t) dt = 0
1
ek (t)k(t, s) dt 0
= ek , k( . , s)
fast u ¨berall.
F¨ ur fast alle s gilt daher k( . , s) = k( . , s), en en + k( . , s), ee = λn en (s)en ; n
n
e∈S
beachte dazu λn ∈ R (Lemma VI.3.1(b)) und k( . , s), e = 0 f¨ ur e ∈ S (Beweis wie oben). Nach der Parsevalschen Gleichung (Satz V.4.9(b)) folgt f¨ ur fast alle s 1 |k(t, s)|2 dt = λ2n |en (s)|2 , 0
n
und der Satz von Beppo Levi (Satz A.3.1) zeigt 1 1 1 |k(t, s)|2 dt ds = λ2n |en (s)|2 ds 0
0
0
=
n
n
1
|en (s)|2 ds =
λ2n 0
λ2n .
n
Daraus ergibt sich die Orthogonalentwicklung k= λn en ⊗ en
(VI.9)
n
(wo (g ⊗ h)(t, s) = g(t)h(s)), die in L2 [0, 1]2 konvergiert, nebst 1/2 k L2 = λ2n = (λn ) 2 < ∞.
(VI.10)
n
Sind der Kern und die rechte Seite der Integralgleichung stetige Funktionen, ist man nat¨ urlich an der Existenz von stetigen L¨osungen interessiert. Hierzu ist es n¨ utzlich, eine Version des Spektralsatzes in Pr¨ahilbertr¨aumen zur Verf¨ ugung zu haben.
278
VI.
Spektraltheorie kompakter Operatoren
Satz VI.4.1 Es sei H0 ein Pr¨ ahilbertraum, und T0 ∈ K(H0 ) erf¨ ulle die Symmetriebedingung T0 x, y = x, T0 y f¨ ur alle x, y ∈ H0 . Dann existieren ein Orthonormalsystem {en : n ∈ N} in H0 und eine Nullfolge (λn ) mit T0 x =
∞
λn x, en en
∀x ∈ H0 .
n=1
Beweis. Es sei H die Vervollst¨ andigung von H0 , die ja (Satz V.1.8) ein Hilbertraum ist, und es sei T die eindeutig bestimmte Fortsetzung von T0 zu einem Operator von H nach H (Satz II.1.5). Wir werden sehen, daß T ebenfalls kompakt ist und ran T ⊂ H0 gilt. Um zu zeigen, daß T kompakt ist, sei mit (xn ) eine beschr¨ankte Folge in H gegeben. W¨ ahle yn ∈ H0 mit xn − yn ≤ n1 und anschließend eine Teilfolge, so daß limk T ynk = limk T0 ynk =: z existiert. Aus der Stetigkeit von T folgt dann auch limk T xnk = z, und T ist kompakt. Ein ¨ahnliches Argument zeigt ran T ⊂ H0 : Zu x ∈ H w¨ ahle eine Folge (yn ) in H0 mit limn yn = x, f¨ ur die o.B.d.A. (T0 yn ) konvergiert, etwa gegen z ∈ H0 (sic!). Wieder liefert die Stetigkeit T x = z ∈ H0 . Nun ist T selbstadjungiert, und f¨ ur x ∈ H0 gilt nach Theorem VI.3.2 T0 x = T x =
∞
λn x, en en ,
n=1
und der Eigenvektor en liegt wegen λn = 0 und T en = λn en in ran T0 ⊂ H0 . 2 Wir wollen Satz VI.4.1 auf einen Integraloperator mit stetigem symmetrischen Kern k anwenden. Setze H0 = C[0, 1] mit dem Skalarprodukt 1 x, y = 0 x(t)y(t) dt. Dann ist der zu k assoziierte Integraloperator Tk : H0 → (C[0, 1], . ∞ ) wohldefiniert und kompakt (verwende den Satz von Arzel`a-Ascoli und in Absch¨ atzung (II.2) auf S. 51 die Cauchy-SchwarzUngleichung). Damit ist Tk auch als Operator von H0 nach H0 kompakt, denn die Identit¨at (C[0, 1], . ∞ ) → H0 ist stetig. Die in Satz VI.4.1 beschriebenen Eigenfunktionen sind daher stetig. Auch f¨ ur die Orthogonalentwicklung (VI.9) l¨ a ßt sich mehr sagen; sind n¨ a mlich alle λn > 0, so kon vergiert n λn en ⊗ en nicht nur im quadratischen Mittel, sondern sogar absolut und gleichm¨ aßig. Diese Versch¨ arfung von (VI.9) ist der Inhalt des Satzes von Mercer, den wir als n¨ achstes beweisen werden. Es sei an die Definition eines positiven Hilbertraumoperators in (VI.7) erinnert. Satz VI.4.2 (Satz von Mercer) Sei k ∈ C([0, 1]2 ) und Tk : L2 [0, 1] → L2 [0, 1] der zugeh¨ orige Integraloperator. Es gelte k(s, t) = k(t, s) f¨ ur alle s, t ∈ [0, 1], so daß Tk selbstadjungiert
VI.4
279
Anwendungen auf Integralgleichungen
ist. Es seien λ1 , λ2 , . . . die gem¨ aß ihrer geometrischen Vielfachheit gez¨ ahlten Eigenwerte von Tk mit zugeh¨ origen Eigenfunktionen e1 , e2 , . . . . Falls Tk positiv ist, gilt k(s, t) =
∞
λj ej (s)ej (t)
∀s, t ∈ [0, 1],
j=1
wobei die Konvergenz absolut und gleichm¨aßig ist. Der Beweis bedarf einiger Vorbereitungen. Zun¨achst ist zu beachten, daß wegen der Stetigkeit von k auch die ej stetig sind, wie soeben beobachtet wurde. Ferner ben¨ otigen wir folgende Verbesserung des Spektralsatzes. Satz VI.4.3 Es m¨ ogen die Voraussetzungen des Satzes von Mercer gelten, jedoch braucht diesmal Tk nicht positiv zu sein. Ferner sei x ∈ C[0, 1]. Dann gilt ∞ (Tk x)(s) = λj x, ej ej (s) ∀s ∈ [0, 1], j=1
wobei die Konvergenz absolut und gleichm¨aßig ist. Beweis. Wir fassen hier Tk als kompakten Operator auf dem Pr¨ahilbertraum C[0, 1] auf, vgl. die obige Diskussion. Da die behauptete Gleichheit stets im Sinn der L2 -Konvergenz ∞gilt (Theorem VI.3.2), ist nur die gleichm¨aßige Konvergenz der Reihe j=1 |λj x, ej ej (s)| f¨ ur alle s zu zeigen. Zun¨achst gilt f¨ ur alle s ∞
|λj ej (s)|2 =
j=1
∞
|(Tk ej )(s)|2
j=1
=
∞
|k(s, . ), ej |2
j=1
≤ k(s, . ) 2L2 (Besselsche Ungleichung) 1 = |k(s, t)|2 dt 0
≤ k 2∞ . W¨ahlt man zu ε > 0 ein N ∈ N, so daß ∞ j=N
|x, ej |2 ≤ ε2
280
VI.
Spektraltheorie kompakter Operatoren
ist, folgt aus der Cauchy-Schwarz-Ungleichung f¨ ur alle s ∞ j=N
|λj x, ej ej (s)| ≤
∞
|λj ej (s)|
2
1/2 ∞
j=N
1/2 |x, ej |
2
j=N
≤ k ∞ ε, was die behauptete gleichm¨ aßige Konvergenz zeigt.
2
Lemma VI.4.4 F¨ ur einen selbstadjungierten Operator T ∈ K(H) sind aquivalent: ¨ (i) Alle Eigenwerte von T sind ≥ 0. (ii) T ist positiv. Beweis. (i) ⇒ (ii) folgt aus dem Spektralsatz, und (ii) ⇒ (i) ist klar, denn T x, x = λ x 2 f¨ ur einen Eigenvektor. 2 Lemma VI.4.5 Unter den Voraussetzungen des Satzes von Mercer gilt k(t, t) ≥ 0
∀t ∈ [0, 1].
Beweis. Sei 0 < t0 < 1. Setze xn (s) = n2 χ[t0 −1/n,t0 +1/n] . Bezeichnet ferner Qn das Quadrat mit dem Mittelpunkt (t0 , t0 ) und der Seitenl¨ange n2 (beachte, daß Qn ⊂ [0, 1]2 f¨ ur große n) und F (Qn ) dessen Fl¨acheninhalt, so gilt 0 ≤ Tk xn , xn t0 +1/n t0 +1/n dt ds = k(s, t) 2/n 2/n t0 −1/n t0 −1/n 1 = k(s, t) ds dt, F (Qn ) Qn und der letzte Term ist nach dem Mittelwertsatz der Integralrechnung = k(sn , tn ) f¨ ur geeignete (sn , tn ) ∈ Qn . Mit n → ∞ gilt sn → t0 , tn → t0 und daher k(t0 , t0 ) ≥ 0, da k stetig ist. Daraus folgt die Behauptung. 2 Jetzt fehlt noch ein wichtiges Ingrediens zum Beweis des Satzes von Mercer, der Satz von Dini. Beachte, daß die Stetigkeit der Grenzfunktion eine Voraussetzung im folgenden Satz ist. Satz VI.4.6 (Satz von Dini) Sei T ein kompakter metrischer (oder topologischer) Raum, f, f1 , f2 , . . . : T → R seien stetig. Es gelte f1 ≤ f2 ≤ . . . und f = sup fn punktweise. Dann konvergiert (fn ) gleichm¨ aßig gegen f .
VI.4
281
Anwendungen auf Integralgleichungen
Beweis. Zu t ∈ T und ε > 0 w¨ ahle Nt mit f (t) − ε < fNt (t). Da f und fNt stetig sind, gilt auch in einer Umgebung Ut von t f (s) − ε < fNt (s)
∀s ∈ Ut .
¨ Uberdecke T durch endlich viele solcher Umgebungen, und sei N das gr¨oßte der dabei vorkommenden Nt ; das ist m¨ oglich, da T kompakt ist. Dann gilt f¨ ur alle n ≥ N und alle t ∈ T f (t) − ε < fN (t) ≤ fn (t) ≤ f (t), 2
was zu zeigen war. Nun k¨onnen wir Satz VI.4.2 beweisen. Sei kn der stetige Kern n
kn (s, t) =
λj ej (s)ej (t).
j=1
Dann gilt nach dem Spektralsatz Tk−kn x, x = Tk x, x − Tkn x, x = λj x, ej ej , x j>n
=
λj |x, ej |2
j>n
≥ 0, da alle λj ≥ 0 sind. Lemma VI.4.5 liefert daher k(t, t) − kn (t, t) ≥ 0 d.h.
n
∀t ∈ [0, 1],
λj |ej (t)|2 ≤ k(t, t) ≤ k ∞
∀n ∈ N.
(VI.11)
j=1
∞ Es folgt, daß die Reihe j=1 λj |ej (t)|2 f¨ ur jedes t konvergiert. Die Cauchy-Schwarz-Ungleichung liefert ∞
|λj ej (s)ej (t)| =
j=1
∞ & & λj ej (s) λj ej (t) j=1
≤
∞
λj |ej (s)|2
j=1
≤ k ∞ ;
1/2 ∞ j=1
1/2 λj |ej (t)|2
282
VI.
Spektraltheorie kompakter Operatoren
f¨ ur den letzten Schritt verwende (VI.11). Deshalb konvergiert die Reihe ∞
λj ej (s)ej (t)
j=1
¨ f¨ ur alle s, t ∈ [0, 1] absolut. Die folgende Uberlegung zeigt, daß bei festem s gleichm¨aßige Konvergenz in t vorliegt. W¨ahle N = N (s) ∈ N, so daß ∞ 2 2 ur alle t wegen (VI.11) j=N λj |ej (s)| ≤ ε ist; dann gilt f¨ ∞
|λj ej (s)ej (t)| ≤
j=N
∞
λj |ej (s)|2
1/2 ∞
j=N
1/2 λj |ej (t)|2
≤ ε k 1/2 ∞ .
j=N
(VI.12) Betrachte nun den Kern ˜ t) = k(s,
∞
λj ej (s)ej (t).
j=1
˜ ∈ L2 ([0, 1]2 ), da die ej ⊗ ej ein Orthonormalsystem in L2 ([0, 1]2 ) Dann ist k bilden und da (λj ) ∈ 2 , vgl. (VI.10). Wir werden als n¨achstes k = k˜ zeigen. Sei dazu s ∈ [0, 1] fest. Betrachte ˜ t). h(t) = k(s, t) − k(s, Wegen der in (VI.12) bewiesenen gleichm¨ aßigen Konvergenz in t ist h stetig. F¨ ur jedes x ∈ C[0, 1] gilt nun 1 1 1 ˜ t)x(t) dt h(t)x(t) dt = k(s, t)x(t) dt − k(s, 0
0
= (Tk x)(s) −
∞
0
=
x(t)ej (t) dt 0
j=1 ∞
1
λj ej (s)
(gleichm¨aßige Konvergenz) ∞ λj x, ej ej (s) − λj ej (s)x, ej
j=1
j=1
(Satz VI.4.3) = 0. Speziell ist
1 0
h(t)h(t) dt = 0, also h = 0. Daher ist f¨ ur jedes s ˜ t) k(s, t) = k(s,
insbesondere ˜ s) = k(s, s) = k(s,
∀t ∈ [0, 1], ∞ j=1
λj |ej (s)|2 .
(VI.13)
VI.4
283
Anwendungen auf Integralgleichungen
Wegen des Satzes von Dini ist die Konvergenz dieser Reihe gleichm¨aßig, und es folgt, daß in (VI.12) angig von s gew¨ahlt werden kann. ∞ N unabh¨ (VI.12) zeigt dann, daß λ e (s)e aßig in s j j j (t) absolut und gleichm¨ j=1 und t konvergiert, und zwar wegen (VI.13) gegen k(s, t). Damit ist der Satz von Mercer komplett bewiesen. 2 Es ist nicht ganz einfach, einer gegebenen (symmetrischen) Kernfunktion k anzusehen, ob sie den Voraussetzungen des Satzes von Mercer gen¨ ugt; vgl. jedoch Aufgabe VI.7.16. Insbesondere ist die Positivit¨at von k nicht hinreichend f¨ ur die Positivit¨ at von Tk . Das zeigt das Gegenbeispiel k(s, t) = |s − t|. W¨are der Operator Tk positiv, so w¨ are wegen der nach dem Satz von Mercer dann vorliegenden gleichm¨ aßigen Konvergenz 1 1 ∞ ∞ |k(s, s)| ds = λj ej (s)ej (s) ds = λj ; 0
0
j=1
j=1
∞ es ist jedoch k(s, s) = 0 f¨ ur alle s, und deshalb w¨are j=1 λj = 0. Die Annahme Tk ≥ 0 impliziert aber λj ≥ 0 f¨ ur alle j (Lemma VI.4.4), so daß dann alle Eigenwerte verschwinden. Da Tk selbstadjungiert ist, folgt nach dem Spektralsatz der Widerspruch Tk = 0. Hingegen ist Satz VI.4.2 auf den Kern k(s, t) = min{s, t} anwendbar. Dazu zeigen wir Tk x, x ≥ 0 f¨ ur alle x ∈ L2 ([0, 1]): 1 1 Tk x, x = dt ds min{s, t}x(s)x(t) 0
1
=
0
0
=
0
0
ds
1
=
0
t 0
0
1
0
=
0
≥ 0.
1
t
t
0 1
t
du x(s)x(t)
du 0
ds x(s)x(t) t
ds x(s)x(t)
1
1
ds x(s) u
ds
dt 0
u
du
0 1
ds x(s)x(t) +
du 0
=
t
1
dt
u 1
t
dt
1
du x(s)x(t) +
du
1
=
0
dt 0
du x(s)x(t) 0 s
t
dt
min{s,t}
ds
1
1
dt
dt x(t) u 2
1 du ds x(s) u
¨ Die vorstehenden Uberlegungen bleiben g¨ ultig, wenn man statt des Einheitsintervalls einen mit einem endlichen Borelmaß versehenen kompakten metrischen Raum betrachtet.
284
VI.
Spektraltheorie kompakter Operatoren
Zum Abschluß dieses Abschnitts diskutieren wir, wie man die FredholmAlternative zur L¨ osung des Dirichletproblems heranziehen kann. Dies geschieht, indem man es auf eine Integralgleichung mit nicht symmetrischer Kernfunktion zur¨ uckf¨ uhrt. Sei Ω ⊂ Rd ein beschr¨ anktes Gebiet, und sei ϕ ∈ C(∂Ω). (Ein Gebiet ist eine offene und zusammenh¨ angende Teilmenge.) Das Dirichletproblem besteht darin, eine Funktion u ∈ C(Ω) zu finden, die in Ω zweimal stetig differenzierbar ist und Δu = 0 in Ω (VI.14) u|∂Ω = ϕ erf¨ ullt. (Δ ist nat¨ urlich der Laplaceoperator.) Wir betrachten im folgenden der Einfachheit halber d = 3, und wir setzen voraus, daß Ω einen C 2 -Rand hat und der Außenraum Ωa := R3 \ Ω ebenfalls zusammenh¨angend ist. Es sei γ(x) = 1/(4π|x|) das Newtonpotential, und es bezeichne ny den ¨außeren Normalenvektor an Ω im Punkt y ∈ ∂Ω. Setze k(x, y) =
∂ x − y, ny γ(x − y) = −(grad γ)(x − y), ny = ∂ny 4π|x − y|3
f¨ ur x ∈ / ∂Ω, y ∈ ∂Ω. Wendet man den Laplaceoperator auf die Funktion k( . , y) bei festem y an, stellt man Δx k(x, y) = 0
∀x ∈ Ω ∪ Ωa , y ∈ ∂Ω
fest. Zur L¨osung von (VI.14) sollen nun die Funktionen k( . , y) u ¨ berlagert“ ” werden. F¨ ur eine Funktion g ∈ C(∂Ω) definieren wir das Doppelschichtpotential (diese Bezeichnung ist physikalisch motiviert) ug (x) = g(y)k(x, y) dσ(y) ∀x ∈ Ω ∪ Ωa . (VI.15) ∂Ω
(Hier ist σ das Oberfl¨ achenmaß.) Diese Funktion erf¨ ullt stets Δug (x) = 0 außerhalb von ∂Ω, und es bleibt, g so zu w¨ ahlen, daß die Randbedingung lim ug (x) = ϕ(z)
x→z x∈Ω
∀z ∈ ∂Ω
(VI.16)
erf¨ ullt ist. Wir werden zeigen, daß das unter den eingangs gemachten Voraussetzungen stets m¨oglich ist. Dazu ben¨ otigen wir einige Eigenschaften von Doppelschichtpotentialen, die ohne Beweis angegeben werden sollen (Beweise findet man in vielen Lehrb¨ uchern der Potentialtheorie, etwa Sobolev [1964], S. 202ff.). Da Ω einen C 2 -Rand hat, ist x − y, ny von der Gr¨oßenordnung const.|x−y|2 f¨ ur x → y, also |k(x, y)| von der Gr¨oßenordnung const.|x−y|−1
VI.4
285
Anwendungen auf Integralgleichungen
f¨ ur x → y. Insbesondere ist der Kern k nicht stetig, aber man u uft, daß ¨berpr¨ trotzdem (VI.15) selbst f¨ ur x ∈ ∂Ω noch sinnvoll ist. Tats¨achlich definiert (T g)(x) =
g(y)k(x, y) dσ(y),
x ∈ ∂Ω
∂Ω
einen stetigen Operator T : C(∂Ω) → C(∂Ω), und mehr noch, da der Kern im Sinn von S. 90 schwach singul¨ ar ist (der Grad der Singularit¨at (= 1) ist kleiner als die Dimension der Mannigfaltigkeit, u ¨ber die integriert wird (= 2)), ist T kompakt; der Beweis ist analog zu Beispiel II.1(n) und II.3(e) zu f¨ uhren. Es ist aus der Potentialtheorie bekannt, daß ein Doppelschichtpotential beim Durchgang durch ∂Ω einen Sprung macht, genauer gilt 1 lim ug (x) + g(z) = (T g)(z) 2
∀z ∈ ∂Ω,
(VI.17)
1 lim ug (x) − g(z) = (T g)(z) 2
∀z ∈ ∂Ω.
(VI.18)
x→z x∈Ω x→z x∈Ωa
Daher ist (VI.16) ¨ aquivalent zur Fredholmschen Integralgleichung zweiter Art 1 T g − g = ϕ. (VI.19) 2 Nach der Fredholm-Alternative existiert entweder f¨ ur alle ϕ ∈ C(∂Ω) eine eindeutig bestimmte L¨ osung dieser Gleichung und deshalb eine L¨osung des Dirichletproblems, oder 12 ist ein Eigenwert von T . Nehmen wir also an, es sei g0 ∈ C(∂Ω) mit 1 T g0 − g0 = 0. 2 Unser Ziel ist es, g0 = 0 zu zeigen. Zun¨ achst folgt aus der obigen Diskussion, daß ug0 , definiert durch (VI.15) mit g0 statt g, das Dirichletproblem mit Randdatum 0 statt ϕ l¨ ost. Das impliziert aber bekanntermaßen ug0 = 0 auf Ω. Weiter lehrt die Potentialtheorie, daß die Normalableitung eines ∂ Doppelschichtpotentials stetig ist; daher folgt ∂n ug0 (y) = 0 f¨ ur alle y ∈ ∂Ω. Nun benutzen wir die Greensche Formel ∂ − grad ug0 , grad ug0 dx = ug 0 ug0 dσ = 0 ∂n Ωa ∂Ω und schließen, da Ωa zusammenh¨ angend ist, daß ug0 auf Ωa konstant ist. Wegen ug0 (x) → 0 f¨ ur |x| → ∞ ergibt sich auch ug0 = 0 auf Ωa . Schließlich liefern (VI.17) und (VI.18) g0 = 0, wie behauptet. Zusammenfassend haben wir folgendes Resultat bewiesen.
286
VI.
Spektraltheorie kompakter Operatoren
Satz VI.4.7 Sei Ω ⊂ R3 ein beschr¨anktes Gebiet mit C 2 -Rand, f¨ ur das Ωa := R3 \ Ω zusammenh¨ angend ist. F¨ ur jedes ϕ ∈ C(∂Ω) existiert dann genau eine L¨ osung des Dirichletproblems Δu = 0 u|∂Ω = ϕ.
in Ω
Der Satz gilt auch, wenn Ωa nicht zusammenh¨angend ist (siehe J¨orgens [1970], S. 136). Hingegen sind nicht glatt berandete beschr¨ankte Gebiete bekannt, f¨ ur die das Dirichletproblem nicht immer l¨osbar ist, das erste solche Beispiel stammt von Lebesgue. Abschließend sei bemerkt, daß man Satz VI.4.7 f¨ ur beliebige Dimensionen aussprechen kann.
VI.5
Nukleare Operatoren
In diesem Abschnitt bezeichnen X und Y (etc.) stets Banachr¨aume und H, Hi (etc.) Hilbertr¨ aume. Der Skalarenk¨ orper kann zun¨achst R oder C sein. Es soll nun eine neue Klasse von linearen Operatoren betrachtet werden. Definition VI.5.1 Ein Operator T ∈ L(X, Y ) heißt nuklear, falls es Fol∞ gen (xn ) in X und (yn ) in Y mit n=1 xn yn < ∞ gibt, so daß Tx =
∞
xn (x)yn
∀x ∈ X
(VI.20)
n=1
gilt. Zun¨achst einige Bemerkungen zu dieser Definition. Wir bezeichnen den Operator x → x (x)y, wo x ∈ X , y ∈ Y , mit
x ⊗ y.
Offensichtlich ist das die allgemeine Darstellung einer stetigen linearen Abbildung mit (h¨ochstens) eindimensionalem Bild. Genauso offensichtlich ist die Gleichung x ⊗ y = x y , so daß T genau dann nuklear ist, wenn T als im Sinn der Operatornorm absolut konvergente Reihe T =
∞ n=1
xn ⊗ yn
VI.5
287
Nukleare Operatoren
geschrieben werden kann. Eine solche Darstellung ist selbstverst¨andlich nicht eindeutig; z.B. ist x1 ⊗ y1 − x2 ⊗ y2 = x1 ⊗ (y1 − y2 ) + (x1 − x2 ) ⊗ y2 .
(VI.21)
Hat T ∈ L(X, Y ) endlichdimensionales Bild, so kann T als endliche Reihe T =
N
xn ⊗ yn
n=1
dargestellt werden und ist trivialerweise nuklear. Nach Definition ist ein nuklearer Operator Limes (in der Operatornorm) von Operatoren mit endlichdimensionalem Bild, n¨ amlich N lim T − xn ⊗ yn = 0, (VI.22) N →∞ n=1
∞
n=1 xn yn
wo T gem¨aß (VI.20) mit < ∞ dargestellt ist. Es folgt, daß nukleare Operatoren kompakt sind (Korollar II.3.3); wir werden bald sehen (Beispiel VI.5(a)), daß die Umkehrung nicht gilt. Manchmal ist folgende Charakterisierung nuklearer Operatoren praktisch. • Ein Operator T ∈ L(X, Y ) ist genau dann nuklear, wenn es Folgen (xn ) in X , (yn ) in Y und (an ) ∈ 1 mit xn = yn = 1 f¨ ur alle n ∈ N sowie Tx =
∞
an xn (x)yn
∀x ∈ X
n=1
gibt. ¨ Die Aquivalenz dieser Umschreibung zu Definition VI.5.1 ist offensichtlich; in der Tat kann man offenbar zus¨ atzlich auch an ≥ 0 verlangen. Nun zur n¨achsten Definition, die es uns gestattet zu messen, wie nu” klear“ ein nuklearer Operator ist. Definition VI.5.2 Es sei N (X, Y ) die Menge aller nuklearer Operatoren von X nach Y ; N (X) := N (X, X). F¨ ur T ∈ N (X, Y ) setze T nuk = inf
∞
xn yn ,
n=1
∞ wo sich u ¨ber alle Darstellungen von T als T = n=1 xn ⊗ yn ∞das Infimum mit n=1 xn yn < ∞ erstreckt. (Eine solche Darstellung heiße nukleare Darstellung.) T nuk heißt die nukleare Norm von T .
288
VI.
Spektraltheorie kompakter Operatoren
Es wird in Satz VI.5.3 nachgewiesen werden, daß N (X, Y ) stets ein Vektorraum und . nuk eine Norm ist. Die nukleare Norm eines Operators ist im allgemeinen nur schwer exakt zu berechnen, h¨aufig muß man sich mit Absch¨atzungen zufriedengeben. Ein einfaches Beispiel: Ist T = x1 ⊗ y1 − x2 ⊗ y2 mit xi = yi = 1, so zeigt diese Darstellung nur T nuk ≤ 2, die Darstellung aus (VI.21) liefert jedoch die im allgemeinen bessere Absch¨ atzung T nuk ≤ y1 − y2 + x1 − x2 . Beachte noch folgende Subtilit¨ at bei der Berechnung von T nuk f¨ ur einen Operator T endlichen Rangs: Obwohl T eine nukleare Darstellung als endliche Reihe besitzt, gehen in die Berechnung von T nuk auch die nicht abbrechenden ∞ Darstellungen n=1 xn ⊗ yn ein! (Besitzt X oder Y die Approximationseigenschaft, vgl. S. 88, kann man sich aber wirklich auf die abbrechenden nuklearen Darstellungen beschr¨ anken.) Satz VI.5.3 (a) N (X, Y ) ist ein linearer Raum. (b) . nuk ist eine Norm auf N (X, Y ), und es gilt T ≤ T nuk f¨ ur alle T ∈ N (X, Y ). Ferner ist x ⊗ y nuk = x ⊗ y = x y . (c) N (X, Y ), . nuk ist vollst¨ andig. (d) Die Operatoren endlichen Ranges liegen dicht in N (X, Y ) bzgl. . nuk . Hier wie im folgenden bezeichnet T die Operatornorm von T , sie ist von der nuklearen Norm T nuk zu unterscheiden. Beachte, daß (d) st¨arker ist als (VI.22). Beweis. (a) ist klar. (b) Wir zeigen zuerst T ≤ T ur alle nuklearen Operatoren T . nuk f¨ ∞ Ist n¨amlich T dargestellt als T = n=1 xn ⊗ yn , so zeigt die Dreiecksungleichung f¨ ur die Operatornorm T ≤
∞ n=1
xn ⊗ yn =
∞
xn yn .
n=1
Da die Darstellung von T beliebig war, heißt das T ≤ T nuk nach Definition der nuklearen Norm. Daraus folgt sofort T nuk = 0
⇒ T = 0
⇒ T = 0.
Scharfes Hinsehen zeigt die Bedingung λT nuk = |λ| T nuk, so daß nur noch die Dreiecksungleichung zu zeigen ist, um zu beweisen, daß . nuk
VI.5
289
Nukleare Operatoren
wirklich eine Norm ist. Seien also T1 , T2 ∈ N (X, Y ). W¨ahle zu ε > 0 nukleare Darstellungen Ti =
∞
∞
xi,n ⊗ yi,n ,
n=1
xi,n yi,n ≤ Ti nuk + ε.
n=1
Dann ist T1 + T2 = x1,1 ⊗ y1,1 + x2,1 ⊗ y2,1 + x1,2 ⊗ y1,2 + x2,2 ⊗ y2,2 + · · · , also nach Definition der nuklearen Norm T1 + T2 nuk ≤ x1,1 y1,1 + x2,1 y2,1 + x1,2 y1,2 + x2,2 y2,2 + · · · ≤ T1 nuk + T2 nuk + 2ε. Da ε > 0 beliebig war, folgt die Dreiecksungleichung. Es bleibt, x ⊗ y nuk = x ⊗ y zu begr¨ unden. Oben wurde bereits ≥“ ” gezeigt. Andererseits ist x ⊗ y eine nukleare Darstellung von x ⊗ y, die freilich nur aus einem einzigen Summanden besteht; also gilt nach Definition x ⊗ y nuk ≤ x y = x ⊗ y . (c) Wir verwenden das Kriterium aus Lemma I.1.8. Seien also Tm ∈ N (X, Y ) mit ∞ T nuk < ∞. W¨ ahle nukleare Darstellungen mit m m=1 Tm =
∞
xm,n
∞
⊗ ym,n ,
n=1
xm,n ym,n ≤ Tm nuk + 2−m .
n=1
Es folgt ∞
xm,n ym,n ≤
m,n=1
∞
( Tm nuk + 2−m ) < ∞,
(VI.23)
m=1
so daß die (Doppel-) Reihe ∞ m,n=1 xm,n ⊗ym,n im Banachraum (Satz II.1.4) L(X, Y ) konvergiert. Daher existiert T ∈ L(X, Y ) mit T =
∞
xm,n ⊗ ym,n
m,n=1
(absolute Konvergenz im Sinn der Operatornorm). (VI.23) zeigt, daß T nuklear ist, und es ist wirklich T = ∞ m=1 Tm im Sinn der nuklearen Norm, denn M ∞ Tm ≤ xm,n ym,n T − m=1 m>M n=1 nuk ≤ ( Tm nuk + 2−m ) → 0. m>M
290
VI.
Spektraltheorie kompakter Operatoren
∞ (d) Sei n=1 xn ⊗ yn eine beliebige nukleare Darstellung von T ∈ N (X, Y ). Dann ist N xn ⊗ yn ≤ xn yn → 0. 2 T − n=1
nuk
n>N
∞ F¨ ur (d) haben wir gezeigt, daß die Reihe T = n=1 xn ⊗ yn nicht nur bzgl. der Operatornorm, sondern auch bzgl. der nuklearen Norm konvergiert. Die im folgenden Satz ausgedr¨ uckte Eigenschaft nennt man die Idealeigenschaft des Raums der nuklearen Operatoren, obwohl L(X, Y ) f¨ ur X = Y kein Ring ist. Satz VI.5.4 Seien R ∈ L(W, X), S ∈ N (X, Y ), T ∈ L(Y, Z). Dann ist T SR ∈ N (W, Z) mit T SR nuk ≤ T S nuk R . Beweis. Sei S = ∞ n=1 xn ⊗ yn . Man verifiziert leicht, daß T SR =
∞
R xn ⊗ T yn ,
n=1
also T SR nuk ≤
∞
R xn T yn ≤ R T
n=1
∞
xn yn
n=1
gilt. Indem man zum Infimum u ¨ber alle nuklearen Darstellungen von S u alt man die Behauptung. 2 ¨bergeht und R = R beachtet, erh¨ Beispiele. (a) Sei 1 ≤ p < ∞ und X = Y = p . Ta seider Multiplikationsoperator mit einer Folge a = (an ) ∈ 1 , also Ta (sn ) = (an sn ). Der Operator Ta : p → p ist stetig mit Ta = maxn |an | (Aufgabe II.5.11). Bezeichnet nun en (bzw. en ) den n-ten Einheitsvektor in p (bzw. in q ∼ = (p ) , 1 1 p + q = 1), so gilt offenbar Ta =
∞
an en ⊗ en .
(VI.24)
n=1
Daher ist Ta nuklear mit Ta nuk ≤ ∞ n=1 |an |. Wir werden im Fall p = 2 sogar die Gleichheit zeigen (Satz VI.5.5), so daß man f¨ ur (an ) = ( n1 ) ∈ / 1 2 einen kompakten, aber nicht nuklearen Operator auf erh¨alt. ∞ 1 1 ∞ 1 (b) Seien X = , Y = , (an ) ∈ , und sei Ta : → wie oben durch Ta (sn ) = (an sn ) definiert. Es ist leicht zu sehen, daß Ta stetig ist ∞ mit Ta = n=1 |an | = a 1 . Wie unter (a) erkennt man die Darstellung
VI.5
291
Nukleare Operatoren
(VI.24), wobei diesmal en ∈ 1 ⊂ (∞ ) aufgefaßt wird. Dies zeigt Ta ∈ ∞ ∞ 1 N ( , ) und T nuk ≤ n=1 |an | = Ta . Satz VI.5.3(b) liefert nun a∞ sogar Ta nuk = n=1 |an |. (c) Sei X = Y = L∞ [0, 1], und sei k ∈ C [0, 1]2 . Wir betrachten den Integraloperator 1 (Tk x)(s) = k(s, t)x(t) dt. 0
Der Operator Tk : L∞ [0, 1] → L∞ [0, 1] ist kompakt; das Argument ist dasselbe wie bei Beispiel II.3(d), wo wir Tk auf C[0, 1] aufgefaßt haben, denn (II.2) zeigt Tk x ∈ C[0, 1] f¨ ur x ∈ L∞ [0, 1]. Wir werden Tk ∈ N (L∞ [0, 1]) mit 1
Tk nuk ≤
sup |k(s, t)| dt
(VI.25)
s
0
zeigen. Wir beginnen mit einer Vor¨ uberlegung. Sei n ∈ N beliebig. Zerlege [0, 1] in die 2n Teilintervalle Ij = [(j − 1)2−n , j2−n ], j = 1, . . . , 2n , die (bis auf (n) die Randpunkte) disjunkt sind. Seien aij ∈ K, i, j = 1, . . . , 2n , und sei kn die beschr¨ankte meßbare (aber unstetige) Funktion n
kn (s, t) =
2
(n)
aij χIi (s)χIj (t)
i,j=1
und Tkn der zugeh¨ orige Integraloperator auf L∞[0, 1]. Wegen n
Tkn x =
n
2 2
(n) aij
i=1 j=1
x(t) dt χIi ∈ lin{χIi : i = 1, . . . , 2n} Ij
ist Tkn ein Operator endlichen Ranges. Seine nukleare Norm kann folgendermaßen abgesch¨ atzt werden. Setze xj (x) = x(t) dt. Ij
Dann gilt xj (L∞ ) = χIj L1 = 2−n . Man erh¨alt n
Tkn =
2
xj
⊗
j=1
also wegen
i
2n
(n) aij χIi ,
i=1
(n)
(n)
aij χIi L∞ = maxi |aij | n
Tkn nuk ≤
2 j=1
2−n max |aij |. (n)
i
Das ist die diskretisierte Version von (VI.25).
292
VI.
Spektraltheorie kompakter Operatoren
Nun zum eigentlichen Beweis. Sei ε > 0 gegeben. Da k gleichm¨aßig stetig ist, existiert m0 mit max{|s1 − s2 |, |t1 − t2 |} ≤ 2−m0
⇒ |k(s1 , t1 ) − k(s2 , t2 )| ≤ ε. (VI.26)
Sei n ≥ m ≥ m0 , und sei aij = k(i2−n , j2−n ). Betrachte den Operator Tkn − Tkm , wo Tkn gem¨ aß der Vor¨ uberlegung gew¨ahlt ist. Auch dieser l¨aßt sich in die Form (n)
n
(Tkn − Tkm )x =
n
2 2
(n) bij
x(t) dt χIi Ij
i=1 j=1 (n)
mit geeigneten bij bringen. Der springende Punkt dieser Darstellung ist, daß nach Definition von (n) Tkn und nach (VI.26) stets |bij | ≤ ε ist. Die Vor¨ uberlegung liefert deshalb n
Tkn − Tkm nuk ≤
2
2−n max |bij | ≤ ε. (n)
i
j=1
Daher ist (Tkn ) eine Cauchyfolge bzgl. . nuk . Sei S ∈ N (L∞ [0, 1]) ihr Limes (Satz VI.5.3(c)). Da (Riemannsche Summe!) n
αn :=
2 j=1
2−n sup |k(s, j2−n )| →
1
sup |k(s, t)| dt f¨ ur n → ∞
s
0
s
und nach der Vor¨ uberlegung Tkn nuk ≤ αn gilt, folgt
1
S nuk ≤
sup |k(s, t)| dt. 0
s
Um das Beispiel abzuschließen, ist noch S = Tk zu zeigen. Da k stetig ist, gilt kn − k ∞ → 0 nach Definition von kn . Nach (II.2) folgt Tkn − Tk = Tkn −k → 0. Andererseits ist nach Satz VI.5.3(b) Tkn − S ≤ Tkn − S nuk → 0, woraus in der Tat S = Tk folgt. ¨ Ahnlich kann man (VI.25) f¨ ur Integraloperatoren mit stetigem Kern auf C[0, 1] beweisen; man muß dann die unstetigen Funktionen χIi in der Definition von kn durch eine stetige Zerlegung der Eins ersetzen. Vergleiche die Symmetrie zwischen (II.3) und (VI.25)!
VI.5
293
Nukleare Operatoren
Der obige Beweis zeigt noch das analoge Ergebnis 1 1 Tk ∈ N (L [0, 1]), T nuk ≤ sup |k(s, t)| ds, 0
t
falls k ein stetiger Kern ist. Die Stetigkeit von k reicht aber nicht, um Tk ∈ N (L2 [0, 1]) zu erzwingen (siehe S. 317); vgl. jedoch Beispiel VI.5(d) unten. Im Rest des Abschnitts werden wir Hilbertraumoperatoren detaillierter untersuchen und erst in den Bemerkungen und Ausblicken die Banachraumsituation kommentieren. Sei also H ein reeller oder komplexer Hilbertraum, den wir der Einfachheit halber als separabel voraussetzen wollen. (Die Resultate bleiben auch im nichtseparablen Fall richtig, nur die Beweise werden ein wenig technischer.) In Satz VI.3.6 wurde gezeigt, daß jedes T ∈ K(H) in der Form T =
∞
sn . , en fn
(VI.27)
n=1
f¨ ur geeignete Orthonormalsysteme (en ) und (fn ) dargestellt werden kann. Die Zahlen sn = sn (T ) ≥ 0 sind die in ihrer Vielfachheit gez¨ahlten Eigenwerte des positiven selbstadjungierten Operators |T | = (T ∗ T )1/2 ; sie heißen, wie bereits in Satz VI.3.6 bemerkt, die singul¨ aren Zahlen von T . Im Vergleich mit dem folgenden Satz beachte sn (T ) ∈ c0 und T = maxn sn (T ) = (sn (T )) c0 . Wir nennen (VI.27) die kanonische Darstellung von T . Satz VI.5.5 Ein Operator T ∈ K(H) ist genau dann nuklear, wenn f¨ ur die Folge der singul¨ aren Zahlen sn (T ) ∈ 1 gilt. In diesem Fall ist T nuk =
∞
sn (T ) = (sn (T )) 1 .
n=1
Beweis. Gelte zun¨ achst sn (T ) ∈ 1 . Dann ist die kanonische Darstellung eine nukleare Darstellung, und es gilt daher T nuk ≤ n sn (T ). Sei umgekehrt T nuklear, und sei T =
∞ n=1
an . , xn yn
eine nukleare Darstellung mit xn = yn = 1 f¨ ur alle n und n |an | < ∞; wir haben hier den Satz von Fr´ e chet-Riesz V.3.6 benutzt. Es ist n sn (T ) ≤ ¨ amlich sn (T ) ∈ 1 und nach Ubergang zum n |an | zu zeigen, das zeigt n¨ Infimum u ¨ ber alle nuklearen Darstellungen n sn (T ) ≤ T nuk.
294
VI.
Spektraltheorie kompakter Operatoren
∞ Sei also T = n=1 sn . , en fn die kanonische Darstellung von T . F¨ ur jedes m ∈ N ist dann einerseits T e m = s m fm , andererseits T em =
∞
an em , xn yn
n=1
sowie nach der Cauchy-Schwarz-Ungleichung und der Besselschen Ungleichung ∞
sm ≤
m=1
=
∞ ∞
|an | |em , xn | |yn , fm |
m=1 n=1 ∞
|an |1/2 |em , xn | |an |1/2 |yn , fm |
m,n=1
≤
∞
|an | |em , xn |
2
1/2 ∞
m,n=1
=
∞
|an |
n=1
≤
∞
n=1
≤
∞
=
|an | |yn , fm |
m,n=1
∞
|em , xn |2
m=1
|an | xn 2
1/2 ∞
1/2 ∞
|an |
n=1
∞
1/2 |yn , fm |2
m=1
1/2
|an | yn 2
n=1
1/2 1/2 ∞ |an | |an |
n=1 ∞
1/2 2
n=1
|an |.
n=1
Damit ist die gew¨ unschte Absch¨ atzung bewiesen.
2
Als n¨achstes soll das Konzept der Spur einer Matrix verallgemeinert werden. Die Spur einer (n × n)-Matrix (aij ) ist bekanntlich ni=1 aii ; sie ist invariant gegen¨ uber orthogonalen (bzw. unit¨aren) Transformationen, d.h. gegen¨ uber einem Wechsel der Orthonormalbasis. Stellt (aij ) eine lineare Abbildung T dar, so gilt f¨ ur jede Orthonormalbasis n i=1
aii =
n
T ei , ei .
i=1
Das legt es nahe, auch f¨ u r Operatoren auf unendlichdimensionalen Hilbert∞ r¨aumen die Spur durch i=1 T ei , ei f¨ ur irgendeine Orthonormalbasis (ei )
VI.5
295
Nukleare Operatoren
von H definieren zu wollen. Es stellt sich hier jedoch die Frage nach der Konvergenz der Reihe und der Wohldefiniertheit, d.h., der Unabh¨angigkeit von der Wahl der Orthonormalbasis. Lemma VI.5.6 Sei T ∈ N (H), (en ) eine Orthonormalbasis von H, und sei ∞ T = an . , xn yn n=1
irgendeine nukleare Darstellung von T mit xn = yn = 1 und (an ) ∈ 1 . Dann gilt ∞ ∞ an yn , xn = T en , en . n=1
n=1
Dabei ist die Konvergenz der Reihen absolut. Beweis. Wegen (an ) ∈ 1 und |yn , xn | ≤ 1 konvergiert die Reihe linker Hand absolut. Es folgt aus der Parsevalschen Gleichung (Satz V.4.9) ∞
an yn , xn =
n=1
= =
∞
an
∞
yn , ek ek , xn
n=1 k=1 ∞ ∞
an yn , ek ek , xn
k=1 n=1 ∞
T ek , ek .
k=1
Daher konvergiert auch die Reihe rechter Hand zum selben Limes, und zwar unbedingt, wie unser Argument zeigt. Also konvergiert auch diese Reihe absolut. 2 Das Lemma zeigt, daß folgende Definition sinnvoll ist. Definition VI.5.7 Sei T ∈ N (H). Die Spur von T ist definiert als tr(T ) =
∞
T en , en,
(VI.28)
n=1
wo (en ) irgendeine Orthonormalbasis von H ist. Es gilt tr(T ) =
∞ n=1
an yn , xn ,
(VI.29)
296
VI.
wo T =
∞ n=1
Spektraltheorie kompakter Operatoren
an . , xn yn nuklear dargestellt ist. Insbesondere ist tr(T ) =
∞
sn (T )fn , en ,
(VI.30)
n=1
wenn man die kanonische Darstellung (VI.27) einsetzt. Die nuklearen Operatoren bilden also die Klasse von Hilbertraumoperatoren, f¨ ur die eine Spur erkl¨ art ist; daher heißen sie auch manchmal Operatoren der Spurklasse. Die Bezeichnung tr erinnert u ¨ brigens an trace. Satz VI.5.8 (a) tr ist ein stetiges lineares Funktional auf N (H) mit tr = 1. (b) Ein Operator T ist genau dann nuklear, wenn T ∗ nuklear ist. Ferner ist in diesem Fall tr(T ) = tr(T ∗ ). (c) Ist T ∈ N (H) und S ∈ L(H), so gilt tr(ST ) = tr(T S). Beweis. (a) Die Linearit¨ at folgt aus (VI.28), die Stetigkeit aus (VI.30): |tr(T )| ≤
∞
sn (T )|fn , en | ≤
n=1
∞
sn (T ) = T nuk,
n=1
letzteres wegen Satz VI.5.5. Der Operator T = . , ee zeigt sogar tr = 1. (b) folgt direkt aus den Definitionen. ∞ (c) Ist T = n=1 an . , xn yn , so ist ST =
∞
an . , xn Syn ,
TS =
n=1
∞
an . , S ∗ xn yn ,
n=1
folglich tr(ST ) =
∞
an Syn , xn =
n=1
∞
an yn , S ∗ xn = tr(T S).
2
n=1
Korollar VI.5.9 Sei T ∈ K(H) selbstadjungiert. (λn ) bezeichne die in ihrer Vielfachheit gez¨ ahlten Eigenwerte von T , d.h., jeder Eigenwert μ kommt dim ker(μ − T )-mal vor. Dann ist T genau dann nuklear, wenn ∞ |λ | < ∞ ist. In diesem Fall ist n n=1 T nuk =
∞ n=1
|λn |
und
tr(T ) =
∞ n=1
λn .
VI.5
297
Nukleare Operatoren
Beweis. Nach dem Spektralsatz bilden die |λn | genau die Folge der singul¨aren Zahlen, und es existiert eine Orthonormalbasis aus Eigenvektoren von T . Korollar VI.5.9 folgt dann aus Satz VI.5.5 und (VI.28). 2 Beispiel. (d) Sei k eine stetige Funktion auf [0, 1]2 , und es gelte k(s, t) = k(t, s) f¨ ur alle s, t ∈ [0, 1]. Dann ist der zugeh¨orige Integraloperator auf L2 [0, 1] 1 (T x)(s) = k(s, t)x(t) dt fast u ¨berall 0
selbstadjungiert und kompakt (Beispiel II.3(c) und V.5(b)). Es wurde in Abschnitt VI.4 die Darstellung k=
∞
λn en ⊗ en
(VI.31)
n=1
entwickelt (Bezeichnungen siehe dort, insbesondere (VI.9)). Wir setzen nun zus¨atzlich voraus, daß T positiv ist, also T x, x ≥ 0 f¨ ur alle x ∈ L2 gilt. In diesem Fall sind alle λn ≥ 0, und nach dem Satz von Mercer (Satz VI.4.2) ist die Konvergenz in (VI.31) absolut und gleichm¨aßig. Es folgt (λn ) ∈ 1 und die Nuklearit¨ at von T , denn es ist k(s, s) =
∞
λn en (s)en (s)
∀s ∈ [0, 1],
n=1
daher wegen der gleichm¨ aßigen Konvergenz
1
∞>
k(s, s) ds = 0
∞
λn
1
en(s)en (s) ds = 0
n=1
∞
λn .
n=1
Unter diesen Voraussetzungen ergibt sich in vollst¨andiger Analogie zum endlichdimensionalen Fall nach Korollar VI.5.9 tr(T ) =
1
k(s, s) ds. 0
Leider ist es nicht einfach, die Voraussetzung Tk ≥ 0 am Kern k abzulesen; insbesondere ist die Bedingung k ≥ 0 daf¨ ur nicht hinreichend, siehe S. 283. Ferner sei nochmals darauf hingewiesen, daß die Stetigkeit von k allein nicht die Nuklearit¨ at von Tk auf L2 impliziert (vgl. S. 317). Die obige Spurformel wird f¨ ur eine gr¨ oßere Klasse von Kernen in Brislawns Arbeit in Proc. Amer. Math. Soc. 104 (1988) 1181–1190 bewiesen.
298
VI.
VI.6
Spektraltheorie kompakter Operatoren
Hilbert-Schmidt-Operatoren
Kommen wir nun zu einer gr¨ oßeren Klasse von Operatoren auf einem (separablen) Hilbertraum H, als es die nuklearen Operatoren sind. Definition VI.6.1 Ein Operator T ∈ K(H) heißt Hilbert-Schmidt-Operator, falls sn (T ) ∈ 2 gilt. HS(H) bezeichne die Menge der HilbertSchmidt-Operatoren. F¨ ur einen Hilbert-Schmidt-Operator T setze 1/2 ∞ 2 T HS = (sn (T )) 2 = sn (T ) . n=1
. HS heißt Hilbert-Schmidt-Norm. Es ist auf Grund der Definition nicht klar, daß . HS tats¨achlich eine Norm ist. Es gilt jedoch der folgende Satz. Satz VI.6.2 (a) F¨ ur T ∈ K(H) sind ¨ aquivalent: (i) T ist ein Hilbert-Schmidt-Operator. ∞ 2 (ii) Es gibt eine Orthonormalbasis (gn ) mit ∞ n=1 T g2n < ∞. (iii) F¨ ur alle Orthonormalbasen (gn ) gilt n=1 T gn < ∞. In diesem Fall ist f¨ ur alle Orthonormalbasen (gn ) 1/2 ∞ 2 T HS = T gn . n=1
(b) Ein Operator T ist ein Hilbert-Schmidt-Operator genau dann, wenn es T ∗ ist. In diesem Fall ist T HS = T ∗ HS . (c) HS(H) ist ein linearer Raum, und . HS ist eine Norm auf HS(H). Außerdem ist HS(H) ein (nicht abgeschlossenes) Ideal in L(H). Ferner gilt T ≤ T HS . (d) Es ist N (H) ⊂ HS(H) mit T HS ≤ T nuk. (e) Das Produkt von zwei Hilbert-Schmidt-Operatoren T1 und T2 ist nuklear, und es ist T1 T2 nuk ≤ T1 HS T2 HS . (f) F¨ ur S, T ∈ HS(H) setze S, T HS = tr(T ∗ S). . , . HS ist ein Skalarprodukt, das die Hilbert-Schmidt-Norm in duziert. HS(H), . HS ist ein Hilbertraum. Ferner gilt f¨ ur alle Orthonormalbasen (gn ) S, T HS =
∞ n=1
Sgn , T gn .
VI.6
299
Hilbert-Schmidt-Operatoren
(g) Die Operatoren endlichen Ranges liegen dicht in HS(H) bzgl. der Hilbert-Schmidt-Norm . HS . ∞ Beweis. (a) Sei T = n=1 sn . , en fn die kanonische Darstellung von T ∈ K(H). Dann gilt f¨ ur jede Orthonormalbasis (gn ) nach der Parsevalschen Gleichung 2 ∞ ∞ ∞ 2 T gm = sn gm , en fn m=1
= = =
m=1 n=1 ∞ ∞
s2n |gm , en |2
m=1 n=1 ∞ ∞
s2n |gm , en |2
n=1 m=1 ∞
∞
n=1
n=1
sn en 2 =
s2n .
(Das Umsummieren ist erlaubt, da alle Terme positiv sind.) Das zeigt (a). ∞ (b) Zun¨achst beobachten wir, daß T ∗ = n=1 sn . , fn en gilt. Es sei (gn ) eine Orthonormalbasis, die das Orthonormalsystem (fn ) umfaßt. Es folgt T ∗ gn = 0 f¨ ur die gn , die nicht zu den fn geh¨oren. Folglich ist ∞
T ∗gn 2 =
n=1
∞
T ∗ fn 2 =
n=1
∞
sn en 2 =
n=1
∞
s2n ,
n=1
und (b) folgt aus (a). (c) Daß HS(H) ein linearer Raum ist sowie die Dreiecksungleichung f¨ ur . HS folgen aus (iii) in (a) und der Dreiecksungleichung f¨ ur die 2 -Norm. Auch die Idealeigenschaft ergibt sich leicht aus (a) und (b). Ferner ist T = sup sn (T ) ≤
∞
n
1/2 sn (T )2
= T HS ,
n=1
insbesondere T HS = 0 ⇒ T = 0
⇒ T = 0.
Auch λT HS = |λ| T HS ist eine direkte Konsequenz aus (a). (d) Nach Satz VI.5.5 ist f¨ ur T ∈ N (H) T HS =
∞
1/2 sn (T )
2
≤
n=1
da . 2 ≤ . 1 gilt (Aufgabe I.4.10).
∞ n=1
sn (T ) = T nuk,
300
VI.
Spektraltheorie kompakter Operatoren
(e) Sei (gn ) eine Orthonormalbasis von H. Dann ist T2 x =
∞
T2 x, gn gn
∀x ∈ H,
n=1
folglich T1 T2 x =
∞
T2 x, gn T1 gn
∀x ∈ H,
n=1
d.h. T1 T2 =
∞
. , T2∗ gn T1 gn ,
n=1
daher T1 T2 nuk ≤ ≤
∞
T2∗ gn T1gn
n=1 ∞
T2∗ gn 2
1/2 ∞
n=1
1/2 T1 gn 2
n=1
(a)
= T2∗ HS T1 HS
(b)
= T2 HS T1 HS .
(f) Es ist leicht zusehen, daß . , . HS ein Skalarprodukt ist; die Wohldefiniertheit folgt aus (e) und (b). (VI.28) impliziert f¨ ur eine Orthonormalbasis (gn ) ∞ ∞ tr(T ∗ S) = T ∗ Sgn, gn = Sgn , T gn, n=1
insbesondere T, T HS =
n=1 ∞
T gn 2 = T 2HS .
n=1
Nun zur Vollst¨ andigkeit von HS(H). Sei (Tn ) eine . HS -Cauchyfolge. Wegen . ≤ . HS ist (Tn ) auch eine . -Cauchyfolge; wegen der Vollst¨andigkeit von L(H) existiert der Limes T dieser Folge bzgl. der Operatornorm. Da alle Tn kompakt sind, ist auch T kompakt (Satz II.3.2(a)). Wir zeigen jetzt, daß T ein Hilbert-Schmidt-Operator ist. Sei dazu (gn ) eine Orthonormalbasis, und sei N ∈ N beliebig. W¨ahle m mit 1 Tm − T ≤ √ . N Da (Tn ) eine . HS -Cauchyfolge ist, ist α := sup Tn HS < ∞. n
VI.6
301
Hilbert-Schmidt-Operatoren
Es folgt mit Hilfe der Dreiecksungleichung f¨ ur die 2 -Norm und nach (a) N
1/2 T gn
2
≤
n=1
N
1/2 (T − Tm )gn
n=1
≤
N
1 N n=1
2
+
N
1/2 Tm gn
2
n=1
1/2 + Tm HS
≤ 1 + α, folglich
∞
1/2 T gn
≤ 1 + α < ∞,
2
n=1
und T ist nach (a) ein Hilbert-Schmidt-Operator. Es ist nun noch Tn − T HS → 0 zu zeigen. W¨ahle zu ε > 0 ein m0 ∈ N mit Tm − Tl HS ≤ ε f¨ ur alle m, l ≥ m0 . Sei wieder N ∈ N beliebig und w¨ ahle l = l(N ) ≥ m0 mit ε T − Tl ≤ √ . N Es sei (gn ) eine Orthonormalbasis von H. Es folgt f¨ ur m ≥ m0 ¨ahnlich wie oben N
1/2 (T − Tm )gn 2
≤
N
n=1
1/2 (T − Tl )gn 2
n=1
+ ≤
N
N
1/2 (Tl − Tm )gn 2
n=1
2
ε N n=1
1/2 + Tl − Tm HS
≤ 2ε und daher auch T − Tm HS =
∞
1/2 (T − Tm )gn 2
n=1
1/2 N 2 = sup (T − Tm )gn ≤ 2ε N
f¨ ur m ≥ m0 .
n=1
302
VI.
Spektraltheorie kompakter Operatoren
(g) Wie in (b) sieht man f¨ ur die Operatoren T = TN = N s . , e f n n n=1 n T − TN HS =
∞
n=1 sn . , en fn
und
1/2 →0
s2n
f¨ ur N → ∞.
2
n>N
Eine wichtige Beispielklasse stellt der n¨ achste Satz vor. 2 Satz VI.6.3 F¨ ur T ∈ L L [0, 1] sind ¨ aquivalent: (i) Es gibt eine Funktion k ∈ L2 ([0, 1]2 ) mit 1 (T x)(s) = (Tk x)(s) := k(s, t)x(t) dt fast ¨ uberall. 0
(ii) T ∈ HS L2 [0, 1] . In diesem Fall ist 1 T HS = 0
1/2
1
|k(s, t)|2 ds dt
= k L2 .
0
Beweis. (i) ⇒ (ii): Sei (en ) (also auch (en )) eine Orthonormalbasis von L2 [0, 1]. Dann gilt: ∞
Tk en
2
=
n=1
=
∞
1
n=1 0 1 ∞
ds
0
1
2 k(s, t)en (t) dt
|k(s, . ), en |2 ds
0 n=1 1
k(s, . ) 2 ds
=
(Parsevalsche Gleichung)
0
1
1
|k(s, t)|2 ds dt.
= 0
0
Das zeigt, daß Tk ein Hilbert-Schmidt-Operator mit Tk HS = k L2 ist. (ii) ⇒ (i): Wir haben gerade gesehen, daß die Abbildung L2 ([0, 1]2 ) → HS(L2 [0, 1]),
k → Tk
eine da jeder Operator endlichen Rangs N Isometrie ist. Sie hat dichtes Bild, 2 . , x y Kernoperator zum L -Kern n n n=1 (s, t) →
N n=1
yn (s)xn (t)
VI.6
303
Hilbert-Schmidt-Operatoren
ist (verwende Satz VI.6.2(g)). Eine isometrische Abbildung mit dichtem Bild zwischen vollst¨ andigen R¨ aumen muß surjektiv sein, da ihr Bild ebenfalls vollst¨andig, ergo abgeschlossen ist. Daher gilt (ii) ⇒ (i). 2 Ein analoges Resultat gilt f¨ ur beliebige Maßr¨aume (Ω, Σ, μ) statt des Einheitsintervalls. Die bisherigen Resultate zeigen einen engen Zusammenhang zwischen c0 und K(H), 1 und N (H) sowie 2 und HS(H); außerdem entspricht das Summenfunktional (sn ) → n sn der Spur T → tr T . In den Bemerkungen zu diesem Kapitel wird darauf detaillierter eingegangen. Im n¨achsten Satz ¨ wird diese Analogie untermauert; beachte die frappante Ahnlichkeit seiner 1 ∼ Aussage mit den isometrischen Isomorphismen = (c0 ) , ∞ ∼ = (1 ) aus Satz II.2.3. Satz VI.6.4 (a) Die Abbildung Φ: N (H) → K(H) , S → ΦS mit ΦS (T ) = tr(ST ) ist ein isometrischer Isomorphismus; es gilt also K(H) ∼ = N (H). (b) Die Abbildung Ψ: L(H) → N (H) , S → ΨS mit ΨS (T ) = tr(ST ) ist ein isometrischer Isomorphismus; es gilt also N (H) ∼ = L(H). Beweis. Der Beweis folgt der Strategie des Beweises von Satz II.2.3. (a) Zun¨achst ist Φ wohldefiniert und linear; die Absch¨atzung |ΦS (T )| = |tr(ST )| ≤ ST nuk ≤ S nuk T (hier gingen die S¨ atze VI.5.8 und VI.5.4 ein) zeigt ΦS ≤ S nuk. Zum Beweis, daß Φ injektiv ist, gelte tr(ST ) = 0 f¨ ur alle T ∈ K(H). Speziell folgt mit T = . , xy =: x ⊗ y 0 = tr(ST ) = tr(x ⊗ Sy) = Sy, x
∀x, y ∈ H.
Also ist S = 0, und Φ ist injektiv. Um den Beweis von (a) abzuschließen, ist nun noch folgendes zu zeigen: • Zu f ∈ K(H) existiert S ∈ N (H) mit ΦS = f und S nuk ≤ f . Dazu betrachte die Abbildung (x, y) → f (y ⊗ x). Man sieht sofort, daß es sich um eine stetige Sesquilinearform handelt. Nach dem Satz von LaxMilgram (Aufgabe V.6.18) existiert S ∈ L(H) mit Sx, y = f (y ⊗ x)
∀x, y ∈ H.
Die eigentliche Schwierigkeit besteht nun darin, die Kompaktheit von S zu zeigen. Nach dem folgenden Lemma VI.6.5 reicht es zu beweisen, daß (Sgn , hn ) f¨ ur alle Orthonormalsysteme (gn ), (hn ) eine Nullfolge ist. Um ∞ das einzusehen, sei (an ) ∈ c0 beliebig. Der Operator T = n=1 an hn ⊗ gn
304
VI.
Spektraltheorie kompakter Operatoren
ist dann kompakt mit T = supn |an |. Da die Reihe f¨ ur T normkonvergent ist, folgt ∞ ∞ |f (T )| = an f (hn ⊗ gn ) = an Sgn , hn n=1
n=1
≤ f T = f (an ) ∞ . ∞ Daher ist (an ) → n=1 an Sgn , hn ein stetiges Funktional auf c0 mit Norm ≤ f . Gem¨ aß Satz II.2.3 wird es von einer 1 -Folge dargestellt; nach Konstruktion ist (Sgn , hn ) diese Folge. Daher gilt ∞
|Sgn , hn | ≤ f
n=1
und insbesondere Sgn , hn → 0, und S ist kompakt. ∞ Betrachten wir nun die kanonische Darstellung S = n=1 sn en ⊗ fn , so zeigt das obige Argument (sn ) = (Sen , fn ) ∈ 1 ,
∞
sn ≤ f .
n=1
Nach Satz VI.5.5 ist S nuklear mit S nuk ≤ f . Schließlich beobachten wir, daß f und ΦS auf allen Operatoren der Form y ⊗ x u ulle und wegen ¨bereinstimmen, daher auf deren linearer H¨ der Stetigkeit von f und ΦS auf deren Abschluß, der nach Korollar VI.3.7 K(H) ist. Es folgt ΦS = f , wie gew¨ unscht. Damit ist der Beweis von Teil (a) vollst¨andig. (b) Der Beweis hier ist ¨ ahnlich wie (aber einfacher als) in Teil (a). 2 Es bleibt noch ein Lemma nachzutragen. Lemma VI.6.5 Sei S ∈ L(H). F¨ ur je zwei Orthonormalsysteme (gn ) und (hn ) gelte Sgn , hn → 0. Dann ist S kompakt. Beweis. Falls S nicht kompakt w¨ are, existierte ε > 0 mit S − T > ε
∀T ∈ K(H).
(VI.32)
Wir werden induktiv Orthonormalsysteme (gn ) und (hn ) mit |Sgn , hn | > ε
∀n ∈ N
konstruieren. Ist n = 1, so setze T = 0 in (VI.32) und finde g1 und h1 mit g1 = h1 = 1 und |Sg1 , h1 | > ε. Seien nun g1 , . . . , gn und h1 , . . . , hn (jeweils
VI.6
305
Hilbert-Schmidt-Operatoren
orthonormal) wie gew¨ unscht bereits konstruiert. Sei E (bzw. F ) die Orthogonalprojektion auf lin{g1 , . . . , gn } (bzw. lin{h1 , . . . , hn }). Wende (VI.32) auf den kompakten Operator T = SE + F S − F SE an und erhalte x, y ∈ H mit |(Id − F )S(Id − E)x, y| = |(S − T )x, y| > ε x y . Insbesondere ist Ex = x, F y = y. Setze nun gn+1 =
x − Ex , x − Ex
hn+1 =
y − Fy . y − F y
Es folgt gn+1 ⊥ gi und hn+1 ⊥ hi f¨ ur i ≤ n sowie |Sgn+1 , hn+1 | > ε.
2
Kehren wir abschließend zur Spektraltheorie zur¨ uck. Im folgenden sei H ein komplexer Hilbertraum. Wir wollen das Eigenwertspektrum von nuklearen und Hilbert-Schmidt-Operatoren qualitativ untersuchen. Der selbstadjungierte Fall – hier stimmen die Betr¨age der Eigenwerte des Operators in ihrer Vielfachheit mit den singul¨aren Zahlen u ¨berein – folgt aus Korollar VI.5.9 bzw. der Definition eines Hilbert-Schmidt-Operators: • Wenn T selbstadjungiert und nuklear ist, konvergiert die Reihe der Eigenwerte absolut. • Wenn T ein selbstadjungierter Hilbert-Schmidt-Operator ist, sind die Eigenwerte quadratisch summierbar. Diese Ergebnisse sollen im folgenden f¨ ur nicht notwendig selbstadjungierte (oder normale) Operatoren ebenfalls bewiesen werden. Sei T ∈ K(H). Das Spektrum besteht dann außer der 0 nur aus einer Nullfolge von Eigenwerten (evtl. ist die Menge der Eigenwerte endlich oder sogar leer), die man sich u ¨ blicherweise der Betragsgr¨oße nach angeordnet denkt: |μ1 | ≥ |μ2 | ≥ . . . > 0. Aus Theorem VI.2.5(c) folgt, daß f¨ ur jeden Eigenwert μ = 0 eine (nicht zwingend orthogonale) Zerlegung H = N (μ) ⊕ R(μ) existiert, wo N (μ) und R(μ) unter T wieder in sich selbst abgebildet werden; nach Konstruktion ist dabei (siehe Abschnitt VI.2) N (μ) = {x: ∃n ≥ 1 (μ − T )n x = 0}, und es ist dμ := dim N (μ) < ∞. N (μ) heißt der verallgemeinerte Eigenraum oder Hauptraum zum Eigenwert μ und dμ dessen algebraische Vielfachheit. Ist T selbstadjungiert, so ist (wie in der linearen Algebra) N (μ) = ker(μ − T ) und dμ gleich der bislang betrachteten geometrischen Vielfachheit dim ker(μ − T ). Es gilt n¨ amlich (μ − T )2 x = 0 ⇒ (μ − T )x = 0
306
VI.
Spektraltheorie kompakter Operatoren
f¨ ur selbstadjungiertes T und reelles μ, denn (μ − T )x 2 = (μ − T )x, (μ − T )x = (μ − T )∗ (μ − T )x, x = (μ − T )2 x, x.
Die Eigenwertfolge λn (T ) entsteht durch jeweils dμk -faches Wiederholen des Eigenwerts μk ; u ¨blicherweise geschieht die Anordnung dieser Folge ebenfalls der Betragsgr¨ oße nach: |λ1 (T )| ≥ |λ2 (T )| ≥ . . . > 0. Diese Folge ist das Analogon zur Folge (λk ) aus dem Spektralsatz f¨ ur selbstadjungierte Operatoren, Theorem VI.3.2. Im folgenden Lemma wird eine schwache Version der Jordanschen Normalform eines kompakten Operators produziert. Lemma VI.6.6 Ist T ∈ K(H), so existiert ein Orthonormalsystem (en ) mit T en , en = λn (T ). Beweis. Betrachte die Einschr¨ ankung von T auf N (μk ). Diese Einschr¨ankung Tk = T |N (μk ) kann als Operator von N (μk ) in sich aufgefaßt werden (siehe oben). W¨ahle eine Basis (fk,l )l=1,...,dμk von N (μk ), so daß Tk bzgl. dieser Basis Jordangestalt hat, d.h. T fk,l = μk fk,l + βk,l fk,l−1
mit βk,l ∈ {0, 1}.
Wir indizieren die fk,l nun um: (f1 , f2 , . . .) := (f1,1 , . . . , f1,dμ1 , f2,1 , . . . , f2,dμ2 , f3,1 , . . .). Dann sind die fn linear unabh¨ angig (Aufgabe VI.7.20), und es gilt nach Konstruktion T fn = λn (T )fn + βn fn−1
mit βn ∈ {0, 1}.
Wendet man auf die fn das Gram-Schmidt-Orthonormalisierungsverfahren (Satz V.4.2) an, erh¨ alt man ein Orthonormalsystem (en ) mit en = αn fn + gn , wo αn = 0, gn ∈ lin{e1 , . . . , en−1 } = lin{f1 , . . . , fn−1 }, so daß auch T gn ∈ lin{e1 , . . . , en−1 }. Es folgt f¨ ur alle n ∈ N T en, en = αn T fn + T gn , en = αn (λn (T )fn + βn fn−1 ), en = λn (T )αn fn , en = λn (T )αn fn + gn , en = λn (T ).
2
VI.6
307
Hilbert-Schmidt-Operatoren
Wir formulieren jetzt den Hauptsatz u ¨ber das Eigenwertverhalten nicht selbstadjungierter kompakter Operatoren. Satz VI.6.7 (Weylsche Ungleichung) Sei T ∈ K(H), λn (T ) sei die Folge der in ihrer algebraischen Vielfachheit gez¨ ahlten Eigenwerte von T , und sn (T ) sei die Folge der singul¨ aren Zahlen von T . F¨ ur 1 ≤ p < ∞ gilt dann ∞
|λn (T )|p ≤
n=1
∞
sn (T )p .
n=1
Beweis. Sei T =
∞
sn (T ) . , fn gn
n=1
die kanonische Darstellung von T , und es sei (en ) ein Orthonormalsystem wie in Lemma VI.6.6. Es folgt f¨ ur alle m ∈ N λm (T ) = T em , em =
∞
sn (T )em , fngn , em .
(VI.33)
n=1
Schreibe abk¨ urzend amn = em , fn gn , em . Dann gelten ∞
|amn | ≤ 1
∞
und
m=1
|amn | ≤ 1.
(VI.34)
n=1
Um das einzusehen, beachte nur ∞
|em , fn gn , em | ≤
m=1
∞
|em , fn |
2
m=1
1/2 ∞
1/2 |em , gn |
2
m=1
≤ fn gn = 1, wo wir die Cauchy-Schwarzsche und die Besselsche Ungleichung verwendet haben. Die zweite Behauptung wird genauso bewiesen. Sei nun p1 + 1q = 1, und sei M ∈ N beliebig. Dann gilt (im Fall p > 1, der Fall p = 1 ist entsprechend zu modifizieren) die Absch¨atzung M
|λm (T )|p
(VI.33)
≤
m=1
M ∞ |λm (T )|p−1 sn (T )|amn | m=1
=
m,n
|amn |
n=1 1/p
sn (T )|amn |1/q |λm (T )|p−1
308
VI.
≤
|amn |sn (T )
m,n
(VI.34)
≤
∞
p
sn (T )
p
Spektraltheorie kompakter Operatoren
1/p
1/p M
n=1
1/q |amn | |λm (T )|
m,n
|λm (T )|
(p−1)q
1/q p
;
m=1
im vorletzten Schritt verwende die H¨ oldersche Ungleichung, und f¨ ur den letzten Schritt bemerke (p − 1)q = p. Daraus folgt die Behauptung. 2 Wir formulieren noch zwei Spezialf¨ alle. Korollar VI.6.8 (a) F¨ ur einen nuklearen Operator T gilt ∞
|λn (T )| ≤ T nuk.
n=1
(b) F¨ ur einen Hilbert-Schmidt-Operator T gilt ∞
1/2 |λn (T )|2
≤ T HS .
n=1
VI.7
Aufgaben
Aufgabe VI.7.1 Bestimme das Spektrum des Shiftoperators T : 1 → 1 ,
(s1 , s2 , . . .) → (s2 , s3 , . . .)
sowie des adjungierten Operators T : ∞ → ∞ . Welche Spektralwerte sind jeweils Eigenwerte? Wie ¨ andern sich die Verh¨ altnisse, wenn wir T als Operator von 2 in sich auffassen? Aufgabe VI.7.2 (Resolventengleichung) Sei X ein Banachraum, und seien S, T ∈ L(X). Zeige: (a) Rλ (T ) − Rμ (T ) = (μ − λ)Rλ (T )Rμ (T ) ∀λ, μ ∈ ρ(T ). (b) Rλ (S) − Rλ (T ) = Rλ (S)(S − T )Rλ (T ) ∀λ ∈ ρ(S) ∩ ρ(T ). Aufgabe VI.7.3 (a) Sei M ein kompakter metrischer Raum und sei h ∈ C(M ). Berechne das Spektrum des Multiplikationsoperators Th : f → f h auf C(M ). Gib notwendige und hinreichende Bedingungen daf¨ ur an, daß ein Element des Spektrums ein Eigenwert ist. (b) Gib notwendige und hinreichende Bedingungen daf¨ ur an, daß Th kompakt ist. Insbesondere beschreibe alle kompakten Multiplikationsoperatoren auf C[0, 1].
VI.7
309
Aufgaben
Aufgabe VI.7.4 Sei K eine kompakte nichtleere Teilmenge von K. Zeige, daß es einen Operator T ∈ L(2 ) mit σ(T ) = K gibt. (Tip: Versuche (sn ) → (an sn ).) Aufgabe VI.7.5 Sei X ein Banachraum. Dann ist die Menge Ω aller stetig invertierbarer Operatoren auf X eine offene Teilmenge von L(X), und die Abbildung T → T −1 ist stetig auf Ω. (Hinweis: Neumannsche Reihe!) Aufgabe VI.7.6 Es sei T ∈ L(X) ein Operator mit T ∈ σ(T ). Dann gilt Id + T = 1 + T . Aufgabe VI.7.7 (Courantsches Minimaxprinzip) Sei H ein Hilbertraum, T ∈ K(H) sei selbstadjungiert. Ordne die positiven Ei+ genwerte (inklusive Vielfachheiten) monoton fallend: λ+ 1 ≥ λ2 ≥ . . . > 0. (a) Sei α > 0, n ∈ N. Dann sind folgende Aussagen a quivalent: ¨ (i) Inklusive Vielfachheiten hat T mindestens n Eigenwerte ≥ α. (ii) Es gibt einen n-dimensionalen Teilraum U von H mit T x, x ≥ αx, x (b) Es gilt λ+ n = sup U
∀x ∈ U.
T x, x , x∈U\{0} x, x min
wobei U alle n-dimensionalen Unterr¨ aume durchl¨ auft, f¨ ur die T x, x > 0 f¨ ur alle x ∈ U , x = 0 gilt. Wann wird das Supremum angenommen? Warum wird das Minimum in der obigen Formel angenommen? (c) Ferner gilt T x, x λ+ max , n = min V x∈V ⊥ \{0} x, x wenn die rechte Seite positiv ist. Das Minimum wird jetzt u ¨ ber alle (n−1)dimensionalen Unterr¨ aume gebildet. F¨ ur welches V wird es angenommen? Aufgabe VI.7.8 Sei h: R → C 2π-periodisch und h|[0,2π] ∈ L2 [0, 2π]. Betrachte den Faltungsoperator
2π
Th : L2 [0, 2π] → L2 [0, 2π], Th f (s) =
f (t)h(s − t) 0
dt . 2π
(a) Th ist wohldefiniert, normal und kompakt. (b) Durch Entwicklung von h in eine Fourierreihe bestimme die Eigenfunktionen und Eigenwerte von Th . (c) Bestimme die Spektralzerlegung von Th . Aufgabe VI.7.9 Seien H ein Hilbertraum, (en )n∈N ein Orthonormalsystem und (λn ) eine beschr¨ ankte Zahlenfolge. Setze Tx =
n∈N
λn x, en en .
310
VI.
Spektraltheorie kompakter Operatoren
(a) T ∈ L(H), und T ist normal. (b) T ist kompakt genau dann, wenn limn→∞ λn = 0. (c) Bestimme die Eigenwerte und Eigenvektoren von T . Aufgabe VI.7.10 Sei H ein Hilbertraum und T ∈ K(H). Dann stimmen die in Aufgabe II.5.30 definierten Approximationszahlen an (T ) mit den singul¨ aren Zahlen sn (T ) u ¨ berein. Anleitung: Ausgehend von der kanonischen Darstellung T x = s x, en fn n n 2 2 2 2 definiere Operatoren U : H → , V : H → und D: → durch
x → x, en ,
x → x, fn ,
(ξn ) → (sn ξn ).
Finde den Zusammenhang zwischen D und T und zeige mit Hilfe von Aufgabe II.5.30(d) an (T ) ≤ an (D) ≤ sn (T ) ≤ an (T ). Aufgabe VI.7.11 (Dunfords Theorem u at) ¨ber schwache und starke Analytizit¨ Sei X ein komplexer Banachraum, G ⊂ C offen und f : G → X eine Funktion, so daß x ◦ f f¨ ur jedes x ∈ X analytisch ist. Dann ist f analytisch, d.h. lim
λ→λ0
f (λ) − f (λ0 ) =: f (λ0 ) λ − λ0
existiert f¨ ur alle λ0 ∈ G. (λ0 ) Beweisidee: Wir m¨ ussen zeigen, daß xn := f (λλnn)−f eine Cauchyfolge definiert, −λ0 falls λn → λ0 . Um das einzusehen, stelle x (xn − xm ) mit Hilfe der Cauchyformel dar, dann versuche supx ≤1 |x (xn − xm )| abzusch¨ atzen. Dazu ziehe den Satz von Banach-Steinhaus heran. Aufgabe VI.7.12 Seien X und Y Banachr¨ aume und H ein Hilbertraum. (a) Wenn T : X → Y nuklear ist, ist auch T : Y → X nuklear. (b) T nuk ≤ T nuk . (c) Ist Y reflexiv, gelten auch die Umkehrung von (a) und ≥“ in (b). ” (d) Ist T ∈ N (H), so gilt tr(T ∗ ) = tr(T ). Aufgabe VI.7.13 Sei H ein Hilbertraum. Dann sind ¨ aquivalent: (i) T ∈ N (H), (ii) T = T1 T2 mit geeigneten Hilbert-Schmidt-Operatoren T1 und T2 . Aufgabe VI.7.14 t (a) Der Integrationsoperator (T x)(t) = 0 x(s) ds ist ein Hilbert-SchmidtOperator auf L2 [0, 1]. (b) Bestimme die singul¨ aren Zahlen von T und entscheide, ob T nuklear ist. Aufgabe VI.7.15 Sei k ∈ C 1 ([0, 1]2 ) und Tk der zugeh¨ orige Integraloperator auf L2 [0, 1], also
(Tk x)(s) =
1
k(s, t)x(t) dt. 0
Dann ist Tk nuklear. (Hinweis: Partielle Integration und Aufgabe VI.7.13.)
VI.7
311
Aufgaben
Aufgabe VI.7.16 Sei k ∈ C([0, 1]2 ) symmetrisch und Tk : L2 [0, 1] → L2 [0, 1] der zugeh¨ orige Integraloperator. Der Kern k heißt positiv semidefinit, wenn f¨ur alle n ∈ N und alle s1 , . . . , sn ∈ [0, 1] die Matrix k(si , sj ) i,j=1,...,n positiv semidefinit ist. (a) Tk ist genau dann positiv, wenn k positiv semidefinit ist. (b) Ist k positiv semidefinit, so gilt |k(s, t)|2 ≤ k(s, s)k(t, t)
∀s, t ∈ [0, 1].
(c) F¨ ur k(s, t) = |s − t|α , α > 0, ist Tk nicht positiv. Aufgabe VI.7.17 Sei T ∈ HS(H) (H ein Hilbertraum) mit Spektralradius r(T ) < 1. Dann ist Id − T bijektiv und (Id − T )−1 = Id + R mit R ∈ HS(H). Aufgabe VI.7.18 Sei T : 2 → 2 der Multiplikationsoperator (sn ) → (sn /n) und sei S: 2 → 2 der Rechtsshiftoperator (s1 , s2 , . . .) → (0, s1 , s2 , . . .). Dann ist R := ST kompakt. Gib |R| sowie die singul¨ aren Zahlen von R an. Wie sieht die Situation f¨ ur den Linksshiftoperator (s1 , s2 , . . .) → (s2 , s3 , . . .) aus? Aufgabe VI.7.19 (a) Sei λ ∈ 1 und Dλ : ∞ → 1 der Diagonaloperator“ (sn ) → (λn sn ). ” Zeige, daß Dλ nuklear ist, und bestimme die nukleare Norm. (b) Ein Operator T ∈ L(X, Y ) ist genau dann nuklear, wenn es Operatoren A ∈ L(X, ∞ ), B ∈ L(1 , Y ) und Dλ ∈ L(∞ , 1 ) mit λ ∈ 1 gibt, so daß das Diagramm T -Y X
6
A
B
?
∞
Dλ
- 1
kommutiert. In diesem Fall gilt T nuk = inf A B λ 1 , wobei sich das Infimum u ¨ ber alle solche Faktorisierungen erstreckt. (c) Faktorisiere Dλ
∞
@
D1@
- 1
@ R @
D2
2 mit Hilfe geeigneter Diagonaloperatoren D1 und D2 und zeige, daß es zu T ∈ N (X) Operatoren S1 : X → 2 , S2 : 2 → X mit T = S2 S1 gibt, f¨ ur die S1 S2 ein Hilbert-Schmidt-Operator auf 2 ist.
312
VI.
Spektraltheorie kompakter Operatoren
Aufgabe VI.7.20 Sei X ein komplexer Banachraum, T ∈ L(X), und es seien μ1 , . . . , μn paarweise verschiedene Eigenwerte von T . F¨ ur j = 1, . . . , n seien xj von 0 verschiedene Elemente des Hauptraums N(μj ). Dann sind x1 , . . . , xn linear unabh¨ angig. n Anleitung: Gelte α x = 0. W¨ ahle k ∈ N mit (μj − T )k xj = 0 f¨ ur alle j. j=1 j j W¨ ahle Polynome P und Q mit P (μ)(μ1 − μ)k + Q(μ)
3
(μj − μ)k = 1
∀μ ∈ C.
j=1
Setze in diese Gleichung T statt μ ein und werte bei α1 x1 aus.
VI.8
Bemerkungen und Ausblicke
Nach sechs Kapiteln sind wir nun da angekommen, wo die Funktionalanalysis ihren Ausgangspunkt nahm: bei der L¨ osungstheorie linearer Integralgleichungen. Um die Jahrhundertwende war bekannt, daß diverse partielle Differentialgleichungen beherrscht werden k¨ onnen, indem man assoziierte Integralgleichungen l¨ ost. Allerdings gab es keine allgemeine Theorie der Integralgleichungen, sondern nur verschiedene Einzelbeitr¨age, und die Entwicklung einer solchen allgemeinen Theorie schien mit un¨ uberwindbaren ” Schwierigkeiten“ verbunden (Dieudonn´e [1981], S. 97). Aber hier trog der Schein. Dieudonn´e schreibt weiter (a.a.O., S. 98): It therefore came as a complete surprise when, in a short note published in 1900, Fredholm showed that the general theory of all integral equations [. . .] considered before him was in fact extremely simple [. . .].
¨ Fredholm (Ofversigt af Kongl. Svenska Vetenskaps-Akademiens F¨ orhandlingar 57 (1900) 39–46) gelangte zu seinen Resultaten, indem er eine Integralgleichung mit stetigem Kern x(s) + λ
1
k(s, t)x(t) dt = y(s)
(VI.35)
0
diskretisiert, die Determinante des entstehenden linearen Gleichungssystems studiert, wieder zum Limes u ¨bergeht und so die Reihe 1 ∞ λm 1 s , . . . , sm Δ(λ) = ··· K 1 ds1 . . . dsm s1 , . . . , sm m! 0 0 m=0 erh¨alt; hier wird K
s ,...,s 1 m = det k(si , tj ) i,j=1,...,m t1 , . . . , t m
VI.8
Bemerkungen und Ausblicke
313
gesetzt. Dann beweist er, daß (VI.35) eine stetige L¨osung besitzt, wenn Δ(λ) = 0 ist, und daß die (h¨ ochstens) eindeutige L¨osbarkeit umgekehrt Δ(λ) = 0 impliziert. In seiner nachfolgenden Arbeit (Acta Math. 27 (1903) 365–390) baut er diesen Ideenkreis zur vollen Fredholm-Alternative f¨ ur die Gleichung (VI.35) aus, und er entwickelt aus seiner Determinantentheorie explizite L¨osungsformeln f¨ ur (VI.35). In seiner 1. Mitteilung von 1904 (siehe die Bemerkungen und Ausblicke zu Kapitel V) gelang es Hilbert, Fredholms Resultate f¨ ur symmetrische stetige Kerne zu verfeinern. Er f¨ uhrt die Begriffe Eigenwert und Eigenfunktion f¨ ur die nichttrivialen L¨ osungen der homogenen Gleichung (VI.35) ein; seine Eigenwerte sind also die Reziproken der heutigen Eigenwerte. Insbesondere wird der Entwicklungssatz VI.4.3 bewiesen, allerdings unter der einschr¨ankenden Voraussetzung, daß – in den heutigen Begriffen – der Operator Tk : C[0, 1] → C[0, 1] dichtes Bild bzgl. der L2 -Norm hat. Ferner ben¨otigt Hilbert zun¨ achst die Annahme, daß alle Eigenwerte einfach sind, wovon er sich danach durch ein etwas umst¨ andliches St¨orungsargument befreit. Kurz darauf bewies Schmidt (Math. Ann. 63 (1907) 433–476) durch einen einfachen direkten determinantenfreien Zugang Hilberts S¨atze ohne weitere Einschr¨ankungen an den (stetigen) Kern; er betrachtet auch unstetige, aber quadratisch integrierbare Kerne und so die ersten Hilbert-SchmidtOperatoren. Die Zerlegung nicht selbstadjungierter kompakter Operatoren auf einem Hilbertraum, Satz VI.3.6, stammt im wesentlichen ebenfalls von Schmidt. Auch die in Abschnitt VI.4 diskutierte Orthogonalentwicklung des Kerns wurde von Hilbert und Schmidt angegeben; Mercer bewies seinen Satz in Phil. Trans. Roy. Soc. London (A) 209 (1909) 415–446. In seiner 4. Mitteilung von 1906 zeigte Hilbert den Spektralsatz VI.3.2 mit seiner Theorie der quadratischen Formen. Hier ist sein Zugang abstrakt und nicht auf Operatoren mit stetigem Kern beschr¨ankt. Er behandelt sogar beschr¨ ankte, nicht kompakte Operatoren auf 2 , denen wir uns in Kapitel VII widmen werden; und das macht es n¨otig, mit dem allgemeinen Begriff des Spektrums statt der Eigenwerte zu operieren. Aber f¨ ur den kompakten Fall gibt er ein unabh¨ angiges Argument (S. 201ff. der 4. Mitteilung), dessen Kern der Beweis der Existenz des ersten Eigenwerts ist (vgl. Lemma VI.3.1(f)). Wie schon in den Bemerkungen zu Kapitel V erw¨ahnt, betrachteten Hilbert und Schmidt statt Operatoren Bilinearformen, und sie arbeiteten nicht auf dem Hilbertraum L2 [0, 1], sondern dem Pr¨ahilbertraum C[0, 1]. Eine detaillierte Analyse der Beweise des Spektralsatzes nach Hilbert und Schmidt gibt Siegmund-Schultze (Arch. Hist. Exact Sci. 36 (1986) 359– 381); ein Nachdruck ihrer wichtigsten Arbeiten ist vor kurzem erschienen (Hilbert/Schmidt [1989]). F¨ ur eine moderne Darstellung unendlichdimensionaler Determinanten siehe Kapitel 4 in Pietsch [1987]. Die Motivation zur spektralen Zerlegung eines Operators entsprang zum Teil der Theorie der Sturm-Liouville-Probleme. Wir skizzieren dazu einen
314
VI.
Spektraltheorie kompakter Operatoren
sehr einfachen Fall. Sei p: [a, b] → R stetig differenzierbar, q: [a, b] → R stetig, und es gelte p(t) > 0 f¨ ur alle t ∈ [a, b]. Wir betrachten eine gew¨ohnliche Differentialgleichung in sog. selbstadjungierter Form Ly := (py ) + qy = g, wo g ∈ C[a, b] gegeben und y ∈ C 2 [a, b] gesucht ist. Unter einem regul¨ aren Sturm-Liouville-Problem versteht man das Randwertproblem Ly = g,
y(a) = y(b) = 0.
(VI.36)
(Tats¨achlich kann man noch allgemeinere Randvorgaben zulassen.) Wir setzen voraus, daß (VI.36) eindeutig l¨ osbar ist, was unter qualitativen Gesichtspunkten keine Einschr¨ ankung ist, da man ansonsten statt q die Funktion q +λ0 f¨ ur ein geeignetes λ0 ∈ R betrachtet. In der Theorie der gew¨ohnlichen Differentialgleichungen zeigt man, daß dann die L¨osung von (VI.36) in der Form b
y(s) =
k(s, t)g(t) dt
∀s ∈ [a, b]
(VI.37)
a
angegeben werden kann. Die Funktion k heißt die Greensche Funktion des Sturm-Liouville-Problems (VI.36). Sie ist symmetrisch und stetig auf [a, b] × [a, b], so daß durch (VI.37) ein selbstadjungierter kompakter Operator T auf dem Pr¨ ahilbertraum (C[a, b], . L2 ) definiert wird, der invers zu L mit dem Definitionsbereich {y ∈ C 2 [a, b]: y(a) = y(b) = 0} ist. Der Spektralsatz garantiert nun, daß es eine Orthonormalbasis von L2 [a, b] aus (stetigen) Eigenfunktionen von T (d.h. aus Eigenfunktionen von L) gibt; im Fall p = q = 1 ist das das trigonometrische System. Singul¨are SturmLiouville-Probleme sind solche, wo statt eines kompakten Intervalls auch unbeschr¨ankte Intervalle zugelassen sind oder wo p am Rand von [a, b] verschwinden darf. Der Greensche Operator hierzu ist i.a. nicht kompakt, und zur funktionalanalytischen Analyse bedarf es der Spektralzerlegung beschr¨ankter oder sogar unbeschr¨ ankter Operatoren, die im n¨achsten Kapitel durchgef¨ uhrt wird. Riesz’ bereits in Kapitel I und II genannte Arbeit aus Acta Math. 41 (1918) 71–98 enth¨ alt die Spektraltheorie kompakter Operatoren, wie sie in Abschnitt VI.2 dargelegt ist. Obwohl er eigentlich nur kompakte Integraloperatoren auf C[0, 1] betrachtet, sind seine Argumente vollkommen allgemein (siehe das auf S. 41 wiedergegebene Zitat); sie sind so elegant, daß sie bis heute nicht vereinfacht wurden. Seine Resultate wurden durch Schauder (Studia Math. 2 (1930) 183–196) komplementiert, der gleichzeitig den adjungierten Operator betrachtete. Riesz’ Idee, Kern und Bild von (Id − T )n zu analysieren, ist sicherlich durch die Konstruktion der Jordanschen Normalform einer Matrix nach dieser Methode inspiriert (siehe E. Weyr, Monatshefte f. Math. u. Physik 1 (1890) 163–236; in B¨ uchern u ¨ ber lineare
VI.8
Bemerkungen und Ausblicke
315
Algebra wird Lemma VI.2.2 im endlichdimensionalen Fall h¨aufig Fitting zugeschrieben, der aber erst 10 Jahre alt war, als Riesz seine Arbeit schrieb). Die Klasse der Operatoren, auf die sich die Rieszsche Theorie erstreckt, umfaßt außer den kompakten Operatoren noch solche, f¨ ur die irgendeine Potenz T m kompakt ist; siehe z.B. Pietsch [1987], S. 147. Da sich das Spektrum eines kompakten Operators auf {0} reduzieren kann, kann es vorkommen, daß aus Theorem VI.2.5 keine Aussagen u ¨ ber die Zerlegbarkeit eines kompakten Operators gewonnen werden k¨onnen. Es stellt sich dann die Frage nach der Existenz von invarianten Unterr¨aumen eines Operators T ∈ L(X), d.h., ob es einen abgeschlossenen Unterraum {0} = U = X mit T (U ) ⊂ U gibt. Hier gilt der gefeierte Satz von Lomonosov aus dem Jahre 1973: • Sei S = 0 ein kompakter Operator auf einem Banachraum X. Dann besitzt S einen invarianten Unterraum, der f¨ ur jedes T ∈ L(X), das mit S kommutiert, ebenfalls invariant ist. Insbesondere besitzt jeder Operator, f¨ ur den irgendeine Potenz kompakt ist, einen invarianten Unterraum. Lomonosovs Beweis, der auf einem Fixpunktargument beruht, ist bei Bollob´as [1990] und Heuser [1992] dargestellt; dort findet man auch eine spektraltheoretische Beweisvariante nach Hilden und Michaels. In der anderen Richtung war bis vor wenigen Jahren kein einziges Beispiel eines stetigen linearen Operators auf einem Banachraum bekannt, der keinen invarianten Unterraum besitzt, und bis heute kennt man keine solchen Operatoren auf reflexiven Banachr¨ aumen. Das erste Gegenbeispiel stammt von Enflo; seine 1981 eingereichte Arbeit erschien erst 1987 in Acta Math. 158 (1987) 213–313. Offenbar auf Grund ihrer immensen Komplexit¨at ben¨otigten die Herausgeber mehrere Jahre, sie auf ihre Korrektheit zu u ufen. Mit ¨ berpr¨ einer anderen Methode hat Read (Bull. London Math. Soc. 16 (1984) 337– 401, J. London Math. Soc. 33 (1986) 335–348) Gegenbeispiele konstruiert; er hat auch gezeigt, daß auf jedem Banachraum, der einen zu 1 isomorphen komplementierten Teilraum enth¨ alt (z.B. L1 ), ein Operator ohne invariante Unterr¨aume existiert. Zu diesem Themenkomplex siehe Beauzamy [1988]. Nukleare Operatoren auf Hilbertr¨ aumen wurden zuerst von Schatten und von Neumann (Ann. of Math. 47 (1946) 608–630) studiert, auf Banachr¨aumen kommen sie zuerst bei Ruston (Proc. London Math. Soc. 53 (1951) 109–124) und Grothendieck (C. R. Acad. Sc. Paris 233 (1951) 1556– 1558) vor. Der Name nuklear“ leitet sich daher ab, daß diese Operatoren ” im Zusammenhang mit L. Schwartz’ Satz vom Kern aus der Distributionentheorie (Abschnitt VIII.9) eine Rolle spielen. Schatten und von Neumann betrachten auch die Klasse cp derjenigen Operatoren auf Hilbertr¨aumen, deren singul¨are Zahlen eine Folge in p bilden. Dies ist ein linearer Raum, p 1/p auf dem T → eine Norm ist, die cp zu einem Banachraum n sn (T ) ) macht. Diese Schattenklassen werden bisweilen als nichtkommutative p -
316
VI.
Spektraltheorie kompakter Operatoren
(oder Lp -) R¨aume bezeichnet, mit denen sie viele Eigenschaften teilen. Z.B. ist analog zu Satz II.2.3 (cp ) zu cq isometrisch isomorph, falls p1 + 1q = 1; hier spielt das Spurfunktional tr dieselbe Rolle wie das Summenfunktional f¨ ur Folgenr¨aume und das Integral f¨ ur Funktionenr¨aume. Das nichtkommutative Analogon zur Aussage von Aufgabe III.6.6 gilt ebenfalls: Jedes Funktional ∈ L(H) kann als = 1 + 2 mit 1 (T ) = tr(ST ) f¨ ur ein S ∈ N (H) und 2 |K(H) = 0 geschrieben werden, und, was der springende Punkt ist, es gilt = 1 + 2 . Dies ist ein Resultat von Dixmier (Ann. of Math. 51 (1950) 387–408). In Analogie zur Spur von nuklearen Operatoren auf Hilbertr¨aumen liegt es auch bei nuklearen Operatoren auf Banachr¨aumen nahe, eine Spur durch tr T =
∞
xn (xn ) f¨ ur
n=1
T =
∞
xn ⊗ xn
n=1
definieren zu wollen; hier gibt es jedoch das Problem der Wohldefiniertheit, denn es ist nicht klar (und in der Tat im allgemeinen falsch), daß n xn (xn ) nur von T und nicht von seiner Darstellung abh¨angt. Die Wohldefiniertheit gilt genau dann, wenn der Banachraum X die Approximationseigenschaft (siehe S. 88) besitzt (Lindenstrauss/Tzafriri [1977], S. 32). Der Satz von Hahn-Banach garantiert, daß es auf jedem Banachraum viele“ stetige Funktionale gibt; aber er sagt nichts u ¨ ber die Reichhaltigkeit ” an Operatoren. Aus Funktionalen kann man die eindimensionalen Operatoren x ⊗ x basteln und aus diesen absolut konvergente Reihen zusammensetzen. Daher garantiert der Satz von Hahn-Banach zumindest, daß es auf jedem Banachraum viele“ nukleare Operatoren gibt, aber m¨oglicherweise ” keine weiteren stetigen Operatoren (außer dem identischen Operator). Man vermutet, daß ein Banachraum X existiert, so daß jedes T ∈ L(X) in der Form λ Id + S mit einem nuklearen Operator S geschrieben werden kann; aber solch einen Raum zu konstruieren ist bis heute noch niemandem gelungen. Das st¨arkste Resultat dieser Art wurde vor kurzem von Argyros und Haydon geliefert (Acta Math. 206 (2011) 1–54): Es gibt einen Banachraum, auf dem jeder Operator von der Form λ Id + S mit einem kompakten Operator S ist. Die Konstruktion dieses Beispiels kombiniert Ans¨atze von Bourgain und Delbaen einerseits und Gowers und Maurey andererseits. In dieser Richtung ist auch ein Ergebnis von K. John bemerkenswert, der f¨ ur die von Pisier (Acta Math. 151 (1983) 181–208) studierten Banachr¨aume P zeigt, daß jeder kompakte Operator von P nach P ∗ nuklear ist (Math. Ann. 287 (1990) 509–514). Weyl bewies seine Ungleichung in Proc. Nat. Acad. Sci. USA 35 (1949) 408–411. Er zeigte sogar eine pr¨ azisere Form seiner Ungleichung, n¨amlich •
N n=1
|λn (T )|p ≤
N n=1
|sn (T )|p
∀N ∈ N;
VI.8
Bemerkungen und Ausblicke
317
hierf¨ ur m¨ ussen die Folgen der Eigenwerte und der singul¨aren Zahlen betragsm¨aßig fallend angeordnet sein. Der Beweis im Text, der Reed/Simon [1978], S. 318, folgt, impliziert die Vergleichbarkeit der endlichen Abschnitte nicht. Varianten der Weylschen Ungleichung f¨ ur Operatoren auf Banachr¨aumen wurden von H. K¨ onig gezeigt und auf Fragen der Eigenwertverteilung von Integraloperatoren angewendet; dar¨ uber geben die Monographien von K¨onig [1986] und Pietsch [1987] Auskunft. F¨ ur nukleare Operatoren aumen gilt i.a. auf Banachr¨ nicht mehr die Eigenwertabsch¨atzung λn (T ) ∈ 1 , sondern nur noch λn (T ) ∈ 2 . Das folgt aus Aufgabe VI.7.19(c) und dem Prinzip der verwandten Operatoren, welches f¨ ur Operatoren S1 : X → Y und S2 : Y → X besagt, daß T = S2 S1 ∈ L(X) dieselben in ihrer algebraischen Vielfachheit gez¨ahlten Eigenwerte besitzt wie S = S1 S2 ∈ L(Y ), falls T kompakt ist (vgl. Pietsch [1987], S. 150); T und S heißen verwandt. Johnson, K¨onig, Maurey und Retherford (J. Funct. Anal. 32 (1979) 353–380) haben bewiesen, daß nur in Hilbertr¨aumen alle nukleare Operatoren summierbare Eigenwerte haben: • Ist X ein Banachraum, so daß f¨ ur jeden nuklearen Operator auf X die Eigenwertfolge in 1 liegt, so ist X zu einem Hilbertraum isomorph. Die Schlußfolgerung λn (T ) ∈ 2 f¨ ur nukleare Operatoren auf Banachr¨aumen kann – zumindest f¨ ur X = L1 oder X = L∞ nicht verbessert werden. Das sieht man mit Hilfe von Aufgabe VI.7.8 so. Sei f eine stetige 2π-periodische Funktion. Deren Fourierkoeffizienten sind dann genau die Eigenwerte des assoziierten Faltungsoperators, und nach Beispiel VI.5(c) ist das ein nuklearer Operator auf L∞ [0, 2π] oder L1 [0, 2π]. Es bleibt, f so zu w¨ahlen, daß die Folge der Fourierkoeffizienten in keinem p f¨ ur p < 2 liegt. (Nach der Besselschen Ungleichung liegt sie auf jeden Fall in 2 .) Das erste Beispiel einer solchen stetigen Funktion stammt von Carleman, der 1923 bewies, daß die Reihe ∞
ein log n eint 1/2 (log n)2 n n=2 gleichm¨aßig konvergiert (Zygmund [1959], vol. I, S. 199). Dasselbe Beispiel zeigt nach Korollar VI.6.8(a), daß solch ein Operator nicht nuklear auf L2 [0, 2π] sein kann, obwohl es sich um einen Integraloperator mit stetigem Kern handelt. In Zusammenhang mit dem Beispiel von Carleman ist noch ein Resultat von Paley und Zygmund von 1932 erw¨ ahnenswert: β 2 • Ist (cn ) ∈ 2 (Z) und gilt ∞ < ∞ f¨ ur ein β > 1, n=1 |cn | log |n| so konvergiert n∈Z ±cn eint f¨ ur fast alle Wahlen von Vorzeichen gleichm¨ aßig.
318
VI.
Spektraltheorie kompakter Operatoren
(Zygmund [1959], vol. I, S. 219.) Damit ist folgendes gemeint. Seien Xn , n ∈ Z, unabh¨angige Zufallsvariable auf einem Wahrscheinlichkeitsraum Ω, die mit jeweils der Wahrscheinlichkeit 12 den Wert +1 bzw. −1 annehint men. Es sei A ⊂ Ω die Menge derjenigen ω, f¨ ur die n∈Z Xn (ω)cn e gleichm¨aßig konvergiert. Dann besitzt A die Wahrscheinlichkeit 1. Auch auf diese Weise erh¨ alt man also die Existenz von stetigen Funktionen, deren Fourierkoeffizienten in keinem p f¨ ur p < 2 liegen; aber man kann die passende Wahl der Vorzeichen nicht konkret angeben. Einen weiteren Existenzbeweis gibt Wojtaszczyk [1991], S. 100, der mit dem Baireschen Kategoriensatz und dem Satz vom abgeschlossenen Graphen argumentiert. Zu zuf¨alligen trigonometrischen Reihen siehe Kahane [1985]. Dort findet man auch einen Beweis des nachstehenden Satzes von de Leeuw, Kahane und Katznelson (a.a.O., S. 63), der jede Hoffnung auf eine sch¨arfere notwendige Bedingung an die Betr¨ age der Fourierkoeffizienten einer stetigen Funktion als (cn ) ∈ 2 (Z) zunichte macht. • Ist (an ) ∈ 2 (Z), so existiert eine Folge (cn ) ∈ 2 (Z) mit |cn | ≥ |an | f¨ ur alle n, so daß n∈Z cn eint die Fourierreihe einer stetigen Funktion ist. F¨ ur Operatoren auf Hilbertr¨ aumen ist noch der Satz von Lidski˘ı aus dem Jahre 1959 wichtig; er besagt ∞ • tr(T ) = λn (T ) ∀T ∈ N (H). n=1
F¨ ur selbstadjungiertes T folgt diese Formel unmittelbar aus der Definition der Spur und dem Spektralsatz; der Beweis des allgemeinen Falls ist sehr viel schwieriger. Man findet verschiedene Beweise z.B. in Reed/Simon [1978], S. 328, oder Pietsch [1987], S. 218. In Abschnitt VI.6 haben wir der Einfachheit halber nur Hilbert-SchmidtOperatoren von einem Hilbertraum in sich selbst betrachtet; man k¨onnte ebenso Operatoren zwischen verschiedenen Hilbertr¨aumen heranziehen. Im Zusammenhang mit dem Rellichschen Einbettungssatz V.2.13 ist dann die Tatsache erw¨ahnenswert, daß f¨ ur k > n/2 die identische Einbettung von H0m+k (Ω) nach H0m (Ω), Ω ⊂ Rn offen und beschr¨ankt, ein Hilbert-SchmidtOperator ist (Adams [1975], S. 174). Als Analogon der Hilbert-SchmidtOperatoren im Banachraumkontext sind die von Pietsch eingef¨ uhrten absolut 2-summierenden Operatoren anzusehen, die durch die Forderung x (xn ) ∈ 2 ∀x ∈ X ⇒ T xn ∈ 2 definiert sind. Diese Operatoren brauchen nicht mehr kompakt zu sein, aber ihr Quadrat ist es; in der Tat ist das Produkt zweier absolut 2-summierender Operatoren – wie bei Hilbert-Schmidt-Operatoren – stets nuklear. F¨ ur diese Operatorklasse sei ebenfalls auf K¨ onig [1986], Pietsch [1987] sowie Wojtaszczyk [1991] verwiesen.
Kapitel VII
Spektralzerlegung selbstadjungierter Operatoren
VII.1
Der Spektralsatz fu ankte Operatoren ¨r beschr¨
In diesem Kapitel bezeichnet H stets einen komplexen Hilbertraum. Ist T ein normaler Operator auf Cn , so kann – wie aus der linearen Algebra bekannt – T diagonalisiert werden, d.h., T ist unit¨ar ¨aquivalent zu einer Diagonalmatrix D: U T U −1 = D Eine andere Formulierung ist T =
μj Ej ,
(VII.1)
wobei die μj die paarweise verschiedenen Eigenwerte von T und die Ej die Orthogonalprojektionen auf die zugeh¨ origen Eigenr¨aume sind. Hier ist eine weitere Formulierung: Ist T diagonalisierbar, so sind die Diagonalelemente der Matrix D genau die in ihrer Vielfachheit gez¨ahlten Eigenwerte von T , etwa λ1 , . . . , λn . Damit ist f¨ ur x ∈ Cn die i-te Komponente von U T U −1 x nichts anderes als das λi -fache der i-ten Komponente von x: (U T U −1 x)i = λi xi , und D kann so als Multiplikationsoperator aufgefaßt werden. Auf diese Weise kann man f¨ ur stetige Funktionen f die Matrix f (T ) definieren, n¨amlich durch (U f (T )U −1 x)i = f (λi )xi , vorausgesetzt, die Eigenwerte von T √liegen im Definitionsbereich von f . (Denke z.B. an f (t) = et oder f (t) = t!) Ist nun T ein kompakter normaler Operator auf einem Hilbertraum H, so gilt eine (VII.1) entsprechende
D. Werner, Funktionalanalysis, 7. Aufl., Springer-Lehrbuch, DOI 10.1007/978-3-642-21017-4_7, © Springer-Verlag Berlin Heidelberg 2011
320
VII.
Spektralzerlegung selbstadjungierter Operatoren
Darstellung, wo die endliche Summe allerdings durch eine unbedingt konvergente unendliche Reihe ersetzt ist (siehe Korollar VI.3.3). Auch dieses Resultat kann so gedeutet werden, daß T unit¨ar ¨aquivalent zum Multiplikationsoperator mit der Folge der in ihrer Vielfachheit gez¨ahlten Eigenwerte auf 2 ist. Des weiteren haben wir diese Spektralzerlegung von T zum Anlaß genommen, um T 1/2 zu definieren, falls σ(T ) ⊂ [0, ∞) vgl. Satz VI.3.4. Ziel dieses Abschnitts ist es, analoge Resultate f¨ ur selbstadjungierte beschr¨ankte (d.h. stetige) Operatoren zu beweisen. (Die Beschr¨ankung auf selbstadjungierte Operatoren erfolgt aus technischen Gr¨ unden, die Modifikation f¨ ur normale Operatoren soll am Schluß kurz angesprochen werden.) Zuerst werden wir die Existenz eines Funktionalkalk¨ uls f¨ ur selbstadjungierte Operatoren nachweisen, d.h. die M¨ oglichkeit, f (T ) f¨ ur geeignete Funktionen f zu definieren. Das wird es m¨ oglich machen, T zu einem Multiplikationsoperator auf einem geeigneten L2 (μ)-Raum zu assoziieren und die zu (VII.1) analoge Darstellung zu erhalten (dann ist allerdings die Summe durch ein Integral bzgl. eines sog. Spektralmaßes zu ersetzen). Wir beginnen mit einem einfachen Lemma. F¨ ur T ∈ L(H) definiere den numerischen Wertebereich W (T ) durch W (T ) = {T x, x: x = 1}. ¨ W (T ) ist beschr¨ankt, also W (T ) kompakt. (Ubrigens kann man zeigen, daß W (T ) stets konvex ist.) Lemma VII.1.1 F¨ ur T ∈ L(H) gilt σ(T ) ⊂ W (T ). Beweis. Sei λ ∈ W (T ), also d := inf{|λ − μ|: μ ∈ W (T )} > 0. Es folgt f¨ ur x = 1 d ≤ |λ − T x, x| = |(λ − T )x, x| ≤ (λ − T )x x = (λ − T )x . Das zeigt, daß λ − T injektiv ist und daß (λ − T )−1 : ran(λ − T ) → H stetig ist (mit Norm ≤ d1 ). Damit ist λ − T ein Isomorphismus zwischen H und ran(λ − T ), so daß λ − T abgeschlossenes Bild besitzt. W¨are ran(λ − T ) nicht dicht, g¨abe es ein Element x0 ∈ ran(λ − T )⊥ mit x0 = 1. Es folgte dann 0 = (λ − T )x0 , x0 = λ − T x0 , x0 und daher λ ∈ W (T ) im Gegensatz zur Wahl dieser Gr¨oße. Daher ist ran(λ − T ) = H und λ ∈ ρ(T ).
2
F¨ ur selbstadjungiertes T ist W (T ) ⊂ R, so daß wir folgendes Korollar erhalten. Korollar VII.1.2 Ist T ∈ L(H) selbstadjungiert, so ist σ(T ) ⊂ R. Genauer gilt σ(T ) ⊂ [m(T ), M (T )], wo m(T ) = inf{T x, x: x = 1}, M (T ) = sup{T x, x: x = 1}. Speziell ist σ(T ) ⊂ [0, ∞) f¨ ur positives T.
VII.1
Der Spektralsatz f¨ ur beschr¨ ankte Operatoren
321
(Zur Erinnerung: T heißt positiv, falls stets T x, x ≥ 0 gilt; nach Satz V.5.6 sind positive Operatoren auf komplexen Hilbertr¨aumen selbstadjungiert.) Als n¨achstes versuchen wir, f (T ) f¨ ur f ∈ C(σ(T )) zu definieren. Sei n zun¨achst f ein Polynom (mit Koeffizienten in C), etwa f (t) = a tk . k k=0 n k 0 Es ist klar, daß mit f (T ) dann nur der Operator k=0 ak T (mit T = Id) gemeint sein kann. (Das w¨ urde man bei irgendeinem Operator auf irgendeinem Banachraum nicht anders machen.) Bei einem selbstadjungierten Operator hat man jedoch zwei Zusatzinformationen. Zum einen wird sich f¨ ur ein Polynom f (mit dieser Definition f¨ ur f (T )) f (T ) = f |σ(T ) ∞ erweisen (siehe unten). Zum anderen liegen die Polynomfunktionen auf σ(T ) dicht in C(σ(T )). Dazu verwende den Weierstraßschen Approximationssatz, der allerdings bis jetzt nur f¨ ur Funktionen auf einem Intervall bewiesen wurde (Satz I.2.10). Da jedoch jede stetige Funktion auf σ(T ) zu einer stetigen Funktion auf dem σ(T ) umfassenden Intervall [m(T ), M (T )] fortgesetzt werden kann (Satz B.1.5), folgt die behauptete Dichtheit. Das sind die wesentlichen Ingredienzien im Beweis des folgenden Satzes. Wir bezeichnen mit t die identische Funktion t → t und mit 1 die konstante Funktion t → 1. Satz VII.1.3 (Stetiger Funktionalkalk¨ ul) Sei T ∈ L(H) selbstadjungiert. Dann existiert genau eine Abbildung Φ: C(σ(T )) → L(H) mit (a) Φ(t) = T , Φ(1) = Id, (b) Φ ist ein involutiver Algebrenhomomorphismus, d.h. • Φ ist linear, • Φ ist multiplikativ (Φ(f · g) = Φ(f ) ◦ Φ(g)), • Φ ist involutiv (Φ(f ) = Φ(f )∗ ), (c) Φ ist stetig. Φ heißt der stetige Funktionalkalk¨ ul von T . Wir schreiben f (T ) := Φ(f ) f¨ ur f ∈ C(σ(T )). Beweis. Eindeutigkeit: Nach (c) ist Φ durch seine Werte auf dem dichten Unterraum der Polynomfunktionen eindeutig bestimmt. Wegen der Linearit¨at bestimmen die Φ(tn ), n ≥ 0, Φ eindeutig, wegen der Multiplikativit¨at reicht es schließlich, Φ(t) und Φ(1) zu kennen, und die sind in (a) vorgeschrieben. Existenz: Wir versuchen, das obige Argument r¨ uckw¨ narts zuk lesen, und definieren daher zun¨ achst f¨ ur ein Polynom f : t → k=0 ak t den Operator Φ0 (f ) = nk=0 ak T k . Wir fassen dabei f als Polynom im Sinn der Algebra bzw. als Polynomfunktion auf R, nicht aber als Polynomfunktion auf σ(T ) auf, denn hier k¨ onnte ein Wohldefiniertheitsproblem entstehen:
322
VII.
Spektralzerlegung selbstadjungierter Operatoren
Ist z.B. σ(T ) = {0, 1}, so erzeugen die Polynome t und t2 dieselbe Polynomfunktion auf σ(T ), aber es ist nicht a priori klar, daß auch T = T 2 gilt. Daß dieses Problem in Wahrheit nicht entsteht, ergibt sich sofort aus Φ0 (f ) = sup |f (λ)| = f |σ(T ) ∞.
(VII.2)
λ∈σ(T )
Zum Beweis dieser Behauptung ben¨ otigen wir die Aussage σ(Φ0 (f )) = {f (λ): λ ∈ σ(T )},
(VII.3)
die einstweilen akzeptiert sei. Mit Hilfe von (VII.3) schließt man n¨amlich, da Φ0 nach Definition (a) und (b) erf¨ ullt: Φ0 (f ) 2 = Φ0 (f )∗ Φ0 (f ) = Φ0 (f f ) (∗)
= sup{|λ|: λ ∈ σ(Φ0 (f f ))}
(∗∗)
= sup{|(f f )(λ)|: λ ∈ σ(T )} = sup{|f (λ)|2 : λ ∈ σ(T )}.
Bei (∗) haben wir uns der S¨ atze VI.1.6 und VI.1.7 bedient und bei (∗∗) die Gleichung (VII.3) auf f f angewandt; beachte, daß Φ0 (f f ) selbstadjungiert ist. Kommen wir nun zum Beweis von (VII.3), das f¨ ur konstante Polynome offensichtlich gilt. Ohne Einschr¨ ankung hat f also echt positiven Grad. Sei λ ∈ σ(T ). Da λ Nullstelle von f − f (λ) ist, gilt f (t) − f (λ) = (t − λ)g(t) f¨ ur ein Polynom g. Daher ist Φ0 (f ) − f (λ) = (T − λ)Φ0 (g) und, falls f (λ) ∈ ρ(Φ0 (f )) w¨are, folgte −1 −1 Id = (T − λ)Φ0 (g) Φ0 (f ) − f (λ) = Φ0 (f ) − f (λ) Φ0 (g)(T − λ) (bemerke, daß die Operatoren in ran(Φ0 ) kommutieren). Es w¨are dann λ ∈ ρ(T ). Daher muß f (λ) ∈ σ(Φ0 (f )) sein. Sei umgekehrt μ ∈ σ(Φ0 (f )). Faktorisiere das Polynom f − μ (= 0): f (t) − μ = a(t − λ1 ) · · · (t − λn ). Dann ist Φ0 (f ) − μ = a(T − λ1 ) · · · (T − λn ). W¨aren alle λi ∈ ρ(T ), w¨ are auch μ ∈ ρ(Φ0 (f )); also muß λi ∈ σ(T ) f¨ ur ein i sein. Wegen f (λi ) = μ ist μ ∈ {f (λ): λ ∈ σ(T )}. In (VII.2) haben wir nicht nur gezeigt, daß Φ0 als Abbildung vom Raum V0 der Polynomfunktionen auf σ(T ) nach L(H) wohldefiniert ist, sondern
VII.1
Der Spektralsatz f¨ ur beschr¨ ankte Operatoren
323
auch die Stetigkeit (sogar die Isometrie) von Φ0 : (V0 , . ∞ ) → L(H) nachgewiesen. Daher ist Φ0 eindeutig auf C(σ(T )) fortsetzbar, so daß die Fortsetzung (die Φ heiße) stetig ist. Ein einfaches Limesargument zeigt, daß Φ auch (b) erf¨ ullt. Um etwa die Involutivit¨ at von Φ zu sehen, approximiere f ∈ C(σ(T )) durch eine Folge von Polynomen (fn ). Dann ist Φ(f ) = Φ lim fn n→∞ = Φ lim fn (da g → g stetig ist) n→∞
= lim Φ(fn ) n→∞
(da Φ stetig ist)
= lim Φ0 (fn ) n→∞
= lim Φ0 (fn )∗ n→∞ ∗ = lim Φ0 (fn ) n→∞ ∗ = Φ lim fn
(da S → S ∗ stetig ist)
= Φ(f )∗ . Damit ist Satz VII.1.3 bewiesen.
2
In Korollar IX.3.8 werden wir einen anderen Beweis der Existenz des stetigen Funktionalkalk¨ uls f¨ ur selbstadjungierte (sogar normale) Operatoren mit Hilfe der Theorie der Banachalgebren geben. Als n¨achstes stellen wir einige Eigenschaften des stetigen Funktionalkalk¨ uls zusammen. Einen abgeschlossenen Unterraum von L(H), der mit zwei Operatoren S und T auch ST enth¨ alt, nennen wir eine Algebra von Operatoren. Satz VII.1.4 Sei T ∈ L(H) selbstadjungiert, f → f (T ) der stetige Funktionalkalk¨ ul auf C(σ(T )). Dann gelten: (a) f (T ) = f ∞ (= supλ∈σ(T ) |f (λ)|). (b) Ist f ≥ 0, so ist f (T ) ≥ 0 (d.h. f (T ) ist positiv ). (c) Aus T x = λx folgt f (T )x = f (λ)x. (d) Spektralabbildungssatz: σ f (T ) = f σ(T ) ) = {f (λ): λ ∈ σ(T )} . (e) {f (T ): f ∈ C(σ(T ))} ist eine kommutative Algebra von Operatoren. Alle f (T ) sind normal, f (T ) ist genau f¨ ur reellwertige f selbstadjungiert. Beweis. (a) ist bereits mit (VII.2) gezeigt, denn die Polynome liegen dicht. (b) Sei f ≥ 0. Schreibe f = g 2 mit g ∈ C(σ(T )), g ≥ 0. Dann ist f¨ ur alle x ∈ H f (T )x, x = g(T )x, g(T )∗ x = g(T )x, g(T )x = g(T )x, g(T )x = g(T )x 2 ≥ 0.
324
VII.
Spektralzerlegung selbstadjungierter Operatoren
(c) ist klar, wenn f ein Polynom ist, und folgt ansonsten durch das u ¨bliche Limesargument. (d) Ist f ein Polynom, so erh¨ alt man gerade (VII.3). Sei μ ∈ / f (σ(T )). Dann ist g := (f − μ)−1 ∈ C(σ(T )), und es ist g(f − μ) = (f − μ)g = 1. Folglich g(T )(f (T ) − μ) = (f (T ) − μ)g(T ) = Id, also μ ∈ ρ(f (T )). Das zeigt die Inklusion ⊂“. Umgekehrt sei μ = f (λ) ” f¨ ur ein λ ∈ σ(T ). W¨ ahle ein Polynom gn mit f − gn ∞ ≤ n1 , so daß auch |f (λ) − gn (λ)| ≤ n1 und f (T ) − gn (T ) ≤ n1 sind. Nach (VII.3) ist gn (λ) ∈ σ(gn (T )), also existiert xn ∈ H mit xn = 1 und (gn (T ) − gn (λ))(xn ) ≤ n1 (Aufgabe VII.5.9). Dann ist (f (T ) − μ)xn ≤
2 3 + (gn (T ) − gn (λ))xn ≤ , n n
also kann f (T ) − μ nicht stetig invertierbar sein (wenn u ¨berhaupt!). Daher folgt μ ∈ σ(f (T )). Alternativ kann man auch so schließen: μ−f (T ) ist Limes der Folge gn (λ) − gn (T ) , die aus nicht stetig invertierbaren Operatoren besteht. Nach Aufgabe VI.7.5 ist auch μ − f (T ) nicht stetig invertierbar. (e) ist jetzt klar. 2 Sei nun T kompakt und selbstadjungiert, und sei T =
∞
μk Ek
k=0
seine Spektralzerlegung gem¨ aß Korollar VI.3.3. Hier setzen wir μ0 = 0 ∈ σ(T ) und E0 = die Orthogonalprojektion auf ker(T ). (μk )k≥1 bezeichnet die Folge der Eigenwerte = 0. ∞Aus den Ergebnissen von Abschnitt VI.3 folgt, daß die Abbildung f → k=0 f (μk )Ek die Eigenschaften (a), (b) und (c) aus Satz VII.1.3 besitzt und daher den stetigen Funktionalkalk¨ ul von T beschreibt (hier ist nat¨ urlich f ∈ C(σ(T ))). Mit Hilfe des Funktionalkalk¨ uls kann man die Projektionen Ek zur¨ uckgewinnen: Da σ(T ) bis auf 0 nur isolierte Punkte hat, ist die Funktion (j ≥ 1) fj : σ(T ) = {0} ∪ {μ1 , μ2 , . . .} → R, stetig, und es gilt fj (T ) =
∞ k=1
fj (μj ) = 1, fj (t) = 0 sonst
fj (μk )Ek = Ej .
VII.1
325
Der Spektralsatz f¨ ur beschr¨ ankte Operatoren
Um auch f¨ ur beschr¨ ankte selbstadjungierte Operatoren die (wie auch immer) in ihnen steckenden Orthogonalprojektionen zu erhalten, kann man versuchen, f¨ ur {0, 1}-wertige Funktionen f auf σ(T ) einen Operator f (T ) zu definieren. Leider werden i.a. solche Funktionen auf σ(T ) nicht stetig sein, so daß der stetige Funktionalkalk¨ ul noch nicht ausreicht. Im weiteren werden wir f (T ) f¨ ur beschr¨ ankte meßbare Funktionen auf σ(T ) definieren. Dazu sei an die im Anhang A zusammengestellten Begriffe und Resultate aus der Integrationstheorie erinnnert. Sei M ⊂ C kompakt. Mit B(M ) bezeichne den Vektorraum der beschr¨ankten meßbaren Funktionen auf M . Wir werden folgendes Ergebnis ben¨otigen. Lemma VII.1.5 (a) B(M ), versehen mit . ∞ , ist ein Banachraum. (b) U ⊂ B(M ) habe die Eigenschaft: Falls fn ∈ U , supn fn ∞ < ∞ und f (t) := lim fn (t) f¨ ur alle t ∈ M existiert, dann ist f ∈ U .
n→∞
(∗)
Dann folgt U = B(M ), wenn nur C(M ) ⊂ U . Beweis. (a) ist klar (vgl. Satz A.1.5(c)). (b) Sei V der Schnitt u ¨ber alle Mengen S, C(M ) ⊂ S ⊂ B(M ), die die Eigenschaft (∗) besitzen. Das System dieser S ist nicht leer, da B(M ) dazugeh¨ort; es folgt C(M ) ⊂ V . Als erstes wird gezeigt, daß V ein Vektorraum ist. Zu f0 ∈ V setze Vf0 = {g ∈ B(M ): f0 + g ∈ V }. Sei nun f0 ∈ C(M ); dann ist C(M ) ⊂ Vf0 , und Vf0 hat (∗). Daher gilt V ⊂ Vf0 ; d.h. f0 ∈ C(M ), g ∈ V ⇒ f0 + g ∈ V. Sei nun g0 ∈ V . Nach dem gerade Bewiesenen ist C(M ) ⊂ Vg0 . Daher gilt V ⊂ Vg0 , da Vg0 (∗) hat. Es folgt g0 ∈ V, g ∈ V ⇒ g ∈ Vg0 ⇒ g + g0 ∈ V. Genauso zeigt man: α ∈ C, g ∈ V ⇒ αg ∈ V . Nun werden wir beweisen, daß alle Treppenfunktionen in V liegen. Daraus folgt dann V = B(M ), wie behauptet, da die Menge der Treppenfunktionen sogar . ∞ -dicht in B(M ) liegt (Satz A.1.5(e)). Es bezeichne Σ die σ-Algebra der Borelmengen von M . Es ist nur χE ∈ V f¨ ur alle E ∈ Σ zu zeigen, da V ein Vektorraum ist. Wir betrachten Δ = {E ∈ Σ: χE ∈ V }. Δ umfaßt alle (relativ) offenen Mengen, da f¨ ur offenes E stetige fn mit 0 ≤ fn ≤ 1 und limn→∞ fn (t) = χE (t) f¨ ur alle t existieren. Also umfaßt Δ einen durchschnittsstabilen Erzeuger von Σ. Nach einem Resultat der Maßtheorie gen¨ ugt es, folgende Bedingungen an Δ zu verifizieren, um Δ = Σ zu zeigen:1 1 Vgl.
Bauer [1990], S. 8, oder Behrends [1987], S. 26. Ein Mengensystem mit (1) und (2) heißt Dynkinsystem.
326
VII.
Spektralzerlegung selbstadjungierter Operatoren
(1) E, F ∈ Δ, E ⊂ F ⇒ F \ E ∈ Δ. (2) E1 , E2 , . . . ∈ Δ paarweise disjunkt ⇒ E := ∞ n=1 En ∈ Δ. Die Bedingung (1) folgt wegen χF \E = χF − χE aus der Vektorraumeigenschaft von V , und (2) gilt wegen χE = χEn (punktweise Konvergenz). Daher gilt Δ = Σ, was zu zeigen war. 2 Teil (b) besagt, daß B(M ) der kleinste Funktionenraum ist, der abgeschlossen gegen¨ uber punktweisen Limiten von gleichm¨aßig beschr¨ankten Folgen ist und alle stetigen Funktionen enth¨ alt. Nun zur Erweiterung des Funktionalkalk¨ uls. Seien x, y ∈ H sowie f ∈ C(σ(T )), wo T ∈ L(H) selbstadjungiert ist. Betrachte x,y (f ) = f (T )x, y. Dann ist x,y : C(σ(T )) → C linear (da f → f (T ) linear) und wegen |x,y (f )| ≤ f (T ) x y = f ∞ x y stetig. Es existiert also nach dem Rieszschen Darstellungssatz II.2.5 ein komplexes Maß μx,y mit f (T )x, y =
f dμx,y
∀f ∈ C(σ(T )).
(VII.4)
σ(T )
Beachte, daß die Abbildung H × H → M (σ(T )),
(x, y) → μx,y
sesquilinear ist (also bis auf μx,λy = λμx,y bilinear); des weiteren ist sie wegen μx,y = x,y ≤ x y (siehe oben) stetig. ( μ ist die Variationsnorm des Maßes μ, siehe Beispiel I.1(j).) Die rechte Seite der Gleichung (VII.4) ist jedoch auch f¨ ur f ∈ B(σ(T )) sinnvoll, und das gibt Anlaß, auch f¨ ur solche f einen Operator f (T ) zu definieren. Satz VII.1.6 (Meßbarer Funktionalkalk¨ ul) Sei T ∈ L(H) selbstadjungiert. Dann gibt es genau eine Abbildung Φ: B(σ(T )) → L(H) mit: (a) Φ(t) = T , Φ(1) = Id, ist ein involutiver Algebrenhomomorphismus, (b) Φ ist stetig, (c) Φ (d) fn ∈ B(σ(T )), supn fn ∞ < ∞ und fn (t) → f (t) f¨ ur alle t ∈ σ(T ) n )x, y → Φ(f )x, y f¨ implizieren Φ(f ur alle x, y ∈ H.
VII.1
Der Spektralsatz f¨ ur beschr¨ ankte Operatoren
327
) Beweis. Eindeutigkeit: Nach Satz VII.1.3 bestimmen (a), (b) und (c) Φ(f f¨ ur f ∈ C(σ(T )) eindeutig; (d) und Lemma VII.1.5 zeigen dann die Eindeutigkeit f¨ ur f ∈ B(σ(T )). Existenz: Seien f ∈ B(σ(T )), x, y ∈ H. Konstruiere die Maße μx,y wie oben und betrachte die Abbildung (x, y) → f dμx,y . σ(T )
Das ist eine stetige Sesquilinearform, denn f dμx,y ≤ f ∞ μx,y ≤ f ∞ x y . σ(T ) Nach dem Satz von Lax-Milgram (Aufgabe V.6.18) existiert ein eindeutig ) bezeichnet werde, mit Φ(f ) ≤ bestimmter stetiger Operator, der mit Φ(f f ∞ und )x, y = Φ(f f dμx,y ∀x, y ∈ H. σ(T )
Es sind noch (a), (b), (c) und (d) zu verifizieren; beachte, daß nach Kon ) = Φ(f ) = f (T ) f¨ struktion Φ(f ur stetige f ist. Daraus folgt bereits (a), und (c) ist auch schon gezeigt. Zu (d): Nach dem Lebesgueschen Konvergenzsatz folgt sofort n )x, y → Φ(f )x, y Φ(f f¨ ur x, y ∈ H unter den Voraussetzungen von (d). linear, und es gilt Φ(f ·g) = Φ(f )◦ Φ(g) Zu (b): Nach Konstruktion ist Φ f¨ ur stetige f und g. g) = Φ(f ) ◦ Φ(g)}. Sei nun g stetig. Setze U = {f ∈ B(σ(T )): Φ(f Nach der Vorbemerkung gilt C(σ(T )) ⊂ U . Um U = B(σ(T )) zu schließen, verwende Lemma VII.1.5(b): Seien fn ∈ U , supn fn ∞ < ∞, und gelte fn (t) → f (t) f¨ ur alle t ∈ σ(T ). Nach (d) ist einerseits n )(Φ(g)x), )(Φ(g)x), lim Φ(f y = Φ(f y
n→∞
und andererseits n )(Φ(g)x), n g)x, y = Φ(f g)x, y, lim Φ(f y = lim Φ(f
n→∞
n→∞
da fn ∈ U . Da x und y beliebig waren, folgt f ∈ U . Mit Lemma VII.1.5(b) schließen wir U = B(σ(T )). Als n¨achstes sei f meßbar und beschr¨ ankt. Setze V = {g ∈ B(σ(T )): Φ(f g) = Φ(f )Φ(g)}. Nach dem ersten Beweisschritt ist C(σ(T )) ⊂ V , und
328
VII.
Spektralzerlegung selbstadjungierter Operatoren
wie oben sieht man mit Hilfe von Lemma VII.1.5 V = B(σ(T )). Das heißt multiplikativ ist. aber, daß Φ ) = Φ(f )∗ f¨ Mit einer ¨ahnlichen Technik zeigt man Φ(f ur f ∈ B(σ(T )). 2 ) verwenden. BeWiederum werden wir die Schreibweise f (T ) statt Φ(f achte, daß die f (T ) paarweise kommutieren, denn f (T )g(T ) = (f g)(T ) = (gf )(T ) = g(T )f (T ), und normal sind. f (T ) ist selbstadjungiert f¨ ur reellwertiges f . Teil (d) aus Satz VII.1.6 kann noch verbessert werden, es gilt n¨amlich sogar: (d ) fn ∈ B(σ(T )), supn fn ∞ < ∞ und fn (t) → f (t) f¨ ur alle t ∈ σ(T ) implizieren fn (T )x → f (T )x f¨ ur alle x ∈ H. Beweis. Zun¨achst zeige fn (T )x → f (T )x : fn (T )x 2 = fn (T )x, fn (T )x = fn (T )∗ fn (T )x, x = (fn fn )(T )x, x → (f f )(T )x, x = f (T )x 2 ; hier haben wir (d) auf fn fn angewandt. Da in einem Hilbertraum nach Aufgabe V.6.5 zn → z schwach, zn → z ⇒ zn → z gilt, folgt nun (d ) aus (d).
2
Wir werden insbesondere an den Operatoren χA (T ) f¨ ur Borelmengen A interessiert sein und formulieren dazu zwei Lemmata. Lemma VII.1.7 F¨ ur Borelmengen A ⊂ σ(T ) ist EA := χA (T ) eine Orthogonalprojektion. 2 ∗ Beweis. Wegen χ2A = χA gilt EA = EA und wegen χA = χA gilt EA = EA (beachte noch Satz V.5.9). 2
Lemma VII.1.8 Sei T ∈ L(H) selbstadjungiert. Dann gilt: (a) χ∅ (T ) = 0, χσ(T ) (T ) = Id. (b) F¨ ur paarweise disjunkte Borelmengen A1 , A2 , . . . ⊂ σ(T ) und x ∈ H ist ∞ χA (T )x = χ∞ (T )x. i
i=1
i=1
Ai
(c) χA (T )χB (T ) = χA∩B (T ) f¨ ur Borelmengen A, B ⊂ σ(T ).
VII.1
329
Der Spektralsatz f¨ ur beschr¨ ankte Operatoren
Beweis. (a) aus Satz VII.1.6(a), (b) aus Satz VII.1.6(d ) (siehe S. 328) folgt n mit fn = i=1 χAi und (c) aus χA · χB = χA∩B und Satz VII.1.6(b). 2 Im allgemeinen ist
χAi (T ) = χ Ai (T ) falsch, da ja fast nie χAi (T )
→ 0 gilt (wann n¨ amlich nur?). Die Lemmata VII.1.7 und VII.1.8 sagen, daß die Abbildung E: A → χA∩σ(T ) (T ) (VII.5) im Sinne der folgenden Definition ein Spektralmaß ist. Definition VII.1.9 Sei Σ die Borel-σ-Algebra auf R. Eine Abbildung E: Σ → L(H), A → EA heißt Spektralmaß, falls alle EA Orthogonalprojektionen sind und (a) E∅ = 0, ER = Id, (b) f¨ ur paarweise disjunkte A1 , A2 , . . . ∈ Σ ∞ EAi (x) = E Ai (x) ∀x ∈ H i=1
gelten. Ein Spektralmaß E hat kompakten Tr¨ ager, falls eine kompakte Menge K mit EK = Id existiert. Man zeigt leicht, daß automatisch EA EB = EB EA = EA∩B gilt (Aufgabe VII.5.7). Als n¨ achstes soll erkl¨ art werden, wie eine beschr¨ankte meßbare Funktion f bez¨ uglich eines Spektralmaßes integriert wird. Dazu geht man wie bei der skalaren Integration in mehreren Schritten vor. Im 1. Schritt sei f = χA , A ∈ Σ, eine Indikatorfunktion. Dann soll nat¨ urlich f dE = EA sein. 2. Schritt: Sei f =
n i=1
αi χAi eine Treppenfunktion. Dann setze
f dE =
n
α i E Ai .
i=1
Es ist nun zu u u fen, daß diese Definition wirklich nur von f und nicht ¨ berpr¨ von der Darstellung αi χAi abh¨ angt. (Das ist sehr einfach.) 3. Schritt: Sei f beschr¨ankt und meßbar. Dann existiert eine Folge (fn ) von Treppenfunktionen, die gleichm¨ aßig gegen f konvergiert (Satz A.1.5(e)). Man ist nun versucht, f dE = lim
n→∞
fn dE
(VII.6)
zu setzen. Das ist gerechtfertigt durch das folgende Lemma. Lemma VII.1.10 F¨ ur eine Treppenfunktion f gilt f dE ≤ f ∞ .
330
VII.
Spektralzerlegung selbstadjungierter Operatoren
n Beweis. Sei x ≤ 1 und f = i=1 αi χAi , wobei die Ai ohne Einschr¨ankung paarweise disjunkt seien. Dann ist 2 2 f dE (x) αi EAi (x) = αi EAi (x) 2 = = |αi |2 EAi (x) 2 ≤ sup |αi |2 EAi (x) 2 i
2 2 = f 2∞ EAi x = f 2∞ E Ai (x) ≤ f 2∞ x 2 , wobei zweimal der Satz von Pythagoras benutzt wurde.
2
Im Hinblick auf (VII.6) impliziert Lemma VII.1.10, daß ( fn dE) eine Cauchyfolge in L(H) ist (da ja (fn ) eine . ∞ -Cauchyfolge ist) und folglich einen Limes besitzt. Gleichzeitig folgt, daß f dE durch (VII.6) wohldefiniert, d.h. unabh¨ angig von der approximierenden Folge (fn ) ist. F¨ ur das so definierte Integral benutzen wir die Bezeichnungen f dE, f (λ) dEλ , f dE etc. R
Hat E kompakten Tr¨ ager, etwa EK = Id, und ist f : K → C einebeschr¨ankte meßbare Funktion, so definieren wir f dE := K f dE durch R χK f dE; beachte, daß diese Definition von der Wahl von K unabh¨ angig ist, denn f¨ ur EK = Id und K ∩ A = ∅ gilt EA = 0 und deshalb χA f dE = 0. Der folgende Satz faßt zusammen, was wir u uglich ¨ber die Integration bez¨ eines Spektralmaßes entwickelt haben. Satz VII.1.11 F¨ ur ein Spektralmaß E und eine beschr¨ ankte meßbare Funktion f existiert f dE ∈ L(H). Die Abbildung f → f dE ist linear und stetig, genauer gilt f dE ≤ f ∞. Ist f reellwertig, so ist f dE selbstadjungiert. Ist K ⊂ R eine kompakte Menge mit EK = Id, so gen¨ ugt es, daß f auf K definiert und beschr¨ankt ist. Sei jetzt E ein Spektralmaß mit kompaktem Tr¨ager. Da alle Polynome auf kompakten Mengen beschr¨ ankt sind, ist f dE f¨ ur Polynome f erkl¨art. Speziell existiert T := λ dEλ ∈ L(H), und T ist selbstadjungiert. Wir haben also in (VII.5) einem beschr¨ ankten selbstadjungierten Operator ein Spektralmaß mit kompaktem Tr¨ ager zugeordnet, und soeben haben wir zu einem Spektralmaß mit kompaktem Tr¨ ager einen beschr¨ankten selbstadjungierten Operator assoziiert. Wir werden beweisen, daß das zueinander inverse Operationen sind.
VII.1
Der Spektralsatz f¨ ur beschr¨ ankte Operatoren
331
Zun¨achst sei E ein Spektralmaß mit kompaktem Tr¨ager, und sei T = λ dEλ . Es ist zu zeigen, daß das Spektralmaß von T , d.h. A → χA∩σ(T ) (T ), mit E u ¨ bereinstimmt. Sei f : σ(T ) → C beschr¨ankt und meßbar. Setze f auf R \ σ(T ) durch 0 fort und bezeichne die so auf R fortgesetzte Funktion mit f. Nach Satz VII.1.11 existiert der Operator Ψ(f ) := fdE,
und Ψ: B(σ(T )) → L(H) ist linear und stetig. Ψ ist auch multiplikativ (f¨ ur Treppenfunktionen ist das klar wegen EA EB = EA∩B , allgemein folgt es durch Approximation) und involutiv (¨ ahnliches Argument). Um zu zeigen, daß auch (d) aus Satz VII.1.6 gilt, bemerke, daß f¨ ur x, y ∈ H die Abbildung νx,y : A → EA x, y ein komplexes Maß ist und daß Ψ(f )x, y = f dνx,y (VII.7) gilt (klar f¨ ur Treppenfunktionen und einfach sonst); man braucht dann nur noch den Lebesgueschen Konvergenzsatz anzuwenden. Es bleibt zu u ¨berlegen, daß auch Id = Ψ(1) und T = Ψ(t) gelten. Die erste aquivalent zu Eσ(T ) = Id, und daraus folgt Behauptung ist ¨ dann Ψ(t) = σ(T ) λ dEλ = T nach Satz VII.1.11. Um Eσ(T ) = Id zu zeigen, w¨ ahle ein (aus technischen Gr¨ unden) halboffenes Intervall (a, b] mit E(a,b] = Id. Sei μ ∈ ρ(T ). Wir werden zuerst EU = 0 f¨ ur eine geeignete Umgebung U von μ zeigen. Da μ − T invertierbar ist, existiert nach Aufgabe VI.7.5 ein δ > 0 mit S − (μ − T ) ≤ δ ⇒ S invertierbar und S −1 ≤ C := (μ − T )−1 + 1. Wir d¨ urfen δ = b−a und δ < C1 annehmen, setzen ak = a + kδ f¨ ur N N k = 0, . . . , N und betrachten die Treppenfunktion f = k=1 ak χ(ak−1 ,ak ] . Satz VII.1.11 impliziert N T − f dE = T − a E ≤ δ, k k k=1
N
wo Ek = E(ak−1 ,ak ] . Also gilt wegen k=1 Ek = Id N (μ − ak )Ek ≤ δ. (μ − T ) − k=1
N Nach Wahl von δ bedeutet das, daß k=1 (μ − ak )Ek invertierbar und die Norm des inversen Operators ≤ C ist. Diese Norm ist jedoch andererseits
332
VII.
Spektralzerlegung selbstadjungierter Operatoren
sup{|μ − ak |−1 : Ek = 0}. Daher gilt Ek = 0, falls |μ − ak | < C1 ; also ist in der Tat EU = 0 f¨ ur eine Umgebung von μ. Sei jetzt K ⊂ ρ(T ) kompakt. Nach dem gerade Bewiesenen existieren zu μ ∈ K Umgebungen Uμmit EUμ = 0. Da K kompakt ist, gibt es endlich n viele μ1 , . . . , μn mit K ⊂ i=1 Uμi ; es folgt EK = 0. Da die positiven Maße A → EA x, x regul¨ ar sind (Satz I.2.14), ist Eρ(T ) x, x = 0 f¨ ur alle x; mit Korollar V.5.8 folgt Eρ(T ) = 0, d.h. Eσ(T ) = Id. Damit haben wir die Bedingungen (a)–(d) aus Satz VII.1.6 verifiziert und erhalten den folgenden Satz. Satz VII.1.12 Ist E ein Spektralmaß ager und T auf R mit kompaktem Tr¨ der selbstadjungierte Operator T = λ dEλ , so ist Ψ: B(σ(T )) → L(H), f → f dE σ(T )
der (gem¨ aß Satz VII.1.6 eindeutig bestimmte) meßbare Funktionalkalk¨ ul. Insbesondere ist Eσ(T ) = Id. Speziell ergibt sich f¨ ur meßbare A ⊂ σ(T ) χA (T ) = Ψ(χA ) = χA dE = EA , d.h. das gem¨aß (VII.5) zu T assoziierte Spektralmaß stimmt mit dem T definierenden Spektralmaß u ¨ berein. Ist umgekehrt ein selbstadjungierter Operator T gegeben, E sein assoziiertes Spektralmaß (gem¨ aß (VII.5)) und schließlich S definiert durch λ dEλ , so ist S = T : Zun¨ achst hat E kompakten Tr¨ager wegen χσ(T ) (T ) = Eσ(T ) = Id. W¨ahle eine Treppenfunktion f auf σ(T ) mit f − t ∞ ≤ ε. Dann ist T − S ≤ T − f (T ) + f (T ) − Ψ(f ) + Ψ(f ) − S ≤ 2ε (hier bezeichnet f (T ) den Funktionalkalk¨ ul von T (Satz VII.1.6), Ψ(f ) den von S (Satz VII.1.12)), da nach Satz VII.1.6 T − f (T ) ≤ t − f ∞ ≤ ε sowie nach Satz VII.1.11
S − Ψ(f ) = (t − f ) dE ≤ t − f ∞ ≤ ε σ(T )
gelten; außerdem ist f (T ) − Ψ(f ) = f¨ ur f =
αi χAi (T ) −
αi EAi = 0
αi χAi nach Definition, denn EAi = χAi (T ).
VII.1
333
Der Spektralsatz f¨ ur beschr¨ ankte Operatoren
Die bisherige Diskussion faßt der zentrale Satz dieses Abschnitts zusammen. Theorem VII.1.13 (Spektralsatz f¨ ur selbstadjungierte beschr¨ankte Operatoren) Sei T ∈ L(H) selbstadjungiert. Dann existiert ein eindeutig bestimmtes Spektralmaß mit kompaktem Tr¨ ager E auf R mit T = λ dEλ . (VII.8) σ(T )
Die Abbildung f → f (T ) = f (λ) dEλ definiert den meßbaren Funktionalkalk¨ ul. f (T ) ist bestimmt durch (vgl. (VII.7)) f (T )x, y = f (λ) dEλ x, y. σ(T )
∞
(VII.8) ist die T = i=1 λi Eλi verallgemeinernde Formel! Sie zeigt, daß T aus den Orthogonalprojektionen EA , A ⊂ σ(T ), zusammengesetzt ist, jedoch i.a. auf kontinuierliche“ Weise, n¨amlich als Integral und nicht ” als Summe. Noch etwas zur Bezeichnung: Das Symbol dEλ x, y bezeichnet die Integration bzgl. des Borelmaßes A → EA x, y, es ist dasselbe Maß, das in (VII.4) mit μx,y bezeichnet wurde. Sei nun S ∈ L(H) ein weiterer beliebiger Operator. Die Mengenfunktion A → SEA x, y = EA x, S ∗ y ist dann ebenfalls ein Maß. Korollar VII.1.14 Sei T ∈ L(H) selbstadjungiert und E sein Spektralmaß. Ein Operator S ∈ L(H) vertauscht genau dann mit T (d.h. ST −T S = 0), wenn S mit allen EA vertauscht. Beweis. S vertauscht mit T genau dann, wenn S mit allen T n , n ≥ 0, vertauscht, und das heißt ST n x, y = T n Sx, y
∀x, y ∈ H, n ≥ 0.
Dies wiederum ist ¨ aquivalent zu λn dSEλ x, y = λn dEλ Sx, y
∀x, y ∈ H, n ≥ 0,
denn es gilt ∗
ST x, y = T x, S y = n
n
n
∗
λ dEλ x, S y =
λn dSEλ x, y
und analog T n Sx, y = λn dEλ Sx, y. Damit stimmen die beiden Maße dSEλ x, y und dEλ Sx, y, aufgefaßt als Funktionale auf C(σ(T )), auf den
334
VII.
Spektralzerlegung selbstadjungierter Operatoren
Polynomen u ¨ berein und damit auch auf deren Abschluß. Mit Hilfe des Weierstraßschen Approximationssatzes und des Rieszschen Darstellungssatzes schließt man daraus, daß S genau dann mit T vertauscht, wenn SEA x, y = EA Sx, y
∀x, y ∈ H, A ∈ Σ
gilt, d.h. EA S = SEA f¨ ur alle Borelmengen A.
2
Beispiele. (a) H sei endlichdimensional, also H = Cn . Besitzt der selbstadjungierte Operator T die m paarweise verschiedenen Eigenwerte μ1 , . . . , μm , so gilt bekanntlich m T = μi E{μi } , (VII.9) i=1
wo E{μi } die Orthogonalprojektion auf den Eigenraum ker(μi − T ) von μi ist. Das Spektralmaß von T ist dann (A ∈ Σ) EA = E{μi } , {i: μi ∈A}
und Theorem VII.1.13 reduziert sich auf die Formel (VII.9). (b) H sei beliebig und T selbstadjungiert und kompakt. Nach dem Spektralsatz f¨ ur kompakte Operatoren ist (Korollar VI.3.3) T =
∞
μi E{μi }
(VII.10)
i=1
(μi in der Bedeutung wie oben); auch das Spektralmaß schreibt sich wie oben als EA = μi ∈A E{μi } , wobei diese Reihe nur punktweise konvergiert, nicht in der Operatornorm. ((VII.10) konvergiert in der Normtopologie.) (c) Sei H = L2 [0, 1], (T x)(t) = t·x(t). T ist selbstadjungiert mit σ(T ) = [0, 1]. T besitzt keine Eigenwerte, d.h. σ(T ) = σc (T ) (vgl. Aufgabe VII.5.8). Die Spektralzerlegung von T sieht so aus: Zu A ∈ Σ setze EA x = χA∩[0,1] x. Es ist leicht zu sehen, daß E ein Spektralmaß mit kompaktem Tr¨ager ist. E stellt T dar: λ dEλ x, y = λx(λ)y(λ) dλ = T x, y, 1 da EA x, y = A∩[0,1] x(λ)y(λ) dλ = 0 χA (λ)x(λ)y(λ) dλ; dEλ x, y hat also bzgl. des Lebesguemaßes die Dichte xy ∈ L1 . Das zeigt T = λ dEλ . (d) T ∈ L(H) sei positiv, dann ist die Wurzelfunktion auf σ(T ) definiert und stetig (vgl. Korollar VII.1.2). Man kann also T 1/2 gem¨aß Satz VII.1.3 (oder VII.1.13, was auf dasselbe hinausl¨ auft) definieren. Nach Satz VII.1.4 ist T 1/2 positiv, und (das war ja der Sinn der Sache) (T 1/2 )2 = T . Sei S ein weiterer positiver Operator mit S 2 = T . Wir werden S = T 1/2 zeigen. Dazu ben¨otigen wir den folgenden Satz.
VII.1
Der Spektralsatz f¨ ur beschr¨ ankte Operatoren
335
Satz VII.1.15 S ∈ L(H) sei selbstadjungiert, g: σ(S) → R und f : R → R seien meßbar und beschr¨ ankt. Dann ist (f ◦ g)(S) = f g(S) . Beweis. Zun¨achst ist f ◦ g meßbar, also (f ◦ g)(S) gem¨aß Theorem VII.1.13 wohldefiniert. Da g reellwertig ist, ist g(S) selbstadjungiert und besitzt ein eindeutig bestimmtes Spektralmaß E. Das Spektralmaß von S sei F . Es reicht nun, die Behauptung f¨ ur Indikatorfunktionen f = χA (A ∈ Σ) zu beweisen, da mit der schon mehrfach verwandten Technik so auf Treppenfunktionen und anschließend auf meßbare f zu schließen ist. Wegen χA ◦ g = χg−1 (A) ist zu zeigen (bemerke g −1 (A) ∈ Σ f¨ ur A ∈ Σ): Fg−1 (A) = EA
∀A ∈ Σ.
¨ Nach der Definition heißt das, daß die Ubereinstimmung der Maße μx,y (A) = EA x, y νx,y (A) = Fg−1 (A) x, y gezeigt werden muß. F¨ ur n ≥ 0 gilt nun λn dνx,y = g(λ)n dFλ x, y, denn νx,y ist das sog. Bildmaß von dFλ x, y unter g; die obige Gleichung ist dann als Transformationssatz f¨ ur Bildmaße in der Maßtheorie bekannt; siehe z.B. Bauer [1990], S. 125, oder Behrends [1987], S. 131. Also gilt n n n λ dνx,y = (g(S)) x, y = λ dEλ x, y = λn dμx,y . Wie im Beweis von Korollar VII.1.14 liefern die S¨atze von Riesz und Weierstraß die Behauptung. 2 2 Um Beispiel 1/2 (d) abzuschließen, verwenden wir g(t) = t und f (t) = tχσ(T ) (t) . Da σ(S) ⊂ [0, ∞) gefordert war, ist f ◦ g = t. Satz VII.1.15 liefert dann S = (f ◦ g)(S) = f g(S) = f (T ) = T 1/2 .
Genauso sieht man: Korollar VII.1.16 Zu positivem T ∈ L(H) und n ∈ N existiert genau ein positives S ∈ L(H) mit S n = T . Wie im kompakten Fall setzt man |T | = (T ∗ T )1/2 , und wie im kompakten Fall erh¨alt man die Polarzerlegung eines beschr¨ankten Operators:
336
VII.
Spektralzerlegung selbstadjungierter Operatoren
Korollar VII.1.17 Zu T ∈ L(H) existiert eine partielle Isometrie U mit T = U |T |. Beweis. W¨ortlich wie bei Satz VI.3.5.
2
Als n¨achstes sollen Spektrum und Resolventenmenge eines selbstadjungierten Operators durch sein Spektralmaß beschrieben werden. Satz VII.1.18 Sei T ∈ L(H) selbstadjungiert und E sein Spektralmaß. (a) Es ist λ ∈ ρ(T ) genau dann, wenn eine offene Umgebung U von λ mit EU = 0 existiert. (b) λ ist ein Eigenwert von T genau dann, wenn E{λ} = 0. In diesem Fall projiziert E{λ} auf den Eigenraum von λ. (c) Isolierte Punkte2 λ von σ(T ) sind Eigenwerte. Beweis. (a) Nach Konstruktion von E ist Eρ(T ) = 0. Zum Beweis der Um1 kehrung sei U eine Umgebung von λ mit EU = 0. Setze f (t) = λ−t f¨ ur t∈ / U , f (t) = 0 sonst. Dann ist f meßbar und auf σ(T ) beschr¨ankt. Dasselbe gilt f¨ ur g(t) = λ − t. Es folgt f (T )(λ − T ) = f (T )g(T ) = (f g)(T ) = χU (T ) = EU = Id, da EU = 0. Genauso zeigt man (λ − T )f (T ) = Id, daher ist λ ∈ ρ(T ). (b) Alles folgt aus ran(E{λ} ) = ker(λ − T ). Zum Beweis hierf¨ ur sei x ∈ ran(E{λ} ), d.h. E{λ} x = x. Dann gilt (λ − T )x, y = (λ − T )E{λ} x, y = (λ − t)χ{λ} (t) dEt x, y = 0 f¨ ur alle y ∈ H, da (λ − t)χ{λ} (t) = 0. Es folgt x ∈ ker(λ − T ). Ist umgekehrt T x = λx, so ist f¨ ur stetige f nach Satz VII.1.4(c) f (T )x = f (λ)x. Mit Lemma VII.1.5(b) folgt, daß diese Gleichung auch f¨ ur beschr¨ankte meßbare f gilt. Setzt man speziell f = χ{λ} , so erh¨ alt man E{λ} x = x. (c) W¨ahle eine offene Menge U mit U ∩ σ(T ) = {λ}. Da U \ {λ} ⊂ ρ(T ) gilt, muß EU \{λ} = 0 sein. W¨ are auch E{λ} = 0, so folgte EU = 0 und deshalb nach (a) λ ∈ ρ(T ). 2 Korollar VII.1.19 Ist T ∈ L(H) selbstadjungiert und E sein Spektralmaß, so ist σ(T ) die kleinste kompakte Menge mit Eσ(T ) = Id. Beweis. Ist K kompakt, λ ∈ / K und EK = Id, also ER\K = 0, so impliziert Satz VII.1.18(a) λ ∈ ρ(T ). Also gilt σ(T ) ⊂ K. 2 Als n¨achstes soll eine Form des Spektralsatzes besprochen werden, die zeigt, daß Beispiel (c) den typischen selbstadjungierten Operator beschreibt. Es existiert eine offene Umgebung U von λ mit U ∩σ(T ) = {λ}. (Anders gesagt: {λ} ist offen bzgl. der Relativtopologie von σ(T ).) 2 D.h.:
VII.1
337
Der Spektralsatz f¨ ur beschr¨ ankte Operatoren
Sei zun¨achst T selbstadjungiert und x ∈ H ein zyklischer Vektor von T , d.h. H = lin{x, T x, T 2 x, . . .}. Sei μ das endliche positive Maß dEλ x, x auf R (oder σ(T )); dabei ist E nat¨ urlich das Spektralmaß von T . Dann gilt folgender Satz. Satz VII.1.20 Sei x ∈ H ein zyklischer Vektor des selbstadjungierten Operators T ∈ L(H). Dann existiert ein unit¨ arer Operator U : H → L2 (μ) (μ wie oben) mit (U T U −1 ϕ)(t) = t · ϕ(t) Beweis. Sei ϕ ∈ C(σ(T )). Dann gilt 2 |ϕ(t)| dμ(t) = σ(T )
μ-fast ¨ uberall.
ϕ(t)ϕ(t) dEt x, x
σ(T )
= ϕ(T )∗ ϕ(T )x, x = ϕ(T )x 2 . Die lineare Abbildung V˜ : C(σ(T )) → H, ϕ → ϕ(T )x, ist also isometrisch bzgl. der Norm von L2 (μ). Sie gestattet daher (denn C liegt dicht in L2 ; vgl. Satz I.2.12) eine Fortsetzung V : L2 (μ) → H; diese ist linear und isometrisch, und sie hat dichtes Bild, denn V (L2 (μ)) umfaßt die T n x, n ≥ 0. V ist also surjektiv und deshalb unit¨ ar. Wegen T (V (ϕ)) = T (ϕ(T )x) = (T ◦ ϕ(T ))x = V (t · ϕ) ist
(V −1 T V )(ϕ) = t · ϕ
∀ϕ ∈ C(σ(T ))
∀ϕ ∈ C(σ(T ));
Aus Dichtheitsgr¨ unden u agt sich diese Aussage auf alle ϕ ∈ L2 (μ). Die ¨bertr¨ Behauptung folgt nun mit U = V −1 = V ∗ . 2 Leider besitzt nicht jeder selbstadjungierte Operator zyklische Vektoren (betrachte z.B. T = Id), allgemein gilt jedoch: Satz VII.1.21 (Multiplikationsoperatorversion des Spektralsatzes) Jeder selbstadjungierte Operator ist unit¨ar ¨aquivalent zu einem Multiplikationsoperator. Genauer gilt: Es existieren ein (im Fall separabler Hilbertr¨ aume σ-endlicher) Maßraum (Ω, Σ, μ), eine beschr¨ ankte meßbare Funktion f : Ω → R und ein unit¨ arer Operator U : H → L2 (μ) mit (U T U −1 )ϕ = f · ϕ
μ-fast ¨ uberall.
Zum Beweis nehmen wir zus¨ atzlich an, daß H separabel ist, um einige notationstechnische Komplikationen zu vermeiden. Die ! Bezeichnung H = 2 Hi bedeutet, daß jedes x ∈ H eindeutig als x = i
338
VII.
Spektralzerlegung selbstadjungierter Operatoren
und x 2 = i
denn da H separabel ist, kann h0 nur h¨ ochstens abz¨ahlbar viele verschiedene Hik enthalten, weil es sonst ein u ¨berabz¨ahlbares Orthonormalsystem g¨abe. Diese sind nat¨ urlich T -invariant und liefern zyklische Vektoren f¨ ur die Einschr¨ankungen von T . Sei hein maximales Element von H , das den Nullraum umfaßt. Setze U = lin K∈h K. W¨ are U = H, so existierte x ∈ U ⊥ \{0}. Sei V = lin{T nx: n ≥ 0}. Nach Konstruktion ist T (V ) ⊂ V , und x ist ein zyklischer Vektor zu T |V : V → V . Also gilt h ≤ h ∪ {V } und, da h maximal war, V ∈ h und x ∈ U , folglich x = 0 (Widerspruch). Das zeigt U = H, und die gesuchte Zerlegung ist erreicht. 2 Beweis von Satz VII.1.21. Verwende die Zerlegung in Lemma VII.1.22 und Satz VII.1.20, um f¨ ur geeignete unit¨ are Ui : Hi → L2 (μi ) und beschr¨ankte meßbare fi : σ(Ti ) → R (Ui Ti Ui−1 )(ϕi ) = fi · ϕi zu schließen. Ω sei die disjunkte der Mengen σ(Ti ); wenn man Vereinigung m¨ochte, kann man sich Ω als i
Setze f (t) = fi (t) falls t ∈ σ(Ti ). Wir schreiben f = (fi ), genauso ϕ = (ϕi ). Der Operator U : H → L2 (μ) sei durch U (xi )i
2
VII.1
339
Der Spektralsatz f¨ ur beschr¨ ankte Operatoren
Es sei ausdr¨ ucklich betont, daß die Wahl von μ nicht eindeutig ist! Beispiel. Sei f ∈ L2 (R) ∩ L1 (R). Zu x ∈ L2 (R) betrachte y(s) = f (s − t)x(t) dt. R
Dieses Integral existiert, da f ∈ L2 (R) ist. Ferner lehrt die Maß- und Integrationstheorie, daß y meßbar ist. y heißt die Faltung von f und x, in Zeichen y = f ∗ x (vgl. auch den Beweis von Lemma V.1.10). Da f jedoch auch in L1 (R) liegt, ist y ∈ L2 (R). Es ist n¨ amlich 2 |y(s)|2 = f (s − t)x(t) dt 2 = x(s − t)f (t) dt
2
≤
|x(s − t)| |f (t)|1/2 |f (t)|1/2 dt ≤ |f (t)| dt |x(s − t)|2 |f (t)| dt nach der Cauchy-Schwarz-Ungleichung, also folgt mit Hilfe des Satzes von Fubini |y(s)|2 ds ≤ f L1 ds dt |x(s − t)|2 |f (t)| = f L1 dt ds |x(s − t)|2 |f (t)| = f L1 dt |f (t)| x 2L2 = f 2L1 x 2L2 . Damit ist gezeigt: F¨ ur f ∈ L2 (R) ∩ L1 (R) ist der Faltungsoperator Tf : L2 (R) → L2 (R), Tf (x) = f ∗ x wohldefiniert und stetig mit Tf ≤ f L1 . Setzt man k(s, t) = f (s − t), so hat Tf (wie fr¨ uher) die Gestalt (Tf x)(s) = k(s, t)x(t) dt, im Unterschied zu den bisher betrachteten Situationen ist hier k ∈ / L2 (R2 ), denn ds dt |k(s, t)|2 = ds f 2L2 = ∞ R
R
R
(es sei denn, f = 0). Faltungsoperatoren sind daher keine Hilbert-SchmidtOperatoren, sie sind nicht einmal kompakt.
340
VII.
Spektralzerlegung selbstadjungierter Operatoren
Aus der obigen Darstellung ergibt sich, daß Tf genau dann selbstadjungiert ist, wenn k(s, t) = k(t, s) f.¨ u. gilt, d.h. wenn f (s) = f (−s) f.¨ u. gilt. Speziell ist Tf selbstadjungiert, wenn f eine gerade reellwertige Funktion ist. Wie sieht die Spektralzerlegung von Tf aus? Zun¨achst sei an die Definition der Fouriertransformation (Definition V.2.1) erinnert: F¨ ur f ∈ L1 (R) ist 1 (F f )(s) = √ f (t)e−ist dt. 2π R In Kapitel V wurde gezeigt, wie man einen unit¨aren Operator F : L2 (R) → L2 (R) gewinnen kann, so daß sich im Fall f ∈ L2 ∩ L1 die Fouriertransformierte F f nach der obigen Formel berechnen l¨aßt (siehe Satz V.2.8 und Satz V.2.9). Wir ben¨ otigen folgendes Resultat der Fourieranalyse (siehe Aufgabe VII.5.10): √ F (f ∗ g) = 2π F f · F g ∀f ∈ L1 ∩ L2 , g ∈ L2 . (VII.11) √ Setzt man h = 2π F f , so ist h ∈ C0 (R) nach Satz V.2.2, also ist der Multiplikationsoperator Mh : g → h · g auf L2 (R) wohldefiniert, und es gilt F Tf F −1 = Mh (das ist nichts anderes als (VII.11)). Daher ist (vgl. Aufgabe VII.5.8) σ(Tf ) = σ(Mh ) = h(R) ∪ {0}. λ ist genau dann Eigenwert, wenn {t: h(t) = λ} 2 positives Maß hat. Ist speziell f (t) = e−t /2 , so ist nach Lemma V.2.6 √ 2 h(t) = 2πe−t /2 , d.h. Tf hat keinen Eigenwert. Und doch: Sei eλ (t) = eiλt , also eλ ∈ L∞ . Man berechnet (f ∗ eλ )(s) = f (s − t)eiλt dt = f (t)eiλ(s−t) dt √ = eiλs (F f )(λ) · 2π = h(λ)eλ (s). Formal ist eλ Eigenfunktion von Tf zum Eigenwert h(λ), aber nat¨ urlich ist eλ ∈ / L2 und damit nicht im Definitionsbereich von Tf ! Den Physiker st¨ort das im u ¨ brigen wenig, er tut einfach so, als w¨are eλ ∈ L2 (und f¨ahrt nicht einmal schlecht damit). Solche verallgemeinerten“ Eigenfunktionen treten ” typischerweise beim stetigen Spektrum auf; wir werden in Abschnitt VIII.7 noch einmal darauf zur¨ uckkommen. Zum Schluß noch eine Anwendung des Spektraltheorems. Man nennt J ⊂ L(H) ein Ideal, wenn J ein Untervektorraum mit S ∈ J, R, T ∈ L(H) ⇒ RST ∈ J ist. Wir beginnen mit einem Lemma.
VII.1
Der Spektralsatz f¨ ur beschr¨ ankte Operatoren
341
Lemma VII.1.23 Sei T = λ dEλ ein selbstadjungierter Operator. Setze An = {t: |t| ≥ n1 }. Sind alle ran(EAn ) endlichdimensional, so ist T kompakt. Beweis. Mit Hilfe von Theorem VII.1.13 erh¨ alt man 1 T − T EAn = (t − tχAn (t)) dEt ≤ sup |t − tχAn (t)| ≤ n . t∈σ(T ) Damit ist T Limes von Operatoren mit endlichdimensionalem Bild und folglich (Korollar II.3.3) kompakt. 2 Satz VII.1.24 Sei H separabel. Dann besitzt L(H) außer {0} und L(H) nur noch K(H) als abgeschlossenes Ideal. Beweis. Nat¨ urlich ist K(H) ein abgeschlossenes Ideal (siehe Satz II.3.2). Sei nun J ein abgeschlossenes Ideal mit {0} = J = L(H). K(H) ⊂ J: Betrachte den Operator (u, v ∈ H) u ⊗ v: x → x, uv. Wegen K(H) = lin{u ⊗ v: u, v ∈ H} (Korollar VI.3.7) reicht es, u ⊗ v ∈ J zu zeigen. W¨ahle dazu 0 = T ∈ J sowie x0 , y0 ∈ H mit T x0 = y0 = 0 und setze S = u ⊗ x0 , R = y10 2 y0 ⊗ v. Dann zeigt eine leichte Rechnung u ⊗ v = RT S ∈ J. J ⊂ K(H): W¨ are dem nicht so, so w¨ are, wie jetzt gezeigt werden wird, Id ∈ J und somit J = L(H), was ausgeschlossen war. Wir nehmen also die Existenz eines T ∈ J, T ∈ / K(H) an. Dann ist T0 = T ∗ T ein selbstadjungiertes Element von J \ K(H). Daß T0 ∈ J ist, ist klar, weil J ein Ideal ist. W¨are T ∗ T ∈ K(H), so w¨ are auch |T | = (T ∗ T )1/2 ∈ K(H) (Satz VI.3.4), und die Polardarstellung T = U |T | aus Korollar VII.1.17 impliziert dann T ∈ K(H), was der Wahl von T widerspricht. Nach Lemma VII.1.23 existiert dann ε > 0 derart, daß P = E[ε,∞) unendlichdimensionales Bild hat, wo T0 = λ dEλ . Setze 1 S= χ[ε,∞) (λ) dEλ , λ dann ist 1 ST0 = χ[ε,∞) (λ)λ dEλ = E[ε,∞) = P, λ also P ∈ J. Da H und ran(P ) unendlichdimensionale separable Hilbertr¨aume sind, existiert ein unit¨ arer Operator U : H → ran(P ) (Satz V.4.12). Schreibe noch i: ran(P ) → H f¨ ur die Einbettung, so daß iU von H nach H abbildet. Daher ist IdH = (iU )∗ P (iU ) ∈ J, denn P ∈ J, und J ist ein Ideal. 2 Die Operatoren mit endlichdimensionalem Bild, die nuklearen Operatoren und die Hilbert-Schmidt-Operatoren bilden zwar Ideale, diese sind
342
VII.
Spektralzerlegung selbstadjungierter Operatoren
jedoch nicht abgeschlossen. Die Separabilit¨ at ist f¨ ur die G¨ ultigkeit des Satzes wesentlich: Auf einem inseparablen Hilbertraum ist {T : ran(T ) ist separabel} ein weiteres abgeschlossenes Ideal. Der Spektralsatz l¨ aßt sich auf normale Operatoren ausdehnen. Ist T normal, so setze T + T∗ T − T∗ S1 = , S2 = . 2 2i Dann ist T = S1 + iS2 , S1 , S2 sind selbstadjungiert, und, was entscheidend ist, S1 und S2 kommutieren, denn T und T ∗ kommutieren. Sei E (bzw. F ) das Spektralmaß von S1 (bzw. S2 ). Nach Korollar VII.1.14 kommutieren alle EA und FB (A, B ∈ Σ). Schreibe GA×B = EA FB . Die GA×B sind Ortho2 2 gonalprojektionen (G2A×B = EA FB EA FB = EA FB = EA FB = GA×B , ∗ ∗ ∗ GA×B = FB EA = FB EA = EA FB = GA×B ). Man kann zeigen, daß die Mengenfunktion A × B → GA×B x, y σ-additiv auf der Menge der Recht” ecke“ ist und daher zu einem Maß auf der Borel-σ-Algebra Σ(R2 ) von R2 2 fortgesetzt werden kann. Wenn man jetzt R mit C durch (x, y) → x + iy identifiziert und G auf der Borel-σ-Algebra von C betrachtet, kann man den Spektralsatz f¨ ur normale Operatoren (fast) w¨ortlich wie f¨ ur selbstadjungierte Operatoren formulieren. Wir u ¨bergehen die Einzelheiten. Satz VII.1.25 (Spektralsatz f¨ ur normale Operatoren) Zu jedem normalen Operator T existiert ein eindeutig bestimmtes Spektralmaß G mit kompaktem Tr¨ager auf der Borel-σ-Algebra von C mit T = z dGz . f (T ) = f (z) dGz definiert den eindeutig bestimmten meßbaσ(T ) ren Funktionalkalk¨ ul. Jeder normale Operator ist unit¨ ar ¨ aquivalent zu einem Multiplikationsoperator mit einer beschr¨ ankten meßbaren komplexwertigen Funktion. Dieser Satz l¨ aßt sich insbesondere f¨ ur unit¨are Operatoren anwenden. Dabei ist das folgende Resultat von Interesse. Lemma VII.1.26 Ist U ∈ L(H) unit¨ ar, so ist σ(U ) ⊂ T = {z ∈ C: |z| = 1}. Beweis. Es ist 0 ∈ ρ(U ), da U bijektiv ist. Ist |λ| > 1, so ist λ ∈ ρ(U ), da U = 1 (Satz VI.1.3(c)). Ist 0 < |λ| < 1, so ist ebenfalls λ ∈ ρ(U ), denn (λ − U ) = (−λU )( λ1 − U ∗ ) ist als Produkt bijektiver Operatoren bijektiv 1 (beachte U ∗ = 1 < |λ| ). 2
VII.2
Unbeschr¨ ankte Operatoren
VII.2
343
Unbeschr¨ ankte Operatoren
Will man die bisherige Theorie auf Differentialoperatoren anwenden, so stellt man zweierlei Hindernisse fest: Erstens sind Differentialoperatoren in aller Regel keine Operatoren, die auf einem Hilbertraum definiert sind und diesen in sich abbilden, sondern sie sind nur auf einem Teilraum definiert, zweitens sind sie dortselbst nicht stetig (also unbeschr¨ankt). Ein Beispiel: Sei H = L2 [0, 1]. Auf dem dichten Unterraum C 1 [0, 1], nicht aber auf ganz d H, ist der Ableitungsoperator dt definiert, er ist bez¨ uglich der L2 -Norm 1 auf C nicht stetig. Beachte, daß eine gewisse Willk¨ ur in der Wahl des Definitionsbereichs liegt, andere Vorschl¨ age k¨onnten C 2 [0, 1], D(0, 1) oder {x ∈ C 1 [0, 1]: x(0) = x(1) = 0} sein. Ein Teil dieses Abschnitts wird davon handeln, den richtigen“ Definitionsbereich eines unbeschr¨ankten Operators ” d zu finden. Betrachte nun i dt auf dem letztgenannten Definitionsbereich; die N¨ utzlichkeit des Faktors i wird sich sofort zeigen. Dann gilt (partielle Integration) 0
1
t=1 1 1 dx dy dy i (t)y(t) dt = ix(t)y(t) − ix(t) (t) dt = x(t) i (t) dt dt dt dt 0 0 t=0
da ja x(0) = x(1) = 0 = y(0) = y(1). Mit Hilfe des L2 -Skalarproduktes k¨ onnen wir also sagen: Der Operator d T = i dt , definiert auf dem Definitionsbereich dom(T ) := {x ∈ C 1 [0, 1]: x(0) = x(1) = 0}, ist linear und erf¨ ullt die Symmetriebeziehung T x, y = x, T y f¨ ur x, y ∈ dom(T ). (Um die Symmetrie zu erhalten, brauchte man den Faktor i in der Definition von T .) Derartige Operatoren tauchen typischerweise im Zusammenhang mit Randwertproblemen bei gew¨ ohnlichen oder elliptischen partiellen Differentialgleichungen, in der mathematischen Physik etc. auf. Im folgenden sollen die Rudimente der Theorie solcher Operatoren entwickelt werden. Der Begriff Operator erf¨ ahrt in diesem Abschnitt einen leichten Bedeutungswandel, n¨amlich (H bezeichnet stets einen komplexen Hilbertraum): Definition VII.2.1 (a) Ein Operator T : H ⊃ dom(T ) → H ist eine lineare Abbildung, deren Definitionsbereich dom(T ) ein (i.a. nicht abgeschlossener) Unterraum von H ist. Man sagt, T sei dicht definiert in H, falls dom(T ) = H ist. (b) Ein Operator S: H ⊃ dom(S) → H heißt Erweiterung von T : H ⊃ dom(T ) → H, falls dom(T ) ⊂ dom(S) und Sx = T x f¨ ur x ∈ dom(T ) gelten. Wir schreiben T ⊂ S. (c) Zwei Operatoren sind gleich, T = S, falls T ⊂ S und S ⊂ T ; mit anderen Worten, falls dom(T ) = dom(S) und T x = Sx f¨ ur alle x ∈ dom(T ).
344
VII.
Spektralzerlegung selbstadjungierter Operatoren
Definition VII.2.2 Ein Operator T : H ⊃ dom(T ) → H heißt symmetrisch, falls T x, y = x, T y
∀x, y ∈ dom(T ).
d Wir haben oben gesehen, daß T = i dt auf dom(T ) = {x ∈ C 1 [0, 1]: d x(0) = x(1) = 0} symmetrisch ist. S = i dt auf dom(S) = {x ∈ C 1 [0, 1]: x(0) = x(1)} ist ebenfalls symmetrisch, und es ist T ⊂ S. Nach dem Satz von Hellinger-Toeplitz (Satz V.5.5) ist ein symmetrischer Operator mit dom(T ) = H stetig, also selbstadjungiert (T = T ∗ ). Als n¨achstes definieren wir den adjungierten Operator eines dicht definierten Operators T . Betrachte den Unterraum(!)
dom(T ∗ ) := {y ∈ H: x → T x, y stetig auf dom(T )}. F¨ ur y ∈ dom(T ∗ ) kann demnach x → T x, y eindeutig zu einem stetigen linearen Funktional auf H fortgesetzt werden, das nach dem Darstellungssatz von Fr´echet-Riesz (Theorem V.3.6) in der Form · , z, z ∈ H, geschrieben werden kann, also T x, y = x, z f¨ ur x ∈ dom(T ). Da dom(T ) dicht liegt, ist z eindeutig durch y festgelegt; wir schreiben z = T ∗ y. Auf diese Weise wird ein Operator T ∗ : H ⊃ dom(T ∗ ) → H definiert, es gilt T x, y = x, T ∗ y
∀x ∈ dom(T ), y ∈ dom(T ∗ ).
Definition VII.2.3 (a) Ist T dicht definiert, so heißt der oben beschriebene Operator T ∗ der adjungierte Operator von T . (b) T heißt selbstadjungiert, falls T = T ∗ . Ist T stetig, stimmt Definition VII.2.3 mit der alten Definition von T ∗ u ankten Fall ist die Wahl des Definitionsbereichs we¨berein. Im unbeschr¨ sentlich daf¨ ur, ob ein Operator selbstadjungiert ist, denn T = T ∗ impliziert insbesondere dom(T ) = dom(T ∗ ). Im unbeschr¨ankten Fall ist es ganz wichtig, zwischen symmetrischen und selbstadjungierten Operatoren zu unterscheiden. (Nur f¨ ur die letzteren gilt der Spektralsatz, siehe Abschnitt VII.3.) Offensichtlich sind selbstadjungierte Operatoren symmetrisch, und f¨ ur einen symmetrischen dicht definierten Operator T ist stets T ⊂ T ∗ . Insbesondere ist f¨ ur einen solchen Operator dom(T ∗ ) dicht, so daß auch T ∗∗ definiert ist. Im nichtsymmetrischen Fall kann jedoch sogar dom(T ∗ ) = {0} vorkommen. Dies zeigen Aufgabe VII.5.12 sowie das folgende einfache Beispiel, auf das mich J. Brasche aufmerksam gemacht hat. (Vgl. jedoch Aufgabe VII.5.16.)
VII.2
345
Unbeschr¨ ankte Operatoren
Beispiel. Sei (en ) eine Orthonormalbasis von L2 (R). Wir betrachten den Operator ∞ T : L2 (R) ⊃ D(R) → L2 (R), T ϕ = ϕ(n)en . n=1
Da ϕ einen kompakten Tr¨ ager besitzt, ist diese Summe in Wirklichkeit nur eine endliche Summe, und T ist wohldefiniert. Sei nun ψ ∈ L2 (R), ψ = 0. Wir zeigen, daß ϕ → T ϕ, ψ nicht stetig auf D(R) ist, so daß in der Tat dom(T ∗ ) = {0} ist. Wegen ψ = 0 existiert n0 ∈ N mit ψ, en0 = 0. W¨ahle eine Folge (ϕk ) in D(R) mit supp(ϕk ) ⊂ [n0 − 12 , n0 + 12 ], ϕk (n0 ) = 1 f¨ ur alle k und ϕk L2 → 0. Dann gilt T ϕk , ψ =
∞
ϕk (n)en , ψ = en0 , ψ = 0,
n=1
obwohl ϕk → 0. Zwischen T und T ∗ besteht folgender Zusammenhang, wenn T dicht definiert ist. (Vgl. Abschnitt IV.4 f¨ ur den Begriff des abgeschlossenen Operators.) Satz VII.2.4 T : H ⊃ dom(T ) → H sei dicht definiert. (a) T ∗ ist abgeschlossen. (b) Ist T ∗ dicht definiert (z.B. falls T symmetrisch ist), so ist T ⊂ T ∗∗ . (c) Ist T ∗ dicht definiert und S eine abgeschlossene Erweiterung von T , so ist T ∗∗ ⊂ S. In diesem Fall ist T ∗∗ die sog. Abschließung von T , d.h. die kleinste abgeschlossene Erweiterung. Beweis. (a) Es ist zu zeigen: Wenn yn ∈ dom(T ∗ ), yn → y ∈ H, T ∗ yn → z ∈ H, dann y ∈ dom(T ∗ ), z = T ∗ y (vgl. Definition IV.4.1). Es ist T x, y = limT x, yn = limx, T ∗ yn = x, z, also x → T x, y stetig. Folglich gilt y ∈ dom(T ∗ ) sowie T ∗ y = z. (b) Ist x ∈ dom(T ) und y ∈ dom(T ∗ ), so ist T x, y = x, T ∗ y, also y → T ∗ y, x stetig auf dom(T ∗ ), und das heißt x ∈ dom(T ∗∗ ) sowie x, T ∗ y = T ∗∗ x, y f¨ ur y ∈ dom(T ∗ ). Da dom(T ∗ ) dicht ist, folgt insgesamt T x = T ∗∗ x d.h. T ⊂ T ∗∗ .
∀x ∈ dom(T ),
346
VII.
Spektralzerlegung selbstadjungierter Operatoren
(c) Zun¨achst sei an die Definition des Graphen eines Operators S erinnert: gr(S) = {(x, Sx): x ∈ dom(S)}. S ist genau dann abgeschlossen, wenn gr(S) abgeschlossen in H × H ist (Lemma IV.4.2). (u, v), (x, y) = u, x + v, y definiert ein Skalarprodukt auf H × H, das H × H zu einem Hilbertraum macht, dessen Norm (u, v) = ( u 2 + v 2 )1/2 zur u ¨blicherweise betrachteten ¨aquivalent ist. Die Behauptung von (c) folgt dann aus gr(T ) = gr(T ∗∗ ). ⊂“: Das ergibt sich aus (a) und (b). ” ⊃“: Es reicht, gr(T )⊥ ⊂ gr(T ∗∗ )⊥ zu zeigen (⊥ bezieht sich nat¨ urlich ” auf das Skalarprodukt von H × H). Sei also (u, v) ∈ gr(T )⊥ , d.h. gelte x, u + T x, v = 0 f¨ ur alle x ∈ dom(T ). Das liefert v ∈ dom(T ∗ ) und ∗ ∗∗ T v = −u. F¨ ur (z, T z) ∈ gr(T ∗∗ ) ist dann (z, T ∗∗ z), (u, v) = z, u + T ∗∗ z, v = z, u + z, T ∗ v = z, u + T ∗ v = 0, wie behauptet.
2
Aus diesem Satz und den Definitionen ergibt sich ein unmittelbares Korollar. Korollar VII.2.5 T : H ⊃ dom(T ) → H sei dicht definiert. (a) T ist genau dann symmetrisch, wenn T ⊂ T ∗ . In diesem Fall ist T ⊂ T ∗∗ ⊂ T ∗ = T ∗∗∗ , und auch T ∗∗ ist symmetrisch. (b) T ist genau dann abgeschlossen und symmetrisch, wenn T = T ∗∗ ⊂ T ∗. (c) T ist genau dann selbstadjungiert, wenn T = T ∗∗ = T ∗ . Zwischen (a) und (c) stehen Operatoren mit folgender Eigenschaft. Definition VII.2.6 Ein symmetrischer, dicht definierter Operator heißt wesentlich selbstadjungiert, wenn seine Abschließung selbstadjungiert ist. Es gilt also: T ist genau dann wesentlich selbstadjungiert, wenn T ⊂ T ∗∗ = T ∗ . Es sei nochmals auf die Notwendigkeit hingewiesen, zwischen symmetrischen Operatoren und selbstadjungierten zu unterscheiden. Nur f¨ ur die letztgenannten k¨ onnen die zentralen S¨ atze bewiesen werden. Damit ein
VII.2
347
Unbeschr¨ ankte Operatoren
symmetrischer Operator T selbstadjungiert ist, muß der richtige“ Defi” nitionsbereich gew¨ ahlt werden. Manchmal gen¨ ugt es zu wissen, daß T eine selbstadjungierte Erweiterung besitzt (was nicht immer der Fall ist); ein wesentlich selbstadjungierter Operator besitzt nat¨ urlich genau eine solche Erweiterung. d Beispiele. (a) Wir betrachten i dt auf diversen Definitionsbereichen. Sei d 1 T = i dt auf dom(T ) = {x ∈ C [0, 1]: x(0) = x(1) = 0} ⊂ L2 [0, 1]. Wie bereits festgestellt, ist T symmetrisch, aber nicht abgeschlossen (siehe Beispiel IV.4(b)), also erst recht nicht selbstadjungiert. Als n¨achstes bestimmen wir T ∗ . Dazu setzen wir (vgl. Beispiel IV.4(c)) dx 2 AC[0, 1] = x ∈ C[0, 1]: x absolutstetig mit ∈ L [0, 1] dt
und behaupten d . dt (Es sei daran erinnert, daß f¨ ur absolutstetige Funktionen die Ableitung fast u ¨berall existiert, siehe Satz A.1.10.) t Sei x ∈ dom(T ∗ ) und y = T ∗ x. Setze F (t) = 0 y(s) ds. Wegen y ∈ L2 [0, 1] ⊂ L1 [0, 1] ist nach Satz A.1.10 F absolutstetig mit F = y fast u ur z ∈ dom(T ) (die partielle Integration ist auch hier ¨berall. Es folgt f¨ erlaubt) dom(T ∗ ) = AC[0, 1], T ∗ = i
T z, x = z, y = z, F = −z , F = T z, −iF . Also gilt
x + iF ∈ ran(T )⊥ = lin{1}.
Um die letzte Gleichheit einzusehen, beachte, daß 1 ran(T ) = w ∈ C[0, 1]: w(s) ds = 0 0
und deshalb ran(T ) =
w ∈ L2 [0, 1]:
1
w(s) ds = 0
= {1}⊥ ,
0
ran(T )⊥ = {1}⊥ ⊥ = lin{1}. Damit ist x = −iF + α1 absolutstetig und i dx = y = T ∗ x ∈ L2 . Ist dt 2 umgekehrt x ∈ AC[0, 1] und y ∈ L die fast u ¨berall existierende Ableitung, so ist wie oben (partielle Integration) T z, x = z, iy
∀z ∈ dom(T ),
348
VII.
Spektralzerlegung selbstadjungierter Operatoren
also x ∈ dom(T ∗ ). T ∗ ist nicht symmetrisch, T also nicht einmal wesentlich selbstadjungiert. Mit derselben Methode wie oben zeigt man dom(T ∗∗ ) = {x ∈ AC[0, 1]: x(0) = x(1) = 0} d d und T ∗∗ = i dt . (T ∗∗ ist nicht selbstadjungiert.) Hingegen ist S = i dt auf {x ∈ AC[0, 1]: x(0) = λx(1)} f¨ ur |λ| = 1 eine selbstadjungierte Erweiterung von T ; man kann zeigen, daß jede selbstadjungierte Erweiterung von dieser Form ist (siehe Beispiel (e) unten). (b) Sei (Ω, Σ, μ) ein Maßraum und f : Ω → R meßbar. Betrachte T x = f · x auf dom(T ) = {x ∈ L2 (μ): f · x ∈ L2 (μ)}. T ist symmetrisch (klar) und dicht definiert. Denn f¨ ur Ωn := {ω: |f (ω)| ≤ n} enth¨ alt dom(T ) alle x ∈ L2 (μ), die außerhalb eines Ωn verschwinden. Wegen n Ωn = Ω bilden solche x einen dichten Unterraum. T ist selbstadjungiert: Wegen T ⊂ T ∗ ist nur dom(T ∗ ) ⊂ dom(T ) zu zeigen. Sei x ∈ dom(T ∗ ) und χn = χΩn ∈ L∞ (μ). Dann sind χn T ∗ x ∈ L2 (μ) und χn f · x ∈ L2 (μ) (da χn f ∈ L∞ (μ)). F¨ ur z ∈ dom(T ) gilt wegen χn z ∈ dom(T )
z, χn T ∗ x = χn z, T ∗ x = T (χn z), x = f χn z, x = z, χn f x d.h. χn T ∗ x = χn f x fast u ¨berall. Nun konvergiert χn → 1 punktweise, daher ist T ∗ x = f x fast u ¨berall. Aber T ∗ x liegt in L2 (μ), also auch f x, d.h. x ∈ dom(T ). In Satz VII.3.1 wird gezeigt, daß jeder selbstadjungierte unbeschr¨ankte Operator zu einem solchen Multiplikationsoperator unit¨ar ¨aquivalent ist. Wir steuern jetzt auf ein wichtiges Kriterium f¨ ur Selbstadjungiertheit zu. Zun¨achst ein Lemma. Dort setzen wir dom(λ − T ) = dom(T ) f¨ ur λ ∈ C. Lemma VII.2.7 T : H ⊃ dom(T ) → H sei dicht definiert. (a) Es gilt ker(T ∗ ∓ i) = ran(T ± i)⊥ . Insbesondere: ker(T ∗ ∓ i) = {0} ⇔ ran(T ± i) dicht in H. (b) T sei abgeschlossen und symmetrisch. Dann sind ran(T ± i) abgeschlossen. Beweis. (a) Beachte zun¨ achst (T + i)∗ = T ∗ − i. F¨ ur die Inklusion ⊃“ ” ⊥ sei y ∈ ran(T + i) . Dann gilt (T + i)z, y = 0 f¨ ur alle z ∈ dom(T ), also y ∈ dom(T ∗ ) und 0 = z, (T ∗ − i)y f¨ ur alle z ∈ dom(T ). Es folgt y ∈ ker(T ∗ − i). (F¨ ur das andere Vorzeichen geht’s genauso!) Um die Inklusion ⊂“ zu erhalten, lies das obige Argument r¨ uckw¨arts! ” (b) Da T symmetrisch ist, ist stets T x, x ∈ R. Deshalb ist (T + i)x 2 = T x 2 + x 2 + 2 ReT x, ix = T x 2 + x 2 ≥ x 2 .
(VII.12)
VII.2
Unbeschr¨ ankte Operatoren
349
Das zeigt, daß (T + i)−1 : ran(T + i) → dom(T ) existiert und stetig ist. Sei nun (xn ) eine Folge in dom(T ) mit (T + i)xn → y ∈ ran(T + i). Folglich ist (T +i)xn eine Cauchyfolge in ran(T +i) und deshalb (xn ) eine Cauchyfolge in dom(T ). Es existiert dann x := limn→∞ xn ∈ H, und es gilt T xn → y − ix. Da T abgeschlossen ist, ist x ∈ dom(T ) und y − ix = T x, d.h. y = (T + i)x ∈ ran(T + i). Das Argument f¨ ur T − i geht genauso. 2 Satz VII.2.8 F¨ ur einen symmetrischen dicht definierten Operator T sind aquivalent: ¨ (i) T ist selbstadjungiert. (ii) T ist abgeschlossen und ker(T ∗ ± i) = {0}. (iii) ran(T ± i) = H. Beweis. (i) ⇒ (ii): T ist abgeschlossen nach Satz VII.2.4. Gelte (T ∗ + i)x = 0. Da T ∗ symmetrisch ist, gilt (siehe (VII.12)) x = 0. Genauso ergibt sich ker(T ∗ − i) = {0}. (ii) ⇒ (iii): Siehe Lemma VII.2.7! (iii) ⇒ (i): Wegen T ⊂ T ∗ ist nur dom(T ∗ ) ⊂ dom(T ) zu zeigen. Sei y ∈ dom(T ∗ ). Schreibe mit (iii) (T ∗ − i)y = (T − i)x f¨ ur ein x ∈ dom(T ). Wegen T ⊂ T ∗ ist dann (T ∗ − i)y = (T ∗ − i)x, also (Lemma VII.2.7(a)) y = x ∈ dom(T ). 2 Mit Teil (iii) dieses Satzes sieht man sofort, daß der Multiplikationsoperator aus Beispiel (b) selbstadjungiert ist. Korollar VII.2.9 F¨ ur einen symmetrischen dicht definierten Operator T sind ¨ aquivalent: (i) T ist wesentlich selbstadjungiert. (ii) ker(T ∗ ± i) = {0}. (iii) ran(T ± i) ist dicht in H. Beweis. (i) ⇔ (ii): Benutze Satz VII.2.8 f¨ ur T ∗∗ und T ∗ = T ∗∗∗ (Korollar VII.2.5). (ii) ⇔ (iii): Siehe Lemma VII.2.7. 2 Man nennt dim ker(T ∗ ± i) die Defektindizes von T . Mit dim ist hierbei die Hilbertraumdimension gemeint, also die Kardinalit¨at einer Orthonormalbasis. Wir werden als n¨ achstes zeigen, daß ein symmetrischer Operator genau dann eine selbstadjungierte Erweiterung besitzt, wenn seine Defektindizes u ¨ bereinstimmen. Beachte, daß ker(T ∗ ± i) = ran(T ∓ i) ⊥ (Lemma VII.2.7). Satz VII.2.10 Sei T : H ⊃ dom(T ) → H symmetrisch und dicht definiert. Genau dann besitzt T eine selbstadjungierte Erweiterung, wenn dim ker(T ∗ + i) = dim ker(T ∗ − i) gilt.
350
VII.
Spektralzerlegung selbstadjungierter Operatoren
Beweis. Zuerst nehmen wir die Gleichheit der Defektindizes an. Es gilt nach (VII.12) (T + i)x = (T − i)x ∀x ∈ dom(T ). Also wird durch U : ran(T − i) → ran(T + i), (T − i)x → (T + i)x, ein wohldefinierter, isometrischer, surjektiver Operator erkl¨art. Da die Orthogonalr¨aume von ran(T ± i) nach Annahme dieselbe Hilbertraumdimension besitzen, kann man nach Satz V.4.12 den Operator U zu einem unit¨aren Operator V : H → H fortsetzen. Wir zeigen jetzt, daß V − Id injektiv ist. Gelte also V y = y; nach Lemma V.5.10 ist dann auch V ∗ y = y. F¨ ur alle x ∈ dom(T ) ist daher 2ix, y = (T + i)x − (T − i)x, y = (V − Id)(T − i)x, y = (T − i)x, V ∗ y − y = 0. Deswegen ist y orthogonal zu dom(T ) und folglich y = 0. Wir k¨onnen daher den Operator S: H ⊃ ran(V − Id) → H, V z − z → i(V z + z) definieren; mit anderen Worten ist S = i(V + Id)(V −Id)−1 auf ran(V −Id). Unser Ziel ist es, S als selbstadjungierte Erweiterung von T zu erkennen. Zun¨achst gilt T ⊂ S, denn f¨ ur x ∈ dom(T ) ist (V − Id)(T − i)x = 2ix und deshalb x ∈ dom(S) sowie Sx = T x. S ist symmetrisch, denn f¨ ur x ∈ dom(S), sagen wir x = V y − y, gilt Sx, x = i(V + Id)y, (V − Id)y = i V y, V y + y, V y − V y, y − y, y = i y, V y − V y, y = −2 Imy, V y ∈ R. Aufgabe VII.5.11 impliziert die Symmetrie von S. Um schließlich die Selbstadjungiertheit von S zu zeigen, verwenden wir Satz VII.2.8. Danach ist nur zu zeigen, daß ran(S ± i) = H gilt. Wegen S − i = 2i(V − Id)−1 bzw. S + i = 2iV (V − Id)−1 (jeweils auf dom(S)) l¨aßt sich in der Tat jedes z ∈ H als z z z = (S − i)(V − Id) = (S + i)(V − Id)V ∗ 2i 2i darstellen. Umgekehrt wollen wir jetzt annehmen, daß T eine selbstadjungierte Erweiterung S besitzt. Wir definieren V = (S + i)(S − i)−1 auf dom(V ) = H (das ist m¨oglich wegen Satz VII.2.8) und U = (T +i)(T −i)−1 auf dom(U ) = ran(T − i). Wegen T ⊂ S gilt auch U ⊂ V , und V ist unit¨ar, denn (VII.12)
VII.2
351
Unbeschr¨ ankte Operatoren
zeigt, daß V : (S − i)x → (S + i)x isometrisch ist, und Satz VII.2.8 liefert die Surjektivit¨at. Nach Konstruktion bildet V den Teilraum ran(T − i) auf ran(T + i) ab; als unit¨ arer Operator bildet V folglich auch die entsprechenden Orthogonalr¨ aume aufeinander ab. Lemma VII.2.7 liefert, daß V ker(T ∗ + i) unit¨ ar auf ker(T ∗ − i) abbildet; diese Kerne m¨ ussen folglich dieselbe Hilbertraumdimension haben. 2 Die im vorangegangenen Beweis definierte isometrische Abbildung U = (T +i)(T −i)−1 heißt die Cayley-Transformierte von T ; vgl. Aufgabe V.6.36 f¨ ur den Fall beschr¨ ankter T . Die hier zugrundeliegende Idee ist, daß t → t+i t−i eine Bijektion zwischen R und {z ∈ C: |z| = 1, z = 1} vermittelt, deren Inverse u → i u+1 u−1 ist. Weiteres zum Zusammenhang zwischen T und U wird in Abschnitt VII.6 referiert. Beispiele. (c) Sei R+ = (0, ∞), dom(T ) = D(R+ ) ⊂ L2 (R+ ) und T = d i dt . Mit einer a¨hnlichen Technik wie in Beispiel (a) zeigt man dom(T ∗ ) = {x ∈ L2 (R+ ): x|I ∈ AC(I) f¨ ur alle kompakten Teilintervalle I ⊂ R+ , dx d 2 + ∗ ∗ ∗ dt ∈ L (R )} und T = i dt . Wir berechnen ker(T ±i). Es gilt (T ±i)y = 0 ∓t t 2 genau dann, wenn y ± y = 0, also y(t) = α± e . Wegen e ∈ / L (R+ ) ist ker(T ∗ − i) = {0},
ker(T ∗ + i) = lin{e−t } = {0}.
(Gemeint sind nat¨ urlich die Funktionen t → et bzw. t → e−t .) Nach Korollar VII.2.9 ist T nicht wesentlich selbstadjungiert, Satz VII.2.10 liefert sogar, daß T keine selbstadjungierte Erweiterung besitzt. (d) Die Greenschen Formeln zeigen, daß der Laplaceoperator T = −Δ auf dom(T ) = S (Rn ) ⊂ L2 (Rn ) symmetrisch ist. T ist wesentlich selbstadjungiert, und dom(T ∗∗ ) ist der Sobolevraum W 2 (Rn ). Es ist T ∗∗ = −Δ, wo die auftretenden Ableitungen im schwachen Sinn aufzufassen sind (Definition V.1.11). Diese Aussagen werden fast offensichtlich, wenn man sie mit Hilfe der Fouriertransformierten u folgenden kurz ¨ bersetzt. Das soll im skizziert werden. Nach Lemma V.2.4 gilt (mit x2 := x2j ) F (−Δ)F −1 ϕ (x) = x2 ϕ(x) f¨ ur x ∈ Rn , ϕ ∈ S (Rn ). Beachte, daß diese Formel nach Lemma V.2.11 im L2 -Sinn auch f¨ ur ϕ ∈ W 2 (Rn ) gilt. Der Multiplikationsoperator M mit der Funktion x → x2 ist nach Korollar VII.2.9 auf S (Rn ) wesentlich selbstadjungiert, denn ran(M ± i) enth¨ alt D(Rn ). Seine Abschließung ist (lax geschrieben) M : ϕ → x2 ϕ auf {ϕ ∈ L2 (Rn ): x2 ϕ ∈ L2 (Rn )}, und dieser Raum ist nach Satz V.2.14 das Fourierbild von W 2 (Rn ). Daher ist −Δ auf W 2 (Rn ) unit¨ar a¨quivalent zu M mit dem obigen Definitionsbereich. (e) Wir versuchen in diesem Beispiel, selbstadjungierte Erweiterungen des Operators T aus Beispiel (a) zu konstruieren. Geht man den Beweis
352
VII.
Spektralzerlegung selbstadjungierter Operatoren
von Satz VII.2.10 an Hand dieses Operators durch, so stellt man folgendes fest. U bildet f¨ ur x ∈ C 1 [0, 1] mit x(0) = x(1) = 0 die Funktion i(x − x) auf i(x +x) ab. Um eine unit¨ are Fortsetzung V zu konstruieren, m¨ ussen wir die Defektr¨aume ker(T ∗ ± i) kennen. Nach Beispiel (a) sind das – wieder etwas lax geschrieben – die jeweils eindimensionalen R¨aume {αe∓t : α ∈ C}. Wir w¨ahlen nun α∓ > 0 so, daß die durch e∓ (t) = α∓ e∓t definierten Funktionen die L2 -Norm 1 haben. Jede unit¨ are Fortsetzung V von U ist dann durch die Forderung V (e− ) = γe+ , wo |γ| = 1, eindeutig bestimmt. Man best¨atigt nun, daß f¨ ur x ∈ ran(V − Id) stets x(0) = λx(1) f¨ ur ein |λ| = 1, n¨amlich λ = −γ(e − γ)/(e − γ), gilt; f¨ ur x ∈ ran(U − Id) ist ja sogar x(0) = x(1) = 0 nach Definition von dom(T ), und man muß daher nur noch V e− − e− bei 0 und 1 vergleichen. Wir erhalten also die in Beispiel (a) bereits genannten selbstadjungierten Erweiterungen. Eine wichtige Klasse von symmetrischen Operatoren, die selbstadjungierte Erweiterungen besitzen, sind die halbbeschr¨ ankten Operatoren, die eine Ungleichung der Form T x, x ≥ C x 2
∀x ∈ dom(T )
(VII.13)
T x, x ≤ C x 2
∀x ∈ dom(T )
(VII.14)
bzw. f¨ ur ein C ∈ R erf¨ ullen. Beachte, daß nach Aufgabe VII.5.11 halbbeschr¨ankte Operatoren symmetrisch sind. Zum Beispiel ist der Laplaceoperator aus Beispiel (d) halbbeschr¨ ankt. Satz VII.2.11 (Friedrichs-Erweiterung) Jeder dicht definierte halbbeschr¨ ankte Operator besitzt eine selbstadjungierte Erweiterung. Genauer gilt: Erf¨ ullt T : H ⊃ dom(T ) → H die Ungleichung (VII.13) bzw. (VII.14), so existiert eine selbstadjungierte Erweiterung, die dieser Ungleichung mit derselben Konstanten gen¨ ugt. Der Kern des Beweises ist das folgende Lemma. Lemma VII.2.12 Seien H und K Hilbertr¨aume, und sei J ∈ L(K, H) ein injektiver Operator mit dichtem Bild. Dann ist JJ ∗ ∈ L(H) ein injektiver Operator mit dichtem Bild, und der Umkehroperator S: H ⊃ ran(JJ ∗ ) → H ist selbstadjungiert. Beweis. Weil J dichtes Bild hat, ist J ∗ und deshalb auch JJ ∗ injektiv (Satz V.5.2(g)). Als selbstadjungierter Operator hat JJ ∗ daher dichtes Bild, und S ist dicht definiert. Die Selbstadjungiertheit von S schließen wir aus Satz VII.2.8. Es ist klar, daß S symmetrisch ist, und um die Surjektivit¨at von S ±i zu zeigen, sind bei gegebenem y ∈ H die Gleichungen (S ± i)x = y in dom(S) zu l¨osen. Diese sind ¨ aquivalent zu (Id ± iJJ ∗ )x = JJ ∗ y, und da
VII.2
353
Unbeschr¨ ankte Operatoren
der selbstadjungierte Operator JJ ∗ reelles Spektrum hat, gibt es L¨osungen in H, die wegen x = JJ ∗ (y ∓ ix) in dom(S) = ran(JJ ∗ ) liegen. 2 Beweis von Satz VII.2.11. Indem man statt T Operatoren der Gestalt ±T + λ f¨ ur ein λ ∈ R betrachtet, darf man annehmen, daß T der Ungleichung T x, x ≥ x 2 gen¨ ugt. Betrachte nun die durch [x, y] = T x, y auf dom(T ) × dom(T ) definierte Sesquilinearform, die wegen [x, x] ≥ x 2 f¨ ur alle x ∈ dom(T ) positiv definit ist. So erh¨alt dom(T ) die Struktur eines Pr¨ahilbertraums, dessen Vervollst¨ andigung K genannt werde; die induzierte Norm sei |||x||| = [x, x]1/2 . Offensichtlich ist der identische Operator von (dom(T ), ||| . |||) nach H kontraktiv, daher existiert eine kontraktive Fortsetzung J ∈ L(K, H) (vgl. Satz II.1.5). Es gilt [x, y] = T x, Jy
∀x ∈ dom(T ), y ∈ K,
denn f¨ ur y ∈ dom(T ) gilt dies definitionsgem¨aß, und f¨ ur die u ¨brigen y ∈ K folgt es durch stetige Ausdehnung. Insbesondere ist J injektiv, da aus Jy = 0 die [ . , . ]-Orthogonalit¨ at von y auf dem dichten Teilraum dom(T ) von K folgt. Wir sind also in der Situation von Lemma VII.2.12 und betrachten den dort als selbstadjungiert erkannten Operator S; dieser leistet das Gew¨ unschte. Es gilt n¨amlich f¨ ur x ∈ dom(T ), y ∈ K [x, y] = T x, Jy = [J ∗ T x, y], also x = J ∗ T x = JJ ∗ T x, denn J = Id auf dom(T ). Das zeigt dom(T ) ⊂ dom(S), und da nach Konstruktion ebenfalls x = JJ ∗ Sx gilt und JJ ∗ injektiv ist, erh¨alt man T ⊂ S. Schließlich ist Sx, x ≥ x 2 auf dom(S) zu zeigen. Schreibt man x = JJ ∗ ξ, so ergibt sich dies aus Sx, x = ξ, JJ ∗ ξ = [J ∗ ξ, J ∗ ξ] = |||J ∗ ξ|||2 ≥ JJ ∗ ξ 2 = x 2 , 2
da J kontraktiv ist.
Korollar VII.2.13 Sei A: H ⊃ dom(A) → H ein abgeschlossener dicht definierter Operator. Dann ist der Operator A∗ A mit dem Definitionsbereich dom(A∗ A) = {x ∈ dom(A): Ax ∈ dom(A∗ )} dicht definiert und selbstadjungiert. Beweis. Es ist klar, daß A∗ A auf dem genannten Definitionsbereich symmetrisch ist; weit weniger klar ist, daß dieser dicht ist. Um das einzusehen, versehen wir dom(A) mit dem Skalarprodukt [x, y] = x, y + Ax, Ay;
354
VII.
Spektralzerlegung selbstadjungierter Operatoren
da A abgeschlossen ist, wird dom(A) so zu einem Hilbertraum, der mit K bezeichnet sei. Ferner sei J ∈ L(K, H) der Inklusionsoperator. Wir zeigen nun ran(JJ ∗ ) ⊂ dom(A∗ A); weil JJ ∗ dichtes Bild hat (vgl. Lemma VII.2.12), folgt daraus die behauptete Dichtheit. Sei also y ∈ H und x = JJ ∗ y = J ∗ y ∈ ran(JJ ∗ ). Dann ist nach Definition von J ∗ nat¨ urlich x ∈ K = dom(A). Um zu zeigen, daß Ax in dom(A∗ ) liegt, ist die Stetigkeit von ξ → Aξ, Ax in der Norm von H zu beweisen; diese ergibt sich aus Aξ, Ax = [ξ, x] − ξ, x = [ξ, J ∗ y] − ξ, x = Jξ, y − ξ, x = ξ, y − x. Damit ist auch der Operator T = Id + A∗ A dicht definiert und halbbeschr¨ankt. Konstruiert man die Friedrichs-Erweiterung wie im Beweis von Satz VII.2.11, so haben die Symbole J und K hier dieselbe Bedeutung wie dort. Die Friedrichs-Erweiterung S ist nun auf dom(S) = ran(JJ ∗ ) definiert; folglich gilt S = T , und T selbst und damit auch A∗ A ist selbstadjungiert. 2 Abschließend soll das Spektrum eines unbeschr¨ankten Operators definiert werden. Definition VII.2.14 T : H ⊃ dom(T ) → H sei dicht definiert. (a) ρ(T ) = {λ ∈ C: λ − T : dom(T ) → H ist bijektiv, und (λ − T )−1 ∈ L(H)} heißt die Resolventenmenge von T . (b) R: ρ(T ) → L(H), Rλ = (λ − T )−1 heißt die Resolventenabbildung. (c) σ(T ) = C \ ρ(T ) heißt das Spektrum von T . Ist T abgeschlossen und λ−T bijektiv, so gilt die Stetigkeit des inversen Operators (λ−T )−1 automatisch (Satz IV.4.4). Ist T nicht abgeschlossen, so gilt stets σ(T ) = C; siehe Aufgabe VII.5.32 oder Beispiel (g) unten. Deshalb sollte man das Spektrum nur f¨ ur abgeschlossene Operatoren studieren. W¨ortlich wie f¨ ur beschr¨ ankte Operatoren zeigt man: Satz VII.2.15 T : H ⊃ dom(T ) → H sei dicht definiert. (a) ρ(T ) ist offen. (b) Die Resolventenabbildung ist analytisch, und es gilt Rλ − Rμ = (μ − λ)Rλ Rμ . (c) σ(T ) ist abgeschlossen. Im unbeschr¨ankten Fall braucht jedoch σ(T ) nicht kompakt zu sein, ferner kann σ(T ) = ∅ vorkommen!
VII.2
355
Unbeschr¨ ankte Operatoren
d Beipiele. (f) Sei T = i dt , dom(T ) = {x ∈ AC[0, 1]: x(0) = 0} ⊂ L2 [0, 1]. Dann ist σ(T ) = ∅. F¨ ur λ ∈ C setze n¨ amlich t Sλ (x)(t) = i e−iλ(t−s) x(s) ds; 0
dann ist (λ − T )Sλ = Id, Sλ (λ − T ) = Id|dom(T ) . (Die Formel f¨ ur Sλ erh¨alt man, wenn man die gew¨ ohnliche Differentialgleichung λy − iy = x mit der Methode der Variation der Konstanten l¨ ost.) Da T abgeschlossen ist (Beweis wie bei Beispiel IV.4(c)), folgt nach der obigen Bemerkung λ ∈ ρ(T ), also ρ(T ) = C und σ(T ) = ∅. (Man kann die Stetigkeit der Sλ nat¨ urlich auch direkt zeigen.) (g) Sei T x = f x, wo f ∈ C ∞ (R), dom(T ) = D(R) ⊂ L2 (R). F¨ ur λ ∈ C ist dann ran(λ − T ) ⊂ D(R), also λ − T nie surjektiv (dank der Wahl des Definitionsbereichs D(R)). Daher ist in diesem Fall σ(T ) = C. Dieses Beispiel zeigt, daß das Spektrum eines symmetrischen Operators nicht reell zu sein braucht (siehe dazu Satz VII.2.16 unten). (h) Sei (Ω, Σ, μ) ein Maßraum, f : Ω → R meßbar und T : x → f x der zugeh¨orige Multiplikationsoperator auf dom(T ) = {x ∈ L2 (μ): xf ∈ L2 (μ)}. Nach Beispiel (b) ist T selbstadjungiert. Dann ist σ(T ) = {λ ∈ R: ∀ε > 0 hat f −1 [λ − ε, λ + ε] positives Maß}. (Das ist der sog. wesentliche Wertebereich von f .) Ist n¨ amlich λ nicht im wesentlichen Wertebereich, so y 1 ist λ−f ∈ L∞ (μ), und (λ − f )x = y gilt genau dann, wenn λ−f = x. Zu y ∈ 2 2 L (μ) existiert demnach genau ein x ∈ L (μ) mit (λ − f )x = y. Es ist auch λ λ x ∈ dom(T ), denn f x = (−1 + λ−f )y ∈ L2 (μ), weil (−1 + λ−f ) ∈ L∞(μ) ist. Da T abgeschlossen ist, ist λ ∈ ρ(T ). Das zeigt ⊂“. Sei nun λ ∈ ρ(T ). ” Dann ist notwendig (λ − T )−1 = Mh , dem Multiplikationsoperator mit 1 h = λ−f . Wir behaupten |h| ≤ Mh < ∞ fast u ¨berall. Sei n¨amlich a > 1, und w¨ ahle eine meßbare Menge E ⊂ {t: |h(t)| > a Mh } endlichen Maßes. Es folgt Mh χE 2 ≤ Mh 2 χE 2 = Mh 2 μ(E) sowie andererseits
Mh χE 2 =
|h(ω)|2 dμ(ω) ≥ a2 Mh 2 μ(E). E
Folglich gilt μ(E) = 0, und da a > 1 beliebig war, ergibt sich unsere Behauptung. Insbesondere ist h ∈ L∞ (μ), und λ liegt nicht im wesentlichen Wertebereich. Satz VII.2.16 F¨ ur selbstadjungiertes T ist σ(T ) ⊂ R.
356
VII.
Spektralzerlegung selbstadjungierter Operatoren
Beweis. Sei z = λ + iμ ∈ C \ R, also μ = 0. Sei S = Tμ − μλ auf dom(S) = dom(T ); dann ist S selbstadjungiert. Wegen (VII.12) gilt (z − T )x 2 = μ2 Sx − ix 2 ≥ μ2 x 2 , also existiert (z − T )−1 : ran(z − T ) = ran(i − S) → dom(T ) und ist stetig. Nach Satz VII.2.8 schließlich ist ran(z − T ) = H. 2 Zur Umkehrung dieses Satzes siehe Aufgabe VII.5.20.
VII.3
Der Spektralsatz fu ankte Operatoren ¨r unbeschr¨
Wir beginnen mit dem Analogon zu Satz VII.1.21. Satz VII.3.1 (Spektralsatz, Multiplikationsoperatorversion) Sei T : H ⊃ dom(T ) → H selbstadjungiert. Dann existieren ein (im separablen Fall σ-endlicher) Maßraum (Ω, Σ, μ), eine meßbare Funktion f : Ω → R sowie ein unit¨ arer Operator U : H → L2 (μ) mit (a) x ∈ dom(T ) ⇔ f · U x ∈ L2 (μ). (b) U T U ∗ ϕ = f · ϕ =: Mf (ϕ) f¨ ur ϕ ∈ dom(Mf ) = {ϕ ∈ L2 : f ϕ ∈ L2 }. Wir wissen bereits aus Beispiel VII.2(b), daß der Operator Mf selbstadjungiert ist; umgekehrt besagt Satz VII.3.1, daß Mf im wesentlichen das einzige Beispiel f¨ ur einen selbstadjungierten Operator ist. Beweis. Da T selbstadjungiert ist, ist σ(T ) ⊂ R (Satz VII.2.16), also existiert R := (T + i)−1 ∈ L(H). Wir zeigen zuerst, daß R normal ist. Seien z1 , z2 ∈ H. Nach Satz VII.2.8 existieren x, y ∈ dom(T ) mit z1 = (T + i)x, z2 = (T − i)y. Dann ist Rz1 , z2 = x, (T − i)y = (T + i)x, y = z1 , (T − i)−1 z2 , also R∗ = [(T + i)−1 ]∗ = (T − i)−1 , und Satz VII.2.15(b) impliziert RR∗ = R∗ R. Nach Satz VII.1.25 ist URU ∗ = Mg f¨ ur eine beschr¨ankte meßbare Funktion g: Ω → C und einen unit¨aren Operator U : H → L2 (μ). ¨ Um daraus eine Darstellung f¨ ur T zu gewinnen, werden wir die Uberlegung 1 =γ τ +i
⇔
zu u ¨ bertragen versuchen.
τ=
1 −i γ
∀τ, γ ∈ C, τ = −i, γ = 0
VII.3
Der Spektralsatz f¨ ur unbeschr¨ ankte Operatoren
357
1 Wir betrachten f (ω) = g(ω) − i. Da R injektiv ist, ist Mg injektiv, daher {ω: g(ω) = 0} eine Nullmenge, und f ist fast u ¨berall definiert. Als n¨achstes zeigen wir Teil (a). Sei x ∈ dom(T ). Da R den Hilbertraum H auf dom(T ) abbildet, kann man x = Ry f¨ ur ein y ∈ H schreiben, also
U x = U Ry = g · U y und f · U x = f · g · U y ∈ L2 (μ), da f · g beschr¨ankt ist. Ist umgekehrt f · U x ∈ L2 (μ), so existiert y ∈ H mit U y = (f + i)U x, also gilt g · U y = U x und x = (U ∗ Mg U )y = (T + i)−1 y ∈ dom(T ). Um (b) zu zeigen, bemerke dom(Mf ) = U (dom(T )) sowie (x = Ry wie oben, daher T x = y − ix) 1 U T x = U y − iU x = − i U x = f · U x; g das zeigt Teil (b). Mit T muß dann auch Mf symmetrisch sein, was schließlich beweist, daß f fast u 2 ¨ berall reellwertig ist. d Beispiel. Betrachte T = −i dt auf dem Schwartzraum dom(T ) = S (R) d (Definition V.2.3). T ist wesentlich selbstadjungiert, und T ∗ = −i dt auf ∗ 2 dom(T ) = {x ∈ L (R): x|I ∈ AC(I) f¨ ur alle kompakten Teilintervalle I ⊂ R und dx/dt ∈ L2 (R)} (vgl. Aufgabe VII.5.22). Die Fouriertransformation F erf¨ ullt
(F T F −1 ϕ)(t) = tϕ(t)
(VII.15)
f¨ ur ϕ ∈ S (R) nach Lemma V.2.4. Via F ist T also unit¨ar a¨quivalent zu dem Multiplikationsoperator Mt auf S (R) ⊂ L2 (R), denn F (dom(T )) = S (R). Man kann zeigen, daß (VII.15) auch f¨ ur den selbstadjungierten Operator T ∗ und ϕ ∈ L2 (R) mit t · ϕ ∈ L2 (R) gilt. Abschließend soll die Spektraldarstellung eines unbeschr¨ankten selbstadjungierten Operators skizziert werden. Wir beginnen mit dem selbstadjungierten Operator Mf , dom(Mf ) = {ϕ ∈ L2 (μ): f ϕ ∈ L2 (μ)}. Ist h: R → C beschr¨ankt und meßbar, so ist h(Mf ) := Mh◦f ∈ L(L2 (μ)) normal. Die Abbildung h → h(Mf ) ist stetig und multiplikativ. Ist A ⊂ R eine Borelmenge, so existiert insbesondere FA = χA (Mf ) = MχA ◦f = Mχf −1 (A) . A → FA ist ein Spektralmaß, hat aber i.a. keinen kompakten Tr¨ager. Fer ner gilt h(Mf ) = R h(λ) dFλ . Des weiteren ist F durch die letzte Gleichung eindeutig festgelegt. Sei T : H ⊃ dom(T ) → H selbstadjungiert und
358
VII.
Spektralzerlegung selbstadjungierter Operatoren
U T U ∗ = Mf gem¨ aß Satz VII.3.1 dargestellt. Setze EA = U ∗ FA U , dann ist E ein Spektralmaß auf R (i.a. ohne kompakten Tr¨ager), und f¨ ur beschr¨ankte meßbare h gilt h(T ) := h(λ) dEλ = U ∗ h(Mf )U. (VII.16) R
Die Abbildung h → h(T ) hat die u ¨blichen Eigenschaften eines Funktionalkalk¨ uls. All das l¨ aßt sich genauso zeigen wie im beschr¨ankten Fall. Sei nun h: R → R meßbar, aber nicht notwendig beschr¨ankt. Setze Dh = {x ∈ H: |h(λ)|2 dEλ x, x < ∞}. (dEλ x, x ist ein positives Maß!) Dann ist Dh ein dichter Unterraum von H. Um diese und die folgenden Aussagen zu beweisen, ist es notwendig, sie vom abstrakten“ Hilbertraum ” H mittels des unit¨ aren Operators U in den konkreten“ Hilbertraum L2 (μ) ” zu u ¨ bersetzen. Betrachten wir dazu noch einmal den Zusammenhang der Spektralmaße E und F . Schreibt man U x = ϕ und U y = ψ, so ist EA x, y = FA ϕ, ψ = ϕψ dμ. f −1 (A)
Setzt man ν(B) = B ϕψ dμ, so gilt also EA x, y = ν f −1 (A) ; die auf S. 335 zitierte Transformationsformel f¨ ur Bildmaße liefert daher f¨ ur integrierbare Funktionen g: R → R g(λ) dEλ x, y = g ◦ f dν = (g ◦ f )ϕψ dμ. (VII.17)
R
Ω
Ω
Nun zur¨ uck zu Dh . Offenbar ist wegen (VII.17) x ∈ Dh genau dann, wenn ϕ = U x |h ◦ f |2 |ϕ|2 dμ < ∞ Ω
erf¨ ullt, und in Beispiel VII.2(b) wurde gezeigt, daß solche ϕ einen dichten Unterraum von L2 (μ) bilden. Also ist auch Dh ein dichter Unterraum von H. Des weiteren existiert f¨ ur x ∈ Dh , y ∈ H das Integral h(λ) dEλ x, y, R
genauer gilt 1/2 2 h(λ) dEλ x, y ≤ |h(λ)| dE x, x y . λ R
R
In der Tat impliziert (VII.17), genauer ein Analogon f¨ ur die Variation, |h(λ)| d|Eλ x, y| = |(h ◦ f )ϕψ| dμ R
Ω
VII.4
359
Operatorhalbgruppen
≤
1/2 |h ◦ f | |ϕ| dμ 2
2
Ω
=
R
ψ 1/2
|h(λ)|2 dEλ x, x
y < ∞;
es gilt ja x ∈ Dh ⇔ (h ◦ f )ϕ ∈ L2 (μ). Daher existiert ein Element, das wir h(T )x ∈ H nennen wollen, mit h(T )x, y = h(λ) dEλ x, y ∀x ∈ Dh , y ∈ H. (VII.18) R
Der so definierte Operator h(T ): Dh → H wird mit h(T ) = h(λ) dEλ bezeichnet. Im Gegensatz zum Fall beschr¨ ankter h existiert dieses Integral nicht im Sinn der Operatornormkonvergenz wie in Satz VII.1.11, sondern nur im Sinn von (VII.18). Setzt man speziell h = t, so ergibt sich λ dEλ x, y = f ϕψ dμ = Mf ϕ, ψ = U ∗ Mf U x, y = T x, y R
Ω
f¨ ur x ∈ dom(T ), d.h. (Satz VII.3.1) f · U x ∈ L2 (μ), d.h. x ∈ Dt nach (VII.17). Es ist also Dt = dom(T ) und T = λ dEλ . Genauso zeigt man U ∗ Mh◦f U x, y = h(T )x, y
∀x ∈ Dh , y ∈ H.
Wir fassen zusammen. Theorem VII.3.2 (Spektralzerlegung selbstadjungierter Operatoren) Sei T : H ⊃ dom(T ) → H selbstadjungiert. Dann existiert ein eindeutig bestimmtes Spektralmaß E mit T x, y = λ dEλ x, y ∀x ∈ dom(T ), y ∈ H. R
Ist h: R → R meßbar und Dh = {x ∈ H: |h(λ)|2 dEλ x, x < ∞}, so definiert h(T )x, y = h(λ) dEλ x, y R
einen selbstadjungierten Operator h(T ): H ⊃ Dh → H.
VII.4
Operatorhalbgruppen
F¨ ur eine (n × n)-Matrix A wird die L¨ osung des Anfangswertproblems f¨ ur eine gew¨ohnliche Differentialgleichung u = Au,
u(0) = x0
(VII.19)
360
VII.
Spektralzerlegung selbstadjungierter Operatoren
bekanntlich durch die Cn -wertige Funktion u(t) = etA x0 gegeben. Auch partielle Differentialgleichungen k¨ onnen h¨ aufig in der Form (VII.19) geschrieben werden; dann ist A jedoch ein (unbeschr¨ankter) Operator in einem Banach- oder Hilbertraum. In diesem Abschnitt soll die Frage untersucht werden, f¨ ur welche Operatoren A das Exponential etA definiert werden kann. F¨ ur selbstadjungierte Operatoren A: H ⊃ dom(A) → H mit nach oben beschr¨ anktem Spektrum und t ≥ 0 ist das nach dem Spektralsatz VII.3.2 der Fall, da dann a → eta eine stetige beschr¨ankte Funktion auf dem Spektrum σ(A) ist. Die etA , t ≥ 0, sind beschr¨ankte Operatoren mit esA etA = e(s+t)A , s, t ≥ 0; sie bilden also eine Halbgruppe von Operatoren. Daß man im unendlichdimensionalen Fall nur positive t betrachtet, liegt in der Natur der Sache; z.B. ist das Anfangswertproblem der W¨ armeleitungsgleichung u = Δu f¨ ur negative Zeiten i.a. nicht l¨ osbar. Halbgruppen von Operatoren auf Banachr¨aumen bilden den Gegenstand dieses Abschnitts, in dem X stets einen komplexen Banachraum bezeichnet. Definition VII.4.1 Eine stark stetige Operatorhalbgruppe (oder C0 -Halbgruppe) ist eine Familie Tt : X → X, t ≥ 0, von stetigen linearen Operatoren auf einem Banachraum X mit folgenden Eigenschaften: (1) T0 = Id, (2) Ts+t = Ts Tt f¨ ur alle s, t ≥ 0, (3) lim Tt x = x f¨ ur alle x ∈ X. t→0
Gilt statt (3) die st¨ arkere Forderung (3 ) lim Tt − Id = 0, t→0
so spricht man von einer normstetigen Halbgruppe. In Abschnitt VIII.1 werden wir die starke Operatortopologie auf L(X) einf¨ uhren; die Bedingung (3) bedeutet dann die Stetigkeit von t → Tt in dieser Topologie bei t = 0. Analog besagt (3 ) die Stetigkeit von t → Tt bei t = 0 in der Operatornormtopologie. Beachte noch, daß wegen (2) die Operatoren einer Halbgruppe notwendig kommutieren. Beispiele. (a) Sei A ∈ L(X) und tA
Tt = e
∞ n n t A := . n! n=0
Die Reihe konvergiert absolut in L(X); daher definiert sie einen stetigen linearen Operator. (Tt )t≥0 ist eine normstetige Halbgruppe: (1) ist trivial,
VII.4
361
Operatorhalbgruppen
(2) zeigt man wie in der Analysisvorlesung die Funktionalgleichung ex+y = ex ey der Exponentialfunktion, und f¨ ur (3 ) beachte nur ∞ ∞ tn A n A n n ≤ Tt − Id = t = et A − 1 → 0 n! n! n=1 n=1 mit t → 0. In diesem Beispiel erhalten wir sogar eine Gruppe, wenn wir t ∈ R zulassen. (b) Wir betrachten die Translationshalbgruppe (Tt f )(x) = f (x + t) auf Lp (R), Lp [0, ∞), C0 (R) oder C0 [0, ∞). Es ist klar, daß jeweils (1) und (2) erf¨ ullt sind. (3) sieht man auf C0 (R) so: Ist f ∈ C0 (R), so ist f gleichm¨aßig stetig (Beweis?). Zu ε > 0 existiert dann ein δ > 0 mit |x − y| ≤ δ
⇒
|f (x) − f (y)| ≤ ε.
Daher gilt f¨ ur 0 < t ≤ δ Tt f − f ∞ = sup |f (x + t) − f (x)| ≤ ε. x∈R
Im Lp -Fall f¨ ur 1 ≤ p < ∞ zeigt man zuerst Tt f → f auf dem dichten Unterraum aller stetigen Funktionen mit kompaktem Tr¨ager und schließt daraus mittels supt Tt < ∞, daß (3) gilt; vgl. Aufgabe II.5.5. F¨ ur p = ∞ gilt (3) nicht, wie man am Beispiel f = 1[0,1] sieht. Ist die Grundmenge [0, ∞), sind die Beweise identisch; im Fall von R erh¨alt man aber sogar eine Gruppe von Operatoren, wenn man auch negative t zul¨aßt. (c) Die W¨ armeleitungshalbgruppe ist durch T0 = Id bzw. |x − y|2 1 (Tt f )(x) = exp − f (y) dy (VII.20) 4t (4πt)d/2 Rd auf diversen Funktionenr¨ aumen auf Rd erkl¨art. Wir behandeln den Fall p d L (R ), 1 ≤ p < ∞. Setzt man γt (x) =
|x|2 1 exp − , 4t (4πt)d/2
x ∈ Rd , t > 0,
so kann (VII.20) mittels der Faltung als Tt f = γt ∗ f geschrieben werden. Die Youngsche Ungleichung (Satz II.4.4, sie gilt f¨ ur Rd wie f¨ ur T) zeigt Ttf p ≤ γt 1 f p = f p ;
362
VII.
Spektralzerlegung selbstadjungierter Operatoren
daher sind alle Tt stetige lineare Operatoren mit Norm ≤ 1 auf Lp (Rd ). Die Eigenschaft (1) einer C0 -Halbgruppe gilt definitionsgem¨aß, und Eigenschaft (3) zeigt man mit einer ¨ ahnlichen Technik wie in Aufgabe II.5.6. Es bleibt, (2) nachzurechnen, das wegen der Assoziativit¨at der Faltung auf γs+t = γs ∗ γt
∀s, t > 0
hinausl¨auft. Diese Gleichung kann elementar verifiziert werden, wenn man nur π d/2 b2 exp(−a2 y 2 + 2by − c2 ) dy = d exp −c2 + 2 , a, c ∈ R, b ∈ Rd , a a Rd ber¨ ucksichtigt; alternativ kann man mittels Fouriertransformation und Aufgabe VII.5.10 argumentieren. (VII.20) definiert auch auf dem Raum C0 (Rd ) eine C0 -Halbgruppe (Aufgabe VII.5.26). Sie wird wegen des Zusammenhangs zur Brownschen Bewegung auch Brownsche Halbgruppe genannt. Der Name W¨armeleitungshalbgruppe reflektiert den engen Zusammenhang dieses Beispiels zur W¨armeleitungsgleichung, vgl. Satz VII.4.7. (d) Auch in der Theorie der Delay-Gleichungen (Differentialgleichungen mit nacheilendem Argument) treten Operatorhalbgruppen auf. Bei einer gew¨ohnlichen Differentialgleichung erster Ordnung h¨angt u (t) nur von u(t) ab, bei einer Delay-Gleichung jedoch von den u(s) in einem Intervall t−σ ≤ s ≤ t. Diese u(s) bilden die Vorgeschichte von u(t). Wir betrachten ein lineares autonomes Delay-Anfangswertproblem der Form u (t) = (u(t) ),
u(0) = ϕ ∈ C[−σ, 0];
(VII.21)
dabei bezeichnet u(t) (s) = u(s + t), −σ ≤ s ≤ 0, und ein stetiges lineares Funktional auf dem Banachraum C[−σ, 0]. Ein einfaches Beispiel erh¨alt man mit = δ−σ , dann lautet die Gleichung u (t) = u(t − σ). Aus der Theorie der Delay-Gleichungen ist bekannt, daß (VII.21) genau eine L¨osung besitzt3 ; diese wollen wir in der Form u(t) = Tt ϕ mit einem L¨osungsoperator Tt schreiben. Die Tt sind dann lineare Abbildungen auf C[−σ, 0], und aus der Eindeutigkeit der L¨ osung f¨ ur jeden Anfangswert folgt die Halbgruppeneigenschaft Ts+t = Ts Tt . Nach Konstruktion gilt T0 = Id sowie f¨ ur t > 0 und −σ ≤ s ≤ 0 ϕ(s + t) falls s + t ≤ 0, s+t (Tt ϕ)(s) = (VII.22) ϕ(0) + 0 (Tϑϕ) dϑ falls s + t > 0. Daraus folgt die Absch¨ atzung
Tt ϕ ∞ ≤ ϕ ∞ +
t
Tϑ ϕ ∞ dϑ 0
3 Vgl.
J. Hale, S. M. Verduyn Lunel, Introduction to Functional Differential Equations, Springer-Verlag 1993, Theorem 6.1.1.
VII.4
363
Operatorhalbgruppen
(beachte s + t ≤ t) und weiter nach der Gronwallschen Ungleichung (siehe z.B. Walter [1993], S. 257) Ttϕ ∞ ≤ e
t ϕ ∞
∀ϕ ∈ C[−σ, 0].
Das liefert die Stetigkeit der Tt auf C[−σ, 0] und mit (VII.22) auch noch limt→0 Tt ϕ − ϕ ∞ = 0. Damit ist gezeigt, daß die Tt , t ≥ 0, eine stark stetige Operatorhalbgruppe auf C[−σ, 0] bilden. Wir wollen nun zwei einfache Eigenschaften einer C0 -Halbgruppe kennenlernen. Lemma VII.4.2 Ist (Tt )t≥0 eine C0 -Halbgruppe auf einem Banachraum X, so existieren M ≥ 1, ω ∈ R mit Tt ≤ M eωt
∀t ≥ 0.
(VII.23)
Beweis. Wir zeigen zuerst, daß ein τ > 0 mit K := sup Tt < ∞
(VII.24)
0≤t≤τ
existiert. W¨are das falsch, g¨ abe es eine Nullfolge (tn ) mit Ttn → ∞. Nach dem Satz von Banach-Steinhaus existierte dann ein x ∈ X mit Ttn x → ∞ im Widerspruch zur Eigenschaft (3) einer C0 -Halbgruppe. Seien nun K und τ wie in (VII.24). Schreibe eine Zahl t ≥ 0 als t = nτ +ϑ mit n ∈ N0 und 0 ≤ ϑ < τ ; dann gilt Tt = Tτn Tϑ ≤ Tτ n Tϑ ≤ K n+1 ≤ K(K 1/τ )t , letzteres wegen n ≤ t/τ , K ≥ T0 = 1. Also ist (VII.23) mit M = K und ω = (log K)/τ erf¨ ullt. 2 Das Infimum u assigen ω, genauer ¨ ber die in (VII.23) zul¨ ω0 := inf{ω: ∃M = M (ω) mit (VII.23)},
(VII.25)
heißt der Typ oder die (exponentielle) Wachstumsschranke der Halbgruppe. Das Infimum braucht u ¨ brigens nicht angenommen zu werden und kann −∞ sein (Aufgaben VII.5.28 und VII.5.29). Wenn man in (VII.23) M = 1 und ω = 0 w¨ahlen kann, mit anderen Worten wenn Tt ≤ 1 f¨ ur alle t ≥ 0 gilt, heißt die C0 -Halbgruppe (Tt ) eine Kontraktionshalbgruppe. Lemma VII.4.3 Ist (Tt ) eine C0 -Halbgruppe auf einem Banachraum X, so ist die Abbildung [0, ∞) × X → X,
(t, x) → Tt x
364
VII.
Spektralzerlegung selbstadjungierter Operatoren
stetig, und zwar gleichm¨ aßig in t auf kompakten Teilmengen von [0, ∞). Insbesondere ist f¨ ur jedes x ∈ X die vektorwertige Funktion u: t → Tt x stetig; in Zeichen u ∈ C([0, ∞), X). Beweis. Seien x ∈ X und t0 > 0. Zu δ > 0 w¨ ahle h0 > 0 mit Th x − x ≤ δ
∀0 ≤ h ≤ h0 .
F¨ ur den Beweis des Satzes reicht es, f¨ ur eine gewisse Konstante C die Absch¨atzung x − y ≤ δ, 0 ≤ s ≤ t ≤ t0 , t − s ≤ h0
⇒
Tt x − Ts y ≤ Cδ
zu beweisen. Seien dazu M und ω wie in (VII.23); es folgt Ttx − Ts y ≤ Tt x − Ts x + Ts x − Ts y ≤ Ts Tt−sx − x + Ts x − y ≤ M eωs δ + M eωs δ. Man setze also C = 2M , falls ω ≤ 0, und C = 2M eωt0 , falls ω > 0.
2
Wir wollen einer C0 -Halbgruppe einen (in der Regel unbeschr¨ankten) Operator, ihren Erzeuger, zuordnen. Eine Hauptaufgabe der Halbgruppentheorie ist, den Zusammenhang dieser beiden Objekte zu studieren. F¨ ur eine Halbgruppe (etA )t≥0 wie in Beispiel (a) w¨ urde man A als Er” zeuger“ der Halbgruppe ansehen. Um nun A aus der Exponentialfunktion etA zur¨ uckzuerhalten, muß man diese differenzieren. Diese Idee steht bei der folgenden Definition Pate. Definition VII.4.4 Sei (Tt )t≥0 eine C0 -Halbgruppe auf einem Banachraum X. Der infinitesimale Erzeuger (kurz Erzeuger ) von (Tt ) ist der Operator Th x − x Ax = lim h→0 h auf dem Definitionsbereich Th x − x dom(A) = x ∈ X: lim existiert . h→0 h Mit Hilfe der vektorwertigen Funktionen u(x) : t → Ttx l¨aßt sich dom(A) als {x: u(x) (0) existiert} und Ax als (rechtsseitige) Ableitung u(x) (0) deuten. Wir berechnen die Erzeuger der Halbgruppen aus den obigen Beispielen. Dabei stellt sich heraus, daß A wirklich in der Regel ein unbeschr¨ankter Operator ist; siehe dazu auch Satz VII.4.9.
VII.4
Operatorhalbgruppen
365
Beispiele. (a) Der Erzeuger der Halbgruppe (etA ) ist A selbst; es gilt ja hA ∞ n−1 n ∞ e − Id h A hn−1 A n = ≤ − A ≤ h A 2 eh A → 0. h n! n! n=2 n=2 Ferner ist hier der Definitionsbereich des Erzeugers ganz X. (b) Bei der Translationshalbgruppe gilt punktweise lim
h→0+
Th f (x) − f (x) f (x + h) − f (x) d+ f = lim = (x); h h dx h→0+
d+ /dx bezeichnet die rechtsseitige Ableitung. Daher ist zu vermuten, daß der Erzeuger A der Ableitungsoperator f → f ist. Wir best¨atigen das in dem Fall, daß die Tt auf C0 (R) (oder C0 [0, ∞)) erkl¨art sind: dom(A) = {f ∈ C0 (R): f existiert und f ∈ C0 (R)}, Af = f . Sei als erstes f ∈ C0 (R) differenzierbar mit f ∈ C0 (R). Dann ist f gleichm¨aßig stetig, woraus mit h → 0+ x+h f (x + h) − f (x) = 1 − f (x) f (y) dy − f (x) h h x x+h 1 ≤ |f (y) − f (x)| dy → 0 h x gleichm¨aßig in x folgt. Das heißt f ∈ dom(A) und Af = f . Ist umgekehrt f ∈ dom(A), so zeigt das punktweise Argument, daß f rechtsseitig differenzierbar ist; und da Af definitionsgem¨aß in C0 (R) liegt, ist die rechtsseitige Ableitung stetig. Daraus folgt aber die Differenzierbarkeit von f schlechthin4 . In der Lp -Theorie ist der Definitionsbereich des Erzeugers schwieriger zu beschreiben. Es sei an den Begriff der absolutstetigen Funktion erinnert (Definition A.1.9) und daran, daß eine solche Funktion fast u ¨ berall differenzierbar ist (Satz A.1.10). Dann kann man f¨ ur den Erzeuger der Translationshalbgruppe auf Lp (R), 1 ≤ p < ∞, zeigen: dom(A) = {f ∈ Lp (R): f ist absolutstetig und f ∈ Lp (R)}, Af = f . (c) Der Erzeuger der W¨ armeleitungshalbgruppe ist der Laplaceoperator. Wir betrachten im Detail den Fall p = 2; hier sieht man das am schnellsten mittels der Fouriertransformation ein. Zun¨ achst ist festzustellen, daß alle 4 Siehe
W. Walter, Analysis I, Springer-Verlag 1985, Satz 12.25.
366
VII.
Spektralzerlegung selbstadjungierter Operatoren
γt ∈ S (Rd ) sind. Da die Faltung zweier Schwartzfunktionen wieder eine Schwartzfunktion ist (Aufgabe VII.5.10), gilt Tt S (Rd ) ⊂ S (Rd ) f¨ ur alle t > 0. Als erstes wird nun lim
h→0
γh ∗ f − f = Δf h
∀f ∈ S (Rd )
(VII.26)
(mit Konvergenz in L2 (Rd )) behauptet. Da die Fouriertransformation ein Isomorphismus auf L2 (Rd ) ist, der den Schwartzraum invariant l¨aßt (Satz V.2.8), ist (VII.26) wegen Aufgabe VII.5.10 ¨ aquivalent zu √ d 2π F γh · F f − F f lim = F (Δf ) h→0 h
∀f ∈ S (Rd ).
Weiter gelten nach Lemma V.2.6 und Lemma V.2.4 F γt (ξ) =
2 1 e−tξ , (2π)d/2
F (Δf )(ξ) = −ξ 2 F f (ξ),
und da die Fouriertransformation ein Isomorphismus auf S (Rd ) ist, ist (VII.26) schließlich zu ehq g − g = qg h→0 h lim
∀g ∈ S (Rd )
(VII.27)
¨aquivalent, wo q(ξ) = −ξ 2 gesetzt und wieder die Konvergenz in L2 (Rd ) gemeint ist. Um (VII.27) einzusehen, betrachte die Hilfsfunktion ∞ ez − 1 z n−1 Φ(z) = −1= ; z n! n=2
damit gilt hq 2 e g − g = (Φ ◦ (hq)) · qg 2 = − qg |Φ(−hξ 2 )|2 |ξ 2 g(ξ)|2 dξ → 0 2 h Rd 2 mit h → 0 nach dem Lebesgueschen Konvergenzsatz, denn der Integrand strebt punktweise gegen 0 und wird von der integrierbaren Funktion |qg|2 majorisiert (beachte −1 ≤ Φ(z) ≤ 0 f¨ ur z ≤ 0). Mehr noch: das Argument zeigt, daß (VII.26) f¨ ur alle f ∈ L2 gilt, f¨ ur die q · F f in L2 liegt, und das ist genau fu r die f aus dem Sobolevraum W 2 (Rd ) der Fall (Satz V.2.14); ¨ hier ist der Laplaceoperator nat¨ urlich im Sinn der schwachen Ableitungen zu verstehen. Damit ist f¨ ur p = 2 dom(A) = W 2 (Rd ),
Af = Δf
gezeigt. Im Fall p = 2 kann man den Definitionsbereich von Δ als {f ∈ Lp : Δf ∈ Lp } beschreiben; hier werden Ableitungen im Distributionensinn
VII.4
367
Operatorhalbgruppen
aufgefaßt, siehe Abschnitt VIII.5. F¨ ur 1 < p < ∞ stimmt dom(Δ) mit dem auf Seite 254 angesprochenen Sobolevraum W 2,p (Rd ) u ¨berein, aber nicht f¨ ur p = 1. (d) In diesem Beispiel ist der Erzeuger der Ableitungsoperator Aϕ = ϕ auf dem Definitionsbereich dom(A) = {ϕ ∈ C 1 [−σ, 0]: ϕ (0) = (ϕ)}. Ist n¨amlich zun¨achst ϕ ∈ dom(A), so folgt aus (VII.22) ⎧ + d ϕ Th ϕ(s) − ϕ(s) ⎨ (s) −σ ≤ s < 0, (Aϕ)(s) = lim = dt h→0 ⎩ h (ϕ) s = 0.
(VII.28)
Da Aϕ stetig ist, muß ϕ (beidseitig) stetig differenzierbar sein (vgl. das Argument in Beispiel (b)); also ist ϕ ∈ C 1 [−σ, 0], ϕ(0) = (ϕ) und Aϕ = ϕ . Daß umgekehrt ein solches ϕ zu dom(A) geh¨ort, ergibt sich aus der gleichm¨aßigen Konvergenz bzgl. s in (VII.22). Als n¨achstes werden einige Eigenschaften des infinitesimalen Erzeugers A einer C0 -Halbgruppe studiert. Aus der Definition von dom(A) ergibt sich nicht unmittelbar, daß dom(A) mehr als die 0 enth¨alt. Unser erstes Ziel ist zu zeigen, daß A stets dicht definiert und abgeschlossen ist. Dazu wird das Riemannintegral f¨ ur banachraumwertige stetige Funktionen ben¨otigt. Dieses kann wie im skalaren Fall als Grenzwert von Riemannschen Summen erkl¨art werden; es gelten dann s¨ amtliche vertrauten Rechenregeln (Lineab c c rit¨at, a + b = a etc.) inklusive des Hauptsatzes 1 t+h lim u(s) ds = u(t) (VII.29) h→0 h t f¨ ur stetige Funktionen mit Werten in einem Banachraum. Die Beweise dieser Aussagen erfolgen wie im skalaren Fall. Ferner gilt f¨ ur stetige lineare Operatoren T b b T u(s) ds = T (u(s)) ds. (VII.30) a
a
Zuerst nun ein wichtiges Lemma. Lemma VII.4.5 Sei A der Erzeuger der C0 -Halbgruppe (Tt ) auf dem Banachraum X, und sei t > 0. t t (a) Ts x ds ∈ dom(A) f¨ ur alle x ∈ X, und A Ts x ds = Tt x − x. 0
(b) Tt (dom(A)) ⊂ dom(A). (c) Tt Ax = ATt x f¨ ur alle x ∈ dom(A). t (d) Tt x − x = Ts Ax ds f¨ ur alle x ∈ dom(A). 0
0
368
VII.
Spektralzerlegung selbstadjungierter Operatoren
Beweis. Beachte, daß die Funktionen t → Tt x nach Lemma VII.4.3 stetig sind. (a) Es gilt nach (VII.30) und (VII.29) t t t t 1 1 Th Ts x ds − Ts x ds = Ts+h x ds − Ts x ds h h 0 0 0 0 t+h h 1 = Ts x ds − Ts x ds h t 0 → Tt x − T0 x = Tt x − x mit h → 0; daraus folgt (a). (b), (c) Sei x ∈ dom(A). Dann konvergiert mit h → 0 T x − x Th (Tt x) − Tt x h = Tt → Tt Ax, h h denn Tt ist stetig. Also ist Ttx ∈ dom(A) und ATt x = Tt Ax. (d) Sei x ∈ dom(A). Unter (a) wurde bewiesen t t t 1 Tt x − x = A Ts x ds = lim Th Ts x ds − Ts x ds h→0 h 0 0 0 t Th x − x = lim Ts ds. h→0 0 h Wegen x ∈ dom(A) konvergiert Ts
T x − x h → Ts Ax h
f¨ ur h → 0, und zwar wegen sups≤t Ts < ∞ (Lemma VII.4.2) gleichm¨aßig auf [0, t]. Daraus folgt
t
lim
h→0
und (d) ist bewiesen.
Ts 0
t T x − x h ds = Ts Ax ds, h 0 2
Es ist zu bemerken, daß in Beispiel (c) sogar Tt x ∈ dom(A) f¨ ur alle x ∈ X gilt, nicht jedoch in Beispiel (b). Aussage (a) aus Lemma VII.4.5 kann so interpretiert werden, daß im Mittel“ Tt x stets in dom(A) liegt; ” im Kontext von Beispiel (b) sieht man erneut die gl¨attende Wirkung der Integration. Satz VII.4.6 Der Erzeuger einer C0 -Halbgruppe ist dicht definiert und abgeschlossen.
VII.4
Operatorhalbgruppen
369
Beweis. Sei A der Erzeuger von (Tt ). Zu x ∈ X und t > 0 betrachte t xt := 1t 0 Ts x ds. Dann ist nach Lemma VII.4.5(a) xt ∈ dom(A), und es gilt nach (VII.29) limt→0 xt = x. Deshalb ist A dicht definiert. Zum Beweis der Abgeschlossenheit von A betrachte eine Folge (xn ) in dom(A) mit xn → x, Axn → y ∈ X. Es ist x ∈ dom(A) und Ax = y zu zeigen. Das folgt aus Th x − x = h
Th xn − xn h 1 h = lim Ts Axn ds (Lemma VII.4.5(d)) n→∞ h 0 h 1 = Ts y ds h 0 (da Ts Axn → Ts y gleichm¨aßig in s ∈ [0, t]) → y lim
n→∞
mit h → 0.
2
Lemma VII.4.5 liefert Informationen u ¨ber die L¨osungen eines abstrakten Cauchyproblems u = Au, u(0) = x0 . (VII.31) Satz VII.4.7 Es sei A der Erzeuger der C0 -Halbgruppe (Tt ) auf einem Banachraum X, und es sei x0 ∈ dom(A). Dann ist die Funktion u: [0, ∞) → X, u(t) = Ttx0 , stetig differenzierbar, dom(A)-wertig und eine L¨ osung von (VII.31). Ferner ist u die einzige L¨ osung von (VII.31) mit diesen Eigenschaften, und u(t) h¨ angt stetig vom Anfangswert x0 ab. Beweis. Nach Lemma VII.4.5(b) ist Tt x0 ∈ dom(A) f¨ ur alle t > 0, also ist A(u(t)) wohldefiniert. F¨ ur die rechtsseitige Ableitung von u gilt T x − x u(t + h) − u(t) Tt+h x0 − Tt x0 h 0 0 lim = lim = lim Tt h h h h→0+ h→0+ h→0+ = Tt Ax0 = ATt x0 = A(u(t)) und f¨ ur die linksseitige ebenfalls lim
h→0+
u(t − h) − u(t) Th x0 − x0 = lim+ Tt−h = Tt Ax0 = A(u(t)). −h h h→0
Im vorletzten Schritt geht ein, daß wegen sups≤t Ts < ∞ die Tt−h gleichgradig stetig sind; mit der Abk¨ urzung Ah = h1 (Th − Id) lautet die Absch¨atzung explizit Tt−h Ah x0 − Tt Ax0 ≤ Tt−h Ah x0 − Tt−h Ax0 + Tt−h Ax0 − Tt Ax0 ≤ Tt−h Ah x0 − Ax0 + Tt−h Ax0 − Tt Ax0 → 0
370
VII.
Spektralzerlegung selbstadjungierter Operatoren
nach Definition von A sowie Lemma VII.4.3. Außerdem zeigt dieses Lemma wegen u (t) = ATt x0 = Tt Ax0 , daß u stetig ist. Sei nun v eine weitere L¨ osung von (VII.31). Dann liefert die Produkt” regel“ der Differentiation (Beweis wie in der Analysis) f¨ ur 0 ≤ t ≤ s d d Ts−t v(t) = (−1)ATs−t v(t) + Ts−t v (t) denn Tτ x = ATτ x dt dτ = −Ts−t Av(t) + Ts−t Av(t) = 0. Daraus folgt die Konstanz der Funktion Φ: [0, s] → X, Φ(t) = Ts−t v(t); denn f¨ ur alle Funktionale ∈ X ist d dΦ ( ◦ Φ) = ◦ = 0, dt dt so daß (Φ(0)) = (Φ(t)) f¨ ur alle t ∈ [0, s], insbesondere f¨ ur t = s. Der Satz von Hahn-Banach impliziert Φ(0) = Φ(s), d.h. Ts x0 = v(s). Da s beliebig war, ist die Eindeutigkeit der L¨ osung gezeigt. Die stetige Abh¨ angigkeit von u(t) von x0 ist nichts anderes als die Stetigkeit der Operatoren Tt . 2 Korollar VII.4.8 Zwei C0 -Halbgruppen mit demselben Erzeuger stimmen u ¨ berein. Beweis. Haben (St ) und (Tt ) denselben Erzeuger A, so l¨osen sowohl t → St x als auch t → Tt x das Anfangswertproblem u (t) = Au(t),
u(0) = x ∈ dom(A).
Die eindeutige L¨ osbarkeit impliziert St |dom(A) = Tt |dom(A) f¨ ur alle t ≥ 0 und, da die St und Tt stetig sind und dom(A) dicht liegt (Satz VII.4.6), St = Tt . 2 Will man Satz VII.4.7 auf ein konkretes Cauchyproblem mit einem gegebenen Differentialoperator A anwenden, ben¨ otigt man Kriterien, mit deren Hilfe man einem abgeschlossenen Operator ansehen kann, ob er eine C0 Halbgruppe erzeugt. Solche Kriterien werden im folgenden hergeleitet. Wir behandeln zuerst den Fall normstetiger Halbgruppen. Bei einer normstetigen Halbgruppe (Tt ) ist die Abbildung t → Tt bzgl. der Operatornorm stetig, wie aus der f¨ ur 0 ≤ s ≤ t ≤ t0 g¨ ultigen Absch¨atzung Tt − Ts = Ts (Tt−s − Id) ≤ Ts Tt−s − Id ≤ C Tt−s − Id t folgt. Daher konvergiert das Riemannintegral 0 Ts ds in der Operatornorm, und wir k¨onnen die Operatoren 1 t Mt = Ts ds (t > 0) (VII.32) t 0
VII.4
371
Operatorhalbgruppen
definieren. Da T → T x ein stetiger linearer Operator von L(X) nach X ist, gilt 1 t Mt x = Ts x ds ∀x ∈ X. t 0 Satz VII.4.9 F¨ ur eine C0 -Halbgruppe (Tt ) mit Erzeuger A sind folgende Aussagen ¨ aquivalent: (i) (Tt ) ist normstetig. (ii) A ist stetig. (iii) dom(A) = X. Sind diese Bedingungen erf¨ ullt, gilt Tt = etA f¨ ur alle t ≥ 0. Beweis. (i) ⇒ (iii): Wir verwenden die obige Notation. Ist (Tt ) normstetig, folgt aus (VII.29) Mt − Id → 0, denn t → Tt ist stetig. F¨ ur hinreichend kleines τ ist deshalb Mτ invertierbar und insbesondere surjektiv (Neumannsche Reihe, Satz II.1.11). Nun ist nach Lemma VII.4.5(a) ran(Mτ ) ⊂ dom(A); folglich ist dom(A) = X. (iii) ⇒ (ii): Da A nach Satz VII.4.6 abgeschlossen ist, folgt diese Implikation aus dem Satz vom abgeschlossenen Graphen. (ii) ⇒ (i): Betrachte die Halbgruppe St = etA ; nach Beispiel (a) ist (St ) normstetig und hat A als Erzeuger. Wegen Korollar VII.4.8 ist Tt = etA , und damit ist auch der Zusatz gezeigt. 2 ¨ Beachte, daß die Aquivalenz von (ii) und (iii) f¨ ur jeden dicht definierten abgeschlossenen Operator in einem Banachraum g¨ ultig ist. Um den fundamentalen Satz von Hille-Yosida u ¨ber die Erzeugung von C0 -Halbgruppen zu formulieren, ben¨ otigen wir Grundbegriffe der Spektraltheorie unbeschr¨ ankter Operatoren in einem Banachraum. Diese sind vollkommen analog zu denen aus Definition VII.2.14 f¨ ur Hilbertraum-Operatoren; auch Satz VII.2.15 gilt entsprechend. Wir wenden uns als erstes den Kontraktionshalbgruppen zu, also den C0 -Halbgruppen mit Tt ≤ 1 f¨ ur alle t ≥ 0. Satz VII.4.10 Sei A der Erzeuger der Kontraktionshalbgruppe (Tt ). (a) {λ: Re λ > 0} ⊂ ρ(A). (b) (λ − A)−1 x =
(c) (Re λ)(λ − A)
∞
0 −1
e−λs Ts x ds f¨ ur alle λ mit Re λ > 0.
≤ 1 f¨ ur alle λ mit Re λ > 0.
Beweis. Sei Re λ > 0; dann ist limt→∞ e−λt Tt = 0, da Tt ≤ 1. Wendet man Lemma VII.4.5 auf die Halbgruppe (e−λt Tt) an, die den Erzeuger A−λ mit Definitionsbereich dom(A) hat, folgt ⎧ t ⎪ ⎪ e−λs Ts x ds ∀x ∈ X, ⎨ (A − λ) −λt 0 e Tt x − x = t ⎪ ⎪ ⎩ e−λs Ts (A − λ)x ds ∀x ∈ dom(A). 0
372
VII.
Spektralzerlegung selbstadjungierter Operatoren
Der Grenz¨ ubergang t → ∞ liefert ∞ ⎧ ⎪ e−λs Ts x ds ⎨ (λ − A) 0 x= ∞ ⎪ ⎩ e−λs Ts (λ − A)x ds
∀x ∈ X, ∀x ∈ dom(A).
0
Daher ist λ − A: dom(A) → X bijektiv und λ ∈ ρ(A), und der inverse Operator hat die in (b) angegebene Gestalt. Schließlich folgt (c) aus ∞ ∞ x (λ− A)−1 x ≤ e− Re λs Ts x ds ≤ e− Re λs ds · x = . 2 Re λ 0 0 Teil (b) kann man so deuten, daß die Resolvente von A die Laplacetransformation der Halbgruppe ist. Wir kommen zum ersten Hauptergebnis, wonach die Umkehrung von Satz VII.4.10 ebenfalls richtig ist. Theorem VII.4.11 (Satz von Hille-Yosida f¨ ur Kontraktionshalbgruppen) Ein Operator A ist genau dann Erzeuger einer Kontraktionshalbgruppe, wenn A dicht definiert und abgeschlossen ist, (0, ∞) ⊂ ρ(A) gilt und λ(λ − A)−1 ≤ 1
∀λ > 0.
(VII.33)
Beweis. Die Notwendigkeit der Bedingungen wurde in Satz VII.4.6 und Satz VII.4.10 bewiesen. Der Beweis der Umkehrung nach Yosida beruht auf folgender Idee: Definiere f¨ ur λ > 0 beschr¨ankte Operatoren Aλ und die zugeh¨origen Halbgruppen (etAλ ); dann zeige, daß Tt x = limλ→∞ etAλ x existiert und eine Kontraktionshalbgruppe mit Erzeuger A definiert. F¨ ur λ > 0 definieren wir also die Yosida-Approximation Aλ := λA(λ − A)−1 = λ2 (λ − A)−1 − λ ∈ L(X) und die zugeh¨orige normstetige Halbgruppe (etAλ ); beachte Aλ x = λ(λ − A)−1 Ax
∀x ∈ dom(A).
Die Operatoren etAλ sind kontraktiv wegen 2
etAλ ≤ e−λt eλ
(λ−A)−1 t
2
≤ e−λt e λ
(λ−A)−1 t
≤ e−λt eλt = 1;
im zweiten Schritt wurde die f¨ ur einen beschr¨ankten Operator S g¨ ultige Absch¨atzung ∞ n ∞ S S n S ≤ e = = e S
n! n! n=0 n=0 und im vorletzten die Voraussetzung (VII.33) benutzt.
VII.4
373
Operatorhalbgruppen
Wir m¨ochten nun das Verhalten von Aλ x und etAλ x f¨ ur λ → ∞ untersuchen. Dazu wird zuerst lim Aλ x = Ax
λ→∞
∀x ∈ dom(A)
(VII.34)
gezeigt. Ist n¨amlich y ∈ dom(A), so erh¨ alt man lim λ(λ − A)−1 y = lim (y + A(λ − A)−1 y) = y,
λ→∞
λ→∞
(VII.35)
denn
Ay →0 λ mit λ → ∞ wegen (VII.33). Nun ist nach Voraussetzung die Familie der Operatoren λ(λ − A)−1 beschr¨ ankt, so daß (VII.35) sogar f¨ ur alle y ∈ X gilt. Setzt man speziell y = Ax ein, erh¨ alt man (VII.34). Seien jetzt x ∈ X und t ≥ 0. Wir zeigen, daß limλ→∞ etAλ x existiert, und beweisen dazu die Cauchy-Eigenschaft. Wir gehen aus von A(λ − A)−1 y = (λ − A)−1 Ay ≤
d s(Aλ −Aμ ) e x = es(Aλ −Aμ ) (Aλ − Aμ )x, ds integrieren von 0 bis t und wenden dann etAμ an; das liefert t etAλ x − etAμ x = esAλ e(t−s)Aμ (Aλ − Aμ )x ds. 0
Hier ist zu beachten, daß f¨ ur kommutierende beschr¨ankte Operatoren S und T auch eS , eT , S und T kommutieren und daß eS+T = eS eT gilt (Aufgabe VII.5.30). Man erh¨ alt jetzt f¨ ur x ∈ dom(A) t etAλ x − etAμ x ≤ esAλ e(t−s)Aμ Aλ x − Aμ x ds 0
≤ t Aλ x − Aμ x → 0 mit λ, μ → ∞ wegen (VII.34). Aber da stets etAλ ≤ 1 gilt, schließen wir, daß limλ→∞ etAλ x sogar f¨ ur alle x ∈ X und nicht bloß auf dom(A) existiert; beachte außerdem, daß die Konvergenz gleichm¨aßig auf beschr¨ankten tIntervallen ist. F¨ ur jedes t ≥ 0 und jedes x ∈ X kann man daher Tt x := lim etAλ x λ→∞
(VII.36)
definieren. Dann sind die Tt stetige Operatoren mit Norm ≤ 1, da die etAλ es sind. Der n¨achste Schritt ist zu zeigen, daß (Tt )t≥0 eine Kontraktionshalbgruppe ist. Hier sind die Forderungen (1) und (2) aus Definition VII.4.1 klar, und die starke Stetigkeit ergibt sich aus der gleichm¨aßigen Konvergenz in (VII.36) auf beschr¨ ankten Intervallen.
374
VII.
Spektralzerlegung selbstadjungierter Operatoren
Schließlich ist A als der Erzeuger von (Tt ) zu identifizieren, der einstweilen mit B bezeichnet sei. Wir behaupten zuerst dom(A) ⊂ dom(B),
Bx = Ax f¨ ur x ∈ dom(A).
(VII.37)
F¨ ur x ∈ dom(A) zeigt Lemma VII.4.5 n¨ amlich t t tAλ sAλ Tt x − x = lim e x − x = lim e Aλ x ds = Ts Ax ds, λ→∞
λ→∞
0
0
denn t t t sAλ e Aλ x ds − Ts Ax ds ≤ esAλ Aλ x − Ax ds 0 0 0 t + esAλ Ax − Ts Ax ds, 0
und das erste Integral strebt nach (VII.34) mit λ → ∞ gegen 0 und das zweite wegen der gleichm¨ aßigen Konvergenz der Integranden. Andererseits ist 1 ∈ ρ(A) nach Voraussetzung und 1 ∈ ρ(B) nach Satz VII.4.10. Wegen (VII.37) ist x = (Id − B)(Id − A)−1 x f¨ ur alle x ∈ X, so daß auch (Id − B)−1 x = (Id − A)−1 x f¨ ur alle x gilt, und das zeigt dom(B) = dom(A). Damit ist der Satz von Hille-Yosida bewiesen. 2 Das n¨achste Ziel wird sein, den Satz von Hille-Yosida auf beliebige C0 -Halbgruppen auszudehnen. Dazu wird eine Umnormierungstechnik verwandt; beachte, daß die starke Stetigkeit einer Halbgruppe, also Forde¨ rung (3) aus Definition VII.4.1, bei Ubergang zu einer a¨quivalenten Norm erhalten bleibt, und auch der Erzeuger ¨ andert sich dabei nicht. Hier ist als erstes die notwendige Spektralbedingung an den Erzeuger einer C0 -Halbgruppe, die sich in Theorem VII.4.13 auch als hinreichend erweisen wird. Satz VII.4.12 Sei (Tt ) eine C0 -Halbgruppe mit Tt ≤ M eωt f¨ ur alle t ≥ 0 und A ihr Erzeuger. Dann gelten (a) {λ: Re λ > ω}⊂ ρ(A), ∞
(b) (λ − A)−1 x =
e−λs Ts x ds f¨ ur alle λ mit Re λ > ω,
0
(c) (Re λ − ω)n (λ − A)−n ≤ M f¨ ur alle λ mit Re λ > ω, n ∈ N. Beweis. Wir betrachten zuerst den Spezialfall ω = 0, so daß stets Tt ≤ M vorausgesetzt ist. Der Ausdruck |||x||| = sup Ttx t≥0
VII.4
375
Operatorhalbgruppen
definiert eine Norm, die wegen x ≤ |||x||| ≤ M x zur urspr¨ unglichen Norm ¨aquivalent ist. Die zugeh¨ orige Operatornorm bezeichnen wir ebenfalls mit diesem Symbol, also |||S||| = sup|||x|||≤1 |||Sx|||. In der neuen Norm ist (Tt ) eine Kontraktionshalbgruppe, denn |||Tt x||| = sup Tτ +tx ≤ |||x|||. τ ≥0
Satz VII.4.10 impliziert daher {λ: Re λ > 0} ⊂ ρ(A) und |||(Re λ)n (λ − A)−n ||| ≤ |||(Re λ)(λ − A)−1 |||n ≤ 1 f¨ ur alle Re λ > 0, n ∈ N, und Satz VII.4.12 ist in diesem Spezialfall gezeigt, denn S ≤ M |||S||| f¨ ur alle S ∈ L(X). Im allgemeinen Fall gehen wir zur Halbgruppe St = e−ωt Tt mit dem Erzeuger A − ω u ur die St ≤ M f¨ ur alle t ≥ 0 gilt. Nach dem ¨ber, f¨ bereits Bewiesenen ist {μ: Re μ > 0} ⊂ ρ(A − ω) = {λ − ω: λ ∈ ρ(A)} und (Re μ)n (μ − (A − ω))−n ≤ M f¨ ur alle Re μ > 0 und n ∈ N. Schreibt man μ = λ − ω, so liefert das sofort die Behauptung. Der Beweis der Formel f¨ ur die Resolvente ist wie in Satz VII.4.10. 2 Wir kommen zur Umkehrung. Theorem VII.4.13 (Satz von Hille-Yosida im allgemeinen Fall) Ein Operator A ist genau dann Erzeuger einer C0 -Halbgruppe, wenn er dicht definiert und abgeschlossen ist und Konstanten ω ∈ R, M ≥ 1 existieren, so daß (ω, ∞) ⊂ ρ(A) und (λ − ω)n (λ − A)−n ≤ M
∀λ > ω, n ∈ N.
(VII.38)
In diesem Fall erf¨ ullt die erzeugte Halbgruppe die Absch¨atzung Tt ≤ M eωt f¨ ur alle t ≥ 0. Beweis. Die Notwendigkeit der Bedingungen wurde gerade in Satz VII.4.12 bewiesen. Die Hinl¨ anglichkeit wird wieder zuerst im Spezialfall ω = 0 untersucht. Die Idee f¨ ur den Beweis ist, durch eine geschickte Umnormierung (VII.38) in (VII.33) zu u uhren und dann Theorem VII.4.11 anzuwen¨berf¨ den. Wir f¨ uhren zuerst zu jedem μ > 0 die durch x μ = sup μn (μ − A)−n x n≥0
definierte Norm . μ auf X ein. Dies ist eine a¨quivalente Norm, denn (VII.38) liefert x ≤ x μ ≤ M x ; (VII.39)
376
VII.
Spektralzerlegung selbstadjungierter Operatoren
außerdem gilt nach Konstruktion μ(μ − A)−1 μ ≤ 1.
(VII.40)
Wir werden zeigen, daß x μ mit μ monoton w¨achst. Dazu wird als erstes λ(λ − A)−1 μ ≤ 1 ∀0 < λ ≤ μ (VII.41) behauptet; das ergibt sich folgendermaßen aus der Resolventengleichung (vgl. Satz VII.2.15(b)): (λ − A)−1 μ = (μ − A)−1 + (μ − λ)(μ − A)−1 (λ − A)−1 μ 1 μ−λ ≤ + (λ − A)−1 μ (nach (VII.40)) μ μ 1 = (λ − A)−1 μ + 1 − λ(λ − A)−1 μ . μ Weiter hat man f¨ ur 0 < λ ≤ μ und n ∈ N wg. (VII.39) und (VII.41) λn (λ − A)−n x ≤ λn (λ − A)−n x μ ≤ λ(λ − A)−1 nμ x μ ≤ x μ und daher x λ ≤ x μ
∀0 < λ ≤ μ.
Wir k¨onnen deshalb die ¨ aquivalente Norm |||x||| = lim x μ μ→∞
einf¨ uhren, die ebenfalls x ≤ |||x||| ≤ M x
(VII.42)
erf¨ ullt. (VII.41) liefert |||λ(λ − A)−1 ||| ≤ 1, also die Hille-Yosida-Bedingung (VII.33); man lasse n¨ amlich in λ(λ − A)−1 x μ ≤ x μ μ → ∞ streben. Theorem VII.4.11 garantiert jetzt, daß A der Erzeuger einer C0 -Halbgruppe mit |||Tt||| ≤ 1 ist; (VII.42) liefert Ttx ≤ |||Tt x||| ≤ |||x||| ≤ M x , also Tt ≤ M , und Theorem VII.4.13 ist im Fall ω = 0 gezeigt. Im Fall eines beliebigen ω betrachten wir B = A − ω. Nach dem gerade Bewiesenen erzeugt B eine C0 -Halbgruppe mit St ≤ M . Der Operator A erzeugt dann die Halbgruppe Tt = eωt St , und die erf¨ ullt Tt ≤ M eωt . Damit ist das Theorem vollst¨ andig bewiesen. 2 Die Bedingungen im Satz von Hille-Yosida k¨onnen so verstanden werden, daß die in einem geeigneten Sinn nach oben beschr¨ankten“ Opera” toren C0 -Halbgruppen erzeugen und negative“ Operatoren Kontraktions” halbgruppen.
VII.4
377
Operatorhalbgruppen
Obwohl die Theoreme VII.4.11 und VII.4.13 in theoretischer Hinsicht sehr befriedigend sind, sind sie in der Praxis h¨aufig schwierig anzuwenden, da man eine explizite Kenntnis der Resolvente ben¨otigt. Deshalb soll jetzt ein praktikableres Kriterium aufgestellt werden. Die dabei auftauchenden dissipativen Operatoren k¨ onnen als Analoga der negativen selbstadjungierten Operatoren im Kontext eines Banachraums verstanden werden. Definition VII.4.14 (a) Die Dualit¨ atsabbildung auf einem Banachraum X ist die mengenwertige Abbildung J: X → P(X ) mit J(x) = {x : x = x und x (x) = x 2 }. (b) Ein linearer Operator A in X heißt dissipativ, falls ∀x ∈ dom(A) ∃x ∈ J(x)
Re x (Ax) ≤ 0.
(VII.43)
(c) Ein linearer Operator A in X heißt akkretiv, falls −A dissipativ ist. Nach dem Satz von Hahn-Banach ist stets J(x) = ∅. Im Fall eines Hilbertraums H, wo H wie u ¨ blich mit H identifiziert wird, ist J(x) = {x}, und ein Operator ist genau dann dissipativ, wenn ReAx, x ≤ 0 auf dom(A) gilt. Insbesondere trifft das auf selbstadjungierte Operatoren mit negativem Spektrum zu (vgl. Aufgabe VII.5.24). Auch f¨ ur X = Lp mit 1 < p < ∞ ist J(f ) ⊂ Lq ∼ = (Lp ) stets einelemen2−p tig, n¨amlich J(f ) = {g} mit g(ω) = f p f (ω)|f (ω)|p−2 bzw. g(ω) = 0 f¨ ur f (ω) = 0. F¨ ur p = 1 oder p = ∞ sowie X = C[0, 1] ist J i.a. tats¨achlich mengenwertig; f¨ ur X = C[0, 1] ist z.B. J(1) die Menge aller Wahrscheinlichkeitsmaße auf [0, 1]. Beispiel. Sei X = C0 (Rd ), und betrachte den Laplaceoperator mit dem Definitionsbereich dom(Δ) = S (Rd ). Dann ist Δ dissipativ: Zu ϕ ∈ S (Rd ) existiert eine Stelle x0 , so daß ϕ ∞ = |ϕ(x0 )|. Setze α = ϕ(x0 ) und betrachte das Funktional = αδx0 . Dann ist ∈ J(ϕ) klar, und weiter gilt Re (Δϕ) = Re α(Δϕ)(x0 ) ≤ 0, denn die reellwertige Funktion ψ = Re αϕ nimmt bei x0 ihr Maximum an, und dann m¨ ussen bei x0 alle ∂ 2 ψ/∂x2j ≤ 0 sein. Satz VII.4.15 Ein linearer Operator A ist genau dann dissipativ, wenn (λ − A)x ≥ λ x
∀λ > 0, x ∈ dom(A).
(VII.44)
378
VII.
Spektralzerlegung selbstadjungierter Operatoren
Beweis. Sei A dissipativ. Zu x ∈ dom(A) w¨ ahle x ∈ J(x) mit Re x (Ax) ≤ 0; f¨ ur alle λ > 0 folgt dann (λ − A)x x ≥ |x (λ − A)x | ≥ Re x (λ − A)x ≥ λ Re x (x) = λ x 2 , was wegen x = x (VII.44) ergibt. Umgekehrt sei (VII.44) vorausgesetzt. Zu x ∈ dom(A) und λ > 0 sei ein beliebiges xλ ∈ J(λx − Ax) gew¨ ahlt. F¨ ur yλ = xλ / xλ gilt dann nach (VII.44) bzw. nach Wahl von xλ λ x ≤ λx − Ax = yλ (λx − Ax) = λ Re yλ (x) − Re yλ (Ax). Daraus folgen die beiden Ungleichungen x ≤ Re yλ (x) +
Ax , λ
Re yλ (Ax) ≤ 0.
Sei E = lin{x, Ax} ⊂ X und zn = yn |E . Dann besitzt die beschr¨ankte Folge (zn ) des endlichdimensionalen Raums E einen H¨aufungspunkt z ; sei y ∈ X eine Hahn-Banach-Fortsetzung von z . (Leserinnen und Leser, die mit dem Satz von Alaoglu aus dem n¨ achsten Kapitel (Korollar VIII.3.12) bereits vertraut sind, k¨onnen an dieser Stelle einfach einen Schwach∗ -H¨aufungspunkt y der yn , n ∈ N, w¨ ahlen.) Auf jeden Fall folgt damit y ≤ 1, x ≤ Re y (x), Re y (Ax) ≤ 0, so daß x := x y ∈ J(x) und Re x (Ax) ≤ 0. 2 Jetzt k¨onnen wir eine weitere Charakterisierung der Erzeuger von Kontraktionshalbgruppen beweisen. Theorem VII.4.16 (Satz von Lumer-Phillips) Sei A ein dicht definierter linearer Operator in einem Banachraum X. Genau dann erzeugt A eine Kontraktionshalbgruppe, wenn A dissipativ ist und λ0 − A f¨ ur ein λ0 > 0 surjektiv ist. Beweis. Erzeugt A eine Kontraktionshalbgruppe, so gilt (0, ∞) ⊂ ρ(A), und die Hille-Yosida-Bedingung (VII.33) impliziert sofort (VII.44), so daß A dissipativ ist. Umgekehrt sei A dissipativ und λ0 −A surjektiv. Aus (VII.44) folgt, daß λ0 − A auch injektiv mit stetiger Inverser ist. Insbesondere ist (λ0 − A)−1 abgeschlossen und deshalb auch λ0 − A sowie A, vgl. Aufgabe IV.8.15. Wenn gezeigt werden kann, daß alle λ − A f¨ ur λ > 0 surjektiv sind, ¨ so zeigt die obige Uberlegung (0, ∞) ⊂ ρ(A), und da (VII.44) f¨ ur den dissipativen Operator A (VII.33) impliziert, ist der abgeschlossene Operator A nach dem Satz von Hille-Yosida Erzeuger einer kontraktiven Halbgruppe. Wir betrachten daher Λ = {λ ∈ (0, ∞): λ − A ist surjektiv} = (0, ∞) ∩ ρ(A).
VII.4
379
Operatorhalbgruppen
Offensichtlich ist Λ eine offene Teilmenge von (0, ∞) und = ∅, denn λ0 ∈ Λ. Wir werden zeigen, daß Λ in der Relativtopologie von (0, ∞) auch abgeschlossen ist, was, wie gew¨ unscht, Λ = (0, ∞) liefert. Sei also (λn ) eine Folge in Λ mit λn → λ ∈ (0, ∞). Wegen (VII.44) folgt mit Aufgabe VII.5.1, deren Aussage auch f¨ ur unbeschr¨ankte Operatoren gilt, daß 1 dist λn , σ(A) ≥ ≥ λn (λn − A)−1 und daher auch
dist λ, σ(A) ≥ λ > 0,
d.h. λ ∈ ρ(A).
2
Als Beispiel behandeln wir ein einfaches Anfangsrandwertproblem: ⎫ vt = vxx f¨ ur t ≥ 0, 0 ≤ x ≤ 1, ⎬ v(0, x) = f0 (x) f¨ ur 0 ≤ x ≤ 1, ⎭ v(t, 0) = v(t, 1) = 0 f¨ ur t ≥ 0.
(VII.45)
Dieses Problem u ¨ bersetzen wir in ein abstraktes Cauchyproblem wie folgt: Setze X = {f ∈ C[0, 1]: f (0) = f (1) = 0} mit der Supremumsnorm, Af = f mit dom(A) = {f ∈ C 2 [0, 1]∩X: f ∈ X} und u(t) (x) = v(t, x). Statt eine skalarwertige L¨ osung v von (VII.45) zu bestimmen, versucht man, eine vektorwertige L¨ osung u: [0, ∞) → X von u = Au,
u(0) = f0
(VII.46)
zu finden. Eine solche L¨ osung existiert nach Satz VII.4.7, wenn A eine C0 Halbgruppe auf X erzeugt und f0 ∈ dom(A). Ersteres folgt aus dem Satz von Lumer-Phillips: Zun¨ achst ist es nicht schwierig zu zeigen, daß A abgeschlossen und dicht definiert ist; die Technik aus Lemma V.1.10 zeigt n¨amlich, daß D(0, 1) dicht in X liegt. Die Dissipativit¨at von A folgt wie im obigen Beispiel des Laplaceoperators. Schließlich ist Id − A surjektiv; diese Aussage ist dazu ¨ aquivalent, daß f¨ ur jedes g ∈ X das Randwertproblem f − f = g, f (0) = f (1) = 0, eindeutig l¨osbar ist. Das ist jedoch ein bekannter Satz aus der Theorie gew¨ ohnlicher Differentialgleichungen (siehe z.B. Walter [1993], S. 219). Dies ist nat¨ urlich nur die Spitze des Eisbergs; auch wesentlich allgemeinere Anfangsrandwertprobleme f¨ ur gleichm¨aßig stark elliptische Differentialoperatoren in Lp k¨ onnen mit Halbgruppenmethoden gel¨ost werden, siehe etwa Pazy [1983].
380
VII.5
VII.
Spektralzerlegung selbstadjungierter Operatoren
Aufgaben
Es bezeichne H stets einen komplexen Hilbertraum und X einen komplexen Banachraum. Aufgabe VII.5.1 Sei T ∈ L(X). F¨ ur λ ∈ ρ(T ) gilt (λ − T )−1 ≥
1 . dist(λ, σ(T ))
Ist T ∈ L(H) selbstadjungiert, gilt sogar Gleichheit. Aufgabe VII.5.2 Zeige mittels eines Beispiels, daß der numerische Wertebereich eines Operators nicht abgeschlossen zu sein braucht. Aufgabe VII.5.3 Sei T ∈ L(H) selbstadjungiert. aus Satz VII.1.6 involutiv ist. (a) Zeige, daß die Abbildung Φ (b) F¨ ur f ∈ B(σ(T )) ist f (T )(x) = f (λ)x, falls T x = λx. (c) Gilt f (σ(T )) = σ(f (T )) f¨ ur f ∈ B(σ(T ))? Aufgabe VII.5.4 (Analytischer Funktionalkalk¨ ul) Es ∞sei T ∈n L(X) ein Operator auf einem Banachraum, und es definiere f (z) = a z eine Potenzreihe mit Konvergenzradius > r(T ). n=0 n ∞ (a) Dann konvergiert die Reihe f (T ) := n=0 an T n in L(X). ∞ (b) Ist g(z) = b z n eine weitere Potenzreihe mit Konvergenzradius n=0 n > r(T ), so gilt (f g)(T ) = f (T )g(T ). (c) Es gilt der Spektralabbildungssatz σ f (T ) = f σ(T ) . (d) Ist T ein selbstadjungierter Operator auf einem Hilbertraum, so stimmt der soeben definierte Operator f (T ) mit dem aus Satz VII.1.3 u ¨ berein. Aufgabe VII.5.5 Ist T ∈ L(H) selbstadjungiert und gilt σ(T ) = {0, 1}, so ist T eine Orthogonalprojektion. Aufgabe VII.5.6 F¨ ur zwei Orthogonalprojektionen E1 und E2 sind ¨ aquivalent: (i) ran(E1 ) ⊂ ran(E2 ), (ii) ker(E2 ) ⊂ ker(E1 ), (iii) E1 E2 = E2 E1 = E1 , (iv) E2 − E1 ≥ 0. Aufgabe VII.5.7 A → EA sei ein Spektralmaß. Zeige EA EB = EB EA = EA∩B f¨ ur A, B ∈ Σ sowie EA ≤ EB (d.h. EB − EA ≥ 0), falls zus¨ atzlich A ⊂ B. (Verwende Aufgabe VII.5.6.) Aufgabe VII.5.8 (a) Sei h ∈ C0 (R) und Mh der Multiplikationsoperator ϕ → hϕ auf L2 (R). Bestimme das Spektrum von Mh . Gib notwendige und hinreichende Bedingungen daf¨ ur an, daß ein Spektralwert ein Eigenwert ist. (b) Behandle dasselbe Problem f¨ ur h ∈ L∞ (R).
VII.5
381
Aufgaben
Aufgabe VII.5.9 Sei T ∈ L(H) ein normaler Operator und λ ∈ σ(T ). Dann existiert eine Folge (xn ) in H mit xn = 1, so daß T xn − λxn → 0. (Man sagt, λ sei ein approximativer Eigenwert von T .) Aufgabe VII.5.10 (a) Seien f, g ∈ S (Rd ). Dann ist die Faltung f ∗ g ∈ S (Rd ), und es gilt F(f ∗ g) = (2π)d/2 Ff Fg. (b) Beweise diese Formel f¨ ur f ∈ L1 (Rd ) ∩ L2 (Rd ), g ∈ L2 (Rd ). Aufgabe VII.5.11 Sei T : H ⊃ dom(T ) → H dicht definiert. Zeige, daß T symmetrisch ist, wenn T x, x ∈ R f¨ ur alle x ∈ dom(T ) ist. (Hinweis: Betrachte T (x + y), x + y.) Aufgabe VII.5.12 (a) Sei T1 = d/dt auf dem Definitionsbereich
"
dom(T1 ) =
f ∈ L2 [0, 1]:
#
df existiert f.¨ u. und geh¨ ort zu L2 [0, 1] . dt
Dann ist dom(T1∗ ) = {0}. (Tip: Approximiere durch st¨ uckweise konstante Funktionen.) (b) Sei T2 = d/dt auf dem Definitionsbereich dom(T2 ) = dom(T1 ) ∩ C[0, 1]. Auch dann ist dom(T2∗ ) = {0}. (Hinweis: Es ist hilfreich zu wissen, daß nicht konstante stetige monotone Funktionen f mit f = 0 f.¨ u. existieren, siehe Rudin [1986], S. 144.) Aufgabe VII.5.13 Sei T : H ⊃ dom(T ) → H dicht definiert. (a) Aus T ⊂ S folgt S ∗ ⊂ T ∗ . (b) Wenn T wesentlich selbstadjungiert ist, besitzt T genau eine selbstadjungierte Erweiterung. (c) Wenn T selbstadjungiert ist, besitzt T keine echte symmetrische Erweiterung. Aufgabe VII.5.14 Sei T : H ⊃ dom(T ) → H dicht definiert und symmetrisch. Dann ist T genau dann wesentlich selbstadjungiert, wenn T ∗ symmetrisch ist. Aufgabe VII.5.15 Seien T : H ⊃ dom(T ) → H und S: H ⊃ dom(S) → H dicht definiert. Setze dom(ST ) = {x ∈ dom(T ): T x ∈ dom(S)}, und nimm an, daß auch ST : H ⊃ dom(ST ) → H, x → S(T x), dicht definiert ist. Dann gilt T ∗ S ∗ ⊂ (ST )∗ , wo dom(T ∗ S ∗ ) analog erkl¨ art ist. Ist S ∈ L(H), so gilt sogar T ∗ S ∗ = (ST )∗ . Aufgabe VII.5.16 Sei T : H ⊃ dom(T ) → H dicht definiert und abgeschlossen, und sei V : H × H → H × H durch (x, y) → (−y, x) definiert. (a) V ist unit¨ ar bzgl. des kanonischen Skalarprodukts von H × H. (b) (c) (d) (e)
$
%⊥
gr(T ) = V (gr(T ∗ )) . Ist z ∈ dom(T ∗ )⊥ , so gilt (z, 0) ∈ gr(T ∗ )⊥ sowie (0, z) ∈ gr(T ). T ∗ ist dicht definiert. T = T ∗∗ .
382
VII.
Spektralzerlegung selbstadjungierter Operatoren
Aufgabe VII.5.17 Bestimme die Objekte [., .], J, K, J ∗ und S aus dem Beweis von Satz VII.2.11 explizit, falls T der Operator Id − Δ auf D (Rn ) ist. (Hinweis: Satz V.2.14.) Aufgabe VII.5.18 Zeige, daß die im Beweis von Satz VII.2.11 konstruierte Friedrichs-Erweiterung S dom(S) = dom(T ∗ ) ∩ J(K), S = T ∗ |dom(T ∗ )∩J (K) erf¨ ullt. Aufgabe VII.5.19 (Satz vom abgeschlossenen Bild) In dieser Aufgabe soll der Satz vom abgeschlossenen Bild (Theorem IV.5.1) f¨ ur unbeschr¨ ankte Operatoren diskutiert werden. Sei T : H ⊃ dom(T ) → H dicht definiert und abgeschlossen. Dann sind folgende Bedingungen a ¨quivalent: (i) ran(T ) ist abgeschlossen. (ii) ran(T ) = ker(T ∗ )⊥ . (iii) ran(T ∗ ) ist abgeschlossen. (iv) ran(T ∗ ) = ker(T )⊥ . Anleitung: (ii) ⇒ (i) und (iv) ⇒ (iii) sind trivial. F¨ ur die Umkehrung dieser Implikationen zeige zuerst, daß f¨ ur einen abgeschlossenen dicht definierten Operator stets ran(T ) dicht in ker(T ∗ )⊥ und ran(T ∗ ) dicht in ker(T )⊥ ist; beachte ¨ daf¨ ur die Aufgaben IV.8.13 und VII.5.16. Die Aquivalenz (i) ⇔ (iii) wird auf die ¨ entsprechende Aquivalenz in Theorem IV.5.1 zur¨ uckgef¨ uhrt. Dazu betrachte den Hilbertraum H × H und dessen abgeschlossenen Unterraum G = gr(T ). Definiere S: G → H durch S: (x, T x) → T x. Offensichtlich ist ran(T ) = ran(S), und S ist stetig. Daher reicht es zu zeigen, daß ran(T ∗ ) genau dann abgeschlossen ist, wenn ¨ ran(S ∗ ) (⊂ H × H) es ist. Das erzielt man durch folgende Uberlegungen. (a) (b) (c) (d) (e)
S(x, T x), yH = (x, T x), (0, y)H×H ∀x ∈ dom(T ), y ∈ H. S ∗ y − (0, y) ∈ G⊥ ∀y ∈ H. (ξ, η) ∈ G⊥ ⇔ η ∈ dom(T ∗ ), ξ = −T ∗ η. ∀y ∈ H ∃η ∈ dom(T ∗ ) S ∗ (y) = (−T ∗ η, y + η). ran(S ∗ ) = ran(T ∗ ) × H.
Aufgabe VII.5.20 Sei T : H ⊃ dom(T ) → H abgeschlossen, dicht definiert und symmetrisch. Dann ist T genau dann selbstadjungiert, wenn σ(T ) ⊂ R gilt. Aufgabe VII.5.21 Sei T : H ⊃ dom(T ) → H selbstadjungiert. Es existiere λ ∈ ρ(T ), so daß (λ−T )−1 kompakt ist. (Man sagt, T habe eine kompakte Resolvente.) (a) Dann ist f¨ ur alle λ ∈ ρ(T ) die Resolvente (λ − T )−1 kompakt. (b) σ(T ) besteht nur aus Eigenwerten endlicher Vielfachheit, die keinen H¨ aufungspunkt besitzen. d Aufgabe VII.5.22 Der Operator i dt ist auf S (R) wesentlich selbstadjungiert, d und seine Abschließung ist i dt auf {x ∈ L2 (R): x|I ∈ AC(I) f¨ ur alle kompakten Teilintervalle I ⊂ R und dx/dt ∈ L2 (R)}.
VII.5
383
Aufgaben
Aufgabe VII.5.23 Sei f ∈ L2 (R), und gelte f (t) = f (−t) fast u ¨ berall. Dann ist der Faltungsoperator T : ϕ → f ∗ ϕ auf dom(T ) = {ϕ ∈ L2 (R): f ∗ ϕ ∈ L2 (R)} selbstadjungiert. Diskutiere die Spektralzerlegung von T . Aufgabe VII.5.24 Sei T : H ⊃ dom(T ) → H dicht definiert. Der numerische Wertebereich von T ist W (T ) = {T x, x: x ∈ dom(T ), x = 1}. (a) Ist λ ∈ / W (T ), so gilt 0 < dist(λ, W (T )) ≤ (λ − T )x
∀x ∈ dom(T ), x = 1.
(b) Ist λ ∈ / W (T ) und λ ∈ ρ(T ), so gilt (λ − T )−1 ≤
1 . dist(λ, W (T ))
(c) Ist T selbstadjungiert, so gilt σ(T ) ⊂ W (T ) sowie inf σ(T ) = inf W (T ), sup σ(T ) = sup W (T ). (Tip: Ist inf σ(T ) = 0, zeige (λ − T )−1 y, y ≤ 0 f¨ ur λ < 0; setze dann y = (λ − T )x und lasse λ → 0 streben.) Aufgabe VII.5.25 Sei (Tt ) eine Familie stetiger linearer Operatoren auf einem Banachraum, die (2) bzw. (2) und (3) aus Definition VII.4.1 erf¨ ullt. Gilt dann auch (1)? Aufgabe VII.5.26 Zeige, daß die W¨ armeleitungshalbgruppe (siehe (VII.20)) eine C0 -Halbgruppe auf C0 (Rd ) ist. Aufgabe VII.5.27 Sei q: Rd → R eine nach oben beschr¨ ankte stetige Funktion. Betrachte die Operatoren (Tt f )(x) = etq(x) f (x) auf C0 (Rd ) oder Lp (Rd ), 1 ≤ p < ∞. Zeige, daß (Tt ) eine C0 -Halbgruppe ist. Was ist ihr Erzeuger? Wann erh¨ alt man auch f¨ ur p = ∞ eine C0 -Halbgruppe? Aufgabe VII.5.28 Sei X = {f ∈ C[0, 1]: f (1) = 0}, und die Operatoren Tt : X → X seien durch (Tt f )(x) = f (x + t) f¨ ur 0 ≤ x + t ≤ 1 und (Tt f )(x) = 0 sonst erkl¨ art. Zeige, daß (Tt )t≥0 eine C0 -Halbgruppe auf X ist, und bestimme ihren Erzeuger sowie ihre Wachstumsschranke. Aufgabe VII.5.29 Sei X = R2 mit der Summennorm, A(x1 , x2 ) = (x2 , 0) und Tt = etA . Bestimme die Wachstumsschranke von (Tt ). Wird das Infimum in (VII.25) angenommen? Aufgabe VII.5.30 Seien S, T ∈ L(X) kommutierende Operatoren. Dann gilt eS+T = eS eT . Aufgabe VII.5.31 Betrachte die Operatoren Af = f und Bf = f − f jeweils mit dem Definitionsbereich W 3(R) ⊂ L2 (R). Dann erzeugt A eine C0 Halbgruppe, B jedoch nicht. (Tip: Fouriertransformation!)
384
VII.
Spektralzerlegung selbstadjungierter Operatoren
Aufgabe VII.5.32 Sei A: X ⊃ dom(A) → X ein dicht definierter Operator mit ρ(A) = ∅. Dann ist A abgeschlossen. Aufgabe VII.5.33 Sei A: X ⊃ dom(A) → X ein dicht definierter dissipativer Operator mit (0, ∞) ∩ ρ(A) = ∅. Dann gilt ∀x ∈ dom(A) ∀x ∈ J(x)
Re x (Ax) ≤ 0.
Aufgabe VII.5.34 Ein Operator A: X ⊃ dom(A) → X heißt abschließbar, falls A eine abgeschlossene Erweiterung besitzt. (a) A ist genau dann abschließbar, wenn aus xn → 0, (Axn ) Cauchyfolge auch Axn → 0 folgt. (b) Ist A abschließbar, so ist der Abschluß des Graphen gr(A) ⊂ X ⊕ X der Graph eines abgeschlossenen Operators A. A heißt die Abschließung von A und ist offenbar die kleinste abgeschlossene Erweiterung von A. (c) Gib ein Beispiel eines nicht abschließbaren Operators. Aufgabe VII.5.35 Ein determinierender oder wesentlicher Bereich (engl. core) eines dicht definierten abgeschlossenen Operators A: X ⊃ dom(A) → X ist ein Untervektorraum D ⊂ dom(A), der bzgl. der Graphennorm xA = x + Ax dicht in dom(A) liegt. Zeige, daß D genau dann ein determinierender Bereich f¨ ur A ist, wenn A die Abschließung von A|D ist. Ist λ ∈ ρ(A), trifft das genau dann zu, wenn (λ − A)(D) dicht in X liegt. Aufgabe VII.5.36 Sei A: X ⊃ dom(A) → X ein dicht definierter dissipativer Operator. (a) Dann ist A abschließbar, und A ist ebenfalls dissipativ. (b) Hat f¨ ur ein λ0 > 0 der Operator λ0 − A dichtes Bild, so ist λ0 − A surjektiv, und A ist der Erzeuger einer Kontraktionshalbgruppe. Aufgabe VII.5.37 Hat ein Banachraum einen strikt konvexen Dualraum (siehe Aufgabe I.4.13), so ist die Dualit¨ atsabbildung stets einelementig. Aufgabe VII.5.38 Sei X = C[0, 1] und Af = f mit dem Definitionsbereich dom(A) = {f ∈ C 2 [0, 1]: f (0) = f (1) = 0}. Dann erzeugt A eine Kontraktionshalbgruppe auf X. Aufgabe VII.5.39 (Operatorgruppen) (a) Sei A: H ⊃ dom(A) → H selbstadjungiert. Sei Tt := eitA gem¨ aß (VII.16) definiert. Dann ist (Tt )t∈R eine Gruppe von unit¨ aren Operatoren, d.h. es ist Ts+t = Ts Tt f¨ ur s, t ∈ R, f¨ ur die lim Tt x = x
t→0
∀x ∈ H
gilt. (Wegen dieser Eigenschaft nennt man (Tt ) wieder stark stetig.) Ferner ist Tt x − x lim = iAx ∀x ∈ dom(A). t→0 t (Tip: Analysiere zuerst den Fall A = Mf .)
VII.6
385
Bemerkungen und Ausblicke
(b) Ist A ein stetiger selbstadjungierter Operator, so gilt sogar lim Tt − Id = 0.
t→0
d (c) Sei A die selbstadjungierte Erweiterung von i dt auf S (R) (siehe Aufgabe VII.5.22). Was sind in diesem Fall die Tt ? (d) (Satz von Stone) Jede stark stetige Gruppe unit¨ arer Operatoren kann als {eitA : t ∈ R} mit einem selbstadjungierten Operator A geschrieben werden; man nennt h¨ aufig A – statt iA – den Erzeuger der Operatorgruppe. Zeige diesen Satz mit Hilfe des Satzes von Lumer-Phillips.
VII.6
Bemerkungen und Ausblicke
Das Kernst¨ uck der in den vorangegangenen Kapiteln bereits erw¨ahnten 4. Mitteilung von Hilbert aus dem Jahre 1906 ist sein Beweis des Spektralsatzes f¨ ur beschr¨ankte selbstadjungierte Operatoren (bzw. in seiner Sprache f¨ ur beschr¨ankte symmetrische Bilinearformen). Die Tatsache, daß im Fall beschr¨ankter Operatoren außer einer Reihendarstellung noch ein Integral auftaucht, war ein vollkommen unvorhergesehenes Ph¨anomen. Hilberts Darstellung sieht freilich von der heutigen verschieden aus; statt eines Spektralmaßes erscheint bei ihm ein Stieltjes-Integral, wobei man sich in Erinnerung rufen muß, daß Stieltjes sein Integral erst 1894 im Rahmen seiner Untersuchung von Kettenbr¨ uchen einf¨ uhrte. In der Zeit nach Hilbert wurden Beweise des Spektralsatzes f¨ ur beschr¨ ankte und unbeschr¨ankte Operatoren von Riesz (Acta. Sci. Math. Szeged 5 (1930–1932) 23–54), Lengyel und Stone (Ann. Math. 37 (1936) 853–864) und anderen gegeben; eine ersch¨opfende Liste von Literaturverweisen findet man in Dunford/Schwartz [1963], S. 927. Dar¨ uber hinaus erw¨ ahnen wir den Beweis von Leinfelder (Math. Ann. 242 (1979) 85–96) im unbeschr¨ ankten Fall. Der im Text gegebene Beweis des Spektralsatzes orientiert sich stark an Reed/Simon [1980]. Ein wesentlicher Teil dieses Beweises war der Entwicklung des Funktionalkalk¨ uls gewidmet. Die Essenz des Satzes VII.1.3 ist, daß die Algebra C(σ(T )) in allen Strukturen zur von Id und dem selbstadjungierten Operator T ∈ L(H) erzeugten abgeschlossenen Unteralgebra von L(H) isomorph ist. Eine sehr elegante Methode, dieses Resultat sogar gleich f¨ ur normale Operatoren zu zeigen, stellt die Theorie der Banachalgebren bereit; siehe Korollar IX.3.8. Die Theorie der unbeschr¨ ankten Operatoren ist das Werk J. von Neumanns (Math. Ann. 102 (1929) 49–131) sowie, kurz darauf und weitgehend unabh¨angig von diesem, M. H. Stones (Stone [1932]). (Es sei daran erinnert, daß erst in diesen Arbeiten Hilbertr¨ aume abstrakt definiert wurden.) Als Vorarbeiten hierzu sind Weyls Untersuchungen u ¨ ber Eigenfunktionen von Randwertproblemen (1910) und Carlemans Studien singul¨arer Integraloperatoren (1923) zu nennen. Von Neumann ist es, der als erster die Notwen-
386
VII.
Spektralzerlegung selbstadjungierter Operatoren
digkeit erkennt, zwischen symmetrischen und selbstadjungierten Operatoren zu unterscheiden, da sich nur letztere spektral zerlegen lassen. In seiner Nomenklatur heißen die symmetrischen Operatoren hermitesch, und von Neumann stellt zun¨ achst fest, daß infolge einer willk¨ urlichen Einengung ” des Definitionsbereiches“ (a.a.O., S. 57) die Forderung der Symmetrie zu schwach ist. Es ist wichtig, daß der Operator maximal hermitesch ist, d.h. keine symmetrische Erweiterung zul¨ aßt. Aber auch das ist noch nicht hinreichend. Um den Spektralsatz zu beweisen, braucht man die Selbstadjungiertheit des Operators, die von von Neumann auf Anregung Schmidts (a.a.O., S. 62) unter dem Namen Hypermaximalit¨ at definiert wird. (Gl¨ ucklicherweise hat sich der von Stone gepr¨ agte Begriff selbstadjungiert gegen¨ uber der eher an die Werbebranche erinnernden Bezeichnung hypermaximal“ ” durchgesetzt.) Mit Hilfe der Cayley-Transformation f¨ uhrt von Neumann den Spektralsatz f¨ ur unbeschr¨ ankte selbstadjungierte Operatoren auf den Spektralsatz f¨ ur beschr¨ankte unit¨ are Operatoren zur¨ uck. Die Cayley-Transformation gestattet es von Neumann ebenfalls, die nicht selbstadjungierten maximal hermiteschen Operatoren zu untersuchen. Der Zusammenhang zwischen einem symmetrischen Operator T und seiner Cayley-Transformierten UT = (T + i)(T − i)−1 ist der: Zun¨ achst ist T dann und nur dann abgeschlossen, wenn U es ist, und in diesem Fall sind sowohl dom(U T T ) = ran(T − i) = ker(T ∗ + i) ⊥ als auch ran(UT ) = ran(T + i) = ker(T ∗ − i) ⊥ abgeschlossene Teilr¨aume. UT ist stets isometrisch und genau dann unit¨ar, wenn T selbstadjungiert ist. Umgekehrt existiert zu jedem auf einem Teilraum von H definierten isometrischen Operator V , f¨ ur den V − Id dichtes Bild hat, genau ein dicht definierter symmetrischer Operator T mit V = UT . Da T ⊂ S ¨aquivalent zu UT ⊂ US ist, ist Satz VII.2.10 vor diesem Hintergrund evident, und die maximal hermiteschen nicht selbstadjungierten Operatoren sind dadurch gekennzeichnet, daß genau ein Defektindex = 0 ist. Ferner kann gezeigt werden, daß der Operator, dessen Cayley-Transformierte unit¨ar ¨aquivalent zum Shift (s1 , s2 , . . .) → (0, s1 , s2 , . . .) auf 2 ist, der Archetyp solcher Operatoren ist. (In Beispiel VII.2(c) haben wir einen Differentialoperator mit den Defektindizes 0 und 1 kennengelernt.) Satz VII.2.11 wurde von Friedrichs (1934) und Stone (1932) gezeigt, der Beweis im Text folgt der Methode von Friedrichs (Math. Ann. 109 (1934) 465–487). Vorher hatte von Neumann eine etwas schw¨achere Form dieses Satzes bewiesen, n¨ amlich: Ist T halbbeschr¨ankt mit T x, x ≥ C x 2 , so existiert f¨ ur jedes c < C eine selbstadjungierte Erweiterung Sc mit Sc x, x ≥ c x 2 . Sein Beweis ist in der 1. Auflage dieses Buchs zu finden. In zwei weiteren Arbeiten (Math. Ann. 102 (1929) 370–427, Ann. Math. 33 (1932) 294–310) erweitert von Neumann seine Resultate auf unbeschr¨ankte normale Operatoren. (Den Fall beschr¨ ankter normaler Operatoren hatte er im Anhang seiner Arbeit von 1929 erledigt.) Auch im unbeschr¨ankten
VII.6
387
Bemerkungen und Ausblicke
Fall heißt ein Operator normal, wenn T ∗ T = T T ∗ gilt, nur muß man jetzt auf die Definitionsbereiche achtgeben; der Definitionsbereich f¨ ur eine Komposition ST ist dabei als {x ∈ dom(T ): T x ∈ dom(S)} erkl¨art. Außerdem zeigt er, daß f¨ ur einen dicht definierten abgeschlossenen Operator T die Komposition T ∗ T stets selbstadjungiert ist (Korollar VII.2.13). Nach Aufgabe VII.5.13(a) besteht das Problem, eine selbstadjungierte Erweiterung eines symmetrischen Operators T zu finden, darin, dom(T ∗ ) passend einzuschr¨ anken. Falls T ein Differentialoperator ist, f¨ uhrt das dazu, T ∗ passenden Randbedingungen zu unterwerfen. F¨ ur den Fall gew¨ohnlicher Differentialoperatoren wird dieser Problemkreis vollst¨andig von der WeylKodaira-Theorie behandelt, siehe Dunford/Schwartz [1963], Kapitel XIII. Insbesondere liefert diese Theorie die Entwicklung nach Eigenfunktionen eines Differentialoperators in gr¨ oßter Allgemeinheit (a.a.O., S. 1330–1333). Wir wollen noch auf den Zusammenhang zwischen Spektralmaßen und der ¨alteren Variante, Spektralintegrale als Stieltjes-Integrale nach Spek” tralscharen“ aufzufassen, eingehen. Eine Funktion λ → E(λ) von R nach L(H) heißt eine Spektralschar, wenn sie folgende Eigenschaften besitzt: (a) E(λ) ist stets eine Orthogonalprojektion. (b) E(·) ist monoton wachsend, d.h. λ ≤ μ ⇒ E(λ) ≤ E(μ). (c) lim E(λ)x = x, lim E(λ)x = 0 ∀x ∈ H. λ→∞
λ→−∞
(d) E(·) ist rechtsseitig stetig in der Topologie der punktweisen Konvergenz, d.h. lim E(λ + ε)x = E(λ)x
ε→0+
∀x ∈ H.
(e) E(·) hat kompakten Tr¨ ager, wenn m und M existieren mit E(λ) = 0 f¨ ur λ < m, E(λ) = Id f¨ ur λ ≥ M. Ist E(·) eine Spektralschar und f : R → C eine stetige Funktion, so kann man f (λ) dE(λ)x, x als (Riemann-)Stieltjes-Integral definieren, d.h. als Limes von Riemannsummen ni=1 f (ξi ) E(ti+1 )x, x − E(ti )x, x . Der Spektralsatz behauptet dann eine eineindeutige Zuordnung zwischen selbstadjungierten [beschr¨ ankten] Operatoren und Spektralscharen [mit kompaktem Tr¨ager]. Ist E ein Spektralmaß, so definiert λ → E(−∞,λ] eine Spektralschar, und die entsprechenden Integrale stimmen u ¨ berein. Umgekehrt lehrt die Maßtheorie, daß jede Spektralschar ein Spektralmaß induziert, so daß beide Formen des Spektralsatzes ¨ aquivalent sind. Die Spektralmaßversion des Spektralsatzes wurde offenbar zuerst von Halmos [1951] dargestellt. Eine Spektralschar braucht nicht linksseitig stetig zu sein; sie ist bei λ genau dann linksseitig stetig (und daher stetig), wenn (in unserer Darstellung) E{λ} = 0 ist. Damit lautet Satz VII.1.18 λ ∈ ρ(T ) ⇐⇒ E(·) in einer Umgebung von λ konstant,
388
VII.
Spektralzerlegung selbstadjungierter Operatoren
λ ∈ σp (T ) ⇐⇒ E(·) bei λ unstetig, λ ∈ σc (T ) ⇐⇒ E(·) bei λ stetig, aber nicht konstant. An einem Punkt des stetigen Spektrums w¨ achst die Spektralschar also stetig! F¨ ur manche Anwendungen in der mathematischen Physik ist eine andere Aufspaltung des Spektrums als in Definition VI.1.1 n¨ utzlich. Sei T ein (eventuell unbeschr¨ ankter) selbstadjungierter Operator in einem Hilbertraum H und E sein Spektralmaß. Wir betrachten zu x ∈ H die positiven Borelmaße A → μx (A) := EA x, x. Es folgt aus Satz VII.1.18, daß μx eine Summe von Diracmaßen ist, wenn x eine Linearkombination von Eigenvektoren von T ist. Steht x senkrecht auf der linearen H¨ ulle aller Eigenvektoren, so ist μx ({t}) = 0 f¨ ur alle t ∈ R, so daß also t → μx ((−∞, t]) eine stetige Funktion ist; in diesem Fall wollen wir μx selbst stetig nennen. Ist μx stetig, so lehrt die Maßtheorie, daß μx = μx,ac + μx,sing mit einem Maß μx,ac , das bzgl. des Lebesguemaßes λ absolutstetig ist, und einem stetigen Maß μx,sing , das bzgl. des Lebesguemaßes singul¨ ar ist, geschrieben werden kann. (Ein positives Maß μ heißt absolutstetig, wenn λ(N ) = 0 ⇒ μ(N ) = 0 f¨ ur alle Borelmengen gilt, und es heißt singul¨ ar, wenn eine Borelmenge N mit λ(N ) = 0, μ(N ) = 0 existiert.) Es sei Hac = {x ∈ H: μx ist absolutstetig} und Hsing = {x ∈ H: μx ist singul¨ ar, aber stetig}. Dies sind abgeschlossene Unterr¨aume von H, und es gilt T (Hac ) ⊂ Hac sowie T (Hsing ) ⊂ Hsing . Man nennt das Spektrum der Restriktion T : Hac → Hac das absolutstetige Spektrum σac (T ) und das Spektrum der Restriktion T : Hsing → Hsing das singul¨ ar-stetige Spektrum σsing (T ). Es gilt σ(T ) = σp (T )∪σac (T )∪σsing (T ); jedoch braucht diese Zerlegung nicht disjunkt zu sein, da es vorkommen kann, daß σac (T ) ∪ σsing (T ) Eigenwerte von T enth¨alt. Das singul¨ar-stetige Spektrum ist der Anteil, der die meisten Komplikationen in sich birgt, und in vielen konkreten F¨ allen gilt in der Tat σsing (T ) = ∅. Um so u ¨berraschender ist ein k¨ urzlich erschienenes Resultat von Simon, daß die mei” sten“ (im Baireschen Kategoriensinn) selbstadjungierten Operatoren rein singul¨ar-stetiges Spektrum haben, d.h. H = Hsing (Ann. Math. 141 (1995) 131–145). Von Neumanns Studien waren zum großen Teil motiviert von der mathematischen Physik, n¨ amlich der sich in den zwanziger Jahren rasant entwickelnden Quantenmechanik eine ad¨ aquate mathematische Formulierung zu geben. Dies kann in der Tat mit Hilfe der Theorie der selbstadjungierten Operatoren in Hilbertr¨ aumen erreicht werden, was jetzt kurz skizziert werden soll. (Dazu siehe etwa Triebel [1972], Kapitel VII, und nat¨ urlich von Neumanns klassische Monographie Die mathematischen Grundlagen der Quantenmechanik aus dem Jahre 19325 .) Ein Zustand eines quantenmechanischen Systems wird durch einen normierten Vektor eines Hilbertraums 5 Ein
Nachdruck erschien 1996 im Springer-Verlag.
VII.6
389
Bemerkungen und Ausblicke
beschrieben; dabei sollen die Zust¨ ande ϕ und λϕ (wo |λ| = 1) identisch sein. Physikalische Gr¨ oßen werden durch selbstadjungierte Operatoren (Observable) ausgedr¨ uckt. Beim Wasserstoffatom (ohne Spin, nichtrelativistisch) betrachtet manH = L2 (R3 ), die x-Koordinate des Orts wird durch den Operator ϕ → (x, y, z) → xϕ(x, y, z) beschrieben, die x-Koordinate des Impulses durch ϕ → i ∂ϕ etc. Auf diese Funktionsvorschriften kommt man ∂x ¨ durch physikalische Uberlegungen; daß die entstehenden Operatoren (auf dem richtigen Definitionsbereich!) selbstadjungiert sein sollen, hat mathematische Gr¨ unde. Die Messung einer physikalischen Gr¨ oße in einem Zustand ϕ ist dann mathematisch folgendes: Sei T = λ dE die Spektralzerlegung der Obserλ vablen T . Die Zahl A dEλ ϕ, ϕ wird dann als Wahrscheinlichkeit daf¨ ur interpretiert, daß der Meßwert von T im Zustand ϕ in der Menge A liegt. In Analogie zu Satz VII.1.18 ist diese Wahrscheinlichkeit im Fall A = {λ0 } genau dann positiv, wenn λ0 Eigenwert von T ist. Daher sind genau die Eigenwerte von T einer scharfen Messung zug¨anglich. Da der Ortsoperator keinen Eigenwert, sondern nur das stetige Spektrum σ(T ) = σc (T ) = R hat (vgl. Beispiel VII.2(h)), kann der Ort eines Teilchens nicht scharf gemessen werden. Die Energie und damit die zeitliche Entwicklung des Systems werden durch den Hamiltonoperator H ausgedr¨ uckt. Im Fall des Wasserstoffatoms ist das (bis auf physikalische Konstanten) der Operator 1 H ϕ = −Δϕ − ϕ r
(wo r = (x2 + y 2 + z 2 )1/2 )
auf dom(H ) = W 2 (R3 ) ⊂ L2 (R3 ), dem Sobolevraum der Ordnung 2. (Ableitungen sind hier im schwachen Sinn, Definition V.1.11, zu verstehen.) H besitzt die Eigenwerte (−R/n2 )n∈N (R > 0 eine Konstante) sowie das stetige Spektrum [0, ∞). Die zeitliche Entwicklung eines quantenmechanischen Systems wird mit Hilfe der Schr¨ odingergleichung i
d ϕ(t) = H ϕ(t) , dt
ϕ(0) = ϕ0 ∈ dom(H )
beschrieben. Die L¨ osung dieser Gleichung kann in der Form ϕ(t) = e−itH ϕ0 angegeben werden. Station¨ are Zust¨ ande, d.h. solche, die sich zeitlich nicht ¨andern, sind die Eigenfunktionen von H . Das Wasserstoffatom besitzt station¨are Zust¨ande zu den Energieniveaus En = −R/n2 , n ∈ N, wie eben ¨ berichtet wurde. Das Bohrsche Postulat fordert, daß beim Ubergang vom Energieniveau Em zum Energieniveau En , m > n, elektromagnetische Wellen der Frequenz νn,m = h1 (Em − En ) (h = Plancksches Wirkungsquantum)
390
VII.
Spektralzerlegung selbstadjungierter Operatoren
ausgesandt werden. Das liefert (zumindest im Fall n = 2) sichtbare Spektrallinien. Hier kann man das Spektrum eines Operators wirklich sehen! Als Hilbert 1906 den Begriff des Spektrums pr¨ agte, konnte er nicht ahnen, wie eng sein Spektrum mit dem physikalischen Spektrum verwandt ist. Wir haben oben die Selbstadjungiertheit des Hamiltonoperators H = −Δ−MV , wo MV der Multiplikationsoperator mit dem Coulombpotential 1r ist, auf W 2 (R3 ) erw¨ ahnt. Da nach Beispiel VII.2(d) −Δ auf W 2 (R3 ) selbstadjungiert ist, k¨onnen wir die Selbstadjungiertheit von H so ausdr¨ ucken, daß die St¨orung von −Δ durch MV an dessen Selbstadjungiertheit nichts ¨andert, also in gewisser Weise klein“ ist. Solche Ph¨anomene werden syste” matisch in der St¨ orungstheorie linearer Operatoren untersucht. Das erste Resultat in dieser Richtung geht auf Rellich (1939) zur¨ uck; es wurde von Kato verallgemeinert. Der St¨ orungssatz von Rellich besagt folgendes. • Sei T : H ⊃ dom(T ) → H selbstadjungiert und S ein symmetrischer Operator mit dom(S) ⊃ dom(T ). Es sollen 0 < a < 1, b ∈ R mit Sx ≤ a T x + b x
∀x ∈ dom(T )
existieren. Dann ist T + S auf dom(T ) selbstadjungiert. Ist T nur wesentlich selbstadjungiert, so ist auch T + S wesentlich selbstadjungiert. Hier ist die Voraussetzung a < 1 wesentlich; die Existenz irgendeines a ∈ R wird vom Satz vom abgeschlossenen Graphen impliziert. Man kann zeigen, daß die obige Situation im Fall T = −Δ, dom(T ) = W 2 (R3 ) und S = MV vorliegt, wenn V ein Potential ist, das sich als V = V2 +V∞ mit V2 ∈ L2 (R3 ), V∞ ∈ L∞ (R3 ) schreiben l¨ aßt. (Offenbar ist das Coulombpotential von dieser Gestalt, denn mit B = Einheitskugel von R3 gilt 1r = χB 1r + (1 − χB ) 1r ∈ L2 + L∞ .) Zu diesem Themenkomplex vgl. Reed/Simon [1975], Kapitel X, oder Triebel [1972], Kapitel VII; die Selbstadjungiertheit komplizierterer quantenmechanischer Operatoren wurde erstmals von Kato (Trans. Amer. Math. Soc. 70 (1951) 195–211) bewiesen. Abschließend soll kurz der Fall von Operatoren auf Banachr¨aumen zur Sprache kommen. Auch hier gibt es Klassen von Operatoren, die wie selbstadjungierte Operatoren auf Hilbertr¨ aumen spektral zerlegt werden k¨onnen; Dunford/Schwartz [1971] besch¨ aftigen sich intensiv mit dieser Problematik. F¨ ur einen beliebigen Operator auf einem komplexen Banachraum kann man mit Mitteln der Funktionentheorie einen Funktionalkalk¨ ul f¨ ur analytische Funktionen aufbauen. Der einfachste Fall eines solchen symbolischen Kalk¨ uls ist in Aufgabe VII.5.4 beschrieben; wesentlich weitgehendere Resultate erh¨alt man jedoch, wenn man den Cauchyschen Integralsatz benutzt. Diese Idee geht auf F. Riesz (1913) zur¨ uck und wurde von N. Dunford (1943) in gr¨oßerer Allgemeinheit ausgef¨ uhrt. Sei T ∈ L(X). Man bezeichne mit O(T ) die Menge der in einer offenen Umgebung von σ(T ) definierten analytischen komplexwertigen Funktionen. Der Definitionsbereich Uf
VII.6
Bemerkungen und Ausblicke
391
von f ∈ O(T ) variiert mit f und braucht nicht zusammenh¨angend zu sein – das Spektrum kann schließlich eine beliebige kompakte Teilmenge von C bilden –, und der Definitionsbereich von f + g bzw. f g ist nat¨ urlich Uf ∩ Ug . Ist Uf nicht zusammenh¨ angend, so wird der Analytizit¨atsbegriff u ¨brigens lokal verstanden: Jeder Punkt besitzt eine Umgebung, auf der f im elementaren Sinn analytisch ist. F¨ ur eine Funktion f ∈ O(T ) l¨aßt sich nun mit Hilfe eines Umlaufintegrals ein Operator f (T ) definieren. Dazu sei Γ ⊂ Uf \ σ(T ) eine endliche Vereinigung geschlossener Kurven (ein Zy” kel“), so daß die Umlaufzahl von Γ um jeden Punkt von σ(T ) gleich +1 ist ( Γ umrundet σ(T ) genau einmal im positiven Sinn“). Solche Zykeln ” existieren stets, k¨ onnen jedoch beliebig kompliziert aussehen, insbesondere, wenn σ(T ) unzusammenh¨ angend ist. Man setze nun 5 1 f (T ) := f (λ)Rλ (T ) dλ. 2πi Γ So ein operatorwertiges Integral definiert man genau wie in der Funktionentheorie, und offensichtlich stand die Cauchysche Integralformel Pate bei der Definition von f (T ). Man kann zeigen, daß f (T ) nicht von der speziellen Wahl von Γ abh¨angt und daß die u ¨blichen Eigenschaften eines Funktionalkalk¨ uls gelten: • • • • •
f (T ) = Id f¨ ur f = 1, f (T ) = T n f¨ ur f (z) = z n , (f + g)(T ) = f (T ) + g(T ) ∀f, g ∈ O(T ), (fg)(T ) = f (T )g(T) ∀f, g ∈ O(T ), σ f (T ) = f σ(T ) ∀f ∈ O(T ), (f ◦ g)(T ) = f g(T ) ∀g ∈ O(T ), f ∈ O g(T ) .
Insbesondere sind Wurzeln oder der Logarithmus eines Operators erkl¨art, wenn σ(T ) etwa in der geschlitzten Ebene C \ {z: Im z = 0, Re z ≤ 0} liegt. F¨ ur einen selbstadjungierten Operator kann man zu jeder abgeschlossenen Teilmenge A des Spektrums eine Projektion assoziieren; das gelingt im allgemeinen Fall nicht mehr, wohl aber, wenn σ(T ) \ A ebenfalls abgeschlossen ist. (Außer ∅ und σ(T ) gibt es solche A nur, wenn σ(T ) nicht zusammenh¨angend ist.) In diesem Fall betrachte eine Funktion f , die auf einer Umgebung von A den Wert 1 und auf einer Umgebung von σ(T ) \ A den Wert 0 annimmt. Da dann f 2 = f ist, ist auch f (T )2 = f (T ); also ist f (T ) eine Projektion, die im u ¨brigen mit T kommutiert. Besonders wichtig ist der Fall eines isolierten Punkts λ0 des Spektrums. Die zugeh¨orige Spektralprojektion kann nun durch 5 1 P = Rλ (T ) dλ 2πi γ definiert werden, wo γ ein hinreichend kleiner positiv orientierter Kreis um λ0 ist. Die Resolventenabbildung besitzt jetzt bei λ0 eine isolierte Singularit¨at, die wie in der Funktionentheorie durch die Laurentreihe als Pol
392
VII.
Spektralzerlegung selbstadjungierter Operatoren
oder als wesentliche Singularit¨ at klassifiziert werden kann. Falls es sich um einen Pol der Ordnung p handelt, ist λ0 ein Eigenwert, und ran(P ) ist der Hauptraum ker(λ0 − T )p zum Eigenwert λ0 , im Fall eines einfachen Pols also der Eigenraum. Diese Resultate kann man z.B. bei Conway [1985], Dunford/Schwartz [1958] oder Heuser [1992] nachlesen. Im Unterschied zu Satz VII.1.24 ist die Idealstruktur von L(X) im Fall separabler Banachr¨ aume i.a. recht kompliziert. Nur f¨ ur X = p , 1 ≤ p < ∞, oder X = c0 weiß man, daß K(X) das einzige nichttriviale zweiseitige abgeschlossene Ideal in L(X) ist (siehe Pietsch [1980], Abschnitt 5); die abgeschlossenen zweiseitigen Ideale von L(H) im nichtseparablen Fall wurden von Gramsch (J. Reine Angew. Math. 225 (1967) 97–115) und Luft (Czechoslovak. Math. J. 18 (1967) 595–605) vollst¨andig beschrieben. ¨ Zum Spektralsatz sind die Ubersichtsartikel von Halmos (Amer. Math. Monthly 70 (1963) 241–247) und Steen (Amer. Math. Monthly 80 (1973) 359–381) erw¨ahnenswert, zu von Neumann siehe Halmos’ Artikel in Amer. Math. Monthly 80 (1973) 382–394. Das fundamentale Theorem VII.4.11 u ¨ber die Charakterisierung der Erzeuger von Kontraktionshalbgruppen wurde 1948 unabh¨angig und fast gleichzeitig von Yosida (J. Math. Soc. Japan 1 (1948) 15–21) und Hille (in der von ihm allein verfaßten 1. Auflage von Hille/Phillips [1957]) bewiesen. Der Beweis im Text beschreibt den Zugang von Yosida, w¨ahrend Hilles Beweis von der Formel eta = 1/e−ta = limn→∞ (1 − ta/n)−n ausgeht. Diesen Term kann man n¨ amlich auch f¨ ur einen unbeschr¨ankten Operator A als Potenz der Resolvente [(Id − nt A)−1 ]n interpretieren und auf Konvergenz untersuchen; hingegen ergeben die naheliegenden Kandidaten limn (Id + nt A)n und n tn An /n! f¨ ur unbeschr¨ankte Operatoren i.a. keinen Sinn. Kurze Zeit darauf erhielten 1952 – wiederum unabh¨angig und fast gleichzeitig – Feller, Miyadera und Phillips die allgemeine Version des Theorems VII.4.13, das in der Literatur gelegentlich Satz von Hille-YosidaPhillips genannt wird. Lumer und Phillips bewiesen Theorem VII.4.16 in Pac. J. Math. 11 (1961) 679–698; der Satz von Stone u ¨ber unit¨are Operatorgruppen (Aufgabe VII.5.39) wurde erstmals in Stone [1932] gezeigt. Operatorhalbgruppen finden u.a. in der Wahrscheinlichkeitstheorie Anwendung (dazu siehe z.B. Lamperti [1977]), in der mathematischen Physik (Reed/Simon [1975]) und bei den partiellen Differentialgleichungen (Pazy [1983]). Detaillierte Darstellungen der Halbgruppentheorie findet man bei Davies [1980], Engel/Nagel [1999], Goldstein [1985], Pazy [1983] und nat¨ urlich in der klassischen Quelle Hille/Phillips [1957]. Viele in den Anwendungen vorkommende Halbgruppen (Tt ) besitzen die Zusatzeigenschaft, zu einer in einem Sektor Σ0α = Σα ∪ {0} = {z ∈ C: |arg(z)| < α} ∪ {0} der komplexen Ebene definierten Halbgruppe (Tz ) ausgedehnt werden zu k¨ onnen, so daß z → Tz x eine banachraumwertige analytische Funktion im offenen Sektor Σα ist. Dabei nimmt die starke Stetigkeit
VII.6
393
Bemerkungen und Ausblicke
bei z = 0 die Form limz→0 Tz x = x an, wo die z in einem Teilsektor Σ0β , β < α, von Σ0α bleiben m¨ ussen. Solche Halbgruppen werden analytische Halbgruppen genannt und ihre Erzeuger sektorielle Operatoren. In diesem Kontext gilt folgender Satz vom Hille-Yosida-Typ: • Ein dicht definierter abgeschlossener Operator A erzeugt genau dann eine analytische Halbgruppe (Tz )z∈Σ0α , die in allen Teilsektoren Σ0β , β < α, beschr¨ ankt bleibt, wenn Σα+π/2 ⊂ ρ(A) und f¨ ur alle β < α eine Konstante Cβ existiert mit λ(λ − A)−1 ≤ Cβ
∀λ ∈ Σβ+π/2 .
Zum Beispiel erzeugt der Laplaceoperator eine analytische Halbgruppe auf Lp (Rd ) mit dem Winkel α = π/2. Eine interessante Eigenschaft analytischer Halbgruppen ist, daß Tt x ∈ dom(A) f¨ ur alle x ∈ X und nicht nur f¨ ur x ∈ dom(A); entsprechend ist das Cauchyproblem (VII.31) sogar f¨ ur alle x0 ∈ X l¨osbar mit L¨ osung u(t) = Tt x0 in C([0, ∞), X) ∩ C ∞ ((0, ∞), X). Bei der Diskussion eines Cauchyproblems ist man nat¨ urlich nicht nur an der L¨osbarkeit schlechthin interessiert, sondern auch an den Eigenschaften der L¨osung, z.B. an deren asymptotischem Verhalten. Im Endlichdimensionalen gilt f¨ ur jede L¨ osung von u = Au bekanntlich u(t) → 0 mit t → ∞, wenn s0 := sup{Re λ: λ ∈ σ(A)}, die Spektralschranke von A, negativ ist; genauer ist hier die Wachstumsschranke ω0 gleich der Spektralschranke. Im unendlichdimensionalen Fall gilt ω0 = s0 z.B. f¨ ur jede analytische Halbgruppe und f¨ ur positive Halbgruppen auf Lp (Weis, Proc. Amer. Math. Soc. 123 (1995) 3089–3094 oder Proc. Amer. Math. Soc. 126 (1998) 3253–3256), aber nicht immer. (Ein Operator T auf einem Funktionenraum heißt positiv im Sinn von positivit¨ atserhaltend“, wenn f ≥ 0 ⇒ T f ≥ 0.) Damit eng ” verwandt ist der spektrale Abbildungssatz f¨ ur Halbgruppen. • Ist (Tt ) eine C0 -Halbgruppe mit Erzeuger A, f¨ ur die t → Tt auf einem Intervall [t0 , ∞) normstetig ist (z.B. eine analytische Halbgruppe), so gilt etσ(A) := {etλ: λ ∈ σ(A)} = σ(Tt ) \ {0}. In diesem Fall folgt ω0 = s0 . Eine andere hinreichende Voraussetzung f¨ ur die G¨ ultigkeit des spektralen Abbildungssatzes ist, daß f¨ ur t ≥ t0 alle Tt kompakt sind. Ohne weitere Voraussetzungen gelten aber nur etσ(A) ⊂ σ(Tt ) \ {0} und ω0 ≥ s0 , selbst wenn die Tt positive Operatoren auf einem Funktionenraum sind. Arendt (Diff. Int. Eq. 7 (1994) 1153–1168) gibt daf¨ ur folgendes einfache Beispiel: Sei X = Lp (1, ∞) ∩ Lr (1, ∞), wo 1 ≤ p < r < ∞, mit der Norm f = max{ f p, f r } und Tt f (x) = f (xet ). Dann ist (Af )(x) = xf (x) und s0 = −1/p < −1/r = ω0 . Im u ¨ brigen liefert der Satz von Datko-Pazy ein wichtiges Kriterium f¨ ur die Stabilit¨ at der L¨ osung (Pazy [1983], S. 116):
394
VII.
Spektralzerlegung selbstadjungierter Operatoren
• Es gilt ω0 < 0 genau dann, wenn f¨ ur ein p ≥ 1 ∞ Ttx p dt < ∞ ∀x ∈ X. 0
Eine wichtige Frage u ¨ber Erzeuger von Operatorhalbgruppen lautet: Wenn A eine C0 -Halbgruppe erzeugt und B ein weiterer Operator ist, ist dann auch A + B ein Erzeuger? Wenn B beschr¨ankt ist, trifft das zu. F¨ ur Kontraktionshalbgruppen gilt das folgende Kriterium: • Sei A der Erzeuger einer Kontraktionshalbgruppe. Ferner sei B ein dissipativer Operator mit dom(B) ⊃ dom(A), f¨ ur den Konstanten 0 ≤ a < 1 und b ≥ 0 mit Bx ≤ a Ax + b x
∀x ∈ dom(A)
existieren. Dann erzeugt auch A + B: X ⊃ dom(A) → X eine Kontraktionshalbgruppe. ¨ Die Ahnlichkeit dieses Resultats zum St¨ orungssatz von Rellich (siehe oben) ist frappant; in der Tat kann man den Rellichschen Satz aus diesem herleiten, wenn man A = ±iT und B = ±iS setzt. Manchmal kann man die von A + B erzeugte Halbgruppe explizit beschreiben, z.B. in der folgenden Trotter-Formel, die ein unendlichdimensionales Analogon zu der auf Lie zur¨ uckgehenden Formel f¨ ur Matrizen eA+B = limn→∞ (eA/n eB/n )n darstellt. • Es seien A, B und die Abschließung von A + B Erzeuger der Kontraktionshalbgruppen (St ), (Tt ) und (Ut ). (Der Definitionsbereich von A + B ist dom(A) ∩ dom(B).) Dann gilt lim (St/n Tt/n )n x = Ut x
n→∞
∀x ∈ X, t ≥ 0.
Ein u ¨berraschender Aspekt der Halbgruppentheorie auf L∞ ist der Satz von Lotz (Math. Z. 190 (1985) 207–220), wonach jede C0 -Halbgruppe auf L∞ automatisch normstetig ist; mit anderen Worten ist jeder Erzeuger einer C0 -Halbgruppe hier automatisch beschr¨ ankt. Es ist u ¨brigens nicht ganz einfach, u ¨ berhaupt einen dicht definierten abgeschlossenen unbeschr¨ankten Operator in L∞ zu definieren. Ein Beispiel erh¨alt man so: Nach Aufgabe II.5.14 existiert ein isometrischer Operator J: 2 → L1 (R). Der adjungierte Operator J : L∞ (R) → 2 ist dann eine Quotientenabbildung und insbesondere surjektiv. Setze dom(A) = {f ∈ L∞ (R): J f ∈ 1 } und A: L∞ (R) ⊃ dom(A) → 1 , Af = J f ; dieser Operator hat die gew¨ unschten Eigenschaften. Der Satz von Lotz gilt auch f¨ ur ∞ und den Banachraum H ∞ aller beschr¨ankten analytischen Funktionen im Einheitskreis.
Kapitel VIII
Lokalkonvexe R¨ aume
VIII.1
Definition lokalkonvexer R¨ aume; Beispiele
Wir haben bislang Vektorr¨ aume betrachtet, worin auf sinnvolle Weise die Konvergenz einer Folge von Elementen durch eine (Halb-) Norm definiert war, z.B. die gleichm¨ aßige Konvergenz in C[0, 1] durch die Supremumsnorm. Das Konzept der punktweisen Konvergenz ordnet sich diesem System nicht unter. Man kann jedoch folgenden Standpunkt einnehmen: Setzt man f¨ ur t ∈ [0, 1] und eine Funktion x: [0, 1] → C pt (x) = |x(t)|, so bedeutet (xn ) konvergiert punktweise gegen 0“ nichts anderes als ” pt (xn ) → 0
∀t.
Die wesentliche Beobachtung ist nun, daß die pt Halbnormen sind und die punktweise Konvergenz nicht durch das Bestehen allein einer Halbnormkonvergenz, sondern das simultane Bestehen mehrerer Halbnormkonvergenzen ausgedr¨ uckt wird. Wir werden es daher im folgenden mit Vektorr¨aumen X und Familien von Halbnormen auf X (anstatt einer einzigen Norm) zu tun haben. Aus diesen Ingredienzien wird die Theorie der lokalkonvexen R¨aume aufgebaut, deren elementarer Teil in mancher Hinsicht parallel zur Theorie normierter R¨aume verlaufen wird. Die Theorie lokalkonvexer R¨aume verlangt allerdings eine rudiment¨ are Kenntnis der Prinzipien (oder zumindest des Vokabulars) topologischer R¨ aume, die im Anhang B.2 dargestellt sind. Kommen wir nun zur Definition eines lokalkonvexen Vektorraums. X sei ein Vektorraum und P eine Menge von Halbnormen auf X, die einem
D. Werner, Funktionalanalysis, 7. Aufl., Springer-Lehrbuch, DOI 10.1007/978-3-642-21017-4_8, © Springer-Verlag Berlin Heidelberg 2011
396
VIII.
Lokalkonvexe R¨ aume
ungeschriebenen Gesetz zufolge mit p bzw. pi bezeichnet werden. Sei nun F eine endliche Teilmenge von P und ε > 0. Setze UF,ε = {x ∈ X: p(x) ≤ ε ∀p ∈ F } sowie U = {UF,ε : F ⊂ P endlich, ε > 0}. Das System U ist das Substitut der Menge aller Kugeln {x: x ≤ ε} im normierten Fall. Es hat folgende Eigenschaften: (1) 0 ∈ U f¨ ur alle U ∈ U. (2) Zu U1 , U2 ∈ U existiert U ∈ U mit U ⊂ U1 ∩ U2 ( U ist abw¨arts ” filtrierend“), denn UF1 ∪F2 ,min(ε1 ,ε2 ) ⊂ UF1 ,ε1 ∩ UF2 ,ε2 . (3) Zu U ∈ U existiert V ∈ U mit1 V + V ⊂ U ; es gilt n¨amlich UF,ε/2 + UF,ε/2 ⊂ UF,ε . (4) Alle U ∈ U sind absorbierend (Definition III.2.1), denn x0 ∈ λUF,ε , falls λ > 1ε · maxp∈F p(x0 ). (5) Zu U ∈ U und λ > 0 existiert V ∈ U mit λV ⊂ U . Es gilt n¨amlich λUF,ε/λ ⊂ UF,ε , ja sogar =“. ” Wir ben¨otigen folgende Definition. Definition VIII.1.1 (a) Eine Teilmenge A eines Vektorraums heißt kreisf¨ ormig, falls {λ: |λ| ≤ 1} · A ⊂ A. (b) A heißt absolutkonvex, falls A konvex und kreisf¨ormig ist. Man zeigt leicht, daß A genau dann absolutkonvex ist, wenn x, y ∈ A, |λ| + |μ| ≤ 1 ⇒ λx + μy ∈ A ist. Speziell gilt f¨ ur unser System U: (6) Jedes U ∈ U ist kreisf¨ ormig. Sogar: (7) Jedes U ∈ U ist absolutkonvex. 1 Hier
wie im folgenden benutzen wir die suggestive Symbolik A + B = {a + b: a ∈ A, b ∈ B}, ΛA = {λa: λ ∈ Λ, a ∈ A}.
Achtung: i.a. ist A + A = 2A! (Beispiel?)
VIII.1
Definition lokalkonvexer R¨ aume; Beispiele
397
Wir werden sehen, daß man mit Hilfe der Eigenschaften (1)–(6) auf X eine Vektorraumtopologie definieren kann, bez¨ uglich derer die algebraischen Operationen Addition und Skalarmultiplikation stetig sind. Den entscheidenden Schritt, n¨ amlich den Satz von Hahn-Banach in verallgemeinerter Form zu zeigen, wird allerdings erst Eigenschaft (7) zulassen (dazu siehe Abschnitt VIII.2). Zun¨achst sei nun U irgendein nichtleeres Mengensystem mit den Eigenschaften (1)–(6) (diese Eigenschaften sind teilweise redundant, z.B. folgt (1) aus (4)). Wir definieren dann folgendermaßen eine Topologie auf X: O ⊂ X offen ⇐⇒ ∀x ∈ O ∃U ∈ U x + U ⊂ O. Es ist noch zu verifizieren, daß in der Tat eine Topologie definiert wird: • ∅ und X sind offen (klar!). • Seien O1 und O2 offen und x ∈ O1 ∩O2 . Dann existieren U1 , U2 ∈ U mit x + Ui ⊂ Oi . W¨ ahle nach (2) U ∈ U mit U ⊂ U1 ∩ U2 , dann ist x + U ⊂ O1 ∩ O2 , und O1 ∩ O2 ist offen. • Seien Oi , i ∈ I, offen und x ∈ i∈I Oi , etwa x ∈ Oi0 . Dann existiert U ∈ U mit x + U ⊂ Oi0 ⊂ i∈I Oi , und i∈I Oi ist offen. Nach Konstruktion ist U eine Nullumgebungsbasis, d.h. jede Umgebung der Null umfaßt ein U ∈ U (das ist klar), und alle U ∈ U sind Nullumgebungen. Um letzteres einzusehen, beachte man nur, daß f¨ ur eine Menge A ⊂ X die Menge O = {x ∈ A: es existiert W ∈ U mit x + W ⊂ A} offen ist; ist n¨amlich x + W ⊂ A und w¨ ahlt man V ∈ U mit V + V ⊂ W , so ist f¨ ur y ∈ x + V stets y + V ⊂ A, d.h. x + V ⊂ O. Ferner sind konstruktionsgem¨aß bei festem x ∈ X die Abbildungen y → x + y stetig, es sind sogar Hom¨oomorphismen, was definitionsgem¨aß bedeutet, daß auch die Umkehrabbildung (y → −x + y) stetig ist. Dar¨ uber hinaus gilt: Lemma VIII.1.2 In der oben beschriebenen Topologie sind (a) Addition: X × X → X, (x, y) → x + y, (b) Skalarmultiplikation: K × X → X, (λ, x) → λx, stetige Abbildungen. Dabei tragen X × X und K × X jeweils die Produkttopologie. Beweis. Sei O ⊂ X offen. Es ist zu zeigen: ˜ := {(x, y): x + y ∈ O} ist offen, (a) O := {(λ, x): λx ∈ O} ist offen. (b) O ˜ W¨ Zum Beweis von (a) sei (x, y) ∈ O. ahle U ∈ U mit x + y + U ⊂ O ˜ und deshalb und V gem¨aß Eigenschaft (3). Dann ist (x + V ) × (y + V ) ⊂ O ˜ ˜ (x, y) ein innerer Punkt von O. Das zeigt die Offenheit von O.
398
VIII.
Lokalkonvexe R¨ aume
W¨ Zum Beweis von (b) sei (λ, x) ∈ O. ahle U ∈ U mit λx + U ⊂ O. Wir werden ε > 0 und W ∈ U mit {μ: |λ − μ| < ε} · (x + W ) − {λx} ⊂ U , angeben. W¨ahle zun¨achst V ∈ U d.h. {μ: |λ − μ| < ε} × (x + W ) ⊂ O, mit V + V ⊂ U (Eigenschaft (3)), und bestimme dann ε > 0 mit εx ∈ V (Eigenschaft (4)). Da V kreisf¨ ormig ist, gilt (μ − λ)x ∈ V, falls |λ − μ| < ε. Nun w¨ahle W ∈ U mit μW ⊂ V, falls |μ| ≤ |λ| + ε (Eigenschaften (5) und (6)). Dann folgt f¨ ur |λ − μ| < ε und w ∈ W μ(x + w) − λx = (μ − λ)x + μw ∈ V + V ⊂ U.
2
Definition VIII.1.3 X sei ein Vektorraum und τ eine Topologie auf X. (a) Sind Addition und Skalarmultiplikation stetig bzgl. τ , so heißt (X, τ) topologischer Vektorraum. (b) Sei P eine Menge von Halbnormen auf X und τ die oben beschriebene Topologie, f¨ ur die eine Nullumgebungsbasis aus den UF,ε = {x: p(x) ≤ ε ∀p ∈ F }, ε > 0, F ⊂ P endlich, besteht. (X, τ) heißt dann lokalkonvexer topologischer Vektorraum (oder k¨ urzer lokalkonvexer Raum). Nach Lemma VIII.1.2 ist ein lokalkonvexer Raum wirklich ein topologischer Vektorraum! Ferner sollte ausdr¨ ucklich bemerkt werden, daß ein Vektorraum, der eine Topologie tr¨ agt, nicht automatisch ein topologischer Vektorraum ist: Versieht man n¨ amlich irgendeinen Vektorraum X mit der diskreten Topologie (in der jede Menge offen ist), so ist die Skalarmultiplikation nicht stetig. (Sonst w¨ are f¨ ur jedes x = 0 bereits limn→∞ n1 x = 0, aber in einem diskreten Raum konvergieren nur Folgen, die schließlich konstant werden.) Es gibt zwar Beispiele nicht lokalkonvexer topologischer Vektorr¨aume, aber fast alle Topologien auf Vektorr¨aumen, die f¨ ur Anwendungen wichtig sind, sind lokalkonvex. Beispiele. (a) Sei T eine Menge und X ein Vektorraum von Funktionen auf T (z.B. T = Rn , X = C b (Rn )). Betrachte die Halbnormen pt (x) = |x(t)| (t ∈ T ). Die von der Familie P = {pt : t ∈ T } erzeugte lokalkonvexe Topologie heißt Topologie der punktweisen Konvergenz. (b) Sei T ein topologischer Raum und X ein Vektorraum von stetigen Funktionen auf T . Betrachte die Halbnormen pK (x) = sup |x(t)|, t∈K
K ⊂ T kompakt.
VIII.1
Definition lokalkonvexer R¨ aume; Beispiele
399
Die von P = {pK : K ⊂ T kompakt} erzeugte lokalkonvexe Topologie heißt Topologie der gleichm¨ aßigen Konvergenz auf Kompakta. (c) Sei X = C ∞ (R) und pK,m (x) = sup |x(m) (t)| t∈K
f¨ ur m ≥ 0, K ⊂ R kompakt. P = {pK,m : K ⊂ R kompakt, m ∈ N0 } erzeugt eine lokalkonvexe Topologie auf X. Wird C ∞ (R) mit dieser Topologie versehen, schreibt man h¨ aufig E (R). Analog definiert man die Topologie von E (Rn ) und von E (Ω) f¨ ur offenes Ω ⊂ Rn . (d) Der Schwartzraum S (Rn ) (Definition V.2.3) wird durch die Halbnormen pα,m (ϕ) = sup (1 + |x|m )|(D α ϕ)(x)| x∈Rn
topologisiert. (Hier ist α ein Multiindex und m ∈ N0 .) (e) Sei Ω ⊂ Rn offen und K ⊂ Ω kompakt. Es sei DK (Ω) := {ϕ: Ω → C: ϕ ∈ C ∞ (Ω), supp(ϕ) ⊂ K}. (Zur Existenz solcher Funktionen siehe Lemma V.1.10.) DK (Ω) wird durch die Halbnormen pα (ϕ) = sup |(Dα ϕ)(x)|, x∈Ω
α ein Multiindex, topologisiert. (f) Die soeben beschriebene Topologie k¨ onnte man auch auf D(Ω) betrachten; aus verschiedenen Gr¨ unden ist das jedoch nicht angemessen. Unter anderem m¨ochte man n¨ a mlich auf D(Ω) eine Topologie betrachten, die die Tatsache, daß D(Ω) = K DK (Ω) ist (hier wird u ¨ ber alle kompakten Teilmengen von Ω vereinigt), reflektiert. Eine solche lokalkonvexe Topologie kann so definiert werden. Sei τK die Topologie von DK (Ω). Es sei P die Menge aller Halbnormen p auf D(Ω), f¨ ur die alle Restriktionen p|DK bez¨ uglich τK stetig sind. Auf D(Ω) betrachtet man dann die von P erzeugte lokalkonvexe Topologie. Die Beispiele (c)–(f) sind fundamental f¨ ur die Distributionentheorie (Abschnitt VIII.5). (g) X sei ein Vektorraum und p eine Norm auf X. Die von P = {p} erzeugte lokalkonvexe Topologie ist die Normtopologie auf X. (h) X sei ein normierter Raum. Betrachte die Halbnormen px (x) = |x (x)|
(x ∈ X ).
Diese Halbnormen erzeugen die schwache Topologie σ(X, X ) auf X. Die schwache Topologie ist fast immer von der Normtopologie verschieden. (N¨aheres dazu in Abschnitt VIII.3.)
400
VIII.
Lokalkonvexe R¨ aume
(i) Auf dem Dualraum X eines normierten Raums definieren die Halbnormen px (x ) = |x (x)| (x ∈ X) die schwach∗ -Topologie σ(X , X), die sowohl von der Normtopologie als auch von der schwachen Topologie σ(X , X ) zu unterscheiden ist (auch hierzu siehe Abschnitt VIII.3). (j) Auf dem Raum L(X, Y ) (X und Y normierte R¨aume) sind außer der Normtopologie zwei weitere Topologien von Interesse: die starke Operatortopologie, die von den Halbnormen px (T ) = T x
(x ∈ X)
erzeugt wird, sowie die schwache Operatortopologie, die durch die Halbnormen px,y (T ) = |y (T x)| (x ∈ X, y ∈ Y ) definiert wird. (Diese Topologie kam implizit im Kapitel VII bei der Diskussion von Spektralmaßen vor; vgl. Satz VII.1.6(d).) (k) In der Wahrscheinlichkeitstheorie ist auf dem Raum M (R) aller endlichen signierten Maße diejenige lokalkonvexe Topologie von Bedeutung, die von den Halbnormen pf (μ) = f dμ (f ∈ C b (R)) R
erzeugt wird. Sie wird in der Wahrscheinlichkeitstheorie ebenfalls schwache Topologie genannt, ist aber von der funktionalanalytischen schwachen Topologie aus Beispiel (h) verschieden. (l) P = {0} erzeugt auf jedem Vektorraum X die chaotische Topologie, in der nur ∅ und X offen sind. Das letzte Beispiel zeigt auf dramatische Weise, daß ein lokalkonvexer Raum nicht die Hausdorffsche Trennungseigenschaft (d.h. verschiedene Punkte besitzen disjunkte Umgebungen) zu haben braucht. Diese Eigenschaft ist f¨ ur lokalkonvexe R¨ aume leicht zu charakterisieren. Lemma VIII.1.4 Die Halbnormfamilie P erzeuge auf X die lokalkonvexe Topologie τ . Dann sind ¨ aquivalent: (i) (X, τ) ist Hausdorffraum. (ii) Zu x = 0 existiert p ∈ P mit p(x) = 0. (iii) Es gibt eine Nullumgebungsbasis U mit U∈U U = {0}. Beweis. (i) ⇒ (ii): Sei x = 0. W¨ ahle Nullumgebungen U und V mit (x + U ) ∩ V = ∅. Nach Definition der Topologie τ darf man annehmen, daß V von der Form V = UF,ε = {u: p(u) ≤ ε f¨ ur alle p ∈ F } mit einer endlichen Teilmenge F ⊂ P ist. Wegen x ∈ V ist dann p(x) = 0 f¨ ur ein p ∈ F .
VIII.1
401
Definition lokalkonvexer R¨ aume; Beispiele
(ii) ⇒ (iii) gilt wegen x ∈ F,ε UF,ε ⇔ p(x) = 0 f¨ ur alle p ∈ P . (iii) ⇒ (i): Sei x = y. W¨ ahle U ∈ U mit x − y ∈ U . Da die Differenzbildung stetig ist, existieren Nullumgebungen V und W mit W − V ⊂ U . Es folgt (x + V ) ∩ (y + W ) = ∅. 2 Das Lemma zeigt, daß alle obigen Beispiele (bis auf (l)) Hausdorffr¨aume sind; bei (h) (und (j)) folgt das aus dem Satz von Hahn-Banach, bei (k) aus der Regularit¨ at von μ. Auf Beispiel (f) werden wir noch detaillierter eingehen. Der n¨achste Satz erkl¨ art, warum lokalkonvexe R¨aume lokalkonvex“ hei” ßen. Satz VIII.1.5 (X, τ ) sei ein topologischer Vektorraum. X ist genau dann lokalkonvex, wenn es eine Nullumgebungsbasis aus absolutkonvexen absorbierenden Mengen gibt. Beweis. Nach Konstruktion besitzt ein lokalkonvexer Raum eine solche Nullumgebungsbasis. Sei nun U eine Nullumgebungsbasis, so daß alle U ∈ U absolutkonvex und absorbierend sind. Wir betrachten die Minkowskifunktionale pU (x) := inf{λ > 0: x ∈ λU } (Definition III.2.1). Da U absorbierend ist, ist stets pU (x) < ∞ (das ist gerade die Definition der Absorbanz); da U konvex ist, ist pU sublinear (Lemma III.2.2(b); dort war zwar vorausgesetzt, daß X normiert und 0 innerer Punkt von U ist, der Beweis macht davon allerdings keinen Gebrauch). Schließlich folgt aus der Kreisf¨ ormigkeit pU (λx) = |λ|pU (x)
∀λ ∈ K,
(VIII.1)
so daß insgesamt pU eine Halbnorm ist. [Beweis von (VIII.1): Da (VIII.1) f¨ ur λ ≥ 0 richtig ist (pU ist sublinear), darf o.E. |λ| = 1 vorausgesetzt werden. Die Kreisf¨ ormigkeit von U liefert dann λU = U , also pU (λx) = pλU (λx) = pU (x).] Betrachte nun die von der Halbnormfamilie P = {pU : U ∈ U} erzeugte ˜ = lokalkonvexe Topologie τ˜ mit der kanonischen Nullumgebungsbasis U {UF,ε : F ⊂ P endlich, ε > 0}. Es ist dann nicht schwer zu verifizieren, daß τ = τ˜ gilt; die Details seien den Leserinnen und Lesern u 2 ¨ berlassen. Satz VIII.1.5 sagt aus, daß lokalkonvexe R¨aume geometrisch (durch Angabe einer Nullumgebungsbasis) oder analytisch (durch Angabe einer Halbnormfamilie) beschrieben werden k¨ onnen. Wir werden hier weitgehend dem analytischen Zugang folgen.
402
VIII.
VIII.2
Lokalkonvexe R¨ aume
Stetige Funktionale und der Satz von Hahn-Banach
In noch st¨arkerem Maße als f¨ ur normierte R¨aume ist die Kenntnis von stetigen Funktionalen f¨ ur lokalkonvexe R¨ aume von Bedeutung. In der Tat ist es gerade die Existenz konvexer Nullumgebungen, die die Existenz von stetigen Funktionalen im Satz von Hahn-Banach garantieren wird. Das folgende Lemma ist der Dreh- und Angelpunkt unserer Untersuchungen. Lemma VIII.2.1 Die Halbnormfamilie P erzeuge die lokalkonvexe Topologie τ auf X. (a) F¨ ur eine Halbnorm q: X → [0, ∞) sind ¨ aquivalent: (i) q ist stetig. (ii) q ist stetig bei 0. (iii) {x: q(x) ≤ 1} ist eine Nullumgebung. (b) Alle p ∈ P sind stetig. (c) Eine Halbnorm q ist genau dann stetig, wenn M ≥ 0 und eine endliche Teilmenge F ⊂ P mit q(x) ≤ M max p(x) p∈F
∀x ∈ X
existieren. Beweis. (a) Die Implikationen (i) ⇒ (ii) ⇒ (iii) sind trivial. Gelte (iii), und seien x ∈ X und ε > 0. Wir zeigen f¨ ur U = ε · {y: q(y) ≤ 1} = {y: q(y) ≤ ε} q(x + U ) ⊂ {a ∈ R: |a − q(x)| ≤ ε}, was die Stetigkeit von q bei x zeigt. In der Tat gilt f¨ ur y ∈ U |q(x + y) − q(x)| ≤ q (x + y) − x = q(y) ≤ ε, wobei wir die umgekehrte Dreiecksungleichung benutzt haben, die f¨ ur Halbnormen genauso wie f¨ ur Normen gilt. (b) Nach Definition von τ sind die {x: p(x) ≤ 1} Nullumgebungen. (c) Nach (iii) in (a) ist q genau dann stetig, wenn es ε > 0 und endliches F ⊂ P mit UF,ε ⊂ {x: q(x) ≤ 1} gibt. Das heißt aber q(x) ≤
1 max p(x) ε p∈F
∀x ∈ X.
2
Korollar VIII.2.2 Die Halbnormfamilie P erzeuge die lokalkonvexe Topologie τ auf X, und es sei P ⊂ Q ⊂ {q: q ist τ -stetige Halbnorm}. Dann erzeugt Q ebenfalls die Topologie τ .
VIII.2
Stetige Funktionale und der Satz von Hahn-Banach
403 2
Beweis. Das folgt sofort aus Lemma VIII.2.1.
Wir behandeln nun lineare Abbildungen. Die von einer Halbnormfamilie P erzeugte lokalkonvexe Topologie werden wir mit τP bezeichnen. Satz VIII.2.3 Seien (X, τP ) und (Y, τQ ) zwei lokalkonvexe R¨ aume und T : X → Y linear. Dann sind ¨ aquivalent: (i) T ist stetig. (ii) T ist stetig bei 0. (iii) Ist q eine stetige Halbnorm auf Y , so ist q◦T eine stetige Halbnorm auf X. (iv) F¨ ur alle q ∈ Q existieren endliches F ⊂ P und M ≥ 0 mit q(T x) ≤ M max p(x) p∈F
∀x ∈ X.
Beweis. (i) ⇔ (ii): ⇒“ ist klar. F¨ ur ⇐“ bemerke, daß T genau dann stetig ” ” bei x ist, wenn f¨ ur alle Nullumgebungen V ⊂ Y eine Nullumgebung U ⊂ X mit T (x + U ) (= T x + T (U )) ⊂ T x + V existiert. (ii) ⇒ (iii) gilt wegen Lemma VIII.2.1(a) und der Tatsache, daß die Komposition stetiger Abbildungen stetig ist. (iii) ⇒ (iv) gilt wegen Lemma VIII.2.1(b) und (c). (iv) ⇒ (ii): Es ist zu zeigen: Zu einer Nullumgebung V ⊂ Y existiert eine Nullumgebung U ⊂ X mit T (U ) ⊂ V . O.E. ist V von der Form V = {y: qi (y) ≤ ε, i = 1, . . . , n}, wo nq1 , . . . , qn ∈ Q sind. W¨ahle Fi und Mi zu qi gem¨aß (iv) und setze F = i=1 Fi , M = maxi=1,...,n Mi . Dann gilt max qi (T x) ≤ M max p(x)
i=1,...,n
p∈F
∀x ∈ X,
d.h. T (UF,ε/M ) ⊂ V .
2
Beachte die Analogie von (iv) zur Formel T x ≤ M x . Wir notieren noch explizit einen Spezialfall von Satz VIII.2.3. Korollar VIII.2.4 Sei (X, τP ) ein lokalkonvexer Raum. Eine lineare Abbildung : X → K ist genau dann stetig, wenn es endlich viele p1 , . . . , pn ∈ P und M ≥ 0 mit |(x)| ≤ M max pi (x) i=1,...,n
∀x ∈ X
gibt. Wie bei normierten R¨ aumen f¨ uhrt man nun den Dualraum ein.
404
VIII.
Lokalkonvexe R¨ aume
Definition VIII.2.5 Die Menge der stetigen linearen Funktionale auf einem lokalkonvexen Raum (X, τ) heißt Dualraum von X und wird mit X oder, um die Abh¨ angigkeit von der Topologie τ zu betonen, (Xτ ) bezeichnet. L(X, Y ) (bzw. L(Xτ1 , Yτ2 )) bezeichnet die Menge der stetigen linearen Abbildungen zwischen den lokalkonvexen R¨ aumen (X, τ1 ) und (Y, τ2 ). Aus Satz VIII.2.3 folgt sofort, daß L(X, Y ) und X ihrerseits Vektorr¨aume sind. Auf die M¨ oglichkeit, auf X eine geeignete lokalkonvexe Topologie zu erkl¨aren, werden wir in Abschnitt VIII.3 eingehen. Es ist noch ein Spezialfall von Satz VIII.2.3 von Interesse, n¨amlich der Fall X = Y und T = Id, wenn zwei lokalkonvexe Topologien auf X definiert sind. (Man denke z.B. an einen normierten Raum X, der außer mit der Normtopologie mit der zugeh¨ origen schwachen Topologie σ(X, X ) (vgl. Beispiel VIII.1(h)) versehen werden kann.) Es ist h¨aufig wichtig, diese Topologien zu vergleichen. Sind τ1 und τ2 lokalkonvexe Topologien auf X, so heißt τ1 feiner als τ2 (und τ2 gr¨ ober als τ1 ), falls jede τ2 -offene Menge auch offen bzgl. τ1 ist, ¨ wenn also τ2 ⊂ τ1 gilt. Aquivalent dazu ist Id ∈ L(Xτ1 , Xτ2 ), und Satz VIII.2.3 gibt leicht zu verifizierende Kriterien daf¨ ur. Nat¨ urlich stimmen die zwei Topologien auf X u ¨berein, wenn Id ∈ L(Xτ1 , Xτ2 ) und Id ∈ L(Xτ2 , Xτ1 ) gelten. Ist τ1 feiner als τ2 , so hat τ1 • mehr offene Mengen, • mehr abgeschlossene Mengen, aber • weniger kompakte Mengen, • mehr stetige Abbildungen nach K (oder in irgendeinen anderen topologischen Raum), • weniger konvergente Folgen. (Diese Aufz¨ahlung betrifft nat¨ urlich nicht nur lokalkonvexe Vektorr¨aume, sondern allgemein topologische R¨ aume.) Beispiel. Sei X = C(Rn ) und τ1 = Topologie der punktweisen Konvergenz, τ2 = Topologie der gleichm¨ aßigen Konvergenz auf Kompakta (Beispiele VIII.1(a) und (b)). Dann ist τ2 feiner als τ1 , da man sofort das Kriterium in Satz VIII.2.3(iv) f¨ ur Id: Xτ2 → Xτ1 nachpr¨ uft: pt (x) ≤ 1 · p{t} (x). (Bezeichnungen wie in den Beispielen VIII.1(a) und (b); nat¨ urlich gilt sogar =“.) ”
VIII.2
Stetige Funktionale und der Satz von Hahn-Banach
405
Ein weiteres Beispiel: Die Normtopologie eines normierten Raums ist stets feiner als die schwache Topologie σ(X, X ), da (Beispiel VIII.1(h)) px (x) = |x (x)| ≤ x x
∀x ∈ X, x ∈ X ,
also Id ∈ L(X . , Xσ(X,X ) ). Als n¨achstes soll kurz u ¨ber Konvergenz in lokalkonvexen R¨aumen gesprochen werden; zur Definition der Konvergenz in topologischen R¨aumen siehe Anhang B.2. Dort wird bemerkt, daß sich topologische Begriffe im allgemeinen nur unzureichend durch Folgen beschreiben lassen. Wir geben dazu jetzt ein Beispiel im Kontext der lokalkonvexen R¨aume, das auf von Neumann zur¨ uckgeht. Beispiel. Betrachte X = 2 mit der schwachen Topologie σ(X, X ) und A = {em + men : 1 ≤ m < n}, wo nat¨ urlich en der n-te Einheitsvektor ist. Dann ist 0 ∈ A, aber keine Folge in A konvergiert gegen 0 (alles bzgl. σ(X, X ) und nicht bzgl. der Normtopologie). Zum Beweis hierf¨ ur sei U eine Nullumgebung; wir haben dann U ∩A = ∅ zu zeigen. Ohne Einschr¨ ankung sei U = {x ∈ 2 : |x, yi | ≤ ε (i = 1, . . . , r)} 2 f¨ ur y1 , . . . , yr ∈ . W¨ ahle m so groß, daß |yi (m)| ≤ 2ε f¨ ur i = 1, . . . , r ist, ε und anschließend n > m mit |yi (n)| ≤ 2m f¨ ur i = 1, . . . , r. Dann ist |em + men , yi | ≤ |yi (m)| + m|yi (n)| ≤ ε, also em + men ∈ U . Daher gilt 0 ∈ A. Sei nun (emk + mk enk )k∈N eine Folge in A. W¨are es eine Nullfolge, so w¨are, da x → |x, y| f¨ ur alle y ∈ 2 eine stetige Halbnorm ist (Lemma VIII.2.1(b)), f¨ ur alle y ∈ 2 lim |y(mk ) + mk y(nk )| = 0.
k→∞
(VIII.2)
Ist die Folge (mk )k∈N beschr¨ ankt, liefert ein geeignetes y = el einen Widerspruch zu (VIII.2). Ist (mk )k∈N unbeschr¨ankt, so d¨ urfen (nk )k∈N und (mk )k∈N als streng monoton wachsend angenommen werden, und dann liefert y ∈ 2 mit y(j) := k1 f¨ ur j = nk und y(j) = 0 sonst einen Widerspruch. F¨ ur die lokalkonvexe Theorie ist das folgende Resultat wichtig; es zeigt, daß die Bezeichnungen der Beispiele VIII.1(a) und (b) zu Recht bestehen. Satz VIII.2.6 (X, τP ) sei ein lokalkonvexer Raum. Ein Netz (xi )i∈I konvergiert genau dann gegen x, wenn lim p(xi − x) = 0 f¨ ur alle p ∈ P gilt. Beweis. Das Netz (xi ) konvergiert genau dann gegen x, wenn (xi −x) gegen 0 konvergiert; also d¨ urfen wir ohne Einschr¨ ankung x = 0 annehmen. Aus
406
VIII.
Lokalkonvexe R¨ aume
lim xi = 0 folgt dann wegen Lemma VIII.2.1(b) und Satz B.2.3 bereits lim p(xi ) = 0 f¨ ur p ∈ P . Gelte umgekehrt diese Bedingung, und sei U (o.E. = UF,ε ) eine Nullumgebung. Zu p ∈ P existiert dann ein ip ∈ I mit p(xi ) ≤ ε
∀i ≥ ip .
Die Gerichtetheit von I liefert ein j mit j ≥ ip f¨ ur alle p ∈ F , denn F ist endlich. F¨ ur i ≥ j und p ∈ F folgt p(xi ) ≤ ε, d.h. xi ∈ UF,ε f¨ ur i ≥ j. Das zeigt lim xi = 0. 2 Hier ist eine Illustration der Netztechnik. Satz VIII.2.7 In einem lokalkonvexen Raum ist der Abschluß einer konvexen Menge konvex. (Desgleichen f¨ ur absolutkonvexe Mengen.) Beweis. Sei C konvex, seien x, y ∈ C, 0 ≤ λ ≤ 1. Nach Satz B.2.1 existieren Netze (xi )i∈I und (yi )i∈I in C mit lim xi = x, lim yi = y. (Als Indexmenge kann jeweils I = U, eine Nullumgebungsbasis, gew¨ahlt werden.) Da Addition und Skalarmultiplikation stetig sind, folgt lim(λxi + (1 − λ)yi ) = λx + (1 − λ)y ∈ C.
2
Man h¨atte Satz VIII.2.7 nat¨ urlich auch ohne Netze, also direkt nach Definition VIII.1.3, beweisen k¨ onnen (Aufgabe VIII.8.1 bittet darum, das zu tun), aber so geht es vermutlich schneller. Nun folgen noch einige Beispiele f¨ ur stetige Funktionale. Beispiele. (a) Betrachte den Raum S (Rn ) (Beispiel VIII.1(d)). Elemente des Dualraums, der mit S (Rn ) bezeichnet wird, heißen temperierte Distributionen und werden in Abschnitt VIII.5 detaillierter studiert. Wir zeigen Lp (Rn ) ⊂ S (Rn ) f¨ ur 1 ≤ p ≤ ∞, genauer, f¨ ur f ∈ Lp (Rn ) definiert Tf (ϕ) = f (x)ϕ(x) dx ∀ϕ ∈ S (Rn ) Rn
ein Funktional Tf ∈ S (Rn ). Nach der H¨ olderschen Ungleichung gilt f¨ ur p > 1 und 1p + 1q = 1 mit den Bezeichnungen aus Beispiel VIII.1(d) |Tf (ϕ)| ≤ f Lp ϕ Lq ≤ f Lp
dx n+1 )q Rn (1 + |x| = M p0,n+1 (ϕ);
1/q sup (1 + |x|n+1 )|ϕ(x)|
x∈Rn
der Fall p = 1 ist analog zu behandeln. (b) Als n¨achstes berechnen wir den Dualraum eines normierten Raums X bez¨ uglich seiner schwachen Topologie σ(X, X ).
VIII.2
Stetige Funktionale und der Satz von Hahn-Banach
407
Behauptung: (X . ) = (Xσ(X,X ) ) , mit anderen Worten, ein lineares Funktional ist genau dann normstetig, wenn es schwach stetig ist. Zun¨achst gilt ⊃“, da die Normtopologie feiner als die schwache Topo” logie ist (siehe S. 405). Umgekehrt gilt ⊂“, da jedes x ∈ (X . ) nach ” Korollar VIII.2.4 schwach stetig ist, denn |x (x)| ≤ px (x)
∀x ∈ X
(sogar =, Bezeichnung nach Beispiel VIII.1(h)). In Korollar VIII.3.4 wird gezeigt, daß der Dualraum von (X , σ(X , X)) (Beispiel VIII.1(i)) genau aus den Auswertungsfunktionalen x → x (x) besteht, also (Xσ(X ,X) ) = X ist, wo X als Unterraum von X (= (X . ) ) aufgefaßt ist. (c) X und Y seien normierte R¨ aume. Wir versehen L(X, Y ) mit der starken Operatortopologie (Beispiel VIII.1(j)) und bezeichnen den so topologisierten Operatorraum mit Lst (X, Y ). Behauptung: Φ ∈ (Lst (X, Y )) genau dann, wenn Φ von der Form n Φ(T ) = i=1 yi (T xi ) f¨ ur geeignete n ∈ N, xi ∈ X, yi ∈ Y ist. ⇐“ ist klar wegen Korollar VIII.2.4. Zu ⇒“: Nach Korollar VIII.2.4 ” ” existieren x1 , . . . , xn ∈ X und M ≥ 0 mit |Φ(T )| ≤ M max T xi . i
(VIII.3)
∞ n (Y ) bezeichne den normierten Raum Y ⊕∞ · · · ⊕∞ Y aller n-Tupel in Y mit der Maximumsnorm (yi ) = maxi yi . Setze Ψ: L(X, Y ) → ∞ n (Y ), Ψ(T ) = (T xi ). (VIII.3) impliziert dann, daß durch (T xi ) = Φ(T ) ein wohldefiniertes stetiges lineares Funktional auf ran(Ψ) erkl¨art wird. Nach dem Satz von Hahn-Banach (f¨ ur normierte R¨aume) kann zu ei nem stetigen linearen Funktional L ∈ (∞ n (Y )) fortgesetzt werden. Wie im Fall Y = K zeigt man, daß L eine Darstellung n L (yi ) = yi (yi ) i=1
mit y1 , . . . , yn ∈ Y besitzt. Es folgt n Φ(T ) = (T xi ) = L (T xi ) = yi (T xi ). i=1
Wir kommen nun zum Satz von Hahn-Banach f¨ ur lokalkonvexe R¨aume. Ausgehend vom algebraischen Hahn-Banach-Satz III.1.2 bzw. III.1.4 lassen sich die Beweise vom normierten auf den lokalkonvexen Fall (fast) w¨ortlich u ¨bertragen, wenn man Norm“ durch stetige Halbnorm“ und Kugel“ ” ” ” durch absolutkonvexe Nullumgebung“ ersetzt. ”
408
VIII.
Lokalkonvexe R¨ aume
Satz VIII.2.8 (Fortsetzungssatz von Hahn-Banach) Sei X ein lokalkonvexer Raum und U ⊂ X ein Untervektorraum sowie ∈ U . Dann existiert eine Fortsetzung L von mit L ∈ X . Beweis. Zun¨achst bemerke, daß die Topologie von U von {p|U : p ∈ P } erzeugt wird, wenn P die von X erzeugt. Zuerst sei K = R. Nach Korollar VIII.2.4 existiert dann eine stetige Halbnorm p auf X (n¨amlich p = M maxi≤n pi ) mit (x) ≤ |(x)| ≤ p(x)
∀x ∈ U.
Nach Satz III.1.2 existiert eine lineare Fortsetzung L: X → R von mit L(x) ≤ p(x)
∀x ∈ X.
Also ist L ∈ X , denn es gilt auch L(−x) ≤ p(x) und deshalb |L(x)| ≤ p(x). F¨ ur K = C erhalten wir aus Re (x) ≤ p(x) (x ∈ U ) ein lineares L: X → C mit Re L(x) ≤ p(x) (x ∈ X), also mit Lemma III.1.3(c) |L(x)| ≤ p(x) und wieder L ∈ X .
2
Die jetzt folgenden Hahn-Banach-Trennungss¨atze bilden das Kernst¨ uck der lokalkonvexen Theorie. Wir notieren zun¨achst ein Lemma. Lemma VIII.2.9 W sei eine absolutkonvexe Nullumgebung des lokalkonvexen Raumes X. Dann ist das Minkowskifunktional pW eine stetige Halbnorm. Beweis. Daß pW eine Halbnorm ist, wurde im Beweis von Satz VIII.1.5 bemerkt. Die Stetigkeit folgt aus Lemma VIII.2.1(a). 2 Lemma VIII.2.10 Sei X ein lokalkonvexer Raum, V ⊂ X konvex und offen und 0 ∈ V . Dann existiert x ∈ X mit Re x (x) < 0
∀x ∈ V.
Beweis. (Vgl. Lemma III.2.3.) Sei x0 ∈ V , y0 = −x0 und U = y0 + V . Dann ist U offen und konvex, y0 ∈ U und 0 ∈ U . Betrachte das Minkowskifunktional pU zu U . Da U offen ist, existiert eine absolutkonvexe absorbierende Nullumgebung W ⊂ U . Nach Lemma III.2.2 (das f¨ ur lokalkonvexe R¨aume wie f¨ ur normierte gilt) ist pU sublinear und pU (y0 ) ≥ 1. Setze Y = lin{y0 } und y : Y → K, y (ty0 ) = tpU (y0 ). Wie bei Lemma III.2.3 folgt Re y (y) ≤ pU (y). Nach dem algebraischen Satz von HahnBanach III.1.4 existiert eine lineare Fortsetzung x : X → K mit Re x (x) ≤ pU (x) ≤ pW (x)
∀x ∈ X,
VIII.3
409
Schwache Topologien
also auch
|x (x)| ≤ pW (x)
∀x ∈ X.
Nach Lemma VIII.2.9 und Satz VIII.2.3 (mit einem Seitenblick auf Korollar VIII.2.2) ist x ∈ X . Wie bei Lemma III.2.3 zeigt man, daß x das Gew¨ unschte leistet. 2 Theorem VIII.2.11 (Trennungssatz von Hahn-Banach; Version I) Seien X ein lokalkonvexer Raum, Vi ⊂ X konvex (i = 1, 2) und V1 offen. Gelte V1 ∩ V2 = ∅. Dann existiert x ∈ X mit Re x (x1 ) < Re x (x2 )
∀x1 ∈ V1 , x2 ∈ V2 . 2
Beweis. W¨ortlich wie bei Theorem III.2.4!
Theorem VIII.2.12 (Trennungssatz von Hahn-Banach; Version II) Sei X ein lokalkonvexer Raum, V ⊂ X sei abgeschlossen und konvex, und es sei x ∈ V . Dann existieren x ∈ X und ε > 0 mit Re x (x) < Re x (x) + ε ≤ Re x (v)
∀v ∈ V.
Ist V zus¨ atzlich absolutkonvex, so existieren x ∈ X und ε > 0 mit |x (v)| + ε ≤ Re x (x)
∀v ∈ V.
(VIII.4)
Beweis. W¨ahle absolutkonvexes offenes U mit (x + U ) ∩ V = ∅. Nach Theorem VIII.2.11 existiert x ∈ X mit Re x (x) + Re x (u) < Re x (v)
∀u ∈ U, v ∈ V.
Setze ε = sup{Re x (u): u ∈ U }. Da U absorbierend ist, ist ε > 0, und die Behauptung folgt. (Warum ist ε < ∞?) Der Zusatz ist klar, da man durch ¨ Ubergang zu −x auch >“ und −ε in der obigen Ungleichung erhalten ” kann. 2 Korollar VIII.2.13 Wenn X ein lokalkonvexer Hausdorffraum ist, trennt X die Punkte von X, d.h., zu x = y existiert x ∈ X mit x (x) = x (y). Beweis. Wende Theorem VIII.2.12 auf V = {y} an, was konvex und abgeschlossen ist. 2
VIII.3
Schwache Topologien
In den Beispielen VIII.1(h) und (i) wurden die schwache Topologie eines normierten Raums und die schwach∗ -Topologie eines Dualraums eingef¨ uhrt. Diese Topologien werden jetzt detaillierter studiert; dabei werden wir einen etwas allgemeineren Standpunkt einnehmen.
410
VIII.
Lokalkonvexe R¨ aume
Seien nun X und Y Vektorr¨ aume (ohne eine Topologie!) und (x, y) → x, y ∈ K eine bilineare Abbildung auf X × Y . (Nicht zuf¨allig erscheint hier dasselbe Symbol wie f¨ ur ein Skalarprodukt. Aber Achtung: X und Y k¨onnen jetzt nat¨ urlich verschieden sein, und auch im Fall K = C wird Biund nicht Sesquilinearit¨ at verlangt.) Die Elemente von Y induzieren dann lineare Abbildungen auf X vermittels der Formel y (x) = x, y. Genauso wirken die Elemente von X als lineare Abbildungen auf Y . Definition VIII.3.1 (X, Y ) (genauer (X, Y, . , . )) heißt ein duales Paar, falls ∀x ∈ X\{0} ∃y ∈ Y x, y = 0, ∀y ∈ Y \{0} ∃x ∈ X
x, y = 0.
Sind X und Y vorgelegt, so ist es meistens klar, welche bilineare Abbildung auf X ×Y zu betrachten ist. Sie wird daher i.a. nicht weiter spezifiziert werden. Des weiteren k¨ onnen wir bei einem dualen Paar (X, Y ) den Raum Y (bzw. X) stets mit einem punktetrennenden Unterraum des algebraischen Dualraums von X (bzw. Y ) identifizieren, denn x → x, . und y → . , y sind injektiv, und das werden wir auch tun. Beispiele. (a) Sei X ein lokalkonvexer Hausdorffraum und X (wie u ¨blich) sein Dualraum. Nach dem Satz von Hahn-Banach ist (X, X ) mit der bilinearen Abbildung (x, x ) → x (x) ein duales Paar. (b) Genauso ist in dieser Situation (X , X) mit (x , x) → x (x) ein duales Paar. (c) Sei X = C b (R) und Y = M (R), der Raum aller (regul¨aren) endlichen signierten (bzw. komplexen) Borelmaße, sowie f, μ = f dμ. R
Die Regularit¨at der Maße zeigt, daß (X, Y ) ein duales Paar ist. (d) Zu einer Funktion f : R → R, also f ∈ RR , betrachte das Auswertungsfunktional δt : f → f (t). (RR , lin{δt : t ∈ R}) ist dann ein duales Paar, wobei nat¨ urlich - . n n f, λi δti = λi f (ti ). i=1
i=1
(e) Seien X und Y normierte R¨ aume. Schreibe abk¨ urzend n X ⊗ Y = u: X → Y : u(x ) = x (xi )yi , n ∈ N, xi ∈ X, yi ∈ Y ; i=1
VIII.3
411
Schwache Topologien
man kann u ¨brigens X ⊗ Y wirklich als Tensorprodukt von X und Y auffassen. (L(X, Y ), X ⊗ Y ) ist dann ein duales Paar unter der bilinearen Abbildung n T, u = yi (T xi ). i=1
Das zeigt der Satz von Hahn-Banach. (f) Wie bei (a) und (b) kann man auch im allgemeinen die Rollen von X und Y vertauschen. Sei (X, Y ) ein duales Paar. Zu y ∈ Y betrachte die Halbnorm py (x) = |x, y|, und setze P = {py : y ∈ Y }. Definition VIII.3.2 Die von P auf X erzeugte lokalkonvexe Topologie heißt σ(X, Y )-Topologie. Analog wird die σ(Y, X)-Topologie erkl¨art. Aus Lemma VIII.1.4 folgt, daß f¨ ur ein duales Paar die σ(X, Y )-Topologie stets Hausdorffsch ist. Nach Satz VIII.2.6 konvergiert eine Folge (bzw. ein Netz) (xi ) genau dann gegen 0 bzgl. σ(X, Y ), wenn xi , y → 0 f¨ ur alle y ∈ Y gilt. Die schwache Konvergenz aus Definition III.3.6 entsteht so als Spezialfall. Faßt man also die xi als Funktionale auf Y auf, so handelt es sich genau um die punktweise Konvergenz. Betrachten wir noch einmal die obigen Beispiele. (a) Die hier entstehende Topologie nennen wir die schwache Topologie des lokalkonvexen Raums X; sie ist, wie im normierten Fall, gr¨ober als die Ausgangstopologie und von ihr i.a. zu unterscheiden. (b) σ(X , X) ist die Topologie der punktweisen Konvergenz auf X, wie im normierten Fall wollen wir sie schwach∗ -Topologie nennen. (c) Die σ(M (R), C b (R))-Topologie ist die schwache Topologie der Wahrscheinlichkeitstheorie aus Beispiel VIII.1(k). (d) Hier erhalten wir die Topologie der punktweisen Konvergenz aus Beispiel VIII.1(a). (e) σ(L(X, Y ), X ⊗ Y ) ist die schwache Operatortopologie aus Beispiel VIII.1(j). Als n¨achstes soll der Dualraum von Xσ(X,Y ) bestimmt werden. Dazu ben¨otigen wir das folgende Lemma. Lemma VIII.3.3 Sei X ein Vektorraum, und seien , 1 , . . . , n : X → K linear. Setze N = {x: i (x) = 0 ∀i = 1, . . . , n}. Dann sind ¨ aquivalent: (i) ∈ lin{1 , . . . , n }. (ii) Es gibt M ≥ 0 mit |(x)| ≤ M max |i (x)| i≤n
(iii) (x) = 0 f¨ ur x ∈ N , d.h.
i≤n
∀x ∈ X.
ker(i ) ⊂ ker().
412
VIII.
Lokalkonvexe R¨ aume
Beweis. Die Implikationen (i) ⇒ (ii) ⇒ (iii) sind klar. (iii) ⇒ (i): Sei V := i (x) i≤n : x ∈ X ⊂ Kn . Nach (iii) ist die Abbildung φ: i (x) i → (x) wohldefiniert und linear auf V . Daher (lineare Kn → K, die folglich von der Algebra!) existiert eine lineare Fortsetzung φ: n n Form ur x ∈ X bzw. φn (ξi ) = i=1 αi ξi ist. Es folgt (x) = i=1 αi i (x) f¨ = i=1 αi i . 2 Dieses Lemma ist das Kernlemma der schwachen Topologien, impliziert es doch sofort das n¨ achste Korollar. Korollar VIII.3.4 Ein Funktional auf X ist genau dann σ(X, Y )-stetig, wenn es von der Form x → x, y ist. Es gilt also (Xσ(X,Y ) ) = Y. 2
Beweis. Benutze Korollar VIII.2.4 und Lemma VIII.3.3.
Zwei Spezialf¨ alle sind besonders erw¨ ahnenswert (der erste wurde, zumindest im normierten Fall, schon in Beispiel VIII.2(b) behandelt): (X, τ ) sei ein lokalkonvexer Raum, z.B. ein normierter Raum. • Ein lineares Funktional auf X ist genau dann schwach stetig, wenn es τ -stetig ist. • Ein lineares Funktional auf X ist genau dann schwach∗ stetig, wenn es ein Auswertungsfunktional x → x (x) ist. Satz VIII.3.5 Seien τ1 und τ2 zwei lokalkonvexe Topologien auf X, und es sei (Xτ1 ) = (Xτ2 ) . Dann ist eine konvexe Menge C genau dann τ1 abgeschlossen, wenn sie τ2 -abgeschlossen ist. Beweis. Sei C etwa τ2 -abgeschlossen und x0 ∈ C. Wir werden (x0 + U ) ∩ C = ∅ τ1
f¨ urτ eine geeignete τ1 -Nullumgebung U und damit x0 ∈ C zeigen, so daß 1 C ⊂ C gilt und daher C auch τ1 -abgeschlossen ist. W¨ahle mit HahnBanach (Theorem VIII.2.12) ein τ2 -stetiges x und ε > 0 mit Re x (x0 ) + ε ≤ Re x (y)
∀y ∈ C.
Da x nach Voraussetzung auch τ1 -stetig ist, ist U = {x: Re x (x) < ε} die gew¨ unschte Umgebung. 2 Ohne die vorausgesetzte Konvexit¨ at von C wird der Satz nat¨ urlich falsch! Wichtige Spezialf¨ alle sind:
VIII.3
413
Schwache Topologien
• (X, τ) lokalkonvex, τ1 = τ und τ2 = σ(X, X ) (Korollar VIII.3.4); im normierten Fall vgl. Satz VIII.3.5 mit Satz III.3.8! • L(X, Y ) mit der schwachen und der starken Operatortopologie (Beispiel (e), Korollar VIII.3.4 und Beispiel VIII.2(c)). Wir erw¨ahnen noch eine wichtige Eigenschaft der schwachen Topologien. Satz VIII.3.6 Die schwache Topologie σ(X, Y ) ist initial bez¨ uglich Y , d.h., ist T ein topologischer Raum und f : T → Xσ(X,Y ) eine Funktion, so ist f genau dann stetig, wenn alle Kompositionen f
y
y ◦ f: T → X → K
(y ∈ Y ),
d.h. alle Abbildungen t → f (t), y, stetig sind. Insbesondere ist σ(X, Y ) die gr¨ obste Topologie auf X, f¨ ur die alle y ∈ Y stetig sind. Beweis. Die Bedingung ist notwendig nach Korollar VIII.3.4. Seien nun alle y ◦ f stetig, und sei t ∈ T . Ist U eine σ(X, Y )-Nullumgebung, so ist f (W ) ⊂ f (t) + U f¨ ur eine geeignete Umgebung W von t zu zeigen. O.E. ist U = {x: |x, yi | ≤ ε, i = 1, . . . , n}. Da yi ◦ f nach Voraussetzung stetige Funktionen sind, existieren Umgebungen Wi von t mit |f (t) − f (s), yi | ≤ ε Daher ist W =
n i=1
∀s ∈ Wi .
Wi die gew¨ unschte Umgebung.
2
Wir kommen zu einem neuen Begriff. Definition VIII.3.7 Es seien (X, Y ) ein duales Paar, A ⊂ X, B ⊂ Y . Die Polare von A ist Ao = {y ∈ Y : Rex, y ≤ 1 ∀x ∈ A}, die Polare von B ist B o = {x ∈ X: Rex, y ≤ 1 ∀y ∈ B}. Die Polaren sind stets bez¨ uglich eines fest vorgegebenen dualen Paars definiert! Insbesondere ist damit Aoo ⊂ X definiert. Achtung: Viele Autoren definieren Ao als die absolute Polare {y ∈ Y : |x, y| ≤ 1 ∀x ∈ A}.
414
VIII.
Lokalkonvexe R¨ aume
Ist z.B. X ein normierter Raum und Y = X , so ist (BX )o = BX und (BX )o = BX ; und f¨ ur einen Unterraum U ⊂ X stimmt U o mit dem in (III.4) definierten Annihilator U ⊥ u ¨ berein (Aufgabe VIII.8.20). Wir kommen nun zu einigen elementaren Eigenschaften. co B bezeichnet dabei die konvexe H¨ ulle von B (das ist der Schnitt aller konvexen Mengen, die B enthalten) und co B ihren Abschluß. Nach Satz VIII.2.7 ist co B die kleinste abgeschlossene konvexe Menge, die B umfaßt. Lemma VIII.3.8 Sei (X, Y ) ein duales Paar und seien A, Ai ⊂ X, wo i eine Indexmenge I durchl¨ auft. o (a) A ist konvex und σ(Y, X)-abgeschlossen, Ao = (co A)o . (b) Es gilt stets 0 ∈ Ao , A ⊂ Aoo und A1 ⊂ A2 ⇒ Ao2 ⊂ Ao1 . (c) Ist A kreisf¨ ormig, so ist Ao = {y ∈ Y : |x, y| ≤ 1 ∀x ∈ A}. 1 o o (d) (λA) = λ A f¨ ur λ > 0. o (e) A = i∈I Aoi . i∈I i o (f) ⊃ co i∈I Aoi (Abschluß in der σ(Y, X)-Topologie!). i∈I Ai Beweis. (a) Ao = x∈A {y: Rex, y ≤ 1} ist als Schnitt bzgl. σ(Y, X) abgeschlossener und konvexer Mengen abgeschlossen und konvex. Genauso folgt Ao = (co A)o , und (b)–(e) sind klar. (f) Setze A = i Ai . Wegen A ⊂ Ai f¨ ur alle i ∈I folgt aus (b) Aoi ⊂ Ao o o f¨ ur alle i ∈ I, also i Ai ⊂ A . (a) liefert dann co i Aoi ⊂ Ao . 2 Satz VIII.3.9 (Bipolarensatz) F¨ ur ein duales Paar (X, Y ) und A ⊂ X gilt Aoo = co(A ∪ {0}), wo der Abschluß bzgl. σ(X, Y ) zu nehmen ist. Beweis. Nach Lemma VIII.3.8(a) und (b) folgt sofort co(A ∪ {0}) ⊂ Aoo . Nimm nun an, daß diese Inklusion echt ist. Dann existiert x0 ∈ Aoo , x0 ∈ co(A ∪ {0}) =: V . Nach Konstruktion ist V konvex und abgeschlossen; x0 und V k¨onnen daher durch ein σ(X, Y )-stetiges Funktional getrennt werden (Satz von Hahn-Banach, Theorem VIII.2.12). Mit Korollar VIII.3.4 heißt das: Es existiert y ∈ Y mit Rex0 , y > 1 ≥ Rex, y
∀x ∈ A.
Die zweite Ungleichung besagt y ∈ Ao und daher die erste x0 ∈ Aoo , das ist ein Widerspruch. 2 Korollar VIII.3.10 Sei (X, Y ) ein duales Paar und C ⊂ X konvex mit 0 ∈ C. Genau dann ist C σ(X, Y )-abgeschlossen, wenn es B ⊂ Y mit C = B o gibt.
VIII.3
415
Schwache Topologien
2
Beweis. Setze B = C o .
Als n¨achstes beweisen wir eine fundamentale Aussage der Funktionalanalysis. Wir betrachten einen lokalkonvexen Raum X und das duale Paar (X, X ). Theorem VIII.3.11 (Satz von Alaoglu-Bourbaki) F¨ ur eine Nullumgebung U ist U o σ(X , X)-kompakt. Beweis. Wir haben bereits bemerkt, daß die σ(X , X)-Topologie auf X genau die Topologie der punktweisen Konvergenz auf X ist (siehe S. 411). Die nat¨ urliche Einbettung von X in KX , die Menge aller Funktionen von X nach K, ist daher eine hom¨ oomorphe Einbettung, wenn KX die Topologie der punktweisen Konvergenz τp tr¨ agt. So weit, so gut. In (KX , τp ) liefert der Satz von Tikhonov (Theorem B.2.10) ein leicht zu handhabendes Kompaktheitskriterium – das ist der springende Punkt. Bevor wir zu den Einzelheiten kommen, sei bemerkt, daß o.E. U absolutkonvex ist; in der Tat enth¨alt jede Nullumgebung U eine absolutkonvexe Nullumgebung V , und wegen U o ⊂ V o folgt mit Lemma VIII.3.8(a) die Kompaktheit von U o aus der von V o . Nun betrachten wir die Abbildung Φ: (X , σ(X , X)) → (KX , τp ),
Φ(x )(x) = x , x.
Es ist klar, daß Φ injektiv ist. Ferner ist die Umkehrabbildung Φ−1 : (Φ(X ), τp ) → (X , σ(X , X)) nach Definition dieser Topologien stetig. Daher reicht es, die τp -Kompaktheit von Φ(U o ) zu zeigen. Sei dazu x ∈ X. Da U absorbierend ist, existiert λx > 0 mit x ∈ λx U ; ist x ∈ U , k¨onnen und werden wir λx ≤ 1 w¨ ahlen. Da U absolutkonvex ist, folgt |x , x| ≤ λx ∀x ∈ U o . Betrachte Kx = {λ ∈ K: |λ| ≤ λx }. Kx ist kompakt. Nach dem Satz von Tikhonov ist K := {f ∈ KX : f (x) ∈ Kx ∀x ∈ X} τp -kompakt, und wir haben oben Φ(U o ) ⊂ K gezeigt. Es steht nun noch aus, die τp -Abgeschlossenheit von Φ(U o ) in K zu zeigen. Sei f ∈ K im τp -Abschluß von Φ(U o ). Weil der punktweise Limes eines Netzes linearer Abbildungen linear ist (Stetigkeit der Addition und Skalarmultiplikation), ist f eine lineare Abbildung auf X. Da wir λx ≤ 1
416
VIII.
Lokalkonvexe R¨ aume
f¨ ur x ∈ U gew¨ahlt haben, folgt f (U ) ⊂ {λ: |λ| ≤ 1}. Daher ist f sogar eine stetige lineare Abbildung, also f ∈ Φ(X ). Weil Φ(U o ) in Φ(X ) abgeschlossen ist (denn U o ist es in X ), ist in der Tat f ∈ Φ(U o ). Also ist Φ(U o ) eine abgeschlossene Teilmenge des Kompaktums K und daher selbst kompakt. 2 Als Korollar erhalten wir den urspr¨ unglichen Satz von Alaoglu. Korollar VIII.3.12 Ist X ein normierter Raum, so ist BX σ(X , X)kompakt. Beweis. Wende Theorem VIII.3.11 mit U = BX an. Diejenigen Leser, die nur an diesem Korollar interessiert sind, sollten den obigen Beweis mit U = BX , U o = BX und λx = x lesen. 2 Der Satz von Alaoglu impliziert nicht, daß eine beschr¨ankte Folge von Funktionalen eine σ(X , X)-konvergente Teilfolge besitzt; als Gegenbeispiel betrachte auf ∞ die Folge der Funktionale xn : x → x(n). (Hierzu siehe auch Aufgabe VIII.8.16(f).) Es sei daran erinnert, daß Kompaktheit in topologischen R¨ aumen dadurch charakterisiert ist, daß jedes Netz ein konvergentes Teilnetz hat (Satz B.2.9); auch die obige Folge hat nur ein schwach∗-konvergentes Teilnetz. Korollar VIII.3.13 Jeder Banachraum X ist isometrisch isomorph zu einem abgeschlossenen Unterraum eines Raums C(K) stetiger Funktionen auf einem Kompaktum K. Beweis. Setze K = BX mit der σ(X , X)-Topologie. Nach dem Satz von Hahn-Banach (Korollar III.1.7) ist die Abbildung X → C(K), x → fx , wo fx (x ) = x , x, isometrisch und hat daher . ∞ -abgeschlossenes Bild. 2 Korollar VIII.3.14 Ist X ein normierter Raum und ϕ: BX → R eine schwach∗ -stetige Funktion, so nimmt ϕ sein Infimum und sein Supremum an. Wir kommen jetzt zu einem nichttrivialen Kriterium f¨ ur die σ(X , X)Abgeschlossenheit. Sei X ein normierter Raum. Ist C ⊂ X schwach∗¨ abgeschlossen, so ist C ∩ tBX f¨ ur alle t > 0 schwach∗-abgeschlossen. Uberraschenderweise gilt f¨ ur konvexe Mengen C und Banachr¨aume X auch die Umkehrung dieses Sachverhalts. (Konvexit¨at und Vollst¨andigkeit sind hierf¨ ur wesentlich.) Das ist nicht selbstverst¨andlich, denn BX ist keine σ(X , X)-Nullumgebung. Theorem VIII.3.15 (Satz von Krein-Shmulyan) Ist X ein Banachraum und C ⊂ X konvex, so ist C genau dann schwach∗ abgeschlossen, wenn C ∩ tBX f¨ ur alle t > 0 schwach∗ -abgeschlossen ist.
VIII.3
417
Schwache Topologien
Beweis. Eine Richtung ist klar. Umgekehrt nehmen wir an, daß alle C∩tBX schwach∗-abgeschlossen sind. Wir setzen nun zun¨achst zus¨atzlich 0 ∈ C voraus. In diesem Fall werden wir C als C = K o f¨ ur geeignetes K ⊂ X darstellen, was nach Lemma VIII.3.8 den Satz beweist. Wir werden das Argument hierf¨ ur in einige Zwischenschritte aufteilen. Setze Cn = C ∩ 2n+1 BX ,
Kn = Cno ⊂ X
∀n ∈ N.
Nach Voraussetzung u ¨ber C ist dann Kno = Cnoo = Cn (Satz VIII.3.9). (1) Es ist Kn ⊂ Kn+1 + 2−n int BX f¨ ur alle n ∈ N. Sonst existiert x ∈ Kn mit Kn+1 ∩ {y ∈ X: y − x < 2−n } = ∅. Kn+1 ist (als Polare) konvex und σ(X, X )-abgeschlossen, also erst recht . -abgeschlossen, {y: x − y < 2−n } ist . -offen und konvex, also liefert der Satz von Hahn-Banach (Theorem III.2.4 oder VIII.2.11) ein . stetiges Funktional x und a ∈ R mit Re x (z) ≤ a < Re x (y)
∀z ∈ Kn+1 , x − y < 2−n .
(VIII.5)
Wegen 0 ∈ Kn+1 ist a ≥ 0. Betrachtet man statt x ein positives Vielfaches davon, darf man a = 1 oder a = 0 annehmen, und im letzteren Fall kann man Re x (x) > 1 erzwingen, was im ersteren Fall automatisch gilt (setze o y = x). Aus der ersten Ungleichung in (VIII.5) folgt dann x ∈ Kn+1 = Cn+1 ⊂ C, aber es ist wegen Re x (x) > 1 und x ∈ Kn andererseits x ∈ / Kno = Cn und deshalb x > 2n+1 . Wir k¨ onnen daher u ∈ X mit u < 2−n und Re x (u) > 2 finden. F¨ ur y0 = x − u ergibt sich jetzt aus (VIII.5) Re x (x) = Re x (u) + Re x (y0 ) > Re x (u) > 2.
(VIII.6)
Das liefert nun den erw¨ unschten Widerspruch: (VIII.6) zeigt 12 x ∈ / Kno = 1 Cn ; andererseits ist C konvex und enth¨ alt 0 und x , daher 2 x ∈ C und folglich 12 x ∈ Cn , denn x ≤ 2n+2 . (2) Mit K = n∈N Kn gilt Kn ⊂ K + 2−n+1 BX f¨ ur alle n ∈ N. Sei n ∈ N. Schreibe xn ∈ Kn nach Behauptung (1) als xn = xn+1 + zn ,
wo xn+1 ∈ Kn+1 , zn ≤ 2−n
sowie xn+1 = xn+2 + zn+1 ,
wo xn+2 ∈ Kn+2 , zn+1 ≤ 2−(n+1)
418
VIII.
Lokalkonvexe R¨ aume
etc. Das liefert f¨ ur k > n die Darstellung xn = xk + (zn + · · · + zk−1 ). ∞ Nach Wahl der zn existiert u = k=n zk im Banachraum X, und es ist −n+1 u (Lemma I.1.8). Daher existiert x := limk→∞ xk , und x ∈ ≤ 2 K = K, denn Kn ⊃ Kn+1 ⊃ . . . , und alle Km sind abgeschlossen. m m∈N Nach Konstruktion ist xn = x + u. (3) F¨ ur A, B ⊂ X und ε > 0 gilt A + B ⊂ (1 + ε) co A ∪ 1ε B . ε Es ist n¨amlich a + b = (1 + ε) (1 − λ)a + λ bε mit λ = 1+ε . (4) Es ist K o ⊃ C ⊃
1 o 1+ε K
f¨ ur alle ε > 0.
Behauptung (2) und (3) liefern K ⊂ Kn ⊂ K + 2−n+1 BX ⊂ (1 + ε) co(K ∪ 2−n+1 ε−1 BX ), also folgt mit Lemma VIII.3.8 K o ⊃ Kno = Cn ⊃
1 (K o ∩ 2n−1 εBX ) 1+ε
f¨ ur alle n ∈ N. Vereinigung u ¨ ber n zeigt Behauptung (4). (5) Es gilt C = K o . Das erh¨alt man aus Behauptung (4), denn C ist . -abgeschlossen, wenn alle C ∩ tBX schwach∗-abgeschlossen (folglich . -abgeschlossen) sind. Zum Schluß l¨ osen wir uns von der Zusatzvoraussetzung 0 ∈ C. Dazu zeigen wir: (6) C ∩ tBX ist genau dann f¨ ur alle t > 0 schwach∗ -abgeschlossen, wenn C ∩(x +tBX ) f¨ ur alle t > 0, x ∈ X schwach∗ -abgeschlossen ist. Da die Richtung ⇐“ trivial ist, brauchen wir nur ⇒“ zu zeigen. Seien ” ” also t > 0 und x ∈ X . W¨ ahle r > 0 mit x + tBX ⊂ rBX . Dann ist nach Voraussetzung C ∩ rBX schwach∗-abgeschlossen und daher auch C ∩ (x + tBX ) = (C ∩ rBX ) ∩ (x + tBX ). Um den Satz von Krein-Shmulyan f¨ ur beliebiges konvexes C zu zeigen, w¨ahle irgendein x0 ∈ C und betrachte C˜ := −x0 + C. Nach (6) trifft die Voraussetzung des Satzes von Krein-Shmulyan auch auf C˜ zu, und wegen 0 ∈ C˜ ist C˜ nach (5) schwach∗-abgeschlossen. Da x → x +x0 ein σ(X , X)Hom¨oomorphismus ist, ist auch C schwach∗ -abgeschlossen. 2 Das folgende Korollar ist als Satz von Banach-Dieudonn´e bekannt.
VIII.3
Schwache Topologien
419
Korollar VIII.3.16 Sei X ein Banachraum. Ein Untervektorraum U von X ist genau dann schwach∗ -abgeschlossen, wenn seine abgeschlossene Einheitskugel es ist. Beweis. Es ist BU = U ∩BX , und x → tx ist f¨ ur alle t > 0 ein Hom¨oomorphismus bzgl. σ(X , X). 2 Nach dem Studium der schwach∗ -Topologie wollen wir abschließend kurz auf die schwache Topologie σ(X, X ) eines Banachraums eingehen. Die Beobachtung ist die folgende: Identifiziert man X durch entscheidende i(x) (x ) = x (x) mit einem Unterraum von X (vgl. Abschnitt III.3), so ist i ein Hom¨oomorphismus zwischen (X, σ(X, X )) und (i(X), σ(X , X )). Zun¨achst beweisen wir den Satz von Goldstine. Satz VIII.3.17 F¨ ur einen normierten Raum X ist i(BX ) σ(X , X )-dicht in BX und folglich i(X) σ(X , X )-dicht in X (aber jeweils . -abgeschlossen). Beweis. Das folgt sofort aus dem Bipolarensatz VIII.3.9, angewandt auf i(BX ) und das duale Paar (X , X ). 2 Als Konsequenz erh¨ alt man folgendes Reflexivit¨atskriterium. (Reflexive Banachr¨aume wurden in Definition III.3.3 eingef¨ uhrt.) Satz VIII.3.18 F¨ ur einen Banachraum X sind ¨ aquivalent: (i) X ist reflexiv. (ii) BX ist σ(X, X )-kompakt. Beweis. (i) ⇒ (ii): Nach dem Satz von Alaoglu ist BX stets σ(X , X )kompakt (Korollar VIII.3.12). Die Bemerkung vor Satz VIII.3.17 zeigt die behauptete Implikation. (ii) ⇒ (i): Wieder nach obiger Vorbemerkung ist i(BX ) σ(X , X )-kompakt, also erst recht abgeschlossen. Andererseits ist nach Satz VIII.3.17 i(BX ) σ(X , X )-dicht in BX . Daher ist i(BX ) = BX , und X ist reflexiv. 2 Zum Vergleich von Satz VIII.3.18 mit Theorem III.3.7 siehe Korollar VIII.6.4. Beachte: • F¨ ur jeden normierten Raum X ist BX σ(X , X)-kompakt (Satz von Alaoglu, Korollar VIII.3.12). • Genau f¨ ur reflexive X ist BX σ(X, X )-kompakt (Satz VIII.3.18). • Genau f¨ ur endlichdimensionale X ist BX . -kompakt (Satz I.2.7).
420
VIII.
Lokalkonvexe R¨ aume
Am Schluß dieses Abschnitts wollen wir ein in Abschnitt IV.7 gemachtes Versprechen einl¨ osen und die Reflexivit¨ at gleichm¨aßig konvexer R¨aume zeigen (Satz IV.7.12). Sei also X ein gleichm¨ aßig konvexer Banachraum. Wir fassen X als abgeschlossenen Unterraum von X auf und unterscheiden nicht zwischen X und i(X). Sei x0 ∈ SX ; wir werden zeigen, daß jede ε-Kugel um x0 ein Element von X enth¨ alt. Da X normabgeschlossen in X ist, folgt x0 ∈ X, und X ist reflexiv. Zu ε > 0 w¨ahle δ > 0 gem¨ aß der Definition der gleichm¨aßigen Konvexit¨at von X. Anschließend w¨ ahle ein Funktional x0 ∈ SX mit x0 (x0 ) > 1 − δ. Setze C = {x ∈ X : x (x0 ) > 1 − δ}, C = {x ∈ X: x0 (x) > 1 − δ}. Dann ist C σ(X , X )-offen in X , und es ist C ∩ BX = ∅. Wir zeigen, daß C ∩ BX vom Durchmesser ≤ ε ist: Sind n¨amlich x, y ∈ C ∩ BX , so gilt x0 ((x+y)/2) > 1−δ und deshalb (x+y)/2 > 1−δ. Aus der gleichm¨aßigen Konvexit¨at folgt x − y ≤ ε nach Wahl von δ. Sei x0 ∈ C ∩ BX fest und B die σ(X , X )-abgeschlossene Kugel B = {x ∈ X : x − x0 ≤ ε}. Wir haben soeben C ∩ BX = C ∩ BX ⊂ B bewiesen; da BX nach dem Satz von Goldstine (Satz VIII.3.17) in BX σ(X , X )-dicht liegt, folgt auch C ∩ BX ⊂ B. (In jedem topologischen Raum gilt f¨ ur Teilmengen M, N, O, wovon O offen ist, die Implikation O ∩ N ⊂ M ⇒ O ∩ N ⊂ M .) Nun ist x0 ∈ C ∩ BX , und deshalb gilt x0 − x0 ≤ ε, wie gew¨ unscht.
VIII.4
Extremalpunkte und der Satz von Krein-Milman
In diesem Abschnitt studieren wir (in der Regel kompakte) konvexe Teilmengen eines lokalkonvexen Raums durch ausgezeichnete Punkte, die Extremalpunkte. Definition VIII.4.1 Sei X ein Vektorraum und K ⊂ X konvex. (a) F ⊂ K heißt Seite von K, falls F konvex ist und x1 , x2 ∈ K, 0 < λ < 1, λx1 + (1 − λ)x2 ∈ F ⇒ x1 , x2 ∈ F gilt. (b) x ∈ K heißt Extremalpunkt von K, falls {x} eine Seite von K ist, mit anderen Worten, falls x1 , x2 ∈ K, 0 < λ < 1, λx1 + (1 − λ)x2 = x ⇒ x1 = x2 = x gilt. ex K bezeichnet die Menge der Extremalpunkte von K.
VIII.4
Extremalpunkte und der Satz von Krein-Milman
' r
r C C
C
C
421
C Cr
r r & r = einige Extremalpunkte Es ist leicht zu sehen, daß man sich in der obigen Definition auf λ = 12 beschr¨anken kann, denn K ist konvex. Mit anderen Worten sind die Extremalpunkte von K dadurch charakterisiert, daß sie nicht als Mittelpunkt einer (nicht ausgearteten) Strecke in K auftreten. Also ist x ∈ K genau dann ein Extremalpunkt, wenn x=
1 (x1 + x2 ), x1 , x2 ∈ K ⇒ x1 = x2 = x 2
bzw. x ± y ∈ K ⇒ y = 0. Der Beweis des folgenden Lemmas ist klar; es wurde nur des einfacheren Zitierens wegen separat formuliert. Lemma VIII.4.2 Ist K konvex, F ⊂ K eine Seite in K und G ⊂ F eine Seite in F , so ist G eine Seite in K. Speziell gilt ex F = (ex K) ∩ F . Beispiele. (a) Hier zun¨ achst ein triviales Beispiel: In X = R gilt ex[a, b] = {a, b} sowie ex(a, b) = ∅. (b) Ist X = C und K = {λ: |λ| ≤ 1}, so gilt ex K = {λ: |λ| = 1}. (c) Sei X = C[0, 1] und K = {x: 0 ≤ x(t) ≤ 1 ∀t}. Dann besteht ex K nur aus den konstanten Funktionen 0 und 1 (beachte die formale Analogie zu Beispiel (a)!): ex K = {0, 1}. Hier ist ⊃“ klar. Zum Beweis von ⊂“ ” ” sei x ∈ {0, 1}. Wir zeigen, daß x Mittelpunkt einer Strecke in K ist. Die Voraussetzung u ¨ ber x impliziert, daß {t: x(t) ∈ {0, 1}} eine nichtleere offene Menge ist. Betrachte ein t0 mit 0 < x(t0 ) < 1 und eine offene Umgebung U von t0 mit ε ≤ x(t) ≤ 1 − ε f¨ ur t ∈ U , wobei ε hinreichend klein ist, etwa ε = 12 min{x(t0 ), 1 − x(t0 )}. Schließlich w¨ ahle y ∈ C[0, 1] mit y ∞ = ε, y(t0 ) = ε und y |U = 0. Dann ist x ± y ∈ K, also x ∈ ex K. (Siehe Skizze auf der n¨achsten Seite.) Als Beispiel einer Seite in K erw¨ ahnen wir F := {x ∈ K: x|[0, 1 ] = 1}. 2 (d) Mit derselben Technik zeigt man f¨ ur einen Maßraum (Ω, Σ, μ), X = L∞ (μ) und K = {x ∈ L∞ (μ): 0 ≤ x(t) ≤ 1 f.¨ u.} ex(K) = {χE : E ∈ Σ}.
422
VIII.
Lokalkonvexe R¨ aume
x
y t0 (e) Ist X ein normierter Raum, so ist es h¨aufig wichtig, die Extremalpunkte der abgeschlossenen Einheitskugel BX von X zu kennen. Zun¨achst x gilt stets ex BX ⊂ SX = {x: x = 1}, denn x = λ x
+ (1 − λ)0, falls λ = x . Wir betrachten einige Spezialf¨ alle: • X = C[0, 1]: Im Fall K = R ist dann ex BX = {−1, 1}, und im Fall K = C ist ex BX = {x: |x(t)| = 1 ∀t}. (Das ist im wesentlichen Beispiel (c)). • X = Hilbertraum: Hier ist ex BX = SX , denn aus x ∈ SX , x ± y ∈ BX folgt 1 ≥ x ± y 2 = 1 ± 2 Rex, y + y 2 , daher y 2 ≤ ∓2 Rex, y, so daß y 2 = 0 und folglich y = 0. • X = Lp oder p , 1 < p < ∞: In diesem Fall gilt ebenfalls ex BX = SX (Aufgabe I.4.13). Gilt ex BX = SX , so heißt X strikt konvex. • X = c0 : Hier ist ex BX = ∅; es gibt also in unendlichdimensionalen normierten R¨ aumen beschr¨ ankte abgeschlossene konvexe Mengen ohne Extremalpunkte. Sei n¨ amlich x ∈ Sc0 (andere x kommen ja als Extremalpunkte sowieso nicht in Frage). W¨ahle n mit |x(n)| =: ε ≤ 12 . Dann ist x ± εen ∈ Bc0 . 1 • Auch f¨ ur X = L1 [0, 1] ist ex BX = ∅. Gelte n¨amlich 0 |f (t)| dt = s 1. Da s → 0 |f (t)| dt stetig ist (Satz A.1.10), existiert s0 mit s0 |f (t)| dt = 12 . F¨ ur f1 = 2χ[0,s0 ] f , f2 = 2χ[s0 ,1] f gilt dann 0 fi = 1, f1 = f2 , aber f = 12 (f1 + f2 ). Allgemeiner kann man ex BL1 (μ) = ∅ f¨ ur alle atomfreien“ Maß” r¨aume (siehe S. 427) zeigen (Aufgabe VIII.8.29). (f) Ein weiteres wichtiges Beispiel im Zusammenhang mit Beispiel (e) ist X = M (T ), wo T ein kompakter topologischer Hausdorffraum ist und M (T ) den Raum der regul¨ aren Borelmaße auf T bezeichnet. Der Rieszsche Darstellungssatz II.2.5 besagt C(T ) ∼ = M (T ), wo μ ∈ M (T ) das Funktional x → x dμ zugeordnet wird. Im folgenden ist unter Maß stets regul¨ares ” Borelmaß“ zu verstehen.
VIII.4
Extremalpunkte und der Satz von Krein-Milman
423
• ex BM(T ) = {αδt : t ∈ T, |α| = 1}. (Hier ist δt wie u ur t ∈ A, δt (A) = 0 sonst; ¨ blich das Diracmaß δt (A) = 1 f¨ es stellt das Funktional x → x(t) dar.) ⊃“: O.E. ist α = 1. Wir setzen ” P (T ) = {μ ∈ M (T ): μ ≥ 0, μ(T ) = 1}, die (konvexe!) Menge der Wahrscheinlichkeitsmaße. Es ist nicht schwer zu sehen, daß P (T ) eine Seite in BM (T ) ist. Nach Lemma VIII.4.2 ist nur δt ∈ ex P (T ) zu zeigen. Gelte δt ± μ ∈ P (T ). Schreibe μ = rδt + ν, wo r = μ({t}) und ν(A) = μ(A\{t}). Dann ist (1 ± r)δt ± ν ∈ P (T ), und das liefert sofort r = 0 und ν = 0 (berechne den Wert der obigen Maße f¨ ur A = {t} und A ⊂ T \{t}). Also ist μ = 0. ⊂“: μ sei nicht von der Form αδt ; wir werden μ echt konvex kombi” nieren. Die Maßtheorie lehrt, daß in diesem Fall |μ|, die Variation von μ, nicht {0, 1}-wertig ist. [Beweis: Falls |μ| nur die Werte 0 und 1 annimmt, betrachte C = {C ⊂ T kompakt: |μ|(C) = 1}. Wir setzen C0 := C∈C C und behaupten C0 ∈ C . Sonst w¨ are n¨ amlich |μ|(C0 ) = 0, und wegen der Regularit¨at von |μ| existierte eine offene Menge O ⊃ C0 mit |μ|(O) = 0. Das liefert O ∈ C , also C0 ⊂ O: Widerspruch, denn wegen der endlichen Durchschnittseigenschaft ist C0 = ∅. H¨ atte C0 mehr als einen Punkt, g¨abe es kompakte A, B = C0 mit A ∪ B = C0 . Da nicht beides Nullmengen sein k¨onnen, ergibt sich ein Widerspruch zur Minimalit¨at von C0 . Also ist C0 = {t} f¨ ur ein t ∈ T , und es folgt |μ| = δt sowie μ = αδt .] W¨ahle nun eine meßbare Menge A mit 0 < |μ|(A) =: λ < 1. Ferner 1 sei μ1 (B) = λ1 μ(A ∩ B), μ2 (B) = 1−λ μ(A ∩ B). Dann sind μi ∈ BM (T ) , μ1 = μ2 , aber μ = λμ1 + (1 − λ)μ2 . Wir haben mitbewiesen: • F¨ ur die Menge P (T ) der Wahrscheinlichkeitsmaße gilt ex P (T ) = {δt : t ∈ T }. Der folgende Satz von Krein-Milman gibt an, ob und wie K aus der Menge seiner Extremalpunkte zur¨ uckgewonnen werden kann. Beachte, daß ex K = ∅ vorkommen kann! Daher ist das Zur¨ uckgewinnen nur unter Zusatzvoraussetzungen zu erzielen. Wir werden sehen, daß eine topologische Voraussetzung (die Kompaktheit) in lokalkonvexen Hausdorffr¨aumen die rein geometrische Konsequenz ex K = ∅ nach sich zieht. Mehr noch: ex K wird sich sogar als hinreichend umfangreich erweisen. Vorher wird ein Lemma bewiesen, das von eigenem Interesse ist.
424
VIII.
Lokalkonvexe R¨ aume
Lemma VIII.4.3 Sei X ein lokalkonvexer Raum, und seien K1 , . . . , Kn ⊂ X konvex und kompakt. Dann ist K = co(K1 ∪ . . . ∪ Kn ) kompakt. Beweis. Sei
Δn =
(λ1 , . . . , λn ) ∈ R : 0 ≤ λi ≤ 1, n
n
λi = 1
i=1
sowie f : Δn × K1 × · · · × Kn → X,
f (λ1 , . . . , λn , x1 , . . . , xn ) =
n
λi xi .
i=1
Dann ist f stetig (warum?), und das Bild von f stimmt mit K u ¨berein (hierzu ben¨otigt man die Konvexit¨ at der Ki ). Da Δn × K1 × · · · × Kn kompakt ist, ist folglich K kompakt. 2 F¨ ur kompaktes, nicht konvexes S braucht co(S) nicht kompakt zu sein! (Beispiel?) Theorem VIII.4.4 (Satz von Krein-Milman) Sei X ein lokalkonvexer Hausdorffraum, und K ⊂ X sei kompakt, konvex und nicht leer. (a) ex K = ∅. (b) K = co ex K. (c) Gilt K = co B, so ist ex K ⊂ B. Beweis. Der Beweis fußt auf dem Zornschen Lemma und dem Satz von Hahn-Banach. (a) Es sei F die Menge aller abgeschlossenen, nicht leeren Seiten von K. Es ist F = ∅, da K ∈ F . Bez¨ uglich der Inklusion ist F induktiv (nach unten) geordnet, denn der Schnitt abgeschlossener Seiten ist eine abgeschlossene Seite und, da K kompakt ist, nicht leer (endliche Durchschnittseigenschaft!). Sei F0 ein minimales Element von F , das ja nach dem Zornschen Lemma existiert. Wir zeigen, daß F0 aus nur einem Punkt, der dann Extremalpunkt von K sein muß, weil F0 eine Seite ist, besteht. Wir nehmen an, das w¨ are nicht so. Nach dem Satz von Hahn-Banach (Korollar VIII.2.13; hier geht ein, daß X ein Hausdorffraum ist) existieren dann x0 , y0 ∈ F0 , x ∈ X mit Re x (x0 ) < Re x (y0 ). Betrachte nun
F1 =
x ∈ F0 : Re x (x) = sup Re x (y) . y∈F0
VIII.4
425
Extremalpunkte und der Satz von Krein-Milman
Dann ist F1 = ∅, da F0 kompakt und x stetig ist. Ferner ist F1 abgeschlossen sowie eine Seite in F0 (scharf hinsehen!). Nach Lemma VIII.4.2 ist F1 auch eine Seite in K, also F1 ∈ F ; aber wegen x0 ∈ F1 ist F1 F0 im Widerspruch zur Minimalit¨ at von F0 . (b) Setze K1 = co ex K. Dann ist K1 kompakt, konvex und nach (a) nicht leer. Ferner ist nat¨ urlich K1 ⊂ K. W¨ are K1 = K, so existierte x0 ∈ K \ K1 und deshalb nach dem Satz von Hahn-Banach x ∈ X , ε > 0 mit Re x (x) ≤ Re x (x0 ) − ε
∀x ∈ K1 .
(VIII.7)
Betrachte F = {x ∈ K: Re x (x) = supy∈K Re x (y)}. Wie oben sieht man, daß F eine abgeschlossene Seite in K und nicht leer ist. Nach (a) ist ex F = ∅, und nach Lemma VIII.4.2 gilt ex F ⊂ ex K. Andererseits ist nach (VIII.7) (ex K) ∩ F ⊂ K1 ∩ F = ∅, das liefert einen Widerspruch. (c) Sei x ∈ ex K und U eine (o.E. absolutkonvexe und abgeschlossene) Nullumgebung. Wir werden (x + U ) ∩ B = ∅ zeigen. Da B kompakt ist, existieren x1 , . . . , xn ∈ B mit B⊂
n
(xi + U ).
i=1
Setze Ki = co (xi + U ) ∩ B ⊂ co B = K; also sind die Ki kompakt und n konvex. Ferner ist B ⊂ i=1 Ki . Lemma VIII.4.3 impliziert nun K = co B = co B ⊂ co
n i=1
Ki = co
n
Ki ⊂ K,
i=1
n d.h. K = co i=1 Ki . Der gegebene Punkt x ∈ ex K muß daher in einem der Ki liegen. Da U absolutkonvex und abgeschlossen ist, erh¨ alt man Ki ⊂ xi + U und daher x ∈ xi + U f¨ ur ein i. Das liefert xi ∈ (x + U ) ∩ B und unsere Behauptung. Damit ist gezeigt, daß ex K im Abschluß von B liegt; also liegt ex K in B selbst. 2 Dieser Satz ist ein weiterer fundamentaler Satz der Funktionalanalysis; Teil (b) ist der eigentliche Satz von Krein-Milman, w¨ahrend Teil (c) auch die Milmansche Umkehrung des Satzes von Krein-Milman genannt wird. Eine Versch¨arfung von Teil (a) wird in Aufgabe VIII.8.33 vorgestellt. Wir haben bereits darauf hingewiesen, daß (b) die Reichhaltigkeit von ex K garantiert. Andererseits ist in vielen Beispielen die Menge ex K vergleichsweise klein, so daß Probleme u ¨ber K effektiv auf ex K reduziert werden k¨onnen. (Siehe Aufgabe VIII.8.34 f¨ ur eine Illustration dieser Strategie.) Um den Satz von Krein-Milman anwenden zu k¨onnen, ben¨otigt man kompakte Mengen; der Satz von Alaoglu ist h¨aufig ein probates Mittel,
426
VIII.
Lokalkonvexe R¨ aume
Kompaktheit zu beweisen. Vor einem Fehler sei gewarnt: Der Abschluß in (b) (und (c)) bezieht sich auf dieselbe Topologie, in der K kompakt ist. Ist z.B. X ein normierter Raum und K ⊂ X σ(X , X)-kompakt, σ(X ,X) so sagt (b) nicht K = co ex K, sondern nur K = co ex K. (Es sei denn, K ist sogar . -kompakt.) Dies soll an folgendem Beispiel illustriert werden. Sei K die Menge aller Wahrscheinlichkeitsmaße auf [0, 1]; K ist dann σ(M [0, 1], C[0, 1])-kompakt und konvex. Nach Beispiel (f) besteht co ex K genau aus den Konvexkombinationen der Diracmaße. Also l¨aßt sich das Lebesguemaß λ durch solche diskreten n Maße approximieren, jedoch nicht in der Normtopologie, da ja λ − i=1 ρi δti = 2 (ρi ≥ 0, n ∗ ρ = 1). Man kann nur in der schwach -Topologie das i=1 i approximieren, heißt, jede schwach∗-Umgebung von λ, sagen wir {μ: | fj dμ− fj dλ| ≤ ε, j = 1, . . . , n} mit fj ∈ C[0, 1], enth¨ alt solch ein Maß. Insbesondere bedeutet das, daß zu f ∈ C[0, 1] und ε > 0 Punkte ti ∈ [0, 1] und ρi ≥ 0, ρi = 1, mit n 1 f (t) dt − ρi f (ti ) ≤ ε 0 i=1
existieren; der Satz von Krein-Milman besagt also in diesem Kontext nichts 1 anderes als die Approximierbarkeit von 0 f (t) dt durch Riemannsche Summen. Wir formulieren einen wichtigen Spezialfall des Satzes von Krein-Milman. Korollar VIII.4.5 Ist X ein normierter Raum, so ist BX = co ex BX , wobei sich der Abschluß auf die schwach∗ -Topologie bezieht. Beweis. Nach dem Satz von Alaoglu ist BX σ(X , X)-kompakt.
2
Korollar VIII.4.6 Die R¨ aume c0 und L1 [0, 1] sind nicht zu einem Dualraum eines normierten Raums isometrisch isomorph. Beweis. Sonst bes¨ aßen die abgeschlossenen Einheitskugeln Extremalpunkte, was nach Beispiel (e) nicht der Fall ist. 2 Wir kommen zu einigen Anwendungen. Zuerst geben wir einen funktionalanalytischen Beweis des Satzes von Stone-Weierstraß, der eine Verallgemeinerung der klassischen Weierstraßschen Approximationss¨atze (I.2.10 und IV.2.12) ist. Ist T ein kompakter topologischer Raum, so nennen wir einen Untervektorraum A von C(T ) eine Algebra (oder Unteralgebra), wenn f, g ∈ A ⇒ f · g ∈ A gilt. Es ist leicht zu sehen, daß der Abschluß (bzgl. . ∞ ) einer Algebra eine Algebra ist.
VIII.4
Extremalpunkte und der Satz von Krein-Milman
427
Satz VIII.4.7 (Satz von Stone-Weierstraß) Sei T ein kompakter Raum und A ⊂ C(T ) eine Algebra mit (1) A enth¨alt die konstanten Funktionen, (2) A ist punktetrennend, d.h., zu s, t ∈ T , s = t, existiert f ∈ A mit f (s) = f (t), sowie im Fall K = C (3) A ist selbstadjungiert, d.h. f ∈ A ⇒ f ∈ A. Dann ist A dicht in C(T ) bzgl. . ∞ . Ohne (3) gilt der Satz im Komplexen nicht; denke an die Disk-Algebra aus Beispiel I.1(e). Beweis. Zuerst zum Fall K = R. W¨ are A nicht dicht, so w¨are nach dem Satz von Hahn-Banach K := μ ∈ M (T ): μ ≤ 1, f dμ = 0 ∀f ∈ A = {0}. Aber K ist σ(M (T ), C(T ))-kompakt (Satz von Alaoglu und Rieszscher Darstellungssatz), denn K ist der Schnitt von BC(T ) und Ao ; da A ein Unterraum ist, stimmt Ao mit dem in (III.4) eingef¨ uhrten Annihilator A⊥ u ¨berein. Daher existiert nach dem Satz von Krein-Milman ein Extremalpunkt μ von K; es ist dann μ = 1. Sei S = supp(μ) der Tr¨ager von μ, das ist die kleinste abgeschlossene Menge mit |μ|(S) = μ . Sei nun f ∈ A mit 0 < f (s) < 1 f¨ ur alle s ∈ S. Betrachte die Maße dμ1 = f dμ, dμ2 = (1−f ) dμ. Es folgt μ1 = 0, μ2 = 0 und, da A eine Algebra ist, μ ˜i := μμii ∈ K. Ferner ist nach Konstruktion μ1 μ ˜ 1 + μ2 μ ˜2 = μ sowie μ1 + μ2 = (f + 1 − f ) d|μ| = μ = 1. Wegen μ ∈ ex K folgt μ = μ ˜1 , d.h. μ1 dμ = f dμ, und aus der Stetigkeit von f ergibt sich f |S = const. Nach geeigneter Skalierung folgt daher stets (gehe von f u ¨ ber zu α+βf ) f ∈A
⇒
f |S = const.
Wegen (2) muß deshalb S = {t} f¨ ur ein t sein, d.h. μ = λδt f¨ urein |λ| = 1. Wegen 1 ∈ A folgt dann aber aus μ ∈ A⊥ der Widerspruch 1 = 1 dμ = 0. Im Fall K = C garantiert (3), daß die reellwertigen Funktionen in A 1 punktetrennend sind (f = 12 (f + f ) + i 2i (f − f )), und der Beweis funktioniert wie oben. 2 F¨ ur eine zweite Anwendung ben¨ otigen wir den Begriff des atomfreien Maßes. Ein endliches Maß μ auf einer σ-Algebra Σ heißt atomfrei, falls es zu A ∈ Σ mit |μ|(A) > 0 stets B ∈ Σ, B ⊂ A mit 0 < |μ|(B) < |μ|(A) gibt. Das Lebesguemaß λ auf Rn und alle Maße der Form A → A f dλ mit f ∈ L1 (Rn ) sind atomfrei.
428
VIII.
Lokalkonvexe R¨ aume
Satz VIII.4.8 (Satz von Lyapunov) (a) Ist μ: Σ → [0, ∞) ein atomfreies endliches Maß auf einer σ-Algebra Σ und sind f1 , . . . , fn reellwertige integrierbare Funktionen, so ist R := f1 dμ, . . . , fn dμ : A ∈ Σ ⊂ Rn A
A
kompakt und konvex. (b) Sind μ1 , . . . , μn : Σ → R atomfreie signierte Maße, so ist {(μ1 (A), . . . , μn (A)) : A ∈ Σ} ⊂ Rn kompakt und konvex. Beweis. Mit Hilfe des Satzes von Radon-Nikod´ ym (Satz A.4.6) kann man (b) auf (a) zur¨ uckf¨ uhren (setze μ = |μ1 | + · · · + |μn | und schreibe dμi = fi dμ), daher braucht nur (a) gezeigt zu werden. Dazu betrachte den linearen Operator T : L∞ (μ) → Rn , T g = gfi dμ i=1,...,n . T ist nach Korollar VIII.3.4 stetig, wenn L∞ (μ) die schwach∗-Topologie tr¨agt (zur Erinnerung: (L1 (μ)) = L∞ (μ), Satz II.2.4), denn die fi sind Elemente von L1 (μ). Setzt man K = {g ∈ L∞ (μ): 0 ≤ g ≤ 1}, so ist nach Beispiel (d) R = T (ex K). Nun ist K konvex und schwach∗-kompakt, denn , K = BL∞ (μ) ∩ g: f g dμ ≥ 0 , f ∈L1 (μ) f ≥0
und deshalb ist T (K) ⊂ Rn ebenfalls kompakt und konvex. Um den Satz von Lyapunov zu beweisen, reicht es daher, R = T (ex K) = T (K) zu zeigen. Zum Beweis hierf¨ ur sei p ∈ T (K). Setze Kp = {g ∈ K: T g = p}. Auch Kp = K ∩T −1 ({p}) ist schwach∗ -kompakt und konvex, nach dem Satz von Krein-Milman gilt daher ex Kp = ∅. Die Behauptung ist also gezeigt, wenn ex Kp ⊂ ex K gezeigt ist. In der Tat: Ist g0 ∈ Kp kein Extremalpunkt von K, d.h. nach Beispiel (d) keine Indikatorfunktion, so existieren A ∈ Σ und ε > 0 mit ε ≤ g0 (t) ≤ 1 − ε f¨ ur t ∈ A und μ(A) > 0. Da μ atomfrei ist, gilt dim g ∈ L∞ (μ): g |A = 0} > n; folglich existiert g ∈ L∞ (μ) mit g = 0, g |A = 0 und mit T g = 0. O.E. darf
VIII.5
Einf¨ uhrung in die Distributionentheorie
429
man g L∞ ≤ ε annehmen, so daß dann g0 ± g ∈ Kp gilt. Also ist solch ein g0 kein Extremalpunkt von Kp. 2 Hier ist eine Anwendung des Satzes von Lyapunov. Nehmen wir an, k Personen wollen sich einen Kuchen teilen, der mit verschiedenen Obstsorten belegt ist, die sich auch u urfen. Gibt es (zumindest theore¨berlappen d¨ tisch) eine gerechte“ Aufteilung? Mathematisch gesehen k¨onnen die Bele” gungen als Wahrscheinlichkeitsmaße μ1 , . . . , μn auf einem meßbaren Raum (Ω, Σ) angesehen werden. Das Problem der gerechten Aufteilung besteht dann darin, Ω in paarweise disjunkte A1 , . . . , Ak ∈ Σ so zu zerlegen, daß stets μi (Aj ) = k1 ist. Da es offenkundige Schwierigkeiten gibt, Kirschkerne gerecht zu verteilen, wenn ihre Anzahl nicht durch k teilbar ist, neh men wir die μi als atomfrei an. Nun ist μ (Ω), . . . , μ (Ω) = (1, . . . , 1) 1 n und μ1 (∅), . . . , μn (∅) = (0, . . . , 0), daher liegt ( k1 , . . . , k1 ) in der konvexen H¨ ulle dieser Vektoren. Nach dem Satz von Lyapunov existiert A1 ∈ Σ mit μ1 (A1 ) = · · · = μn (A1 ) = k1 . Indem man diese Prozedur mit Ω \ A1 statt Ω wiederholt, findet man sukzessive die gew¨ unschten A1 , . . . , Ak . Das Aufteilungsproblem ist also theoretisch l¨ osbar; jedoch haben wir mit dieser Methode nichts u ¨ ber die Geometrie der Aj sagen k¨onnen. Das Modell kann auch anders interpretiert werden: es seien n¨amlich atomfreie Wahrscheinlichkeitsmaße μ1 , . . . , μk vorgelegt, so daß μi (A) die Pr¨aferenz von Person i f¨ ur das Kuchenst¨ uck A mißt. Das Resultat ist dasselbe: es gibt eine Aufteilung, die alle subjektiv als gerecht empfinden.
VIII.5
Einfu ¨hrung in die Distributionentheorie
Die Grundidee der Distributionentheorie ist es, Funktionen f als Funktionale Tf mittels Tf (ϕ) = f (x)ϕ(x) dx (VIII.8) auf geeigneten Funktionenr¨ aumen aufzufassen (vgl. Beispiel VIII.2(a)) und so einen Rahmen zu schaffen, um auch allgemeinere Situationen zu behandeln. Z.B. wird in der theoretischen Physik bisweilen die Existenz einer Deltafunktion“ δ: R → [−∞, ∞] postuliert, die auf R\{0} verschwindet ” ∞ und die Eigenschaft −∞ δ(x) dx = 1 besitzt. (Nat¨ urlich gibt es keine solche Funktion.) Mit etwas Courage l¨ aßt sich dann die Formel ϕ(0) = δ(x)ϕ(x) dx (VIII.9) ableiten. Nun ist es so, daß man nirgends an einem Funktionswert δ(x) interessiert ist, einzig von Bedeutung sind die Integrale vom Typ (VIII.9).
430
VIII.
Lokalkonvexe R¨ aume
Heaviside, Dirac und andere haben einen symbolischen Kalk¨ ul f¨ ur Deltafunktionen entwickelt, um Integrale der Form (VIII.9) wie klassische Integrale der Form (VIII.8) zu behandeln; unter anderem wird durch formales partielles Integrieren die Ableitung δ (x) gewonnen. L. Schwartz ist es gelungen, einen solchen symbolischen Kalk¨ ul mathematisch zu rechtfertigen, indem er den Funktionsstandpunkt aufgab und (VIII.8) und (VIII.9) als lineare Funktionale ϕ → f (x)ϕ(x) dx bzw. ϕ → ϕ(0) interpretierte. Der Funktionenraum X, dem die ϕ entstammen, muß nun topologisiert werden, um Methoden der Funktionalanalysis anwenden zu k¨onnen. Damit m¨oglichst viele Integrale des Typs (VIII.8) existieren und daher m¨oglichst viele Funktionen im neuen Kontext interpretiert werden k¨onnen, sollte X klein“ sein; da wir andererseits weniger an X als an X interessiert sind, ” sollte die Topologie von X m¨ oglichst fein sein, damit X groß“ ist. ” Es zeigt sich, daß der Raum D(Ω) mit der in Beispiel VIII.1(f) beschriebenen lokalkonvexen Topologie einen idealen Rahmen abgibt. (Hier ist Ω ⊂ Rn offen.) Im folgenden bezeichnen wir diese Topologie mit τ ; die Topologie von DK (Ω) (Beispiel VIII.1(e)) wird mit τK bezeichnet. Letztere kann ¨aquivalent durch die Halbnormfamilie {p0 , p1 , p2 , . . .} mit pm (ϕ) = sup sup |(D α ϕ)(x)| |α|≤m x∈Ω
erzeugt werden. Beachte DK1 (Ω) ⊂ DK2 (Ω) f¨ ur K1 ⊂ K2 ; ferner ist DK1 (Ω) τK2 -abgeschlossen in DK2 (Ω). Die Topologie τ wird definitionsgem¨aß von der Familie P derjenigen Halbnormen auf D(Ω) erzeugt, f¨ ur die p|DK (Ω) stets τK -stetig ist; explizit sind das die p, die ∀K ⊂ Ω kompakt ∃c, m ≥ 0 ∀ϕ ∈ DK (Ω)
p(ϕ) ≤ c pm (ϕ)
(VIII.10)
erf¨ ullen (Lemma VIII.2.1). Das folgende Lemma beschreibt einige Eigenschaften von τ ; wir verwenden im Beweis die oben eingef¨ uhrten Bezeichnungen P und pm . Lemma VIII.5.1 (a) Die Relativtopologie von τ auf DK (Ω) stimmt mit τK ¨ uberein. (b) DK (Ω) ist τ -abgeschlossen in D(Ω). (c) (D(Ω), τ ) ist ein Hausdorffraum. (d) Sei Y ein lokalkonvexer Raum und L: D(Ω) → Y eine lineare Abbildung. Dann ist L genau dann τ -stetig, wenn f¨ ur alle kompakten K ⊂ Ω die Restriktion L|DK (Ω) τK -stetig ist. Beweis. (a) Die Relativtopologie wird definitionsgem¨aß von Q = {p|DK (Ω) : p ∈ P } erzeugt. Nach Konstruktion gilt {p0 , p1 , . . .} ⊂ Q ⊂ {q: q ist τK stetige Halbnorm auf DK (Ω)}; es bleibt, Korollar VIII.2.2 anzuwenden.
VIII.5
Einf¨ uhrung in die Distributionentheorie
431
(b) Sei x ∈ Ω. Die Halbnorm πx : ϕ → |ϕ(x)| geh¨ort zu P und ist daher τ -stetig. Also ist DK (Ω) = x∈K / ker πx τ -abgeschlossen. (c) Ist ϕ = 0, etwa ϕ(x) = 0, so bildet die gerade beschriebene Halbnorm πx die Testfunktion ϕ nicht auf 0 ab. Nach Lemma VIII.1.4 ist D(Ω) ein Hausdorffraum. (d) Die Bedingung ist notwendig, wie aus (a) folgt. Daß sie hinreichend ist, ergibt sich aus Satz VIII.2.3: Sei n¨ amlich q eine stetige Halbnorm auf Y . Dann ist q ◦ L|DK (Ω) nach Annahme f¨ ur alle Kompakta K eine stetige Halbnorm auf DK (Ω), d.h. q ◦ L ∈ P . Insbesondere ist q ◦ L τ -stetig, und (iii) aus Satz VIII.2.3 ist erf¨ ullt. 2 Nun widmen wir uns der Konvergenz von Folgen in D(Ω). Im n¨achsten Satz ist es wesentlich, daß (ϕn ) eine Folge und kein Netz ist. Satz VIII.5.2 Sei (ϕn ) eine Folge in D(Ω). Dann sind ¨ aquivalent: (i) ϕn → 0 bzgl. τ . (ii) Es existiert ein Kompaktum K ⊂ Ω mit ϕn ∈ DK (Ω) f¨ ur alle n ∈ N sowie ϕn → 0 bzgl. τK . (iii) Es existiert ein Kompaktum K ⊂ Ω mit supp(ϕn ) ⊂ K f¨ ur alle n ∈ N, und f¨ ur alle Multiindizes α konvergiert (Dα ϕn ) gleichm¨ aßig gegen 0. Beweis. Da (iii) nur eine Umschreibung von (ii) und (ii) ⇒ (i) trivial ist, reicht es, (i) ⇒ (ii) zu beweisen. Ist dort die Existenz von K gezeigt, folgt der Rest aus Lemma VIII.5.1(a). Nehmen wir an, es g¨ abe kein K wie unter (ii). Dann existieren eine Folge K1 ⊂ K2 ⊂ . . . ⊂ Ω von Kompakta mit n int Kn = Ω und eine Teilfolge (ψn ) von (ϕn ) mit ψn ∈ DKn (Ω), ψn ∈ / DKn−1 (Ω). W¨ahle xn ∈ Kn \ Kn−1 mit αn := |ψn (xn )| > 0. Im letzten Beweis haben wir gesehen, daß die −1 Halbnormen ∞ πn : ϕ → αn |ϕ(xn )| τ -stetig sind. Betrachte nun die Halbnorm π = n=1 πn . Jede kompakte Teilmenge liegt bereits in einem der Kn , denn n int Kn = Ω, also gilt D(Ω) = n DKn (Ω). Weil πn |DK (Ω) = 0 f¨ ur m n > m ist, ist daher π(ϕ) f¨ ur jedes ϕ ∈ D(Ω) eine endliche Summe. Die ¨ Halbnorm π ist also wohldefiniert, und dieselbe Uberlegung zeigt π |D ˜ (Ω) = K
N n=1
˜ ⊂ KN . πn |D ˜ (Ω) , falls K K
Es ist daher π ∈ P ; insbesondere ist π τ-stetig. Einerseits ist nun π(ψn ) ≥ πn (ψn ) = 1; andererseits impliziert ϕn → 0 jedoch π(ψn ) → π(0) = 0. Das ist ein Widerspruch, und die Existenz von K ist gezeigt. 2 Sowohl Lemma VIII.5.1(d) als auch Satz VIII.5.2 lassen erkennen, daß D(Ω) nicht nur mengentheoretisch, sondern auch topologisch“ aus den ” DK (Ω) aufgebaut ist.
432
VIII.
Lokalkonvexe R¨ aume
Wir haben bereits bemerkt, daß unser eigentliches Interesse dem Dualraum von D(Ω) gilt, den wir nun einf¨ uhren. Definition VIII.5.3 Der Dualraum von (D(Ω), τ ) wird mit D (Ω) bezeichnet. Seine Elemente heißen Distributionen auf Ω. Da der Wert einer Distribution bei den ϕ ∈ D(Ω) getestet“ wird, tragen ” diese Funktionen den Namen Testfunktionen. Nach den bisherigen Resultaten dieses Abschnitts k¨onnen Distributionen wie folgt charakterisiert werden; Bedingung (iii) ist dabei die handlichste. Satz VIII.5.4 F¨ ur eine lineare Abbildung T : D(Ω) → C sind ¨aquivalent: (i) T ∈ D (Ω). (ii) F¨ ur alle kompakten K ⊂ Ω ist T |DK (Ω) ∈ (DK (Ω)) . (iii) F¨ ur alle kompakten K ⊂ Ω existieren m ∈ N0 und c ≥ 0 mit |T ϕ| ≤ c pm (ϕ) = c sup sup |(Dα ϕ)(x)| |α|≤m x∈Ω
∀ϕ ∈ DK (Ω).
(iv) Gilt ϕn → 0 in D(Ω), so folgt T ϕn → 0 in C. Beweis. (i) ⇔ (ii) ist ein Spezialfall von Lemma VIII.5.1(d). (ii) ⇔ (iii) folgt aus Korollar VIII.2.4. (i) ⇒ (iv) gilt nach Definition. (iv) ⇒ (ii): Bedingung (iv) impliziert, daß T |DK (Ω) stets folgenstetig ist. Aber τK wird von einer abz¨ ahlbaren Halbnormfamilie erzeugt und ist daher nach Aufgabe VIII.8.16 metrisierbar, so daß T |DK (Ω) sogar stetig ist. 2 Beachte, daß in (iii) m im allgemeinen von K abh¨angt; das ist z.B. in Beispiel (e) so. Sollte das nicht der Fall sein (wie in den Beispielen (a)–(d) unten), nennt man das kleinstm¨ ogliche m die Ordnung von T . Beispiele. (a) Ist f : Ω → Ceine meßbare Funktion, f¨ ur die f¨ ur alle kompakten K ⊂ Ω das Integral K |f (x)| dx endlich ist, nennt man f lokal in1 tegrierbar ; diese Funktionen bilden den Vektorraum Llok (Ω). Identifiziert man zwei fast u ¨berall u ¨bereinstimmende Funktionen, erh¨alt man den zu¨ geh¨origen Raum von Aquivalenzklassen L1lok (Ω). (Wie u ¨blich werden wir 1 die f ∈ Llok (Ω) doch als Funktionen ansehen.) Insbesondere sind stetige Funktionen und Funktionen in Lp (Ω) lokal integrierbar. F¨ ur f ∈ L1lok (Ω) definiere nun Tf (ϕ) = f (x)ϕ(x) dx ∀ϕ ∈ D(Ω). Ω
VIII.5
Einf¨ uhrung in die Distributionentheorie
433
Da f lokal integrierbar ist, ist Tf wohldefiniert und linear. Um zu zeigen, daß Tf eine Distribution ist, sei K ⊂ Ω kompakt. Dann gilt |Tf (ϕ)| ≤ |f (x)| dx sup |ϕ(x)| ∀ϕ ∈ DK (Ω); x∈K
K
damit ist (iii) aus Satz VIII.5.4 erf¨ ullt. Tf heißt die zu f geh¨orige regul¨ are Distribution. Wir beobachten noch, daß f → Tf injektiv ist, so daß wir eine Funktion f ∈ L1lok(Ω) mit der Distribution Tf ∈ D (Ω) identifizieren k¨onnen. Ist n¨amlich Ω f (x)ϕ(x) dx = 0 f¨ ur alle Testfunktionen ϕ, so gilt f = 0 fast u ur: Ist K ⊂ Ω kompakt und m hinreichend groß, so ¨berall. [Beweis hierf¨ definiert Φm (x) = ϕ1/m (x − y) dy Km
mit ϕ1/m wie im Beweis von Lemma V.1.10 und Km := {x ∈ Ω: d(x, K) ≤ 1 m } eine Folge von Testfunktionen mit Φm → χK punktweise. Der Konvergenzsatz von Lebesgue impliziert nun f (x) dx = lim f (x)Φm (x) dx = 0. K
m→∞
Ω
Da die kompakten Teilmengen einen durchschnittsstabilen Erzeuger der Borel-σ-Algebra von Ω bilden, folgt A f (x) dx = 0 f¨ ur alle Borelmengen A ⊂ Ω (Bauer [1990], S. 26, Behrends [1987], S. 23). Das liefert f = 0 fast u ¨berall.] (b) Sei x0 ∈ Ω fest gew¨ ahlt, und betrachte das Funktional δx0 : ϕ → ϕ(x0 ). Wegen |ϕ(x0 )| ≤ p0 (ϕ) ist δx0 auf allen DK (Ω) stetig, also ist δx0 eine Distribution, die man Deltadistribution nennt. Ist x0 = 0, schreibt man einfach δ. Daß δx0 keine regul¨ are Distribution ist, kann man so einsehen. Sei Ω0 = Ω\{x0 }. Dann ist δx0 |D(Ω0 ) = 0. W¨are δx0 = Tf , so w¨are, da f → Tf injektiv ist, f |Ω0 = 0 fast u ¨berall, also f = 0 fast u ¨ berall; es w¨are also δx0 = 0, was nicht der Fall ist. (c) Allgemeinerlassen sich alle Borelmaße mit |μ|(K) < ∞ f¨ ur kompakte K durch Tμ (ϕ) = Ω ϕ dμ als Distributionen auffassen. Das Argument von (a) zeigt, daß auch μ → Tμ injektiv ist. (d) Bei der Behandlung des Dipols in der Elektrodynamik spielt die Distribution ϕ → ϕ (0) auf D(R) eine Rolle. In der Tat handelt es sich wegen |ϕ (0)| ≤ p1 (ϕ) um eine Distribution. ∞ (n) (e) Das Funktional T : ϕ → (n) ist auf D(R) wohldefiniert n=0 ϕ und linear. T ist eine Distribution, denn f¨ ur Testfunktionen mit supp(ϕ) ⊂ [−N, N ] gilt N −1 |T ϕ| ≤ |ϕ(n) (n)| ≤ N pN −1 (ϕ). n=0
434
VIII.
Lokalkonvexe R¨ aume
Der mathematische Gewinn der Distributionentheorie ist, daß sich viele f¨ ur Funktionen definierte Operationen auf Distributionen u ¨bertragen lassen und im Distributionensinn h¨ aufig leichter zu handhaben sind. Wir werden hier etwas genauer auf die Differentiation und die Fouriertransformation von Distributionen eingehen, aber vorher einen etwas allgemeineren Standpunkt einnehmen, indem wir wie im normierten Fall den Begriff des adjungierten Operators einf¨ uhren. Definition VIII.5.5 Es seien X und Y lokalkonvexe R¨aume und L ∈ L(X, Y ). Zu y ∈ Y betrachte L (y ) := y ◦ L ∈ X . Die so definierte lineare Abbildung L : Y → X heißt der zu L adjungierte Operator. Aus Satz VIII.3.6 und Korollar VIII.3.4 folgt sofort, daß L σ(Y , Y )σ(X , X)-stetig ist. Nun kommen wir zur Differentiation von Distributionen. In Definition V.1.11 haben wir bereits f¨ ur gewisse L2 -Funktionen eine verallgemeinerte Ableitung definiert. Dieselbe Idee f¨ uhrt nun dazu, allen Distributionen und damit allen (lokal integrierbaren) Funktionen eine Ableitung zuzuordnen; der Preis, den man f¨ ur diese Flexibilit¨ at zu zahlen hat, ist, daß diese Ableitungen i.a. keine Funktionen mehr sind, sondern nur noch Distributionen. Die Rechnung, die uns auf Definition V.1.11 gef¨ uhrt hat, liefert im Kontext der Distributionentheorie f¨ ur stetig differenzierbares f : R → C Tf (ϕ) = −Tf (ϕ )
∀ϕ ∈ D(R);
eine analoge Formel gilt f¨ ur h¨ ohere oder partielle Ableitungen. Das suggeriert folgende Definition. Definition VIII.5.6 F¨ ur T ∈ D (Ω) und einen Multiindex α setze (D(α) T )(ϕ) = (−1)|α| T (Dα ϕ). Lemma VIII.5.7 Die Abbildung D (α) : D (Ω) → D (Ω) ist wohldefiniert und σ(D , D)-stetig. Beweis. Nach Definition ist D(α) = (−1)|α| (Dα ) , also bis auf das Vorzeichen der zu D α adjungierte Operator. Es ist also nur zu verifizieren, daß D α : D(Ω) → D(Ω) stetig ist, d.h. nach Lemma VIII.5.1(a) und (d), daß D α : DK (Ω) → DK (Ω) stetig ist, und das ist wegen pm (Dα ϕ) ≤ pm+|α| (ϕ) klar. 2 Beispiele. (f) Wir haben bereits bemerkt, daß dank des Faktors (−1)|α| f¨ ur stetig differenzierbare Funktionen D(α) Tf = TDα f gilt. Daher ist der Operator D(α) eine Fortsetzung des klassischen Differentialoperators Dα .
VIII.5
435
Einf¨ uhrung in die Distributionentheorie
(g) Die Heavisidefunktion H: R → C ist die Indikatorfunktion des Intervalls [0, ∞), also H(x) = 1 f¨ ur x ≥ 0 und H(x) = 0 f¨ ur x < 0. Ihre Ableitung im Distributionensinn ist (ϕ ∈ D(R)) ∞ TH (ϕ) = −TH (ϕ ) = − H(x)ϕ (x) dx −∞ ∞ 0 = − ϕ (x) dx = ϕ(x) = ϕ(0); ∞
0
also TH = δ, was der heuristischen Interpretation der Deltafunktion“ ent” spricht. (h) Die Ableitung der Deltadistribution ist
δ (ϕ) = −δ(ϕ ) = −ϕ (0), also ist δ im wesentlichen die Dipoldistribution“ aus Beispiel (d). ” 1 (i) Betrachte die Funktion f , f (x) = − 4π |x|−1 auf R3 \{0} und f (0) = 0, wo |x| = (x21 + x22 + x23 )1/2 . Dann ist f ∈ L1lok (R3 ), und wir k¨onnen den Laplaceoperator Δ im Distributionensinn auf Tf anwenden. In Aufgabe VIII.8.38 ist ΔTf = δ zu zeigen; man nennt Tf eine Grundl¨ osung f¨ ur den Laplaceoperator. In Abschnitt VIII.7 wird mehr u ¨ber diesen Begriff und den Zusammenhang zur Theorie partieller Differentialgleichungen berichtet. In Abschnitt V.2 wurde die Fouriertransformierte F f einer Funktion f ∈ L1 (Rn ) bzw. f ∈ S (Rn ) bzw. f ∈ L2 (Rn ) erkl¨art. Hier liefert die Distributionentheorie die M¨ oglichkeit einer umfassenderen Betrachtungsweise. Leider ist der Raum D (Rn ) nicht der geeignete Rahmen, da f¨ ur ϕ ∈ D(Rn ) n nicht unbedingt F ϕ ∈ D(R ) ist (tats¨ achlich ist das bis auf ϕ = 0 nie der Fall). Hingegen wurde in Satz V.2.8 bewiesen, daß F eine Bijektion von S (Rn ) auf sich ist. Das legt es nahe, den adjungierten Operator auf dem Dualraum S (Rn ) zu betrachten. Wir werden als n¨ achstes u ¨ berlegen, daß das wirklich sinnvoll ist. Dazu beweisen wir zuerst ein Lemma. Es sei daran erinnert, daß gem¨aß Beispiel VIII.1(d) S (Rn ) mittels der Halbnormen pα,m (ϕ) = sup (1 + |x|m )|(D α ϕ)(x)| x∈Rn
topologisiert wird. Ein ¨ aquivalentes Halbnormsystem, das technisch manchmal Vorz¨ uge bietet, wird von den Halbnormen qα,Q (ϕ) = sup |Q(x)(Dα ϕ)(x)| x∈Rn
gebildet, wo Q ein Polynom und α nach wie vor ein Multiindex ist (vgl. (V.9)–(V.11)).
436
VIII.
Lokalkonvexe R¨ aume
Lemma VIII.5.8 (a) F¨ ur jeden Multiindex α ist der Multiplikationsoperator ϕ → xα ϕ wohldefiniert und stetig auf S (Rn ). (b) F¨ ur jeden Multiindex β ist der Differentialoperator ϕ → D β ϕ wohldefiniert und stetig auf S (Rn ). (c) Es gibt eine Konstante c ≥ 0 mit |(F ϕ)(ξ)| ≤ c p0,n+1 (ϕ)
∀ϕ ∈ S (Rn ), ξ ∈ Rn .
Beweis. (a) folgt sofort aus der Leibnizformel, und (b) ist klar. F¨ ur (c) bemerke nur dx n/2 −ixξ (2π) |(F ϕ)(ξ)| = e ϕ(x) dx ≤ p (ϕ). 2 n+1 0,n+1 n n 1 + |x| R
R
Satz VIII.5.9 Die Fouriertransformation F und ihre Inverse F −1 sind stetig auf S (Rn ). Beweis. Wir haben nach Satz VIII.2.3 f¨ ur ein Polynom Q, Q(ξ) = aγ ξ γ , und einen Multiindex α qα,Q (F ϕ) = sup Q(ξ) Dα (F ϕ) (ξ) ξ∈Rn
abzusch¨atzen. Definiert man den Differentialoperator Q(D) = aγ Dγ , so ist nach Lemma V.2.4 und Lemma VIII.5.8(c) Q(ξ) Dα (F ϕ) (ξ) = F Q(D)(xα ϕ) (ξ) ≤ c p0,n+1 Q(D)(xα ϕ) , und nach Lemma VIII.5.8(a) und (b) kann man diesen Term gegen eine geeignete Halbnorm c max pβj ,mj (ϕ) absch¨ atzen. Zusammen hat man qα,Q (F ϕ) ≤ c max pβj ,mj (ϕ)
∀ϕ ∈ S (Rn ),
was zu zeigen war. Wegen Lemma V.2.7 ist auch F −1 stetig.
2
Definition VIII.5.10 (a) Ein Funktional T ∈ S (Rn ) heißt temperierte Distribution. (b) F¨ ur T ∈ S (Rn ) ist die Fouriertransformierte F T durch (F T )(ϕ) = T (F ϕ)
∀ϕ ∈ S (Rn )
erkl¨art. Da F : S (Rn ) → S (Rn ) stetig ist, ist F T = T ◦ F ein stetiges lineares Funktional; es ist also F T nichts anderes als der adjungierte Operator F angewandt auf T . Weil mit einem Operator auch dessen Adjungierter bijektiv ist, ist wegen Satz V.2.8 die Fouriertransformation eine Bijektion auf S (Rn ). Wir wollen nun den Zusammenhang zwischen D und S kl¨aren.
VIII.5
Einf¨ uhrung in die Distributionentheorie
437
Satz VIII.5.11 (a) Die identische Einbettung j: D(Rn ) → S (Rn ) ist stetig und hat dichtes Bild. (b) j : S (Rn ) → D (Rn ), T → T |D(Rn) , ist injektiv. Beweis. (a) Die Stetigkeit von j ist klar, denn wegen Lemma VIII.5.1(d) ist nur die Stetigkeit der Inklusion von DK (Rn ) in S (Rn ) zu beobachten. Sei nun ϕ ∈ S (Rn ). W¨ ahle Φ ∈ D(Rn ) mit 0 ≤ Φ ≤1,Φ(x) = 1 f¨ ur |x| ≤ 1, Φ(x) = 0 f¨ ur |x| ≥ 2. Setzt man ϕk (x) = ϕ(x)Φ xk , so ist ϕk ∈ D(Rn ), und es gilt ϕk → ϕ bzgl. der Topologie von S (Rn ), wie man unschwer nachweist. (b) ist eine Konsequenz von (a). 2 Das Bild von j besteht aus genau denjenigen Distributionen in D (Rn ), die noch bez¨ uglich einer gr¨ oberen Topologie als der von D(Rn ), n¨amlich n der von S (R ), stetig sind. Insofern kann die Ableitung D (α) T im Sinn von Definition VIII.5.6 verstanden werden. Nach Lemma VIII.5.8(b) ist D (α) T wieder eine temperierte Distribution, wenn T es ist. Genauso ist nach Lemma VIII.5.8(a) xα T : ϕ → T (xα ϕ) temperiert. Aus Lemma V.2.4 folgt nun eine Verallgemeinerung von Lemma V.2.11. Satz VIII.5.12 Ist T ∈ S (Rn ), so gilt F (D(α) T ) = i|α| xα F T . Abschließend sollen einige Beispiele diskutiert werden. Beispiele. (j) Sei 1 ≤ p ≤ ∞ und f ∈ Lp(Rn ). Dann definiert Tf (ϕ) = f (x)ϕ(x) dx Rn
nach Beispiel VIII.2(a) eine temperierte Distribution. F¨ ur p = 1 ist definitionsgem¨aß (F Tf )(ϕ) = Tf (F ϕ) = f (x)(F ϕ)(x) dx = (F f )(x)ϕ(x) dx = TF f (ϕ); wir haben hier das Analogon zu Gleichung (V.13) benutzt. Also ist die Fouriertransformation temperierter Distributionen eine Ausdehnung der klassischen Fouriertransformation. Dieselbe Zeile zeigt im Fall p = 2, daß die Fouriertransformation auf S (Rn ) auch die Fourier-Plancherel-Transformation fortsetzt. Wegen Lp (Rn ) ⊂ S (Rn ) (Beispiel VIII.2(a)) ist jetzt die Fouriertransformation f¨ ur alle Lp -Funktionen erkl¨art, aber im Unterschied zum Fall p ≤ 2 (Satz V.2.10) ist f¨ ur 2 < p ≤ ∞ die Fouriertransformierte i.a.
438
VIII.
Lokalkonvexe R¨ aume
keine Funktion mehr, sondern nur noch eine temperierte Distribution. (Beispiel (l) diskutiert einen speziellen Fall, wo dieser Effekt auftritt.) (k) F¨ ur a ∈ Rn ist δa ∈ S (Rn ), wie man leicht sieht. Es ist 1 (F δa )(ϕ) = δa (F ϕ) = (F ϕ)(a) = e−iax ϕ(x) dx. (2π)n/2 Rn Also ist F δa die zur L∞ -Funktion x → (2π)1n/2 e−iax geh¨orige temperierte Distribution, in etwas laxer Schreibweise (F δa )(x) =
1 e−iax . (2π)n/2
(l) Wir berechnen die Fouriertransformierte der konstanten Funktion 1 im Distributionensinn. Die naheliegende Argumentation, (F T1 )(ϕ) definitionsgem¨aß zu berechnen, scheitert, weil sie auf ein nicht absolut konvergentes Integral f¨ uhrt und der Satz von Fubini nicht anwendbar ist. (Versuche es!) Wir verwenden daher einen Kunstgriff. Setzt man ϕ∗ (x) = ϕ(−x), so gilt n¨amlich nach Lemma V.2.7 und Beispiel (k) (F T1 )(ϕ) = (2π)n/2 (F F δ)(ϕ) = (2π)n/2 δ(F F ϕ) = (2π)n/2 δ(ϕ∗ ) = (2π)n/2 ϕ(−0) = (2π)n/2 δ(ϕ), also lax F 1 = (2π)n/2 δ.
VIII.6
Schwache Kompaktheit
Wir kehren zur Thematik von Abschnitt VIII.3 zur¨ uck und studieren jetzt einige Aspekte der schwachen Topologie eines Banachraums, insbesondere des Raums L1 . Im folgenden seien X, Y, . . . stets Banachr¨aume. Eine schwach kompakte Menge A ⊂ X ist eine bez¨ uglich der schwachen Topologie σ(X, X ) komσ pakte Menge, und A heißt relativ schwach kompakt, wenn der Abschluß A von A bez¨ uglich der schwachen Topologie kompakt ist. Solche Mengen und die mit ihnen zusammenh¨ angenden linearen Operatoren sollen nun studiert werden. Obwohl die schwache Topologie im allgemeinen nicht metrisierbar ist (Aufgabe VIII.8.16) sind die topologischen Eigenschaften einer schwach kompakten Menge denen eines kompakten metrischen Raums sehr a¨hnlich. Dies ist der Inhalt des folgenden tiefliegenden Satzes. Theorem VIII.6.1 (Satz von Eberlein-Shmulyan) Sei X ein Banachraum, und sei A ⊂ X.
VIII.6
439
Schwache Kompaktheit
(a) A ist genau dann relativ schwach kompakt, wenn jede Folge in A eine schwach konvergente Teilfolge (mit Grenzwert in X) besitzt. σ (b) Ist A relativ schwach kompakt und x ∈ A , so existiert eine Folge in A, die schwach gegen x konvergiert. (c) A ist genau dann schwach kompakt, wenn A schwach folgenkompakt ist; letzteres bedeutet, daß jede Folge in A eine schwach konvergente Teilfolge mit Grenzwert in A besitzt. Bevor wir zum Beweis dieses Satzes kommen, ein paar Bemerkungen σ und Vorbereitungen. W¨ are die schwache Topologie auf A metrisierbar, so w¨aren diese Aussagen klar; siehe dazu auch Satz B.1.7. F¨ ur allgemeine nichtmetrisierbare topologische R¨ aume brauchen sie jedoch nicht zuzutreffen; im Anschluß an Korollar VIII.3.12 haben wir zum Beispiel einen kompakten Raum kennengelernt, der nicht folgenkompakt ist. Die Metrisierbarkeit von relativ schwach kompakten Mengen gilt in separablen R¨aumen; dies wird der erste Schritt zum Beweis des Satzes von Eberlein-Shmulyan sein. Um dies im n¨ achsten Lemma zu zeigen, beobachten wir zuvor die Beschr¨ anktheit relativ schwach kompakter Mengen A: F¨ ur jedes x ∈ X ist x (A) n¨ amlich relativ kompakt, also beschr¨ankt, und die Beschr¨anktheit von A folgt nach Korollar IV.2.4 aus dem Satz von BanachSteinhaus. Lemma VIII.6.2 Sei Y ein separabler Banachraum, und sei B ⊂ Y eine schwach kompakte Teilmenge. Dann ist die schwache Topologie auf B metrisierbar. Beweis. Die Folge (yn ) liege dicht in Y . W¨ ahle mit dem Satz von HahnBanach Funktionale yn ∈ SY mit yn (yn ) = yn . Betrachte nun f¨ ur y, y˜ ∈ B ∞ d(y, y˜) = 2−n |yn (y − y˜)|. n=1
Da B beschr¨ankt ist, konvergiert die Reihe, und man sieht sofort, daß d eine Metrik definiert. (Die Definitheit von d folgt daraus, daß z = 0 ist, sobald alle yn (z) = 0 sind.) Nun ist die identische Abbildung von (B, σ(Y, Y )) nach (B, d) stetig: Seien y ∈ B und ε > 0; ferner setze M = supb∈B b . W¨ahle k mit 2−k · 2M < ε/2; dann folgt f¨ ur y˜ ∈ B mit |yn (y − y˜)| ≤ ε/2 f¨ ur n = 1, . . . , k (was eine schwache Umgebung von y definiert) d(y, y˜) < ε. Da (B, σ(Y, Y )) kompakt ist, ist die Identit¨ at nach Lemma B.2.7 sogar ein Hom¨oomorphismus, und (B, σ(Y, Y )) ist metrisierbar. 2 Nun k¨onnen wir die einfachere Richtung von Aussage (a) aus dem Satz von Eberlein-Shmulyan beweisen, in der vorausgesetzt ist, daß A relativ schwach kompakt ist. Sei (an ) eine Folge in A. Setze Y = lin{a1 , a2 , . . .},
440
VIII.
Lokalkonvexe R¨ aume
σ
B = A ∩ Y . Nach Satz VIII.3.5 ist Y in X schwach abgeschlossen, und der Satz von Hahn-Banach liefert, daß die Einschr¨ankung der σ(X, X )Topologie auf Y genau die σ(Y, Y )-Topologie ist. Lemma VIII.6.2 impliziert nun, daß (B, σ(Y, Y )) ein kompakter metrischer Raum ist, und (an ) besitzt eine schwach konvergente Teilfolge. (Wegen der obigen Beobachtung, die wir noch h¨aufiger anwenden werden, ist es unerheblich, ob man sich auf die schwache Topologie des Banachraums Y oder die von X bezieht.) Jetzt beweisen wir die R¨ uckrichtung in (a). Es wird also vorausgesetzt, daß jede Folge in A eine schwach konvergente Teilfolge besitzt. Auch diese Voraussetzung impliziert, daß A beschr¨ ankt ist. Denn sonst g¨abe es xn ∈ A mit xn ≥ n, und diese Folge kann keine schwach konvergente Teilfolge haben, da schwach konvergente Folgen beschr¨ankt sind (Korollar IV.2.3). Wir sehen nun X kanonisch als Unterraum von X an und verwenden die σ(X ,X ) Dualit¨atsklammern des dualen Paars (X , X ). Sei A˜ := A ⊂ X . Da A beschr¨ankt ist, ist A˜ nach dem Satz von Alaoglu σ(X , X )-kompakt. Unsere Strategie wird sein, die Inklusion A˜ ⊂ X nachzuweisen, woraus dann σ(X,X ) die Behauptung folgt, denn in diesem Fall ist A˜ = A . Dazu bedienen wir uns der Whitleyschen Konstruktion. Wir beginnen wieder mit einem vorbereitenden Lemma. Lemma VIII.6.3 Sei Y ein Banachraum, und sei E ⊂ Y ein endlichdimensionaler Unterraum. Dann existieren endlich viele y1 , . . . , yn ∈ SY mit 1 y ≤ max |y (yi )| i=1,...,n 2 f¨ ur alle y ∈ E. Beweis. Die Einheitssph¨ are SE ist norm-kompakt. n Daher existiert ein endliches 14 -Netz, d.h. y1 , . . . , yn ∈ SE mit SE ⊂ i=1 (yi + 14 BY ). Zu yi w¨ahle yi ∈ SY mit |yi (yi )| ≥ 34 . Es folgt f¨ ur y ∈ SE und geeignetes i |y (yi )| ≥ |yi (yi )| − |(y − yi )(yi )| ≥
3 1 1 − = , 4 4 2 2
was zu zeigen war.
˜ wir wollen zeigen, daß x tats¨achlich in X liegt. Sei Sei nun x ∈ A; dazu x1 ∈ SX beliebig, und betrachte die schwach∗-Umgebung von x U1 = {z : |z − x , x1 | ≤ 1}. Weil A schwach∗-dicht in A˜ ist, existiert ein a1 ∈ A ∩ U1 . Nun betrachte den endlichdimensionalen Unterraum E1 = lin{x , a1 } ⊂ X . Nach Lemma VIII.6.3, angewandt auf Y = X , existieren x2 , . . . , xn2 ∈ SX mit 1 z ≤ max |z , xi | ≤ max |z , xi | 2≤i≤n2 i≤n2 2
∀z ∈ E1 .
VIII.6
441
Schwache Kompaktheit
Im n¨achsten Schritt definiere U2 = {z : |z − x , xi | ≤
f¨ ur i = 1, . . . , n2 }
1 2
und finde ein Element a2 ∈ A ∩ U2 . Setze E2 = lin{x , a1 , a2 }, Lemma VIII.6.3 liefert xn2 +1 , . . . , xn3 ∈ SX mit 1 z ≤ max |z , xi | i≤n3 2
∀z ∈ E2 .
Im dritten Schritt definiere U3 = {z : |z − x , xi | ≤
1 3
f¨ ur i = 1, . . . , n3 },
finde ein Element a3 ∈ A ∩ U3 , betrachte E3 = lin{x , a1 , a2 , a3 } und finde Funktionale xn3 +1 , . . . , xn4 ∈ SX mit 1 z ≤ max |z , xi | i≤n4 2
∀z ∈ E3 ,
etc. Auf diese Weise werden Folgen (an ) in A und (xn ) in SX definiert mit 1 z ≤ sup |z , xi | 2 i∈N
(VIII.11)
f¨ ur alle z ∈ F0 := lin{x , a1 , a2 , . . .}. Es ist klar, daß (VIII.11) auch f¨ ur den Norm-Abschluß F = F 0 gilt. Nach Voraussetzung besitzt (an ) eine schwach konvergente Teilfolge, σ
.
sagen wir mit Grenzwert x. Wegen x ∈ lin {a1 , a2 , . . .} = lin {a1 , a2 , . . .} (vgl. Satz VIII.3.5) ist x ∈ F , und deshalb gilt (VIII.11) f¨ ur z = x − x. Wir zeigen jetzt x = x und damit x ∈ X, wie gew¨ unscht. Seien dazu ε > 0 und i ∈ N beliebig. Sei k ≥ max{i, 1/ε}. Dann gilt |x − ak , xi | ≤
1 ≤ ε, k
da ak ∈ Uk und i ≤ k ≤ nk . Da andererseits x schwacher H¨aufungspunkt der an ist, kann man k noch so w¨ ahlen, daß |ak − x, xi | ≤ ε ist. Zusammen folgt |x − x, xi | ≤ 2ε und daher nach (VIII.11) auch 12 x − x ≤ 2ε. Deshalb ist x = x , und der Beweis von (a) ist erbracht. Der Beweis von (b) ist in dem obigen Argument bereits enthalten: Ist n¨amlich A relativ schwach kompakt (und damit relativ schwach folgenkompakt) und a im schwachen Abschluß von A, so liefert die auf a anstelle von x angewandte Whitleysche Konstruktion eine Folge in A mit gegen a schwach konvergenter Teilfolge.
442
VIII.
Lokalkonvexe R¨ aume
Teil (c) folgt nun aus (a) und (b). Daß schwach kompakte Mengen folgenkompakt sind, ergibt sich sofort aus (a). F¨ ur die Umkehrung ist wegen σ (a) nur die schwache Abgeschlossenheit zu zeigen. Sei also a ∈ A ; nach (b) existiert eine Folge in A mit schwachem Grenzwert a. Wegen der vorausgesetzten schwachen Folgenkompaktheit hat diese Folge eine schwach konvergente Teilfolge mit Grenzwert in A; aber dieser Grenzwert muß a sein. 2 Als Korollar erhalten wir die Umkehrung von Theorem III.3.7. Korollar VIII.6.4 (a) Ein Banachraum X ist genau dann reflexiv, wenn jede beschr¨ankte Folge eine schwach konvergente Teilfolge hat. (b) Ein Banachraum X ist genau dann reflexiv, wenn jeder abgeschlossene separable Unterraum reflexiv ist. Beweis. (a) folgt aus Satz VIII.3.18, wenn man A = BX im Satz von Eberlein-Shmulyan setzt. (b) Daß jeder abgeschlossene Unterraum ebenfalls reflexiv ist, wurde in Satz III.3.4 gezeigt. Wenn umgekehrt jeder abgeschlossene separable Unterraum reflexiv ist und (an ) eine beschr¨ ankte Folge in X ist, so liegt diese insbesondere im separablen Unterraum lin{a1 , a2 , . . .}. Dort existiert eine schwach konvergente Teilfolge, die dann auch in X schwach konvergiert. 2 Schwach kompakte Teilmengen von C(K) sind nun leicht zu beschreiben. Da f¨ ur beschr¨ ankte Folgen in C(K) schwache Konvergenz gegen 0 dasselbe ist wie punktweise Konvergenz (siehe Seite 107), erh¨alt man: Korollar VIII.6.5 Eine beschr¨ ankte Teilmenge A ⊂ C(K) ist genau dann relativ schwach kompakt, wenn jede Folge in A eine punktweise konvergente Teilfolge mit stetiger Grenzfunktion enth¨ alt. Um schwache Kompaktheit in L1 (μ) zu charakterisieren, ben¨otigen wir einen neuen Begriff. Definition VIII.6.6 Eine Teilmenge H ⊂ L1 (μ) heißt gleichgradig integrierbar, wenn es zu jedem ε > 0 ein δ > 0 gibt, so daß sup h dμ < ε, h∈H
E
falls μ(E) < δ. Beispiele. (a) Einpunktige Mengen sind gleichgradig integrierbar. Zu gegebenem h ∈ L1 (μ) setze n¨ amlich En = {ω: |h(ω)| ≥ n}. Dann gilt |h|1En → 0
VIII.6
443
Schwache Kompaktheit
punktweise, also nach dem Lebesgueschen Konvergenzsatz En |h| dμ → 0. Zu ε > 0 w¨ahle nun n mit En |h| dμ < ε/2. F¨ ur μ(E) < δ := ε/(2n) hat man in der Tat ε h dμ ≤ |h| dμ + |h| dμ < + nμ(E) < ε. 2 E E∩En E\En (b) Da endliche Vereinigungen gleichgradig integrierbarer Mengen offenbar ebenfalls gleichgradig integrierbar sind, sind auch endliche Mengen gleichgradig integrierbar. (c) Relativkompakte (bez¨ uglich der L1 -Norm) Mengen sind gleichgradig integrierbar: Man braucht eine solche Menge nur durch endlich viele ε/2Kugeln zu u ¨ berdecken und (b) anzuwenden. (d) Die Menge {n1[0,1/n]: n ∈ N} ⊂ L1 [0, 1] ist nicht gleichgradig integrierbar. Wir wollen beweisen, daß eine beschr¨ ankte Teilmenge von L1 [0, 1] genau dann relativ schwach kompakt ist, wenn sie gleichgradig integrierbar ist. Dazu u ¨berlegen wir vorbereitend, daß man die σ-Algebra eines endlichen Maßraums auf kanonische Weise zu einem vollst¨andigen metrischen Raum machen kann. Sei (Ω, Σ, μ) ein endlicher Maßraum. Zu E1 , E2 ∈ Σ betrachte die symmetrische Differenz E1 Δ E2 = (E1 \ E2 ) ∪ (E2 \ E1 ) und setze dμ (E1 , E2 ) = μ(E1 Δ E2 ). Dies ist eine Pseudometrik, d.h. dμ ist symmetrisch und erf¨ ullt die Dreiecks¨ ungleichung. Identifiziert man wie beim Ubergang von L 1 zu L1 zwei fast u alt man einen metrischen Raum, ¨berall u ¨bereinstimmende Mengen, so erh¨ der Σμ genannt werde. Daß dieser Raum vollst¨andig ist, sieht man am einfachsten so. Da dμ (E1 , E2 ) = 1E1 − 1E2 L1 gilt, kann man Σμ mit der Menge der Indikatorfunktionen identifizieren. Es reicht nun zu u ¨berlegen, daß letztere in L1 (μ) abgeschlossen ist. Gelte also 1En − f L1 → 0. Dann konvergiert eine Teilfolge von (1En ) fast u ¨berall gegen f ; daher nimmt die Grenzfunktion fast u ¨ berall nur die Werte 0 und 1 an und ist selbst eine Indikatorfunktion. Nun k¨onnen wir ein wichtiges Lemma zeigen. Lemma VIII.6.7 Sei μ ein endliches Maß, und sei (h n ) eine Folge in L1 (μ), so daß f¨ ur alle E ∈ Σ der Grenzwert limn→∞ E hn dμ existiert. Dann ist die Menge {hn : n ∈ N} gleichgradig integrierbar. Beweis. Sei ε > 0. Wir betrachten die Mengen Hk = E: (hn − hm ) dμ ≤ ε ∀m, n ≥ k ⊂ Σμ , E
k = 1, 2, . . . .
444
VIII.
Lokalkonvexe R¨ aume
∞ Nach Voraussetzung u ¨ ber die Folge (hn ) ist k=1 Hk = Σμ . Ferner sind die Hk abgeschlossen; dazu reicht es einzusehen, daß f¨ ur festes h die Abbildung E → E h dμ auf Σμ stetig ist, und das folgt aus der Absch¨atzung ≤ h dμ − h dμ |h| dμ E1
E2
E1 ΔE2
und Beispiel (a) oben. Nach dem Baireschen Kategoriensatz (Korollar IV.1.4) enth¨alt ein Hp einen inneren Punkt; es existieren also ein E0 ∈ Hp und ein δ1 > 0 mit E ∈ Σ, dμ (E , E0 ) < δ1 ⇒ E ∈ Hp . Gelte nun μ(E) < δ1 . Es ist E = (E0 ∪ E) \ (E0 \ E) und dμ (E0 ∪ E, E0 ) = μ((E0 ∪ E) Δ E0 ) ≤ μ(E) < δ1 sowie dμ (E0 \ E, E0 ) = μ((E0 \ E) Δ E0 ) ≤ μ(E) < δ1 , da die symmetrischen Differenzen jeweils Teilmengen von E sind. Daher liegen E1 = E0 ∪ E und E2 = E0 \ E in Hp . Das bedeutet nach Definition von Hp (hn − hm ) dμ ≤ ε f¨ ur n, m ≥ p. Ej
Speziell folgt f¨ ur n ≥ p (hn − hp ) dμ = E
(hn − hp ) dμ −
E1
E2
(hn − hp ) dμ ≤ 2ε.
Weil die Menge {hp } gleichgradig integrierbar ist, existiert ein δ2 > 0 mit hp dμ < ε E
f¨ ur μ(E) < δ2 . Also hat man f¨ ur μ(E) < min{δ1 , δ2 } hn dμ < 3ε E
f¨ ur n ≥ p, und da {h1 , . . . , hp−1 } gleichgradig integrierbar ist, folgt die Behauptung des Lemmas. 2 Die Voraussetzung von Lemma VIII.6.7 ist insbesondere erf¨ ullt, wenn (hn ) schwach konvergiert bzw. allgemeiner, wenn (h ) eine schwache Caun chyfolge ist, denn h → E h dμ ist ein stetiges lineares Funktional auf L1 (μ).
VIII.6
445
Schwache Kompaktheit
(Dieser Begriff wurde in Aufgabe IV.8.11 eingef¨ uhrt; zur Erinnerung: Eine Folge (xn ) in einem Banachraum heißt schwache Cauchyfolge, wenn f¨ ur jedes Funktional x ∈ X die skalare Folge (x (xn )) eine skalare Cauchyfolge ist oder, was auf dasselbe hinausl¨ auft, konvergiert.) Das soll explizit festgehalten werden. Korollar VIII.6.8 Sei μ ein endliches Maß; dann ist jede schwache Cauchyfolge und insbesondere jede schwach konvergente Folge in L1 (μ) gleichgradig integrierbar. Die Aussage gilt sogar in jedem Maßraum. Nun zur schwachen Kompaktheit in L1 (μ). Satz VIII.6.9 Sei μ ein endliches Maß, und sei H eine beschr¨ ankte Teilmenge von L1 (μ). Genau dann ist H relativ schwach kompakt, wenn H gleichgradig integrierbar ist. Beweis. Sei zuerst H relativ schwach kompakt. W¨are H nicht gleichgradig integrierbar, so g¨ abe es Folgen (hn ) in H und (En ) in Σ sowie ein ε0 > 0 derart, daß μ(En ) < 1/n, aber | En hn dμ| ≥ ε0 f¨ ur alle n ist. Dann ist auch keine Teilfolge von (hn ) gleichgradig integrierbar. Aber (hn ) besitzt eine schwach konvergente Teilfolge nach dem Satz von Eberlein-Shmulyan, und man erh¨alt einen Widerspruch zu Korollar VIII.6.8. Umgekehrt sei H als gleichgradig integrierbar vorausgesetzt. Wir fassen wie im Beweis des Satzes von Eberlein-Shmulyan H als Teilmenge von ˜ von H. L1 (μ) auf und betrachten dort den σ(L1 (μ) , L1 (μ) )-Abschluß H ∗ ˜ ˜ Da H beschr¨ankt ist, ist H schwach kompakt. Sei Φ ∈ H; wir werden ˜ ⊂ L1 (μ) und damit die relative schwache Φ ∈ L1 (μ) zeigen, so daß H Kompaktheit von H folgt. Setze ν(E) = Φ(1E ) f¨ ur E ∈ Σ. Da Φ linear ist, ist ν eine additive Mengenfunktion. Des weiteren existiert ein Netz (fα ) in H mit fα → Φ bzgl. σ(L1 (μ) , L1 (μ) ). Zu ε > 0 w¨ ahle gem¨aß der gleichgradigen Integrierbarkeit ein δ > 0 mit sup | f dμ| < ε f¨ ur μ(E) < δ. Wegen α E α ν(E) = limα E fα dμ folgt die Implikation μ(E) < δ
⇒
|ν(E)| < ε.
(VIII.12)
Daraus k¨onnen wir jetzt die σ-Additivit¨ at der Mengenfunktion ν herleiten. Es ist daf¨ u r nur zu zeigen, daß f¨ u r eine absteigende Folge E1 ⊃ E2 ⊃ . . . ∞ in Σ mit n=1 En = ∅ die Konvergenz ν(En ) → 0 folgt. Wegen (VIII.12) ist daf¨ ur μ(En ) → 0 hinreichend, aber f¨ ur endliche Maße μ folgt das aus En ! ∅. (Hier haben wir einige maßtheoretische Grundtatsachen benutzt.) Also ist ν ein signiertes (oder komplexes) Maß, und es ist klar, daß ν bzgl. μ absolutstetig ist: ν " μ. Nach dem Satz von Radon-Nikod´ ym
446
VIII.
Lokalkonvexe R¨ aume
(Satz A.4.6) existiert eine Dichte h ∈ L1 (μ), d.h. h dμ = ν(E) = Φ(1E ) ∀E ∈ Σ.
E
Daher gilt Ω hg dμ = Φ(g) f¨ ur alle Treppenfunktionen g, und da die Treppenfunktionen dicht in L∞ liegen und Φ norm-stetig ist, gilt dies sogar f¨ ur alle g ∈ L∞ (μ). Deshalb stimmt Φ mit dem Auswertungsfunktional bei h u 2 ¨berein und liegt in L1 (μ). Die Endlichkeit von μ ist im letzten Satz wesentlich. Ohne Beweis sei bemerkt, daß bei unendlichen Maßen zus¨ atzlich zur Beschr¨anktheit und gleichgradigen Integrierbarkeit die Bedingung ∀ε > 0 ∃E ∈ Σ, μ(E) < ∞: sup |h| dμ ≤ ε h∈H
Ω\E
zur Charakterisierung der relativen schwachen Kompaktheit ben¨otigt wird. Eine Konsequenz von Satz VIII.6.9 ist die schwache Folgenvollst¨andigkeit von L1 (μ); ein Banachraum heißt schwach folgenvollst¨ andig, wenn jede schwache Cauchyfolge schwach konvergiert. Um diesen Begriff zu analysieren, sei eine schwache Cauchyfolge (xn ) in X vorgelegt. Dann ist Φ(xn ) : X → K,
Φ(xn ) (x ) = lim x (xn ) n→∞
eine wohldefinierte lineare Abbildung, die nach Korollar IV.2.5 stetig ist: Φ(xn ) ∈ X . Daher ist X genau dann schwach folgenvollst¨andig, wenn all diese Φ(xn ) Auswertungsfunktionale sind. Damit ist klar, daß reflexive R¨aume schwach folgenvollst¨ andig sind. Satz VIII.6.10 L1 (μ) ist schwach folgenvollst¨andig. Beweis. Ist μ ein endliches Maß und (hn ) ⊂ L1 (μ) eine schwache Cauchyfolge, so ist (hn ) gleichgradig integrierbar (Korollar VIII.6.8) und beschr¨ankt (Aufgabe IV.8.11). Im Beweis von Satz VIII.6.9 wurde gezeigt, daß das zugeh¨orige Funktional Φ(hn ) in L1 (μ) ⊂ L1 (μ) liegt. Ist μ σ-endlich, kann man Ω in disjunkte Teilmengen Ω1 , Ω2 , . . . endlichen Maßes zerlegen und dann die Folgen (hn |Ωk )n betrachten. Dies enth¨alt bereits den allgemeinen Fall, denn bei gegebener Folge (hn ) ⊂ L1 (μ) ist der Gesamttr¨ ager“ der hn σ-endlich: Ωn,k = {ω: k ≤ ” |hn (ω)| < k + 1}, n ≥ 1, k ≥ 0, bildet eine Zerlegung von Ω = n {ω: hn (ω) = 0} in abz¨ ahlbar viele paarweise disjunkte Mengen endlichen Maßes, und außerhalb von Ω verschwinden alle hn . 2 In reflexiven R¨ aumen ist jede beschr¨ ankte Menge relativ schwach kompakt; am anderen Ende der Skala steht der Folgenraum 1 . Dort stimmen n¨amlich schwache Kompaktheit und Kompaktheit u ¨berein, wie aus
VIII.6
447
Schwache Kompaktheit
dem n¨achsten Satz, dem Schurschen Lemma, und dem Satz von EberleinShmulyan folgt. Satz VIII.6.11 Jede schwach konvergente Folge in 1 ist konvergent. Beweis. Ohne Einschr¨ ankung gelte xn → 0 schwach in 1 . Wir schreiben 1 das Element xn ∈ , das ja eine Folge von Zahlen ist, in der Form xn = (xn (m))m . Ebenso werden Elemente des Dualraums ∞ als y = (y(m))m notiert, und y wirkt auf xn gem¨ aß y, xn = m y(m)xn (m). Sei nun ε > 0. Setze , Fk = {y ∈ B ∞ : |y, xn | ≤ ε}, k = 1, 2, . . . . n≥k
Da (xn ) schwach gegen 0 konvergiert, gilt B ∞ = ∞ k=1 Fk . Wir versehen B ∞ mit der schwach∗ -Topologie σ(∞ , 1 ); nach Aufgabe VIII.8.17 ist diese Topologie auf B ∞ metrisierbar und stimmt dort mit der Topologie der koordinatenweisen Konvergenz u ¨berein. So wird B ∞ zu einem vollst¨andigen metrischen (da kompakten) Raum. Da die xn als schwach∗-stetige Funktionale auf ∞ wirken, sind die Fk schwach∗ abgeschlossen. Nach dem Baireschen Kategoriensatz besitzt eine dieser Mengen, sagen wir Fp , einen relativ zu B ∞ inneren Punkt y∗ ; nach der obigen Diskussion existieren also δ > 0 und r ∈ N mit {y ∈ B ∞ : |y(m) − y∗ (m)| ≤ δ f¨ ur m = 1, . . . , r} ⊂ Fp .
(VIII.13)
Weiter impliziert die schwache Konvergenz limn→∞ xn (m) = 0 f¨ ur alle m; daher existiert eine nat¨ urliche Zahl N mit r
|xn (m)| ≤ ε f¨ ur n ≥ N.
m=1
Wir zeigen jetzt xn 1 ≤ 3ε f¨ ur n ≥ max{p, N } und damit xn 1 → 0. Zu n ≥ max{p, N } definiere yn ∈ B ∞ durch yn (m) = y∗ (m) f¨ ur m ≤ r,
yn (m) =
|xn (m)| f¨ ur m > r xn (m)
(mit der Konvention 0/0 = 0). Aus (VIII.13) ersieht man, daß yn ∈ Fp gilt, also wegen n ≥ p r |yn , xn | = y∗ (m)xn (m) + |xn (m)| ≤ ε. m=1
m>r
Es folgt m>r
r r |xn (m)| ≤ ε + y∗ (m)xn (m) ≤ ε + |xn (m)| m=1
m=1
448
VIII.
sowie xn 1 ≤ ε + 2
r
Lokalkonvexe R¨ aume
|xn (m)| ≤ 3ε,
m=1
letzteres wegen n ≥ N . Das war zu zeigen.
2
Das in diesem Satz ausgesprochene Ph¨ anomen nennt man die SchurEigenschaft von 1 . Die Schur-Eigenschaft darf nicht dahingehend mißverstanden werden, daß die Normtopologie und die schwache Topologie auf 1 u ur die Beschrei¨bereinstimmten; das ist nicht der Fall. Nur sind Folgen f¨ bung der schwachen Topologie vollkommen unangemessen.
VIII.7
Schwach kompakte Operatoren
Wir untersuchen nun die zu den schwach kompakten Mengen zugeh¨orige Operatorklasse; X, Y , etc. bezeichnen stets Banachr¨aume. Definition VIII.7.1 Ein linearer Operator zwischen Banachr¨aumen, T ∈ L(X, Y ), heißt schwach kompakt, wenn T (BX ) relativ schwach kompakt ist. Die Menge aller schwach kompakten Operatoren von X nach Y wird mit W (X, Y ) bezeichnet. Nach dem Satz von Eberlein-Shmulyan (Theorem VIII.6.1) ist ein Operator T : X → Y genau dann schwach kompakt, wenn f¨ ur jede beschr¨ankte Folge (xn ) die Bildfolge (T xn ) eine schwach konvergente Teilfolge enth¨alt. Beispiele. (a) Offensichtlich ist jeder stetige lineare Operator T : X → Y schwach kompakt, wenn Y reflexiv ist, denn in reflexiven R¨aumen sind beschr¨ankte Mengen relativ schwach kompakt, oder wenn X reflexiv ist. Beachte f¨ ur letzteres, daß T schwach-schwach stetig ist (Aufgabe VIII.8.10) und deshalb die schwach kompakte Menge BX auf eine schwach kompakte Menge abbildet. Der identische Operator Id: X → X ist genau dann schwach kompakt, wenn X reflexiv ist. (b) Jeder kompakte Operator ist schwach kompakt. (c) Der Integrationsoperator s Tp : L1 [0, 1] → Lp[0, 1], (Tp f )(s) = f (t) dt 0
ist kompakt f¨ ur 1 ≤ p < ∞ [Beweis?]. Als Operator nach C[0, 1] oder L∞ [0, 1] ist er jedoch nicht schwach kompakt: F¨ ur hn = n1[0,1/n] besitzt die Bildfolge keine schwach konvergente Teilfolge. (d) Die kanonische Inklusion von L∞ [0, 1] nach L1 [0, 1] ist schwach kompakt (das sieht man am einfachsten mit Hilfe des n¨achsten Satzes), ohne kompakt zu sein.
VIII.7
449
Schwach kompakte Operatoren
(e) Es ist nicht ganz einfach, schwach kompakte Operatoren von L1 nach L1 anzugeben, die nicht kompakt sind; warum das so ist, erkl¨art Satz VIII.7.12. Hier ist ein solches Beispiel. Sei k: [0, 1] × [0, 1] → R beschr¨ankt und meßbar. Dann ist der Integraloperator 1 Tk : L1 [0, 1] → L1 [0, 1], (Tk f )(s) = k(s, t)f (t) dt 0
1
wohldefiniert und stetig mit Tk ≤ supt 0 |k(s, t)| ds. Der Operator ist sogar schwach kompakt; das folgt aus der Absch¨atzung (λ ist das Lebesguemaß) |Tk f (s)| ds ≤ λ(E) sup |k(s, t)| f L1 , s,t
E
die zeigt, daß Tk (BL1 ) gleichgradig integrierbar und deshalb (Satz VIII.6.9) relativ schwach kompakt ist. Wir betrachten nun den speziellen Kern ∞ 2 −1 l
k(s, t) =
1((2j+1)2−(l+1) ,(2j+2)2−(l+1) ] (s)1(2−(l+1) ,2−l ] (t);
l=0 j=0
k ist die Indikatorfunktion einer Teilmenge von [0, 1] × [0, 1] [Skizze?]. Der entsprechende Integraloperator Tk ist also schwach kompakt, aber nicht kompakt; f¨ ur die Funktionen fn = 2n+1 1(2−(n+1) ,2−n ] , n = 0, 1, 2, . . . , gilt n¨amlich fn L1 = 1, aber Tk fn −Tk fm L1 = 1/2 f¨ ur n = m, so daß (Tk fn ) keine konvergente Teilfolge besitzt. Weitere Beispiele erh¨ alt man aus dem folgenden einfachen Satz, der genauso wie die entsprechenden Aussagen u ¨ber kompakte Operatoren (siehe Satz II.3.2) gezeigt wird. Satz VIII.7.2 Seien V, X, Y, Z Banachr¨ aume. (a) W (X, Y ) ist ein Untervektorraum von L(X, Y ). (b) Sind R ∈ L(V, X), S ∈ W (X, Y ) und T ∈ L(Y, Z), so ist T SR ∈ W (V, Z). Um jetzt die schwache Kompaktheit der Inklusion j∞,1 von L∞ [0, 1] nach L1 [0, 1] zu begr¨ unden, schreiben wir j∞,1 als Produkt der Inklusionen j∞,2 : L∞ [0, 1] → L2 [0, 1] und j2,1 : L2 [0, 1] → L1 [0, 1]: j∞,1 = j2,1 j∞,2 . Da L2 reflexiv ist, sind beide Faktoren schwach kompakt und erst recht das Produkt. Das folgende Kriterium ist sehr n¨ utzlich. Satz VIII.7.3 Seien X und Y Banachr¨aume. F¨ ur T ∈ L(X, Y ) sind ¨ aquivalent:
450
VIII.
Lokalkonvexe R¨ aume
(i) T ist schwach kompakt. (ii) Der adjungierte Operator T : Y → X ist σ(Y , Y )-σ(X , X )stetig. (iii) T (X ) ⊂ Y . Beweis. (ii) ⇔ (iii): Beide Bedingungen bedeuten, daß y → T x , y = x , T y schwach∗ -stetig ist. (i) ⇒ (iii): Nach dem Satz von Goldstine ist der σ(X , X )-Abschluß von BX gleich BX , und da T schwach∗-schwach∗ stetig ist (vgl. Aufgabe VIII.8.11) folgt T (BX ) ⊂ T (BX )
σ(Y ,Y )
σ(Y ,Y )
= T (BX )
.
Aber T (BX ) ist nach Voraussetzung relativ schwach kompakt, daher T (BX )
σ(Y ,Y )
= T (BX )
σ(Y,Y )
⊂ Y.
Es folgt T (X ) ⊂ Y . (iii) ⇒ (i): Der Operator T ist schwach∗ -schwach∗ stetig, daher und wegen des Satzes von Alaoglu ist T (BX ) σ(Y , Y )-kompakt. Diese Menge liegt nach Voraussetzung in Y und ist folglich schwach kompakt. Wegen T (BX ) ⊂ T (BX ) (vgl. Lemma III.4.3) folgt (i). 2 Korollar VIII.7.4 (Satz von Gantmacher) Ein Operator T zwischen Banachr¨ aumen ist genau dann schwach kompakt, wenn es sein Adjungierter T ist. Beweis. Wenn T : X → Y schwach kompakt ist, ist nach Teil (ii) des letzten Satzes in Verbindung mit dem Satz von Alaoglu T (BY ) schwach kompakt. Ist umgekehrt T schwach kompakt, so nach dem gerade Bewiesenen auch T und deshalb T , denn Y ist norm- und schwach abgeschlossen in Y . 2 Korollar VIII.7.5 Seien X und Y Banachr¨ aume. Dann ist W (X, Y ) abgeschlossen in L(X, Y ) und daher selbst ein Banachraum. Beweis. Seien Tn ∈ W (X, Y ), T ∈ L(X, Y ) mit Tn → T . Dann gilt auch Tn → T und insbesondere Tn x → T x f¨ ur alle x ∈ X . Nach Satz VIII.7.3(iii) liegen die Tn x in Y , also gilt auch T x ∈ Y . Eine erneute Anwendung von Satz VIII.7.3 liefert T ∈ W (X, Y ). 2 Es ist leicht zu sehen, daß ein kompakter Operator T : X → Y schwache Nullfolgen auf Norm-Nullfolgen abbildet (Aufgabe III.6.16). 1940 zeigten Dunford und Pettis, daß f¨ ur X = L1 (μ) auch schwach kompakte Operatoren diese Eigenschaft haben. Das soll als n¨ achstes diskutiert werden. Wir ben¨otigen dazu eine Definition.
VIII.7
Schwach kompakte Operatoren
451
Definition VIII.7.6 (a) Ein Operator T : X → Y heißt vollstetig, falls T schwache Nullfolgen in Norm-Nullfolgen u uhrt. Die Menge aller vollstetigen ¨ berf¨ Operatoren von X nach Y wird mit V (X, Y ) bezeichnet. (b) Ein Banachraum X hat die Dunford-Pettis-Eigenschaft, wenn jeder schwach kompakte Operator auf X mit Werten in einem beliebigen Banachraum Y vollstetig ist, mit anderen Worten, wenn W (X, Y ) ⊂ V (X, Y ) f¨ ur alle Banachr¨aume Y gilt. Offensichtlich haben endlichdimensionale R¨aume die Dunford-Pettis-Eigenschaft, und nach Satz VIII.6.11 hat auch 1 die Dunford-Pettis-Eigenschaft. Andererseits ist der identische Operator auf unendlichdimensionalen reflexiven R¨aumen nicht vollstetig (da er sonst kompakt w¨are), aber schwach kompakt, so daß diese R¨ aume nicht die Dunford-Pettis-Eigenschaft haben. Unser n¨achstes Ziel wird es sein, die Dunford-Pettis-Eigenschaft f¨ ur C(K)- und L1 (μ)-R¨ aume zu zeigen. Wir beginnen mit einem Lemma. Lemma VIII.7.7 Die folgenden Aussagen u ¨ber einen Banachraum X sind aquivalent: ¨ (i) X hat die Dunford-Pettis-Eigenschaft. (ii) Jeder schwach kompakte Operator auf X mit Werten in einem beliebigen Banachraum Y bildet schwache Cauchyfolgen auf normkonvergente Folgen ab. (iii) Aus xn → 0 bzgl. σ(X, X ) und xn → 0 bzgl. σ(X , X ) folgt xn , xn → 0. (iv) Jeder schwach kompakte Operator auf X mit Werten in einem beliebigen Banachraum Y bildet schwach kompakte Mengen auf normkompakte Mengen ab. Beweis. (i) ⇒ (ii): Dem Beweis dieser Richtung schicken wir eine elementare Vor¨ uberlegung voraus: Eine Folge (zn ) in einem normierten Raum ist genau dann eine Cauchyfolge, wenn f¨ ur jede Teilfolge die Differenzfolge (znk+1 − znk )k eine Nullfolge ist. [Das ist nur eine geschickte Umschreibung der Definition einer Cauchyfolge.] Indem man zu (z , zn ) u ¨ bergeht, erh¨alt man eine analoge Aussage f¨ ur schwache Cauchyfolgen. Nun gelte (i), sei T ∈ W (X, Y ), und sei (xn ) eine schwache Cauchyfolge. Also gilt f¨ ur alle Teilfolgen, daß xnk+1 − xnk → 0 schwach. Weil T vollstetig ist, hat man auch, daß T xnk+1 − T xnk → 0 bzgl. der Norm. Also ist (T xn ) eine Cauchyfolge im Banachraum Y und deshalb konvergent. (ii) ⇒ (iv) folgt aus dem Satz von Eberlein-Shmulyan. (iv) ⇒ (i) ist klar. (i) ⇒ (iii): (xn ) und (xn ) seien schwache Nullfolgen in X bzw. X . Definiere T : X → c0 , T x = (xn , x);
452
VIII.
Lokalkonvexe R¨ aume
da (xn ) eine schwache und daher auch eine schwach∗-Nullfolge ist, bildet T wirklich nach c0 ab. Wir behaupten, daß T schwach kompakt ist. Der adjungierte bzw. biadjungierte Operator hat n¨amlich die Form T : 1 → X , T (ξn ) = ξn xn n
bzw. T : X → ∞ ,
T x = (xn , x ),
wie leicht nachzurechnen ist. Aber weil (xn ) nicht nur schwach∗, sondern schwach gegen 0 konvergiert, gilt sogar T (X ) ⊂ c0 , und T ist nach Satz VIII.7.3 schwach kompakt. Wegen (i) gilt daher T xn → 0, und (iii) folgt aus |xn , xn | ≤ sup |xk , xn | = T xn . k
(iii) ⇒ (i): Nehmen wir an, daß (i) falsch ist. Dann existieren ein Banachraum Y , T ∈ W (X, Y ), ε > 0 sowie (xn ) ⊂ X mit xn → 0 schwach, aber T xn ≥ ε f¨ ur alle n. W¨ ahle Funktionale yn ∈ BY mit T xn = ¨ yn , T xn = T yn , xn . Nach eventuellem Ubergang zu einer Teilfolge darf nach Korollar VIII.7.4 angenommen werden, daß (T yn ) schwach konvergiert, etwa gegen x . Das liefert f¨ ur hinreichend große n |T yn − x , xn | ≥ |T yn , xn | − |x , xn | ≥ ε −
ε ε = 2 2 2
im Widerspruch zu (iii). Aus Teil (iii) des Lemmas folgt sofort:
Korollar VIII.7.8 Wenn X die Dunford-Pettis-Eigenschaft hat, hat auch X die Dunford-Pettis-Eigenschaft. Die Umkehrung gilt nicht, siehe Aufgabe VIII.8.56. Wir diskutieren jetzt die klassischen Funktionenr¨aume C(K) and L1 (μ). Satz VIII.7.9 Sei K ein kompakter Hausdorffraum. Dann hat C(K) die Dunford-Pettis-Eigenschaft. Zum Beweis ben¨ otigen wir ein Lemma. Lemma VIII.7.10 Seien μn ∈ M (K) = C(K) , und es gelte μn → 0 bzgl. σ(M (K), M (K) ). Dann existiert ein positives Maß μ mit ∀ε > 0 ∃δ > 0 ∀E:
μ(E) ≤ δ ⇒ sup |μn |(E) ≤ ε. n
VIII.7
453
Schwach kompakte Operatoren
Beweis. Betrachte das endliche Maß μ = n 2−n|μn |. Hier bezeichnet |μn | die Variation von μn ; μ ist endlich, da die schwach konvergente Folge (μn ) beschr¨ankt ist. Offensichtlich gilt μn " μ f¨ ur alle n; also existieren nach dem Satz von Radon-Nikod´ ym Dichten hn ∈ L1 (μ) mit μn (E) = h dμ E n f¨ ur alle Borelmengen E. Beachte, daß dann auch |μn |(E) = E |hn | dμ gilt. Wenn wir via h → h dμ den Raum L1 (μ) als abgeschlossenen Unterraum von M (K) ansehen, besagt die Voraussetzung u ¨ ber (μn ), daß (hn ) eine schwache Nullfolge in L1 (μ) ist. Nach Korollar VIII.6.8 ist (hn ) gleichgradig integrierbar, und Aufgabe VIII.8.47 liefert die Behauptung des Lemmas. 2 Kommen wir nun zum Beweis von Satz VIII.7.9. Wir zeigen Bedingung (iii) aus Lemma VIII.7.7. Gelte also fn → 0 bzgl. σ(C(K), C(K) ) und μn → 0 bzgl. σ(M (K), M (K) ). W¨ ahle μ gem¨aß Lemma VIII.7.10. Da (fn ) insbesondere punktweise konvergiert, existiert nach dem Satz von Egorov aus der Maßtheorie (siehe z.B. Satz IV.6.7 in Werner [2009]) zu δ > 0 eine Borelmenge E mit μ(K \ E) < δ so, daß (fn ) auf E gleichm¨aßig konvergiert. Im weiteren sei ohne Einschr¨ ankung fn ≤ 1 und μn ≤ 1 angenommen. Sei ε > 0 vorgelegt. W¨ ahle δ wie in Lemma VIII.7.10 und dazu E wie im Satz von Egorov. Dann folgt |fn , μn | = fn dμn K ≤ |fn | d|μn | + |fn | d|μn | E
K\E
≤ sup |fn (t)| · |μn |(E) + sup |fn (t)| · |μn |(K \ E) t∈E
≤ ε · 1 + 1 · ε = 2ε
t∈E /
f¨ ur hinreichend große n, denn (fn ) konvergiert auf E gleichm¨aßig gegen 0 und |μn |(K \ E) ≤ ε, weil μ(K \ E) ≤ δ. 2 Korollar VIII.7.11 Ist μ σ-endlich, so haben der Raum L1 (μ) und sein Dualraum L∞ (μ) die Dunford-Pettis-Eigenschaft. Beweis. Es reicht nach Korollar VIII.7.8 zu zeigen, daß L∞ (μ) die DunfordPettis-Eigenschaft besitzt. In Korollar IX.3.5 wird aber gezeigt, daß L∞(μ) zu einem Raum C(K) isometrisch isomorph ist, und die Dunford-PettisEigenschaft folgt aus Satz VIII.7.9. (Strenggenommen ist dieses Argument nur im Fall komplexer Skalare perfekt; aber der Isomorphismus von L∞(μ) auf C(K) in Korollar IX.3.5 bildet reellwertige Funktionen auf reellwertige Funktionen ab, und daher ist auch der reelle Fall abgedeckt.) 2 Korollar VIII.7.11 gilt sogar f¨ ur jeden Maßraum, da man zeigen kann, daß zu jedem Maßraum (Ω, Σ, μ) ein Maßraum (Ω , Σ , μ ) mit L1 (μ) ∼ = L1 (μ ) und (L1 (μ )) ∼ = L∞ (μ ) existiert.
454
VIII.
Lokalkonvexe R¨ aume
Auf R¨aumen mit der Dunford-Pettis-Eigenschaft sind die schwach kompakten Operatoren recht nah an den kompakten Operatoren. Satz VIII.7.12 Hat X die Dunford-Pettis-Eigenschaft und sind S, T : X → X schwach kompakt, so ist ST kompakt. Insbesondere ist das Quadrat eines schwach kompakten Operators von X nach X kompakt. Beweis. Sei (xn ) eine beschr¨ ankte Folge in X. Dann hat (T xn ) eine schwach konvergente Teilfolge (T xnk ), weil T schwach kompakt ist. Da S nach Voraussetzung vollstetig ist, ist (ST xnk ) konvergent. 2 Aus diesem Satz folgt u ur schwach kompakte Operatoren ¨brigens, daß f¨ T : C(K) → C(K) bzw. T : L1 (μ) → L1 (μ) die Rieszsche Eigenwerttheorie gilt; diese gilt n¨amlich nicht nur f¨ ur kompakte Operatoren, sondern auch, wenn nur eine Potenz kompakt ist (vgl. Pietsch [1987], S. 147). Es ergibt sich noch eine interessante Anwendung auf die Unterraumstruktur von C(K) und L1 (μ). Es sei an den Begriff des komplementierten Unterraums aus Definition IV.6.4 erinnert. Korollar VIII.7.13 Sei X ein Banachraum mit der Dunford-Pettis-Eigenschaft, und sei U ein reflexiver komplementierter Unterraum. Dann ist U endlichdimensional. Beweis. Sei P : X → X eine stetige Projektion von X auf U . Weil U reflexiv ist, ist P schwach kompakt. Nach Satz VIII.7.12 ist P = P 2 sogar kompakt. Weil P |U der identische Operator ist, muß U endlichdimensional sein. 2 Nach Aufgabe III.6.23 ist jeder separable reflexive Banachraum isometrisch zu einem Unterraum von ∞ (sogar von C[0, 1]), und ∞ hat die Dunford-Pettis-Eigenschaft (Korollar VIII.7.11); ferner wurde in Aufgabe II.5.14 gezeigt, daß L1 einen zu 2 isometrischen Unterraum besitzt. Wegen des letzten Korollars kann keiner dieser reflexiven Unterr¨aume komplementiert sein. Es folgt noch eine u ¨ berraschende Aussage u ¨ber Teilr¨aume von Lp [0, 1]. Satz VIII.7.14 F¨ ur 1 ≤ p < ∞ gibt es keinen unendlichdimensionalen abgeschlossenen Unterraum von Lp [0, 1], der nur aus (wesentlich) beschr¨ ankten Funktionen besteht. Beweis. Sei zun¨achst p > 1. Sei H ein abgeschlossener Unterraum von Lp [0, 1], der gleichzeitig Teilraum von L∞ [0, 1] ist. Da die kanonische In−1 klusion j∞,p : L∞ [0, 1] → Lp [0, 1] stetig ist, ist H = j∞,p (H) abgeschlossen ∞ in L [0, 1]. Die Identit¨ at von (H, . ∞ ) nach (H, . p ) ist also eine stetige Bijektion zwischen Banachr¨ aumen und folglich ein Isomorphismus. Deshalb ist H ein reflexiver Unterraum von L∞ [0, 1], und der schwach kompakte
VIII.8
455
Aufgaben
Operator j∞,p bildet die schwach kompakte Menge BH auf eine kompakte Menge ab, denn L∞ [0, 1] hat die Dunford-Pettis-Eigenschaft. Daher ist H endlichdimensional. Im Fall p = 1 betrachte die Inklusionen (H, . ∞ ) → (H, . 2 ) → (H, . 1 ), um auch hier auf die Reflexivit¨ at von H zu schließen. 2
VIII.8
Aufgaben
Aufgabe VIII.8.1 Sei X ein topologischer Vektorraum. (a) Ist O ⊂ X offen, so auch die konvexe H¨ ulle von O. (b) Zeige ohne Benutzung von Netzen: Ist C ⊂ X konvex, so auch der Abschluß C. Aufgabe VIII.8.2 Sei X ein normierter Raum. Die Einheitssph¨ are SX liegt dann σ(X, X )-dicht in der Einheitskugel BX , falls X unendlichdimensional ist. Aufgabe VIII.8.3 Ein Beispiel f¨ ur einen nicht lokalkonvexen topologischen Vektorraum: Betrachte zu 0 < p < 1 den Vektorraum Lp [0, 1], der wie u ¨blich definiert ist. Setze 1
|f (t) − g(t)|p dt.
d(f, g) := 0
(a) d definiert eine Metrik auf Lp [0, 1]. (b) Mit dieser Metrik versehen wird Lp [0, 1] zu einem topologischen Vektorraum. (c) Sei V ⊂ Lp [0, 1] eine offene konvexe Nullumgebung. Dann ist V = Lp [0, 1]. (Hinweis: W¨ ahle ε > 0 mit {f : d(f, 0) ≤ ε} ⊂ V . Sei f ∈ Lp [0, 1]. Betrachte nun f¨ ur großes n eine Zerlegung von [0, 1] in n Intervalle I1 , . . . , In und die Funktionen gj := nχIj f .) (d) Zeige, daß f → 0 das einzige stetige lineare Funktional auf Lp [0, 1] f¨ ur p < 1 ist. Aufgabe VIII.8.4 Sei X ein Vektorraum und P die Menge aller Halbnormen auf X. (X, τP ) ist dann ein lokalkonvexer Raum, und es gelten: (a) (X, τP ) ist ein Hausdorffraum. (b) Alle linearen Abbildungen in einen weiteren lokalkonvexen Raum Y sind stetig. (c) Jeder Unterraum ist abgeschlossen. Aufgabe VIII.8.5 (a) Auf Rn stimmt jede lokalkonvexe Hausdorfftopologie mit der Normtopologie u ¨ berein. (b) Ein endlichdimensionaler Unterraum eines lokalkonvexen Hausdorffraums ist abgeschlossen.
456
VIII.
Lokalkonvexe R¨ aume
Aufgabe VIII.8.6 Sei X ein lokalkonvexer Vektorraum. Eine Teilmenge B ⊂ X heißt beschr¨ ankt, wenn es zu jeder Nullumgebung U ein α > 0 gibt mit B ⊂ αU . (Was sind die in diesem Sinn beschr¨ ankten Teilmengen eines normierten Raums?) Folgende Bedingungen sind dann ¨ aquivalent: (i) B ist beschr¨ ankt. (ii) F¨ ur jede Folge (xn ) in B und jede Nullfolge (αn ) in K ist (αn xn ) eine Nullfolge in X. (Bemerkung: Kolmogorov hat gezeigt, daß die Topologie eines lokalkonvexen Hausdorffraums genau dann von einer einzigen Norm erzeugt werden kann, wenn es eine beschr¨ ankte Nullumgebung gibt (Kolmogorovsches Normierbarkeitskriterium).) Aufgabe VIII.8.7 Betrachte den Schwartzraum S (R). (a) Der Ableitungsoperator Dk : S (R) → S (R), ϕ → ϕ(k) ist stetig. (b) Sei g ∈ S (R). Dann ist der Faltungsoperator Cg : S (R) → S (R),
(Cg ϕ)(x) = (g ∗ ϕ)(x) =
ϕ(y)g(x − y) dy R
stetig. ¨ Aufgabe VIII.8.8 Uberpr¨ ufe die folgenden Funktionale und Operatoren des Schwartzraums S (R) auf Wohldefiniertheit und Stetigkeit: ∞ (a) T (ϕ) = −∞ ϕ(t)ψ(t) dt f¨ ur ψ ∈ L∞ (R). (b) T (ϕ) = ϕ(s) (c) T (ϕ) = ϕ · ψ
f¨ ur s ∈ R. f¨ ur ψ ∈ S (R).
Aufgabe VIII.8.9 Sei K ⊂ R kompakt, und betrachte auf D K (R) die drei Halbnormfamilien • P = {p0 , p1 , p2 , . . .} mit pn (ϕ) = supx∈K |ϕ(n) (x)|, • Q = {q0 , q1 , q2 , . . .} mit qn (ϕ) = • R = {r0 , r1 , r2 , . . .} mit rn (ϕ) =
K
|ϕ(n) (x)| dx,
K
|ϕ(n) (x)|2 dx
1/2
.
Zeige, daß alle drei Familien dieselbe Topologie erzeugen. Aufgabe VIII.8.10 X und Y seien normierte R¨ aume, T : X → Y sei linear. Dann sind ¨ aquivalent: (i) T ist . - . -stetig. (ii) T ist σ(X, X )-σ(Y, Y )-stetig. (Hinweis: Satz von Banach-Steinhaus!) Aufgabe VIII.8.11 X und Y seien normierte R¨ aume, und es sei T ∈ L(Y , X ). Genau dann ist T σ(Y , Y )-σ(X , X)-stetig, wenn S ∈ L(X, Y ) mit S = T existiert. (Tip: Satz VIII.3.6.)
VIII.8
457
Aufgaben
Aufgabe VIII.8.12 X und Y seien normierte R¨ aume, und es sei T ∈ L(X, Y ). Genau dann ist T σ(X, X )- . -stetig, wenn T einen endlichdimensionalen Bildraum hat. Warum widerspricht dieses Resultat nicht Aufgabe III.6.16(b)? (Hinweis: Beweis von Lemma VIII.3.3.) Aufgabe VIII.8.13 Seien X und Y Banachr¨ aume und T ∈ L(X, Y ). Dann sind aquivalent: ¨ (i) T ist kompakt. (ii) T |BY : BY → X ist σ(Y , Y )- . -stetig. Aufgabe VIII.8.14 Verschwinden L2 -Funktionen im Unendlichen? Auf L2 (R) betrachte zu t ∈ R die Operatoren Tt , definiert durch Tt ϕ(s) = ϕ(t+s) fast u ¨ berall. Untersuche, ob limt→∞ Tt existiert (a) in der Operatornormtopologie, (b) in der starken Operatortopologie, (c) in der schwachen Operatortopologie. √ Aufgabe VIII.8.15 Betrachte die durch xn = nen definierte Folge (xn ) in 2 . Zeige, daß 0 im schwachen Abschluß der Menge der xn liegt, aber daß keine Teilfolge von (xn ) schwach gegen 0 konvergiert. Aufgabe VIII.8.16 (Metrisierbarkeit lokalkonvexer Topologien) (a) Die Halbnormfamilie P = {p1 , p2 , . . .} erzeuge die Topologie des lokalkonvexen Hausdorffraums X. Zeige, daß durch d(x, y) =
∞ n=1
2−n
pn (x − y) 1 + pn (x − y)
eine Metrik definiert wird, die dieselbe Topologie erzeugt. (Hinweis: Zeige zun¨ achst a/(1 + a) ≤ b/(1 + b) f¨ ur 0 ≤ a ≤ b.) (b) Ist ein lokalkonvexer Raum metrisierbar, so kann seine Topologie von einer abz¨ ahlbaren Halbnormfamilie erzeugt werden. (Hinweis: Imitiere den Beweis von Satz VIII.1.5 f¨ ur eine abz¨ ahlbare Nullumgebungsbasis.) (c) Eine schwache Topologie σ(X, Y ) ist genau dann metrisierbar, wenn Y eine h¨ ochstens abz¨ ahlbare Vektorraumbasis besitzt. (d) Ist X ein unendlichdimensionaler Banachraum, so ist weder die schwache Topologie auf X noch die schwach∗ -Topologie auf X metrisierbar. (Hinweis: Aufgabe IV.8.2.) Aufgabe VIII.8.17 (a) Sei X ein normierter Raum, und U ⊂ X sei ein dichter Unterraum. Dann stimmt auf beschr¨ ankten Teilmengen von X die σ(X , X)-Topologie mit der σ(X , U )-Topologie u ¨berein. (b) Auf B ∞ stimmt die σ(∞ , 1 )-Topologie mit der Topologie der punktweisen (= koordinatenweisen) Konvergenz u ¨berein.
458
VIII.
Lokalkonvexe R¨ aume
(c) Ist X ein separabler normierter Raum, so ist die schwach∗ -Topologie auf BX metrisierbar. (Hinweis: d(x , y ) = 2−n |(x − y )(xn )| f¨ ur geeignete xn .) (d) Mit Hilfe von (c) und dem Satz von Alaoglu l¨ ose erneut Aufgabe III.6.18. Aufgabe VIII.8.18 Sei X ein separabler Banachraum, und sei A ⊂ X eine schwach∗ -kompakte Teilmenge. Dann ist (A, σ(X , X)) (linear-) hom¨ oomorph zu einer norm-kompakten Teilmenge eines Hilbertraums. Anleitung: Sei (xn ) ⊂ SX ∞ −n eine dichte Folge; setze T : 2 → X, (an ) → 2 a x . Zeige, daß T komn n n=1 pakt ist, und benutze Aufgabe VIII.8.13, um zu schließen, daß (A, σ(X , X)) und (T (A), . 2 ) hom¨ oomorph sind. Aufgabe VIII.8.19 (a) C[0, 1] ist σ(L∞ [0, 1], L1 [0, 1])-dicht in L∞ [0, 1]. (b) L1 [0, 1] ist σ(M [0, 1], C[0, 1])-dicht in M [0, 1]. (Hier ist f ∈ L1 [0, 1] mit f dλ ∈ M [0, 1] zu identifizieren.) Aufgabe VIII.8.20 (a) (X, Y ) sei ein duales Paar, und es sei A ⊂ X. Dann gilt Aooo = Ao . (b) X sei normiert; betrachte das duale Paar (X, X ). Dann gelten BXo = BX und BXo = BX . F¨ ur jeden Unterraum U von X gilt U o = U ⊥ = {x : x |U = 0}. Aufgabe VIII.8.21 Sei X ein reflexiver Banachraum. Dann ist BL(X) kompakt in der schwachen Operatortopologie. (Tip: Versuche den Beweis des Satzes von Alaoglu zu imitieren!) Aufgabe VIII.8.22 (Satz von Mackey-Arens) Sei (E, F ) ein duales Paar. Eine lokalkonvexe Topologie τ auf E heißt mit der Dualit¨ at dieses dualen Paares vertr¨ aglich, falls, nach kanonischer Identifizierung, (Eτ ) = F gilt. Die von den Halbnormen pK (x) = supy∈K |x, y|, wo K ⊂ F σ(F, E)-kompakt und konvex ist, induzierte lokalkonvexe Topologie auf E wird Mackey-Topologie genannt; Bezeichnung μ(E, F ). Ziel der Aufgabe ist der Satz von Mackey-Arens: • Eine lokalkonvexe Topologie τ auf E ist genau dann mit der Dualit¨ at von (E, F ) vertr¨ aglich, wenn σ(E, F ) ⊂ τ ⊂ μ(E, F ) gilt. (a) U := {B o : B ⊂ F konvex und σ(F, E)-kompakt} bildet eine μ(E, F )Nullumgebungsbasis. (b) Sei : E → K linear und μ(E, F )-stetig. Dann existiert eine absolutkonvexe und σ(F, E)-kompakte Menge K ⊂ F mit |(x)| ≤ sup |x, y|
∀x ∈ E.
y∈K
(c) Mit den Bezeichnungen von (b) gilt ∈ K bei kanonischer Inklusion F ⊂ E ∗ := {ϕ: E → K: ϕ linear}. (Hinweis: Arbeite mit dem dualen Paar (E, E ∗ ) und verwende den Satz von Hahn-Banach.)
VIII.8
459
Aufgaben
(d) Zeige (Eμ(E,F ) ) = F . (e) Gelte (Eτ ) = F , und sei U eine abgeschlossene konvexe τ -Nullumgebung. Dann ist U ∈ U (siehe Teil (a)). (Hinweis: Betrachte U o .) (f) Beweise den Satz von Mackey-Arens. (g) Sei E ein Banachraum, und betrachte das duale Paar (E, E ). Was ist die Mackey-Topologie μ(E, E )? Aufgabe VIII.8.23 (Lemma von Farkas) Sei X ein reeller lokalkonvexer Raum, und seien x , x1 , . . . , xn ∈ X . Es gelte x1 (x) ≥ 0, . . . , xn (x) ≥ 0 ⇒ x (x) ≥ 0
n
f¨ ur alle x ∈ X. Zeige, daß Skalare aj ≥ 0 mit x = j=1 aj xj existieren. (Tip: Betrachte die Menge C all dieser Konvexkombinationen und zeige mit dem Satz von Hahn-Banach, daß x ∈ C gilt; beachte noch Aufgabe VIII.8.5.) Aufgabe VIII.8.24 Es sei K eine kompakte konvexe nichtleere Teilmenge eines lokalkonvexen Hausdorffraums X. Mit A(K) bezeichne den Banachraum (!) aller affinen stetigen reellwertigen Funktionen auf K, versehen mit der Supremumsnorm. [Eine Funktion x: K → R heißt affin, falls x(λp1 + (1 − λ)p2 ) = λx(p1 ) + (1 − λ)x(p2) f¨ ur alle p1 , p2 ∈ K, 0 ≤ λ ≤ 1 gilt.] Definiere δp (x) = x(p).
:= {δp : p ∈ K} ist eine schwach∗ -kompakte konvexe Teilmenge von (a) K A(K) .
= {x ∈ A(K) : x (1) = 1 = x }. (b) K (Hinweis: Satz von Hahn-Banach!) (c) Schließe, daß es f¨ ur jedes regul¨ are Borelwahrscheinlichkeitsmaß μ auf K einen eindeutig bestimmten Punkt p ∈ K mit
(p) =
dμ
∀ ∈ X
K
gibt. (p heißt der Schwerpunkt von μ. [Warum wohl?]) Aufgabe VIII.8.25 Sei d der Raum der abbrechenden Folgen, versehen mit der Supremumsnorm. d ist also dicht in c0 , und d = (c0 ) = 1 . Betrachte den Unterraum U = {(sn ): 2−n sn = 0} von 1 . Dann ist BU σ(1 , d)-abgeschlossen, aber U ist es nicht. Man kann also auf die Vollst¨ andigkeit beim Satz von Krein-Shmulyan nicht verzichten. Aufgabe VIII.8.26 Es sei K eine konvexe Teilmenge eines Vektorraums und x ∈ K. (a) Sei F eine konvexe Teilmenge von K. Wenn F eine Seite ist, ist K \ F konvex. (b) Die Umkehrung gilt nicht. (c) x ∈ ex K genau dann, wenn K\{x} konvex ist.
460
VIII.
Lokalkonvexe R¨ aume
Aufgabe VIII.8.27 (a) Zeige BX = co ex BX (Normabschluß) f¨ ur X = 1 und X = ∞ . Folgt das aus dem Satz von Krein-Milman? (b) Zeige, daß ex BX f¨ ur X = ∞ = (1 ) schwach∗ -abgeschlossen, jedoch f¨ ur ∞ X = L [0, 1] = (L1 [0, 1]) schwach∗ -dicht in BX ist. Aufgabe VIII.8.28 Sei H ein Hilbertraum. (a) {T ∈ L(H): T oder T ∗ ist Isometrie} ⊂ ex BL(H) . (b) ex BK(H) = ∅, falls H unendlichdimensional ist. (Hinweis: Satz VI.3.6.) Aufgabe VIII.8.29 Es sei (Ω, Σ, μ) ein Maßraum. Eine Teilmenge A ∈ Σ heißt Atom, falls f¨ ur B ⊂ A, B ∈ Σ, entweder μ(B) = 0 oder μ(A \ B) = 0 ist. Zeige ex BL1 (μ) = {αχA : A Atom, 0 < μ(A) < ∞, |α| = 1/μ(A)}. Aufgabe VIII.8.30 Sei X ein reflexiver Banachraum, K ⊂ X konvex, be schr¨ ankt und abgeschlossen. Dann gilt K = co ex K. Aufgabe VIII.8.31 Sei K ⊂ R2 beschr¨ ankt, abgeschlossen und konvex. Dann ist ex K abgeschlossen. Gilt dies auch im R3 ? Aufgabe VIII.8.32 Sei X ein normierter Raum und Y ⊂ X ein Unterraum. Sei y ∈ ex BY . Dann existiert x ∈ ex BX mit x |Y = y . (Tip: Betrachte die Menge aller Hahn-Banach-Fortsetzungen!) Aufgabe VIII.8.33 Sei K eine kompakte konvexe Teilmenge eines lokalkonvexen Hausdorffraums X. Eine Teilmenge E ⊂ K heißt extremal, wenn sie die eine Seite definierende Bedingung erf¨ ullt; sie braucht nicht konvex zu sein. Zeige, daß jede abgeschlossene extremale Teilmenge von K einen Extremalpunkt von K enth¨ alt. (Hinweis: Imitiere den Beweis von Teil (a) des Satzes von Krein-Milman.) Aufgabe VIII.8.34 (Bauersches Maximumprinzip) Sei K eine kompakte konvexe Teilmenge eines lokalkonvexen Hausdorffraums X. Dann nimmt jede stetige konvexe Funktion f : K → R ihr Supremum an einem Extremalpunkt von K an. [Eine Funktion f : K → R heißt konvex, falls f (λx1 + (1 − λ)x2 ) ≤ λf (x1 ) + (1 − λ)f (x2 ) f¨ ur alle x1 , x2 ∈ K, 0 ≤ λ ≤ 1 gilt.] (Tip: Betrachte {x ∈ K: f (x) = sup f (K)} und verwende Aufgabe VIII.8.33.) Aufgabe VIII.8.35 Definieren folgende Abbildungsvorschriften Distributionen T ∈ D (Ω)? ∞ (a) Ω = (0, 1), T ϕ = n=2 ϕ(n) ( n1 ). (b) Ω = R, T ϕ =
∞ (n) 1 ϕ ( n ). n=1 2π
(c) Ω = R2 , T ϕ = 0 ϕ(cos α, sin α) dα. (d) Gibt es eine Distribution S ∈ D (R), die T aus (a) fortsetzt (beachte D (0, 1) ⊂ D (R))? Widerspricht das dem Satz von Hahn-Banach?
VIII.8
461
Aufgaben
Aufgabe VIII.8.36 Zeige, daß durch den Cauchyschen Hauptwert
6
∞
ϕ(x) dx := lim ε→0 x
T ϕ = CH−∞
−ε
−∞
ϕ(x) dx + x
∞
ε
ϕ(x) dx x
7
eine Distribution T ∈ D (R) definiert wird. Ist T regul¨ ar? Aufgabe VIII.8.37 (Multiplikation von Funktionen und Distributionen) (a) Sei Ω ⊂ Rn offen. Ist f ∈ C ∞ (Ω) und T ∈ D (Ω), so setze (f T )(ϕ) = T (f ϕ) f¨ ur ϕ ∈ D (Ω). Zeige, daß f T eine Distribution ist. (b) Im Fall n = 1 gilt die Produktregel (f T ) = f T + f T . (c) Welche f ∈ C ∞ (R) erf¨ ullen f δ = 0, und welche erf¨ ullen f δ = 0? (Bemerkung: L. Schwartz hat gezeigt, daß das Produkt von zwei beliebigen Distributionen nicht auf sinnvolle Weise erkl¨ art werden kann; siehe C. R. Acad. Sc. Paris 239 (1954) 847–848.) 1 Aufgabe VIII.8.38 Definiere eine Funktion f : R3 → R durch f (x) = − 4π |x|−1 1 3 f¨ ur x = 0 und f (0) = 0. Zeige f ∈ L (R ) und ΔT = δ im Distributionensinn. f lok (Hinweis: Tf (Δϕ) = limε→0 {|x|≥ε} f (x)Δϕ(x) dx und Greensche Formel (= partielle Integration).)
Aufgabe VIII.8.39 (a) Sei f : Rn → C eine meßbare Funktion, die f¨ ur geeignete Konstanten N ∈ N und c ≥ 0 einer Absch¨ atzung |f (x)| ≤ c(1 + |x|N ) f¨ ur alle x ∈ Rn gen¨ ugt. (Solch eine Funktion heißt langsam wachsend.) Dann ist Tf eine temperierte Distribution. (b) Zeige, daß die Funktion x → ex cos(ex ) (x ∈ R) eine temperierte Distribution definiert (wie?), x → ex aber nicht. Aufgabe VIII.8.40 F¨ ur eine Folge (Mn ) positiver reeller Zahlen und eine Folge (mn ) nichtnegativer ganzer Zahlen definiere eine Halbnorm auf D (R) durch q(Mn ),(mn ) (ϕ) =
∞
Mn
n=1
mn
sup |x|≥n−1
|ϕ(k) (x)| .
k=0
Dann erzeugt das System Q all dieser Halbnormen die Topologie von D (R). Anleitung: Daß τQ gr¨ ober ist, ist einfach. Umgekehrt ist eine auf allen D K (R) stetige Halbnorm p durch endlich viele q ∈ Q abzusch¨ ∞ atzen. Dazu arbeite mit einer Zerlegung der Eins, das sind ϕn ∈ D (R) mit ϕ = 1, 0 ≤ ϕn ≤ 1, so n=1 n daß supp(ϕn ) ⊂ {x: n − 1 ≤ |x| ≤ n + 1}. Aufgabe VIII.8.41 (Lokale Darstellbarkeit von Distributionen) (a) Sei T ∈ D (R). Zu jeder kompakten Menge K ⊂ R gibt es eine Funktion f ∈ C(R) und eine Zahl k ∈ N0 , so daß
Tϕ =
f (x) R
dk ϕ (x) dx dxk
∀ϕ ∈ D K (R).
(VIII.14)
462
VIII.
Lokalkonvexe R¨ aume
Kurz: Jede Distribution kann lokal durch mehrfaches Ableiten einer stetigen Funktion gewonnen werden. d (Anleitung: Setze D := dx . W¨ ahle m so, daß |T ϕ| ≤ C max{|Dn ϕ(x)|: x ∈ R, n ≤ m} f¨ ur ϕ ∈ D K (R). Zeige dann |T ϕ| ≤ C K |Dm+1 ϕ|, und setze das auf Dm+1 (D K (R)) durch Dm+1 ϕ → T ϕ erkl¨ arte Funktional auf L1 (K) fort. Beachte noch (L1 (K)) ∼ = L∞ (K).)
∞
(b) Betrachte T ∈ D (R), T ϕ = ϕ(n) (n). Zeige, daß es nicht m¨ oglich n=0 ist, f¨ ur T eine Darstellung (VIII.14) anzugeben, die f¨ ur alle ϕ ∈ D (R) gilt. (c) Untersuche, ob es f¨ ur T ∈ S (R) eine Darstellung (VIII.14) gibt, die f¨ ur alle ϕ ∈ S (R) gilt. Aufgabe VIII.8.42 (Distributionen mit kompaktem Tr¨ ager) (a) Man sagt, eine Distribution T ∈ D (Ω) habe kompakten Tr¨ ager, falls es ein Kompaktum K ⊂ Ω gibt, so daß T ϕ = 0 gilt, falls supp(ϕ) ∩ K = ∅. Sei f ∈ C(Ω). Dann hat die regul¨ are Distribution Tf kompakten Tr¨ ager genau dann, wenn f kompakten Tr¨ ager hat. (b) D (Ω) liegt dicht in E (Ω). (E (Ω) wurde in Beispiel VIII.1(c) erkl¨ art.) (c) T ∈ D (Ω) hat genau dann kompakten Tr¨ ager, wenn T stetig bez¨ uglich der Topologie von E (Ω) ist. (d) Es gibt einen Isomorphismus zwischen E (Ω) und {T ∈ D (Ω): T hat kompakten Tr¨ ager}. (e) Es gilt E (Rn ) ⊂ S (Rn ) in nat¨ urlicher Weise. Aufgabe VIII.8.43 Jede schwach kompakte Teilmenge von L∞ [0, 1] ist normseparabel. (Hinweis: Benutze, daß L∞ [0, 1] der Dualraum eines separablen Raums ist; zeige zuerst die schwache Separabilit¨ at.) Aufgabe VIII.8.44 (a) Ist X schwach folgenvollst¨ andig und U ⊂ X ein abgeschlossener Unterraum, so ist auch U schwach folgenvollst¨ andig. (b) c0 ist nicht isomorph zu einem abgeschlossenen Unterraum von L1 [0, 1]. Aufgabe VIII.8.45 Eine Teilmenge A eines Banachraums ist genau dann relativ schwach kompakt, wenn f¨ ur jede Folge (an ) in A der Schnitt n co{ak : k ≥ n} nicht leer ist. (Hinweis: F¨ ur eine Richtung verwende die Whitleysche Konstruktion, f¨ ur die andere beachte Korollar III.3.9.) Aufgabe VIII.8.46 (Shmulyan) Eine abgeschlossene konvexe Teilmenge C eines Banachraums ist genau dann schwach kompakt, wenn f¨ ur jede absteigende Folge C ⊃ C1 ⊃ C2 ⊃ . . . abgeschlossener konvexer nichtleerer Teilmengen n Cn = ∅ gilt. (Verwende Aufgabe VIII.8.45.)
VIII.8
463
Aufgaben
Aufgabe VIII.8.47 Eine Teilmenge H ⊂ L1 [0, 1] ist genau dann gleichgradig integrierbar, wenn {|h|: h ∈ H} gleichgradig integrierbar ist. (Hinweis: Zerlege h in Real- und Imagin¨ arteil und letztere in Positiv- und Negativteil.) Aufgabe VIII.8.48 Sei μ ein endliches Maß. Eine Teilmenge H ⊂ L1 (μ) ist genau dann beschr¨ ankt und gleichgradig integrierbar, wenn
|h| dμ → 0
sup h∈H
{|h|≥K}
f¨ ur K → ∞. Aufgabe VIII.8.49 (a) Sei g ∈ L1 [0, 1]. Zeige, daß {h ∈ L1 [0, 1]: |h| ≤ g} gleichgradig integrierbar ist. 1 (b) Sei p > 1. Zeige, daß {h ∈ L1 [0, 1]: 0 |h(t)|p dt ≤ 1} gleichgradig integrierbar ist. Aufgabe VIII.8.50 Jeder schwach kompakte Operator von c0 in einen Banachraum Y ist kompakt. Aufgabe VIII.8.51 Sei X ein Banachraum und K ein kompakter Hausdorffraum. (a) Es besteht eine eineindeutige Zuordnung zwischen stetigen linearen Operatoren T : X → C(K) und Funktionen τ : K → X , die σ(X , X)-stetig sind, gem¨ aß τ (k), x = (T x)(k). (b) T ist genau dann schwach kompakt, wenn τ σ(X , X )-stetig ist. (c) T ist genau dann kompakt, wenn τ norm-stetig ist. Aufgabe VIII.8.52 F¨ ur Banachr¨ aume X und Y ist V (X, Y ) ein abgeschlossener Unterraum von L(X, Y ). Aufgabe VIII.8.53 Wenn X die Dunford-Pettis-Eigenschaft hat, hat auch jeder komplementierte Unterraum die Dunford-Pettis-Eigenschaft. Aufgabe VIII.8.54 Hat K(2 ) die Dunford-Pettis-Eigenschaft? Aufgabe VIII.8.55 Jeder schwach kompakte Operator von C(K) in einen Banachraum Y ist strikt singul¨ ar. (Strikt singul¨ are Operatoren wurden in Aufgabe IV.8.28 definiert. Argumentiere wie bei Satz VIII.7.14.) Aufgabe VIII.8.56 ! 2 (a) Die 1 -Summe X = (n) hat die Schur-Eigenschaft. (Diese direkte 1 Summe wurde in Aufgabe II.5.28 eingef¨ uhrt.) (b) Der Dualraum von X enth¨ alt eine komplementierte Kopie von 2 . (c) Die Umkehrung von Korollar VIII.7.8 gilt nicht.
464
VIII.9
VIII.
Lokalkonvexe R¨ aume
Bemerkungen und Ausblicke
Die offizielle“ Definition eines lokalkonvexen Raums taucht zuerst bei von ” Neumann (Trans. Amer. Math. Soc. 37 (1935) 1–20) auf; er geht von einem System U mit den Eigenschaften (1)–(7) aus Abschnitt VIII.1 aus und zeigt die ¨aquivalente Beschreibung mittels Halbnormen. Bereits vorher (Math. Ann. 102 (1929) 370–427) hatte er die schwache Topologie eines Hilbertraums H studiert, mit Hilfe des Beispiels von S. 405 gezeigt, daß Folgen in diesem Kontext inad¨ aquat sind, und die starke und schwache Operatortopologie auf L(H) eingef¨ uhrt. Kurz darauf beobachtete Wehausen (Duke Math. J. 4 (1938) 157–169), daß auch f¨ ur lokalkonvexe R¨aume der Satz von Hahn-Banach zur Verf¨ ugung steht. Die eigentliche Theorie der lokalkonvexen R¨aume wurde zwischen 1935 und 1955 von J. Dieudonn´e, A. Grothendieck, G. K¨othe und L. Schwartz entwickelt. Sie setzten sich das Ziel, die f¨ ur die Analysis relevanten R¨aume zu untersuchen und ihre strukturell wesentlichen Eigenschaften herauszustellen. Eine auch heute noch lesenswerte Zusammenstellung der Resultate aus dieser Epoche findet sich in Dieudonn´es Artikel in Bull. Amer. Math. Soc. 59 (1953) 495–512. Hier wollen wir nur kurz auf einige die Distributionentheorie betreffende Ergebnisse eingehen. Sei (X, τP ) ein lokalkonvexer Raum. Er wird vollst¨ andig genannt, wenn jedes Cauchynetz (das ist ein Netz (xi ), das ∀p ∈ P ∀ε > 0 ∃i0 ∈ I ∀i, j ≥ i0
p(xi − xj ) ≤ ε
erf¨ ullt) konvergiert. In diesem Sinn ist D(Ω) vollst¨andig, was einen Hinweis darauf gibt, daß die auf D(Ω) betrachtete Topologie die richtige“ ist. Ist ” P abz¨ahlbar, so ist X gem¨ aß Aufgabe VIII.8.16 metrisierbar, und X ist genau dann vollst¨ andig, wenn X mit der dort betrachteten Metrik d als metrischer Raum vollst¨ andig ist, und das wiederum ist ¨aquivalent dazu, daß jede Metrik d, die die Topologie erzeugt und translationsinvariant ist (d.h. d(x, y) = d(x + z, y + z) f¨ ur alle x, y, z ∈ X), vollst¨andig ist. In diesem Fall nennt man X einen Fr´echetraum; Beispiele f¨ ur Fr´echetr¨aume sind die R¨aume DK (Ω), S (Rn ) und E (Ω). Da in Fr´echetr¨aumen nach Satz IV.1.1 der Bairesche Kategoriensatz gilt, u ¨berrascht es nicht, daß die S¨atze aus Kapitel IV, insbesondere der Satz von der offenen Abbildung und der Satz vom abgeschlossenen Graphen, auch f¨ ur diese R¨aume g¨ ultig sind. Korollar IV.2.5 kann man leicht auf eine noch gr¨ oßere Klasse von lokalkonvexen R¨aumen ausdehnen, die wie folgt erkl¨ art ist. Nach Bourbaki wird eine abgeschlossene absorbierende absolutkonvexe Teilmenge eines lokalkonvexen Raums X eine Tonne genannt, und X heißt tonneliert, falls jede Tonne eine Nullumgebung ist. Der Bairesche Kategoriensatz liefert unmittelbar, daß jeder Fr´echetraum tonneliert ist, und es ist nicht schwer, folgenden Satz zu zeigen.
VIII.9
465
Bemerkungen und Ausblicke
• Ist X tonneliert und ist (n ) eine Folge von stetigen linearen Funktionalen auf X, die punktweise gegen das lineare Funktional konvergiert, so ist auch stetig. (Der Beweis ergibt sich daraus, daß V := n {x: |n (x)| ≤ ε} eine Tonne ist und |(x)| ≤ ε f¨ ur x ∈ V gilt.) Die N¨ utzlichkeit dieses Satzes liegt nun darin, daß z.B. D(Ω) tonneliert ist, ohne ein Fr´echetraum zu sein. Um ersteres einzusehen, beschreiben wir die Topologie von D(Ω) erneut von einem abstrakten Standpunkt aus. Die Topologie von D(Ω) war ja aus denen aller DK (Ω) zusammengesetzt“; man u ¨ berlegt sich nun, daß man ” dieselbe Topologie erh¨ alt, wenn man statt aller DK (Ω) irgendeine Folge von kompakten Teilmengen von Ω mit K1 ⊂ int K2 ⊂ K2 ⊂ . . . ⊂ Ω und ahlt. Abstrakt m Km = Ω betrachtet und nur die Xm := DKm (Ω) ausw¨ gesehen, liegt nun folgende Situation vor. Gegeben ist ein Vektorraum X (= D(Ω)) und eine aufsteigende Folge von Untervektorr¨aumen (Xm ) mit agt eine lokalkonvexe Topologie τm , so daß die m Xm = X. Jedes Xm tr¨ Relativtopologie von τm+1 auf Xm stets mit τm u ¨ bereinstimmt. Dann generiert die Menge P aller Halbnormen p auf X, f¨ ur die p|Xm stets τm -stetig ist, eine lokalkonvexe Topologie auf X, die die Topologie des strikten induktiven Limes genannt wird. F¨ ur diese Topologie gilt Lemma VIII.5.1 entsprechend. Sind alle Xm Fr´echetr¨ aume, so nennt man X einen strikten (LF)-Raum. Diese Konstruktion stammt von Dieudonn´e und Schwartz (Ann. Inst. Fourier 1 (1950) 61–101), die zeigen, daß ein strikter (LF)Raum praktisch alle Eigenschaften eines Fr´echetraums besitzt, ohne selbst einer zu sein. Insbesondere ist ein strikter (LF)-Raum ebenfalls tonneliert, und deshalb gilt: • Der Limes einer punktweise konvergenten Folge von Distributionen ist eine Distribution. Diese Aussage kann man auch direkt beweisen; sie soll uns hier als Illustration der Prinzipien der allgemeinen lokalkonvexen Theorie dienen, die detailliert z.B. bei K¨ othe [1966, 1979], Tr`eves [1967] oder Meise/Vogt [1992] beschrieben ist. Die wohl profundeste Aussage der Distributionentheorie ist der Kernsatz von Schwartz, der folgendes besagt. • Sei B: D(Ω) × D(Ω) → C eine partiell stetige Bilinearform. Dann existiert eine Distribution K ∈ D (Ω × Ω) mit B(ϕ, ψ) = K(ϕ ⊗ ψ)
∀ϕ, ψ ∈ D(Ω).
Dabei ist (ϕ ⊗ ψ)(x, y) = ϕ(x)ψ(y). Ein analoger Satz gilt f¨ ur temperierte Distributionen.
466
VIII.
Lokalkonvexe R¨ aume
Bevor wir auf die Bedeutung dieses Satzes zu sprechen kommen, soll seine Stellung in der lokalkonvexen Theorie kommentiert werden. Grothendieck ( Produits tensoriels topologiques et espaces nucl´eaires“, Mem. Amer. ” Math. Soc. 16 (1955)) ist es n¨ amlich gelungen, eine Eigenschaft des Raums D(Ω), Nuklearit¨ at genannt, zu isolieren, die er als f¨ ur die G¨ ultigkeit des Kernsatzes entscheidend erkannt hat. Diese ist so definiert. Sei p eine stetige Halbnorm auf einem lokalkonvexen Raum X. Auf dem Quotientenvektorraum X/ ker(p) induziert p eine Norm, und wir betrachten die Vervollst¨andigung Xp dieses normierten Raums. Ist q ≥ p eine weitere stetige Halbnorm, so kann ein kanonischer Operator Iq,p : Xq → Xp als stetige Fortsetzung der Abbildung x + ker(q) → x + ker(p) definiert werden. (X, τP ) wird nuklear genannt, wenn f¨ ur alle p ∈ P eine Halbnorm q ∈ P , q ≥ p, existiert, so daß Iq,p ein nuklearer Operator (Definition VI.5.1) zwischen den Banachr¨ aumen Xq und Xp ist. Beispiele nuklearer R¨aume sind D(Ω), S (Rn ), E (Ω) und ihre Dualr¨aume (mit der schwach∗ -Topologie). Die Eigenschaften nuklearer R¨aume lassen diese den endlichdimensionalen R¨ aumen weit ¨ ahnlicher erscheinen, als es etwa die Hilbertr¨aume sind; z.B. sind in vollst¨ andigen nuklearen R¨aumen beschr¨ankte (Aufgabe VIII.8.6) abgeschlossene Mengen kompakt. Einen Beweis des Kernsatzes von diesem abstrakten Standpunkt aus findet man etwa bei Tr`eves [1967], direktere Argumente geben Dieudonn´e [1982] und H¨ormander [1990]. Seien X und Y lokalkonvexe Funktionenr¨aume auf Ω, so daß die kanonischen Einbettungen von D(Ω) nach X und von Y nach D (Ω) (mit der schwach∗-Topologie) stetig sind. Ist u: X → Y ein stetiger Operator, so induziert u einen stetigen Operator v: D(Ω) → X → Y → D (Ω) und weiter eine partiell stetige Bilinearform B: (ϕ, ψ) → v(ϕ) (ψ). Nach dem Kernsatz kann B durch eine Kerndistribution K dargestellt werden. Ist z.B. X = Y = L2 (R) und u ein Hilbert-Schmidt-Operator mit L2 -Kern k (vgl. Satz VI.6.3), so ist K nichts anderes als die zu k geh¨orige regul¨are Distribution. Will man aber den identischen Operator auf L2 (R) als Integraloperator mit einem Kern darstellen, scheitert man; der Kern ist nun eine δ-Funktion auf der Diagonalen“, n¨ amlich die Distribution ” K(φ) = φ(x, x) dx ∀φ ∈ D(R2 ). R
Der Kernsatz gestattet es also, praktisch alle Operatoren zwischen Funktionenr¨aumen als Kernoperatoren mit Distributionskernen darzustellen. Solche Kerne tauchen in den Anwendungen oft als Greensche Funktionen f¨ ur Differentialgleichungen auf. Mit dem Kernsatz hat man in der Regel als erstes einen Existenzsatz f¨ ur Greensche Distributionen“, durch weitere ” Analysen kann man dann versuchen zu zeigen, daß eine solche Distribution
VIII.9
467
Bemerkungen und Ausblicke
außerhalb der Diagonalen eine C ∞ -Funktion ist. Hier hat sich der Kalk¨ ul der Pseudodifferentialoperatoren als sehr hilfreich erwiesen. F¨ ur Einzelheiten sei auf die Spezialliteratur (etwa Dieudonn´e [1982, 1983]) verwiesen; ¨ einen Uberblick gibt Dieudonn´e [1981], S. 252ff. Die Greenschen Funktionen sind eng verwandt mit den Grundl¨osungen f¨ ur Differentialoperatoren. Ist L ein linearer Differentialoperator mit C ∞ -Koeffizienten auf D (Rn ), so bezeichnet man eine Distribution Ea mit L(Ea ) = δa als Grundl¨ osung f¨ ur L im Punkt a. Um die Bedeutung dieses Begriffs zu erkennen, betrachte man den adjungierten Operator L auf D(Rn ). Ist ϕ ∈ D(Rn ) eine L¨ osung von L (ϕ) = ψ, wo ψ ∈ D(Rn ) vorausgesetzt ist, so gilt notwendig Ea (ψ) = Ea (L (ϕ)) = (LEa )(ϕ) = δa (ϕ) = ϕ(a).
(VIII.15) −1 |x|−1 4π
Mit diesem Begriff werden die klassischen Grundl¨osungen des La−3/2 2 placeoperators bzw. (4πt) exp(−|x| /4t) des W¨armeleitungsoperators ∂ 3 − Δ auf R verallgemeinert (vgl. Aufgabe VIII.8.38). Hat L konstante ∂t Koeffizienten, kann man mit Hilfe der von Schwartz eingef¨ uhrten Faltung von Distributionen eine (VIII.15) entsprechende Formel zeigen, n¨amlich L(E0 ∗ ψ) = ψ, die eine L¨osung von L(T ) = ψ angibt, aber nur im Distributionensinn. Daher ist es wichtig zu wissen, ob ein Differentialoperator Grundl¨osungen besitzt. Der Satz von Ehrenpreis-Malgrange beantwortet diese Frage. • Ist L = 0 ein linearer Differentialoperator mit konstanten Koeffizienten, so besitzt L Grundl¨ osungen Ea ∈ D . Dieser Satz wird z.B. in Rudin [1991] bewiesen; an entscheidender Stelle wird der Satz von Hahn-Banach benutzt. Tats¨achlich gibt es sogar Grundl¨osungen in S , wie von H¨ ormander 1958 und L ojasiewicz 1959 gezeigt wurde. Verschiedene andere Beweismethoden werden von Ortner und Wagner in ihrer Note in S. Dierolf, S. Dineen, P. Doma´ nski (Hg.), Functional Analysis, de Gruyter 1996, S. 343–352, gegen¨ ubergestellt; insbesondere bringen sie eine Variante von K¨ onigs Beweis (Proc. Amer. Math. Soc. 120 (1994) 1315– 1318), der eine explizite Formel f¨ ur eine Grundl¨osung angibt. Man beachte auch Wagners Note in Amer. Math. Monthly 116 (2009) 457–462. bemerkt, daß f¨ ur einen linearen Differentialoperator L = Gerade wurde (α) a D mit konstanten Koeffizienten die Gleichung L(T ) = ψ f¨ ur |α|≤m α n n ψ ∈ D(R ) eine L¨ osung in D (R ) besitzt. Es erhebt sich die Frage, wann jede solche Distributionenl¨ osung eine klassische L¨osung, d.h. ∈ E (Rn ) ist. Differentialoperatoren mit dieser Eigenschaft werden hypoelliptisch genannt, sie Hilfe der Nullstellenmenge des assoziierten Polynoms P (x) = k¨onnen mit α ormander). Beispiele sol|α|≤m aα x charakterisiert werden (Satz von H¨ cher Operatoren sind die elliptischen Differentialoperatoren, die durch die
468
VIII.
Lokalkonvexe R¨ aume
α Forderung = 0 f¨ ur x = 0 definiert sind, insbesondere der |α|=m aα x Laplaceoperator. Auch parabolische Operatoren wie der W¨armeleitungsoperator ∂/∂t − Δ sind hypoelliptisch; hingegen sind der zeitabh¨angige Schr¨odingeroperator ∂/∂t−iΔ oder hyperbolische Operatoren wie der Wellenoperator ∂ 2 /∂ 2 t − Δ nicht hypoelliptisch. Beim Beweis solcher Regularit¨atss¨atze spielt das Lemma von Sobolev, Satz V.2.12, eine entscheidende Rolle. Die dort verwendeten Sobolevr¨ aume lassen sich u ¨brigens jetzt leichter handhaben, denn die W m (Ω) lassen sich als Hilbertr¨aume von (regul¨aren) Distributionen auffassen. Es sollte noch erw¨ ahnt werden, daß Sobolev der erste war, der Distributionen und ihre Ableitungen definiert hat; unser Satz VIII.5.4(iii) ist seine Definition (Mat. Sbornik 1 (1936) 39–72). Jedoch war es Schwartz, der einen allgemein anwendbaren geschmeidigen Kalk¨ ul entwickelt hat; insbesondere hat er die R¨ aume S und S eingef¨ uhrt und so der Fouriertransformation einen vollkommen neuen Aspekt verliehen. Weitere Beitr¨age von ihm sind die R¨ aume E und E , die Faltung und das Tensorprodukt von Distributionen, auf die dieser Text nicht eingeht. Geschichte und Vorgeschichte der Distributionentheorie (der Name Distribution“ stammt ” u utzen [1982] analysiert; er schreibt ¨brigens von Schwartz) werden von L¨ (S. 64): Thus Sobolev invented distributions, but it was Schwartz who ” created the theory of distributions.“ Weitergehende Darstellungen findet man in Schwartz’ klassischer, erstmals 1950/51 erschienener Monographie (Schwartz [1966]) sowie bei Rudin [1991], Tr`eves [1967], H¨ormander [1990] oder in dem einf¨ uhrenden Text von Al-Gwaiz [1992]. Im Beispiel des Abschnitts VII.1 sind wir auf das Ph¨anomen der ver” allgemeinerten Eigenvektoren“ gestoßen. Die Distributionentheorie und die Theorie der nuklearen R¨ aume (siehe oben) gestatten es, die Diagonalisierung eines Operators mittels solcher Elemente pr¨azise zu formulieren. Es seien H ein Hilbertraum und T : H ⊃ dom(T ) → H ein dicht definierter symmetrischer Operator, der dom(T ) in sich u uhrt. T besitze eine ¨berf¨ selbstadjungierte Erweiterung S: H ⊃ dom(S) → H. Wir nehmen ferner an, daß X := dom(T ) eine lokalkonvexe Topologie τ tr¨agt, so daß T : (X, τ) → (X, τ) und die identische Einbettung i: (X, τ ) → (H, . ) stetig sind. Dann ist i : H → X injektiv und schwach∗-stetig, und wenn man H nach dem Satz von Fr´echet-Riesz mit H identifiziert, erh¨alt man Inklusionen X ⊂ H ⊂ X ; man beschreibt diese Situation als Gelfandschen Dreier. Als Beispiel denke man an S (R) ⊂ L2 (R) ⊂ S (R) oder D(R) ⊂ L2 (R) ⊂ D (R) und (T ϕ)(t) = tϕ(t). F¨ ur einen Physiker ist nun klar, daß dieser Operator δ-Funktionen als Eigenfunktionen besitzt: T δλ = λδλ . Nat¨ urlich ist diese Gleichung sinnlos, aber wenn man statt T den adjungierten Operator T auf S betrachtet, ist T δλ = λδλ eine sinnvolle (und wahre) Aussage u ¨ber temperierte Distributionen. In der allgemeinen Situation wird man also versucht sein, nicht Eigenvektoren von T , sondern solche von T zu suchen. Ist (X, τ) nuklear (wie z.B. D oder
VIII.9
469
Bemerkungen und Ausblicke
S ), kann man tats¨ achlich zeigen, daß es ein vollst¨andiges“ System solcher ” verallgemeinerter Eigenvektoren gibt. Um dieses Resultat zu beschreiben, nehmen wir der Einfachheit halber an, die selbstadjungierte Erweiterung S von T besitze einen zyklischen Vektor ξ ∈ X, d.h. lin{ξ, Sξ, S 2 ξ, . . .} = H. Es sei E das Spektralmaß von S und μ wie in Satz VII.1.20 das endliche positive Maß dEλ ξ, ξ; beachte, daß S diesmal unbeschr¨ ankt sein darf. Dann gilt folgender Satz von Gelfand und Kostyuchenko (siehe Gelfand/Vilenkin [1964], S. 103ff.): • Wenn X nuklear ist, existieren f¨ ur alle λ ∈ σ(S) verallgemeinerte Eigenvektoren xλ ∈ X , T xλ = λxλ , so daß x, y = xλ (x)xλ (y) dμ(λ) ∀x, y ∈ X, σ(S) T x, y = λxλ (x)xλ (y) dμ(λ) ∀x, y ∈ X. σ(S)
Schreibt man x, xλ f¨ ur xλ (x), so sind diese Formeln vollkommen denen der Entwicklung in eine Orthonormalbasis bzw. der Diagonalisierung eines kompakten selbstadjungierten Operators analog: x, y =
∞ k=1
x, ek ek , y,
T x, y =
∞
λk x, ek ek , y.
k=1
Es sei jedoch betont, daß die verallgemeinerten Entwicklungsformeln nicht mehr f¨ ur alle Elemente von H gelten, sondern nur noch auf dem kleineren Raum X. Ist T ein elliptischer Differentialoperator auf X = D(Ω), kann man sogar zeigen, daß die xλ C ∞ -Funktionen sind (Satz von Mautner, G˚ arding und Browder; siehe Dunford/Schwartz [1963], S. 1709, oder Dieudonn´e [1982], S. 250). Alaoglu bewies Korollar VIII.3.12 in Ann. Math. 41 (1940) 252–267, Krein und Shmulyan Theorem VIII.3.15 in Ann. Math. 41 (1940) 556–583 und Goldstine die S¨ atze VIII.3.17 und VIII.3.18 in Duke Math. J. 4 (1938) 125–131. Auch der enigmatische Bourbaki k¨ undigte 1938 in einer ComptesRendus-Note einen Beweis dieser Aussagen (mit Korollar VIII.3.16 statt des Satzes von Krein-Shmulyan) an; seine Beweise wurden 1942 von Dieudonn´e ´ (Ann. Sci. Ecole Norm. Sup. 59 (1942) 107–139) avec l’autorisation de ” l’auteur“ (a.a.O., S. 128) ver¨ offentlicht. Der Beweis des Satzes von KreinShmulyan im Text folgt einer Idee von Pryce (siehe Day [1973], S. 50). Jedoch hatte Banach in seinem Buch (Banach [1932]) bereits Versionen dieser S¨atze gezeigt. Banach bedient sich aber nicht der schwachen oder schwach∗-Topologie, sondern bleibt ganz im Rahmen der schwach oder schwach∗ konvergenten Folgen, die ja ganz naiv definiert werden k¨onnen (siehe Definition III.3.6). Daher sind seine Versionen von Korollar VIII.3.12
470
VIII.
Lokalkonvexe R¨ aume
und Satz VIII.3.18 nur f¨ ur separable R¨ aume formuliert; vgl. die Aufgaben III.6.18 und VIII.8.17(d) f¨ ur das erstere. Bemerkenswerterweise gelingt es ihm aber, einen zu Korollar VIII.3.16 ¨ aquivalenten Satz f¨ ur alle Banachr¨aume, ob separabel oder nicht, zu beweisen (a.a.O., S. 118–122); dieser ist mit Hilfe eines Ad-hoc-Konzepts von transfiniten Folgen“ formuliert ” und lautet Jeder transfinit abgeschlossene Unterraum von X ist regul¨ar ” abgeschlossen.“ Banachs Version von Satz VIII.3.18 besagt, daß ein separabler Banachraum, in dem jede beschr¨ ankte Folge eine schwach konvergente Teilfolge besitzt, reflexiv ist (a.a.O., S. 189). (Die Umkehrung hatten wir in Theorem III.3.7 gezeigt.) Da jedoch Kompaktheit und Folgenkompaktheit verschiedene Dinge sind, ist nicht a priori klar, daß Satz VIII.3.18 dies als Spezialfall enth¨alt. Das ergibt sich jedoch aus dem Satz von Eberlein-Shmulyan. Daß schwach kompakte Mengen schwach folgenkompakt sind, wurde von Shmulyan (Mat. Sbornik 7 (1940) 425–444) bewiesen und die Umkehrung von Eberlein (Proc. Nat. Acad. Sci. USA 33 (1947) 51–53). Tats¨achlich zeigte Eberlein etwas Allgemeineres: Schwache Kompaktheit und abz¨ahlbare schwache Kompaktheit sind ¨ aquivalent. (Ein topologischer Raum heißt ¨ abz¨ahlbar kompakt, wenn jede abz¨ ahlbare offene Uberdeckung eine endliche Teil¨ uberdeckung besitzt. In T1 -R¨ aumen, insbesondere in Hausdorffr¨aumen, ist das ¨aquivalent dazu, daß jede abz¨ ahlbare Teilmenge einen H¨aufungspunkt besitzt.) Der Beweis des Satzes von Eberlein-Shmulyan im Text, der von Whitley stammt (Math. Ann. 172 (1967) 116–118), zeigt auch diese Variante. Vogt (Arch. Math. 95 (2010) 31–34) hat die Whitleysche Konstruktion benutzt, um zu zeigen, daß A genau dann relativ schwach kompakt ist, wenn f¨ ur jede Folge (an ) in A der Schnitt n co{ak : k ≥ n} nicht leer ist; siehe Aufgabe VIII.8.45. Wegen ihrer erstaunlichen Eigenschaften hat man topologischen R¨aumen, die zu schwach kompakten Teilmengen von Banachr¨aumen hom¨oomorph sind, einen eigenen Namen gegeben; man nennt sie Eberlein-kompakt. Eng damit zusammenh¨ angend sind die schwach kompakt erzeugten Banachr¨aume; ein Banachraum X heißt schwach kompakt erzeugt, wenn es eine schwach kompakte Teilmenge A ⊂ X gibt mit X = lin A. Diese Raumklasse bildet eine Verallgemeinerung der separablen und der reflexiven R¨aume. Schwach kompakt erzeugten R¨ aumen kommen Eigenschaften zu, die in allgemeinen Banachr¨ aumen nicht zutreffen, zum Beispiel ist die duale Einheitskugel eines schwach kompakt erzeugten Banachraums sogar schwach∗ folgenkompakt. Ein C(K)-Raum ist genau dann schwach kompakt erzeugt, wenn K Eberlein-kompakt ist. Zu schwach kompakt erzeugten R¨aumen siehe zum Beispiel Fabian et al. [2011]. Die Charakterisierung schwach kompakter Teilmengen von L1 durch ihre gleichgradige Integrierbarkeit stammt von Dunford und Pettis (Trans. Amer. Math. Soc. 47 (1940) 323–392). Sie zeigten auch die Dunford-PettisEigenschaft von L1 (μ), nat¨ urlich ohne diesen Begriff zu verwenden, der von
VIII.9
471
Bemerkungen und Ausblicke
Grothendieck (Canad. J. Math. 5 (1953) 129–173) eingef¨ uhrt wurde und auf den die meisten Resultate aus Abschnitt VIII.7 zur¨ uckgehen. Von Grothendieck stammt auch das folgende Resultat, das man heute die GrothendieckEigenschaft von L∞ nennt: • Eine schwach ∗ konvergente Folge im Dualraum von L∞ (μ) ist schwach konvergent. Auch der Raum der beschr¨ ankten analytischen Funktionen H ∞ und der 2 Operatorraum L( ) besitzen die Grothendieck-Eigenschaft (Bourgain, Studia Math. 75 (1983) 193–216, und Pfitzner, Math. Ann. 298 (1994) 349–371). Der Ansatz von Dunford und Pettis basiert auf ihrer Darstellung schwach kompakter Operatoren auf L1 durch vektorwertige Integrale, sogenannte Bochner-Integrale. Ein solcher Operator T : L1 (μ) → Y kann n¨amlich, ¨ahnlich wie ein Funktional, durch ein Integral Th = hg dμ Ω
dargestellt werden, wobei g: Ω → Y eine beschr¨ankte, in einem geeigneten Sinn meßbare Y -wertige Funktion ist. Dieser Darstellungssatz ist bei Diestel/Uhl [1977] beschrieben. Der Zusammenhang von gleichgradiger Integrierbarkeit und schwacher Kompaktheit ist in der Wahrscheinlichkeitstheorie von Interesse; zum Beispiel findet man bei Kopp [1984] eine funktionalanalytisch inspirierte Herlei¨ tung der Martingalkonvergenzs¨ atze. Ubrigens ist der Spezialfall des Satzes von Alaoglu f¨ ur X = C0 (R), also X = M (R), als Satz von Helly-Bray in der Wahrscheinlichkeitstheorie bekannt. Eine weitere, außerordentlich tiefliegende Charakterisierung schwach kompakter Mengen stammt von James (1964). • Eine schwach abgeschlossene beschr¨ ankte Teilmenge A eines reellen Banachraums ist genau dann schwach kompakt, wenn jedes stetige lineare Funktional sein Supremum auf A annimmt. In diesem Zusammenhang ist noch der Satz von Bishop-Phelps (1961) erw¨ahnenswert. • Sei X ein reeller Banachraum und C ⊂ X konvex, beschr¨ ankt und abgeschlossen. Dann ist die Menge aller stetigen linearen Funktionale, die ihr Supremum auf C annehmen, . -dicht in X . Diese S¨atze werden in Holmes [1975] bewiesen. Die einfachste Methode, um die schwache Kompaktheit eines Operators zu zeigen, ist, ihn u ¨ber einen reflexiven Raum zu faktorisieren. Daß dies immer m¨oglich ist, ist der Inhalt des Satzes von Davis, Figiel, Johnson und Pelczy´ nski (J. Funct. Anal. 17 (1974) 311–327):
472
VIII.
Lokalkonvexe R¨ aume
• Sei T : X → Y schwach kompakt. Dann existieren ein reflexiver Banachraum Z und stetige Operatoren T1 : X → Z, T2 : Z → Y mit T = T2 T1 . Lima, Nygaard und Oja (Israel J. Math. 119 (2000) 325–348) haben gezeigt, daß man die Faktorisierung sogar isometrisch einrichten kann, so daß auch T = T2 T1 gilt. Die Benutzung der schwachen Topologien er¨offnet einen neuen Blick auf den Satz vom abgeschlossenen Bild (Theorem IV.5.1). Man kann ihn jetzt so formulieren. • Seien X und Y Banachr¨ aume und T ∈ L(X, Y ). Dann sind ¨ aquivalent: (i) ran(T ) ist abgeschlossen. (ii) ran(T ) ist . -abgeschlossen. (iii) ran(T ) ist schwach∗ -abgeschlossen. Mit Methoden dieses Kapitels kann der Beweis so gef¨ uhrt werden. Wir f¨ ugen die Zwischenbehauptungen (iv) T : X → ran(T ) ist eine offene Abbildung bzgl. der Normtopologien. (v) T : X → ran(T ) ist eine offene Abbildung bzgl. der schwachen Topologien. ein. Dann zeigt der Satz von der offenen Abbildung (i) ⇔ (iv). Mit Hilfe der Aufgabe VIII.8.10 und der kanonischen Faktorisierung aus Lemma IV.5.2 kann man (iv) ⇔ (v) einsehen. Der Bipolarensatz liefert (v) ⇔ (iii) (Details in K¨othe [1979], S. 5), und (iii) ⇒ (ii) ist trivial. Die Umkehrung folgt aus dem Satz von Krein-Shmulyan: Zun¨ achst impliziert der Satz von der offenen Abbildung die Existenz eines ε0 > 0 mit ε0 BX ∩ ran(T ) ⊂ T (BY ), falls U := ran(T ) . -abgeschlossen ist, und das heißt BU = BX ∩ ran(T ) = BX ∩ T (ε−1 0 BX ). Da T schwach∗-stetig ist, ist BU schwach∗-abgeschlossen, also nach Korollar VIII.3.16 U selbst schwach∗-abgeschlossen. Krein und Milman bewiesen ihren Satz in Studia Math. 9 (1940) 133– 138 f¨ ur schwach∗-kompakte konvexe Teilmengen des Duals eines Banachraums. Der Beweis im Text stammt von Kelley und ist der heute generell verwandte; ein alternatives Argument fand L´eger (C. R. Acad. Sc. Paris 267 (1968) 92–93). Es war lange ein offenes Problem, ob der Satz von KreinMilman auch in nicht lokalkonvexen topologischen Vektorr¨aumen gilt. Das erste, sehr komplizierte Gegenbeispiel wurde von Roberts (Studia Math. 60 (1977) 255–266) konstruiert; es gibt sogar Gegenbeispiele in Lp [0, 1] f¨ ur 0 < p < 1 (siehe Kalton/Peck/Roberts [1984], S. 211).
VIII.9
473
Bemerkungen und Ausblicke
Bessaga und Pelczy´ nski (Israel J. Math. 4 (1966) 262–264) fanden eine Versch¨arfung des Satzes von Krein-Milman f¨ ur gewisse Banachr¨aume, in der die Kompaktheit keine Rolle mehr spielt. • Ist X ein Banachraum mit separablem Dualraum und K ⊂ X nicht leer, . -abgeschlossen und beschr¨ ankt, so gilt K = co ex K. Der Satz von Bessaga und Pelczy´ nski ist z.B. auf die Dualr¨aume von X = c0 oder von X = K(2 ) anwendbar. Lindenstrauss hat diesen Satz 1975 auf eine gr¨oßere Klasse von Banachr¨ aumen ausgedehnt, siehe Phelps’ Arbeit in J. Functional Anal. 16 (1974) 78–90. In einer anderen Richtung wurde der Satz von Krein-Milman durch Choquet verallgemeinert. Betrachten wir eine kompakte konvexe Teilmenge K eines lokalkonvexen Hausdorffraums X und T := ex K. Mit der Nomenklatur von Aufgabe VIII.8.24 ist die Restriktionsabbildung a → a|T von A(K) nach C(T ) isometrisch; dies folgt aus dem Satz von Krein-Milman, denn {x ∈ K: a(x) = sup a(K)} ist eine abgeschlossene Seite. Das Funktional a → a(x0 ), x0 ∈ K beliebig, l¨ aßt sich dann normgleich auf C(T ) fortsetzen und nach dem Rieszschen Darstellungssatz durch ein regul¨ares Borelmaß μ auf T darstellen. Da das Funktional positiv ist und die konstante Funktion 1 auf 1 abbildet, ist μ ein Wahrscheinlichkeitsmaß. Mit anderen Worten existiert zu jedem x0 ∈ K ein Wahrscheinlichkeitsmaß auf K mit μ(ex K) = 1, so daß a(x0 ) = a(x) dμ(x) ∀a ∈ A(K), ex K
wof¨ ur man symbolisch
x0 =
x dμ(x) ex K
schreibt. Der Satz von Choquet sagt aus, daß f¨ ur metrisierbare K sogar solch ein Maß mit μ(ex K) = 1 gefunden werden kann, symbolisch x0 = x dμ(x). ex K
Diese Formel beschreibt wesentlich pr¨ aziser als der Satz von Krein-Milman, wie jeder Punkt von K als Mischung“ von Extremalpunkten zu repr¨asen” tieren ist. Der Satz von Choquet hat bedeutende Anwendungen; wir ver¨ weisen auf die Ubersicht von Phelps in Bartle [1980], S. 115–157, sowie die Monographien von Phelps [1966] und Choquet [1969]. Der Beweis des Satzes von Stone-Weierstraß im Text stammt von de Branges (Proc. Amer. Math. Soc. 10 (1959) 822–824) und der des Satzes von Lyapunov von Lindenstrauss (J. Math. Mech. 15 (1966) 971–972). Brosowski und Deutsch geben ein sehr elementares Argument f¨ ur den Satz von Stone-Weierstraß in Proc. Amer. Math. Soc. 81 (1981) 89–92. Anwendungen des Satzes von Lyapunov auf das Bang-Bang-Prinzip der Kontrolltheorie
474
VIII.
Lokalkonvexe R¨ aume
diskutiert Holmes [1975], S. 109, und Anwendungen in der Wahrscheinlichkeitstheorie findet man bei Hill, Partitioning Inequalities in Probability ” and Statistics“, in M. Shaked, Y. L. Tong (Hg.) Stochastic Inequalities (1992), S. 116–132. F¨ ur die Aufteilung eines Kuchens siehe Dubins und Spanier, Amer. Math. Monthly 68 (1961) 1–17. Mit Hilfe eines Extremalpunktarguments kann man auch den folgenden Satz von Banach-Stone beweisen. • Sind S und T kompakte Hausdorffr¨ aume, f¨ ur die die Banachr¨ aume C(S) und C(T ) isometrisch isomorph sind, so sind S und T hom¨oomorph. Ist n¨amlich I: C(S) → C(T ) ein isometrischer Isomorphismus, so ist I : C(T ) → C(S) ebenfalls einer; daher bildet I die Extremalpunkte der Einheitskugel von M (T ) = C(T ) auf Extremalpunkte der Einheitskugel von M (S) = C(S) ab. Diese wurden in Beispiel VIII.4(f) beschrieben; folglich ist I (δt ) von der Form h(t)δϕ(t) . So wird eine Funktion ϕ: T → S definiert, und man beweist, daß ϕ ein Hom¨ oomorphismus ist. (Dazu ist es hilfreich zu wissen, daß S und {δs : s ∈ S}, versehen mit der schwach∗-Topologie, hom¨oomorph sind, was aus Satz VIII.3.6 und Lemma B.2.7 folgt.) Die Umkehrung des Satzes von Banach-Stone ist ebenfalls richtig (und sehr einfach). Der Satz von Goldstine impliziert lax gesprochen, daß es zu x ∈ BX (X ein normierter Raum) und zu einem endlichdimensionalen Teilraum F ⊂ X ein Element x ∈ BX gibt, das l¨ angs F“ mit x fast u ¨bereinstimmt. ” Eine Versch¨arfung dieser Aussage macht das Prinzip der lokalen Reflexivit¨ at von Lindenstrauss und Rosenthal (Israel J. Math. 7 (1969) 325–349): • Seien X ein normierter Raum, E ⊂ X und F ⊂ X endlichdimensionale Teilr¨ aume, und sei ε > 0. Dann existiert ein linearer Operator T : E → X mit (a) T x = x ∀x ∈ E ∩ X. (b) x (T x ) = x (x ) ∀x ∈ E, x ∈ F . (c) (1 − ε) x ≤ T x ≤ (1 + ε) x ∀x ∈ E. (Hier wurde, wie u ¨blich, X als Unterraum von X aufgefaßt.) Alle Beweise dieses Satzes fußen auf dem Satz von Hahn-Banach; die einfachsten Argumente fanden Dean (Proc. Amer. Math. Soc. 40 (1973) 146–148), Stegall (Proc. Amer. Math. Soc. 78 (1980) 154–156), Behrends (Studia Math. 100 (1991) 109–128) und Mart´ınez-Abej´ on (Proc. Amer. Math. Soc. 127 (1999) 1397–1398). Man spricht hier von lokaler Reflexivit¨at, da (c) zeigt, daß, obwohl X i.a. ein echter Oberraum von X ist, jeder endlichdimensionale Teilraum von X – bis auf ε – zu einem endlichdimensionalen Teilraum von X isometrisch ist. Das Attribut lokal“ bezieht sich in der Banach” raumtheorie auf die endlichdimensionale Struktur.
Kapitel IX
Banachalgebren
IX.1
Grundbegriffe und Beispiele
In diesem Kapitel untersuchen wir Banachr¨aume, die neben den Vektorraumoperationen Addition und Skalarmultiplikation eine innere Multiplikation zulassen (wie es z.B. f¨ ur den Banachraum C(T ) der Fall ist). Definition IX.1.1 Es seien A ein komplexer Banachraum und (x, y) → x · y =: xy eine bilineare assoziative Abbildung von A × A nach A ( Multi” plikation“) mit x · y ≤ x · y ∀x, y ∈ A. (IX.1) Dann heißt A (genauer (A, · , . )) eine Banachalgebra. Gilt xy = yx f¨ ur alle x, y ∈ A, so heißt A kommutativ. Ein Element e ∈ A mit ex = xe = x f¨ ur alle x ∈ A und e = 1 (IX.2) heißt Einheit von A. Die algebraischen Forderungen an eine Multiplikation lauten explizit x(y + z) = xy + xz, x(yz) = (xy)z,
(x + y)z = xz + yz, λ(xy) = (λx)y = x(λy)
f¨ ur alle x, y, z ∈ A, λ ∈ C. Eine Banachalgebra hat h¨ochstens eine Einheit (denn sind e und e˜ Einheiten, so gilt e = e˜ e = e˜). Die Beschr¨ankung auf komplexe Skalare erfolgt, da nur f¨ ur komplexe Algebren die fundamentalen Darstellungss¨ atze (siehe Abschnitt IX.2 und Satz IX.1.3 sowie IX.1.4) gelten. Beispiele. (a) Ist X ein komplexer Banachraum, so sind L(X) und K(X) Banachalgebren. (Hier ist die Norm nat¨ urlich die Operatornorm und die
D. Werner, Funktionalanalysis, 7. Aufl., Springer-Lehrbuch, DOI 10.1007/978-3-642-21017-4_9, © Springer-Verlag Berlin Heidelberg 2011
476
IX.
Banachalgebren
Multiplikation die Komposition.) F¨ ur dim(X) > 1 sind sie nicht kommutativ. L(X) enth¨ alt eine Einheit (n¨ amlich Id), K(X) im Fall dim X = ∞ nicht. [Beweis hierf¨ ur: Ist e Einheit von K(X), so muß e = Id sein (betrachte Operatoren mit eindimensionalem Bild!). Also gilt Id ∈ K(X) und folglich (Satz I.2.7) dim X < ∞.] (b) Die klassischen Funktionenalgebren C(T ) (T kompakter Hausdorffraum), L∞ (μ) und H ∞ und A(D) aus Beispiel I.1(e) sind kommutative Banachalgebren mit Einheit 1. (Die Multiplikation ist nat¨ urlich punktweise definiert, und als Norm betrachten wir die [im Fall L∞ wesentliche] Supremumsnorm.) C0 (R) ist eine kommutative Banachalgebra ohne Einheit. (c) Es sei W der Vektorraum der 2π-periodischen stetigen Funktionen von R nach C, deren Fourierreihe absolut konvergiert: f 2πZu 2π-periodischem 1 −int betrachte die Fourierkoeffizienten cn = cn (f ) = 2π f (t)e dt (n ∈ Z); 0 dann ist f ∈W ⇔ cn (f ) n∈Z ∈ 1 (Z). (1 (Z) ist der Banachraum aller zweiseitigen“ absolut summierbaren Fol ” gen (cn )n∈Z mit der Norm (cn ) 1 = n∈Z |cn |.) Insbesondere folgt f (s) =
cn (f )eins
(gleichm¨ aßige Konvergenz!)
n∈Z
f¨ ur f ∈ W . Die Multiplikation in W wird punktweise erkl¨art. Wir versehen W mit der Norm f W = n∈Z |cn (f )|. Nachrechnen zeigt, daß . W wirklich eine Norm und (W, . W ) ein Banachraum ist. [Oder man argumentiert so: f → cn (f ) ist ein isometrischer Isomorphismus zwischen W und dem Banachraum 1 (Z).] (W, · , . W ) ist eine Banachalgebra, die sog. Wieneralgebra; W ist kommutativ und hat das Einselement 1. Es ist daf¨ ur zu verifizieren: Sind f, g ∈ W , so gilt f g ∈ W mit f g W ≤ f W g W . Dazu berechne 2π 1 cn (f g) = f (t)g(t)e−int dt 2π 0 2π 1 = ck (f )eikt cl (g)eilt e−int dt 2π 0 k∈Z l∈Z 2π 1 = ck (f )cl (g) ei(k+l−n)t dt 2π 0 k,l∈Z
(erlaubt wegen absoluter und gleichm¨aßiger Konvergenz!) = ck (f )cl (g) k+l=n
=
k∈Z
ck (f )cn−k (g).
IX.1
477
Grundbegriffe und Beispiele
Also gilt (die Vertauschung der Summationsreihenfolge ist wegen der absoluten Konvergenz erlaubt) |cn (f g)| ≤ |ck (f )| |cn−k (g)| n
= =
n
k
k
n
|ck (f )| |cn−k (g)|
|ck (f )|
k
|cn−k (g)|
n
k
=
|ck (f )|
|cn (g)|
n
= f W g W . (d) Auf 1 (Z) f¨ uhren wir als Multiplikation die Faltung x ∗ y ein: (x ∗ y)n = xk yn−k f¨ ur x = (xn )n , y = (yn )n . k∈Z
Dasselbe Argument wie unter (c) zeigt, daß (1 (Z), ∗ , . 1 ) eine kommutative Banachalgebra mit Einselement e0 = (. . . , 0, 1, 0, .. .) (1 steht beim Index 0) ist. In der Tat ist der Isomorphismus f → cn (f ) von W auf 1 (Z) nicht nur ein isometrischer Isomorphismus von Banachr¨aumen, sondern sogar von Banachalgebren (d.h. er ist multiplikativ), denn f · g → cn (f ) ∗ cn (g) . Die Wieneralgebra ist also nichts anderes als eine andere Darstellung der Faltungsalgebra 1 (Z). Solche Darstellungen von Banachalgebren zu finden ist das Thema von Abschnitt IX.2. (e) Analog zu (d) definieren wir f¨ ur f, g ∈ L1 (R) (f ∗ g)(t) = f (s)g(t − s) ds. R
Direktes Nachrechnen zeigt, daß (L1 (R), ∗ , . L1 ) eine kommutative Banachalgebra ist, die allerdings keine Einheit besitzt. Gemeinsamer Hintergrund der Beispiele (d) und (e) ist, daß sowohl Z als auch R lokalkompakte topologische Gruppen sind; solche Gruppen G studiert man in der harmonischen Analyse z.B. mit Hilfe der Algebra L1 (G, μ), wo μ ein translationsinvariantes“ (sog. Haarsches) Maß auf der Borel-σ” Algebra von G ist. Bedingung (IX.1) aus Definition IX.1.1 garantiert, daß die Multiplikation eine stetige Abbildung ist. Ist umgekehrt (A, . ) ein Banachraum mit einer Multiplikation (x, y) → x · y, die partiell stetig ist (d.h. alle Abbildungen x → x · y (y ∈ A) und x → y · x (y ∈ A) sind stetig), so existiert eine Konstante c mit xy ≤ c x y (siehe Aufgabe IV.8.12), so daß die
478
IX.
Banachalgebren
Multiplikation sogar stetig ist. Setzt man |||x||| = sup y ≤1 xy , so erh¨alt man eine Halbnorm, die (IX.1) erf¨ ullt; das sieht man am schnellsten, wenn man beachtet, daß |||x||| die Norm des Multiplikationsoperators y → x · y auf (A, . ) ist. Besitzt A eine Einheit, so ist ||| . ||| sogar eine ¨aquivalente Norm, die auch (IX.2) erf¨ ullt. Das zeigt, daß die Normbedingungen aus Definition IX.1.1 bei Vorliegen einer partiell stetigen Multiplikation durch ¨ Ubergang zu einer ¨ aquivalenten Norm erzwungen werden k¨onnen. Wie im Spezialfall A = L(X) definieren wir nun das Spektrum eines Elements einer Banachalgebra. Definition IX.1.2 Sei A eine Banachalgebra mit Einheit e. (a) x ∈ A heißt invertierbar (in A), falls es y ∈ A gibt mit xy = yx = e. Schreibweise: y = x−1 (beachte, daß y eindeutig bestimmt ist). (b) ρ(x) = {λ ∈ C: λ − x := λe − x ist invertierbar in A} heißt Resolventenmenge von x. (Um die Algebra zu kennzeichnen, schreibt man auch ρA (x).) (c) σ(x) = C \ ρ(x) heißt Spektrum von x. (Pr¨aziser schreibt man σA (x).) (d) R: ρ(x) → A, λ → (λ − x)−1 heißt Resolventenabbildung. (e) r(x) = inf n∈N xn 1/n heißt Spektralradius von x. Als einfaches Beispiel betrachte die Banachalgebra C(T ); das Spektrum einer stetigen Funktion f ist dann σ(f ) = {f (t): t ∈ T } (Aufgabe IX.4.4). W¨ortlich wie f¨ ur A = L(X) zeigt man (vgl. die S¨atze II.1.11, VI.1.3 und VI.1.6): Satz IX.1.3 Sei A eine Banachalgebra mit Einheit e, und sei x ∈ A. (a) Falls x − e < 1, ist x invertierbar; genauer gilt (mit y 0 = e) x−1 =
∞
(e − x)n
(Neumannsche Reihe).
n=0
(b) (c) (d) (e)
ρ(x) ist offen, und R ist analytisch. σ(x) ist kompakt, genauer gilt |λ| ≤ x f¨ ur λ ∈ σ(x). σ(x) = ∅. sup{|λ|: λ ∈ σ(x)} = limn→∞ xn 1/n = r(x).
Die Teile (d) und (e) verlangen komplexe Skalare; f¨ ur R-Algebren sind (d) und (e) i.a. falsch. Neu ist hingegen der folgende Satz. Satz IX.1.4 (Satz von Gelfand-Mazur) Eine Banachalgebra mit Einheit e, in der jedes von Null verschiedene Element invertierbar ist, ist eindimensional: A = C · e.
479
IX.2 Die Gelfandsche Darstellungstheorie
Beweis. Sei x ∈ A. W¨ ahle λ ∈ σ(x); das ist m¨oglich nach Satz IX.1.3(d). Dann ist definitionsgem¨ aß λ− x nicht invertierbar, also nach Voraussetzung λ − x = 0, d.h. x = λe. 2 Das folgende Lemma u ¨ber das Spektrum eines Produkts wird in Abschnitt IX.3 ben¨otigt. Lemma IX.1.5 Sei A eine Banachalgebra mit Einheit e. Dann gilt σ(xy)\{0} = σ(yx)\{0}
∀x, y ∈ A.
Beweis. Ist λ ∈ ρ(xy)\{0}, existiert z ∈ A mit z(λ − xy) = (λ − xy)z = e. Wegen (nachrechnen!) (e + yzx)(λ − yx) = (λ − yx)(e + yzx) = λe ist dann auch λ − yx invertierbar, d.h. λ ∈ ρ(yx)\{0}.
IX.2
2
Die Gelfandsche Darstellungstheorie
Wir wissen bereits aus Korollar VIII.3.13, daß jeder Banachraum A als abgeschlossener Unterraum eines Raums stetiger Funktionen dargestellt werden kann: Wir betrachten BA ; versehen mit der σ(A , A)-Topologie ist BA ein kompakter Hausdorffraum nach dem Satz von Alaoglu. Ferner betrachten wir die Abbildung A → C(BA ), x → x , wo x (x ) = x (x) ist. Ist A eine Banachalgebra, so ist { x: x ∈ A} ⊂ C(BA ) keine Unteralgebra der Banachalgebra C(BA ), da nicht jedes Funktional multiplikativ ist. Will man die Algebra A als eine Funktionenalgebra darstellen, wird man also auf die multiplikativen Funktionale gef¨ uhrt. Es stellt sich nat¨ urlich sofort die Frage nach der Existenz und der Vielfalt dieser Funktionale. Ein Ergebnis der Gelfandschen Theorie ist, daß man tats¨ achlich viele Banachalgebren durch die Menge ihrer multiplikativen Funktionale beschreiben kann (geradeso, wie man einen Banachraum X durch X beschreiben kann – das ist der Satz von Hahn-Banach). Wir werden diese Ideen systematisch entwickeln und beginnen mit einer Definition. Definition IX.2.1 A1 und A2 seien Banachalgebren. Eine Abbildung Φ: A1 → A2 heißt Algebrenhomomorphismus, falls Φ linear und multiplikativ ist. Im Fall A2 = C spricht man k¨ urzer von [komplexen] Homomorphismen (oder Charakteren). In Definition IX.2.1 ist die Stetigkeit von Φ nicht verlangt; u ¨ berraschenderweise ergibt sie sich h¨ aufig automatisch.
480
IX.
Banachalgebren
Lemma IX.2.2 Sei A eine Banachalgebra [mit Einheit ]. Dann ist jeder Homomorphismus ϕ: A → C stetig; genauer gilt ϕ ≤ 1 [bzw. ϕ = 1 oder ϕ = 0]. Beweis. abe es x ∈ A mit x < 1, ϕ(x) = 1. Setze ∞W¨are 1 < ϕ ≤ ∞, so g¨ y = n=1 xn . Es folgt y = x + xy und damit der Widerspruch ϕ(y) = ϕ(x) + ϕ(x)ϕ(y) = 1 + ϕ(y). Besitzt A eine Einheit e und ist ϕ = 0, so existiert x ∈ A mit ϕ(x) = 1. Es folgt 1 = ϕ(x) = ϕ(ex) = ϕ(e)ϕ(x) = ϕ(e), also ϕ ≥ 1, da e = 1.
2
Beispiele. (a) Sei T ein kompakter Hausdorffraum und A = C(T ). Zu t ∈ T setze ϕt (x) = x(t). Dann ist ϕt ein Homomorphismus. Wir werden sehen, daß es (außer 0) keine weiteren Homomorphismen als die ϕt , t ∈ T , gibt. (b) Sei A die Faltungsalgebra 1 (Z) (Beispiel IX.1(d)). Zu z ∈ C mit n |z| = 1 setze ϕz (x) = n∈Z xn z . Dann ist ϕz ein komplexer Homomorphismus, denn ϕz (x ∗ y) = (x ∗ y)n z n = xk yn−k z n n
=
k
xk z k
n
k
yn−k z n−k
(absolute Konvergenz!)
n
= ϕz (x) · ϕz (y). Umgekehrt sei ϕ = 0 ein Homomorphismus. Nach Lemma IX.2.2 ist ϕ = 1. Nun gilt f¨ ur den k-ten Einheitsvektor ek , wo k ∈ Z, ek ∗ el = ek+l . Setze z = ϕ(e1 ), dann folgt ϕ(ek ) = z k f¨ ur k ∈ Z. Insbesondere gilt |z| = |ϕ(e1 )| ≤ e1 = 1,
|z −1 | = |ϕ(e−1 )| ≤ e−1 = 1,
so daß |z| = 1. Da auch ϕz (ek ) = z k und ergo die stetigen Abbildungen ϕ und ϕz auf der dichten ¨ bereinstimmen, gilt ϕ = ϕz . Menge lin{ek : k ∈ Z} u (c) Da f → cn (f ) ein Homomorphismus der Wieneralgebra W auf 1 (Z) ist, sind die von Null verschiedenen Homomorphismen von W genau die ϕ˜t : f → f (t), 0 ≤ t ≤ 2π. (Beachte f (t) = n cn (f )eint .) (d) Man kann zeigen, daß die Homomorphismen L1 (R) → C genau die ϕt (f ) = f (s)e−ist ds R
bzw. ϕ = 0 sind, also ϕt (f ) im wesentlichen die Fouriertransformation (F f )(t) ist; siehe z.B. Conway [1985], S. 231.
IX.2
481
Die Gelfandsche Darstellungstheorie
Wir wollen als n¨ achstes zeigen, daß eine kommutative Banachalgebra (mit Einheit) viele Homomorphismen besitzt. Dazu ben¨otigen wir eine weitere Definition. Definition IX.2.3 (a) Ein Ideal J einer Banachalgebra A ist ein Untervektorraum mit x ∈ J, y ∈ A
⇒
xy ∈ J und yx ∈ J.
Im Falle J = A heißt J echtes Ideal. (b) Ein maximales Ideal J ist ein echtes Ideal mit ˜ J˜ Ideal J J,
⇒
J˜ = A.
Lemma IX.2.4 Es sei A eine Banachalgebra. (a) Der Abschluß eines Ideals ist ein Ideal. (b) Ist J ein abgeschlossenes Ideal der Banachalgebra A, so ist A/J, versehen mit der Quotientennorm, eine Banachalgebra. (Die Mul¨ tiplikation zweier Aquivalenzklassen ist nat¨ urlich [x][y] = [xy]; und das ist wohldefiniert.) Ist A kommutativ, so ist es auch A/J. Beweis. (a) folgt aus der Stetigkeit der Multiplikation. (b) Die algebraischen Forderungen best¨ atigt man durch Nachrechnen. Zu (IX.1) aus Definition IX.1.1: F¨ ur u, v ∈ J ist xy + uy + xv + uv ∈ [xy], also [xy] ≤ xy + uy + xv + uv = (x + u)(y + v) ≤ x + u y + v , daher [xy] ≤ [x] [y] .
2
Beispiele. (e) Der Kern eines Homomorphismus ϕ ist ein maximales Ideal, falls ϕ = 0, denn die Kodimension ist = 1. Wegen Lemma IX.2.2 ist es abgeschlossen. (f) F¨ ur einen separablen Hilbertraum H unendlicher Dimension sind nach Satz VII.1.24 {0} und K(H) die einzigen echten abgeschlossenen Ideale von L(H). Insbesondere ist 0 der einzige Homomorphismus von L(H) nach C. (g) Sei T ein kompakter Hausdorffraum. Dann ist J ⊂ C(T ) genau dann ein abgeschlossenes Ideal, wenn eine abgeschlossene Teilmenge D ⊂ T mit J = JD := {x ∈ C(T ): x|D = 0} existiert. Daß die JD Ideale sind, ist klar. Zum Beweis der Umkehrung setzen wir D = {t ∈ T : x(t) = 0 ∀x ∈ J}. Dann ist D abgeschlossen, und es
482
IX.
Banachalgebren
gilt J ⊂ JD nach Konstruktion. Sei umgekehrt x ∈ JD ; wir werden x ∈ J zeigen. Zun¨achst gilt ∀t ∈ T ∃xt ∈ J
xt (t) = x(t).
Ist n¨amlich t ∈ D, so w¨ ahle xt = 0. Ist t ∈ / D, so existiert x ˜t ∈ J mit x ˜t (t) = 0; w¨ahle ein geeignetes Vielfaches von x ˜t . Sei nun ε > 0. Setze Ut = {s: |x(s) − xt (s)| < ε}. Nach Wahl von xt ist Ut eine offene Umgebung von t. Wegen der Kompaktheit von T existiert eine endliche Teil¨ uberdeckung Ut1 , . . . , Utn . Sei {f1 , . . . , fn } ⊂ C(T ) eine dieser Teil¨ u berdeckung untergeordnete Zerlegung der Eins, d.h. 0 ≤ fi ≤ 1, n f = 1 und f (t) = 0 f¨ ur t ∈ / Uti .1 Wegen der Idealeigenschaft ist i i=1 i n y := i=1 fi xti ∈ J. Dann ist |y(s) − x(s)| ≤
n i=1
fi (s)|xti (s) − x(s)| ≤
n
fi (s)ε = ε,
i=1
denn der i-te Summand ist = 0 (falls s ∈ / Uti ) oder ≤ fi (s)ε (falls s ∈ Uti ); daher folgt y − x ≤ ε. Da ε > 0 beliebig war, ergibt sich x ∈ J = J. Wir werden jetzt den Zusammenhang zwischen Homomorphismen und maximalen Idealen in kommutativen Banachalgebren mit Einheit studieren. Dazu ben¨otigen wir eine Versch¨ arfung von Lemma IX.2.4. Lemma IX.2.5 A sei eine kommutative Banachalgebra mit Einheit e. (a) Ein echtes Ideal von A liegt nicht dicht. (b) Maximale Ideale sind abgeschlossen. (c) Jedes echte Ideal ist in einem maximalen Ideal enthalten. (d) Ist J ein echtes abgeschlossenes Ideal, so hat A/J eine Einheit. (e) Ist J ein maximales Ideal, so ist A/J eindimensional. Beweis. (a) folgt aus Satz IX.1.3(a) und der Tatsache, daß echte Ideale keine invertierbaren Elemente enthalten. (b) folgt aus (a) und Lemma IX.2.4(a). (c) ergibt sich aus einer Standardanwendung des Zornschen Lemmas: Beachte nur, daß f¨ u r eine Kette (bzgl. der Inklusionsordnung) {J i : i ∈ I} von echten Idealen i∈I Ji ein echtes Ideal ist. (Sonst w¨are e ∈ i Ji , also e ∈ Ji0 f¨ ur ein i0 , und Ji0 w¨ are nicht echtes Ideal.) (d) [e] ist Einheit von A/J. Zu (IX.2) aus Definition IX.1.1: Es ist [e] = inf x∈J e − x = 1, denn ≤ 1 ist klar; aber < 1 kann wegen Satz IX.1.3(a) nicht gelten (sonst enthielte J ein invertierbares Element und folglich die Einheit von A). 1 Die Existenz solcher Funktionen weist man mit Hilfe des Satzes von Tietze-Urysohn (Theorem B.2.4) nach; im vorliegenden Fall argumentiert man am einfachsten durch Induktion nach n. F¨ ur eine Verallgemeinerung siehe z.B. Pedersen [1989], S. 40.
IX.2
Die Gelfandsche Darstellungstheorie
483
(e) Nach (b) und (d) ist A/J eine kommutative Banachalgebra mit Einheit. Nach dem Satz von Gelfand-Mazur (Satz IX.1.4) reicht es, ∀x ∈ A\J ∃y ∈ A xy ∈ e + J = [e] zu zeigen. Zu x ∈ A \ J setze Jx = {xa + b: a ∈ A, b ∈ J}. Dann ist Jx ein Ideal (nachrechnen!), und es gelten J ⊂ Jx (setze a = 0) sowie J = Jx (setze a = e, b = 0). Da J ein maximales Ideal ist, ist Jx = A, d.h. es existieren y ∈ A, b ∈ J mit xy + b = e, also xy ∈ e + J. 2 Man mache sich klar, f¨ ur welche Teile von Lemma IX.2.5 die Kommutativit¨at wesentlich ist. Definition IX.2.6 A sei eine kommutative Banachalgebra mit Einheit. (a) Dann heißt ΓA := {ϕ: A → C: ϕ = 0, ϕ Homomorphismus} Gelfandraum (oder Spektrum [vgl. Satz IX.2.7(c)]) oder maximaler Ideal-Raum [vgl. Satz IX.2.7(b)] von A. (b) Zu x ∈ A und ϕ ∈ ΓA setze x (ϕ) = ϕ(x). Die Abbildung x → x heißt Gelfandtransformation. Nach Lemma IX.2.2 gilt ΓA ⊂ BA , sogar ΓA ⊂ SA . Wir k¨onnen daher ΓA mit der σ(A , A)-Topologie versehen. Satz IX.2.7 A sei eine kommutative Banachalgebra mit Einheit. (a) ΓA , versehen mit der schwach∗ -Topologie σ(A , A), ist ein kompakter Hausdorffraum, und es ist x ∈ C(ΓA ). (b) J ⊂ A ist genau dann ein maximales Ideal, wenn J der Kern eines ϕ ∈ ΓA ist. (c) Es ist ΓA = ∅. Genauer gilt σ(x) = {ϕ(x): ϕ ∈ ΓA } f¨ ur alle x ∈ A. Beweis. (a) Es gilt , ΓA = {ϕ ∈ A : ϕ(xy) − ϕ(x)ϕ(y) = 0} ∩ {ϕ: ϕ(e) = 1}. x,y∈A
Da die Abbildungen ϕ → ϕ(a), a ∈ A, σ(A , A)-stetig sind, ist ΓA eine schwach∗ -abgeschlossene Teilmenge der schwach∗-kompakten Einheitskugel, also selber schwach∗ -kompakt. Da die Gelfandtransformierte x eine Einschr¨ankung der nach Korollar VIII.3.4 schwach∗-stetigen Abbildung x → x (x) ist, ist sie selbst eine stetige Funktion.
484
IX.
Banachalgebren
(b) Sei J ein maximales Ideal. Nach Lemma IX.2.5(e) ist A/J = C·[e] ∼ = C, und die Quotientenabbildung ist ein Homomorphismus, dessen Kern mit J u ur ϕ ∈ ΓA der Kern ker(ϕ) ein 1¨bereinstimmt. Umgekehrt ist f¨ kodimensionales, also maximales Ideal. (c) Es ist ΓA = ∅ nach (b), da es laut Lemma IX.2.5(c) maximale Ideale gibt. Ist λ ∈ ρ(x), also λ − x invertierbar, so sind alle ϕ(λ − x) = λ − ϕ(x), ϕ ∈ ΓA , in C invertierbar (d.h. = 0), denn ϕ ist multiplikativ. Folglich gilt λ∈ / {ϕ(x): ϕ ∈ ΓA }. Ist λ ∈ σ(x), so ist J = {(λ − x)a: a ∈ A} ein echtes Ideal, das nach Lemma IX.2.5(c) in einem maximalen Ideal liegt. Nach (b) existiert also ϕ ∈ ΓA mit λ − x ∈ J ⊂ ker(ϕ), d.h. λ = ϕ(x). 2 Theorem IX.2.8 (Gelfandscher Darstellungssatz) A sei eine kommutative Banachalgebra mit Einheit e, ΓA , versehen mit der schwach∗ -Topologie, der zugeh¨ orige Gelfandraum und x → x die Gelfandtransformation von A nach C(ΓA ). (a) Die Gelfandtransformation ist ein wohldefinierter stetiger Algebrenhomomorphismus mit e = 1. Es ist x ∞ = r(x) ≤ x .
(IX.3)
(b) Es gilt σ(x) = σ( x) f¨ ur x ∈ A. Beweis. (a) Es ist alles klar (siehe noch Satz IX.2.7(a)) bis auf (IX.3), worauf wir gleich zur¨ uckkommen. (b) folgt aus Satz IX.2.7(c) und daraus, daß f¨ ur C(T ) stets σ(f ) = {f (t): t ∈ T } gilt (Aufgabe IX.4.4). Insbesondere ist r(f ) = f ∞ . Zur¨ uck zu (IX.3): Mit (b) und Satz IX.1.3 schließt man jetzt x ∞ = r( x) = r(x) ≤ x .
2
Beispiele. (h) Wir betrachten zuerst A = C(T ). Nach Beispiel (a) ist ϕt ∈ ΓA f¨ ur t ∈ T . Ist umgekehrt ϕ ∈ ΓA , so ist der Kern ker(ϕ) ein maximales Ideal, also nach Beispiel (g) von der Form J{t} . Es folgt ϕ = ϕt . Wir k¨onnen also ΓC(T ) (als Menge) mit T identifizieren; aber andererseits ist t → ϕt ein Hom¨oomorphismus (kombiniere Satz VIII.3.6 und Lemma B.2.7). Also sind T und ΓC(T ) hom¨ oomorph. Die Gelfandtransformation ist x (ϕt ) = x(t); es 8 folgt, daß C(T ) und C(T ) := { x: x ∈ C(T )} isometrisch algebrenisomorph sind. (i) Als zweites Beispiel betrachte A = 1 (Z). Wir wissen aus Beispiel (b), daß ΓA = {ϕz : z ∈ T}, wo T = {z ∈ C: |z| = 1}. Die Abbildung z → ϕz ist sogar ein Hom¨ oomorphismus, denn sie ist injektiv (klar) und stetig nach Satz VIII.3.6, denn z → ϕz (x) ist stetig f¨ ur alle x, und weil T kompakt ist, ist auch die Umkehrabbildung stetig (Lemma B.2.7). Die Gelfandtransfor mation ist x (ϕz ) = xn z n ; und das heißt 18 (Z) = W , wenn man Γ 1 (Z)
IX.3 C ∗ -Algebren
485
mit T und die Wieneralgebra mit der entsprechenden Algebra von Funktionen auf T identifiziert. Hier ist die Gelfandtransformation nicht isometrisch (Beispiel?), wohl aber injektiv, und nach dem Satz von Stone-Weierstraß liegt W dicht in C(T). (j) Die Diskussion unter (i) zeigt: Die identische Einbettung von W in C(T) ist“ die Gelfandtransformation. Diese Bemerkung liefert auf einen ” Schlag ein gefeiertes Resultat von Wiener. Korollar IX.2.9 (Satz von Wiener) Hat f ∈ C(T) eine absolut konvergente Fourierreihe und ist stets f (z) = 0, so besitzt auch 1/f eine absolut konvergente Fourierreihe. Beweis. Nach Voraussetzung ist f ∈ W mit 0 ∈ / σC(T) (f ). Die Behauptung ist 0 ∈ / σW (f ); und das stimmt nach Theorem IX.2.8(b) und den vorherge¨ henden Uberlegungen, denn σC(T) (f ) = σ(f). 2 Eine kommutative Banachalgebra wird halbeinfach genannt, wenn ihre Gelfandtransformation injektiv ist. A ist also genau dann halbeinfach, wenn , Rad(A) := ker(ϕ) = {0} ϕ∈ΓA
ist. Rad(A) heißt das Radikal von A. Wir erw¨ahnen noch: Lemma IX.2.10 Gilt x2 = x 2 f¨ ur alle x ∈ A, so ist die Gelfandtransformation isometrisch und insbesondere A halbeinfach. k
k
Beweis. Durch Induktion folgt x2 = x 2 und daher x ∞ = r(x) = k k limk→∞ x2 1/2 = x . 2
IX.3
C ∗-Algebren
Die Algebra der beschr¨ ankten Operatoren auf einem Hilbertraum tr¨agt neben der Algebrenstruktur noch eine Involution T → T ∗ . Die Eigenschaften dieser Sternbildung geben zu folgenden Begriffen Anlaß. Definition IX.3.1 Sei A eine Banachalgebra. (a) Eine Abbildung x → x∗ , die (x + y)∗ = x∗ + y ∗ , (λx)∗ = λx∗ , x∗∗ = x, (xy)∗ = y ∗ x∗ f¨ ur alle x, y ∈ A, λ ∈ C erf¨ ullt, heißt Involution. (b) Besitzt A eine Involution mit x∗ x = x 2 so heißt A eine C ∗ -Algebra.
∀x ∈ A,
486
IX.
Banachalgebren
(c) Ein Algebrenhomomorphismus Φ zwischen C ∗ -Algebren A und B heißt ∗ -Homomorphismus (oder involutiv), falls Φ(x∗ ) = (Φ(x))∗ f¨ ur alle x ∈ A gilt. Ein bijektiver ∗ -Homomorphismus heißt ∗ -Isomorphismus. Man kann zeigen, daß injektive ∗ -Homomorphismen stets isometrisch sind; den bei uns vorkommenden injektiven ∗ -Homomorphismen wird man die Isometrie immer direkt ansehen k¨ onnen. Im folgenden bezeichnet H einen komplexen Hilbertraum. Beispiele. (a) L(H) und K(H) sind C ∗ -Algebren; wegen der Normbedingung siehe Satz V.5.2(f). (b) Ist T ∈ L(H) normal, so ist alg(T, T ∗ ), die kleinste abgeschlossene Unteralgebra von L(H), die Id, T und T ∗ enth¨alt, eine kommutative C ∗ N n ∗ m Algebra. Es ist alg(T, T ∗ ) der Abschluß von n,m=0 an,m T (T ) : an,m ∈ C, N ∈ N0 . (c) C(T ) und L∞ (μ) mit der Involution f ∗ (t) = f (t) sind kommutative ∗ C -Algebren. (d) Da K(H) ein abgeschlossenes Ideal in L(H) ist, ist L(H)/K(H) nach Lemma IX.2.4(b) eine Banachalgebra, die sog. Calkin-Algebra. Die ¨ Norm [T ] einer Aquivalenzklasse in der Calkin-Algebra wird h¨aufig mit T e bezeichnet und wesentliche Norm von T genannt. Wir versehen den Quotienten L(H)/K(H) mit der (wohldefinierten!) Involution [T ]∗ = [T ∗ ] und zeigen, daß man so eine C ∗ -Algebra erh¨ alt. Wir f¨ uhren den Beweis nur f¨ ur separable H. Da die algebraischen Eigenschaften der Involution erf¨ ullt sind, reicht es, die Normbedingung T ∗T e = T 2e zu zeigen. ≤“ folgt aus T ∗ T e ≤ T ∗ e T e und T e = inf K∈K(H) T − K = ” inf K∈K(H) T ∗ − K ∗ = inf K∈K(H) T ∗ − K = T ∗ e . ≥“: Sei hierzu {e1 , e2 , . . .} eine Orthonormalbasis von H und Pn die ” Orthogonalprojektion Pn x = nk=1 x, ek ek . Dann gilt Pn x → x f¨ ur alle x ∈ H. Hieraus folgt (vgl. den Beweis von Satz II.3.5), daß (Pn ) auf jeder kompakten Teilmenge von H gleichm¨ aßig gegen Id konvergiert. Ist also K ∈ K(H) und C = K(BH ), so gilt Pn K − K = sup Pn Kx − Kx = sup Pn y − y → 0 x∈BH
y∈C
und ferner KPn − K = (KPn − K)∗ = Pn K ∗ − K ∗ → 0. Nun setze Qn = Id − Pn . Dann ist lim Qn S = S e
n→∞
∀S ∈ L(H);
IX.3
C ∗ -Algebren
487
denn ≥“ ist klar, da Pn stets kompakt ist, und ≤“ folgt aus (K ∈ K(H) ” ” beliebig) Qn K → 0 und Qn S ≤ Qn (S − K) + Qn K ≤ S − K + Qn K , so daß lim sup Qn S ≤ S e . Daraus schließt man T 2e = T ∗ 2e = lim Qn T ∗ 2 n→∞
= lim T Qn 2 n→∞
(denn (Qn T ∗ )∗ = T Qn)
= lim (T Qn)∗ (T Qn) = lim Qn T ∗ T Qn n→∞
n→∞
≤ lim Qn T ∗ T = T ∗ T e . n→∞
Wir werden in Theorem IX.3.15 beweisen, daß es zu jeder C ∗ -Algebra A einen Hilbertraum H und einen isometrischen ∗ -Homomorphismus Φ: A → L(H) gibt. Jede C ∗ -Algebra ist“ also eine Algebra von Operatoren ” auf einem geeigneten Hilbertraum. (F¨ ur das Beispiel (d) ist das u ¨berhaupt nicht offensichtlich.) Unser erstes Ziel ist es, kommutative C ∗ -Algebren mit Einheit zu charakterisieren. Dazu definieren wir: Definition IX.3.2 Sei A eine C ∗ -Algebra. (a) x ∈ A heißt selbstadjungiert, falls x∗ = x. (b) x ∈ A heißt normal, falls xx∗ = x∗ x. Lemma IX.3.3 Sei A eine C ∗ -Algebra (mit Einheit f¨ ur Teile (b) und (c)) und x ∈ A. (a) x = x∗ , xx∗ = x 2 . (b) Ist x normal, so gelten x 2 = x2 sowie r(x) = x . (c) Ist x selbstadjungiert, so ist σ(x) ⊂ R. Beweis. (a) Wegen x 2 = x∗ x ≤ x∗ x folgt x ≤ x∗ und x∗ ≤ x∗∗ = x . Ferner gilt xx∗ = x∗∗ x∗ = x∗ 2 = x 2 . (b) W¨ortlich wie Satz VI.1.7; siehe auch Lemma IX.2.10. (c) Zun¨achst ist e∗ = e (warum?). Sei α + iβ ∈ σ(x); wir werden β = 0 zeigen. F¨ ur alle λ ∈ R gilt α + i(β + λ) ∈ σ(x + iλ), so daß |α + i(β + λ)| ≤ x + iλ (Satz IX.1.3(c)). Es folgt α2 + (β + λ)2 = |α + i(β + λ)|2 ≤ x + iλ 2 = (x + iλ)∗ (x + iλ) = x2 + λ2 e ≤ x2 + λ2 , so daß α2 + β 2 + 2βλ ≤ x2 f¨ ur alle λ ∈ R. Daher gilt β = 0.
2
488
IX.
Banachalgebren
Theorem IX.3.4 (Satz von Gelfand-Naimark, kommutative Version) A sei eine kommutative C ∗ -Algebra mit Einheit. Dann ist die Gelfandtransformation ein isometrischer ∗ -Isomorphismus; es gilt 9∗ = x x
∀x ∈ A.
(IX.4)
Es ist also A in allen Strukturen isomorph zu C(ΓA ). Beweis. Da A kommutativ ist, k¨ onnen wir die Gelfandsche Darstellungs = { theorie anwenden und A x: x ∈ A} ⊂ C(ΓA ) betrachten. Nach Lem abgeschlossen in ma IX.3.3(b) und (IX.3) ist x → x isometrisch; daher ist A C(ΓA ). Wir benutzen nun den Satz von Stone-Weierstraß (Satz VIII.4.7), dicht liegt. Es ist klar, daß A eine Unteralgebra ist, um zu zeigen, daß A daß A die Punkte von ΓA trennt und daß 1 ∈ A ist. Wenn (IX.4) gezeigt ist, folgt mit dem Satz von Stone-Weierstraß die behauptete Dichtheit und = C(ΓA ). A Nun zu (IX.4). Sei zun¨ achst x selbstadjungiert. Dann ist (IX.4) ¨aquivalent dazu, daß x reellwertig ist; und das folgt aus Lemma IX.3.3(c) sowie ∗ x−x∗ Satz IX.2.7(c). Ein beliebiges x zerlege in x = y + iz = x+x 2 + i 2i . Dann sind y und z selbstadjungiert, und (IX.4) folgt aus der Vor¨ uberlegung. 2 Korollar IX.3.5 Es existieren kompakte Hausdorffr¨aume T und Tμ und isometrische ∗ -Isomorphismen ∞ ∼ = C(T ), L∞ (μ) ∼ = C(Tμ ). Nach dem in Abschnitt VIII.7 diskutierten Satz von Banach-Stone sind T und Tμ bis auf Hom¨ oomorphie eindeutig bestimmt. Nun kommen wir noch einmal auf die C ∗ -Algebra aus Beispiel (b) zur¨ uck. Allgemeiner sei A eine C ∗ -Algebra mit Einheit e, es sei x ∈ A ein normales Element und A0 die von e, x und x∗ erzeugte C ∗ -Unteralgebra von A. Nach dem Satz von Gelfand-Naimark kann A0 als C(ΓA0 ) dargestellt werden. Um diese Darstellung etwas transparenter zu machen, zeigen wir folgenden Satz. Satz IX.3.6 (a) ΓA0 ist hom¨oomorph zu σ(x). (b) Dieser Hom¨oomorphismus induziert isometrische ∗ -Isomorphismen C(σ(x)) ∼ = C(ΓA0 ) ∼ = A0 , so daß t (bzw. t bzw. 1) ∈ C(σ(x)) auf x (bzw. x∗ bzw. e) ∈ A abgebildet werden. Beweis. (a) Nach Theorem IX.2.8 ist σA0 (x) = σ( x) = {ϕ(x): ϕ ∈ ΓA0 }, so daß x eine stetige Funktion von ΓA0 auf σA0 (x) ist. Es bleibt σA0 (x) = σ(x) (= σA (x)) und die Injektivit¨ at von x zu zeigen, da dann aus Lemma B.2.7
IX.3
C ∗ -Algebren
489
(ΓA0 ist kompakt) Teil (a) folgt. Die Gleichheit der Spektren wird im folgenden Lemma bewiesen. Nun zur Injektivit¨ at von x . Gelte also ϕ(x) = ψ(x) f¨ ur ϕ, ψ ∈ ΓA0 . Dann ist auch 9∗ )(ϕ) = x ϕ(x∗ ) = (x (ϕ) = ϕ(x) = ψ(x) = ψ(x∗ ). Daher stimmen ϕ und ψ auf endlichen Summen der Form an,m xn (x∗ )m u unden. ¨berein; also gilt ϕ = ψ aus Stetigkeitsgr¨ (b) folgt sofort aus (a). 2 Satz IX.3.6 er¨ offnet – wie in Kapitel VII – die M¨oglichkeit, Funktionen von normalen, insbesondere selbstadjungierten Elementen x einer C ∗ Algebra zu bilden; man nennt dieses Verfahren den Funktionalkalk¨ ul von x. Es ist noch ein Lemma nachzutragen; u ¨ brigens kann man auf die Normalit¨at von x in Lemma IX.3.7 verzichten, aber wir ben¨otigen nur die folgende Fassung. Lemma IX.3.7 Sei A eine C ∗ -Algebra mit Einheit e, x ∈ A normal und B ⊂ A eine C ∗ -Unteralgebra von A mit e, x ∈ B. Dann ist σB (x) = σA (x). Beweis. ⊃“ ist klar, und es reicht, die umgekehrte Inklusion f¨ ur B = A0 zu ” zeigen. Es sei Φ: C(σA0 (x)) → A0 der ∗ -Isomorphismus aus Satz IX.3.6. (Die Existenz dieses ∗ -Isomorphismus ist wirklich bereits bewiesen.) Nehmen wir an, es g¨abe λ ∈ σA0 (x) \ σA (x). Dann existiert y := (λ − x)−1 ∈ A. Seien m > y und f ∈ C(σA0 (x)) derart, daß f (λ) = m und |f (t)(λ − t)| ≤ 1 f¨ ur alle t ∈ σA0 (x). Es folgt mit g(t) = f (t)(λ − t) m ≤ f ∞ = Φ(f ) = Φ(f )(λ − x)y ≤ Φ(g) y = g ∞ y ≤ y im Widerspruch zur Wahl von m.
2
Spezialisiert man diese Betrachtungen auf die C ∗ -Algebra A = L(H) und einen normalen Operator T ∈ L(H), so erf¨ ullt der ∗ -Isomorphismus Φ: C(σ(T )) → A0 = alg(T, T ∗) ⊂ L(H) aus Satz IX.3.6 Φ(t) = T , Φ(t) = T ∗ , Φ(1) = Id. Hiermit haben wir das Analogon zu Satz VII.1.3 f¨ ur normale Operatoren gefunden. Ausgehend von Satz IX.3.6(b) kann man nun (wie in Kapitel VII) direkt die spektrale Zerlegung T = λ dEλ eines normalen Operators finden, statt wie in Satz VII.1.25 auf die Maßtheorie und den Spektralsatz f¨ ur selbstadjungierte Operatoren zur¨ uckzugreifen. Zusammenfassend erhalten wir: Korollar IX.3.8 (Spektralsatz f¨ ur normale beschr¨ankte Operatoren) Sei T ∈ L(H) normal. Dann existiert ein isometrischer ∗ -Homomorphismus Φ: C(σ(T )) → L(H) mit Φ(t) = T , Φ(t) = T ∗ , Φ(1) = Id.
490
IX.
Banachalgebren
Im letzten Teil dieses Kapitels wollen wir uns den nichtkommutativen C ∗ -Algebren widmen und zeigen, daß diese stets ∗ -isomorph zu Unteralgebren von L(H), H ein geeigneter Hilbertraum, sind. Der Beweis dieses Darstellungssatzes (Theorem IX.3.15) st¨ utzt sich – ¨ahnlich wie im kommutativen Fall – auf die Analyse gewisser Funktionale, die als n¨achstes definiert werden. Definition IX.3.9 Sei A eine C ∗ -Algebra mit Einheit e. Ein Funktional ω ∈ A heißt Zustand, falls ω(e) = ω = 1 gilt. Die Menge aller Zust¨ande wird mit S(A) bezeichnet2 . Es ist klar, daß S(A) stets eine konvexe schwach∗-kompakte Teilmenge von A ist, denn S(A) = BA ∩ {ω: ω(e) = 1}. Ist A = C(K), so sind genau die Wahrscheinlichkeitsmaße auf K Zust¨ande auf A. Beispiele f¨ ur Zust¨ ande auf A = L(H) sind die Vektorzust¨ ande ∞ ω: T → T ξ, ξ f¨ ur ξ ∈ H, ξ = 1, bzw. allgemeiner ω: T → k=1 T ξk , ξk ∞ f¨ ur k=1 ξk 2 = 1. Wir ben¨otigen einen weiteren Begriff. Definition IX.3.10 Sei A eine C ∗ -Algebra mit Einheit e. Ein selbstadjungiertes Element x ∈ A heißt positiv, falls σ(x) ⊂ [0, ∞) gilt. Nach Aufgabe IX.4.4 sind die in diesem Sinn positiven Elemente von A = C(K) tats¨achlich die positiven Funktionen. Ferner sind die positiven Elemente von A = L(H) genau die bislang positiv genannten Operatoren T , die T ξ, ξ ≥ 0 f¨ ur alle ξ ∈ H erf¨ ullen (Aufgabe IX.4.16). Lemma IX.3.11 Sei A eine C ∗ -Algebra mit Einheit e, und seien x, y ∈ A selbstadjungiert. (a) Es ist ω(x) ∈ R f¨ ur alle ω ∈ S(A), und f¨ ur alle λ ∈ σ(x) existiert ein Zustand ω mit ω(x) = λ. (b) x ist genau dann positiv, wenn ω(x) ≥ 0 f¨ ur alle Zust¨ ande ω gilt. (c) Mit x und y ist auch x + y positiv. (d) Es existieren positive x+ , x− ∈ A mit x = x+ − x− und x+ x− = x− x+ = 0. (e) x ist genau dann positiv, wenn u ∈ A mit x = u∗ u existiert. Beweis. Wir beginnen mit einer Vorbemerkung. Wir werden die von x und e erzeugte C ∗ -Algebra A0 = alg(x) betrachten. Da nach Lemma IX.3.7 σA (x) = σA0 (x) gilt, ist x genau dann in A positiv, wenn x in A0 positiv ist. Nach Satz IX.3.6 ist A0 ∗ -isomorph zu C(σ(x)), so daß x der identischen Funktion t entspricht. Diese Aussagen werden im folgenden stillschweigend benutzt. 2S
wie state.
IX.3
C ∗ -Algebren
491
(a) Ist x selbstadjungiert und ω ∈ S(A), so ist x = t ∈ C(σ(x)) reellwertig (Lemma IX.3.3) und ω0 := ω |A0 ∈ S(A0 ), d.h. ω0 ist mit einem Wahr scheinlichkeitsmaß μ auf σ(x) zu identifizieren. Es folgt ω(x) = x dμ ∈ R. Sei umgekehrt λ ∈ σ(x) = σ( x); das Funktional ω0 : a → a(λ) ist dann ein Zustand auf A0 . Sei ω eine Hahn-Banach-Fortsetzung von ω0 auf A. Es gilt dann ω = ω0 = ω(e) = 1, also ω ∈ S(A), und es ist ω(x) = x (λ) = λ. (b) Wie unter (a) sieht man ω(x) ≥ 0 f¨ ur ω ∈ S(A) und positives x; die Umkehrung ist ein Spezialfall von (a). (c) ist klar nach (b). (d) Da es solch eine Zerlegung in A0 ∼ = C(σ(x)) gibt, ist (d) √ evident. (e) Ist x positiv, so auch x ; w¨ ahle also u ∈ A0 mit u = x . Die Umkehrung ist wesentlich schwieriger zu beweisen, weil u nicht als selbstadjungiert vorausgesetzt ist. Zun¨ achst ist x = u∗ u stets selbstadjungiert, und wir schreiben x = x+ − x− wie unter (d). Wegen x+ x− = x− x+ = 0 folgt (ux− )∗ (ux− ) = x− u∗ ux− = x− (x+ − x− )x− = −x3− , so daß −(ux− )∗ (ux− ) positiv ist. Nun kann jedes Element z einer C ∗ Algebra als z = a + ib mit selbstadjungierten a und b geschrieben werden 1 (n¨amlich a = 12 (z + z ∗ ), b = 2i (z − z ∗ )). Wendet man diese Beobachtung f¨ ur z = ux− an, erh¨ alt man (ux− )∗ (ux− ) = (a + ib)∗ (a + ib) = a2 + b2 + i(ab − ba) (ux− )(ux− )∗ = (a + ib)(a + ib)∗ = a2 + b2 + i(ba − ab) = 2(a2 + b2 ) + −(ux− )∗ (ux− ) , und als Summe positiver Elemente ist dieser Ausdruck nach (c) positiv. Wir wissen nun σ (ux− )∗ (ux− ) ⊂ (−∞, 0], σ (ux− )(ux− )∗ ⊂ [0, ∞). Aber nach Lemma IX.1.5 h¨ angt das Spektrum (bis auf die 0) nicht von der Reihenfolge der Faktoren ab. Daher folgt σ(−x3− ) = σ (ux− )∗ (ux− ) = {0}, d.h. x− = 0, und x ist positiv, wie behauptet.
2
Dieses Lemma wird es gestatten, zu einem Zustand ω ein Skalarprodukt und damit einen Hilbertraum zu assoziieren. Wir setzen [x, y]ω = ω(y ∗ x)
∀x, y ∈ A.
Es ist klar, daß [ . , . ]ω sesquilinear ist, und es gilt [x, y]ω = ω(y ∗ x) = ω(a + ib) = ω(a) − iω(b) = ω(a − ib) = ω (a + ib)∗ = ω(x∗ y) = [y, x]ω ;
492
IX.
Banachalgebren
hier haben wir y ∗ x = a+ ib mit selbstadjungierten a, b ∈ A geschrieben und Lemma IX.3.11(a) benutzt. Lemma IX.3.11(b) und (e) zeigen [x, x]ω ≥ 0 f¨ ur alle x ∈ A, so daß die einzige Eigenschaft eines Skalarprodukts, die [.,.]ω noch fehlt, die Definitheit ist. In der Tat braucht [x, x]ω = 0 nicht bloß f¨ ur x = 0 zu gelten; daher definieren wir Iω = {x ∈ A: [x, x]ω = 0} und werden zum Quotientenraum A/Iω u ¨bergehen. Bevor das geschieht, formulieren wir ein weiteres Lemma, in dem die obigen Bezeichnungen beibehalten werden. Lemma IX.3.12 (a) (Cauchy-Schwarzsche Ungleichung) 1/2 [x, y]ω ≤ [x, x]1/2 ω [y, y]ω
∀x, y ∈ A
(b) Es gilt [x, x]ω = 0 genau dann, wenn [x, y]ω = 0 f¨ ur alle y ∈ A gilt. (c) Es gilt [ax, ax]ω ≤ a 2 [x, x]ω ∀a, x ∈ A. (d) Iω ist ein Untervektorraum mit a ∈ A, x ∈ Iω
⇒
ax ∈ Iω ;
mit anderen Worten ist Iω ein Linksideal in A. Beweis. (a) Im Fall [y, y]ω = 0 ist der Beweis genauso wie bei der CauchySchwarz-Ungleichung in Satz V.1.2. Falls [y, y]ω = 0, zeigt der dortige Beweis 0 ≤ [x, x]ω + λ[x, y]ω + λ[x, y]ω ∀λ ∈ C. Indem man λ = ±t, λ = ±it mit t → ∞ setzt, schließt man [x, y]ω = 0, was zu zeigen war. (b) folgt aus (a). (c) Es ist [ax, ax]ω = ω(x∗ a∗ ax), a 2 [x, x]ω = ω(x∗ a 2 x). Nun gilt ∗ a a = a 2 und deshalb σ(a∗ a) ⊂ [− a 2 , a 2 ], weswegen σ( a 2 − a∗ a) ⊂ [0, ∞) folgt. Nach Lemma IX.3.11(e) kann man a 2 − a∗ a = u∗ u f¨ ur ein u ∈ A schreiben. Damit schließt man a 2 [x, x]ω − [ax, ax]ω = ω(x∗ u∗ ux) = ω (ux)∗ (ux) ≥ 0; im letzten Schritt wurden Lemma IX.3.11(b) und (e) benutzt. (d) Teil (b) zeigt, daß Iω ein Untervektorraum ist, und (c) impliziert die linksseitige Idealeigenschaft. 2 Nun sind wir berechtigt, den Quotientenvektorraum A/Iω zu betrachten und x + Iω , y + Iω ω := [x, y]ω
IX.3
C ∗ -Algebren
493
zu definieren. Nach Konstruktion ist . , . ω ein Skalarprodukt auf A/Iω ; die Vervollst¨andigung des Pr¨ ahilbertraums A/Iω bezeichnen wir mit Hω . Das auf Hω fortgesetzte Skalarprodukt wird weiterhin als . , . ω geschrieben. Damit ist es gelungen, einem Zustand ω kanonisch einen Hilbertraum Hω zuzuordnen. Wir werden u ¨berlegen, daß die Elemente der C ∗ -Algebra A kanonisch als Operatoren auf Hω wirken. Dazu definieren wir die lineare Abbildung π ˜ω : A → L(A/Iω ),
π ˜ω (a)(x + Iω ) = ax + Iω .
Die π ˜ω (a) sind nach Lemma IX.3.12(d) wohldefiniert, und sie sind stetig nach Lemma IX.3.12(c); genauer zeigt dieses Lemma ˜ πω (a) ≤ a . In der 1/2 anderen Richtung ist ˜ πω (a) ≥ ae + Iω = [a, a]ω , denn e + Iω ≤ 1 (sogar = 1, denn e ∈ / Iω ; verwende die Neumannsche Reihe). Die π ˜ω (a) k¨onnen also zu Operatoren von Hω in sich fortgesetzt werden, die mit πω (a) bezeichnet werden. Lemma IX.3.13 πω : A → L(Hω ) ist ein stetiger ∗ -Homomorphismus, und es gilt [a, a]1/2 ∀a ∈ A. ω ≤ πω (a) ≤ a Beweis. Es ist nur noch zu verifizieren, daß πω ein ∗ -Homomorphismus ist. Nach Konstruktion ist πω (ab)(x + Iω ) = abx + Iω = πω (a)(bx + Iω ) = πω (a) πω (b)(x + Iω ) , also πω (ab) = πω (a)πω (b) f¨ ur alle a, b ∈ A. Außerdem gilt x + Iω , πω (a∗ )(y + Iω )ω = x + Iω , a∗ y + Iω ω = ω(y ∗ ax) = ax + Iω , y + Iω ω = πω (a)(x + Iω ), y + Iω ω , ∗ was πω (a∗ ) = πω (a) zeigt. (Da A/Iω dicht in Hω liegt, durften wir uns auf Elemente der Form x + Iω beschr¨ anken.) 2 Das einzige Hindernis, das es jetzt noch zu u ¨berwinden gilt, besteht darin, daß πω nicht isometrisch zu sein braucht. Um einen isometrischen ∗ -Homomorphismus von A nach L(H) zu erhalten, bilden wir die Summe“ ” der πω . Genauer betrachten wir den Hilbertraum !2 H = ω∈S(A) Hω = (ξω )ω∈S(A) : ξω ∈ Hω , ξω , ξω ω < ∞ ω∈S(A)
494
IX.
Banachalgebren
mit dem Skalarprodukt 1
2 (ξω ), (ηω ) = ξω , ηω ω . ω∈S(A)
Die Summation ist hier im Sinn von Definition V.4.6 zu verstehen. Es ist elementar zu u ufen, daß H tats¨ achlich ein Hilbertraum ist; H ist die ¨berpr¨ Hilbertsche Summe der Hω . Nun erkl¨ aren wir einen Operator π: A → L(H), π(a) (ξω )ω = πω (a)(ξω ) ω . Da alle πω ∗ -Homomorphismen sind, ist auch π ein ∗ -Homomorphismus. Ferner ist es einfach zu zeigen, daß π(a) = sup πω (a) ω∈S(A)
gilt; beachte, daß die π(a) als Diagonaloperatoren“ auf H = ” wirken. Aus Lemma IX.3.13 folgt daher sup [a, a]1/2 ω ≤ π(a) ≤ a
!2
ω∈S(A) Hω
∀a ∈ A.
ω∈S(A)
Das n¨achste Lemma impliziert, daß π isometrisch ist. 1/2
Lemma IX.3.14 Zu jedem a ∈ A existiert ein Zustand ω mit [a, a]ω a .
=
Beweis. Wir suchen einen Zustand ω mit ω(a∗ a) = a 2 = a∗ a . Betrachte die von e und x := a∗ a erzeugte C ∗ -Algebra A0 , die zu C(σ(x)) ∗ -isomorph ist. Da x selbstadjungiert und positiv ist, liegt x = r(x) in σ(x). Lemma IX.3.11(a) liefert einen Zustand ω mit ω(x) = x , was zu zeigen war. 2 Damit ist insgesamt folgendes Theorem bewiesen. (Man kann nach Aufgabe IX.4.14 auf die Forderung einer Einheit von A verzichten.) Theorem IX.3.15 (Satz von Gelfand-Naimark, nichtkommutative Version) Ist A eine C ∗ -Algebra mit Einheit, so existieren ein Hilbertraum H und ein isometrischer ∗ -Homomorphismus π: A → L(H). Die Konstruktion, die zu den Hilbertr¨ aumen Hω f¨ uhrt, wird nach den Initialen von Gelfand, Naimark und Segal, der ebenfalls Beitr¨age zur Darstellungstheorie von C ∗ -Algebren lieferte, GNS-Konstruktion genannt. Eine Darstellung (H, π) einer C ∗ -Algebra A ist ein ∗ -Homomorphismus π: A → L(H), wo H ein Hilbertraum ist; ist π isometrisch, heißt sie treu. Die
IX.3
C ∗ -Algebren
495
in Theorem IX.3.15 konstruierte treue Darstellung wird universelle Darstellung genannt, da man zeigen kann, daß sie jede andere Darstellung enth¨alt. Der Preis dieser Universalit¨ at ist, daß der der universellen Darstellung zugrundeliegende Hilbertraum h¨ ochst inseparabel und deshalb h¨aufig nicht der nat¨ urlichste Darstellungsraum ist. Beispiel. Wir wollen nun ein Beispiel einer GNS-Konstruktion durchrechnen, um diesen Effekt zu studieren. Wir betrachten die endlichdimensionale C ∗ -Algebra A = L(Cn ); es sei {e1 , . . . , en } die kanonische Einheitsvektorbasis des Cn . Sei 1 1 T ek , ek = tr(T ); n n n
ω(T ) =
k=1
tr bezeichnet die Spur. Diesem Zustand ω wird die Sesquilinearform 1 Sek , T ek n n
[S, T ]ω = ω(T ∗ S) =
k=1
zugeordnet. Hier ist Iω = {T : ω(T ∗ T ) = 0} = {0}; also ist [ . , . ]ω in diesem Fall bereits ein Skalarprodukt, und man braucht nicht den Quotientenraum A/Iω heranzuziehen. Dieses Skalarprodukt ist wohlbekannt: Bis auf den Faktor n1 ist es nichts anderes als das Hilbert-Schmidt-Skalarprodukt aus √ Satz VI.6.2(f). Des weiteren ist Hω = A, aber mit dem 1/ n-fachen der Hilbert-Schmidt-Norm . HS versehen, und nicht mit der Operatornorm. Die C ∗ -Algebra A wirkt auf Hω (= sich selbst) mittels πω (T )(S) = T S, T ∈ A, S ∈ Hω , und f¨ ur die Norm gilt πω (T ) = sup S
T S HS = T S HS
∀T ∈ A,
wie man unschwer best¨ atigt. Daher ist πω selbst isometrisch und stellt L(Cn ) treu u ¨ ber dem n2 -dimensionalen Hilbertraum HS(Cn ) der HilbertSchmidt-Operatoren auf Cn dar. F¨ ur die universelle Darstellung erh¨alt man einen nicht separablen Hilbertraum, da es u ¨berabz¨ahlbar viele Zust¨ande gibt. Zum Schluß notieren wir ein Beispiel einer C ∗ -Algebra, die nur auf nicht separablen Hilbertr¨ aumen treu dargestellt werden kann. (F¨ ur ein positives Resultat vgl. Aufgabe IX.4.19.) Satz IX.3.16 Ist π: L(2 )/K(2 ) → L(H) ein isometrischer ∗ -Homomorphismus auf der Calkin-Algebra, so ist der Hilbertraum H nicht separabel.
496
IX.
Banachalgebren
Beweis. Die Calkin-Algebra L(2 )/K(2 ) wurde in Beispiel (d) eingef¨ uhrt. F¨ ur eine Teilmenge N ⊂ N bezeichne PN die Orthogonalprojektion von 2 auf lin{ek : k ∈ N }. Dann hat QN := PN + K(2 ) ∈ L(2 )/K(2 ) die Eigenschaften Q2N = QN , Q∗N = QN . π(QN ) besitzt nun dieselben Eigenschaften und ist daher eine Orthogonalprojektion in L(H). Bemerke, daß QN genau f¨ ur endliche N ⊂ N verschwindet. In Lemma IV.6.6 wurde eine u ¨berabz¨ahlbare Familie von unendlichen Teilmengen Ni ⊂ N konstruiert, so daß Ni ∩ Nj f¨ ur i = j endlich ist. Es ist also QNi QNj = QNj QNi = 0 f¨ ur i = j und QNi = 0 f¨ ur alle i. Folglich gibt es u ¨berabz¨ahlbar viele Orthogonalprojektionen = 0 mit paarweise orthogonalen Bildern in L(H), und H kann nicht separabel sein. 2
IX.4
Aufgaben
Aufgabe IX.4.1 Betrachte auf C 1 [0, 1] die punktweise Multiplikation (f g)(t) = f (t)g(t) und die Normen f = max{f ∞ , f ∞ } sowie |||f ||| = f ∞ + f ∞ . Welche dieser Normen macht C 1 [0, 1] zu einer Banachalgebra? Aufgabe IX.4.2 Auf p , 1 ≤ p < ∞, definiere die Multiplikation (xy)(n) = x(n)y(n). Zeige, daß p mit der kanonischen Norm so zu einer Banachalgebra wird. Bestimme alle Homomorphismen ϕ: p → C. Aufgabe IX.4.3 Auf dem Raum M (R) aller komplexen Borelmaße auf R, versehen mit der Variationsnorm, erkl¨ are das Faltungsprodukt durch
(μ ∗ ν)(E) =
χE (s + t) dμ(s)dν(t), R
R
wo E ⊂ R eine Borelmenge ist. (a) Beweise, daß M (R) mit dem Faltungsprodukt eine kommutative Banachalgebra ist. Besitzt sie eine Einheit? (b) Der Operatorvon L1 (R) nach M (R), der f ∈ L1 (R) auf das absolutstetige Maß μ: E → E f (t) dt abbildet, ist ein isometrischer Algebrenhomomorphismus bzgl. der Faltungsprodukte. (c) Auf diese Weise kann L1 (R) mit einem abgeschlossenen Ideal von M (R) identifiziert werden. Aufgabe IX.4.4 Zeige σ(f ) = {f (t): t ∈ T } f¨ ur f ∈ C(T ), wo T ein kompakter Hausdorffraum ist und C(T ) mit der punktweisen Multiplikation und der Supremumsnorm versehen ist. Aufgabe IX.4.5 Zeige, daß in einer Banachalgebra im allgemeinen σ(xy) = σ(yx) gilt. Aufgabe IX.4.6 Sei A eine Banachalgebra mit Einheit und a ∈ A. Der Operator La : A → A sei durch La (x) = ax erkl¨ art. Zeige La = a und σ(La ) = σ(a).
IX.4
Aufgaben
497
Aufgabe IX.4.7 Betrachte die Faltungsalgebra A = 1 (Z) und die Unteralgebra B = {(sn ) ∈ 1 (Z): sn = 0 ∀n < 0} = 1 (N0 ). Zeige σA (e1 ) = σB (e1 ). Aufgabe IX.4.8 Auf dem Raum A aller komplexen Folgen x = (xn )n≥0 mit ∞ n 2 x := |xn |e−n < ∞ betrachte die Faltung (x ∗ y)n = x y als n=0 k=0 k n−k Multiplikation. (a) (A, ∗ , . ) ist eine kommutative Banachalgebra mit Einheit. (b) J = {x: x0 = 0} ist ein maximales Ideal, und jedes x ∈ J hat den Spektralradius r(x) = 0. (c) F¨ ur x = (x0 , x1 , x2 , . . .) ist σ(x) = x0 . (d) Die Gelfandtransformation verschwindet auf J; insbesondere ist sie nicht injektiv. Aufgabe IX.4.9 Auf der Faltungsalgebra A = 1 (Z) definiere x∗ (n) = x(−n). Dann ist x → x∗ eine isometrische Involution. Macht sie 1 (Z) zu einer C ∗ Algebra? Aufgabe IX.4.10 In dieser Aufgabe diskutieren wir den Quaternionenschiefk¨ orper H. Das ist der Raum R4 , der mit folgender Multiplikation ausgestattet wird: Man schreibe (a, b, c, d) ∈ R4 als a + ib + jc + kd, definiere i2 = j 2 = k2 = −1, ij = −ji = k, jk = −kj = i, ki = −ik = j und setze linear fort. Versieht man H mit der euklidischen Norm des R4 , gilt xy ≤ x y f¨ ur alle x, y ∈ H. Man kann nun H auch als zweidimensionalen komplexen Raum auffassen, so daß wir eine zweidimensionale komplexe Banachalgebra erhalten, in der jedes Element invertierbar ist. Das widerspricht aber dem Satz von Gelfand-Mazur. Was stimmt hier nicht? ¨ (Uber Quaternionen kann man in H.-D. Ebbinghaus et al., Zahlen, Springer 1983, nachlesen.) Aufgabe IX.4.11 Betrachte die Disk-Algebra A(D) aus Beispiel I.1(e). (a) Zu f ∈ A(D) und 0 < r < 1 definiere fr (z) = f (rz). Dann ist fr ∈ A(D) und limr→1 fr = f . (b) Die Menge U aller Funktionen f ∈ A(D), die in einer (von f abh¨ angigen) offenen Umgebung von D analytisch sind, bilden einen dichten Unterraum von A(D). (c) F¨ ur |z| ≤ 1 ist ϕz : f → f (z) ein komplexer Homomorphismus auf A(D). (d) Jeder komplexe Homomorphismus ϕ = 0 auf A(D) ist von der Gestalt ϕz , |z| ≤ 1, und ΓA(D) ist hom¨ oomorph zu D. (Hinweis: Betrachte die identische Funktion ζ: z → z und setze z0 = ϕ(ζ). Zeige dann zuerst ϕ = ϕz0 auf U ; betrachte dazu die Potenzreihe der f ∈ U .) (e) Beschreibe die Gelfandtransformation auf A(D). Aufgabe IX.4.12 Beschreibe die Gelfandtransformation der Algebra B aus Aufgabe IX.4.7.
498
IX.
Banachalgebren
Aufgabe IX.4.13 Eine mit einer Involution x → x∗ versehene Banachalgebra A, die x∗ x ≥ x2 ∀x ∈ A erf¨ ullt, ist eine C ∗ -Algebra. Aufgabe IX.4.14 Sei A eine Banachalgebra ohne Einheit und A1 = A ⊕ C. (a) Definiert man auf A1 das Produkt (a, s)(b, t) = (ab + ta + sb, st) und die Norm (a, s) = a + |s|, so ist (A1 , . ) eine Banachalgebra mit Einheit, und a → (a, 0) ist ein isometrischer Algebrenhomomorphismus von A auf das Ideal A ⊕ {0} von A1 . (b) Ist A sogar eine C ∗ -Algebra, so definiert (a, s)∗ = (a∗ , s) eine isometrische Involution auf (A1 , . ), aber (A1 , . ) ist keine C ∗ -Algebra. (c) Man kann auf folgende Weise eine C ∗ -Algebrennorm auf A1 erhalten, so daß a → (a, 0) ist ein isometrischer ∗ -Homomorphismus ist. Wir fassen A als Unteralgebra von A1 auf. Betrachte zu a ∈ A1 den Operator La : A → A, La (x) = ax. Zeige als erstes La = a f¨ ur alle a ∈ A. Setze nun |||a||| = La f¨ ur alle a ∈ A1 und beweise, daß es sich um eine C ∗ Algebrennorm handelt; begr¨ unde insbesondere, warum ||| . ||| eine Norm ist. Kurz gesagt kann also jede C ∗ -Algebra ohne Einheit zu einer C ∗ -Algebra mit Einheit erweitert werden. Aufgabe IX.4.15 Zeige, daß ein kompakter Hausdorffraum K mit C b ((0, 1]) ∼ = C(K) existiert. Kann K = [0, 1] gew¨ ahlt werden? Aufgabe IX.4.16 Sei H ein Hilbertraum und T ∈ L(H) selbstadjungiert. Dann ist T ξ, ξ ≥ 0 f¨ ur alle ξ ∈ H genau dann, wenn ω(T ) ≥ 0 f¨ ur alle Zust¨ ande auf L(H) gilt. Schließe, daß T positiv im Sinn von Definition IX.3.10 genau dann ist, wenn T ξ, ξ ≥ 0 f¨ ur alle ξ ∈ H gilt. (Hinweis: Setze ωξ (S) = Sξ, ξ f¨ ur ξ = 1 und zeige S(L(H)) = co{ωξ : ξ = 1} (schwach∗ -Abschluß). Dazu verwende den Satz von Hahn-Banach und Lemma VII.1.1.) Aufgabe IX.4.17 (Die CAR-Algebra) n Sei n ∈ N0 und M ∈ L C2 , also eine (2n × 2n )-Matrix. Wir werden einen Operator TM auf 2 definieren, der als Inflation“ der Matrix M entsteht. Es sei ” {e1 , e2 , . . .} die Einheitsvektorbasis des 2 und Uk,n = lin{e(k−1)2n +1 , . . . , ek2n }; ! n 2 dann ist 2 ∼ U . Identifiziert man jedes Uk,n kanonisch mit C2 , wird = k∈N k,n durch TM : (uk,n )k → (M uk,n )k , uk,n ∈ Uk,n , ein Operator TM ∈ L(2 ) definiert. (Es ist sich TM als unendliche Matrix hilfreich, n vorzustellen.) Setze An = TM : M ∈ L C2 .
n
(a) An ist eine C ∗ -Unteralgebra von L(2 ), die zu L C2 (b) Es gilt A0 ⊂ A1 ⊂ A2 ⊂ . . . , A∞ := A := A∞ ist eine C ∗ -Algebra.
∗
-isomorph ist.
An ist eine Algebra, und n
499
IX.5 Bemerkungen und Ausblicke
(c) Es existiert ein Zustand ω ∈ A mit 1 T el , el m m
ω(T ) = lim
m→∞
∀T ∈ A.
l=1
(Untersuche die rechte Seite zuerst f¨ ur T ∈ An .) (d) Dieser Zustand erf¨ ullt ω(ST ) = ω(T S) f¨ ur alle S, T ∈ A, weswegen er Spurzustand genannt wird. (Vgl. die entsprechenden Eigenschaften der Spur tr aus Satz VI.5.8(c); jedoch ist tr nicht auf der ganzen C ∗ -Algebra L(2 ) definiert, sondern nur auf N (2 ).) Die Algebra A wird CAR-Algebra (oder Fermionenalgebra) genannt, da in ihr die Fermionen auszeichnenden canonical anticommutator relations formuliert werden k¨ onnen. Sie hat einige bemerkenswerte Eigenschaften, von denen eine in Teil (d) vorkommt. Die CAR-Algebra wird detailliert in Bratteli/Robinson [1981] und Kadison/Ringrose [1986] studiert. Aufgabe IX.4.18 Betrachte den Vektorzustand ω: T → T ξ, ξ auf der C ∗ Algebra L(H). F¨ uhre die GNS-Konstruktion f¨ ur diesen Zustand durch. Aufgabe IX.4.19 Sei A eine separable C ∗ -Algebra mit Einheit. Dann existiert ein isometrischer ∗ -Homomorphismus π: A → L(2 ). !2 (Hinweis: Verwende die GNS-Konstruktion und betrachte H = Hω f¨ ur eine ω∈Ω geeignete abz¨ ahlbare Teilmenge Ω von Zust¨ anden.) Aufgabe IX.4.20 (Toeplitz-Operatoren) Sei H der von den Funktionen z → z n , n ≥ 0, aufgespannte abgeschlossene Unterraum von L2 (T) und P die Orthogonalprojektion von L2 (T) auf H. F¨ ur f ∈ C(T) heißt der Operator Tf : H → H, ϕ → P (f ϕ), Toeplitz-Operator. Zeige, daß π: C(T) → L(H)/K(H), π(f ) = Tf + K(H), ein stetiger ∗ -Homomorphismus der C ∗ -Algebra C(T) in die Calkin-Algebra ist. Ist auch f → Tf ein stetiger ∗ -Homomorphismus? (Hinweis: Untersuche zun¨ achst f (z) = z r , r ∈ Z.)
IX.5
Bemerkungen und Ausblicke
Die Theorie der Banachalgebren wurde 1941 von Gelfand entwickelt (Mat. Sbornik 9 (1941) 3–24); diese Arbeit enth¨ alt praktisch alle Resultate der Abschnitte IX.1 und IX.2. Wiener bewies Korollar IX.2.9 in Ann. Math. 33 (1932) 1–100, insbesondere S. 10–14, mit Methoden der harten“ Analysis; ” der elegante banachalgebraische Beweis stammt von Gelfand (Mat. Sbornik 9 (1941) 51–66). Der Satz von Gelfand-Mazur wurde auch von Mazur (C. R. Acad. Sc. Paris 207 (1938) 1025–1027) angek¨ undigt, jedoch ver¨offentlichte er keinen Beweis. Seine Arbeit inklusive vollst¨andiger Beweise war n¨amlich zu umfangreich, um in den Comptes Rendus zu erscheinen; daher verlangten die Herausgeber eine Straffung des Texts. Diese Informationen findet man
500
IX.
Banachalgebren
˙ in Zelazko [1973], S. 18, der fortf¨ ahrt: The only sensible way of a shorten” ing was to leave out all the proofs, and the paper was finally so published.“ Erst 35 Jahre sp¨ ater wurde Mazurs Beweis tats¨achlich ver¨offentlicht, und ˙ zwar auf S. 19–22 in Zelazkos Buch. Mazurs Zugang funktioniert auch im reellen Fall und zeigt, daß die einzigen Banachalgebren u ¨ber dem K¨orper R, in denen jedes von 0 verschiedene Element ein Inverses besitzt, endlichdimensional und daher nach dem Satz von Frobenius R, C und die Quaternionenalgebra H sind. Zur Darstellung von Mazurs Originalbeweis siehe auch P. Mazet, Gaz. Math., Soc. Math. de France, 111 (2007) 5–11. Die Darstellungstheorie f¨ ur kommutative Banachalgebren l¨aßt sich auch f¨ ur Algebren ohne Einheit durchf¨ uhren. Allerdings muß man sich jetzt auf gewisse Ideale beschr¨ anken, die man modular nennt, denn im allgemeinen ist nun nicht mehr jedes Ideal in einem maximalen Ideal enthalten. (Bourbaki gibt in Th´eories Spectrales, S. 95, Aufgabe 2, das Beispiel des Ideals d aller abbrechenden Folgen in c0 .) Es stellen sich jedoch die maximalen modularen Ideale als genau die Kerne der von 0 verschiedenen komplexen Homomorphismen heraus. Definiert man den Gelfandraum und die Gelfandtransformation wie im Fall der kommutativen Algebren mit Einheit, erh¨alt man einen lokalkompakten Raum ΓA und eine Abbildung ∧ : A → C0 (ΓA ). Im Fall A = L1 (R) ist, wie in Beispiel IX.2(d) erw¨ahnt, ΓA hom¨oomorph zu R verm¨oge ϕ ∈ ΓA ⇔ ϕ(f ) = ϕt (f ) = e−ist f (s) ds, R
es ist also f(ϕt ) = e−ist f (s) ds. Die Fouriertransformation ist daher ein Spezialfall der Gelfandtransformation; die Aussage f ∈ C0 (R) ist das klassische Riemann-Lebesgue-Lemma (Satz V.2.2) und f¨allt hier als Nebenprodukt ab. Details hierzu kann man etwa bei Conway [1985] nachlesen. 1943 ver¨offentlichten Gelfand und Naimark (Mat. Sbornik 12 (1943) 197–213) ihre Theorie der C ∗ -Algebren, wie in Abschnitt IX.3 dargelegt. Die Tatsache, daß u∗ u stets positiv ist, taucht bei ihnen noch als eines der Axiome f¨ ur C ∗ -Algebren auf, und 1953 konnte Kaplansky zeigen, daß diese Zusatzvoraussetzung automatisch erf¨ ullt ist (vgl. Lemma IX.3.11(e)). Vorher hatte Calkin (Ann. Math. 42 (1941) 839–873) mit Hilfe von Banachlimiten (Aufgabe III.6.5) bereits einen nichtseparablen Hilbertraum H und einen isometrischen ∗ -Homomorphismus der Calkin-Algebra L(2 )/K(2 ) nach L(H) konstruiert. Der kommutative“ Satz von Gelfand-Naimark, ” Theorem IX.3.4, ist eines der Lemmata aus ihrer Arbeit. Ist A eine kommutative C ∗ -Algebra ohne Einheit, so kann man zeigen, daß A isometrisch ∗ ¨ -isomorph zu C0 (ΓA ) ist. Ubrigens werden C ∗ -Algebren in der a¨lteren Literatur auch B ∗ -Algebren genannt. Segal (Bull. Amer. Math. Soc. 53 (1947) 73–88) perfektionierte die Darstellungstheorie f¨ ur C ∗ -Algebren mit Hilfe der GNS-Konstruktion. Als be-
IX.5
501
Bemerkungen und Ausblicke
sonders wichtig erweisen sich die reinen Zust¨ ande, d.h. die ω ∈ ex S(A), die nach dem Satz von Krein-Milman (Theorem VIII.4.4) ja stets in ausreichender Zahl existieren. Genau f¨ ur solche ω haben n¨amlich die Darstellungen πω : A → L(Hω ) die Eigenschaft, daß K = {0} und K = Hω die einzigen abgeschlossenen Unterr¨ aume von Hω mit πω (a) (K) ⊂ K f¨ ur alle a ∈ A sind. Diese Eigenschaft nennt man Irreduzibilit¨at der Darstellung. Die Normeigenschaft x∗ x = x 2 f¨ ur Elemente einer C ∗ -Algebra A mag harmlos aussehen; tats¨ achlich impliziert sie jedoch eine sehr enge Kopplung der algebraischen und der metrischen Eigenschaften von A, wie aus Lemma IX.3.3(b) folgt. Dieses Lemma liefert n¨amlich 1/2 x = x∗ x 1/2 = r(x∗ x)
∀x ∈ A,
und hier ist die rechte Seite allein durch algebraische Gr¨oßen bestimmt, w¨ahrend in die linke Seite nur die Norm eingeht. Es folgt, daß es h¨ochstens eine Norm auf einer involutiven Banachalgebra (mit Einheit) gibt, die diese zu einer C ∗ -Algebra macht, und daß jeder ∗ -Homomorphismus Φ zwischen C ∗ -Algebren (mit Einheit) stetig ist und sogar Φ ≤ 1 erf¨ ullt. In der allgemeinen Banachalgebrentheorie macht der sehr viel schwierigere Eindeutigkeitssatz von B. Johnson (1967) eine verwandte Aussage. • Ist A eine halbeinfache Banachalgebra mit Einheit, so sind je zwei Banachalgebrennormen auf A ¨ aquivalent. Einen kurzen Beweis hierf¨ ur gibt Ransford, Bull. London Math. Soc. 21 (1989) 487–488. (Im nichtkommutativen Fall heißt eine Banachalgebra mit Einheit halbeinfach, wenn der Schnitt aller maximalen Linksideale nur die 0 umfaßt.) In Korollar IX.3.5 wurde als Folge des Satzes von Gelfand-Naimark beobachtet, daß die Algebra ∞ als C(T ) dargestellt werden kann. Schreibt man die Gelfandtransformation f¨ ur diesen Fall auf, sieht man folgende bizarre Eigenschaft des topologischen Raums T . Zun¨achst enth¨alt T die Homomorphismen δn : x → x(n), n ∈ N. Die Menge T0 dieser δn ist in der schwach∗-Topologie hom¨ oomorph zu N. Ferner folgt aus dem Satz von Tietze-Urysohn, daß T0 dicht in T liegt. Nach der Identifizierung von T0 mit N k¨onnen wir T als kompakten Hausdorffraum ansehen, in dem N dicht ˇ liegt; man nennt T die Stone-Cech-Kompaktifizierung von N und schreibt T = βN. Vermittels der Gelfandtransformation erkennt man, daß jede beschr¨ankte Folge (= jede stetige beschr¨ ankte Funktion auf N) zu einer stetigen beschr¨ankten Funktion auf βN fortgesetzt werden kann; offenbar hat die einfachste Kompaktifizierung N ∪ {∞} diese Eigenschaft nicht. Genauso kann man f¨ ur einen normalen Hausdorffraum (oder allgemeiner einen sog. vollst¨andig regul¨ aren topologischen Raum) T0 und die C ∗ -Algebra C b (T0 ) ˇ argumentieren und so die Stone-Cech-Kompaktifizierung βT0 erhalten, der dieselbe Fortsetzungseigenschaft zukommt. βT0 ist ein recht kompliziertes
502
IX.
Banachalgebren
Gebilde. Es ist nie metrisierbar (es sei denn, T0 ist bereits kompakt (und metrisierbar)), und der Abschluß einer offenen Teilmenge von βN ist selbst offen; diese letzte Eigenschaft stellt einige Anforderungen an die Vorstellungskraft. Bereits vor Gelfand hatte von Neumann gewisse (konkrete) C ∗ -Unteralgebren von L(H) untersucht, die man heute von-Neumann-Algebren nennt. Sein Ausgangspunkt war sein Bikommutantensatz (Math. Ann. 102 (1929) 370–427). Die Kommutante einer Teilmenge M ⊂ L(H) ist als M = {T ∈ L(H): T S = ST
∀S ∈ M }
definiert. (Dieses Objekt wird in der Literatur meistens mit M bezeichnet, was jedoch mit unserem Symbol f¨ ur einen Dualraum kollidiert.) Es ist klar, daß M stets eine Unteralgebra von L(H) ist, die in der schwachen Operatortopologie abgeschlossen ist und den identischen Operator enth¨alt. • (Bikommutantensatz) F¨ ur eine C ∗ -Unteralgebra A von L(H) mit Id ∈ A sind ¨ aquivalent: (i) A ist in der starken Operatortopologie abgeschlossen. (ii) A ist in der schwachen Operatortopologie abgeschlossen. (iii) A = A . Ist eine dieser Bedingungen erf¨ ullt, heißt A eine von-Neumann-Algebra (oder W ∗ -Algebra). Sakai gelang es 1956, von-Neumann-Algebren abstrakt zu charakterisieren. • Genau dann besitzt eine C ∗ -Algebra A eine treue Darstellung als von-Neumann-Algebra, wenn A als Banachraum isometrisch isomorph zu einem Dualraum ist, d.h., wenn ein Banachraum X mit A∼ = X existiert. Ist π: A → L(H) die universelle Darstellung einer C ∗ -Algebra A, so ist π(A) eine von-Neumann-Algebra, die man die universell einh¨ ullende vonNeumann-Algebra nennt. Sie ist – als Banachraum – isometrisch isomorph zum Bidualraum A von A. Im Gegensatz zu C ∗ -Algebren von Operatoren enthalten von-NeumannAlgebren stets Projektionen. Ist z.B. A ⊂ L(H) eine von-Neumann-Algebra, T ∈ A selbstadjungiert und T = λ dEλ die spektrale Zerlegung von T , so liegt f¨ ur alle Borelmengen B ⊂ σ(T ) die Orthogonalprojektion EB in A. In einer Reihe von Arbeiten analysierten Murray und von Neumann in den dreißiger Jahren von-Neumann-Algebren mit Hilfe des Verbands der in ihnen enthaltenen Orthogonalprojektionen. Sie widmeten sich insbesondere den maximal nichtkommutativen Algebren, den Faktoren, die durch die Forderung A ∩ A = C · Id definiert sind, und sie zeigten, daß diese in drei Klassen, die die technischen Bezeichnungen Typ I, II und III tragen, zerfallen. Ein Faktor vom Typ I ist ∗ -isomorph zu L(H0 ) f¨ ur einen geeigneten
IX.5
Bemerkungen und Ausblicke
503
Hilbertraum H0 , der eventuell endlichdimensional ist. Wesentlich interessanter sind die Faktoren vom Typ II, denn diese lassen Funktionale mit ¨ahnlichen Eigenschaften wie die Spur tr zu, die Anlaß zu einer nichtkom” mutativen Integrationstheorie“ geben. Die Feinstruktur der Faktoren vom ´ Typ III wurde von Connes studiert (Ann. Sci. Ecole Norm. Sup. 6 (1973) 133–252); diese sind f¨ ur die Quantenfeldtheorie besonders bedeutsam. Die Untersuchungen von Neumanns waren, zumindest zum Teil, durch die theoretische Physik motiviert. In den Bemerkungen und Ausblicken zu Kapitel VII wurde dargelegt, wie sich die Quantenmechanik selbstadjungierte Operatoren (= Observable) und normierte Vektoren im Hilbertraum (= Zust¨ande) zunutze macht. In diesem Bild wirken die Observablen auf die Zust¨ande; h¨aufig ist auch die duale Formulierung, in der Zust¨ande auf Observablen wirken, wichtig, insbesondere in der Quantenfeldtheorie. In dem dualen Bild geht man von einer C ∗ -Algebra oder von-Neumann-Algebra A aus, die die Gesamtheit der f¨ ur das physikalische System relevanten Observablen umfaßt; ein Zustand (im physikalischen Sinn) ist dann ein Zustand im Sinn von Definition IX.3.9. Man beachte, wie ein Vektorzustand auf L(H) die auf S. 389 erhobene Forderung, daß ξ und λξ, |λ| = 1, denselben Zustand repr¨asentieren sollen, erf¨ ullt, da ja ωξ (T ) = T ξ, ξ = T (λξ), λξ = ωλξ (T ). Die Dynamik des Systems wird nun durch eine Gruppe {σt : t ∈ R} von ∗ -Isomorphismen der Algebra A ausgedr¨ uckt. Die tiefliegende Tomita-Takesaki-Theorie gestattet es, zu Zust¨ anden auf von-Neumann-Algebren Automorphismengruppen zu assoziieren. An dieser Stelle mag man einwenden, daß die typischen Operatoren der Quantenmechanik unbeschr¨ ankt sind. Man hilft sich, indem man beschr¨ankte Funktionen solcher Operatoren bildet. Ist etwa T ein unbeschr¨ankter selbstadjungierter Operator und h ∈ C b (σ(T )), so ist nach Theorem VII.3.2 ein beschr¨ankter Operator h(T ) erkl¨ art. Man betrachtet dann {h(T ): h ∈ C b (σ(T ))}. (Die entsprechende Konstruktion f¨ ur mehrere nicht kommutierende Operatoren ist schwieriger.) Einen Einstieg in die C ∗ -Algebrentheorie bieten Murphy [1990] oder Kadison/Ringrose, Band 1 [1983]; weitergehende Darstellungen findet man ¨ in Pedersen [1979] und Kadison/Ringrose, Band 2 [1986]. Uberblicksartikel ∗ versammelt der von Doran herausgegebene Band C -Algebras: 1943–1993, ¨ Contemporary Math. 167 (1994); man beachte auch Bonsalls Ubersicht zu Banachalgebren schlechthin in Bull. London Math. Soc. 2 (1970) 257–274. F¨ ur die Bedeutung der C ∗ - und von-Neumann-Algebren f¨ ur die Physik sei auf Bratteli/Robinson [1979, 1981] verwiesen. Die Aufl¨osungstheorie von Operatorgleichungen der Form T x = y bedient sich der Spektraltheorie in der Banachalgebra L(X), insbesondere wenn kompakte Operatoren beteiligt sind. F¨ ur gewisse singul¨are Integralgleichungen spielt auch die Calkin-Algebra eine große Rolle. Um diesen
504
IX.
Banachalgebren
Zusammenhang zu erl¨ autern, ben¨ otigt man den Begriff des Fredholmoperators. Ein Operator T auf einem Banachraum X heißt Fredholmoperator, falls ran(T ) abgeschlossen ist und ker(T ) und X/ran(T ) endlichdimensional sind; u ¨ brigens folgt die erste dieser Eigenschaften nach einem Satz von Kato automatisch aus der letzten. Die ganze Zahl ind(T ) = dim ker(T ) − dim X/ran(T ) (= dim ker(T ) − dim ker(T )) heißt dann der Index von T . Ist z.B. Tf der Toeplitz-Operator aus Aufgabe IX.4.20 und verschwindet f nirgends, so ist Tf ein Fredholmoperator, dessen Index gleich dem Negativen der aus der Funktionentheorie bekannten Umlaufzahl der durch t → f (eit ), 0 ≤ t ≤ 2π, parametrisierten Kurve um 0 ist. Man kann zeigen, daß die Komposition von zwei Fredholmoperatoren U und T wieder ein Fredholmoperator mit dem Index ind(U T ) = ind(U ) + ind(T ) ist, und der adjungierte Operator T ist ein Fredholmoperator mit ind(T ) = − ind(T ). Ferner ist die Menge aller Fredholmoperatoren offen, und der Index ist eine stetige Z-wertige Funktion. Das bedeutet mit anderen Worten, daß es zu einem Fredholmoperator T ein ε > 0 gibt, so daß jeder Operator S mit S − T < ε ebenfalls ein Fredholmoperator mit demselben Index ist; der Index bleibt also unter kleinen“ St¨ orungen invariant. Ein anderes ” St¨orungsresultat bezieht sich auf kompakte Operatoren: Ist K kompakt, so gilt ind(T + K) = ind(T ). Dieses Resultat schließt insbesondere den Satz von Riesz-Schauder (Satz VI.2.1) ein; man muß nur T = Id setzen. Eine wichtige Charakterisierung von Fredholmoperatoren liefert der Satz von Atkinson: • Ein Operator T ∈ L(X) ist genau dann ein Fredholmoperator, wenn ein Operator S ∈ L(X) existiert, so daß ST − Id und T S − Id kompakt sind. Ein solcher Operator S wird Fredholm-Inverse oder Parametrix genannt. Der Satz von Atkinson l¨ aßt sich besonders durchsichtig mittels der Quotienten-Banachalgebra L(X)/K(X) formulieren: • T ∈ L(X) ist genau dann ein Fredholmoperator, wenn die entspre¨ chende Aquivalenzklasse [T ] in der Banachalgebra L(X)/K(X) invertierbar ist. Die Untersuchung des Spektrums von [T ] gestattet weitere Aufschl¨ usse u ¨ber das Spektrum eines Operators; man nennt σess (T ) := σ([T ]) das wesentliche Spektrum von T . (Dieser Begriff wird in der Literatur nicht einheitlich verwendet.) Zum Beispiel ist jedes Element von ∂σ(T ) \ σess (T ) ein isolierter Punkt des Spektrums und ein Eigenwert von T . Detaillierte Informationen zu Fredholmoperatoren findet man unter anderem in Heuser [1992], J¨orgens [1970] oder Conway [1985].
Anhang A
Maß- und Integrationstheorie
A.1
Das Lebesgueintegral fu ¨r Funktionen auf einem Intervall
Dieser Anhang umreißt in groben Z¨ ugen diejenigen Teile der Maß- und Integrationstheorie, die f¨ ur das Verst¨ andnis dieses Buches wesentlich sind. Alle hier ausgesparten Einzelheiten k¨ onnen in diversen Lehrb¨ uchern nachgelesen werden; es seien etwa Bauer [1990], Behrends [1987], Cohn [1980] oder Rudin [1986] genannt. 1 Wenn man das Riemannintegral 0 f (t) dt f¨ ur eine beschr¨ankte Funktion f definieren will, geht man bekanntlich folgendermaßen vor. Der Urbildbereich [0, 1] wird in kleine Teilintervalle der L¨ange < δ zerlegt und f durch eine Treppenfunktion ϕδ , die auf dem Inneren der Teilintervalle konstant
f
(etc.) ϕδ
ist, approximiert (siehe Abbildung). Anschließend definiert man auf kanoni1 sche Weise 0 ϕδ (t) dt und zeigt, daß f¨ ur eine große Klasse von Funktionen 1 (u.a. alle stetigen Funktionen auf [0, 1]) limδ→0 0 ϕδ (t) dt existiert und unabh¨angig von der approximierenden Folge (ϕδ ) ist; diese Zahl wird dann
D. Werner, Funktionalanalysis, 7. Aufl., Springer-Lehrbuch, DOI 10.1007/978-3-642-21017-4, © Springer-Verlag Berlin Heidelberg 2011
506
Anhang A.
Maß- und Integrationstheorie
1 mit 0 f (t) dt bezeichnet. (Die Einf¨ uhrung u ¨ber Ober- und Untersummen ist nur eine technische Modifikation dieses Konzepts.) Die St¨arken des Riemannintegrals sind bekannt: die Einf¨ uhrung ist sehr anschaulich, und man kann mit recht geringem Aufwand wichtige Resultate, z.B. den Hauptsatz der Differential- und Integralrechnung, beweisen. In der h¨oheren Analysis erweist sich das Riemannsche Integral jedoch als sehr schwerf¨allig. Zum einen ist die Definition des Riemannintegrals auf Bereichen Ω ⊂ Rd schon weitaus schwieriger zu verdauen, was als Konsequenz sehr technische Beweise f¨ ur Resultate wie etwa den Satz von Fubini (selbst im Fall stetiger Integranden) nach sich zieht. Zum anderen zeigt sich die Notwendigkeit, Limes- und Integralbildung zu vertauschen; man braucht also Kriterien, die 1 1 lim fn (t) dt = lim fn (t) dt n→∞
0 n→∞
0
sicherstellen. (Hinreichend ist nat¨ urlich die gleichm¨aßige Konvergenz.) Das entscheidende Manko des Riemannintegrals ist nun, daß selbst f¨ ur stetige fn die Grenzfunktion f (t) := limn→∞ fn (t) im Riemannschen Sinn nicht integrierbar zu sein braucht. H. Lebesgue hat in seiner 1902 erschienenen Dissertation gezeigt, wie ein Integralbegriff einzuf¨ uhren ist, der die Vorteile des Riemannintegrals u ¨bernimmt, aber seine Nachteile vermeidet. Wir schildern sein Verfahren zun¨achst f¨ ur Funktionen auf einem Intervall. Sei J ⊂ R ein Intervall, das auch unbeschr¨ankt sein darf, und f : J → [0, ∞] eine Funktion. (Aus technischen Gr¨ unden werden zun¨achst positive Funktionen, die auch den Wert ∞ annehmen d¨ urfen, betrachtet.) Lebesgues Idee ist es, den Bildbereich von f in kleine Teilintervalle zu zerlegen, f durch eine Treppenfunktion ϕ zu approximieren, in nat¨ urlicher Weise ein Integral ϕ zu definieren und dann f durch einen Grenzprozeß zu erkl¨aren. Es ist nun eine u ur so gut wie ¨ berraschende Tatsache, daß dieses Verfahren f¨ alle denkbaren Funktionen (die meßbaren“ Funktionen) durchf¨ uhrbar ist ” ¨ und nach Uberwindung der anf¨ anglich auftauchenden H¨ urden zu einem sehr geschmeidigen Integralbegriff f¨ uhrt, der das Riemannintegral verallgemeinert; insbesondere ergibt sich nirgendwo die Notwendigkeit, uneigentliche“ ” Integrale zu betrachten. Um die genannten Anfangsschwierigkeiten zu erkl¨aren, betrachten wir zu einer Funktion f (von der wir momentan 0 ≤ f ≤ 1 annehmen) die Mengen k k+1 Ek,n = t: ≤ f (t) < n n und Funktionen der Gestalt ϕn (t) =
k n
falls t ∈ Ek,n .
A.1
Das Lebesgueintegral f¨ ur Funktionen auf einem Intervall
507
(k+1)/n k/n
Ek,n
Sollten die Ekk,n Intervalle sein, ist klar, wie ϕn zu definieren ist, n¨amlich als ange des Intervalls Ek,n ist. k n λ(Ek,n ), wo λ(Ek,n ) die L¨ F¨ ur den Fall, daß Ek,n eine disjunkte Vereinigung endlich vieler Intervalle I1 , . . . , Ir ist, w¨ urde man λ(Ek,n ) = ri=1 λ(Ii ) setzen. Da die Funktion f beliebig ist (einstweilen zumindest), k¨ onnen jedoch die Mengen Ek,n ebenfalls irgendwelche Teilmengen von J sein, und dann ist es absolut unklar, was unter λ(Ek,n ) sinnvollerweise zu verstehen ist; als relativ harmlosen Fall betrachte man etwa die Dirichletsche Sprungfunktion. Daher stellt sich zun¨achst einmal das Problem, m¨ oglichst vielen Teilmengen von R auf eine solche Weise ein Maß“ zuzuordnen, daß die Maßbildung viele nat¨ urliche ” Eigenschaften wie Monotonie, Additivit¨ at, Translationsinvarianz etc. besitzt. Leider stellt sich heraus, daß man nicht alle Teilmengen von R auf nat¨ urliche Weise (was das heißt, wird gleich pr¨azisiert) messen“ kann ” und folglich nicht jede Funktion dem obigen Verfahren unterworfen werden kann. Der hier zu skizzierende Zugang zur Integrationstheorie st¨ utzt sich auf folgende Begriffe. Definition A.1.1 Sei T eine Menge, und sei Σ ein System von Teilmengen von T mit den Eigenschaften (a) ∅ ∈ Σ, (b) E ∈ Σ ⇒ T \ E ∈ Σ, (c) E1 , E2 ∈ Σ ⇒ E1 ∪ E2 ∈ Σ. Dann heißt Σ eine Algebra. Gilt statt (c) ∞ (c)∗ E1 , E2 , . . . ∈ Σ ⇒ Ei ∈ Σ, i=1
so heißt Σ eine σ-Algebra. Man beweist leicht, daß der Schnitt von σ-Algebren wieder eine σAlgebra ist. Daher existiert eine kleinste σ-Algebra von Teilmengen von R,
508
Anhang A.
Maß- und Integrationstheorie
die alle Teilintervalle I ⊂ R enth¨ alt. Diese σ-Algebra heißt die σ-Algebra der Borelmengen von R, und es stellt sich heraus, daß es die Borelmengen sind, die man messen“ kann. ” Satz A.1.2 Es sei Σ die σ-Algebra der Borelmengen von R. Dann gibt es genau eine Abbildung λ: Σ → [0, ∞] mit den Eigenschaften: (a) λ(∅) = 0. (b) λ [a, b] = λ (a, b) = b − a falls a < b. (c) λ ist σ-additiv, d.h., sind die Ei ∈ Σ paarweise disjunkt, so ist ∞ ∞ λ Ei = λ(Ei ). i=1
i=1
(d) λ ist translationsinvariant, d.h., es gilt λ(E) = λ {s + t: t ∈ E} ∀s ∈ R, E ∈ Σ. F¨ ur alle weiteren Untersuchungen ist es entscheidend, daß man die Bedingung in (c) f¨ ur abz¨ ahlbar viele Ei und nicht bloß f¨ ur endlich viele hat. (Deswegen ist man auch an σ-Algebren und nicht an Algebren von Teilmengen interessiert.) Definition A.1.3 Die Abbildung λ aus Satz A.1.2 heißt Lebesguemaß, genauer Lebesgue-Borel-Maß. Wir beschreiben jetzt die Konstruktion des Lebesguemaßes. Zun¨achst sei daran erinnert, wie der Riemann-Jordansche Inhalt einer beschr¨ankten Menge A definiert ist; u ¨ blicherweise betrachtet man A ⊂ Rd , aber hier sind wir nur an A ⊂ R interessiert. Man u ¨berdeckt A mit endlich vielen ¨ Intervallen und nennt das Infimum der Gesamtl¨angen der an solchen Uberdeckungssystemen beteiligten Intervalle den ¨ außeren Inhalt ma (A): ma (A) := inf
n i=1
|Ii |: A ⊂
n
Ii , n ∈ N .
i=1
¨ (|I| bezeichnet die L¨ ange des Intervalls I.) Ahnlich definiert man einen inneren Inhalt mi (A) und nennt A Jordan-meßbar, falls mi (A) = ma (A) ist. Leider ist das System der Jordan-meßbaren Mengen nur schwer zu handhaben; z.B. ist nicht jede abgeschlossene Menge Jordan-meßbar, ebensowenig ist es die Menge Q ∩ [0, 1], die doch offensichtlich“ den Inhalt 0 haben ” sollte. Lebesgues Ansatz, der auf Ideen von Borel aufbaut, sieht nun vor, statt endlich vieler u ¨ berdeckender Intervalle unendlich viele (genauer abz¨ahlbar
A.1
Das Lebesgueintegral f¨ ur Funktionen auf einem Intervall
509
viele) zu nehmen; und damit werden die Verh¨ altnisse grundlegend ge¨andert. F¨ ur jedes A ⊂ R wird also das ¨ außere Lebesguesche Maß λ∗ (A) durch ∗
λ (A) := inf
∞ i=1
|Ii |: A ⊂
∞
Ii
i=1
definiert. Lebesgue definiert auch ein inneres Maß λ∗ (dessen Definition nicht analog zum Jordanschen Inhalt ist) und nennt Mengen A meßbar, falls λ∗ (A) = λ∗ (A) =: λ(A) gilt. Ferner zeigt er die nicht offensichtliche Tatsache, daß λ auf dem System der meßbaren Mengen σ-additiv ist. Sp¨ater hat Carath´eodory mit einer sehr allgemeinen Methode gezeigt, wie man die Existenz des Lebesguemaßes allein aus dem ¨außeren Maß ableitet. Seine Idee ist, das Mengensystem A := {A ⊂ R: λ∗ (B) = λ∗ (B ∩ A) + λ∗ (B \ A) ∀B ⊂ R} zu betrachten. A enth¨ alt also all die Mengen A, die jede Menge B so in zwei Teile B ∩ A und B \ A zerlegen, daß das Ganze (= λ∗ (B)) die Summe seiner Teile (= λ∗ (B ∩ A) + λ∗ (B \ A)) wird. Man zeigt dann, daß A eine die Intervalle enthaltende σ-Algebra ist, also Σ ⊂ A gilt, und λ∗ |A σ-additiv ist. (Analog kann man in vielen anderen Situationen vorgehen, insbesondere beim d-dimensionalen Lebesguemaß oder in noch allgemeineren F¨allen, siehe etwa den Beweis des Rieszschen Darstellungssatzes II.2.5.) Satz A.1.2 liefert also ein umfangreiches System von Mengen, die ge” messen“ werden k¨ onnen. In der Tat umfaßt dieses System fast alle Mengen, die von Interesse sind, z.B. alle abgeschlossenen Mengen, alle offenen Mengen, abz¨ahlbare Vereinigungen und Schnitte davon etc. Es muß jedoch betont werden, daß Σ echt kleiner als die Potenzmenge von R ist, und mit dem Zornschen Lemma kann man zeigen, daß es keine Abbildung gibt, die auf der ganzen Potenzmenge von R definiert ist und die Eigenschaften (a)–(d) aus Satz A.1.2 besitzt.1 Kehren wir zur¨ uck zu unserem Versuch, ein Integral zu definieren. Falls f so beschaffen ist, daß die oben definierten k,n Borelmengen sind, Mengen E so ist λ(Ek,n ) definiert, und man kann ϕn durch k nk λ(Ek,n ) erkl¨aren. Die Klasse solcher f soll als n¨ achstes eingef¨ uhrt werden. Definition A.1.4 Eine Funktion f : J → R (bzw. f : J → [0, ∞]) heißt (Borel-) meßbar, falls f −1 [a, b) f¨ ur alle a, b ∈ R eine Borelmenge ist. Eine Funktion f : J → C heißt meßbar, falls Re f und Im f meßbar sind. 1 Jedoch hat Banach mit Hilfe des Satzes von Hahn-Banach (genauer gesagt einem Vorl¨ aufer davon) die Existenz einer Mengenfunktion auf der Potenzmenge von R bewiesen, die (a)–(d) bis auf die Tatsache erf¨ ullt, daß (c) nur f¨ ur endliche Summen gilt (siehe Mukherjea/Pothoven [1986], S. 24). Solch eine Mengenfunktion gibt es auch f¨ ur R2 , nicht jedoch f¨ ur h¨ ohere Dimensionen.
510
Anhang A.
Maß- und Integrationstheorie
Eine Funktion f ist genau dann meßbar, wenn f −1 (A) f¨ ur jede Borelmenge A ⊂ R (bzw. [0, ∞] bzw. C) eine Borelmenge ist, was daraus folgt, daß {A: f −1 (A) ist Borelmenge} eine σ-Algebra bildet. Eine Funktion der Gestalt 1 t∈E χE (t) = 0 t∈ /E heißt Indikatorfunktion der Menge E. Eine Funktion der Gestalt f=
n
αi χEi
i=1
mit Ei ∈ Σ wird Treppenfunktion genannt. Allgemeiner als in der Riemannschen Theorie brauchen die Stufen“ Ei keine Intervalle zu sein, sondern ” sind beliebige meßbare Mengen. Satz A.1.5 Seien f, fn , g: J → K Funktionen auf einem Intervall J. (a) Sind f und g meßbar, so sind f + g, f g, f /g (falls g(s) = 0 f¨ ur alle s), αf (wo α ∈ K), |f | sowie im Fall K = R auch max{f, g} und min{f, g} meßbar. (b) Stetige Funktionen sind meßbar. (c) Sind f1 , f2 , . . . meßbar und existiert f (t) = limn→∞ fn (t) f¨ ur alle t, so ist f meßbar. (d) Ist f meßbar, so existiert eine Folge von Treppenfunktionen (ϕn ) mit f (t) = lim ϕn (t) ∀t ∈ J n→∞
und, falls f ≥ 0 ist, ϕ1 (t) ≤ ϕ2 (t) ≤ . . . . (e) Ist f meßbar und beschr¨ ankt, so existiert eine Folge von Treppenfunktionen (ϕn ), die gleichm¨aßig gegen f konvergiert. Die meßbaren Funktionen bilden also einen Vektorraum, der unter der Bildung von punktweisen Limiten abgeschlossen ist. Diese Eigenschaft ist ein entscheidender Gewinn im Lebesgueschen Ansatz. Wieder gilt die Bemerkung, daß fast alle Funktionen, auf die man in Anwendungen stoßen kann, meßbar sind. ur [0, ∞]-wertige meßbare Funktionen f das Integral Jetzt k¨onnen wir f¨ f dλ definieren, das allerdings = ∞ sein kann. Zun¨achst definiert man f¨ ur n Treppenfunktionen f = i=1 αi χEi f dλ =
n i=1
αi λ(Ei ).
(A.1)
A.1
511
Das Lebesgueintegral f¨ ur Funktionen auf einem Intervall
Hier ist die rechte Seite erkl¨ art, da die E i Borelmengen sind, und man zeigt, m daß f¨ ur jede andere Darstellung f = i=1 βi χFi dieselbe Zahl in (A.1) herauskommt; f¨ ur Treppenfunktionen ist das Integral also wohldefiniert. Ist nun f meßbar und [0,∞]-wertig, so w¨ ahle (ϕn ) wie in Satz A.1.5(d). Dann ist die Zahlenfolge ( ϕn dλ) monoton wachsend und daher in [0, ∞] konvergent. Ist (ψn ) eine andere solche Folge, so kann man lim ϕn dλ = lim ψn dλ n→∞
n→∞
zeigen, was nicht ganz trivial ist. Auf jeden Fall ist dann f dλ := lim ϕn dλ n→∞
wohldefiniert. Definition A.1.6 (a) Eine meßbare Funktion f : J → [0, ∞] heißt integrierbar (genauer Lebesgue-integrierbar), wenn f dλ < ∞ ist. (b) Eine meßbare Funktion f : J → R heißt integrierbar, falls f + := max{f, 0} und f − := max{−f, 0} integrierbar sind. Man setzt f dλ = f + dλ − f − dλ. (c) Eine meßbare Funktion f : J → C heißt integrierbar, falls Re f und Im f integrierbar sind. Man setzt f dλ = Re f dλ + i Im f dλ. Andere Bezeichnungen f¨ ur das Integral sind
f (t) dλ(t), J
b
f (t) dλ(t), a
b
f (t) dt,
etc.
a
Daß die letzte Bezeichnung sinnvoll ist, zeigt der n¨achste Satz, der auch zeigt, daß der Wert des Lebesgueintegrals mit dem des Riemannintegrals u ¨bereinstimmt. Satz A.1.7 (a) Die Summe integrierbarer Funktionen ist integrierbar mit (αf + βg) dλ = α f dλ + β g dλ.
512
Anhang A.
Maß- und Integrationstheorie
(b) Ist f : J → K stetig und |f | uneigentlich Riemann-integrierbar, so ist f integrierbar mit
f dλ = Riemann-
b
f (t) dt. a
Bevor wir als n¨ achstes den Hauptsatz der Differential- und Integralrechnung formulieren, m¨ ussen zwei Begriffe erkl¨ art werden. Definition A.1.8 Man spricht von fast ¨ uberall (f.¨ u.) (genauer λ-fast u ¨berall) bestehenden Eigenschaften einer Funktion, wenn es eine Borelmenge E mit λ(E) = 0 gibt, so daß f die fragliche Eigenschaft (z.B. differenzierbar, ≥ 0, . . .) an allen Stellen t ∈ / E besitzt. Solch eine Menge wird Borelsche Nullmenge genannt. F¨ ur die Integrationstheorie macht es praktisch keinen Unterschied, ob eine Eigenschaft u ¨ berall oder fast u ¨ berall vorliegt. Es sei jedoch ein technisches Detail erw¨ahnt, das die Formulierung des Konvergenzsatzes von Lebesgue (Satz A.3.2) ber¨ uhrt. Sind die fn meßbar und gilt limn→∞ fn = f fast u berall, so braucht f nicht meßbar zu sein. Vergr¨oßert man jedoch die ¨ vorgelegte σ-Algebra um alle Teilmengen von Nullmengen, so gilt noch die Meßbarkeit bez¨ uglich dieser gr¨ oßeren σ-Algebra. Definition A.1.9 Eine Funktion f : [a, b] → K heißt absolutstetig, wenn zu jedem ε > 0 ein δ > 0 existiert, so daß f¨ ur alle a ≤ a1 < b1 ≤ a2 < b2 ≤ . . . ≤ an < bn ≤ b, n ∈ N beliebig, die Implikation n
(bk − ak ) < δ
n
⇒
k=1
|f (bk ) − f (ak )| < ε
k=1
gilt. Es ist einfach zu zeigen, daß Lipschitz-stetige Funktionen absolutstetig sind. Satz A.1.10 (Hauptsatz der Differential- und Integralrechnung) (a) Ist f : [a, b] → K absolutstetig, so existiert die Ableitung f fast uberall, f ist auf [a, b] integrierbar, und es gilt ¨ f (t) − f (s) =
t
f dλ
∀s, t ∈ [a, b].
s
(Dabei sei
t
=−
s
f¨ ur s > t.)
t (b) Ist g: [a, b] → K integrierbar und f (t) := a g dλ, so ist f absolutstetig, f existiert fast u ¨berall, und es gilt f = g fast u ¨berall. s
t
A.2 Das d-dimensionale Lebesguemaß und abstrakte Integration
A.2
513
Das d-dimensionale Lebesguemaß und abstrakte Integration
Nachdem das Maßproblem mit Satz A.1.2 einmal gel¨ost war, war es f¨ ur die Definition des Integrals f dλ vollkommen unerheblich, daß es sich um eine Funktion auf einem Intervall handelte; wichtig war nur die Existenz des Lebesguemaßes auf der σ-Algebra der Borelmengen. In der Tat kann das Integral als Linearisierung des Maßes aufgefaßt werden. Hier ist die Definition des abstrakten Maßbegriffs. Definition A.2.1 Sei Σ eine σ-Algebra auf einer Menge T . Eine Abbildung μ: Σ → [0, ∞] heißt Maß, wenn (a) μ(∅) = 0, (b) μ σ-additiv ist, d.h., wenn f¨ ur paarweise disjunkte E1 , E2 , . . . ∈ Σ ∞ ∞ μ Ei = μ(Ei ). i=1
i=1
Man nennt (T, Σ, μ) dann einen Maßraum. Ist μ(T ) < ∞, spricht man von einem endlichen Maß bzw. Maßraum und im Fall μ(T ) = 1 von einem Wahrscheinlichkeitsmaß bzw. einem Wahrscheinlichkeitsraum. Gibt es eine ∞ Folge (En ) ⊂ Σ mit μ(En ) < ∞ und n=1 En = T , so heißen das Maß bzw. der Maßraum σ-endlich. In der Analysis ist die folgende σ-Algebra die am h¨aufigsten benutzte. Definition A.2.2 Sei T ein metrischer (oder bloß topologischer) Raum. Die kleinste σ-Algebra, die die offenen Teilmengen von T enth¨alt, heißt die Borel-σ-Algebra; die E ∈ Σ heißen Borelmengen. Ist T ⊂ R ein Intervall, so ist die soeben definierte Borel-σ-Algebra mit der in Abschnitt A.1 betrachteten identisch. Satz A.2.3 Sei Σ die Borel-σ-Algebra des Rd . Dann existiert genau ein translationsinvariantes Maß λd auf Σ mit λd [a1 , b1 ] × · · · × [ad , bd ] = (b1 − a1 ) · · · · · (bd − ad ). λd heißt d-dimensionales Lebesguemaß. Insbesondere ist λd σ-endlich. Mit denselben Ideen wie im vorigen Abschnitt (meßbare Funktionen, Integral f¨ ur Treppenfunktionen, Integral f¨ ur positive meßbare Funktionen, d schließlich integrierbare Funktionen und ihr Integral) f¨ u hrt man Ω f dλ f¨ ur Borelmengen Ω ⊂ Rd bzw. im allgemeinen Fall E f dμ f¨ ur E ∈ Σ ein. Die S¨atze A.1.5 und A.1.7(a) gelten dann entsprechend.
514
Anhang A.
Maß- und Integrationstheorie
Beispiele. (a) Ist g: R → R+ meßbar, so definiert μ(E) = g dλ E
ein Maß auf den Borelmengen von R. (Das folgt aus dem Satz von Beppo Levi, Satz A.3.1.) Eine meßbare Funktion f ist genau dann μ-integrierbar, wenn f g λ-integrierbar ist. In diesem Fall ist f dμ = f g dλ. (b) Sei T eine Menge, Σ eine σ-Algebra auf T und t0 ∈ T . Das Diracmaß δt0 ist definiert durch 1 falls t0 ∈ E, δt0 (E) = 0 falls t0 ∈ / E, wo E ∈ Σ. F¨ ur meßbare Funktionen gilt f dδt0 = f (t0 ). (c) Analog gilt f¨ ur eine Summe von Diracmaßen μ = f dμ =
n
n i=1
αi δti
αi f (ti ).
i=1
Endliche Summen k¨ onnen also als Integrale f¨ ur sehr einfache Maße angesehen werden. (d) Auch unendliche Reihen ordnen sich dem abstrakten Integrationskonzept unter. Auf der Potenzmenge von N betrachte das z¨ahlende Maß μ, das jeder Teilmenge von N die Anzahl ihrer Elemente (∈ N ∪ {0} ∪ {∞}) zuordnet. Eine Funktion f : N → C, f (n) = an , ist genau dann integrierbar, wenn (an ) ∈ 1 ist, und dann gilt f dμ =
∞
an .
n=1
Zur Berechnung mehrdimensionaler Integrale benutzt man den Satz von Fubini, der in der Lebesgueschen Theorie besonders durchsichtig formuliert und gezeigt werden kann. Es folgt die Fassung f¨ ur d = 2. Satz A.2.4 (Satz von Fubini) Sei f : R2 → K eine meßbare Funktion.
515
A.3 Konvergenzs¨ atze
(a) F¨ ur alle s ∈ R ist t → f (s, t) meßbar, und f¨ ur alle t ∈ R ist s → f (s, t) meßbar. Ferner sind die [0, ∞]-wertigen Funktionen s → |f (s, t)| dλ(t) und t → |f (s, t)| dλ(s) meßbar. (b) Ist R
R
|f (s, t)| dλ(s) dλ(t) < ∞,
so ist f integrierbar. (c) Ist f integrierbar, so ist ft : s → f (s, t) f¨ ur fast alle t integrierbar, ft dλ falls ft integrierbar, h: t → 0 sonst ist meßbar und integrierbar, und es gilt f dλ2 = h dλ. R2
R
In aller K¨ urze besagt der Satz von Fubini also f (s, t) ds dt = f (s, t) ds dt. R2
R
R
Im Satz von Fubini d¨ urfen die Rollen von s und t nat¨ urlich vertauscht werden. Daher darf man f¨ ur integrierbare Funktionen f die Integrationsreihenfolge bei den iterierten Integralen vertauschen: f (s, t) ds dt = f (s, t) dt ds. R
R
R
R
Das zweidimensionale Lebesguemaß ist in gewisser Hinsicht das Produkt des eindimensionalen Lebesguemaßes mit sich selbst. Seien allgemeiner (T1 , Σ1 , μ1 ) und (T2 , Σ2 , μ2 ) σ-endliche Maßr¨ aume. Sei Σ1 ⊗ Σ2 die von den Mengen E1 × E2 , E1 ∈ Σ1 , E2 ∈ Σ2 , erzeugte σ-Algebra auf T1 × T2 . Dann existiert genau ein Maß μ auf Σ1 ⊗ Σ2 mit μ(E1 × E2 ) = μ1 (E1 )μ2 (E2 ); μ heißt Produktmaß von μ1 und μ2 und wird mit μ1 ⊗ μ2 bezeichnet. F¨ ur μ1 ⊗ μ2 -integrierbares f : T1 × T2 → K gilt ein Satz A.2.4 entsprechender allgemeiner Satz von Fubini.
A.3
Konvergenzs¨ atze
Die Lebesguesche Integrationstheorie liefert tats¨achlich die Konvergenzs¨atze, deren Fehlen einen Mangel des Riemannintegrals ausmacht. Es sei (T, Σ, μ) ein beliebiger Maßraum, z.B. T = R, Σ = Borel-σ-Algebra, μ = Lebesguemaß. Wir formulieren jetzt die beiden wichtigsten Konvergenzs¨atze.
516
Anhang A.
Maß- und Integrationstheorie
Satz A.3.1 (Satz von Beppo Levi) Seien f1 , f2 , . . . : T → R meßbare Funktionen mit 0 ≤ f1 ≤ f2 ≤ . . . . Es sei f (t) := limn→∞ fn(t) (∈ [0, ∞]). Dann ist f meßbar mit lim
n→∞
fn dμ =
f dμ ∈ [0, ∞].
Satz A.3.2 (Konvergenzsatz von Lebesgue) Seien f1 , f2 , . . . : T → K integrierbar, und es existiere eine meßbare Funktion f mit f (t) = limn→∞ fn (t) fast u ¨ berall. Es existiere ferner eine integrierbare Funktion g mit |fn | ≤ g
fast u ¨berall
f¨ ur alle n ∈ N. Dann ist f integrierbar, und es gilt lim fn dμ = f dμ. n→∞
Im Fall μ(T ) < ∞ ist die Voraussetzung insbesondere erf¨ ullt, wenn ∃M ≥ 0 ∀n ∈ N
|fn | ≤ M
fast u ¨ berall.
Wegen der vorausgesetzten Meßbarkeit von f siehe die auf Definition A.1.8 folgende Bemerkung. Der Satz von Beppo Levi heißt auch Satz von der monotonen Konvergenz und der Konvergenzsatz von Lebesgue Satz von der dominierten Konvergenz. Diese S¨ atze z¨ ahlen zu den wichtigsten Aussagen der Integrationstheorie; vergleiche insbesondere, mit welch einfachen Voraussetzungen sie im Vergleich zu (speziell uneigentlichen) Riemannintegralen auskommen. Mit dem Konvergenzsatz von Lebesgue lassen sich sehr handliche Kriterien f¨ ur die Differentiation unter dem Integral“ beweisen. Im folgenden ” Korollar notieren wir Punkte des Rd+1 als (t, x), t ∈ R, x ∈ Rd . Korollar A.3.3 Sei f : Rd+1 → C stetig differenzierbar, und x → f (t, x) sei f¨ ur alle t integrierbar. F¨ ur alle t0 ∈ R existiere eine Umgebung U und eine integrierbare Funktion g: Rd → R mit ∂f (t, x) ≤ g(x) ∀t ∈ U, x ∈ Rd . ∂t Dann gilt d dt
f (t, x) dx = Rd
Rd
∂f (t, x) dx ∂t
∀t ∈ R.
517
A.4 Signierte und komplexe Maße
A.4
Signierte und komplexe Maße
In diesem Abschnitt widmen wir uns der Integration nach reell- oder komplexwertigen Maßen. Definition A.4.1 Ist Σ eine σ-Algebra, so heißt eine Abbildung μ: Σ → R (bzw. μ: Σ → C) signiertes (bzw. komplexes) Maß, falls μ σ-additiv ist (vgl. Definition A.2.1). Es ist dann automatisch μ(∅) = 0, denn μ(∅) = μ(∅ ∪ ∅) = μ(∅) + μ(∅). Definition A.4.2 Sei μ ein signiertes oder komplexes Maß auf Σ und E ∈ Σ. Setze n |μ|(E) = sup |μ(Ek )|, k=1
wo das Supremum u ¨ ber alle endlichen Zerlegungen E = E1 ∪ . . . ∪ En mit paarweise disjunkten Ek ∈ Σ zu bilden ist. |μ|(E) heißt Variation von μ auf E. Satz A.4.3 Ist μ ein signiertes oder komplexes Maß, so definiert E → |μ|(E) ein positives endliches Maß. Satz A.4.4 (Hahn-Jordan-Zerlegung) Sei Σ eine σ-Algebra ¨ uber einer Menge T und μ: Σ → R ein signiertes Maß. (a) Es existiert ein bis auf eine |μ|-Nullmenge eindeutig bestimmtes E + ∈ Σ mit • 0 ≤ μ(E) ≤ μ(E + )
∀E ∈ Σ, E ⊂ E + ,
• 0 ≥ μ(E) ≥ μ(E − )
∀E ∈ Σ, E ⊂ E − := T \ E + .
(b) μ+ := χE + μ und μ− := −χE − μ sind positive endliche Maße mit μ = μ+ − μ− . (c) |μ|(E) = μ+ (E) + μ− (E) ∀E ∈ Σ. Die Zerlegung T = E + ∪ E − heißt Hahn-Zerlegung, und die Zerlegung μ = μ+ − μ− heißt Jordan-Zerlegung. Beispiel. Sei λ das Lebesguemaß auf R und g: R → R λ-integrierbar. μ(E) = g dλ definiert dann ein signiertes Maß. Es kann E E + = {t: g(t) ≥ 0}, gew¨ahlt werden, und es ist μ+ (E) = g + dλ, E
E − = {t: g(t) < 0}
μ− (E) =
g − dλ. E
518
Anhang A.
Maß- und Integrationstheorie
Definition A.4.5 Sei μ ein signiertes Maß, μ = μ+ − μ− seine JordanZerlegung und f : T → R meßbar. Dann heißt f μ-integrierbar, falls f |μ|-integrierbar ist. Man setzt + f dμ = f dμ − f dμ− . Komplexe Maße zerlegt man in Real- und Imagin¨arteil μ = μ1 + i μ2 und setzt f¨ ur |μ|-integrierbares f f dμ = f dμ1 + i f dμ2 .
Es gilt f¨ ur |μ|-integrierbare Funktionen f die wichtige Ungleichung f dμ ≤ |f | d|μ|. (A.2) Die nichttriviale Richtung im folgenden Satz ist (i) ⇒ (ii); um die Kraft dieses Satzes zu w¨ urdigen, mache man sich klar, wie schwach die Voraussetzung (i), wie stark hingegen die Behauptung (ii) ist. Satz A.4.6 (Satz von Radon-Nikod´ ym) Sei Σ eine σ-Algebra auf einer Menge T , μ ein σ-endliches positives Maß und ν ein signiertes (bzw. komplexes) Maß auf Σ. Dann sind folgende Bedingungen ¨ aquivalent: (i) Ist E ∈ Σ mit μ(E) = 0, so ist auch ν(E) = 0. (ii) Es existiert eine μ-integrierbare Funktion g: T → R (bzw. C) mit ν(E) = g dμ ∀E ∈ Σ. E
Man sagt, daß ν absolutstetig bzgl. μ ist, und schreibt ν " μ, wenn (i) erf¨ ullt ist. J. von Neumann hat einen Beweis dieses Satzes gefunden, der auf dem Darstellungssatz von Fr´echet-Riesz (Theorem V.3.6) beruht; siehe z.B. Rudin [1986], S. 122. Abschließend sei erw¨ ahnt, daß es noch den Aufbau der Integrationstheorie `a la Bourbaki gibt, der aber trotz seiner zugegebenermaßen gr¨oßeren mathematischen Eleganz f¨ ur die Lernenden schwerer zug¨anglich zu sein scheint. Diese Methode wird z.B. bei Choquet [1969], Dieudonn´e [1987], Floret [1981], Meise/Vogt [1992] und Pedersen [1989] dargestellt.
Anhang B
Metrische und topologische R¨aume
B.1
Metrische R¨ aume
In diesem Teil des Anhangs werden die wichtigsten Tatsachen u ¨ber metrische R¨aume zusammengestellt; auf topologische R¨aume wird im n¨achsten Abschnitt eingegangen. Hier sollen nur die Stellen angemerkt werden, wo die Theorie topologischer R¨ aume signifikant von der Theorie metrischer R¨aume abweicht. Die Aussagen dieses Anhangs sind mit eventueller Ausnahme der S¨atze B.1.5 und B.1.7 in jedem Lehrbuch der Analysis zu finden; bis auf die genannten Ausnahmen sind sie so einfach, daß sie sich praktisch von allein“ beweisen. ” Eine Menge T , versehen mit einer Abbildung d: T × T → R mit den Eigenschaften (s, t, u ∈ T beliebig) (a) (b) (c) (d)
d(s, t) ≥ 0, d(s, t) = d(t, s), d(s, u) ≤ d(s, t) + d(t, u), d(s, t) = 0 ⇐⇒ s = t,
wird metrischer Raum und d eine Metrik genannt. Gilt in (d) nur ⇐“, so ” spricht man von einem halbmetrischen Raum. In einem metrischen (oder halbmetrischen) Raum betrachte die Kugeln Uε (t) = {s ∈ T : d(s, t) < ε}. Sei M ⊂ T . Ein Punkt t ∈ M heißt innerer Punkt von M , und M heißt Umgebung von t, falls ∃ε > 0 Uε (t) ⊂ M. Eine Teilmenge O ⊂ T , f¨ ur die jedes t ∈ O innerer Punkt ist, heißt offen.
520
Anhang B.
Metrische und topologische R¨ aume
Satz B.1.1 Sei (T, d) ein metrischer Raum und τ die Menge aller offenen Teilmengen von T . (a) ∅ ∈ τ , T ∈ τ . (b) Sind O1 ∈ τ und O2 ∈ τ , so gilt O1 ∩ O2 ∈ τ . (c) Ist I eine beliebige Indexmenge und sind Oi ∈ τ (i ∈ I), so ist i∈I Oi ∈ τ . Allgemeiner nennt man ein System von Teilmengen einer Menge T , welches die obigen Bedingungen (a)–(c) erf¨ ullt, eine Topologie auf T und spricht von T als topologischem Raum. Metrische R¨aume wurden zuerst von Fr´echet (1906) und topologische R¨ aume zuerst von Hausdorff (1914) betrachtet. Eine Teilmenge A eines metrischen Raums heißt abgeschlossen, wenn ihr Komplement T \ A offen ist. Analog zu Satz B.1.1 gelten also: (a) ∅ und T sind abgeschlossen. (b) Die Vereinigung zweier abgeschlossener Mengen ist abgeschlossen. (c) Der Schnitt beliebig vieler abgeschlossener Mengen ist abgeschlossen. Bedingung (c) impliziert, daß f¨ ur jede Teilmenge M ⊂ T eine kleinste abgeschlossene Menge existiert, die M umfaßt. Diese wird mit M bezeichnet und Abschluß von M genannt: , M := A A⊃M A abgeschlossen
Analog ist das Innere von M int M :=
O
O⊂M O offen
die gr¨oßte offene Menge, die in M liegt. Offenbar besteht int M genau aus den inneren Punkten von M . Der Rand von M ist ∂M := {t ∈ T : Uε (t) ∩ M = ∅ und Uε (t) ∩ T \M = ∅ ∀ε > 0}. ∂M ist stets abgeschlossen, und es gilt M = M ∪∂M sowie ∂M = M \int M . Eine Folge (tn ) in einem metrischen Raum T heißt konvergent gegen t ∈ T , falls ∀ε > 0 ∃N ∈ N ∀n ≥ N d(tn , t) ≤ ε. t heißt Limes von (tn ). Es ist leicht zu sehen, daß der Limes einer konvergenten Folge eindeutig bestimmt ist. (Das gilt nicht mehr in halbmetrischen R¨aumen.) Man schreibt tn → t oder limn→∞ tn = t. Besitzt t nur die Eigenschaft, daß jede Umgebung von t unendlich viele Folgenglieder enth¨alt, heißt t H¨ aufungspunkt von (tn ).
B.1
Metrische R¨ aume
521
Satz B.1.2 Folgende Bedingungen sind in einem metrischen Raum ¨ aquivalent: (i) t ∈ M . (ii) Es existiert eine Folge (tn ) in M mit tn → t. In topologischen R¨ aumen ist die Implikation (i) ⇒ (ii) im allgemeinen falsch. Seien (T1 , d1 ) und (T2 , d2 ) metrische R¨ aume. Dann definiert d (s1 , s2 ), (t1 , t2 ) = d1 (s1 , t1 ) + d2 (s2 , t2 ) eine Metrik auf dem Produktraum T1 × T2 . Eine Folge (xn , yn ) in T1 × T2 konvergiert genau dann gegen (x, y), wenn xn → x und yn → y gelten. Sei nun f : T1 → T2 eine Abbildung zwischen metrischen R¨aumen. Dann heißt f stetig an der Stelle t0 ∈ T1 , falls ∀ε > 0 ∃δ > 0 d1 (t, t0 ) < δ ⇒ d2 f (t), f (t0 ) < ε. Man erh¨alt eine ¨ aquivalente Definition, wenn man ≤“ statt <“ verwen” ” det. Offenbar ist f genau dann stetig bei t0 , wenn f¨ ur jede Umgebung V −1 von f (t0 ) das Urbild f (V ) eine Umgebung von t0 ist. Satz B.1.3 Sei f : T1 → T2 eine Abbildung zwischen metrischen R¨ aumen. Dann sind folgende Bedingungen ¨ aquivalent: (i) f ist stetig bei t0 . (ii) tn → t0 ⇒ f (tn ) → f (t0 ) f¨ ur alle Folgen (tn ). In topologischen R¨ aumen ist diesmal die Implikation (ii) ⇒ (i) im allgemeinen falsch. Eine Abbildung f : T1 → T2 heißt schlechthin stetig, falls sie an jeder Stelle t0 ∈ T1 stetig ist. Nach Definition ist die Stetigkeit also eine lokale Eigenschaft; denn es geht an jeder Stelle t0 nur das Verhalten von f in einer Umgebung von t0 ein. Satz B.1.4 F¨ ur eine Abbildung f zwischen metrischen R¨ aumen T1 und T2 sind ¨ aquivalent: (i) f ist stetig. (ii) F¨ ur alle offenen O ⊂ T2 ist f −1 (O) offen in T1 . (iii) F¨ ur alle abgeschlossenen A ⊂ T2 ist f −1 (A) abgeschlossen in T1 . Wir formulieren jetzt einen bedeutenden Existenzsatz f¨ ur reellwertige stetige Funktionen.
522
Anhang B.
Metrische und topologische R¨ aume
Satz B.1.5 (Satz von Tietze-Urysohn f¨ ur metrische R¨aume) Sei T ein metrischer Raum und A ⊂ T eine abgeschlossene Teilmenge. Zu jeder stetigen Funktion f : A → [a, b] existiert eine stetige Fortsetzung F : T → [a, b]. Insbesondere existiert zu t0 ∈ / A eine stetige Funktion ϕ: T → [0, 1] mit ϕ|A = 0 und ϕ(t0 ) = 1. Beweis. Offensichtlich reicht es, den Fall a = 1, b = 2 zu behandeln. In diesem Fall setzt man F (t) = f (t) f¨ ur t ∈ A und F (t) =
inf{f (s)d(s, t): s ∈ A} inf{d(s, t): s ∈ A}
f¨ ur t ∈ / A. Es ist nicht schwer zu verifizieren, daß F wirklich stetig ist. Zum Zusatz: Setze die auf A0 = A∪{t0 } stetige Funktion ϕ0 : A0 → [0, 1] mit ϕ0 |A = 0 und ϕ0 (t0 ) = 1 fort. 2 Dieser Satz gilt nicht f¨ ur alle topologischen R¨aume, sondern nur f¨ ur die sog. normalen R¨ aume. Insbesondere gilt er f¨ ur alle kompakten Hausdorffr¨aume. F¨ ur Anwendungen in der Funktionalanalysis ist folgende Fassung n¨ utzlich. Korollar B.1.6 Sei T ein metrischer Raum und A ⊂ T eine abgeschlossene Teilmenge. Sei f : A → K eine beschr¨ ankte stetige Funktion. Dann existiert eine beschr¨ ankte stetige Fortsetzung F : T → K mit F ∞ = f ∞. Beweis. Im Fall K = R handelt es sich hier nur um eine Umformulierung des Satzes von Tietze-Urysohn. Im komplexen Fall w¨ahle stetige Fortsetzungen g bzw. h von Re f bzw. Im f . Sei r: C → C durch r(z) = z f¨ ur |z| ≤ f ∞ und r(z) = f ∞ z/|z| sonst definiert. Dann ist r stetig, und F : T → C, F (t) = r g(t) + i h(t) 2
ist die gew¨ unschte Fortsetzung.
Eine Metrik induziert nicht nur eine topologische Struktur, sondern auch eine uniforme Struktur, die sich in den Begriffen Cauchyfolge, Vollst¨andigkeit und gleichm¨ aßige Stetigkeit manifestiert. Eine Cauchyfolge in einem metrischen Raum (T, d) ist durch die Forderung ∀ε > 0 ∃N ∈ N ∀n, m ≥ N
d(tn , tm ) ≤ ε
definiert. Ein metrischer Raum heißt vollst¨ andig, wenn jede Cauchyfolge konvergiert. Mit T1 und T2 ist auch T1 × T2 vollst¨andig. Es ist zu beachten, daß verschiedene Metriken auf einer Menge zwar dieselbe Topologie, aber unterschiedliche uniforme Strukturen erzeugen k¨onnen. Wird z.B. R mit der Metrik d2 (s, t) = |arctan s − arctan t| versehen, so
B.1
523
Metrische R¨ aume
sind die d2 -offenen Mengen genau die u ¨ blichen offenen Mengen; jedoch ist die Folge (n) der nat¨ urlichen Zahlen eine nicht konvergente Cauchyfolge. Daher ist (R, d2 ) nicht vollst¨ andig. Eine Abbildung f : T1 → T2 heißt gleichm¨ aßig stetig, wenn ∀ε > 0 ∃δ > 0 ∀s, t ∈ T1
d1 (s, t) < δ ⇒ d2 f (s), f (t) < ε.
Bei der Definition der Stetigkeit darf δ vom betrachteten Punkt t abh¨angen; bei der gleichm¨aßigen Stetigkeit hat man δ unabh¨angig von t zu w¨ahlen. Im Gegensatz zur Stetigkeit handelt es sich hier also um eine globale Eigenschaft. Ein zentraler topologischer Begriff ist der der Kompaktheit. Ein metri¨ scher (oder topologischer) Raum T heißt kompakt, wenn jede offene Uberdeckung eine endliche Teil¨ uberdeckung besitzt. Mit anderen Worten, wenn (Oi ) eine Familie offener Mengen mit T = O ist, so existieren endlich i∈I i n viele Oi1 , . . . , Oin mit T = k=1 Oik . Ist (T, d) ein metrischer Raum und S ⊂ T , so kann (S, d) als eigenst¨andiger metrischer Raum angesehen werden. Ist T kompakt und S ⊂ T abgeschlossen, so ist auch S kompakt. Ist T ein beliebiger metrischer Raum und S ⊂ T kompakt, so ist S abgeschlossen. Beachte, daß die Abgeschlossenheit nur mit Bezug auf einen gr¨ oßeren Raum formuliert werden kann (S ist abgeschlossen in T ); hingegen ist die Kompaktheit ein intrinsischer Begriff. Wenn f : T1 → T2 eine stetige Abbildung zwischen metrischen R¨aumen ist und T1 kompakt ist, so ist auch f (T1 ) kompakt. Ferner ist unter diesen Voraussetzungen f gleichm¨ aßig stetig. Im Fall metrischer R¨ aume kann die Kompaktheit ¨aquivalent als Folgenkompaktheit beschrieben werden. Im folgenden Satz bleibt im allgemeinen keine der Implikationen (i) ⇒ (ii) bzw. (ii) ⇒ (i) f¨ ur topologische R¨aume richtig; (iii) ist dort sinnlos. Satz B.1.7 F¨ ur einen metrischen Raum (T, d) sind ¨ aquivalent: (i) T ist kompakt. (ii) Jede Folge in T hat eine konvergente Teilfolge ( T ist folgenkom” pakt“). (iii) T ist totalbeschr¨ ankt, d.h. f¨ ur alle ε > 0 existieren endlich viele N t1 , . . . , tN ∈ T mit T = k=1 Uε (tk ), und T ist vollst¨ andig. Beweis. (i) ⇒ (ii): Falls (tn ) eine Folge ohne konvergente Teilfolge ist, kann kein t ∈ T H¨aufungspunkt von (tn ) sein. F¨ ur jedes t ∈ T existiert also εt > 0 derart, daß Uεt (t) nur endlich viele tn enth¨alt. Da T = t∈T Uεt (t) gilt, reichen nach (i) endlich viele der Uεt (t) aus, um T zu u ¨ berdecken. Also enthielte T nur endlich viele der tn : Widerspruch!
524
Anhang B.
Metrische und topologische R¨ aume
(ii) ⇒ (iii): W¨ are T nicht totalbeschr¨ ankt, g¨abe es ein ε > 0, so daß f¨ ur alle n ∈ N und alle t1 , . . . , tn ∈ T n
Uε (tk ) T
k=1
gilt. Wir werden nun induktiv eine Folge ohne konvergente Teilfolge konstruieren. Sei dazu t1 ∈ T beliebig. Wegen Uε (t1 ) = T existiert t2 ∈ T mit d(t2 , t1 ) ≥ ε. Nun ist auch Uε (t1 ) ∪ Uε (t2 ) = T , also existiert t3 ∈ T mit d(t3 , tk ) ≥ ε f¨ ur k = 1, 2. So fortfahrend, erh¨ alt man eine Folge (tn ) in T , f¨ ur die d(tn , tk ) ≥ ε f¨ ur alle k < n gilt. Es ist klar, daß keine Teilfolge von (tn ) eine Cauchyfolge sein kann; daher enth¨ alt (tn ) erst recht keine konvergente Teilfolge. Deshalb ist T totalbeschr¨ ankt. Da eine Cauchyfolge, die eine konvergente Teilfolge besitzt, selbst konvergiert, ist T auch vollst¨andig. ¨ (iii) ⇒ (i): Nehmen wir an, es g¨ abe eine offene Uberdeckung (Oi ), die (1) (1) keine endliche Teil¨ uberdeckung besitzt. Sei ε1 = 1, und w¨ahle t1 , . . . , tN1 (1)
gem¨aß der Totalbeschr¨ anktheit von T . Mindestens eine der Kugeln Uε1 (tk ) (1) kann dann nicht endlich u ¨ berdeckbar sein, sagen wir Uε1 (t1 ). Nun sei (2) (2) ε2 = 12 , und es seien t1 , . . . , tN2 gem¨ aß der Totalbeschr¨anktheit von T zu ε2 gew¨ahlt. Es folgt (1)
Uε1 (t1 ) =
N2 (1) (2) Uε1 (t1 ) ∩ Uε2 (tk ) , k=1 (1)
(2)
und eine dieser Mengen, sagen wir Uε1 (t1 ) ∩ Uε2 (t1 ), kann nicht endlich u ¨berdeckbar sein. Nun wenden wir die Totalbeschr¨anktheit mit ε3 = 14 an, (3) und wir erhalten einen Punkt t1 , so daß (1)
(2)
(3)
Uε1 (t1 ) ∩ Uε2 (t1 ) ∩ Uε3 (t1 ) nicht endlich u Nach diesem Schema konstruieren wir mit ¨ berdeckbar ist. n εn = 21−n Punkte sn , so daß k=1 Uεk (sk ) f¨ ur kein n ∈ N endlich u ¨berdeckbar ist. Insbesondere ist stets Uεn (sn ) ∩ Uεn+1 (sn+1 ) = ∅. Betrachte die so entstandene Folge (sn ). Sie ist wegen d(sn+1 , sn ) ≤ εn + εn+1 ≤ 22−n eine Cauchyfolge, also nach Voraussetzung konvergent, etwa sn → s0 . W¨ ahle i0 mit s0 ∈ Oi0 . Da Oi0 offen ist, ist η := inf{d(s0 , s): s ∈ / Oi0 } > 0. W¨ahle n so groß, daß d(sn , s0 ) < η/2 und 21−n < η/2 ausf¨allt. Dann ist Uε1 (s1 ) ∩ . . . ∩ Uεn (sn ) ⊂ Uεn (sn ) ⊂ Uη (s0 ) ⊂ Oi0 , also Uε1 (s1 ) ∩ . . . ∩ Uεn (sn ) endlich u ¨ berdeckbar (n¨amlich durch ein einziges Oi ) im Widerspruch zur Konstruktion der sn . Damit ist die Implikation (iii) ⇒ (i) bewiesen. 2
525
B.2 Topologische R¨ aume
B.2
Topologische R¨ aume
Jetzt beschreiben wir die Grundz¨ uge der Theorie der topologischen R¨aume in dem Umfang, wie es f¨ ur das Verst¨ andnis von Kapitel VIII notwendig ist. Wieder gilt, daß die hier nicht bewiesenen Aussagen mit Ausnahme von Lemma B.2.5 ohne gr¨ oßere M¨ uhen zu begr¨ unden sind. Was hier nur angedeutet wird, findet sich z.B. in den B¨ uchern von Dugundji [1966], Kelley [1955] oder Willard [1970]. Sehr lesenswert ist die Einf¨ uhrung in die mengentheoretische Topologie im ersten Kapitel von Pedersen [1989]. Eine Topologie τ auf einer Menge T ist ein System von Teilmengen von T mit den Eigenschaften: (a) ∅ ∈ τ , T ∈ τ . (b) Sind O1 ∈ τ und O2 ∈ τ , so gilt O1 ∩ O2 ∈ τ . (c) Ist I eine beliebige Indexmenge und sind Oi ∈ τ (i ∈ I), so ist i∈I Oi ∈ τ . Man nennt (T, τ ) (oder k¨ urzer T ) einen topologischen Raum und die in τ versammelten Mengen offen. In Satz B.1.1 wurde beobachtet, daß die offenen Mengen eines metrischen Raums eine Topologie bilden; eine Topologie, die auf diese Weise von einer Metrik abgeleitet werden kann, heißt metrisierbar. Der Begriff des topologischen Raums verallgemeinert also den des metrischen Raums. Es zeigt sich, daß sich wesentliche Konzepte wie Konvergenz, Stetigkeit oder Kompaktheit aus dem Kontext der metrischen R¨aume in den Rahmen der topologischen R¨ aume u ¨bertragen lassen. Bisweilen kann man Begriffe w¨ortlich u ¨bernehmen, manchmal ist es notwendig, sie zuerst in eine Sprache ohne ε und δ“ zu u ¨bersetzen, und hier und da gibt es ” vollkommen neue Effekte. Absolut problemlos sind die Begriffe abgeschlossene Menge, Abschluß und Inneres, denn diese sind genauso wie im metrischen Fall erkl¨art. Also: Eine Teilmenge A eines topologischen Raums T heißt abgeschlossen, wenn ihr Komplement T \ A offen ist; nach wie vor gelten also: (a) ∅ und T sind abgeschlossen. (b) Die Vereinigung zweier abgeschlossener Mengen ist abgeschlossen. (c) Der Schnitt beliebig vieler abgeschlossener Mengen ist abgeschlossen. Der Abschluß einer Menge M ⊂ T ist , M := A A⊃M A abgeschlossen
und ihr Inneres int M :=
O⊂M O offen
O.
526
Anhang B.
Metrische und topologische R¨ aume
Eine Umgebung eines Punkts t eines topologischen Raums T ist eine Menge U , so daß eine offene Menge O mit t ∈ O ⊂ U existiert. (Eine Umgebung braucht selbst nicht offen zu sein.) Eine Umgebungsbasis von t ist ein System U von Umgebungen von t, so daß jede Umgebung V ein U ∈ U umfaßt. Im metrischen Fall bilden die Kugeln um t eine Umgebungsbasis; eine kleinere abz¨ ahlbare Umgebungsbasis besteht aus den Kugeln mit dem Radius n1 . Jetzt ist klar, was man unter dem Rand ∂M von M verstehen wird, n¨amlich die Menge aller t ∈ T , so daß U ∩ M = ∅ und U ∩ M = ∅ f¨ ur alle Umgebungen U von t gilt; es reicht, das f¨ ur alle U , die eine Umgebungsbasis von t durchlaufen, zu fordern. Eine Folge (tn ) in einem topologischen Raum T heißt konvergent gegen t ∈ T , falls – mit der Bezeichnung Ut f¨ ur die Menge aller Umgebungen eines Punkts t – ∀U ∈ Ut ∃N ∈ N ∀n ≥ N tn ∈ U. Wir schreiben wieder tn → t. Nun kommen wir zur ersten Abweichung vom metrischen Fall. Zum einen braucht der Grenzwert t nicht mehr eindeutig bestimmt zu sein; ein drastisches Beispiel ist τ = {∅, T }, denn hier konvergiert jede Folge gegen jeden Punkt in T . Zum anderen – und das wiegt weitaus schwerer – l¨ aßt sich Satz B.1.2 nicht auf topologische R¨aume ausdehnen; f¨ ur ein konkretes Gegenbeispiel siehe S. 405. Zwar ist die Implikation (ii) ⇒ (i) nach wie vor g¨ ultig; jedoch benutzt das Argument f¨ ur (i) ⇒ (ii) im metrischen Fall die Existenz abz¨ahlbarer Umgebungsbasen, denn man w¨ahlt ja tn ∈ U1/n (t) ∩ M . Man kann also sagen, daß die Folge (tn ) in Satz B.1.2(ii) eigentlich“ nicht mit N, sondern mit einer geeigneten ” Umgebungsbasis von t indiziert ist; und das suggeriert, in topologischen R¨aumen mit komplizierterer Umgebungsstruktur einen allgemeineren Konvergenzbegriff zu studieren. Die mengentheoretische Topologie kennt hier die Filterkonvergenz und die Netzkonvergenz. Beide Konzepte sind ¨ aquivalent; da jedoch die Netzkonvergenz einfacher zu erkl¨ aren ist und den Bed¨ urfnissen der Analysis angepaßter erscheint, soll nur auf diese eingegangen werden. Eine gerichtete Menge ist eine mit einer Relation ≤ versehene Menge I, welche (a) i ≤ i ∀i ∈ I, (b) i ≤ j, j ≤ k ⇒ i ≤ k, (c) ∀i1 , i2 ∈ I ∃j ∈ I
i1 ≤ j, i2 ≤ j
erf¨ ullt. Ein Netz in einer Menge T ist eine Abbildung von einer gerichteten Menge I nach T ; man schreibt (ti )i∈I oder k¨ urzer (ti ). Offensichtlich ist N mit der u ¨blichen Ordnung gerichtet, so daß jede Folge ein Netz ist. Ein weiteres Beispiel einer gerichteten Menge ist eine Umgebungsbasis U eines Punkts in einem topologischen Raum mit der Richtung U ≥ V ⇔ U ⊂ V ; (c) ist erf¨ ullt, da der Schnitt zweier Umgebungen eine Umgebung ist.
B.2
527
Topologische R¨ aume
Ein Netz (ti ) in einem topologischen Raum T heißt konvergent gegen t, falls (Ut wie oben) ∀U ∈ Ut ∃j ∈ I ∀i ≥ j
ti ∈ U.
W¨ahlt man im zuletzt genannten Beispiel zu V ∈ U ein beliebiges tV ∈ V , konvergiert (tV ) gegen t. Liegt t im Abschluß einer Menge M , kann man tV ∈ V ∩M w¨ahlen, und man erh¨ alt folgende Beschreibung des Abschlusses in topologischen R¨ aumen. Satz B.2.1 Folgende Bedingungen sind in einem topologischen Raum ¨ aquivalent: (i) t ∈ M . (ii) Es existiert ein Netz (ti ) in M mit ti → t. Kommen wir nun zur Stetigkeit von Abbildungen. Seien T1 und T2 (genauer (T1 , τ1 ) und (T2 , τ2 )) topologische R¨ aume und f : T1 → T2 eine Abbildung. Wir erheben nun die ε-δ-freie Charakterisierung der Stetigkeit im metrischen Fall zur Definition: f heißt stetig bei t0 , falls f¨ ur jede Umgebung ¨ V von f (t0 ) das Urbild f −1 (V ) eine Umgebung von t0 ist. Aquivalenterweise hat man nach Wahl von Umgebungsbasen U von t0 und V von f (t0 ) folgendes ε-δ-Kriterium“: f ist genau dann bei t0 stetig, wenn ” ∀V ∈ V ∃U ∈ U
t ∈ U ⇒ f (t) ∈ V.
Wie im metrischen Fall sagt man, f : T1 → T2 sei stetig, falls f an jeder Stelle stetig ist, und man erh¨ alt das folgende Analogon zu Satz B.1.4. Satz B.2.2 F¨ ur eine Abbildung f zwischen topologischen R¨ aumen T1 und T2 sind ¨ aquivalent: (i) f ist stetig. (ii) F¨ ur alle offenen O ⊂ T2 ist f −1 (O) offen in T1 . (iii) F¨ ur alle abgeschlossenen A ⊂ T2 ist f −1 (A) abgeschlossen in T1 . Anders als im metrischen Fall braucht die Stetigkeit nicht durch Folgenkonvergenz wie in Satz B.1.3(ii) charakterisiert zu sein; diese Eigenschaft ¨ wird Folgenstetigkeit genannt. Wieder erh¨ alt man eine Aquivalenz, wenn man mit Netzen statt Folgen operiert. Satz B.2.3 Sei f : T1 → T2 eine Abbildung zwischen topologischen R¨ aumen. Dann sind folgende Bedingungen ¨aquivalent: (i) f ist stetig bei t0 . (ii) ti → t0 ⇒ f (ti ) → f (t0 ) f¨ ur alle Netze (ti ).
528
Anhang B.
Metrische und topologische R¨ aume
Die S¨atze B.2.1 und B.2.3 deuten darauf hin, daß man in topologischen R¨aumen mit Netzen genauso hantieren kann wie mit Folgen im metrischen Fall. Dieser Eindruck ist weitgehend korrekt, und der Vorzug der Netze liegt darin, daß sich mit ihrer Hilfe Beweise oft mechanisieren lassen (siehe etwa Satz VIII.2.7). Es muß jedoch betont werden, daß es sehr wohl Konvergenzph¨anomene gibt, die sich nur auf Folgen beziehen. So ist etwa der Konvergenzsatz von Lebesgue (Satz A.3.2) f¨ ur Netze statt Folgen im allgemeinen falsch, und auch Korollar IV.2.5 braucht nicht mehr f¨ ur Netze zu gelten. Beachte ferner in diesem Zusammenhang, daß selbst in R konvergente Netze nicht beschr¨ ankt zu sein brauchen, etwa (ti ) = ( 1i ) auf der mit ≤ gerichteten Menge (0, ∞). Ist (T, τ ) ein topologischer Raum und S ⊂ T , so kann S mit der Relativtopologie τS = {O∩S: O ∈ τ } zu einem eigenst¨andigen topologischen Raum gemacht werden. Ist R ein weiterer topologischer Raum und f : R → S eine Abbildung, so ist f : R → S genau dann τS -stetig, wenn f : R → T τ -stetig ist. Ist f : T1 → T2 eine bijektive stetige Abbildung, f¨ ur die auch f −1 stetig ist, nennt man f einen Hom¨ oomorphismus und T1 und T2 hom¨ oomorph; die R¨aume T1 und T2 sind dann vom topologischen Standpunkt nicht zu unterscheiden. Wie das bereits erw¨ ahnte Beispiel der Topologie {∅, T } zeigt, garantiert die Definition eines topologischen Raums noch nicht, daß es auch viele offene Mengen gibt. Die mengentheoretische Topologie kennt eine ganze Hierarchie von Trennungsaxiome“ genannten Reichhaltigkeitsbedingungen, die ” von den meisten der f¨ ur die Analysis relevanten Topologien allesamt erf¨ ullt werden. Hier interessieren uns nur zwei dieser Bedingungen. Ein topologischer Raum T heißt Hausdorffraum, wenn je zwei verschiedene Punkte disjunkte Umgebungen besitzen, explizit, wenn es zu s = t disjunkte offene Mengen U und V mit s ∈ U , t ∈ V gibt. Das garantiert, daß jede endliche Menge abgeschlossen ist und jede konvergente Folge bzw. jedes konvergente Netz genau einen Grenzwert besitzt. Damit ist aber noch nicht gesagt, daß es nichttriviale reellwertige Funktionen auf einem solchen Raum gibt; in der Tat hat Urysohn (Math. Ann. 94 (1925) 262–295) einen Hausdorffraum T konstruiert, auf dem jede stetige Funktion f : T → R konstant ist; vgl. auch Pedersen [1989], S. 29, f¨ ur eine einfachere Konstruktion nach Bing. Man braucht dazu also eine sch¨arfere Bedingung. Ein topologischer Raum T heißt normal, wenn je zwei disjunkte abgeschlossene Mengen disjunkte Umgebungen besitzen, genauer, wenn es zu disjunkten abgeschlossenen Mengen A und B disjunkte offene Mengen U und V mit A ⊂ U und B ⊂ V gibt. (Beachte, daß definitionsgem¨aß ein normaler Raum nicht notwendig ein Hausdorffraum ist, da einpunktige Mengen nicht abgeschlossen zu sein brauchen.) Es ist leicht zu sehen, daß metrische R¨aume und kompakte Hausdorffr¨ aume normal sind. Hier ist der relevante Satz u ¨ber normale R¨aume.
B.2
Topologische R¨ aume
529
Theorem B.2.4 (Satz von Tietze-Urysohn) F¨ ur einen topologischen Raum T sind ¨ aquivalent: (i) T ist normal. (ii) Sind A und B disjunkte abgeschlossene Teilmengen von T , so existiert eine stetige Funktion f : T → [0, 1] mit f |A = 0 und f |B = 1. (iii) Zu jeder abgeschlossenen Teilmenge A von T und jeder bzgl. der Relativtopologie auf A stetigen Funktion f : A → [a, b] existiert eine stetige Fortsetzung F : T → [a, b]. Den u ¨blichen“ Beweis dieses Theorems entnehme man der angegebenen ” Literatur (etwa Pedersen [1989], S. 24); man beachte auch die Beweisvarianten von Mandelkern in Arch. Math. 60 (1993) 364–366 und von Ossa in Arch. Math. 71 (1998) 331–332. Ein etwas anderer Beweis beruht auf folgendem Sandwichlemma“. ” Lemma B.2.5 (Lemma von Tong) Sei T ein normaler topologischer Raum, und seien ϕ1 , ϕ2 : T → [a, b] Funktionen, so daß {t: ϕ1 (t) < α} f¨ ur alle α ∈ R offen ist (ϕ1 ist halbstetig ” von oben“), {t: ϕ2 (t) > α} f¨ ur alle α ∈ R offen ist (ϕ2 ist halbstetig von ” unten“) und ϕ1 ≤ ϕ2 gilt. Dann existiert eine stetige Funktion ϕ: T → [a, b] mit ϕ1 ≤ ϕ ≤ ϕ2 . Beweise dieses Lemmas findet man in Tongs Originalarbeit (Duke Math. J. 19 (1952) 289–292) oder in Lacey [1974], S. 27f. Wenn man Lemma B.2.5 akzeptiert, folgt Theorem B.2.4 sofort: Die Implikationen (iii) ⇒ (ii) ⇒ (i) sind klar, und f¨ ur (i) ⇒ (iii) setze einfach f (t) t ∈ A, f (t) t ∈ A, ϕ1 (t) = ϕ2 (t) = a t∈ / A, b t∈ / A. Wie im metrischen Fall erh¨ alt man eine Aussage u ¨ ber normerhaltende Fortsetzungen. Korollar B.2.6 Sei T ein normaler topologischer Raum und A ⊂ T eine abgeschlossene Teilmenge. Sei f : A → K eine beschr¨ankte stetige Funktion. Dann existiert eine beschr¨ankte stetige Fortsetzung F : T → K mit F ∞ = f ∞ . Nun wollen wir uns den kompakten topologischen R¨aumen widmen. Wie im metrischen Fall nennen wir einen topologischen Raum kompakt, wenn ¨ jede offene Uberdeckung eine endliche Teil¨ uberdeckung besitzt1 . Ein topologischer Raum heißt lokalkompakt, wenn jeder Punkt eine Umgebungsbasis aus kompakten Mengen besitzt. 1 Manche
Autoren nennen diese Eigenschaft quasikompakt und fordern zur Kompaktheit zus¨ atzlich die Hausdorffeigenschaft.
530
Anhang B.
Metrische und topologische R¨ aume
Ist T ein kompakter Raum und S ⊂ T abgeschlossen, so ist S in der Relativtopologie kompakt; ist T ein Hausdorffraum, gilt auch die Umkehrung. Die Kompaktheit eines Teilraums S eines topologischen Raums T kann man ¨aquivalent so beschreiben: Ist (Oi ) eine Familie offener Teilmengen von T mit S ⊂ i∈I Oi , so existieren endlich viele Oi1 , . . . , Oin mit n ˜ i := Oi ∩ S bilden eine offene Uberdeckung ¨ S ⊂ k=1 Oik ; denn die O von S bzgl. der Relativtopologie im bisherigen Sinn. Ist f : T1 → T2 stetig und T1 kompakt, so ist f (T1 ) kompakt. Das folgende Lemma u aume ist zwar einfach, aber n¨ utzlich; ¨ber kompakte Hausdorffr¨ es folgt unmittelbar aus den obigen Bemerkungen und Satz B.2.2(iii). Lemma B.2.7 Sind T1 und T2 Hausdorffr¨ aume, f : T1 → T2 stetig und bijektiv sowie T1 kompakt, so ist f −1 stetig. Mit anderen Worten, T1 und T2 sind hom¨oomorph. Es sollen verschiedene ¨ aquivalente Umformungen des Kompaktheitsbegriffs beschrieben werden. Wie bereits im Zusammenhang mit Satz B.1.7 bemerkt wurde, sind Kompaktheit und Folgenkompaktheit f¨ ur topologische R¨aume v¨ollig verschiedene Eigenschaften (siehe auch S. 416). Wieder muß man Netze ins Spiel bringen. Leider ist der ad¨aquate Begriff eines Teilnetzes etwas kompliziert. Sei (ti )i∈I ein Netz, J eine weitere gerichtete Menge und ϕ: J → I eine Abbildung mit ∀i ∈ I ∃j0 ∈ J ∀j ≥ j0
ϕ(j) ≥ i.
Dann heißt (tϕ(j) )j∈J ein Teilnetz von (ti )i∈I . Jedes Teilnetz eines konvergenten Netzes konvergiert gegen denselben Grenzwert. Ein Teilnetz eines Netzes (ti ) enth¨alt manche der ti , diese jedoch eventuell sehr h¨aufig, was das Konzept des Teilnetzes von dem einer Teilfolge unterscheidet. In der Tat werden wir im Beweis von Lemma B.2.8 ein Teilnetz angeben, das jedes der ti unendlich oft enth¨ alt. F¨ ur den folgenden Satz ist noch ein Begriff wichtig. Ein Netz (ti ) liegt schließlich in einer Menge M ⊂ T , falls ein i0 ∈ I mit ti ∈ M f¨ ur alle i ≥ i0 existiert. Eine Netz heißt universell, wenn es f¨ ur alle M ⊂ T entweder schließlich in M oder schließlich in T \ M liegt. Universelle Netze sind schwer zu visualisieren, und tats¨ achlich ist es noch niemandem gelungen, ein solches (außer den schließlich konstanten Netzen) konkret anzugeben. Mit Hilfe des Zornschen Lemmas kann man aber ihre Existenz beweisen. Lemma B.2.8 Jedes Netz besitzt ein universelles Teilnetz. Beweis. Sei (ti ) ein Netz in T . Betrachte die Schw¨anze“ Si = {ti : i ≥ i} ” sowie S = {Si : i ∈ I}. Nennt man eine Familie F von Teilmengen von T eine Filterbasis, falls kein F ∈ F leer ist und zu F1 , F2 ∈ F ein F ∈ F mit F ⊂ F1 ∩ F2 existiert, so ist S eine Filterbasis. Sei X das System
B.2
Topologische R¨ aume
531
aller S umfassenden Filterbasen. Bez¨ uglich der Inklusion ist X induktiv geordnet, und das Zornsche Lemma liefert eine maximale Familie U ∈ X; die Maximalit¨at von U impliziert insbesondere T ∈ U. Als n¨achstes beobachten wir, daß U die bizarre Eigenschaft zukommt, f¨ ur jede Teilmenge von T entweder diese selbst oder ihr Komplement zu enthalten. Ist n¨amlich M ⊂ T , so gilt M ∩ U = ∅ f¨ ur alle U ∈ U oder M ∩ U = ∅ f¨ ur alle U ∈ U, denn andernfalls existierten U, V ∈ U mit M ∩ U = ∅ und M ∩ V = ∅, so daß U und V disjunkt sind im Widerspruch zur Definition von X. Nehmen wir M ∩ U = ∅ f¨ ur alle U ∈ U an, so ist U ∪ {U ∩ M : U ∈ U} ∈ X, und wegen der Maximalit¨at von U gilt M = T ∩ M ∈ U. Im verbleibenden Fall erh¨ alt man analog M ∈ U. Nun versehen wir Φ = {(U, i) ∈ U × I: ti ∈ U } mit der Relation (U, i) ≥ (V, j), falls U ⊂ V und i ≥ j. Φ ist eine gerichtete Menge, denn zu (U1 , i1 ), (U2 , i2 ) ∈ Φ w¨ahle V ∈ U mit V ⊂ U1 ∩ U2 und j ∈ I mit j ≥ i1 , j ≥ i2 . Da Sj ∈ U, ist Sj ∩ V = ∅; d.h. es existiert k ≥ j mit tk ∈ V . Also dominiert (V, k) ∈ Φ sowohl (U1 , i1 ) als auch (U2 , i2 ). Mittels ϕ: Φ → I, (U, i) → i, wird ein Teilnetz (tϕ(U,i) ) von (ti ) definiert, das nach Konstruktion schließlich in allen U ∈ U verl¨auft. Die im letzten Absatz gemachte Beobachtung liefert, daß es ein universelles Teilnetz ist. 2 Das im vorigen Beweis konstruierte“ Mengensystem U ist ein Beispiel ” eines Ultrafilters. Satz B.2.9 F¨ ur einen topologischen Raum T sind ¨ aquivalent: (i) T ist kompakt. (ii) T hat die endliche Durchschnittseigenschaft, d.h., sind Ai (i ∈ I) abgeschlossene Teilmengen von T mit A i = ∅, so existieren i∈I n endliche viele Indizes i1 , . . . , in mit k=1 Aik = ∅. (iii) Jedes universelle Netz in T konvergiert. (iv) Jedes Netz in T hat ein konvergentes Teilnetz. Beweis. (i) ⇔ (ii) folgt sofort durch Komplementbildung. (i) ⇒ (iii): Wir nehmen an, es existiere ein nicht konvergentes universelles Netz (ti ). F¨ ur alle t ∈ T gibt es dann eine offene Umgebung Ut , so daß (ti ) nicht schließlich in Ut liegt; weil das Netz universell ist, muß (ti ) schließlich in Ut liegen. W¨ ahlt man uberdeckung Ut1 ∪ . . . ∪ Utn eine endliche Teil¨ ¨ der offenen Uberdeckung alt man den Widerspruch, daß (ti ) t∈T Ut , erh¨ schließlich in Ut1 ∩ . . . ∩ Utn = ∅ liegt. (iii) ⇒ (iv) ist klar nach Lemma B.2.8. (iv) ⇒ (i): Nehmen wir an, (iv)gelte, aber T sei nicht kompakt. Dann ¨ existiert eine offene Uberdeckung uberdeki∈I Ui , die keine endliche Teil¨ kung zul¨aßt. Bezeichnet Φ die Menge der endlichen Teilmengen von I, so existiert also zu jedem F ∈ Φ ein tF ∈ T \ i∈F Ui . Da Φ in nat¨ urlicher Weise eine gerichtete Menge ist, haben wir so ein Netz definiert. W¨are
532
Anhang B.
Metrische und topologische R¨ aume
(tϕ(j) )j∈J ein konvergentes Teilnetz, so existierte ein Grenzwert t und weiter ein Index i mit t ∈ Ui . Aber tϕ(j) ∈ / Ui , falls ϕ(j) ≥ {i}, im Widerspruch zur angenommenen Konvergenz. 2 Die wohl wichtigste Stabilit¨ atsaussage u ¨ber kompakte R¨aume ist der Satz von Tikhonov. Um ihn zu formulieren, brauchen wir das Konzept der Produkttopologie. Es sei A eine Indexmenge, und Tα sei f¨ ur jedes α ∈ A ein topologischer Raum. Das mengentheoretische Produkt der Tα ist : Tα = {f : A → Tα : f (α) ∈ Tα ∀α ∈ A} . α∈A
Stimmen alle Tα u ¨berein, sagen wir Tα = T , schreibt man auch T A ; T A besteht also :aus allen Funktionen von A nach T . Das Auswahlaxiom impliziert, daß Tα nicht: leer ist. Nun beschreiben wir die Produkttopologie. Eine Teilmenge O ⊂ Tα heißt offen (in der Produkttopologie), wenn es f¨ ur alle t ∈ O endlich viele Indizes α1 , . . . , αk und in Tαj offene Mengen Oαj (j = 1, . . . , k) mit : t ∈ s ∈ Tα : s(αj ) ∈ Oαj ∀j = 1, . . . , k ⊂ O gibt. (Mit anderen Worten haben wir so eine Umgebungsbasis von t be: schrieben.) Bezeichnet πβ die: kanonische Abbildung Tα → Tβ , t → t(β), so ist eine Abbildung f : S → Tα (S ein topologischer Raum) genau dann stetig, wenn es:alle πβ ◦ f : S → Tβ sind, und ein Netz (ti )i∈I konvergiert genau dann in Tα gegen t, wenn alle πβ (ti ) i∈I in Tβ gegen πβ (t) konvergieren. Die Produkttopologie ist also die Topologie der punktweisen (oder koordinatenweisen) Konvergenz. Nun k¨onnen wir den fundamentalen Satz von Tikhonov formulieren und beweisen. Theorem B.2.10 (Satz von Tikhonov) : Das Produkt Tα kompakter R¨ aume ist kompakt. Beweis. Der Beweis kann schnell mit Hilfe uhrt wer: von Satz B.2.9 gef¨ den. Sei (t ) ein universelles Netz in T . F¨ u r jedes α ∈ A ist dann i i∈I α πα (ti ) i∈I ein universelles Netz in Tα , also nach Satz B.2.9 konvergent. Gem¨aß der Vorbemerkung ist (ti )i∈I selbst konvergent. Eine nochmalige Anwendung von Satz B.2.9 liefert die Behauptung des Theorems. 2 F¨ ur eine Beweisvariante sei auf Chernoffs Note in Amer. Math. Monthly 99 (1992) 932–934 verwiesen.
Symbolverzeichnis
X, Y, Z, . . . Xτ H, K, . . . A, B, . . . X (Xτ ) X/U X ⊕ Y , X ⊕p Y !2 Hi i∈I X Y X∼ =Y U ⊥ , V⊥
normierte, Banach- oder lokalkonvexe R¨ aume X, versehen mit der Topologie τ Hilbertr¨ aume Banachalgebren Dualraum von X Dualraum von X, versehen mit der Topologie τ Quotientenraum direkte Summe, p -direkte Summe (Satz I.3.3) Hilbertsche Summe der Hilbertr¨ aume Hi (Seite 493) X und Y sind isomorph X und Y sind isometrisch isomorph Annihilatoren ((III.4) und (III.5)); im Hilbertraumkontext: orthogonales Komplement
BX SX iX
abgeschlossene Einheitskugel: {x: x ≤ 1} Einheitssph¨ are: {x: x = 1} kanonische Isometrie von X nach X (Satz III.3.1)
K T D Re z Im z xξ xα
R oder C {z ∈ C: |z| = 1} {z ∈ C: |z| < 1} Realteil von z Imagin¨ n arteil von z n :nk=1 xαkkξk , wo x, ξ ∈n R x , wo x ∈ R , α ein Multiindex k=1 k
. , ||| . ||| . ∞ . p , . p , . Lp T , T nuk , T HS
generische Normen Supremumsnorm kanonische Norm auf p bzw. Lp Operatornorm, nukleare Norm, Hilbert-Schmidt-Norm von T Skalarprodukt
.,.
534
Symbolverzeichnis
τP σ(X, X ) σ(X , X) σ(X, Y )
von P erzeugte lokalkonvexe Topologie schwache Topologie auf X, X lokalkonvex schwach∗ -Topologie auf X , X lokalkonvex schwache Topologie des dualen Paars (X, Y ) auf X
∞ (T ) B(T ) C b (T ), C(T ), C0 (T ) C2π C k (Ω), C k (Ω) d, c0 , c, ∞ p , p (n) 2 (I) L p (R), L p (μ) Lp (R), Lp (μ) L1lok (Ω)
Raum aller beschr¨ ankten Funktionen auf T Raum der beschr¨ ankten meßbaren Funktionen auf T R¨ aume stetiger Funktionen (Beispiel I.1(c)) Raum der 2π-periodischen stetigen Funktionen R¨ aume differenzierbarer Funktionen (Beispiel I.1(d)) Folgenr¨ aume (Beispiel I.1(f)) p -Folgenraum, n-dimensionaler p -Raum (Beispiel I.1(g)) 2 -Raum u ¨ ber beliebiger Indexmenge (Beispiel V.1(e)) L p -Raum (Beispiele I.1(h) und (i)) ¨ zugeh¨ origer Raum von Aquivalenzklassen ¨ Raum der (Aquivalenzklassen von) lokal integrierbaren Funktionen {f : [a, b] → C: f absolutstetig, df /dt ∈ L2 [a, b]} R¨ aume von Maßen (Beispiel I.1(j) und Definition I.2.13) Raum der fastperiodischen Funktionen (Beispiel V.1(f)) Sobolevr¨ aume (Definition V.1.12) Raum aller stetigen Funktionen mit kompaktem Tr¨ ager (Aufgabe II.5.5) Raum der Testfunktionen auf Ω, d.h. der C ∞ -Funktionen mit kompaktem Tr¨ ager (Definition V.1.9) Raum der Testfunktionen auf Ω mit Tr¨ ager in K Raum der Distributionen auf Ω Raum der C ∞ -Funktionen auf Ω Raum der Distributionen auf Ω mit kompaktem Tr¨ ager (Aufgabe VIII.8.42) Schwartzraum (Definition V.2.3) Raum der temperierten Distributionen
AC[a, b] M (T, Σ), M (T ) AP2 (R) W m (Ω), H0m (Ω) K (Ω) D (Ω) D K (Ω) D (Ω) E (Ω) E (Ω) S (Rn ) S (Rn ) L(X, Y ) K(X, Y ) F (X, Y ) N (X, Y ) W (X, Y ) V (X, Y ) L(X), K(X), . . . HS(H)
Raum der linearen stetigen Operatoren von X nach Y Raum der kompakten Operatoren von X nach Y Raum der linearen stetigen Operatoren von X nach Y mit endlichdimensionalem Bild Raum der nuklearen Operatoren von X nach Y Raum der schwach kompakten Operatoren von X nach Y Raum der vollstetigen Operatoren von X nach Y entsprechender Raum von Operatoren von X nach X Raum der Hilbert-Schmidt-Operatoren auf H
Id, IdX T T∗ λ−T ker(T )
identischer Operator auf X adjungierter Operator im Hilbertraumsinn adjungierter Operator λ Id − T Kern von T : {x: T x = 0}
535
Symbolverzeichnis
Bild von T : {T x: x ∈ X} Definitionsbereich von T Graph von T : {(x, T x): x ∈ dom(T )} T ist Erweiterung von S Spektrum eines Operators oder eines Elements einer Banachalgebra A σp (T ), σc (T ), σr (T ) Punkt-, stetiges und Restspektrum eines Operators ρ(T ), ρ(x) Resolventenmenge Rλ (T ), Rλ (x) Resolventenabbildung r(T ), r(x) Spektralradius λn (T ) n-ter Eigenwert von T , gem¨ aß der Vielfachheit gez¨ ahlt sn (T ) n-te singul¨ are Zahl von T tr(T ) Spur von T x ⊗ y Operator x → x (x)y auf einem Banachraum e⊗f Operator x → x, ef auf einem Hilbertraum F Fouriertransformation F2 Fourier-Plancherel-Transformation (Satz V.2.9) PU im Hilbertraumkontext: Orthogonalprojektion auf U f (T ) Funktion eines selbstadjungierten Operators (Theorem VII.1.13) EA Spektralmaß, ausgewertet bei der Borelmenge A dEλ x, x Integration nach einem Spektralmaß ran(T ) dom(T ) gr(T ) S⊂T σ(T ), σ(x), σA (x)
A int A lin A lin A co A co A A A+B ΛA Ao , Aoo ex A
Abschluß von A Inneres von A lineare H¨ ulle von A abgeschlossene lineare H¨ ulle von A konvexe H¨ ulle von A abgeschlossene konvexe H¨ ulle von A Komplement von A {a + b: a ∈ A, b ∈ B} {λa: λ ∈ Λ, a ∈ A} Polare, Bipolare von A Menge der Extremalpunkte von A
λ, λd δx μ⊗ν ν μ f dλ, f (t) dt, . . .
Lebesguemaß Diracmaß oder Deltadistribution Produktmaß von μ und ν ν ist absolutstetig bzgl. μ Lebesguesches Integral
ΓA x x → x∗ alg(x, x∗ ) S(A) (Hω , πω )
Gelfandraum einer Banachalgebra Gelfandtransformierte von x Involution kleinste abgeschlossene Unteralgebra A0 mit e, x, x∗ ∈ A0 Menge der Zust¨ ande auf einer C ∗ -Algebra A GNS-Darstellung bzgl. des Zustands ω
536 [x], x + U σ xn → x UF,ε x⊥y d(x, A) xi
Symbolverzeichnis
¨ Aquivalenzklasse von x in X/U schwache Konvergenz {x: p(x) ≤ ε ∀p ∈ F } (Kapitel VIII) Orthogonalit¨ at Abstand von x zu A (Definition I.3.1) unbedingt konvergente Reihe
i∈I
pA χA 1 t Dα f D(α) f D(α) T Tf δ, δx supp(f ) f ∗g XI
Minkowskifunktional Indikatorfunktion von A (S. 510) konstante Funktion oder Folge mit dem Wert 1 identische Funktion t → t partielle Ableitung der Ordnung α, α ein Multiindex schwache Ableitung der Ordnung α (Definition V.1.11) Distributionenableitung der Ordnung α von T zu f geh¨ orige regul¨ are Distribution Deltadistribution Tr¨ ager von f : {t: f (t) = 0} Faltung von f und g Menge aller Funktionen von I nach X
Literaturverzeichnis
Das Literaturverzeichnis enth¨ alt einf¨ uhrende B¨ ucher zur Funktionalanalysis, die mit dem Symbol gekennzeichnet sind, sowie speziellere Monographien zu Teilgebieten der Funktionalanalysis und Lehrb¨ ucher anderer Gebiete, die im Text genannt werden. R. A. Adams: Sobolev Spaces. Academic Press, 1975. A. G. Aksoy, M. A. Khamsi: Nonstandard Methods in Fixed Point Theory. Springer, 1990. F. Albiac, N. J. Kalton: Topics in Banach Space Theory. Springer, 2006. M. A. Al-Gwaiz: Theory of Distributions. Marcel Dekker, 1992.
H. W. Alt: Lineare Funktionalanalysis. Springer, 5. Auflage, 2006. D. Amir: Characterizations of Inner Product Spaces. Birkh¨ auser, 1986.
J. Appell, M. V¨ ath: Elemente der Funktionalanalysis. Vieweg, 2005. J. Arias de Reyna: Pointwise Convergence of Fourier Series. Springer, 2002.
J.-P. Aubin: Applied Functional Analysis. Wiley, 1979. A. V. Balakrishnan: Applied Functional Analysis. Springer, 1976. S. Banach: Th´eorie des Op´erations Lin´ eaires. Monografie Matematyczne, 1932. R. G. Bartle (Hg.): Studies in Functional Analysis. Mathematical Association of America, 1980. H. Bauer: Maß- und Integrationstheorie. De Gruyter, 1990. H. Bauer: Wahrscheinlichkeitstheorie. De Gruyter, 4. Auflage, 1991. B. Beauzamy: Introduction to Banach Spaces and their Geometry. NorthHolland, 2. Auflage, 1985. B. Beauzamy: Introduction to Operator Theory and Invariant Subspaces. NorthHolland, 1988. E. Behrends: Maß- und Integrationstheorie. Springer, 1987.
538
Literaturverzeichnis
C. Bennett, R. Sharpley: Interpolation of Operators. Academic Press, 1988. Y. Benyamini, J. Lindenstrauss: Geometric Nonlinear Functional Analysis. American Mathematical Society, 2000.
S. K. Berberian: Lectures in Functional Analysis and Operator Theory. Springer, 1974. J. Bergh, J. L¨ ofstr¨ om: Interpolation Spaces. Springer, 1976. A. Besicovitch: Almost Periodic Functions. Cambridge University Press, 1932. H. Bohr: Fastperiodische Funktionen. Springer, 1932. ´ s: Linear Analysis. Cambridge University Press, 1990. B. Bolloba O. Bratteli, D. W. Robinson: Operator Algebras and Quantum Statistical Mechanics (Vol. I and II). Springer, 1979, 1981.
H. Brezis: Analyse Fonctionnelle. Masson, 4. Auflage, 1993. G. Buttazzo, M. Giaquinta, S. Hildebrandt: One-Dimensional Variational Problems. Clarendon Press, 1998. N. Carothers: A Short Course on Banach Space Theory. Cambridge University Press, 2005. E. W. Cheney: Introduction to Approximation Theory. Chelsea, 2. Auflage, 1982. G. Choquet: Lectures on Analysis I–III. Benjamin, 1969. D. L. Cohn: Measure Theory. Birkh¨ auser, 1980.
J. B. Conway: A Course in Functional Analysis. Springer, 1985. R. Courant, D. Hilbert: Methoden der Mathematischen Physik (Band I und II). Springer, 3. Auflage, 1968. B. Dacorogna: Direct Methods in the Calculus of Variations. Springer, 1989. I. Daubechies: Ten Lectures on Wavelets. SIAM, 1992. E. B. Davies: One-Parameter Semigroups. Academic Press, 1980. M. M. Day: Normed Linear Spaces. Springer, 3. Auflage, 1973. K. Deimling: Nonlinear Functional Analysis. Springer, 1985. R. Deville, G. Godefroy, V. Zizler: Smoothness and Renormings in Banach Spaces. Longman, 1993. J. Diestel, J. J. Uhl: Vector Measures. American Mathematical Society, 1977. ´: Grundz¨ J. Dieudonne uge der modernen Analysis. Vieweg, 9 B¨ ande. Insbesondere: Band 1, 3. Auflage, 1985. Band 2, 2. Auflage, 1987. Band 7, 1982. Band 8, 1983. J. Dieudonn´ e: History of Functional Analysis. North-Holland, 1981.
M. Dobrowolski: Angewandte Funktionalanalysis. Springer, 2006. J. Dugundji: Topology. Allyn and Bacon, 1966. N. Dunford, J. T. Schwartz: Linear Operators. Wiley, 3 B¨ ande. Part I: General Theory, 1958. Part II: Spectral Theory, 1963. Part III: Spectral Operators, 1971. D. E. Edmunds, W. D. Evans: Spectral Theory and Differential Operators. Clarendon Press, 1987.
Literaturverzeichnis
539
Yu. Eidelman, V. Milman, A. Tsolomitis: Functional Analysis. American Mathematical Society, 2004. K.-J. Engel, R. Nagel: One-Parameter Semigroups for Linear Evolution Equations. Springer, 2000. ´jek, P. Habala, V. Montesinos, V. Zizler: Banach Space M. Fabian, P. Ha Theory. Springer, 2011. K. Floret: Maß- und Integrationstheorie. Teubner, 1981. G. B. Folland: Introduction to Partial Differential Equations. Princeton University Press, 2. Auflage, 1995. T. W. Gamelin: Uniform Algebras. Chelsea, 2. Auflage, 1984. I. M. Gelfand, N. Ya. Vilenkin: Generalized Functions, Vol. 4. Academic Press, 1964. K. Goebel, W. A. Kirk: Topics in Metric Fixed Point Theory. Cambridge University Press, 1990. J. A. Goldstein: Semigroups of Linear Operators and Applications. Oxford University Press, 1985. A. Granas, J. Dugundji: Fixed Point Theory. Springer, 2003. `re: Sequences in Classical Banach Spaces. Marcel Dekker, S. Guerre-Delabrie 1992. ´ jek, V. Zizler: Introduction to Banach Spaces. Matfyzpress, P. Habala, P. Ha 1996. P. Halmos: Introduction to Hilbert Space and the Theory of Spectral Multiplicity. Chelsea, 1951.
P. Halmos: A Hilbert Space Problem Book. Springer, 2. Auflage, 1982. H. Heuser: Funktionalanalysis. Teubner, 3. Auflage, 1992. D. Hilbert, E. Schmidt: Integralgleichungen und Gleichungen mit unendlich vielen Unbekannten. Teubner-Archiv zur Mathematik, 1989. E. Hille, R. S. Phillips: Functional Analysis and Semi-Groups. American Mathematical Society Colloquium Publications, Vol. 31, 2. Auflage, 1957.
F. Hirzebruch, W. Scharlau: Einf¨uhrung in die Funktionalanalysis. B. I., 1971. R. B. Holmes: Geometric Functional Analysis and its Applications. Springer, 1975. L. H¨ ormander: The Analysis of Linear Partial Differential Operators I. Springer, 2. Auflage, 1990.
G. J. O. Jameson: Topology and Normed Spaces. Chapman and Hall, 1974. K. J¨ orgens: Lineare Integraloperatoren. Teubner, 1970. O. G. Jørsboe, L. Mejlbro: The Carleson-Hunt Theorem on Fourier Series. Lecture Notes in Mathematics 911. Springer, 1982. J. Jost: Partielle Differentialgleichungen. Springer, 1998. J. Jost, X. Li-Jost: Calculus of Variations. Cambridge University Press, 1999.
540
Literaturverzeichnis
W. Kaballo: Grundkurs Funktionalanalysis. Spektrum-Verlag, 2011. M. I. Kadets, V. M. Kadets: Series in Banach Spaces. Birkh¨ auser, 1997. R. V. Kadison, J. R. Ringrose: Fundamentals of the Theory of Operator Algebras (Vol. I and II). Academic Press, 1983, 1986. J.-P. Kahane: Some Random Series of Functions. Cambridge University Press, 2. Auflage, 1985. N. J. Kalton, N. T. Peck, J. W. Roberts: An F -Space Sampler. Cambridge University Press, 1984. ˙ The Life of Stefan Banach. Birkh¨ R. Kaluza: auser, 1996. E. Kaniuth: A Course in Commutative Banach Algebras. Springer, 2009. J. L. Kelley: General Topology. Van Nostrand, 1955. H. K¨ onig: Eigenvalue Distribution of Compact Operators. Birkh¨ auser, 1986. P. Kopp: Martingales and Stochastic Integrals. Cambridge University Press, 1984. T. W. K¨ orner: Fourier Analysis. Cambridge University Press, 1988. G. K¨ othe: Topologische lineare R¨ aume I. Springer, 2. Auflage, 1966. G. K¨ othe: Topological Vector Spaces II. Springer, 1979. H. E. Lacey: The Isometric Theory of Classical Banach Spaces. Springer, 1974. J. Lamperti: Stochastic Processes. Springer, 1977.
P. D. Lax: Functional Analysis. Wiley, 2002. J. Lindenstrauss, L. Tzafriri: Classical Banach Spaces (Vol. I and II). Springer, 1977, 1979. Nachdruck 1996. L. H. Loomis: An Introduction to Abstract Harmonic Analysis. Van Nostrand, 1953. J. L¨ utzen: The Prehistory of the Theory of Distributions. Springer, 1982.
B. MacCluer: Elementary Functional Analysis. Springer, 2009. J. T. Marti: Introduction to Sobolev Spaces and Finite Element Solution of Elliptic Boundary Value Problems. Academic Press, 1986.
M. Mathieu: Funktionalanalysis. Spektrum-Verlag, 1998. R. D. Mauldin (Hg.): The Scottish Book. Mathematics from the Scottish Caf´ e. Birkh¨ auser, 1981. R. B. Megginson: An Introduction to Banach Space Theory. Springer, 1998.
R. Meise, D. Vogt: Einf¨uhrung in die Funktionalanalysis. Vieweg, 1992. Y. Meyer: Wavelets and Operators. Cambridge University Press, 1992. A. F. Monna: Dirichlet’s Principle. A Mathematical Comedy of Errors and its Influence on the Development of Analysis. Oosthoek Publishing Company, 1975. A. F. Monna: Functional Analysis in Historical Perspective. Oosthoek Publishing Company, 1973.
A. Mukherjea, K. Pothoven: Real and Functional Analysis (Vol. I and II). Plenum Press, 2. Auflage, 1984, 1986.
Literaturverzeichnis
541
G. J. Murphy: C ∗ -Algebras and Operator Theory. Academic Press, 1990. L. Narici, E. Beckenstein: Topological Vector Spaces. Marcel Dekker, 1985. J. C. Oxtoby: Measure and Category. Springer, 2. Auflage, 1980. A. Pazy: Semigroups of Linear Operators and Applications to Partial Differential Equations. Springer, 1983. G. K. Pedersen: C ∗ -Algebras and their Automorphism Groups. Academic Press, 1979.
G. K. Pedersen: Analysis Now. Springer, 1989. R. Phelps: Convex Functions, Monotone Operators and Differentiability. Springer, 2. Auflage, 1993. R. R. Phelps: Lectures on Choquet’s Theorem. Van Nostrand, 1966. 2. Auflage Springer 2001. A. Pietsch: Operator Ideals. North-Holland und Deutscher Verlag der Wissenschaften, 1980. A. Pietsch: Eigenvalues and s-Numbers. Cambridge University Press und Geest & Portig, 1987. A. Pietsch: History of Banach Spaces and Linear Operators. Birkh¨ auser, 2007.
M. Reed, B. Simon: Methods of Modern Mathematical Physics. Academic Press. I: Functional Analysis. 2. Auflage, 1980. II: Fourier Analysis, Self-Adjointness. 1975. III: Scattering Theory. 1979. IV: Analysis of Operators. 1978.
F. Riesz, B. Sz.-Nagy: Vorlesungen ¨uber Funktionalanalysis. Deutscher Verlag der Wissenschaften, 2. Auflage, 1968. W. Rudin: Fourier Analysis on Groups. Wiley, 1962. W. Rudin: Principles of Mathematical Analysis. McGraw-Hill, 3. Auflage, 1976. W. Rudin: Real and Complex Analysis. McGraw-Hill, 3. Auflage, 1986.
W. Rudin: Functional Analysis. McGraw-Hill, 2. Auflage, 1991. ˇka: Nichtlineare Funktionalanalysis. Springer, 2004. M. Ruˇ zi c
K. Saxe: Beginning Functional Analysis. Springer, 2002. W. Scharlau: Wer ist Alexander Grothendieck? Band 1: Anarchie. Band 3: Spiritualit¨ at. Books on Demand, 2007, 2010.
M. Schechter: Principles of Functional Analysis. American Mathematical Society, 2. Auflage, 2002.
H. Schr¨ oder: Funktionalanalysis. Akademie-Verlag, 1997. J. T. Schwartz: Nonlinear Functional Analysis. Gordon and Breach, 1969. L. Schwartz: Th´eorie des distributions. Hermann, 2. Auflage, 1966. S. L. Sobolev: Partial Differential Equations of Mathematical Physics. Pergamon Press, 1964. M. H. Stone: Linear Transformations in Hilbert Space. American Mathematical Society Colloquium Publications, Vol. 15, 1932.
542
Literaturverzeichnis
V. S. Sunder: Functional Analysis: Spectral Theory. Birkh¨auser, 1998. A. E. Taylor, D. C. Lay: Introduction to Functional Analysis. Wiley, 2. Auflage, 1980. `ves: Topological Vector Spaces, Distributions and Kernels. Academic F. Tre Press, 1967. H. Triebel: H¨ ohere Analysis. Deutscher Verlag der Wissenschaften, 1972. H. Triebel: Interpolation Theory, Function Spaces, Differential Operators. Deutscher Verlag der Wissenschaften, 1978. J. L. Troutman: Variational Calculus and Optimal Control. Springer, 2. Auflage, 1996. W. Walter: Gew¨ ohnliche Differentialgleichungen. Springer, 5. Auflage, 1993. J. Weidmann: Lineare Operatoren in Hilbertr¨ aumen. Teubner, 1976. D. Werner: Einf¨ uhrung in die h¨ ohere Analysis. Springer, 2. Auflage, 2009. N. Wiener: I Am a Mathematician. Doubleday & Co, 1956. S. Willard: Topology. Addison-Wesley, 1970. J. Wloka: Partielle Differentialgleichungen. Teubner, 1982. P. Wojtaszczyk: Banach Spaces for Analysts. Cambridge University Press, 1991. P. Wojtaszczyk: A Mathematical Introduction to Wavelets. Cambridge University Press, 1997.
K. Yosida: Functional Analysis. Springer, 6. Auflage, 1980. Nachdruck 1995. N. Young: An Introduction to Hilbert Space. Cambridge University Press, 1988. E. Zeidler: Applied Functional Analysis (2 Bde.). Springer, 1995. E. Zeidler: Nonlinear Functional Analysis and Its Applications. Vol. I: Fixed Point Theorems. Springer, 1986. ˙ W. Zelazko: Banach Algebras. Elsevier, 1973. R. J. Zimmer: Essential Results of Functional Analysis. The University of Chicago Press, 1990. A. Zygmund: Trigonometric Series (Vols. 1 and 2 combined). Cambridge University Press, 2. Auflage, 1959.
Namen- und Sachverzeichnis
Abbildung asymptotisch regul¨ are 171 demiabgeschlossene 169 kompakte 180 kondensierende 186 nichtexpansive 167 verdichtende 186 Abbildungsgrad 201 abgeschlossene Menge 520, 525 Abschließung eines Operators 345, 384 Abschluß einer Menge 520, 525 absolute Konvergenz 16, 235 absolutkonvex 396 absolutstetig 512, 518 absorbierend 101 affine Funktion 128, 459 Algebrenhomomorphismus 321, 479 Annihilator 99 Approximation, beste 128, 225 Approximationseigenschaft 88 Approximationszahlen 86, 310 approximativer Eigenwert 381 aquivalente Norm 24, 25, 83, 155 ¨ Asplundraum 136 Atom eines Maßraums 460 Auerbach, H. 43 Auerbachbasis 65 Auswertungsfunktional 412 B ∗ -Algebra 500 Bairescher Kategoriensatz 140
Banach, S. 40–43, 131–133, 195, 469 Banachalgebra 475 halbeinfache 485, 501 ohne Einheit 498, 500 Banachlimes 126 Banach-Mazur-Abstand 90 Banach-Mazur-Spiel 187 Banachraum 2 endlichdimensionaler 26, 27, 48, 64, 65, 82, 90, 164, 196 isomorphe Banachr¨ aume 54, 134 reflexiver 105, 175, 419, 442 Banachverband 245 Basis siehe Auerbachbasis, Orthonormalbasis, Schauderbasis Bauersches Maximumprinzip 460 Bergmanraum 249 Bernsteinpolynome 30 beschr¨ ankte Menge 456 Besselsche Ungleichung 233, 235 Bidualraum 104 Bikommutantensatz 502 bilineare Abbildung 122, 189, 465 Bipolarensatz 414 Borelmaß 32 Borelmengen 508, 513 Bourbaki, N. 90, 464, 469, 518 C0 -Halbgruppe 360
544 C ∗ -Algebra 485 Calkin-Algebra 486, 495 CAR-Algebra 498 Cauchy-Schwarzsche Ungleichung 20, 203, 492 Cauchyfolge 2, 522 schwache 189, 445 Cauchyproblem 359, 369, 379 Cayley-Transformation 250, 351, 386 Choquet-Spiel 187 Choquettheorie 473 Clarksonsche Ungleichung 38, 199 Courantsches Minimaxprinzip 309 Darstellung einer C ∗ -Algebra 494 irreduzible 501 Defektindizes 349 Delay-Gleichungen 362 Deltafunktion“ 429, 433 ” determinierender Bereich 384 dicht 28 Dieudonn´e, J. 132, 464, 465 Differentialoperator 50, 157, 347, 351 elliptischer 467, 469 hypoelliptischer 467 Diracmaß 514 Dirichletkern 148 Dirichletproblem 136, 230–232, 284–286 Dirichletsches Prinzip 136, 247 Disk-Algebra 8, 497 Distribution 432 Ableitung 434 mit kompaktem Tr¨ ager 462 Ordnung 432 regul¨ are 433 temperierte 406, 436 Doppelschichtpotential 284 Drei-Geraden-Satz 74 Dreiecksungleichung 1 umgekehrte 23 duales Paar 410 Dualit¨ atsabbildung 377 Dualraum 58, 404 separabler 100, 106, 473 von c0 59
Namen- und Sachverzeichnis
von C(K) 62 von K(H) 303 von Lp 60, 89 von p 59 von ∞ 89, 99 von N (H) 303 von (X, σ(X, X )) 407, 412 von (X, σ(X, Y )) 412 von (X , σ(X , X)) 412 Dunford-Pettis-Eigenschaft 451 Eidelheit, M. 43, 132 Eigenfunktion 258 Eigenvektor 258 verallgemeinerter 340, 468–469 Eigenwert 258, 336 approximativer 381 Vielfachheit algebraische 305 geometrische 272 Einbettungssatz von Rellich 222, 255 von Sobolev 220, 254 Einheitskugel 47 Einheitssph¨ are 47 Einheitsvektor 29 endlichdimensional siehe Banachraum, endlichdimensionaler oder Operator, endlichdimensionaler endliche Durchschnittseigenschaft 531 Epigraph 130 Ergodensatz 250 Erweiterung eines Operators 343 Friedrichs-Erweiterung 352, 382 Erzeuger einer Kontraktionshalbgruppe 372, 378 normstetigen Halbgruppe 371 Operatorhalbgruppe 364, 375 unit¨ aren Operatorgruppe 385 Euler-Lagrange-Gleichung 123 Extremalpunkt 420 Faktor 502
Namen- und Sachverzeichnis
Faltung 77, 82, 309, 339, 381, 477 Faltungsalgebra 477 fast u ¨ berall 512 fastperiodische Funktion 253 Fej´erkern 152 Fixpunktsatz Banachscher 166 Brouwerscher 178 Schauderscher 179, 182 von Browder-G¨ ohde-Kirk 175 von Caristi 198 von Darbo-Sadovski˘ı 186 von Krasnoselski˘ı 187 von Tikhonov 200 von Weissinger 197 Folgenkompaktheit 523 Folgenstetigkeit 527 Formel von Ascoli 84 Fourierkoeffizienten 147, 317 Fourierreihen 147–152, 191, 192, 237, 256, 309, 485 zuf¨ allige 317 Fouriertransformation 212–220, 240, 255, 436–438, 480 Fourier-PlancherelTransformation 218 Fr´echet, M. 43, 135, 252, 520 Fr´echet-differenzierbar 113 n-mal 122 Fr´echetraum 464 Fredholm, I. 312 Fredholmoperator 263, 504 Fredholmsche Alternative 266 Fredholmsche Integralgleichung 276 Fredholmscher Integraloperator 52 Friedrichs-Ungleichung 231 Friedrichssche Erweiterung 352, 382 Friedrichsscher Gl¨ attungsoperator 81 Fundamentallemma der Variationsrechnung 124 Funktion absolutstetige 512 affine 128, 459 der 1. Baireklasse 188 fastperiodische 253 Fr´echet-differenzierbare 113
545 Gˆ ateaux-differenzierbare 113 gleichm¨ aßig stetige 523 halbstetige 124, 529 integrierbare 511, 518 konvexe 128, 460 langsam wachsende 461 lokal integrierbare 432 meßbare 509 nirgends differenzierbare 141 schnell fallende 213 Schwartzfunktion 213 stetige 521, 527 Testfunktion 209, 432 Funktional halbstetiges 124 koerzitives 124 komplex-lineares 96 konvexes 125 Minkowskifunktional 101 normannehmendes 84, 471 stetiges 45, 403 sublineares 93 unstetiges 80 Funktionalkalk¨ ul 321, 326, 380, 391, 489 Gans 88 Gˆ ateaux, R. 135 Gˆ ateaux-differenzierbar 113 Gδ -Menge 140 Gelfand, I. M. 469, 500 Gelfandraum 483 Gelfandscher Darstellungssatz 484 Gelfandscher Dreier 468 Gelfandtransformation 483 gerichtete Menge 526 glatt 119 gleichgradig integrierbar 442 gleichgradig stetig 68 gleichm¨ aßig konvex 38, 172 GNS-Konstruktion 491–494 Gram-Schmidt-Verfahren 233 Graph 156 Graphennorm 158 Greensche Funktion 314, 466 Grothendieck, A. 88, 315, 464, 466 Grothendieck-Eigenschaft 471 Grundl¨ osung 435, 467
546 Haarfunktionen 247 Haarmaß 255, 477 Hahn, H. 40, 131 Hahn-Jordan-Zerlegung 517 halbeinfach 485, 501 Halbnorm 1, 402 halbnormierter Raum 1 Hamiltonoperator 389 Hammerstein-Operator 181 Hardyraum 248 harmonische Analyse 255–256, 477 H¨ aufungspunkt 520 Hauptraum 305 Hausdorff, F. 520 Hausdorffraum 528 Hausdorff-Young-Ungleichung 219, 250 Helly, E. 40, 131 Hermitepolynome 244 Hilbert, D. 40, 87, 133, 136, 251, 313, 385 Hilbertraum 204 Hilbertraumdimension 238 Hilbert-Schmidt-Operator 298 Hilberttransformation 91 H¨ oldersche Ungleichung 10, 15, 20 Homomorphismus 479 ∗ -Homomorphismus 486 Hom¨ oomorphismus 528 hypoelliptisch 467 Ideal 340, 341, 481 echtes 481 maximales 481 Index 263, 504 Indikatorfunktion 510 infinitesimaler Erzeuger siehe Erzeuger initiale Topologie 413 innerer Punkt 519 Inneres einer Menge 520, 525 inneres Produkt 203 Integral banachraumwertiger Funktionen 367 Integralgleichungen 57–58, 267, 276–286 Integraloperator 51–53, 67, 70, 109, 240, 291, 302
Namen- und Sachverzeichnis
Fredholmscher 52 schwach singul¨ arer 52, 85, 90, 285 singul¨ arer 90 Volterrascher 85, 267 Interpolationssatz von Marcinkiewicz 92 Riesz-Thorin 73 invarianter Unterraum 315 Involution 485 Isometrie 54 partielle 275 isometrisch 54 isomorph 54, 134 Isomorphismus 54, 129 ∗ -Isomorphismus 486 Jamesraum 36 Kategorie von erster 140 von zweiter 140 Kern eines Integraloperators 52 positiv semidefiniter 311 Kernlemma 411 Kernsatz 465 Kettenregel 120 koerzitive Bilinearform 247 koerzitives Funktional 124 Kolmogorovsches Normierbarkeitskriterium 456 kompakter Operator siehe Operator, kompakter kompakter Raum 523 kompakter Tr¨ ager 329, 462 komplementiert 165, 254 konjugiert linear 228 konjugierter Exponent 62 Kontraktion strikte 166 Kontraktionshalbgruppe 363 konvergente Folge 520, 526 konvergentes Netz 527 Konvergenz absolute 16, 235 schwache siehe schwache Konvergenz unbedingte 234, 235, 247, 253
547
Namen- und Sachverzeichnis
Konvergenzsatz von Lebesgue 516 konvexe Funktion 128, 460 H¨ ulle 414 abgeschlossene 414 Menge 101 konvexes Funktional 125 K¨ othe, G. 464 kreisf¨ ormig 396 Kuchen 429
Mazur, S. 43, 131–133, 136, 499 Metrik 519 metrischer Raum 519 kompakter 523 vollst¨ andiger 522 metrisierbar 457, 525 Minkowskifunktional 101 Minkowskische Ungleichung 12, 15 Mittelwertsatz 120 Multiindex 7
Laplaceoperator 230, 351, 365, 435 Lebesgue, H. 506 Lebesgueintegral 511 Lebesguemaß 508 Legendrepolynome 243 Leibnizformel 245 Lemma von Ehrling 86 Farkas 459 Schur 133, 447 Sobolev 220, 254 Tong 529 Zabre˘ıko 193 Leray-Schauder-Prinzip 194 (LF)-Raum 465 lokal gleichm¨ aßig konvex 130 lokalkompakter Raum 529 lokalkonvexer Raum 398 metrisierbarer 457 normierbarer 456 nuklearer 466, 469 tonnelierter 464 Lyapunovsche Ungleichung 38, 72
Nemytski˘ı-Operator 181 Netz 526 universelles 530 Neumannsche Reihe 56, 88, 478 Nichtkompaktheitsmaß 183, 201 nirgends dicht 140 nirgends differenzierbare Funktion 141 Norm 1 aquivalente 24, 25, 83, 155 ¨ feinere 49 Fr´echet-differenzierbare 117, 119, 130, 135, 248 Gˆ ateaux-differenzierbare 117, 130, 136 gleichm¨ aßig konvexe 38, 172 gr¨ obere 49 Hilbert-Schmidt-Norm 298 lokal gleichm¨ aßig konvexe 130 nukleare 287 strikt konvexe 37, 127, 130, 172, 422 wesentliche 486 normale Struktur 198 normaler Operator 239 normaler topologischer Raum 528 normales Element einer Banachalgebra 487 normierter Raum 1 normstetige Halbgruppe 360 nuklearer Operator 286 nuklearer Raum 466, 469 Nullumgebungsbasis 397 numerischer Wertebereich 320, 383
Mackey-Topologie 458 Maß 513 absolutstetiges 518 atomfreies 427 außeres 63, 509 ¨ Borelmaß 32 endliches 513 komplexes 517 regul¨ ares 32 σ-endliches 513 signiertes 517 Maßraum 513 maximaler Ideal-Raum 483
Observable 389, 503 offene Abbildung 153
548 offene Menge 519, 525 Operator siehe auch Abbildung, Differentialoperator, Integraloperator abgeschlossener 156, 345 abschließbarer 384 absolut 2-summierender 318 adjungierter 109, 238, 344, 434 akkretiver 377 beschr¨ ankter 46 dicht definierter 343 dissipativer 377 endlichdimensionaler 67 Erweiterung 343 Fredholmoperator 263, 504 halbbeschr¨ ankter 352 Hilbert-Schmidt-Operator 298 hypermaximaler 386 kompakter 66, 79, 111, 269, 271 endlichdimensionale Approximation 70, 87, 276 normaler 239 unbeschr¨ ankter 387 nuklearer 286 positiver 145, 249, 274, 280 schwach kompakter 448 sektorieller 393 selbstadjungierter 239, 344 stetige Fortsetzung 48, 129, 134, 166 stetiger 45, 403 strikt singul¨ arer 192 symmetrischer 344 Toeplitz-Operator 499, 504 unit¨ arer 239 vollstetiger 87, 133, 451 wesentlich selbstadjungierter 346 Operatorgruppe 81, 384 Operatorhalbgruppe analytische 393 normstetige 360, 394 stark stetige 360 Operatornorm 47 Ordnung einer Distribution 432 Orlicz, W. 43 Orliczraum 39
Namen- und Sachverzeichnis
orthogonal 224 Orthogonalprojektion 226 Orthonormalbasis 232 Orthonormalsystem 232 Parallelogrammgleichung 205 Parametrix 504 Parsevalsche Gleichung 236 partiell stetig 189 partielle Integration 244 partielle Isometrie 275 Plancherelgleichung 218 Poincar´e-Ungleichung 231 Polare 413 Polarisierung 241 Polarzerlegung 275, 336 positiv definit 203 positives Element einer C ∗ -Algebra 490 Pr¨ ahilbertraum 204 Prinzip der gleichm¨ aßigen Beschr¨ anktheit 143 Prinzip der lokalen Reflexivit¨ at 474 Prinzip der Verdichtung der Singularit¨ aten 191 Produktmaß 515 Produkttopologie 532 Projektion 163, 226 Projektionssatz 225, 226 Punktspektrum 258 Quadraturformeln 146 Quantenmechanik 388–390, 503 Quaternionen 497 Quotientenabbildung 54–56, 192 Quotientennorm 34 Quotientenraum 34 Rademacherfunktionen 247 Radikal 485 Rand einer Menge 520, 526 reflexiv 105, 175, 419, 442 lokale Reflexivit¨ at 474 regul¨ ares Maß 32 relativkompakt 66 Relativtopologie 528 reproduzierender Kern 246 Resolventenabbildung 257, 354, 371, 478
Namen- und Sachverzeichnis
Resolventengleichung 308 Resolventenmenge 257, 354, 371, 478 Restspektrum 258 Riesz, F. 40–41, 87–89, 131, 133, 252, 314, 385, 390 Riesz, M. 91 Rieszscher Darstellungssatz 62, 89, 127 Rieszsches Lemma 27, 39 Saks, S. 195 Satz u ¨ ber implizite Funktionen 121 Satz vom abgeschlossenen Bild 161, 382, 472 Satz vom abgeschlossenen Graphen 159, 464 Satz vom Kern 465 Satz von der dominierten Konvergenz siehe Satz von Lebesgue Satz von der monotonen Konvergenz siehe Satz von Beppo Levi Satz von der offenen Abbildung 154, 159, 464 Satz von Alaoglu 416 Alaoglu-Bourbaki 415 Arzel` a-Ascoli 68 Atkinson 504 Baire 139, 140 Banach-Dieudonn´e 419 Banach-Mazur 129 Banach-Saks 229 Banach-Steinhaus 143 Banach-Stone 474 Beppo Levi 516 Bessaga-Pe lczy´ nski 473 Bishop-Phelps 471 Carleson 151 Choquet 473 Courant 309 Datko-Pazy 393 Davis-Figiel-JohnsonPe lczy´ nski 471 de Leeuw-Kahane-Katznelson 318 Dini 280
549 Dunford 310 Dvoretzky-Rogers 235 Eberlein-Shmulyan 438 Ehrenpreis-Malgrange 467 Fej´er 151 Fischer-Riesz 238 Fr´echet-Riesz 228 Friedrichs-Stone 352 Fubini 514 Gantmacher 450 Gelfand 484 Gelfand-Kostyuchenko 469 Gelfand-Mazur 478 Gelfand-Naimark kommutativer 488 nichtkommutativer 494 Gluskin 90 Goldstine 419 Hahn-Banach 94, 97, 103, 104, 246, 408, 409 Hellinger-Toeplitz 240 Helly-Bray 471 Hille-Yosida 372, 375, 393 Jackson 44 James 471 John 90 Johnson 501 Johnson-K¨ onig-MaureyRetherford 317 Kadets-Snobar 196 Koml´ os 253 Kondrachev 255 Korovkin 145, 146 Krein-Milman 424 Krein-Shmulyan 416 Lax-Milgram 246 Lebesgue 516 Lidski˘ı 318 Lindenstrauss-Tzafriri 254 Lomonosov 315 Lumer-Phillips 378 Lyapunov 428 Mackey-Arens 458 Marcinkiewicz 92 Mazur-Ulam 83 Mercer 278 Milman 425
550 Satz von (Forts.) M¨ untz-Sz´ asz 44 Paley-Zygmund 317 Peano 183 Pe lczy´ nski 197 Peter-Weyl 256 Pitt 134 Pythagoras 225 Radon-Nikod´ ym 518 Rellich Einbettungssatz 222, 255 St¨ orungssatz 390 Riesz siehe Rieszscher Darstellungssatz, Rieszsches Lemma, Satz von Fischer-Riesz, Satz von Fr´echet-Riesz, Satz von Riesz-Schauder Riesz-Schauder 263 Riesz-Thorin 73 Schauder 111 Schur 133, 447 Schwartz 465 Sobczyk 197 Sobolev 220, 254 Steinitz 253 Stone 385 Stone-Weierstraß 427 Szeg˝ o 146 Taylor 122 Tietze-Urysohn 522, 529 Tikhonov 532 Toeplitz 160 Weierstraß siehe Weierstraßscher Approximationssatz Wiener 485 Schattenklassen 315 Schauder, J. 43, 133, 195 Schauderbasis 190–191, 256 Schmidt, E. 40, 87, 251, 313, 386 schnell fallend 213 Schottisches Buch 43, 88, 132, 254 Schr¨ odingergleichung 389 Schur-Eigenschaft 448 schwach folgenvollst¨ andig 446 schwach singul¨ ar siehe Integraloperator, schwach singul¨ arer
Namen- und Sachverzeichnis
schwache Ableitung 210, 434 schwache Kompaktheit 419, 438, 470–471 schwach∗ -Kompaktheit 415–416 schwache Konvergenz 106, 133, 144, 188–189, 229, 244, 447 schwache L¨ osung 232 schwache Operatortopologie 400 schwache Topologie 399, 400, 411 schwach∗ -Topologie 400, 411 Schwartz, L. 255, 315, 464, 465, 468 Schwartzfunktion 213 Schwartzraum 213, 399 Schwerpunkt 459 Seite 420 selbstadjungiert 239, 344, 487 separabel 28 sesquilinear 203 Shiftoperator 109, 240 Shmulyan, V. L. 135, 469 σ-additiv 513 σ-Algebra 507, 508 σ-endlich 513 singul¨ are Zahlen 275 Skalarprodukt 203 Sobolev, S. L. 254, 468 Sobolevr¨ aume 92, 210, 224 Spaltensummennorm 82 Spektralabbildungssatz 323, 380, 391, 393 Spektralmaß 329 Spektralradius 261, 478 Spektralsatz f¨ ur beschr¨ ankte Operatoren 333, 337, 342, 489 f¨ ur kompakte Operatoren 271, 273, 278 f¨ ur unbeschr¨ ankte Operatoren 356, 359 Spektralschar 387 Spektralschranke 393 Spektrum einer kommutativen Banachalgebra 483 eines Elements einer Banachalgebra 478 eines Operators 257, 354, 371
551
Namen- und Sachverzeichnis
Spektrum eines Operators (Forts.) absolutstetiges 388 singul¨ ar-stetiges 388 stetiges 258, 388 wesentliches 504 Spur 295 Spurklasse siehe nuklearer Operator stark stetige Halbgruppe 360 starke Operatortopologie 400 Steinhaus, H. 89, 195 Stone, M. H. 252, 385 ˇ Stone-Cech-Kompaktifizierung 501 St¨ orungssatz 390, 394 strikt konvex 37, 127, 172, 422 strikter induktiver Limes 465 Sturm-Liouville-Problem 314 sublinear 93 Summierbarkeitsmethoden 160 Supremumsnorm 3 wesentliche 20 Teilnetz 530 Testfunktion 209, 432 Thorin, G. O. 91 Toeplitz-Operator 499, 504 tonneliert 464 Topologie 520, 525 feinere 404 gr¨ obere 404 topologisch direkte Zerlegung 163 topologischer Raum 525 kompakter 523, 531 metrisierbarer 525 normaler 528 topologischer Vektorraum 398 totalbeschr¨ ankt 523 Tr¨ ager 80, 209, 329, 462 Trennungssatz 103, 104, 246, 409 Treppenfunktion 510 treue Darstellung 494 trigonometrisches Polynom 152 Trotter-Formel 394 Ulam, S. 42 Umgebung 519, 526 Umgebungsbasis 526 unbedingte Konvergenz 234, 235, 247, 253
unit¨ ar 239 universelle Darstellung 495 Unterraum 4, 24 invarianter 315 komplementierter 165, 254 Variation 22, 517 Variationsnorm 22 Variationsrechnung 123 direkte Methode der 124 Vektorzustand 490 verallgemeinerte Ableitung 210, 434 Verdichtung der Singularit¨ aten 191 Vervollst¨ andigung 3, 105 Vielfachheit algebraische 305 geometrische 272 Vollst¨ andigkeit 2, 464, 522 Volterrascher Integraloperator 85, 267 von Neumann, J. 195, 252, 254, 315, 385–388, 464, 502 von-Neumann-Algebra 502 W ∗ -Algebra 502 Wachstumsschranke 363, 393 Wahrscheinlichkeitsmaß 513 Wavelet 256 Weierstraßscher Approximationssatz 29, 43, 145 zweiter 152 wesentlich selbstadjungiert 346 wesentlicher Bereich 384 Weyl, H. 251, 316, 385 Weylsche Ungleichung 307, 316 Weylsches Lemma 232 Whitleysche Konstruktion 440 Wiener, N. 40–42, 499 Wieneralgebra 476 Youngsche Ungleichung 78 Zeilensummennorm 82 Zornsches Lemma 95 zuf¨ allige Fourierreihen 317 Zustand 388, 490, 503 zyklischer Vektor 337
Ich habe bemerkt“, sagte Herr K., daß wir viele abschrecken von ” ” unserer Lehre dadurch, daß wir auf alles eine Antwort wissen. K¨ onnten wir nicht im Interesse der Propaganda eine Liste der Fragen aufstellen, die uns ganz ungel¨ ost erscheinen?“
B. Brecht, Geschichten vom Herrn Keuner1 1 Gesammelte
Werke, Band 12, S. 382. Suhrkamp-Verlag 1967.