Prüfungstrainer Lineare Algebra
Rolf Busam Thomas Epp
Prüfungstrainer Lineare Algebra 500 Fragen und Antworten für Bachelor und Vordiplom
Autor Dr. Rolf Busam Universität Heidelberg Mathematisches Institut Im Neuenheimer Feld 288 (1. OG, Zimmer 218) 69120 Heidelberg
[email protected] Thomas Epp
[email protected]
Wichtiger Hinweis für den Benutzer Der Verlag und die Autoren haben alle Sorgfalt walten lassen, um vollständige und akkurate Informationen in diesem Buch zu publizieren. Der Verlag übernimmt weder Garantie noch die juristische Verantwortung oder irgendeine Haftung für die Nutzung dieser Informationen, für deren Wirtschaftlichkeit oder fehlerfreie Funktion für einen bestimmten Zweck. Ferner kann der Verlag für Schäden, die auf einer Fehlfunktion von Programmen oder ähnliches zurückzuführen sind, nicht haftbar gemacht werden. Auch nicht für die Verletzung von Patent- und anderen Rechten Dritter, die daraus resultieren. Eine telefonische oder schriftliche Beratung durch den Verlag über den Einsatz der Programme ist nicht möglich. Der Verlag übernimmt keine Gewähr dafür, dass die beschriebenen Verfahren, Programme usw. frei von Schutzrechten Dritter sind. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Buch berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Der Verlag hat sich bemüht, sämtliche Rechteinhaber von Abbildungen zu ermitteln. Sollte dem Verlag gegenüber dennoch der Nachweis der Rechtsinhaberschaft geführt werden, wird das branchenübliche Honorar gezahlt. BibliograÝsche Information Der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen NationalbibliograÝe; detaillierte bibliograÝsche Daten sind im Internet über http://dnb.d-nb.de abrufbar
Springer ist ein Unternehmen von Springer Science+Business Media springer.de © Spektrum Akademischer Verlag Heidelberg 2009 Spektrum Akademischer Verlag ist ein Imprint von Springer 09 10 11 12 13
5 4 3 2 1
Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, MikroverÝlmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen.
Planung und Lektorat: Dr. Andreas Rüdinger, Bianca Alton Herstellung: Andrea Brinkmann Umschlaggestaltung: SpieszDesign, Neu-Ulm TitelfotograÝe: © Panthermedia / Rilo N. Satz: Autorensatz Druck und Bindung: Krips b.v., Meppel Printed The Netherlands ISBN 978-3-8274-1976-7
Vorwort Bei dem vorliegenden Band haben wir uns von denselben Zielen und Vorstellungen leiten lassen, die wir schon beim Pr¨ ufungstrainer Analysis“ verfolgt haben. Unse” re Idee war es, die zentralen Begriffe der Linearen Algebra in einer knappen und zielgerichteten Form zu rekapitulieren, und zwar in einer Weise, die Studentinnen und Studenten bei der Pr¨ ufungsvorbereitung eine echte Hilfestellung bietet. Wir wollten weder eine Aufgabensammlung vorlegen noch mit den zahlreichen Lehrb¨ uchern und den Einf¨ uhrungsvorlesungen zur Linearen Algebra konkurrieren. Stattdessen haben wir versucht, Fragen zu formulieren, die man in einer m¨ undlichen Pr¨ ufung realistischerweise erwarten kann. In aller Regel wird man dort nicht damit konfrontiert, komplizierte Rechnungen und aufwendige Beweise in allen Details vorzuf¨ uhren, sondern zu zeigen, dass man die zentralen Begriffe verstanden hat und sie in den wichtigsten Beweistechniken auch anwenden kann. Unter diesem Gesichtspunkt sind die Fragen ausgesucht und die Antworten formuliert worden, wobei wieder wesentlich die Erfahrungen des erstgenannten Autors aus seiner jahrelangen T¨ atigkeit als Dozent und Pr¨ ufer an der Ruprecht-KarlsUniversit¨ at Heidelberg eingeflossen sind. Die Inhalte werden, wie schon beim Pr¨ ufungstrainer Analysis“, in einem knap” pen Frage- und Antworten-Stil dargestellt. Das soll dem Leser erm¨ oglichen, sein Wissen stichpunktartig zu u ufen und eventuelle L¨ ucken schnell zu entdecken. ¨berpr¨ Das Buch richtet sich an alle Studierenden, die ein gewisses mathematisches Pensum in Ihrem Studium zu erf¨ ullen haben. Die Lineare Algebra ist heutzutage derart grundlegend f¨ ur s¨ amtliche Teilgebiete der Mathematik und in ihrer Darstellung derart einheitlich, dass es k¨ unstlich w¨ are, Niveauunterschiede einzuf¨ uhren und ein Buch u ¨ber Lineare Algebra speziell an Diplommathematiker, Lehramtskandidaten oder Informatiker zu adressieren. Es mag sein, dass es in der Analysis Unterschiede in den Anspr¨ uchen gibt, aber u ¨ber die Grundlagen der Linearen Algebra muss im Großen und Ganzen jeder dasselbe wissen. Daher sind Studenten im Haupt- oder Nebenfach Mathematik (mit den Studienzielen Diplom, Bachelor oder Lehramt) genauso herzlich eingeladen, das Buch zur Hand zu nehmen, wie Studierende, die einen Abschluss in Informatik oder in einer Naturwissenschaft anstreben. Wir danken dem Verlagsteam von Spektrum Akademischer Verlag f¨ ur die konstruktive Zusammenarbeit. Besonderer Dank geb¨ uhrt unserem Lektor Herrn Dr. R¨ udinger, ohne dessen kompetente und engagierte Beratung das Buch in dieser Form nicht zustande gekommen w¨ are, sowie Frau Alton, die uns w¨ ahrend der Entstehungsphase in allen organisatorischen Fragen tatkr¨ aftig und geduldig unterst¨ utzt hat. Heidelberg/Berlin im September 2008
Rolf Busam Thomas Epp
Inhaltsverzeichnis
1 1.1 1.2 1.3 1.4 1.5
Algebraische Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 Der Begriff der Gruppe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 Abbildungen zwischen Gruppen, Untergruppen . . . . . . . . . . . . . . . . . . . . 9 Der Signum-Homomorphismus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 Ringe und K¨ orper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 Polynomringe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2 2.1 2.2 2.3
Vektorr¨ aume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Basis und Dimension . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Summen von Vektorr¨ aumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
36 36 43 49
3 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8
Lineare Abbildungen und Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Quotientenvektorr¨ aume und affine Unterr¨ aume . . . . . . . . . . . . . . . . . . . . Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Matrizenringe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Koordinatenisomorphismen und Basiswechselformalismus . . . . . . . . . . . Das Gauß’sche Eliminationsverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . Lineare Gleichungssysteme Teil 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Der Dualraum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
52 53 61 66 73 79 86 92 97
4 4.1 4.2
Determinanten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 Alternierende Multilinearformen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 Determinanten von Matrizen und Endomorphismen . . . . . . . . . . . . . . . . 107
5 5.1 5.2 5.3 5.4
Normalformentheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Eigenwerte und Eigenvektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Das charakteristische Polynom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Einsetzen von Matrizen und Endomorphismen in Polynome . . . . . . . . . Die Jordan’sche Normalform . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
117 117 123 130 135
6 6.1 6.2 6.3
Euklidische und unit¨ are Vektorr¨ aume . . . . . . . . . . . . . . . . . . . . . . . Bilinearformen und Skalarprodukte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Normierte R¨ aume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Orthonormalbasen und das Orthonormalisierungsverfahren von Gram-Schmidt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Lineare Gleichungssysteme Teil 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Orthogonale und unit¨ are Endomorphismen . . . . . . . . . . . . . . . . . . . . . . . Die adjungierte Abbildung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Selbstadjungierte Endomorphismen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
144 144 151
6.4 6.5 6.6 6.7
158 167 170 176 181
VIII
7 7.1 7.2 7.3 7.4 7.5 7.6 7.7
Inhaltsverzeichnis
Anwendungen in der Geometrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Affine R¨aume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Affine Abbildungen und Koordinaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . Projektive R¨ aume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Projektive Abbildungen und Koordinaten . . . . . . . . . . . . . . . . . . . . . . . . . Invarianten von Projektivit¨ aten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Projektive Quadriken . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Affine Quadriken . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
188 188 195 201 206 211 219 230
Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235 Symbolverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236 Namen- und Sachverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241
1 Algebraische Grundlagen Wir setzen hier voraus, dass die Leser und Leserinnen mit den Sprech- und Bezeichnungsweisen der Mengenlehre und dem Abbildungsbegriff hinreichend vertraut sind. Wir sind nicht der Meinung, dass die Vorlesung Lineare Algebra“ ” dazu benutzt werden sollte, Allgemeinheiten u ¨ber algebraische Strukturen wie z. B. allgemeine Strukturs¨ atze in aller Ausf¨ uhrlichkeit von Grund auf zu behandeln. Allerdings ist der Gruppen- und K¨ orperbegriff f¨ ur den Aufbau der linearen Algebra fundamental, und deswegen beginnen wir das Buch mit einigen Fragen zu den grundlegenden Eigenschaften des Gruppen- und K¨ orperbegriffs.
1.1
Der Begriff der Gruppe
Gruppen spielen nicht nur in der Linearen Algebra eine zentrale Rolle (z. B. ist ein Vektorraum insbesondere auch eine abelsche Gruppe bez¨ uglich der Addition), sondern besitzen auch zahlreiche Anwendungen in außermathematischen Bereichen wie der Chemie ( kristallografische Gruppe“) oder in der Physik (etwa bei ” der Klassifikation der Elementarteilchen). Die Schlagkraft der axiomatischen Methode bei der Einf¨ uhrung dieser Begriffe wird sich an vielen Beispielen zeigen. Frage 1 Was versteht man unter einer Gruppe? Wann heißt eine Gruppe abelsch bzw. kommutativ? Antwort: Eine Gruppe ist eine Menge G zusammen mit einer Verkn¨ upfung ∗“, ” d. h. einer Abbildung ∗ : G × G → G, f¨ ur die die folgenden Axiome gelten (G1) (Assoziativit¨ at) F¨ ur alle a, b, c ∈ G gilt (a ∗ b) ∗ c = a ∗ (b ∗ c). (G2) (Existenz neutraler Elemente) Es gibt ein e ∈ G, so dass f¨ ur alle a ∈ G gilt e ∗ a = a. e heißt neutrales Element von G. (G3) (Existenz inverser Elemente) Zu jedem a ∈ G gibt es ein a ∈ G mit
a ∗ a = e,
wobei e das neutrale Element bezeichnet. a heißt in diesem Fall das zu a inverse Element.
Eine Gruppe (G, ∗) heißt abelsch bzw. kommutativ, wenn zus¨ atzlich a∗b = b∗a f¨ ur jedes a, b ∈ G gilt.
2
1 Algebraische Grundlagen
Frage 2
Warum gilt f¨ ur jede Gruppe (G, ∗) mit neutralem Element e e ∗ a = a =⇒ a ∗ e = a
f¨ ur alle a ∈ G
a ∗ a = e =⇒ a ∗ a=e
f¨ ur alle a ∈ G?
sowie Mit anderen Worten, warum ist ein linksneutrales Element in jeder Gruppe G stets auch rechtsneutral und ein linksinverses Element zu a ∈ G stets auch rechtsinvers? Antwort: Zu a gibt es nach G3 ein linksinverses Element a. Damit gilt
a a (a a) = a = e (a a) = a ( a (a a)) = a (( aa) a) = a (e a) = a a = e. a
Das beantwortet den zweiten Teil der Frage. Der erste folgt damit aus a ∗ e = a ∗ ( a ∗ a) = (a ∗ a) ∗ a = e ∗ a = a.
Frage 3 Warum ist das neutrale Element e und das zu a ∈ G inverse Element a eindeutig bestimmt, so dass man also von dem neutralen und dem zu a ∈ G inversen Element sprechen kann? Antwort: Ist e′ ein (eventuell von e unterschiedenes) neutrales Element, so folgt mit der Antwort zur vorigen Frage e′ ∗ e = e
sowie
e′ ∗ e = e′ ,
also e′ = e. Ist a′ ein (eventuell von a verschiedenes) inverses Element zu a, so gilt
a′ = a′ ∗ e = a′ ∗ (a ∗ a) = ( a′ ∗ a) ∗ a = e∗ a= a.
Frage 4 Warum ist eine nichtleere Menge G mit einer assoziativen Verkn¨ upfung ∗ genau dann eine Gruppe, wenn es zu je zwei Elementen a, b ∈ G ein x ∈ G und ein y ∈ G gibt mit x∗a=b und a ∗ y = b?
Antwort: Aus der ersten Gleichung erh¨ alt man f¨ ur beliebiges a ∈ G ein e ∈ G mit e ∗ a = a. F¨ ur jedes andere b ∈ G gilt dann e ∗ b = e ∗ (a ∗ y) = (e ∗ a) ∗ y = a ∗ y = b,
also ist e ein neutrales Element in G. Durch L¨ osen der Gleichung x ∗ a = e erh¨ alt man das zu a inverse Element. Dieses existiert also f¨ ur jedes a ∈ G, und folglich ist G eine Gruppe.
1.1 Der Begriff der Gruppe
3
Frage 5 Sei G eine Gruppe und seien a, b ∈ G. K¨ onnen Sie die folgenden Rechenregeln beweisen: (a−1 )−1 = a
(a · b)−1 = b−1 · a−1 ?
(Wir lassen an dieser Stelle die bisher gebrauchten Notationen hinter uns und benut¨ zen in Zukunft der Ubersichtlichkeit wegen bei der Untersuchung allgemeiner Gruppen die f¨ ur multiplikative Strukturen g¨angigen Bezeichnungen. D. h., a−1 bezeichnet das zu a inverse Element, und f¨ ur das Verkn¨ upfungssymbol verwenden wir das Multiplikationszeichen, das gegebenenfalls auch unterdr¨ uckt werden kann.) Antwort: Es ist (a−1 )−1 = (a−1 )−1 · e = (a−1 )−1 · (a−1 · a) = ((a−1 )−1 · a−1 ) · a = e · a = a. Das beweist die erste Gleichung, die zweite folgt aus (b−1 · a−1 ) · (a · b) = b−1 · (a−1 · a) · b = b−1 · e · b = b−1 · b = e. Frage 6
K¨ onnen Sie Beispiele f¨ ur abelsche und nicht-abelsche Gruppen angeben?
uglich der Addition eine abelsche Antwort: (a) Die ganzen Zahlen Z bilden bez¨ Gruppe mit unendlich vielen Elementen. (b) Ist K ein beliebiger K¨ orper, so ist (K, +) eine additive abelsche Gruppe und (K ∗ , ·) eine multiplikative abelsche Gruppe. Dabei ist K ∗ := K \ {0}, wobei 0 das neutrale Element bez¨ uglich der Addition bezeichnet. (c) Jeder Vektorraum ist bez¨ uglich der Addition von Vektoren eine abelsche Gruppe. (d) F¨ ur ein n > 0 und r ∈ Z betrachte man die Menge r + nZ := {r + n · a ; a ∈ Z} ⊂ Z, die sogenannte Restklasse von r modulo n. Es gilt r + nZ = q + nZ genau dann, wenn r − q durch n teilbar ist bzw. wenn f¨ ur r und q bei der ganzzahligen Division durch n derselbe Rest u ¨brig bleibt. Daher gibt es genau n verschiedene Restklassen modulo n, n¨ amlich nZ, 1 + nZ, . . . , (n − 1) + nZ. Mit Z/nZ bzw. Zn bezeichnet man die Menge dieser n Restklassen. Diese sind paarweise disjunkt, und ihre Vereinigung ist Z. Somit liegt jede ganze Zahl a in genau einer der n Restklassen. Die Abbildung : Z → Z/nZ ordne jedem a ∈ Z seine Restklasse modulo n zu. Dann ist durch a ⊕ b := a + b
4
1 Algebraische Grundlagen
auf Z/nZ eine Verkn¨ upfung definiert. Diese ist assoziativ und kommutativ, da die u bliche Addition auf Z dies ist, ferner ist 0 ein neutrales Element in Z/nZ, und ¨ das zu a inverse Element ist durch −a gegeben. (Z/nZ, ⊕) ist damit eine additive abelsche Gruppe, die Restklassengruppe modulo n. (e) F¨ ur eine Menge X sei Sym(X) die Menge aller bijektiven Selbstabbildungen X → X. Sym(X) bildet bez¨ uglich der Verkettung von Abbildungen eine Gruppe, die allerdings nicht kommutativ ist, wenn X mehr als 2 Elemente hat. Die Assoziativit¨ at ist automatisch erf¨ ullt, da die Hintereinanderausf¨ uhrung von Abbildungen assoziativ ist, mit der identischen Abbildung x → x enth¨ alt Sym(X) ein neutrales Element, und aufgrund der Bijektivit¨ at ist mit F auch die Umkehrabbildung F −1 , also das zu F inverse Element, in Sym(X) enthalten. (Sym(X), ◦) ist damit eine Gruppe, die sogenannte symmetrische Gruppe auf X. Ist speziell X = {1, 2, . . . , n}, so schreibt man Sn f¨ ur Sym(X). Sn besteht aus allen Permutationen der ersten n nat¨ urlichen Zahlen, und daher nennt man Sn auch Permutationsgruppe. (f) Zu einem K¨ orper K bezeichnet GL(n, K) (General Linear Group) die Menge aller n×n-Matrizen in K mit nichtverschwindender Determinante. GLn (K) bildet bez¨ uglich der Matrizenmultiplikation eine nicht-abelsche Gruppe (s. Frage 191). (g) Ist K ein K¨ orper und V ein K-Vektorraum, dann l¨ asst sich unabh¨ angig von einer Basis die Menge Aut(V ) aller bijektiven K-linearen Selbstabbildungen (Automorphismen) auf V definieren. Aut(V ) ist dann bez¨ uglich der Hintereinanderausf¨ uhrung von Abbildungen eine Gruppe, die Automorphismengruppe von V . Hat V die Dimension n, dann existiert bez¨ uglich der Wahl einer Basis in V ein Isomorphismus Aut(V ) → GLn (K), der einem Automorphismus V → V seine Matrix bez¨ uglich der Basis zuordnet. (h) Zu zwei Gruppen (G, ∗G ) und (H, ∗H ) ist das direkte Produkt G × H := {(g, h) ; g ∈ G, h ∈ H} zusammen mit der komponentenweise erkl¨ arten Verkn¨ upfung (g1 , h1 ) · (g2 , h2 ) := (g1 ∗G g2 , h1 ∗H h2 ) ebenfalls eine Gruppe. Das neutrale Element ist gegeben durch (eG , eH ), das zu (g, h) inverse Element durch (g −1 , h−1 ). Frage 7 Sei M eine beliebige nichtleere Menge. Warum ist die Menge Abb(M, M ) der Abbildungen M −→ M bez¨ uglich der Hintereinanderausf¨ uhrung von Abbildungen keine Gruppe? Antwort: Die Abbildungen aus Abb(M, M ) sind in der Regel nicht bijektiv und besitzen in diesen F¨ allen keine Umkehrabbildung M → M , also kein inverses Element in Abb(M, M ).
1.1 Der Begriff der Gruppe
Frage 8
5
Was besagt die K¨ urzungsregel in einer Gruppe G?
Antwort: F¨ ur a, b, c ∈ G gilt: c · a = c · b =⇒ a = b,
a · c = b · c =⇒ a = b.
Die beiden Regeln erh¨ alt man, wenn man beide Seiten der jeweiligen Gleichung links- bzw. rechtsseitig mit c−1 verkn¨ upft. Frage 9 Ist G = {a1 = e, a2 . . . , an } eine Menge mit n Elementen, wie kann man dann auf u upfung auf G angeben? ¨bersichtliche Weise eine Verkn¨ Antwort: Die Gruppenstruktur l¨ asst sich in einer sogenannten Verkn¨ upfungstafel 2 upfungen ai · aj in einem quadratischen Schema darstellen, in der alle n Verkn¨ eingetragen sind. ·
e
a2
···
an
e
ee
ea2
···
ean
a2
a2 e
a2 a2
···
a2 an
···
···
···
···
···
an
an e an a2
···
an an
Frage 10 Wie kann man aus einer Verkn¨ upfungstafel ablesen, ob eine Menge G = {a1 , . . . , an } eine Gruppe ist?
Antwort: Es gilt:
G enth¨ alt ein neutrales Element e = ak genau dann, wenn die k-te Zeile und die k-te Spalte einfach die Anordnung der Gruppenelemente wiederholen. G enth¨ alt inverse Elemente genau dann, wenn die Anordnung in jeder Zeile und Spalte aus einer Permutation der Gruppenelemente hervorgeht. Wegen a−1 a = aa−1 = e muss f¨ ur eine Gruppe zus¨ atzlich gelten, dass die neutralen Elemente in der Gruppentafel symmetrisch zur Hauptdiagonalen i = j liegen. Bei der Verkn¨ upfungstafel einer abelschen Gruppe liegen alle Eintr¨ age symmetrisch zur Hauptdiagonalen. Die G¨ ultigkeit der Axiome G2 und G3 spiegelt sich damit unmittelbar in den offen zu Tage liegenden Eigenschaften der Verkn¨ upfungstafel wider, und l¨ asst sich dementsprechend leicht u ufen. Das gilt allerdings nicht f¨ ur das Assoziativ¨berpr¨ gesetz. Um dieses zu verifizieren, m¨ ussen n3 Gleichungen u uft werden. ¨berpr¨ Frage 11 angeben?
K¨ onnen Sie die Verkn¨ upfungstafeln f¨ ur G := Z5 := Z/5Z und f¨ ur S3
6
1 Algebraische Grundlagen
Antwort: Die Verkn¨ upfungstafel der Restklassengruppe Z/5Z lautet ⊕ 0 1 2 3 4
0 0 1 2 3 4
1 1 2 3 4 0
2 2 3 4 0 1
3 3 4 0 1 2
4 4 0 1 2 3
Hier handelt es sich um eine abelsche Gruppe. Die Gruppe S3 besteht 1 σ1 = 1 1 σ4 = 1
aus den sechs Elementen (Permutationen) 2 3 1 2 3 1 2 3 σ2 = σ3 = 2 3 2 3 1 3 1 2 2 3 1 2 3 1 2 3 σ5 = σ6 = 3 2 3 2 1 2 1 3
Dabei stehen in der unteren Zeile die Bilder der Zahlen 1, 2, 3 unter der jeweiligen Permutation. Man erh¨ alt damit folgende Verkn¨ upfungstafel f¨ ur die Gruppe S3 ◦
σ1
σ2
σ3
σ4
σ5
σ6
σ1
σ1
σ2
σ3
σ4
σ5
σ6
σ2
σ2
σ3
σ1
σ5
σ6
σ4
σ3
σ3
σ1
σ2
σ6
σ4
σ5
σ4
σ4
σ6
σ5
σ1
σ3
σ2
σ5
σ5
σ4
σ6
σ2
σ1
σ3
σ6
σ6
σ5
σ4
σ3
σ2
σ1
Da die Verkn¨ upfungstafel nicht symmetrisch zur Hauptdiagonalen ist, handelt es sich bei S3 um keine abelsche Gruppe. Frage 12 Warum ist eine Gruppe G mit neutralem Element e abelsch, wenn a2 = e f¨ ur jedes a ∈ G gilt? K¨ onnen Sie ein Beispiel f¨ ur eine solche Gruppe angeben?
Antwort: F¨ ur beliebige Elemente a, b ∈ G gilt unter diesen Voraussetzungen a = a−1 , b = b−1 sowie ab = (ab)−1 , und daraus folgt insgesamt ab = (ab)−1 = b−1 a−1 = ba.
1.1 Der Begriff der Gruppe
7
Das einfachste Beispiel einer Gruppe mit dieser Eigenschaft ist Z/2Z. Davon ausgehend lassen sich durch Bildung direkter Produkte
Z/2Z × Z/2Z × · · · × Z/2Z Gruppen mit Ordnung 2n angeben, bei denen jedes Element zu sich selbst invers ist. Frage 13
Warum ist jede Gruppe mit vier Elementen abelsch?
Antwort: Seien a und b mit a = b zwei Elemente aus G. Da jedes Element mit seinem Inversen und das neutrale Element mit jedem anderen Element kommutiert, bleibt nur der Fall ab = c mit a = e und b = e sowie c ∈ {e, a, b} zu untersuchen. In diesem Fall muss aber auch ba = c gelten, denn aus ba = a bzw. ba = b bzw. ba = e w¨ urde b = e bzw. a = e bzw. b = a−1 folgen, und das hatten wir bereits ausgeschlossen. Frage 14
Was versteht man unter der Ordnung einer endlichen Gruppe?
Antwort: Die Ordnung von G ist die Kardinalit¨ at der Menge G und wird mit ord G oder |G| bezeichnet. Ist |G| endlich, so ist die Ordnung von G also die Anzahl der Elemente in G. Im anderen Fall hat G unendliche Ordnung. Frage 15
Welche Ordnung hat die Gruppe Sn ?
Antwort: Eine Permutation einer n-elementigen Menge l¨ asst sich auf n! verschiedene Arten festlegen: F¨ ur das Bild des ersten Elements hat man n M¨ oglichkeiten, f¨ ur das zweite noch n − 1 M¨ oglichkeiten usw., bis schließlich f¨ ur das Bild des letzten Elements nur noch eine M¨ oglichkeit u ¨brig bleibt. Die Gruppe Sn hat somit die Ordnung n!. Frage 16
Wie ist die Ordnung eines Elements a einer Gruppe G definiert?
Antwort: Definiert man f¨ ur a ∈ G und n ∈ Z n-mal
aa ···a f¨ ur n > 0 e f¨ ur n = 0 , an := −1 −1 −1 ur n < 0 . a
a · · · a f¨ n-mal
dann gelten die u ¨blichen Potenzregeln“ ” am an = am+n ,
(am )n = amn ,
und aus diesen folgt {n ∈ Z ; an = e} = k Z
8
1 Algebraische Grundlagen
f¨ ur eine nichtnegative ganze Zahl k. F¨ ur k > 0 hat a eine endliche Ordnung in G. Die Zahl k ist in diesem Fall die Ordnung von a in G. Im Fall k = 0 sagt man, a hat unendliche Ordnung in G. Besitzt a eine endliche Ordnung in G, so ist die Ordnung von a also die kleinste nat¨ urliche Zahl n, f¨ ur die an = e gilt. Gibt es keine nat¨ urliche Zahl mit dieser Eigenschaft, dann hat a unendliche Ordnung in G. Frage 17 angeben?
K¨ onnen Sie f¨ ur die Gruppe S3 jeweils die Ordnungen der sechs Elemente
Antwort: Das neutrale Element σ1 ist wie in jeder Gruppe das einzige Element mit der Ordnung 1. Die Elemente σ2 und σ3 besitzen beide die Ordnung 3, und σ4 , σ5 und σ6 besitzen jeweils die Ordnung 2. Frage 18
Wann heißt eine Gruppe zyklisch?
Antwort: Eine Gruppe G heißt zyklisch, wenn sie von einem einzigen Element a ∈ G erzeugt ist. D. h., f¨ ur jedes g ∈ G gibt es eine ganze Zahl m mit g = am . Im Fall einer endlichen Gruppe der Ordnung n gilt dann G = {e, a, a2 , . . . , an−1 }. Ist |G| unendlich, dann gilt G = {e, a, a−1 , a2 , a−2 , . . .}. Frage 19
Warum ist jede zyklische Gruppe abelsch?
Antwort: Sei g das erzeugende Element von G. F¨ ur alle a, b ∈ G gibt es dann m, n ∈ Z mit a = g m und b = g n . Es folgt ab = g m g n = g m+n = g n+m = g n g m = ba.
Frage 20 K¨ onnen Sie jeweils ein Beispiel einer endlichen und einer nichtendlichen zyklischen Gruppe angeben? Antwort: Die Gruppe Z/nZ ist eine zyklische Gruppe der Ordnung n, erzeugt von der Restklasse 1. Die ganzen Zahlen sind eine zyklische Gruppe, deren Ordnung nichtendlich ist. Das erzeugende Element ist die 1. Mit diesen beiden Beispielen sind bis auf Isomorphie schon alle zyklischen Gruppen mit endlicher bzw. nichtendlicher Ordnung aufgez¨ ahlt. Eine zyklische Gruppe G = {e, a1 , a2 , . . . , an } der Ordnung n ist n¨ amlich verm¨ oge der Abbildung
Z/nZ → G,
m → am
isomorph zu Z/nZ, und f¨ ur eine nichtendliche Gruppe H = {e, h1 , h−1 , h2 , h−2 , . . .} ist die Abbildung Z → h, m → hm ein Isomorphismus.
1.2 Abbildungen zwischen Gruppen, Untergruppen
1.2
9
Abbildungen zwischen Gruppen, Untergruppen
F¨ ur zwei Gruppen G und G′ sind vor allem diejenigen Abbildungen F : G −→ G′ von Interesse, durch die nicht nur die Elemente, sondern auch die Gruppenstruktur von G in bestimmter Weise auf diejenige von G′ abgebildet wird, sodass gruppentheoretische Relationen zwischen zwei Elementen a, b ∈ G auch zwischen den Bildern von a und b in G′ bestehen. Abbildungen mit dieser Eigenschaft nennt man Homomorphismen. Frage 21 Was versteht man unter einem Homomorphismus zwischen zwei Gruppen (G, ∗) und (H, ⋄)? Wann heißt ein Homomorphismus (a) (b) (c) (d) (e)
Monomorphismus, Epimorphismus, Isomorphismus, Endomorphismus, Automorphismus?
Antwort: Eine Abbildung F : G −→ H heißt Homorphismus, wenn f¨ ur alle a, b ∈ G gilt: F (a ∗ b) = F (a) ⋄ F (b). Die anderen vier Begriffe beschreiben spezielle Homomorphismen. Ein Homomorphismus F heißt (a) (b) (c) (d) (e)
Monomorphismus, falls F injektiv ist, Epimorphismus, falls F surjektiv ist, Isomorphismus, falls F bijektiv ist, Endomorphismus, falls F ein Homomorphismus von G in sich selbst ist, Automorphismus, falls F ein Isomorphismus von G in sich selbst ist.
Frage 22
Wann heißen zwei Gruppen isomorph?
Antwort: Zwei Gruppen G und H heißen isomorph, geschrieben G ≃ H, wenn es einen Isomorphismus von G nach H gibt. Frage 23
K¨ onnen Sie einige Beispiele von Homomorphismen nennen?
Antwort: (a) F¨ ur zwei Gruppen G und H ist die Abbildung G −→ H, die jedes g ∈ G auf das neutrale Element in H abbildet, stets ein Homomorphismus. (b) Ist G eine Gruppe und H ⊂ G eine Untergruppe, dann ist die identische Abbildung H −→ G, g −→ g ein Homomorphismus. (c) Die Abbildung : (Z, +) −→ (Zn , ⊕)
n → n
10
1 Algebraische Grundlagen
ist wegen n + m = n ⊕ m ein Homomorphismus. Dies ist ein Beispiel eines allgemeineren Prinzips, das in Frage 39 genauer erl¨ autert wird: Ist G eine Gruppe und N ein Normalteiler in G, dann ist die sogenannte kanonische Projektion π : G −→ G/N,
g → gN
von G in die Menge G/N der Linksnebenklassen von N in G ein Gruppenhomomorphismus. (d) Die Exponentialfunktion exp : R −→ R+ ist wegen exp(x + y) = exp(x) exp(y) ein Gruppenhomomorphismus von der additiven Gruppe (R, +) in die multiplikative Gruppe (R+ , ·). Da die Exponentialfunktion die reellen Zahlen bijektiv auf R+ abbildet, handelt es sich dabei um einen Isomorphismus. (e) Die komplexe Konjugation : C −→ C,
a + ib → a − ib
ist offensichtlich ein Automorphismus der additiven Gruppe , +). Wegen (a + ib) · (c + id) = (ac − bd) − i(ad + bc) = (a + ib) · (c + id) handelt es sich aber auch um einen Automorphismus der multiplikativen Gruppe orperautomorphismus (C∗ , ·). Die komplexe Konjugation beschreibt also einen K¨ von C. (f) Die komplexe Exponentialfunktion exp : C −→ C ist ein Gruppenhomomorphismus von der additiven Gruppe (C, +) in die multiplikative Gruppe (C∗ , ·). Dieser ist surjektiv, aber wegen exp(z) = exp(z + 2kπi) f¨ ur alle k ∈ Z nicht injektiv. (g) Jede lineare Abbildung V −→ W zwischen zwei Vektorr¨ aumen V und W ist insbesondere ein Homomorphismus zwischen den Gruppen (V, +) und (W, ∗). Frage 24 stets
Warum gilt f¨ ur einen Gruppenhomomorphismus F : (G, ∗) −→ (G′ , ⋄)
(a) F (e) = e′ f¨ ur die neutralen Elemente e ∈ G und e′ ∈ G′ sowie
−1 −1 f¨ ur alle a ∈ G? (b) F (a ) = F (a) Antwort: F¨ ur beliebiges a ∈ G ist F (a) = F (a ∗ e) = F (a) ⋄ F (e), also F (e) = e′ . Das zeigt (a). Damit gilt dann e′ = F (e) = F (a ∗ a−1 ) = F (a) ⋄ F (a−1 ), und daraus folgt (b).
1.2 Abbildungen zwischen Gruppen, Untergruppen
Frage 25
11
Was versteht man unter dem Kern eines Homomorphismus?
Antwort: Der Kern eines Homomorphismus F : G −→ G′ , geschrieben ker F , ist die Menge aller a ∈ G, die durch F auf das neutrale Element in G′ abgebildet werden. Es ist also ker(F ) := {a ∈ G ; F (a) = e′ }. Frage 26 Warum ist ein Homomorphismus F : (G, ∗) −→ (G′ , ⋄) genau dann injektiv, wenn ker F = {e} mit dem neutralen Element e ∈ G gilt? Antwort: Sei zun¨ achst ker F = {e}. F¨ ur a, b ∈ G mit F (a) = F (b) gilt dann
−1 = e′ , F (a ∗ b−1 ) = F (a) ⋄ F (b−1 ) = F (a) ⋄ F (b)
also a ∗ b−1 ∈ ker(F ) und damit wegen der Voraussetzung a = b. Das heißt, F ist injektiv. Die andere Richtung folgt aus F (e) = e′ . Ist F injektiv, dann ist e das einzige Element, das auf e′ abgebildet wird. Frage 27 Warum ist die Zusammensetzung von Homomorphismen wieder ein Homomorphismus? Antwort: F¨ ur Homomorphismen F : (G, ∗) −→ (G′ , ⋄)
und F ′ : (G′ , ⋄) −→ (G′′ , •)
und Elemente a, b ∈ G gilt
F ′ ◦ F (a ∗ b) = F ′ F (a) ⋄ F (b) = F ′ F (a) • F ′ F (b) = F ′ ◦ F (a) • F ′ ◦ F (b). Damit ist die Abbildung F ′ ◦ F : G −→ G′′ ein Homomorphismus.
Frage 28
K¨ onnen Sie folgende Aussagen begr¨ unden?
(a) (b)
Die identische Abbildung id : G −→ G ist ein Isomorphismus. Ist F : G −→ G′ ein Isomorphismus, dann ist die (wohldefinierte) Umkehrabbildung F −1 : G′ −→ G ebenfalls ein Isomorphismus. (c) Die Zusammensetzung von Isomorphismen ist wieder ein Isomorphismus. Antwort: (a) Die identische Abbildung ist bijektiv und ferner wegen id(a + b) = a + b = id(a) + id(b) ein Homomorphismus. (b) Als Umkehrabbildung einer bijektiven Abbildung ist F −1 ebenfalls bijektiv. Sind ferner a′ , b′ beliebige Elemente aus G′ , dann gibt es a, b ∈ G mit F (a) = a′ und F (b) = b′ und es gilt:
F −1 (a′ · b′ ) = F −1 F (a) · F (b) = F −1 F (a · b) = a · b = F −1 (a′ ) · F −1 (b′ ),
also ist F −1 ein Homomorphismus.
(c) Dies folgt aus dem Ergebnis zu Frage 27 zusammen mit der Tatsache, dass die Verkettung bijektiver Abbildungen wieder bijektiv ist.
12
1 Algebraische Grundlagen
Frage 29
Wann heißt eine Teilmenge H ⊂ G einer Gruppe (G, · ) Untergruppe?
Antwort: H ⊂ G ist eine Untergruppe von G, wenn die Elemente aus H bez¨ uglich der Verkn¨ upfung ·“ ebenfalls eine Gruppe bilden. ” Frage 30
Was besagt das Untergruppenkriterium?
Antwort: Das Kriterium besagt: Eine nichtleere Teilmenge U ⊂ G einer Gruppe G ist eine Untergruppe von G genau dann, wenn gilt (i) (ii)
a ∈ U =⇒ a−1 ∈ U a, b ∈ U =⇒ ab ∈ U .
Beweis: Dass jede Untergruppe U die beiden Bedingungen erf¨ ullen muss, gilt definitionsgem¨ aß. Umgekehrt folgt aus (i) und (ii) zusammen e ∈ U . Da das Assoziativgesetz in ganz G und somit insbesondere in U gilt, erf¨ ullt U folglich alle drei Gruppenaxiome. Frage 31 Ist F : G −→ G′ ein Gruppenhomomorphismus, warum tragen ker F und das Bild im F von F dann in nat¨ urlicher Weise eine Gruppenstruktur? Antwort: F¨ ur a, b ∈ ker F gilt F (ab) = F (a)F (b) = ee = e, also ab ∈ ker F .
−1 , dass mit a auch a−1 in ker F enthalten ist. Ferner gilt wegen F (a−1 ) = F (a) Der Kern von F ist also nach dem Kriterium aus Frage 30 eine Untergruppe von G. F¨ ur a′ , b′ ∈ im F gibt es a, b ∈ G mit F (a) = a′ und F (b) = b′ . Somit gilt F (ab) = a′ b′ , also a′ b′ ∈ im F . Außerdem gilt F (a−1 ) = F (a)−1 = a′−1 , also ist mit a′ auch a′−1 in im F enthalten und im F daher eine Untergruppe von G′ . Frage 32 Was versteht man unter einer Linksnebenklasse von G bez¨ uglich einer Untergruppe H ⊂ G? Was ist eine Rechtsnebenklasse? Antwort: F¨ ur eine Unterguppe H ⊂ G heißt die Menge aH = {ah ; h ∈ H} f¨ ur a ∈ G eine Linksnebenklasse von H in G. Entsprechend heißt Ha := {ha ; h ∈ H} eine Rechtsnebenklasse von H in G. Beispiel: Sei G = (R2 , +) und H ⊂ G ein eindimensionaler Unterraum, d. h. eine Gerade durch den Ursprung. Dann ist H insbesondere eine Untergruppe von G. F¨ ur v ∈ R2 bezeichnet dann die Linksnebenklasse v +H in geometrischer Hinsicht die zu H parallele Gerade im R2 , die durch den Punkt O + v verl¨ auft.
1.2 Abbildungen zwischen Gruppen, Untergruppen
13
Die Menge der Linksnebenklassen bez¨ uglich H wird mit G/H bezeichnet. Die Rechtsnebenklassen bezeichnet man mit G\H. Die Abbildung g −→ g −1 bildet jedes Element ah ∈ aH auf (ah)−1 = h−1 a−1 ∈ Ha−1 ab und vermittelt daher eine Bijektion zwischen G/H und G\H, die aH auf Ha−1 abbildet. y c+H =d+H b+H
d
H
c
b
a+H
x a
0
Ist G abelsch, so sind Links- und Rechtsnebenklassen trivialerweise identisch. Das gilt im Allgemeinen allerdings nicht. Diejenigen Untergruppen H, f¨ ur die aH = Ha gilt, besitzen besonderes Interesse (vgl. Frage 39). Frage 33 identisch?
Wieso sind zwei Linksnebenklassen von H in G entweder disjunkt oder
Antwort: Es gen¨ ugt, die folgende Implikation zu zeigen: a ∈ bH =⇒ aH = bH.
(∗)
Aus a′ ∈ aH ∩ bH folgt dann n¨ amlich sofort a′ H = aH = bH. Sei also a ∈ bH, dann gilt a = bh1 und b = ah−1 f¨ ur ein h1 ∈ H. F¨ ur ein 1 beliebiges Element c ∈ bH gibt es entsprechend ein h2 ∈ H mit c = bh2 , und daraus folgt c = ah−1 1 h2 ∈ aH. Also gilt bH ⊂ aH. Gilt umgekehrt c ∈ aH, also c = ah3 f¨ ur ein h3 ∈ H, dann folgt c = bh1 h3 ∈ bH. Damit ist auch aH ⊂ bH und insgesamt (∗) gezeigt. Frage 34 Gruppe G?
Was versteht man unter dem Index einer Untergruppe H einer endlichen
Antwort: Unter dem Index von H in G versteht man die Anzahl der Linksnebenklassen (und damit der Rechtsnebenklassen) von H in G. Man bezeichnet diese Zahl mit (G : H).
14
Frage 35
1 Algebraische Grundlagen
Was besagt der Satz von Lagrange?
Antwort: Der Satz von Lagrange besagt: Ist G eine endliche Untergruppe und H ⊂ G eine Untergruppe, dann gilt |G| = (G : H) · |H|. Der Beweis ergibt sich im Wesentlichen aus Antwort 33. Aus dieser folgt insbesondere, dass G die disjunkte Vereinigung der Linksnebenklassen von H in G ist. Da in jeder Linksnebenklasse aH genau |H| Elemente liegen, folgt daraus schon der Satz von Lagrange. Frage 36 Warum ist in einer endlichen Gruppe G die Ordnung einer Untergruppe H stets ein Teiler der Ordnung von G? Antwort: Da (G : H) eine nat¨ urliche Zahl ist, ergibt sich die Antwort als eine unmittelbare Konsequenz aus dem Satz von Lagrange. Frage 37 Was besagt der kleine Fermat’sche Satz? Was besagt er im Spezialfall G = (Z/pZ)∗ , wo p eine Primzahl ist? Antwort: Aus dem Satz von Lagrange erh¨ alt man als Spezialfall: Die Ordnung eines Elements a ∈ G ist ein Teiler der Gruppenordnung. F¨ ur jedes a ∈ G gilt also a|G| = am·ord a = em = e. Das ist der kleine Fermat’sche Satz in gruppentheoretischer Sprechweise. Ist G = (Z/pZ)∗ , so gilt wegen |G| = p − 1 speziell ap−1 = 1 f¨ ur alle a ∈ G bzw. ap−1 = 1 (mod p)
f¨ ur alle a ∈ Z,
So lautet der kleine Fermat’sche Satz in seiner klassischen zahlentheoretischen Formulierung. Frage 38 abelsch?
Warum ist jede Gruppe von Primzahlordnung p zyklisch und damit
Antwort: Nach dem Satz von Lagrange hat jedes Element aus G entweder die Ordnung 1 oder die Ordnung p. Jedes vom neutralen Element verschiedene Ele ment aus G erzeugt daher die Gruppe G.
1.2 Abbildungen zwischen Gruppen, Untergruppen
Frage 39
15
Was versteht man unter einem Normalteiler in G?
Antwort: Eine Untergruppe N ⊂ G heißt Normalteiler in G, wenn gilt: aN = N a
f¨ ur alle a ∈ G,
d. h., wenn die Links- und Rechtsnebenklassen von N in G u ¨bereinstimmen. Frage 40 Aus welchem Grund spielen die Normalteiler in einer Gruppe eine ausgezeichnete Rolle? Antwort: Ist N ein Normalteiler in G, dann l¨ asst sich auf der Menge der Linksnebenklassen G/N von N in G eine Gruppenstruktur definieren, indem man f¨ ur zwei Linksnebenklassen aN und bN deren Produkt durch aN · bN := abN
(∗)
erkl¨ art. Allerdings muss begr¨ undet werden, dass auf diese Weise tats¨ achlich eine Verkn¨ upfung in der Menge der Linksnebenklassen von N in G gegeben ist. In der Definition (∗) werden n¨ amlich Repr¨ asentanten der vorkommenden Linksnebenklassen benutzt und es ist a priori nicht selbstverst¨ andlich, dass man bei der Wahl von anderen Repr¨ asentanten derselben Klassen das gleiche Ergebnis bekommt. Es muss daher gezeigt werden, dass die Verkn¨ upfung wohldefiniert, d. h. unabh¨ angig von der Auswahl der Repr¨asentanten ist. Genau muss Folgendes gezeigt werden Aus a′ N = aN und b′ N = bN folgt stets abN = a′ b′ N . Seien also die beiden Voraussetzungen erf¨ ullt. Dann gibt es Elemente n1 , n2 ∈ N mit a = a′ n1 und b = b′ n2 , und daraus folgt abN = ab′ n2 N = ab′ N = aN b′ = a′ n2 N b′ = a′ N b′ = a′ b′ N. Das zeigt die Wohldefiniertheit der Verkn¨ upfung. Man beachte, dass hier zweimal von der Normalteilereigenschaft von N Gebrauch gemacht wurde. Diese Argumentation l¨ asst sich daher nicht auf Links- oder Rechtsnebenklassen u ¨bertragen. Die Gruppenstruktur von G/N ergibt sich nun leicht aus derjenigen von G. So u agt sich die Assoziativit¨ at der Verkn¨ upfung (∗) unmittelbar von G auf ¨bertr¨ G/N . Die Verkn¨ upfungsdefinition garantiert unmittelbar, dass mit aN und bN auch aN · bN eine Linknsnebenklasse von N in G ist. Ferner ist mit eN = N ein neutrales Element in G/N gegeben und zu jeder Linksnebenklasse aN ∈ G/N existiert mit a−1 N ein inverses Element in G/N . Damit ist G/N eine Gruppe und die kanonische Projektion π : G −→ G/N, ein Gruppenhomomorphismus.
a → aN
16
1 Algebraische Grundlagen
Frage 41 Ist der Kern eines Gruppenhomomorphismus F : G −→ G′ stets ein Normalteiler in G? Antwort: Sei b ∈ ker F . Dann gilt f¨ ur jedes a ∈ G F (aba−1 ) = F (a)F (b)F (a−1 ) = F (a)F (a−1 ) = 1, also aba−1 ∈ ker F . Daraus folgt zun¨ achst a · ker F · a−1 ⊂ ker F und durch einen M¨ achtigkeitsvergleich der beiden Mengen dieser Inklusion anschließend a · ker F · a−1 = ker F , also a · ker F = ker F · a. Demnach ist ker F ein Normalteiler in G. Die Aussage des folgenden Homomorphiesatzes impliziert, dass jeder Normalteiler in G sich als Kern eines Gruppenhomomorphismus realisieren l¨ asst. Frage 42
Was besagt der Homomorphiesatz f¨ ur Gruppen?
Antwort: Der Homomorphiesatz besagt: Zu jedem Gruppenhomomorphismus F : G −→ G′ gibt es einen eindeutig bestimmten Homomorphismus F : G/ ker F −→ G′ , so dass das folgende Diagramm kommutiert. F // G′ G HH OO HH HH F π HHH ## G/ ker F Es gilt im F = im F und ker F = 0, insbesondere ist F injektiv. F¨ ur surjektives F gilt also G′ ≃ G/ ker F. Beweis: Falls u ¨ berhaupt eine Abbildung F mit diesen Eigenschaften existiert, dann gilt f¨ ur alle a ∈ G: F (a ker F ) = F (a). (∗) Umgekehrt folgt die Existenz von F , wenn man zeigen kann, dass die durch (∗) gegebene Abbildung wohldefiniert, also unabh¨ angig von der Auswahl der Repr¨ asentanten ist. Dazu muss gezeigt werden, dass aus a ker F = b ker F stets F (a ker F ) = F (b ker F ) folgt. Sei also a ker F = b ker F , dann gilt ab−1 ∈ ker F , also F (ab−1 ) = F (a)F −1 (b) = 1, also F (a) = F (b), und mit Definition (∗) folgt wie gew¨ unscht F (a ker F ) = F (b ker F ). Das zeigt, dass F durch (∗) wohldefiniert ist. Also existiert ein Homomorphismus mit den gesuchten Eigenschaften. Dieser ist eindeutig, weil er (∗) erf¨ ullen muss. Beispiel: Sei GL(n, K) die Gruppe der invertierbaren n×n-Matrizen u ¨ber einem K¨ orper K. Die Determinantenabbildung det : GL(n, K) −→ K ∗
1.2 Abbildungen zwischen Gruppen, Untergruppen
17
ist ein surjektiver Gruppenhomomorphismus (vgl. Frage 265) mit dem Kern SL(n, K) ( Special Linear Group“: die Menge aller n × n-Matrizen u ¨ber K mit ” Determinante 1). Mit dem Homomorphiesatz schließt man GL(n, K)/ SL(n, K) ≃ K ∗ . Weitere Anwendungsbeispiele des Homomorphiesatzes finden sich in den Antwor ten zu Frage 51 und Frage 64. Frage 43
Was besagt der Satz von Cayley?
Antwort: Der Satz von Cayley besagt: F¨ ur jede Gruppe existiert ein kanonischer injektiver Homomorphismus G −→ Sym G in die Gruppe Sym G aller Selbstabbildungen von G. Mit anderen Worten, jede Gruppe der Ordnung n ist isomorph zu einer Untergruppe von Sn . Zum Beweis betrachte man f¨ ur a ∈ G die Abbildung τa : G −→ G,
g → ag.
Man verifiziert leicht die folgenden drei Eigenschaften ur jedes a ∈ G (i) τa ist bijektiv f¨ (ii) τa ◦ τb = τab f¨ ur alle a, b ∈ G (iii) τa ◦ τa−1 = id f¨ ur alle a ∈ G.
Aus (i), (ii) und (iii) folgt, dass die Menge Θ := {τa ; a ∈ G} eine Untergruppe der symmetrischen Gruppe Sym(G) ist. Wegen (ii) ist G −→ Θ,
a → τa
ein Homomorphismus. Dieser ist injektiv, denn aus τa = τb folgt ag = bg f¨ ur alle g ∈ G, also a = b. Frage 44 ben?
K¨ onnen Sie alle Untergruppen der symmetrischen Gruppe S3 beschrei-
Antwort: Die einzigen Untergruppen der Ordnung 2 in S3 sind die von den Transpositionen σ4 , σ5 und σ6 (zur Bezeichnung siehe Frage 11) erzeugten Untergruppen. Eine Untergruppe der Ordnung 3 ist mit σ2 := {1, σ2 , σ3 } gegeben. Mehr Untergruppen der Ordnung 3 kann es nicht geben, denn eine von σ2 verschiedene Untergruppe der Ordnung 3 m¨ usste mindestens eine der Permutationen σ4 , σ5 oder σ6 der Ordnung 2 enthalten, was aufgrund des Satzes von Lagrange nicht sein kann. Da nach dem Satz von Lagrange jede echte Untergruppe von S3 h¨ ochstens die Ordnung 3 hat, sind damit alle Untergruppen aufgez¨ ahlt.
18
1 Algebraische Grundlagen
Frage 45
Warum ist jede Gruppe der Ordnung ≤ 5 eine abelsche Gruppe?
Antwort: Die Gruppen der Ordnung 2, 3 und 5 sind Gruppen von Primzahlordnung. F¨ ur eine Gruppe G, deren Ordnung eine Primzahl p ist, folgt aber aus dem Satz von Lagrange, dass jedes vom neutralen Element verschiedene Element aus G die Ordnung p hat und damit ein Erzeuger von G ist. Gruppen mit Primzahlordnung sind also zyklisch und damit nach Antwort 38 abelsch. F¨ ur Gruppen der Ordnung 4 wurde die Behauptung schon in der Antwort zu Frage 13 gezeigt, und f¨ ur Gruppen der Ordnung 1 ist sie trivial.
1.3
Der Signum-Homomorphismus
Jeder Permutation σ : {1, 2, . . . , n} −→ {1, 2, . . . , n} l¨ asst sich ein Vorzeichen so zuordnen, dass die Abbildung ε : Sn −→ {−1, 1} ein Gruppenhomomorphismus ist. Die Homomorphieeigenschaft von ε spielt in vielen Zusammenh¨ angen eine große Rolle, insbesondere bei der Definition der Determinante nach Leibniz (vgl. Frage 271). Frage 46
Was versteht man unter dem Fehlstand einer Permutation σ ∈ Sn ?
Antwort: Ein Paar (j, k) ∈ {1, . . . , n}2 nennt man einen Fehlstand von σ ∈ Sn , wenn j < k aber σ(j) > σ(k) ande, n¨ amlich das gilt. Zum Beispiel hat die Permutation [ 12 23 31 ] genau zwei Fehlst¨ Paar (1, 3) und das Paar (2, 3). Frage 47
Wie ist das Vorzeichen einer Permutation σ ∈ Sn definiert?
Antwort: F¨ ur σ ∈ Sn ist das Vorzeichen sign σ definiert durch +1, falls σ eine gerade Anzahl an Fehlst¨ anden hat sign σ = −1, falls σ eine ungerade Anzahl an Fehlst¨ anden hat. Frage 48
Wann heißt ein Element τ ∈ Sn eine Transposition?
Antwort: Eine Permutation τ ∈ Sn heißt Transposition, wenn sie zwei Elemente aus {1, . . . , n} vertauscht und alle anderen fest l¨ asst, wenn es also zwei Elemente k, j aus {1, . . . , n} mit k = j gibt, so dass gilt: τ (k) = j,
τ (j) = k,
τ (m) = m
f¨ ur alle m ∈ {1, . . . , n} \ {j, k}.
Zur Bezeichnung der Transposition benutzt man die Schreibweise (j, k).
1.3 Der Signum-Homomorphismus
19
Frage 49 Warum ist jede Permutation σ ∈ Sn f¨ ur n ≥ 2 ein endliches Produkt von Transpositionen? ur jede beliebige Antwort: Ist σ die identische Abbildung, dann gilt σ = τ · τ −1 f¨ Transposition τ ∈ Sn . Im anderen Fall gibt es eine kleinste Zahl j ∈ {1, . . . , n}, f¨ ur die σ(j) = j gilt, spezieller σ(j) > j wegen der Bijektivit¨ at von σ. Ist τ1 die Abbildung, welche j mit σ(j) vertauscht, dann ist τ1 · σ eine Permutation, die mindestens die ersten j Elemente aus {1, . . . , n} fest l¨ asst, d. h., τ1 · σ bildet mindestens ein Element mehr als σ auf sich selbst ab. Daraus folgt induktiv die Existenz von Transpositionen τ1 , τ2 , . . . , tk mit k < n − j + 1, f¨ ur die gilt τk · · · τ2 · τ1 · σ = id, also σ = τ1−1 · −1 −1 τ2 · · · τ k . Beispiel. F¨ ur die Permutation σ = [ 14 25 31 42 53 ] erh¨ alt man nacheinander (1, 4) · σ (2, 5) · (1, 4) · σ (3, 4) · (2, 5) · (1, 4) · σ (4, 5) · (3, 4) · (2, 5) · (1, 4) · σ
= [ 11 25 34 42 53 ] , = [ 11 22 34 45 53 ] , = [ 11 22 33 45 54 ] , = [ 11 22 33 44 55 ] = id.
−1 Es folgt σ = (4, 5) · (3, 4) · (2, 5) · (1, 4) = (1, 4) · (2, 5) · (3, 4) · (4, 5). Frage 50
Warum ist die Abbildung ε : Sn −→ {−1, 1},
σ → ε(σ) := Vorzeichen von σ
ein Gruppenhomomorphismus? Antwort: Es muss gezeigt werden, dass f¨ ur τ, σ ∈ Sn gilt: sign (τ · σ) = sign τ · sign σ.
(∗)
Dieser Zusammenhang ergibt sich im Wesentlichen aus der folgenden Darstellung des Signums: σ(k) − σ(j) sign σ = , (∗∗) k−j π(j)<π(k)
wobei π ∈ Sn beliebig gew¨ ahlt werden kann. Um Formel (∗∗) einzusehen, mache man sich klar, dass im Z¨ ahler des rechts vom Gleichheitszeichen stehenden Produktes bis auf die Reihenfolge und das Vorzeichen genau dieselben Differenzen als Faktoren vorkommen wie im Nenner. Somit betr¨ agt der Wert des Produkts ±1. Weiter tr¨ agt ein Quotient σ(k)−σ(j) genau dann ein negatives Vorzeichen, wenn k−j das Paar (k, j) ein Fehlstand von σ ist. Daraus folgt insgesamt ((∗∗)).
20
1 Algebraische Grundlagen
Den Zusammenhang (∗) erh¨ alt man damit nun aus sign (τ · σ) =
τ (σ(k)) − τ (σ(j)) τ (σ(k)) − τ (σ(j)) σ(k) − σ(j) = · k−j σ(k) − σ(j) k−j
j
j
τ (σ(k)) − τ (σ(j)) = · sign σ = σ(k) − σ(j) j
j
σ(j)<σ(k)
τ (k) − τ (j) · sign σ = sign τ · sign σ. = k−j
τ (σ(k)) − τ (σ(j)) · sign σ σ(k) − σ(j)
j
Frage 51
Wie viele Elemente hat An = ker ε?
Antwort: An ist als Kern des Gruppenhomomorphismus ε ein Normalteiler in Sn (vgl. Frage 41). Da ε surjektiv ist, folgt mit dem Homomorphiesatz (vgl. Frage 42) Sn /An ≃ {−1, 1}, also insbesondere |Sn /An | = (Sn : An ) = 2. Mit dem Satz von Lagrange folgt hieraus |An | = |Sn |/2, also |An | = 12 n!. Frage 52 Wann heißt eine Permutation σ ∈ Sn gerade, wann ungerade? Wie lassen sich demnach die Elemente aus An charakterisieren? Antwort: Die Darstellung einer Permutation als Produkt von Transpositionen, deren generelle M¨ oglichkeit in Frage 49 gezeigt wurde, ist in der Regel nicht eindeutig. F¨ ur jede Permutation σ ist jedoch eindeutig bestimmt, ob sie sich als Produkt einer geraden oder ungeraden Anzahl von Transpositionen schreiben l¨ asst. F¨ ur den Nachweis zeigen wir, dass f¨ ur eine beliebige Permutation σ ∈ Sn und eine beliebige Transposition τ ∈ Sn stets gilt: sign (τ · σ) = −sign σ. Daraus folgt, dass sich jede Permutation mit ungeradem Vorzeichen nur als Produkt einer ungeraden Anzahl an Transpositionen darstellen l¨ asst und entsprechend jede Permutation mit geradem Vorzeichen nur als Produkt einer geraden Anzahl an Transpositionen. Sei ··· j ··· i ··· k ··· σ= (∗) · · · σ(j) · · · σ(i) · · · σ(k) · · · ¨ und τ die Transpostion, die σ(j) und σ(k) miteinander vertauscht. Beim Ubergang von σ zu τ · σ ¨andert sich die Anzahl der Fehlst¨ ande, und diese Anzahl h¨ angt ab von
1.4 Ringe und K¨ orper
21
¨ der Anderung der Reihenfolge von σ(j) und σ(k). Dies bewirkt genau einen zus¨ atzlichen Fehlstand oder genau einen Fehlstand weniger ¨ der Anderung der Reihenfolge von σ(j) und σ(i) sowie σ(i) und σ(k) f¨ ur alle i mit j < i < k. Hier muss unterschieden werden: – Ist σ(i) < min{σ(j), σ(k)} oder σ(i) > max{σ(j), σ(k)}, so ¨ andert sich die Anzahl der Fehlst¨ ande nicht. – F¨ ur min{σ(j), σ(k)} < σ(i) < max{σ(j), σ(k)} ¨ andert sich die Anzahl der Fehlst¨ ande um +2 oder −2.
Das Aufsummieren der hinzugekommenen bzw. weggefallenen Fehlst¨ ande ergibt also in jedem Fall eine ungerade Zahl. Daraus folgt (∗) und insgesamt die Behauptung. Bez¨ uglich An gilt damit An = {σ ∈ Sn ; σ ist ein Produkt einer geraden Anzahl von Transpositionen}. Frage 53
Warum ist An f¨ ur n ≥ 4 keine abelsche Gruppe?
Antwort: F¨ ur paarweise verschiedene x1 , x2 , x3 ∈ {1, . . . , n} gilt (x1 , x2 , x3 ) = (x1 , x2 ) ◦ (x2 , x3 ).
Das heißt, dass jeder Drei-Zyklus (also eine Permutation, die genau drei Elemente nicht fest l¨ asst) sich als Produkt zweier Transpositionen schreiben l¨ asst und folglich zu An geh¨ ort. Ist n ≥ 4, so enth¨ alt An die beiden Drei-Zyklen σ1 = (1, 2, 3) und σ2 = (2, 3, 4). F¨ ur diese gilt σ1 ◦ σ2 = (1, 2) ◦ (3, 4) = (1, 3) ◦ (2, 4) = σ2 ◦ σ1 .
1.4
Ringe und K¨ orper
Neben dem Gruppenbegriff sind f¨ ur die Lineare Algebra auch die Strukturen Ring“ und K¨ orper“ von großer Bedeutung. Wir bringen an dieser Stelle aus sy” ” stematischen Gr¨ unden auch schon tiefer liegende Sachverhalte insbesondere u ¨ber Ringe zur Sprache, die erst an sp¨ aterer Stelle ab Kapitel 5.3 gebraucht werden. Frage 54 (a) (b) (c)
Was versteht man unter
einem Ring, einem Schiefk¨ orper, einem K¨ orper?
Benutzen Sie bei Ihren Antworten nach M¨ oglichkeit die Sprache der Gruppentheorie.
22
1 Algebraische Grundlagen
Antwort: (a) Ein Ring ist eine Menge R mit zwei inneren Verkn¨ upfungen +“ ” und ·“ mit den Eigenschaften ” (R1) (R, +) ist eine abelsche Gruppe. (R2) Die Verkn¨ upfung ·“ ist assoziativ. ” (R2) Es gelten die Distributivgesetze (a + b) · c = a · c + b · c,
c · (a + b) = c · a + c · b
f¨ ur a, b, c ∈ R.
Besitzt R außerdem ein Einselement bez¨ uglich der Multiplikation, so nennt man R einen Ring mit Eins. Wo nicht ausdr¨ ucklich anders gesagt, verstehen wir unter einem Ring stets einen Ring mit Eins. (b) Ein Schiefk¨ orper S ist ein Ring mit der zus¨ atzlichen Eigenschaft, dass (S ∗ , ·) = (S \ {0}, ·) eine multiplikative Gruppe bildet, Zus¨ atzlich zu den Eigenschaften R1, R2 und R3 gilt f¨ ur S also noch, dass zu jedem a ∈ S ∗ ein inverses Element a−1 existiert, so dass gilt a−1 · a = 1. (c) Ein K¨ orper K ist ein Schiefk¨ orper mit der zus¨ atzlichen Eigenschaft, dass die multiplikative Gruppe (K ∗ , ·) kommutativ ist. Frage 55 (a) (b) (c)
K¨ onnen Sie Beispiele nennen f¨ ur
Ringe (nichtkommutative und kommutative), einen Schiefk¨ orper, einige K¨ orper?
Antwort: (a) Die Menge der ganzen Zahlen ist ein kommutativer Ring mit 1. ur n ∈ N sind ebenfalls kommutative Ringe, besitzen jedoch kein Die Mengen nZ f¨ Einselement bez¨ uglich der Multiplikation. Ferner sind alle K¨ orper und Schiefk¨ orper insbesondere auch Ringe. Aus einem gegebenen Ring R lassen sich durch verschiedene Konstruktionsprozesse weitere Ringe gewinnen: F¨ ur einen K¨ orper K sei R = K n×n die Menge der (n × n)-Matrizen mit Koeffizienten in K. Dann ist R bez¨ uglich der u ¨blichen Addition und Multiplikation von Matrizen ein Ring mit der Einheitsmatrix als neutralem multiplikativem Element. R ist f¨ ur n ≥ 2 nicht kommutativ. Etwas allgemeiner gilt, dass f¨ ur einen Vektorraum V die Menge der linearen Abbildungen V −→ V die Struktur eines Rings besitzt, wobei die additive Struktur durch die u ¨bliche Addition von Abbildungen und die Multiplikation durch die Verkn¨ upfung von Abbildungen gegeben ist. Man beachte, dass die G¨ ultigkeit des Distributivgesetzes hier von der Linearit¨ at der Abbildungen abh¨ angt.
1.4 Ringe und K¨ orper
23
F¨ ur eine Menge M und einen Ring R sei RM die Menge aller Abbildungen M −→ R. Definiert man f¨ ur f, g ∈ RM die Verkn¨ upfungen f + g : X −→ R, f · g : X −→ R,
x → f (x) + g(x) x → f (x) · g(x),
dann ist RM auf nat¨ urliche Weise ein Ring. Im Fall I = N erh¨ alt man aus dem vorhergehenden Punkt einen wichtigen Spezialfall. Der Polynomring R[X] ist definiert als R[X] := {(ai )i∈N ; ai ∈ R und ai = 0 f¨ ur alle bis auf endlich viele i}.
R[X] ist damit isomorph zu einem Unterring von RN . Genauer gilt:
R[X] ≃ R(N) := {f ∈ RN ; f (n) = 0 f¨ ur alle bis auf endlich viele n ∈ N} (b) Das bekannteste Beispiel eines Schiefk¨ orpers ist der Schiefk¨ orper H der Hamilton’schen Quaternionen. Zur Konstruktion von H gehe man aus von einem vierdimensionalen Vektorraum V mit Basis e, i, j, k und definiere e2 = e,
ei = ie = i, 2
ij = −ji = k,
ej = je = j, 2
ek = ke = k,
2
i = j = k = −e, jk = −kj = i, ki = −ik = j.
Das Produkt beliebiger Elemente aus V erkl¨ art man hiervon ausgehend durch R-lineare Ausdehnung. Mit dieser Multiplikation und der gew¨ohnlichen Vektoraddition ist (V, +, ·) =: H ein Schiefk¨ orper.
(c) Beispiele f¨ ur K¨ orper sind √ Q, R oder√C. Zwischen Q und C liegen unendlich viele Zwischenk¨ orper, etwa Q( 2) := {a+b 2, ; a, b ∈ Q} oder Q(i) := {a+bi, ; a, b ∈ Q}. Diese K¨orper enthalten alle unendlich viele Elemente. Beispiele endlicher K¨ orper sind f¨ ur jede Primzahl p die Mengen Fp := Z/pZ. Ist allgemeiner q = pn eine Primzahlpotenz, so existiert ein K¨ orper Fq mit q Elementen. Diesen erh¨ alt man als Erweiterungsk¨ orper von Fp . (vgl. [5]). F¨ ur einen K¨ orper K ist die Menge K(X) der rationalen Funktionen ebenfalls ein K¨ orper. Diesen erh¨ alt man rein algebraisch als Quotientenk¨ orper des Polynomrings K[X] (analog zur Konstruktion von Q aus Z). Frage 56
Was versteht man unter einem Integrit¨ atsring?
Antwort: Ein Ring R heißt Integrit¨ atsring, wenn f¨ ur zwei Elemente a, b ∈ R mit a = 0 und b = 0 stets auch ab = 0 gilt. Ein Integrit¨ atsring ist somit ein nullteilerfreier Ring. Frage 57 Worin besteht der Unterschied zwischen einem kommutativen Ring mit Einselement ( = 0) und einem K¨ orper? Antwort: Ein Ring, der kein K¨ orper ist, besitzt nicht zu jedem Element ein multiplikativ Inverses, ist also bez¨ uglich der Multiplikation keine Gruppe.
24
1 Algebraische Grundlagen
Frage 58 terk¨ orper?
Warum besitzt der K¨ orper Q der rationalen Zahlen keinen echten Un-
Antwort: Sei U ⊂ Q ein Unterk¨ orper von Q. Wegen 1 ∈ U folgt zun¨ achst Z ∈ U 1 und damit auch m ∈ U f¨ ur alle m ∈ Z∗ . Beide Zwischenergebnisse zusammen n implizieren aber, dass die Br¨ uche m f¨ ur alle n ∈ Z und alle m ∈ Z∗ in U enthalten sind, dass also U = Q gilt. Frage 59
Was versteht man unter der Charakteristik eines K¨ orpers K?
Antwort: F¨ ur n ∈ N betrachte man die endlichen Summen 1 + 1K + · · · + 1K =: n · 1K .
K n Summanden
Sind diese alle von null verschieden, so setzt man char(K) = 0. Andernfalls gibt es eine kleinste Zahl n, f¨ ur die n · 1K = 0 gilt. In diesem Fall ist char(K) = n. √ √ Frage 60 Welche Charakteristik haben die K¨ orper Q, Q( 2) := {a+b 2 ; a, b ∈ Q} und C? Antwort: Alle drei K¨ orper besitzen die Charakteristik 0.
Frage 61
Gibt es K¨ orper der Charakteristik 2 mit unendlich vielen Elementen?
Antwort: Ja, beispielsweise ist der K¨ orper K = F2 (X) der rationalen Funktionen u orper F2 ein K¨ orper mit unendlich vielen Elementen, f¨ ur den 1K +1K = ¨ber dem K¨ 0 gilt. Ein weiteres Beispiel ist der algebraische Abschluss F2 von F2 . Zur Definition des algebraischen Abschlusses vergleiche [5]. Frage 62 zahl?
Warum ist die Charakteristik eines endlichen K¨ orpers stets eine Prim-
Antwort: Sei char(K) = n = pq eine zusammengesetzte Zahl mit 1 < p, q < n. Definitionsgem¨ aß ist dann n die kleinste nat¨ urliche Zahl mit n1K = 0. Aufgrund des Distributivgesetzes gilt (p1K ) · (q1K ) = (1K + · · · + 1K ) · (1K + · · · + 1K ) = (pq)1K = n1K = 0
p-mal
q-mal
Nach Voraussetzung ist q1K = 0, also existiert ein Inverses (q1K )−1 , und es folgt p1K = (p1K ) · (q1K ) · (q1K )−1 = 0 · (q1K )−1 = 0, im Widerspruch zur Voraussetzung.
1.4 Ringe und K¨ orper
Frage 63
25
Was versteht man unter dem Primk¨ orper eines K¨ orpers K?
Antwort: Der Primk¨ orper von K ist der kleinste Unterk¨ orper von K. Frage 64 (a) (b)
Ist K ein K¨ orper und P sein Primk¨ orper. Warum gilt dann
char(K) = p ⇐⇒ P ≃ Z/pZ, char(K) = 0 ⇐⇒ P ≃ Q?
Mit anderen Worten: Warum sind Q und die Restklassenk¨ orper Z/pZ bis auf Isomorphie die einzigen Primk¨ orper? Antwort: (a) Ist P = Z/pZ, dann gilt char(K) = p, andernfalls w¨ urde q1K = 0 f¨ ur ein q < p gelten, und damit w¨ are Z/pZ kein Unterk¨ orper von K. Zum Beweis der anderen Richtung betrachte man die Abbildung F : Z −→ K,
n −→ n1K .
Man u uft leicht, dass es sich dabei um einen Homomorphismus von Rin¨berpr¨ gen handelt, insbesondere also um einen Gruppenhomomorphismus der additiven Gruppe (Z, +) in die additive Gruppe (K, +). Ist char(K) = p, so gilt ker F = pZ, und aus dem Homomorphiesatz (Frage 42) folgt Z/pZ ≃ im F ⊂ K. (b) Ist char(K) = 0, so sind alle endlichen Summen n1K f¨ ur n ∈ Z \ {0} von null verschieden und besitzen daher ein inverses Element. Man betrachte n → n1K · (m1K )−1 . F ∗ : Q −→ K, m Die Abbildung F ∗ ist wegen n kn ∗ = kn1K ·(km1K )−1 = k1K ·n1K ·(k1K ·m1K )−1 = n1K ·(m1K )−1 = F ∗ F km m
wohldefiniert. Ferner ist F ∗ , wie man leicht u uft, ein injektiver K¨ orperho¨berpr¨ momorphismus. Daraus folgt Q ⊂ K und folglich Q = P , da Q keine weiteren Unterk¨ orper enth¨ alt. Die Umkehrung der Aussage ist trivial. Frage 65
Was ist ein Ideal in einem Ring R?
Antwort: Eine Teilmenge a ⊂ R heißt Ideal, wenn gilt: (i) (ii)
a ist eine additive Untergruppe. F¨ ur alle a ∈ a und alle r ∈ R gilt ra ∈ a und ar ∈ a.
Zum Beispiel bilden f¨ ur jedes a ∈ R die Mengen Ra := (a) := {ra ; r ∈ R} ein Ideal in R.
26
Frage 66
1 Algebraische Grundlagen
Welches sind die Ideale in Z?
Antwort: Die Ideale in Z sind genau die Mengen aZ := {am ; m ∈ Z} mit a ∈ Z. Frage 67
Ist ein Ideal a ⊂ R stets auch ein Unterring von R?
Antwort: Nein, denn im Allgemeinen ist 1 = a. Genauer folgt aus 1 ∈ a bereits a = R, da f¨ ur jedes r ∈ R gilt r = 1 · r ∈ a. Frage 68 spiel?
Was versteht man unter einem Hauptidealring? Kennen Sie ein Bei-
Antwort: Ein Ring R heißt Hauptidealring, wenn jedes Ideal a ⊂ R von einem einzigen Element erzeugt wird, wenn also ein a ∈ R existiert mit
a = Ra := (a) := {ra ; r ∈ R}. Ein einfaches Beispiel eines Hauptidealrings ist Z.
Frage 69 K¨ onnen Sie zeigen, dass f¨ ur einen Homomorphismus F R −→ R′ zwi′ schen Ringen R und R der Kern von F ein Ideal in Z ist? Antwort: F¨ ur a, b ∈ ker F gilt F (a + b) = F (a) + F (b) = 0 + 0 = 0, also a + b ∈ ker F . Ferner folgt f¨ ur beliebiges r ∈ R F (ra) = r · F (a) = r · 0 = 0, also ra ∈ ker F . Das zeigt die Behauptung. Frage 70 Wie ist f¨ ur einen Ring R und ein Ideal a ⊂ R der Quotienten- bzw. Restklassenring R/aR definiert? K¨ onnen Sie zeigen, dass R/aR von R tats¨achlich die Struktur eines Rings erbt? ¨ Antwort: Ahnlich wie f¨ ur Untergruppen definiert man f¨ ur ein Ideal a ⊂ R eine Relation ∼a“ auf R durch ” a ∼a b ⇐⇒ a − b ∈ a. ¨ Die Relation ∼a“ ist dann eine Aquivalenzrelation. Denn wegen a − a = 0 ∈ a ” f¨ ur jedes a ∈ R gilt a ∼a a, die Relation ist also reflexiv. Sie ist symmetrisch, da aus a − b ∈ a, also a ∼a b auch b − a = −(a − b) ∈ a, also b ∼a a folgt. Um die Transitivit¨ at zu zeigen, nehme man a ∼a b und b ∼a c mit a, b, c ∈ R an. Dann gilt a − b ∈ a und b − c ∈ a und daraus folgt (a − b) + (b − c) = a − c ∈ a, also a ∼a c. Das zeigt die Transitivit¨ at. Man kann daher zu jedem a ∈ R die Nebenklasse [a] := {b ∈ R ; b ∼a a} = a + a
1.4 Ringe und K¨ orper
27
bilden. Nach Frage 33 sind zwei Nebenklassen entweder disjunkt oder identisch, insbesondere ist R die disjunkte Vereinigung der Nebenklassen modulo a. Eine Ringstruktur auf R/a erkl¨ art man mittels der Verkn¨ upfungsregeln [a] + [b] := [a + b],
[a] · [b] := [a · b].
Hier ist wie in Antwort 40 zu zeigen, dass diese Regeln unabh¨ angig von der Auswahl der Repr¨ asentanten sind. Gilt etwa [a] = [a′ ] und [b] = [b′ ], dann hat man a − a′ ∈ a und b − b′ ∈ a, und es folgt (a+b)−(a′ +b′ ) = (a−a′ )+(b−b′ ) ∈ a,
(a·b)−(a′ ·b′ ) = b(a−a′ )+a′ (b−b′ ) ∈ a,
also [a + b] = [a′ + b′ ],
[a · b] = [a′ · b′ ].
angig von der AusDie Multiplikation und Division in R/a ist also wirklich unabh¨ wahl der Repr¨ asentanten. Die Eigenschaften R1 bis R3 u ¨bertragen sich von R damit unmittelbar auf R/a, woraus insgesamt folgt, dass R/a ein Ring ist. Frage 71 sen?
Wie lautet der Homomorphiesatz f¨ ur Ringe? Wie l¨asst er sich bewei-
Antwort: Der Satz lautet: Sei F : R −→ R′ ein Ringhomomorphismus, a ein Ideal in R mit a ⊂ ker F und π : R −→ R/a die nat¨ urliche Projektion. Dann gibt es einen eindeutig bestimmten Ringhomomorphismus F : R/a −→ R′ , so dass das unten stehende Diagramm kommutiert. F // R′ RB BB {== { BB {{ B {{ π BB !! {{ F R/a Insbesondere gilt f¨ ur surjektives F R/(ker F ) ≃ R′ . Antwort: Der Beweis funktioniert nach demselben Muster wie der f¨ ur Gruppen (vgl. Frage 42). Falls ein F mit den genannten Eigenschaften existiert, dann gilt f¨ ur a ∈ R/a jedenfalls F (a) = F (a). (∗) Nun zeigt man, dass durch die Festlegung (∗) tats¨ achlich ein wohldefinierter Ho′ angigmomorphismus R/a −→ R gegeben ist. Dazu ist wiederum nur die Unabh¨ keit der Definition von der Auswahl der Repr¨ asentanten nachzuweisen. Sind a und b zwei Repr¨ asentanten derselben Restklasse, dann gilt a−b ∈ a, also a−b ∈ ker F , und daher liefert die Definition (∗) F (a) − F (b) = F (a) − F (b) = F (a − b) = 0,
28
1 Algebraische Grundlagen
also F (a) = F (b). Die Abbildung F ist folglich wohldefiniert und es gilt F ◦π = F . Ferner ist F durch (∗) eindeutig festgelegt. Ist F surjektiv, dann auch F , und es gilt F (a) = 0 ⇐⇒ a ∈ ker F , also a = 0 ∈ R/ ker F . Daraus folgt der Zusatz.
1.5
Polynomringe
Das Studium der Polynome f¨ uhrt streng genommen u ¨ber die Lineare Algebra hinaus und ist dem mathematischen Teilgebiet zuzurechnen, das man heutzutage allgemein als Algebra“ bezeichnet. Polynome spielen trotzdem auch in der Linea” ren Algebra eine wesentliche Rolle, da in zahlreichen F¨ allen lineare Problemstellungen auf nat¨ urliche Weise die Untersuchung von Gleichungen h¨ oheren“, eben ” polynomialen, Typs erfordern, etwa bei der Bestimmung der Eigenwerte eines Endomorphismus. Den Polynomring R[X] u uhren wir hier gleich ¨ber einem Ring R f¨ im algebraischen Sinne ein, verstehen Polynome also nicht als spezielle Abbildungen R −→ R, sondern als Ring R(N) . Auch einige allgemeine ringtheoretische Begriffe und Zusammenh¨ ange werden behandelt. Frage 72 definieren?
Wie kann man f¨ ur einen kommutativen Ring R den Polynomring R[X]
Antwort: Man kann Polynomring R[X] als die Menge aller formal gebildeten den m Summen des Typs i=1 ai X i mit ai ∈ R einf¨ uhren, wobei die obere Grenze m variabel aber stets endlich ist. Indem man auf diese Ausdr¨ ucke die Rechenregeln f¨ ur gew¨ ohnliche Summen anwendet, erkennt man R[X] als kommutativen Ring. Eins- bzw. Nullelement entsprechen dabei dem Eins- bzw. Nullelement in R. Etwas pr¨ aziser l¨ asst sich R[X] definieren als die Menge aller Folgen (ai )i∈N mit Elementen ai ∈ R, f¨ ur die ai = 0 f¨ ur fast alle i gilt. Erkl¨ art man die Addition und Multiplikation durch (ai )i∈N + (bi )i∈N := (ai + bi )i∈N (ai )i∈N · (bi )i∈N := (ci )i∈N
mit ci =
ak bℓ ,
k,ℓ∈N k+ℓ=i
so wird R[X] unter dieser Definition zu einem kommutativen Ring mit 1. Die Variable“ X kann man unter dieser Perspektive einf¨ uhren als das Element ” X := (0, 1, 0, . . .) ∈ R(N) . Anwenden der Definition der Multiplikation auf X liefert dann X n = (δin )i∈N = ( 0, . . . , 0 , 1, 0, . . .) ∈ R[X].
n − 1-mal
1.5 Polynomringe
29
Identifiziert man die Elemente a ∈ R mit (a, 0, . . .) ∈ R(N) , so ist diese Identifikation vertr¨ aglich mit der Ringstruktur und jede Folge f = (ai )i∈N ∈ R(N) auf R, l¨ asst sich als Summe der Gestalt i∈N ai X i darstellen. Die Definition der Addition und Multiplikation in R[X] entspricht dann der Bildung von Summen und Produkten gew¨ ohnlicher endlicher Summen. Frage 73
Wie ist der Grad eines Polynoms f ∈ R[X] definiert?
Antwort: Ist f nicht das Nullpolynom, dann gibt es in der Darstellung f = i ur alle i > n gilt. i∈N0 ai X = 0 einen Koeffizienten an = 0, so dass ai = 0 f¨ Man nennt in diesem Fall an den h¨ ochsten Koeffizienten von f und bezeichnet n als den Grad von f , n = deg f . F¨ ur das Nullpolynom f = 0 gilt die Konvention deg f = −∞. Frage 74
K¨ onnen Sie zeigen, dass f¨ ur f, g ∈ R[X] gilt deg(f + g) ≤ max{deg f, deg g} deg(f · g) ≤ deg f + deg g
sowie, falls R ein Integrit¨atsring ist, deg(f · g) = deg f + deg g? Antwort: Sei f=
i∈N
ai X i
g=
bi X i
i∈N
mit deg f = n und deg g = m. Dann gilt ai = 0 und bj = 0 und folglich ai + bj = 0 f¨ ur alle i > n und alle j > m, also ak + bk = 0 f¨ ur alle k > max{n, m}. Das zeigt die erste Behauptung. Weiter gilt ai bj = 0, falls i + j > n + m ist. Daraus folgt f¨ ur f ·g = cℓ mit cℓ = ai bj , ℓ∈N
i+j=ℓ
dass cℓ f¨ ur alle ℓ > m + n verschwindet. Also gilt deg(f · g) ≤ deg f + deg g. Ist R zudem ein Integrit¨ atsring, dann folgt aus an = 0 und bm = 0 auch cn+m = an bm = 0. Zusammen mit deg(f · g) ≤ m + n ergibt sich deg(f · g) = deg f + deg g. Frage 75
Wenn R ein Integrit¨atsring ist, wieso dann auch R[X]?
Antwort: F¨ ur nichttriviale Polynome f, g ∈ R[X] gilt deg f ≥ 0 und deg g ≥ 0. Dann ist nach Frage 74 aber auch deg(f · g) = deg f + deg g ≥ 0, also f · g = 0. Das zeigt, dass R[X] ein Integrit¨ atsring ist.
30
1 Algebraische Grundlagen
Frage 76 Wie ist f¨ ur einen kommutativen Ring R und f¨ ur ein Element r ∈ R der Einsetzungshomomorphismus Fr : R[X] −→ R definiert? Antwort: F¨ ur r ∈ R definiert man
Fr : R[X] −→ R,
i∈N
ci X i −→
ci ri .
i∈N
Dass dies ein Homomorphismus von Ringen ist, pr¨ uft man unmittelbar nach. Frage 77
Was versteht man unter einem euklidischen Ring?
Antwort: Ein Integrit¨ atsring R heißt euklidischer Ring, wenn es eine Abbildung δ : R \ {0} −→ N gibt, die die folgende Eigenschaft besitzt: Zu je zwei Elementen a, b ∈ R mit b = 0 existieren (nicht notwendig eindeutig bestimmte) Elemente p, q ∈ R, so dass a = bq + r, r = 0 oder δ(r) < δ(b) gilt. Zum Beispiel ist Z aufgrund des Satzes u ¨ber den euklidischen Algorithmus ein euklidischer Ring, wenn man δ als Betragsfunktion w¨ ahlt. Frage 78 K¨ onnen Sie zeigen, dass der Polynomring K[X] zusammen mit der Gradabbildung ein euklidischer Ring ist? Antwort: Seien f, g zwei Polynome aus K[X] mit g = 0. Es muss gezeigt werden, dass Polynome q, r ∈ K[X] existieren, f¨ ur die gilt f = qg + r,
deg r < deg g.
(∗)
Ist deg g > deg f , dann folgt dies bereits mit q = 0 und r = f . Man kann daher im Folgenden von m = deg f ≥ deg g = n ausgehen. F¨ ur f = aX m + · · · und g = bX n + · · · setze man q1 :=
a · X m−n , b
f1 = f − q1 g.
Dann gilt q1 g = aX m + · · · und damit f = q1 g + f1 ,
deg f1 < deg f.
Gilt nun bereits deg f1 < deg g, so hat man eine Zerlegung des Typs (∗) gefunden. Andernfalls kann man dasselbeVerfahren f¨ ur f1 wiederholen und eine Zerlegung f1 = q2 g + f2 ,
deg f2 < deg f
1.5 Polynomringe
31
finden. Derart fortfahrend l¨ asst sich eine Serie f1 , f2 , . . . von Polynomen mit deg f1 > deg f2 > · · · konstruieren. Nach endlich vielen (genauer h¨ ochstens m−n) Schritten k gilt dann notwendigerweise deg fk < deg g, und man erh¨ alt f = q1 g + q2 g + · · · + qk g + fk = (q1 + · · · + qk )g + fk ,
deg fk < deg g.
Mit q = q1 + · · · + qk und r = fk folgt (∗). Um die Eindeutigkeit zu zeigen, betrachte man eine weitere Darstellung f = q ′ g + r′ mit deg r′ < deg g. Es gilt dann (q − q ′ )g + (r − r′ ) = 0 bzw.
(∗∗) (q − q ′ )g = r′ − r.
Ist (q − q ′ ) = 0, dann folgt deg (q − q ′ )g ≥ deg g. Andererseits ist nach Voraussetzung deg(r′ − r) < deg g, im Widerspruch zu (∗∗). Also gilt q = q ′ und damit auch r = r′ . Frage 79
K¨ onnen Sie das Verfahren aus Frage 78 an den beiden Polynomen f = 4X 4 + 3X 3 + 2X 2 + X + 1,
g = X3 + X2 + X + 1
veranschaulichen? Antwort: Man erh¨ alt q1 g = 4X · g = 4X 4 + 4X 3 + 4X 2 + 4X + 4 und damit f1 = −X 3 − 2X 2 − 3X − 3.
Weiter ist q2 g = −1 · g, also
f2 = f1 + g = −X 2 − 2X − 2.
Damit erh¨ alt man wegen deg f2 < deg g mit f = (4X − 1) · g + (−X 2 − 2X − 2) die gesuchte Zerlegung. Frage 80
Wieso ist jeder euklidische Ring ein Hauptidealring?
Antwort: Sei R ein euklidischer Ring und a ein Ideal in R. Man kann a = 0 annehmen, da andernfalls bereits a = (0) gilt. Sei a = min{δ(r) ; r ∈ a}.
(∗)
Wir zeigen, dass a = (a) gilt. Dazu w¨ ahle man ein beliebiges b ∈ a. Wegen (∗) gilt δ(b) ≥ δ(a), und da R ein euklidischer Ring ist, gibt es geeignete Elemente q, r ∈ R mit b = qa + r, wobei r = 0 oder δ(r) < δ(a) gilt. Ist nun δ = 0, dann kann r wegen (∗) nicht in a enthalten sein, woraus b − qa ∈ a folgt. Das ist ein Widerspruch, da mit b und a auch b − qa ein Element des Ideals a ist. Es muss also r = 0 und damit b = qa, also b ∈ (a) gelten. Daraus folgt a = (a), also ist R ein Hauptidealring.
32
Frage 81
1 Algebraische Grundlagen
Wann heißen zwei Elemente a, b eines Integrit¨atsrings R assoziiert?
Antwort: Die beiden Elemente a und b heißen assoziiert, wenn es eine Einheit e ∈ R∗ mit ae = b gibt. Frage 82 Wieso sind zwei Elemente a, b eines Integrit¨atsrings R genau dann assoziiert, wenn (a) = (b) gilt? Antwort: Sind a und b assoziiert, dann gilt ae = b und be′ = a mit Einheiten e, e′ ∈ R∗ . Daraus folgt b ∈ (a) und (a) ∈ b, also (b) ⊃ (a) und (a) ⊃ (b). ¨ Das beweist die eine Richtung der Aquivalenz. Gelte nun umgekehrt (a) = (b). Dann gibt es Elemente p, q ∈ R mit a = pb und b = qa, woraus a = pqa bzw. a · (1 − pq) = 0 folgt. Ist a = 0, dann erh¨ alt man pq = 1, die Elemente p und q sind also Einheiten und a und b folglich assoziiert. Dies gilt auch im Fall a = 0, denn wegen b = qa folgt dann a = b = 0. Frage 83 Wann nennt man ein Element p eines Integrit¨atsrings R irreduzibel, wann Primelement? Antwort: (i) p heißt irreduzibel, wenn aus einer Gleichung p = ab mit a, b ∈ R stets folgt, dass a oder b eine Einheit in R ist. Im anderen Fall heißt p reduzibel. (ii) p heißt Primelement, wenn aus p|ab mit a, b ∈ R stets p|a oder p|b folgt. Dabei bedeutet die Schreibweise p|q, dass p ein Teiler von q ist, also ein Element r ∈ R mit q = pr existiert. Im Ring Z sind die irreduziblen Elemente genauso wie die Primelemente gerade die Primzahlen einschließlich der 1. Frage 84
Wieso ist in jedem Integrit¨atsring R jedes Primelement auch irreduzibel?
Antwort: Sei p ∈ R ein Primelement. Aus p = ab folgt dann p|a oder p|b. Ohne Beschr¨ ankung der Allgemeinheit k¨ onnen wir p|b, also b = cp f¨ ur ein c ∈ R annehmen. Es folgt p = acp oder p · (1 − ac) = 0. Damit ist a eine Einheit in R und p folglich irreduzibel. Frage 85 Wieso gilt f¨ ur einen Hauptidealring R auch, dass jedes irreduzible Element ein Primelement ist? Antwort: Sei p ∈ R irreduzibel und gelte p|ab sowie p |a. Es muss p|b gezeigt werden. Dazu betrachte man das Ideal (a) + (p) = {ra + sp ; s, r ∈ R}.
1.5 Polynomringe
33
Da R nach Voraussetzung ein Hauptideal ist, wird (a) + (p) von einem Element c ∈ R erzeugt, also gilt (a) + (p) = (c) und insbesondere a ∈ (c) und p ∈ (c), also a = rc und p = sc f¨ ur geeignete Elemente r, s ∈ R. Da p irreduzibel ist, ist entweder s oder c eine Einheit in R. Im ersten Fall folgt c = s−1 p und damit a = rs−1 p, im Widerspruch zur Voraussetzung, dass p kein Teiler von a ist. Also bleibt nur die M¨ oglichkeit, dass c eine Einheit in R ist. Dies impliziert (c) = (a) + (p) = R, insbesondere gibt es e, f ∈ R mit ea + f p = 1. Multiplikation dieser Gleichung mit b liefert eab + f pb = b. Wegen p|ab folgt aus dieser Gleichung wie gew¨ unscht p|b. Frage 86 K¨ onnen Sie zeigen, dass sich in einem Hauptidealring R jedes Element a = 0, welches keine Einheit ist, als endliches Produkt von Primelementen schreiben l¨asst? Antwort: Ist a irreduzibel, dann ist a nach Frage 84 prim und somit insbesondere ein endliches Produkt von Primelementen. Wir k¨ onnen folglich im Weiteren davon ausgehen, dass a reduzibel ist und f¨ uhren den Beweis indirekt, nehmen also an, dass sich a nicht als endliches Produkt von Primelementen schreiben l¨ asst. Da a reduzibel ist, gilt a = a1 b1 f¨ ur zwei Nichteinheiten a1 und b1 , von denen nach der Voraussetzung sich mindestens einer ebenfalls nicht als endliches Produkt von Primelementen schreiben l¨ asst. Sei dies etwa a1 . Dann gilt aus denselben Gr¨ unden wie oben a1 = a2 b2 f¨ ur zwei Nichteinheiten a2 , b2 ∈ R, wobei man ohne Beschr¨ ankung der Allgemeinheit annehmen kann, dass sich a2 nicht als endliches Produkt von Primelementen schreiben l¨ asst. F¨ ahrt man auf diese Weise fort, erh¨ alt man eine Folge a = a0 , a1 , a2 , . . . ∈ R, ai+1 |ai . uhrt das auf eine echt Da ferner ai+1 und ai nicht miteinander assoziiert sind, f¨ aufsteigende Kette von Idealen (a) = (a0 ) (a1 ) (a2 ) · · · .
Nun ist leicht einzusehen, dass in diesem Fall auch b = i∈N (ai ) ein Ideal in R ist, und da R ein Hauptideal ist, gilt b = (b) f¨ ur ein b ∈ R. Nach Definition von b gibt es dann einen Index i0 mit b ∈ (ai0 ). Es folgt b = (b) ⊂ (ai0 ) ⊂ (ai ) ⊂ b f¨ ur alle i ≥ i0 . Also ist (ai0 ) = (ai ) f¨ ur i ≥ i0 , im Widerspruch dazu, dass die Kette der Ideale echt aufsteigend ist. Frage 87 K¨ onnen Sie zeigen, dass die Primfaktorzerlegung in einem Integrit¨atsring bis auf Assoziiertheit eindeutig ist, d. h. dass aus einer Gleichung der Form p1 · · · pr = q1 · · · qs
(∗)
f¨ ur Primelemente pi , qi ∈ R stets folgt, dass nach geeigneter Umnummerierung pi und qi assoziiert sind und insbesondere r = s gilt?
34
1 Algebraische Grundlagen
Antwort: Aus (∗) folgt p1 |q1 · · · qs , und da q1 , . . . , qs Primelemente sind, gibt es ein qi mit p1 |qi , also p1 = ǫ1 qi . Durch Umnummerierung kann man i = 1 erreichen und erh¨ alt damit die Gleichung p2 · · · pr = ǫ1 q2 · · · qs . Auf dieselbe Weise schließt man nun, dass p2 zu einem der Elemente q2 , . . . , qs assoziiert sein muss. Induktiv folgt daraus, dass pi zu qi f¨ ur i = 1, . . . , r assoziiert ist, wenn man die Elemente q1 , . . . , qs entsprechend umnummeriert. Insbesondere gilt s > r, und das Herausk¨ urzen aller pi liefert die Gleichung 1 = qr+1 · · · qs , welche zeigt, dass die Elemente qr+1 , . . . , qs s¨ amtlich Einheiten sind, im Widerspruch zu ihrer Eigenschaft als Primelemente. Frage 88 Wie ist der gr¨ oßte gemeinsame Teiler von Ringelementen r1 , . . . , rn ∈ R definiert? Antwort: Ein Element d ∈ R heißt gr¨ oßter gemeinsamer Teiler von r1 , . . . , rn , wenn gilt: (i) (ii)
d|ri f¨ ur i = 1, . . . , n, d. h. d ist ein gemeinsamer Teiler der ri . Ist a ein gemeinsamer Teiler der ri , so gilt d|a.
Man schreibt in diesem Fall d = ggT (r1 , . . . , rn ).
Frage 89 Seien a, b Elemente eines Integrit¨atsrings R und d = ggT (a, b). Dann gilt aR + bR = dR, insbesondere existieren r, s ∈ R mit ar + bs = d, wobei ggT (r, s) = 1 gilt. K¨ onnen Sie das beweisen? ur ein d′ ∈ R, und Antwort: Da R ein Hauptidealring ist, gilt aR + bR = d′ R f¨ ′ es ist d ein gemeinsamer Teiler von a und b und damit auch von d. Es gilt also d′ |d. Andererseits impliziert die Gleichung aR + bR = d′ R, dass as + br = d′ f¨ ur bestimmte Zahlen r, s ∈ R gilt, und hieraus folgt, dass jeder gemeinsame Teiler von a und b auch ein Teiler von d′ ist. Also gilt d|d′ und folglich d = d′ . Das beantwortet den ersten Teil der Frage. Ist d∗ ein gemeinsamer Teiler von r und s, dann folgt aus der Gleichung ar + bs = d, dass d∗ d ein Teiler von d ist. Folglich ist d∗ eine Einheit, und es gilt ggT (r, s) = 1. Frage 90 K¨ onnen Sie zeigen, dass ein Element p = 0 eines Hauptidealrings R genau dann ein Primelement ist, wenn der Restklassenring R/(p) ein K¨ orper ist?
1.5 Polynomringe
35
Antwort: Sei p ein Primelement. F¨ ur jedes a ∈ R \ (p) gilt dann ggT (a, p) = 1, und nach Frage 89 gibt es r, s ∈ R mit ra + sp = 1. F¨ ur die Restklasse [ar + sp] = [a][r] ∈ R/(p) gilt daher [r][a] = [1], d. h., [a] ist eine Einheit in R/(p). Damit ist R/(p) ein K¨ orper. Ist umgekehrt p kein Primelement, dann gilt p = ab f¨ ur zwei Nichteinheiten a, b ∈ R. In R/(p) gilt dann [a] = [0] und [b] = [0] aber [a][b] = [ab] = [p] = [0]. Der Ring R/(p) besitzt in diesem Fall Nullteiler und kann daher kein K¨ orper sein. Frage 91
Was ist eine Nullstelle eines Polynoms f ∈ R[X]?
Antwort: Ein Element a ∈ R heißt Nullstelle von f , wenn f (a) = 0 gilt, d. h. wenn f im Kern des Einsetzungshomomorphismus Fa : R[X] −→ R, p −→ p(a) liegt. Frage 92 Sei α ∈ K eine Nullstelle des Polynoms f ∈ K[X]. K¨ onnen Sie zeigen, dass dann ein Polynom g ∈ K[X] existiert, so dass f = (X − α) · g gilt? Antwort: Division mit Rest f¨ uhrt auf eine Gleichung f = (X − α) · g + r
(∗)
mit deg r < deg(X − α) = 1, also r ∈ K. Setzt man hier α f¨ ur X ein, so folgt wegen f (α) = 0 unmittelbar r = 0.
2 Vektorr¨ aume In diesem Kapitel wird der Vektorraumbegriff axiomatisch eingef¨ uhrt und einige grundlegende Begriffe erl¨ autert, etwa Unterraum“, Linearkombination“, lineare ” ” ” Unabh¨ angigkeit“ und Erzeugendensystem“. F¨ ur Vektoren eines allgemeinen Vek” torraums benutzen wir stets lateinische Buchstaben u, v, w, wobei die Buchstaben x, y, z in der Regel Vektoren des K n bezeichnen. F¨ ur Elemente des Grundk¨ orpers K benutzen wir in den meisten F¨ allen griechische Buchstaben α, β, γ, . . ..
2.1
Grundbegriffe
Frage 93
Wie lauten die Axiome f¨ ur einen K-Vektorraum?
Antwort: Sei K ein K¨ orper. Ein K-Vektorraum ist eine Menge V zusammen mit einer inneren Verkn¨ upfung V × V −→ V , (v, w) −→ v + w, genannt Addition“, ” und einer ¨ außeren Verkn¨ upfung K × V −→ V , genannt skalare Multiplikation“, ” f¨ ur die die folgenden Eigenschaften gelten: (V1) V ist eine abelsche Gruppe bez¨ uglich der Addition +“. ” (V2) F¨ ur alle v, w ∈ V und alle α, β ∈ K gilt: α · (β · v) = (αβ) · v (Assoziativit¨ at) (α + β) · v = α · v + β · v, (Distributivit¨ at) α · (v + w) = α · v + α · w (iii) 1 · v = v (i) (ii)
Frage 94 (i) (ii) (iii) (iv)
Wie erh¨alt man aus den Axiomen die folgenden Rechenregeln?
ur alle α ∈ K α · 0V = 0V f¨ 0K · v = 0V f¨ ur alle v ∈ V (−α) · v = α · (−v) = −α · v Aus α · v = 0V folgt α = 0K oder v = 0V
(Das Nullelement des K¨ orpers K und das des Vektorraums V werden hier durch einen entsprechenden Index unterschieden. Das wird aber nur an dieser Stelle so gemacht, im Weiteren wird auf den Unterschied nicht mehr durch eine spezielle Bezeichnungsweise hingewiesen.) Antwort: (i) Es gilt α · 0V + α · 0V = α · (0V + 0V ) = α · 0V . Daraus folgt α · 0V = 0K . (ii) Aus 0K · v + 0K · v = (0K + 0K ) · v = 0K · v folgt 0K · v = 0V .
2.1 Grundbegriffe
37
(iii) Mit (i) und (ii) gilt α · v + (−α) · v = (α + (−α)) · v = 0K · v = 0V und α · v + α · (−v) = α · (v + (−v)) = α · 0V = 0V .
Daraus folgt (iii).
Sei αv = 0V und α = 0K . Dann gilt
v = 1 · v = α−1 α · v = α−1 · (αv) = α−1 · 0V = 0V .
Frage 95
K¨ onnen Sie einige Beispiele f¨ ur Vektorr¨aume nennen?
Antwort: (i) Das Standardbeispiel ist der Raum K n = {x = (x1 , . . . , xn ) ; xi ∈ K},
bestehend aus allen n-Tupeln von Elementen aus K. Definiert man die Addition und die skalare Multiplikation komponentenweise durch (x1 , . . . , xn ) + (y1 , . . . , yn ) = (x1 + y1 , . . . , xn + yn ), α · (x1 , . . . , xn ) = (αx1 , . . . , αxn ),
so ergibt sich die G¨ ultigkeit der Vektorraumaxiome f¨ ur K n unmittelbar aus den K¨ orpereigenschaften von K. Aus denselben Gr¨ unden sieht man, dass auch die R¨ aume und
K[X] := {Folgen (xn )n∈N in K ; xi = 0 f¨ ur fast alle i} K N := {Folgen (xn )n∈N in K },
versehen mit komponentenweiser Addition und Skalarmultiplikation, jeweils KVektorr¨ aume sind. Man nennt K[X] den Polynomring u ¨ber K. Im Unterschied zu K n haben die R¨ aume K N und K[X] unendliche Dimension (vgl. Frage 115). (ii) Die Menge Abb(K, K) der Abbildungen K −→ K ist ein Vektorraum, wenn man die Addition und skalare Multiplikation durch (f + a)(x) = f (x) + g(x),
(αf )(x) = α · f (x)
f¨ ur f, g ∈ K K und α ∈ K definiert. In der Regel interessiert man sich nur f¨ ur bestimmte Teilmengen von Abb(K, K), die in den meisten interessanten F¨ allen ebenfalls eine Vektorraumstruktur tragen. Speziell f¨ ur K = R bilden z. B. die Mengen
C [a, b] := {stetige Funktionen auf [a, b]} C n [a, b] := {n-mal stetig differenzierbare Funktionen auf [a, b]} R [a, b] := {Regelfunktionen auf [a, b]}
Vektorr¨ aume.
38
2 Vektorr¨ aume
(iii) F¨ ur jede rein irrationale Zahl ξ sind die Mengen
Q(α) := {a + bξ ; a, b ∈ Q} √ Vektorr¨ aume u orper ¨ber Q. Beispielsweise ist die Menge Q( 2) als Erweiterungsk¨ von Q insbesondere ein Q-Vektorraum. Ein analoger Zusammenhang gilt f¨ ur alle Erweiterungsk¨ orper eines Grundk¨ orpers K (vgl. [4]). (iv) Die komplexen Zahlen C := {a + bi ; a, b ∈ R} sind insbesondere ein R-Vektorraum. (v) Jeder K¨ orper K besitzt die Struktur eines K-Vektorraums, indem man die Multiplikation als skalare Multiplikation deutet. Frage 96
Was versteht man unter einem Unterraum eines K-Vektorraums V ?
Antwort: Eine nichtleere Teilmenge U ⊂ V heißt Untervektorraum oder linearer Unterraum oder kurz Unterraum von V , wenn U zusammen mit der in V gegebenen Vektoraddition und skalaren Multiplikation ebenfalls einen Vektorraum bildet. Da die Assoziativ- und Distributivgesetze in U automatisch gelten, da sie in V gelten, ist eine Teilmenge U ⊂ V durch folgende drei Eigenschaften als Unterraum ausgezeichnet: (i) U = ∅ (ii) v, w ∈ U =⇒ v + w ∈ U (iii) v ∈ U =⇒ αv ∈ U f¨ ur alle α ∈ K. Man beachte, dass man aus (iii) sofort −1 · v = −v ∈ U sowie 0 · v = 0 ∈ U erh¨ alt. Beispiele: (a) Jeder Vektorraum enth¨ alt insbesondere sich selbst als Unterraum sowie den trivialen Unterraum U = {0}. (b) Die Menge U := {(x1 , x2 , x3 ) ; x1 , x2 , x3 ∈ K, x3 = 0} ⊂ K 3 bildet einen Unterraum von K 3 , die Menge X := {(x1 , x2 , x3 ) ; x1 , x2 , x3 ∈ K, x3 = 1} ⊂ K 3 allerdings nicht, da die Summe zweier Elemente aus X nicht mehr in X liegt. (c) F¨ ur α1 , α2 , β ∈ K ist U := {(x1 , x2 ) ∈ K ; α1 x1 + α2 x2 = β}
2.1 Grundbegriffe
39
genau dann ein Unterraum, wenn β = 0 gilt. In diesem Fall enth¨ alt U n¨ amlich den Nullvektor, und f¨ ur x = (x1 , x2 ) und y = (y1 , y2 ) und λ ∈ K folgt α1 (x1 + y1 ) + α2 (x2 + y2 ) = (α1 x1 + α2 x2 ) + (α1 y1 + α2 y2 ) = 0 + 0 = 0 α1 λx1 + α2 λx2 = λ(α1 x1 + α2 x2 ) = λ · 0 = 0, also x + y ∈ U und λx ∈ U . F¨ ur β = 0 ist U jedoch kein Unterraum, denn U enth¨ alt in diesem Fall nicht den Nullvektor. (d) Ist A eine reelle m × n-Matrix (vgl. Kapitel 3), dann ist die L¨ osungsmenge U := {x ∈ K n ; A · x = 0} des zugeh¨ origen homogenen Systems ein Unterraum von K n . (e) Im Raum Abb(R, R) der Abbildungen R −→ R hat man die folgende aufsteigende Kette von Unterr¨ aumen
Rd [X] ⊂ R[X] ⊂ C 1 (R) ⊂ C (R) ⊂ R (R) ⊂ Abb(R, R). Dabei bezeichnet Rd [X] die Menge aller Polynome mit Grad ≤ d, C 1 (R) die Menge der differenzierbaren reellen Funktionen, C (R) die Menge der stetigen reellen Funktionen und R (R) die Menge der Regelfunktionen in R. Frage 97
Ist die Menge U := {(x1 , x2 ) ∈ R2 ; x1 · x2 ≥ 0}
ein Unterraum von R2 ? Antwort: Die Vektoren v = (1, 2) und w = (−2, −1) liegen beide in U , trotzdem gilt v + w = (−1, 1) ∈ U . Also ist U kein Unterraum. Frage 98 K¨ onnen Sie zeigen, dass der Durchschnitt (auch unendlich vieler) Unterr¨aume eines Vektorraums V wieder ein Unterraum von V ist? Gilt dasselbe auch f¨ ur die Vereinigung von Unterr¨aumen? Antwort: Sei (Ui )i∈I ein System von Unterr¨ aumen aus V , wobei I irgendeine Indexmenge bezeichnet. Der Durchschnitt i∈I Ui enth¨ alt den Nullvektor, da dieser in allen Ui liegt. Ferner gilt f¨ ur v, w ∈ i∈I Ui u, w ∈ Ui
f¨ ur alle i ∈ I,
und folglich, da die Ui Unterr¨ aume sind, v + w ∈ Ui
und αv ∈ Ui
f¨ ur alle i ∈ I,
40
2 Vektorr¨ aume
also v+w ∈
i∈I
Ui
und αv ∈
Ui .
i∈I
Somit ist ∩i∈I Ui ein Unterraum von V . Dagegen ist die Vereinigung U1 ∪U2 zweier Unterr¨ aume U1 , U2 ∈ V in der Regel kein Unterraum. Sei zum Beispiel U1 = {(x1 , x2 ) ∈ K 2 ; x1 = 0},
und
U2 = {(x1 , x2 ) ∈ K 2 ; x2 = 0},
dann liegen die Vektoren u1 = (0, 1) und u2 = (1, 0) beide in U1 ∪ U2 , nicht aber deren Summe u1 + u2 = (1, 1). Frage 99 Was versteht man unter einer Linearkombination eines endlichen Systems (v1 , . . . , vr ) von Vektoren eines K-Vektorraums V ? Antwort: Unter einer Linearkombination der Vektoren v1 , . . . , vr ∈ V versteht man jede Summe der Form α1 v1 + · · · + αr vr , wobei αi f¨ ur i = 1, . . . , r beliebige Elemente des Grundk¨ orpers K sind. Da V gegen¨ uber skalarer Multiplikation und Addition von Vektoren abgeschlossen ist, ist jede Linearkombination von Vektoren aus V damit selbst ein Element aus V . Frage 100 Was versteht man unter einer Linearkombination von Vektoren eines unendlichen Systems von Vektoren aus V ? Antwort: Eine Linearkombination eines unendlichen Systems S ist eine Linearkombination eines endlichen Teilsystems von S, d. h. eine Linearkombination von endlich vielen Vektoren aus S. Man betrachte zum Beispiel das unendliche System S = (1, X, X 2 , X 3 , . . .) des Polynomrings K[X]. Jede Linearkombination aus S besitzt dann die Gestalt α0 + α1 X + α2 X 2 + · · · + αr X r mit αi ∈ K und r ∈ N.
Frage 101 Was versteht man unter dem von einem System S = (v1 , . . . , vr ) von Vektoren in V aufgespannten Unterraum? Wieso handelt es sich dabei u ¨berhaupt um einen linearen Unterraum? Antwort: Der von S aufgespannte Unterraum ist die Menge aller Linearkombinationen von Vektoren aus S. Er wird mit span(S) bezeichnet. Erg¨ anzend definiert man span(∅) := {0}.
2.1 Grundbegriffe
41
Beispiel: F¨ ur die Vektoren e1 = (1, 0, 0) und e2 = (0, 1, 0) aus K 3 gilt span(e1 , e2 ) = {(x1 , x2 , x3 ) ∈ K 3 ; x3 = 0}. Um zu zeigen, dass span(S) Unterraum ist, betrachte man zwei Vektoren v, w ∈ span(S). Es gilt v = α1 v1 + · · · + αr vr ,
w = β1 v1 + · · · + βr vr
mit bestimmten αi , βi ∈ K, also −v = (−α1 )v1 + · · · + (−αr )vr v + w = (α1 + β1 )v1 + · · · + (αr + βr )vr
∈ span(S), ∈ span(S).
Damit ist insbesondere 0 ∈ span(S). Weiter gilt f¨ ur jedes λ ∈ K λv = (λα1 )v1 + · · · + (λαr )vr ∈ span(S). Damit ist span(S) abgeschlossen gegen¨ uber skalarer Multiplikation und der Addition von Vektoren. Außerdem gelten in span(S) die Assoziativ- und Distributivgesetze, da sie in V gelten. Also ist span(S) ⊂ V ein Vektorraum, folglich ein Unterraum von V . Frage 102 Sei S = (v1 , v2 , . . .) ein (eventuell unendliches) System von Vektoren aus V . Durch welche Eigenschaft l¨asst sich der Unterraum span(S) charakterisieren? Antwort: Es gilt: span(S) ist der kleinste Unterraum von V , der alle Vektoren aus S enth¨ alt. Genau bedeutet das span(S) = {U ⊂ V ; U Unterraum mit S ⊂ U }. Beweis: Sei
W :=
{U ⊂ V ; U Unterraum mit S ⊂ U }.
Die Menge W bildet nach Frage 98 einen Unterraum von V . Ebenso ist span(S) nach Frage 101 ein Untervektorraum. Da S ⊂ span(S) gilt, folgt W ⊂ span(S). Umgekehrt erh¨ alt man aber auch span(S) ⊂ W , denn jedes v ∈ span(S) l¨ asst sich als Linearkombination v = α1 v1 + · · · + αr vr f¨ ur ein r ∈ N und bestimmten α1 , . . . , αr ∈ K schreiben. Diese Linearkombination ist in jedem Unterraum U mit S ⊂ U und damit auch in W enthalten. Frage 103 Was versteht man unter einem Erzeugendensystem eines Vektorraums V ? Wann heißt ein Vektorraum V endlich erzeugt?
42
2 Vektorr¨ aume
Antwort: Ein System S von Vektoren aus V heißt Erzeugendensystem von V , wenn V = span(S) gilt. V heißt endlich erzeugt, wenn es ein Erzeugendensystem von V gibt, das nur endlich viele Elemente enth¨ alt. Frage 104 Wann heißt ein System S = (v1 , . . . , vr ) von Vektoren eines KVektorraums V linear unabh¨ angig bzw. linear abh¨ angig? Antwort: S heißt linear unabh¨ angig, wenn f¨ ur alle α1 , . . . , αr ∈ K gilt: α1 v1 + · · · + αr vr = 0 ⇐⇒ α1 = · · · = αr = 0. S heißt linear abh¨ angig, wenn S nicht linear unabh¨ angig ist, wenn es also eine nichttriviale Linearkombination des Nullvektors mit Vektoren aus V gibt. Zum Beispiel ist das System der beiden Funktionen f1 : x −→ ex und f2 : x −→ e−x im Vektorraum C (R) linear unabh¨ angig, dagegen sind die drei Funktionen (f1 , f2 , sinh) wegen 1 x 1 −x e − e − sinh x = 0 2 2
f¨ ur alle x ∈ R
linear abh¨ angig. Frage 105
Wann heißt ein unendliches System S von Vektoren linear unabh¨angig?
Antwort: Ein unendliches System S = (v1 , v2 , . . .) heißt linear unabh¨ angig, wenn jedes endliche Teilsystem linear unabh¨ angig ist. Das bedeutet, dass f¨ ur jedes r ∈ N gilt: α1 v1 + · · · + αr vr = 0 ⇐⇒ α1 = α2 = · · · = αr = 0. In diesem Sinne ist z. B. das System der Polynome (p0 , p1 , p2 , . . .) mit pi (x) = X i
f¨ ur alle i ∈ N
linear unabh¨ angig in R[X]. F¨ ur jedes r ∈ N folgt n¨ amlich aus α0 p0 + α1 p1 + · · · + αr pr = α0 + α1 X + · · · + αr X r = 0 notwendigerweise α0 = α1 = · · · = αr = 0. Frage 106 2?
Was bedeutet die lineare Abh¨angigkeit bei Systemen der L¨ange 1 bzw.
Antwort: Ein System S = (v) ist linear abh¨ angig genau dann, wenn v = 0 gilt, ein System S = (v, w) genau dann, wenn v = α · w mit einem α ∈ K gilt.
2.2 Basis und Dimension
43
Frage 107 K¨ onnen Sie folgenden Zusammenhang begr¨ unden: Ein System S = (v1 , . . . , vr ) ist linear unabh¨angig genau dann, wenn f¨ ur k = 1, . . . , r gilt: vk ∈ span(v1 , . . . , vk−1 ) (dabei ist span(∅) = {0})?
Antwort: Beweis mit Induktion nach r. Der Fall r = 1 ist klar, da {v1 } genau dann linear unabh¨ angig ist, wenn v1 = 0, also v1 ∈ span(∅) gilt. Sei daher r ≥ 2 und die Behauptung f¨ ur k < r schon gezeigt. Angenommen, die Vektoren (v1 , . . . , vr ) sind linear abh¨ angig. Dann gibt es α1 , . . . , αr mit αi = 0 f¨ ur mindestens ein i ∈ {1, . . . , r}, so dass gilt α1 v1 + · · · + αr vr = 0,
(∗)
also α1 v1 + · · · + αr−1 vr−1 = −αr vr . Ist αr = 0, dann liefert die Division durch −αr eine Darstellung von vr als Linearkombination von v1 , . . . , vr−1 , in diesem Fall gilt also vr ∈ span(v1 , . . . , vr−1 ). Ist αr = 0, dann sind bereits die Vektoren v1 , . . . , vr−1 linear abh¨ angig. Nach Induktionsvoraussetzung l¨ asst sich vr−1 als Linearkombination von v1 , . . . , vr−2 darstellen, und indem man diese in (∗) substituiert, erh¨ alt man β1 v1 + · · · + βr−2 vr−2 + αr vr = 0, mit bestimmten βi ∈ K, die nicht alle verschwinden. Das System (v1 , . . . , vr−2 , vr ) der L¨ ange r − 1 ist demnach linear abh¨ angig. Nach Induktionsvoraussetzung gilt vr ∈ span(v1 , . . . , vr−2 ) und damit erst recht vr ∈ span(v1 , . . . , vr−1 ). Das zeigt insgesamt die Implikation v1 , . . . , vr linear abh¨ angig =⇒ vr ∈ span(v1 , . . . , vr−1 ). Sei umgekehrt vr ∈ span(v1 , . . . , vr−1 ). Dann gilt α1 v1 + · · · + αr−1 vr−1 = vr , f¨ ur bestimmte αi ∈ K, und durch Addition von −vr auf beiden Seiten der Gleichung erh¨ alt man eine nichttriviale Linearkombination des Nullvektors.
2.2
Basis und Dimension
Der Begriff der Basis ist von fundamentaler Bedeutung f¨ ur die Lineare Algebra. In der Tat ergeben sich die meisten Zusammenh¨ ange der Linearen Algebra als eine Folge der Tatsache, dass Vektorr¨ aume u ¨berhaupt eine Basis besitzen. Auf
44
2 Vektorr¨ aume
dem Begriff der Basis gr¨ undet sich auch der Dimensionsbegriff. Außerdem erm¨ oglicht die Auswahl einer Basis, Vektoren eines n-dimensionalen Vektorraums durch n-Tupel von Elementen aus K zu beschreiben und lineare Abbildungen zwischen endlich-dimensionalen Vektorr¨ aumen durch Matrizen. Die wichtigsten S¨ atze in diesem Kapitel sind der Basisauswahlsatz, der Basiserg¨ anzungssatz sowie der Austauschsatz von Steinitz. Frage 108
Was versteht man unter einer Basis in einem K-Vektorraum V ?
Antwort: Eine Basis ist ein System S von Vektoren aus V mit den beiden Eigenschaften (i) (ii)
S ist ein Erzeugendensystem von V , also V = span(S). S ist linear unabh¨ angig.
Beispiele: (a) Eine Basis des K n ist gegeben durch die Standardbasis En = (e1 , . . . , en ) mit e1 = (1, 0, 0 . . . , 0), e2 = (0, 1, 0, . . . , 0), . . . , en = (0, 0, . . . , 0, 1). (b) Eine Basis des Vektorraums K[X] = { i∈N αi X i ; αi = 0 f¨ ur fast alle i } der Polynome in K ist gegeben durch das unendliche System (1, X, X 2 , . . .). √ √ (c) Die Elemente 1 und 2 bilden eine Basis des Q-Vektorraums Q( 2). (d) (1, i) ist eine Basis von C, betrachtet als R-Vektorraum.
Frage 109 Wie lassen sich Basen in einem endlich erzeugten Vektorraum V = {0} charakterisieren? aquivalent: Antwort: Folgende Aussagen sind f¨ ur B = (v1 , . . . , vn ) ¨ B ist eine Basis von V . B ist ein unverl¨ angerbares (maximales) linear unabh¨ angiges System in V , d. h., f¨ ugt man zu B irgendeinen Vektor v ∈ V hinzu, so ist das neue System linear abh¨ angig. (iii) B ist ein unverk¨ urzbares (minimales) Erzeugendensystem von V , d. h., l¨ asst man einen Vektor weg, so ist das neue System kein Erzeugendensystem mehr. (iv) Jeder Vektor aus V l¨ asst sich eindeutig als Linearkombination von Vektoren aus B schreiben. (i) (ii)
Beweis: (i) =⇒ (ii): Sei v ∈ V beliebig. Da B als Basis insbesondere ein Erzeugendensystem von V ist, l¨ a sst sich v als Linearkombination der Basisvektoren n darstellen, es gilt also v = i=1 αi vi mit geeigneten αi ∈ K. Subtraktion von v auf beiden Seiten der Gleichung liefert dann v−
n i=1
αi vi = 0.
2.2 Basis und Dimension
45
Da zumindest der Koeffizient bei v in dieser Linearkombination nicht verschwindet, bedeutet das, dass die Vektoren v, v1 , . . . , vn linear abh¨ angig sind. (ii) =⇒ (iii): Sei B ein maximal linear unabh¨ angiges System. W¨ are B kein Erzeugendensystem, dann g¨ abe es einen Vektor v ∈ V mit v ∈ span(B) und somit w¨are B ∪ {v} ebenfalls linear unabh¨ angig, im Widerspruch zur Maximalit¨ at von B. Da andererseits B als maximal linear unabh¨ angiges System insbesondere linear unabh¨ angig ist, ist B \ {vi } f¨ ur jeden Basisvektor vi ∈ B kein Erzeugendensystem mehr. Daraus folgt die Minimalit¨ atseigenschaft von B. (iii) =⇒ (iv): Ist B ein minimales Erzeugendensystem, so l¨ asst sich jeder Vektor aus v ∈ V als Linearkombination der Vektoren aus B Angenommen, die darstellen. n n Darstellung sei nicht eindeutig, es gelte also v = i=1 αi vi = i=1 βi vi , wobei wir ohne Beschr¨ ankung der Allgemeinheit αn = βn annehmen k¨ onnen. Dann folgt vn = −
n−1 i=1
αi − βi vi , αn − βn
also
vn ∈ span(v1 , . . . , vn−1 ).
i F¨ ur jede Linearkombination λ1 v1 + · · · λn vn gilt dann mit α′ := − ααni −β −βn
λ1 v1 + · · · λn vn =
n−1
(λi + λn α′ )vi .
i=1
Das heißt, (v1 , . . . , vn−1 ) ist ebenfalls ein Erzeugendensystem von V , im Widerspruch dazu, dass B minimal ist. (iv) =⇒ (i): Unter der Voraussetzung ist B zumindest ein Erzeugendensystem von V , und aus der Eindeutigkeit der Linearkombinationen folgt, dass sich insbesondere der Nullvektor nur durch eine einzige Linearkombination darstellen l¨ asst, n¨ amlich durch die, in der alle Koeffizienten verschwinden. Daraus folgt die lineare Unabh¨ angigkeit von B. Frage 110
Was besagt der Basisauswahlsatz?
Antwort: Der Basisauswahlsatz lautet: Jedes Erzeugendensystem E = (v1 , . . . , vm ) eines endlich-dimensionalen Vektorraums V enth¨ alt ein Teilsystem, das eine Basis von V ist. Beweis: Da E endlich ist, enth¨ alt E ein minimales Erzeugendensystem. Dieses muss dann eine Basis von V sein. Frage 111 nitz?
Was besagt der Basiserg¨ anzungssatz oder Austauschsatz von Stei-
Antwort: Der Satz besagt: Jedes linear unabh¨ angige System S = (u1 , . . . , ur ) von Vektoren eines endlich erzeugten Vektorraums V l¨ asst sich durch Hinzunahme von Vektoren eines Erzeugendensystems E = (v1 , . . . , vm ) zu einer Basis von V erg¨ anzen.
46
2 Vektorr¨ aume
Beweis: Ausgehend von S0 := S konstruiere man linear unabh¨ angige Systeme S1 , . . . , Sm durch die rekursive Vorschrift Si−1 falls vi ∈ span(Si−1 ) Si = Si−1 ∪ {vi } sonst ur i = 1, . . . , m linear unabh¨ angig. Sm Nach Konstruktion sind alle Systeme Si f¨ ist aber auch ein Erzeugendensystem von V , da span(Sm ) alle Vektoren des Erzeugendensystems E enth¨ alt. Also ist Sm eine Basis von V und der Satz damit bewiesen. Will man beispielsweise die linear unabh¨ angigen Vektoren v1 = (1, 1, 0, 0) und 4 v2 = (0, 1, 1, 0) des R mit Vektoren aus der Standardbasis zu einer Basis B des R4 erg¨anzen, so liefert der obige Algorithmus S0 = (v1 , v2 ), S1 = (v1 , v2 , e1 ) = S2 = S3 , S4 = (v1 , v2 , e1 , e4 ) = B.
Frage 112 K¨ onnen Sie begr¨ unden, warum jeder endlich erzeugte K-Vektorraum V eine Basis besitzt? Antwort: Man wende den Basisauswahlsatz auf ein endliches Erzeugendensystem E von V an. Die so erhaltene Basis B ⊂ E ist dann in jedem Fall sogar endlich. Frage 113 Sei V ein endlich erzeugter K-Vektorraum, E = (v1 , . . . , vm ) ein Erzeugendensystem und B = (u1 , . . . , ur ) eine Basis von V . Wieso gilt dann r ≤ m?
asst sich nach dem BasisAntwort: Das linear unabh¨ angige System (u2 , . . . , ur ) l¨ erg¨ anzungssatz durch die Hinzunahme von i1 Vektoren aus E zu einer Basis B1 von V erg¨ anzen, wobei notwendigerweise i1 ≥ 1 gilt. Analog l¨ asst sich das linear unabh¨ angige System B1 \ {u2 } zu einer Basis B2 erg¨ anzen, indem man i2 weitere Vektoren aus E hinzuf¨ ugt. Auf diese Weise fortfahrend konstruiert man eine Folge B1 , . . . , Br von Vektorraumbasen mit |B1 | = r − 1 + i1 |B2 | = r − 2 + i1 + i2 ··· |Br | = i1 + i2 + · · · + ir .
Wegen Br ⊂ E gilt i1 + · · · + ir ≤ m und wegen ij ≥ 1 f¨ ur j = 1, . . . , r folgt daraus r ≤ m wie gew¨ unscht. Frage 114 Warum haben je zwei Basen eines endlich erzeugten K-Vektorraums dieselbe L¨ange? ange n bzw. m. Da B2 insAntwort: Seien B1 und B2 zwei Basen von V der L¨ besondere ein Erzeugendensystem ist, gilt m ≥ n nach Frage 113. Aus demselben Grund gilt aber auch n ≤ m, also insgesamt n = m.
2.2 Basis und Dimension
Frage 115
47
Wie ist die Dimension eines K-Vektorraums definiert?
Antwort: Wenn V endlich erzeugt ist, haben alle Basen nach Frage 114 dieselbe L¨ange. Diese L¨ ange nennt man die Dimension von V (dim V ). Ist V nicht endlich erzeugt, so setzt man dim V = ∞ und sagt, V sei unendlich-dimensional. Frage 116 Wie ist der Rang rg(v1 , . . . , vr ) eines endlichen Systems (v1 , . . . , vr ) von Vektoren aus V definiert? Antwort: Es ist rg(v1 , . . . , vn ) = dim span(v1 , . . . , vn ).
Frage 117 K¨ onnen Sie zeigen, dass es in einem nicht endlich erzeugten KVektorraum linear unabh¨angige Systeme beliebiger L¨ange gibt? Antwort: Angenommen, der Zusammenhang gilt nicht. Dann gibt es ein linear unabh¨ angiges System maximaler L¨ ange in V . Dies w¨ are dann eine Basis von V , also insbesondere ein endliches Erzeugendensystem von V , im Widerspruch dazu, dass V unendlichdimensional ist. Frage 118 Teilmenge
Man betrachte zum Raum der stetigen Funktionen aus R die folgende S = {fa : R −→ R ; fa (x) = x + a}.
K¨ onnen Sie alle maximal linear unabh¨angigen Teilmengen von S bestimmen? Antwort: F¨ ur a = b sind die beiden Funktionen fa und fb linear unabh¨ angig, denn aus α1 fa + βfb = 0 folgt αfa (x) + βfb (x) = α(x + a) + β(x + a) = (α + β)x + αa + βb = 0
(∗)
f¨ ur alle x ∈ R. Einsetzen der speziellen Werte x = 0 und x = 1 liefert αa + βb = α + β + αa + βb = 0, also β = −α und damit α(a − b) = 0, was wegen a = b dann α = 0 und schließlich auch β = 0 impliziert. Das zeigt die lineare Unabh¨ angigkeit der Funktionen fa , fb . Je drei paarweise verschiedene Funktionen fa , fb , fc aus S sind jedoch linear abh¨ angig. Wie oben f¨ uhrt αfa + βfb + γfc = 0 auf (α + β + γ)x + αa + βb + γc = 0
f¨ ur alle x ∈ R,
was auf jeden Fall f¨ ur die L¨ osungen des Gleichungssystems α + β + γ = αa + βb + γc = 0 erf¨ ullt ist. Dieses System aus zwei Gleichungen in drei Unbekannten besitzt aber stets eine nichttriviale L¨ osung. (Was sich unmittelbar aus der Theorie linearer Gleichungssysteme ergibt, auf elementarem“ Weg aber auch durch expli” zite Konstruktion der L¨ osungen wie im ersten Teil der Antwort verifiziert werden kann.)
48
2 Vektorr¨ aume
Insgesamt folgt, dass die maximal linear unabh¨ angigen Systeme aus S genau diejenigen sind, die zwei verschiedene Funktionen aus S enthalten. Frage 119 Ist B eine Basis eines K-Vektorraums V , wieso gilt dann |V | = max{|B|, |K|}?
Antwort: Die Ungleichung |V | ≥ |B| ist klar. Um |V | ≥ |K| zu beweisen, w¨ ahle man einen beliebigen Vektor v ∈ B. Wegen v = 0 gilt αv = βv f¨ ur aα = b. Es folgt K = Kv ⊂ V , also |K| ≤ |V |. Zum Beweis der anderen Ungleichung betrachte man die f¨ ur jeden Vektor v ∈ V k(v) eindeutige Darstellung v = i=1 αi vi und ordne dem Vektor v die Menge Ψ(v) := {(α1 , v1 ), . . . , (αk(v) , vk(v) )} ⊂ K × B
ur zu. Damit ist Ψ eine injektive Abbildung V −→ Pfin (K × B), wobei Pfin (M ) f¨ eine beliebige Menge M die Menge der endlichen Teilmengen von M bezeichnet. Ist M unendlich, so gilt der allgemeine Zusammenhang |Pfin (M )| = |M |, und damit erh¨ alt man insgesamt |V | ≤ |Pfin (K × B)| = |K × B| = max{|K|, |B|}.
Frage 120 Ist B eine Basis des Raums RR der Funktionen R −→ R und C eine Basis der Raums C (R) der stetigen Funktionen auf R, dann gilt |B| > |R| und |C| = |R|. K¨ onnen Sie das begr¨ unden?
Antwort: Die Abbildung Ψ : RR −→ P (R) mit Ψ(f ) = {x ∈ R ; f (x) = 0} ist surjektiv. Also gilt |RR | ≥ |P (R)| > |R|. Da |RR | = max{|R|, |B|} nach Frage 119 gilt, folgt |B| > |R|. Eine stetige Funktion ist durch ihre Werte in Q bereits eindeutig festgelegt. Daher ist die Abbildung
C (R) −→ RQ ,
f −→ f |Q
injektiv. Es folgt |C (R)| ≤ |RQ | = |RN | = |R|. Zusammen mit |C (R)| = max{|R|, |C|} folgt daraus die Behauptung. Frage 121 Sei V ein endlich-dimensionaler Vektorraum und U ⊂ V ein Unterraum. K¨ onnen Sie dim U ≤ dim V zeigen und dass dim U = dim V nur f¨ ur U = V gilt? Antwort: Sei dim V = n. Angenommen, dim U > n. Dann gibt es ein linear unabh¨ angiges System der L¨ ange n + 1 von Vektoren aus U . Das System dieser Vektoren ist nat¨ urlich auch in V linear unabh¨ angig, im Widerspruch zu Antwort 109 (d). Also ist U endlich erzeugt mit dim U ≤ dim V . Der Zusatz folgt aus dem Basiserg¨ anzungssatz.
2.3 Summen von Vektorr¨ aumen
49
Frage 122 Seien U, W ⊂ V Unterr¨aume eines K-Vektorraums V . Unter welcher Bedingung ist auch U ∪ W ein Unterraum von V ?
Antwort: Bez¨ uglich der Vereinigung von Unterr¨ aumen gilt: U ∪W ist genau dann ein Unterraum, wenn U ⊂ W oder W ⊂ U gilt. Hier ist die R¨ uckrichtung“ der ” ¨ Aquivalenz offensichtlich, da U ∪ W in diesem Fall einem der beiden Unterr¨ aume U oder W entspricht. Gilt umgekehrt U ⊂ W und W ⊂ U , dann w¨ ahle man Vektoren u ∈ U \ W und w ∈ W \ U . Der Vektor u + w kann dann nicht in U enthalten sein, denn aus u + w = u′ ∈ U folgt w = u − u′ ∈ U , im Widerspruch zur Voraussetzung. Analog folgt u + w ∈ W , insgesamt also u + w ∈ U ∪ W . Daher kann U ∪ W in diesem Fall kein Vektorraum sein.
2.3
Summen von Vektorr¨ aumen
Die Antworten zu den Fragen 98 und 122 zeigen, dass man durch die bloße mengentheoretische Vereinigung zweier Unterr¨ aume in der Regel keinen neuen Unterraum erh¨ alt. Um gegebene Unterr¨ aume U und W zu einem gr¨ oßeren Raum zusammenzufassen, der ebenfalls eine lineare Struktur tr¨ agt, bildet man statt dessen die Summe U + W , welche gerade dem Erzeugnis der Menge U ∪ W entspricht. Frage 123 V definiert?
Wie ist die Summe U + W zweier Unterr¨aume eines K-Vektorraums
Antwort: Man definiert U + W = span(U ∪ W ). Damit besitzt jedes Element aus v ∈ U + W eine Darstellung v = u + w mit u ∈ U und w ∈ W . Diese Darstellung braucht im Allgemeinen jedoch nicht eindeutig zu sein. Frage 124 Wie lautet die Dimensionsformel f¨ ur Unterr¨ aume? K¨ onnen Sie eine Beweisskizze geben? Antwort: Die Dimensionsformel lautet: F¨ ur endlich-dimensionale Untervektorr¨ aume U, W ⊂ V gilt dim(U + W ) = dim U + dim W − dim(U ∩ W ). Beweis: Sei (v1 , . . . , vm ) eine Basis von U ∩ W . Gem¨ aß dem Basiserg¨ anzungssatz kann man diese zu einer Basis BU = (v1 , . . . , vm , u1 , . . . , ur ) von U bzw. einer Basis BW = (v1 , . . . , vm , w1 , . . . , ws ) von W erg¨ anzen. Durch Zusammenfassen von BU und BW erh¨ alt man B := (v1 , . . . , vm , u1 , . . . , ur , w1 , . . . , ws ).
50
2 Vektorr¨ aume
Da das System B genau dim U +dim W −dim(U ∩B) Vektoren enth¨ alt, gen¨ ugt es zu zeigen, dass B eine Basis von U +W ist. Offensichtlich ist B ein Erzeugendensystem von U + W , also muss nur noch die lineare Unabh¨ angigkeit nachgewiesen werden. Dazu betrachte man α v + · · · + αm vm + β1 u1 + · · · + βr ur + γ1 w1 + · · · + γs ws = 0. 1 1
=: v =: −v
(∗)
Der Vektor v l¨ asst sich sowohl als Linearkombination von Vektoren aus BU als auch von Vektoren aus BW darstellen und liegt folglich in U ∩ W . Daher muss er sich bereits als Linearkombination der Vektoren v1 , . . . , vm darstellen lassen, also ist (∗) ¨ aquivalent zu ′ α1′ v1 + · · · + αm vm + γ1 w1 + · · · + γs ws = 0
mit eindeutig bestimmten αi′ ∈ K. Das ist eine Linearkombination der Basisvektoren aus BW . Da BW linear unabh¨ angig ist, folgt daraus γi = 0 f¨ ur i = 1, . . . , s. Setzt man dieses Ergebnis in (∗) ein, so liefert die linearen Unabh¨ angigkeit von BU , dass auch die restlichen Koeffizienten in (∗) verschwinden. Das zeigt die lineare Unabh¨ angigkeit von B und damit insgesamt die Behauptung. Frage 125 Wann heißt die Summe U + W zweier Unterr¨aume eines KVektorraums V direkt? Antwort: Eine Summe U +W heißt direkt, geschrieben U ⊕W , wenn U ∩W = {0} gilt. Das ist ¨ aquivalent dazu, dass jedes Element v ∈ U ⊕ W eine eindeutige Darstellung v = u + w mit u ∈ U und w ∈ W besitzt. Hat man n¨ amlich eine Basis (u1 , . . . , ur ) von U und eine Basis (w1 , . . . , wm ) von W , so impliziert U ∩W = {0}, dass das System (u1 , . . . , ur , w1 , . . . , wm ) linear unabh¨ angig und damit eine Basis von U + W ist. Jeder Vektor v ∈ U + W hat dann eine eindeutige m r m Darstellung r v = i=1 αi ui + i=1 βi wi mit u = i=1 αi ui ∈ U und w = i=1 βi wi ∈ W . Frage 126 Wann gilt f¨ ur zwei Unterr¨aume U und W eines endlichdimensionalen K-Vektorraums dim(U + W ) = dim(U ) + dim(W )?
Antwort: Nach der Dimensionsformel aus Frage 124 gilt die Formel genau dann, wenn dim(U ∩ W ) = 0, also U ∩ W = {0} gilt bzw. genau dann, wenn die Summe direkt ist. Frage 127 Was ist ein Komplement eines Unterraums U ⊂ V in V ? Ist ein Komplement, falls es existiert, eindeutig bestimmt? Antwort: Ein Komplement eines Unterraums U ⊂ V ist ein Unterraum W ⊂ V derart, dass V = U ⊕ W gilt.
2.3 Summen von Vektorr¨ aumen
51
Ein Komplement ist nicht eindeutig bestimmt. Sei V zum Beispiel zweidimensional und U der von einem Vektor u ∈ V aufgespannte Unterraum. F¨ ur zwei von ′ u linear unabh¨ angige Vektoren w und w gilt dann V = U ⊕ Kw = U ⊕ Kw′ , aber Kw = Kw′ , sofern w = w′ ist.
3 Lineare Abbildungen und Matrizen In der Linearen Algebra bewegt man sich immer innerhalb von Vektorr¨ aumen, also Mengen mit einer bestimmten algebraischen Struktur. Wie meistens in der Mathematik geh¨ ort zu einer bestimmten, durch strukturelle Eigenschaften ausgezeichneten Klasse von Mengen aber auch eine bestimmte Klasse von Abbildungen, die die Struktur ebendieser Mengen respektieren. Im Fall der Linearen Algebra sind das die linearen Abbildungen oder Vektorraumhomomorphismen. Eine lineare Abbildung F : V −→ W zwischen zwei Vektorr¨ aumen V und W u agt alle vektorraumspezifischen Relationen, die zwischen den Vektoren aus ¨bertr¨ V bestehen, auf deren Bilder in W . So gilt z. B. v ∈ span(v1 , . . . , vr ) =⇒ F (v) ∈ span F (v1 ), . . . , F (vr ) v1 , . . . , vr linear abh¨ angig =⇒ F (v1 ), . . . , F (vr ) linear abh¨ angig w = α1 v1 + · · · + αr vr =⇒ F (w) = α1 F (v1 ) + · · · + αr F (vr ).
Das letzte Beispiel ist besonders aufschlussreich. Da sich jede Relation, die zwischen den Elementen eines Vektorraums besteht, durch den Begriff der Linearkombination ausdr¨ ucken l¨ asst, gen¨ ugt es, f¨ ur eine lineare Abbildung zu fordern, dass sie bestehende Gleichungen zwischen Linearkombinationen u agt, dass ¨bertr¨ also f¨ ur v1 , . . . , vr ∈ V und α1 , . . . , αr ∈ K stets gilt: F (α1 v1 + · · · + αr vr ) = α1 F (v1 ) + · · · + αr F (vr ) Dies ist bereits in der k¨ urzeren Forderung F (α1 v1 + α2 v2 ) = α1 F (v1 ) + α2 F (v2 )
f¨ ur alle v1 , v2 ∈ V und α1 , α2 ∈ K
enthalten. F (α2 v2 )
α1 v1 + α 2 v2
α1 F (v1 ) + α2 F (v2 )
F α2 v2 F (v2 ) v2 v1
α1 v 1
F (v1 )
F (α1 v1 )
Da sich alle Elemente eines Vektorraums als Linearkombinationen der Basisvektoren darstellen lassen, verwundert es nicht, dass lineare Abbildungen die Eigenschaft besitzen, bereits durch ihre Werte auf den Basisvektoren eindeutig bestimmt zu sein, was ein große rechnerische und theoretischen Tragweite besitzt.
3.1 Grundbegriffe
3.1
53
Grundbegriffe
Wir f¨ uhren in diesem Abschnitt die wesentlichen Grundbegriffe ein und leiten daraus die ersten elementaren Eigenschaften linearer Abbildungen ab. Hier und im Folgenden bezeichnen wir lineare Abbildungen stets große lateinische Buchstaben F, G. Ist von allgemeinen, nicht unbedingt linearen, Abbildungen die Rede, dann benutzen wir kleine Buchstaben f, g, h. Frage 128 Wann heißt eine Abbildung F : V −→ W zwischen K-Vektorr¨aumen V und W K-linear oder K-Homomorphismus? Antwort: Eine Abbildung F : V −→ W heißt K-linear bzw. K-Homomorphismus, wenn f¨ ur alle v, w ∈ V und alle α ∈ K gilt (i) (ii)
F (v + w) = F (v) + F (w). F (αv) = α · F (v).
Die beiden Bedingungen lassen sich zusammenfassen, indem man f¨ ur v, w ∈ V und α, β ∈ K fordert F (αv + βw) = αF (v) + βF (w).
Frage 129 K¨ onnen Sie die Begriffe Isomorphismus, Epimorphismus, Endomorphismus und Automorphismus erl¨autern? Antwort: Alle vier Begriffe bezeichnen Spezialf¨ alle linearer Abbildungen. Eine lineare Abbildung F : V −→ W zwischen K-Vektorr¨ aumen V und W heißt Isomorphismus, wenn F bijektiv ist, Epimorphismus, wenn F surjektiv ist, Endomorphismus, wenn F eine Selbstabbildung ist, also V = W gilt, Automorphismus, wenn V = W gilt und F bijektiv ist.
Frage 130
K¨ onnen Sie einige Beispiele linearer Abbildungen nennen?
Antwort: Seien V, W Vektorr¨ aume. (a) Die identische Abbildung id : V −→ V ist wegen id(v + v ′ ) = v + v ′ = id(v) + id(v ′ ) id(αv) = αv = α · id(v) ein Homomorphismus, aufgrund der Bijektivit¨ at sogar ein Isomorphismus.
54
3 Lineare Abbildungen und Matrizen
(b) Die Nullabbildung o : V −→ W mit o(v) = 0 f¨ ur alle v ∈ V ist K-linear: o(v + v ′ ) = 0 = 0 + 0 = o(v) + o(v ′ ) o(αv) = 0 = α · 0 = α · o(v). (c) F¨ ur einen Unterraum U ⊂ V ist die Inklusionsabbildung U ֒→ V ein Vektorraumhomomorphismus. (d) Die komplexe Konjugation : C −→ C mit x + iy −→ x − iy ist R-linear, allerdings nicht C-linear. F¨ ur α ∈ C \ R gilt n¨ amlich αz = α · z = αz. Das ist u ¨brigens der Grund, weshalb die komplexe Konjugation keine holomorphe Funktion ist (vgl. [6], S. 265). (e) Die linearen Abbildungen R −→ R sind genau die Abbildungen des Typs x −→ ax mit a ∈ R, also genau diejenigen Abbildungen, deren Graph eine Gerade durch den Ursprung beschreibt. (f) Zu m, n ∈ N seien m × n Elemente αij ∈ K mit 1 ≤ i ≤ m und 1 ≤ j ≤ n gegeben. Die Abbildung f : K n −→ K m , die jeden Vektor (x1 , . . . , xn ) ∈ K n auf den Vektor n n a1j xj , . . . , αmj xj j=1
j=1
abbildet, ist eine K-lineare Abbildung.
(h) F¨ ur ein Intervall [a, b] bezeichne C ([a, b]) den R-Vektorraum der stetigen Funktionen und C 1 ([a, b]) der stetig differenzierbaren Funktionen auf [a, b]. Dann sind die Abbildungen x int : C ([a, b]) −→ C 1 ([a, b]), f −→ F mit F (x) = f (t) dt, a
diff : C 1 ([a, b]) −→ C ([a, b]),
f −→ f ′
R-lineare Abbildungen zwischen unendlich-dimensionalen Vektorr¨aumen.
Frage 131 Ist die Abbildung F : R2 −→ R mit F (x1 , x2 ) = x1 − x2 linear? Wie verh¨alt es sich mit G : R2 −→ R, definiert durch G (x1 , x2 ) = x1 x2 ?
Antwort: Die Abbildung F ist linear. F¨ ur zwei Vektoren x = (x1 , x2 ) und y = (y1 , y2 ) sowie α ∈ R gilt F (x + y) = F (x1 + y1 , x2 + y2 ) = (x1 + y1 ) − (x2 + y2 ) = (x1 − x2 ) + (y1 − y2 ) = F (x) + F (y) F (αx) = F (αx1 , αx2 ) = αx1 − αx2 = α(x1 − x2 ) = αF (x1 , x2 ) = αF (x).
3.1 Grundbegriffe
55
Dagegen ist G nicht linear. Es ist n¨ amlich G(x+y) = G (x1 +y1 , x2 +y2 ) = (x1 +y1 )(x2 +y2 ) = x1 x2 +y1 y2 = G(x)+G(y). Ist α ∈ R, so folgt die Nichtlinearit¨ at von G auch aus G(αx) = G (αx1 , αx2 ) = α2 x1 x2 = αx1 x2 = αG(x).
Frage 132 Warum ist die Zusammensetzung (Verkettung) linearer Abbildungen wieder linear? Antwort: Seien G : U −→ V und F : V −→ W linear. Dann gilt f¨ ur alle Vektoren u, u′ ∈ U F ◦ G(u + u′ ) = F G(u + u′ ) = F G(u) + G(u′ ) (wegen der Linearit¨ at von G) ′ = F G(u) + F G(u ) (wegen der Linearit¨ at von F ) = F ◦ G(u) + F ◦ G(u′ ).
Nach demselben Muster zeigt man f¨ ur α ∈ R F ◦ G(αu) = F G(αu) = F αG(u) = αF G(u) = α(F ◦ G)(u).
Also ist F ◦ G linear.
Frage 133 Ist F : V −→ W linear und bijektiv, warum ist dann auch die Umkehrabbildung G : W −→ V linear und bijektiv? Antwort: Die Umkehrabbildung einer bijektiven Abbildung ist immer bijektiv Um die Linearit¨ at zu zeigen, betrachte man w, w′ ∈ W und v, v ′ ∈ V mit F (v) = w und F (v ′ ) = w′ . Dann folgt wegen G ◦ F = id und der Linearit¨ at von F G(w + w′ ) = G F (v) + F (v ′ ) = G F (v + v ′ ) = v + v ′ = G(w) + G(w′ ). Weiter erh¨ alt man f¨ ur alle α ∈ K G(αw) = G αF (v) = G F (αv) = αv = αG(w).
Frage 134 Warum ist die Zusammensetzung von Isomorphismen wieder ein Isomorphismus? Antwort: Die Zusammensetzung zweier Isomorphismen ist als Zusammensetzung zweier bijektiver Abbildungen bijektiv und außerdem linear nach Frage 132.
56
3 Lineare Abbildungen und Matrizen
Frage 135 erkl¨art?
Wie ist der Kern, wie das Bild einer linearen Abbildung F : V −→ W
Antwort: Man definiert ker F := F −1 (0) := {v ∈ V ; F (v) = 0} ⊂ V im F := F (V ) := {w ∈ W ; es gibt ein v ∈ V mit w = F (v)} ⊂ W.
Frage 136 Warum besitzen der Kern und das Bild einer K-linearen Abbildung F : V −→ W stets eine Vektorraumstruktur? Antwort: Seien v, v ′ ∈ ker F und α ∈ K. Dann gilt F (v + v ′ ) = F (v) + F (v ′ ) = 0 + 0 = 0, also v + v ′ ∈ ker F F (αv) = α · F (v) = α · 0 = 0, also αv ∈ ker F , Somit ist ker F ein Untervektorraum von V . Liegen w, w′ ∈ W im Bild von F , dann gibt es Vektoren v, v ′ ∈ V mit w = F (v) und w = F (v ′ ). Mit α ∈ K folgt w + w′ = F (v) + F (v ′ ) = F (v + v ′ ) ∈ im F αw = α · F (v) = F (αv) ∈ im F, also ist im F ein Untervektorraum von W . Frage 137
K¨ onnen Sie zur linearen Abbildung F : R2 −→ R,
(x1 , x2 )T −→ x1 − x2
den Kern und das Bild angeben? Antwort: Wegen F (x1 , x2 )T = 0 ⇐⇒ (x1 − x2 ) = 0 ⇐⇒ x1 = x2
folgt
ker F = {(x1 , x2 )T ∈ R2 ; x1 = x2 } = R · (1, 1)T .
Zu jedem a ∈ R gibt es mit (a, 0) zumindest ein Urbild unter F (es gibt nat¨ urlich noch viel mehr). Daher ist im F = R. Frage 138 Wie l¨asst sich die Surjektivit¨at bzw. Injektivit¨at einer linearen Abbildung F : V −→ W mittels der Eigenschaften von im F bzw. ker F charakterisieren? Antwort: Es gilt: (i) (ii)
F surjektiv ⇐⇒ im F = W , F injektiv ⇐⇒ ker F = {0}.
3.1 Grundbegriffe
57
Aussage (i) ist klar: F ist surjektiv genau dann, wenn f¨ ur jedes w ∈ W ein v ∈ V mit F (v) = w existiert, was gerade bedeutet, dass jedes w ∈ W im Bild von F liegt. Zu Aussage (ii): Ist F injektiv, so kann nat¨ urlich nur ein Element auf die Null abgebildet werden. Das zeigt die Hinrichtung“. Ist umgekehrt ker F = {0}, dann ” folgt aus F (v) = F (v ′ ), also F (v − v ′ ) = 0, dass v − v ′ = 0 und damit v = v ′ gilt. D. h., F ist injektiv. Was besagt der Basisbildersatz“ f¨ ur lineare Abbildungen? ” Antwort: Der Satz besagt: Frage 139
Seien V, W Vektorr¨ aume, F : V −→ W linear, sowie (v1 , . . . , vn ) eine Basis von V . Dann ist die Abbildung F durch die Bilder F (v1 ), . . . , F (vn ) der Basisvektoren bereits eindeutig bestimmt. Beweis: F¨ ur beliebiges v ∈ V gibt es eindeutig bestimmte Skalare α1 , . . . , αn ∈ K mit v = α1 v1 + · · · + αn vn . F¨ ur den Wert F (v) unter einer linearen Abbildung F : V −→ W gilt dann F (v) = F (α1 v1 + · · · + αn vn ) = α1 F (v1 ) + · · · + αn F (vn ). Der Wert F (v) ist also f¨ ur jedes v ∈ V durch die Bilder F (v1 ), . . . , F (vn ) der Basisvektoren bereits eindeutig bestimmt. Frage 140 Gibt es eine lineare Abbildung F : R2 −→ R2 mit F (2, 1)T = (1, 1)T , F (1, 1)T = (2, 1)T , F (1, 2)T = (1, 2)T ?
Antwort: Die Vektoren v1 = (2, 1)T und v2 = (1, 1)T bilden eine Basis von R2 . Nach dem Basisbildersatz ist F durch die Werte f¨ ur v1 und v2 bereits eindeutig festgelegt, sofern F linear ist. In diesem Fall erhielte man wegen (1, 2)T = −v1 + 3 · v2 F (1, 2)T = −F (v1 ) + 3 · F (v2 ) = −(1, 1)T + 3 · (2, 1)T = (5, 2)T = (1, 2)T .
Daraus folgt, dass keine lineare Abbildung mit den angegebenen Eigenschaften existiert. Frage 141 Mit HomK (V, W ) bezeichnet man die Menge aller K-linearen Abbildungen V −→ W . Wie l¨asst sich auf HomK (V, W ) eine Vektorraumstruktur definieren?
58
3 Lineare Abbildungen und Matrizen
Antwort: F¨ ur zwei Abbildungen F, G ∈ HomK (V, W ) und α ∈ K definiere man die Vektorraumaddition sowie die skalare Multiplikation durch F + G : V −→ W, αF : V −→ W,
(F + G)(v) = F (v) + G(v) (αF )(v) = α · F (v).
(i) (ii)
Dann sind F + G und αF K-linear wegen (F + G)(v + v ′ ) = F (v + v ′ ) + G(v + v ′ ) = F (v) + F (v ′ ) + G(v) + G(v ′ ) = (F + G)(v) + (F + G)(v ′ ), (F + G)(αv) = F (αv) + G(αv) = αF (v) + αG(v) = α F (v) + G(v) = α(F + G)(v).
Die Abbildungen F + G und αF geh¨ oren damit ebenfalls zu HomK (V, W ), also handelt es sich bei HomK (V, W ) zusammen mit den beiden Operationen (i) und (ii) um einen K-Vektorraum. Frage 142
Warum ist HomK (K, W ) (kanonisch) isomorph zu W ?
ur jedes α ∈ K gilt dann F (α) = α·F (1), und Antwort: Sei F ∈ HomK (K, W ). F¨ damit ist F bereits durch den Wert F (1) ∈ W eindeutig bestimmt. Umgekehrt l¨asst sich zu jedem w ∈ W eine lineare Abbildung G ∈ HomK (K, W ) allein durch die Festsetzung G(1) = w definieren. Die Abbildung Φ : HomK (K, W ) −→ W,
F −→ F (1)
ist also bijektiv. Sie ist ferner linear, denn f¨ ur F, G ∈ HomK (K, W ) und α, β ∈ K hat man wegen der Linearit¨ at von F und G Φ(αF + βG) = (αF + βG)(1) = αF (1) + βG(1) = αΦ(F ) + βΦ(G). Insgesamt handelt es sich bei F also um einen Isomorphismus. Frage 143 W?
Was versteht man unter dem Rang einer linearen Abbildung F : V −→
Antwort: Der Rang von F ist definiert als die Dimension des Bildes von F rg F := dim im F. Beispielsweise besitzt eine konstante Abbildung V −→ W mit v −→ w f¨ ur ein w ∈ W und alle v ∈ V den Rang 1. F¨ ur die identische Abbildung id : V −→ V gilt rg id = dim V , und f¨ ur die Nullabbildung o : V −→ {0} ist rg o = 0.
3.1 Grundbegriffe
59
Frage 144 Was besagt die Dimensionsformel (Rangformel) f¨ ur lineare Abbildungen? K¨ onnen Sie eine Beweisskizze geben? Antwort: Die Dimensionsformel liefert einen Zusammenhang zwischen der Dimension des Kerns und der des Rangs einer linearen Abbildung. Sie lautet: F¨ ur K-Vektorr¨ aume V, W und K-lineare Abbildungen f : V −→ W gilt dim V = dim ker F + dim im F.
Beweis: Ist einer der beiden R¨ aume im F oder ker F unendlich-dimensional, so auch V , und in diesem Fall gilt die Formel. Man kann also annehmen, dass ker F und im F beide von endlicher Dimension sind. Man w¨ ahle eine Basis (v1 , . . . , vr ) von ker F . Nach dem Basiserg¨ anzungssatz kann diese zu einer Basis (v1 , . . . , vr , w1 , . . . , ws ) von V erg¨ anzt werden, wobei s + r = n = dim V gilt. Die Vektoren F (w1 ), . . . , F (ws ) bilden dann ein Erzeugendensystem von im F , denn f¨ ur v ∈ V hat man eine s r Darstellung v = i=1 αi′ vi + j=1 αj wj mit eindeutig bestimmten αi′ , αj ∈ K. Daraus folgt F (v) =
r i=1
αi′ f (vi ) +
=0
s
αj F (wj ) =
j=1
s
αj F (wj ).
j=1
Somit ist im F = span(F (w1 ), . . . , F (ws )). Die Dimensionsformel folgt also, wenn jetzt noch die lineare Unabh¨ angigkeit der F (wi ) gezeigt werden kann. In diesem Fall gilt dann n¨amlich dim im F = s = n − r = dim V − dim ker F . Sei also α1 F (w1 ) + · · · + αs F (ws ) = 0. Dann folgt aufgrund der Linearit¨ at von F α1 w1 + · · · + αs ws ∈ ker F, also α1 w1 + · · · + αs ws = β1 v1 + · · · + βr vr f¨ ur eindeutig bestimmte βi ∈ R. Man erh¨ alt −β1 v1 − · · · − βr vr + α1 w1 + · · · + αs ws = 0, und daraus folgt α1 = · · · = αs = β1 = · · · = βr = 0, da (v1, . . . , vr , w1 , . . . , ws) eine Basis von V ist. Damit ist die lineare Unabh¨ angigkeit von F (w1 ), . . . , F (ws ) und insgesamt die Dimensionsformel bewiesen.
60
3 Lineare Abbildungen und Matrizen
Frage 145 K¨ onnen Sie folgenden Zusammenhang begr¨ unden? Ist V oder W endlich-dimensional, so gilt f¨ ur F ∈ HomK (V, W ) stets rg F ≤ min(dim V, dim W ). Antwort: Wegen im F ⊂ W gilt stets rg F = dim im F ≤ dim W . Es muss im Folgenden also nur noch rg F ≤ dim V nachgewiesen werden. Ist W endlich-dimensional und V unendlich-dimensional, dann gilt erst recht rg F < V , und die Ungleichung ist in diesem Fall richtig. F¨ ur endlich-dimensionales V folgt rg F ≤ dim V aus dem Basisbildersatz, demzufolge im F ein Erzeugendensystems der L¨ ange dim V besitzt. Also gilt dim im F = rg F ≤ dim V aufgrund von Frage 113. Frage 146 dim V ?
Folgt aus dim ker F < ∞ und dim im F < ∞ die Endlichkeit von
Antwort: Ja, denn dim V = dim ker F + dim im F < ∞.
Frage 147 Sei dim V = dim W < ∞. K¨ onnen Sie zeigen, dass die folgenden Aussagen ¨aquivalent sind? (i) F ist surjektiv,
(ii) F ist injektiv,
(iii) F ist bijektiv.
Mit anderen Worten: Eine lineare Abbildung zwischen zwei Vektorr¨aumen derselben Dimension ist bereits dann bijektiv, wenn sie injektiv oder surjektiv ist. Antwort: Ist F surjektiv, dann gilt dim im F = dim W = dim V , und damit folgt aus der Dimensionsformel dim ker F = 0, also ker F = {0}, d. h., F ist injektiv nach Frage 138. Ist F injektiv, dann gilt dim ker F = 0, und zwar wieder aufgrund von Frage 138. Die Dimensionsformel liefert dann dim W = dim V = dim im F . Daraus folgt die Surjektivit¨at von F . ¨ Damit ist die Aquivalenz (i) ⇐⇒ (ii) gezeigt, aus der unmittelbar folgt, dass beide Aussagen mit (iii) ¨ aquivalent sind. Frage 148 Sei dim V = dim W = n. Warum ist F genau dann ein Isomorphismus, wenn rg F = n gilt? Antwort: Ist F bijektiv, dann gilt ker F = {0}, und aus der Dimensionsformel folgt rg F = dim V = dim W = n. Gilt umgekehrt rg F = n, dann liefert die Dimensionsformel dim ker F = 0. Also ist F injektiv und aufgrund von Frage 147 auch bijektiv, also ein Isomorphismus.
3.2 Quotientenvektorr¨ aume und affine Unterr¨ aume
3.2
61
Quotientenvektorr¨ aume und affine Unterr¨ aume
¨ Das Aquivalent zu den Nebenklassen der Gruppentheorie bilden bei den Vektorr¨ aumen die affinen Unterr¨ aume. In der Euklidischen Geometrie handelt es sich dabei um Punkte, Geraden und Ebenen. Dies sind selbst in der Regel keine Unterr¨ aume, sondern entstehen aus diesen durch Parallelverschiebung entlang eines Vektors. Frage 149 Was ist ein affiner Unterraum eines Vektorraums V ? K¨ onnen Sie einige Beispiele nennen? Antwort: Man nennt eine Teilmenge A ⊂ V einen affinen Unterraum, wenn A leer ist oder es ein Element a ∈ V und einen linearen Unterraum U ⊂ V gibt, so dass gilt A = a + U := {a + u ; u ∈ U }. aume gerade die Punkte, Geraden und Ebenen, im Im R3 sind die affinen Unterr¨ R2 analog die Punkte und Geraden. Die Gerade x2 = x1 + 1 etwa ist der um den Vektor (0, 1)T parallel verschobene Unterraum R · (1, 1)T ⊂ R2 . Ein weiteres wichtiges Beispiel f¨ ur affine Unterr¨ aume sind die L¨ osungsmengen nicht-homogener Gleichungssysteme (s. Frage 223). Frage 150 Wie ist die Dimension eines affinen Unterraums definiert? Was versteht man unter einer affinen Gerade bzw. einer affinen Ebene? Antwort: Die Dimension eines affinen Unterraums v + U ist dim U . Man nennt einen affinen Unterraum A Gerade, wenn A die Dimension 1 und Ebene, wenn A die Dimension 2 hat. Frage 151
Was ist eine affine Hyperebene? K¨ onnen Sie ein Beispiel nennen?
Antwort: Ist V ein n-dimensionaler Vektorraum und U ⊂ V ein Unterraum der Dimension n − 1, so ist jeder affine Unterraum v + U eine Hyperebene in V . Beispiele f¨ ur Hyperebenen sind die Geraden im R2 und die Ebenen im R3 . Frage 152 Wann heißen zwei affine Unterr¨aume A1 = v1 + U1 und A2 = v2 + U2 parallel? Wann ist eine affine Gerade zu einer affinen Ebene parallel? Antwort: A1 und A2 heißen parallel, wenn U1 ⊂ U2 oder U2 ⊂ U1 gilt. Ist A1 eine affine Gerade, A2 eine affine Ebene, so ist A1 parallel zu A2 , wenn U1 ein Unterraum von U2 ist. Frage 153 K¨ onnen Sie zeigen: Ist U ⊂ V ein Unterraum, dann gilt f¨ ur v, w ∈ V entweder v + U = w + U oder (v + U ) ∩ (w + U ) = ∅? (Anschaulich: Zwei nicht identische parallele affine Unterr¨aume besitzen keinen Schnittpunkt.)
62
3 Lineare Abbildungen und Matrizen
Antwort: Sei a ∈ (v + U ) ∩ (w + U ). Dann gibt es u1 , u2 ∈ U mit a = v + u1 = w + u2 . Daraus folgt zun¨ achst v = w + u2 − u1 . Ist nun b ein beliebiges Element aus v + U , dann gilt b = v + u3 f¨ ur ein u3 ∈ U , also b = w + u2 − u1 + u3 ∈ w + U . Das zeigt v + U ⊂ w + U , und auf dieselbe Weise folgt w + U ⊂ v + U . Das zeigt die Behauptung. Frage 154 Sei U ein Unterraum und V /U := {v + U ; v ∈ V }. Wie kann man dieser Menge eine K-Vektorraumstruktur aufpr¨agen? Wie nennt man den Raum V /U ? Antwort: Setzt man versuchsweise (v + U ) + (w + U ) = (v + w) + U,
α(v + U ) = αv + U,
(∗)
so erf¨ ullt V /U zusammen mit diesen Verkn¨ upfungen formal alle Vektorraumaxiome. Die Frage w¨ are damit beantwortet, vorausgesetzt man kann zeigen, dass durch (∗) u ¨berhaupt eine wohldefinierte Abbildung gegeben ist, was in diesem Fall bedeutet, dass die Definition der Summe und skalaren Multilplikation unabh¨ angig von der Auswahl der Repr¨ asentanten sind. Es muss also gezeigt werden, dass aus v + U = v ′ + U und w + U = w′ + U stets (v + w) + U = (v ′ + w′ ) + U und αv + U = αv ′ + U folgt, wie es in dem Beispiel in der Abbildung der Fall ist. (v + w) + U = (v ′ + w′ ) + U
w + U = w′ + U v ′ + w′ v + U = v′ + U
v+w v′
v w w′
Gelte also v + U = v ′ + U und w + U = w′ + U . Dann folgt v ′ = v + u1 und w′ = w + u2 f¨ ur bestimmte u1 , u2 ∈ U . Es folgt dann (v ′ + w′ ) + U = (v + u1 + w + u2 ) + U = (v + w) + u1 + u2 + U = (v + w) + U und αv ′ + U = α(v + u1 ) + U = αv + αu1 + U = αv + U . Damit sind die Verkn¨ upfungen durch (∗) in der Tat wohldefiniert und V /U damit ein K-Vektorraum. Man nennt V /U Quotientenvektorraum.
3.2 Quotientenvektorr¨ aume und affine Unterr¨ aume
63
Frage 155 Sei F : V −→ W eine lineare Abbildung und w ∈ W . Was versteht man unter der Faser von F u ¨ber w? Antwort: Die Faser ist die Urbildmenge F −1 (w) des Vektors w unter F : F −1 (w) := {v ∈ V ; F (v) = w}. Die Faser von F u ¨ber w ist genau dann nichtleer, wenn w im Bild von F liegt. Frage 156
Wieso wird V durch die Fasern von F in disjunkte Teilmengen zerlegt?
Antwort: Jedes v ∈ V wird auf genau ein Element F (v) = w ∈ W abgebildet und liegt daher in genau einer Faser, n¨ amlich in F −1 (w). Frage 157 In welchem Zusammenhang stehen die Fasern von F mit den affinen Unterr¨aumen von V ? Antwort: Es gilt: F¨ ur v ∈ V ist die Faser von F u ¨ber F (v) gerade der affine Unterraum v + ker F . Es gilt also v + ker F = F −1 (F (v)). Ist F insbesondere surjektiv, dann entsprechen die Fasern von F auf bijektive Weise den affinen Unterr¨ aumen v + U mit U = ker F . Beweis: Sei U := ker F . F¨ ur v + u ∈ v + U gilt F (v + u) = F (v), also v + u ∈ F −1 (F (v)) und damit v + U ⊂ F −1 (F (v)). Ist umgekehrt v ′ ∈ F −1 (F (v)), dann gilt F (v ′ ) = F (v), also F (v ′ −v) = 0 bzw. v ′ −v ∈ U . Es folgt v ′ = v +u mit einem u ∈ U und schließlich v ′ ∈ v + U . Das zeigt insgesamt die erste Behauptung. Die zweite folgt daraus unmittelbar, denn f¨ ur ein surjektives F liegt u ¨ber jedem w = F (v) genau eine nichtleere Faser, und diese ist nach dem ersten Teil von der Gestalt v + U . Frage 158
Wie ist die nat¨ urliche Projektion πU : V −→ V /U definiert?
Antwort: F¨ ur v ∈ V definiert man πU (v) = v + U. Damit ist πU ein surjektiver Homomorphismus mit ker πU = U . Frage 159 Sie
Sei F : V −→ W linear w ∈ im F und u ∈ F −1 (w) beliebig. K¨ onnen F −1 (w) = u + ker F = {u + v ; v ∈ ker F }
zeigen?
64
3 Lineare Abbildungen und Matrizen
Antwort: Sei u′ ∈ F −1 (w). Dann gilt F (u′ ) = F (u), also u′ − u ∈ ker F und damit u′ = u + v f¨ ur ein v ∈ ker F . Gilt umgekehrt u′ = u + v mit v ∈ ker F , dann ist F (u′ − u) = 0 und folglich F (u′ ) = F (u) = w, also u′ ∈ F −1 (w). Frage 160
Wie lautet der Faktorisierungssatz?
Antwort: Der Satz lautet: Sei F : V −→ W surjektiv und linear mit ker F = U . Sei ferner U ′ ein Komplement von U in V , also ein linearer Unterraum, mit dem V = U ⊕U ′ gilt. Dann ist die Einschr¨ ankung F |U ′ : U ′ −→ W ein Isomorphismus und mit der Projektion π : V = U ⊕ U ′ −→ U ′ ,
u + u′ −→ u′
auf den zweiten Summanden gilt F = F |U ′ ◦ π. In Form eines Diagramms hat man F
V = U ⊕LU ′ LL LL L π LLL L%
U′
/W }> } }} }} F |U ′ } }
Beweis: Die erste Aussage (ii) ergibt sich daraus, dass F |U ′ erstens U ′ surjektiv auf W abbildet und zweitens wegen ker F |U ′ = {0} injektiv ist. Damit folgt die zweite Aussage unmittelbar aufgrund der Konstruktion von π. Frage 161
Wie lautet der Homomorphiesatz f¨ ur Vektorr¨aume?
Antwort: Der Satz lautet: Sei U ⊂ V ein linearer Unterraum eines K-Vektorraums V und sei π : V −→ V /U der kanonische Epimorphismus oder allgemeiner ein Epimorphismus mit ker π ⊂ U . Dann gibt es zu jeder K-linearen Abbildung F : V −→ W eine lineare Abbildung F : V /U −→ W , so dass das unten stehende Diagramm kombetatiert F
/W V C CC z< z CCπ zz CC zzF C! z z V /U
Es ist F genau dann injektiv, wenn U = ker F gilt und genau dann surjektiv, wenn F surjektiv ist.
3.2 Quotientenvektorr¨ aume und affine Unterr¨ aume
65
Beweis: Die Eindeutigkeit ist klar. Um die Existenz zu zeigen beachte man, dass f¨ ur zwei Vektoren v, v ′ mit π(v) = π(v ′ ) gilt v ′ − v ∈ U ⊂ ker F und daher v ′ = v +u mit einem u ∈ ker F . Es folgt dann F (v ′ ) = F (v +u) = F (v), und daher ist die durch F : V /U −→ W,
v −→ F (v)
gegebene Abbildung wohldefiniert, wobei mit v jeweils irgendein Urbild von v ∈ V /U unter π gemeint ist. Mit dieser Definition ist die Beziehung F = F ◦ π erf¨ ullt. Weiter muss gezeigt werden, dass F K-linear ist. Dazu seien v, v ′ ∈ V und v, v ′ entsprechende Urbilder in V sowie α ∈ K. Dann gilt F (v + v ′ ) = F (v + v ′ ) = F (v) + F (v ′ ) = F (v) + F (v) F (αv) = F (αv) = α · F (v) = α · F (v). Damit ist auch die K-Linearit¨ at von F nachgewiesen. Es bleiben noch die beiden Zusatzbehauptungen zu zeigen. Es gilt F (v) = F (v) = 0 genau dann, wenn v ∈ ker F gilt. Ist U = ker F , so folgt daraus v = 0, also ist F injektiv. Ist umgekehrt F injektiv, so gilt die Gleichung F (v) = 0 dann und nur dann, wenn v in ker F liegt. In diesem Fall muss dann ker F = U gelten. Dass F genau dann surjektiv ist, wenn F dies ist, ergibt sich unmittelbar aus der Konstruktion von F . Frage 162 Der Homomorphiesatz besitzt als Spezialfall ein f¨ ur die Anwendungen wichtiges Korollar, den sogenannten Isomorphiesatz. K¨ onnen Sie diesen noch einmal herleiten? Antwort: Der Isomorphiesatz lautet: Sei F : V −→ W eine K-lineare Abbildung. Dann induziert F in nat¨ urlicher Weise einen Isomorphismus V / ker F ≃ im F , also einen Isomorphismus V / ker F ≃ W , falls F surjektiv ist. In Form eines Diagramms erh¨ alt man F / im F V HH t9 HH t t HHπ tt HH tt F H# t t V / ker F
Frage 163 K¨ onnen Sie zeigen, dass sich jeder affine Unterraum A = v + U von V als Faser einer linearen Abbildung F : V −→ W realisieren l¨asst? Antwort: Ist A = ∅, so betrachte man etwa die Nullabbildung o : V −→ W mit o(v) = 0 f¨ ur alle v ∈ V . Dann gilt A = ∅ = o−1 (1). Ist A = ∅, dann betrachte man den kanonischen Epimorphismus π : V −→ V /U . Es gilt A = v + U = π −1 π(v) , also ist A eine Faser von π.
66
3 Lineare Abbildungen und Matrizen
Frage 164 Sei A eine Teilmenge eines K-Vektorraums V . K¨ onnen Sie zeigen, dass A genau dann ein affiner Unterraum von V ist, wenn f¨ u r jeweils endlich Elemente r viele r a0 , . . . , ar und Koeffizienten α1 , . . . , αr mit i=1 αi = 1 stets folgt i=1 αi ai ∈ A?
Antwort: Sei A ein affiner Unterraum von V . Nach Frage 163 existiert dann ein ur ein Homomorphismus V −→ W in einen Vektorraum W mit A = F −1 (w) f¨ Element w ∈ W . Es folgt r r r αi ai = αi F (ai ) = αi · w = w. F i=1
Also gilt
i=0
r
i=0
αi ai ∈ F −1 (w) = A.
i=1
Um die Umkehrung zu zeigen, betrachte man zu beliebigem a0 ∈ A die Menge ΔA := {a − a0 ; a ∈ A}. Wir zeigen, dass ΔA ein Untervektorraum von V ist. Zum einen ist jedenfalls 0 ∈ ΔA und damit ΔA = ∅. Sind nun a, b ∈ ΔA, so ist a = a1 − a0 und b = a2 − a0 mit a1 , a2 ∈ A. Es folgt a + b = (a1 − a0 + a2 ) − a0 ∈ ΔA. F¨ ur α ∈ K gilt aufgrund der Voraussetzung αa1 + (1 − α)a0 ∈ A, da die Koeffizienten in dieser Summe sich zu 1 summieren. Also hat man, wiederum aufgrund der Voraussetzung, αa = (αa1 + (1 − α)a0 ) − a0 ∈ ΔA. Folglich ist ΔA ein Untervektorraum und damit A = a0 + ΔA ein affiner Unterraum von V .
3.3
Matrizen
Nach dem zentralen Basisbildersatz , der in Frage 139 behandelt wurde, ist eine lineare Abbildung F : V −→ W durch ihre Werte auf den Vektoren einer Basis von V bereits eindeutig festgelegt. Ist V endlich-dimensional, dann existiert eine endliche Basis B = (v1 , . . . , vn ), und F ist ausreichend durch die n Werte F (v1 ), F (v2 ), . . . , F (vn ) beschrieben. Ist auch W endlich-dimensional, dann lassen sich die n Vektoren F (vj ) ∈ W bez¨ uglich einer Basis B ′ = (w1 , . . . , wm ) von W als Linearkombination F (vj ) = α1j w1 + · · · + αmj wm
3.3 Matrizen
67
darstellen, wobei die Koeffizienten αij ∈ K f¨ ur i = 1, . . . , m eindeutig bestimmt sind. Aus diesen beiden Eigenschaften zusammen schließt man, dass s¨ amtliche Informationen u orperelementen ¨ber die lineare Abbildung F in den m · n K¨ αij ,
f¨ ur 1 ≤ m ≤ i, j ≤ n
bereits eindeutig codiert sind. Diese kann man auch u ¨bersichtlich in einem rechteckigen Schema, einer sogenannten m × n-Matrix eintragen. Das sieht dann so aus: ⎛ ⎞ a11 · · · a1n ⎜ .. .. ⎟ ⎝ . . ⎠ am1
···
amn
Matrizen beschreiben also lineare Abbildungen. Den Anwendungen linearer Abbildungen entsprechen dann bestimmte kalk¨ ulm¨ aßige Operationen an Matrizen, die sich auf Additionen und Multiplikationen innerhalb des Gundk¨ orpers K reduzieren. Matrizen repr¨ asentieren daher die eher rechnerische Seite“ der Linearen ” Algebra, weswegen sie in konkreten Anwendungen eine außerdordentliche Rolle spielen. Wichtig ist aber zu betonen, dass eine Matrix eine lineare Abbildung immer nur im Hinblick auf bestimmte gegebene Vektorraumbasen des Definitionsund Wertebereichs beschreibt. Frage 165 Wie kann man den Begriff einer m × n-Matrix in einem K¨ orper K formal definieren? Antwort: Eine m × n-Matrix mit Koeffizienten kann man formal als eine Abbildung A : {1, 2, . . . , m} × {1, 2, . . . , n} −→ K, (i, j) −→ aij definieren. Man nennt den Index i den Zeilenindex, den Index j den Spaltenindex des Elements aij . Die m · n Werte dieser Abbildung, durch die A eindeutig bestimmt ist, lassen sich u ¨bersichlich in einem rechteckigen Schema anordnen ⎞ ⎛ a11 · · · a1n ⎜ . .. ⎟ A = (aij )1≤i≤m1≤j≤n = ⎝ .. . ⎠. am1
···
amn
Meist spricht man von diesem Schema selbst als einer Matrix und bezieht sich darauf, wenn von Zeilen, Spalten, Diagonalen und dergleichen die Rede ist. In manchen Zusammenh¨ angen schreiben wir eine m × n-Matrix A auch in der Form ⎛ ⎞ z1 ⎜ ⎟ A = (s1 , . . . , sn ) = ⎝· · ·⎠ , zm
68
3 Lineare Abbildungen und Matrizen
wobei s1 , . . . , sn die Spalten (verstanden als Spaltenvektoren in K m ) und z1 , . . . , zm die Zeilen (verstanden als Zeilenvektoren in K n ) bezeichnen. Die Menge der m × n-Matrizen u ¨ber K bezeichnen wir mit M (m × n, K) Eine weitere gebr¨ auchliche Bezeichnung ist K m×n . F¨ ur die Menge der quadratischen n × n-Matrizen u ¨ber K benutzen wir die Schreibweise M (n, K). Wir behandeln hier in den meisten F¨ allen nur Matrizen mit Eintr¨ agen aus einem K¨ orper K. Es sei nur bemerkt, dass Matrizen sich nat¨ urlich auch f¨ ur kommutative Ringe gem¨ aß der obigen Definition einf¨ uhren lassen. Die Regeln f¨ ur die Addition und Multiplikation lassen sich dann genauso u ¨bernehmen. Frage 166 Wie sind f¨ ur Matrizen A, B ∈ K m×n und α ∈ K die Summe A + B und das skalare Produkt αA erkl¨art? Ist K m×n ein K-Vektorraum? Antwort: Addition und skalare Multiplikation werden in K m×n komponentenweise erkl¨ art. F¨ ur A = (aij ) und B = (bij ) ist also (A + B)ij = (aij + bij ) sowie (αA)ij = (αaij ). m×n
eine abelsche Gruppe bez¨ uglich der Addition. Neutrales Element Damit ist K ist die Matrix, deren s¨ amtliche Eintr¨ age null sind, und die zu A = (aij ) bez¨ uglich der Addition inverse Matrix lautet −A = (−aij ). Zusammen mit der skalaren Multiplikation ist K m×n damit ein K-Vektorraum. Er besitzt die Dimension m · n, denn die Matrizen Eij , deren Eintr¨ age in der i-ten Zeile und j-ten Spalte gleich 1 sind, und deren andere Eintr¨ age alle verschwinden, bilden offensichtlich eine Basis von K m×n . Frage 167 Wie ist f¨ ur eine Matrix A = (aij ) ∈ K m×n und einen Vektor x = T n (x1 , . . . , xn ) ∈ K das Produkt A · x definiert? Antwort: Das Produkt A · x ist wie folgt erkl¨ art: ⎛ ⎞ ⎞ ⎛ ⎞ ⎛ n a11 · · · a1n x1 j=1 a1j xj ⎜ . ⎟ .. .. ⎟ ⎜ .. ⎟ ⎜ .. A · x = ⎝ .. ⎠ . . ⎠·⎝ . ⎠=⎝ . n am1 · · · amn xn j=1 amj xj
Man beachte: Das Produkt A · x ist nur f¨ ur den Fall definiert, in dem die Anzahl der Spalten von A mit der Anzahl der Komponenten von x u ¨bereinstimmt. Zur Bezeichnung: Bewegt man sich innerhalb des Matrizenkalk¨ uls, so ist aus formalen Gr¨ unden eine Unterscheidung zwischen Zeilen- und Spaltenvektoren aus angen keine Rolle K n wichtig – eine Unterscheidung, die in anderen Zusammenh¨ spielt. Wir fassen Vektoren x ∈ K n in Zukunft stets als Spaltenvektoren auf. Um denselben Vektor als Zeilenvektor darzustellen, benutzen wir die Schreibweise xT (mit T“ wie Transponierte“). ” ”
3.3 Matrizen
69
Etwas u ¨bersichtlicher kann man die Matrizenmultiplikation auch folgendermaßen darstellen: Sind s1 , . . . , sn ∈ K m die Spaltenvektoren von A, dann l¨ asst sich A · x auch in der Form A · x = x1 s1 + · · · + xn sn schreiben, also z. B. ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎞ ⎞ ⎛ ⎛ 3 2 1 10 1 2 3 ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎟ ⎟ ⎜ ⎜ + 1000 · + 100 · = 10 · · 3 2 100 2 3 4 ⎝4⎠ . ⎝ ⎠ ⎝ ⎠ ⎠ ⎠ ⎝ ⎝ 5 4 3 1000 3 4 5 Frage 168
K¨ onnen Sie
ausrechnen? Antwort: Man erh¨ alt ⎛ 3·4 + ⎜ ⎝ 5·4 + 2·4 +
⎛ ⎞ ⎛ ⎞ 4 3 2 1 0 ⎜2⎟ ⎜ ⎟ ⎜ ⎟ ⎝5 3 2 2 ⎠ · ⎜ ⎟ ⎝−3⎠ 2 5 1 −1 −4 als Ergebnis den Vektor
⎞ ⎛ ⎞ 13 2 · 2 + 1 · (−3) + 0 · (−4) ⎟ ⎜ ⎟ 3 · 2 + 2 · (−3) + 2 · (−4) ⎠ = ⎝12⎠ . 19 5 · 2 + 1 · (−3) + −1 · (−4)
Frage 169 Inwiefern ist durch eine Matrix A ∈ K m×n eine Abbildung FA : n m K −→ K gegeben? Antwort: F¨ ur jedes x ∈ K n ist A · x ein Element aus K m . Durch x −→ A · x ist also eine Abbildung FA : K n −→ K m gegeben. Diese Abbildung ist linear. Bezeichnen n¨ amlich s1 , . . . , sn die Spaltenvektoren von A und sind x = (x1 , . . . , xn )T und y = (y1 , . . . , yn )T zwei Vektoren aus K n sowie α, β ∈ K, dann gilt A · (αx + βy) = s1 · (αx1 + βy1 ) + · · · + sn · (αxn + βyn ) = α(s1 x1 + · · · + sn xn ) + β(s1 y1 + · · · + sn yn ) = α · Ax + β · Ay.
Frage 170 K¨ onnen Sie zeigen, dass sich umgekehrt jeder linearen Abbildung F : K n −→ K m eindeutig eine Matrix AF ∈ K m×n so zuordnen l¨asst, dass F (x) = AF ·x f¨ ur alle x ∈ K n gilt?
70
3 Lineare Abbildungen und Matrizen
Antwort: Sei e1 , . . . , en die Standardbasis des K n . Man betrachte die Matrix A := F (e1 ), . . . , F (en ) ∈ K m×n ,
die als Spalten die Bilder der Basisvektoren des K n enth¨ alt. Nach Frage 169 beschreibt A eine lineare Abbildung F : K n −→ K m . F¨ ur alle x = (x1 , . . . xn )T ∈ K n gilt ⎛ ⎞ x1 ⎜ .⎟ FA (x) = A · x = F (e1 ), . . . , F (en ) · ⎝ .. ⎠ xn
= x1 F (e1 ) + · · · + xn F (en ) = F (x1 e1 + . . . + xn en ) = F (x).
Es folgt F (x) = FA (x). Damit wird F eindeutig durch die Matrix A beschrieben. Die gesuchte Matrix AF = A ist also diejenige Matrix, deren Spalten aus den Bildern F (ej ) der Basisvektoren ej besteht. Das beantwortet die Frage. Als Faustregel kann man sich merken: Die einer linearen Abbildung F : K n −→ K m zugeordnete Matrix A ∈ K m×n ist diejenige Matrix, deren Spalten die Bilder F (ej ) der Einheitsvektoren ej f¨ ur j = 1, . . . n sind. Frage 171
Gibt es eine Bijektion zwischen Hom(K n , K m ) und K m×n ?
Antwort: Die Abbildung Hom(K n , K m ) −→ K n×m ,
F −→ F (e1 ), . . . , F (en )
ist nach Antwort 170 injektiv und nach Antwort 169 surjektiv, definiert folglich eine Bijektion zwischen der Menge der linearen Abbildungen K n −→ K m und der Menge der Matrizen A ∈ K m×n . Frage 172
K¨ onnen Sie der linearen Abbildung F : R2 −→ R2 ,
(x2 , x2 )T −→ (x1 − x2 , 2x1 )T
ihre Matrix bez¨ uglich der Standardbasis zuordnen? Antwort: Mit e1 = (1, 0)T und e2 = (0, 1)T gilt F (e1 ) = (1, 2)T ,
F (e2 ) = (−1, 0)T .
Nach Frage 170 erh¨ alt man als gesuchte Matrix 1 −1 AF = . 2 0
3.3 Matrizen
71
Frage 173 Sei F : R2 −→ R2 die lineare Abbildung, die geometrisch eine Drehung im Uhrzeigersinn um den Winkel ϑ beschreibt. Wie lautet die F zugeordnete Matrix AF ? Antwort: Mit F (e1 ) = (cos ϑ, sin ϑ),
π π F (e2 ) = cos ϑ + , sin ϑ + = (− sin ϑ, cos ϑ) 2 2
erh¨ alt man als Darstellungsmatrix
cos ϑ − sin ϑ . AF = sin ϑ cos ϑ
Frage 174 Unter welchen Voraussetzungen ist das Produkt A · B zweier Matrizen definiert? Wie lautet gegebenenfalls die Definition? Antwort: Das Produkt A · B ist f¨ ur zwei Matrizen A und B genau dann erkl¨ art, wenn die Anzahl der Spalten von A gleich der Anzahl der Zeilen von B ist, wenn also nat¨ urliche Zahlen m, n, p existieren mit A ∈ K m×n
und
B ∈ K n×p .
(∗)
F¨ ur zwei Matrizen A = (aij ) und B = (bij ) wie in (∗) ist das Produkt A · B dann eine Matrix in K m×p . F¨ ur die Koeffizienten von A · B gilt (A · B)kℓ :=
n
aki biℓ ,
i=1
oder etwas schematischer ⎛ ⎞ ⎛ a11 · · · a1n b11 ⎜ .. .. ⎟ ⎜ .. ⎝ . . ⎠·⎝ . am1
···
amn
bn1
··· ···
⎞ ⎛ n b1p i=1 a1i bi1 .. ⎟ ⎜ .. . ⎠=⎝ . n bnp i=1 ami bi1
··· .. . ···
n
⎞ a1i bip ⎟ .. ⎠. .
i=1
n
i=1
ami bip
Man kann sich die Multiplikation auch so einpr¨ agen: Die Spaltenvektoren von AB sind die Bilder der Spaltenvektoren von B unter der Abbildung x −→ A · x. Frage 175
Wie lautet das Ergebnis der Multiplikation ⎛ ⎞ ⎞ ⎛ 5 2 3 2 −2 8 ⎜ ⎟ ⎟ ⎜ 3 −8⎟ ⎜ · ⎟? ⎝5 1 3 −3⎠ ⎜ ⎝2 9⎠ 3 0 4 0 −1 1
72
3 Lineare Abbildungen und Matrizen
Antwort: Man erh¨ alt als Ergebnis die 2 × 2-Matrix ⎞ ⎞ ⎛ ⎛ 9 −20 3·5+2·3−2·2−8·1 3·2−2·8−2·9+8·1 ⎟ ⎟ ⎜ ⎜ ⎝5 · 5 + 1 · 3 + 3 · 2 + 3 · 1 5 · 2 − 1 · 8 + 3 · 9 − 3 · 1⎠ = ⎝37 26 ⎠ . 23 42 3·5+0·3+4·2−0·1 3·2−0·8+4·9+0·1
Frage 176 Seien F : K n −→ K m und G : K m −→ K p lineare Abbildungen, die durch die Matrizen AF ∈ K m×n bzw. AG ∈ K p×m beschrieben werden. Wieso gilt dann (AG · AF ) · x = (G ◦ F )(x) f¨ ur alle x ∈ K n , d. h., dass auf der Ebene der Matrizen der Verkettung linearer Abbildungen gerade die Multiplikation von Matrizen entspricht? Antwort: Man betrachte den ℓ-ten Spaltenvektor sℓ = (a1ℓ , . . . , amℓ )T der Matrix AF . Nach Antwort 170 gilt sℓ = F (eℓ ) mit dem ℓ-ten Standardbasisvektor eℓ ∈ K n . Man erh¨ alt (G ◦ F )(eℓ ) = G F (eℓ ) = G (a1ℓ , . . . , amℓ )T = G(a1ℓ ǫ1 + · · · + amℓ ǫm ) = a1ℓ G(ǫ1 ) + · · · + amℓ G(ǫm ),
wobei ǫ1 , . . . , ǫm die Standardbasisvektoren in K m bezeichnen. Die Vektoren G(ǫ1 ), . . . , G(ǫm ) sind nach Antwort 170 genau die Spalten von AG , also ist die rechte Summe identisch mit AG · sℓ = AG · (AF eℓ ) = (AG · AF ) · eℓ , also der ℓ-ten Spalte von AG · AF . Damit gilt AG · AF = (G ◦ F )(e1 ), . . . , (G ◦ F )(en ) , und nach Frage 170 ist das die Darstellungsmatrix von G ◦ F . Frage 177
Unter welchen Bedingungen sind sowohl A · B als auch B · A definiert?
Antwort: Die Produkte lassen sich nur dann bilden, wenn sowohl A als auch B quadratische Matrizen sind, also A, B ∈ M (n, K) gilt. Auf der Ebene der linearen Abbildungen, die durch Matrizen beschrieben werden, wird diese Bedingung dadurch verst¨ andlich, dass die Verkettungen F ◦ G und G ◦ F nur dann beide definiert sind, wenn F und G denselben Definitions- und Zielbereich haben. In dem gegenw¨ artigen Zusammenhang heißt das speziell, dass es sich bei beiden um Endomorphismen K n −→ K n handeln muss. Frage 178
Ist die Matrizenmultiplikation im Allgemeinen kommutativ?
Antwort: Nein. Es 1 0 0 · 0 0 0
gilt zum Beispiel 1 0 1 = aber 1 0 0
0 1 0 1 0 0 · = . 0 1 0 0 0 0
Das zweite Produkt zeigt obendrein, dass der Matrizenring nicht nullteilerfrei ist.
3.4 Matrizenringe
73
Frage 179 Geben Sie die Darstellungsmatrix der linearen Abbildung Φ : R3 −→ 3 R an, die eine Drehung um die x3 -Achse um den Winkel ϑ, gefolgt von einer Drehung um die x1 -Achse um den Winkel ̺ beschreibt (beide Drehungen im Uhrzeigersinn). K¨onnen Sie zeigen, dass man im Allgemeinen ein anderes Ergebnis erh¨alt, wenn man die Reihenfolge der Drehungen vertauscht? Antwort: Sei F : R3 −→ R3 die Drehung um die x3 -Achse um den Winkel ϑ und G : R3 −→ R3 die Drehung um die x1 -Achse um den Winkel ̺ beschreiben. F¨ ur die zugeh¨ origen 3 × 3-Matrizen AF und AG erh¨ alt man durch eine einfache Verallgemeinerung der Argumentation aus Frage 173 ⎛ ⎛ ⎞ ⎞ cos ϑ − sin ϑ 0 1 0 0 ⎜ ⎜ ⎟ ⎟ AF = ⎝ sin ϑ cos ϑ 0⎠ , AG = ⎝0 cos ̺ − sin ̺⎠ . 0 sin ̺ cos ̺. 0 0 1 Es gilt Φ = G ◦ F und folglich
⎞ cos ϑ − sin ϑ 0 ⎟ ⎜ AΦ = AG · AF = ⎝cos ̺ sin ϑ cos ̺ cos ϑ − sin ̺⎠ . sin ̺ sin ϑ sin ̺ cos ϑ cos ̺ ⎛
Vertauscht man die Reihenfolge der Drehungen, so erh¨ alt man als Darstellungs′ 3 3 matrix der so erhaltenen Abbildung Φ : R −→ R ⎞ ⎛ cos ϑ − sin ϑ cos ̺ sin ϑ sin ̺ ⎟ ⎜ AΦ′ = AF · AG = ⎝ sin ϑ cos ϑ cos ̺ − cos ϑ sin ̺⎠ = AΦ . 0 sin ̺ cos ̺ Daraus folgt Φ′ = Φ, die beiden Abbildungen R3 −→ R3 sind also verschieden.
3.4
Matrizenringe
Da sich quadratische Matrizen miteinander addieren und multiplizieren lassen und diese Operationen zudem die Assoziativ- und Distributivgesetze erf¨ ullen, besitzt die Menge M (n, K) der quadratischen n × n-Matrizen u orper K die ¨ber einem K¨ Struktur eines Rings (oder spezieller die einer K-Algebra, da M (n, K) zus¨ atzlich ein K-Vektorraum ist). Die Menge aller invertierbaren Matrizen aus M (n, K) bildet dar¨ uberhinaus einen K¨ orper. Frage 180 K¨ onnen Sie f¨ ur A = (aij ) ∈ K m×n , B = (bij ) ∈ K n×p , C = (cij ) ∈ p×q K verifizieren, dass die Matrizenmultiplikation assoziativ und distributiv ist, dass also (AB)C = A(BC) gilt?
74
3 Lineare Abbildungen und Matrizen
Antwort: Wir benutzen folgende Notation: Mkℓ bezeichne den Eintrag in der k-ten Zeile und ℓ-ten Spalte einer Matrix M . Es gilt
(AB)C
kℓ
=
p
(AB)ki ciℓ =
i=1
p n
akj bji ciℓ =
i=1 j=1
n
akj
j=1
p i=1
bji ciℓ = A(BC) kℓ .
Das zeigt die Assoziativit¨ at der Matrizenmultiplikation. Frage 181
Was ist eine K-Algebra?
Antwort: Sei K ein K¨ orper. Eine Algebra mit Eins u ¨ber K (kurz K-Algebra) ist ein Ring R mit 1, der gleichzeitig ein K-Vektorraum ist, so dass α(AB) = (αA)B = A(αB) f¨ ur alle α ∈ K und A, B ∈ R gilt. Frage 182
Warum ist M (n, K) eine K-Algebra?
Antwort: M (n, K) ist mit der Addition und Multiplikation von Matrizen ein Ring mit 1. Das folgt aus den Fragen 178 und 180. Das Distributivgesetz gilt wegen
n n A(B + C) kℓ = aki (biℓ + ciℓ ) = (aki biℓ + aki ciℓ ) = AB + AC kℓ i=1
i=1
In Antwort 166 wurde schon begr¨ undet, dass M (n, K) ein Vektorraum ist. Ferner rechnet man ohne Probleme nach, dass α(AB) = (αA)B = A(αB) f¨ ur alle α ∈ K und A, B ∈ M (n, K). Also ist M (n, K) eine K-Algebra. Frage 183 Was versteht man unter dem Spaltenraum S(A), was unter dem Zeilenraum Z(A) einer Matrix A ∈ K m×n ? Antwort: Als Spaltenraum von A definiert man den durch die Spaltenvektoren s1 , . . . , sn ∈ K m von A aufgespannten Unterraum von K m . Entsprechend ist der Zeilenraum der durch die Zeilenvektoren z1 , . . . , zm ∈ K n von A aufgespannte Unterraum von K n , also S(A) := span(s1 , . . . , sn ),
Z(A) := span(z1 , . . . , zm ).
Man kann Zeilenraum und Spaltenraum daher auch charakterisieren durch S(A) := {Ax ; x ∈ K n },
Z(A) := {xT A ; x ∈ K m }.
3.4 Matrizenringe
Frage 184 niert?
75
Wie sind Spaltenrang und Zeilenrang einer Matrix A ∈ K m×n defi-
Antwort: Der Spaltenrang rgs von A ist die Dimension des Spaltenraumes, der Zeilenrang rgz entsprechend die Dimension des Zeilenraumes. Der Spalten- bzw. Zeilenrang entspricht damit der Anzahl linear unabh¨ angiger Spalten bzw. Zeilen in A. Frage 185 Welcher Zusammenhang besteht zwischen dem Spaltenrang von A ∈ K m×n und dem Rang der linearen Abbildung FA : K n → K m mit F (x) = A · x? Antwort: Die Spaltenvektoren s1 , . . . , sm von A bilden ein Erzeugendensystem von im f , da f¨ ur jedes w = F (x) ∈ im f gilt: ⎛ ⎞ x1 ⎜ .. ⎟ w = F (x) = A · x = (s1 , . . . , sn ) · ⎝ . ⎠ = x1 s1 + · · · + xn sn . xn
Somit ist rg f = dim im f gleich der Dimension des durch die Spaltenvektoren si aufgespannten Unterraums von W , also gleich dem Spaltenrang von A.
Frage 186 K¨ onnen Sie beweisen, dass f¨ ur jede Matrix Zeilen- und Spaltenrang u ¨bereinstimmen, so dass also allgemein von dem Rang einer Matrix gesprochen werden kann? Antwort: Beim Beweis kann man so vorgehen, dass man zun¨ achst zeigt, dass sich der Zeilenrang von A nicht ¨ andert, wenn man eine Spalte aus A entfernt, die sich aus den u asst (der Spaltenrang ¨ andert ¨brigen Spalten linear kombinieren l¨ sich dadurch offensichtlich nicht). Ohne Beschr¨ ankung der Allgemeinheit kann man dabei davon ausgehen, dass sich die letzte Spalte von A als Linearkombination der ersten n − 1 Spalten darstellen l¨ asst, so dass also gilt: ⎞ ⎛ n−1 a11 · · · a1(n−1) i=1 αi a1i ⎟ ⎜ .. .. .. .. ⎠. ⎝ . . . . n−1 amn · · · am(n−1) i=1 αi ami Sei A′ ∈ K m×(n−1) diejenige Matrix, die man durch Streichen der letzten Spalte aus A erh¨ alt. Sind die Zeilen von A′ linear unabh¨ angig, dann nat¨ urlich auch die ′ von A. Sind aber die Zeilen von A linear abh¨ angig, gilt also m j=1
βj ajk = 0,
1 ≤ k ≤ n − 1,
76
3 Lineare Abbildungen und Matrizen
mit bestimmten βj ∈ R, 1 ≤ j ≤ m, dann folgt daraus f¨ ur die Elemente der letzten Spalte von A m j=1
βj ajn =
m k=1
βj
n−1 i=1
αi aji =
n−1 i=1
αi
m
βj aji = 0.
j=1
=0
Man sieht also, dass die Zeilen von A genau dann linear abh¨ angig sind, wenn die Zeilen aus A′ dies sind. Beim Streichen einer Spalte, die sich aus den anderen linear kombinieren l¨ asst, ¨ andert sich der Zeilenrang nicht. Auf dieselbe Weise zeigt man, dass das Streichen einer linear abh¨ angigen Zeile keinen Einfluss auf den Spaltenrang hat. Man kann in der Matrix A daher so lange linear abh¨ angige Spalten und Zeilen ∈ K m′ ×n′ gelangt, streichen, bis man zu einer – in aller Regel kleineren – Matrix A deren Spalten- und Zeilenvektoren alle jeweils voneinander linear unabh¨ angig sind, muss dann quadratisch und die denselben Spalten- und Zeilenrang wie A hat. A sein, denn w¨ are etwa n′ > m′ , dann k¨ onnten die n′ Spaltenvektoren von A als m′ Elemente aus K nicht linear unabh¨ angig sein. = rgz (A) = rgz (A) gezeigt. Insgesamt ist damit rgs (A) = rgs (A) Frage 187
Wann heißt eine Matrix A ∈ M (n, K) invertierbar?
Antwort: Eine Matrix A ∈ M (n, K) heißt invertierbar, wenn es eine Matrix B ∈ M (n, K) gibt, so dass AB = BA = En gilt. Dabei bezeichnet En die Einheitsmatrix aus M (n, K). Die Matrix 2 1 1 1 ist beispielsweise invertierbar. Durch Ausprobieren findet man schnell 2 1 1 −1 1 0 · = . 1 1 −1 2 0 1
Frage 188 Wieso ist die inverse Matrix B zu einer invertierbaren Matrix A eindeutig bestimmt? Antwort: Ist B ′ eine Matrix mit AB ′ = B ′ A = En , so folgt B ′ = B ′ En = B ′ (AB) = (B ′ A)B = (AB ′ )B = En B = B. Man kann daher von der Inversen einer Matrix A sprechen. Man bezeichnet sie mit A−1 .
3.4 Matrizenringe
77
Frage 189 Warum ist eine Matrix A ∈ M (n, K) genau dann invertierbar, wenn die durch sie beschriebene lineare Abbildung FA : K n −→ K n ein Isomorphismus ist? Antwort: Ist FA ein Isomorphismus, dann existiert eine Umkehrabbildung FA−1 mit FA ◦ FA−1 = id. Da die identische Abbildung des K n durch die Einheitsmatrix En beschrieben wird, folgt daraus mit Frage 176 A · B = En , wobei B die zur Abbildung FA−1 geh¨ orende Matrix ist. Folglich ist A invertierbar, und die Inverse A−1 ist gerade die zur Umkehrabbildung von FA−1 geh¨ orende Matrix. Frage 190 L¨asst sich die Invertierbarkeit einer Matrix A ∈ M (n, K) auch durch den Rang von A charakterisieren? Antwort: Aus den Antworten 185 und 189 folgt unmittelbar A ∈ M (n, K) invertierbar ⇐⇒ rg A = n.
Frage 191 Wie ist die allgemeine lineare Gruppe (General Linear Group GL(n, K) definiert? K¨ onnen Sie begr¨ unden, weshalb GL(n, K) bez¨ uglich der Matrizenmultiplikation eine Gruppe ist? Antwort: GL(n, K) ist die Gruppe der invertierbaren Matrizen aus M (n, K). Sind A, B invertierbare Matrizen, so ist wegen (AB)−1 = B −1 A−1 auch AB invertierbar und somit ein Element aus GL(n, K). Das Assoziativgesetz u agt ¨bertr¨ sich vom Ring der Matrizen auf GL(n, K). Mit En enth¨ alt GL(n, K) ein neutrales Element, und f¨ ur jede Matrix A ∈ GL(n, K) existiert nach Definition ein inverses Element A−1 , und wegen A = (A−1 )−1 ist dieses auch invertierbar, also ein Element aus GL(n, K). Damit sind alle Gruppenaxiome f¨ ur die allgemeine lineare Gruppe nachgewiesen. Frage 192 K¨ onnen Sie – auch im Hinblick auf sp¨atere Kapitel – eine m¨ oglichst große Liste von Eigenschaften einer Matrix A ∈ M (n, K) angeben, die zur Invertierbarkeit ¨aquivalent sind? Antwort: Zur Invertierbarkeit von A ¨ aquivalente Eigenschaften sind (a) (b) (c) (d)
Es gibt eine Matrix B ∈ M (n, K) mit AB = En ( Rechtsinverses“). ” Es gibt eine Matrix B ∈ M (n, K) mit BA = En ( Linksinverses“) ” Die Gauß-Jordan’sche Normalform ist die Einheitsmatrix. rg A = n.
78
(e) (f) (g) (h) (i) (j) (k) (l) (m)
3 Lineare Abbildungen und Matrizen
rgz A = n rgs A = n FA ist ein Isomorphismus. FA ist bijektiv. FA ist surjektiv. FA ist injektiv. Das homogene LGS Ax = 0 hat nur die triviale L¨ osung. Das LGS Ax = b ist universell l¨ osbar. A ist Basiswechselmatrix geeigneter Basen.
Frage 193
Wieso gilt f¨ ur A ∈ K m×n , B ∈ K n×p rg(AB) ≤ min(rg A, rg B)? n
Antwort: Sei FA : K −→ K m bzw. FB : K p −→ K n die von A bzw. B vermittelte lineare Abbildung. Wegen im(FA ◦ FB ) ⊂ im(FA ) ist rg(AB) = dim im(FA ◦ FB ) ≤ dim im(FA ) = rg A. Nach der Dimensionsformel gilt dim K p = dim im(FB ) + dim ker(FB ) sowie dim K p = dim im(FA ◦ FB ) + dim ker(FB ), also insgesamt rg(AB) = dim im(FA ◦ FB ) = dim im(FB ) + dim ker(FB ) − dim ker(FA ◦ FB ) ≤ dim im(FB ) = rg B, weil ker(FB ) ⊆ ker(FA ◦ FB ). Frage 194 A ≈ B?
aquivalent, in Zeichen Wann heißen zwei Matrizen A, B ∈ K m×n ¨
Antwort: A und B heißen a ¨quivalent, wenn es Matrizen P ∈ GL(m, K) und Q ∈ GL(n, K) gibt, so dass A = P BQ gilt. ¨ Frage 195 K¨ onnen Sie zeigen, dass durch ≈“ eine Aquivalenzrelation auf K m×n × ” K m×n definiert wird? Antwort: Die Relation ≈“ ist reflexiv, denn wegen A = Em AEn gilt A ≈ A, ” sie ist symmetrisch, denn aus A ≈ B, also A = P BQ folgt B = P −1 AQ−1 , also B ≈ A. Die Relation ist ferner transitiv, denn wenn A ≈ B und B ≈ C, also A = P BQ und B = SCT , gilt, dann ist A = P (SCT )Q = (P S)C(T Q), und damit A ≈ C. Die Relation ≈“ ist also reflexiv, symmetrisch und transitiv und definiert damit ” ¨ eine Aquivalenzrelation auf K m×n .
3.5 Koordinatenisomorphismen und Basiswechselformalismus
79
Frage 196 K¨ onnen Sie den folgenden Invarianzsatz zeigen? F¨ ur A ∈ K m×n , P ∈ GL(m, K), Q ∈ GL(n, K) gilt rg(P AQ) = rg(A). Antwort: Durch die Rechtsmultiplikation mit Q werden die Spalten von A auf die Spalten von AQ abgebildet. Da Q einen Isomorphismus beschreibt, ¨ andert sich die Anzahl linear unabh¨ angiger Spalten dadurch nicht. Es ist also rgs (A) = rgs (AQ) und damit rg A = rg AQ. Mit demselben Argument zeigt man, dass P AQ genauso viele unabh¨ angige Zeilen enth¨ alt wie AQ. Damit hat man rgz (P AQ) = rgz (AQ) und rg(P AQ) = rg(AQ). Insgesamt folgt daraus rg(A) = rg(P AQ).
3.5
Koordinatenisomorphismen und Basiswechselformalismus
Hat man in einem Vektorraum V der Dimension n < ∞ eine Basis B = (v1 , . . . , vn ) bestimmt, so l¨ asst sich jeder Vektor v ∈ V in der Form v = α1 v1 + · · · + αn vn schreiben, wobei die Koeffizienten α1 , . . . , αn eindeutig bestimmt sind. Der Vektor v ∈ V kann daher hinsichtlich der gegebenen Basis eindeutig durch das n-Tupel (α1 , . . . , αn ) beschrieben, also mit einem Element aus K n identifiziert werden. Was hier im Wesentlichen dahintersteckt, ist ein Isomorphismus V −→ K n , der es in jedem Fall erm¨ oglicht, Strukturen eines endlich-dimensionalen Vektorraums ¨ durch Ubertragung auf den K n dort zu untersuchen und damit auch rechnerisch zug¨ anglich zu machen. In diesem Abschnitt werden alle Vektorr¨ aume als endlich-dimensional vorausgesetzt. Frage 197 Sei V ein Vektorraum der Dimension n < ∞. Was versteht man unter einem Koordinatensystem f¨ ur V ? Antwort: Ist B = (v1 , . . . , vn ) eine Basis von V , so existiert nach Frage 139 genau ein Isomorphismus κB : K n −→ V, welcher die Standardbasis des K n auf B abbildet, f¨ ur den also κB (ei ) = vi
f¨ ur i = 1, . . . , n
80
3 Lineare Abbildungen und Matrizen
gilt. Den bei gegebener Basis B eindeutig bestimmten Isomorphismus κB nennt man das Koordinatensystem von V bez¨ uglich der Basis B. F¨ ur jeden nichttrivialen endlich-dimensionalen Vektorraum u orper existieren also ¨ber einem unendlichen K¨ unendlich viele Koordinatensysteme, n¨ amlich zu jeder Basis genau eines. Frage 198 Sei V ein endlich-dimensionaler Vektorraum, B = (v1 , . . . , vn ) eine Basis von V und κB : K n −→ V ein Koordinatensystem. Was versteht man unter einem Koordinatenvektor κB (v) eines Elements v ∈ V bez¨ uglich B? Antwort: Der Koordinatenvektor von v ist das Urbild von v unter dem Koordinatensystem κB , also der Vektor n κ−1 B (v) ∈ K .
F¨ ur die Basisvektoren vi gilt defintionsgem¨ aß κ−1 B (vi ) = ei
f¨ ur i = 1, . . . , n
Wird v durch die Linearkombination v = α1 v1 + · · · + αn vn dargestellt, so folgt also T κ−1 B (v) = (α1 , . . . , αn ) .
Um den Koordinatenvektor von v bez¨ uglich zu bezeichnen, benutzen wir in Zukunft auch die abk¨ urzende Schreibweise vB . Es soll also definitionsgem¨ aß vB = κ−1 (v) gelten. B Frage 199
Wieso ist jeder Vektorraum V der Dimension n < ∞ isomorph zu K n ?
ur jede beliebige Basis B ein IsoAntwort: Die Koordinatenabbildung κB ist f¨ morphismus. Dies folgt unmittelbar aus dem Basisbildersatz (Frage 139). Frage 200 Seien B = (v1 , . . . , vn ) und C = (w1 , . . . , wm ) Basen von V bzw. W und F : V → W eine lineare Abbildung. Wie ist die beschreibende Matrix MCB (F ) von F bez¨ uglich der Basen B und C definiert? Antwort: Die Matrix MCB (F ) ist definiert als diejenige Matrix, deren Spalten die Koordinatenvektoren der Bilder F (v1 ), . . . , F (vn ) bez¨ uglich der Basis C sind. Gilt also F (v1 ) = β11 w1 + β21 w2 + · · · + βm1 wm .. .. . . F (vn ) = β1n w1 + β2n w2 + · · · + βmn wm ,
3.5 Koordinatenisomorphismen und Basiswechselformalismus
so ist
⎛
β11 ⎜ .. B MC (F ) := ⎝ .
βm1
··· .. . ···
81
⎞ β1n .. ⎟ . ⎠.
βmn
Man beachte, dass der obere Index die Basis des Definitionsbereichs, der untere die Basis des Wertebereichs von F bezeichnet. Diese Schreibweise erm¨ oglicht einen sehr suggestiven kalk¨ ulm¨ aßigen Umgang mit beschreibenden Matrizen, der an der K¨ urzung von Br¨ uchen angelehnt ist (vgl. Frage 209). Frage 201
zeigen?
Sei F : V −→ W linear. K¨ onnen Sie F (v) C = MCB (F ) · vB
Antwort: Sei vB = (α1 , . . . , αn ) der Koordinatenvektor von v. Dann gilt v = α1 v1 + · · · + αn vn und folglich, wenn wir die Bezeichnungen wie in der Antwort 200 w¨ ahlen, F (v) = α1 F (v1 ) + · · · + αn F (vn ) = α1 (β11 w1 + · · · + βm1 wm ) + · · · + αn (β1n w1 + · · · + βmn wm ) = (α1 β11 + · · · + αn β1n )w1 + · · · + (α1 βm1 + · · · + αn βmn )wm . Es folgt
⎞ α1 β11 + · · · + αn β1n ⎟ ⎜ F (v) C = ⎝ ··· ⎠, α1 βm1 + · · · + αn βmn ⎛
und aus dieser Darstellung erkennt man die G¨ ultigkeit der Formel. Das zugeh¨ orige kommutative Diagramm ist F
V −−−−→ ⏐ ⏐ κ−1 B A
W ⏐κC, ⏐
dabei ist A := MCB (F ).
K n −−−−→ K m
Frage 202 K¨ onnen Sie den folgenden, sogenannten Normalformensatz zeigen? Sind V und W endlich-dimensional und F : V −→ W linear, dann gibt es stets Basen B von V und C von W , so dass gilt E 0 r MCB (F ) = , mit r = rg F . 0 0
82
3 Lineare Abbildungen und Matrizen
Antwort: Sei B0 = (v1 , . . . , vn ) eine Basis von V . Die Bilder F (v1 ), . . . , F (vn ) bilden ein Erzeugendensystem von im F , und wegen dim im F = rg F = r finden sich darunter genau r linear unabh¨ angige, die man – nach eventueller Neuanordnung – mit F (v1′ ), . . . , F (vr′ ) bezeichnen kann. Nach der Dimensionsformel besitzt ′ ker F die Dimension n − r, und daher gibt es eine Basis (vr+1 , . . . , vn′ ) von ker F . ′ Dann ist B = (v1′ , . . . , vr′ , vr+1 ur die gilt , . . . , vn′ ) eine Basis von V , f¨ ′ F (v1′ ), . . . , F (vr′ ) ist Basis von im F und F (vr+1 ) = · · · = F (vn′ ) = 0. Man erg¨ anze die Vektoren F (v1′ ), . . . , F (vr′ ) nun zu einer Basis ′ ′ , . . . , wm C = F (v1′ ), . . . , F (vr′ ), wr+1
von W . Man hat dann (F (vi′ ))C = ei
f¨ ur 1 ≤ i ≤ r
und folglich
ur r + 1 ≤ j ≤ n (F (vj′ ))C = 0 f¨
und
E 0 r . MCB (F ) = 0 0
Frage 203 Seien dim V, W Vektorr¨aume mit endlichen Dimensionen dim = n, dim W = m. Mit B = (v1 , . . . , vn ) und C = (w1 , . . . , wm ) seien zwei Basen von V bzw. W gegeben. K¨ onnen Sie zeigen, dass dann die Elementarabbildungen Fij : V −→ W,
Fij (vk ) = δjk wi
eine Basis von Hom(V, W ) bilden? Antwort: Sei G ∈ Hom(V, W ). F¨ ur die Bilder der Basisvektoren gelte G(vk ) = αk1 w1 + · · · + αkn wm ,
1≤k≤n
F¨ ur den Basisvektor vk stimmt dann G mit der Abbildung Gk := αk1 F1k + · · · + αkn Fnk u ¨berein, es gilt also
G(vj ) f¨ ur j = k Gk (vj ) = 0 sonst.
Daraus folgt G = G1 + · · · + Gn , da die Abbildungen auf beiden Seiten dieser Gleichung auf s¨ amtlichen Basisvektoren und folglich u ¨berall u ¨bereinstimmen. Es ist also m n G= αij Fji , i=1 j=1
3.5 Koordinatenisomorphismen und Basiswechselformalismus
83
woraus folgt, dass die Funktionen Fij ein Erzeugendensystem von Hom(V, W ) bilden. Es bleibt zu zeigen, dass sie linear unabh¨ angig sind. Sei m n
αij Fji = 0,
i=1 j=1
dann gilt insbesondere f¨ ur k = 1, . . . , n m n
αij Fji (vk ) = 0,
also
m n
αij δik (vk ) =
αij wi = 0.
j=1
i=1 j=1
i=1 j=1
m
Daraus folgt αij = 0 f¨ ur alle i ∈ {1, . . . , m} und alle j ∈ {1, . . . , m}, also die lineare Unabh¨ angigkeit der Fij . Frage 204
K¨ onnen Sie eine Basis von K 2×2 angeben?
Antwort: Eine Basis ist 1 0 0 1 0 0 0 0 , , , . 0 0 0 0 1 0 0 1 Dies sind gerade die beschreibenden Matrizen der vier Elementarabbildungen Fij : K 2 −→ K 2 . Frage 205 Gegeben seien lineare Abbildungen F : U −→ V und G : V −→ W sowie Basen B = (u1 , . . . , un ) von U , C = (v1 , . . . , vm ) von V und D = (w1 , . . . , wp ) von W . Sei A := MCB (F ) ∈ K m×n
und
C B := MD (G) ∈ K p×m .
Wie kann man dann B (G ◦ F ) ∈ K p×n C := MD
aus A und B berechnen? Antwort: Das Diagramm F
U −−−−→ ⏐ ⏐ −1 κB F
G
V −−−−→ ⏐ ⏐ −1 κC F
W ⏐ ⏐ −1 κD
K n −−−A−→ K m −−−B−→ K p ist kommutativ, da das linke und rechte Teildiagramm dies sind. Folglich gilt B κD ◦ (FB ◦ FA ) ◦ κ−1 C = MD B .
B folgt daraus, dass C gerade die zur Abbildung FB ◦FA und nach Definition von MD geh¨ orende Matrix ist, also C = AB gilt.
84
3 Lineare Abbildungen und Matrizen
Frage 206
Sei dim V = n und B eine Basis von V . K¨ onnen Sie zeigen, dass durch MBB : Hom(V, V ) −→ M (n, K),
F −→ MBB (F )
ein Isomorphismus von K-Algebren definiert wird? Antwort: Die Abbildung ist linear und injektiv, da eine lineare Abbildung F durch die Bilder der Basisvektoren, die als Spalten in MBB (F ) auftreten, eindeutig bestimmt ist. Sie ist ferner surjektiv, da durch jede Festlegung der Bilder der Basisvektoren eine lineare Abbildung definiert wird. Frage 207 Sei V ein endlich-dimensionaler K-Vektorraum mit den Basen B = (v1 , . . . , vn ) bzw. B′ = (v1′ , . . . , vn′ ). In welcher Beziehung stehen die Koordinatenvektoren vC und vB (v ∈ V ) zueinander? Wie erh¨alt man die Basiswechselmatrix ¨ f¨ ur den Ubergang von den B-Koordinaten zu den C-Koordinaten? uglich Antwort: Sei vB = (α1 , . . . , αn ) und vC = (α1′ , . . . , αn′ ), d. h., v besitze bez¨ der Basen B bzw. C die eindeutigen Darstellungen v = α1 v1 + · · · + αn vn v = α1′ v1′ + · · · + αn′ vn′ . uglich C, F¨ ur 1 ≤ i ≤ n sei ferner (ai1 , . . . , ain ) der Koordinatenvektor von vi bez¨ d. h., es gilt vi = ai1 v1′ + · · · + ain vn′ , f¨ ur 1 ≤ i ≤ n. Dann folgt v = α1 v1 + · · · + αn vn = α1 (a11 v1′ + · · · + a1n vn′ ) + · · · + αn (an1 v1′ + · · · + ann vn′ ) = (a11 α1 + · · · + an1 αn )v1′ + · · · + (a1n α1 + · · · + ann αn )vn′ . F¨ ur i = 1, . . . , n gilt also αi′ = a1i α1 + · · · + ani αn . Ist MCB die Matrix, die die Koordinatenvektoren von (v1′ , . . . , vn′ ) als Spalten besitzt, also ⎞ ⎛ a11 · · · a1n ⎜ . .. ⎟ .. MCB := ⎝ .. . . ⎠, an1
···
ann
so erh¨ alt man damit den Zusammenhang
vC = MCB vB . Die Matrix MCB (= MCB (id)) nennt man Basiswechselmatrix.
3.5 Koordinatenisomorphismen und Basiswechselformalismus
Frage 208
85
Warum sind Basiswechselmatrizen stets invertierbar?
Antwort: Da sowohl id, κB und κC in dem unten stehenden kommutativen Diagramm Isomorphismen sind, ist auch FA ein Isomorphismus. Dessen Darstellungsmatrix ist die Basiswechselmatrix MCB , die somit invertierbar ist. id
VO kB
K
n
/V O kC
FA
/ Kn
mit A = MCB .
Frage 209 Begr¨ unden Sie die folgenden Formeln (Basiswechselformalismus): Sind B, C, D Basen eines endlich-dimensionalen Vektorraums, so gilt −1 B C MD = MD · MCB und MBC = MCB . Antwort: Nach Antwort 207 gilt C vD = MD vC
und vC = MCB vB .
Daraus folgt C vD = MD MCB vB
und damit die erste Formel. Die zweite folgt aus vC = MCB vB durch Linksmultiplikation mit (MCB )−1 .
Frage 210 In V = R2 sei S = (e1 , e2 ) die Standardbasis und B = (v1 , v2 ) mit v1 = (3, 4)T und v2 = (−1, 2)T eine weitere Basis. K¨ onnen Sie MBS und MSB bestimmen? K¨ onnen Sie ferner f¨ ur v = s1 e1 + s2 e2 = t1 v1 + t2 v2 die Koordinaten t1 und t2 durch s1 und s2 ausdr¨ ucken? Antwort: MBS ist nach Antwort 207 die Matrix, die die Koordinatenvektoren von (v1 , v2 ) bez¨ uglich S als Spalten besitzt. Also ist 3 −1 . MBS = 4 2 Wegen e1 = 0.2 · v1 − 0.4 · v2 und e2 = 0.1 · v1 + 0.3 · v2 gilt ferner 0.2 0.1 . MSB = −0.4 0.3 F¨ ur die Koordinaten gilt
s1 t1 S . = MB s2 t2
86
3 Lineare Abbildungen und Matrizen
Frage 211 Sei F : V −→ W linear, B, B ′ seien Basen von V und C, C ′ seien Basen von W . K¨ onnen Sie erl¨autern, warum das Diagramm ′
n
K C CC CC κB′ CCC ! B′ MB V {= κB {{ { {{ {{ Kn
MCB′ (F )
F
/ Km y O y yy yyκ ′ y| y C
/W MCC′ bEE EEκC EE EE / K m.
MCB (F )
kommutativ ist und warum f¨ ur die beteiligten Matrizen ′
MCB′ (F ) = MCC′ · MCB (F ) · PBB
′
gilt? Antwort: Die beiden trapezf¨ ormigen Teildiagramme oben und unten sind nach den Antworten 199 bzw. 201 kommutativ, die beiden dreickigen Teildiagramme links und rechts nach Antwort 207. Daraus folgt die Kommutativit¨ at des gesamten Diagramms, und aus dieser ergibt sich auch unmittelbar die Formel.
3.6
Das Gauß’sche Eliminationsverfahren
Das Gauß’sche Eliminationsverfahren bietet eine praktikable Methode zur Bestimmung des Rangs einer Matrix sowie zur L¨ osung linearer Gleichungssysteme. Das dahinter liegende Prinzip ist es, eine Matrix durch eine Reihe von elementaren Zeilen- und Spaltenumformungen, die weder den Rang der Matrix noch die L¨ osungsmenge des Gleichungssystems ver¨ andern, auf sogenannte Zeilenstufenform zu transformieren, aus der sich die gesuchten Informationen unmittelbar ablesen“ ” lassen. Frage 212 Was versteht man unter der Zeilenstufenform einer Matrix A ∈ K m×n ? Wie l¨asst sich der Rang einer Matrix in Zeilenstufenform unmittelbar ablesen?
3.6 Das Gauß’sche Eliminationsverfahren
87
Antwort: Eine Matrix A ∈ K m×n ist in Zeilenstufenform, wenn Gestalt hat: ⎛ 0 · · · 0 a1 · · · ∗ ∗ · · · ∗ · · · ∗ · · · ∗ ∗ · · · ∗ ⎜0 · · · 0 0 · · · 0 a · · · ∗ · · · ∗ · · · ∗ ∗ · · · ∗ 2 ⎜ ⎜ ⎜0 · · · 0 0 · · · 0 0 · · · 0 · · · ∗ · · · ∗ ∗ · · · ∗ ⎜ ⎜ ··· ··· ··· ··· ··· ··· A=⎜ ⎜0 · · · 0 0 · · · 0 0 · · · 0 · · · 0 · · · 0 a · · · ∗ r ⎜ ⎜ ⎜0 · · · 0 0 · · · 0 0 · · · 0 · · · 0 · · · 0 0 · · · 0 ⎜ ⎝ ··· ··· ··· ··· ··· ··· 0···0 0···0 0···0 ··· 0···0 0···0
A die folgende
⎞
⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟. ⎟ ⎟ ⎟ ⎟ ⎟ ⎠
Aus dieser Zeilenstufenform folgt rg(A) = r, da die ersten r Zeilen von A linear unabh¨ angig sind. Frage 213 Welche Arten von Umformungen einer Matrix bezeichnet man als elementare Zeilenumformungen? Antwort: Es gibt drei Typen elementarer Zeilenumformungen. Typ I: Multiplikation einer Zeile mit einem Skalar α ∈ K ⎛ ⎞ ⎛ ⎞ ··· ··· ⎜ ⎟ ⎜ ⎟ ⎝ ai ⎠ −→ ⎝αai ⎠ ··· ···
Typ II: Additon des α-fachen der j-ten Zeile zur i-ten Zeile ⎞ ⎛ ⎛ ⎞ ··· ··· ⎜a + αa ⎟ ⎜a ⎟ j⎟ ⎜ i ⎜ i⎟ ⎟ ⎜ ⎜ ⎟ ⎜· · ·⎟ −→ ⎜ · · · ⎟ ⎟ ⎜ ⎜ ⎟ ⎝ aj ⎠ ⎝ aj ⎠ ··· ···
Typ III: Vertauschung zweier Zeilen ⎛ ⎞ ⎛ ⎞ ··· ··· ⎜a ⎟ ⎜a ⎟ ⎜ j⎟ ⎜ i⎟ ⎜ ⎟ ⎜ ⎟ − → ⎜· · ·⎟ ⎜· · ·⎟ ⎜ ⎟ ⎜ ⎟ ⎝ ai ⎠ ⎝ aj ⎠ ···
···
Analog definiert man elementare Spaltenumformungen, indem man in allen drei Definitionen das Wort Zeile“ durch Spalte“ ersetzt. ” ”
88
3 Lineare Abbildungen und Matrizen
Frage 214 Wieso ¨andert sich der Rang einer Matrix bei elementaren Zeilenumformungen nicht? Antwort: Es ist
⎧ ⎪ ⎨ span(a1 , . . . , αai , . . . , aj , . . . , an ) span(a1 , . . . , ai , . . . , aj , . . . , an ) = span(a1 , . . . , ai + αaj , . . . , aj , . . . , an ) ⎪ ⎩ span(a , . . . , αa , . . . , a , . . . , a ). 1 j i n
Damit ¨ andert sich die Dimension des von den Zeilenvektoren von A aufgespannten Untervektorraums – also rg A – durch elementare Zeilenumformungen nicht. Somit gilt Erh¨ alt man B ∈ K m×n aus A ∈ K m×n durch eine Reihe elementarer Zeilenumformungen, so gilt stets rg A = rg B. Frage 215
Was besagt der Satz u ¨ber das Gauß’sche Eliminationsverfahren?
Antwort: Der Satz besagt: Jede Matrix A ∈ K m×n l¨ asst sich durch eine Serie elementarer Zeilenumformungen auf Zeilenstufenform bringen. Beweis: Ist A nicht die Nullmatrix, dann gibt es einen kleinsten Spaltenindex j1 , so dass ai1 j1 = 0 f¨ ur ein i1 ∈ {1, . . . , m} gilt. Man vertausche die i1 -te Zeile mit der ersten (Umformung vom Typ I). Dies f¨ uhrt auf eine Matrix der Gestalt ⎞ ⎛ 0 · · · 0 a′11 · · · a′1r ⎟ ⎜ ⎜0 · · · 0 a′21 · · · a′2r ⎟ ′ ⎜ A =⎜ . .. .. ⎟ ⎟ . . ⎠ ⎝ .. 0 · · · 0 a′m1 · · · amr
mit a′11 = ai1 j1 = 0. Zu denjenigen Zeilen aus A′ mit dem Zeilenindex k (k = 1), in denen die unter a′11 stehende Komponente ungleich null ist, addiere man nun a′ das − ′11 -fache der ersten Zeile (elementare Zeilenumformung vom Typ II). Dies ak1 f¨ uhrt auf eine Matrix der Gestalt 0 · · · 0 a′11 ∗ ′′ A = 0 · · · 0 0 A(1) Dasselbe Verfahren l¨ asst sich nun auf die kleinere Matrix A(1) anwenden, wobei deren elementare Zeilenumformungen als solche von A′′ zu interpretieren sind. Rekursiv gewinnt man auf diese Weise die gew¨ unschte Zeilenstufenform. Das Verfahren bricht nach endlich vielen Schritten ab, und zwar genau dann, wenn nach m Schritten A(m) entweder die leere Matrix oder die Nullmatrix ist.
3.6 Das Gauß’sche Eliminationsverfahren
89
Wie lautet die Zeilenstufenform der Matrix ⎞ ⎛ 0 1 0 ⎟ ⎜ A = ⎝1 1 2⎠? 3 3 6
Frage 216
Antwort: Das Gauß’sche ⎛ 0 1 ⎜ ⎝1 1 3 3
Verfahren liefert ⎛ ⎛ ⎞ ⎞ ⎞ 1 1 2 1 1 2 0 ⎜ ⎜ ⎟ ⎟ ⎟ 2⎠ ⎝0 1 0⎠ ⎝0 1 0⎠ . 0 0 0 3 3 6 6
Welche Gestalt besitzt die Zeilenstufenform einer Matrix?
Frage 217
(i) A ∈ K m×n mit rg A = n (m ≥ n), (ii) A ∈ K m×n mit rg A = m (n ≥ m), (iii) A ∈ GL(n, K)? Antwort: Die Zeilenstufenformen der Matrizen sehen folgendermaßen aus: 0
1
∗ ∗
B B B B B (i) B B B B B @
∗ ··· ∗
0
0
C C C C C C C C ∗ C C A
B B B (ii) B B @
1
∗ ∗
∗ ··· ∗
0
∗
C C C C C A
0
B B B (iii) B B @
1
∗ ∗
∗ ··· ∗
0
∗
C C C C C A
Frage 218 Welche Typen von Elementarmatrizen sind Ihnen bekannt? Wie kann man sie definieren, warum sind sie invertierbar? Antwort: Es gibt im Wesentlichen drei Arten von Elementarmatrizen
⎛
⎞
1
⎜ ... ⎜ ⎜ α ⎜ .. ⎝ . ⎛1
1
⎟ ⎟ ⎟ ⎟ ⎠
⎜ ... ⎜ ⎜ 1 ··· α ⎜ . . .. ⎜ . . ⎜ ⎜ 1 ⎜ ⎝ ..
⎞
.
⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠
1
Typ I: (α = 0): Diese Elementarmatrizen unterscheiden sich von der Einheitsmatrix nur im Diagonalelement akk . Linksmultiplikation (Rechtsmultiplikation) mit einer solchen Matrix bewirkt eine Multiplikation der k-ten Zeile (Spalte) mit α. Typ II: Diese Elementarmatrizen unterscheiden sich von der Einheitsmatrix nur im Koeffizienten akl mit k = l. Linksmultiplikation (Rechtsmultiplikation) mit einer Matrix dieses Typs bewirkt eine Addition des α-fachen der l-ten Zeile zur kten Zeile (der k-ten Spalte zur l-ten Spalte).
90
⎛1
3 Lineare Abbildungen und Matrizen
⎜ ... ⎜ ⎜ 0 ··· 1 ⎜ .. . . .. ⎜ . . . ⎜ ⎜ 1 ··· 0 ⎜ ⎝ .. .
⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠
Typ III: Diese Elementarmatrizen unterscheiden sich von der Einheitsmatrix in den vier Koeffizienten akk , all , akl , alk . Linksmultiplikation (Rechtsmultiplikation) mit einer Matrix dieses Typs bewirkt eine Vertauschung der l-ten und k-ten Zeile (Spalte).
1 Elementarmatrizen sind invertierbar, weil sie Zeilen- bzw. Spaltenumformungen beschreiben, die umkehrbar sind. Bemerkung: Linksmultiplikation bewirkt immer eine Zeilenumformung, Rechtsmultiplikation eine Spaltenumformung. Jede Elementarmatrix bewirkt die Umformung, durch die sie aus der Einheitsmatrix entstanden ist. Frage 219 Begr¨ unden Sie: Die Matrix B ∈ K m×n entstehe aus der Matrix m×n A∈K , indem man auf A eine endliche Abfolge elementarer Zeilenumformungen anwendet. Wendet man diese Zeilenumformungen in derselben Weise auf die Einheitsmatrix Em an, so erh¨alt man eine Matrix P ∈ GL(m, K) mit P A = B. Antwort: Gilt Λr · · · Λ1 · A = B mit Elementarmatrizen Λ1 , . . . , Λr ∈ K m×m , so folgt wegen Em A = A P A = (Λr · · · Λ1 · Em )A = Λr · · · Λ1 · A = B. Da Elementarmatrizen genauso wie die Einheitsmatrix stets invertierbar sind, ist P ein Produkt invertierbarer Matrizen, und damit gilt P ∈ GL(n, K). Frage 220 Wie l¨asst sich mit dem Zusammenhang aus Frage 219 eine Methode zur Inversenbestimmung einer Matrix A ∈ GL(n, K) formulieren? Antwort: Die Matrix A l¨ asst sich durch eine Reihe elementarer Zeilenumformungen auf die Einheitsmatrix En transformieren. Es gibt also Elementarmatrizen Λ1 , . . . , Λr ∈ K n×n , so dass gilt En = Λr · · · Λ1 A = (Λr · · · Λ1 En )A. Daraus folgt Λr · · · Λ1 En = A−1 . Man erh¨ alt damit die Regel Erh¨ alt man En aus einer Reihe elementarer Zeilenumformungen aus A, so verwandeln dieselben Zeilumformungen die Matrix En in A−1 .
3.6 Das Gauß’sche Eliminationsverfahren
Frage 221
91
Erl¨autern Sie den Algorithmus zur Inversenbestimmung an der Matrix ⎞ ⎛ 0 1 −4 ⎟ ⎜ A := ⎝1 2 −2⎠ 1 1 2
Antwort: Um die Methode aus Antwort 220 praktisch anzuwenden, schreibe man die Matrizen A und E3 nebeneinander ⎛ ⎞ ⎛ ⎞ 1 0 0 0 1 −4 ⎜ ⎟ ⎜ ⎟ 1 0 ⎠ 2 −2 ⎠ , ⎝ 0 ⎝ 1 1 1 2 0 0 1
und transformiere A mittels elementarer Zeilenumformungen in die Einheitsmatrix. In jedem Schritt wird dieselbe Zeilenumformung auf die rechts stehende Matrix angewendet. Steht dann nach endlich vielen Schritten auf der linken Seite die Einheitsmatrix E3 , so steht rechts die zu A inverse Matrix A−1 . Dies liefert also ⎞ ⎛ ⎞ ⎛ 0 1 0 1 2 −1 ⎟ ⎜ ⎟ ⎜ ⎝ 0 0 0 ⎠ 1 −4 ⎠ , ⎝ 1 0 1 1 2 ⎛ 1 ⎛ 0 ⎞ ⎞ 1 2 −1 0 1 0 ⎜ ⎜ ⎟ ⎟ ⎝ 0 1 −4 ⎠ , ⎝ 1 0 0 ⎠ 3 1 ⎛ 0 −1 ⎛ 0 −1 ⎞ ⎞ 0 1 0 1 2 −1 ⎜ ⎜ ⎟ ⎟ ⎝ 0 0 0 ⎠ 1 −4 ⎠ , ⎝ 1 0 −1 1 ⎛ 0 ⎞ ⎛ 1 −1 ⎞ −1 2 −1 1 2 0 ⎜ ⎟ ⎜ ⎟ ⎝ 0 4 −4 ⎠ 1 0 ⎠ , ⎝ −3 1 0 −1 ⎛ 0 ⎛ 1 −1 ⎞ ⎞ 5 −6 7 1 0 0 ⎜ ⎜ ⎟ ⎟ ⎝ 0 4 −4 ⎠ . 1 0 ⎠ , ⎝ −3 −1 1 −1 0 0 1 Also ist
A−1
⎞ 5 −6 7 ⎟ ⎜ = ⎝−3 4 −4⎠ . −1 1 −1 ⎛
92
3.7
3 Lineare Abbildungen und Matrizen
Lineare Gleichungssysteme Teil 1
Die Theorie linearer Gleichungssysteme steht in engem Zusammenhang mit der linearer Abbildungen. Wie lineare Abbildungen K n −→ K m durch eine Matrix aus K m×n eindeutig bestimmt sind, lassen sich auch Gleichungssysteme mit m Gleichungen in n Unbekannten in der Form A · x = b schreiben, bei der A eine m × n-Matrix ist und b ein Vektor aus K m . Das Problem, die L¨ osungen des Gleichungssystems A · x = b zu bestimmen, ist damit in geometrischer Hinsicht aquivalent zu der Aufgabe, die Niveaumenge“ der durch x −→ A · x definierten ¨ ” linearen Abbildung FA : K n −→ K m zum Wert b zu ermitteln. Frage 222 Was versteht man unter einem linearen Gleichungssystem (LGS) mit Koeffizienten in K? Wann heißt ein Gleichungssystem homogen, wann inhomogen? Antwort: Unter einem Gleichungssystem in K mit m Gleichungen und n Unbekannten versteht man ein System von Gleichungen der Art a11 x1 a21 x1 am1 x1
+ ··· + ··· ··· + ···
+ a1n xn + a2n xn
= b1 = b2
+ amn xm
= bn .
(∗)
orpers K. Das Die Koeffizienten aij und die bi sind hier Elemente des Grundk¨ Gleichungssystem heißt homogen, falls bi = 0 f¨ ur i = 1, . . . , m gilt, andernfalls inhomogen. Eine L¨ osung des Gleichungssystems ist ein n-Tupel (x1 , . . . , xn ) mit Elementen aus K, f¨ ur welche alle m Gleichungen zutreffen. Mit der m × n-Matrix A = (aij ), dem Vektor b = (b1 , . . . , bm ) ∈ K m und dem unbekannten“ Vektor x = (x1 , . . . , xn )T ∈ K n l¨ asst sich (∗) auch schreiben in ” der Form A · x = b. Daher ist das Problem, s¨ amtliche L¨ osungen von (∗) zu finden, ¨ aquivalent zu dem Problem, alle Vektoren x ∈ K n zu bestimmen, welche die Gleichung A · x = b erf¨ ullen. Frage 223 Was versteht man unter dem L¨ osungsraum L(A, b) eines linearen Gleichungssystems A · x = b mit A ∈ K m×n und b ∈ K m ? Wie erh¨alt man aus der Definition sofort eine einfache Charakterisierung des L¨ osungsraums? Antwort: Der L¨ osungsraum ist die Menge aller L¨ osungen des Gleichungssystems A · x = b, also L(A, b) = {x ∈ K n ; A · x = b}. F¨ ur die lineare Abbildung F : K n −→ K m , x −→ A · x gilt L(A, b) = F −1 (b).
3.7 Lineare Gleichungssysteme Teil 1
93
Nach Frage 157 handelt es sich bei L(A, b) also um einen affinen Unterraum von K n. Frage 224 Sei A eine m × n-Matrix. Welche Struktur besitzt der L¨ osungsraum L(A, 0) des homogenen linearen Gleichungssystems A · x = 0? Was ist die Dimension von L(A, 0)? Antwort: Es gilt: Der L¨ osungsraum L(A, 0) des homogenen linearen Gleichungssystems A · x = 0 ist ein linearer Unterraum von K n der Dimension n − rg A. Beweis: Wegen A · 0 = 0 ist 0 ∈ L(A, 0). Ferner gilt mit x, y ∈ L(A, 0) und α, β ∈ K A · (αx + βy) = α · A · x + β · A · y = α · 0 + β · 0 = 0, also αx + βy ∈ L(A, 0). Der L¨ osungsraum ist damit ein linearer Unterraum von n K . F¨ ur die lineare Abbildung F : K n −→ K m , x −→ A·x gilt L(A, 0) = ker F . Mit der Dimensionsformel folgt daher dim ker F = dim K n − rg F , also dim L(A, b) = n − rg A. Frage 225 Sei das LGS A · x = b mit A ∈ K m×n und b ∈ K m l¨ osbar und es sei rg A = n. Warum besteht die L¨ osungsmenge dann nur aus einem Element? Antwort: Sei FA die durch A gegebene Abbildung. Aus der Dimensionsformel folgt dim ker FA = dim V − rg FA = n − rg A = 0, also ker FA = {0}. Damit ist FA injektiv, und es gibt h¨ ochstens ein x ∈ V mit FA (x) = A · x = b. Zusammen mit der Voraussetzung, dass das LGS l¨ osbar ist, folgt daraus, dass es genau eine L¨ osung gibt. Frage 226 K¨ onnen Sie ein Verfahren schildern, mit dem sich der L¨ osungsraum eines homogenen linearen Gleichungssystem A · x = 0 effektiv berechnen l¨asst? Antwort: Eine sinnvolle Methode zur Berechnung des L¨ osungsraums liefert das Gauß’sche Eliminationsverfahren, mit dessen Hilfe sich eine Basis von L(A, 0) konstruieren l¨ asst. Grundlage f¨ ur die Anwendbarkeit des Verfahrens ist die Tatsache, dass sich der L¨ osungsraum eines homogenen linearen Gleichungssystems A · x = 0 nicht ¨ andert, wenn man an A elementare Zeilenumformungen durchf¨ uhrt. Nach Frage 218 entsprechen elementare Zeilenumformungen an A der Linksmultiplikation von A mit einer Matrix S ∈ GL(m, K). Nun gilt (S · A) · x = 0 ⇔ A · x = 0,
94
3 Lineare Abbildungen und Matrizen
was man durch Multiplikation mit S bzw. S −1 der Gleichung auf der entsprechen¨ den Seite dieser Aquivalenz unmittelbar erkennt. Man kann also zur L¨ osung des Gleichungssystems A·x = 0 die Matrix A mittels des Gauß’schen Verfahrens auf eine Matrix A′ in Zeilenstufenform transformieosen. Da der L¨ osungsraum invariant ren und das Gleichungssystem A′ · x = 0 l¨ gegen¨ uber elementaren Zeilenumformungen ist, gilt L(A, 0) = L(A′ , 0). Dieses Vorgehen besitzt den Vorteil, dass sich die Struktur des L¨ osungsraumes an A′ bereits unmittelbar ablesen“ l¨ asst, wie wir im Folgenden darlegen wollen. ” ¨ Um die dazugeh¨ orige Uberlegungen zu vereinfachen, wollen wir annehmen, dass ′ A die spezielle Zeilenstufenform ⎞ ⎛ a11 a1n ⎜ a22 a2n ⎟ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ··· ⎟ ⎜ ⎟ ⎜ ··· ⎟ ⎜ ⎜ arn ⎟ arr ⎟ ⎜ ⎟ ⎜ 0 0 ··· 0 ⎟ ⎜ ⎟ ⎜ ⎠ ⎝ ··· 0
···
0
besitzt, bei der also die besetzten Zeilen jeweils mit einem Eintrag auf der Hauptdiagonalen beginnen. Diese Form l¨ asst sich immer durch Vertauschen der Spalten realisieren, was im Hinblick auf das Gleichungssystem einer Umnummerierung der Unbekannten x1 , . . . , xn entspricht. Die Voraussetzung an die Zeilenstufenform von A′ bedeutet daher keine wirkliche Einschr¨ ankung, macht die allgemeine Darstellung aber wesentlich u ¨bersichtlicher. Durch weitere Zeilenumformungen kann man A′ weiter auf die Form ⎛ ⎞ 1 0 0 a1,r+1 · · · a1n ⎜ 1 0 0 a1,r+1 · · · a2n ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ··· ⎜ ⎟ ⎜ ⎟ ··· ⎜ ⎟ ⎜ 1 ar,r+1 · · · arn ⎟ ⎜ ⎟ ⎜ ⎟ 0 0 · · · · · · 0 ⎜ ⎟ ⎜ ⎟ ⎝ ⎠ ··· ··· 0
···
···
0
bringen. Die i-te Gleichung des zu l¨ osenden linearen Gleichungssystems lautet damit n xi + aij xj = 0, i = 1, . . . , r. j=r+1
3.7 Lineare Gleichungssysteme Teil 1
Also gilt xi = −
n
95
aij xj ,
i = 1, . . . , r.
j=r+1
Mit dieser Darstellung lassen sich beliebige L¨ osungen nun unmittelbar angeben, da angigkeiten die Werte f¨ ur die Unbekannten xr+1 , . . . , xn nicht durch interne Abh¨ zwischen den Gleichungen festgelegt sind, mit anderen Worten frei gew¨ ahlt werden k¨onnen. F¨ ur jede Wahl der Werte xr+1 , . . . , xn ist also der Vektor ⎞ ⎛ n − j=r+1 a1j xj ⎟ ⎜ .. ⎟ ⎜ ⎟ ⎜ . ⎟ ⎜− n a x ⎟ ⎜ rj j j=r+1 x=⎜ ⎟ ⎟ ⎜ xr+1 ⎟ ⎜ .. ⎟ ⎜ ⎠ ⎝ . xn
eine L¨ osung des Gleichungssystems A′ · x = b. Umgekehrt besitzt jede L¨ osung dieses Gleichungssystems die Form (∗). Insbesondere erkennt man an dieser Darstellung noch einmal dim L(A′ , 0) = n − r, und durch die Wahl einer Basis von K n−r ist eine Basis von L(A′ , 0) festgelegt. Bez¨ uglich der Einheitsbasis etwa erh¨ alt man ⎞ ⎛ ⎞ ⎞ ⎛ ⎛ −a1,n −a1,r+2 −a1,r+1 ⎟ ⎜ ⎟ ⎟ ⎜ ⎜ ⎜ ··· ⎟ ⎜ ··· ⎟ ⎜ ··· ⎟ ⎟ ⎜ ⎟ ⎟ ⎜ ⎜ ⎜−ar,n ⎟ ⎜−ar,r+1 ⎟ ⎜−ar,r+2 ⎟ ⎟ ⎜ ⎟ ⎟ ⎜ ⎜ ⎜ 1 ⎟,⎜ 0 ⎟,...,⎜ 0 ⎟ ⎟ ⎜ ⎟ ⎟ ⎜ ⎜ ⎜ 0 ⎟ ⎜ 0 ⎟ ⎜ 1 ⎟ ⎟ ⎜ ⎟ ⎟ ⎜ ⎜ ⎟ ⎜ ⎟ ⎟ ⎜ ⎜ ⎝ ··· ⎠ ⎝ ··· ⎠ ⎝ ··· ⎠ 1 0 0
als Basis von L(A′ , 0). Durch eine entsprechende Anordnung der Zeilen, die die Umnummerierung der Unbekannten x1 , . . . , xn r¨ uckg¨ angig macht, erh¨ alt man daraus eine Basis von L(A, 0).
Frage 227 Sei A ∈ K m×n und b ∈ K m . Mit (A|b) sei diejenige Matrix aus m×(n+1) K bezeichnet, die man aus A durch Hinzuf¨ ugen der Spalte b erh¨alt. Es gilt dann A · x = b l¨ osbar ⇐⇒ rg(A|b) = rg A. K¨ onnen Sie diesen Zusammenhang zeigen?
96
3 Lineare Abbildungen und Matrizen
Antwort: Sei A · x = b l¨ osbar. Da der Rang von A durch Hinzuf¨ ugen einer Spalte nat¨ urlich nicht kleiner werden kann, gilt stets rg(A|b) ≥ rg A. Angenommen, es gilt rg(A|b) > rg A. Dann gilt b ∈ span(a1 , . . . , an ), wobei a1 , . . . , an die Spaltenvektoren aus A bezeichnen. In diesem Fall kann aber A · x = b nicht l¨ osbar sein, da f¨ ur eine L¨ osung x = (x1 , . . . , xn ) gelten muss a1 x1 + · · · + an xn = b, also b ∈ span(a1 , . . . , an ). Aus diesem Widerspruch folgt rg(A|b) = rg A. Gilt umgekehrt rg(A|b) = rg A, dann folgt b ∈ span(a1 , . . . , an ), also existiert eine Linearkombination x1 a1 + · · · xn an = b. Dies ist genau die Gleichung A · x = b. Der Vektor (x1 , . . . , xn )T ist in diesem Fall eine L¨ osung von A · x = b. Frage 228 K¨ onnen Sie zeigen, dass f¨ ur A ∈ K m×n das Gleichungssystem Ax = b m genau dann f¨ ur jedes b ∈ K l¨ osbar ist, wenn rg A = m gilt? Antwort: Gilt rg A = m, dann bilden die Spalten von A bereits ein Erzeugenugen eines Spaltenvektors b ∈ K m l¨ asst sich densystem von K m , und durch Hinzuf¨ rg A nicht mehr vergr¨ oßern. Es gilt also rg A = rg(A|b) f¨ ur jedes b ∈ K m , und damit ist Ax = b nach Frage 227 l¨ osbar. Ist umgekehrt Ax = b f¨ ur jedes b ∈ K m l¨ osbar, so gilt rg A = rg(A|b) f¨ ur jedes b ∈ K m . Das bedeutet, dass die Spaltenvektoren von A bereits ein Erzeugendensystem von K m bilden und daher rg A = m gelten muss. Frage 229 K¨ onnen Sie zeigen, dass f¨ ur A ∈ M (n, K) die folgenden Aussagen ¨aquivalent sind? (i) (ii) (iii) (iv)
Das homogene LGS A · x = 0 hat nur die triviale L¨ osung x = 0. F¨ ur jedes b ∈ K n hat das LGS A · x = b mindestens eine L¨ osung. F¨ ur jedes b ∈ K n hat das LGS A · x = b genau eine L¨ osung. rg A = n.
Antwort: (i) =⇒ (iv): Sei FA die zu A assoziierte Abbildung. Hat das LGS A ·x = 0 nur die triviale L¨ osung, dann ist ker FA = {0}, und aus der Dimensionsformel folgt rg A = rg FA = dim K n = n. (iv) =⇒ (ii): Aus rg A = n folgt rg A = rg(A|b) f¨ ur jeden Vektor b ∈ K n , und damit ist das LGS A · x = b l¨ osbar f¨ ur jeden Vektor b ∈ K n . (ii) =⇒ (iii): Die Gleichung A · x = b besagt, dass sich der Vektor b als Linearkombination der Spaltenvektoren a1 , . . . , an von A schreiben l¨ asst: x1 a1 + · · · + xn an = b.
3.8 Der Dualraum
97
Diese Darstellung ist eindeutig, sofern die Spalten von A linear unabh¨ angig sind. G¨abe es daher f¨ ur ein b ∈ K n mehrere L¨ osungen des Gleichungssystems A · x = b, so w¨ aren die Spalten von A linear abh¨ angig und folglich kein Erzeugendensystem von K n . Damit g¨ abe es einen von den Spalten von A linear unabh¨ angigen Vektor ur diesen bes¨ aße das LGS A · x = b′ keine L¨ osung. b′ ∈ K n , und f¨ (iii) =⇒ (i): Man setze b = 0. Frage 230 Wie erh¨alt man s¨amtliche L¨ osungen eines inhomogenen linearen Gleichungssystems A · x = b? Antwort: Es gilt: Ist xinh eine spezielle L¨ osung des inhomogenen Systems A · x = b, so besitzt jede weitere L¨ osung x0 die Form x0 = xinh + xhom , wobei xhom eine L¨ osung des homogenen Systems A · x = 0 ist. Es gilt also L(A, b) = xinh + L(A, 0). Beweis: F¨ ur einen beliebigen Vektor xhom ∈ L(A, 0) gilt A · x0 = A · (xinh + xhom ) = A · xinh + A · xhom = b + 0 = b. Es folgt xinh + L(A, 0) ⊂ L(A, b). Umgekehrt gilt f¨ ur x0 ∈ L(A, b) A · (x0 − xinh ) = A · x0 − A · xinh = b − b = 0, also x0 − xinh ∈ L(A, 0) bzw. x0 ∈ xinh + L(A, 0). Das zeigt die andere Inklusion.
3.8
Der Dualraum
Ist F eine lineare Abbildung K n −→ K, dann gilt f¨ ur jeden Vektor x = (x1 , . . . , xn )T n αi xi F (x) = i=1
mit bestimmten αi ∈ K. Der Vektor v := (α1 , . . . , αn )T gibt also Anlass zu einer linearen Abbildung K n −→ K. Umgekehrt l¨ asst sich jede lineare Abbildung K n −→ K durch genau einen Vektor v ∈ K n beschreiben. Unter Ber¨ ucksichtigung der f¨ ur endlich-dimensionale Vektorr¨ aume V g¨ ultigen Isomorphie V ≃ K n erkennt man, dass die Struktur jedes endlich-dimensionalen Vektorraums V sich in derjenigen des Raums der linearen Abbildungen V −→ K in isomorpher Weise widerspiegelt, was eine Untersuchung des Dualraums V ∗ = HomK (V, K) motiviert. Eine Theorie dualer R¨ aume l¨ asst sich auch f¨ ur unendlich-dimensionale Vektorr¨ aume entwickeln, allerdings lassen sich die meisten der hier behandelten S¨ atze nicht ohne Weiteres auf den unendlich-dimensionalen Fall u ¨bertragen.
98
3 Lineare Abbildungen und Matrizen
Frage 231 Was versteht man unter einer Linearform auf einem K-Vektorraum V , was unter dem zu V dualen Vektorraum V ∗ ? Antwort: Eine Linearformist eine lineare Abbildung V −→ K. Beispielsweise n n ist durch (x1 , . . . , xn ) −→ i=1 xi eine Linearform auf K gegeben. Spezielles Interesse in der Analysis haben die Abbildungen b df f (x) dx und f −→ f −→ . dx x0 a
Diese sind ebenfalls Linearformen auf den entsprechenden R¨ aumen der integrierbaren bzw. differenzierbaren Funktionen.
Der zu V duale Vektorraum V ∗ ist die Menge aller Linearformen auf V , also V ∗ = HomK (V, K). Frage 232 Sei V endlich-dimensional, B = (v1 , . . . , vn ) eine Basis von V . Wie erh¨alt man daraus die zu B duale Basis B∗ von V ∗ ? Antwort: Setzt man vi∗ (vj )
1 f¨ ur i = j, = δij = 0 sonst,
so ist B∗ = (v1∗ , . . . , vn∗ ) eine Basis von V ∗ . Beweis: B ∗ ist ein Erzeugendensystem f¨ ur V ∗ . Ist n¨ amlich ξ eine Linearform auf V , die auf den Basisvektoren die Werte ξ(v ) = α i i ∈ K annimmt, dann gilt ξ= αi vi∗ . Vektoren in B ∗ sind ferner linear unabh¨ angig. Aus der Gleichung Die n ∗ amlich, indem man vj einsetzt, αj = 0 f¨ ur alle j = 1, . . . , n. i=1 αi vi = 0 folgt n¨ Frage 233
Wieso sind die R¨aume V und V ∗ isomorph?
Antwort: Bei gegebener Basis B = (v1 , . . . , vn ) von V ist die durch ΨB (vi ) = vi∗ gegebene lineare Abbildung nach Frage 232 ein Isomorphismus V −→ V ∗ .
Frage 234 Warum l¨asst sich das Verfahren aus Frage 232 zur Konstruktion einer dualen Basis nicht auch auf unendlich-dimensionale Vektorr¨aume verallgemeinern?
3.8 Der Dualraum
99
Antwort: Ist (v1 , v2 , . . .) ein unendliches Erzeugendensystem, dann enth¨ alt die Menge αi vi∗ ; αi = 0 f¨ ur fast alle i span(v1∗ , v2∗ , . . .) = i∈N
nur diejenigen Linearformen ξ, f¨ ur die ξ(vi ) = 0 f¨ ur fast alle i ∈ N gilt. Andererseits l¨ asst sich auch f¨ ur einen unendlich-dimensionalen Vektorraum eine Linearform V −→ K konstruieren, indem man die Bilder der Basisvektoren beliebig vorgibt. Insbesondere existieren Linearformen V −→ K, die auf unendlich vielen Basisvektoren Werte = 0 annehmen. Daraus folgt span(v1∗ , v2∗ , . . .) = V ∗ , die Linearformen v1∗ , v2∗ , . . . bilden also kein Erzeugendensystem f¨ ur V ∗ . Frage 235 Man betrachte die Basis (v1 , v2 ) des R2 mit v1 = e1 = (1, 0)T und ∗ T v2 = (1, 1) . Wie lautet die dazu duale Basis (v1∗ , v2∗ ) von R2 ? Antwort: Die Gleichungen v1∗ (v1 ) = v2∗ (v2 ) = 1, v1∗ (v2 ) = v2∗ (v1 ) = 0 liefern v1∗ = (1, −1) und v2∗ = (0, 1). Frage 236 Sei U ⊂ V Untervektorraum eines K-Vektorraums V . Wie ist der Annulator U 0 von U definiert? Antwort: Unter dem Annulator versteht man die Menge ur alle u ∈ U }. U 0 = {ξ ∈ V ∗ ; ξ(u) = 0 f¨
Frage 237
Wieso gilt dim U 0 = dim V − dim U,
falls V endlich-dimensional ist? anze diese zu einer Antwort: Man betrachte eine Basis (u1 , . . . , uℓ ) von U und erg¨ Basis (u1 , . . . , uℓ , v1 , . . . , vr ) von V . Es gen¨ ugt dann zu zeigen, dass (v1∗ , . . . , vr∗ ) eine Basis von U 0 ist. Die lineare Unabh¨ angigkeit ist klar, da v1 , . . . , vr linear unabh¨ angig sind. Es bleibt also U 0 = span(v1∗ , . . . , vr∗ ) zu zeigen, wobei die Inklusion ⊃“ wiederum trivial ist, da nach Konstruktion der ” ur alle i = 1, . . . , r und alle j = 1, . . . , ℓ gilt. Um ⊂“ zu dualen Basis vi∗ (uj ) = 0 f¨ ” 0 zeigen, sei ξ ∈ U und ξ = α1 u∗1 + · · · + αℓ u∗ℓ + β1 v1∗ + · · · + βr vr∗ . ur i = 1, . . . , ℓ, also ξ ∈ span(v1∗ , . . . , vr∗ ). Einsetzen von ui liefert dann αi = 0 f¨
100
3 Lineare Abbildungen und Matrizen
Frage 238 Was versteht man unter der zu einer linearen Abbildung F : V −→ W zwischen K-Vektorr¨aumen V und W dualen Abbildung F ∗ ? Wieso ist F ∗ linear? Antwort: Die zu F : V −→ W duale Abbildung ist definiert durch F ∗ : W ∗ −→ V ∗ ,
ξ −→ ξ ◦ F.
F¨ ur jede auf W definierte Linearform ξ ist damit F ∗ (ξ) eine Linearform auf V . Die Wirkung der dualen Abbildung besteht also darin, auf W definierte Linearformen auf V zur¨ uckzuholen“. Das wird in dem nebenstehenden ” Diagramm beschrieben. Seien ξ, χ ∈ V
∗
V A AA AA F ∗ (ξ) AA
F
K
/W | | || || ξ | ~|
∗
und α ∈ K. Die Linearit¨ at von F folgt aus
F ∗ (ξ + χ) = (ξ + χ) ◦ F = ξ ◦ F + χ ◦ F = F ∗ (ξ) + F ∗ (χ) F ∗ (αξ) = (αξ) ◦ F = α(ξ ◦ F ) = αF ∗ (ξ).
Frage 239 Wieso gilt (F ◦ G)∗ = G∗ ◦ F ∗ f¨ ur zwei K-lineare Abbildungen F, G ∈ HomK (V, W )? Antwort: F¨ ur jede Linearform ξ ∈ W ∗ hat man (F ◦ G)∗ (ξ) = ξ ◦ (F ◦ G) = (ξ ◦ F ) ◦ G = (F ∗ (ξ)) ◦ G = G∗ (F ∗ (ξ)) = (G∗ ◦ F ∗ )(ξ). Daraus folgt (F ◦ G)∗ = G∗ ◦ F ∗ wie gew¨ unscht.
Frage 240 Seien V und W endlich-dimensionale Vektorr¨aume mit Basen B und C und F : V −→ W eine lineare Abbildung. K¨ onnen Sie beweisen, dass f¨ ur die Darstellungsmatrizen der folgende Zusammenhang gilt: T ∗ MBC∗ (F ∗ ) = MCB (F ) ,
mit anderen Worten, dass die duale Matrix bez¨ uglich der dualen Basen durch die transponierte Matrix beschrieben wird?
Antwort: Sei B = (v1 , . . . , vn ) und C = (w1 , . . . , wm ). Mit MCB (F ) = (aij ) gilt m F (vj ) = i=1 aij wi , und durch Anwendung von wi∗ auf beide Seiten der Gleichung erh¨ alt man wi∗ F (vj ) = aij , also F ∗ (wi∗ )(vj ) = aij . (∗) ∗ n Umgekehrt: Ist MBC∗ (F ∗ ) = (bji ), so hat man F ∗ (wi∗ ) = j=1 bji vj∗ , und Einsetzen von vj liefert F ∗ (wi )(vj ) = bji , Zusammen mit (∗) folgt bji = aij , also die Behauptung.
3.8 Der Dualraum
Frage 241 (i) (ii)
101
K¨ onnen Sie zeigen:
Ist F injektiv, so ist F ∗ surjektiv. Ist F surjektiv, so ist F ∗ injektiv.
Antwort: (i) Sei F injektiv. Es gilt zu zeigen, dass zu jeder Linearform χ ∈ V ∗ eine Linearform ξ ∈ W ∗ mit F ∗ (ξ) = ξ ◦ F = χ existiert. Dazu zerlegen wir F in die beiden Abbildungen F1 : V −→ im F und F2 : im F ֒→ W . Wegen der Injektivit¨ at von F ist F1 bijektiv, und daher kann man durch χ′ := χ ◦ F1−1 eine Linearform χ′ : im F −→ K definieren, f¨ ur die χ = χ′ ◦ F1 gilt. Um χ′ auf ganz W fortzusetzen, w¨ ahle man ein Komplement U zu im F in W , so dass also W = im F ⊕ U gilt, und f¨ ur w + u ∈ im F ⊕ U definiere man die Linearform ξ : W −→ K durch ξ(w + u) = χ′ (w). F¨ ur jedes v ∈ V gilt dann ξ F (v) = χ′ F (v) = χ′ F1 (v) = χ(v), also ξ ◦ F = χ wie gew¨ unscht. F1
/ im F F2 / W vv vv v ξ vvv χ′ χ vv vvv v vv {vvv K
V
(ii) Sei F : V −→ W surjektiv. Dann gibt es zu jedem w ∈ W ein v ∈ V mit F (v) = w, und aus F ∗ (ξ) = F ∗ (ξ ′ ) folgt dann ξ(w) = ξ(F (v)) = F ∗ (ξ)(v) = F ∗ (ξ ′ )(v) = ξ ′ (F (v)) = ξ ′ (w). Da diese Gleichung f¨ ur alle w ∈ W gilt, folgt ξ = ξ ′ , also die Injektivit¨ at von F ∗ . Frage 242 K¨ onnen Sie zeigen, dass f¨ ur eine lineare Abbildung F : V −→ W zwischen endlich-dimensionalen Vektorraumen stets rg F = rg F ∗ gilt? Antwort: Man betrachte die folgende Aufspaltung von F F: V
F1
/ im F
F2
/ W,
in eine surjektive Abbildung F1 und eine injektive Abbildung F2 . Nach Frage 239 induziert dies die duale Sequenz F∗: W∗
F2∗
/ (im F )∗
F1∗
/ V ∗,
bei der nun nach Frage 241 F2∗ surjektiv und F1∗ injektiv ist. Das bedeutet, dass (im F )∗ durch F1∗ bijektiv auf im F ∗ abgebildet wird, und daraus folgt rg F ∗ = dim im F ∗ = dim(im F )∗ = dim(im F ) = rg F.
102
3 Lineare Abbildungen und Matrizen
Frage 243 K¨ onnen Sie mit den Mitteln der Dualraumtheorie noch einmal einen Beweis daf¨ ur liefern, dass f¨ ur jede Matrix A ∈ K m×n Spalten- und Zeilenrang u ¨bereinstimmen? Antwort: Sei FA die durch A beschriebene Matrix. Mit den Antworten 240 und 242 erh¨ alt man rgs A = rg FA = rg FA∗ = rgs AT = rgz A.
Frage 244
K¨ onnen Sie zeigen, dass V und V ∗∗ kanonisch isomorph sind?
Antwort: F¨ ur v ∈ V definiere man die Abbildung v ∗∗ : V ∗ −→ K durch v ∗∗ (ξ) = ξ(v) f¨ ur alle ξ ∈ V ∗ . Dann ist die Abbildung Φ : V −→ V ∗∗ ,
v −→ v ∗∗
ein Isomorphismus von Vektorr¨ aumen. Beweis: Φ ist ein Homomorphismus, denn f¨ ur alle v, w ∈ V , alle α ∈ K und alle ξ ∈ V ∗ gilt Φ(v + w)(ξ) = (v + w)∗∗ (ξ) = ξ(v + w) = ξ(v) + ξ(w) = v ∗∗ (ξ) + w∗∗ (ξ) = Φ(v)(ξ) + Φ(w)(ξ), Φ(αv)(ξ) = (αv)∗∗ (ξ) = ξ(αv) = αξ(v) = αv ∗∗ (ξ) = αΦ(v)(ξ). Daraus folgt Φ(v + w) = Φ(v) + Φ(w) und Φ(αv) = αΦ(v), also die Linearit¨ at von Φ. Ist B = (v1 , . . . , vn ) eine Basis von V und B ∗ = (v1∗ , . . . , vn∗ ) die hierzu duale Basis, dann gilt vi∗∗ (vj∗ ) = vj∗ (vi ) = δji . Also ist B ∗∗ = (v1∗∗ , . . . , vn∗∗ ) die duale Basis zu B ∗ . Das heißt, dass Φ Basen von V auf Basen von V ∗∗ abbildet und damit notwendigerweise ein Isomorphismus ist.
4 Determinanten Die Determinante ordnet jeder linearen Abbildung zwischen endlich-dimensionalen K-Vektorr¨ aumen der gleichen Dimension einen Wert aus dem Grundk¨ orper K zu. Sie ist eine wichtige Kenngr¨ oße linearer Abbildungen. So liefert die Determinante z. B. ein Invertierbarkeitskriterium f¨ ur quadratische Matrizen und eine L¨ osungsformel f¨ ur lineare Gleichungssysteme (Cramer’sche Regel). Die Determinantenabbildung besitzt f¨ ur reelle Vektorr¨ aume eine anschauliche geometrische Interpretation. Sind v1 , . . . , vn Vektoren im Rn , so gibt | det(v1 , . . . , vn )| gerade das Volumen des durch diese n Vektoren aufgespannten Parallelotops im Rn an. x2 v+w
d w b
v
c
a
x1
F¨ ur zwei Vektoren v = (a, b)T und w = (c, d)T best¨ atigt man dies etwa, indem man die von v und w eingeschlossene Fl¨ ache A elementargeometrisch berechnet. Man erh¨ alt A = (a + c) · (b + d) − ab − cd − 2 · bc = ad − bc = det(v1 , v2 ). Der Fl¨ acheninhalt betr¨ agt genau dann null, wenn die Vektoren linear abh¨ angig sind. Als geometrische Kenngr¨ oße tritt die Determinante auch in der mehrdimensionalen Analysis in Erscheinung, insbesondere als Funktionaldeterminante, die als Maß f¨ ur die infinitesimale Volumenverzerrung einer Funktion interpretiert werden kann. Damit h¨ angt auch die Rolle der Determinante bei der Integraltransformationsformel zusammen. Abschließend sei auch noch die Rolle der Determinante bei der Bestimmung der Eigenwerte einer linearen Abbildung (s. Kapitel 5.1) erw¨ ahnt.
104
4.1
4 Determinanten
Alternierende Multilinearformen
Wir f¨ uhren die Determinante auf M (n, k) im Anschluss an Weierstraß als spezielle alternierende Multilinearform V n −→ K ein, die durch die Eigenschaft der Normiertheit eindeutig bestimmt ist. Frage 245 Sei V ein n-dimensionaler K-Vektorraum. Was versteht man unter einer alternierenden k-Form (alternierende Multilinearform vom Grad k) auf V ? Was ist eine Determinantenform auf V ? Antwort: Eine alternierende k-Form auf V ist eine Abbildung g : V k −→ K,
(v1 , . . . , vk ) −→ d(v1 , . . . , vk ),
die (a)
multilinear, d. h. linear in jeder Komponente ist, so dass also f¨ ur jedes α, α′ ∈ K gilt g(. . . , αvi + α′ vi′ , . . .) = αg(. . . , vi , . . .) + α′ g(. . . , vi′ , . . .)
(b)
alternierend ist in dem Sinne, dass g verschwindet, falls zwei der k Argumente identisch sind g(. . . , v, . . . , v, . . .) = 0
f¨ ur jedes v ∈ V
Eine n-Form auf einem n-dimensionalen Vektorraum heißt Determinantenform. Frage 246
Wann heißt eine k-Form auf V schiefsymmetrisch (antisymmetrisch)?
Antwort: Eine k-Form heißt antisymmetrisch, wenn die Form bei Vertauschung von zwei der k Variablen v1 , . . . , vk ihr Vorzeichen wechselt. Frage 247
Warum sind alternierende k-Formen stets schiefsymmetrisch?
Antwort: F¨ ur eine alternierende k-Form g gilt g(. . . , vi , . . . , vj , . . .) + g(. . . , vj , . . . , vi , . . .) = g(. . . , vi + vj , . . . , vi + vj , . . .) = 0, also g(. . . , vi , . . . , vj , . . .) = −g(. . . , vj , . . . , vj , . . .).
105
4.1 Alternierende Multilinearformen
Frage 248 Sei g eine alternierende k-Form und π eine Permutation aus Sk . K¨ onnen Sie g(vπ(1) , . . . , vπ(k) ) durch g(v1 , . . . , vk ) ausdr¨ ucken? Antwort: Es ist g(vπ(1) , . . . , vπ(k) ) = sign π · g(v1 , . . . , vk ). Das folgt aus der Schiefsymmetrie von g, wenn man π als Produkt von Transpositionen (vgl. Frage 49) schreibt. Frage 249 Ist char(K) = 2, wieso ist dann jede schiefsymmetrische k-Form auch alternierend? Antwort: Jede schiefsymmtrische k-Form ist f¨ ur char(K) = 2 wegen 1 1 g(. . . , v, . . . , v, . . .) = g(. . . , v, . . . , v, . . .) + g(. . . , v, . . . , v, . . .) 2 2 1 1 = g(. . . , v, . . . , v, . . .) + d(. . . , v, . . . , v, . . .) 2 2 1 1 = g(. . . , v, . . . , v, . . .) + g(. . . , v, . . . , v, . . .) = 0 2 2 auch alternierend (man beachte, dass die Division durch 2 nur f¨ ur char(K) = 2 erlaubt ist). Frage 250 K¨ onnen Sie den folgenden Zusammenhang zeigen? Ist f : V k −→ K eine alternierende k-Form, dann ist g(v1 , . . . , vk ) = 0 f¨ ur jedes linear abh¨angige kTupel (v1 , . . . , vk ). Antwort: L¨ asst sich vj aus den u ¨brigen k − 1 Vektoren linear kombinieren, so folgt k k αi vi , . . . = αi g(. . . , vi , . . .). g(. . . , vj , . . .) = g . . . , i=1, i=j
i=1, i=j
In jedem der k−1 Summanden αi g(. . . , vi , . . .) kommt der Vektor vi genau zweimal als Argument von g vor. Daher verschwindet jeder Summand und somit auch g(v1 , . . . , vk ). Frage 251 Nullform?
Warum ist im Fall k > n = dim V jede alternierende k-Form die
Antwort: F¨ ur k > dim V sind die k Argumente der alternierenden k-Form in jedem Fall linear abh¨ angig. Der Zusammenhang folgt daher aus Frage 250.
106
4 Determinanten
Frage 252 K¨ onnen Sie zeigen, dass die alternierenden k-Formen auf V einen Vektorraum Altk (V ) bilden? Antwort: Setzt man f¨ ur zwei k-Formen g und f (f + g)(v1 , . . . , vk ) = f (v1 , . . . , vk ) + g(v1 , . . . , vk ) (αf )(v1 , . . . , vk ) = α · f (v1 , . . . , vk ),
(∗) (∗∗)
so u uft man leicht, dass f + g und αf ebenfalls alternierende k-Formen sind. ¨berpr¨ Zusammen mit den in (∗) und (∗∗) definierten Verkn¨ upfungen wird die Menge der alternierenden k-Formen auf V damit zu einem Vektorraum Altk (V ). Frage 253
Welche Dimension hat Altk (V )?
Antwort: Da jedes g ∈ Altk (V ) multilinear und alternierend ist, ist g bereits eindeutig durch die nk Werte g(ei1 , ei2 , . . . , eik )
mit i1 < i2 < · · · ik ,
festgelegt, wobei die eik Basisvektoren aus V sind. Aufgrund dieser Eigenschaft ist es naheliegend, eine Basis von Altk (V ) zu konstruieren, indem man die Werte der Basisformen auf den n-Tupeln (ei1 , . . . , eik ) explizit so festlegt, dass diese linear unabh¨ angig sind. Das funktioniert folgendermaßen. F¨ ur jedes geordnete k-Tupel (i1 , . . . , ik ) mit 1 ≤ ij ≤ n und i1 < . . . < ik definiere man die Multilinearform di1 ,...,ik durch ⎧ ⎪ ⎨ sign τ falls j1 , . . . , jk aus einer Permutation τ i1 ,...,ik von i1 , . . . , ik hervorgeht (∗) (ej1 , . . . , ejk ) = d ⎪ ⎩ 0 sonst.
Man sieht dann leicht, dass die Multilinearformen di1 ,...,ik alternierend sind, durch die Vorschrift (∗) bereits eindeutig festgelegt sind und daher Elemente aus Altk (V ) sind. Ferner sind die alternierenden k-Formen di1 ,...,ik linear unabh¨ angig, denn aus g= ai1 ,...,ik di1 ,...,ik = 0 (∗) i1 <···
folgt insbesondere, dass g f¨ ur jedes System aus k Basisvektoren gleich null ist und daher die Koeffizienten ai1 ,...,ik alle verschwinden. Ferner besitzt jede alternierende k-Form g eine Darstellung der Form (∗). Die rechte Seite in (∗) hat n¨ amlich f¨ ur alle k-Tupel (ej1 , . . . , ejk ) mit j1 < . . . < jk dieselben Werte wie g und stimmt daher aus Linearit¨ atsgr¨ unden f¨ ur alle k-Tupel (v1 , . . . , vk ) beliebiger Vektoren aus V mit g u berein. ¨ Damit ist gezeigt, dass die nk alternierenden k-Formen di1 ,...,ik mit i1 < . . . < ik eine Basis von Altk (V ) bilden. Es ist also n
. dim Altk (V ) = k
4.2 Determinanten von Matrizen und Endomorphismen
Frage 254
107
Sei (v1 , . . . , vn ) eine Basis von V . Wieso gilt dann f¨ ur f, g ∈ Altn (V ) f (v1 , . . . , vn ) = g(v1 , . . . , vn ) ⇐⇒ f = g?
Antwort: Wegen dim Altn (V ) = 1 ist g ein skalares Vielfaches von f , g = αf . Aus f (v1 , . . . , vn ) = a mit a = 0 folgt also g(v1 , . . . , vn ) = αa. Stimmen f und g auf den Basisvektoren u ¨berein, dann ist also α = 1 und damit f = g. Im Fall a = 0 ist f die Nullform und aus g(v1 , . . . , vn ) = 0 folgt dann auch g = 0. Die Umkehrung des Zusammenhangs ist trivial.
4.2
Determinanten von Matrizen und Endomorphismen
Als spezielle Multilinearform auf K n l¨ asst sich die Determinante zun¨ achst f¨ ur Matrizen aus M (n, K) definieren, indem man det(A) = det(a1 , . . . , an ) setzt, wobei a1 , . . . , an die Spaltenvektoren von A bezeichnen. Dies erlaubt auch unmittelbar, die Determinante f¨ ur lineare Abbildungen F : K n −→ K n einzuf¨ uhren, etwa durch det(F ) = F (e1 ), . . . , F (en ) . Dabei ist allerdings nicht a priori klar, dass man dasselbe Ergebnis erh¨ alt, wenn man statt der Standardbasis eine beliebige Basis des K n w¨ ahlt. Dass dies aber tats¨ achlich der Fall ist, h¨ angt damit zusammen, dass ¨ ahnliche Matrizen dieselbe Determinante besitzen. Frage 255
n
Was versteht man unter der Determinante auf M (n, K) ≃ (K n ) ?
Antwort: Die Determinante ist die (eindeutig bestimmte) alternierende normierte Multilinearform auf (K n )n . Dabei bedeutet die Normiertheit, dass die Determinante der Standardbasis den Wert 1 hat. n Aufgrund des Isomorphismus M (n, K) ≃ (K n ) k¨ onnen wir die Determinante gleichermaßen auf Matrizen aus M (n, K) anwenden wie auf k-Tupel von Vektoren aus K n . F¨ ur A ∈ K n×n definiere man einfach det(A) = det(a1 , . . . , an ), wobei a1 , . . . , an die Spaltenvektoren von A sind. Frage 256 bestimmt?
Wieso ist die Determinante durch die Normiertheitsforderung eindeutig
Antwort: Aus Linearit¨ atsgr¨ unden ist die Determinante durch ihre Wirkung auf die Basisvektoren bereits eindeutig festgelegt. Oder anders: Wegen dim Altk (V ) = 1 und weil det nicht die Nullform ist, ist jedes Element aus g ∈ Altk (V ) ein Vielfaches von det, also g = α det. Aus g(e1 , . . . , en ) = 1 = det(e1 , . . . , en ) folgt dann bereits α = 1, also g = det.
108
4 Determinanten
Frage 257
Erl¨autern Sie die Existenz der Determinante im Fall n = 1 und n = 2.
Antwort: Im Fall n = 1 ist die Determinante gerade die identische Abbildung det(a) = a
f¨ ur jedes a ∈ K = K 1×1 .
F¨ ur n = 2 ist die Determinante durch die Abbildung Δ : R2 × R2 −→ R, (a, b)T , (c, d)t −→ ad − bc gegeben.
Frage 258
K¨ onnen Sie begr¨ unden, warum f¨ ur eine Diagonalmatrix ⎛ ⎞ α1 0 ⎟ ⎜ .. D = Diag(α1 , . . . , αn ) = ⎝ ⎠ . 0
gilt
αn
det(D) = α1 · · · αn ? Antwort: Es ist det(D) = det(α1 e1 , α2 e2 , . . . , αn en ) = α1 · · · αn det(e1 , . . . , en ) = α1 · · · αn .
Frage 259 gr¨ unden?
Seien A, B ∈ M (n, K). K¨ onnen Sie folgende Zusammenh¨ange be-
(a)
Geht B aus A durch Multiplikation einer Spalte mit einem Skalar r ∈ K hervor, so gilt det B = r · det A.
(b)
Entsteht B aus A durch Vertauschen von zwei Spalten, so gilt det B = − det A.
(c)
Entsteht B aus A durch Addition des α-fachen einer Spalte von A zu einer anderen Spalte von A (α ∈ K), so gilt det B = det A.
Antwort: Mit a1 , . . . , an seien die Spalten von A und entsprechend mit b1 , . . . , bn die Spalten von B bezeichnet. Man erh¨ alt (a)
det(B) = det(a1 , . . . , rai , . . . , an ) = r · det(a1 , . . . , ai , . . . , an ) = r · det(A).
4.2 Determinanten von Matrizen und Endomorphismen
(b)
Folgt unmittelbar aus der Schiefsymmetrie von det (vgl. Frage 247).
(c)
det(B) = det(. . . , ai + αaj , . . . , aj , . . .) = det(. . . , ai , . . . , aj , . . .) + α det(. . . , aj , . . . , aj , . . .) = det A + 0.
109
Aus diesen Formeln folgt insbesondere im Zusammenhang mit Antwort 258 f¨ ur Elementarmatrizen Λ ∈ K n×n die Multiplikationsformel det(ΛA) = det(Λ) det(A). Frage 260
Wieso gilt f¨ ur eine obere Dreiecksmatrix ⎞ ⎛ a11 ∗ ⎟ ⎜ .. A := ⎝ ⎠ . 0
stets
ann
det(A) = a11 · · · ann ? Antwort: Durch wiederholte Addition eines Vielfachen einer Spalte zu einer anderen l¨ asst sich A auf Diagonalform A′ = Diag(a11 , . . . , ann ) bringen. Nach Antwort 259 (c) und 258 gilt det(A) = det(A′ ) = a11 · · · ann . Frage 261
Wieso gilt f¨ ur A ∈ K n×n
rg(A) = n d. h., A ist invertierbar ⇐⇒ det A = 0? Antwort: Wenn rg A < n ist, dann kann man durch elementare Spaltenumformungen, die det A nicht ¨ andern, eine Nullspalte erzeugen. Also ist in diesem Fall det A = 0. Ist dagegen rg A = n, dann kann man nur durch Spaltenumformungen eine obere Dreiecksmatrix erzeugen, deren Diagonalemente von null verschieden sind. Nach Frage 258 gilt dann det A = 0. Frage 262 Was besagt die Cramer’sche Regel f¨ ur ein LGS Ax = b mit A ∈ K n×n , b ∈ K n und det A = 0? Antwort: Die Cramer’sche Regel lautet: Ist det A = 0, so berechnet sich die i-te Komponente der eindeutig bestimmten L¨ osung des LGS Ax = b nach der Formel xi =
det(a1 , . . . , ai−1 , b, ai+1 , . . . , an ) . det A
Dabei bezeichnen a1 , . . . , an die Spalten von A.
110
4 Determinanten
Zur Herleitung der Cramer’schen Regel schreibe man das lineare Gleichungssystem Ax = b in der Form a1 x1 + · · · + an xn = b. Subtraktion des Vektors b f¨ uhrt dann auf a1 x1 + · · · + an xn − b = 0 oder, was dasselbe ist, auf a1 x1 + · · · + (xi ai − b) + · · · + an xn = 0,
(∗)
wobei i ∈ {1, . . . , n} beliebig gew¨ ahlt werden kann. Nach Voraussetzung besitzt das Gleichungssystem (∗) eine nichttriviale L¨ osung, was bedeutet, dass die Vektoren a1 , . . . , xi ai − b, . . . , an linear abh¨ angig sind und daher det(a1 , . . . , xi ai − b, . . . , an ) = 0 gilt. Aufgrund der Linearit¨ at der Determinante in der i-ten Komponente folgt xi det(a1 , . . . , ai , . . . , an ) = det(a1 , . . . , ai−1 , b, ai+1 , . . . , an ).
(∗∗)
Nach Voraussetzung ist det(A) = det(a1 , . . . , an ) = 0, also darf in Gleichung (∗∗) durch det(A) dividiert werden, und man erh¨ alt det(a1 , . . . , ai−1 , b, ai+1 , . . . , an ) , det A was genau die Cramer’sche Regel ist. xi =
Frage 263 Warum ist die Cramer’sche Regel im Allgemeinen nicht f¨ ur die praktische Berechnung der L¨ osung eines LGS Ax = b mit det A = 0 geeignet? Wieso hat sie dennoch theoretische Bedeutung? Antwort: Man muss f¨ ur jede L¨ osungskomponente eine neue Determinante ausrechnen. Das ist wesentlich rechenaufwendiger als die L¨ osung mit dem GaußAlgorithmus. Man kann der Cramer’schen Regel allerdings entnehmen, dass die L¨ osungen eines LGS stetig von den Koeffizienten des LGS abh¨ angen. Auf diese Weise kann man Absch¨ atzungen f¨ ur die einzelnen L¨ osungskomponenten gewinnen. Frage 264
Welches neue Invertierbarkeitskriterium liefert die Determinante?
Antwort: Eine Matrix A ∈ K n×n ist genau dann invertierbar, wenn ihre Determinante = 0 ist. Frage 265 Wie lautet der Determinantenmultiplikationssatz? K¨ onnen Sie eine Beweisskizze geben? Antwort: F¨ ur zwei Matrizen A, B ∈ K n×n gilt: det(AB) = det A · det B.
4.2 Determinanten von Matrizen und Endomorphismen
111
Beweis: Ist rg A < n oder rg B < n, so ist auch rg(AB) < n. Der Satz gilt daher im Fall det(A) = 0 oder det(B) = 0. Sei daher A, B ∈ GL(n, K). Jede Matrix aus GL(n, K) l¨ asst sich als endliches Produkt von Elementarmatrizen schreiben. Daher gen¨ ugt es sogar, den Beweis f¨ ur den Fall zu f¨ uhren, dass A ∈ GL(n, K) und B eine Elementarmatrix ist. Das wurde bereits in Antwort 259 erledigt. Frage 266 det(A)−1 ?
K¨ onnen Sie zeigen: Ist A ∈ K n×n invertierbar, dann gilt det(A−1 ) =
Antwort: Wegen det(A−1 A) = det(En ) = 1 ergibt sich das unmittelbar aus dem Multiplikationssatz aus Frage 265. Frage 267
Wieso haben ¨ahnliche Matrizen die gleiche Determinante?
ahnlich, so gibt es eine Matrix S ∈ GL(n, K) mit Antwort: Sind A, B ∈ K n ¨ A = S −1 BS. Der Determinantenmultiplikationssatz liefert dann det(A) = det(S)−1 det(B) det(S) =
det(S) det(B) = det(B). det(S)
Frage 268 Wie ist allgemein die Determinante eines Endomorphismus f : V −→ V definiert? Wieso ist diese Definition eindeutig? Antwort: Wird F bez¨ uglich irgendeiner Basis F von V durch die Matrix A beschrieben, so definiert man det(F ) := det(A).
(∗)
Hier muss nat¨ urlich noch der Nachweis erbracht werden, dass det(f ) durch (∗) tats¨ achlich wohldefiniert, also unabh¨ angig von der Wahl der speziellen Basis F ist. Sei daher F ′ eine weitere Basis von V , so dass f bez¨ uglich dieser Basis durch die Matrix B beschrieben wird. Dann gilt A = S −1 AS mit einer Matrix S ∈ GL(n, K) (d. h., A und B sind ¨ ahnlich). Wegen Frage 267 ist also det(A) = det(B), und somit ist det(f ) durch (∗) tats¨ achlich wohldefiniert. Frage 269
Wie ist die Gruppe SL(n, K) (spezielle lineare Gruppe) definiert?
Antwort: SL(n, K) ist die Gruppe der Matrizen aus K n×n , die die Determinante 1 haben. Offensichtlich ist SL(n, K) ⊂ GL(n, K), und der Determinantenmultiplikationssatz stellt sicher, dass es sich bei SL(n, K) tats¨ achlich um eine hinsichtlich Matrizenmultiplikation abgeschlossene Gruppe handelt.
112
4 Determinanten
Frage 270 Versuchen Sie zu begr¨ unden, warum f¨ ur A ∈ K n×n stets det A = T det A gilt (Transpositionsinvarianz der Determinante). Antwort: Da Zeilen- und Spaltenrang einer Matrix stets identisch sind, gilt rg A = rg AT . Aus det A = 0 folgt daher det AT = 0 und umgekehrt. Ist aber det A = 0, dann l¨ asst sich A als ein Produkt von Elementarmatrizen schreiben. Da f¨ ur Elementarmatrizen Δ der Zusammenhang det Δ = det ΔT gilt, wie sich leicht verifizieren l¨ asst, folgt die Behauptung daraus mithilfe des Determinantenmultiplikationssatzes. Frage 271 einer Matrix
Wie lautet die Leibniz’sche Formel zur Berechnung der Determinanten
⎛
a11 ⎜ .. A=⎝ .
an1
··· .. . ···
⎞ a1n .. ⎟ . ⎠,
ann
und wie folgt sie aus der Definition der Determinantenabbildung? Antwort: Die Leibniz’sche Formel lautet det(A) =
sign (π)aπ(1),1 · · · aπ(n),n .
σ∈Sn
Dabei bezeichnet sign die Signum-Abbildung, die in Abschnitt 1.3 behandelt wurde. Zum Beweis der Formel. Zun¨ achst gilt aufgrund der Multilinearit¨ at der Determinante n n ain n ein ain 1 ein , . . . , det(A) = det i1 =1
=
n
in =1
ai1 1 · · · ain n det(ei1 , . . . , ein ).
i1 ,...,in =1
Nun sind die Terme det(ei1 , . . . , ein ) genau dann null, wenn zwei der Basisvektoren gleich sind, wenn also eil = eik f¨ ur bestimmte k, l ∈ {1, . . . , n} gilt. Dies ist genau dann nicht der Fall, wenn die Menge der Indizes {i1 , . . . , in } aus einer Permutation von {1, . . . , n} hervorgeht. Somit folgt det(A) = aπ(1),1 · · · aπ(n),n det(eπ(1) , . . . , eπ(n) ). (∗) π∈Sn
Mit Antwort 248 ergibt sich ferner det(eπ(1) , . . . , eπ(n) ) = sign (π) det(e1 , . . . , en ) = sign π. Zusammen mit (∗) folgt daraus die Leibniz’sche Formel.
4.2 Determinanten von Matrizen und Endomorphismen
113
K¨ onnen Sie begr¨ unden, warum f¨ ur A ∈ M (n, K) gilt
Frage 272
(∗) det(AT ) = det(A)? Antwort: Die Gleichung l¨ asst sich etwa mithilfe der Leibniz’schen Formel herleiten. Es gilt det(A) = sign π · aπ(1),1 · · · aπ(n),n π∈Sn
=
sign π · aπ(1),π−1 ◦π(1) · · · aπ(n),π−1 ◦π(n)
π∈Sn
=
sign π · a1,π−1 (1) · · · an,π−1 (n)
π∈Sn
=
sign π −1 · a1,π−1 (1) · · · an,π−1 (n)
π∈Sn
=
sign π · a1,π(1) · · · an,π(n)
π∈Sn
= det(AT ). Aus (∗) folgt insbesondere, dass die Determinante nicht nur linear in den Spalten von A, sondern ebenso in den Zeilen von A ist. Frage 273 A=
Sei A ∈ M (m + n, K) eine Blockmatrix der Gestalt B M , mit B ∈ M (m, K), C ∈ M (n, K), M ∈ K m×n . 0 C
K¨ onnen Sie zeigen, dass det(A) = det(B) · det(C) gilt? Antwort: Wir k¨ onnen annehmen, dass B und C maximalen Rang haben. Andernfalls hat n¨ amlich auch A keinen maximalen Rang, und die Formel gilt wegen det(A) = 0 trivialerweise. Die Formel erh¨ alt man, indem man ausnutzt, dass det(A) einerseits linear in den Spalten von B und andererseits linear in den Zeilen von C ist. Genauer: Sind b1 , . . . , bm die Spaltenvektoren von B mit m bj = bij ei , i=1
so f¨ uhrt die lineare Entwicklung nach den Spalten von B auf m Em M det(A) = bi1 ,1 · · · bim ,m det 0 C i ,...,i =1 1
=
π∈Sm
m
sign π · bπ(1),1 · · · bπ(m),m
Em M = det(B) · det . 0 C
114
4 Determinanten
Entsprechend erh¨ alt man nun durch lineare Entwicklung nach den Zeilen von C die Formel Em M Em M sign π · c1,π(1) · · · c1,π(m) = det(C) · det = 0 En 0 C π∈S n
Da nach Frage 260 die Matrix
Em M 0 En die Determinante 1 besitzt, folgt die Behauptung.
F¨ ur A ∈ K n×n sei ⎛ a11 ··· a1,j−1 0 a1,j+1 ⎜ .. .. .. .. ⎜ . . . . ⎜ ⎜a · · · a 0 a i−1,j−1 i−1,j+1 ⎜ i−1,1 ⎜ Aij = ⎜ 0 ··· 0 1 0 ⎜ ⎜ai+1,1 · · · ai+1,j−1 0 ai+1,j+1 ⎜ ⎜ .. .. .. .. ⎝ . . . . ··· an,j−1 0 an,j+1 an1
Frage 274
··· ··· ··· ··· ···
⎞ a1n .. ⎟ . ⎟ ⎟ ai−1,n ⎟ ⎟ ⎟ 0 ⎟. ⎟ ai+1,n ⎟ ⎟ .. ⎟ . ⎠ an,n
D. h., Aij ist diejenige Matrix, die man aus A erh¨alt, indem man aij = 1 setzt und ansonsten alle Komponenten in der i-ten Zeile und j-ten Spalte gleich null. K¨ onnen Sie zeigen, dass det(Aij ) = (−1)i+j det(A′ij ) (†) gilt, wobei A′ij ∈ K (n−1)×(n−1) die Matrix i-ten Zeile und j-ten Spalte erh¨alt ⎛ a11 · · · ⎜ . ⎜ .. ⎜ ⎜ A′ij = ⎜ ai1 · · · ⎜ . ⎜ . ⎝ . an1 · · ·
ist, die man aus A durch Streichen der a1j .. .
···
aij .. .
···
anj
···
⎞ a1n .. ⎟ . ⎟ ⎟ ⎟ ain ⎟? .. ⎟ ⎟ . ⎠ ann
Antwort: Durch (i − 1) Zeilen und (j − 1) Spaltenvertauschungen l¨ asst sich Aij auf die Form 1 0 0 A′ij
bringen. Wegen (−1)(i−1)+(j−1) = (−1)i+j und Frage 273 gilt daher det(Aij ) = (−1)i+j det(A′ij ).
115
4.2 Determinanten von Matrizen und Endomorphismen
Frage 275 Wie lautet der Laplace’sche Entwicklungssatz? K¨ onnen Sie einen Beweis skizzieren? Antwort: Der Satz lautet: ur jedes i = {1, . . . , n} Ist n ≥ 2 und A ∈ K n×n , so gilt f¨ det(A) =
n
(−1)i+j · aij · det(A′ij )
(∗)
j=1
und entsprechend f¨ ur jedes j = {1, . . . , n} det(A) =
n
(−1)i+j · aij · det(A′ij ).
(∗∗)
i=1
Dabei bezeichnet A′ij die in Frage 274 definierte Matrix. Die Darstellung (∗) bezeichnet man als Entwicklung nach der i-ten Zeile, die Darstellung (∗∗) als Entwicklung nach der j-ten Spalte. alt, Beweis: Sei (a1 , . . . , aj−1 , ei , aj+1 , . . . , an ) diejenige Matrix, die man aus A erh¨ indem man den i-ten Spaltenvektor durch ei ersetzt. Obwohl dabei im Gegensatz zu Aij die restlichen Spaltenvektoren unver¨ andert bleiben, gilt trotzdem stets det(Aij ) = det(a1 , . . . , aj−1 , ei , aj+1 , . . . , an ), da sich (a1 , . . . , aj−1 , ei , aj+1 , . . . , an ) durch Addition von Vielfachen der j-ten Spalte zu den anderen Spalten in Aij umwandeln l¨ asst. Nach Antwort 259 (c) bleibt die Determinante dabei unver¨ andert. Die Gleichung (∗∗) folgt nun in Kombination mit Formel (†) aus Frage 274, indem man die j-te Spalte linear entwickelt det(A) =
n
aij det(a1 , . . . , aj−1 , ei , aj+1 , . . . , an ) =
i=1
=
n
n
aij det(Aij )
i=1
(−1)i+j · aij · det(A′ij )
i=1
Analog zeigt man (∗), indem man die i-te Zeile von A linear entwickelt. Frage 276 niert?
Wie ist die zu A ∈ K n×n adjungierte Matrix (Adjunkte) Aad defi-
Antwort: Aad ist die (n × n)-Matrix, deren Komponente aad ij gleich der Determinante der Matrix Aji aus Frage 274 ist ⎞ ⎛ det(A11 ) · · · det(An1 ) ⎜ ⎟ .. .. .. Aad := aad ⎠ ∈ K n×n . . ij ⎝ . . det(A1n ) · · ·
det(Ann )
116
4 Determinanten
Man beachte die Vertauschung von Zeilen und Spalten.
Wieso gilt
Frage 277
Aad · A = A · Aad = det(A) · En
(∗)
f¨ ur jede Matrix A ∈ K n×n ? Antwort: F¨ ur die Komponente (cik ) von Aad · A gilt cik =
=
n
j=1 n
aad ij ajk
=
n
det(Aji )ajk
j=1
ajk · det(a1 , . . . , ai−1 , ej , ai+1 , . . . , an )
(wie in Antwort 275)
j=1
= det(a1 , . . . , ai−1 ,
n
ajk ej , aj+1 , . . . , an )
j=1
= det(a1 , . . . , ai−1 , ak , aj+1 , . . . , an ) = δik det(A).
Frage 278
Wof¨ ur ist die Gleichung (∗) aus Frage 277 unter anderem n¨ utzlich?
Antwort: F¨ ur A ∈ GL(n, K) folgt aus der Formel sofort eine explizite Darstellung f¨ ur die inverse Matrix: 1 A−1 = Aad det(A) Frage 279 K¨ onnen Sie mit dem Ergebnis aus Frage 278 nochmals die Cramer’sche Formel herleiten? Antwort: F¨ ur eine nicht-singul¨ are Matrix A l¨ asst sich die eindeutig bestimmte −1 L¨ osung des LGS Ax = b in der Form x = A · b darstellen. Nach der Antwort der vorigen Frage hat A−1 in der i-ten Spalte und j-ten Zeile die Komponente det(Aji ) det(a1 , . . . , ai−1 , ej , ai+1 , . . . , an ) = . det(A) det(A) Folglich erh¨ alt man f¨ ur die i-te Komponente des L¨ osungsvektors x xi =
n j=1
bj
det(Aji ) det(a1 , . . . , ai−1 , b, ai+1 , . . . , an ) = . det(A) det(A)
Das ist die Cramer’sche Formel.
5 Normalformentheorie Dieses Kapitel besch¨ aftigt sich damit, die (geometrischen) Abbildungseigenschaften von Endomorphismen F : V −→ V genauer zu analysieren. Das Vorgehen besteht dabei darin, geeignete Unterr¨ aume von V aufzufinden, auf denen F eine besonders u ¨bersichtliche, einfache und klassifizierbare Struktur aufweist. Der Satz u ¨ber die Jordan’sche Normalform, der am Ende dieses Kapitels behandelt wird, ist in dieser Hinsicht das allgemeinste Ergebnis. Er besagt, dass sich V stets derart in eine direkte Summe V = Ui von sogenannten F -invarianten Unterr¨ aumen Ui (das sind Unterr¨ aume, f¨ ur die F (Ui ) ⊂ Ui ) zerlegen l¨ asst, dass F |Ui einem Abbildungstyp entspricht, der durch eine Reihe von Invarianten eindeutig charakterisiert ist. In matrizentheoretischer Hinsicht zielt die Fragestellung auf die Klassifikation von n × n-Matrizen. In Frage 202 wurde gezeigt, dass jede A mit n × n-Matrix Er 0 ist. Es gibt rg A = r ¨ aquivalent zu einer Matrix der Form Mr := 0 0 also stets Matrizen Q, P ∈ GL(n, K) mit QAP = Mr , woraus folgt, dass zwei n × n-Matrizen genau dann ¨ aquivalent sind, wenn sie denselben Rang haben. ¨ In diesem Kapitel steht dagegen die Ahnlichkeit von Matrizen im Mittelpunkt. Zwei Matrizen A und B sind ¨ ahnlich, wenn eine Matrix P ∈ GL(n, K) mit B = ¨ ¨ P −1 AP existiert. Die Ahnlichkeit ist eine Aquivalenzrelation, und es stellt sich ¨ die Frage, zu jeder Ahnlichkeitsklasse einen besonders einfachen und typischen Repr¨ asentanten anzugeben. Anders formuliert: Zu einem Endomorphismus F : V −→ V finde man eine Basis B, so dass MBB (f ) einer bestimmten Normalform entspricht.
5.1
Eigenwerte und Eigenvektoren
Die kleinstm¨ oglichen nicht-trivialen Unterr¨ aume U ⊂ V , die durch einen Endomorphismus F : V −→ V auf sich selbst abgebildet werden, besitzen die Dimension 1, f¨ ur diese gilt also U = Kv mit einem Vektor v ∈ V . Auf diesen Unterr¨ aumen sind die Abbildungseigenschaften von F besonders u ¨bersichtlich, da jeder Vektor aus U durch F auf ein konstantes Vielfaches α seiner selbst abgebildet wird. Den Wert α nennt man in diesem Fall Eigenwert von F , den Unterraum U Eigenraum und jeden Vektor v ∈ U einen Eigenvektor zum Eigenwert α. Besitzt V eine Zerlegung in eine direkte Summe von Eigenr¨ aumen von F , dann heißt F diagonalisierbar. Frage 280 Was versteht man unter (a) einem Eigenvektor, (b) einem Eigenwert, (c) einem Eigenraum eines Endomorphismus F : V −→ V ?
118
5 Normalformentheorie
Antwort: (a) Ein Vektor v ∈ V heißt Eigenvektor von F , wenn v = 0 ist und ein λ ∈ K existiert, so dass gilt F (v) = λv. Ein Eigenvektor wird durch F also auf ein skalares Vielfaches seiner selbst abgebildet. Man beachte, dass der Nullvektor nach Definition kein Eigenvektor ist. (b) In der Situation unter (a) heißt λ Eigenwert von F . Man spricht dann auch als v von einem Eigenvektor zum Eigenwert λ. (c) Ist λ Eigenwert von F , so heißt Eig(F, λ) := {v ∈ V ; F (v) = λv} der Eigenraum zum Eigenwert λ. Hierbei handelt es sich tats¨ achlich um einen Unterraum von V , denn aus v, w ∈ Eig(F, λ) und α ∈ K folgt F (v + w) = λ(v +w) = λv +λw sowie F (αv) = αF (v) = α ·λv = λ(αv), also v +w ∈ Eig(F, λ) und αv ∈ Eig(F, λ). Frage 281 Welche Eigenwerte und Eigenvektoren besitzt die Abbildung F : R2 −→ R2 mit (x1 , x2 ) −→ (x1 , −x2 ) (Spiegelung an der x1 -Achse). Was sind die Eigenr¨aume? ¨ Antwort: Durch eine anschaulich-geometrische Uberlegung macht man sich klar, dass jeder Vektor des Typs (x1 , 0) ein Eigenvektor zum Eigenwert 1, jeder Vektor des Typs (0, x2 ) ein Eigenvektor zum Eigenwert −1 ist. Dar¨ uber hinaus gibt es keine weiteren Eigenvektoren. Weiter gilt Eig(F, 1) = Re1 und Eig(F, −1) = Re2 . Frage 282
Wieso gilt Eig(F, 0) = ker F f¨ ur einen Endomorphismus F : V −→ V ?
Antwort: Es ist Eig(F, 0) = {x ∈ V ; F (x) = 0 · x} = {x ∈ V ; F (x) = 0} = ker f . Frage 283 Sei F : V −→ V ein Endomorphismus und A = MBB (F ) f¨ ur eine Basis B von V . Dann gilt: v ist ein Eigenwert von F zum Eigenwert λ genau dann, wenn der Koordinatenvektor κB (v) ∈ K n ein Eigenvektor von A zum Eigenwert λ ist. K¨ onnen Sie diesen Zusammenhang begr¨ unden? Antwort: Es gilt A · κB (v) = κB (F (v)). Da κB ein Homomorphismus ist, folgt daraus A · κB (v) = λκB (v) ⇐⇒ F (v) = λv. Die Koordinatenabbildung ist ferner sogar ein Isomorphismus, so dass v = 0 genau dann gilt, wenn κB (v) = 0 ist. Eigenvektoren werden damit durch κB auf Eigenvektoren abgebildet.
5.1 Eigenwerte und Eigenvektoren
Frage 284
119
Wie sind die Eigenwerte einer Matrix A ∈ K n×n erkl¨art?
Antwort: Die Eigenwerte einer Matrix A ∈ K n×n sind die Eigenwerte der durch A beschriebenen Abbildung FA : K n −→ K n mit FA (x) = A · x. Frage 285 Sei F : V −→ V ein Endomorphismus eines K-Vektorraums V sowie B und C zwei Basen von V . Wieso besitzen dann MBB (F ) und MCC (F ) dieselben Eigenwerte? Antwort: Nach den Fragen 283 und 284 ist λ ein Eigenwert von F genau dann, wenn λ ein Eigenwert von MBB (F ) ist und genau dann, wenn λ ein Eigenwert von MCC (F ) ist. Daraus folgt die Behauptung. Frage 286 Wann heißen zwei n × n-Matrizen A und B ¨ ahnlich? Wieso ist die ¨ ¨ Ahnlichkeit von Matrizen eine Aquivalenzrelation? ahnlich, wenn eine Matrix P ∈ Antwort: Zwei Matrizen A, B ∈ K n×n heißen ¨ GL(n, K) existiert, so dass A = P −1 BP gilt. ¨ ¨ Um zu zeigen, dass es sich bei der Ahnlichkeit um eine Aquivalenzrelation handelt, m¨ ussen die Eigenschaften der Reflexivit¨ at, Symmetrie und Transitivit¨ at verifiziert werden. Dazu schreiben wir A ∼ B, um die Relation A ist ¨ ahnlich zu ” B“ zu bezeichnen. Zun¨ achst gilt A = En−1 AEn , also A ∼ A, d. h., ∼“ ist refle” xiv. Gilt A = P −1 BP , so folgt B = Q−1 AQ mit Q = P −1 . Aus A ∼ B folgt also B ∼ A. Damit ist ∼“ reflexiv. Sei schließlich A ∼ B und B ∼ C. Dann ” existieren Matrizen P, Q ∈ M (n, K) mit A = P −1 BP und B = Q−1 CQ. Hieraus folgt A = (P Q)−1 CQP = S −1 CS mit S = QP . Somit gilt A ∼ C, und es folgt ¨ die Transitivit¨ at von ∼. Insgesamt ist damit gezeigt, dass die Ahnlichkeit von ¨ Matrizen eine Aquivalenzrelation auf der Menge der n × n-Matrizen ist. Frage 287
Wieso besitzen ¨ahnliche Matrizen dieselben Eigenwerte?
Antwort: Seien A und B ¨ ahnlich, so dass A = P −1 BP mit einer Matrix P ∈ GL(n, K) gilt. Man betrachte die durch F (x) = A · x definierte Abbildung F : K n −→ K n . Bez¨ uglich der Standardbasis E von K n gilt dann A = MEE (F ). Fasst man nun P als Basiswechselmatrix auf, die E in eine weitere Basis B des K n u uhrt, so gilt B = MBB (F ). Nach Frage 285 besitzen MEE (F ) und MBB (F ) und ¨berf¨ damit A und B dieselben Eigenwerte. Frage 288 K¨ onnen Sie zeigen, dass jede n×n-Matrix A = (aij ), in der alle Zeilensummen den Wert λ haben, den Eigenwert λ und den Eigenvektor x = (1, 1, . . . , 1)T besitzt?
120
5 Normalformentheorie
Antwort: Es gilt
⎞ ⎛ ⎞ λ a11 + · · · + a1n ⎟ ⎜ .. ⎟ ⎜ A·x=⎝ ··· ⎠ = ⎝ . ⎠ = λ · x. an1 + · · · + ann λ ⎛
Damit ist x ein Eigenvektor von A zum Eigenwert λ.
Frage 289 Wieso ist ein System (v1 , . . . , vr ) von Eigenvektoren von F zu verschiedenen Eigenwerten λ1 , . . . , λr ∈ K stets linear unabh¨angig? Antwort: Angenommen, die Eigenvektoren v1 , . . . , vr sind linear abh¨ angig, so dass also gilt r
αi vi = 0
mit αi ∈ K, nicht alle αi = 0.
(∗)
i=1
Man zeigt nun, dass dies bereits die lineare Abh¨ angigkeit von v2 , . . . , vr impliziert, woraus man induktiv vr = 0 folgert, was im Widerspruch zur Voraussetzung steht, dass vr ein Eigenvektor ist. Man betrachte also (∗). Wegen vi = 0 f¨ ur alle i = 1, . . . , r gilt sogar, dass mindestens zwei der Skalare αi in dieser Gleichung nicht verschwinden, also αj = 0
f¨ ur mindestens ein j ∈ {2, . . . , r}. r Nun erh¨ alt man aus (∗) einerseits i=1 λ1 αi vi = 0, andererseits r r r λi αi vi = F (αi vi ) = F αi vi = F (0) = 0. i=1
i=1
(∗∗)
i=1
Subtraktion dieser beiden Gleichungen liefert daher r i=1
(λi − λ1 )αi vi =
r
(λi − λ1 )αi vi = 0.
i=2
ur i = 2, . . . , r. Da die Eigenwerte paarweise verschieden sind, ist (λi − λ1 ) = 0 f¨ Wegen (∗∗) verschwinden damit nicht alle Koeffizienten in der rechten Summe, d. h., v2 , . . . , vr sind linear abh¨ angig, was zu zeigen war. Frage 290 Wie viele paarweise verschiedene Eigenwerte kann ein Endomorphismus F : V −→ V h¨ ochstens besitzen? Antwort: Es existieren h¨ ochstens n = dim V paarweise verschiedene Eigenwerte, da die zugeh¨ origen Eigenvektoren nach Antwort 289 linear unabh¨ angig sind.
121
5.1 Eigenwerte und Eigenvektoren
Frage 291
Wie ist die geometrische Vielfachheit eines Eigenwerts erkl¨art?
Antwort: Die geometrische Vielfachheit eines Eigenwerts ist die Dimension des von den zugeh¨ origen Eigenvektoren aufgespannten Unterraums. Z. B. besitzt die identische Abbildung id : V −→ V den einzigen Eigenwert λ = 1, und jedes v ∈ V ist ein zugeh¨ origer Eigenvektor. Die geometrische Vielfachheit des Eigenwerts 1 zur identischen Abbldung ist also gleich n = dim V . Frage 292 Warum ist die Summe der Eigenr¨aume zu verschiedenen Eigenwerten eines Endomorphismus F : V −→ V stets direkt? Antwort: Da Eigenvektoren zu paarweise verschiedenen Eigenvektoren stets lir near unabh¨ angig sind, kann eine Summe i=1 vi mit vi ∈ Eig(F, λi ) auch nur dann verschwinden, wenn r alle vi gleich null sind. Das heißt nichts anderes, als dass die Summe V ′ = i=1 Eig(F, λi ) direkt ist: V′ =
r
Eig(F, λi ).
i=1
Frage 293 Wann heißt ein Endomorphismus F : V −→ V eines endlichdimensionalen K-Vektorraums diagonalisierbar? Antwort: F heißt diagonalisierbar, wenn eine Basis B von V existiert, so dass die beschreibende Matrix MBB (F ) Diagonalform besitzt, also wie folgt aussieht ⎛ ⎞ λ1 0 ⎜ ⎟ λ2 ⎜ ⎟ B ⎟. MB (F ) = ⎜ .. ⎜ ⎟ . ⎝ ⎠ 0
λn
Frage 294 Wie l¨asst sich die Diagonalisierbarkeit eines Endomorphismus F : V −→ V im Hinblick auf seine Eigenwerte charakterisieren? Antwort: Es gilt: Ein Endomorphismus F : V −→ V ist diagonalisierbar genau dann, wenn V eine Basis aus Eigenvektoren von F besitzt. Beweis: Ist F diagonalisierbar, dann gibt es eine Basis B = (v1 , . . . , vn ), so dass gilt: ⎞ ⎛ λ1 0 ⎟ ⎜ λ2 ⎟ ⎜ B ⎟. MB (F ) = ⎜ (∗) .. ⎟ ⎜ . ⎠ ⎝ 0 λn
122
5 Normalformentheorie
Wegen κB (vi ) = ei gilt dann κB (F (vi )) = MBB (F ) · κB (vi ) = λi · κB (vi ) = κB (λi vi ). ur i = 1, . . . , n ein Eigenvektor zum EigenDaraus folgt F (vi ) = λi vi . Also ist vi f¨ wert λi . Ist umgekehrt B = (v1 , . . . , vn ) eine Basis aus Eigenvektoren zu F mit den zugeh¨ origen Eigenwerten λ1 , . . . , λn , dann gilt κB (F (vi )) = κB (λi vi ) = λi · κB (vi ), und damit besitzt MBB (F ) notwendigerweise die Gestalt (∗).
Frage 295 Der Endomorphismus F : V −→ V besitze n = dim V paarweise verschiedene Eigenwerte. Wieso ist F dann diagonalisierbar? Gilt hiervon auch die Umkehrung? Antwort: Existieren n paarweise verschiedene Eigenwerte, so besitzt V nach Antwort 289 eine Basis aus Eigenvektoren und ist daher nach Frage 294 diagonalisierbar. Die Umkehrung gilt nat¨ urlich nicht. Als Gegenbeispiel betrachte man die identische Abbildung. Diese ist diagonalisierbar (mit En als beschreibender Matrix), besitzt aber offensichtlich nur den einzigen Eigenwert λ = 1. Frage 296 Seien dim V = n < ∞ und λ1 , . . . , λr die verschiedenen Eigenwerte eines Endomorphismus F : V −→ V und m(λj ) = dim Eig(F, λj ) die geometrische Vielfachheit eines Eigenwerts λj . K¨ onnen Sie zeigen: F diagonalisierbar ⇐⇒ n =
r
m(λj ).
j=1
Antwort: Sei F diagonalisierbar. Dann existiert eine Basis aus Eigenvektoren, von denen jeder in genau einem Eigenraum Eig(F, λi ) mit i = 1, . . . , r liegt. Da die Summe der Eigenr¨ aume direkt ist, gilt folglich V =
r
Eig(F, λi ),
i=1
und damit n = dim V = dim
r
Eig(F, λi ) =
i=1
r
dim Eig(F, λi ) =
i=1
r
m(λi ).
i=1
Umgekehrt folgt aufgrund der Direktheit der Summe der Eigenr¨ aume eben auch dim
r
i=1
Eig(F, λi ) =
r i=1
dim Eig(F, λi ) =
r i=1
m(λi ) = n,
123
5.2 Das charakteristische Polynom
also
r
Eig(F, λi ) = V.
i=1
Da die Eigenr¨ aume Eig(F, λi ) von Eigenvektoren von F aufgespannt werden, gilt dies damit auch f¨ ur V . D. h., V besitzt eine Basis aus Eigenvektoren und ist daher diagonalisierbar (nach Frage 294).
5.2
Das charakteristische Polynom
Nachdem im vorigen Abschnitt die Eigenschaften der Eigenwerte von Endomorphismen untersucht wurden, wird nun eine Methode behandelt, die Eigenwerte eines Endomorphismus F : V −→ V explizit zu bestimmen. Die Grundlage daf¨ ur bildet die Tatsache, dass λ genau dann ein Eigenwert von F ∈ End(V ) ist, wenn F − λid einen nichttrivialen Kern hat bzw. wenn det(F − λid) = 0 gilt. Durch Bestimmung derjenigen Werte x ∈ K, f¨ ur die det(F − xid) = 0 gilt, erh¨ alt man also s¨ amtliche Eigenwerte von F . ¨ Frage 297 Sei F : V −→ V ein Endomorphismus. K¨ onnen Sie die Aquivalenz der folgenden Aussagen beweisen? (i) λ ist Eigenwert zu F (ii) ker(λid − F ) = {0} (iii) λid − F ist nicht invertierbar (iv) det(λid − F ) = 0. ¨ Antwort: Die Aquivalenz von (ii), (iii) und (iv) geh¨ ort zur Theorie linearer Abbildungen und ihrer Determinanten und wurde in den entsprechenden Kapiteln schon gezeigt. Ist v ein Eigenvektor zum Eigenwert λ, so gilt außerdem F (v) = λv ⇐⇒ λv − F (v) = id(λv) − F (v) = λid(v) − F (v) = (λid − F )(v) = 0. Daraus folgt v ∈ ker(λid − F ). Wegen v = 0 beweist das (i) ⇐⇒ (ii). Frage 298 erkl¨art?
Wie ist das charakteristische Polynom χF einer Matrix A ∈ K n×n
Antwort: Zur Berechnung von Eigenwerten ist Punkt (iv) aus Frage 297 aufschlussreich. Ist F die durch die Matrix A = (aij ) beschriebene Abbildung K n −→ K n , so ist λ genau dann ein Eigenwert von F , wenn det(λid − F ) verschwindet. In diesem Fall gilt also det(λEn − A) =
π∈Sn
sign π
n i=1
λδπ(i),i − aπ(i),i = 0
124
5 Normalformentheorie
genau dann, wenn λ ein Eigenwert zu A ist bzw. genau dann, wenn λ eine Nullstelle des Polynoms χA :=
π∈S n
sign π
n i=1
Xδπ(i),i − aπ(i),i ∈ K[X].
ist. χA heißt das charakteristische Polynom zur Matrix A. Die Eigenwerte von F sind also genau die Nullstellen des charakteristischen Polynoms χA , wobei A ∈ K n×n eine Darstellungsmatrix von F bez¨ uglich einer Basis von V ist. Formal w¨ are es komfortabler, das charakteristische Polynom einfach durch det(XEn − A) zu definieren. Dabei entsteht allerdings der formale Missklang, dass die Eintr¨ age in der Matrix XEn − A keine Elemente des K¨ orpers K, sondern des Polynomrings K[X] sind, und eine Determinantentheorie f¨ ur Matrizen mit Eintr¨ agen aus einem beliebigen Ring steht uns nicht zur Verf¨ ugung. Ein leichter Ausweg aus dieser Situation besteht darin, die Elemente X nicht als Elemente des Polynomrings K[X], sondern des zugeh¨ origen Quotientenk¨ orpers K(X) aufzufassen. F¨ ur diesen greift unsere Determinantentheorie, und mit dieser formalen Vereinbarung kann man χA = det(XE − A) unzweideutig definieren. Frage 299 Wie ist das charakteristische Polynom χF eines Endomorphismus F : V −→ V erkl¨art? Warum ist diese Definition basisunabh¨angig? Antwort: Wird F bez¨ uglich einer Basis von V durch die Matrix A beschrieben, dann setzt man χF := χA . Ist nun eine weitere Basis von V gegeben, bez¨ uglich der F durch die B ∈ K n×n −1 beschrieben wird, so gilt B = S AS mit einer Matrix S ∈ GL(n, K). Wegen XE = S −1 · XE · S folgt det(XE − B) = det(XE − S −1 AS) = det(S −1 (XE − A)S) = det S −1 · det(XE − A) · det S = det(XE − A). angig ist. Eine ¨ aquivalente Formulierung dieses Daraus folgt, dass χF basisunabh¨ Ergebnisses lautet, dass ¨ ahnliche Matrizen dasselbe charakteristische Polynom haben. Frage 300
Was versteht man unter der Spur einer Matrix A ∈ K n×n ?
Antwort: Die Spur von A ist die Summe der Diagonalelemente der Matrix A Spur(A) =
n i=1
aii .
125
5.2 Das charakteristische Polynom
Frage 301
Warum besitzen ¨ahnliche Matrizen dieselbe Spur?
Antwort: Man betrachte die Darstellung des charakteristischen Polynoms aus Antwort 298 mittels der Leibniz’schen Formel. Diese l¨ asst sich schreiben als Summe χA =
n n (Xδπ(i),i − aπ(i),i ) (X − aii ) + i=1
π∈S n i=1 π=id
= X n − (a11 + · · · + ann ) X n−1 + c2 X n−2 + · · · + =Spur(A)
n (Xδπ(i),i − aπ(i),i ).
π∈S n i=1 π=id
Die rechte Summe stellt ein Polynom vom Grad ≤ n − 2 dar, da f¨ ur π = id mindestens zwei Komponenten T δπ(i),i verschwinden. Da ¨ ahnliche Matrizen nach Frage 299 dasselbe charakteristische Polynom besitzen, folgt durch Koeffizientenvergleich, dass sie auch dieselbe Spur haben. Frage 302
Sei dim V = 2 und F ∈ End(V ). Wieso gilt
χF (X) = X 2 − Spur(F ) · X + det(F )? Antwort: Sei A = ac db eine Darstellungsmatrix von F . Dann gilt X −a b = (X − a)(X − d) − bc χF = det c X −d = X 2 − (a + d)X + ab − bc = X 2 − Spur(F ) + det(F ).
Frage 303 Warum tritt jedes normierte Polynom als charakteristisches Polynom eines geeigneten Endomorphismus auf? Antwort: Zu p(X) := X n + cn−1 X n−1 + · · · + c1 X + c0 betrachte man die Matrix (die sogenannte Begleitmatrix ) ⎞ ⎛ 0 ··· −c0 ⎟ ⎜1 0 ··· −c1 ⎟ ⎜ ⎟ ⎜ 0 1 0 ··· −c2 ⎟ . A=⎜ ⎟ ⎜ .. ⎟ ⎜ .. .. .. . . ⎝. . ⎠ 0 1 −cn−1 Wir zeigen, dass dann χA = p gilt, was die Frage beantwortet.
126
5 Normalformentheorie
Der Beweis erfolgt u ur n = 1 ist der Zusammen¨ber Induktion nach n = deg(p). F¨ hang klar. Sei sie f¨ ur Polynome vom Grad n − 1 also bereits gezeigt. Dann liefert Entwicklung nach der ersten Zeile ⎛ ⎞ X c0 ⎜−1 X ⎟ c1 ⎜ ⎟ ⎜ ⎟ ⎟ −1 X c2 det(XEn − A) = ⎜ ⎜ ⎟ .. ⎜ ⎟ .. .. . . ⎝ ⎠ . −1 X + cn−1 ⎞ ⎛ ⎞ ⎛ −1 X X c1 ⎟ ⎜ ⎟ ⎜ −1 X c2 ⎟ ⎜ ⎟ ⎜−1 X n−1 ⎟ ⎜ ⎟ ⎜ + (−1) c · det = X · det ⎜ 0 .. . . .. .. ⎜ ⎟ .. ..⎟ . . . ⎠ ⎝ ⎠ ⎝ −1 −1 X + cn−1
Der erste Summand ist gleich X · (X n−1 + cn−1 X n−2 + · · · + c1 ) gem¨ aß der Induktionsvoraussetzung, und f¨ ur den letzten ergibt sich (−1)n−1 · c0 · (−1)n−1 = c0 , also hat man insgesamt χA = det(XE − A) = X n + cn−1 X n−1 + · · · + c0 = p(X), was zu zeigen war. Frage 304
Wie ist die algebraische Vielfachheit eines Eigenwerts definiert?
Antwort: Ist λ ein Eigenwert des Endomorphismus F , so ist die algebraische Vielfachheit µF (λ) von λ gleich der Vielfachheit von λ als Nullstelle des charakteristischen Polynoms χF . Es ist µ(λ) = r also genau dann, wenn χF eine Darstellung χF = (X − λ)r · p(X) mit einem Polynom p(X) besitzt, welches keine Nullstelle f¨ ur X = λ hat.
Frage 305 Wieso ist die geometrische Vielfachheit eines Eigenwerts stets kleiner oder gleich seiner algebraischen Vielfachheit?
127
5.2 Das charakteristische Polynom
Antwort: Sei λ ein Eigenwert zu F und sei s := m(λ) = dim Eig(F, λ). Man w¨ahle eine Basis (v1 , . . . , vs ) von Eig(F, λ) und erg¨ anze diese zu einer Basis B = (v1 , . . . , vs , vs+1 , . . . , vn ) von V . Es gilt dann ⎛ ⎞ ⎫ λ ⎪ ⎬ ⎜ ⎟ ⎪ . . ⎜ ⎟ . ∗ ⎜ ⎟ ⎪s ⎜ ⎟ ⎭ λ ⎟ ⎪ MBB (F ) = ⎜ ⎜ ⎟ ⎜ ⎟ . ⎜ ⎟ ′ ⎝ ⎠ 0 A n−s
Folglich gilt χF = (X − λ)s · p(X) mit einem Polynom p vom Grad n − s. Die Vielfachheit von λ als Nullstelle von χF ist damit mindestens gleich s bzw. es gilt also µ(λ) ≥ m(λ), was zu zeigen war. Dass hier im Allgemeinen kein Gleichheitszeichen steht, zeigt das Beispiel 1 1 A= . −1 3 Das charakteristische Polynom χA (X) = (X − 1)(X − 3) + 1 = (X − 2)2 besitzt eine zweifache Nullstelle bei 2, aber das Gleichungssystem a + b = 2a −a + 3b = 2b besitzt nur den eindimensionalen L¨ osungsraum λ(1, 1)T .
Frage 306 Sei A = ( 10 11 ). Wie lautet χA ? Was ist die geometrische, was die algebraische Vielfachheit des Eigenwerts 1? Ist A diagonalisierbar? Antwort: Es ist χA (X) = (X − 1)2 und somit µ(1) = 2. Da aber das Gleichungssystem a+b=a b=b nur den eindimensionalen L¨ osungsraum K ·(1, 0)T besitzt, gilt f¨ ur die algebraische Vielfachheit m(1) = 1. Damit ist A auch nicht diagonalisierbar, da ja andernfalls eine Basis aus Eigenvektoren (zum einzigen Eigenwert 1) existieren m¨ usste.
128
5 Normalformentheorie
Frage 307 Sei V ein n-dimensionaler K-Vektorraum und F ∈ End(V ). Wieso ist F genau dann diagonalisierbar, wenn k χF (X) = (X − λi )ei i=1
mit λj ∈ K sowie ei = m(λi ) = µ(λi ) gilt? Antwort: Unter den gegebenen Bedingungen gilt s
m(λi ) =
i=1
s
µ(λi ) = n,
i=1
und damit ist F diagonalisierbar nach Antwort 296.
Frage 308 Wann heißt ein Endomorphismus F : V −→ V eines K-Vektorraums V trigonalisierbar? Antwort: F heißt trigonalisierbar, wenn eine Basis von B von V existiert, so dass MBB eine obere Dreiecksmatrix ist, also folgende Gestalt besitzt: ⎞ ⎛ a11 ∗ ⎟ ⎜ a22 ⎟ ⎜ B ⎟. MB = ⎜ .. ⎟ ⎜ . ⎠ ⎝ 0
ann
Frage 309 Warum ist F : V −→ V genau dann trigonalisierbar, wenn χF u ¨ber K in Linearfaktoren zerf¨allt? B Antwort: Ist F trigonalisierbar, existiert also eine Basis n B, so dass MB =: A = (aij ) eine obere Dreiecksmatrix ist, so gilt χF = χA = i=1 (X − aii ), also zerf¨ allt χF vollst¨ andig in Linearfaktoren. Die andere Richtung zeigt man mit vollst¨ andiger Induktion u ur ¨ber n = dim V . F¨ n = 1 ist nichts zu zeigen. Sei also die Behauptung f¨ ur Vektorr¨ aume der Dimension n − 1 schon gezeigt. F¨ ur das charakteristische Polynom von F : V −→ V gelte
χF =
n (X − λi ) i=1
129
5.2 Das charakteristische Polynom
f¨ ur λi ∈ K. Man w¨ ahle einen Eigenvektor v1 zu λ1 und erg¨ anze diesen zu einer Basis B = (v1 , w2 , . . . , wn ) von V . Dann gilt ⎛ ⎞ λ1 a11 · · · a1n ⎜ ⎟ ⎜ 0 ⎟ B ⎟. MB (F ) = ⎜ ⎜ .. ⎟ B ⎝ . ⎠ 0
Die Matrix B ist nun eine Darstellungsmatrix eines Endomorphismus V ′ −→ V ′ mit dim V ′ = n − 1. Nach der Induktionsvoraussetzung existiert eine Basis ′ B ′ = (w1′ , . . . , wn−1 ) von V ′ , bez¨ uglich der B trigonalisierbar ist. Die Vekoren wi′ betten wir nun mit der Abbildung F : V ′ −→ V in V ein, die sich wie in dem unten stehenden Diagramm zusammensetzt V′
F
/V
κB′
κB
K n−1
/ K n,
G
bei dem G die kanonische Einbettung ist, die einen Vektor (x1 , . . . , xn )T ∈ K n−1 auf (0, x1 , . . . , xn )T abbildet. Damit ist dann (v1 , F (w1′ ), . . . , F (wn′ )) ebenfalls eine Basis von V , und bez¨ uglich dieser wird F durch eine Diagonalmatrix beschrieben. Frage 310 Wann heißt ein Endomorphismus F : V −→ V nilpotent? Nennen Sie weitere zu dieser Definition ¨aquivalente Bedingungen. Antwort: Man nennt einen Endomorphismus F : V −→ V nilpotent, wenn F k = 0 f¨ ur ein k ∈ N gilt. F¨ ur F ∈ End(V ) und n = dim V sind die folgenden Aussagen ¨ aquivalent (i) (ii) (iii) (iv)
F ist nilpotent F ℓ = 0 f¨ ur ein ℓ mit 1 ≤ ℓ ≤ n χF = ±X n Es gibt eine Basis B von V , so dass
⎛
⎜ MBB (F ) = ⎝
0 .. 0
.
⎞ ∗ ⎟ ⎠ 0
Beweis: (i) =⇒ (ii) Aus F k = 0 und F k−1 = 0 folgt {0} = im F k im F k−1 . . . im F V.
(∗)
130
5 Normalformentheorie
Denn andernfalls w¨ urde im F j = F (im F j−1 ) = im F j−1 f¨ ur ein j < k gelten, und daraus folgte dann im F j+1 = F (im F j ) = F (im F j−1 ) = im F j−1 und schließlich im F m = im F j−1 = 0 f¨ ur alle m ≥ j − 1, im Widerspruch zur Voraussetzung. Die Kette in (∗) besteht (ausschließlich V ) also aus h¨ ochstens n = dim V Gliedern. (ii) =⇒ (iii) F ℓ = 0 impliziert, dass 0 der einzige Eigenwert ist. W¨ are λ = 0 ein anderer Eigenwert und v ein zugeh¨ origer Eigenvektor, dann w¨ urde ja F ℓ (v) = λℓ v = 0 gelten. Es folgt, dass das charakteristische Polynom die Form χF = ±X n haben muss. (iii) =⇒ (iv) Nach Antwort 309 ist F trigonalisierbar. Die entsprechende Dreiecksmatrix muss dann die spezielle Gestalt haben. (iv) =⇒ (i) In der Matrix A = (aij ) gilt aij = 0 f¨ ur alle Paare (i, j) mit j ≤ i. F¨ ur die Eintr¨ age cij der Matrix A2 gilt daher cij = aiℓ aℓj = aiℓ aℓj , ℓ=1
i<ℓ<j
ur alle Paare von Indizes (i, j) mit j ≤ i + 1. Induktiv ergibt d. h., es ist cij = 0 f¨ sich mit diesem Argument, dass f¨ ur die Eintr¨ age dij der Matrix An gelten muss: dij = 0 f¨ ur alle Paare (i, j) mit j ≤ i + n − 1, woraus wegen 1 ≤ i, j ≤ n dann folgt, dass alle Eintr¨ age in An verschwinden.
5.3
Einsetzen von Matrizen und Endomorphismen in Polynome
Um das Abbildungsverhalten eines Endomorphismus F : V −→ V zu analysieren, m¨ ussen systematisch die Potenzen F i untersucht werden. Das spielt vor allem dann eine Rolle, wenn es um das Auffinden F -invarianter Unterr¨ aume von V geht. Frage 311 Wie sind f¨ ur F ∈ End(V ) bzw. A ∈ M (n, K) die Einsetzungshomomorphismen ΦF : K[X] −→ End(V ) definiert?
bzw. ΦA : K[X] −→ M (n, K)
131
5.3 Einsetzen von Matrizen und Endomorphismen in Polynome
r i Antwort: F¨ ur ein Polyom p(X) = i=0 αi X aus K[X] ist ΦF (p) derjenige Endomorphismus V −→ V , den man durch formales Einsetzen von F f¨ ur X in p erh¨ alt, analog f¨ ur ΦA (p). Es gilt also ΦF (p) = p(F ) =
r
αi F
i
bzw.
ΦA (p) = p(A) =
i=0
r
αi Ai .
i=0
Dabei sind die Potenzen F i und Ai wie u ¨blich rekursiv definiert durch F 0 = id, F i+1 = F ◦ F i ,
A0 = En , Ai+1 = A · Ai .
Frage 312 K¨ onnen Sie zeigen, dass es sich bei dem Einsetzungshomomorphismus ΦF um einen Homomorphismus von Ringen handelt? i i Antwort: Seien p, q ∈ K[X] mit p(X) = i∈N βi X , i∈N αi X und q(X) = wobei nur endlich viele der Koeffizienten αi , βi nicht verschwinden. Dann gilt (αi + βi )F i = αi F i + βi F i = p(F ) + q(F ) (p + q)(F ) = i∈N
i∈N
(λp)(F ) =
λαi F i = λ
i∈N
i∈N
αi F i = λ · p(F ).
i∈N
Es folgt ΦF (p + q) = ΦF (p) + ΦF (q) und ΦF (λp) = λΦF (p). Damit respektiert ΦF die Vektorraumstrukturen von K[X] und End(V ). Da f¨ ur Endomorphismen F, G der Zusammenhang αF ◦ βG = αβ · F ◦ G gilt, folgt außerdem βj F j = βj · p(F ) ◦ F j p(F ) ◦ q(F ) = p(F ) ◦ j∈N
=
j∈N
βj
i∈N
j∈N
αi · F i ◦ F j =
αi βj F i+j = (p · q)(F ).
i∈N j∈N
Es gilt also ΦF (p·q) = ΦF (p)◦ΦF (q). Die Abbildung ΦF respektiert damit auch die Strukturen von K[X] und End(V ) als Halbgruppen bez¨ uglich der Multiplikation von Polynomen bzw. der Verkettung von Endomorphismen. ΦF ist also in der Tat ein Homomorphismus von Ringen. Frage 313
Wieso gilt ΦF (p) ◦ ΦF (q) = ΦF (q) ◦ ΦF (p)?
Antwort: Da die Multiplikation von Polynomen in K[X] kommutativ ist, folgt aus dem zweiten Teil von Frage 312 ΦF (p) ◦ ΦF (q) = ΦF (p · q) = ΦF (q · p) = ΦF (q) ◦ ΦF (p).
132
5 Normalformentheorie
Frage 314
K¨ onnen Sie MBB p(F ) = p MBB (F ) zeigen?
Antwort: Nach Frage 176 gilt f¨ ur F, G ∈ End(V ) der Zusammenhang MBB (F ◦ i r G) = MBB (F )·MBB (G), und daraus folgt MBB (F i ) = MBB (F ) . Mit p = i=1 αi X i gilt also r r i αi MBB (F i ) αi MBB (F ) = p MBB (F ) =
=
i=1 r i=1
i=1
MBB (αi F i )
=
MBB
r i=1
αi F
i
= MBB p(F ) .
Frage 315 Wieso gibt es zu jedem Endomorphismus F : V −→ V eines KVektorraums V der Dimension n < ∞ ein Polynom p = 0 mit ΦF = p(F ) = 0? Antwort: Der Raum End(V ) besitzt als K-Vektorraum die Dimension n2 . Da K[X] unendliche Dimension besitzt, muss der Vektorraumhomomorphismus ΦF : K[X] −→ End(V ) einen nichttrivialen Kern haben. Konkreter und ausf¨ uhrlicher kann man auch wie folgt argumentieren. Sei m = n2 = dim End(V ). Dann sind die m + 1 Endomorphismen id = F 0 , F, . . . , F m linear abh¨ angig, f¨ ur geeignete αi ∈ K gilt also αm F m + · · · + α1 F + α0 id = 0. m Mit p(X) = i=0 αi X i folgt dann ΦF (p) = p(F ) = 0. Das beantwortet die Frage. Frage 316 K¨ onnen Sie zeigen, dass es zu jeder 2 × 2-Matrix A ein Polynom p vom Grad 2 gibt, f¨ ur das p(A) = 0 gilt? 2 a b a + bc ab + bd . F¨ ur jedes . Man erh¨ alt A2 = Antwort: Sei A = b c ac + cd bc + d2 quadratische Polynom p(X) = αX 2 + βX + γ gilt damit α(a2 + bc) + βa + γ α(ab + bd) + βb . p(A) = α(ac + cd) + βc α(bc + d2 ) + βd + γ Der Ansatz p(A) = 0 f¨ uhrt auf ein lineares Gleichungssystem mit vier Gleichungen und drei Unbekannten. Der zweite und dritte Eintrag in der Matrix f¨ uhren auf die Gleichungen c(aα + dα + β) = 0 und b(aα + dα + β) = 0, die linear abh¨ angig sind. Aus ihnen ergibt sich β = −αa − αd. Setzt man das in den ersten und letzten Eintrag der Matrix ein, so f¨ uhrt das auf die beiden Gleichungen αa2 + αbc − αa2 − αad + γ = αbc − αad + γ = 0 αbc + αd2 − αad − αd2 + γ = αbc − αad + γ = 0.
5.3 Einsetzen von Matrizen und Endomorphismen in Polynome
133
Diese Gleichungen sind dann ebenfalls linear abh¨ angig. Man schließt daraus, dass das durch p(A) = 0 gegebene Gleichungssystem in drei Unbekannten einen Rang kleiner oder gleich 2 und damit nichttriviale L¨ osung (α, β, γ) besitzt. Mit p = αX 2 + βX + γ gilt also p(A) = 0. Setzt man u alt man β = −(a + b) = − Spur A und ¨brigens α = 1, so erh¨ γ = ad − bc = det A. Das f¨ uhrt auf das Polynom X 2 − Spur A · X + det A, welches gerade das charakteristische Polynom von A ist. Frage 317 Ist λ ein Eigenwert zu F ∈ End(V ) und p ∈ K[X], dann ist p(λ) ein Eigenwert von p(F ). K¨ onnen Sie diese Aussage begr¨ unden? Antwort: Ist zu λ, dann gilt F (v) = λv und somit F i (v) = λi v. vr ein Eigenvektor i Mit p(X) = i=0 αi X gilt also p(F )(v) =
r i=0
i
αi F (v) =
r
αi λi · v = p(λ) · v.
i=0
Damit ist v ein Eigenvektor von p(F ) zum Eigenwert p(λ). Das beantwortet die Frage. Frage 318 Was ist das Minimalpolynom eines Endomorphismus F : V −→ V eines endlich-dimensionalen Vektorraums V ? Antwort: Das Minimalpolynom pF ∈ K[X] ist durch die folgenden beiden Eigenschaften ausgezeichnet: (i) Es gilt pF (F ) = 0. (ii) pF ist normiert, pF = X r + · · · . (iii) F¨ ur jedes Polynom q ∈ K[X] mit q(F ) = 0 gilt pF |q. Die Existenz des Minimalpolynoms folgt aus der Tatsache, dass die Menge
IF := {q ∈ K[X] ; F (q) = 0} ⊂ K[X] ein Ideal im Hauptidealring K[X] ist und daher von einem p ∈ K[X] erzeugt wird, so dass also f¨ ur jedes q ∈ IF ein r ∈ K[X] existiert mit q = rp. Damit erf¨ ullt p die Eigenschaft (iii), und durch Normierung von p erh¨ alt man daraus pF . Frage 319 sen?
Was besagt der Satz von Cayley-Hamilton? Wie kann man ihn bewei-
Antwort: Der Satz von Cayley-Hamilton lautet: Das Minimalpolynom eines Endomorphismus F : V −→ V ist stets ein Teiler des charakteristischen Polynoms. Insbesondere gilt χF (F ) = 0 und deg pF ≤ deg χF .
134
5 Normalformentheorie
Beweis: Zun¨ achst ist es sinnvoll, das Problem in ein matrizentheoretisches zu u bersetzen, d. h. die zur Behauptung a ¨ ¨quivalente Gleichung χA (A) = 0, zu zeigen, bei der A eine Matrix aus K n×n bezeichnet. Man betrachte dazu die Matrix (EX − A). Diese kann man gem¨ aß der Bemerkung aus Frage 298 als Element von K(X)n×n auffassen, wobei K(X) den Quotientenk¨ orper von K[X] bezeichnet. Nach der Formel aus Frage 277 erh¨ alt man (XE − A)ad · (XE − A) = det(XE − A) · E = χA (X) · E. (∗) Diese Gleichung gilt zun¨ achst in K(X)n×n , sie bleibt aber auch noch in K[X]n×n g¨ ultig, da aufgrund der Definition der adjungierten Matrix auch (XE − A)ad zu K[X]n×n geh¨ ort. Das ist der erste wesentliche Schritt im Beweis. Der zweite erfordert einen kleinen begrifflichen Exkurs. Ausgangspunkt ist die Beobachtung, dass – wie man sich leicht klarmacht – jede Matrix C ∈ K[X]n×n sich eindeutig in der Form C= Ci (X · E)i , Ci ∈ K n×n i∈N
schreiben l¨ asst, wobei nat¨ urlich Ci = 0 f¨ ur fast alle i gilt. Damit kann man – wenn man statt X · E einfach X schreibt – den Matrizenring K[X]n×n mit dem Polynomring K n×n [X] identifizieren. Dieser l¨ asst sich analog zu den Polynomringen u ur den nicht-kommutativen Ring K n×n ¨ber kommutativen Ringen auch f¨ definieren. Allerdings ist dann zu beachten, dass die Einsetzungsabbildung FA : K n×n [X] −→ K n×n , Ci X i −→ Ci Ai i∈N
i∈N
f¨ ur A ∈ K n×n im Allgemeinen kein Homomorphismus von Ringen mehr ist, da A im Gegensatz zu X in der Regel nicht mit allen Elementen aus K n×n kommutiert. Dieses Defizit kommt beim weiteren Beweis allerdings nicht zu Tragen. Nach diesen Vorbereitungen kann man zum eigentlichen Beweis und der Formel (∗) zur¨ uck, nun aber ausgestattet mit der zus¨ atzlichen Erkenntnis, dass man die Matrix (XE −A) und ihre Adjunkte und damit auch deren Produkt als Polynome in K n×n [X] auffassen kann. Es ist also (XE − A)ad = i∈N Ai X i mit eindeutig
135
5.4 Die Jordan’sche Normalform
bestimmten Matrizen Ai ∈ K n×n , die f¨ ur fast alle i verschwinden. Setzt man das in (∗) ein, so folgt i χA (X) · E = Ai X · (XE − A) i=∈N
=
Ai X i+1 −
i∈N
=
=
Ai X i A
i∈N
Ai X
i+1
Ai X
i+1
−
i∈N
Ai AX i
i∈N
− A0 A −
i∈N
Ai+1 AX i+1
i∈N
= −A0 A +
(Ai − Ai+1 )X i+1 .
i∈N
Dieselbe Rechnung l¨ asst sich auch dann durchf¨ uhren, wenn man f¨ ur X eine Matrix B einsetzt, die mit A vertauschbar ist. Insbesondere kann man f¨ ur X also A einsetzen und erh¨ alt χA (A) · E = −A0 A + (Ai Ai+1 − Ai+1 Ai+2 ) = 0, i∈N
da der mittlere Gleichungsterm eine Teleskopsumme ist. Es folgt χA (A) = 0, und damit ist der Satz von Cayley-Hamilton vollst¨ andig bewiesen.
5.4
Die Jordan’sche Normalform
Ein Endomorphismus ist nur dann diagonalisierbar, wenn sein charakteristisches Polynom u orper vollst¨ andig in Linearfaktoren zerf¨ allt und die ¨ber dem Grundk¨ geometrische Vielfachheit jedes Eigenwerts mit der algebraischen Vielfachheit u ur einen Eigenwert nicht gegeben, so ¨bereinstimmt. Ist die letzte Bedingung f¨ gilt die Zerlegung von V aus Frage 296 in eine direkte Summe aus Eigenr¨ aumen nicht mehr, selbst wenn das charakteristische Polynom vollst¨ andig in Linearfaktoren zerf¨ allt, da die Dimensionen des entsprechenden Eigenraums in diesem Fall zu klein ist. Um auch unter diesen Bedingungen eine Zerlegung von V in F -invariante Unterr¨ aume zu bekommen, muss man demnach gr¨ oßere R¨ aume in Betracht ziehen. Kandidaten daf¨ ur sind die sogenannten Hauptr¨ aume oder verallgemeinerten Eigenr¨ aume. Frage 320 Sei F : V −→ V ein Endomorphismus eines K-Vektorraums V . K¨ onnen Sie zeigen, dass eine kleinste nat¨ urliche Zahl d mit 0 < d ≤ n = dim V existiert, f¨ ur die im F d+1 = im F d und ker F d+1 = ker F d
136
5 Normalformentheorie
gilt? Wieso gilt dann bereits im F d+j = im F d und ker F d+j = ker F d f¨ ur alle j ∈ N? Antwort: F¨ ur jedes k ∈ N gilt im F k+1 ⊆ im F k und damit n = dim im F 0 ≥ · · · ≥ dim im F k ≥ dim im F k+1 ≥ 0. Da diese Folge nicht endlos absteigen kann, muss an einer fr¨ uhesten Stelle d+1 d d+1 d dim im F = dim im = im F gelten. Daraus ergibt im F und folglich F sich F d+2 (V ) = F F d+1 (V ) = F F (V ) = F d+1 (V ) = F (V ). Induktiv erh¨ alt ur alle j ∈ N. man daraus F d+j (V ) = F d (V ) f¨ Die entsprechenden Behauptungen f¨ ur den Kern von F d folgen daraus mithilfe der Dimensionsformel unter Benutzung von ker F k+1 ⊇ ker F k f¨ ur alle k ∈ N. Frage 321 K¨ onnen Sie zeigen, dass mit der nach Frage 320 eindeutig bestimmten nat¨ urlichen Zahl d = min{ℓ ∈ N ; im F ℓ = im F l+1 } gilt V = im F d ⊕ ker F d ,
(∗)
und dass die R¨aume im F d und ker F d F -invariant sind? Antwort: Wegen im F d+1 = im F d bzw. ker F d+1 = ker F d erh¨ alt man v ∈ im F d =⇒ F (v) ∈ im F d+1 =⇒ F (v) ∈ im F d v ∈ ker F d =⇒ v ∈ ker F d+1 =⇒ F d+1 (v) = F d F (v) = 0 =⇒ F (v) ∈ ker F d .
Das zeigt die F -Invarianz der R¨ aume im F d und ker F d . Um (∗) zu zeigen, sei v ∈ im F d ∩ ker F d . Dann gilt v = F d (w) f¨ ur ein w ∈ V sowie F d (v) = F 2d (w) = 0 und folglich w ∈ ker F 2d = ker F d . Damit hat man v = F (w) = 0. Somit ist die Summe im F d + ker F d direkt. Die Gleichung (∗) ergibt sich daraus mithilfe der Dimensionsformel. Frage 322 Sei G : V −→ V ein Endomorphismus, dessen charakteristisches Polynom die Gestalt χG (X) = (X − λ)m · (X − λ2 )m2 · · · (X − λr )mr mit paarweise verschiedenen Eigenwerten λ, λ1 , . . . , λr besitzt. K¨ onnen Sie zeigen, dass f¨ ur die Abbildung F := G − λid und die nach Frage 320 eindeutig bestimmten Zahl d := min{ℓ ∈ N ; im F ℓ = im F ℓ+1 } = min{ℓ ∈ N ; ker F ℓ = ker F ℓ+1 } die folgenden Behauptungen zutreffen? (i) Die Einschr¨ankung von F auf im F d ist injektiv. (ii) Es gilt χG| ker F d = (X − λ)m . (iii) dim ker F d = m und d ≤ m.
5.4 Die Jordan’sche Normalform
137
Antwort: (i) Sei v ∈ im F d , also v = F d (w) f¨ ur ein w ∈ V . Dann gilt d F (v) = 0 =⇒ F F (w) = 0 =⇒ w ∈ ker F d+1 = ker F d =⇒ v = F d (w) = 0. Also ist F |im F d : V −→ V injektiv. (ii) Aufgrund der Zerlegung (∗) aus Frage 321 gilt
χF (X) = χF | ker F d (X) · χF |im F d (X). Es kann λ kein Eigenwert zu G|im F d sein, denn f¨ ur v = F d (w) ∈ im F d gilt: G(v) = λv =⇒ (F + λid)(v) = λv =⇒ F d+1 (w) + λv = λv =⇒ F d+1 (w) = 0 =⇒ w ∈ ker F d+1 = ker F d =⇒ v = F (w) = 0. Daraus folgt, dass der Faktor (X − λ)m ein Teiler von χG| ker F d sein muss. Es bleibt daher nur noch zu zeigen, dass keiner der anderen Faktoren von χG ein Teiler von χF | ker F d sein kann. Angenommen, es gilt G(v) = (F + λid)(v) = λi v f¨ ur ein i ∈ 2, . . . , n und ein v ∈ ker F d mit v = 0. Dann folgt F (v) = (λi − λ) · v und somit (λi − λ)d · v = 0, also λi = λ, im Widerspruch zur Voraussetzung. (iii) Der erste Teil folgt unmittelbar daraus, dass das charakteristische Polynom von G|ker F d den Grad m besitzt. F¨ ur den Beweis der zweiten Behauptung beachte man, dass nach dem Satz von Cayley-Hamilton gilt: χG| ker F d (G|ker F d ) = (G|ker F d − λid)m = 0, also (G−λid)m (v) = F m (v) = 0 f¨ ur alle v ∈ ker F d . Daraus folgt ker F d ⊂ ker F m , also d ≤ m. Frage 323 Was versteht man unter dem Hauptraum oder verallgemeinertem Eigenraum H(F, λ) eines Endomorphismus F : V −→ V zum Eigenwert λ? Antwort: Man definiert H(F, λ) := ker(F − λid)m , wobei m = µ(F, λ) gleich der algebraischen Vielfachheit von λ ist. Aufgrund der Fragen 320 und 322 (iii) hat man H(F, λ) = ker(F − λid)d . Dabei ist wie u ¨blich d = min{ℓ ∈ N ; im (F − λid)ℓ = im (F − λid)ℓ+1 }. Frage 324
angeben?
K¨ onnen Sie s¨amtliche Hauptr¨aume der Matrix ⎛ ⎞ 1 2 1 ⎜ ⎟ A = ⎝0 3 1⎠ 0 0 3
138
5 Normalformentheorie
Antwort: F¨ ur das charakteristische Polynom gilt χA (X) = (X − 1) · (X − 3)2 . Damit ist H(A, 1) = ker(A − id) = L(A, 0) = Re1 ein Hauptraum. Weiter gilt rg(A − 3id) = 2,
rg(A − 3id)2 = rg(A − 3id)3 = 1.
F¨ ur den Eigenwert 2 hat man damit d = 2. Somit ist ker(A − 3id)2 = L(A − 3id, 0) = span (1, 1, 0)t , e3 der Hauptraum zum Eigenwert 2. Frage 325
Was besagt der Satz u ¨ber die Hauptraumzerlegung?
Antwort: Der Satz u ¨ber die Hauptraumzerlegung besagt: Ist F ∈ EndK (V ) ein Endomorphismus mit den paarweise verschiedenen Eigenwerten λ1 , . . . , λr , dessen charakteristisches Polynom u andig in Line¨ber K vollst¨ arfaktoren zerf¨ allt, dann gilt V = H(F, λ1 ) ⊕ · · · ⊕ H(F, λr ), ur i = 1, . . . , r F -invariant sind. wobei die Unterr¨ aume H(F, λi ) f¨ Beweis: Sei χF (X) = (X − λ1 )m1 · (X − λ2 )m2 · · · (X − λr )mr das charakteristische Polynom von F . Nach Frage 321 existiert eine Zerlegung V = H(F, λ1 ) ⊕ U in F -invariante Unterr¨ aume. Da die Einschr¨ ankung von F auf U das charakterim2 mr besitzt, ergibt sich der Satz daraus stische Polynom (X − λ2 ) · · · (X − λr ) mit vollst¨ andiger Induktion. Frage 326 Was versteht man unter einem nilpotenten Endomorphismus? Was ist ein Nilpotenzindex? Antwort: Ein Endomorphismus F : V −→ V heiß nilpotent, wenn eine nat¨ urliche k Zahl k existiert, so dass F (v) = 0 f¨ ur alle v ∈ V gilt. Der Nilpotenzindex ist der kleinste Exponent, f¨ ur den diese Gleichung gilt. Frage 327 Sei F : V −→ V ein nilpotenter Endomorphismus mit Nilpotenzindex n = dim V . K¨ onnen Sie zeigen, dass eine Basis B von V existiert, bez¨ uglich der F die folgende Gestalt hat ⎞ ⎛ 0 1 0 ⎟ ⎜ 0 1 ⎟ ⎜ ⎟ ⎜ . . ⎟? .. .. MB (F ) = Jn := ⎜ ⎟ ⎜ ⎟ ⎜ ⎝ 0 1⎠ 0 0
139
5.4 Die Jordan’sche Normalform
Antwort: Es gibt ein Element v ∈ V derart, dass die Vektoren F n−1 (v), F n−2 (v), . . . , F (v), v
(∗)
alle ungleich null sind. Sie sind ferner linear unabh¨ angig, denn aus der Gleichung α1 F n−1 (v) + · · · + αn v = 0 folgt durch Anwendung von F n−1 auf beiden Seiten αn F n−1 (v) = 0, also αn = 0. Die Anwendung von F n−2 liefert anschließend αn−1 = 0 usw. Die Vektoren in (∗) bilden daher eine Basis B von V , und bez¨ uglich dieser hat die Matrix MB (F ) die angegebene Gestalt. Frage 328 K¨ onnen Sie zeigen, dass f¨ ur jeden nilpotenten Endomorphismus F : V −→ V mit Nilpotenzindex d eine Zerlegung V = W 1 ⊕ · · · ⊕ Wd in Unterr¨aume Wi existiert, f¨ ur die F (Wi ) ⊂ Wi−1 mit i = 1, . . . , d und W0 = {0} gilt? Antwort: Man betrachte die Kette {0} = ker F 0 ker F 1 · · · ker F d−1 ker F d = V und w¨ ahle Wd in einem ersten Schritt so, dass V = ker F d = ker F d−1 ⊕ Wd gilt. F¨ ur den Raum Wd gelten die Eigenschaften F (Wd ) ⊂ ker F d−1
und F (Wd ) ∩ ker F d−2 = {0}.
(∗)
Die erste Eigenschaft folgt einfach daraus, dass F den Nilpotenzindex d hat. Die zweite erkennt man folgendermaßen: Sei v ∈ F (Wd ) ∩ ker F d−2 . Dann gilt v = F (w) f¨ ur ein w ∈ Wd sowie F d−2 (v) = F d−1 (w) = 0, also w ∈ Wd ∩ ker F d−1 . Daraus folgt w = 0 und somit v = F (0) aufgrund der Konstruktion von Wd . Wegen (∗) sowie ker F d−2 ⊂ ker F d−1 gibt es also eine Zerlegung ker F d−1 = ker F d−2 ⊕ Wd−1
mit F (Wd ) ⊂ Wd−1 .
Man erh¨ alt V = ker F d−2 ⊕ Wd−1 ⊕ Wd . Der Unterraum ker F d−2 l¨ asst sich nun wiederum nach dem obigen Muster zerlegen. Die wiederholte Zerlegung der Unterr¨ aume ker F d−j f¨ uhrt schließlich auf V = ker F 0 ⊕ W1 ⊕ · · · ⊕ Wd = W1 ⊕ · · · ⊕ Wd .
140
5 Normalformentheorie
Frage 329
K¨ onnen Sie die Zerlegung aus Frage 328 am Beispiel der Matrix ⎛ ⎞ 0 4 1 ⎜ ⎟ A = ⎝0 0 1 ⎠ 0 0 0
demonstrieren?
Antwort: Sei F die durch A beschriebene lineare Abbildung. Mit A2 = und A3 = 0 erh¨ alt man d = 3 und
004 000 000
{0} = ker F 0 ⊂ ker F = span e1 ⊂ ker F 2 = span(e1 , e2 ) ⊂ ker F 3 = R3 . achst W3 = span e3 . F¨ ur W2 muss gelten Aus R3 = ker F 2 ⊕ W3 folgt zun¨
R3 = ker F ⊕ W2 ⊕ W3
und F (W3 ) ⊂ W2 .
Daraus folgt, dass w2 := A · e3 = (1, 1, 0)T ein geeigneter Basisvektor von W2 ist. Schließlich erh¨ alt man auf demselben Weg w3 := A · w2 = A2 · e3 = (4, 0, 0)T als Basisvektor von W2 . Somit ist V = Rw3 ⊕ Rw2 ⊕ Re3 die gesuchte Zerlegung in F -invariante Unterr¨ aume. Bez¨ uglich der Basis (w3 , w2 , e3 ) wird F durch die Matrix ⎛ ⎞ 0 1 0 ⎜ ⎟ A′ = ⎝0 0 1⎠ 0 0 0
beschrieben.
Frage 330 Sei F : V −→ V ein nilpotenter Endomorphismus mit Nilpotenzindex d. K¨ onnen Sie zeigen, dass eindeutig bestimmte nat¨ urliche Zahlen s1 , . . . , sd mit d · sd + (d − 1) · sd−1 + · · · + s1 = n = dim V existieren sowie eine Basis B von V , mit der gilt: ⎞ ⎛ ⎛ Ad 0 Jk ⎟ ⎜ Ad−1 ⎟ ⎜ ⎜ ⎟ MB (F ) = ⎜ mit Ak = ⎝ .. ⎟ ⎜ . ⎠ ⎝ 0 0 A1
0 ..
.
Dabei besitzen die Matrizen Jk ∈ K k×k die Form aus Frage 327.
Jk
⎞⎫ ⎪ ⎬ ⎟ ⎠ sk -mal. ⎪ ⎭
141
5.4 Die Jordan’sche Normalform
Antwort: Um die gesuchte Basis von V zu konstruieren, orientiere man sich an der Zerlegung (∗) aus Frage 328 und beginne mit einer Basis (∗)
wd,1 , . . . , wd,sd
von Wd (mit sd := dim Wd ), wobei wie in Frage 328 gilt: V = ker F d−1 ⊕ Wd . Da die Einschr¨ ankung F |Wd injektiv abbildet und F (Wd ) ⊂ Wd−1 gilt, sind die Bilder der Basisvektoren in (∗) unabh¨ angig in Wd−1 . Sie lassen sich daher zu einer Basis F (wd,1 ), . . . , F (wd,sd ), wd−1,1 , · · ·, wd−1,sd−1 von Wd−1 erg¨ anzen, wobei sd−1 = dim Wd−1 −sd gilt. Auf diese Weise fortfahrend erh¨ alt man Vektoren wd,1 . . . F (wd,1 ) . . . .. .
wd,sd F (wd,sd ) .. .
wd−1,1 . . . .. .
wd−1,sd−1 .. .
F d−1 (wd,1 ) . . . F d−1 (wd,sd ) F d−2 (wd−1,1 ) . . . F d−2 (wd−1,sd−1 ) . . . w1,1 . . . , w1,s1 . Hier ist die i-te Zeile von unten eine Basis f¨ ur Wi . Aufgrund der Zerlegung aus Frage 328 bilden die d · sd + (d − 1) · sd−1 + · · · + s1 Vektoren in diesem Schema eine Basis von V . Ferner sind die Zahlen si f¨ ur i = 1, . . . d durch die Rekursionsi formel dim Wi = ν=1 sν eindeutig bestimmt. Das beantwortet den ersten Teil der Frage. Man ordne die Vektoren in den Spalten des obigen Schemas nun zu jeweils d linear unabh¨ angigen Systemen Bℓ (1 ≤ ℓ ≤ ν=1 sν ) an, indem man die Spalten von unten nach oben durchliest. Die Unterr¨ aume Uℓ := span(Bℓ ) sind dann F invariant, und die Einschr¨ ankungen F |Uℓ sind nilpotente Endomorphismen, deren Nilpotenzindex gerade der Dimension von Uℓ entspricht. Daher gilt MBℓ (F |Uℓ ) = Jℓ nach Frage 327, und bez¨ uglich der Zerlegung V = U1 ⊕ · · · ⊕ Usd ⊕ · · · ⊕ Usd +sd−1 ⊕ · · · · · · ⊕ Usd +sd−1 +···+s1 mit den entsprechenden Basen Bℓ besitzt die Matrix die angebene Gestalt. Frage 331
Was besagt der Satz u ¨ber die Jordan’sche Normalform?
Antwort: Der Satz besagt: Sei F : V −→ V ein Endomorphismus eines K-Vektorraums V , dessen charakteristisches Polynom u andig in Linearfaktoren zerf¨ allt, also ¨ber K vollst¨ χF (X) = (X − λ1 )m1 · · · (X − λr )mr
142
5 Normalformentheorie
mit den paarweise verschiedenen Eigenwerten λ1 , . . . , λr gilt. Dann existiert eine Basis B von V , bez¨ uglich der F durch eine Matrix der Gestalt ⎛ ⎞
⎜ C1 ⎜ ⎜ ⎜ ⎜ m1 ⎜ C2 MB (F ) = ⎜ ⎜ ⎜ ⎜ .. m2 ⎜ . ⎜ ⎝ 0
0
Cr
⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠
mr
dargestellt wird. Dabei gilt mit eindeutig bestimmten nat¨ urlichen Zahlen µi und νi,j (i = 1, . . . , r, j = 1, . . . , µi ) ⎛ ⎞
⎜ J ⎜ i,1 ⎜ ⎜ ⎜ ⎜ ⎜ νi,1 Ji,2 Ci = ⎜ ⎜ ⎜ ⎜ ⎜ .. νi,2 ⎜ . ⎜ ⎝
⎟ ⎟ ⎛ ⎟ λi 1 ⎟ ⎜ ⎟ λi ⎜ ⎟ ⎜ ⎟ ⎟ und Ji,j = ⎜ ⎜ ⎟ ⎜ ⎟ ⎟ ⎝ ⎟ ⎟ ⎟ ⎠
Ji,μi νi,μi
1 ..
.
⎞⎫ ⎪ ⎪ ⎪ ⎟⎪ ⎪ ⎟⎪ ⎬ ⎟ .. ⎟ . ⎟⎪ νi,j . ⎟⎪ ⎪ λi 1 ⎠⎪ ⎪ ⎪ ⎭ λi
Dabei sind die Bl¨ ocke der Gr¨ oße nach geordnet: νi,1 ≥ νi,2 ≥ · · · ≥ νi,1 , wobei an einigen Stellen allerdings auch das Gleichheitszeichen stehen kann. Der Beweis beschr¨ ankt sich im Wesentlichen auf eine Zusammenfassung des bereits Entwickelten. Die Einschr¨ ankungen (f − λi id)|H(F,λi ) sind nilpotente Endomorphismen mit Nilpotenzindex di und werden demnach bez¨ uglich einer geeigneten Basis Bi durch eine Matrix der Gestalt wie in Frage 330 beschrieben. Die Matrix von F |H(f,λi ) sieht damit wie folgt aus ⎛ ⎞ ⎞ ⎛ Adi 0 Jij 0 ⎜ ⎟ Adi −1 ⎜ ⎟ ⎟ ⎜ .. ⎟ MBi (F |H(F,λi ) ) = ⎜ mit Aj = ⎝ ⎠, . .. ⎜ ⎟ . ⎝ ⎠ 0 Jij 0 A1
5.4 Die Jordan’sche Normalform
143
wobei die Gr¨ oße der Bl¨ ocke Aj eindeutig bestimmt ist. Durch eine entsprechende Anordnung der Vektoren in Bi erreicht man, dass diese Bl¨ ocke der Gr¨ oße nach absteigend geordnet sind und MBi (F |H(f,λi ) ) damit die Gestalt der Matrix Ci hat. Daraus folgt nun die Jordan’sche Normalform mithilfe der Hauptraumzerlegung V = H(F, λ1 ) ⊕ · · · ⊕ H(F, λr ) aus Frage 325. Frage 332
Wie lautet die Jordan’sche Normalform der Matrix ⎛ ⎞ 0 4 1 ⎜ ⎟ A = ⎝0 0 1 ⎠ 0 0 0
aus Frage 329?
Antwort: Die Jordan’sche Normalform lautet ⎛ ⎞ 1 0 0 ⎜ ⎟ ⎝0 3 1⎠ 0 0 3 .
6 Euklidische und unit¨ are Vektorr¨ aume Viele Vektorr¨ aume besitzen neben denjenigen Eigenschaften, die sich durch die Begriffe Basis“, Linearkombination“ etc. ausdr¨ ucken lassen, auch noch zus¨ atz” ” n liche Strukturen. So hat etwa jeder Vektor im R eine bestimmte L¨ ange“ und ” schließt mit einem anderen Vektor einen bestimmten Winkel ein. Diese Merkmale lassen sich mithilfe eines Skalarprodukts beschreiben. Vektorr¨ aume, die ein Skalarprodukt besitzen, heißen euklidisch, wenn sie reell, und unit¨ ar, wenn sie komplex sind. Wir betrachten in diesem gesamten Kapitel ausschließlich Vektorr¨ aume u ¨ber den K¨ orpern R oder C und benutzen in S¨ atzen, die auf beide K¨ orper verweisen, das Symbol K.
6.1
Bilinearformen und Skalarprodukte
Skalarprodukte auf einem reellen bzw. komplexen Vektorraum sind spezielle Bilinear- bzw. Sesquilinearformen. Frage 333 Was versteht man unter einer Bilinearform auf einem K-Vektorraum V ? Wann nennt man eine Bilinearform symmetrisch, wann alternierend? Antwort: Eine Bilinearform auf einem K-Vektorraum V ist eine Abbildung Φ : V × V −→ K, die linear in beiden Argumenten ist, f¨ ur die also Φ(v + v ′ , w) = Φ(v, w) + Φ(v ′ , w), Φ(v, w + w′ ) = Φ(v, w) + Φ(v, w′ ),
Φ(αv, w) = αΦ(v, w) Φ(v, αw) = αΦ(v, w)
f¨ ur alle v, v ′ , w, w′ ∈ V und alle α ∈ K gilt. Eine Bilinearform Φ heißt symmetrisch, wenn Φ(v, w) = Φ(w, v) alternierend, wenn Φ(v, w) = −Φ(w, v) f¨ ur alle v, w ∈ V gilt. Frage 334
Was ist eine Sesquilinearform auf einem C-Vektorraum V ?
Antwort: Eine Sesquilinearform auf einem komplexen Vektorraum V ist eine Abbildung Φ : V × V −→ C mit den Eigenschaften (i) (ii) (iii) (iv)
Φ(v + v ′ , w) = Φ(v, w) + Φ(v ′ , w) Φ(αv, w) = αΦ(v, w) Φ(v, w + w′ ) = Φ(v, w) + Φ(v, w′ ) Φ(v, αw) = αΦ(v, w)
6.1 Bilinearformen und Skalarprodukte
145
Dabei bezeichnen v, v ′ , w, w′ Vektoren aus V und α ein beliebiges Element aus K sowie : C −→ C, α −→ α die komplexe Konjugation. Eine Sesquilinearform unterscheidet sich von einer Bilinearform also nur im Punkt (iv). Letztere ist linear, Erstere semilinear im zweiten Argument. Insbesondere sind f¨ ur R-Vektorr¨ aume Sesquilinearformen und Bilinearformen dasselbe. Frage 335
Was ist eine hermitesche Form auf einem C-Vektorraum V ?
Antwort: Eine hermitesche Form Φ ist eine Sesquilinearform auf V , f¨ ur die Φ(v, w) = Φ(v, w) f¨ ur alle v, w ∈ V gilt. F¨ ur eine hermitesche Form Φ gilt damit stets Φ(v, v) ∈ R. Es ist diese Eigenschaft, die es erm¨ oglicht, mittels hermitescher Formen eine Norm auf einem komplexen Vektorraum einzuf¨ uhren, siehe Abschnitt 6.2. Daher wird f¨ ur hermitesche Formen die Semilinarit¨ at im zweiten Argument gefordert. Frage 336 Wann heißt eine hermitesche Form Φ : V × V −→ R eines KVektorraums V positiv semidefinit, wann positiv definit? Antwort: Φ heißt positiv semidefinit, wenn Φ(v, v) ≥ 0 und positiv definit, wenn sogar Φ(v, v) > 0 f¨ ur alle v ∈ V mit v = 0 gilt. Da eine symmetrische Bilinearform stets Φ(0, 0) = 0 erf¨ ullt, ist die positive Definitheit von Φ gleichbedeutend damit, dass Φ positiv semidefinit ist und aus Φ(v, v) = 0 stets v = 0 folgt. Frage 337
Was ist ein Skalarprodukt auf einem R-Vektorraum V ?
Antwort: Ein Skalarprodukt auf einem R-Vektorraum V ist eine positiv definite symmetrische Bilinearform. Ein reelles Skalarprodukt ist also eine Abbildung , : V × V −→ R, die f¨ ur alle u, v, w ∈ V und α, β ∈ R die folgenden Eigenschaften besitzt: (i) αu + βv, w = αu, w + βv, w (ii) v, w = w, v (iii) v, v ≥ 0 f¨ ur alle v ∈ V und v, v = 0 ⇐⇒ v = 0 Man beachte, dass die Eigenschaften (i) und (ii) zusammen die Linearit¨ at von , in beiden Argumenten implizieren. Frage 338
Was ist ein Skalarprodukt auf einem C-Vektorraum V ?
Antwort: Eine Skalarprodukt auf einem C-Vektorraum V ist eine positiv definite hermitesche Form, also eine Abbildung , : V −→ C, die f¨ ur alle u, v, w ∈ V und α, β ∈ C die folgenden Eigenschaften besitzt:
146
6 Euklidische und unit¨ are Vektorr¨ aume
(i) αu + βv, w = αu, w + βv, w (ii) v, w = w, v (iii) v, v ≥ 0 ist eine nichtnegative reelle Zahl, und es gilt v, v = 0 dann und nur dann, wenn v = 0 ist Die Eigenschaften (i) und (ii) implizieren die Semilinearit¨ at von Φ im zweiten Argument, denn es gilt u, αv + βw = αv + βw, u = αv, u + βw, u = αu, v + βu, w.
Frage 339
Was ist ein euklidischer Vektorraum, was ein unit¨ arer Vektorraum?
Antwort: Ein euklidischer Vektorraum bzw. unit¨ arer Vektorraum ist ein R- bzw. C-Vektorraum, auf dem ein Skalarprodukt definiert ist. Frage 340 Kennen Sie ein Skalarprodukt im Vektorraum C [a, b] (Raum der stetigen Funktionen auf [a, b])? Antwort: F¨ ur zwei Funktionen f und g aus C [a, b] definiere man eine Abbildung C [a, b] × C [a, b] −→ R durch b f, g := f (t)g(t) dt. a
Dann ist , ein Skalarprodukt in V . Denn f¨ ur f, g, h ∈ C [a, b] und α ∈ R gilt zun¨ achst b f + g, h = f (t) + g(t) h(t) dt a
=
b
f (t)h(t) dt +
a
b
g(t)h(t) dt = f, h + g, h.
a
sowie αf, g =
b
αf (t)g(t) dt = α
a
b
f (t)g(t) dt = α · f, g.
a
Also ist , eine Bilinearform. Deren Symmetrie folgt unmittelbar aus der Kommutativit¨ at der Multiplikation in C [a, b]. Weiter ist , positiv semidefinit, da stets f, f ≥ 0 gilt. Ist f = 0, dann gibt es wegen der Stetigkeit von f einen inneren Punkt t0 ∈ (a, b) mit f (t0 )2 > 0, und daraus folgt wiederum aus Stetigkeitsgr¨ unden, dass in einer Umgebung ]t0 − ε, t0 + ε[ von t0 die Ungleichung f (t)2 > m f¨ ur ein m > 0 erf¨ ullt ist. Damit erh¨ alt man b t0 +ε f (t)2 dt ≥ f (t)2 dt > 2εm > 0. f, f = a
t0 −ε
147
6.1 Bilinearformen und Skalarprodukte
Da zudem offensichtlich 0, 0 = 0 gilt, ist , positiv definit und damit ein Skalarprodukt in C [a, b]. Da beim Nachweis der positiven Definitheit wesentlich von der Stetigkeit der beteiligten Funktionen Gebrauch gemacht wurde, bleibt dasselbe Argument nicht g¨ ultig, wenn man statt des Raumes C [a, b] den Raum der Riemann-integrierbaren Funktionen betrachtet. Zum Beispiel ist die Funktion g : [a, b] −→ R mit 1 f¨ ur x = a g(x) = 0 f¨ ur x ∈ ]a, b] b Riemann-integrierbar mit a g(t)2 dt = 0. Da aber g = 0 ist, ist , auf dem Raum der Riemann-integrierbaren Funktionen nicht positiv definit und definiert dort kein Skalarprodukt. Frage 341
Wie ist das Standardskalarprodukt im Rn bzw. Cn definiert?
Antwort: F¨ ur Vektoren x = (x1 , . . . , xn )T , y = (y1 , . . . , yn )T ∈ Rn definiert man das Standardskalarprodukt • : Rn × Rn −→ R durch x • y = xT · y = x1 y1 + · · · + xn yn . Das komplexe Standardskalarprodukt ist f¨ ur Vektoren x = (x1 , . . . , xn )T , y = (y1 , . . . , yn )T ∈ Cn definiert durch x • y = xT · y = x1 y 1 + · · · + xn y n . Frage 342
Warum ist durch T
≺x, y≻:= x · y :=
n
xi yi
i=1
mit x = (x1 , . . . , xn )T und y = (y1 , . . . , yn )T kein Skalarprodukt auf Cn gegeben? Antwort: Offensichtlich gilt ≺x, y≻=≺y, x≻, und damit ullt die Abbildung erf¨ n nicht die Eigenschaft (ii) einer hermiteschen Form, sofern i=1 xi yi in C \ R liegt, was z. B. f¨ ur v = (1, 0, . . . , 0)T und w = (i, 0, . . . , 0)T der Fall ist. Frage 343
Wie erh¨alt man andere als die kanonischen Skalarprodukte in Rn ?
Antwort: Sei , das Standardskalarprodukt. F¨ ur jeden bijektiven Endomorphismus F : V −→ V ist dann die Abbildung , : V × V −→ R, definiert durch v, w = F (v), F (w) eine positiv definite, symmetrische Bilinearform auf V , mithin ein Skalarprodukt. Alle drei Eigenschaften des Standardskalarproduktes u amlich auf¨bertragen sich n¨ grund der Linearit¨ at und Bijektivit¨ at von F auf , .
148
6 Euklidische und unit¨ are Vektorr¨ aume
Frage 344 Was versteht man unter der darstellenden Matrix bzw. Strukturmatrix einer Bilinear- bzw. Sesquilinearform Φ : V × V −→ V auf einem endlichdimensionalen K-Vektorraum V ? Antwort: Ist B = (v1 , . . . , vn ) eine Basis von V , so nennt man die n × n-Matrix ⎞ ⎛ Φ(v1 , v1 ) · · · Φ(v1 , vn ) ⎟ ⎜ .. .. .. MB (Φ) := ⎝ ⎠ . . . Φ(vn , v1 ) · · ·
Φ(vn , vn )
die Strukturmatrix von Φ bez¨ uglich B.
Eine Bilinearform bzw. Sesquilinearform Φ ist aus Linearit¨ atsgr¨ unden durch die n2 Eintr¨ age inder Strukturmatrixbereits eindeutig festgelegt, da f¨ ur beliebige n n Vektoren v = i=1 αi vi und w = i=1 βi vi gilt: Φ(v, w) =
n n
αi β j Φ(vi , vj ).
i=1 j=1
Diese Summe l¨ asst sich mit der Strukturmatrix auch als Ergebnis einer Matrizenmultiplikation schreiben Φ(v, w) = (α1 , . . . , αn ) · MB (Φ) · (β 1 , . . . , β n )T = vBT · MB (Φ) · wB , wobei (α1 , . . . , αn )T und (β1 , . . . , βn )T die Koordinatenvektoren von v bzw. w bez¨ uglich B sind. Beispiel: Die Strukturmatrix des Standardskalarprodukts im R3 bez¨ uglich der T T T Basis (v1 , v2 , v3 ) mit v1 = (1, 0, 0) , v2 = (1, 1, 0) und v3 = (1, 1, 1) lautet ⎛ ⎞ 1 1 1 ⎜ ⎟ ⎝1 2 2 ⎠ 1 2 3 Frage 345
Welche Eigenschaften besitzen reelle bzw. komplexe Strukturmatrizen?
Antwort: Ist Φ eine symmetrische Bilinearform auf einem reellen Vektorraum, orige Strukturmatrix ist in diesem Fall also so gilt Φ(vi , vj ) = Φ(vj , vi ), die zugeh¨ symmetrisch bez¨ uglich der Hautdiagonalen, also eine symmetrische Matrix. Ist Φ eine Sesquilinearform auf einem komplexen Vektorraum V , dann gilt Φ(v, w) = Φ(v, w) f¨ ur alle v, w ∈ V . Die zugeh¨ orige Strukturmatrix ist also konjugiert symmetrisch bez¨ uglich der Hauptdiagonalen (d. h. es gilt aij = aij ) Ferner sind alle Eintr¨ age auf der Hauptdiagonalen reell. Eine Matrix mit diesen Eigenschaften heißt hermitesch.
149
6.1 Bilinearformen und Skalarprodukte
Frage 346 Sei V = P2 (R) der Vektorraum der reellen Polynome vom Grad ≤ 2 zusammen mit dem durch 1 f, g = f (x)g(x) dx 0
gegebenen Skalarprodukt. Wie lautet die Strukturmatrix des Skalarprodukts bez¨ uglich der Basis B = {f1 , f2 , f3 } mit f1 (x) = 1, f2 (x) = x und f3 (x) = x2 ? Antwort: Es ist
1 f1 , f1 = 0 1 dx = 1, 1 f1 , f2 = 0 x dx = 12 , 1 f1 , f3 = 0 x2 dx = 13 ,
Unter Ber¨ ucksichtigung der Symmetrie der ⎛ 1 ⎜ MB ( , ) = ⎝1/2 1/3
1 f2 , f2 = 0 x2 dx = 31 , 1 f2 , f3 = 0 x3 dx = 41 , 1 f3 , f3 = 0 x4 dx = 51 .
Strukturmatrix erh¨ alt man damit ⎞ 1/2 1/3 ⎟ 1/3 1/4⎠ . 1/4 1/5
Frage 347 K¨ onnen Sie eine Bijektion angeben zwischen der Menge der symmetrischen Bilinearformen auf einem n-dimensionalen R-Vektorraum V und der Menge der symmetrischen Matrizen aus Rn×n ? Wie lautet die entsprechende Bijektion zwischen hermiteschen Formen auf einem komplexen Vektorraum und hermiteschen Matrizen aus M (n, C)? Antwort: Man w¨ ahle eine Basis B = {v1 , . . . , vn } von V und bezeichne mit Bil die Menge der symmetrischen Bilinearformen auf V und mit SM die Menge der symmetrischen Matrizen aus M (n, R). Die Abbildung ΨB : Bil −→ SM,
Φ −→ (Φ(vi , vj ))1≤i,j≤n .
ist, wie in der Antwort zu Frage 344 bereits gezeigt wurde, injektiv. Um die Surjektivit¨ at zu zeigen, betrachte man eine Matrix A = (aij ) ∈ SM ⊂ Rn×n , setze Φ(vi , vj ) = aij , 1 ≤ i, j ≤ n und definiere davon ausgehend die Abbildung Φ : V ×V −→ R durch lineare Fortsetzung. Dann ist Φ bilinear und wegen der Symmetrie von A auch symmetrisch. Das zeigt die Bijektivit¨ at der Abbildung ΨB . Auf analoge Weise l¨ asst sich eine Bijektion zwischen der Menge der hermiteschen Matrizen und der Menge der hermiteschen Formen angeben. Frage 348 Wie lautet die Transformationsformel f¨ ur die Strukturmatrix einer symmetrischen Bilinearform (bzw. einer hermiteschen Form) Φ bei Basiswechsel?
150
6 Euklidische und unit¨ are Vektorr¨ aume
Antwort: Seien B und C Basen von V , MB (Φ) und MC (Φ) die entsprechenden Strukturmatrizen von Φ. Wie u ¨blich bezeichne MBC die Basiswechselmatrix von C nach B. F¨ ur Vektoren v, w ∈ V gilt dann vB = MBC vC und wB = MBC wC . Also hat man T Φ(v, w) = vBT · MB (Φ) · wB = MBC vC · MB (Φ) · MBC wC C = vCT (MBC )T · MB (Φ) · M B wC = vCT
·
MC (Φ)
·
wC .
Hieraus erh¨ alt man die Transformationsformel f¨ ur Strukturmatrizen: C
MC (Φ) = (MBC )T · MB (Φ) · M B Man beachte, dass hier im Unterschied zu den Basiswechselmatrizen die Transformierte der Basiswechselmatrix ins Spiel kommt und nicht deren Inverse. Frage 349 Was versteht man unter der einer symmetrischen Bilinearform (bzw. hermiteschen Form) zugeordneten quadratischen Form? Antwort: Ist Φ : V × V −→ K eine symmetrische Bilinearform oder eine hermitesche Form, so nennt man die Abbildung q : V −→ R,
v −→ Φ(v, v)
die zugeh¨ orige quadratische Form.
Frage 350 Wie kann man eine symmetrische Bilinearform aus der zugeordneten quadratischen Form zur¨ uckgewinnen? Antwort: F¨ ur jede symmetrische Bilinearform Φ gilt der Zusammenhang Φ(v, w) =
1 Φ(v + w, v + w) − Φ(v, v) − Φ(w, w) . 2
Die drei Summanden in der rechten Klammer lassen sich alle durch die zugeordnete quadratische Form q mit q(v) = Φ(v, v) ausdr¨ ucken. Somit gilt die Gleichung Φ(v, w) =
1 q(v + w) − q(v) − q(w) , 2
mit der sich bei gegebenem q die Bilinearform Φ rekonstruieren l¨ asst. Als Beispiel betrachte man im R2 die quadratische Form q mit q((x1 , x2 )T ) = x21 − x22 . F¨ ur zwei Vektoren x, y ∈ R2 ergibt die zugeh¨ orige Bilinearform Φ(x, y) =
1 (x1 + y1 )2 − (x2 + y2 )2 − (x21 − x22 ) − (y12 − y22 ) = x1 y1 − x2 y2 . 2
151
6.2 Normierte R¨ aume
Frage 351 Wie ist f¨ ur eine symmetrische Bilinearform Φ : V × V −→ K das Radikal von Φ definiert? Was ist ein isotroper Vektor bzgl. Φ? Antwort: Das Radikal von Φ besteht aus all denjenigen Vektoren aus v ∈ V , f¨ ur die Φ(v, w) = 0 f¨ ur alle w ∈ V gilt. Ein Vektor v ∈ V heißt isotrop (bzgl. Φ), wenn Φ(v, v) = 0 gilt. Frage 352 Wann heißt eine Bilinearform Φ : V × V −→ K nicht-ausgeartet? K¨ onnen Sie zeigen, dass Φ genau dann nicht-ausgeartet ist, wenn die Strukturmatrix MB (Φ) f¨ ur jede Basis B von V den Rang n = dim V hat? Antwort: Die Bilinearform Φ ist nicht-ausgeartet genau dann, wenn ihr Radikal nur aus dem Nullvektor besteht. ur je zwei Basen B und C von V , da die Zun¨ achst gilt rg MB (Φ) = rg MC (Φ) f¨ beiden Matrizen MB (Φ) und MC (Φ) ¨ aquivalent sind, was sich aus der Transformationsformel ablesen l¨ asst. Es gen¨ ugt also, die Behauptung f¨ ur eine Basis B zu zeigen. Angenommen, es gilt rg MB (Φ) < n. Dann hat das lineare Gleichungssystme MB (Φ)·x = 0 eine nichttriviale L¨ osung x0 , insbesondere gilt xT ·MB (Φ)·x0 = 0 −1 n f¨ ur alle x ∈ K . Mit v := κB (x) und v0 := κ−1 B (x0 ) folgt dann Φ(v, v0 ) = xT · MB (Φ) · x0 = 0,
f¨ ur alle v ∈ V .
Damit ist v0 ∈ Rad Φ = {0}. Sei umgekehrt v0 ∈ Rad Φ. Man erg¨ anze v0 zu einer Basis B := {v0 , . . . , vn−1 } von V . Dann hat die Strukturmatrix MB (Φ) := Φ(vi , vj ) mit 0 ≤ i, j < n in der ersten Zeile und Spalte nur Nullen stehen. Also gilt rg MB (Φ) < n.
6.2
Normierte R¨ aume
Skalarprodukte auf einem K-Vektorraum V erlauben es, durch die Zahl v, v jedem Vektor v eine bestimmte L¨ ange“ zuzuordnen. Vektorr¨ aume, in denen eine ” derartige Zuordnung in einer geometrisch sinnvollen Weise m¨ oglich ist, heißen normierte R¨ aume. Frage 353
Was versteht man unter einer Norm auf einem K-Vektorraum V ?
Antwort: Eine Norm auf einem K-Vektorraum V ist eine Abbildung : V −→ R+ mit den folgenden Eigenschaften: (i) v = 0 ⇐⇒ v = 0 (ii) λv = |λ| · v f¨ ur alle v ∈ V , λ ∈ K (iii) v + w ≤ v + w f¨ ur alle v, w ∈ V (Dreiecksungleichung).
152
6 Euklidische und unit¨ are Vektorr¨ aume
Zum Beispiel ist der Rn zusammen mit der durch x := x21 + · · · + x2n
gegebenen Norm ein normierter Raum. Frage 354 nen?
Was ist ein normierter Vektorraum? K¨ onnen Sie einige Beispiele nen-
Antwort: Ein normierter Vektorraum ist ein Paar (V, ), bestehend aus einem K-Vektorraum V und einer Abbildung : V −→ R+ , die die Eigenschaften einer Norm aus Frage 353 erf¨ ullt. Beispiele: (a) Q und R und C bilden zusammen mit der Betragsabbildung x −→ |x| normierte R¨ aume. (b) Der Rn ist zusammen mit der durch x := x21 + · · · + x2n
definierten euklidischen Norm ein normierter Raum. (c) Wie in Frage 358 gezeigt wird, ist jeder Vektorraum, der mit einem Skalarprodukt versehen ist, insbesondere ein normierter Raum, indem man die Norm durch v = v, v definiert.
(d) Die in der Analysis vorkommenden Funktionenr¨ aume lassen sich alle ebenfalls mit einer (dem jeweiligen Problemkreis) angemessenen Norm versehen. Im Raum der stetigen Funktionen C ([a, b]) ist etwa durch f := sup{|f (x)| ; x ∈ [a, b]} eine Norm gegeben. Eine andere Norm erhielte man auf demselben Raum z. B. mit b f := |f (x)| dx. a
(e) Erw¨ ahnt seien noch die Banachr¨ aume und Hilbertr¨ aume. Dies sind normierte R¨ aume X mit der zus¨ atzlichen Eigenschaft, vollst¨ andig zu sein in dem Sinne, dass jede konvergente Folge in X einen Grenzwert besitzt. Hilbertr¨ aume zeichnen sich im Unterschied zu Banachr¨ aumen noch dadurch aus, dass ihre Norm von einem Skalarprodukt abgeleitet ist, sie also unit¨ are bzw. euklidische Vektorr¨ aume sind. Frage 355 Was ist ein metrischer Raum? Wieso ist jeder normierte Raum automatisch ein metrischer Raum?
153
6.2 Normierte R¨ aume
Antwort: Ein metrischer Raum ist ein Paar (X, d), bestehend aus einer Menge X und einer Abbildung (einer Metrik) d : X × X −→ R+ , welche die folgenden drei Eigenschaften erf¨ ullt (i) d(x, y) = 0 ⇐⇒ x = y (ii) d(x, y) = d(y, x) (iii) d(x, y) ≤ d(x, z) + d(z, x) (Dreiecksungleichung) f¨ ur alle x, y, z ∈ X. Setzt man in einem normierten Raum d(x, y) = x − y, dann erf¨ ullt die Abbildung d alle Eigenschaften einer Metrik. Speziell die Dreiecksungleichung folgt aus d(x, y) = x − y = x − z + z − y ≤ x − z + z − y = d(x, z) + d(z, y). Somit induziert jede Norm in einem normierten Raum eine Metrik. Alle Beispiele aus Antwort 353 sind damit auch metrische R¨ aume. Ein Beispiel eines metrischen Raumes, dessen Metrik nicht von einer Norm induziert ist, ist jede nichtleere Menge X zusammen mit der durch 0, falls x = y d(x, y) := 1, sonst gegebenen Metrik. W¨ are d von einer Norm abgeleitet, dann folgte f¨ ur 0 = α = 1 und x = y der Widerspruch 1 = x − y = d(x, y) = d(αx, αy) = α · x − y = α = 1.
Frage 356 Wann heißen zwei Normen auf einem Vektorraum V ¨ aquivalent? K¨ onnen Sie zeigen (das ist Analysis!), warum auf dem Rn alle Normen ¨aquivalent sind? Antwort: Zwei Normen und ∗ heißen ¨ aquivalent, wenn Konstanten α, β ∈ R+ existieren, so dass f¨ ur alle v ∈ V gilt ∗
αv ≤ v ≤ βv. ¨ ugt es zu zeigen, Um die Aquivalenz aller Normen auf dem Rn nachzuweisen, gen¨ aquivalent zur euklidischen Norm 2 ist. Der dass jede Norm auf dem Rn ¨ Beweis daf¨ ur beruht auf folgenden drei Tatsachen:
154
6 Euklidische und unit¨ are Vektorr¨ aume
(i) Die Funktion : Rn −→ R ist stetig bez¨ uglich 2 . (ii) Die Sph¨ are S n−1 = {x ∈ Rn ; x2 = 1} ist kompakt. (iii) Jede stetige reellwertige Funktion auf einer kompakten Menge nimmt dort ein Maximum und ein Minimum an. Man betrachte einen Vektor v ∈ Rn . Es gilt v/v2 ∈ S n−1 , und daher existieren nach den Punkten (i) bis (iii) positive reelle Zahlen α, β mit v α≤ v ≤ β, 2 also
αv2 ≤ v ≤ βv2 .
¨ Das zeigt die Aquivalenz der Normen und 2 und beantwortet damit den zweiten Teil der Frage. Frage 357 Was besagt die Cauchy-Schwarz’sche Ungleichung in einem KVektorraum mit Skalarprodukt , ? K¨ onnen Sie die Ungleichung zuerst mit einem kurzen Argument f¨ ur den Fall K = R beweisen und anschließend den allgemeinen Beweis liefern? Antwort: Die Cauchy-Schwarz’sche Ungleichung lautet |v, w|2 ≤ v, v · w, w, wobei die Gleichheit genau dann gilt, wenn v und w linear abh¨ angig sind. Beweis f¨ ur K = R: F¨ ur v = 0 ist die Behauptung mit dem Gleichheitszeichen erf¨ ullt. Sei also v = 0. F¨ ur jedes λ ∈ R gilt dann 0 ≤ λv + w, λv + w = v, vλ2 + 2v, wλ + w, w. Diese Ungleichung impliziert, dass das Polynom p(λ) = v, vλ2 +2v, wλ+w, w entweder keine oder eine doppelte Nullstelle besitzt, ihre Diskriminante kann also nicht positiv sein, d. h. 4 · v, w2 − 4 · v, v · w, w ≤ 0
bzw. v, w2 ≤ v, v · w, w.
Das ist die Cauchy-Schwarz’sche Ungleichung f¨ ur euklidische Vektorr¨ aume. Beweis im allgemeinen Fall: F¨ ur v = 0 ist die Beziehung mit dem Gleichheitszeichen erf¨ ullt, man kann also v = 0 annehmen. F¨ ur beliebiges λ ∈ K gilt dann zun¨ achst 0 ≤ λv + w, λv + w = λλv, v + λv, w + λw, v + w, w. Setzt man nun speziell λ=−
w, v v, w =− , v, v v, v
also
λ=−
w, v v, w =− , v, v v, v
155
6.2 Normierte R¨ aume
so erh¨ alt man daraus 0≤
|v, w|2 |v, w|2 |v, w|2 |v, w|2 − − + w, w = − + w, w. v, v v, v v, v v, v
Wegen w, w > 0 folgt |v, w|2 ≤ v, v · w, w, also die Cauchy-Schwarz’sche Ungleichung.
Frage 358 Wie l¨asst sich auf einem euklidischen bzw. unit¨aren Vektorraum (V, , ) eine Norm definieren? Antwort: Definiert man v =
v, v,
dann erf¨ ullt die Abbildung alle drei Eigenschaften einer Norm. Allein die Dreiecksungleichung ist nicht offensichtlich. Zu deren Nachweis ben¨ otigt man die Cauchy-Schwarz’sche Ungleichung. Mit dieser erh¨ alt man 2
v + w = v + w, v + w = v, v + v, w + v, w + w, w = v, v + 2Re v, w + w, w ≤ v, v + 2|v, w| + w, w ≤ v, v + 2 v, vw, w + w, w 2 2 2 = v + 2vw + w = v + w .
(∗)
Hieraus folgt die Dreiecksungleichung. An der Stelle (∗) wurde die Cauchy Schwarz’sche Ungleichung benutzt. Frage 359
Wie kann man in einem euklidischen Vektorraum Winkel definieren?
Antwort: Die Cauchy-Schwarz’sche Ungleichung l¨ asst sich auch in der Form −1 ≤
|v, w| ≤1 v · w
schreiben. Folglich gibt es genau ein ϑ ∈ [0, π] mit cos ϑ =
|v, w| . v · w
Die Zahl ϑ definiert man als Winkel zwischen v und w, in Zeichen
∠(v, w) = arccos
|v, w| . v · w
Anmerkung: F¨ ur den Fall, dass einer der beteiligten Winkel normiert ist, erh¨ alt man hieraus eine geometrische Interpretation des Skalarprodukts. Ist etwa w = 1, dann gilt v, w = v · cos ∠(v, w).
156
6 Euklidische und unit¨ are Vektorr¨ aume
v
ϑ
w = 1
w v , w
Das heißt, dass v, w in diesem Fall die Komponente von v in Richtung von w angibt, wie es in der Abbildung veranschaulicht ist. Frage 360 K¨ onnen Sie f¨ ur den Fall V = R2 zeigen, dass die Winkeldefinition mit der geometrischen Vorstellung eines Winkels u ¨bereinstimmt? Antwort: Der Zusammenhang wird u ur den Cosinus ¨ber das Additionstheroem f¨ cos(α + β) = cos α cos β − sin α sin β, das z. B. in [6] bewiesen wird, hergestellt. Bezeichnen α bzw. β die von den Vektoren x = (x1 , x2 )T bzw. y = (y1 , y2 )T aus R2 mit der x1 -Achse eingeschlossenen Winkel, so gilt x = x · (cos α, sin α)T ,
y = y · (cos β, sin β)T .
Mit dem Additionstheorem folgt cos ∠(x, y) = cos(β − α) = x · y · (cos α cos β + sin α sin β) = x · y · (x1 x2 + y1 y2 ) = x · y · x, y. x2
y · sin β y x · sin α x
β
−
α
β α y · cos β
Das entspricht der Winkeldefinition aus Frage 359.
x · cos α
x1
157
6.2 Normierte R¨ aume
Frage 361 K¨ onnen Sie zeigen, dass in einem euklidischen oder unit¨aren Vektor¨ raum V die folgenden Aquivalenzen gelten? v + w = v − w ⇐⇒ v, w = 0 v + w2 = v2 + w2 ⇐⇒ v, w = 0.
(Satz des Pythagoras)
Antwort: Wegen
v, v + w, w + 2v, w v − w = v − w, v − w = v, v + w, w − 2v, w v + w =
v + w, v + w =
hat man v + w = v − w genau dann, wenn v, w = −v, w, also v, w = 0 gilt. Weiter ist v + w2 = v, v + w, w + 2v, w = v + w + 2v, w. Also gilt der Satz von Pythagoras genau dann, wenn v, w = 0 gilt.
Frage 362 Kennen Sie eine notwendige Bedingung daf¨ ur, dass eine Norm aus einem Skalarprodukt abgeleitet ist? Antwort: Ist , ein Skalarprodukt auf V , so gilt v + w, v + w + v − w, v − w = 2v, v + 2w, w, also f¨ ur die von dem Skalarprodukt abgeleitete Norm v := v, v die sogenannte Parallelogramm-Gleichung v + w2 + v − w2 = 2v2 + 2w2 .
Frage 363 K¨ onnen Sie umgekehrt (wenigstens im Fall K = R) zeigen, dass man bei G¨ ultigkeit der Parallelogramm-Identit¨at f¨ ur die Norm ein Skalarprodukt so definieren kann, dass die aus dem Skalarprodukt abgeleitete Norm gerade die gegebene ist? Antwort: Ein Skalarprodukt mit der Eigenschaft v = v, v muss die Gleichung v + w2 = v2 + w2 + 2v, w erf¨ ullen. Man setze deswegen v, w :=
1 (v + w2 − v2 − w2 ). 2
Daraus folgt mit der Parallelogramm-Identit¨ at v, w =
1 (v + w2 − v − w2 ). 4
158
6 Euklidische und unit¨ are Vektorr¨ aume
Damit h¨ atte man einen Kandidaten gefunden, f¨ ur den jetzt noch im Einzelnen nachgewiesen werden muss, dass er die Eigenschaften eines Skalarprodukts (Bilinearit¨ at, Symmetrie, positive Definitheit) besitzt. Die Symmetrie und positive Definitheit ergeben sich unmittelbar aus den Eigenschaften der Norm. Die Bilinearit¨ at weist man in mehreren Schritten nach. Durch eine direkte Rechnung zeigt man v + v ′ , w = v, w + v ′ , w und folgert daraus, dass die Gleichung λv, w = λ · v, w zun¨ achst f¨ ur alle λ ∈ N gilt. Aus Linearit¨ atsgr¨ unden folgt daraus, dass die Gleichung auch f¨ ur alle λ ∈ Q gilt. In einem letzten Schritt folgert man, dass die Gleichung auch noch f¨ ur beliebige λ ∈ R g¨ ultig bleibt. Frage 364
Warum stammt die Maximumsnorm (x1 , . . . , xn ) = max{|x1 |, . . . , |xn |}
im Rn nicht von einem Skalarprodukt? Antwort: Die Maximumsnorm erf¨ ullt nicht die Parallelogramm-Identit¨ at, so ist etwa mit x = (1, 0, . . . , 0) und y = (0, 1, . . . , 0) x + y2 + x − y2 = 1 + 1 = 2 + 2 = 2x + 2y.
6.3
Orthonormalbasen und das Orthonormalisierungsverfahren von Gram-Schmidt
Frage 365 Sei V ein euklidischer oder unit¨arer Vektorraum und U ⊂ V ein Unterraum. Was versteht man unter einer Projektion von V auf U ? Antwort: Man w¨ ahle ein Komplement W von U in V , also einen Unterraum W ⊂ V derart, dass V = U ⊕ W gilt. Unter der Projektion von V auf U entlang W versteht man die eindeutig bestimmte lineare Abbildung T : V −→ V mit der Eigenschaft, dass f¨ ur jeden Vektor v = u + w ∈ U ⊕ W gilt T (v) = T (u + w) = u. Zu einem gegebenen Unterraum U ⊂ V existieren demnach verschiedene Projektionen auf U , abh¨ angig von der Wahl des Komplements W . Als Beispiel be trachte man den R2 mit U = span(e1 ), W = span(e2 ) bzw. W ′ = span (1, 1)T .
6.3 Orthonormalbasen und das Orthonormalisierungsverfahren von Gram-Schmidt
W′
W
(0, 1)T
159
v = (2, 1)T
TW = (2, 0)T
U
(0, 1)T
v = (2, 1)T
TW ′ = (1, 0)T
U
Es gilt R2 = U ⊕ W = U ⊕ W ′ , und ein Vektor v = (2, 1)T ∈ R2 kann auf zwei Arten dargestellt werden: 2e1 + e2 ∈ U ⊕ W = R2 , T v = (2, 1) = e1 + (1, 1)T ∈ U ⊕ W ′ = R2 . Bezeichnen TW und TW ′ die Projektionen von U entlang von W bzw. W ′ , so erh¨ alt man entsprechend TW (v) = (2, 0)T
und
TW ′ (v) = (1, 0)T .
Frage 366 Wie lassen sich Projektionen T : V −→ V eines Vektorraumes V auf einen Unterraum U ⊂ V algebraisch charakterisieren? Antwort: Eine lineare Abbildung T : V −→ V ist eine Projektion auf U ⊂ V genau dann, wenn T 2 = T ◦ T = T gilt. Beweis: Die Notwendigkeit der Bedingung ist klar. F¨ ur jeden Vektor v = u + w ∈ V = U ⊕ W gilt T (T (u + v)) = T (u) = u = T (u + v). Man betrachte also die Umkehrung und nehme T 2 = T an. Ist u ∈ im (T ), so gibt es ein v ∈ V mit T (v) = u, und aus der Voraussetzung folgt T (u) = T (T (v)) = T 2 (v) = T (v) = u. Also gilt T (u) = u f¨ ur alle u ∈ im (T ). Daher gen¨ ugt es zu zeigen, dass die Voraussetzung V = im (T ) ⊕ ker(T ) impliziert, denn f¨ ur u + w ∈ V = im (T ) ⊕ ker(T ) hat man in diesem Fall T (u + w) = T (u) = u. Nun gilt aufgrund der Dimensionsformel dim V = dim im (T ) + dim ker(T ), woraus V = im (T ) + ker(T ) folgt. Es bleibt also nur noch im (T ) ∩ ker(T ) = {0} zu zeigen. Dazu nehme man v ∈ im (T ) ∩ ker(T ) an. Dann gibt es einen Vektor x ∈ V mit T (x) = v, und außerdem gilt T (v) = 0. Daraus folgt wegen T 2 = T v = T (x) = T 2 (x) = T (T (x)) = T (v) = 0. Das zeigt V = im (T ) ⊕ ker(T ) und damit die Behauptung.
160
6 Euklidische und unit¨ are Vektorr¨ aume
Frage 367 Wann nennt man zwei Vektoren v, w eines K-Vektorraums mit Skalarprodukt orthogonal? Antwort: Zwei Vektoren v und w heißen orthogonal, in Zeichen v ⊥ w genau dann, wenn v, w = 0 gilt. Im Rn entspricht das geometrisch dem Sachverhalt, dass die beiden Vektoren senkrecht“ aufeinanderstehen. Dies steht im Einklang mit ∠(v, w) = ” arccosv, w = arccos 0 = π2 . Frage 368 Wann nennt man zwei Unterr¨aume U und W eines euklidischen oder unit¨aren Vektorraumes V zueinander orthogonal? Wie ist das orthogonale Komplement U ⊥ eines Unterraums U ⊂ V definiert? Antwort: U und W heißen zueinander orthogonal, geschrieben U ⊥ W , wenn u, w = 0 f¨ ur alle Vektoren u ∈ U und w ∈ W gilt. Als das orthogonale Komplement U ⊥ eines Unterraums U ⊂ V definiert man die Menge aller v ∈ V , die zu jedem Vektor aus U orthogonal sind: U ⊥ := {v ∈ V ; u, v = 0f¨ ur alle u ∈ U }. Es ist leicht einzusehen, dass U ⊥ ein Unterraum von V ist. Ferner erkennt man aus Linearit¨ atsgr¨ unden sofort, dass ein Vektor v ∈ V genau dann zu U ⊥ geh¨ ort, wenn er auf jedem Vektor einer beliebigen Basis von U senkrecht steht. Frage 369 Sei U ein Unterraum eines euklidischen oder unit¨aren Vektorraums V . K¨ onnen Sie folgende Sachverhalte zeigen? (i) dim U + dim U ⊥ = dim V (ii) (U ⊥ )⊥ = U (iii) V = U ⊕ U ⊥ Antwort: (i) Sei dim U = k. Man w¨ ahle eine Basis {v1 , . . . , vk } von U und erg¨ anze diese zu einer Basis n{v1 , . . . , vk , vk+1 , . . . , vn } von V , wobei n = dim V ist. F¨ ur einen Vektor v = i=1 αi vi ∈ V gilt dann v ∈ U ⊥ genau dann, wenn die folgenden k Gleichungen erf¨ ullt sind 0 = v1 , v = v1 , v1 α1 + v1 , v2 α2 + · · · + v1 , vn αn .. .. . . 0 = vk , v = vk , v1 α1 + vk , v2 α2 + · · · + vk , vn αn Dies ist ein System von k Gleichungen in n Unbekannten, deren Koeffizientenmatrix eine Teilmatrix der Strukturmatrix des Skalarproduktes bez¨ uglich der Basis B ist (vgl. Frage 344). Da deren Spalten linear unabh¨ angig sind, hat die Koeffizientenmatrix den Rang k. Der L¨ osungsraum des Gleichungssystems besitzt damit die Dimension n − k. Es folgt dim U ⊥ = n − k = dim V − dim U und damit die Behauptung.
6.3 Orthonormalbasen und das Orthonormalisierungsverfahren von Gram-Schmidt
161
(ii) Da jeder Vektor aus U orthogonal zu U ⊥ ist, gilt zun¨ achst U ⊆ (U ⊥ )⊥ . ⊥ ⊥ ⊥ Nach (i) gilt außerdem dim(U ) = n − dim U = n − (n − dim U ) = dim U . Zusammen folgt U = (U ⊥ )⊥ . (iii) Wegen U ∩ U ⊥ = {0} folgt die Behauptung aus (i) zusammen mit der Antwort zu Frage 125. Frage 370 Was versteht man unter der orthogonalen Projektion eines KVektorraums V mit Skalarprodukt auf einen Unterraum U ⊂ V ? Antwort: Die orthogonale Projektion projU : V −→ U von V auf U ist die nach den Fragen 365 und 369 eindeutig bestimmte Projektion auf U entlang des orthogonalen Komplements U ⊥ . Frage 371 Durch welche Eigenschaft ist die orthogonale Projektion auf einen Unterraum U ⊂ V eindeutig charakterisiert? Antwort: F¨ ur jeden Vektor v ∈ V gilt v = projU (v) + projU ⊥ (v), also v − projU (v) = projU ⊥ (v) ∈ U ⊥ . Die orthogonale Projektion auf U erf¨ ullt also die Bedingung v − proj(v), u = 0 f¨ ur alle u ∈ U . (∗) Anders herum folgt aus dieser Eigenschaft, dass proj(u) = u f¨ ur alle u ∈ U gilt. Außerdem hat man v−proj(v) ∈ U ⊥ . Wegen V = U ⊕U ⊥ gibt es also ein u ∈ U , so dass sich v eindeutig in der Form v = u + v − proj(v) schreiben l¨ asst. Daraus folgt proj(v) ∈ U f¨ ur alle v ∈ V und insgesamt die Eigenschaften, die die Projektion eindeutig charakterisieren. Frage 372 Wie erh¨alt man f¨ ur v ∈ V die beste Approximation (Proximum) von v in U ⊂ V ? Antwort: Das Proximum von v in U ist derjenige Vektor prox(v) ∈ U , der von v den kleinsten Abstand“ im Sinne der Norm hat, also durch die Bedingung ” v − prox(v) ≤ v − u f¨ ur alle u ∈ U charakterisiert ist. Das Proximum von v in U erh¨ alt man mittels orthogonaler Projektion von v auf U . Es gilt also prox(v) = projU (v). ur alle v ∈ V ist v − projU (v) ∈ U ⊥ . Beweis: Wegen v = projU (v) + projU ⊥ (v) f¨ Also gilt f¨ ur alle u ∈ U v − u2 = (v − proj(v)) + (proj(v) − u)2 = v − proj(v)2 + proj(v) − u2 ≥ v − proj(v).
162
6 Euklidische und unit¨ are Vektorr¨ aume
Dabei wurde in der zweiten Gleichung der Satz des Pythagoras aus Frage 361 auf den Fall der orthogonalen Vektoren v − proj(v) ∈ U ⊥ und u − proj(v) ∈ U angewendet. Frage 373 Wie l¨asst sich mithilfe einer Orthonormalbasis f¨ ur U eine explizite Darstellung f¨ ur die orthogonale Projektion auf einen Unterraum U ⊂ V angeben? Antwort: Sei {u1 , . . . , uk } eine Orthonormalbasis von U . Die Bedingung (∗) aus Antwort 370ist dann gleichwertig mit v, uj = p(v), uj f¨ ur alle j ∈ {1, . . . , k}. m Mit p(v) = i=1 αi ui erh¨ alt man damit v, uj =
m
αi ui , uj = αj ,
i=1
wegen ui , uj = δij . Also ist p durch die Gleichung p(v) = v, u1 u1 + · · · + v, um um , f¨ ur jedes v ∈ V definiert.
v
u2
π(
v − π(v) = πU ⊥ (v)
v)
u1
Frage 374 Wann heißt ein System (vj )j∈J von Vektoren vj eines K-Vektorraums mit Skalarprodukt (i) (ii)
ein Orthogonalsystem? ein Orthonormalsystem?
Antwort: Das System heißt orthogonal, wenn je zwei verschiedene Vektoren des Systems orthogonal sind: vi , vj = 0
f¨ ur i = j.
Eine orthogonales System heißt orthonormal, wenn zus¨ atzlich vj = 1 f¨ ur alle j ∈ J gilt. Frage 375 Warum sind Orthogonalsysteme, die den Nullvektor nicht enthalten, stets linear unabh¨angig?
6.3 Orthonormalbasen und das Orthonormalisierungsverfahren von Gram-Schmidt
163
Antwort: Seien die Vektoren v1 , . . . , vn paarweise orthogonal. Aus der Gleichung α1 v1 + . . . + αn vn = 0 folgt dann f¨ ur i = 1, . . . , n α1 v1 + . . . + αn vn , vi = αi vi , vi = 0, also αi = 0, da vi , vi > 0 gilt, falls vi = 0 ist. Frage 376 produkt?
Was ist eine Orthonormalbasis in einem K-Vektorraum mit Skalar-
Antwort: Eine Orthonormalbasis in einem K-Vektorraum ist ein orthonormales System von Vektoren, das gleichzeitig eine Basis von V bildet. Beispielsweise ist die kanonische Basis im Rn eine Orthonormalbasis. Frage 377 Was besagt der Satz u ¨ber das Gram-Schmidt’sche Orthonormalisierungsverfahren? K¨ onnen Sie einen Beweis skizzieren? Antwort: Mit dem Gram-Schmidt’schen Orthonormalisierungsverfahren l¨ asst sich zu jedem Unterraum U ⊂ V eines euklidischen oder unit¨ aren Vektorraumes V eine Orthonormalbasis konstruieren. Der dahinter stehende Satz l¨ asst sich folgendermaßen formulieren: Sei {v1 , v2 , . . .} ein endliches oder h¨ ochstens abz¨ ahlbar unendliches System linear unabh¨ angiger Vektoren eines euklidischen oder unit¨ aren Vektorraumes V . Dann gibt es ein zugeh¨ origes Orthonormalsystem {e1 , e2 , . . .}, so dass f¨ ur jedes k ∈ N die Vektoren {e1 , . . . , ek } denselben Unterraum Uk von V erzeugen wie die Vektoren {v1 , . . . , vk }. Beweis: Mittels vollst¨ andiger Induktion u ¨ber k. Der Vektor e1 := vv11 bildet eine Orthonormalbasis des Unterraums U1 := Rv1 . Damit ist der Induktionsanfang erledigt. Sei nun die Behauptung f¨ ur k − 1 Vektoren bereits bewiesen, d. h.{e1 , . . . , ek−1 } ein Orthonormalsystem des Unterraums Uk−1 := span(v1 , . . . , vk−1 ). Nach Frage 371 ist vk −projUk−1 (vk ) orthogonal zu den Vektoren e1 , . . . , ek−1 , und nach Frage 373 gilt projUk−1 (vk−1 ) = vk , e1 e1 + vk , e2 e2 + · · · + vk , ek−1 ek−1 . Setzt man also ek :=
vk − vk , e1 e1 − vk , e2 e2 − · · · − vk , ek−1 ek−1 , vk , e1 e1 + vk , e2 e2 + · · · + vk , ek−1 ek−1
(∗)
164
6 Euklidische und unit¨ are Vektorr¨ aume
so gilt ek = 1 und ek , ej = 0 f¨ ur alle j = 1, . . . , k − 1. D. h., {e1 , . . . , ek } ist eine Orthonormalbasis des Unterraums Uk . Damit ist der Induktionsschritt und damit der Satz insgesamt bewiesen. v2
v2 projU1 (v2 )
v1
projU1 (v2 )
v1
e1
e2
e1
e1
Die Abbildung zeigt die einzelnen Schritte bei Konstruktion einer Orthonormalbasis im Fall V = R2 . Frage 378 K¨ onnen Sie aus dem Orthonormalisierungsverfahren von GramSchmidt folgern, dass jeder endlich-dimensionale K-Vektorraum V eine Orthonormalbasis besitzt? Antwort: Man w¨ ahle irgendeine Basis von V und forme diese mithilfe des GramSchmidt’schen Verfahrens zu einer Orthonormalbasis um. Frage 379 K¨ onnen Sie zeigen, dass zu jedem endlichdimensionalen euklidischen oder unit¨aren Vektorraum (V, , ) eine Basis existiert, so dass das Skalarprodukt bez¨ uglich dieser Basis sich in der Standardform aus Frage 341 darstellen l¨asst? ur Antwort: Man w¨ ahle man eine Orthonormalbasis B = {e1 , . . . , en } von V . F¨ Vektoren v = α1 e1 +· · · αn en und w = β1 e1 +· · ·+βn en gilt dann wegen ei , ej = δij n n αi β j ei , ej = α1 β 1 + · · · + αn β n , v, w = i=1 j=1
was genau dem Standardskalarprodukt in Cn entspricht (f¨ ur den Fall, dass V ein R-Vektorraum ist, ignoriere man in der obigen Rechnung einfach die Konjugationsstriche). Ist eine Orthonormalbasis von V gegeben, so l¨ asst der Koordinatenisomorphismus κ : V −→ Kn das Skalarprodukt auf V somit invariant, indem es dieses mit dem kanonischen Skalarprodukt im Kn identifiziert. Frage 380
K¨ onnen Sie im Raum C [0, 1] mit dem Skalarprodukt 1 f (x)g(x) dx f, g = 0
eine Basis aus orthogonalen Vektoren f¨ ur den von den Funktionen w1 , w2 , w3 mit w1 (x) = 1, w2 (x) = x und w3 (x) = x2 aufgespannten Unterraum mithilfe des Gram-Schmidt’schen Verfahrens konstruieren?
6.3 Orthonormalbasen und das Orthonormalisierungsverfahren von Gram-Schmidt
165
Antwort: Entsprechend des Orthonormalisierungsverfahrens konstruiert man schrittweise paarweise orthogonale Vektoren (Funktionen) v1 , v2 und v3 . Man erh¨ alt v1 = w1 = 1 1 v1 , w2 1/2 v2 = w2 − v1 = x − 1=x− v1 , v1 1 2 1/12 1 v2 , w3 1/3 1 v1 , w3 v1 − v2 = x2 − 1− (x − ) = x2 − x + . v3 = w3 − v1 , v1 v2 , v2 1 1/12 2 6 achlich orthogonal Es l¨ asst sich jetzt nachpr¨ ufen, dass Funktionen v1 , v2 , v3 tats¨ sind. Zum Beispiel gilt 1 1 1 1 1 1 1 1 2 (x − x + )(x − ) dx = v2 , v3 = (x3 − x2 + x − x2 + x − ) dx = 0. 6 2 6 2 2 12 0 0 Betrachtet man statt dem Raum C [0, 1] den Raum C [−1, 1] mit dem Skalarpro1 dukt f, g = −1 f (x)g(x) dx und verlangt als Normierungseigenschaft, dass jedes Polynom den Wert 1 an der Stelle x = 1 annimmt, so erh¨ alt man mit demselben Verfahren die ersten drei Legendre-Polynome. Frage 381 K¨ onnen Sie zeigen, dass eine Sesquilinearform Φ : V −→ V eines endlich-dimensionalen unit¨aren Vektorraums V genau dann positiv definit, also ein Skalarprodukt ist, wenn eine Matrix S ∈ GL(n, K) mit S T · MB (Φ) · S = En
(∗)
existiert, wobei MB (Φ) wie u uglich einer Basis B ¨blich die Strukturmatrix von Φ bez¨ von V bezeichnet. Antwort: Sei zun¨ achst Φ ein Skalarprodukt. Dann besitzt V nach Frage 378 eine Orthonormalbasis C, und bez¨ uglich dieser Basis gilt nach Frage 379 dann M (Φ)C = En . Mit der Transformationsformel aus Frage 348 folgt En = MC (Φ) = (MBC )T · M (φ)B · MBC , wobei MBC wie u ¨blich die Basiswechselmatrix von C nach B bezeichnet. Setzt man S = MBC , so folgt daraus (∗). Gilt umgekehrt (∗), dann kann man S als Basiswechselmatrix des Typs MBC auffassen. Es gilt dann MC (Φ) = En , woraus sich die positive Definitheit von Φ unmittelbar ablesen l¨ asst. Frage 382 Ist , ein Skalarprodukt auf einem endlich-dimensionalen KVektorraum V , welche Eigenschaft besitzt dann die Determinante der Strukturmatrix M ( , )B bez¨ uglich jeder Basis B von V ?
166
6 Euklidische und unit¨ are Vektorr¨ aume
Antwort: Es gilt det M ( , )B > 0. Beweis: Man w¨ ahle eine Orthonormalbasis C von V . Nach der Transformationsformel und dem Multiplikationssatz f¨ ur Determinanten gilt dann det M ( , )B = det(MCB )T · det M ( , )C · det MCB = det(MCB )T · En · det MCB = | det MCB |2 > 0.
Frage 383 Sei Φ : V −→ V eine symmetrische Bilinearform bzw. hermitesche Form auf einem endlich-dimensionalen K-Vektorraum V , und B = {v1 , . . . , vn } sei eine Basis von V . Kennen Sie f¨ ur M (Φ)B ein Determinantenkriterium, das ¨aquivalent zur positiven Definitheit von Φ ist? Antwort: Es gilt: Die symmetrische Bilinearform bzw. hermitesche Form Φ ist genau dann positiv definit, also ein Skalarprodukt, wenn alle Hauptunterdeterminanten von M (Φ)B positiv sind, d. h. wenn f¨ ur die Matrizen Mℓ := Φ(vi , vj )i,j=1,...,ℓ ∈ Kℓ×ℓ
mit ℓ = 1, . . . , n
gilt det Mℓ > 0. Beweis: Ist Φ positiv definit, dann auch die Einschr¨ ankung von Φ auf die Untervektorr¨ aume Vℓ = span(v1 , . . . , vℓ ). Die Antwort zu Frage 382 liefert dann det Mℓ > 0. Gelte nun umgekehrt det Mℓ > 0 f¨ ur ℓ = 1, . . . , n. Wir beweisen induktiv, dass dann die Einschr¨ ankung Φ|Vℓ auf Vℓ f¨ ur ℓ = 1, . . . , n ein Skalarprodukt definiert. F¨ ur ℓ = 1 ist dies klar, da in diesem Fall {v1 } eine Basis von Vn−1 ist, und wegen M1 = Φ(v1 , v1 ) > 0 folgt die positive Definitheit von Φ|V1 mit der Antwort zu Frage 336. Ist nun bereits gezeigt, dass Φ|Vn−1 auf Vn−1 ein Skalarprodukt definiert, dann ¨ existiert eine Orthonormalbasis {e1 , . . . , en−1 }. Ahnlich wie in der Antwort zu Frage 377 definiere man mit vn′
= vn −
n−1
Φ(vn , ei )ei ,
i=1
einen zu allen ei mit i = 1, . . . , n − 1 orthogonalen Vektor. Dann ist C = {e1 , . . . , en−1 , vn′ } eine Orthogonalbasis von V . Die Strukturmatrix von Φ bez¨ uglich C hat damit die Gestalt ⎞ ⎛ 1 0 ⎟ ⎜ .. ⎟ ⎜ ⎟ ⎜ M (Φ)C = ⎜ .. ⎟ ⎟ ⎜ ⎠ ⎝ 1 0 0
0 Φ(vn′ , vn′ )
167
6.4 Lineare Gleichungssysteme Teil 2
Mit S = MCB folgt M (Φ)C = S T An S und damit Φ(vn′ , vn′ ) = det M (Φ)C = | det S|2 · det An > 0. Somit gilt Φ(vi , vj ) > 0 f¨ ur je zwei Basisvektoren vi und vj , also ist Φ positivdefinit nach Frage 336.
6.4
Lineare Gleichungssysteme Teil 2
F¨ ur einen euklidischen oder unit¨ aren Vektorraum K n erlauben die zus¨ atzlichen L¨ angen- und Winkelstrukturen eine Anwendung auf lineare Gleichungssysteme. Frage 384
Sei A eine m × n-Matrix. K¨ onnen Sie L(A, 0) ⊥ Z(A) in Kn ,
L(AT , 0) ⊥ S(A) in Km
zeigen? ur jeden Antwort: F¨ ur jeden Vektor v ∈ Rn gilt A · v = 0 ⇐⇒ a · v = 0 f¨ Zeilenvektor a von A. Das zeigt L(A, 0) ⊥ Z(A). Die zweite Gleichung ergibt sich daraus wegen S(A) = Z(AT ). Frage 385
Wieso gilt L(A, 0) = Z(A)⊥
L(AT , 0) = S(A)⊥
f¨ ur jede Matrix A ∈ Km×n ? Antwort: L(A, 0) und Z(A) sind jeweils Unterr¨ aume von V und es gilt dim(L(A, 0) + Z(A)) = dim L(A, 0) + dim Z(A) − dim(L(A, 0) ∩ Z(A)) = dim L(A, 0) + dim Z(A) = dim L(A, 0) + rg(A) = n = dim Kn . Daraus folgt L(A, 0) + Z(A) = Kn , und wegen L(A, 0) ∩ Z(A) = {0} dann sogar L(A, 0) ⊕ Z(A) = Kn . Daraus folgt zusammen mit Antwort 384 die erste Gleichung. Ein analoges Argument liefert L(AT , 0) ⊕ Z(A) = Km , und man erh¨ alt die zweite Gleichung. Frage 386 Was versteht man unter der Optimall¨ osung eines Gleichungssystems Ax = b mit A ∈ Km×n ?
168
6 Euklidische und unit¨ are Vektorr¨ aume
Antwort: Ein Vektor x0 ∈ Kn heißt Optimall¨ osung des Gleichungssystems, wenn gilt Ax0 − b ≤ Ax − b f¨ ur alle x ∈ Kn , (∗) Eine Optimall¨osung x0 ist also dadurch ausgezeichnet, dass der Vektor Ax0 ∈ Km zu dem angezielten“ Vektor b ∈ Km den kleinsten Abstand hat. Ist das ” Gleichungssystem Ax = b l¨ osbar, so sind die Optimall¨ osungen mit den L¨ osungen identisch, andernfalls entsprechen die Optimall¨ osungen den besten Ann¨ aherungen an die L¨ osungen hinsichtlich der gegebenen Metrik. Um die Optimall¨ osungen explizit zu bestimmen, betrachte man die orthogonale Zerlegung S(A) ⊕ L(A, 0) = Km . Jeder Vektor b ∈ Km besitzt eine eindeutige Darstellung b = r + s mit r ∈ S(A) und s ∈ L(A, 0). Ferner ist r = projS(A) (b) und nach Frage 372 gilt daher r − b ≤ y − b
f¨ ur alle y ∈ Km .
Da r im Spaltenraum von A liegt, existieren L¨ osungen des Gleichungssystems Ax = r, und jede L¨ osung x0 erf¨ ullt in diesem Fall (∗). Zusammenfassend gilt also: Sei b = r + s mit r ∈ Z(A) und s ∈ L(A, 0) die orthogonale Zerlegung von b ∈ Km . Dann sind die Optimall¨ osungen des Gleichungssystems Ax = b durch die L¨ osungen des Systems Ax = r = projZ(A) (b) gegeben. Da r im Zeilenraum von A liegt, ist dieses Gleichungssystem in jedem Fall l¨ osbar. Frage 387 Was versteht man unter der Normalgleichung eines Gleichungssystems Ax = b? Wieso besitzt die Normalgleichung eine eindeutige L¨ osung, die gerade der besten Ann¨aherung an x entspricht? Antwort: Die Normalgleichung zu der Gleichung Ax = b ist die Gleichung AT Ax = AT b.
(∗)
Um den Zusammenhang zu beweisen, betrachte man die nach den Fragen 369 und 385 eindeutig gegebene Zerlegung b = bS + bL ∈ S(A) ⊕ L(AT , 0) mit bS = projS(A) (b). Ist nun x0 eine L¨ osung zu (∗), dann gilt AT (Ax0 − b) = 0 und damit Ax0 − b = Ax0 − (bZ + bL ) ∈ L(AT , 0). Wegen Ax0 ∈ S(A) und bL ∈ L(AT , 0) folgt daraus Ax0 − bS ∈ L(AT , 0) ∩ S(A) = {0}, also Ax0 = bZ = projZ(A) (b). D. h., x0 ist die beste Ann¨ aherung an die L¨ osung von Ax = b.
169
6.4 Lineare Gleichungssysteme Teil 2
Frage 388 Was versteht man unter der QR-Zerlegung einer Matrix m×n-Matrix A? Unter welchen Bedingungen existiert eine QR-Zerlegung, und wie kann man sie konstruieren? Antwort: Unter der QR-Zerlegung von A versteht man eine Faktorisierung des Typs A = QR, bei der die Spaltenvektoren von Q ∈ Km×n orthonormale Vektoren im Rm sind und die Matrix Rn×n obere Dreiecksform hat. Es gilt A besitzt eine QR-Zerlegung genau dann, wenn rg(A) = m gilt, also wenn die Spalten von A linear unabh¨ angig sind. Beweis: Seien w1 , . . . , wn die Spaltenvektoren von A. Da diese nach Voraussetzung linear unabh¨ angig sind, kann man mit dem Gram-Schmidt-Verfahren eine Orthogonalbasis (v1 , . . . , vn ) konstruieren, bei der sie vi f¨ ur i = 1, . . . , n nach der Formel v1 , wi v2 , wi vi−1 , wi v1 − v2 − · · · − vi−1 vi = wi − v1 , v1 v2 , v2 vi−1 , vi−1 berechnet. Aufl¨ osen dieser n Gleichungen nach wi liefert das Gleichungssystem w1 = v1 v1 , w2 v1 + v2 w2 = v1 , v1 ··· v2 , wn vn−1 , wn v1 , wn wn = v1 + v2 + · · · + vn−1 + vn . v1 , v1 v2 , v2 vn−1 , vn−1 Mittels Matrizen schreibt sich dieses System in der Form
A = (v1 , . . . , vn )R,
∈ Kn×n eine obere Dreiecksmatrix ist. Setzt man nun noch qi := vi /vi , wobei R so ist (q1 , . . . , qn ) ein Orthonormalsystem in Km , es gilt (v1 , . . . , vn ) = (q1 , . . . , qn )· Diag(v1 , . . . , vn ) und folglich A = (w1 , . . . , wn ) = (q1 , . . . , qn ) · Diag(v1 , . . . , vn ) · R Q
Mit A = QR hat man die gew¨ unschte QR-Zerlegung.
R
170
6.5
6 Euklidische und unit¨ are Vektorr¨ aume
Orthogonale und unit¨ are Endomorphismen
Unter orthogonalen bzw. unit¨ aren Endomorphismen versteht man Selbstabbildungen eines euklidischen bzw. unit¨ aren Vektorraums, welche L¨ angen von Vektoren und Winkel zwischen Vektoren invariant lassen. Im R2 beispielsweise sind die orthogonalen Endomorphismen genau die Drehungen um den Ursprung. Frage 389 Seien (V, V ) und (W, W ) normierte Vektorr¨aume. Wann heißt eine K-lineare Abbildung F : V −→ W eine Isometrie bzw. Kongruenzabbildung? Antwort: Eine lineare Abbildung F : V −→ W heißt Isometrie, wenn sie l¨ angen erhaltend in dem Sinne ist, dass f¨ ur alle v ∈ V stets F (v) = v gilt. Frage 390 Wann nennt man einen Endomorphismus F : V −→ V eine Vektorraum V mit Skalarprodukt , orthogonal bzw. unit¨ar? Antwort: Ein Endomorphismus F : V −→ V heißt orthogonal bzw. unit¨ ar, wenn f¨ ur alle v, w ∈ V gilt F (v), F (w) = v, w.
Frage 391 K¨ onnen Sie zeigen, dass eine lineare Abbildung F : V −→ V eines euklidischen oder unit¨aren K-Vektorraums V genau dann orthogonal bzw. unit¨ar ist, wenn F eine Isometrie ist? Antwort: Dass ein orthogonaler bzw. unit¨ arer Endomorphismus auch eine Isometrie ist, folgt unmittelbar, wenn man in der Definition aus Frage 390 v = w setzt. F¨ ur den Beweis der Umkehrung m¨ ussen die beiden F¨ alle K = R und K = C unterschieden werden. In beiden F¨ allen gehen wir davon aus, dass F eine Isometrie ist und daher die Gleichung F (v), F (v) = v, v
f¨ ur alle v ∈ V
erf¨ ullt. Man betrachte zun¨ achst den K¨ orper R. In diesem Fall gilt f¨ ur alle v, w ∈ V F (v + w), F (v + w) = v + w, v + w = v, v + 2v, w + w, w und zum anderen F (v + w), F (v + w) = F (v), F (v) + 2F (v), F (w) + F (w), F (w) = v, v + 2F (v), F (w) + w, w Zusammen folgt hieraus F (v), F (w) = v, w wie gew¨ unscht.
171
6.5 Orthogonale und unit¨ are Endomorphismen
Nun behandeln wir den Fall K = C. Da beim vorhergehenden Beweis wesentlich von der Symmetrie des Skalarproduktes Gebrauch gemacht wurde, l¨ asst er sich nicht unmittelbar auf hermitesche Formen u ¨bertragen, aber mit demselben Argument wie oben erh¨ alt man zun¨ achst die Gleichung F (v), F (w) + F (w), F (v) = v, w + w, v.
(∗)
Nun wiederholt man die im ersten Teil ausgef¨ uhrte Rechnung, ersetzt hierin aber w durch iw. Dann erh¨ alt man F (v + iw), F (v + iw) = v + iw, v + iw = v, v − iv, w + iw, v − w, w und F (v + iw), F (v + iw) = v, v − iF (v), F (w) + iF (w), F (v) − w, w. Aus diesen beiden Gleichungen ergibt sich −v, w + w, v = −F (v), F (w) + F (w), F (v), woraus zusammen mit (∗) das gew¨ unschte Resultat folgt.
Frage 392 Wann heißt eine Matrix A ∈ GL(n, R) orthogonal bzw. eine Matrix A ∈ GL(n, C) unit¨ ar K¨ onnen Sie zeigen, dass f¨ ur einen euklidischen bzw. unit¨aren Vektorraum V mit Orthonormalbasis B eine Orthonormalbasis von V eine lineaer Abbildung F : V −→ V genau dann eine Isometrie ist, wenn die beschreibende Matrix A := AB (F ) orthogonal bzw. unit¨ar ist? Antwort: Eine Matrix A ∈ GL(n, R) heißt orthogonal, wenn A−1 = AT gilt. Entsprechend heißt A ∈ GL(n, K) unit¨ ar, wenn A−1 = AT gilt. Sei B = (v1 , . . . , vn ) eine Orthonormalbasis von V und F ∈ End(V ). Die Spaltenvektoren a1 , . . . , an ∈ Kn von A sind die Bilder der Basisvektoren unter F . Ist F eine Isometrie, so bilden die Spaltenvektoren von A eine Orthonormalbasis von Kn und es gilt T
A A = (aTi · aj )1≤i,j≤n = (ai • aj )1≤i,j≤n = (δij )1≤i,j≤n = En . T
Umgekehrt folgt aus A A = En T
F (v), F (w) = (A[v]B )T A[w]B = [v]TB A A[w]B = [v]TB [w]B = v, w.
172
6 Euklidische und unit¨ are Vektorr¨ aume
Also ist F in diesem Fall eine Isometrie. Der Beweis impliziert auch die entsprechende Aussage f¨ ur reelle Vektorr¨ aume und orthogonale Matrizen. Frage 393
Wie sind die Mengen SO(n), O(n) und U(n) definiert?
Antwort: Die Mengen SO(n), O(n) und U(n) sind Untergruppen von GL(n, R) bzw. GL(n, C), definiert durch O(n) := {A ∈ GL(n, R) ; A−1 = AT } SO(n) := {A ∈ O(n) ; det A = 1} U(n) := {A ∈ GL(n, C) ; A−1 = AT }
(orthogonale Gruppe) (spezielle orthogonale Gruppe) (unit¨ are Gruppe)
Dass es sich bei den Mengen tats¨ achlich um Untergruppen von GL(n, R) bzw. GL(n, C) handelt, l¨ asst sich unmittelbar u ufen. Zum Beispiel gilt f¨ ur A, B ∈ ¨berpr¨ U(n) T
T
T
(AB)−1 = B −1 A−1 = B A = (AB)
und
T
(A−1 )−1 = A = (AT ) .
Das zeigt, dass U(n) eine Untergruppe von GL(n, C) ist. Entsprechend verifiziert man dies f¨ ur O(n) und SO(n). Frage 394
Welche Form besitzen die orthogonalen Matrizen aus GL(2, R)?
Antwort: Jede orthogonale Matrix aus GL(2, R) besitzt eine der beiden folgenden Formen cos θ − sin θ cos θ sin θ oder mit θ ∈ [0, 2π[. sin θ cos θ sin θ − cos θ
a b Beweis: Sei A = orthogonal, so dass also AAT = E2 = AT A gilt. Aus c d der ersten Gleichung erh¨ alt man a2 + b2 = 1,
ac + bd = 0,
c2 + d2 = 1
a2 + c2 = 1,
ab + cd = 0,
b2 + d2 = 1.
und aus der zweiten
Wegen der ersten Gleichung in der ersten Zeile gibt es ein θ ∈ [0, 2π[ mit a = cos θ und b = sin θ. Aus der ersten Gleichung der zweiten Zeile erh¨ alt man b = ±c. Ist b = −c, dann folgt a = d, andernfalls ist a = −d. Dies f¨ uhrt auf die beiden m¨ oglichen Matrizen.
6.5 Orthogonale und unit¨ are Endomorphismen
173
Es ist anschaulich klar, dass eine Drehung außer f¨ ur θ = 0 und θ = π keine reellen Eigenwerte besitzen kann. In der Tat, f¨ ur A ∈ O(2) und det A = 1 erh¨ alt man als charakteristisches Polynom χA (X) = (X − cos θ)2 + sin2 θ, und dieses quadratische Polynom besitzt nur in den F¨ allen eine reelle Nullstelle, in denen beide Summanden verschwinden, also sin θ = 0 ist, was θ = 0 oder θ = π impliziert. Frage 395 ren?
Wie lassen sich die orthogonalen Matrizen aus GL(3, R) charakterisie-
Antwort: Sei F : R3 −→ R3 orthogonal. Da das charakteristische Polynom χf den Grad 3 hat, existiert mindestens eine reelle Nullstelle und damit ein Eigenwert λ1 , f¨ ur den λ1 = ±1 gilt. Sei e1 ein zugeh¨ origer Eigenvektor. Indem wir den Vektor e1 normieren, k¨ onnen wir e1 = 1 annehmen und ihn zu einer Orthonormalbasis B = {e1 , e2 , e3 } von V erg¨ anzen. Mit W = span(e2 , e3 ) gilt F (W ) = W , die Einschr¨ ankung von F auf W ist also eine orthogonale Abbildung R2 −→ R2 und wird durch eine Matrix aus A′ ∈ O(2) beschrieben. Somit gilt ⎞ ⎛ λ1 0 0 ⎟ ⎜ MB (F ) = ⎝ 0 ⎠ =: A mit A′ ∈ O(2). A′ 0
Die Gleichung det A = det λ1 · det A er¨ offnet an dieser Stelle eine Fallunterscheidung. λ1 = +1. Ist det A = +1, so gilt det A′ = +1, und damit besitzt A′ die Gestalt (∗) aus Frage 394. Es gilt also ⎞ ⎛ 1 0 0 ⎟ ⎜ MB (F ) = ⎝0 cos θ − sin θ ⎠ 0 sin θ cos θ
f¨ ur ein θ ∈ [0, 2π[. Ist det A = −1, dann folgt det A′ = −1, und nach der Bemerkung aus Frage 394 kann man eine Orthonormalbasis B aus Eigenvektoren von F w¨ ahlen. Bez¨ uglich dieser Basis gilt dann ⎛ ⎞ 1 0 0 ⎜ ⎟ MB (F ) = ⎝0 1 0 ⎠ . 0 0 −1
174
6 Euklidische und unit¨ are Vektorr¨ aume
λ1 = −1. Hier sind wieder die F¨ alle det A = −1 von det A = +1 zu unterscheiden. Dies f¨ uhrt auf die beiden M¨ oglichkeiten ⎞ ⎛ ⎞ ⎛ −1 0 0 −1 0 0 ⎟ ⎜ ⎟ ⎜ MB (F ) = ⎝ 0 cos θ − sin θ ⎠ und MB (F ) = ⎝ 0 1 0 ⎠ , 0 0 −1 0 sin θ cos θ
wo B eine geeignete Orthonormalbasis aus Eigenvektoren von F bezeichnet. Bez¨ uglich der Charakterisierung orthogonaler Matrizen 3×3-Matrizen bedeutet das, dass eine Matrix A ∈ R3×3 genau dann orthogonal ist, wenn eine Matrix S ∈ GL(3, R) existiert, so dass S −1 · A · S eine der vier dargestellten Formen besitzt.
Frage 396 K¨ onnen Sie zeigen, dass ein Endomorphismus F : V −→ V eines euklidischen bzw. unit¨aren Vektorraumes V genau dann orthogonal bzw. unit¨ar ist, wenn F Orthonormalbasen von V auf Orthonormalbasen von V abbildet ? Antwort: Sei B = {v1 , . . . , vn } eine Orthonormalbasis von V . Ist F orthogonal bzw. unit¨ ar, dann gilt vi , vj = δij
und F (vi ), F (vj ) = vi , vj .
Hieraus folgt, dass {F (v1 ), . . . , F (vn )} ebenfalls eine Orthonormalbasis von V ist. Seien nun umgekehrt B = {v1 , . . . , vn } und C = {F (v1 ), . . . , F (vn )} Orthonormalbasen von V und F ∈ End(V ). F¨ ur zwei Vektoren v = λ1 v1 + · · · + λn vn und w = λ1 v1 +· · ·+λn vn gilt aus Linearit¨ atsgr¨ unden F (v) = λ1 F (v1 )+· · ·+λn F (vn ) und F (w) = μ1 F (v1 ) + · · · + μn F (vn ). Da B und C Orthonormalbasen sind, gilt nach Frage 379 f¨ ur das Skalarprodukt v, w = λ1 μ1 + · · · + λn μn und F (v), F (w) = λ1 μ1 + · · · + λn μn . Es folgt, dass F unit¨ ar ist. Frage 397
Wieso sind alle unit¨aren Abbildungen invertierbar?
Antwort: Nach Frage 396 bilden unit¨ are Abbildungen Orthonormalbasen auf Orthonormalbasen ab. Daraus ergibt sich die Behauptung aus allgemeinen Eigenschaften linearer Abbildungen. Die Behauptung folgt auch unmittelbar aus der Antwort zu Frage 392, nach der ein unit¨ arer Endomorphismus bez¨ uglich einer Basis durch eine invertierbare Matrix dargestellt wird.
6.5 Orthogonale und unit¨ are Endomorphismen
175
Frage 398 Sei F : V −→ V eine orthogonale Abbildung eines endlichdimensionalen Vektorraums V . K¨ onnen Sie zeigen, dass V einen F -invarianten Unterraum W der Dimension 1 oder 2 besitzt? Antwort: Besitzt F einen reellen Eigenwert λ mit zugeh¨ origem Eigenvektor v, dann hat man mit W := Rv einen F -invarianten Unterraum der Dimension 1. Es bleibt also nur der Fall zu behandeln, in dem F keine reellen Eigenwerte hat. In diesem Fall hat das charakteristische Polynom von F die Gestalt χf (X) = ±(X − λk )(X − λk ) · · · (X − λ1 )(X − λ1 ) = ±pk (X) · · · p1 (X), wobei λi , λi ∈ C \ R f¨ ur i = 1, . . . , k die Eigenwerte von F und pi (X) = X 2 +cX + d ∈ R[X] reelle Polynome vom Grad 2 sind (mit c = −2Re λi und d = |λi |2 = 1). Nun erinnere man sich an den Satz von Cayley-Hamilton (Frage 319). Nach diesem gilt χf (F )(v) = ± p1 (F ) ◦ · · · ◦ pk (F ) (v) = 0 f¨ ur jedes v ∈ 0,
woraus folgt, dass ein v = 0 mit der Eigenschaft existiert, dass pr (F )(v) = f 2 (v) + cF (v) + dv = 0
(∗)
f¨ ur wenigstens ein r ∈ {1, . . . , n} gilt. (In der Tat: Man beginne mit einem beliebigen Vektor v1 = 0. Ist dann p1 (v1 ) = 0, so ist man fertig. Andernfalls betrachte man v2 := p1 (v1 ) und schaue, ob p2 (v2 ) = 0 gilt usw. Sp¨ atestens f¨ ur den Vektor vk muss dann pk (vk ) = 0 gelten.) Man setze nun W := span v, F (v) . F¨ ur jeden Vektor w = av + bF (v) ∈ W gilt dann wegen (∗) f (w) = aF (v) + bf F (v) = aF (v) + b(−cF (v) − d v) = −bd v + (a − bc)F (v) ∈ W. Somit ist W der gesuchte F -invariante Unterraum. Frage 399
Wie lassen sich die orthogonalen Matrizen Rn×n klassifizieren?
Antwort: Es gilt folgendes Theorem:
176
6 Euklidische und unit¨ are Vektorr¨ aume
Ist F ein orthogonaler Endomorphismus eines euklidischen Vektorraumes V , so gibt es in V eine Orthonormalbasis B derart, dass ⎞ ⎛ +1 ⎟ ⎜ .. ⎟ ⎜ . ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ +1 ⎟ ⎜ ⎟ ⎜ −1 0 ⎟ ⎜ ⎟ ⎜ .. MB (f ) = ⎜ ⎟ . ⎟ ⎜ ⎟ ⎜ −1 ⎟ ⎜ ⎟ ⎜ 0 A1 ⎟ ⎜ ⎟ ⎜ . ⎟ ⎜ .. ⎠ ⎝ Ak gilt, wobei die Matrizen Aj f¨ ur j = 1, . . . , k die Gestalt cos θj − sin θj ∈ SO(2) mit θj ∈ [0, 2π[ \ {0, π} Aj = sin θj cos θj
besitzen. Beweis: Induktion u ur n = 1 und wurde ¨ber n = dim V . Die Behauptung ist klar f¨ f¨ ur n = 2 in der Antwort zu Frage 394 gezeigt. Sei also V ein Vektorraum der Dimension n und die Behauptung f¨ ur Vektorr¨ aume der Dimension n − 1 und n − 2 bereits gezeigt. Nach dem Ergebnis von Frage 398 gibt es einen F -invarianten Unterraum W ⊂ V mit dim W = 1 oder dim W = 2. Da F als orthogonale Abbildung bijektiv ist, gilt dann sogar F (W ) = W
und ebenso F (W ⊥ ) = W ⊥ .
Die Einschr¨ ankungen F1 := f |W und F2 := f |W ⊥ auf W bzw. W ⊥ sind damit jeweils orthogonale Abbildungen von W bzw. W ⊥ in sich. Nach der Induktionsvoraussetzung gibt es Orthonormalbasen B1 von W und B2 von W ⊥ , bez¨ uglich derer die Abbildungsmatrizen die angegebene Gestalt haben. Setzt man B := B1 ∪ B2 , so ist B eine Orthonormalbasis von V , und die Matrix MB (f ) besitzt – nach entsprechender Anordnung der Basisvektoren – die Gestalt (∗). Damit ist der Satz bewiesen.
6.6
Die adjungierte Abbildung
Frage 400 Sei (V, , ) ein unit¨arer K-Vektorraum. Wie ist die zu einem Endomorphismus F ∈ EndK (V ) adjungierte Abbildung F ∗ : V −→ V definiert?
177
6.6 Die adjungierte Abbildung
Antwort: Die Abbildung F ∗ : V −→ V heißt zu F adjungiert, wenn F (v), w = v, F ∗ (w)
f¨ ur alle v, w ∈ V
gilt.
(∗)
Frage 401 K¨ onnen Sie zeigen, dass zu jedem F ∈ EndK (V ) genau eine adjungierte Abbildung existiert? Antwort: Um zun¨ achst die Existenz zu zeigen, betrachte man eine Orthonormalbasis B = {e1 , . . . , en } von V . Setzt man F ∗ (w) := F (e1 ), we1 + · · · + F (en ), wen ,
(∗∗)
so folgt f¨ ur i = 1, . . . , n ei , F ∗ (w) = ei , F (e1 ), we1 + · · · + ei , F (en ), wen = F (e1 ), wei , e1 + · · · + F (en ), wei , en = F (ei ), wei , ei = F (ei ), w. Die Abbildung F ∗ besitzt also die Eigenschaft (∗), sofern v einer der Basisvektoren ei ist, und aus Linearit¨ atsgr¨ unden folgt daraus, dass (∗) sogar f¨ ur alle Vektoren v ∈ V gilt. F¨ ur den Beweis der Eindeutigkeit nehme man an, F∗ sei eine weitere Abbildung, die (∗) erf¨ ullt. Dann gilt f¨ ur alle v, w ∈ V F (v), w = v, F ∗ (w) = v, F∗ (w)
also
v, F ∗ (w) − F∗ (w) = 0,
ur alle w ∈ V wegen der positiven Definitheit und daraus folgt F ∗ (w)− F∗ (w) = 0 f¨ ∗ ∗ von , , also F = F .
Frage 402
Wieso ist die zu F ∈ EndK (V ) adjungierte Abbildung F ∗ linear?
Antwort: F¨ ur Vektoren u, v, w ∈ V gilt u, F ∗ (v + w) = F (u), v + w = F (u), v + F (u), w = u, F ∗ (v) + u, F ∗ (w) = u, F ∗ (v) + F ∗ (w), und daraus folgt F ∗ (v + w) = F ∗ (v) + F ∗ (w) wegen der positiven Definitheit des Skalarproduktes. Weiter gilt f¨ ur λ ∈ K v, F ∗ (λw) = F (v), λw = λF (v), w = λv, F ∗ (w) = v, λF ∗ (w), also F ∗ (λw) = λF ∗ (w). Das zeigt insgesamt die Linearit¨ at von F ∗ .
178
6 Euklidische und unit¨ are Vektorr¨ aume
Frage 403 Kennen Sie eine Eigenschaft der adjungierten Abbildung F ∗ , die ¨aquivalent zur Eigenschaft von F ist, orthogonal bzw. unit¨ar zu sein? Antwort: Der Endomorphimus F ist unit¨ ar genau dann, wenn F ◦ F ∗ die identische Abbildung ist. Beweis: Ist F unit¨ ar, so gilt v, w = F (v), F (w) = v, F ∗ (F (w))
f¨ ur alle v, w ∈ V ,
also F ∗ ◦ F = id. Umgekehrt folgt aus F ∗ ◦ F = id v, w = v, F ∗ (F (w)) = F (v), F (w)
f¨ ur alle v, w ∈ V ,
also v, w = F (v), F (w), was bedeutet, dass F unit¨ ar ist.
Frage 404 K¨ onnen Sie zeigen, dass f¨ ur alle F, G ∈ End(V ) eines unit¨aren Vektorraumes (V, , ) und alle λ, μ ∈ K die folgenden Eigenschaften gelten F ∗∗ = F (λF + μG)∗ = λF + μG (d. h., die Abbildung semilinear ) (iii) (F ◦ G)∗ = G∗ ◦ F ∗ . (iv) ker F ∗ = (im F )⊥ , im F ∗ = (ker F )⊥ . (v) rg F = rg F ∗ . (i) (ii)
∗
: End(V ) → End(V ) ist
Antwort: (i) F¨ ur v, w ∈ V gilt v, F ∗∗ (w) = F ∗ (v), w = w, F ∗ (v) = F (w), v = v, F (w). ur alle w ∈ V , also F ∗∗ = F aufgrund der positiven Es folgt F ∗∗ (w) = F (w) f¨ Definitheit von , . (ii) F¨ ur alle v, w ∈ V gilt v, (λF + μG)∗ (w) = (λF + μG)(v), w = λF (v), w + μG(v), w = λv, F ∗ (w) + μv, G∗ (w) = v, λF ∗ (w) + v, μG∗ (w) = v, (λF ∗ + μG∗ )(w) Das zeigt die Semilineari¨ at der Abbildung ∗ . (iii) F¨ ur v, w ∈ V gilt v, (F ◦ G)∗ (w) = (F ◦ G)(v), w = F (G(v)), w = G(v), F ∗ (w) = v, G∗ (F ∗ (w)) = v, (G∗ ◦ F ∗ )(w). Das impliziert (F ◦ G)∗ = G∗ ◦ F ∗ . (iv) Sei w ∈ ker F ∗ , d. h. F ∗ (w) = 0. Dann gilt 0 = v, F ∗ (w) = F (v), w
f¨ ur alle v ∈ V ,
179
6.6 Die adjungierte Abbildung
also w ⊥ F (v) f¨ ur alle v ∈ V bzw. w ∈ (im F )⊥ und damit ker F ∗ ⊆ (im F )⊥ . Umgekehrt folgert man aus der Voraussetzung w ∈ (im F )⊥ mit derselben Gleichung wie oben, dass w ∈ ker F ∗ , also (im F )⊥ ⊆ ker F ∗ gilt. Ist nun v ∈ ker F , dann folgt 0 = F (v), w = v, F ∗ (w)
f¨ ur alle w ∈ V ,
und somit v ∈ (im F ∗ )⊥ bzw. ker F ⊆ (im F ∗ )⊥ . Umgekehrt folgt aus v ∈ (im F ∗ )⊥ mit derselben Gleichung v ∈ ker f , also (im F ∗ )⊥ ⊆ ker F . (v) Mit der Dimensionsformel ergibt sich aus (iv) rg F = dim V − dim(ker F ) = dim V − dim(im F ∗ )⊥ = dim V − (dim V − rg F ∗ ) = rg F ∗ .
Frage 405 Wann heißt ein Endomorphismus F : V −→ V eines unit¨aren Vektorraumes V normal? Antwort: Ein Endomorphismus F heißt normal, wenn er mit seiner adjungierten Abbildung F ∗ kommutiert, d. h. wenn F ◦ F ∗ = F ∗ ◦ F gilt. Frage 406
Wieso ist F ∈ End(V ) genau dann normal, wenn F (v), F (w) = F ∗ (v), F ∗ (w)
(∗)
f¨ ur alle v, w ∈ V gilt? Antwort: Ist F normal, so hat man wegen F ∗∗ = F F (v), F (w) = v, F ∗ (F (w)) = v, F (F ∗ (w)) = v, F ∗∗ (F ∗ (w) = F ∗ (v), F ∗ (w). Umgekehrt folgt aus der Eigenschaft (∗) v, F ∗ (f (w)) = F (v), F (w) = F ∗ (v), F ∗ (w) = v, F ∗∗ (F ∗ (w)) = v, F (F ∗ (w)), und damit F ∗ ◦ F = F ◦ F ∗ . Frage 407
Sei F ∈ EndK (V ) normal. Wieso gilt ker F = ker F ∗ ?
Antwort: Ist v ∈ ker F , dann gilt 0 = F (v), F (v) = F ∗ (v), F ∗ (v) und damit wegen der positiven Definitheit F ∗ (v) = 0, also v ∈ ker F ∗ . Die umgekehrte Implikation folgt, wenn man obige Gleichung von rechts nach links liest.
180
6 Euklidische und unit¨ are Vektorr¨ aume
Frage 408 Sei F ∈ End(V ) normal. K¨ onnen Sie zeigen, dass ein Vektor v ∈ V genau dann ein Eigenvektor von F zum Eigenwert λ ist, wenn v ein Eigenvektor von F ∗ zum Eigenwert λ ist? Antwort: Aufgrund von Frage 404 (ii) gilt (λ id − F )∗ = λ id − F ∗ . Daraus folgt, dass mit F auch (λ id − F )∗ normal ist. Mit Frage 407 erh¨ alt man also ker(λ id − F ) = ker (λ id − F )∗ = ker(λ id − F ∗ ). Daraus folgt die Behauptung.
Frage 409 Wie lautet der Spektralsatz f¨ ur normale Endomorphismen? K¨ onnen Sie einen Beweis skizzieren? Antwort: Der Satz lautet: aren VektorSei F ∈ EndK (V ) ein Endomorphismus eines euklidischen bzw. unit¨ raumes (V, , ), dessen charakteristisches Polynom χf ∈ K[X] vollst¨ andig in Linearfaktoren zerf¨ allt. Dann sind a quivalent: ¨ (i) (ii)
F ist normal. Es existiert eine Orthonormalbasis von V aus Eigenvektoren von F .
Beweis: Sei zun¨ achst F normal. Um zu zeigen, dass F eine Orthonormalbasis aus Eigenvektoren von F besitzt, benutzen wir Induktion nach n = dim V , wobei der Induktionsanfang mit n = 0 trivial ist. Sei also die Implikation (i) =⇒ (ii) f¨ ur Vektorr¨ aume der Dimension n − 1 bereits bewiesen. Da χf in K[X] vollst¨ andig in Linearfaktoren zerf¨ allt, besitzt F wenigstens einen Eigenwert λ1 mit zugeh¨ origem Eigenvektor e1 . Indem wir e1 normieren, k¨ onnen wir e1 = 1 annehmen. Man betrachte nun die nach Frage 369 existierende Zerlegung V = span(e1 ) ⊕ span(e1 )⊥ . Wir zeigen, dass span(e1 )⊥ ein F -invarianter Unterraum ist. Sei v ∈ span(e1 )⊥ . Dann gilt nach Frage 408 F (v), e1 = v, F ∗ (e1 ) = v, λe1 = λv, e1 = 0, also F (v) ∈ span(e1 )⊥ . Damit ist gezeigt, dass es sich bei span(e1 )⊥ um einen F -invarianten Unterraum handelt, auf den sich daher die Induktionsvoraussetzung anwenden l¨ asst. Demnach gibt es eine Orthonormalbasis {e2 , . . . , en } von span(e1 )⊥ , die aus Eigenvektoren von F besteht. Die Vektoren e1 , e2 , . . . , en bilden dann eine Orthonormalbasis von V , bestehend aus Eigenvektoren von F . Das ¨ beweist den ersten Teil der Aquivalenz.
6.7 Selbstadjungierte Endomorphismen
181
Sei jetzt umgekehrt mit {e1 , . . . , en } eine Orthonormalbasis von V aus Eigenvektoren von F gegeben, λ1 , . . . , λn seien die entsprechenden Eigenwerte. Nach der Darstellung von F ∗ aus Frage 401 gilt dann f¨ ur i = 1, . . . , n F ∗ (ei ) = F (e1 ), ei e1 + · · · + F (en ), ei en = λi ei , ei ei = λi ei . Es folgt, dass λi f¨ ur i = 1, . . . , n Eigenwert von F ∗ zum Eigenvektor ei ist. Geht man umgekehrt von dieser Voraussetzung aus, dann folgert man genauso wie oben unter Benutzung der Darstellung von F ∗∗ = F , dass ei Eigenwert von F zum Eigenwert λi ist. Daher ist F normal nach Frage 408.
6.7
Selbstadjungierte Endomorphismen
Frage 410 Wann nennt man einen Endomorphismus F ∈ End(V ) eines euklidischen bzw. unit¨aren Vektorraumes (V, , ) selbstadjungiert? Antwort: Der Endomorphismus F heißt selbstadjungiert, wenn er mit seiner adur alle v, w ∈ V gilt: jungierten Abbildung F ∗ u ¨bereinstimmt, wenn also f¨ F (v), w = v, F (w)
Frage 411 Durch welche Arten von Matrizen werden selbstadjungierte Endomorphismen F : V −→ V eines euklidischen bzw. unit¨aren Vektorraumes V bez¨ uglich einer Orthonormalbasis B von V beschrieben? Antwort: Es gilt F selbstadjungiert ⇐⇒ A := MB (F ) symmetrisch bzw. hermitesch. Beweis: Der Zusammenhang folgt aus den beiden Gleichungen F (v), w = (A · vB )T · wB = vBT · AT · w, v, F (w) = vBT · (A · wB ) = vBT · A · wB . Aus der Selbstadjungiertheit von F , also der Gleichheit der linken Seiten beider Gleichungen, folgt AT = A bzw. A = A∗ , d. h. A ist symmetrisch bzw. hermitesch. Ist umgekehrt A hermitesch, d. h. die rechten Seiten der Gleichungen identisch, dann ergibt sich daraus F (v), w = v, F (w), also die Selbstadjungiertheit von F. Frage 412 K¨ onnen Sie zeigen, dass f¨ ur einen beliebigen Endomorphismus F : V −→ V die Komposition F ◦ F ∗ selbstadjungiert ist? Was bedeutet das im Bezug auf symmetrische bzw. hermitesche Matrizen?
182
6 Euklidische und unit¨ are Vektorr¨ aume
Antwort: Die Behauptung wird durch einfaches Nachrechnen verifiziert. F¨ ur v, w ∈ V gilt F ◦ F ∗ (v), w = F ∗ (v), F ∗ (w) = F ◦ F ∗ (w).
(∗)
Also ist F ◦ F ∗ selbstadjungiert. Im Bezug auf Matrizen folgt darauf, dass f¨ ur jede Matrix A ∈ Kn×n das Produkt ∗ AA symmetrisch bzw. hermitesch ist. Frage 413 Welcher Zusammenhang besteht zwischen den selbstadjungierten Abbildungen F : V −→ V eines euklidischen bzw. unit¨aren Vektorraums (V, , ) und den symmetrischen Bilinearformen bzw. hermiteschen Formen Φ : V × V −→ K? Antwort: Es ist F selbstadjungiert genau dann, wenn die durch Φ(v, w) = F (v), w gegebene Abbildung Φ : V × V −→ K eine symmetrische Bilinearform bzw. hermitesche Form definiert. Beweis: Ist F selbstadjungiert, dann gilt Φ(v, w) = F (v), w = v, F (w) = F (w), v = Φ(w, v), und damit ist Φ eine symmetrische Bilinearform bzw. hermitesche Form. Ist andersherum eine symmetrische Bilinearform bzw. hermitesche Form auf V gegeben, so gilt f¨ ur die lineare Abbildung F F (v), w = Φ(v, w) = Φ(w, v) = F (w), v = v, F (w), und F ist selbstadjungiert. Der Zusammenhang folgt auch daraus, dass zu den hermiteschen (symmetrischen) Matrizen sowohl eine Bijektion auf die Menge der hermiteschen Formen (symmetrischen Bilinearformen) existiert (Frage 347) als auch auf die Menge der selbstadjungierten Endomorphismen des unit¨ aren (euklidischen) Vektorraums V (Frage 411). Die Begriffe Symmetrische Bilinearform bzw. hermitesche Form“, unit¨ are bzw. ” ” symmetrische Matrix“ und selbstadjungierter Endomorphismus“ beschreiben al” so nur unterschiedliche Erscheinungsweisen ein und derselben Sache. Jede Eigen¨ schaft einer der drei Begriffe besitzt ein genaues Aquivalent in den Eigenschaften der anderen beiden. Frage 414
Wieso ist jeder selbstadjungierte Endomorphismus normal?
6.7 Selbstadjungierte Endomorphismen
183
Antwort: Die Gleichung (∗) aus Antwort 412 impliziert zusammen mit Eigenschaft (ii) aus Frage 404 (F ◦ F ∗ )∗ = F ◦ F ∗ = F ∗ ◦ F. Damit ist F normal gem¨ aß Definition.
Frage 415 Wieso sind alle Eigenwerte eines selbstadjungierten Endomorphismus F ∈ EndK (V ) reell? Antwort: Sei zun¨ achst K = C. Da das charakteristische Polynom χf ∈ C[X] vollst¨ andig in Linearfaktoren zerf¨ allt, existiert ein Eigenwert λ ∈ C mit Eigenvektor v = 0. Aus der Selbstadjungertheit von F folgt dann λv, v = F (v), v = v, F (v) = λv, v, also λ = λ und damit λ ∈ R. Ist nun K = R, so w¨ ahle man eine Orthonormalbasis B von V . Die Matrix n×n M := MB (F ) ∈ R ist dann orthogonal und – aufgefasst als Element aus Cn×n – unit¨ ar. Nach dem ersten Teil der Antwort zerf¨ allt χM u andig in ¨ber R vollst¨ Linearfaktoren. Wegen χf = χM folgt, dass F nur reelle Eigenwerte besitzt. Frage 416 Was besagt der Spektralsatz f¨ ur selbstadjungierte Endomorphismen (manchmal auch Satz u ¨ber die Hauptachsentransformation genannt)? Wie kann man ihn beweisen? Antwort: Der Satz besagt: Ein Endomorphismus F ∈ EndK (V ) eines unit¨ aren oder euklischen Vektorraumes V ist selbstadjungiert genau dann, wenn V eine Orthonormalbasis aus Eigenvektoren von V besitzt. Beweis: Da jeder selbstadjungierte Endomorphismus insbesondere normal ist, handelt es sich bei diesem Satz um einen Spezialfall des Spektralsatzes f¨ ur normale Endomorphismen aus Frage 404. Er folgt auch sofort aus diesem, wenn man das Ergebnis der vorigen Frage 415 miteinbezieht. Nach dieser zerf¨ allt das charakteristische Polynom eines selbstadjungierten Endomorphismus u andig in ¨ber K vollst¨ Linearfaktoren. Der Rest folgt nun aus dem Spektralsatz f¨ ur normale Endomorphismen. Frage 417 Wie lautet die matrizentheroretische Version des Spekatralsatzes u ¨ber selbstadjungierte Endomorphismen? ¨ Antwort: Ubersetzt in den Matrizenkalk¨ ul lautet der Satz:
184
6 Euklidische und unit¨ are Vektorr¨ aume
Sei A ∈ Kn×n eine symmetrische bzw. unit¨ are Matrix. Dann existiert eine orthogonale bzw. unit¨ are Matrix S ∈ GL(n, K) so dass D = S −1 AS = S ∗ AS eine reelle Diagonalmatrix ist. Beweis: Als unit¨ are Matrix beschreibt A einen selbstadjungierten Endomorphismus, dessen Eigenwerte λ1 , . . . , λn alle reell sind. Nach dem Spektralsatz gibt es eine Orthonormalbasis B von V derart, dass ⎞ ⎛ λ1 0 ⎟ ⎜ .. D := MB (F ) = ⎝ ⎠ . λn
gilt. Ist S ∈ GL(n, K) die Matrix, die den Basiswechsel von der Standardbasis des Kn auf B beschreibt, so gilt also S −1 AS = D,
und da S Orthonormalbasen auf Orthonormalbasen abbildet, ist S unit¨ ar und erf¨ ullt S ∗ = S −1 . Daraus folgt die Behauptung. Frage 418 K¨ onnen Sie den geometrischen Hintergrund der Hauptachsentransfor” mation“ erl¨autern? Antwort: Sei C eine Kurve im R2 , die durch eine Gleichung der Gestalt ax21 + bx1 x2 + cx22 = 1,
a, b, c ∈ R
beschrieben. Mit x = (x1 , x2 )T l¨ asst sich dies auch elegant als Matrixgleichung xT · A · x = 1 ausdr¨ ucken, wobei A=
a b/2 b/2 c
eine symmetrische Matrix ist und folglich eine symmetrische Bilinearform auf R2 definiert. A besitzt nach Antwort 415 zwei reelle Eigenwerte λ1 und λ2 , und nach dem Satz u ¨ber die Hauptachsentransformation existiert eine orthogonale Matrix S, so dass λ1 0 = S T AS D := 0 λ2
185
6.7 Selbstadjungierte Endomorphismen
gilt. Die Matrix S beschreibt als orthogonale Matrix eine Drehung des R2 und bildet die Standardbasis auf eine weitere Orthonormalbasis B ab. F¨ ur die KoorT dinaten (y1 , y2 ) = S · (x1 , x2 ) bez¨ uglich dieser neuen Basis wird die Kurve dann durch die Gleichung y T · D · y = λ1 y12 + λ2 y22 =
y12 y22 + = 1, a b
mit a =
1 1 ,b = λ1 λ2
beschrieben, in der kein gemischter Term mehr vorkommt. Man erkennt, dass C im Fall λ1 > 0, λ2 > 0 eine Ellipse beschreibt und im Fall λ1 > 0, λ2 < 0 eine Hyperbel. x2
x2
y2
y2 y1
y1 x1
x1
Die Koordinatenachsen der neuen Basis sind dabei so ausgerichtet, dass sie den Hauptachsen der Kurve C entsprechen. Frage 419 Sei Φ : V ×V −→ K eine symmetrische Bilinearform bzw. hermitesche Form auf einem endlich-dimensionalen K-Vektorraum V . Kennen Sie ein Kriterium f¨ ur die positive Definitheit von Φ, welches auf die Eigenschaften der Eigenwerte von MB (Φ) bez¨ uglich einer geeigneten Basis B von V Bezug nimmt? Antwort: Es gilt: Φ ist positiv definit genau dann, wenn eine Basis B von V existiert, so dass MB (Φ) ausschließlich positive Eigenwerte besitzt. Beweis: Ist Φ positiv definit, also ein Skalarprodukt, so existiert eine Orthonormalbasis B von V , so dass MB (Φ) die Einheitsmatrix ist. Diese besitzt nur den Eigenwert 1.
186
6 Euklidische und unit¨ are Vektorr¨ aume
Sei umgekehrt eine Basis B gegeben, sodass alle Eigenwerte λ1 , . . . , λn von MB (Φ) positiv sind. Da MB (Φ) symmetrisch bzw. hermitesch ist, gibt es nach dem Spektralsatz eine Matrix S ∈ GL(n, K) mit ⎞ ⎛ λ1 0 ⎟ ⎜ .. S ∗ · MB (Φ) · S = S −1 · MB (Φ) · S = ⎝ ⎠ =: D. . 0
λn
Fasst man S als Basiswechselmatrix des Typs MBC auf, wobei C = {v1 , . . . , vn } eine Basis des Kn ist, dann gilt MC (Φ) = D und somit Φ(vi , vi ) = λi > 0
i = 1, . . . , n.
Damit ist Φ positiv definit. Frage 420
Was besagt der Tr¨ agheitssatz von Sylvester?
Antwort: Der Satz besagt: Sei Φ eine symmetrische Bilinearform bzw. hermitesche Form auf einem endlichdimensionalen K-Vektorraum V . Sei B = (v1 , . . . , vn ) eine Basis von V . Dann sind die Zahlen k := Anzahl der positiven Eigenwerte von MB (Φ) ℓ := Anzahl der negativen Eigenwerte von MB (Φ) unabh¨ angig von der Auswahl der Basis B. Beweis: Nach Antwort 417 existiert eine unit¨ are Matrix S ∈ GL(n, K), so dass D := S −1 · MB (Φ) · S eine reelle Diagonalmatrix ist, deren Diagonaleintr¨ age gerade die Eigenwerte von MB (Φ) sind. Es gen¨ ugt daher, den Satz f¨ ur symmetrische Bilinearformen bzw. hermitesche Formen Φ zu beweisen, deren Strukturmatrix Diagonalform besitzt, f¨ ur die also Φ(vi , vj ) = 0 f¨ ur alle Basisvektoren vi , vj mit i = j gilt. Seien also zwei Basen B1 und B2 gegeben, so dass MB1 (Φ) und MB2 (Φ) Diagonalform besitzen. F¨ ur i = 1, 2 bezeichne ki , ℓi bzw. mi Anzahl der positiven, negativen bzw. verschwindenden Eigenwerte von MBi (Φ). Man betrachte f¨ ur i = 1, 2 die R¨ aume Vi+ := span {v ∈ Bi ; Φ(v, v) > 0} Vi− := span {v ∈ Bi ; Φ(v, v) < 0} Vi0 := span {v ∈ Bi ; Φ(v, v) = 0} .
187
6.7 Selbstadjungierte Endomorphismen
Es gilt V = Vi+ ⊕ Vi− ⊕ Vi0 dim Vi+
dim Vi−
dim Vi0
= ki , = ℓi , ki + ℓi + mi = dim V.
(6.1) = mi
(6.2) (6.3)
Da die Strukturmatrizen MBi Diagonalform haben, erkennt man V10 = V20 = {v ∈ V ; Φ(v, w) = 0 f¨ ur alle w ∈ V }. Die R¨ aume Vi0 sind also basisunabh¨ angig, woraus man m1 = m2 schließt. Weiter gilt V1+ ∩ (V2− ⊕ V20 ) = {0}, wegen Φ(v, v) > 0 f¨ ur v ∈ V1+ ,
Φ(v, v) ≤ 0 f¨ ur v ∈ V2− ⊕ V20 .
Daraus folgt k1 + ℓ2 + m2 ≤ dim V, was wegen k2 + ℓ2 + m2 dann k1 ≤ k2 und anschließend aus Symmetriegr¨ unden k1 = k2 impliziert. Wegen m1 = m2 folgt ℓ1 = ℓ2 , was schließlich den Tr¨ agheitssatz von Sylvester beweist.
7 Anwendungen in der Geometrie Es ist naheliegend, Sachverhalte der Linearen Algebra in geeigneten F¨ allen auch geometrisch zu interpretieren, zumal dann, wenn diese im R2 oder R3 stattfinden. Dies erm¨ oglicht einen fruchtbaren Anschluss an das r¨ aumliche Vorstellungsverm¨ ogen, f¨ uhrt aber zwangsl¨ aufig dazu, dass die prinzipielle Unterscheidung zwischen Punkten auf der einen und Vektoren auf der anderen Seite verwischt wird. In diesem Kapitel wird der Zusammenhang zwischen Geometrie und linearer Algebra von einem systematischeren Standpunkt untersucht.
7.1
Affine R¨ aume
Frage 421 K?
Was versteht man unter einem affinen Raum A u orper ¨ber einem K¨
Antwort: Ein affiner Raum A u ¨ber K besteht aus einer Menge, die wir ebenfalls mit A bezeichnen und deren Elemente Punkte genannt werden, und im Fall A = ∅ aus einem K-Vektorraum VA und einer Zuordnung, die jedem geordneten Paar → (p, q) von Punkten aus A eindeutig einen mit − pq bezeichneten Vektor aus VA so zuordnet, dass folgende Axiome erf¨ ullt sind: (A1) Zu jedem Punkt p ∈ A und jedem Vektor v ∈ VA gibt es genau einen Punkt → q ∈ A mit v = − pq. → → → (A2) F¨ ur alle Punkte p, q, r ∈ A gilt − pq + − qr = − pr. Axiom (i) beinhaltet, dass ein Vektor v ∈ VA jedem Punkt p ∈ A eindeutig einen weiteren Punkt q ∈ A zuordnet. Man kann die Vektoren v ∈ VA daher auch als Abbildungen → v : A −→ A, p −→ q mit v = − pq interpretieren, die den Punkt p in q u uhren. Insbesondere gilt ¨berf¨ − → pq(p) = q
−−−→ und pv(p) = v.
(∗)
→ Geometrisch beschreibt v = − pq eine Translation des affinen Raums A, weswegen wir VA als Translationsraum bezeichnen. Beispiel: Sei V ein Vektorraum und U ⊂ V ein Unterraum. Dann ist f¨ ur jeden Vektor v ∈ V der affine Unterraum A := v + U ⊂ V (vgl. Frage 149) ein affiner Raum im Sinne der obigen Definition, indem man f¨ ur zwei Punkte p = v + u1 ∈ A − → und q = v + u2 ∈ A den Vektor pq durch − → pq = q − p ∈ U
189
7.1 Affine R¨ aume
definiert. Mit VA = U erf¨ ullt die Zuordnung dann die beiden Axiome (A1) und (A2). Damit ist insbesondere auch gezeigt, dass jeder Vektorraum V Anlass zu einem affinen Raum gibt, indem man die Elemente der Menge V als Punkte interpretiert und V zusammen mit seiner Vektorraumstruktur als Translationsraum. Gilt speziell V = K n , so erh¨ alt man daraus den n-dimensionalen affinen Standardraum An (K). Frage 422
Wie ist die Dimension eines affinen Unterraums A erkl¨art?
Antwort: Die Dimension eines affinen Raums A ist gleich der Dimension des A zugeordneten Translationsraums VA . Im Fall A = ∅ setzt man dim A = −1. →=0 Frage 423 Wieso gilt f¨ ur zwei Punkte p, q eines affinen Raums A stets − pp − → − → und qp = −pq? →+− →=− → also − → = 0. Damit folgt wiederum Antwort: Axiom (A2) liefert − pp pp pp, pp − → − → − → − → mit dem zweiten Axiom pq + qp = 0, also qp = −pq. Frage 424 Wie erh¨alt man eine Bijektion zwischen einem affinen Raum A und dessen Translationsraum VA ? Antwort: Man w¨ ahle einen beliebigen Punkt p0 ∈ A und definiere die Abbildung Φ : A −→ VA ,
p −→ − p→ 0 p.
Dann ist Φ injektiv und ferner aufgrund von (A1) surjektiv, also eine Bijektion. VA
A Φ p0
p0
Zeichnet man im affinen Raum einen beliebigen Punkt als Anfangspunkt“ aus, ” dann entsprechen die Punkte aus A also eineindeutig den Vektoren aus VA . Man kann daher VA als Raum der Ortsvektoren von A bez¨ uglich eines Anfangspunkts p0 auffassen. Es gilt also → pq ; p, q ∈ A} = {− p→ VA = {− 0 q ; q ∈ A}, wobei der mittlere Term sich direkt aus der Definition von VA ergibt und der ¨ hintere aufgrund der vorigen Uberlegung.
190
7 Anwendungen in der Geometrie
Frage 425 Was ist ein affiner Unterraum eines affinen Raums A? Wie ist die Dimension eines affinen Unterraums erkl¨art? Wann nennt man einen affinen Unterraum eine affine Gerade, wann eine affine Ebene? Antwort: Eine Teilmenge U ⊂ A heißt affiner Unterraum von A, wenn entweder → pq ; p, q ∈ U } ein linearer Unterraum von VA U = ∅ gilt oder die Menge VU = {− ist. F¨ ur U = ∅ ist dim U = dim VU und f¨ ur U = ∅ setzt man dim U = −1. Affine Unterr¨ aume der Dimension 1 heißen affine Gerade, Unterr¨ aume der Dimension 2 affine Ebene. Frage 426 Sei S ein nichtleeres Systemvon affinen Unterr¨aumen eines affinen Raum A. Ist dann der Durchschnitt D := U ∈S U selbst wieder ein affiner Unterraum?
Antwort: Der Durchschnitt ist selbst ein affiner Unterraum. Im Fall D = ∅ ist dies trivial. Im anderen Fall gen¨ ugt es zu zeigen, dass die Menge → VD := {− pq ; p, q ∈ D} ⊂ V. ein linearer Unterraum von V ist. Dies folgt mit der Antwort zu Frage 98, da VD wegen → {− pq ; p, q ∈ U } = VU VD = U ∈S
ein Durchschnitt linearer Unterr¨ aume ist.
U ∈S
Frage 427 Sei A ein affiner Raum, M ⊂ A eine Teilmenge. Wie ist die affine H¨ ulle von M definiert? Antwort: Die affine H¨ ulle M von M in A (oder auch: der von M erzeugte oder aufgespannte affine Unterraum) ist definiert als der Durchschnitt aller M enthaltenden affinen Unterr¨ aume von A, also M := {U ; M ⊂ U, U Unterraum von A} .
Nach Antwort 426 ist M in der Tat ein affiner Unterraum von A. In informeller Sprechweise l¨ asst sich die affine H¨ ulle von M auch als der kleinste affine Unterraum von A charakterisieren, der alle Punkte aus M enth¨ alt. Die affine H¨ ulle eines Kreises in der affinen reellen Ebene ist z. B. mit dieser Ebene identisch.
Frage 428 Sei S ein System von affinen Unterr¨a umen eines affinen Raums A. Was versteht man dann unter dem Verbindungsraum U ∈S U ?
191
7.1 Affine R¨ aume
Antwort: Der Verbindungsraum Vereinigung U ∈S U , also
U ∈S
U :=
U ∈S
U ist definiert als die affine H¨ ulle der
U ∈S
U
.
Nach Antwort 426 ist U ∈S U ein affiner Unterraum von A, n¨ amlich der kleinste, der alle Punkte aus S enth¨ a lt. Der Verbindungsraum U ∈S U ist der kleinste affine Unterraum von A der alle Unterr¨ aume U ∈ S enth¨ alt. So ist der Verbindungsraum zweier Punkte z. B. eine affine Gerade. F¨ ur den Verbindungsraum endlich vieler Unterr¨ aume U1 , . . . , Uk benutzt man auch die Schreibweise U1 ∨. . .∨Uk , und statt {p}∨{q} schreibt man vereinfachend auch p ∨ q. Frage 429 K¨ onnen Sie zeigen, dass f¨ ur zwei Punkte p, q ∈ A der Verbindungsraum eine affine Gerade ist? → → Antwort: Es ist Vp∨q = {U Unterraum von V ; U ⊃ − pq} = K · − pq. Damit ist p ∨ q ein eindimensionaler affiner Unterraum, also eine affine Gerade. Frage 430 Sei A ein affiner Raum u orper K mit char K = 2 und ¨ber einem K¨ U ⊂ A eine Teilmenge. Dann sind die folgenden beiden Aussagen ¨aquivalent: (i) (ii)
U ist ein affiner Unterraum von A. Zu je zwei verschiedenen Punkten p, q ∈ U gilt p ∨ q ⊂ U .
K¨ onnen Sie das beweisen? → Antwort: (i) ⇐⇒ (ii). Ist U ein affiner Unterraum, so gilt − pq ∈ VU f¨ ur p, q ∈ U , − → also Vp∨q = K pq ⊂ VU nach Frage 429 und folglich p ∨ q ⊂ U . p p∨r
p−0→ p
−→q + p0 − p→ 0p
r′
r p0
q q
p→ VU := {− 0 p ∈ VA ; p ∈ U }.
p−0→ q p∨
(ii) ⇐⇒ (i). Die Idee des Beweises ist in der Abbildung rechts veranschaulicht. Sind p0 , p und q drei Punkte aus U , so liegt nach Voraussetzung der Mittelwert r von p und q ebenfalls in U . Die Gerade p0 ∨ r ist dann nach Voraussetzung ebenfalls in U enthalten und somit auch der Punkt r′ = −→ (− p→ 0 p + p0 q)(p0 ). Formal argumentiert man folgendermaßen. F¨ ur einen festen Punkt p0 ∈ U betrachte man die Menge
192
7 Anwendungen in der Geometrie
Es ist zu zeigen, dass VU ein linearer Teilraum von VA ist. Nach Voraussetzung liegt f¨ ur zwei Punkt p, q ∈ U der Mittelwert“ ”
1− → pq (p) r := 2
→ → → → → → → → in U . Es gilt − pr = 21 − pq und − qr = − qp + − pr = − 12 − pq, also − pr + − qr = 0. Damit erh¨ alt man −→ −→ − → −→ − → −→ −→ −→ − p→ 0 p + p0 q = p0 p + pr + p0 q + qr = p0 r + p0 r = 2p0 r. p+− p→q ∈ V . Ferner gilt f¨ ur α ∈ K und p ∈ U aufgrund von Wegen r ∈ U folgt − p→ 0
0
U
Formel (∗) aus der Antwort zu Frage 421 −−→′ mit p′ = α · − p→ α·− p→ 0 p = p0 p 0 p(p0 ).
Der Punkt p′ liegt auf der Verbindungsgeraden p0 ∨ p und damit nach Voraussetp→ zung in U . Es folgt α · − 0 p ∈ VU . Damit ist insgesamt gezeigt, dass VU ein linearer Unterraum von VA ist, die Behauptung damit vollst¨ andig bewiesen. Frage 431 Seien U, W affine Unterr¨aume. K¨ onnen Sie die folgenden beiden Behauptungen zeigen? (i) (ii)
Im Fall U ∩ W = ∅ gilt
VU ∨W = VU + VW .
Ist U ∩ W = ∅ und sind p ∈ U sowie q ∈ W beliebige fest gew¨ahlte Punkte, so gilt VU ∨W = (VU + VW ) ⊕ Vp∨q .
Antwort: (i) Sei p ∈ U ∩ W fest gew¨ ahlt. Es gilt dann
→ pq ; q ∈ U ∪ W } ⊂ VU ∨W . VU ∪ VW = {−
Da definitionsgem¨ aß VU ∪ VW ⊂ VU + VW gilt, folgt daraus VU + VW ⊂ VU ∨W . Um die umgekehrte Inklusion zu zeigen, betrachte man den affinen Raum → X := {q ; − pq ∈ VU + VW }. Wegen U ⊂ X und W ⊂ X gilt U ∨ W ⊂ X, also VU ∨W ⊂ VX = VU + VW . Daraus folgt die zu zeigende Identit¨ at. (Kurz zusammengefasst ergibt sich diese daraus, dass die Summe linearer Unterr¨ aume und der Verbindungsraum affiner Unterr¨ aume analog definiert sind, n¨ amlich als kleinster linearer (affiner) Unterraum, der die Vereinigung der beiden linearen (affinen) Unterr¨ aume enth¨ alt.)
193
7.1 Affine R¨ aume
(ii) Sei p ∈ U und q ∈ W . Aus p ∨ q ⊂ U ∨ W erh¨ alt man U ∨ W ∨ (p ∨ q) = U ∨ W . Durch zweimalige Anwendung des Ergebnisses von Teil (i) folgt daraus VU ∨W = VU + VW ∨(p∨q) = (VU + VW ) + Vp∨q , → pq und es bleibt zu zeigen, dass die hintere Summe direkt ist. Wegen Vp∨q = K − − → − → gen¨ ugt es, daf¨ ur pq ∈ VU + VW zu beweisen. Angenommen also, es gilt pq ∈ VU + VW , dann gibt es Punkte u ∈ U und w ∈ W mit − → →+− → pq = − pu wq.
Daraus folgt
− →=− →+− → → = 0, uw up pq + − qw
also u = w, im Widerspruch zur Voraussetzung U ∩ W = ∅. Damit ist auch die Gleichung unter (ii) bewiesen. Frage 432 Wie lautet die Dimensionsformel f¨ ur den Verbindungsraum U ∨ W zweier affiner Unterr¨aume U und W ? Antwort: Die Dimensionsformel lautet dim U + dim W − dim(U ∩ W ) dim(U ∨ W ) = dim U + dim W − dim(VU ∩ VW ) + 1
falls U ∩ W = ∅ falls U ∩ W = ∅.
Die Gleichungen folgen zusammen mit der Dimensionsformel f¨ ur Summen von Untervektorr¨ aumen aus der Darstellung von VU ∨W aus Frage 431. Ist U ∩ W = ∅, so gilt demnach dim(U ∨ W ) = dim(VU + VW ) = dim VU + dim VW − dim(VU ∩ VW ) = dim U + dim W − dim(U ∩ W ). Die Formel f¨ ur den anderen Fall beweist man analog. Man beachte dabei aber, dass die Gleichung VU ∩W = VU ∩ VW nur dann gilt, wenn U und W nicht disjunkt sind. Frage 433 (i) (ii)
Welche affine Dimension besitzen im R3 der Verbindungsraum
zweier sich schneidender Geraden? zweier windschiefer Geraden?
Antwort: Die Dimensionsformel liefert die Dimension 1 + 1 − 0 = 2 im ersten und die Dimension 1 + 1 − 0 + 1 = 3 im zweiten. Frage 434 A parallel?
Wann heißen zwei affine Unterr¨aume U und W eines affinen Raumes
194
7 Anwendungen in der Geometrie
Antwort: Die affinen Unterr¨ aume U und W heißen parallel, in Zeichen U W , wenn einer der beiden Translationsr¨ aume im anderen enthalten ist, wenn also VU ⊂ VW oder VW ⊂ VU gilt. Frage 435 K¨ onnen Sie zeigen, dass zwei parallele affine Unterr¨aume U und W entweder punktfremd sind, oder einer ein Unterraum des anderen ist? Antwort: Sei p ∈ U ∩ W . Ohne Beschr¨ ankung der Allgemeinheit kann man → → ur jedes q ∈ U wegen − pq ∈ VU auch − pq ∈ VW , VU ⊂ VW annehmen. Dann gilt f¨ also q ∈ W . Daraus folgt U ⊂ W . Frage 436
Was ist eine Hyperebene eines affinen Raums A?
Antwort: Eine Hyperebene von A ist ein affiner Unterraum von A der Dimension dim A − 1. Typische Beispiele sind Ebenen im R3 oder Geraden im R2 . Frage 437 Sei U ein nichtleerer Unterraum und H eine Hyperebene des affinen Raumes A. Dann sind U und H parallel oder es gilt dim(U ∩H) = dim U −1. K¨ onnen Sie das beweisen? Antwort: Sei U nicht in H enthalten. Dann gilt U ∨ H = A. Im Fall U ∩ H = ∅ folgt dann mit der Dimensionsformel dim(U ∩ H) = dim U + dim H − dim(U ∨ H) = dim U + (n − 1) − n = dim U − 1. Ist jedoch U ∩ H = ∅, dann liefert die Dimensionsformel dim(VU ∩ VH ) = dim U + dim H − dim(U ∨ H) + 1 = dim U + (n − 1) − n + 1 = dim U = dim VU . Es folgt VU ∩ VH = VU , also ist VU ein linearer Unterraum von VH , d. h. U und H sind parallel. Aus diesem Ergebnis folgen nun bekannte geometrische Zusammenh¨ ange: (i)
(ii)
Eine Gerade und eine Hyperebene in einem affinen Raum besitzen genau einen Schnittpunkt oder sind parallel. Insbesondere schneiden sich zwei nicht-parallele Geraden einer affinen Ebene in genau einem Punkt. Die Schnittmenge zweier Hyperebenen in einem affinen Raum der Dimension n ist entweder leer oder ein affiner Unterraum der Dimension n − 2. Insbesondere schneiden sich zwei nicht-parallele Ebenen im dreidimensionalen affinen Raum in einer Geraden.
195
7.2 Affine Abbildungen und Koordinaten
7.2
Affine Abbildungen und Koordinaten
Frage 438 Seien A und B affine R¨aume. Wann heißt eine Abbildung F : A −→ B affin? Was ist eine Affinit¨ at? Antwort: Eine Abbildung F : A −→ B heißt affin, wenn eine lineare Abbildung Fˆ : VA −→ VB zwischen den entsprechenden Translationsvektorr¨ aumen mit der Eigenschaft existiert, dass −−−−−−→ → pq) = F (p)F (q) Fˆ (− f¨ ur alle Punkte p, q ∈ A gilt. Die Abbildung Fˆ ist dann im Fall der Existenz nat¨ urlich eindeutig bestimmt. Man nennt eine affine Abbildung Affininit¨ at, wenn sie bijektiv ist. Frage 439 Wieso ist eine Abbildung F : A −→ B zwischen affinen R¨aumen A und B schon dann affin, wenn ein Punkt p0 ∈ A existiert, so dass die Abbildung Fˆ : VA −→ VB ,
−−−−−−−→ − p→ 0 q −→ F (p0 )F (q),
q∈A
linear wird? → →+− −→ −→ Antwort: Seien p, q ∈ A beliebig. Wegen − pq = − pp p→ 0 0 q = −p0 p + p0 q impliziert die Linearit¨ at von Fˆ −−−−−−−→ −−−−−−−→ −−−−−−→ −→ → ˆ −→ ˆ −→ Fˆ (− pq) = Fˆ (−− p→ 0 p+p0 q) = −F (p0 p)+F (p0 q) = −F (p0 )F (p)+F (p0 )F (q) = F (p)F (q). Damit erf¨ ullt F die Definition einer affinen Abbildung.
Frage 440 Seien A, B affine R¨aume, p ∈ A und p∗ ∈ B beliebig und G : VA −→ VB eine lineare Abbildung. Wieso existiert dann genau eine affine Abbildung F : A −→ B, die F (p) = p∗ und Fˆ = G erf¨ ullt? Mit anderen Worten: eine affine Abbildung ist durch ihre lineare Komponente und die Angabe eines Bildpunktes eindeutig bestimmt. Antwort: Definiert man
−−−−→ → p∗ F (q) = G(− pq),
so ist F (q) f¨ ur jeden Punkt q ∈ A aufgrund von Axiom (A1) eindeutig bestimmt. Ferner ist F nach Frage 439 affin. Frage 441 Wie viele verschiedene Affinit¨aten der affinen Ebene A := A2 (F2 ) u ¨ber dem K¨ orper mit zwei Elementen gibt es? Antwort:
1 0
Die Menge
0 1 , 1 0
GL(2, F2 ) enth¨ alt 6 Elemente, n¨ amlich die Matrizen
1 1 1 1 0 0 1 0 1 , , , , . 1 1 0 1 1 1 1 1 0
196
7 Anwendungen in der Geometrie
Es gibt also sechs bijektive lineare Abbildungen F22 −→ F22 . Jeder dieser Isomorphismen bestimmt zusammen mit der Angabe des Bildpunktes von p0 ∈ A eindeutig eine Affinit¨ at A −→ A. Da A vier Punkte enth¨ alt, gibt es f¨ ur die Auwahl des Bildpunktes 4 M¨ oglichkeiten. Also existieren 4 · 6 = 24 Affinit¨ aten der affinen Ebene u orper mit zwei Elementen. ¨ber dem K¨ Frage 442 K¨ onnen Sie zeigen, dass mit F und G auch F ◦G eine affine Abbildung ˆ zugeordnet ist? ist, der die lineare Abbildung Fˆ ◦ G
Antwort: Es gilt
−− −−−−− −− −−−→ −−−−−−→ − ˆ → F G(p) F G(q) = Fˆ G(p)G(q) = Fˆ G( pq)
ˆ Also ist F ◦ G eine affine Abbildung mit zugeordneter linearer Abbildung Fˆ ◦ G. Frage 443 Sei F : A −→ B eine affine Abbildung und U, W parallele Unterr¨aume von A. Wieso sind dann F (U ) und F (W ) parallele affine Unterr¨aume von B? Antwort: Man kann voraussetzen, dass U und W nicht leer sind, da die Behauptung andernfalls trivial ist. Ohne Beschr¨ ankung der Allgemeinheit sei VU ⊂ VW . Daraus folgt Fˆ (VU ) ⊂ Fˆ (VW ), also F (U ) ⊂ F (W ) und damit U W . Frage 444 Wann heißen drei Punkte p, q, r eines affinen Raumes A kollinear? Wie ist das Teilverh¨altnis TV(p, q, r) dreier kollinearer Punkte p, q, r ∈ A definiert? Was sagt das Teilverh¨altnis u ¨ber die Lagebeziehung der drei Punkte aus? Antwort: Drei Punkte p, q, r ∈ A heißen kollinear, wenn sie auf einer gemeinsamen Geraden liegen. → → Sind p, q, r kollinear, so gilt − pr = α · − pq f¨ ur genau ein α ∈ K. Man nennt α dann das Teilverh¨ altnis der drei Punkte: α = T V (p, q, r). → − pr
→ − pr r
→ − pq
TV(p, q, r) > 1 0 < TV(p, q, r) < 1 TV(p, q, r) < 0
p q
p TV(p, q, r) > 1
r
q
r
q p
→ − pq
→ − pr
→ − pq
0 < TV(p, q, r) < 1
q liegt zwischen p und r r liegt zwischen p und q p liegt zwischen q und r
TV(p, q, r) < 0
TV(p, q, r) = 0 TV(p, q, r) = 1 TV(p, q, r) = ∞
p=r q=r p=q
197
7.2 Affine Abbildungen und Koordinaten
Frage 445 Warum sind mit p, q, r ∈ A auch die Bildpunkte F (p), F (q), F (r) einer affinen Abbildung kollinear und warum gilt TV(p, q, r) = TV(F (p), F (q), F (r))? Antwort: Sind p, q, r kollinear, dann hat der Verbindungsraum U = p ∨ q ∨ r eine Dimension ≤ 1. Daher gilt dim F (U ) = dim Fˆ (VU ) ≤ dim VU = dim U ≤ 1. Die Bildpunkte F (p), F (q), F (r) liegen also in einem Unterraum von mit einer Dimension ≤ 1, d. h., sie sind kollinear. → → → → pr = α · − pq mit α ∈ K, dann folgt Fˆ (− pr) = α · Fˆ (− pq), also Gilt weiter p = q und − −−−−−−→ −−−−−−→ F (p)F (r) = α · F (p)F (q). Das beantwortet den zweiten Teil der Frage. Frage 446 Sei (p0 , p1 , . . . , pn ) eine Basis eines affinen Raums A und B ein weiterer affiner Raum. K¨ onnen Sie zeigen, dass man durch Vorgabe der Bildpunkte F (p0 ), . . . , F (pn ) ∈ B eine eindeutig bestimmte affine Abbildung F : A −→ B erh¨alt? Mit anderen Worten: Sind p∗0 , . . . , p∗n beliebige Punkte aus B, dann existiert genau eine affine Abbildung F : A −→ B mit F (pi ) = p∗i f¨ ur i = 0, . . . , n. − − → − − → Antwort: Da die Vektoren p0 p1 , . . . , p0 pn eine Basis von VA bilden, gibt es genau eine lineare Abbildung Fˆ : VA −→ VB mit −− → ∗→ ∗ Fˆ (− p− 0 pi ) = p 0 pi ,
i = 1, . . . , n.
Nach Frage 440 gibt es dazu genau eine affine Abbildung A −→ B, die F (p0 ) = p∗0 erf¨ ullt, und f¨ ur diese gilt dann notwendigerweise F (pi ) = p∗i f¨ ur 1 ≤ i ≤ n. Frage 447 Wann nennt man ein (n + 1)-Tupel von Punkten (p0 , p1 , . . . , pn ) eines affinen Raums A affin unabh¨ angig? Was ist eine affine Basis? Antwort: Das (n + 1)-Tupel heißt affin unabh¨ angig (eine affine Basis von A), wenn die n Vektoren −−→ − → p− 0 p1 , . . . , p 0 p n linear unabh¨ angig in VA sind (eine Basis von VA bilden).
Frage 448 Wieso h¨angt die affine Unabh¨angigkeit eines (n+1)-Tupels (p0 , . . . , pn ) nicht von der Reihenfolge der Komponenten ab? angig im Sinne von Antwort: Seien das (n + 1)-Tupel (p0 , . . . , pn ) affin unabh¨ Frage 447. Um die Frage zu beantworten gen¨ ugt es zu zeigen, dass dann f¨ ur jedes ℓ ∈ {0, . . . , n} die Vektoren − → −−−−→ −−−−→ −−→ p− ℓ p0 , . . . , pℓ pℓ−1 , pℓ pℓ+1 , . . . , pℓ pn
(∗)
198
7 Anwendungen in der Geometrie
ebenfalls linear unabh¨ angig in VA sind. Gelte also n → αi − p− ℓ pi = 0 i=0 i=ℓ
→ −−→ −−→ mit αi ∈ K. Wegen − p− ℓ pi = pℓ p0 + p0 pi folgt daraus ⎞ ⎛ n n n n ⎟ −→ −−→ −−→ ⎜ → −−→ αi (− p− αi ⎠ − 0= αi p0 pi = αi p0 pi . pℓ p 0 + ℓ p 0 + p0 pi ) = ⎝ i=0 i=ℓ
i=0 i=ℓ
=:αℓ
i=1 i=ℓ
i=1
Man erh¨ alt zun¨ achst αi = 0 f¨ ur i = {1, . . . , n} aufgrund der affinen Unabh¨ angigkeit der Punkte p0 , . . . , pn . Nach der Definition von αℓ ergibt sich dann auch α0 = 0. Die Vektoren in (∗) sind also linear unabh¨ angig. Frage 449 Was versteht man unter einem affinen Koordinatensystem? Was ist ein Koordinatenvektor eines Punktes p ∈ A?
Antwort: W¨ ahlt man in einem affinen Raum A eine Basis (p0 , . . . , pn ) aus, so gibt es nach Frage 440 genau eine Affinit¨ at κ : K n −→ A
mit
κ(0) = p0 , κ(e1 ) = p1 , . . . , κ(en ) = pn .
n
Dabei wird K als affiner Raum mit der zugrundeliegenden Menge K n interpretiert (vgl. Frage 421). Allgemein bezeichnet man eine Affinit¨ at κ : K n −→ A
als ein affines Koordinatensystem. Durch Auswahl eines Koordinatensystems wird es m¨ oglich, Punkte in A durch Koordinaten, also Elementen aus K n zu beschreiben. Setzt man n¨ amlich p0 := κ(O), p1 := κ(ǫ1 ), . . . , pn := κ(ǫn ), so ist (p0 , . . . , pn ) eine affine Basis von A, und das durch κ−1 (p) = (x1 , . . . , xn ) ∈ K n
eindeutig bestimmte n-Tupel nennt man den Koordinatenvektor von p bez¨ uglich der Basis (p0 , . . . , pn ). Die Skalare x1 , . . . , xn heißen die Koordinaten von p bez¨ uglich der entsprechenden Basis. Frage 450
Was ist eine Affinkombination von Punkten p0 , . . . , pm ∈ K n ?
Antwort: Unter einer Affinkombination der Punkte p0 , . . . , pm versteht man eine Linearkombination α0 p0 + α1 p1 + · · · + αm pm mit α0 + α1 + · · · + αm = 1.
199
7.2 Affine Abbildungen und Koordinaten
Frage 451 Wieso ist der Verbindungsraum p0 ∨ p1 ∨ . . . ∨ pm beliebiger Punkte aus K n gleich der Menge der Affinkombinationen von p0 , . . . , pm , also m m n n αi = 1 , αi pi ∈ K ; α0 , . . . , αm ∈ K , p0 ∨ . . . ∨ pm = i=0
i=0
wobei die Skalare α0 , . . . , αm genau dann eindeutig bestimmt sind, wenn p0 , . . . , pm affin unabh¨angig sind? → −−→ p− Antwort: Es ist Vp0 ∨...∨pm = span(− 0 p1 , . . . , p0 pn ). Also gilt p ∈ p0 ∨ . . . ∨ pm genau dann, wenn Skalare α1 , . . . , αm ∈ K existieren mit −−→ −−−→ − p→ 0 p = α1 p0 p1 + · · · + αm p0 pm .
(∗)
In K n l¨ asst sich diese Gleichung auch so schreiben: p − p0 = α1 (p1 − p0 ) + · · · + αm (pm − p0 ). Hieraus folgt p = α0 p0 + α1 p1 + · · · + αm pm
mit α0 := 1 − (α1 + · · · + αm ),
also wie gew¨ unscht α0 + · · · + αm = 1. Sind die Punkte p0 , . . . , pm affin unabh¨ angig, dann auch die Vektoren − − → − − − → p0 p1 , . . . , p0 pm , und somit sind die Koeffizienten in (∗) eindeutig bestimmt. Das beantwortet die Zusatzfrage. Frage 452 Seien A und B affine R¨aume mit den Koordinatensystemen κ1 : K n −→ A und κ2 : K m −→ B. Ferner sei F : A −→ B affin. Dann existiert genau eine Matrix M ∈ K m×n , so dass f¨ ur alle p ∈ A gilt κ−1 F (p) = b + M · κ−1 1 (p), 2 wobei b = κ−1 F (p0 ) mit p0 = κ1 (0) gilt. K¨ onnen Sie das beweisen? 2
Antwort: Sei zun¨ achst A = K n und B = K m und sei x ein beliebiger Punkt aus n K . F¨ ur die zu F geh¨ orende lineare Abbildung Fˆ gilt dann − → − → Fˆ (0x) = M · 0x = A · (x − 0) = A · x. mit einer Matrix M ∈ K m×n . Daraus folgt f¨ ur die affine Abbildung F : K n −→ m K −−−→ −−−→ −−−−−−→ − → F (x) = F (x) − 0 = 0F (x) = 0F (0) + F (0)F (x) = F (0) + Fˆ (0x) = F (0) + M · x.
200
7 Anwendungen in der Geometrie
Also gilt die Behauptung im Fall A = K n und B = K m . Der allgemeine Fall folgt nun aus der Tatsache, dass das Diagramm A
F
κ−1 2
κ−1 1
Kn
/B
F
′
/ Km
kommutiert. Die Abbildung F ′ = k2−1 ◦F ◦k1 ist eine affine Abbildung K n −→ K m . Mit x = F (p) folgt κ−1 F (p) = F ′ (0) + M · κ−1 1 (p), 2 Das ist die Behauptung.
Frage 453 Was versteht man unter einer Kollineation? Ist jede Kollineation eine affine Abbildung? Antwort: Eine Kollineation ist eine bijektive Abbildung f : A −→ B zwischen affinen R¨ aumen A und B, welche Geraden auf Geraden abbildet oder, gleichbedeutend, welche je drei kollineare Punkte aus A auf kollineare Punkte aus B abbildet. Nicht jede Kollineation ist eine affine Abbildung. Als Gegenbeispiel betrachte man in A2 (C) die Abbildung f : C2 −→ C2 ,
(z1 , z2 ) −→ (z1 , z2 ).
F¨ ur jede komplexe Gerade G = (ζ1 , ζ2 )+ C ·(z1 , z2 ) ist f (G) = (ζ1 , ζ2 )+ C ·(z1 , z2 ). Die Abbildung f ist also eine Kollineation. Sie ist aber nicht affin, denn andernfalls m¨ usste die Abbildung fˆ: (z1 , z2 ) −→ (z1 , z2 ) des Vektorraums C2 linear sein, was aber wegen ur α ∈ C \ R fˆ (αz1 , αz2 ) = αfˆ (z1 , z2 ) = αfˆ (αz1 , αz2 ) f¨
nicht zutrifft. Als anderes Gegenbeispiel betrachte man den affinen Raum A3 (F2 ). Da jede Gerade in A3 (F2 ) genau zwei Punkte enth¨ alt, ist jede bijektive Selbstabbildung von A3 (F2 ) eine Kollineation. Davon gibt es 8! = 40 3020 St¨ uck. Andererseits enth¨ alt die Gruppe GL(3, F2 ) genau 7 · 6 · 4 = 168 Elemente, wie man sich leicht u aten von A2 (F2 ). ¨berlegt. Also existieren nur 8 · 168 = 1 344 Affinit¨
7.3 Projektive R¨ aume
7.3
201
Projektive R¨ aume
In der affinen Geometrie wurde der Zusammenhang zwischen geometrischen Objekten und der Struktur der Vektorr¨ aume u ¨ber den Begriff der Parallelverschiebung oder Parallelprojektion hergestellt. Das ist nicht die einzige M¨ oglichkeit, geometrische Sachverhalte mittels linearer Algebra zu beschreiben. Eine weitere wichtige Klasse geometrischer Transformationen bilden Zentralprojektionen, die in aller Regel keine affinen Abbildungen zu sein brauchen. Die projektive Geometrie stellt einen Zusammenhang zwischen den R¨ aume den Geomtrie und den Vektorr¨ aumen der Linearen Algebra in einer solchen Weise her, dass auch Zentralprojektionen u aume ¨ber lineare Abbildungen der zugrunde liegenden Vektorr¨ beschrieben werden k¨ onnen. Ein weiterer Vorteil des projektiven Standpunktes besteht darin, dass l¨ astige Fallunterscheidungen wegfallen, die in der affinen Geometrie vorkommen, da parallele Hyperebenen in affinen R¨ aumen keinen Schnittpunkt besitzen. Dagegen enth¨ alt die projektive Geometrie die Vorstellung, dass sich parallele Geraden in einer Ebene im Unendlichen“ schneiden. ” Frage 454 Sei V ein endlich-dimensionaler Vektorraum u orper K. ¨ber einem K¨ Wie ist der projektive Raum P(V ) definiert? Wie nennt man die Elemente von P(V ) und wie ist die projektive Dimension von P(V ) definiert? Antwort: Der projektive Raum P(V ) ist die Menge der eindimensionalen Unterr¨ aume von V , P(V ) = {U = K · v ; v ∈ V }. Die Elemente von P(V ) werden wiederum Punkte genannt, obwohl es sich dabei im formalen Sinne um Geraden handelt. Die projektive Dimension von P(V ) ist definiert als die Zahl pdim P(V ) := dim V − 1. Frage 455 Wann nennt man eine Teilmenge Up ⊂ P(V ) einen projektiven Unterraum? K¨ onnen Sie die Begriffe (projektive) Gerade, (projektive) Ebene und (projektive) Hyperebene erl¨autern? Antwort: Up ist ein projektiver Unterraum von P(V ), wenn die Menge aller Punkte aus Up ein linearer Unterraum U von V ist, so dass also Up = {Kv ; v ∈ U } gilt. Damit ist Up = P(U ) selbst ein projektiver Raum mit projektiver Dimension. Man nennt Up ⊂ P(V ) eine (projektive) Gerade, wenn pdim Up = 1, (projektive) Ebene, wenn pdim Up = 2, (projektive) Hyperebene, wenn pdim Up = pdim P(V ) − 1 gilt. Aus den entsprechenden S¨ atzen f¨ ur Untervektorr¨ aume erh¨ alt man außerdem unmittelbar
202
7 Anwendungen in der Geometrie
(a)
Der Durchschnitt eines Systems von projektiven Unterr¨ aumen von P(V ) ist selbst ein projektiver Unterraum. Sei S ein System von Unterr¨ aumen von P(V ). Dann ist der Verbindungsraum U := {W Unterraum von P(V ) mit U ⊂ W }
(b)
U ∈S
U ∈S
ein Unterraum von P(V ), undzwar der kleinste, der alle Unterr¨aume aus S enth¨ alt. Es gilt U ∈S U = P( U ∈S U ). Frage 456
Wie lautet die Dimensionsformel f¨ ur projektive Unterr¨aume?
Antwort: Seien U1 , U2 ⊂ P(V ) projektive Unterr¨ aume. Dann lautet die Dimensionsformel pdim(U1 ∨ U2 ) = pdim U1 + pdim U2 − pdim(U1 ∩ U2 ). Wegen pdim U = dim U −1 f¨ ur jeden Unterraum U ⊂ P(V ) folgt diese unmittelbar aus der Dimensionsformel f¨ ur Untervektorr¨ aume aus Frage 124. Frage 457 K¨ onnen Sie den Begriff der homogenen Koordinaten im ndimensionalen projektiven Standardraum Pn (K) := P(K n+1 ) erl¨autern? Antwort: Jeder von 0 verschiedene Vektor v = (x0 , x1 , . . . , xn ) ∈ K n+1 bestimmt genau eine Gerade K · v ⊂ K n+1 . Durch F : v −→ K · v ist also eine Abbildung F : V \ {0} −→ P(V ) gegeben, wobei F (v) = F (v ′ ) genau dann gilt, wenn v ′ ein skalares Vielfaches von v ist. Man definiert (x0 : x1 : . . . : xn ) := K · (x0 , x1 , . . . , xn ) als die homogenen Koordinaten von F (v) ∈ P(V ). Die Komponenten x0 , . . . , xn sind dann bis auf ein skalares Vielfaches λ = 0 eindeutig bestimmt, d. h., es gilt (x0 : x1 : . . . : xn ) = (x′0 : x′1 : . . . : x′n ) f¨ ur ein λ ∈ K ∗ . ⇐⇒ x′0 = λx0 , x′1 = λx1 , . . . , x′n = λxn asst sich daher auch Jeder Punkt p = (x0 : x1 : . . . : xn ) ∈ Pn (K) mit x0 = 0 l¨ in der standardisierten Form (1 : xx01 : . . . : xxn0 ) schreiben. In diesem Fall ist das (n + 1)-Tupel (1, xx10 , . . . , xxn0 ) ∈ K n+1 eindeutig bestimmt. Bezeichnet H ⊂ Pn (K) die Menge aller projektiven Punkte mit x0 = 0 und A die durch x0 = 1 definierte Hyperebene von K n+1 , so hat man damit eine Bijektion.
Pn (K) \ H −→ A,
(x0 : x1 : . . . : xn ) −→ (1, x1 , . . . , xn )
Das Bild eines Punktes p = Kv ∈ Pn (K) entspricht im Fall K = R und n = 2 dem Schnitt der Geraden Kv mit der Hyperebene A.
203
7.3 Projektive R¨ aume
(x0 : x1 : x2 )
(y0 : y1 : y2 )
x0 (1,
x1 x2 , ) x0 x0
(1,
y1 y2 , ) y0 y0
A x2 x1
Allein f¨ ur die Elemente aus H ist diese Abbildung nicht definiert, da diese und nur diese keinen Schnittpunkt mit A besitzen. F¨ ugt man zu A zu jedem Punkt aus H, also zu jeder Geradenrichtung des durch x0 = 0 gegebenen linearen Unterraums von K n+1 , genau ein Element hinzu, so l¨ asst sich A zusammen mit diesen unendlich fernen Punkten“ mit dem projektiven Raum Pn (K) identifizieren. ” Frage 458 Seien p1 , p2 zwei verschiedene Punkte aus Pn (K). K¨ onnen Sie zeigen, dass die Gerade g durch p1 und p2 sich in homogenen Koordinaten durch die Gleichung g:
q = λp1 + μp2
mit
(λ : μ) ∈ P2 (K)
darstellen l¨asst? Antwort: Sei p1 = K ·v1 und p2 = K ·v2 mit Vektoren v1 , v2 ∈ K n+1 . Die Gerade g ist die Menge aller eindimensionalen Unterr¨ aume des durch die Vektoren v1 und v2 aufgespannten zweidimensionalen Unterraums von K n+1 . Es gilt also g: Daraus folgt (∗).
q = K · (λv1 + μv2 ),
(λ, μ) = (0, 0).
Frage 459 Wieso besitzen je zwei verschiedene Geraden in einer projektiven Ebene genau einen Schnittpunkt? Antwort: F¨ ur zwei verschiedene Geraden U1 , U2 in einer projektiven Ebene P(V ) gilt U1 ∨ U2 = P(V ). Wegen pdim Ui = 1 f¨ ur i = 1, 2 und pdim P(V ) = 2 folgt aus der Dimensionsformel pdim(U1 ∩ U2 ) = 0. Also existiert genau ein Schnittpunkt.
204
7 Anwendungen in der Geometrie
Frage 460 Sei H eine Hyperebene eines n-dimensionalen projektiven Raumes P(V ). K¨onnen Sie zeigen, dass A := P(V ) \ H dann ein affiner Raum ist?
ur ein v0 ∈ V \ UH Antwort: Es ist H = P(UH ) mit einer Hyperebene UH ⊂ V . F¨ betrachte man die Menge A′ = v0 + UH .
Dies ist ein affiner Unterraum von V . Wegen v0 ∈ UH ist f¨ ur jeden Vektor v ∈ A′ die Gerade K · v ein Element aus A. Man hat damit eine Abbildung σ : A′ −→ A,
v −→ K · v.
Diese Abbildung ist bijektiv, da jede Gerade aus A die Hyperebene A′ ⊂ V in genau einem Punkt schneidet. Kv = σ(v) ∈ A
v0
v
A′ UH
Definiert man f¨ ur p, q ∈ A nun
−−−−−−−−−→ − → pq := σ −1 (p)σ −1 (q) = σ −1 (q) − σ −1 (p) ∈ UH ,
so ist leicht zu sehen, dass A zusammen mit dieser Zuordnung die Axiome eines affinen Raums aus Antwort 421 erf¨ ullt, wobei der zugeh¨ orige Translationsraum in diesem Fall UH ist. Das beantwortet die Frage. Frage 461 Sei P(V ) ein projektiver Raum, H ⊂ P(V ) eine Hyperebene und A = P(V ) \ H der zur Hyperebene H geh¨orende afffine Raum. K¨onnen Sie zeigen, dass zu jedem affinen Unterraum U ⊂ A genau ein projektiver Unterraum Up ⊂ P(V ) existiert, so dass U = A ∩ Up gilt?
Antwort: Man benutze die Affinit¨ at σ : A′ −→ A aus Frage 460 und betrachte ′ −1 ′ den Unterraum U := σ (U ) ⊂ A . Es gilt dann U ′ = v0 + VU mit einem Unterraum VU ⊂ VH . Da v0 nicht in VU enthalten ist, ist die Summe W := Kv0 ⊕ VU ⊂ V
205
7.3 Projektive R¨ aume
in der Tat direkt. Die Menge P(W ) ist ein projektiver Unterraum von P(V ) mit
P(W ) = {Kv ; v = αv0 + u, α ∈ K, u ∈ VU }. Ferner gilt A = {Kv ; v = v0 + u, u ∈ VH } U = {Kv ; v = v0 + u, u ∈ VU }.
(∗) (∗∗)
Hieraus folgt U = P(W ) ∩ A. Das beweist die Existenzbehauptung. Ist W ∗ ⊂ V ein weiterer Unterraum mit U = P(W ∗ ) ∩ A, dann implizieren (∗) und (∗∗) zusammen mit der Vektorraumeigenschaft von W ∗ , dass W ∗ = Kv0 +VU , also W ∗ = W gilt. Frage 462 Sei H eine Hyperebene eines projektiven Raumes P(V ), A := P(V )\H der zugeh¨ orige affine Raum und U ⊂ A ein affiner Unterraum. Was versteht man unter dem projektiven Abschluss von U ? Antwort: Der projektive Abschluss U ist der nach Frage 461 eindeutig bestimmte projektive Unterraum von P(V ), f¨ ur den U =U ∩A gilt. Man u ¨berzeuge sich, indem man den Beweis aus Antwort 461 nachvollzieht, dass man U erh¨ alt, indem man zu den Geradenrichtungen aus U diejenigen des Vektorraums VU hinzuf¨ ugt. Dies sind aus der Perspektive von U genau die un” endlich fernen“ Punkte. Frage 463 Sei U1 eine affine Hyperebene des affinen Raums A = P(V ) \ H und U2 ein weiterer echter Teilraum von A, f¨ ur den U2 ⊂ U1 gilt. K¨ onnen Sie zeigen, dass U1 und U2 genau dann parallel sind, wenn U 1 ∩ U 2 ⊂ H gilt?
Antwort: Man betrachte f¨ ur i = 1, 2 wieder die affinen Hyperebenen Ui′ = σ(U1 ) = vi + VUi . ur i = 1, 2. Ferner hat man Wegen Ui ⊂ H gilt VUi ⊂ VH f¨ U i = {Kv ; v = αvi + ui , α ∈ K, ui ∈ Ui }.
Seien U1 und U2 nun parallel. Da U1 eine Hyperebene ist, gilt dann VU2 ⊆ VU1 (mit Gleichheitszeichen, falls U1 auch eine Hyperebene von A ist). Ferner gilt v1 = v2 , da U2 nach Voraussetzung nicht in U1 enthalten ist. Daraus folgt U 1 ∩ U 2 = {Kv ; v ∈ VU1 ∩ VU2 } = {Kv ; v ∈ VU1 } ⊂ H. Gilt umgekehrt U 1 ∩ U 2 ⊂ H, dann folgt U1 ∩ U2 = ∅ wegen v1 = v2 , und da U1 eine Hyperebene und U2 ein Unterraum von A ist, sind U1 und U2 parallel nach Frage 434.
206
7.4
7 Anwendungen in der Geometrie
Projektive Abbildungen und Koordinaten
Es ist naheliegend, in Analogie zu den affinen Abbildungen auch projektive Abbildungen f : P(V ) −→ P(W ) mittels der Existenz von linearen Abbildungen F : V −→ W der zugrunde liegenden Vektorr¨ aume zu definieren. Allerdings muss dabei zus¨ atzlich gefordert werden, dass durch F Geraden aus V auf Geraden aus W abgebildet werden. Dies ist nur f¨ ur injektive lineare Abbildungen der Fall. Nach demselben Prinzip wie bei Vektorr¨ aumen und affinen R¨ aumen erm¨ oglichen bijektive projektive Abbildungen die Einf¨ uhrung von Koordinaten in einem projektiven Raum. Frage 464 Wann heißt eine Abbildung f : P(V ) −→ P(W ) projektiv? Wie nennt man eine bijektive projektive Abbildung? Antwort: Eine Abbildung f : P(V ) −→ P(W ) heißt projektiv, wenn eine injektive lineare Abbildung F : V −→ W existiert, so dass f (K · v) = K · F (v) f¨ ur alle v ∈ V \ {0} gilt. Man benutzt in diesem Fall die Schreibweise f = P(F ). Eine bijektive projektive Abbildung nennt man Projektivit¨ at. Frage 465 K¨ onnen Sie zeigen, dass die zu einer projektiven Abbildung geh¨ orende lineare Abbildung nur bis auf einen skalaren Faktor eindeutig bestimmt ist, d. h. f¨ ur ′ ′ zwei injektive lineare Abbildungen F, F : V −→ W ist P(F ) = P(F ) genau dann, wenn F ′ = α · F f¨ ur ein α ∈ K gilt. ur jedes v ∈ V Antwort: Hat man P(F ) = P(F ′ ), so gilt f¨ K · F ′ (v) = K · F (v),
also
F ′ (v) = αv · F ′ (v)
mit einem αv ∈ K. Es muss gezeigt werden, dass αv f¨ ur jeden v ∈ V gleich ist. Aufgrund der Linearit¨ at von F und F ′ gilt F ′ (v + w) = αv · F (v) + αw · F (w) sowie mit α := αv+w
F ′ (v + w) = α · F (v) + F (w) .
Die beiden Gleichungen f¨ uhren zusammen auf
(αv − α) · F (v) + (αw − α) · F (w) = 0.
7.4 Projektive Abbildungen und Koordinaten
207
Wegen der Injektivit¨ at von F sind auch die Vektoren F (v) und F (w) linear unabh¨angig in W . Aus der letzten Gleichung folgt daher αv = α = αw , was zu zeigen war. Die andere Richtung des Beweises ist einfach: Aus F ′ = α · F folgt K · F (v) = ur jedes v ∈ V , also P(F ) = P(F ′ ). K · F ′ (v) f¨ Frage 466 Wann heißt ein (r + 1)-Tupel (p0 , . . . , pr ) von Punkten eines projektiven Raumes P(V ) projektiv unabh¨ angig? Antwort: Die r + 1 Punkte heißen projektiv unabh¨ angig, wenn die zugeh¨ origen eindimensionalen Unterr¨ aume in V paarweise verschieden sind, d. h. wenn jedes r+ ur das pi = Kvi gilt, linear unabh¨ angig 1-Tupel (v0 , . . . , vr ) von Vektoren aus V , f¨ in V ist. ¨ Aquivalent hierzu ist die nur scheinbar schw¨ achere Voraussetzung, dass ein einziges linear unabh¨ angiges System (w0 , . . . , wr ) von Vektoren aus V existiert, so ¨ dass pi = Kwi gilt. Die Aquivalenz ist klar, da jeder Vektor vi mit pi = Kvi dann ein skalares Vielfaches von wi sein muss. Frage 467 Was ist eine projektive Basis eines n-dimensionalen projektiven Raumes P(V )? Antwort: Eine projektive Basis in P(V ) ist ein (n + 2)-Tupel (p0 , . . . , pn+1 ) von Punkten aus P(V ) mit der Eigenschaft, dass je (n + 1) Punkte davon projektiv unabh¨ angig sind. Im Raum Pn (K) ist zum Beispiel mit p0 := (1 : 0 : . . . : 0) p1 := (0 : 1 : . . . : 0) .. .. . . pn := (0 : 0 : . . . : 1) pn+1 := (1 : 1 : . . . : 1) eine projektive Basis gegeben.
Frage 468 Sei (p0 , . . . , pn+1 ) eine Basis von P(V ). Dann gibt es eine Basis (v0 , . . . , vn ) mit pi = Kvi f¨ ur i = 0, . . . , n. K¨ onnen Sie zeigen, dass sich die Vektoren vi so w¨ahlen lassen, dass pn+1 = K · (v0 + · · · + vn ) gilt?
208
7 Anwendungen in der Geometrie
Antwort: Zun¨ achst gilt pn+1 = K · (α0 v0 + · · · + αn vn )
(∗)
mit geeigneten αi ∈ K. Es gen¨ ugt nun zu zeigen, dass αi = 0 f¨ ur alle i = 0, . . . , n gilt, denn in diesem Fall hat man mit (α0 v0 , . . . , αn vn ) eine Basis von V mit den gesuchten Eigenschaften. Sei dazu pn+1 = Kv mit einem Vektor v ∈ V . W¨ are αℓ = 0 f¨ ur ein ℓ ∈ {0, . . . , n}, dann w¨ are das (n + 1)-Tupel (v0 , . . . , vℓ−1 , v, vℓ+1 , . . . , vn ) wegen (∗) linear abh¨ angig in V und damit (p0 , . . . , pn+1 ) keine Basis von P(V ). Frage 469 Seien P(V ) und P(W ) projektive R¨aume derselben Dimension mit Basen (p0 , . . . , pn+1 ) und (q0 , . . . , qn+1 ). Wieso gibt es dann genau eine Projektivit¨at f : P(V ) −→ P(W ) mit f (pi ) = qi f¨ ur i = 0, . . . , n + 1?
Antwort: Entsprechend der Antwort zu Frage 468 w¨ ahle man Basen (v0 , . . . , vn ) von V und (w0 , . . . , wn ) so, dass pn+1 = K · (v0 + · · · + vn ) und qn+1 = K · (w0 + · · · w0 ) gilt. Definiert man f¨ ur i = 0, . . . , n die lineare Abbildung F : V −→ W durch F (vi ) = wi , dann gilt mit f := P(F ) f (pi ) = qi
f¨ ur i = 0, . . . , n + 1.
(∗)
Das zeigt die Existenzbehauptung. Ist f eine weitere Abbildung, die die Basispunkte wie in (∗) aufeinander abbildet, dann gilt f¨ ur die lineare Abbildung F : V −→ W mit f = P(F) F(v0 ) = α0 w0 , . . . , F(vn ) = αn wn
mit bestimmten αi ∈ K sowie
F(v0 + · · · + vn ) = α · (w0 + · · · + wn ).
mit einem bestimmten α ∈ K. Aus den letzten beiden Gleichungen zusammen folgt zusammen mit der Linearit¨ at von F (α0 − α) · w0 + · · · + (αn − α) · wn = 0.
Daraus folgt αi = α f¨ ur alle i = 1, . . . , n aufgrund der linearen Unabh¨ angigkeit der wi . Also gilt F = α · F , also f = f . Das zeigt die Eindeutigkeit. Frage 470 Wieso besitzt jede Projektivit¨at einer reell-projektiven Ebene mindestens einen Fixpunkt und eine Fixgerade?
7.4 Projektive Abbildungen und Koordinaten
209
Antwort: Sei F eine lineare Abbildung mit f = F (P). Dann ist F ein Endomorphismus R3 −→ R3 und besitzt mindestens einen reellen Eigenwert λ und einen F -invarianten Unterraum U der Dimension 2. Die Unterr¨ aume Eig(F, λ) und U bestimmen dann F -invariante Unterr¨ aume von P2 (R) der Dimension 0 bzw. 1. Frage 471 Was versteht man unter einem Koordinatensystem in einem ndimensionalen projektiven Raum P(V )? Antwort: Unter einem Koordinatensystem in P(V ) versteht man eine Projektivit¨ at κ : Pn (K) −→ P(V ). Mit Hilfe der in Pn (K) gegebenen homogenen Koordinaten auch lassen sich damit in P(V ) homogene Koordinaten einf¨ uhren. Gilt p = κ (x0 : . . . : xn ) , so heißt (x0 : . . . : xn ) homogener Koordinatenvektor von p bez¨ uglich κ. Man beachte, dass dieser nur bis auf einen Skalar α = 0 eindeutig bestimmt ist. Frage 472 Wie lassen sich mithilfe eines Koordinatensystems homogene Koordinaten in P(V ) einf¨ uhren und Projektivit¨aten durch eine Matrix beschreiben? at, so entAntwort: Ist zun¨ achst f : Pn (K) −→ Pn (K) eine Projektivit¨ spricht dem ein bis auf eine Konstante eindeutig bestimmter Isomorphismus F : K n+1 −→ K n+1 , der sich durch eine Matrix ⎛ ⎞ a00 a01 · · · a0n ⎜a ⎟ ⎜ 10 a11 · · · a1n ⎟ A=⎜ ⎟ ⎝· · · ···⎠ an0 an1 · · · ann
beschreiben l¨ asst. F¨ ur einen Vektor x = (x0 , . . . , xn ) gilt dann F (x) = Ax = (z0 · x, . . . , zn · x),
wobei z0 , . . . , zn die Zeilen von A bezeichnen. Entsprechend erh¨ alt man f¨ ur einen Punkt p ∈ Pn (K) mit den homogenen Koordinaten (x0 : . . . : xn ) die homogenen Koordinaten des Bildes f (p) durch f (p) = (z0 · x : . . . : zn · x), also durch formale Matrizenoperationen, wobei wiederum zu beachten ist, dass die homogenen Komponenten von f (p) nur bis auf einen skalaren Faktor eindeutig festgelegt sind. Das Gleiche gilt auch f¨ ur die Eintr¨ age der Matrix A.
210
7 Anwendungen in der Geometrie
Mithilfe eines Koordinatensystems lassen sich damit auch Projektivit¨ aten P(V ) −→ P(W ) beliebiger projektiver R¨aume derselben Dimension beschreiben. Dazu braucht man nur die Kommutativit¨ at des Diagramms
P(V )
f
/ P(W ) κ−1 2
κ−1 1
Pn (K)
f
′
/ Pn (K).
auszunutzen. Die der Projektivit¨ at f bez¨ uglich der Koordinatensysteme κ1 und κ2 zugeordnete Matrix ist dann die Matrix der Projektivit¨ at f ′ . Diese h¨ angt nat¨ urlich von den gew¨ ahlten Koordinatensystemen ab. Frage 473 Eine Matrix A ∈ K (n+1)×(n+1) beschreibt genau dann eine affine n Abbildung K −→ K n , wenn A die Gestalt ⎞ ⎛ a00 0 ··· 0 ⎟ ⎜a ⎜ 10 a11 · · · a1n ⎟ A=⎜ ⎟ ⎝· · · ···⎠ an0 an1 · · · ann besitzt. K¨ onnen Sie das aus der Perspektive projektiver Abbildungen begr¨ unden? Antwort: Der affine Raum K n ist mittels der Abbildung (x1 , . . . , xn ) −→ (1 : x1 : . . . : xn ) at f : Pn (K) −→ Pn (K) l¨ asst sich daher in Pn (K) eingebettet. Eine Projektivit¨ genau dann zu einer affinen Abbildung K n −→ K n beschr¨ anken, wenn f die Hyperebene H := {(x0 : . . . : xn ) ∈ Pn (K) ; x0 = 0} in sich abbildet. Wird f durch die Matrix ⎛ a00 a01 · · · ⎜a ⎜ 10 a11 · · · A=⎜ ⎝· · · an0 an1 · · ·
⎞ a0n ⎟ a1n ⎟ ⎟ ···⎠ ann
beschrieben, so bedeutet f (H) = H gerade, dass a01 = · · · = a0n = 0 gilt.
Frage 474 Sei P(V ) ein projektiver Raum der projektiven Dimension n. Die Hyperebene L ⊂ P(V ) werde durch die Perspektivit¨at“ π von einem Zentrum z außerhalb ” von L und M auf die Hyperebene M ⊂ P(V ) projiziert, so wie es in der Abbildung skizziert ist. K¨ onnen Sie zeigen, dass π eine Projektivit¨at L −→ M ist?
211
7.5 Invarianten von Projektivit¨ aten
Antwort: Sei (p1 , . . . , pn ) eine projektive Basis von M . Wegen z = M ist b dann (z, p1 , . . . , pn ) eine projektive Basis von P(V ). Mit dem Koordinatensystem a κ : Pn (K) −→ P(V ), das die Standardbasis von Pn (K) auf die Basis (z, p1 , . . . , pn ) abz bildet, gilt dann κ−1 (z) = (1 : 0 : . . . : 0), und M wird bez¨ uglich κ durch die Gleiπ(a) chung x0 = 0 beschrieben. Schreibt man π(b) −1 −1 ˆ := κ (M ) und L ˆ := κ (L) so l¨ M asst sich die Situation u ¨bersichtlich in dem kommutativen Diagramm ˆ L
f
κ
L
L
M
/M ˆ = {(x0 : . . . : xn ) ; x0 = 0} κ
π
/M
darstellen. F¨ ur das Weitere gen¨ ugt es zu zeigen, dass f eine Projektivit¨ at ist. ˆ Die Gerade durch pˆ und Sei pˆ = (ξ0 : ξ1 : ξ2 ) ein belieber Punkt aus L. zˆ := κ−1 (z) besitzt dann nach Frage 458 die Gleichung λˆ p + μˆ z = λ(ξ0 : ξ1 : ξ2 ) + μ(1 : 0 : 0) mit (λ : μ) ∈ P2 (K). ˆ im Punkt (0 : x1 : . . . : xn ). Folglich gilt Die Gerade schneidet M ˆ −→ M ˆ, f: L
(x0 : x1 : . . . : xn ) −→ (0 : x1 : . . . : xn ).
ˆ und M ˆ geh¨ Man betrachte nun die zu L orenden Hyperebenen Lˆ und Mˆ in K n+1 sowie die lineare Abbildung F : Lˆ −→ Mˆ,
(x0 , x1 , . . . , xn ) −→ (0, x1 , . . . , xn ).
Aus x ∈ ker F folgt x = (λ, 0, . . . , 0) mit einem λ ∈ K. W¨ are λ = 0, so w¨ urde zˆ = ˆ und damit im Widerspruch zur Voraussetzung z ∈ L folgen. (1 : 0 : . . . : 0) ∈ L Folglich gilt ker F = {0}, d. h., F ist injektiv und damit aus Dimensionsgr¨ unden auch bijektiv. Man erkennt nun f = P(F ), woraus schließlich folgt, dass f und damit auch π eine Projektivit¨at ist.
7.5
Invarianten von Projektivit¨ aten
Frage 475 In Abschnitt 7.3 hatten wir gesehen, dass affine Abbildungen das Teilverh¨altnis dreier Punkte invariant lassen. Gilt dies f¨ ur projektive Abbildungen auch?
212
7 Anwendungen in der Geometrie
Antwort: Projektive Abbildungen erhalten das Teilverh¨ altnis in der Regel nicht, wie man an der Zentralprojektion, die in der Abbildung rechts dargestellt ist, sehen kann. f (p1 ) TV (f (p0 ), f (p1 ), f (p)) < 1
f (p) Z
p0 = f (p0 )
p1
p
TV(p0 , p1 , p) > 1
Dagegen erhalten projektive Abbildungen ein bestimmtes Verh¨ altnis von vier kollinearen Punkten, das sogenannte Doppelverh¨ altnis. Dieses l¨ asst sich folgendermaßen einf¨ uhren. Seien p0 , p1 und p2 drei kollineare, paarweise verschiedene Punkte eines projektiven Raumes P(V ). Dann bildet (p0 , p1 , p2 ) eine Basis der gemeinsamen projektiven Geraden Z, folglich gibt es ein Koordinatensystem κ : P1 (K) −→ Z mit κ(1 : 0) = p0 ,
κ(0 : 1) = p1 ,
κ(1 : 1) = p2 .
Jeder Punkt p der Geraden Z besitzt dann bez¨ uglich dieses Koordinatensystems bestimmte homogene Koordiaten κ−1 (p) = (λ : μ) mit λ, μ ∈ K. Man definiert nun DV(p0 , p1 , p2 , p) = λ : μ ∈ K ∪ {∞} ≃ P1 (K)
Ist μ = 0 (d. h. p = p0 ), dann ist DV(p0 , p1 , p2 , p) ein Element aus K, andernfalls ist DV (p0 , p1 , p2 , p) = ∞.
Wir zeigen, dass das Doppelverh¨ altnis eine projektive Invariante ist. Sei f : P(V ) −→ P(W ) eine Projektivit¨at. f bildet die Gerade Z ∈ P(V ) auf eine Gerade Z ′ ∈ P(W ) ab. F¨ ur die Abbildung κ′ := f |Z ◦ κ gilt dann κ′ (1 : 0) = f (p0 ), κ′ (0 : 1) = f (p1 ) und κ′ (1 : 1) = f (p2 ). Damit ist κ′ ein Koordinatensystem von Z ′ . Aus κ(λ : μ) = p folgt κ′ (λ : μ) = f (p), also DV(p0 , p1 , p2 , p) = λ : μ = DV(f (p0 ), f (p1 ), f (p2 ), f (p)), was zu zeigen war.
Frage 476 Kennen Sie eine Formel, mit der sich das Doppelverh¨altnis von vier kollinearen Punkten des projektiven Raums Pn (K) explizit berechnen l¨asst?
213
7.5 Invarianten von Projektivit¨ aten
Antwort: Es gilt: Seien die Punkte (k)
(k)
pk = (x0 : x1 : . . . : x(k) n ),
k = 0, 1, 2, 3.
kollinear. Sind i, j ∈ {1, . . . , n} zwei Indizes derart, dass die Punkte (0)
(xi
(0)
(1)
: xj ), (xi
(1)
(2)
: xj ), (xi
(2)
: xj ) ∈ P1 (K)
definiert (was heißt, dass nicht beide Komponenten verschwinden) und paarweise verschieden sind, dann gilt x(3) x(1) x(2) x(1) i i i i (2) (3) (1) (1) xj xi xi xj : . (∗) DV(p0 , p1 , p2 , p3 ) = x(3) x(0) x(2) x(0) i i i i (3) (2) (0) (0) xj xi xj xi
Beweis: Man betrachte zun¨ achst den Spezialfall n = 1 und berechne die Darstellungsmatrix A des Koordinatensystems κ : P1 (K) −→ P1 (K), das die projektive Standardbasis von P1 (K) auf die Punkte p0 , p2 und p3 abbildet. Wegen κ(1 : 0) = (λ0 : μ0 ) und κ(0 : 1) = (λ1 : μ1 ) gilt
αλ0 α′ λ1 A= αμ0 α′ μ1 mit frei w¨ ahlbaren Skalaren α, α′ ∈ K ∗ . Die Forderung κ(1 : 1) = (λ2 : μ2 ) f¨ uhrt anschließend auf das Gleichungssystem αλ0 + α′ λ1 = α′′ λ2 αμ0 + α′ μ1 = α′′ μ2 mit frei w¨ ahlbarem α′′ ∈ K ∗ . Mithilfe der Cramer’schen Formel aus Frage 262 lassen sich die Werte α, α′ in Abh¨ angigkeit von α′′ berechnen. Dies liefert α′′ λ λ λ α′′ λ 0 2 1 2 ′′ α μ2 μ1 μ0 α′′ μ2 ′ , . α= α = λ λ λ λ 0 0 1 1 μ0 μ1 μ0 μ1
214
7 Anwendungen in der Geometrie
λ λ 0 1 W¨ ahlt man speziell α = , so erh¨alt man also μ0 μ1 ′′
⎛
⎜ ⎜ A=⎜ ⎜ ⎝
λ 2 λ0 μ2 λ 2 μ0 μ2
λ λ1 0 λ1 μ0 μ1 λ λ1 0 μ1 μ0 μ1
λ2 μ2 λ2 μ2
⎞
⎟ ⎟ ⎟. ⎟ ⎠
Mit der Formel zur Berechnung der Inversen einer Matrix folgt ⎛ λ λ ⎞ λ λ 0 0 2 2 ⎜ μ1 μ μ −λ1 μ μ ⎟ 0 2 ⎟ 0 2 ⎜ 1 ⎜ ⎟. A−1 = ⎜ λ λ ⎟ λ λ det A ⎝ 2 2 1 ⎠ 1 λ0 −μ0 μ2 μ1 μ2 μ1
Die Koordinaten des Punktes p bez¨ uglich κ berechnen sich damit zu
λ λ λ λ λ λ λ 2 3 1 0 2 0 3 κ−1 (p) = det A · A−1 (λ3 : μ3 )T = · : · μ3 μ1 μ0 μ2 μ0 μ3 μ2 Es folgt
λ 3 μ3 DV(p0 , p1 , p2 , p) = λ 3 μ3
λ1 λ2 μ1 μ2 : λ0 λ2 μ0 μ2
λ1 μ1 . λ0 μ0
λ1 . μ1
Das ist die Formel (∗) f¨ ur den Fall n = 1. Um den allgemeinen Fall darauf zur¨ uckzuf¨ uhren, betrachten wir eine geeignete Projektivit¨ at Pn (K) −→ P1 (K), die ja nach Frage 475 das Doppelverh¨ altnis invariant l¨ asst. Ist Z die von den drei Punkten p0 , p2 , p3 ∈ Pn (K) aufgespannte Gerade, so w¨ ahle man zwei verschiedene Indizes i, j ∈ {0, . . . , n} derart, dass f¨ ur alle Punkte (x0 : . . . : xi : . . . : xj : . . . : xn ) ∈ Z gilt (xi , xj ) = (0, 0)
und
(xi : xj ) = const
f¨ ur alle p ∈ Z.
In jedem Fall existiert mindestens ein Indexpaar (i, j) mit diesen Eigenschaften. Dies erkennt man sofort, wenn man die Z entsprechende Hyperebene in K n+1 betrachtet. Die Abbildung f : Z −→ P1 (K),
(x0 : . . . , xi : . . . : xj : . . . xn ) −→ (xi : xj )
215
7.5 Invarianten von Projektivit¨ aten
ist unter dieser Voraussetzung eine Projektivit¨ at. Nach Frage 475 gilt DV(p0 , p1 , p2 , p) = DV f (p0 ), f (p1 ), f (p2 ), f (p) .
Um DV(p0 , p1 , p2 , p) zu berechnen, gen¨ ugt es daher, zwei geeignete Koordinaten auszuw¨ ahlen und in die Formel (∗) einzusetzen. Aufgrund der Invarianz des Doppelverh¨ altnisses liefert jede Auswahl geeigneter Koordinatenpaare, die die Eigenschaft (∗∗) erf¨ ullen, dasselbe Ergebnis. Frage 477
Wie lautet der Satz von Desargues? K¨ onnen Sie ihn beweisen?
Antwort: Der Satz von Desargues lautet: In der projektiven Ebene P2 (K) sei ein Dreieck mit den Eckpunkten p1 , p2 und p3 gegeben. Ein weiteres Dreieck mit den Eckpunkten p′1 , p′2 , p′3 sei das Bild des ersten Dreiecks unter einer Perspektivit¨ at mit Zentrum z. Dann sind die Schnittpunkte q1 := (p1 ∨ p2 ) ∩ (p′1 ∨ p′2 ) q2 := (p2 ∨ p3 ) ∩ (p′2 ∨ p′3 ) q3 := (p3 ∨ p1 ) ∩ (p′3 ∨ p′1 ) der durch die entsprechenden Seiten der beiden Dreiecke verlaufenden Geraden kollinear. q3
p′1
q2 p′2 p3 p1
p′3
z
q1 p2
Beweis: Man w¨ ahle f¨ ur i = 1, 2, 3 Vektoren v, vi , vi′ ∈ K 3 mit z = K · v,
pi = K · vi ,
p′i = K · vi′
Da die Punkte z, pi , p′i kollinear sind, kann man zus¨ atzlich v = v1 − v1′ = v2 − v2′ = v3 − v3′ , also v1 − v2 = v1′ − v2′ ,
v2 − v3 = v2′ − v3′ ,
v3 − v1 = v3′ − v1′
216
7 Anwendungen in der Geometrie
annehmen. Somit gilt q1 = K · (v1 − v2 ), q2 = K · (v2 − v3 ) und q3 = K · (v3 − v1 ). Die drei Vektoren sind aber wegen (v1 − v2 ) + (v2 − v3 ) + (v3 − v1 ) = 0 linear abh¨ angig. Folglich sind die Punkte q1 , q2 und q3 kollinear. Das beweist den Satz. Frage 478 K¨ onnen Sie den Satz von Desargues beweisen, indem sie aus Pn (2) eine geeignete Hyperebene entfernen und die gesuchten Eigenschaften anhand der enthaltenen affinen Konstellation nachweisen? Antwort: Sei A der affine Raum, den man aus P2 (R) durch Herausnahme der Geraden q1 ∨q2 erh¨ alt, so dass also q1 ∨q2 aus der Sicht von A die unendlich ferne“ ” Gerade ist. Da die Punkte q1 und q2 auf dieser Geraden liegen, sind die affinen Anteile der Geraden p1 ∨ p2 und p′1 ∨ p′2 und die affinen Anteile der Geraden p2 ∨ p3 und p′2 ∨ p′3 jeweils parallel in A. Die affine Konstellation besitzt also folgende Gestalt. p′2
p′1
p3 p′3
Z
p1
p2
Um zu beweisen, dass q3 ebenfalls auf der unendlich fernen Geraden q1 ∨ q2 liegt, gen¨ ugt es nun zu zeigen, dass die Geraden p1 ∨ p3 und p′1 ∨ p′3 ebenfalls parallel sind. Das aber ergibt sich als einfache Konsequenz aus dem Strahlensatz. Frage 479
Was besagt der Satz von Pappos und wie kann man ihn beweisen?
Antwort: Der Satz besagt: Seien Z, Z ′ zwei Geraden der projektiven Ebene P2 (K) und darauf je drei paarweise verschiedene Punkte p1 , p2 , p3 ∈ Z
p′1 , p′2 , p′3 ∈ Z ′
gegeben. Dann sind die Schnittpunkte q1 := (p1 ∨ p′2 ) ∩ (p2 ∨ p′1 ) q2 := (p2 ∨ p′3 ) ∩ (p3 ∨ p′2 ) q3 := (p1 ∨ p′3 ) ∩ (p3 ∨ p′1 )
217
7.5 Invarianten von Projektivit¨ aten
kollinear. Beweis: Man betrachte die Gerade q1 ∨ q3 . Dann gen¨ ugt es zu zeigen, dass die Punkte q2∗ := (q1 ∨ q3 ) ∩ (p2 ∨ p′3 )
und q2∗∗ := (q1 ∨ q3 ) ∩ (p3 ∨ p′2 )
u ¨bereinstimmen. p
Z
p3 p2 p1 q2 = q2∗ = q2∗∗ q3
q1 r p′
p′1
p′2 p3′
Z′
Sei p bzw. p′ der Schnittpunkt der Geraden (q1 ∨ q3 ) mit den Geraden Z bzw. Z ′ . Ferner bezeichne r den Schnittpunkt von Z und Z ′ . Die Projektion auf die Gerade Z mit dem Zentrum p′3 ergibt DV(p′ , q3 , q2∗ , p) = DV(r, p1 , p2 , p). Die Projektion auf die Gerade Z ′ mit dem Zentrum q1 liefert DV(r, p1 , p2 , p) = DV(r, p′2 , p′1 , p′ ), und die Projektion auf die Gerade p ∨ q mit dem Zentrum p3 ergibt DV(r, p′2 , p′1 , p′ ) = DV(p, q2∗∗ , q3 , p′ ). Insgesamt folgt daraus DV(p′ , q3 , q2∗ , p) = DV(p, q2∗∗ , q3 , p′ ). Da allgemein DV(a, b, c, d) = DV(d, c, b, a) gilt, wie man anhand der Formel (∗) aus der Antwort zu Frage 476 u ufen kann, gilt also ¨berpr¨ DV(p′ , q3 , q2∗ , p) = DV(p′ , q3 , q2∗∗ , p). Daraus folgt q2∗ = q2∗∗ , was zu zeigen war.
218
7 Anwendungen in der Geometrie
Frage 480 K¨ onnen Sie f¨ ur S¨atze der projektiven Geometrie das Prinzip der Dualit¨at erl¨autern? Wie l¨asst sich die G¨ ultigkeit dieses Prinzips formal begr¨ unden? Antwort: Die S¨ atze der projektiven Geometrie handeln von Punkten und Hyperebenen und deren Lagebeziehungen zueinander. In der projektiven Ebene z. B. sagen die S¨ atze aus, dass bestimmte Geraden sich in einem gemeinsamen Punkt schneiden bzw. bestimmte Punkte auf einer gemeinsamen Geraden liegen. Die Besonderheit der projektiven Geometrie besteht darin, dass Punkte und Hyperebenen formal vollkommen identische Eigenschaften besitzen. So ist eine Hyperebene z. B. definiert als die Menge aller Punkte (x0 : . . . : xn ), die eine Gleichung der Form a0 x0 + · · · + an xn = 0 mit (a0 : . . . an ) ∈ Pn (K) (∗) erf¨ ullt. Eine Hyperebene ist damit durch das projektive n-Tupel (a0 : . . . : an ), mithin durch den Punkt (a0 : . . . : an ) eindeutig bestimmt. Punkte und Hyperebenen sind in diesem Sinne duale Objekte. Die Menge der Punkte(x0 : . . . : xn ), die (∗) erf¨ ullen, l¨ asst sich daher genauso gut als Menge von Hyperebenen interpretieren, und zwar als die Menge derjenigen Hyperebenen, die den Punkt (a0 : . . . : an ) enthalten. Unter algebraischen Gesichtspunkten bleiben alle Eigenschaften der Menge erhalten, unabh¨ angig davon, ob sie als Punktmenge oder als Menge von Hyperebenen definiert wird. Ensprechend l¨ asst sich jede Relation von Punkten auch als Relation von Hyperebenen interpretieren, indem man die Eigenschaft der Kollinearit¨ at durch die Relation schneiden sich in einem gemeinsamen ” Punkt“ austauscht. Jedem Satz der projektiven Geometrie entspricht daher ein dualer Satz. Das Dualit¨ atsprinzip bleibt auch f¨ ur S¨ atze g¨ ultig, die Aussagen u ¨ber nichtlineare projektive Gebilde wie etwa Quadriken enthalten. Jede Quadrik l¨ asst sich n¨ amlich als Punktmenge genauso wie als Menge ihrer Tangentialhyperebenen definieren. Jedem Satz der projektiven Geometrie, der Aussagen u ¨ber die Eigenschaften von Quadriken als Punktmengen macht, entspricht daher ein dualer Satz u ¨ber die Tangentialhyperebenen. Frage 481 Pappos?
Wie lauten die dualen Versionen der S¨atze von Desargues und von
Antwort: Die duale Version des Satzes von Desargues lautet In einer projektiven Ebene seien die Geraden G1 , G2 , G3 , G′1 , G′2 , G′3 , Z gegeben mit der Eigenschaft, dass Gi , Z, G′i sich f¨ ur i = 1, 2, 3 jeweils in einem gemeinsamen Punkt schneiden. Dann schneiden sich die Geraden (G1 ∨ G2 ) ∩ (G′1 ∨ G′2 ) (G2 ∨ G3 ) ∩ (G′2 ∨ G′3 ) (G1 ∨ G3 ) ∩ (G′1 ∨ G′3 ) in einem gemeinsamen Punkt.
219
7.6 Projektive Quadriken
Als die duale Version des Satzes von Pappos erh¨ alt man den sogennanten Satz von Brianchon. Schneiden sich die Geraden Z1 , Z2 , Z3 in einem gemeinsamen Punkt p und die Geraden Z1′ , Z2′ , Z3′ in einem gemeinsamen Punkt p′ , dann schneiden sich die Geraden Y1 := (Z1 ∨ Z2′ ) ∩ (Z2 ∨ Z1′ ) Y2 := (Z2 ∨ Z3′ ) ∩ (Z3 ∨ Z2′ ) Y3 := (Z1 ∨ Z3′ ) ∩ (Z3 ∨ Z1′ ) in einem gemeinsamen Punkt.
7.6
Projektive Quadriken
Frage 482 homogen?
Wann nennt man ein Polynom P ∈ K[x0 , . . . , Xn ] zweiten Grades
Antwort: Das Polynom P ∈ K[X0 , . . . , Xn ] heißt homogen, wenn P die Darstellung αij Xi Xj P (X0 , . . . , Xn ) = 0≤i≤j≤n
besitzt. Ein homogenes Polynom ist also dadurch ausgezeichnet, dass alle darin vorkommenden Monome denselben Grad – im Fall eines quadratischen Polynoms also den Grad 2 – besitzen. Beispielsweise ist das Polynom P1 = X02 + 2X1 X0 + X12 homogen, das Polynom ′ P = X02 + 2X1 X0 + X12 + X0 + 1 jedoch nicht. Frage 483
Was ist eine projektive Quadrik?
Antwort: Eine Teilmenge Q ⊂ Pn (K) heißt (projektive) Quadrik, wenn ein homogenes Polynom P ∈ K[X0 , . . . , Xn ] existiert, so dass gilt Q = {(x0 : . . . : xn ) ; P (x0 , . . . , xn ) = 0}. Hier ist zu bemerken, dass f¨ ur λ ∈ K ∗ jedes homogene Polynom P ∈ K[X0 , . . . , Xn ] die Gleichung P (λx0 , . . . , λxn ) = λ2 P (x0 , . . . , xn ) erf¨ ullt. Daher gilt P (λx0 , . . . , λxn ) = 0 ⇐⇒ P (x0 , . . . , xn ) = 0. Aus diesem Grund entspricht der Nullstellenmenge eines homogenen Polynoms in K[X0 , . . . , Xn ] auch eindeutig eine Teilmenge des projektiven Raumes Pn (K), d. h., die Menge {(x0 : . . . : xn ) ; P (x0 , . . . , xn ) = 0}
220
7 Anwendungen in der Geometrie
ist wohldefiniert. Dies ist f¨ ur allgemeine Polynome aus K[X0 , . . . , Xn ] nicht der Fall. So enth¨ alt z. B. die Nullstellenmenge des inhomogenen Polynoms X02 −X1 = 0 den Punkt (1, 1), aber keinen der Punkte (λ, λ) f¨ ur λ ∈ {0, 1}. Frage 484 Sei P ein Polynom in K[X1 , . . . , Xn ] und Q ∈ K n die Nullstellenmenge von P , also Q = {(x1 , . . . , xn ) ∈ K n ; P (x1 , . . . , xn ) = 0}. Was versteht man dann unter dem projektiven Abschluss Q von Q in Pn (K)? asst sich durch die Hinzunahme Antwort: Jedes Polynom P ∈ K[X1 , . . . , Xn ] l¨ einer weiteren Variablen X0 homogenisieren, d. h. zu einem homogenen Polynom P ∈ K[X0 , . . . , Xn ] erweitern, indem man jedes Monom von P mit einer geeigneten Potenz von X0 multipliziert. F¨ ur P = X12 + X1 + 1 ∈ P [X1 ] gilt beispielsweise 2 2 P = X1 + X1 X0 + X0 ∈ P [X0 , X1 ]. Der projektive Abschluss von Q ist dann gerade die durch das Polynom P gegebene Quadrik in Pn (K). Beispiel: Sei Q = {(x1 , x2 ) ∈ R2 ; 1 + x21 − x22 = 0}.
Dies ist eine Hyperbel in R2 . Deren projektiver Abschluss ist die Quadrik Q = {(x0 : x1 : x2 ) ∈ P2 (R) ; x20 + x21 − x22 = 0}. alt im Vergleich zu Q zus¨ atzlich die unendlich fernen Punkte“ Die Quadrik Q enth¨ ” von Q. Das sind genau die Schnittpunkte von Q mit der Hyperebene x0 = 0, also 2 2 alle Punkte (0 : x1 : x2 ) ∈ P2 (R) mit x1 − x2 = 0 bzw. die beiden uneigentlichen Punkte {(0 : x1 : x2 ) ∈ P2 (R) ; x1 = x2 } und {(0 : x1 : x2 ) ∈ P2 (R) ; x1 = −x2 }. Frage 485 Sei Q ∈ Pn (K) eine projektive Quadrik und H ⊂ Pn (K) eine Hyperebene. Was versteht man unter dem affinen Anteil Q0 von Q bez¨ uglich H? Antwort: Es ist Q0 := Q ∩ (Pn (K) \ H). Da Pn (K) \ H sich nach Frage 460 mit dem affinen Raum An (K) identifizieren l¨ asst, ist Q0 damit eine affine Teilmenge von An (K). Deren geometrische Gestalt h¨ angt aber wesentlich von der Wahl der Ebene H ab (vgl. dazu die n¨ achste Frage). Ist H speziell durch x0 = 0 gegeben, so gilt Q0 = {(x0 : . . . : xn ) ∈ Q ; x0 = 0}
= {(1, x1 , . . . , xn ) ∈ K n+1 ; (1 : x1 : . . . : xn ) ∈ Q}.
221
7.6 Projektive Quadriken
Wird Q durch die Gleichung 0≤i,j=n αij xi xj = 0 beschrieben, so wird Q0 als uglich der kanonischen affinen Basis durch die Gleichung Teilmenge von An (K) bez¨ n
αij xi xj +
n
α0i xi + α00 = 0
i=1
i,j=1
beschrieben.
Frage 486 Sei Q die durch die Gleichung x20 − x21 − x22 = 0 gegebene projektive Quadrik in P2 (R). K¨ onnen Sie zeigen, dass man durch Entfernen einer geeigneten Hyperebene in P2 (R) als affinen Anteil von Q (a) (b) (c)
einen Kreis eine Hyperbel eine Parabel
erh¨alt? Antwort: Die Gleichung x20 − x21 − x22 = 0 beschreibt einen Kreiskegel in R3 . Die affinen Anteile von Q lassen sich als die Schnitte von Q mit den entsprechenden Hyperebenen veranschaulichen. a) Sei H = {(x0 : x1 : x2 ) ; x0 = 0}. Man hat dann eine Affintit¨ at ι : R2 −→ P2 (R) \ H,
(x1 , x2 ) −→ (1 : x1 : x2 ).
F¨ ur alle Punkte (1 : x1 : x2 ) ∈ Q ∩ A gilt x21 + x22 = 1, Es folgt ι−1 (Q) = {(x1 , x2 ) ; x21 + x22 = 1}. Dies ist ein Kreis in A. Geometrisch kann man sich diesen als Schnitt des Kreiskegels mit der Hyperfl¨ ache x0 = 1 vorstellen. x0
R2 x2 x1
222
7 Anwendungen in der Geometrie
b) Im Fall H = {(x0 : x1 : x2 ) ; x2 = 0} lautet die Affiniti¨ at Es gilt
ι : R2 −→ P2 (R) \ H,
(x0 , x1 ) −→ (x0 : x1 : 1).
ι−1 (Q) = {(x0 , x1 ) ∈ R2 ; x20 − x21 = 1}.
Dies ist eine Hyperbel in R2 , die man sich als Schnitt von K mit der Hyperbene x2 = 1 des R3 veranschaulichen kann. x0
R2 x2 x1
c) Sei nun H = {(x0 : x1 : x2 ) ; x0 + x2 = 0}. In diesem Fall hat man eine Affinit¨ at ι : R2 −→ P2 (R) \ H,
(x1 , x2 ) −→ ((1 − x2 ) : x1 : x2 ).
Die Menge Q \ H wird dann durch die Gleichung (1 − x2 )2 − x21 − x22 = 0 bzw. x2 = (1 − x21 )/2 beschrieben. Es folgt ι−1 (Q) = {(x1 , x2 ) ∈ R2 ; x2 = (1 − x21 )/2}.
Dies ist eine Parabel in R2 . Man erh¨ alt sie als Schnitt des Kreiskegels K mit der Hyperfl¨ ache x0 + x2 = 1. x0
x2
x1 R2
223
7.6 Projektive Quadriken
Frage 487 Wie lassen sich projektive Quadriken Q ∈ Pn (K) durch symmetrische Bilinearformen Φ : K n+1 × K n+1 −→ K beschreiben? Antwort: Ist P ∈ K[X0 , . . . , Xn ] ein homogenes Polynom, so definiere man eine Matrix A ∈ K (n+1)×(n+1) durch ⎧ ⎪ f¨ ur i = j ⎨ αij 1 aij := ur i < j 2 αij f¨ ⎪ ⎩ 1α ur i > j. 2 ji f¨
Dann ist A = (aij ) eine symmetrische Matrix, definiert also eine symmetrische Bilinearform auf K n+1 . F¨ ur jeden Spaltenvektor x = (x0 , . . . , xn )T gilt αij xi xj = P (x). xT Ax = i≤j
Zu jeder Quadrik Q gibt es also eine symmetrische Matrix A mit Q = {x = (x0 : . . . : xn )T ; xT Ax = 0}. Dabei ist die Matrix A nur bis auf einen Faktor ̺ ∈ K ∗ eindeutig bestimmt. Umgekehrt geh¨ ort zu jeder symmetrischen Bilinearform Φ : K n+1 × K n+1 −→ K, eine quadratische Form q : K n+1 −→ K,
x −→ Φ(x, x)
und damit eine projektive Quadrik Q = {(x0 : . . . : xn )T ; Φ(x, x) = 0}.
Frage 488 K¨ onnen Sie zeigen, dass Quadriken unter Projektivit¨aten invariant bleiben, dass also f¨ ur jede Quadrik Q ∈ Pn (K) und jede Projektivit¨at f : Pn (K) −→ Pn (K) auch f (Q) eine Quadrik ist? Antwort: Sei Q = {(x0 : . . . : xn )T ; xT Ax = 0}
mit einer symmetrischen Matrix A ∈ K n+1 . Ist F : K n+1 −→ K n+1 ein Isomorphismus mit f = P(F ) und S ∈ GL(n + 1) die beschreibende Matrix von F , so gilt f (Q) = {f x0 : . . . : xn )T ; xT Ax = 0}.
224
7 Anwendungen in der Geometrie
Mit y = (y0 , . . . , yn )T = F (x0 , . . . , xn )T schreibt sich das in der Form f (Q) = {(y0 : . . . : yn ) ; y T (S −1 )T AS −1 y = 0}
Die Matrix (S −1 )T AS −1 ist dann ebenfalls symmetrisch und somit f (Q) nach Frage 487 eine Quadrik. Frage 489 Wann heißen zwei Quadriken Q, Q′ ∈ Pn (K) geometrisch (projektiv) ¨ aquivalent? aquiAntwort: Zwei Quadriken Q, Q′ ∈ Pn (K) heißen geometrisch oder projektiv ¨ valent, symbolisch Q ∼ Q′ , wenn es eine Projektivit¨ at f : Pn (K) −→ Pn (K) mit Q′ = f (Q) gibt. Frage 490 tion?
Was besagt der Satz u ¨ber die projektive Hauptachsentransforma-
Antwort: Hauptachsentransformation“ bedeutet in diesem Zusammenhang, ei” ne Quadrik mittels einer Projektivit¨ at auf eine geometrisch ¨ aquivalente Quadrik abzubilden, die durch eine besonders einfache standardisierte Gleichung beschrieben wird, in der keine gemischten Variablen mehr vorkommen. Der Satz u ¨ber die Hauptachsentransformation besagt gerade, dass sich jede projektive Quadrik dergestalt auf Hauptachsen transformieren l¨ asst. Er erm¨ oglicht es daher, zu jeder Klasse geometrisch ¨ aquivalenter Quadriken einen eindeutigen Repr¨ asentanten in Hauptachsenform“ anzugeben, was bei der Klassifikation von Quadriken eine ” tragende Rolle spielt. Der Satz besitzt f¨ ur komplexe und reelle Quadriken jeweils eine eigene Formulierung. Genau besagt er: 1. Zu jeder Quadrik Q ∈ Pn (R) gibt es eine geometrisch ¨ aquivalente Quadrik Q′ mit der Gleichung x20 + · · · + x2ℓ − x2ℓ+1 − · · · − x2k = 0,
−1 ≤ ℓ, k ≤ n.
Dabei sind die Zahlen ℓ und k durch die zus¨ atzliche Forderung ℓ + 1 ≥ k − ℓ eindeutig bestimmt. 2. Zu jeder Quadrik Q ∈ Pn (C) gibt es eine eindeutig bestimmte Zahl k ≤ n ∈ N, so dass Q geometrisch ¨ aquivalent ist zu der Quadrik mit der Gleichung x20 + · · · + x2k = 0. Die ¨ aquivalente matrizentheoretische Formulierung lautet
225
7.6 Projektive Quadriken
1’. Zu jeder symmetrischen Matrix A ∈ M (n + 1) × (n + 1), R) gibt es eindeutig bestimmte Zahlen, k, ℓ mit −1 ≤ k, ℓ ≤ n und ℓ + 1 ≥ k − ℓ und eine invertierbare Matrix S ∈ GL(n + 1, R), so dass ⎞ ⎛ Eℓ+1 0 0 ⎟ ⎜ S −1 AS = ⎝ 0 (∗) −Ek−ℓ 0⎠ . 0 0 0 gilt.
2’. Zu jeder symmetrischen Matrix A ∈ M (n + 1) × (n + 1), C) gibt es eine eindeutig bestimmte Zahl k ≤ n und eine invertierbare Matrix S ∈ GL(n + 1, C) mit
E 0 k (∗∗) S −1 AS = 0 0 gilt. Der Beweis ergibt sich im reellen Fall unmittelbar aus dem Satz u ¨ber die reelle Hauptachsentransformation. Beim komplexen Fall ist jedoch zu beachten, dass in Antwort 416 die Hauptachsentransformation im Bezug auf hermitesche Formen bzw. Matrizen bewiesen wurde, w¨ ahrend man es im gegenw¨ artigen Kontext mit symmetrischen komplexen Matrizen zu tun hat. Eine leichte Modifikation der Argumentation f¨ uhrt aber auch in diesem Fall zum gew¨ unschten Ergebnis. Frage 491 Wie l¨asst sich mit den Mitteln der linearen Algebra die geometrisch ¨aquivalente Quadrik Q′ bestimmen? Antwort: Sei Q = {x ∈ Pn (K) ; xT Ax = 0} mit einer symmetrischen Matrix A ∈ M (n + 1) × (n + 1), K . Die Frage l¨ auft darauf hinaus, die nach dem Satz u ber die Hauptachsentransformation existierende ¨ Matrix S ∈ GL(n + 1, K) zu bestimmen mit der D := S −1 AS die Gestalt (∗) bzw. (∗∗) aus Frage 490 besitzt. Die Matrix S −1 beschreibt dann die Projektivit¨ at, die Q auf die geometrisch ¨ aquivalente Quadrik Q′ in Normalform abbildet. Als Element aus GL(n + 1, k) l¨ asst sich S als Produkt C1 · · · Cs von Elementarmatrizen schreiben. Es gilt also B = CnT · · · C1T · A · C1 · · · Cn . Die Multiplikation von rechts mit den Matrizen C1 , . . . , Ck beschreibt eine Reihe elementarer Zeilenumformungen, die Multiplikation von links mit den Matrizen C1T , . . . , CkT die Serie entsprechender elementarer Spaltenumformungen. Man erh¨ alt B = C1 · · · Ck , wenn man an En+1 die gleichen Zeilenumformungen durchf¨ uhrt. Dies f¨ uhrt auf folgendes Verfahren. Man transformiere A durch elementare
226
7 Anwendungen in der Geometrie
Zeilenumformungen, gefolgt von den entsprechenden elementaren Spaltenumformungen auf eine Matrix des Typs B um. Gleichzeitig wende man auf En+1 die Zeilenumformungen an. Die auf diese Weise aus En+1 erhaltene Matrix ist die gesuchte Matrix T . Schematisch l¨ asst sich das so darstellen: A C1T AC1
.. . T B = Ck · · · C1T AC1 · · · Ck
En+1 En+1 C1 .. . En+1 C1 · · · Ck = T
Mit S := T −1 ist die gesuchte Transformationsmatrix gefunden, und es gilt Q′ = {(y0 : . . . : yn ) ; y T (S T AS)y = 0} = {(y0 : . . . : yn ) ; (Sy)T A(Sy) = 0} = {S · (x0 , . . . , xn )T ; xT Ax = 0} = f (Q).
Frage 492
Was besagt die Vorzeichenregel von Descartes?
Antwort: Die Regel besagt: Die Anzahl der positiven Nullstellen eines reellen Polynoms P [X] = αm X m + αm−1 X m + · · · + α1 X + α0
mit αm = 0 und α0 = 0
welches nur reelle Nullstellen besitzt, ist gleich der Anzahl der Vorzeichenwechsel seiner Koeffizientenfolge. So besitzt beispielsweise das Polynom X 2 − X − 2 genau eine positive Nullstelle (die Voraussetzung, dass alle Nullstellen reell sind, ist in diesem Fall erf¨ ullt). Einen Beweis findet man etwa in [5]. Frage 493 Wie kann man, ohne die Transformationsmatrix explizit zu berechnen, die zu einer Quadrik Q ∈ Pn (R) ¨aquivalente Quadrik Q′ in Hauptachsenform, d. h. die Q′ beschreibende Gleichung x20 + · · · + x2ℓ − x2ℓ+1 − · · · − x2k = 0 bestimmen?
Antwort: Wird Q durch die symmetrische Matrix A ∈ M (n+1), R) beschrieben, so besitzt A nach Frage 417 n + 1 reelle Eigenwerte λ0 , . . . , λn . Die Q′ beschreibende Matrix ⎞ ⎛ Eℓ+1 0 0 ⎟ ⎜ B=⎝ 0 −Ek−ℓ 0⎠ 0 0 0
227
7.6 Projektive Quadriken
hat nach dem Tr¨ agheitssatz von Sylvester dieselbe Anzahl positiver und negativer Eigenwerte wie A. Um B und damit Q′ zu bestimmen, gen¨ ugt es also, die Anzahl positiver und negativer Eigenwerte von A ausfindig zu machen, d. h. die Vorzeichenverteilung des charakteristischen Polynoms von A. Ist χA = X m (αj X j + αj−1 X j−1 + · · · + α0 ) =: X m · P (X),
α0 = 0,
so folgt mit der Vorzeichenregel von Descartes ℓ = Anzahl der Vorzeichenwechsel der Koeffizientenfolge von P sowie k − ℓ = deg P − ℓ = j − ℓ. Beispiel: Sei Q = {(x0 : x1 : x2 : x3 ) ; x21 + x22 − 2x0 x3 = 0}
ort die Vorzeichenfolge (+, +, −, +, +). Also ist Zu χA (X) = X 4 − 2X 2 + 1 geh¨ ℓ = 2 und k − ℓ = 4 − 2 = 2, und somit ist Q ¨ aquivalent zu Q′ = {(x0 : x1 : x2 : x3 ) ; x20 + x21 − x22 − x23 = 0}. Frage 494 Pn (K)?
Wie lautet das Klassifikationstheorem f¨ ur projektive Quadriken aus
Antwort: Der Satz lautet Seien A1 , A2 ∈ M ((n + 1), K) symmetrische Matrizen und Qi := {(x0 : . . . : xn ) ∈ Pn (K) ; xT Ai x},
i = 1, 2
die dadurch beschriebenen Quadriken. Dann gilt im Fall K = R Q1 ∼ Q2 ⇐⇒ rg A1 = rg A2 und | Sign A1 | = | Sign A2 |. Dabei ist Sign A f¨ ur eine reelle symmetrische Matrix definiert durch Sign A := (Anzahl der positiven Eigenwerte von A) − (Anzahl der negativen Eigenwerte von A). F¨ ur K = C gilt Q1 ∼ Q2 ⇐⇒ rg A1 = rg A2 . Dass zwei geometrisch ¨ aquivalente Matrizen die angegebenen Eigenschaften besitzen, folgt, indem man Q1 und Q2 auf Hauptachsen transformiert. Der Beweis der anderen Richtung ben¨ otigt noch zus¨ atzlich die Tatsache, dass jeder normalen“ ” Quadrik bis auf einen Faktor ein eindeutiges Polynom zugeordnet werden kann.
228
7 Anwendungen in der Geometrie
Frage 495 Welche Normalformen von Quadriken in P2 (R) bzw. P3 (R) erh¨alt man aus dem Klassifikationssatz? Antwort: Jede Normalform entspricht einer m¨ oglichen Kombinationen von rg A alt man damit folgende und | Sign A|. In der reell projektiven Ebene P2 (R) erh¨ sechs Normalformen: rg 0 1 2 2 3 3
| Sign | 0 1 2 0 3 1
Gleichung 0=0 x20 = 0 x20 + x21 = 0 x20 − x21 = 0 x20 + x21 + x22 = 0 x20 + x21 − x22 = 0
Beschreibung Ebene P2 (R) Gerade Punkt Geradenpaar leere Quadrik Kreis
In P3 (R) erh¨ alt man neun Klassen geometrisch ¨ aquivalenter Quadriken: rg 0 1 2 2 3 3 4 4 4
| Sign | 0 1 2 0 3 1 4 2 2
Gleichung 0=0 x20 = 0 x20 + x21 = 0 x20 − x21 = 0 x20 + x21 + x22 = 0 x20 + x21 − x22 = 0 x20 + x21 + x22 + x23 = 0 x20 + x21 + x22 − x23 = 0 x20 + x21 − x22 − x23 = 0
Beschreibung P3 (R) Ebene Gerade Ebenenpaar Punkt Kegel leere Quadrik Kugel Regel߬ ache
Die affinen Anteile der Quadriken der reellen projektiven Ebene wurden schon in Frage 486 untersucht. In der n¨ achsten Frage wird dies f¨ ur die interessanten F¨ alle der Quadriken aus P3 (R) nachgeholt. Frage 496 geben?
K¨ onnen Sie f¨ ur die Kugel und die Regelfl¨ache die affinen Anteile an-
Antwort: Zun¨ achst zur Kugel Q mit der Gleichung x20 + x21 + x22 − x23 = 0. Entfernt man aus P3 (R) die Hyperebene H1 mit der Gleichung x3 = 0, so verbleibt {(x0 , x1 , x2 ) ; x20 + x21 + x22 − 1 = 0}
229
7.6 Projektive Quadriken
als affiner Anteil. Dies ist eine Kugel im affinen Raum. Wegen Q ∩ H1 = ∅ besitzt diese keine unendlich fernen Punkte. Durch Entfernen der Hyperebene H2 mit der Gleichung x0 = 0 erh¨ alt man {(x1 , x2 , x3 ) ; x23 − x22 − x21 = 1}. Das ist ein zweischaliges Hyperboloid. Die unendlich fernen Punkte liegen auf dem Kreis {(x1 : x2 : x3 ) ∈ P2 (R) ; x21 + x22 − x23 = 0}, ¨ von Q beschreibt. der gewissermaßen den Aquator“ ” Die dritte M¨ oglichkeit, ein affines Bild von Q zu erhalten, besteht darin, einen einzigen Punkt von Q ins Unendliche“ zu r¨ ucken. Dazu ersetze man Q durch die ” geometrisch ¨ aquivalente Quadrik Q′ mit der Gleichung x21 + x22 − x0 x3 = 0. Definiert man H3 durch x0 = 0, dann erh¨ alt man als affinen Rest von Q′ das elliptische Paraboloid {(x1 , x2 , x3 ) ; x21 + x22 − x3 = 0}. Der unendlich ferne Anteil ist gegeben durch {(x1 : x2 : x3 ) ∈ P2 (R) ; x21 + x22 = 0} = {(0 : 0 : 1)}. Nun zur Regelfl¨ ache Q mit der Gleichung x20 + x21 − x22 − x23 = 0. Entfernt man die Hyperebene H1 mit der Gleichung x3 = 0, so erh¨ alt man als affinen Rest {(x0 , x1 , x2 ) ∈ R3 ; x20 + x21 − x22 = 1}. Das ist ein einschaliges Hyperboloid. Der unendlich ferne Anteil ist dann der Kreis“ ” {(x0 : x1 : x2 ) ∈ P2 (R) ; x20 + x21 = 1}.
230
7.7
7 Anwendungen in der Geometrie
Affine Quadriken
Frage 497
Was ist eine affine Quadrik?
Antwort: Eine Teilmenge Q0 ⊂ An (K) heißt affine Quadrik, wenn es eine projektive Quadrik Q ∈ Pn (K) mit Q0 = Q ∩ An (K) gibt. Eine affine Quadrik erh¨ alt man damit als affinen Anteil einer projektiven Quadrik, d. h., indem man aus Q die unendlich fernen Punkte entfernt. Lautet die Gleichung der projektiven Quadrik Q αij xi xj = 0, 0≤i≤j≤n
uglich der kanonischen affinen Koordiso wird Q0 als Teilmenge von An (K) bez¨ naten durch die Gleichung
αij xi xj +
1≤i≤j≤n
n
α0j xj + α00 = 0.
j=1
beschrieben. Die Menge Qu := {(x0 : . . . : xn ) ∈ Q ; x0 = 0} heißt der uneigentliche Anteil von Q. Da dieser durch die Gleichung αij xi xj = 0 1≤i≤j≤n
beschrieben wird, ist Qu eine Quadrik des projektiven Raumes Pn−1 (k). Durch jede projektive Quadrik Q ist die affine Quadrik Q0 = Q ∩ An (K) eindeutig bestimmt. Umgekehrt k¨ onnen aber zwei verschiedene projektive Quadriken Q und Q′ durchaus dieselbe affine Quadrik bestimmen. Das ist genau dann der Fall, wenn sich Q und Q′ nur in ihren uneigentlichen Punkten unterscheiden. Frage 498
Wann heißen zwei affine bzw. projektive Quadriken affin ¨ aquivalent?
aquivalent, wenn es eine Antwort: Zwei affine Quadriken Q0 und Q′0 heißen affin ¨ Affinit¨ at F mit F (Q0 ) = Q′0 gibt. Entsprechend nennt man zwei projektive Quadriken Q und Q′ affin ¨ aquivalent, wenn es eine projektive Affinit¨ at F mit F (Q) = Q′ gibt. Sind die projektiven Quadriken Q und Q′ affin ¨ aquivalent, so auch die affinen Anteile Q0 und Q′0 . Ferner sind in diesem Fall die uneigentlichen Anteile Qu und Q′u projektiv ¨ aquivalent.
231
7.7 Affine Quadriken
Frage 499
¨ Wie lautet der Aquivalenzsatz f¨ ur affine Quadriken?
Antwort: Der Satz besagt: (i)
ur 1 ≤ ℓ, k ≤ n definiert durch Die projektiven Quadriken Qℓ,k ∈ Pn (K) seien f¨ die Gleichungen x21 + . . . + x2ℓ − x2ℓ+1 − · · · − x2k = Δ(i) mit Δ(1) = 0,
Δ(2) = x20 ,
Δ(3) = −x20 ,
Δ(4) = x0 xk+1
(nur f¨ ur k < n). (i)
Dann gilt: Jede projektive Quadrik Q ∈ Pn (K) ist zu genau einer Quadrik Qℓ,k affin a ¨quivalent. Beweis: Sei Q gegeben durch die Gleichung 0≤i≤j≤n αij xi xj = 0. Der uneigent liche Anteil Qu von Q wird dann durch die Gleichung 1≤i≤j≤n αij xi xj = 0 beschrieben. Nach Frage 490 ist Qu geometrisch ¨ aquivalent zu einer Quadrik Q′u mit der Gleichung x21 + · · · + x2ℓ − xℓ+1 − · · · − xk = 0. Sei S ∗ die Darstellungsmatrix der Projektivit¨ at f ∗ : Pn−1 (K) −→ Pn−1 (K), die ′ Qu auf Qu abbildet. Die Matrix
1 S= S∗ beschreibt dann eine Fortsetzung von f ∗ zu einer affinen Projektivit¨ at f : Pn (K) −→ Pn (K), die Q auf die affin a¨quivalente Quadrik Q′ abbildet. Dabei wird Q′ durch eine Gleichung der Form x21 + · · · + x2ℓ − x2ℓ+1 − · · · − x2k = bx20 +
n
bi x0 xi
i=1
beschrieben. Diese Gleichung l¨ asst sich durch eine affine Transformation weiter vereinfachen. Die durch die Gleichungen ⎧ bi ⎪ ur i = 1, . . . , ℓ ⎨ xi − 2 x0 f¨ ′ bi xi = ur i = ℓ + 1, . . . , k xi + 2 x0 f¨ ⎪ ⎩ x f¨ ur i = 0 und i > k i definierte projektive Affinitit¨ at bildet Q′ auf eine Quadrik Q′′ mit der Gleichung x21 + · · · + x2ℓ − x2ℓ+1 − · · · − x2k = cx20 +
n
i=k+1
bi x0 xi
232
7 Anwendungen in der Geometrie
ab. Somit ist Q′′ immer noch affin ¨ aquivalent zu Q. Nun sind folgende vier F¨ alle zu unterscheiden: ur i = k + 1, . . . , n Fall 1. c = 0 und bi = 0 f¨ In diesem Fall ist Q′′ bereits vom Typ 1. ur i = k + 1, . . . , n Fall 2. c > 0 und bi = 0 f¨ √ Durch x′0 = cx0 und xi = xi f¨ ur i = 1, . . . , n wird eine projektive Affinit¨ at mit der Gleichung Pn (K) −→ Pn (K) beschrieben, die Q′′ auf eine Quadrik Q x21 + · · · + x2ℓ − x2ℓ+1 − · · · − x2k = x20 .
abbildet. Diese ist vom Typ 2. Fall 3. c < 0 und bi = 0 f¨ ur i = k + 1, . . . , n √ Durch x′0 = − −cx0 und xi = xi f¨ ur i = 1, . . . , n wird eine projektive Affinit¨ at Pn (K) −→ Pn (K) beschrieben, die Q′′ auf eine Quadrik Q∗ mit der Gleichung x21 + · · · + x2ℓ − x2ℓ+1 − · · · − x2k = −x20 .
abbildet. Diese ist vom Typ 3. ur mindestens ein i > k + 1 Fall 4. bi = 0 f¨
Da eine Vertauschung der Variablen eine affine Projektivit¨ at ist, kann man bk+1 = 0 annehmen. Die durch xi f¨ ur i = k + 1 n x′i = ur i = r + 1 cx0 + ν=k+1 bν xν f¨ definierte affine Projektivit¨ at bildet Q′′ auf eine Quadrik Q∗ mit der Gleichung x1 + · · · + x2ℓ − x2ℓ+1 − · · · − x2k = x0 xk+1 ab. Also ist Q∗ vom Typ 4. Da diese Fallunterscheidung vollst¨ andig ist, ist gezeigt, dass jede projektive Qua(i) aquivalent ist. drik zu mindestens einer der Quadriken Qℓ,k affin ¨ (i)
Die Eindeutigkeit ergibt sich daraus, dass die Quadriken Qℓ,k untereinander nicht affin ¨ aquivalent sind. Angenommen n¨ amlich, die beiden Quadriken Qj := (ij ) Qℓj ,kj mit j ∈ {1, 2} und ij ∈ {1, 2, 3, 4} sind affin ¨ aquivalent. Dann sind die uneigentlichen Anteile projektiv ¨ aquivalent, woraus ℓ1 = ℓ2 und k1 = k2 folgt. (j) Ferner gilt f¨ ur die Darstellungsmatrizen A(j) von Qℓ,k rg A(1) = k,
rg A(2) = k + 1 = rg A(3) , (2)
(3)
rg A(4) = k + 2.
Damit k¨ onnten h¨ ochstens Qℓ,k und Qℓ,k untereinander affin ¨ aquivalent sein. Das (2) ist aber ebenfalls ausgeschlossen, da wegen | Sign A | = | Sign A(3) | diese beiden Quadriken noch nicht einmal projektiv ¨ aquivalent sind.
233
7.7 Affine Quadriken
Frage 500 K¨ onnen Sie eine vollst¨andige Liste aller affin ¨aquivalenter Quadriken in P3 (R) angeben? Antwort: Die Liste affin a ¨quivalenter Quadriken ist eine Verfeinerung derjenigen f¨ ur projektiv ¨ aquivalente Quadriken. Systematisch erh¨ alt man diese, indem man jede Klasse projektiv ¨ aquivalenter Quadriken noch hinsichtlich der projektiven ¨ Aquivalenz ihrer uneigentlichen Anteile differenziert. Das bedeutet, dass jede Zeile der Tabelle aus Frage 495 noch in die m¨ oglichen Kombinationen der Werte von ur den uneigentlichen Anteil | rg A′ | und | Sign A′ |, wo A′ die Darstellungsmatrix f¨ von Q ist, verzweigt werden muss. In der reellen projektiven Ebene erh¨ alt man folgende 12 Klassen affin ¨ aquivalenter Quadriken: Nr. 1 2 3 4 5 6 7 8 9 10 11 12
rg A 0 1 1 2 2 2 2 2 3 3 3 3
| Sign A| 0 0 0 0 0 0 2 2 1 1 1 3
rg A′ 0 0 1 0 1 2 1 2 1 2 2 2
| Sign A′ | 0 0 0 0 1 0 1 2 1 0 2 2
Gleichung 0=0 0 = x20 x21 = 0 0 = x 0 x1 −x21 = x20 x21 + x22 = 0 x21 = x20 x21 − x22 = 0 x21 = x0 x2 x21 − x22 = x20 x21 + x22 = x20 −x21 − x22 = x20
Bezeichnung P2 (R) uneigentl. Gerade eigentl. Gerade eigentl. und uneigentl. Gerade uneigentl. Punkt eigentl. Punkt Paar paralleler Geraden Geradenpaar mit eigentl. Schnittpunkt Parabel Hyperbel Ellipse ∅
Im projektiven Raum P3 (R) gibt es zwanzig Klassen affin ¨ aquivalenter Quadriken. Nr. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
rg A 0 1 1 2 2 2 2 2 3 3 3 3 3 3 4 4 4 4 4 4
| Sign A| 0 1 1 0 0 0 2 2 0 1 1 1 3 3 0 0 1 2 2 4
rg A′ 0 0 1 0 1 2 1 2 1 2 2 3 2 3 2 3 3 2 3 3
| Sign A′ | 0 0 1 0 1 0 1 2 1 0 2 1 2 3 0 1 3 2 1 3
Gleichung 0=0 0 = x20 x21 = 0 0 = x 0 x1 x21 = x20 2 x1 − x22 = 0 −x21 = x20 2 x1 + x22 = 0 x21 = x0 x2 2 x1 − x22 = x20 x21 + x22 = x20 x21 + x22 − x23 = 0 −x21 − x22 = x20 2 x1 + x22 + x23 = 0 x21 − x22 = x0 x3 2 x1 + x22 − x23 = x20 x21 + x22 + x23 = x20 x21 + x22 = x0 x3 2 x1 − x22 − x23 = x20 −x21 − x22 − x23 = x20
Bezeichnung 3-dim. Raum uneigentl. Ebene eigentl. Ebene Ebenenpaar Paar paralleler Ebenen Ebenenpaar uneigentliche Gerade eigentl. Gerade parabolischer Zylinder hyperbolischer Zylinder elliptischer Zylinder Kegel uneigentl. Punkt eigentl. Punkt hyperbolisches Paraboloid einschaliges Hyperboloid Ellipsoid elliptisches Paraboloid zweischaliges Hyperboloid ∅
234
7 Anwendungen in der Geometrie
Die folgenden Abbildungen zeigen die affinen Anteile einiger Klassen. x3 x3
x1
x2
x1
Zweischaliges Hyperboloid
x2
Elliptisches Paraboloid x3
x3
x1
x2
x1
x2
Einschaliges Hyperboloid
Kegel
x3 x3
x1 x1
x2
x2
Ellipsoid
Hyperbolisches Paraboloid
Literatur [1]
¨ Howard Anton. Lineare Algebra. Einf¨ uhrung, Grundlagen, Ubungen. Spektrum Akademischer Verlag, 1998.
[2]
Artin, M. Algebra. Birkh¨ auser, 1. Auflage, 1998.
[3]
Beutelspacher, A. Lineare Algebra. Vieweg, 15. Auflage, 2005.
[4]
Bosch, S. Algebra. Springer, 6. Auflage, 2006.
[5]
Bosch, S. Lineare Algebra. Springer, 2006.
[6]
Busam, R. und Epp, T. Pr¨ ufungstrainer Analysis. Spektrum Akademischer Verlag, 1. Auflage, 2007.
[7]
Fischer, G. Lineare Algebra. Vieweg, 15. Auflage, 2005.
[8]
J¨ anich, K. Lineare Algebra. Springer, 10. Auflage, 2004.
[9]
Koecher, M. Lineare Algebra und analytische Geometrie. Springer, 4. Auflage, 2007.
[10]
Kowalsky, G. und Michler, H.-J. Lineare Algebra. de Gruyter, 12. Auflage, 2003.
[11]
Kwak, H.-J. Linear Algebra. Birkh¨ auser, 1. Auflage, 1997.
[12]
Lorenz, F. Lineare Algebra 1. Spektrum Akademischer Verlag, 4. Auflage, 2003.
[13]
L¨ uneburg, H. Vorlesungen u ¨ber Lineare Algebra. BI-Wiss.-Verl., 1993.
[14]
Muthsam, J. H. Lineare Algebra und ihre Anwendungen. Spektrum Akademischer Verlag, 1. Auflage, 2006.
[15]
Roman, S. Advanced Linear Algebra. Springer, 3. Auflage, 2007.
[16]
Strang, G. Lineare Algebra. Springer, 1. Auflage, 2007.
Symbolverzeichnis
e
neutrales Element in einer Gruppe, Seite 1
Z/nZ, Zn
Restklassengruppe modulo n, Seite 3
Z
Menge der ganzen Zahlen, Seite 3
K
allgemeiner K¨ orper, Seite 3
K∗
multiplikative Gruppe von K (= K \ {0}), Seite 3
Aut(V )
Automorphismengruppe von V , Seite 4
GL(n, K)
allgemeine lineare Gruppe auf K, Seite 4
Abb(M, N )
Menge aller Abbildungen M → N , Seite 4
Sym(X)
symmetrische Gruppe auf X, Seite 4
≃
isomorph, Seite 9
ker F
Kern von F , Seite 11
(G : H)
Index von H in G, Seite 13
G/H
Menge der Linksnebenklassen von G in G, Seite 13
SL(n, K)
Spezielle Lineare Gruppe, Menge der n × n-Matrizen mit Determinante 1, Seite 17
sign σ
Vorzeichen der Permutation σ, Seite 18
An
alternierende Gruppe, Seite 20
Fq
K¨ orper mit q Elementen, Seite 23
char K
Charakteristik von K, Seite 24
a, b, . . .
Ideal, Seite 25
(a)
von a erzeugtes Hauptideal, Seite 25
R[X]
Ring der Polynome u ¨ber R, Seite 28
deg
Grad eines Polynoms, Seite 29
ggT
gr¨ oßter gemeinsamer Teiler, Seite 34
Symbolverzeichnis
237
Kn
Standardvektorraum u ¨ber K, Seite 37
C
Menge der komplexen Zahlen, Seite 38
∅
leere Menge, Seite 38
Q
Menge der rationalen Zahlen, Seite 38
C k (M )
Menge der k-mal stetig differenzierbaren Funktionen auf M ⊂ R, Seite 39
span(S)
von S ⊂ V aufgespannter Unterraum, Seite 40
B, C, . . .
Basen, Seite 44
e1 , e2 , . . .
Standardbasisvektoren des K n , Seite 44
rg
Rang, Seite 47
dim
Dimension, Seite 47
id
identische Abbildung, Seite 53
F, G
lineare Abbildungen, Seite 53
z
zu z ∈ C konjugiert komplexe Zahl, Seite 54
o
Nullabbildung, Seite 54
f ◦g
Verkettung von Abbildungen, Seite 55
f −1
Umkehrabbildung zu f , Seite 55
im F
Bild von F , Seite 56
HomK (V, W )
Menge der K-linearen Abbildungen V −→ W , Seite 57
πU
nat¨ urliche Projektion, Seite 63
A·x
Produkt einer Matrix mit einem Spaltenvektor, Seite 68
K m×n
Vektorraum der (m × n)-Matrizen u ¨ber K, Seite 68
FA
die der Matrix A zugeordnete lineare Abbildung, Seite 69
AF
die der linearen Abbildung F zugeordnete Matrix, Seite 69
A·B
Matrizenprodukt, Seite 71
M (n, K)
Menge der quadratische n × n-Matrizen u ¨ber K, Seite 73
rgs
Spaltenrang, Seite 75
rgz
Zeilenrang, Seite 75
238
Symbolverzeichnis
A≈B
¨ Aquivalenz von Matrizen A und B, Seite 78
κB
Koordinatensystem, Seite 79
MCB (F )
beschreibende Matrix von F , Seite 80
MCB
Matrix des Basiswechsels con B nach C, Seite 84
L(A, b)
L¨ osungsraum des LGS A · x = b, Seite 92
B∗ , C ∗ , D∗
duale Basis, Seite 98
Altk (V )
Vektorraum der alternierenden k-Formen, Seite 106
det
Determinante, Seite 107
Diag(α1 , . . . , αn )
Diagonalmatrix, Seite 108
SL(n, K)
spezielle lineare Gruppe, Seite 111
Aad
adjungierte Matrix, Seite 115
Eig(F, λ)
Eigenraum von F zum Eigenwert λ, Seite 118
m(λ)
geometrische Vielfachheit, Seite 122
χF
Charakteristisches Polynom von F , Seite 123
Spur(A)
Spur von A, Seite 124
μF (λ)
algebraische Vielfachheit, Seite 126
pF
Minimalpolynom, Seite 133
H(F, λ)
Hauptraum, Seite 137
K
R oder C, Seite 144
v, w
Skalarprodukt, Seite 145
MB (Φ)
Strukturmatrix von Φ, Seite 148
d(x, y)
Abstand, Seite 153
2
euklidische Norm, Seite 154
∠
Winkel, Seite 155
O(n)
orthogonale Gruppe, Seite 172
SO(n)
spezielle orthogonale Gruppe, Seite 172
U(n)
unit¨ are Gruppe, Seite 172
Symbolverzeichnis
239
An (K)
affiner n-dimensionaler Standardraum, Seite 189
F∗
zu adjungierte Abbildung, Seite 176
M
affine H¨ ulle von M , Seite 190
p∨q
Verbindungsraum von p und q, Seite 191
parallel, Seite 194
Fˆ
die der affinen Abbildung F zugeordnete lineare Abbildung, Seite 195
TV
Teilverh¨ altnis, Seite 196
pdim
projektive Dimension, Seite 201
P(V )
projektiver Raum, Seite 201
Pn (K)
projektiver Standardraum, Seite 202
P(F )
der linearen Abbildung F zugeordnete projektive Abbildung, Seite 206
DV
Doppelverh¨ altnis, Seite 212
Sign
Signum einer Matrix, Seite 227
S(A)
Spaltenraum der Matrix A, Seite 74
Sn
symmetrische Gruppe, Seite 4
U ֒→ V
Inklusionsabbildung, Seite 54
U +W
Summe der Unterr¨ aume U und W , Seite 49
U ⊕W
direkte Summe von Unterr¨ aumen, Seite 50
U0
Annulator von U , Seite 99
v•w
Standardskalarprodukt in Kn , Seite 147
V /U
Quotientenvektorraum, Seite 62
v⊥w
v und w sind orthogonal, Seite 160
V∗
dualer Vektorraum (= HomK (V, K)), Seite 98
V∗
dualer Vektorraum, Seite 98
VA
Translationsraum, Seite 188
U ∈S
Verbindungsraum, Seite 190
240
Symbolverzeichnis
vB
Koordinatenvektor von v bez¨ uglich B, Seite 80
x•y
Standardskalarprodukt, Seite 147
xT
Transponierte des Spaltenvektors x ∈ K n , Seite 68
Z(A)
Zeilenraum der Matrix A, Seite 74
(j,k)
Transposition, Seite 18
A,B,C,. . .
i. d. R. Matrizen, Seite 67
LGS
Lineares Gleichungssystem, Seite 92
Namen- und Sachverzeichnis Abbildung, 1 – adjungierte, 176–181 – affine, 195 – duale, 100, 101 – lineare, 52 – orthogonale, 170 – projektive, 206 – selbstadjungierte, 181–187 – unit¨ are, 170 Abel, Nils Henrik (1802-1829), 1 abelsch, 1 Abstandsfunktion, 153 adjungierte Abbildung, 177, 178 Adjunkte, 115 ahnlich, 119, 125 ¨ aquivalent ¨ – affin, 224, 230 – geometrisch, 224 ¨ Aquivalenz – affiner Quadriken, 230 – Matrizen, 79 – projektiver Quadriken, 224 – von Matrizen, 78 – von Normen, 153 ¨ Aquivalenzrelation, 119 affin unabh¨ angig, 197 affine Ebene, 61 affine Gerade, 61 affine H¨ ulle, 190 affiner Anteil, 220 affiner Raum, 188 affiner Unterraum, 61 Affinit¨ at, 195 Affinkombination, 198 algebraischer Abschluss, 24 alternierend, 104, 105 alternierende k-Form, 104, 106 alternierende Gruppe, 20, 21 Annulator, 99 antisymmetrisch, 104 Assoziativgesetz, 1 assoziiert, 32 Automorphismengruppe, 4 Automorphismus, 9, 53 Banach, Stefan (1892-1945), 152 Banachraum, 152 Basis, 44 – affine, 197
– duale, 98 – eines Vektorraums, 44 – orthonormale, 163 – projektive, 207 Basisauswahlsatz, 45 Basisbildersatz, 57, 66 Basiserg¨ anzungssatz, 45 Basiswechselformalismus, 85 Basiswechselmatrix, 84, 85 Begleitmatrix, 125 Bild, 56 – einer linearen Abbildung, 56 Bilinearform, 144 – alternierende, 144 – symmetrische, 144 Blockmatrix, 113 Brianchon, Charles Julien, 219 Cauchy, Augustin (1789-1857), 154 Cauchy-Schwarz’sche Ungleichung, 154 Cayley, Arthur (1821-1895), 17, 133 Cayley-Hamilton, Satz von, 133 Charakteristik eines K¨ orpers, 24 charakteristisches Polynom, 123, 124 Cramer, Gabriel (1704-1752), 109 Cramer’sche Regel, 109, 110 Desargues, G´ erard (1591-1661), 215 Descartes, Ren´e (1596-1650), 226 Determinante – einer Matrix, 107–109 – eines Endomorphismus, 111 – Rechenregeln, 108, 110 – Transpositionsinvarianz, 112 Determinantenform, 104 Determinantenmultiplikationssatz, 110 diagonalisierbar, 117, 121, 122 Diagonalmatrix, 108 Dimension, 47 – affine, 189 – eines affinen Unterraums, 61, 190 – projektive, 201 Dimensionsformel – f¨ ur den Verbindungsraum, 193 – f¨ ur lineare Abbildungen, 59 – f¨ ur projektive Unterr¨ aume, 202 – f¨ ur Untervektorr¨ aume, 49 direktes Produkt von Gruppen, 4 Distributivgesetze, 22
242
Doppelverh¨ altnis, 212 Drehung, 71, 73 Drei-Zyklus, 21 Dreiecksungleichung, 153 Dualit¨ at, 218 Dualraum, 98 Durchschnitt – affiner Unterr¨ aume, 190 – linearer Unterr¨ aume, 39 – projektiver Unterr¨ aume, 202 Ebene, 190 Eigenraum, 117–119 Eigenvektor, 117–119 Eigenwert, 117–119 Einschr¨ ankung, 64 Einsetzungshomomorphismus, 30, 130, 131 Elementarabbildungen, 82 Elementarmatrix, 89 Ellipse, 233 Ellipsoid, 233 elliptisches Paraboloid, 229 endlich erzeugt, 41 Endomorphismus, 9, 53 – normaler, 182 – selbstadjungierter, 181–187 Entwicklungssatz von Laplace, 115 Epimorphismus, 9, 53 Erweiterungsk¨ orper, 38 Erzeugendensystem, 41 Erzeugnis, 41 Euklid, (etwa 365-300 v. Chr.), 146 euklidischer Ring, 30 f -invariant, 117 Faktorisierungssatz, 64 Faser, 63 Fehlstand, 18 Fermat, Pierre de (1607-1655), 14 Funktionenraum, 152 Gauß-Jordan’sche Normalform, 77 Gauss, Carl Friedrich (1777-1855), 86 Gauß’sches Eliminationsverfahren, 88 Gerade, 190 gr¨ oßter gemeinsamer Teiler, 34 Grad eines Polynoms, 29 Gram, Jørgen (1850-1916), 163 Gruppe, 1 – abelsche, 1, 6 – allgemeine lineare, 4, 77 – orthogonale, 172 – spezielle lineare, 17, 111 – spezielle orthogonale, 172 – symmetrische, 4
Namen- und Sachverzeichnis
– unit¨ are, 172 – zyklische, 8 Hamilton, Sir William (1805-1865), 133 Hamilton, William Rowan (1805-1865), 23 Hauptachsentransformation, 183, 184, 224 Hauptraum, 137 Hauptraumzerlegung, 140 Hermite, Charles (1822-1901), 145 hermitesche Form, 145 Hilbert, David (1862-1943), 152 Hilbertraum, 152 Homomorphiesatz – f¨ ur Gruppen, 16 – f¨ ur Ringe, 27 – f¨ ur Vektorr¨ aume, 64 Homomorphismus, 9, 53 Hyperbel, 233 Hyperboloid – einschaliges, 233 – zweischaliges, 229, 233 Hyperebene, 61, 194, 220 Ideal, 25 identische Abbildung, 53 Index einer Untergruppe, 13 Inklusionsabbildung, 54 Integrit¨ atsring, 23, 29 Invarianzsatz f¨ ur ¨ aquivalente Matrizen, 79 inverses Element, 1, 2 invertierbar, 76 Invertierbarkeitskriterium, 77, 109, 110 irreduzibel, 32 Isometrie, 170 isomorph, 9 Isomorphismus, 9, 11, 53 Jordan, Camille (1838-1922), 117, 141 Jordan’sche Normalform, 117, 141 K-Algebra, 74 K¨ orper, 21, 22 kanonische Projektion, 10, 15 Kegel, 233 Kern – einer linearen Abbildung, 56 – eines Gruppenhomomorphismus, 11 Kern eines Homomorphismus, 11, 12 Klassifikationstheorem – f¨ ur affine Quadriken, 231 – f¨ ur projektive Quadriken, 227 kleiner Fermat’scher Satz, 14 K-linear, 53 kollinear, 196 Kollineation, 200
Namen- und Sachverzeichnis
243
kommutativ, 1 Komplement – orthogonales, 160 Komplement eines Unterraums, 50 komplexe Konjugation, 54 komplexe Zahlen, 38 Koordinaten – homogene, 202 Koordinatensystem, 79 – affines, 198 – projektives, 209 Koordinatenvektor, 80 K¨ urzungsregel, 5 Kugel, 228
– Summe, 68 – symmetrische, 148, 181 – unit¨ are, 171 – Zeilenindex, 68 – Zeilenrang, 75 – Zeilenraum, 74 Maximumsnorm, 158 Mengenlehre, 1 Metrik, 152, 153 metrischer Raum, 152 Minimalpolynom, 133 Monomorphismus, 9 multilinear, 104 Multilinearform, 104
L¨ osungsraum, 92 Lagrange, Joseph-Louis (1736-1813), 14 Laplace, Pierre Simon (1749-1827), 115 Legendre, Adrien-Marie (1752-1833), 165 Legendre-Polynome, 165 Leibniz, Gottfried Wilhelm (1646-1716), 112 Leibniz’sche Determinantenformel, 112 linear abh¨ angig, 42 linear unabh¨ angig, 42 lineare Abbildung, 53 Lineares Gleichungssystem, 92 – homogenes, 92 – inhomogenes, 92 Linearform, 98 Linearkombination, 40 – eines unendlichen Systems, 40 links-, rechtsinvers, 2 links-, rechtsneutral, 2 Linksnebenklasse, 12
nat¨ urliche Projektion, 63 neutrales Element, 1, 2 nicht-ausgeartet, 151 nilpotent, 129, 138 Nilpotenzindex, 138 Norm, 151 – euklidische, 152 – in euklidischen und unit¨ aren Vektorr¨ aumen, 155 normal, 179 Normalform – einer Matrix, 81 Normalformensatz, 81 Normalgleichung, 168 Normalteiler, 15, 16 normiert, 107 normierter Raum, 152 Nullform, 105 Nullstelle eines Polynoms, 35
Matrix, 67 ¨ – Aquivalenz, 79 – adjungierte, 115 – als lineare Abbildung, 68, 69, 80, 81 – beschreibende, 80, 81 – der dualen Abbildung, 100 – einer Bilinearform, 148 – eines Basiswechsels, 85 – eines nilpotenten Endomorphismus, 138 – hermitesche, 148, 181 – inverse, 76, 90 – invertierbare, 76, 77 – linksinverse, 77 – orthogonale, 171 – Produkt, 71, 72 – Rang, 75, 78 – rechtsinverse, 77 – skalares Vielfaches, 68 – Spaltenindex, 68 – Spaltenrang, 75 – Spaltenraum, 74
Optimall¨ osung, 167 Ordnung – einer Gruppe, 7 – eines Gruppenelements, 7 orthogonal, 160 Orthogonalsystem, 162 Orthonormalbasis, 163 Orthonormalisierungsverfahren, 163 Orthonormalsystem, 162 Ortsvektor, 189 Pappos von Alexandria (um 300 n. Chr.), 216 Parabel, 233 Paraboloid – elliptisches, 233 – hyperbolisches, 233 parallel, 61, 193 Parallelogramm-Gleichung, 157 Permutation, 6
244
– gerade, ungerade, 20 Permutationsgruppe, 4 Perspektivit¨ at, 210 Polynom, 28 – homogenes, 219 Polynomring, 23, 28, 37 positiv definit, 145 positiv semidefinit, 145 Primelement, 32 Primfaktorzerlegung, 33 Primk¨ orper, 25 Projektion – eines Unterraums, 158 – orthogonale, 161 projektive Dimension, 201 projektiver Abschluss, 205, 220 projektiver Raum, 201 Projektivit¨ at, 206 Proximum, 161 Pythagoras (etwa 580-500 v. Chr.), 157 QR-Zerlegung, 169 quadratische Form, 150 Quadrik – affine, 230 – projektive, 219 Quaternionenschiefk¨ orper, 23 Quotientenring, 26 Quotientenvektorraum, 62 Radikal, 151 Rang – der dualen Abbildung, 101 – einer linearen Abbildung, 58, 75 – einer Matrix, 75, 109 – eines endlichen Systems von Vektoren, 47 Rechtsnebenklasse, 12 Regelfl¨ ache, 228 Restklassengruppe, 4 Restklassenring, 26 Riemann, Bernhard (1826-1866), 147 Ring, 21 – der Polynome, 37 – euklidischer, 31 – kommutativer, 22 – mit Eins, 22 Satz – u ¨ber die Hauptachsentransformation, 183, 184 – u ¨ber die Hauptraumzerlegung, 138 – des Pythagoras, 157 – von Brianchon, 219 – von Cayley, 17 – von Desargues, 215
Namen- und Sachverzeichnis
– von Lagrange, 14 – von Pappos, 216 Schiefk¨ orper, 21–23 schiefsymmetrisch, 104 Schmidt, Erhard (1876-1959), 163 Schwarz, Hermann Amandus (1843-1921), 154 selbstadjungiert, 181–187 Sesquilinearform, 144 Skalarprodukt, 145 Spaltenrang, 102 Spaltenumformung, elementare, 87 Spektralsatz – f¨ ur normale Endomorphismen, 180 – f¨ ur selbstadjungierte Endomorphismen, 183, 184 Spur, 124 Standardbasis, 70 Standardraum – affiner, 189 – projektiver, 202 Standardskalarprodukt, 147, 164 Strukturmatrix, 148 Summe von Untervektorr¨ aumen, 49 Sylvester, James (1814-1897), 186 symmetrische Bilinearform, 223 symmetrische Gruppe, 4 Teilverh¨ altnis, 196 Tr¨ agheitssatz von Sylvester, 186 , 227 Transformationsformel f¨ ur Strukturmatrizen, 149 Translation, 188 Translationsraum, 188 Transponierte, 68 Transposition, 18, 19 trigonalisierbar, 128 Umkehrabbildung, 55 unabh¨ angig – affin, 197 – linear, 42 – projektiv, 207 uneigentlicher Anteil, 230 unendlich ferne Gerade, 203 unendlich-dimensional, 47 Untergruppe, 12 Unterraum, 38, 40 – affiner, 190 – projektiver, 201 Untervektorraum, 38 unverk¨ urzbar, 44 unverl¨ angerbar, 44
Namen- und Sachverzeichnis
Vektorraum, 36, 37 – Axiome, 36 – dualer, 98 – euklidischer, 146 – Isomorphie zu K n , 80 – Rechenregeln, 36 – unendlich-dimensionaler, 98 – unit¨ arer, 146 verallgemeinerter Eigenraum, 137 Verbindungsraum, 190 Verkettung – affiner Abbildungen, 196 – linearer Abbildungen, 55 Verkn¨ upfungstafel, 5 Vielfachheit – algebraische, 126 – geometrische, 121 vollst¨ andig, 152 Vorzeichen einer Permutation, 18, 19 Vorzeichenregel von Descartes, 226 Weierstrass, Karl, 104 windschief, 193 Winkel, 155 wohldefiniert, 15, 25, 65, 111 Zeilenrang, 102 Zeilenstufenform, 86 Zeilenumformung, elementare, 87 zyklische Gruppe, 14 Zylinder – elliptischer, 233 – hyperbolischer, 233 – parabolischer, 233
245