Skriptum zur Vorlesung Mathematische Logik Klaus Gloede Mathematisches Institut der Universit¨at Heidelberg (Stand der Neubearbeitung: 25.04.2005) Wintersemester 2004/05
INHALTSVERZEICHNIS
i
Inhaltsverzeichnis I
Strukturen, formale Sprachen, Modelle
1
Mengen von Mengen von . . . 1.1 Mengentheoretische Grundbegriffe . . . . . . . . . . 1.2 Relationen und Funktionen . . . . . . . . . . . . . . 1.2.1 Injektive, surjektive und bijektive Funktionen 1.3 Ordnungen und Wohlordnungen . . . . . . . . . . . 1.3.1 Teilweise und lineare Ordnungen . . . . . . 1.3.2 Wohlordnungen . . . . . . . . . . . . . . . . 1.3.3 Auswahlaxiom (AC) . . . . . . . . . . . . . 1.4 M¨achtigkeiten und Kardinalzahlen . . . . . . . . . . 1.4.1 Endliche und abz¨ahlbare Mengen . . . . . . 1.4.2 Eigenschaften abz¨ahlbarer Mengen . . . . . 1.4.3 Vergleich von M¨achtigkeiten . . . . . . . . . 1.4.4 Kardinalzahlen . . . . . . . . . . . . . . . . 1.4.5 Arithmetik unendlicher Kardinalzahlen . . . 1.4.6 Das Kontinuumsproblem . . . . . . . . . . .
2
Strukturen und formale Sprachen 2.1 Strukturen . . . . . . . . . . . . . . . . . . 2.1.1 Beispiele . . . . . . . . . . . . . . 2.1.2 Mehrsortige Strukturen . . . . . . . 2.1.3 Symbole f¨ur formale Sprachen . . . 2.2 Unterstrukturen und Morphismen . . . . . . 2.2.1 Beispiele . . . . . . . . . . . . . . 2.2.2 Satz u¨ ber Unterstrukturen . . . . . 2.2.3 Homomorphes Bild, Identifizierung 2.3 Terme einer Sprache . . . . . . . . . . . . 2.3.1 Interpretation von Termen . . . . .
1
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . . . . . .
4 4 5 6 7 7 8 10 11 11 12 13 13 15 16
. . . . . . . . . .
18 18 19 19 20 22 23 24 24 25 25
INHALTSVERZEICHNIS
2.4
3
4
ii
2.3.2 Spracherweiterung durch Namen . . . . . . . . 2.3.3 Satz u¨ ber erzeugte Unterstrukturen . . . . . . . Formeln einer Sprache . . . . . . . . . . . . . . . . . 2.4.1 Beweis durch Induktion u¨ ber den Formelaufbau 2.4.2 Freie und gebundene Variable . . . . . . . . . 2.4.3 Substitution . . . . . . . . . . . . . . . . . . .
Modelle und Theorien 3.1 Das Wahrheitspr¨adikat: Modelle . . . . . . . . . . 3.1.1 Satz u¨ ber neue Konstanten . . . . . . . . . 3.2 Axiome und Theorien . . . . . . . . . . . . . . . . 3.3 Der Kompaktheitssatz und einige Folgerungen . . . 3.3.1 Kompaktheitssatz . . . . . . . . . . . . . . 3.3.2 Satz u¨ ber die Existenz unendlicher Modelle 3.4 Diagramme . . . . . . . . . . . . . . . . . . . . . 3.4.1 Diagrammlemma . . . . . . . . . . . . . . 3.4.2 Universelle Theorien . . . . . . . . . . . . 3.4.3 Modellerweiterungssatz von Keisler . . . . 3.4.4 Erhaltungssatz f¨ur universelle Formeln . . 3.4.5 Satz von Ło´s-Tarski . . . . . . . . . . . . 3.5 Einige mathematische Theorien . . . . . . . . . . 3.5.1 Gruppen- und K¨orpertheorie . . . . . . . . 3.5.2 Axiomatisierbarkeit: Elementare Klassen . 3.5.3 Zahlentheorie . . . . . . . . . . . . . . . . 3.5.4 Mengenlehre . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
Grundlagen der Modelltheorie ¨ 4.1 Vollst¨andigkeit und elementare Aquivalenz . . . . . . ¨ 4.1.1 Elementare Aquivalenz . . . . . . . . . . . . . 4.1.2 Die Theorie der dichten linearen Ordnung . . . 4.1.3 Isomorphiesatz von Cantor . . . . . . . . . . . 4.1.4 Bemerkungen . . . . . . . . . . . . . . . . . . 4.2 Elementare Substrukturen und Einbettungen . . . . . . 4.2.1 Diagrammlemma (Fortsetzung) . . . . . . . . 4.2.2 Kriterium von Tarski . . . . . . . . . . . . . . 4.2.3 Satz von L¨owenheim-Skolem-Tarski (abw¨arts) 4.2.4 Satz von L¨owenheim-Skolem-Tarski (aufw¨arts)
. . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . .
. . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . .
. . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . .
. . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . .
. . . . . .
. . . . . . . . . . . . . . . . .
. . . . . . . . . .
. . . . . .
26 27 28 29 29 31
. . . . . . . . . . . . . . . . .
32 32 34 35 36 36 37 38 38 39 40 41 41 42 42 43 44 47
. . . . . . . . . .
50 50 50 52 53 54 55 55 56 57 58
INHALTSVERZEICHNIS
4.3
4.4
4.5
4.6
Kategorizit¨at . . . . . . . . . . . . . . . . . . . . . 4.3.1 Isomorphiesatz f¨ur endliche Modelle . . . . . 4.3.2 Test von Vaught . . . . . . . . . . . . . . . . Vereinigungen und Durchschnitte von Strukturen . . 4.4.1 Durchschnitt . . . . . . . . . . . . . . . . . 4.4.2 Vereinigung . . . . . . . . . . . . . . . . . . 4.4.3 Ketten von Strukturen . . . . . . . . . . . . 4.4.4 Satz u¨ ber Ketten von Strukturen . . . . . . . 4.4.5 Erhaltungssatz f¨ur Ketten . . . . . . . . . . . 4.4.6 Satz von Chang- Ło´s-Szusko . . . . . . . . . Produkte und Ultraprodukte . . . . . . . . . . . . . 4.5.1 Direktes Produkt . . . . . . . . . . . . . . . 4.5.2 Filter und Ultrafilter . . . . . . . . . . . . . 4.5.3 Ultrafiltersatz, Boolesches Primidealtheorem 4.5.4 Reduziertes Produkt . . . . . . . . . . . . . 4.5.5 Satz von Ło´s . . . . . . . . . . . . . . . . . 4.5.6 Kompaktheitssatz . . . . . . . . . . . . . . . Modellvollst¨andigkeit . . . . . . . . . . . . . . . . . 4.6.1 Robinsonscher Test . . . . . . . . . . . . . .
iii
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
59 59 59 60 61 61 61 62 63 64 64 65 65 67 67 68 71 72 74
II Collegium Logicum
76
5
79 80 80 81 82 83 85 85 85 86 87 89 89 90
Die Aussagenlogik 5.1 Syntax der Aussagenlogik . . . . . . . . . . . . . . . . . 5.1.1 Definition der aussagenlogischen Formeln . . . . . 5.1.2 Klammerregeln . . . . . . . . . . . . . . . . . . . 5.1.3 Induktion und Rekursion . . . . . . . . . . . . . . 5.1.4 Beweis durch Induktion u¨ ber den Formelaufbau . . 5.1.5 Definition durch Rekursion u¨ ber den Formelaufbau 5.2 Semantik der Aussagenlogik . . . . . . . . . . . . . . . . 5.2.1 Wahrheitsfunktionen . . . . . . . . . . . . . . . . 5.2.2 Interpretation von aussagenlogischen Formeln . . . 5.2.3 Definition der wichtigsten semantischen Begriffe . 5.2.4 Einige wichtige allgemeing¨ultige Formeln . . . . . ¨ 5.2.5 Einige wichtige Aquivalenzen . . . . . . . . . . . 5.2.6 Boolesche Gesetze . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
INHALTSVERZEICHNIS
5.3
5.4 5.5
5.6
6
iv
5.2.7 Einsetzungsregel . . . . . . . . . . . . . . . . . . . . 5.2.8 Ersetzungsregel . . . . . . . . . . . . . . . . . . . . . Normalformen . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.1 Boolesche Umformung . . . . . . . . . . . . . . . . . 5.3.2 Entscheidungsverfahren f¨ur Boolesche Normalformen 5.3.3 Boolescher Repr¨asentationssatz . . . . . . . . . . . . 5.3.4 Das Dualit¨atsprinzip . . . . . . . . . . . . . . . . . . Der semantische Folgerungsbegriff: Erf¨ullbarkeit . . . . . . . 5.4.1 Zusammenhang zwischen Folgerung und Erf¨ullbarkeit Der syntaktische Folgerungsbegriff: Beweisbarkeit . . . . . . 5.5.1 Axiomensysteme und Beweise . . . . . . . . . . . . . 5.5.2 Korrektheit und Vollst¨andigkeit . . . . . . . . . . . . 5.5.3 Beispiele von Axiomensystemen . . . . . . . . . . . . Vollst¨andigkeit und Kompaktheit . . . . . . . . . . . . . . . . 5.6.1 Verallgemeinerte Expansion . . . . . . . . . . . . . . 5.6.2 Lemma u¨ ber die Negation . . . . . . . . . . . . . . . 5.6.3 Tautologiesatz . . . . . . . . . . . . . . . . . . . . . 5.6.4 Deduktionstheorem . . . . . . . . . . . . . . . . . . . 5.6.5 Widerspruchsfreiheit und Vollst¨andigkeit von Theorien 5.6.6 Lemma u¨ ber Beweisbarkeit und Konsistenz . . . . . . 5.6.7 Vervollst¨andigung . . . . . . . . . . . . . . . . . . . 5.6.8 Verallgemeinerter Vollst¨andigkeitssatz . . . . . . . . . 5.6.9 Kompaktheitssatz der Aussagenlogik . . . . . . . . .
Die Pr¨adikatenlogik 6.1 Ein Axiomensystem f¨ur die Pr¨adikatenlogik 6.1.1 Axiomensystem von Shoenfield . . 6.1.2 Definition eines Beweises . . . . . 6.2 Der Tautologiesatz . . . . . . . . . . . . . 6.3 Substitution und universeller Abschluss . . 6.3.1 Hintere Generalisierung . . . . . . 6.3.2 Satz u¨ ber die Generalisierung . . . 6.3.3 Substitutionsregel . . . . . . . . . . 6.3.4 Substitutionssatz . . . . . . . . . . 6.3.5 Abschluss-Satz . . . . . . . . . . . 6.4 Ersetzung und Umbenennung, Gleichheit . 6.4.1 Ersetzungstheorem . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
90 91 92 92 94 95 96 98 99 100 100 101 102 104 106 107 107 108 108 109 110 110 111
. . . . . . . . . . . .
112 112 113 114 115 117 118 118 119 119 121 121 121
INHALTSVERZEICHNIS
v
6.4.2 Eigenschaften des Gleichheitspr¨adikates . . . . . . . . . . 6.5 Pr¨anexe Normalformen . . . . . . . . . . . . . . . . . . . . . . . 6.5.1 Umformungen mit der Negation . . . . . . . . . . . . . . 6.5.2 Umformungen mit Konjunktion und Disjunktion . . . . . 6.5.3 Umformungen mit der Implikation . . . . . . . . . . . . . 6.5.4 Das Dualit¨atsprinzip f¨ur die Pr¨adikatenlogik . . . . . . . . 6.6 Das Deduktionstheorem . . . . . . . . . . . . . . . . . . . . . . . 6.7 Erweiterungen von Theorien, Widerspruchsfreiheit . . . . . . . . 6.7.1 Erweiterungen und Expansionen . . . . . . . . . . . . . . 6.7.2 Satz u¨ ber rein sprachliche Erweiterungen von Theorien . . 6.7.3 Widerspruchsfrei/widerspruchsvoll . . . . . . . . . . . . 6.7.4 Beweisbarkeit und Widerspruchsfreiheit . . . . . . . . . . 6.8 Termmodelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.8.1 Kanonische Struktur einer Theorie, Termstruktur . . . . . 6.8.2 Satz u¨ ber Termmodelle . . . . . . . . . . . . . . . . . . . 6.9 Vervollst¨andigung von Theorien . . . . . . . . . . . . . . . . . . 6.9.1 Satz von Lindenbaum . . . . . . . . . . . . . . . . . . . 6.10 Henkin-Theorien . . . . . . . . . . . . . . . . . . . . . . . . . . 6.10.1 Henkin-Erweiterungen . . . . . . . . . . . . . . . . . . . 6.11 Der G¨odelsche Vollst¨andigkeitssatz . . . . . . . . . . . . . . . . . 6.11.1 Vollst¨andigkeit der Pr¨adikatenlogik / Modellexistenz-Satz 6.11.2 Satz von L¨owenheim . . . . . . . . . . . . . . . . . . . . 6.11.3 Kompaktheitssatz . . . . . . . . . . . . . . . . . . . . . .
III 7
¨ Naturliche Zahlen und Unvollst¨andigkeit Berechenbare Funktionen 7.1 Turing-Maschinen . . . . . . . . . . . . . . 7.2 URM-berechenbare Funktionen . . . . . . 7.3 Churchsche These . . . . . . . . . . . . . . 7.4 Aufz¨ahlbarkeitss¨atze . . . . . . . . . . . . 7.5 Primitiv-rekursive Funktionen . . . . . . . 7.5.1 Abschlusseigenschaften . . . . . . 7.6 Rekursive und partiell-rekursive Funktionen
. . . . . . .
. . . . . . .
. . . . . . .
122 124 124 124 125 127 129 131 131 133 135 136 137 137 138 139 140 141 142 144 144 146 147
148 . . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
151 151 153 154 155 155 157 158
INHALTSVERZEICHNIS
8
9
¨ die naturlichen ¨ Eine Basistheorie fur Zahlen − 8.1 Axiome von PA . . . . . . . . . . . . . . . . . 8.2 Enderweiterungen . . . . . . . . . . . . . . . . . 8.3 Arithmetische Formeln . . . . . . . . . . . . . . 8.4 Erhaltungseigenschaften unter Enderweiterungen Definierbarkeit berechenbarer Funktionen 9.1 Lemma . . . . . . . . . . . . . . . . . . . . 9.2 G¨odels Lemma . . . . . . . . . . . . . . . . 9.3 Definierbarkeitssatz f¨ur rekursive Funktionen 9.4 Repr¨asentierbarkeit . . . . . . . . . . . . . .
10 Unvollst¨andigkeit und Unentscheidbarkeit 10.1 G¨odel-Nummern . . . . . . . . . . . . . 10.2 Diagonalisierungslemma . . . . . . . . . 10.3 Satz von G¨odel-Rosser . . . . . . . . . . 10.4 1. G¨odelscher Unvollst¨andigkeitssatz . . . 10.5 2. G¨odelscher Unvollst¨andigkeitssatz . . . 10.6 Wahrheit ist nicht arithmetisch definierbar 10.7 Unentscheidbarkeit . . . . . . . . . . . .
IV
vi
Reelle Zahlen und Entscheidbarkeit
. . . . . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . .
. . . . . . .
. . . .
. . . .
. . . . . . .
. . . .
. . . .
. . . . . . .
. . . .
. . . .
. . . . . . .
. . . .
. . . .
. . . . . . .
. . . .
. . . .
. . . . . . .
. . . .
. . . .
. . . . . . .
. . . .
. . . .
. . . . . . .
. . . .
161 161 163 164 166
. . . .
168 168 170 171 172
. . . . . . .
175 175 176 177 178 180 180 181
184
11 Quantorenelimination 185 11.1 Theorie der reellen Zahlen . . . . . . . . . . . . . . . . . . . . . 185 11.2 Effektive Funktionen . . . . . . . . . . . . . . . . . . . . . . . . 186 12 Entscheidbarkeit 192 12.1 Reell-abgeschlossene K¨orper . . . . . . . . . . . . . . . . . . . . 192 12.2 Presburger-Arithmetik . . . . . . . . . . . . . . . . . . . . . . . 193 13 Literatur
196
1
Teil I Strukturen, formale Sprachen, Modelle
2
Einleitung Dass Mathematik und logisches Denken miteinander verkn¨upft sind, ist eine bekannte Schulweisheit; wie eng tats¨achlich die Verbindung ist, soll in dieser Vorlesung an zwei Beispielen gezeigt werden: Es handelt sich um die beiden grundlegenden mathematischen Strukturen • die nat¨urlichen Zahlen N mit ihren u¨ blichen Rechenoperationen +, · und • die reellen Zahlen R, ebenfalls mit +, · sowie der <-Beziehung. Wir werden nachweisen, dass - entgegen dem ersten Anschein - die reellen Zahlen eine einfachere Struktur als die nat¨urlichen Zahlen besitzen, und zwar ist • die Theorie der nat¨urlichen Zahlen unentscheidbar und nicht vollst¨andig axiomatisierbar, w¨ahrend • die Theorie der reellen Zahlen ein Entscheidungsverfahren zul¨asst und eine einfache Axiomatisierung (als reell-abgeschlossener K¨orper) besitzt. Warum l¨asst sich ein Entscheidungsverfahren f¨ur reelle Zahlen nicht u¨ bertragen auf den Teilbereich der nat¨urlichen Zahlen? Der Grund liegt darin, dass zwar jede einzelne nat¨urliche Zahl 0, 1, 2 . . . im K¨orper der reellen Zahlen definierbar ist, nicht aber der allgemeine Begriff “n ist eine nat¨urliche Zahl”. Allerdings gilt letzteres nur, wenn man den Definierbarkeitsbegriff genau festlegt, was eine der Hauptaufgaben der Mathematischen Logik ist. Bevor wir mit der Mathematischen Logik im engeren Sinne beginnen, wollen wir den f¨ur die moderne Mathematik grundlegenden Begriff der Struktur einf¨uhren: Strukturen kommen vor als • relationale Strukturen: Ordnungen, Graphen, B¨aume . . . • algebraische Strukturen: Gruppen, Ringe, K¨orper, Vektorr¨aume . . . • gemischte Strukturen: topologische Gruppen, angeordnete K¨orper, geometrische R¨aume . . . Verschiedene Strukturen k¨onnen sich in bestimmten Eigenschaften unterscheiden, pr¨azisieren werden wir den Eigenschaftsbegriff mit Hilfe formaler Sprachen.
3
Beliebige Eigenschaften kann man zusammenfassen als Axiome einer (m¨oglicherweise widerspruchsvollen) Theorie T. Erf¨ullt eine Struktur M die Axiome einer Theorie T, sind also alle Axiome wahr in der Struktur, so nennt man M ein Modell dieser Theorie. Schließlich legen wir fest: Eine Aussage ist (logisch) wahr oder allgemeing¨ultig genau dann, wenn sie in allen Strukturen wahr ist. F¨ur eine gen¨ugend allgemeine Definition des Begriffes der Struktur m¨ussen wir auf den Mengenbegriff zur¨uckgreifen; damit werden Strukturen zu Mengen (von Mengen), und auch die auf ihnen erkl¨arten Relationen und Funktionen k¨onnen in der n¨otigen Allgemeinheit auf den Mengenbegriff zur¨uckgef¨uhrt werden. Eine strenge Begr¨undung dieses Begriffes m¨ussen wir zun¨achst zur¨uckstellen; stattdessen werden wir ihn nur lose umschreiben und vor allem die wichtigsten Bezeichnungen einf¨uhren, wie sie auch in anderen Gebieten der Mathematik gebr¨auchlich sind. Insbesondere wollen wir uns mit den logischen Symbolen vertraut machen: a∈A
a ist Element von A
¬
nicht
∨
oder
∧
und
=⇒
wenn . . . , dann
⇐⇒
genau dann, wenn (im Englischen: iff)
∃
existiert
∃!
es existiert genau ein
∀
f¨ur alle
Diese Zeichen benutzen wir zun¨achst informal als Abk¨urzungen f¨ur die entsprechenden umgangssprachlichen Ausdr¨ucke, sp¨ater werden wir sie auch als formale Symbole verwenden, dann aber → (statt =⇒) und ↔ (statt ⇐⇒ ) schreiben, obwohl wir auch f¨ur die anderen Zeichen zwischen formalem und (meta-) sprachlichem Gebrauch streng unterscheiden sollten. Tats¨achlich ist es gerade in der Modelltheorie oft sehr aufwendig, eine korrekte Trennung zwischen beiden ¨ Sprachebenen durchzuhalten, andererseits eine gute Ubung, aus dem jeweiligen Zusammenhang die genaue Bedeutung zu erschließen. Im Zweifelsfall werden wir entsprechende Hinweise geben.
4
Kapitel 1 Mengen von Mengen von . . . 1.1 Mengentheoretische Grundbegriffe Mengen sind bestimmt allein durch ihre Elemente (insbesondere unabh¨angig von deren Reihenfolge); daher werden zwei Mengen als gleich definiert, wenn sie dieselben Elemente enthalten (wobei die Elemente ihrerseits nat¨urlich wieder Mengen sind): Extensionalit¨atsprinzip
A = B :⇐⇒ ∀x(x ∈ A ⇐⇒ x ∈ B)
Von der Element-Beziehung zu unterscheiden ist die Teilmengen-Beziehung (Inklusion) (auch wenn man in beiden F¨allen vom “Enthalten” spricht): A ⊆ B : ⇐⇒ ∀x(x ∈ A =⇒ x ∈ B) A ⊂ B : ⇐⇒ A ⊆ B ∧ A 6= B Somit kann man die Gleichheit zweier Mengen nachweisen, indem man zeigt, dass sie wechselweise ineinander enthalten sind: A = B ⇐⇒ A ⊆ B ∧ B ⊆ A Mengen werden meistens durch Eigenschaften eingef¨uhrt: {x | E(x)} bezeichnet die Menge aller Mengen x mit der Eigenschaft E(x). F¨ur bestimmte Eigenschaften (die aber im Normalgebrauch nicht vorkommen) kann diese Festlegung zu einem Widerspruch f¨uhren; indem die Bildung von Mengen mittels mengentheoretischer Axiome eingeschr¨ankt wird, versucht man, das Auftreten von Antinomien zu vermeiden. Solange allerdings die durch Eigenschaften eingef¨uhrten Mengen nicht “zu groß” sind, hat man keine Widerspr¨uche zu bef¨urchten. So bilden wir etwa die
5
1.2. R ELATIONEN UND F UNKTIONEN
0/ {a} {a, b} (a, b) (a, b, c) (a1 , . . . , an )
: = {x | x 6= x} : = {x | x = a} : = {x | x = a ∨ x = b} : = {{a}, {a, b}} : = (a, (b, c)) = (a1 , (a2 , . . . , an ))
leere Menge, Einermenge von a, Paarmenge, geordnetes Paar, Tripel und allgemeiner n-Tupel f¨ur n ≥ 3.
Die genaue Definition des geordneten Paares und des n-Tupels ist hier nicht wichtig, wir ben¨otigen nur ihre charakteristischen Eigenschaften: (a, b) = (c, d) ⇐⇒ a = c ∧ b = d, und allgemein: (a1 , . . . , an ) = (b1 , . . . , bn ) ⇐⇒ ai = bi f¨ur i = 1, . . . , n. Mittels geordneter Paare kann man Produkte von Mengen einf¨uhren: A×B An
:= {(x, y) | x ∈ A ∧ y ∈ B}, cartesisches Produkt, := {(x1 , . . . , xn ) | x1 , . . . , xn ∈ A}. n-faches Produkt von A.
Außerdem ben¨otigen wir die BOOLEschen Operationen: A∪B A∩B A\B
:={x | x ∈ A ∨ x ∈ B} :={x | x ∈ A ∧ x ∈ B} := {x | x ∈ A ∧ x 6∈ B}
Vereinigung von A mit B, Durchschnitt von A mit B, Komplement von B bez¨uglich A.
Diese Operationen f¨uhren von Mengen wieder zu Mengen; dagegen ist das absolute Komplement −B := {x | x 6∈ B} einer Menge B niemals eine Menge!
1.2 Relationen und Funktionen n-stellige Relationen identifizieren wir mit den n-Tupeln, die diese Relationen erf¨ullen: R ist n-stellige Relation auf A : ⇐⇒ R ⊆ An Im Falle einer 2-stelligen Relation schreiben wir dann auch wie u¨ blich: aRb : ⇐⇒ (a, b) ∈ R. Funktionen identifizieren wir mit ihren Graphen: F : A −→ B : ⇐⇒ F ⊆ A × B ∧ ∀x ∈ A ∃!y ∈ B (x, y) ∈ F
6
1.2. R ELATIONEN UND F UNKTIONEN
Hierf¨ur sagen wir auch: F ist Funktion von A nach B. F¨ur x ∈ A bezeichnet F(x) das eindeutig bestimmte y mit (x, y) ∈ F den Funktionswert von F an der Stelle x, und f¨ur D ⊆ A ist F D := {(x, F(x)) | x ∈ D} die Funktion F, eingeschr¨ankt auf D. Im Falle von Strukturen werden wir Funktionen F mit F : An → A betrachten; wir sagen dann auch, dass F eine n-stellige Funktion auf der Menge A ist. H¨aufig definiert man eine Funktion durch Angabe ihres Wertes F(x) f¨ur x ∈ A: F : A −→ B, x 7→ F(x). Unter den Funktionsbegriff f¨allt auch der Begriff der Familie: F¨ur eine Indexmenge I ist (xi )i∈I die Funktion f mit Definitionsbereich I und f (i) = xi f¨ur alle i ∈ I. Im Falle I = N spricht man auch von einer Folge, f¨ur I = {0, . . . , n − 1} entspricht die endliche Folge einem n-Tupel. 1.2.1 Injektive, surjektive und bijektive Funktionen Ist F : A −→ B, also F eine Abbildung von A nach B, so nennen wir • A Definitionsbereich von F, • B Bildbereich von F, und • W (F) := {F(x) | x ∈ A} Wertebereich von F. (Bild- und Wertebereich werden oft gerade in umgekehrter Weise bezeichnet!) Der Bildbereich B ist durch F nicht eindeutig bestimmt; er braucht n¨amlich den Wertebereich W (F) nur zu enthalten. Ist jedoch Bildbereich = Wertebereich, so heißt F surjektiv (oder: auf B): F : A B : ⇐⇒ F : A −→ B ∧ B = {F(x)|x ∈ A}. In diesem Fall gibt es also zu jedem b ∈ B mindestens ein a ∈ A mit F(a) = b.
7
1.3. O RDNUNGEN UND W OHLORDNUNGEN
Eine Funktion F : A −→ B heißt injektiv oder eineindeutig gdw es zu jedem b ∈ W (F) genau ein a ∈ A mit F(a) = b gibt, welches mit a = F −1 (b) als Urbild von b bezeichnet wird: F : A B : ⇐⇒ F : A −→ B ∧ ∀x, y ∈ A (F(x) = F(y) → x = y). F¨ur eine injektive F Funktion gibt es also eine inverse Funktion F −1 , und zwar ist F −1 : W (F) −→ A
f¨ur injektives F : A −→ B.
Eine Funktion F : A −→ B heißt bijektiv gdw F injektiv und surjektiv ist: F : A ←→ B : ⇐⇒ F : A B ∧ F : A B. F¨ur eine bijektive Funktion F : A ←→ B ist dann die inverse Funktion (oder Umkehrfunktion) eine (ebenfalls bijektive) Abbildung F −1 : B ←→ A mit F −1 (F(a)) = a, F(F −1 (b)) = b f¨ur alle a ∈ A, b ∈ B.
1.3 Ordnungen und Wohlordnungen 1.3.1 Teilweise und lineare Ordnungen 1. Eine (reflexive) teilweise Ordnung auf einer Menge A ist eine 2-stellige Relation ≤ auf A, so dass f¨ur alle a, b, c ∈ A: (a) (b) (c)
a≤a a ≤ b ∧ b ≤ a =⇒ a = b a ≤ b ∧ b ≤ c =⇒ a ≤ c
reflexiv, antisymmetrisch, transitiv.
2. Eine (reflexive) lineare Ordnung auf A ist eine teilweise Ordnung auf A, so dass f¨ur alle a, b ∈ A: (d)
a ≤ b∨b ≤ a
vergleichbar (connex).
3. Eine (irreflexive) teilweise Ordnung auf einer Menge A ist eine 2-stellige Relation < auf A, so dass f¨ur alle a, b, c ∈ A: (a’) (c’)
a 6< a a < b ∧ b < c =⇒ a < c
irreflexiv, transitiv.
1.3. O RDNUNGEN UND W OHLORDNUNGEN
8
4. Eine (irreflexive) lineare Ordnung auf A ist eine teilweise Ordnung auf A, so dass f¨ur alle a, b ∈ A: (d’) a < b ∨ a = b ∨ b < a vergleichbar (connex). Definiert man a < b : ⇐⇒ a ≤ b ∧ a 6= b, so erh¨alt man aus einer reflexiven (teilweisen) Ordnung ≤ eine irreflexive (teilweise) Ordnung <, und umgekehrt erh¨alt man durch a ≤ b :↔ a < b ∨ a = b aus einer irreflexiven (teilweisen) Ordnung < wieder eine reflexive (teilweise) Ordnung ≤ (und bei wiederholter Operation die alte Ordnung zur¨uck). Eine teilweise Ordnung nennt man manchmal auch eine partielle (oder Halb-) Ordnung, eine lineare Ordnung auch einfach Ordnung. Die gew¨ohnlichen Ordnungen auf den nat¨urlichen, den ganzen, den rationalen und den reellen Zahlen sind offenbar lineare Ordnungen; die Relation f < g : ⇐⇒ ∀x ∈ R f (x) < g(x) auf den reellen Funktionen ist dagegen nur eine teilweise Ordnung. 1.3.2 Wohlordnungen Die nat¨urlichen Zahlen lassen sich der Gr¨oße nach aufz¨ahlen, aber f¨ur die anderen Zahlbereiche ist dies nicht m¨oglich; selbst wenn man noch −∞ als “kleinste Zahl” hinzunimmt, gibt es keine n¨achstgr¨oßere (und bei dichten Ordnungen wie den rationalen Zahlen gibt es zu u¨ berhaupt keiner Zahl eine n¨achstgr¨oßere). Um diese Bereiche in der Form {a0 , a1 , . . . an , an+1 . . .} aufzuz¨ahlen, m¨ussen wir sie auf solche Weise neu ordnen, dass man mit (i) einem kleinsten Element beginnen kann, und wenn man in der Aufz¨ahlung zu einem Element gekommen ist, (ii) weiß, mit welchem Element man fortfahren kann, und schließlich (iii) auch den Aufz¨ahlungsprozess fortsetzen kann, wenn man bereits eine unendliche Teilfolge von Elementen aufgez¨ahlt hat (aber noch nicht alles aufgez¨ahlt ist).
1.3. O RDNUNGEN UND W OHLORDNUNGEN
9
Diese Anforderungen kann man pr¨azisieren und zugleich vereinheitlichen, indem man verlangt, dass jede nicht-leere Teilmenge (n¨amlich der Rest der noch nicht aufgez¨ahlten Elemente) ein kleinstes Element enth¨alt (welches als “n¨achstes” aufzuz¨ahlen ist): Eine Wohlordnung auf einer Menge A ist eine (irreflexive) lineare Ordnung auf A, welche zus¨atzlich die Minimalit¨atsbedingung erf¨ullt: (Min)
∀z (0/ 6= z ⊆ A ⇒ ∃x ∈ z ∀y ∈ z y 6< x)
(d. h. jede nicht-leere Teilmenge hat ein minimales Element). Wegen der Vergleichbarkeit (d’) ist (Min) a¨ quivalent zur Forderung, dass jede nicht-leere Teilmenge ein kleinstes Element besitzt: (Kl)
∀z (0/ 6= z ⊆ A ⇒ ∃x ∈ z ∀y ∈ z x ≤ y),
wobei wie oben x ≤ y :↔ x < y ∨ x = y. Beispiele 1. Jede lineare Ordnung < auf einer endlichen Menge ist eine Wohlordnung. Ist A = {a0 , . . . , an−1 }, wobei a0 < a1 < . . . < an−1 , so ist die Zahl n die Anzahl der Elemente von A. Diese Zahl ist nur von A abh¨angig, nicht aber von der Wahl der Ordnung <. 2. Die gew¨ohnliche Ordnung < auf den nat¨urlichen Zahlen N ist eine Wohlordnung, da jede nicht-leere Menge nat¨urlicher Zahlen ein kleinstes Element besitzt (hierauf werden wir sp¨ater noch genauer eingehen). Aus diesem Minimumsprinzip folgt das Induktionsprinzip: Ist A ⊆ N und gilt f¨ur alle nat¨urlichen Zahlen n: ∀m(m < n =⇒ m ∈ A) =⇒ n ∈ A (Induktionsschluss), so gilt
A = N.
(Denn ist A ⊂ N, so ist das Komplement von A nicht leer, und w¨ahlt man hierin ein minimales Element n 6∈ A, so m¨usste ∀m < n m ∈ A gelten, also n ∈ A laut Induktionsschluss, ein Widerspruch zur Wahl von n. In a¨ hnlicher Weise kann man zeigen, dass auch umgekehrt aus dem Induktionsprinzip das Minimumsprinzip folgt.)
10
1.3. O RDNUNGEN UND W OHLORDNUNGEN
Bekannter ist die folgende Form des Induktionsprinzips, das hier f¨ur Eigenschaften statt Mengen formuliert sei: Ist E(n) eine Eigenschaft von nat¨urlichen Zahlen, so dass gilt: E(0)
(Induktionsanfang) und
∀n (E(n) =⇒ E(n + 1)) (Induktionsschluss), so gilt ∀n ∈ N E(n). (Zum Induktionsschluss, der wie oben auch hier aus einer Induktionsvoraussetzung E(n) und einer Induktionsbehauptung E(n + 1) besteht, kommt hier noch der Induktionsanfang E(0) hinzu.) 3. Die gew¨ohnliche Ordnung auf Z ist keine Wohlordnung, ebensowenig wie die u¨ blichen Ordnungen auf Q oder R. Allerdings lassen sich die ganzen wie auch die rationalen Zahlen wohlordnen, indem sie neu ordnet (s. unten). 4. F¨ur die Menge R der reellen Zahlen ist keine Wohlordnung bekannt, f¨ur die Menge der reellen Funktionen nicht einmal eine lineare Ordnung (sondern nur die teilweise Ordnung, die wir oben erw¨ahnt haben). Man kann sogar zeigen, dass aus den u¨ blichen Axiomen der Mengenlehre nicht folgt, dass sich derartige Mengen wohlordnen lassen. Um auf beliebigen Mengen eine Wohlordnung zu erhalten, ben¨otigt man das Z ERMELOsche 1.3.3 Auswahlaxiom (AC) ∀x ∈ A x 6= 0/ =⇒ ∃F (F ist Funktion auf A ∧ ∀x ∈ A F(x) ∈ x). Es besagt, dass man aus einer Menge von nicht-leeren Mengen mittels einer Funktion “ausw¨ahlen” kann (AC = Axiom of Choice). Damit kann man beliebige Mengen A wohlordnen, indem man immer wieder aus den noch nicht aufgez¨ahlten Elementen von A ein n¨achstes als kleinstes Element ausw¨ahlt, bis alle Elemente von A erfasst sind. Dieses Axiom besitzt Anwendungen in fast allen mathematischen Gebieten, meistens in der Form des (zum Auswahlaxiom a¨ quivalenten) ZORNschen Lemmas < sei eine teilweise Ordnung auf der Menge P mit der Eigenschaft jede (durch <) linear geordnete Teilmenge K ⊆ P hat eine obere Schranke in P (also ein s ∈ P mit ∀x ∈ K x ≤ s). Dann hat P ein bez¨uglich < maximales Element, d. h. ein Element m ∈ P, welches kein gr¨oßeres Element besitzt: ∀x ∈ P m 6< x.
¨ 1.4. M ACHTIGKEITEN UND K ARDINALZAHLEN
11
1.4 M¨achtigkeiten und Kardinalzahlen 1.4.1 Endliche und abz¨ahlbare Mengen Eine Menge A ist endlich gdw A = {a0 , a1 , . . . , an−1 } f¨ur eine “endliche” Folge, d. h. wenn sich A auf die Zahlen {0, . . . , n − 1} f¨ur eine nat¨urliche Zahl n bijektiv abbilden l¨asst: A endlich : ⇐⇒ ∃n ∈ N ∃ f ( f : {0, . . . , n − 1} ←→ A), und eine derartige Zahl n h¨angt (wie bereits erw¨ahnt) nicht von der Reihenfolge der Abz¨ahlung ab, sondern ist eindeutig durch A bestimmt ist: die Anzahl der Elemente von A (wobei n = 0 im Falle der leeren Menge). Mengentheoretisch definiert man die nat¨urlichen Zahlen so, dass n = {0, . . . , n − 1}, was man hier auch schon gut zur Vereinfachung der Schreibweise benutzen kann. Die Menge der nat¨urlichen Zahlen N = {0, 1, 2, . . .} ist die einfachste unendliche Menge; Mengen, die sich bijektiv auf N abbilden lassen, nennen wir abz¨ahlbar - unendlich: A abz¨ahlbar-unendlich: ⇐⇒ ∃ f ( f : N ←→ A), eine abz¨ahlbar-unendliche Menge l¨asst sich also durch eine Folge {an |n ∈ N} aufz¨ahlen, die bijektiv ist (also ohne Wiederholungen), w¨ahrend wir zu den abz¨ahlbaren Mengen auch die endlichen Mengen rechnen, die sich also durch eine beliebige Folge {an |n ∈ N} (notwendig mit Wiederholungen) aufz¨ahlen lassen: A abz¨ahlbar: ⇐⇒ A = 0/ ∨ ∃ f ( f : N A). Nicht-leere abz¨ahlbare Mengen lassen sich also in der Form A = {a0 , a1 , . . . an . . .} schreiben f¨ur eine Folge (an |n ∈ N), die m¨oglicherweise ab einer Stelle konstant ist oder zumindest Wiederholungen besitzt (was im Falle endlicher Mengen immer eintreffen muss, aber nat¨urlich auch im unendlichen Fall vorkommen kann).
¨ 1.4. M ACHTIGKEITEN UND K ARDINALZAHLEN
12
1.4.2 Eigenschaften abz¨ahlbarer Mengen 1. Sind A = {a0 , a1 , . . .} und B = {b0 , b1 , . . .} abz¨ahlbare Mengen, so ist auch ihre Vereinigung A ∪ B = {a0 , b0 , a1 , b1 , . . . , an , bn , . . .} abz¨ahlbar: A, B abz¨ahlbar =⇒ A ∪ B abz¨ahlbar. 2. Da man auch die Paare nat¨urlicher Zahlen N × N abz¨ahlen kann (als Gitterpunkte der Zahlenebene etwa l¨angs der Diagonalen oder mittels der Paarfunktion f (n, m) = 2n · (2m + 1) − 1), so ist auch das Produkt A × B abz¨ahlbarer Mengen A, B wieder abz¨ahlbar, ebenso die Vereinigung abz¨ahlbarvieler abz¨ahlbarer Mengen: A, B abz¨ahlbar =⇒ A × B abz¨ahlbar, S ∀i ∈ N Ai abz¨ahlbar =⇒ i∈N Ai abz¨ahlbar, S A abz¨ahlbar =⇒ n∈N An , {x ⊆ A | x endlich} abz¨ahlbar. 3. Teilmengen einer abz¨ahlbaren Menge sind abz¨ahlbar, und auch das Bild F[A] = {F(x) | x ∈ A} einer abz¨ahlbaren Menge A ist offensichtlich wieder abz¨ahlbar. Sind nun alle Mengen abz¨ahlbar? Bekanntlich ist die Menge R der reellen Zahlen nach G. C ANTOR u¨ berabz¨ahlbar; am einfachsten ist wohl der Beweis, dass die Menge aller 0, 1-Folgen u¨ berabz¨ahlbar ist: F¨ur jede abz¨ahlbare Teilmenge { fn | n ∈ N} ⊆ { f | f : N → {0, 1}} kann man durch Diagonalisierung eine 0, 1-Funktion f definieren, die in der Abz¨ahlung nicht vorkommen kann, weil sie von allen fn verschieden ist, n¨amlich ( 0 falls fn (n) = 1, f (n) = 1 falls fn (n) = 0. Die Menge aller 0, 1-Folgen nat¨urlicher Zahlen l¨asst sich (mittels der charakteristischen Funktionen) bijektiv auf die Menge aller Teilmengen nat¨urlichen Zahlen (und damit auf die Menge aller reellen Zahlen) abbilden. Bezeichnet P(A) := {x | x ⊆ A} A B := { f | f : A → B}
die Potenzmenge von A und die Menge aller Funktionen von A nach B,
so gilt allgemeiner (∼ und ≺ werden gleich definiert): A
{0, 1} ∼ P(A) und A ≺ P(A).
¨ 1.4. M ACHTIGKEITEN UND K ARDINALZAHLEN
13
1.4.3 Vergleich von M¨achtigkeiten Die Begriffe M¨achtigkeit und Kardinalzahl verallgemeinern den Begriff der Anzahl auf unendliche Mengen. Oft reicht es jedoch aus, Mengen untereinander nach ihrer jeweiligen Anzahl zu vergleichen, ohne die Anzahl selbst zu bestimmen: A ∼ B : ⇐⇒ ∃F(F : A ←→ B) A 4 B : ⇐⇒ ∃F(F : A B) ⇐⇒ ∃X ⊆ B (A ∼ X) A ≺ B : ⇐⇒ A 4 B ∧ A ∼ 6 B
A ist gleichm¨achtig mit B A ist kleiner oder gleichm¨achtig mit B (A ist schm¨achtiger als B) A ist kleiner als B
(Genauer sollte man f¨ur A 4 B sagen: A ist von M¨achtigkeit kleiner oder gleich B, analog f¨ur A ≺ B.) Beispiele • A 4 N und A ≺ N f¨ur endliches A, N 4 Z 4 N, N ≺ R, aber • {2n | n ∈ N} 6≺ N, da {2n | n ∈ N} ∼ N. Eine echte Teilmengen einer unendlicher Menge A kann also mit der Menge A gleichm¨achtig sein; dieses scheinbare Paradox hat D EDEKIND gerade als Definition unendlicher Mengen gew¨ahlt. (Danach ist dann eine Menge genau dann unendlich, wenn sie eine abz¨ahlbar-unendliche Teilmenge besitzt; zum Beweis ben¨otigt man wiederum das Auswahlaxiom.) 1.4.4 Kardinalzahlen Gleichm¨achtige Mengen k¨onnen als “gleich groß” angesehen werden. Diese Re¨ lation ist eine Aquivalenzrelation auf allen Mengen, und die M¨achtigkeit einer ¨ Menge ist ein geeigneter Repr¨asentant der zugeh¨origen Aquivalenzklasse, d. h. f¨ur |A|, die M¨achtigkeit einer Menge A, muss gelten: |A| = |B| ⇐⇒ A ∼ B. F¨ur endliche Mengen k¨onnen wir ihre Anzahl als ihre M¨achtigkeit w¨ahlen, im Falle abz¨ahlbar-unendlicher Mengen die Menge der nat¨urlichen Zahlen, die zugleich die erste unendliche Ordinalzahl ω ist. Allerdings l¨asst sich schon hier
¨ 1.4. M ACHTIGKEITEN UND K ARDINALZAHLEN
14
feststellen, dass Wohlordnungen zu verschiedenen “L¨angen” f¨uhren k¨onnen: So k¨onnen wir etwa die ganzen Zahlen abz¨ahlen als 0, 1, −1, 2, −2, 3, −3, . . . 0, 1, 2, 3, . . . , −1, −2, −3, . . .
(Ordnungstyp ω) (Ordnungstyp ω + ω)
oder auch noch nach vielen anderen Ordnungstypen. (Dieses Ph¨anomen ist gerade f¨ur unendliche Mengen charakteristisch!) F¨ur u¨ berabz¨ahlbare Mengen, wie etwa die reellen Zahlen, ben¨otigt man im allgemeinen das Auswahlaxiom, um sie u¨ berhaupt wohlordnen und damit nach ihrer Gr¨oße aufz¨ahlen zu k¨onnen: A = {a0 , a1 , . . . an . . . aω . . .}, wobei man - mit Hilfe der Ordinalzahlen - allerdings u¨ ber die nat¨urlichen Zahlen als Indizes hinausz¨ahlen muss. Die ”k¨urzeste” derartige Aufz¨ahlung bestimmt dann die Kardinalzahl der Menge A, die dann auch mit card(A), |A| oder A bezeichnet wird. Außer den nat¨urlichen Zahlen 0, 1, 2, . . . , n . . . als Kardinalzahlen der endlichen Mengen gibt es also noch die unendlichen Kardinalzahlen, die man mit dem hebr¨aischen Buchstaben ”Aleph” bezeichnet. Sie setzen die nat¨urlichen Zahlen fort und lassen sich auch gem¨aß ihrer Gr¨oße aufz¨ahlen: ℵ0 < ℵ1 < ℵ 2 . . . < ℵω < . . . Operationen auf den Kardinalzahlen Die arithmetischen Operationen auf den Kardinalzahlen definiert man analog zum endlichen Fall, wobei im Falle der Addition zu beachten ist, dass man als Summe zweier Kardinalzahlen die Kardinalzahl der Vereinigung disjunkter Mengen der entsprechenden Kardinalzahl w¨ahlt: |A| ⊕ |B| := |(A × {0}) ∪ (B × {1})| |A| |B| := |A × B| |B||A| := |A B|, wobei A B := { f | f : A → B}, insbesondere 2|A|
= |A {0, 1}| = |P(A)|.
F¨ur unendliche Kardinalzahlen werden die Operationen der Addition und Multiplikation nun aber trivial: Es gilt n¨amlich der
¨ 1.4. M ACHTIGKEITEN UND K ARDINALZAHLEN
15
Satz von Hessenberg Es seien κ, λ unendliche Kardinalzahlen. Dann gilt: κ ⊕ λ = κ λ = max{κ, λ }. (Tats¨achlich braucht nur eine der beiden Zahlen unendlich zu sein, im Falle der Multiplikation darf aber nat¨urlich keine = 0 sein.) Dieses Ergebnis l¨aßt sich (mit einfachen Monotoniegesetzen) zur¨uckf¨uhren auf den ¨ Satz uber das Produkt unendlicher Mengen κ κ = κ A×A ∼ A
f¨ur unendliche Kardinalzahlen, also f¨ur unendliche Mengen A.
Damit vereinfacht sich die Bestimmung der Kardinalzahl unendlicher Mengen in vielen F¨allen (vergleiche den Fall abz¨ahlbarer Mengen), insbesondere f¨ur die Mengen der endlichen Teilmengen bzw. endlichen Folgen einer Menge A: P<ω (A) : = {x ⊆ A | x endlich}, A<ω : = { f | ∃n < ω f : {0, . . . , n − 1} → A}. 1.4.5 Arithmetik unendlicher Kardinalzahlen F¨ur unendliches A gilt: (i) |A ∪ B| = |A × B| = |A|, falls 0/ 6= B 4 A, (ii) |P<ω (A)| = |A|, (iii) |A<ω | = |A|. Das bedeutet also, dass es hinsichtlich der Kardinalzahl bei der Vereinigung und dem Produkt zweier unendlicher Mengen nur auf die gr¨oßere der beiden Mengen ankommt. Ebenso ist f¨ur die Menge der endlichen Teilmengen von A wie auch f¨ur die Menge der endlichen Funktionen mit Werten in A ihre Anzahl f¨ur unendliches A leicht zu bestimmen: es gibt hiervon genauso viele Elemente wie in A. Dies soll hier nicht allgemein bewiesen werden, sondern nur an einigen Beispielen ausgef¨uhrt werden:
¨ 1.4. M ACHTIGKEITEN UND K ARDINALZAHLEN
16
Beispiele 1. Nimmt man eine abz¨ahlbare Menge B = {b0 , b1 , . . .} zu einer unendlichen Menge A hinzu, so a¨ ndert sich die Kardinalzahl nicht: A unendlich ∧ B abz¨ahlbar =⇒ |A| = |A ∪ B|. (Hinweis: W¨ahle aus A eine abz¨ahlbar-unendliche Teilmenge A0 aus und setze A = A0 ∪ A1 mit dem Rest A1 = A\A0 . Da auch B abz¨ahlbar ist, erh¨alt man A0 ∪ B ∼ A0 und damit leicht A ∼ A ∪ B.) 2. So wie N × N wiederum abz¨ahlbar ist, kann man auch f¨ur die reellen Zahlen leicht nachweisen, dass R dieselbe M¨achtigkeit hat wie R × R (und damit auch wie Rn ), ebenso wie die Menge der Folgen reeller Zahlen, N R, und damit auch die Menge aller stetigen reellen Funktionen! G. P EANO hat sogar eine stetige Abbildung (eine P EANO-Kurve) des Einheitsintervalls [0, 1] auf das Einheitsquadrat [0, 1] × [0, 1] angegeben. 1.4.6 Das Kontinuumsproblem W¨ahrend Summe und Produkt unendlicher Kardinalzahlen einfach das Maximum beider Zahlen sind, f¨uhrt - wie bereits erw¨ahnt - die Potenzmengenoperation zu gr¨oßeren Zahlen: Satz von Cantor A ≺ P(A). ¨ Beweis: Die Abbildung x 7→ {x} zeigt, dass A 4 P(A) gilt. Um die Aquivalenz der beiden Mengen auszuschließen, zeigen wir wiederum durch ein Diagonalargument, dass es keine surjektive Abbildung von A auf P(A) gibt: W¨are n¨amlich f : A P(A), so k¨onnten wir die Menge b := {x ∈ A | x 6∈ f (x)} als Teilmenge von A bilden, welche wegen der Surjektivit¨at von f ein Urbild haben muss, also b = f (a) f¨ur ein a ∈ A. Daraus erh¨alt man aber dann den Widerspruch a ∈ b ⇐⇒ a 6∈ b.
¨ 1.4. M ACHTIGKEITEN UND K ARDINALZAHLEN
17
Wieviel gr¨oßer die Kardinalzahl der Potenzmenge einer unendlichen Menge ist, l¨asst sich jedoch schon im einfachsten Fall nicht entscheiden: Die Kardinalzahl von P(N) und damit auch die Kardinalzahl der Menge der reellen Zahlen (des Kontinuums), ist 2ℵ0 (was sich auch mit der Bin¨ardarstellung nachweisen l¨aßt). Die naheliegende Vermutung Cantorsche Kontinuumshypothese (CH)
2ℵ0 = ℵ1
besagt, dass es zwischen dem Abz¨ahlbaren und der M¨achtigkeit des Kontinuums keine weitere Kardinalzahl gibt, dass also f¨ur alle Teilmengen A ⊆ R gilt: A ist abz¨ahlbar oder gleichm¨achtig mit R. ¨ Tats¨achlich zeigte G ODEL 1938, dass diese Annahme jedenfalls mit den u¨ blichen mengentheoretischen Axiomen widerspruchsfrei ist, w¨ahrend erst C OHEN 1963 zeigte, dass sie auch nicht beweisbar, somit unabh¨angig von den mengentheoretischen Axiomen ist. F¨ur “einfache” Mengen A konnte man diese Eigenschaft jedoch nachweisen; aus dem Versuch, sie auch f¨ur kompliziertere Mengen nachzuweisen entwickelte sich die Deskriptive Mengenlehre.
18
Kapitel 2 Strukturen und formale Sprachen 2.1 Strukturen Eine Struktur A ist ein 4-Tupel A A (A, (RA i |i ∈ I), ( f j | j ∈ J), (ck |k ∈ K)),
wobei f¨ur jedes i ∈ I, j ∈ J, k ∈ K : 1. A 6= 0/ eine nicht-leere Menge ist, der Individuenbereich (Grundbereich, Tr¨ager) der Struktur A, ni 2. RA i ⊆A
3. f jA : Am j −→ A 4. cA k ∈A
(RA i ist eine ni -stellige Relation auf A), ( f jA ist eine m j -stellige Funktion auf A), (cA k ist ein Element (eine Konstante) von A).
Die Anzahl der Relationen, Funktionen und Konstanten sowie ihre jeweiligen Stellenzahlen (die ≥ 1 sein sollen) werden im Tripel ((ni |i ∈ I), (m j | j ∈ J), K) festgelegt, genannt Signatur oder Typ der Struktur. Die Indexmengen I, J, K werden meistens endlich sein, so dass man die einzelnen Relationen, Funktionen und Konstanten auch einfacher hintereinander schreibt (s. folgendes Beispiel). Den Grundbereich einer Struktur A bezeichnet man auch mit A = |A|, ebenso werden wir den Grundbereich der Struktur B mit B bezeichnen, usw.
19
2.1. S TRUKTUREN
2.1.1 Beispiele 1. Die geordneten Gruppen (Z, <, +, 0) und (Q\{0}, <, ·, 1) haben eine 2stellige Relation, eine 2-stellige Funktion und eine Konstante, sind also Strukturen vom Typ ((2),(2),{0}), aber nicht alle Strukturen dieses Typs m¨ussen geordnete Gruppen sein; man erh¨alt auch eine Struktur (A, R, f , c) dieses Typs durch die Festlegung A := N,
R := {(n, m) | n, m ∈ N, n teilt m + 3}, f := {(n, m, k) | n, m, k ∈ N, k = m · n3 + 1001},
c := 17,
denn die G¨ultigkeit von Axiomen haben wir (noch) nicht verlangt! 2. Vektorr¨aume V u¨ ber einem K¨orper K fallen unter den obigen Strukturbegriff, wenn man als Grundbereich die Menge V der Vektoren w¨ahlt, auf welcher die Vektoraddition als 2-stellige Operation definiert ist. Der Nullvektor als neutrales Element ist eine Konstante von V, und die skalare Multiplikation wird wiedergegeben durch 1-stellige Funktionen fα : V → V mit fα (v) = αv f¨ur alle α ∈ K. Im Falle K = R oder C ist dann die Indexmenge J u¨ berabz¨ahlbar (und zwar von der M¨achtigkeit des Kontinuums)! 2.1.2 Mehrsortige Strukturen Die Euklidische Ebene ist ein typisches Beispiel einer mehrsortigen Struktur: In diesem Fall gibt es zus¨atzlich eine Menge S von Sorten, und statt eines Grundbereiches A gibt es nun f¨ur jede Sorte s ∈ S einen Grundbereich As , Relationen zwischen Elementen m¨oglicherweise verschiedener Sorten, Funktionen, die auf einzelnen Grundbereichen definiert sind und m¨oglicherweise in andere Grundbereiche abbilden und schließlich Konstanten aus den einzelnen Grundbereichen. So gibt es im Falle der Euklidischen Ebene zwei Sorten (Menge der Punkte P bzw. der Geraden G) und die Inzidenzbeziehung I zwischen Punkten und Geraden (p liegt auf g). Alle Ergebnisse, die hier f¨ur einsortige Strukturen dargestellt werden, lassen sich (mutatis mutandis) auf mehrsortige Strukturen u¨ bertragen; die mehrsortigen Strukturen zu behandeln, erfordert allerdings einen erheblichen formalen Aufwand wegen der zus¨atzlichen Sortenindizes. Andererseits lassen sich prinzipiell alle mehrsortigen Strukturen auf einsortige zur¨uckf¨uhren, indem man die einzelnen Grundbereiche As zu einer disjunkten Vereinigung A zusammenfasst, f¨ur die Aufteilung in die einzelnen Grundbereiche zus¨atzliche 1-stellige Pr¨adikate Ps auf
20
2.1. S TRUKTUREN
A einf¨uhrt und die fr¨uheren Relationen und Funktionen in trivialer Weise auf den Grundbereich A fortsetzt. So w¨urde z. B. aus der 2-sortigen Euklidischen Ebene die 1-sortige Struktur E = (P ∪ G, P, G, I) mit I = {(p, g) | p ∈ P, g ∈ G und p liegt auf g} Ein Vektorraum V = (V, K, +, ·, 0) u¨ ber einem K¨orper K (mit Vektoraddition, Nullvektor und der skalaren Multiplikation · als Abbildung K ×V → V ) ist ebenfalls eigentlich eine 2-sortige Struktur (mit Vektoren und Skalaren als den beiden Sorten). Wie wir sp¨ater sehen werden, ist es aber vorteilhaft, den Vektorraum wie im Beispiel (2) von 2.1.1 als gew¨ohnliche 1-sortige Struktur aufzufassen, auch wenn damit die Signatur so groß wie der K¨orper wird. ¨ formale Sprachen 2.1.3 Symbole fur Die Strukturen (Z, <, +, 0) und (Q\{0}, <, ·, 1) haben verschiedene Grundbereiche sowie unterschiedliche Operationen, erf¨ullen aber beide die Gesetze einer angeordneten Gruppe. Gibt es auch Eigenschaften, in denen sie sich unterscheiden? Um Strukturen desselben Typs hinsichtlich ihrer Eigenschaften untersuchen und vergleichen zu k¨onnen, m¨ussen wir die Eigenschaften in einer einheitlichen Sprache ausdr¨ucken. So besagt zum Beispiel die Aussage ∀x(e < x → ∃y(e < y ∧ y ◦ y < x)) dass es f¨ur jedes Element x, welches gr¨oßer als das neutrale Element ist, ein Element y gibt, welches ebenfalls gr¨oßer als das neutralen Element ist, so dass das Produkt von y mit y noch kleiner als x ist. Diese Aussage ist offensichtlich in einigen, aber nicht allen Strukturen wahr (das h¨angt von der Interpretation der Symbole ab). Definition Gegeben sei eine Signatur σ = ((ni |i ∈ I), (m j | j ∈ J), K). Eine (formale) Sprache L zur Signatur σ besitzt als Alphabet folgende 1. logische Zeichen: • Variable v0 , v1 , v2 , . . . (wir schreiben auch x, x0 , x1 , x2 , y, z, . . .) • aussagenlogische Verkn¨upfungen ¬, ∨ • den Existenz-Quantor ∃
21
2.1. S TRUKTUREN
• das Gleichheitszeichen = (als 2-stelliges Relationszeichen) und dazu - festgelegt durch die Signatur -: 2. nicht-logische Zeichen: • ni - stellige Relationszeichen Rni i (ni ≥ 1, i ∈ I), m
• m j - stellige Funktionszeichen f j j (m j ≥ 1, j ∈ J), • Individuenkonstanten ck (k ∈ K). Sprachen und Strukturen sind somit u¨ ber die Signatur verbunden; haben die Struktur A und die Sprache L dieselbe Signatur, so sagen wir auch, dass A eine L-Struktur ist, bzw. dass L die Sprache der Struktur A ist. Als Symbole f¨ur die Gruppenoperation bzw. das neutrale Element w¨ahlt man u¨ blicherweise ◦ bzw. e; in konkreten Gruppen, wie A = (Z, +, 0) und
B = (Q\{0}, ·, 1),
stehen dann die entsprechenden Interpretationen, also in unserer Bezeichnungsweise: A = (Z, ◦A , eA ) und B = (Q\{0}, ◦B , eB ). Syntax und Semantik Die formalen Zeichen (Symbole) einer Sprache, ihr Aufbau zu endlichen Zeichenreihen (als Terme und Formeln) und die Untersuchung ihrer Eigenschaften, die allein auf ihrer formalen Gestalt beruhen, geh¨oren zur Syntax. Dagegen handelt es sich beim Begriff der Struktur, sowie allgemeiner den Interpretationen der formalen Symbole, um Gegenst¨ande der Semantik. Zwischen beiden zu unterscheiden ist besonders wichtig f¨ur Grenzbereiche der Mathematischen Logik ¨ (G ODEL sche Unvollst¨andigkeitss¨atze), sollte aber trotzdem schon fr¨uhzeitig beachtet werden. Manchmal kann allerdings eine konsequente Wahl der Bezeichnung zu schwerf¨alligen Ausdrucksweisen f¨uhren, so dass wir Vereinfachungen treffen werden. (Z. B. kann das Zeichen + wie oben die Addition auf den ganzen Zahlen bezeichnen, gelegentlich aber auch die Addition auf den nat¨urlichen bzw. reellen Zahlen, m¨oglicherweise aber auch ein formales Symbol f¨ur eine 2stellige Relation - die korrekte Bedeutung wird sich dann aber meistens aus dem Zusammenhang ergeben.)
2.2. U NTERSTRUKTUREN UND M ORPHISMEN
22
2.2 Unterstrukturen und Morphismen A und B seien Strukturen derselben Sprache L mit Grundbereich A bzw. B. Dann heißt A Unterstruktur (oder Substruktur) von B, geschrieben A ⊆ B , genau dann, wenn U1 A ⊆ B, U2 RA = RB ∩ An f¨ur jedes n-stellige Relationszeichen R von L, U3 f A = f B Am f¨ur jedes m-stellige Funktionszeichen f von L, und U4 cA = cB f¨ur jede Individuenkonstante c von L. Eine Abbildung h heißt Homomorphismus von A nach B, h : A −→ B , genau dann, wenn H1 h : A −→ B, H2 RA (a1 , . . . , an ) =⇒ RB (h(a1 ), . . . , h(an )) f¨ur alle a1 , . . . , an ∈ A und f¨ur jedes n-stellige Relationszeichen R von L, H3 h( f A (a1 , . . . , am )) = f B (h(a1 ), . . . , h(am )) f¨ur alle a1 , . . . , am ∈ A und f¨ur jedes m-stellige Funktionszeichen f von L, und H4 h(cA ) = cB f¨ur jede Individuenkonstante c von L. Ein • surjektiver Homomorphismus ist ein Epimorphismus, • ein injektiver Homomorphismus ist ein Monomorphismus, und schließlich ist • ein Isomorphismus eine surjektive Einbettung, also eine bijektive Abbildung h : A ←→ B, welche die Bedingungen (H1), (H2’), (H3) und (H4) erf¨ullt. A ist isomorph zu B, A ∼ = B , gdw es einen Isomorphismus h : A ←→ B gibt. Somit ist A ⊆ B gdw die identische Abbildung iA : A → B (mit i(a) = a f¨ur alle a ∈ A) eine Einbettung iA : A −→ B ist.
23
2.2. U NTERSTRUKTUREN UND M ORPHISMEN
2.2.1 Beispiele 1. Es sei • Z = (Z, +, 0) die additive Gruppe der ganzen Zahlen, • N = (N, +, 0) die Struktur der nat¨urlichen Zahlen, und • G = ({2n | n ∈ Z}, +, 0) die Struktur der geraden Zahlen. Dann sind N, G ⊆ Z, aber (N, ·, 1) 6⊆ Z. Im u¨ brigen ist N keine Gruppe: Unterstrukturen von Gruppen brauchen also keine Untergruppen zu sein, da diese auch unter der Inversenbildung abgeschlossen sein m¨ussen. F¨ugen wir aber zur Sprache ein entsprechendes 1-stelliges Funktionszeichen f¨ur das Inverse hinzu, so sind Unterstrukturen zugleich Untergruppen. Ferner ist die Abbildung h : Z −→ G mit h(n) = 2n ein Isomorphismus von Z auf G. 2. Es sei • A = ({a, b, c, d},
c 4 6
d
c I @ @ @
A
b c @ I @
@
@c c
@ @
@c
a
c 3 6
B
c 2 6 c 1
Dann ist die Abbildung h mit • h(a) = 1, h(b) = 2, h(c) = 3, h(d) = 4 ein Homomorphismus h : A −→ B. Da aber h(b) = 2
2.2. U NTERSTRUKTUREN UND M ORPHISMEN
24
3. Unterstrukturen von Vektorr¨aumen sind Unterr¨aume (lineare Teilr¨aume), wenn man die Sprache der Vektorr¨aume u¨ ber einem K¨orper K wie in 2.1.1 mit Hilfe von einstelligen Funktionszeichen fα f¨ur jedes α ∈ K formuliert, wobei fα f¨ur die skalare Operation mit α steht. Ist B Universum einer L-Struktur B und enth¨alt die Sprache L nur Relationszeichen, so f¨uhrt jede nicht-leere Teilmenge A ⊆ B wieder zu einer Unterstruktur von B: Man schr¨anke einfach die Relationen auf den Teilbereich A ein. Falls die Sprache jedoch auch Funktionszeichen enth¨alt, muss A unter den entsprechenden Funktionen von B abgeschlossen sein: ¨ 2.2.2 Satz uber Unterstrukturen B sei eine L-Struktur, 0/ 6= A ⊆ B. Dann ist A das Universum einer Unterstruktur A ⊆ B genau dann, wenn (i) a1 , . . . , am ∈ A =⇒ f B (a1 , . . . , am ) ∈ A f¨ur alle m-stelligen Funktionszeichen f von L und (ii) cB ∈ A f¨ur jede Individuenkonstante c von L. Sind die obigen Bedingungen erf¨ullt, so ist die Unterstruktur A durch die Menge A (und nat¨urlich die Struktur B) eindeutig bestimmt. Ist B eine L-Struktur, 0/ 6= A ⊆ B, so gibt es eine kleinste (bzgl. ⊆) Menge A, die A enth¨alt und Grundbereich einer Unterstruktur von B ist: die von A erzeugte Unterstruktur. Auf eine Beschreibung von A kommen wir nach Einf¨uhrung des Termbegriffes zur¨uck. 2.2.3 Homomorphes Bild, Identifizierung Ist h : A −→ B ein Homomorphismus, so erf¨ullt die Menge der Bilder von h h[A] := {h(a) | a ∈ A} die Bedingungen von Satz 2.2.2, ist also Universum einer Unterstruktur h[A] von B, das homomorphe Bild von A. Ist h sogar eine Einbettung, so ist h ein Isomorphismus von A auf h[A]. H¨aufig identifiziert man in dieser Situation A mit dem isomorphen Bild h[A], d. h. man ersetzt in B die Elemente h(a) durch ihre Urbilder a f¨ur a ∈ A, um somit A ⊆ B zu erhalten (w¨ahrend eigentlich statt A nur eine isomorphe Kopie hiervon Unterstruktur von B ist).
25
2.3. T ERME EINER S PRACHE
2.3 Terme einer Sprache (T1) Jede Variable und jede Individuenkonstante von L ist ein Term von L. (T2) Ist f ein m-stelliges Funktionszeichen von L und sind t1 , . . . ,tm Terme von L, so ist auch f (t1 , . . . ,tm ) ein Term von L. (T3) Das sind alle Terme von L. Wie u¨ blich werden wir im Falle 2-stelliger Funktionszeichen (wie + ) statt f (t, s) auch t f s schreiben. Beispiele • Enth¨alt die Sprache L keine Funktionszeichen und keine Individuenkonstanten, so sind die Variablen die einzigen L-Terme. • Im allgemeinen Fall entstehen Terme aus Variablen und Konstanten durch wiederholte Anwendung von Funktionszeichen, z. B. 1
sin(x2 + z) + eiπ z , was eigentlich schon die Interpretation eines Termes ist, denn hier m¨ussten statt der Funktionen nat¨urlich die entsprechenden Funktionszeichen stehen. Die Interpretation eines Terms in einer Struktur A wird ein Element von A sein, abh¨angig davon, wie wir die Variablen im Term belegen (der Wert von x + y h¨angt von der Operation + sowie von den Werten von x und y ab). Mit t(x1 , . . . , xn ) bezeichnen wir einen Term t, der (h¨ochstens) die Variablen x1 , . . . , xn enth¨alt (m¨oglicherweise weniger - diese Festlegung ist zweckm¨aßig, da ¨ beim Ubergang von einem Term zu seinen Teiltermen Variablen verschwinden k¨onnen). Ein konstanter Term ist ein Term ohne Variable. 2.3.1 Interpretation von Termen A sei eine L-Struktur, A = |A|, t = t(x1 , . . . , xn ) ein Term der Sprache L. Ferner seien a1 , . . . , an Elemente von A. Dann ist t A [a1 , . . . , an ] (die Interpretation von t in A unter der Belegung a1 , . . . , an )
26
2.3. T ERME EINER S PRACHE
wie folgt definiert: t A [a1 , . . . , an ] = ai
f¨ur t = xi ,
t A [a1 , . . . , an ] = cA k
f¨ur t = ck ,
t A [a1 , . . . , an ] = f A (t1A [a1 , . . . , an ], . . . ,tmA [a1 , . . . , an ]) f¨ur t = f (t1 , . . . ,tm ), wobei f ein m-stelliges Funktionszeichen der Sprache L sei. Man erh¨alt also t A [a1 , . . . , an ], indem man im Term t die Variable xi durch das Element ai sowie die Individuenkonstanten und Funktionszeichen in t durch ihre jeweilige Interpretation in A ersetzt und das Ergebnis in der Struktur A “auswertet”. In einem Term selbst kann man f¨ur die Variablen keine Objekte direkt einsetzen, da Terme lediglich formale Zeichenreihen sind. Die in der Interpretation vorkommende Belegung ist auch nur eine Zuordnung (daher die Bezeichnung oben mit eckigen Klammern). Wollen wir aber diese Zuordnung in der Sprache selbst ausdr¨ucken, so ist das nur m¨oglich mit Hilfe von Symbolen, welche Namen f¨ur die jeweiligen Objekte darstellen, wovon man in der Modelltheorie h¨aufig Gebrauch macht: 2.3.2 Spracherweiterung durch Namen Die Sprache L wird zur Sprache LA erweitert durch Hinzuf¨ugen von neuen Individuenkonstanten a f¨ur jedes Element von a ∈ A; das Symbol a wird als Name von a bezeichnet. ¨ die Interpretation eines Termes Variante fur t sei konstanter Term von LA (d. h. t enthalte keine Variablen, u. U. aber Namen f¨ur Elemente von A). Wir definieren t A (die Interpretation von t in A) durch Induktion u¨ ber den Aufbau eines Termes wie folgt: aA = a, cA = cA k k , f (t1 , . . . ,tm )A = f A (t1A , . . . ,tmA ), wobei f ein m-stelliges Funktionszeichen f der Sprache L ist.
27
2.3. T ERME EINER S PRACHE
Zwischen beiden Arten der Definition besteht offenbar folgender Zusammenhang: t A [a1 , . . . , an ] = (t[a1 /x1 , . . . , an /xn ])A . Dabei ist mit t[a1 /x1 , . . . , an /xn ] auf der rechten Seite der Term gemeint, der aus t entsteht, indem man hierin den Term ai f¨ur die Variable xi einsetzt (f¨ur i = 1, . . . , n). Ist B eine L-Struktur mit A ⊆ B, so bezeichnen wir mit BA die Expansion zu einer LA -Struktur, die alle Symbole von L wie in B interpretiert, jedoch die zus¨atzlichen neuen Konstanten a mit a. Statt AA schreiben wir h¨aufig kurz A. Beachte den Unterschied zwischen einer Erweiterung und einer Expansion: • B Erweiterung von A (B ⊇ A) : A wird erweitert zu B, die Sprache bleibt unver¨andert, • B Expansion von A: die Grundbereiche bleiben gleich (A = B), die Sprache wird erweitert (das gilt auch f¨ur den allgemeinen Begriff einer Expansion). Wir k¨onnen nun den Begriff der erzeugten Unterstruktur neu fassen: ¨ 2.3.3 Satz uber erzeugte Unterstrukturen B sei eine L-Struktur, A ⊆ B. Ferner sei A 6= 0/ oder die Sprache enthalte wenigstens eine Individuenkonstante. Dann gibt es eine kleinste (bzgl. ⊆) Menge A, die A enth¨alt und Universum einer Unterstruktur von B ist: die von A erzeugte Unterstruktur. Man erh¨alt A, indem man zu A die cB f¨ur jede Individuenkonstante c von L hinzunimmt und unter den Funktionen f B abschließt. Alternativ gilt folgende Darstellung: A = {t B [a1 , . . . , am ] | t(v1 , . . . , vm ) L-Term, a1 , . . . , am ∈ A} = {t BA | t konstanter L-Term von LA }. Wenn wir die Kardinalzahl einer Menge A mit card(A) bezeichnen und die Kardinalzahl der Menge der L-Terme mit card(LT ), so gilt: card(LT ) = max(ℵ0 , card(J), card(K)) und card(A) ≤ card(A) ≤ max(card(A), card(LT )). F¨ur unendliches A mit card(J), card(K) ≤ card(A) ist also card(A) = card(A).
2.4. F ORMELN EINER S PRACHE
28
Beispiele 1. (Z, ≤) wird als geordnete Struktur nur von Z erzeugt, dagegen wird 2. (Z, +, −, ·, 0, 1) als Ring bereits von der leeren Menge erzeugt, w¨ahrend 3. (Q, +, −, ·, 0, 1) von keiner endlichen Menge erzeugt wird. 4. In Vektorr¨aumen (als einsortige Strukturen wie in 2.1.1) sind die erzeugenden Mengen genau die Mengen von Vektoren, deren endliche Linearkombinationen alle Vektoren ergeben (wie im Sinne der Linearen Algebra).
2.4 Formeln einer Sprache ¨ Terme bezeichnen Objekte einer Struktur, Formeln Eigenschaften. Ahnlich wie der Begriff eines Terms werden Formeln einer Sprache L (L-Formeln) durch Rekursion definiert: (F1) Die einfachsten L-Formeln (auch atomare oder Prim-Formeln genannt) sind: • s = t f¨ur beliebige Terme s,t und • R(t1 , . . . ,tn ) f¨ur jedes n-stellige Relationszeichen von L und beliebige L-Terme t1 , . . . ,tn . (F2) Ist ϕ eine L-Formel, so auch ¬ϕ. (F3) Sind ϕ und ψ L-Formeln, so auch (ϕ ∨ ψ). (F4) Ist ϕ eine L-Formel und x eine Variable, so ist auch ∃x ϕ eine L-Formel. (F5) Das sind alle L-Formeln. Wiederum werden wir im Falle 2-stelliger Relationszeichen (wie = oder < ) statt R(t, s) auch tRs schreiben; w¨ahrend wir jedoch im ersten Fall (wo die Relationszeichen stets vor den Argumenten stehen) auf Klammern verzichten k¨onnen, m¨ussen wir im zweiten Fall jedoch m¨oglicherweise Klammern setzen, um eindeutige Lesbarkeit zu sichern (mehr dar¨uber im Teil III u¨ ber Logik). Die aussagenlogischen Zeichen ∧, → und ↔ sowie den Allquantor ∀ definieren wir:
29
2.4. F ORMELN EINER S PRACHE
ϕ ∧ψ
: ⇐⇒
¬(¬ϕ ∨ ¬ψ),
ϕ →ψ
: ⇐⇒
¬ϕ ∨ ψ,
ϕ ↔ψ
: ⇐⇒
(ϕ → ψ) ∧ (ψ → ϕ),
∀xϕ
: ⇐⇒
¬∃x¬ϕ.
Die rekursive Definition des Formelbegriffs erlaubt es (ebenso wie im Fall der Terme), Aussagen u¨ ber alle Formeln entsprechend dem rekursiven Aufbau einer Formel durchzuf¨uhren: ¨ 2.4.1 Beweis durch Induktion uber den Formelaufbau Es sei E eine Eigenschaft mit (i) E(ϕ) gilt f¨ur alle atomaren Formeln ϕ, (ii) gilt E(ϕ), so auch E(¬ϕ), (iii) gelten E(ϕ) und E(ψ), so auch E(ϕ ∨ ψ), und (iv) gilt E(ϕ), so auch E(∃x ϕ). Dann gilt E(ϕ) f¨ur alle Formeln ϕ. Um eine Eigenschaft f¨ur alle Formeln nachzuweisen, muss man sie also (1) f¨ur alle atomaren Formeln nachweisen und dann (2) unter der Annahme, dass die Eigenschaft bereits f¨ur die Formel ϕ (bzw. die Formeln ϕ und ψ) gilt, f¨ur die Formeln ¬ϕ, (ϕ ∨ ψ) und ∃x ϕ nachweisen. (1) nennt man den Induktionsanfang, (2) den Induktionsschluss, welcher aus einer Induktionsannahme und einer Induktionsbehauptung besteht. 2.4.2 Freie und gebundene Variable Bildet man eine Formel ∃x ϕ nach (F4), so heißt die in ϕ vorkommende Variable gebunden (durch den Quantor ∃); a¨ hnlich nat¨urlich im Falle der Formel ∀x ϕ. Die u¨ brigen Variablen heißen freie Variable, weil sie frei f¨ur Einsetzungen sind. W¨ahrend es nicht sinnvoll ist, in gebundene Variable Einsetzungen vorzunehmen, kann man sie aber in eine andere geeignete Variable umbenennen, ohne die Bedeutung (die wir noch erkl¨aren werden) zu a¨ ndern. Bei obiger Definition treten nun aber folgende Probleme auf:
30
2.4. F ORMELN EINER S PRACHE
• Bildet man aus zwei Formeln ϕ, ψ nach (F3) die neue Formel (ϕ ∨ ψ), so kann es vorkommen, dass dieselbe Variable y in der einen Formel frei, in der anderen jedoch gebunden vorkommt: (*)
¬x = y → ∃y(x < y ∧ 1 < x ◦ y)
• In (F4) ist nicht ausgeschlossen, dass die Variable x in ϕ bereits (in einer Teilformel) gebunden vorkommt. Prinzipiell bereiten beide Probleme keine Schwierigkeiten; statt zwischen freien und gebundenen Variablen zu unterscheiden, spricht man vom freien bzw. gebundenen Vorkommen einer Variable in einer Formel, so dass dieselbe Variable in einer Formel an einigen Stellen frei, an anderen jedoch auch gebunden vorkommen kann. L¨astig ist diese Freiheit der Formelbildung jedoch bei Einsetzungen, welche besondere Vorkehrungen erfordern: Will man in obiger Formel (*) einen Term f¨ur eine Variable einsetzen, so muss man sich auf Stellen beschr¨anken, an denen die Variable frei vorkommt. Wichtiger ist jedoch zu beachten, dass Einsetzungen so erfolgen, dass die Formel ϕ(t) u¨ ber den Term t dasselbe aussagt wie ϕ(x) u¨ ber die Variable x, und dazu muss man zus¨atzlich darauf achten, dass beim Einsetzen eines Terms t(y . . .) in eine frei vorkommende Variable x nicht durch den Term t eine Variable y in den Bindungsbereich eines Quantors ger¨at, z. B. wenn man (y + 1) f¨ur x in die Formel (*) einsetzt, in welcher x u¨ berall frei vorkommt! Diese Probleme kann man durch die Wahl von unterschiedlichen Variablen f¨ur freie bzw. gebundene Variable umgehen (wie in der a¨ lteren H ILBERT-Schule). Wir wollen jedoch bei dem heute allgemein u¨ blichen Gebrauch einer einzigen Sorte von Variablen bleiben, andererseits aber Einsetzungen leichter handhaben und daher folgende Vereinbarungen treffen (die man intuitiv zwecks besserer Lesbarkeit ohnehin wohl beachten w¨urde): • Bei der Bildung einer Formel ϕ sind gebundene Variablen so zu w¨ahlen, dass sie nicht zugleich auch frei vorkommen. Unter dieser Voraussetzung kann man dann wieder einfach von freien bzw. gebundenen Variablen sprechen (anstatt von freien bzw. gebundenen Vorkommen).
31
2.4. F ORMELN EINER S PRACHE
Terme enthalten auf jeden Fall nur freie Variable, w¨ahrend in Formeln sowohl freie wie auch gebundene Variable vorkommen k¨onnen. Da f¨ur die Interpretation von Termen bzw. Formeln in einer Struktur Belegungen der freien Variablen angegeben werden m¨ussen, schreiben wir oft t(x1 , . . . , xn ) bzw. ϕ(x1 , . . . , xn ) um anzuzeigen, dass alle im Term t vorkommenden Variable bzw. in der Formel ϕ vorkommenden freien Variable unter den x1 , . . . , xn vorkommen. 2.4.3 Substitution ϕ sei eine Formel, s,t Terme, x eine freie Variable. Dann entstehe • s[t/x] aus s, indem u¨ berall t f¨ur x eingesetzt wird, ebenso • ϕ[t/x] aus ϕ, indem u¨ berall t f¨ur x eingesetzt wird. Dabei soll im zweiten Fall t substituierbar in ϕ sein, d. h. t soll keine Variable enthalten, die in ϕ gebunden vorkommt. ¨ Ahnlich erkl¨aren wir die mehrfache Substitution s[t1 /x1 , ...,tn /xn ] und ϕ[t1 /x1 , ...,tn /xn ] durch mehrfache (simultane) Ausf¨uhrung der jeweiligen Substitution. Wenn man aus dem Zusammenhang weiß, f¨ur welche Variable eine Substitution erfolgt (oder wenn man einfach bequemer sein will), schreibt man k¨urzer auch s(t) f¨ur s[t/x] und ϕ(t) f¨ur ϕ[t/x], und a¨ hnlich im Falle mehrfacher Substitution. Nat¨urlich kann man auch hintereinander substituieren: erst t1 f¨ur x1 , dann t2 f¨ur x2 , usw.; wenn dann aber mit t1 auch die Variable x2 hineinkommt, so wird auch hier (anders als bei der simultanen Substitution) anschließend der Term t2 eingesetzt! Definition t konstanter Term :
⇐⇒ t Term ohne Variable,
ϕ Satz (Aussage) :
⇐⇒ ϕ Formel ohne freie Variable.
Der Begriff Satz im Sinne der obigen Definition ist rein syntaktisch und nat¨urlich nicht mit dem Begriff des Satzes im Sinne eines Theorems zu verwechseln! Im Englischen unterscheidet man oft zwischen sentence und theorem; gelegentlich nennt man S¨atze im Sinne der obigen Definition auch Aussagen oder abgeschlossene Formeln, um eine Verwechslung mit der Bedeutung als Theorem zu vermeiden.
32
Kapitel 3 Modelle und Theorien 3.1 Das Wahrheitspr¨adikat: Modelle Nachdem wir die Interpretation von Termen in einer Struktur definiert haben, werden wir in a¨ hnlicher Weise die Bedeutung einer Formel in einer Struktur erkl¨aren.1 Gegeben sei • eine L-Struktur A mit Grundbereich A = |A|, • eine L-Formel ϕ = ϕ(x1 , . . . , xn ), deren s¨amtliche Variable (also freie wie auch gebundene) unter x1 , . . . , xn vorkommen, • eine Belegung f = (a1 , . . . , an ) der Variablen x1 , . . . , xn . Dann definieren wir induktiv: A |= ϕ[ f ]
ϕ ist wahr in A unter der Belegung f
wie folgt: A |= (t = s)[ f ] A |= R(t1 , . . . ,tn )[ f ] A |= ¬ϕ[ f ] A |= (ϕ ∨ ψ)[ f ] A |= ∃xi ϕ[ f ]
⇐⇒ ⇐⇒ ⇐⇒ ⇐⇒ ⇐⇒
t A [ f ] = sA [ f ] (t1A [ f ], . . . ,tnA [ f ]) ∈ RA A 6|= ϕ[ f ] A |= ϕ[ f ] oder A |= ψ[ f ] es gibt ein a ∈ A mit A |= ϕ[ f (a/ai )],
wobei f (a/ai ) die Belegung f ist, allerdings mit a als Belegung von xi (also mit a an der Stelle von ai ). 1 A.
Tarski: Der Wahrheitsbegriff in den formalisierten Sprachen, Studia Phil. 1 (1936)
¨ 3.1. DAS WAHRHEITSPR ADIKAT : M ODELLE
33
¨ Aus der letzten Aquivalenz ersieht man, dass die G¨ultigkeit einer Formel ϕ in einer Struktur nur von der Belegung der in ϕ frei vorkommenden Variablen abh¨angt, so dass man meistens A |= ϕ[ f ] (oder A |= ϕ[a1 , . . . , an ]) schreibt unter der Annahme, dass nur die freien Variablen von ϕ unter den x1 , . . . , xn vorkommen und f eine Belegung allein dieser Variablen ist. Auch hier l¨asst sich eine alternative Definition angeben, die formal etwas einfacher ausf¨allt: Definition des Wahrheitspr¨adikats: Variante in erweiterter Sprache LA A sei eine L-Struktur, A = |A|, σ sei ein LA -Satz. Wir definieren induktiv A |= σ
(genauer: AA |= σ )
wie folgt: A |= (t = s)
⇐⇒
t A = sA
A |= R(t1 , . . . ,tn )
⇐⇒
(t1A , . . . ,tnA ) ∈ RA
A |= ¬σ
⇐⇒
A 6|= σ
A |= (σ ∨ τ)
⇐⇒
A |= σ oder A |= τ
A |= ∃xϕ
⇐⇒
es gibt ein a ∈ A mit A |= ϕ[a/x]
Wiederum haben wir hier eine einfache Beziehung zwischen diesen beiden Definitionen: A |= ϕ[a1 , . . . , an ] ⇐⇒ A |= ϕ[a1 /x1 , . . . , an /xn ]. Dabei steht auf der linken Seite eine L-Formel ϕ mit h¨ochstens x1 , . . . , xn als frei vorkommenden Variablen, die mit a1 , . . . , an belegt werden, auf der rechten Seite (bezogen auf die alternative Definition) ein LA -Satz ϕ, welcher an Stelle der x1 , . . . , xn Namen f¨ur die a1 , . . . , an enth¨alt. (Wenn nicht ausdr¨ucklich darauf hingewiesen wird, welche der beiden Definitionen gebraucht wird, muss dies aus dem Zusammenhang erschlossen werden.) F¨ur eine L-Formel ϕ = ϕ(x1 , . . . , xn ) definieren wir ϕ ist wahr in A (oder: A ist Modell von ϕ) durch A |= ϕ : ⇐⇒ A |= ∀x1 . . . ∀xn ϕ
¨ 3.1. DAS WAHRHEITSPR ADIKAT : M ODELLE
34
Diese Festlegung entspricht dem u¨ blichen Gebrauch in der Mathematik: Die Axiome einer algebraischen Theorie schreibt man oft als Formeln auf, z. B. a + b = b + a im Falle des Kommutativgesetzes der Gruppentheorie, meint damit aber, dass es in einer Gruppe f¨ur alle Elemente gelten soll, d. h. in der Form ∀x∀y(x + y = y + x). F¨ur ϕ = ϕ(x1 , . . . , xn ) sei ϕ ∀ := ∀x1 . . . ∀xn ϕ der universelle Abschluss von ϕ. ¨ Die Wahrheit (oder Allgemeingultigkeit) einer L-Formel ϕ = ϕ(x1 , . . . , xn ) wird definiert durch |= ϕ : ⇐⇒ f¨ur alle L-Strukturen A gilt: A |= ϕ Das bedeutet also f¨ur eine Formel ϕ, dass sie bei allen m¨oglichen Interpretationen der nicht-logischen Zeichen und f¨ur alle Einsetzungen in die frei vorkommenden Variablen wahr sein muss. Ebenso definieren wir im Falle einer Menge Σ von Formeln: A ist Modell von Σ gdw A ist Modell von allen ϕ ∈ Σ: A |= Σ : ⇐⇒ f¨ur alle ϕ ∈ Σ : A |= ϕ. Schließlich erkl¨aren wir den semantischen Begriff der Folgerung: Eine Formel ϕ folgt aus der Formelmenge Σ gdw sie in allen Modellen von Σ gilt: Σ |= ϕ : ⇐⇒ f¨ur alle A |= Σ gilt: A |= ϕ F¨ur x0 , . . . , xn schreiben wir auch~x (¨ahnlich in anderen F¨allen). Die Bedeutung der Einf¨uhrung neuer Konstanten zeigt sich in dem folgenden ¨ 3.1.1 Satz uber neue Konstanten Es sei Γ eine Menge von S¨atzen der Sprache L, ϕ(~x) eine L-Formel und ~c eine Folge von Individuenkonstanten (derselben L¨ange wie ~x), die in der Sprache L nicht vorkommen. Dann gilt: Γ |= ϕ(~c) =⇒ Γ |= ∀~x ϕ(~x). Beweis: Sei Γ |= ϕ(~c), A |= Γ und ~a seien n beliebige Elemente von A. Wir m¨ussen zeigen, dass A |= ϕ[~a]. Dazu sei L0 die Sprache L, erweitert um die neuen Individuenkonstanten ~c. Wir expandieren A zu einer L0 -Struktur A0 , indem wir 0 0 cA i = ai setzen. Dann ist auch A |= Γ (da die neuen Konstanten in der Menge Γ
35
3.2. A XIOME UND T HEORIEN
nicht vorkommen!), also gilt nach Voraussetzung A0 |= ϕ(~c), d. h. A |= ϕ[~a], weil 0 wir ciA = ai festgelegt haben. Dieser Satz bedeutet also, dass eine Aussage der Form ∀~x ϕ(~x) aus einer Menge von S¨atzen Γ folgt, wenn sie f¨ur “feste, aber beliebige” Elemente folgt. Meistens wird man Γ als die Menge von Axiomen einer Theorie auffassen:
3.2 Axiome und Theorien Eine Theorie T ist bestimmt durch 1. eine formale Sprache L, die Sprache von T, sowie 2. eine Menge Σ von Formeln der Sprache L als Axiome der Theorie. Da man die Sprache einer Theorie meistens aus den Axiomen ablesen kann, werden wir in der Regel eine Theorie mit der Menge Σ ihrer Axiome gleichsetzen. Somit erkl¨aren wir f¨ur eine Theorie T mit der Axiomenmenge Σ und eine Formel ϕ: A |= T : ⇐⇒ T |= ϕ : ⇐⇒ T+ϕ
A |= Σ
A ist Modell von T,
f¨ur alle A |= T : A |= ϕ
ϕ folgt aus T.
bezeichnet die Theorie T mit ϕ als zus¨atzlichem Axiom.
Jeder Theorie T (oder Menge von S¨atzen) kann man die Klasse ihrer Modelle zuordnen: Mod(T) := {A | A |= T}
die Modellklasse von T,
und umgekehrt jeder L-Struktur A eine Menge von S¨atzen, ihre Theorie: Th(A) := {σ | σ L-Satz, A |= σ }
die (elementare) Theorie von A.
H¨aufig verlangt man von Theorien, dass sie deduktiv abgeschlossen sind, z¨ahlt also auch alle Folgerungen zur Theorie. Stattdessen werden wir Theorien als gleich ansehen, wenn sie dieselben Folgerungen haben (also sich h¨ochstens durch die Wahl ihrer Axiome unterscheiden), und diese Aussage bedeutet wiederum, dass sie dieselben Modelle haben: T = T0 :
⇐⇒ f¨ur alle S¨atze σ : T |= σ ⇐⇒ T0 |= σ ⇐⇒ Mod(T) = Mod(T0 ).
3.3. D ER KOMPAKTHEITSSATZ UND EINIGE F OLGERUNGEN
36
Der oben eingef¨uhrte semantische Folgerungsbegriff hat im konkreten Fall meistens einen schwerwiegenden Nachteil: Denn semantisch folgt etwa eine Aussage σ aus der Gruppentheorie, wenn sie in allen Gruppen gilt. Das kann man nun aber nicht nachweisen, indem man die G¨ultigkeit der Aussage in allen einzelnen Gruppen nachpr¨uft, schon die Wahrheit einer Formel in einer (unendlichen) Struktur ist i. a. schwierig zu u¨ berpr¨ufen. Der syntaktische Folgerungsbegriff: Beweise Folgerungen aus einer mathematischen Theorie wird man versuchen, mit logischen Argumenten zu begr¨unden, indem man nach einem Beweis einer Formel ϕ aus den Axiomen der Theorie sucht. Wir werden sp¨ater im Rahmen der Pr¨adikatenlogik einen formalen Begriff eines Beweises einf¨uhren, der sich auf ein Axiomensystem der Pr¨adikatenlogik bezieht. Wenn T ` ϕ besagt, dass es einen Beweis von ϕ aus den Axiomen von T mit Hilfe logischer Axiome und Regeln gibt, so wird f¨ur geeignete Axiomensysteme der Logik der Vollst¨andigkeitssatz in der folgenden Form gelten: T |= ϕ ⇐⇒ T ` ϕ.
3.3 Der Kompaktheitssatz und einige Folgerungen Da Beweise endlich sein m¨ussen, kann ein Beweis einer Aussage aus den Axiomen einer Theorie auch nur von endlich-vielen Axiomen Gebrauch machen. Zusammen mit dem oben erw¨ahnten Vollst¨andigkeitssatz folgt daraus sofort der f¨ur die Modelltheorie zentrale 3.3.1 Kompaktheitssatz F¨ur jede Theorie T und jeden Satz σ der Sprache von T gilt: (i) T |= σ =⇒ es gibt ein endliches T0 ⊆ T mit T0 |= σ , (ii) jedes endliche T0 ⊆ T hat ein Modell =⇒ T hat ein Modell. (Trivialerweise gelten nat¨urlich auch die jeweiligen Umkehrungen.) Der Kompaktheitssatz ist aber ein rein modelltheoretischer Satz und soll sp¨ater auch mit modelltheoretischen Methoden bewiesen werden. Hier sei schon auf einige Anwendungen hingewiesen:
3.3. D ER KOMPAKTHEITSSATZ UND EINIGE F OLGERUNGEN
37
• Man kann zeigen, dass viele Theorien Modelle besitzen, an die man bei der Axiomatisierung “eigentlich nicht gedacht” hat: Nicht-Standardmodelle der P EANO-Arithmetik, die unendlich-große Zahlen besitzen, oder NichtArchimedisch angeordnete K¨orper. • Einige Klassen von Modellen lassen sich (in der Sprache der Pr¨adikatenlogik erster Stufe) nicht axiomatisch erfassen. Um hierf¨ur ein Beispiele zu erhalten, benutzen wir Anzahlformeln In der Sprache der Pr¨adikatenlogik lassen sich allein mit Hilfe der Gleichheit S¨atze formulieren, die Aussagen u¨ ber die Anzahl der Elemente einer Struktur machen ¨ (explizite Angabe als Ubungsaufgabe): A |= ∃≥n
⇐⇒
A hat mindestens n Elemente,
A |= ∃≤n
⇐⇒
A hat h¨ochstens n Elemente,
A |= ∃
⇐⇒
A hat genau n Elemente.
n
Die Menge der S¨atze Σ∞ := {∃≥n |n ∈ N} hat also nur unendliche Modelle; dagegen kann man i. a. durch keine Menge von S¨atzen die Endlichkeit eines Modells erzwingen: ¨ 3.3.2 Satz uber die Existenz unendlicher Modelle T sei eine Theorie, die beliebig große endliche Modelle hat (d.h. f¨ur jede nat¨urliche Zahl n hat T ein Modell mit mindestens n Elementen). Dann hat T auch ein unendliches Modell. Beweis: Nimm zur Theorie T die oben definierte Satzmenge Σ∞ hinzu und nenne die erweiterte Theorie T0 . Dann gilt nach Voraussetzung u¨ ber T: jede endliche Teilmenge von T0 hat ein Modell, also hat nach dem Kompaktheitssatz T0 selbst ein Modell, das dann Modell von T ist und nicht endlich sein kann.
3.4. D IAGRAMME
38
3.4 Diagramme Die Eigenschaften einer L-Struktur A werden durch ihre Theorie Th(A) beschrieben. Um auch die Eigenschaften einzelner Elemente der Struktur A anzugeben, gehen wir wieder zur erweiterten Sprache LA u¨ ber. A. ROBINSON hat die (f¨ur die Modelltheorie wichtige) Methode der Diagramme eingef¨uhrt: F¨ur eine Menge H von L-Formeln ist das H-Diagramm von A die Menge der S¨atze • DH (A) := {ϕ(a1 , . . . , an )|ϕ ∈ H, A |= ϕ[a1 , . . . , an ]}, speziell • D+ (A) := DAt (A) das positive Diagramm von A f¨ur H = Menge der atomaren L-Formeln, • D(A) := DBa (A) das quantorenfreie (oder ROBINSON-)Diagramm von A, f¨ur H = Ba = Menge der L-Formeln, welche atomar oder Negation einer atomaren Formel sind (Basis-Formeln oder Literale), • DL (A) = Th(AA ) das elementare Diagramm von A. Das positive Diagramm kann man sich als eine Verallgemeinerung der Gruppentafel vorstellen; im Falle von (N, ·) enth¨alt es das kleine und große Einmaleins: 0 · 0 = 0, 0 · 1 = 0, . . . , 1 · 1 = 1, · · · , 2 · 3 = 6, aber auch 2 · (5 · 3) = 30, (1 · 2) · 6 = 3 · 4, usw. (genauer immer mit n statt n geschrieben), das ROBINSON-Diagramm enth¨alt zus¨atzlich auch die Ungleichungen 1 · 4 6= 2, 3 · 2 6= 5, . . . Dagegen ist Th(AA ), das elementare Diagramm von A, die umfangreichste Beschreibung der Eigenschaften aller Elemente von A, die in der Struktur A gelten. Offensichtlich ist AA ein Modell von D(A) und sogar von Th(AA ). Es ist leicht zu sehen, dass f¨ur A ⊆ B auch die Struktur BA ein Modell von D(A) ist; allgemein wird ein Modell von D(A) eine LA -Struktur der Form (B, (h(a))a∈A ) sein, wobei h(a) = aB durchaus von a verschieden sein kann. Jedoch kann man in diesem Fall A mit einer Substruktur von B identifizieren: 3.4.1 Diagrammlemma Es sei A eine L-Struktur, (B, (aB )a∈A ) eine LA -Struktur und h : A −→ B definiert durch h(a) = aB . Dann gilt: (i) (B, (h(a))a∈A ) |= D(A) ⇐⇒ h : A −→ B ist eine Einbettung, (ii) BA |= D(A) ⇐⇒ A ⊆ B, falls A ⊆ B.
39
3.4. D IAGRAMME
Beweis von (i): Wir schreiben kurz Bh f¨ur (B, (h(a))a∈A ) und nehmen an, dass Bh |= D(A). Dann gilt f¨ur beliebige a, b ∈ A: a 6= b ⇐⇒ a 6= b ∈ D(A) Bh |= a 6= b nach Vor.
=⇒
⇐⇒ h(a) 6= h(b), ¨ also ist h injektiv. Ahnlich im Falle der Relationszeichen: RA (a1 , . . . , an ) ⇐⇒ R(a1 , . . . , an ) ∈ D(A) Bh |= R(a1 , . . . , an ) nach Vor.
=⇒
⇐⇒ RB (h(a1 ), . . . , h(an )). Das gleiche Argument f¨ur die Formel ¬R liefert die Umkehrung, also RA (a1 , . . . , an ) ⇐⇒ RB (h(a1 ), . . . , h(an )), und schließlich gilt auch f¨ur die Funktionszeichen: f A (a1 , . . . , am ) = a ⇐⇒ f (a1 , . . . , an ) = a ∈ D(A) =⇒
Bh |= f (a1 , . . . , an ) = a nach Vor.
B
⇐⇒ f (h(a1 ), . . . , h(an ) = h(a). Mit denselben Argumenten zeigt man auch die umgekehrte Richtung von (i). 3.4.2 Universelle Theorien ψ ist eine ∀-Formel (oder universell): ⇐⇒ ψ = ∀x1 . . . ∀xn ϕ f¨ur eine quantorenfreie Formel ϕ, ψ ist eine ∃-Formel (oder existentiell): ⇐⇒ ψ = ∃x1 . . . ∃xn ϕ f¨ur eine quantorenfreie Formel ϕ. F¨ur eine Theorie T sei T∀ := {σ | T |= σ , σ ein ∀-Satz} der universelle Teil von T. Eine Theorie T heiße Substruktur-abgeschlossen gdw A ⊆ B |= T =⇒ A |= T.
40
3.4. D IAGRAMME
Allgemeiner nennt man eine Formel ϕ(x1 , . . . , xn ) Substruktur-persistent in T (oder einfach T-persistent) gdw f¨ur alle A, B |= T mit A ⊆ B und f¨ur alle a1 , . . . , an ∈ A gilt: B |= ϕ[a1 , . . . , an ] =⇒ A |= ϕ[a1 , . . . , an ]. ∀-Formeln bleiben offensichtlich g¨ultig, wenn man den Grundbereich einschr¨ankt (und entsprechend bleiben existentielle Formeln wahr unter Erweiterungen), sie sind also persistent. Es gilt aber auch die Umkehrung: 3.4.3 Modellerweiterungssatz von Keisler Folgende Aussagen sind a¨ quivalent f¨ur eine L-Theorie T: (i) Es existiert ein Struktur B mit A ⊆ B und B |= T, (ii) A |= T∀ . Beweis von (i) ⇒ (ii): Sei B mit A ⊆ B und B |= T. Dann ist auch B |= T∀ , und weil ∀-S¨atze beim ¨ Ubergang zu Substrukturen erhalten bleiben, ist A |= T∀ . (ii) ⇒ (i): Sei A |= T∀ . Wir behaupten, dass T ∪ D(A) ein Modell hat: Anderenfalls g¨abe es nach dem Kompaktheitssatz eine endliche Teilmenge ∆ ⊆ D(A), so dass T ∪ ∆ kein Modell hat. Es sei δ (a1 , . . . , an ) die Konjunktion der endlich-vielen S¨atze in ∆, die dann in keinem Modell von T wahr sein k¨onnen, d. h. es gilt T |= ¬δ (a1 , . . . , an ), und da die Konstanten ai in der Sprache von T nicht vorkommen, nach dem Satz u¨ ber neue Konstanten 3.1.1 auch T |= ∀x1 , . . . , xn ¬δ (x1 , . . . , xn ), also ∀x1 , . . . , xn ¬δ (x1 , . . . , xn ) ∈ T∀ . Da nach Voraussetzung A |= T∀ , so: A |= ∀x1 , . . . , xn ¬δ (x1 , . . . , xn ), insbesondere A |= ¬δ [a1 , . . . , an ] im Widerspruch zu ∆ ⊆ D(A)! Somit hat also D(A) ∪ T ein Modell, welches nach dem Diagrammlemma 3.4.1 als Oberstruktur von A gew¨ahlt werden kann. Als Korollare erhalten wir:
41
3.4. D IAGRAMME
¨ universelle Formeln 3.4.4 Erhaltungssatz fur Die folgenden Aussagen sind f¨ur einen Formel ϕ a¨ quivalent: (i) ϕ = ϕ(x1 , . . . , xn ) ist T-persistent, (ii) es gibt eine universelle Formel ψ(x1 , . . . , xn ), die in T a¨ quivalent zu ϕ ist, d. h. T |= ϕ ↔ ψ. Beweis von (i) ⇒ (ii): Wir nehmen zun¨achst an, dass ϕ ein Satz σ ist, welcher T-persistent ist. Setze Σ := {ϕ | ϕ universell, T + σ |= ϕ} = (T + σ )∀ . Dann gilt (∗)
T ∪ Σ |= σ ,
denn ist A |= T ∪ Σ, so existiert nach dem Modellerweiterungssatz 3.4.3 ein A mit A ⊆ B |= T + σ , also auch A |= σ nach (i). Wegen (*) gibt es nach dem Kompaktheitssatz endlich-viele S¨atze σ1 , . . . , σk ∈ Σ mit T + σ1 ∧ . . . ∧ σk |= σ , und da auch umgekehrt T + σ |= σi f¨ur alle i = 1, . . . , k, so gilt T |= σ ↔ σ1 ∧ . . . ∧ σk . Die Konjunktion endlich-vieler universeller S¨atze ist aber a¨ quivalent zu einem universellen Satz (s. im Kapitel u¨ ber die Pr¨adikatenlogik den Abschnitt 6.5). Den allgemeinen Fall einer Formel kann man auf den obigen Fall eines Satzes durch ¨ die Einf¨uhrung neuer Konstanten und den Ubergang zum Satz ϕ(c1 , . . . , cn ) zur¨uckf¨uhren. 3.4.5 Satz von Ło´s-Tarski T Substruktur-abgeschlossen ⇐⇒ Mod(T) = Mod(T∀ ) ⇐⇒ T hat ein Axiomensystem aus T∀ -S¨atzen.
3.5. E INIGE MATHEMATISCHE T HEORIEN
42
3.5 Einige mathematische Theorien 3.5.1 Gruppen- und K¨orpertheorie 1. Die Theorie der (A BELschen) Gruppen in der Sprache LG mit einem 2-stelligen Funktionssymbol ◦, einem 1-stelligen Funktionssymbol −1 und der Individuenkonstanten e besitzt universelle Axiome und ist somit Substruktur-abgeschlossen. Ist dagegen TAG die Theorie der A BELschen Gruppen in der Sprache mit nur einem 2-stelligen Funktionssymbol ◦, dann ist T∀ die Theorie der kommutativen regul¨aren Halbgruppen mit den Axiomen: • ∀x∀y∀z x ◦ (y ◦ z) = (x ◦ y) ◦ z
(assoziativ)
• ∀x∀y x ◦ y = y ◦ x
(kommutativ)
• ∀x∀y∀z(x ◦ y = x ◦ z → y = z)
(K¨urzungsregel)
In a¨ hnlicher Weise ist f¨ur die Theorie TF der K¨orper (in der Sprache mit +, ·, −, 0, 1) der universelle Teil (TF )∀ die Theorie der Integrit¨atsbereiche. 2. Die Klasse der unendlichen Gruppen, K¨orper, . . . l¨asst sich mit Hilfe der (unendlichen) Satzmenge Σ∞ axiomatisieren, nicht aber die Klasse der endlichen Gruppen, der endlichen K¨orper, . . . (denn es gibt jeweils beliebig große endliche Gruppen und K¨orper, und eine Theorie dieser Modelle muss dann nach dem Satz 3.3.2 u¨ ber die Existenz unendlicher Modelle notwendig ein unendliches Modell ein¨ schließen). Ahnliches gilt f¨ur die Theorie der K¨orper der Charakteristik 0 bzw. endlicher Charakteristik: Satz L sei die Sprache der Theorie der K¨orper, σ ein Satz dieser Sprache. Gilt σ in allen K¨orpern der Charakteristik 0 (bzw. in allen unendlichen K¨orpern), so gibt es ein p, so dass σ in allen K¨orpern der Charakteristik ≥ p (bzw. in allen K¨orpern mit mindestens p Elementen) gilt. Beweis: Es sei TF die Theorie der K¨orper (F f¨ur englisch: field). Nimmt man den Satz χ p := |1 + 1 + {z. . . + 1} = 0 p−mal
43
3.5. E INIGE MATHEMATISCHE T HEORIEN
hinzu, welcher ausdr¨uckt, dass die Charakteristik = p ist, so erh¨alt man die Theorie der K¨orper der Charakteristik p. Um die Theorie TF,0 der K¨orper der Charakteristik 0 zu erhalten, muss man TF erg¨anzen um die unendlich-vielen Aussagen {¬χ p | p Primzahl}. Gilt nun σ in allen K¨orpern der Charakteristik 0, so TF,0 |= σ , also gibt es nach dem Kompaktheitssatz ein endliches T0 ⊆ TF,0 mit T0 |= σ . T0 kann aber nur endlich viele der Aussagen ¬χ p enthalten, und daraus erhalten wir die Behauptung. ¨ (Ahnlich im anderen Fall mit Anzahl- statt Charakteristik-Formeln.) Mit modelltheoretischen Methoden lassen sich noch weitere Ergebnisse u¨ ber verschiedene algebraische Theorien erzielen, insbesondere die Entscheidbarkeit der Theorie von (R, <, +, −, ·, 0, 1) (= Theorie der reell-abgeschlossenen K¨orper) und der Theorie (C, +, −, ·, 0, 1) (= Theorie der algebraisch-abgeschlossenen K¨orper). 3.5.2 Axiomatisierbarkeit: Elementare Klassen Ist K eine Klasse von L-Strukturen, so heißt K elementar (EC-Klasse) :
⇐⇒
K = Mod(σ ) f¨ur einen Satz σ ,
K ∆-elementar (EC∆ -Klasse) :
⇐⇒
K = Mod(Γ) f¨ur eine Satzmenge Γ.
Eine EC-Klasse ist also eine Klasse von Strukturen, die sich durch einen einzelnen Satz (oder durch endlich-viele S¨atze) axiomatisieren l¨asst, eine EC∆ -Klasse ist Durchschnitt von EC-Klassen und l¨asst sich mittels einer Menge von S¨atzen axiomatisieren. Beispiele 1. elementare Klassen sind: • {G | G ist Gruppe} = Mod(σG ), σG = Konjunktion der endlich-vielen Gruppenaxiome, • {G | G ist kommutative Gruppe}, • {R | R ist Ring (kommutativ, mit 1)}, • {K | K ist K¨orper},
3.5. E INIGE MATHEMATISCHE T HEORIEN
44
• {K | K ist K¨orper der Charakteristik p} (p fest; p Primzahl), • {≤|≤ ist (lineare) Ordnung}. 2. ∆-elementare Klassen, aber keine elementaren Klassen sind: • {G | G ist unendliche Gruppe} = Mod({σG } ∪ Σ∞ ), • {K | K ist unendlicher K¨orper}, • {K | K ist K¨orper der Charakteristik 0}. 3. nicht einmal ∆-elementare Klassen sind: • {G | G ist endliche Gruppe}, • {G | G ist Torsions-Gruppe (alle Elemente haben endliche Ordnung)}, • {K | K ist endlicher K¨orper}, • {≤|≤ ist Wohlordnung}. Die negativen Beispiele beruhen auf dem Kompaktheitssatz und dieser wiederum wesentlich auf der Eigenschaft von Beweisen, endlich zu sein. Geht man zu erweiterten Logiken u¨ ber, die etwa auch unendliche Konjunktionen und Disjunktionen zulassen, so kann man zwar wesentlich mehr ausdr¨ucken, aber Beweise sind nun nicht mehr notwendig endlich, die erweiterte Logik ist nicht mehr vollst¨andig (bzw. nur in einem abgeschw¨achten Sinn), auch gelten die klassische S¨atze der Modelltheorie dann h¨ochstens noch mit Einschr¨ankungen. 3.5.3 Zahlentheorie W¨ahrend die algebraischen Theorien der Gruppen, Ringe, K¨orper, . . . sehr viele Modelle besitzen, untersucht die Zahlentheorie Eigenschaften eines Modells, das man das Standardmodell der Zahlentheorie nennt: N = (N, +, ·,0 , 0). LPA sei die zugeh¨orige Sprache, f¨ur die wir auch +, ·, 0 als (nicht-logische) Symbole w¨ahlen, aber S f¨ur die 1-stellige Nachfolgeroperation. Die Theorie des Standardmodells, Th(N), ist die Menge der LPA -S¨atze, die in diesem Modell gelten - was sich zwar einfach definieren l¨asst, aber doch immer noch viele offene Fragen bereith¨alt. Die wichtigsten Eigenschaften des Standardmodells werden zusammengefasst als
3.5. E INIGE MATHEMATISCHE T HEORIEN
45
Peano-Axiome: P1 Sx 6= 0 P2 Sx = Sy → x = y P3 x + 0 = x P4 x + Sy = S(x + y) P5 x · 0 = 0 P6 x · Sy = x · y + x sowie die unendlich-vielen Induktionsaxiome: Ind ϕ(0) ∧ ∀x(ϕ(x) → ϕ(Sx)) → ∀x ϕ(x) Die Theorie mit diesen Axiomen nennt man PA, die Peano-Arithmetik. Aus dem Kompaktheitssatz folgt nun, dass diese Theorie Nicht-Standardmodelle besitzt, d. h. Modelle, die nicht isomorph zum Standardmodell sind, weil sie “unendlich-große” Zahlen besitzen: Satz Es gibt ein (abz¨ahlbares) Modell N∗ von PA, welches nicht-isomorph zu N ist. (Tats¨achlich folgt aus den Ergebnissen des n¨achsten Kapitels, dass es sogar in jeder unendliche Kardinalzahl ein Nicht-Standardmodell gibt.) Beweis: Erweitere die Sprache von PA um eine neue Konstante c f¨ur ein “unendlich-großes” Element und bilde die erweiterte Theorie PA∗ := PA ∪ {c 6= 0, c 6= S0, c 6= SS0, . . .}. Da es unendlich-viele nat¨urliche Zahlen gibt, kann man endlich-viele der zus¨atzlichen Aussagen im Standardmodell erf¨ullen, indem man c als gen¨ugend große Zahl w¨ahlt. Somit hat jede endliche Teiltheorie von PA∗ ein Modell, also gibt es nach dem Kompaktheitssatz auch ein Modell N∗ |= PA∗ . Da N∗ die Axiome (P1) und (P2) erf¨ullt, ist die Abbildung der Terme {0, S0, SS0, . . .} auf ihre Interpretationen in N∗ injektiv, so dass wir sie mit den “gew¨ohnlichen” nat¨urlichen Zahlen ∗ identifizieren k¨onnen. Dann hat aber N∗ noch das Element cN , welches von allen “gew¨ohnlichen” nat¨urlichen Zahlen verschieden sein muss (da n¨amlich N∗ auch die neuen Axiome von PA∗ u¨ ber c erf¨ullt).
3.5. E INIGE MATHEMATISCHE T HEORIEN
46
Dasselbe Ergebnis erhalten wir auch, wenn wir die Theorie PA durch die Theorie des Standardmodells ersetzen; wieder gibt es ein nicht-isomorphes (abz¨ahlbares) Modell N∗ , welches aber alle S¨atze erf¨ullt, die auch im Standardmodell gelten. Ein solches Modell kann man nach A. ROBINSON benutzen, um eine Nonstandard-Analyis aufzubauen, d. h. eine Theorie, in welcher alle Aussagen der “gew¨ohnlichen” reellen Zahlen gelten, in denen es aber noch zus¨atzlich “infinitesimal kleine” Zahlen gibt. Diese Ergebnisse kann man als Ausdrucksschw¨ache der Sprache der Pr¨adikatenlogik interpretieren, denn geht man zu einer Sprache 2. Stufe u¨ ber, in welcher man zus¨atzlich die M¨oglichkeit hat, mittels Quantoren 2. Stufe ∃X, ∀Y u¨ ber Teilmengen des jeweiligen Grundbereiches zu quantifizieren, so kann man in dieser st¨arkeren Theorie das Standardmodell eindeutig (bis auf Isomorphie) charakterisieren: Kategorizit¨at der Peano-Axiome 2. Stufe Die Theorie PA(2) (P EANO-Axiome 2.Stufe) besitzt folgende Axiome: P1
∀x Sx 6= 0
P2
∀x∀y(Sx = Sy → x = y)
IND
∀X(0 ∈ X ∧ ∀x(x ∈ X → Sx ∈ X) → ∀x x ∈ X)
Die Kategorizit¨at dieser Theorie besagt, dass es (bis auf Isomorphie) genau ein Modell gibt, d. h.: Jedes Modell von PA(2) ist isomorph zum Standardmodell (N,0 , 0). Es zeigt sich hier also, dass das Induktionsaxiom 2. Stufe (eigentlich ein mengentheoretisches Axiom) wesentlich ausdrucksst¨arker ist als das entsprechende Induktionsschema, in welchem nur Eigenschaften 1. Stufe erlaubt sind mit Quantoren, die nur u¨ ber Elemente (statt auch u¨ ber Teilmengen) nat¨urlicher Zahlen quantifizieren. Andererseits ist die Logik 2. Stufe mit anderen Nachteilen belastet; f¨ur sie kann n¨amlich kein Vollst¨andigkeitssatz gelten. Eine weitere Theorie, die Theorie der dichten linearen Ordnungen, werden wir im n¨achsten Kapitel behandeln.
47
3.5. E INIGE MATHEMATISCHE T HEORIEN
3.5.4 Mengenlehre Mengen bildet man durch Zusammenfassung von Objekten (welche wiederum Mengen sind) zu einer neuen Gesamtheit entsprechend C ANTORs ber¨uhmter Beschreibung einer Menge: Unter einer “Menge” verstehen wir jede Zusammenfassung M von bestimmten wohlunterschiedenen Objekten unserer Anschauung oder unseres Denkens (welche die “Elemente” von M genannt werden) zu einem Ganzen.2 Man kann diese “Definition” in folgendem Sinne zu pr¨azisieren versuchen: Zu jeder Eigenschaft E(x) existiert die Menge M aller Objekte x mit der Eigenschaft E(x): M = {x : E(x)}. Z ERMELOs Erkl¨arung des Begriffes Eigenschaft wurde von F RAENKEL und S KOLEM dahingehend pr¨azisiert, dass diese als Ausdr¨ucke einer formalen Sprache festzulegen sind. Die C ANTORsche Definition kann dann als Komprehensionsaxiom pr¨azisiert werden: ∃y∀x(x ∈ y ↔ ϕ(x)) wobei ϕ(x) eine beliebige Formel ist, in welcher y nicht vorkommt. Dieses Axiom (eigentlich ein Axiomenschema, da es aus unendlich vielen Axiomen besteht) ist nun aber widerspruchsvoll: RUSSELLsche Antinomie (1903) W¨ahlt man f¨ur ϕ(x) die Formel x 6∈ x, so liefert das Komprehensionsaxiom die Existenz einer Menge r mit ∀x(x ∈ r ↔ x 6∈ x) insbesondere gilt f¨ur x = r : r ∈ r ↔ r 6∈ r
Widerspruch!
¨ Ahnliche Widerspr¨uche hatte man zwar schon fr¨uher erhalten (Antinomie der “Menge aller Mengen” von C ANTOR, Antinomie der “Menge aller Ordinalzahlen” von C ANTOR und B URALI -F ORTI), wobei man allerdings noch einige Schritte in der Anwendung der Theorie durchf¨uhren musste, um zum Widerspruch zu 2 C ANTOR ,
G EORG : Beitr¨age zu Begr¨undung der transfiniten Mengenlehre. Math. Ann. 46, (1895), 481 - 512, Math. Ann. 49, (1897), 207 - 246)
3.5. E INIGE MATHEMATISCHE T HEORIEN
48
gelangen, w¨ahrend die Antinomie von RUSSELL (die um die gleiche Zeit auch bereits Z ERMELO bekannt war) sehr elementar - und daher besonders beeindruckend - ist. Als Ausweg aus den Antinomien w¨ahlte Z ERMELO eine Einschr¨ankung des Komprehensionsaxioms auf die Bildung von Teilmengen einer bereits gegebenen Menge a: Aussonderungsaxiom:
∃y∀x(x ∈ y ↔ x ∈ a ∧ ϕ(x))
Versucht man erneut, die RUSSELLsche Antinomie abzuleiten, so erh¨alt man die Existenz einer Menge r mit r ∈ r ↔ r ∈ a ∧ r 6∈ r, also • es gibt keine “Menge aller Mengen” (f¨ur a eingesetzt, erhielte man den RUSSELLschen Widerspruch), • es gibt eine “leere” Menge (setze f¨ur ϕ(x) ein: x 6= x und f¨ur a irgendeine Menge). Das Aussonderungsaxiom ist nachweisbar widerspruchsfrei - es ist bereits wahr in einem Modell, welches nur die leere Menge enth¨alt. Um es dar¨uber hinaus anwenden zu k¨onnen, m¨ussen wir die Menge a, aus welcher mittels der Eigenschaft ϕ(x) eine Teilmenge ausgesondert wird, bereits haben - weitere Axiome sind erforderlich! In der heute u¨ blichen Axiomatisierung der Mengenlehre ZF von Z ERMELO -F RAENKEL w¨ahlt man als derartige Axiome (die dann schließlich das Aussonderungsaxiom sogar u¨ berfl¨ussig machen): Nullmengenaxiom Paarmengenaxiom Summenaxiom Ersetzungsschema Potenzmengenaxiom Unendlichkeitsaxiom
∃y∀x(x 6∈ y) ∃y∀x(x ∈ y ↔ x = a ∨ x = b) ∃y∀z(z ∈ y ↔ ∃x ∈ a z ∈ x) ∀x∀y∀z(ϕ(x, y) ∧ ϕ(x, z) → y = z) → ∃u∀y(y ∈ u ↔ ∃x ∈ a ϕ(x, y)) ∃y∀z(z ∈ y ↔ z ⊆ a) ∃x(0/ ∈ x ∧ ∀y(y ∈ x → y ∪ {y} ∈ x))
Diese Axiome fordern also die Existenz der leeren Menge 0, / der Paarmenge S {a, b}, der Vereinigungsmenge x∈a x, der Potenzmenge P(a) sowie der Menge der Funktionswerte {F(x) | x ∈ a} einer Funktion F auf einer Menge a (Ersetzungsmenge) und schließlich die Existenz einer unendlichen Menge (etwa der Menge der nat¨urlichen Zahlen N). Die Gleichheit von zwei Mengen hatten wir durch das Extensionalit¨atsprinzip charakterisiert, daf¨ur steht jetzt das
3.5. E INIGE MATHEMATISCHE T HEORIEN
Extensionalit¨atsaxiom
49
∀x(x ∈ a ↔ x ∈ b) → a = b
Die abschließenden Axiome spielen eine Sonderrolle: w¨ahrend die obigen Existenzaxiome zugleich eine Definition der geforderten Menge angeben, stellt das Fundierungsaxiom (welches eine untergeordnete Rolle spielt und hier nicht n¨aher erl¨autert werden soll) eine Einschr¨ankung des Bereiches aller Mengen dar, das demgegen¨uber wichtige Auswahlaxiom (AC) ∀x ∈ a x 6= 0/ → ∃ f (Fkt( f ) ∧ D( f ) = a ∧ ∀x ∈ a f (x) ∈ x) fordert dagegen die Existenz einer Funktion (genannt Auswahlfunktion f¨ur die Menge a), ohne dass ersichtlich ist, wie man eine derartige Funktion u¨ berhaupt erhalten oder beschreiben k¨onnte. Daher ist dieses Axiom oft umstritten und seine Anwendung wird h¨aufig besonders herausgehoben; es z¨ahlt insbesondere nicht zu den eigentlichen Axiomen von ZF3 . Auf Anwendungen in der Theorie der Kardinalzahlen haben wir schon in 1.3.3 hingewiesen, in der Mathematischen Logik wird das Auswahlaxiom angewandt bei der Existenz von Ultrafiltern sowie beim ¨ Beweis des allgemeinen Vollst¨andigkeitssatzes und der S¨atze von L OWENHEIM S KOLEM.
3 Zur
Geschichte und Problematik des Auswahlaxioms verweisen wir auf M OORE , G.H.: Zermelo’s Axiom of Choice. Springer 1982.
50
Kapitel 4 Grundlagen der Modelltheorie ¨ 4.1 Vollst¨andigkeit und elementare Aquivalenz Mathematische Theorien lassen sich grob in zwei Klassen unterteilen: 1. Theorien, die Eigenschaften eines bestimmten Modells beschreiben wollen (z. B. die Theorie der nat¨urlichen (reellen, komplexen) Zahlen oder die Theorie der Euklidischen Ebene) sowie andererseits 2. Theorien, welche gemeinsame Eigenschaften vieler Modelle zusammenfassen, wobei sie aber durchaus zulassen, dass Modelle sich bez¨uglich anderer Eigenschaften unterscheiden (wie die meisten algebraischen Theorien: Gruppen, Ringe, K¨orper, Vektorr¨aume, . . . , aber auch die Theorie topologischer R¨aume, Graphen und Ordnungen). ¨ 4.1.1 Elementare Aquivalenz Die Theorie Th(A) einer Struktur A unterscheidet sich von allgemeinen Theorien wie folgt: • Th(A) |= σ ⇐⇒ A |= σ , • T |= σ ⇐⇒
f¨ur alle A |= T : A |= σ ,
die G¨ultigkeit eines Satzes σ in Th(A) h¨angt also nur von der G¨ultigkeit in dem einen Modell A ab, sonst von der G¨ultigkeit in allen Modellen der Theorie. Somit ist Th(A) semantisch vollst¨andig in folgendem Sinne: T (semantisch) vollst¨andig : ⇐⇒ f¨ur alle L-S¨atze σ : T |= σ oder T |= ¬σ .
¨ QUIVALENZ ¨ 4.1. VOLLST ANDIGKEIT UND ELEMENTARE A
51
Achtung: F¨ur Formeln ϕ gilt i. a. nicht: A |= ϕ oder A |= ¬ϕ, denn sonst m¨usste der universelle Abschluss von ϕ oder der universelle Abschluss von ¬ϕ in A gelten (aber in einer nicht-kommutativen Gruppe G gilt weder ∀x∀y (x + y = y + x) noch ∀x∀y (x + y 6= y + x)). Dagegen gilt nach der Wahrheitsdefinition f¨ur S¨atze σ stets A |= σ oder A |= ¬σ . Dagegen gilt i. a. auch nicht: T |= σ oder T |= ¬σ , denn der Satz σ k¨onnte in einem Modell von T gelten, in einem anderen aber nicht (wie das Kommutativgesetz im Falle der Gruppentheorie). Dagegen gilt die letzte Alternative, wenn sich je zwei Modelle von T in ihren elementaren Eigenschaften (ausgedr¨uckt durch S¨atze der zugeh¨origen Sprache) nicht unterscheiden: Sind A und B Strukturen derselben Sprache L, so heißen sie elementar-¨aquivalent genau dann, wenn sie dieselben S¨atze erf¨ullen: A ≡ B :⇐⇒ f¨ur alle L-S¨atze σ : A |= σ ⇐⇒ B |= σ . Beispiele und Bemerkungen 1. (N, <) ≡ (N\{0}, <), aber (N, <, 1) 6≡ (N\{0}, <, 1). 2. (Q, +, ·, 0, 1) 6≡ (R, +, ·, 0, 1) als K¨orper (2 ist in Q kein Quadrat), betrachten wir sie jedoch als geordnete Strukturen, so gilt: (Q, <) ≡ (R, <) (wird sp¨ater bewiesen), dagegen (Z, <) 6≡ (Q, <). 3. A ≡ B ⇐⇒ Th(A) = Th(B). 4. Eine Theorie ist vollst¨andig gdw je zwei ihrer Modelle elementar-¨aquivalent sind. 5. Hat T u¨ berhaupt ein Modell, so ist T vollst¨andig gdw T = Th(A) f¨ur ein (oder: alle) Modelle A von T. 6. F¨ur einen Isomorphismus h : A ∼ = B gilt: A |= ϕ[a1 , . . . an ] ⇐⇒ B |= ϕ[h(a1 ), . . . h(an )], d. h. ein Isomorphismus ist eine elementare Einbettung (s.u.), und somit sind isomorphe Strukturen a¨ quivalent. Das obige Beispiel in (2) zeigt, dass die Umkehrung aber nicht zu gelten braucht: elementar-¨aquivalente Strukturen k¨onnen sogar verschiedene M¨achtigkeiten haben und lassen sich daher nicht einmal als Mengen bijektiv aufeinander abbilden.
¨ QUIVALENZ ¨ 4.1. VOLLST ANDIGKEIT UND ELEMENTARE A
52
7. Ist A endlich, so ist im Falle A ≡ B auch B endlich, und zwar von derselben Anzahl (da beide dieselben Anzahlformeln erf¨ullen). Tats¨achlich kann man zeigen, dass A und B in diesem Fall sogar isomorph sind! ¨ Die obigen Beispiele zeigen zudem, dass elementare Aquivalenz in starkem Maße von der Sprache abh¨angt, die man zugrunde legt. Die Relation der elemen¨ taren Aquivalenz ist ein wichtiger Grundbegriff der Modelltheorie, l¨asst sich aber i. a. schwer nachweisen, da man u¨ ber S¨atze einer Sprache keine Induktion f¨uhren kann. (Meistens weist man diese Relation nach u¨ ber die st¨arkere Isomorphiebeziehung oder zeigt, dass beide Strukturen Modelle einer vollst¨andigen Theorie sind.) 4.1.2 Die Theorie der dichten linearen Ordnung Wir wollen hier ein Musterbeispiel einer vollst¨andigen Theorie behandeln. Dazu werden wir zeigen, dass je zwei abz¨ahlbare Modelle isomorph sind; aus dem sp¨ater folgenden Kriterium 4.3.2 von VAUGHT wird sich dann ergeben, dass diese Theorie vollst¨andig ist. Die Theorie LO der linearen Ordnung wird in einer Sprache mit einem 2stelligen Relationszeichen < formuliert und hat folgende Axiome: (L1) ∀x x 6< x (L2) ∀x∀y∀z (x < y ∧ y < z → x < z) (L3) ∀x∀y (x < y ∨ x = y ∨ y < x)
irreflexiv transitiv connex
F¨ur dichte Ordnungen gilt zus¨atzlich (D)
∀x∀y∃z (x < y → x < z ∧ z < y)
dicht
Diese Theorie ist noch nicht vollst¨andig; sie wird es aber, wenn man Aussagen u¨ ber die Endpunkte hinzunimmt, etwa (OE) ∀x∃y (x < y) ∧ ∀x∃y (y < x)
ohne Endpunkte
DLO sei die Theorie der dichten linearen Ordnungen (Axiome: L1−L3, D); Beispiele von Modellen von DLO + OE sind (Q, <) und (R, <), ersteres ist bis auf Isomorphie das einzige abz¨ahlbare Modell:
¨ QUIVALENZ ¨ 4.1. VOLLST ANDIGKEIT UND ELEMENTARE A
53
4.1.3 Isomorphiesatz von Cantor Je zwei abz¨ahlbare dichte lineare Ordnungen ohne Endpunkte sind isomorph. Beweis: Es seien (A, <), (B, <0 ) abz¨ahlbare dichte Ordnungen ohne Endpunkte, A = {a0 , a1 , . . .}, B = {b0 , b1 , . . .}. Wir konstruieren einen Isomorphismus h : (A, <) ∼ = (B, <0 ) mit a0n 7→ b0n wie folgt: hin: a0 7→ b0 , wir setzen also a00 := a0 , b00 := b0 .
.. .
her: In der Aufz¨ahlung B = {b0 , b1 , . . .} kommt nach b0 als n¨achstes Element b1 =: b01 an die Reihe: wir suchen in der Aufz¨ahlung A = {a0 , a1 , . . .} ein entsprechendes a01 , welches in der Ordnung < zu a00 = a0 so liegt, wie b01 zu b00 (da die Ordnungen keine Endpunkte haben, ist dies m¨oglich). hin: Es sei n = 2i − 1 ungerade und die Zuordnung a00 7→ b00 , . . . , a0n 7→ b0n bereits gefunden. Wir w¨ahlen a0n+1 als das erste a in der Aufz¨ahlung A = {a0 , a1 , . . .}, welches wir noch nicht nach B abgebildet haben (welches also unter den a00 , . . . a0n noch nicht vorgekommen ist) und ordnen diesem ein entsprechendes b0n+1 in B zu, welches unter den bisherigen Bildern b00 , . . . , b0n nicht vorkommt, so dass es zu diesen in der Ordnung <0 so liegt, wie a zu den a00 , . . . a0n , mithin ({a00 , . . . , a0n+1 }, <) ∼ = ({b00 , . . . , b0n+1 }, <), was m¨oglich ist, da die Ordnung <0 auf B dicht und ohne Endpunkte ist. her: Es sei n = 2i gerade und die die Zuordnungen a00 7→ b00 , . . . , a0n 7→ b0n bereits gefunden. Wir w¨ahlen jetzt umgekehrt ein b0n+1 als das erste b in der Aufz¨ahlung B = {b0 , b1 , . . .}, f¨ur welches wir noch kein Urbild in A gefunden haben (welches also unter den b00 , . . . b0n noch nicht vorgekommen ist) und ordnen diesem ein entsprechendes a0n+1 in A zu, welches unter den bisherigen Urbildern a00 , . . . , a0n nicht vorkommt, so dass es zu diesen in der Ordnung < so liegt, wie b zu den b00 , . . . , b0n , mithin ({a00 , . . . , a0n+1 }, <) ∼ = ({b00 , . . . , b0n+1 }, <), was m¨oglich ist, da die Ordnung < auf A dicht und ohne Endpunkte ist.
Damit erhalten wir eine ordnungstreue bijektive Abbildung h : A ←→ B, die wegen der ”hin”-F¨alle schließlich alle Elemente von A abbildet und wegen der ”her”F¨alle auch alle Elemente von B als Bilder annimmt.
¨ QUIVALENZ ¨ 4.1. VOLLST ANDIGKEIT UND ELEMENTARE A
54
4.1.4 Bemerkungen 1. Auf a¨ hnliche Weise kann man zeigen, dass auch zwei abz¨ahlbare dichte lineare Ordnungen mit erstem und letztem Element isomorph sind (indem man diese zuerst aufeinander abbildet und dann mit dem Hin- und Herverfahren fortf¨ahrt), a¨ hnlich bei anderen Festlegungen u¨ ber die Endelemente. Die (zun¨achst unvollst¨andige) Theorie der dichten linearen Ordnungen hat also 4 verschiedene Vervollst¨andigungen: ohne Endelemente, mit beiden Endpunkten, mit nur kleinstem und ohne gr¨oßtes sowie mit gr¨oßtem, aber ohne kleinstes Element. 2. Die Methode des “Hin und Her” stammt von H UNTINGTON 1904; C ANTOR hat nur den “Hin”-Teil benutzt, welcher u¨ brigens zeigt, dass man (Q, <) in jede dichte lineare Ordnung einbetten kann. (Diese Methode l¨asst sich in der Modelltheorie sehr gut verallgemeinern.) ¨ 3. Uberabz¨ ahlbare dichte lineare Ordnungen derselben M¨achtigkeit brauchen jedoch nicht isomorph zu sein: Ist (A, <) eine solche Ordnung, so ist die Ordnung, die man erh¨alt, wenn man eine Kopie der abz¨ahlbaren Struktur (Q, <) anf¨ugt, von derselben M¨achtigkeit, aber nicht isomorph. Es gilt sogar: Nimmt man aus den rationalen Zahlen einen Punkt heraus, so ist die verbleibende Struktur immer noch eine abz¨ahlbare lineare Ordnung ohne Endpunkte (¨ahnlich, wenn man endlich-viele Punkte herausnimmt), anders jedoch im Falle von (R, <): (Q\{0}, <) ∼ = (Q, <), aber (R\{0}, <) ∼ 6 (R, <). = Die Unterschiede beruhen darauf, dass (Q, <) sehr viele “L¨ucken” hat, die erst durch Hinzunahme der irrationalen Zahlen geschlossen werden; dagegen ist (R, <) so dicht (ein Kontinuum), dass dort jede monoton aufsteigende beschr¨ankte Folge einen Limes hat.
55
4.2. E LEMENTARE S UBSTRUKTUREN UND E INBETTUNGEN
4.2 Elementare Substrukturen und Einbettungen A und B seien Strukturen derselben Sprache L, A ⊆ B. Dann heißt A elementare Substruktur von B gdw beide bez¨uglich der Elemente der kleineren Struktur dieselben Eigenschaften erf¨ullen: A 4 B : ⇐⇒ f¨ur alle L-Formeln ϕ(v1 , . . . vn ) und f¨ur alle a1 , . . . an ∈ A : A |= ϕ[a1 , . . . an ]
⇐⇒
B |= ϕ[a1 , . . . an ],
A4B
⇐⇒
AA ≡ BA .
d. h.
Ein Homomorphismus h : A −→ B heißt eine elementare Einbettung gdw f¨ur alle L-Formeln ϕ(v1 , . . . vn ) und f¨ur alle a1 , . . . an ∈ A gilt: A |= ϕ[a1 , . . . an ] ⇐⇒ B |= ϕ[h(a1 ), . . . h(an )]. Indem man f¨ur ϕ die Formeln v1 = v2 bzw. R(v1 , . . . vn ) w¨ahlt, sieht man, dass in diesem Fall h tats¨achlich eine Einbettung sein muss. Die obige Bedingung besagt also gerade, dass das Bild h[A] eine elementare Substruktur von B ist; durch Identifizieren kann man dann also A 4 B erreichen. Diese Begriffe kann man auch mit Hilfe des Diagramms charakterisieren; der Beweis des fr¨uheren Diagrammlemmas 3.4.1 l¨asst sich n¨amlich leicht erweitern: 4.2.1 Diagrammlemma (Fortsetzung) Es sei A eine L-Struktur, (B, (aB )a∈A ) eine LA -Struktur und h : A −→ B definiert durch h(a) = aB . Dann gilt: (i) (B, (h(a))a∈A ) |= D(A) ⇐⇒ h : A −→ B ist eine Einbettung, (ii) (B, (h(a))a∈A ) |= DL (A) ⇐⇒ h : A −→ B ist eine elementare Einbettung. Insbesondere gilt f¨ur A ⊆ B: (iii) BA |= D(A) ⇐⇒ A ⊆ B, (iv) BA |= DL (A) ⇐⇒ A 4 B, (v) AA ≡ BA ⇐⇒ A 4 B.
4.2. E LEMENTARE S UBSTRUKTUREN UND E INBETTUNGEN
56
4.2.2 Kriterium von Tarski Es seien A, B L-Strukturen, A ⊆ B. Dann sind a¨ quivalent: (i) A 4 B (ii) f¨ur alle L-Formeln ϕ(v0 , . . . , vn ) und beliebige a1 , . . . an ∈ A gilt: B |= ∃v0 ϕ[a1 , . . . an ] =⇒ es gibt ein a0 ∈ A mit B |= ϕ[a0 , a1 , . . . an ]. Der Beweis ist sehr einfach: (i) ⇒ (ii) folgt unmittelbar aus der Definition einer elementaren Substruktur, w¨ahrend man die Umkehrung durch Induktion u¨ ber den Formelaufbau beweist. Dabei sind alle F¨alle trivial bis auf den Fall einer Formel der Gestalt ∃vo ϕ, und hier liefert das Kriterium den entscheidenden Schritt von der Existenz in der Struktur B zur Existenz in der Unterstruktur A. Dieses Kriterium ist besonders n¨utzlich, weil in (ii) nur die G¨ultigkeit in der Struktur B vorkommt. F¨ur Anwendungen kann man auch oft den folgenden Satz benutzen: Satz Es sei A ⊆ B und f¨ur beliebige a1 , . . . an ∈ A, b ∈ B existiere ein Automorphismus j : B −→ B mit j(ai ) = ai und j(b) ∈ A, welcher also die ai festl¨asst und b nach A abbildet. Dann ist A 4 B.
Beispiele 1. (Q, <) 4 (R, <) (wende obigen Satz an!) und somit auch (Q, <) ≡ (R, <). 2. A 4 B =⇒ A = B, falls A oder B endlich sind. (Denn nach Voraussetzung gelten in A dieselben Anzahlformeln wie in B.) Endliche Strukturen haben somit weder echte elementare Substrukturen noch echte elementare Erweiterungen, anders dagegen im Falle unendlicher Strukturen: Diese haben in jeder kleineren M¨achtigkeit κ (solange noch κ ≥ card(L)) eine elementare Substruktur:
4.2. E LEMENTARE S UBSTRUKTUREN UND E INBETTUNGEN
57
4.2.3 Satz von L¨owenheim-Skolem-Tarski (abw¨arts) A sei eine L-Struktur, κ eine Kardinalzahl mit card(L) ≤ κ ≤ card(A). Dann existiert eine Struktur B mit B 4 A , card(B) = κ. Zusatz: Ist A0 ⊆ A beliebig mit card(A0 ) ≤ κ, so kann man zus¨atzlich A0 ⊆ B verlangen. Beweis: Es sei A0 ⊆ A gegeben mit card(A0 ) ≤ κ ≤ card(A). Indem wir A0 n¨otigenfalls vergr¨oßern, k¨onnen wir annehmen, dass card(A0 ) = κ ist. Falls f¨ur Elemente a1 , . . . , an ∈ A0 (∗) A |= ∃v0 ϕ[a1 , . . . , an ] gilt, so m¨ussen wir ein (von ϕ und den a1 , . . . , an abh¨angiges) b∃v0 ϕ (a1 , . . . , an ) zu A0 hinzunehmen; A1 sei die Menge, die aus A0 entsteht, indem solche Beispiele (und zwar f¨ur alle m¨oglichen Existenzformeln und alle m¨oglichen Belegungen mit Elementen aus A0 ) hinzugenommen werden. Nach unseren fr¨uheren Ergebnissen u¨ ber unendliche Kardinalzahlen 1.4.5 bleibt card(A1 ) = card(A0 ) = κ. Nun kann aber (*) m¨oglicherweise f¨ur eine Formel ϕ und neue Elemente a1 , . . . , an ∈ A1 gelten, die nicht in A0 enthalten sind; wir m¨ussen also das Verfahren wiederholen: Ist Ai definiert, so erg¨anze man es um geeignete Elemente von A, so dass gilt: Falls f¨ur a1 , . . . , an ∈ Ai : A |= ∃v0 ϕ[a1 , . . . , an ], so existiert ein a ∈ Ai+1 mit A |= ϕ[a, a1 , . . . , an ]. Wie im ersten Schritt l¨asst sich Ai+1 aus Ai gewinnen, ohne dass die Kardinalit¨at sich a¨ ndert. Schließlich setzen wir B :=
[
Ai
i∈N
und erhalten eine Menge B mit A0 ⊆ B ⊆ A und card(B) = κ. Beim ersten Schritt m¨ussen wir die Konstanten von A bereits aufgenommen haben (mit (*) f¨ur die Formel ∃v0 (v0 = c)) und in allen weiteren Schritten unter den Funktionen von A abgeschlossen haben (entsprechend der Formel ∃v0 (v0 = F(v1 , . . . , vn )), so dass B das Universum einer Unterstruktur B von A ist. Schließlich gilt B 4 A, weil unsere Konstruktion gerade so eingerichtet ist, dass das Kriterium von TARSKI VAUGHT anwendbar ist. Einfacher mit Hilfe des Kompaktheitssatzes erhalten wir den
4.2. E LEMENTARE S UBSTRUKTUREN UND E INBETTUNGEN
58
4.2.4 Satz von L¨owenheim-Skolem-Tarski (aufw¨arts) A sei eine unendliche L-Struktur, κ eine Kardinalzahl mit card(A), card(L) ≤ κ. Dann existiert eine Struktur B mit A 4 B , card(B) = κ. Beweis: Wir w¨ahlen zun¨achst eine Menge C mit A ⊆ C und card(C) = κ und erweitern die Theorie von A (mit Hilfe neuer Konstanten) um S¨atze, so dass jedes Modell mindestens so viele Elemente wie C hat: T0 = Th(A) ∪ {c 6= d|c, d ∈ C, c 6= d}. Nach dem Kompaktheitssatz hat T0 ein Modell, etwa B, in welchem die neuen Konstanten c durch Elemente von B interpretiert werden, und zwar verschiedene Konstanten durch verschiedene Elemente von B. Indem wir zu einer isomorphen Struktur u¨ bergehen, k¨onnen wir annehmen, dass cB = c ist und somit C ⊆ B, also card(B) ≥ κ. Die Sprache von T0 hat wegen κ ≥ card(L) die M¨achtigkeit κ, also kann man auch annehmen, dass card(B) = κ ist (indem man den Abw¨arts-Satz benutzt). Schließlich gilt wegen B |= Th(A) : A ≡ B. Die st¨arkere Aussage A 4 B erh¨alt man, indem man dasselbe Argument benutzt, jedoch statt Th(A) das elementare Diagramm Th(AA ) w¨ahlt, das aus allen in A wahren LA -S¨atzen besteht. Folgerungen 1. Ist A eine L-Struktur und κ ≥ card(L) eine Kardinalzahl, so gibt es eine Struktur B mit card(B) = κ und • B4A
im Falle κ ≤ card(A),
• A4B
im Falle card(A) ≤ κ.
2. Insbesondere hat jede Theorie T, die ein unendliches Modell besitzt, f¨ur jede Kardinalzahl κ ≥ card(L) ein Modell der Kardinalzahl κ. 3. Noch spezieller: Eine Theorie T in einer abz¨ahlbaren Sprache L, die u¨ ber¨ haupt ein Modell hat, hat ein abz¨ahlbares Modell. Dieser Satz von L OWEN HEIM (1915) ist eines der fr¨ uhesten Ergebnisse der mathematischen Logik.
¨ 4.3. K ATEGORIZIT AT
59
4.3 Kategorizit¨at Alle Modelle des Satzes ∃n haben dieselbe Anzahl n, und es gilt sogar der ¨ endliche Modelle 4.3.1 Isomorphiesatz fur Ist A endlich, so: A ≡ B ⇐⇒ A ∼ = B. Zusammen mit fr¨uheren Ergebnissen erhalten wir: 1. Hat eine vollst¨andige Theorie ein endliches Modell, so sind also alle Modelle dieser Theorie isomorph (zu diesem einen Modell). 2. Hat eine Theorie beliebig große endliche Modelle, so nach 3.3.2 auch ein unendliches Modell. 3. F¨ur eine Theorie T mit einem unendlichen Modell gibt es Modelle in jeder M¨achtigkeit κ ≥ card(L), wobei L die Sprache der Theorie T ist. Definiert man eine Theorie T als kategorisch genau dann, wenn je zwei Modelle von T isomorph sind, so sind zwar vollst¨andige Theorien mit einem endlichen Modell kategorisch, aber keine Theorie mit einem unendlichen Modell. Man kann dann h¨ochstens noch danach fragen, ob Modelle derselben M¨achtigkeit isomorph sind: T κ-kategorisch : ⇐⇒ je zwei Modelle von T der Kardinalit¨at κ sind isomorph. 4.3.2 Test von Vaught Ist eine Theorie T κ -kategorisch f¨ur ein κ ≥ card(L) und besitzt T nur unendliche Modelle, so ist T vollst¨andig. Beweis: Gegeben seien zwei Modelle A, B von T, von denen wir zeigen m¨ussen, dass sie elementar-¨aquivalent sind. Da sie unendlich sind, kann man nach den ¨ S¨atzen von L OWENHEIM -S KOLEM -TARSKI zu elementaren Erweiterungen (bzw. 0 0 Substrukturen) A , B dieser Strukturen u¨ bergehen, die dann dieselbe M¨achtigkeit κ haben, also nach Voraussetzung isomorph, insbesondere elementar-¨aquivalent sind. Damit sind dann aber auch A, B elementar-¨aquivalent.
4.4. V EREINIGUNGEN UND D URCHSCHNITTE VON S TRUKTUREN
60
Bemerkungen Es gibt Theorien, die • f¨ur keine unendliche Kardinalzahl κ κ-kategorisch sind (z. B. die Theorie der reell-abgeschlossenen K¨orper), • f¨ur κ = ℵ0 , aber f¨ur keine u¨ berabz¨ahlbare Kardinalzahl κ κ-kategorisch sind (z. B. die Theorie der dichten linearen Ordnung ohne Endpunkte), • nur f¨ur u¨ berabz¨ahlbare Kardinalzahl κ κ-kategorisch sind (z. B. die Theorie der algebraisch-abgeschlossenen K¨orper), • f¨ur alle unendlichen Kardinalzahlen κ κ-kategorisch sind (z.B. die Theorie der unendlichen Mengen in der Sprache mit = und den Konstanten cn ; einzige Axiome sind die S¨atze cn 6= cm f¨ur n 6= m). Mehr Unterscheidungen gibt es nicht: Nach einem Satz von M ORLEY (1965) gilt: Ist eine Theorie T (in einer abz¨ahlbaren Sprache) κ-kategorisch f¨ur ein u¨ berabz¨ahlbares κ, so ist T κ-kategorisch f¨ur alle u¨ berabz¨ahlbaren κ. (Entsprechend verallgemeinert gilt nach S HELAH dieses Ergebnis auch f¨ur Theorien in einer u¨ berabz¨ahlbaren Sprache.) Interessant ist außerdem das Ergebnis von VAUGHT, dass eine vollst¨andige Theorie niemals genau zwei abz¨ahlbare nicht-isomorphe Modelle besitzen kann. Eine Reihe neuerer Arbeiten (insbesondere von S HELAH) besch¨aftigt sich mit der Frage • wieviele nicht-isomorphe Modelle der M¨achtigkeit κ kann eine Theorie T besitzen und • wie kann man diese Modelle klassifizieren?
4.4 Vereinigungen und Durchschnitte von Strukturen Bekanntlich ist der Durchschnitt von (affinen) Unterr¨aumen eines Vektorraumes wieder ein Unterraum (oder die leere Menge), w¨ahrend die Vereinigungsmenge ¨ lediglich einen Unterraum aufspannt. Ahnlich ist es im allgemeinen Fall von Substrukturen einer Struktur A:
4.4. V EREINIGUNGEN UND D URCHSCHNITTE VON S TRUKTUREN
61
4.4.1 Durchschnitt Es sei (Ai )i∈I eine Familie von Substrukturen einer Struktur A. Dann ist der T Durchschnitt i∈I |Ai | entweder 0/ oder Grundbereich einer Substruktur von A, T die mit i∈I Ai bezeichnet wird. Denn sind die Bedingungen (i) und (ii) von Satz 2.2.2 f¨ur alle |Ai | erf¨ullt, so auch f¨ur deren Durchschnitt. - Wichtiger als der Durchschnitt ist die 4.4.2 Vereinigung Es sei wieder (Ai )i∈I eine Familie von Substrukturen einer Struktur A. Dann erS S zeugt die Vereinigungsmenge i∈I |Ai | eine Substruktur von A, die mit i∈I Ai S bezeichnet wird, ihr Grundbereich ist i∈I |Ai |. Interessanter ist der Fall, dass f¨ur eine vorgegebene Familie von Strukturen eine gemeinsame Oberstruktur nicht vorhanden ist, sondern erst gebildet werden soll. Dazu m¨ussen aber die Strukturen bestimmte Vertr¨aglichkeitsbedingungen erf¨ullen. 4.4.3 Ketten von Strukturen Eine Familie (Ai )i∈I von L-Strukturen bildet eine Kette, wenn je zwei Strukturen miteinander vergleichbar sind in dem Sinne, dass von zwei Strukturen jeweils eine Struktur eine Substruktur der anderen ist: (K) (Ai )i∈I ist eine Kette : ⇐⇒ ∀i, j ∈ I : Ai ⊆ A j oder A j ⊆ Ai . Damit sind auch je endlich-viele Strukturen der Kette vergleichbar; insbesondere: wenn Ai1 . . . Ain Strukturen der Kette sind, so sind alle ⊆ Aik f¨ur ein k. Sp¨ater ben¨otigen wir einen st¨arkeren Begriff: (Ai )i∈I ist eine elementare Kette : ⇐⇒ ∀i, j ∈ I : Ai 4 A j oderA j 4 Ai . Die Vereinigung
i∈I Ai
S
einer Kette k¨onnen wir wie folgt definieren:
(V1) |A| :=
S
i∈I |Ai |,
(V2) RA :=
S
Ai
f¨ur jedes Relationszeichen R der Sprache L,
(V3) f A :=
S
f Ai
f¨ur jedes Funktionszeichen f der Sprache L,
i∈I R
i∈I
(V4) cA := cAi
f¨ur jede Individuenkonstante c der Sprache L.
4.4. V EREINIGUNGEN UND D URCHSCHNITTE VON S TRUKTUREN
62
Das bedeutet also f¨ur ein Relationszeichen R und Elemente a1 , . . . , an ∈ A: RA (a1 , . . . , an ) ⇐⇒ RAi (a1 , . . . , an ) f¨ur ein i ∈ I mit a1 , . . . , an ∈ Ai , wobei es wegen (K) auf die Auswahl des gew¨ahlten i nicht ankommt, a¨ hnlich im Falle der Funktionszeichen. Die Individuenkonstanten werden wegen (K) in allen Ai durch dasselbe Element interpretiert (und damit auch in der Vereinigung). ¨ 4.4.4 Satz uber Ketten von Strukturen Ist A =
i∈I Ai
S
die Vereinigung der Kette (Ai )i∈I , so gilt:
(i) A ist eine L-Struktur mit Ai ⊆ A f¨ur jedes i ∈ I, (ii) A ist die kleinste derartige L-Struktur. (iii) Ist (Ai )i∈I eine elementare Kette, so gilt Ai 4 A f¨ur jedes i ∈ I. (Kettenlemma von Tarski) In den meisten F¨allen (wie auch in den folgenden Beispielen) kann man sich auf aufsteigende ω-Ketten von Strukturen beschr¨anken; in diesen F¨allen ist die Indexmenge I = ω = N und es gilt: ∀n < m
An ⊆ Am .
Beispiele 1. Es sei An := [1/2n , 1] das abgeschlossene Intervall der reellen Zahlen, An = (An , ≤) mit der gew¨ohnlichen ≤-Beziehung auf den reellen Zahlen. Dann ist die Vereinigung dieser Strukturen das halb-offene Intervall (A, ≤) mit A = (0, 1]. 2. Es sei An := {x ∈ Z| − n ≤ x ≤ n}, An = (An , ≤) mit der gew¨ohnlichen ≤Beziehung auf den ganzen Zahlen. Dann ist die Vereinigung dieser Strukturen (Z, ≤). In beiden F¨allen ist die Vereinigung von (dichten) linearen Ordnungen wieder eine (dichte) lineare Ordnung, aber die Existenz von Endpunkten bleibt nicht erhalten! Im ersten Fall haben wir isomorphe, insbesondere elementar-¨aquivalente Strukturen, aber die Vereinigung hat neue Eigenschaften. Man kann nun aber genau angeben, welche Eigenschaften erhalten bleiben:
63
4.4. V EREINIGUNGEN UND D URCHSCHNITTE VON S TRUKTUREN
σ ist ein ∀∃-Satz: ⇐⇒ σ = ∀x1 . . . ∀xn ∃y1 . . . ∃ym ϕ f¨ur eine quantorenfreie Formel ϕ Beispiele 1. ∀x∃y (x ≤ y ∧ x 6= y) (Unbeschr¨anktheit nach oben) ist ein ∀∃-Satz, nicht aber ∃x∀y x ≤ y (Existenz eines kleinsten) bzw. ∃x∀y y ≤ x (Existenz eines gr¨oßten Elementes). 2. Wichtige S¨atze der Algebra sind ebenfalls ∀∃-S¨atze: ∀x∃y (x ◦ y = e) (Existenz eines inversen Elementes) sowie ∀x0 . . . xn ∃y (yn+1 + xn yn + . . . + x0 = 0) (Existenz von Nullstellen f¨ur normierte Polynome vom Grad n + 1). ∀∃-S¨atze bleiben bei der Vereinigung von Ketten erhalten: ¨ Ketten 4.4.5 Erhaltungssatz fur Ist A =
i∈I Ai
S
die Vereinigung der Kette (Ai )i∈I , so gilt f¨ur jeden ∀∃-Satz σ : Ai |= σ f¨ur alle i ∈ I =⇒ A |= σ .
Beweis: Es sei σ = ∀x1 . . . ∀xn ∃y1 . . . ∃ym ϕ f¨ur eine quantorenfreie Formel ϕ und σ gelte in allen Ai . Um die G¨ultigkeit in A nachzuweisen, seien beliebige a1 , . . . , an ∈ A gegeben. Nach Definition der Vereinigungsmenge einer Kette k¨onnen wir ein i ∈ I finden, so dass alle a1 , . . . , an ∈ Ai sind. Weil σ in Ai gilt, gibt es b1 , . . . , bm ∈ Ai mit Ai |= ϕ[a1 , . . . , an , b1 , . . . , bm ]. Da ϕ quantorenfrei ist, sich also aussagenlogisch aus atomaren Formeln zusammensetzt, und da Ai ⊆ A, so gilt die Formel ϕ mit derselben Belegung auch in A. Die b1 , . . . , bm sind aber auch in A, so dass dort der Existenzsatz gilt: A |= ∃y1 . . . ∃ym ϕ[a1 , . . . , an , b1 , . . . , bm ].
Das obige Ergebnis ist optimal: Eine Theorie heiße induktiv gdw sie abgeschlossen ist unter Vereinigungen von Ketten, d. h. ist (Ai )i∈I eine Kette von MoS dellen von T, so ist auch die Vereinigung i∈I Ai ein Modell von T.
64
4.5. P RODUKTE UND U LTRAPRODUKTE
4.4.6 Satz von Chang- Ło´s-Szusko Eine Theorie T ist induktiv gdw sie ein Axiomensystem aus ∀∃-S¨atzen besitzt. Beim Beweis (den wir hier nicht ausf¨uhren k¨onnen) wird f¨ur die Induktivit¨at von T nur die Abgeschlossenheit unter aufsteigenden ω-Ketten ben¨otigt, hieraus folgt dann also schon die Abgeschlossenheit unter beliebigen Ketten! Zahlreiche algebraische Theorien sind induktiv: die Theorie der (A BELschen) Gruppen, der Ringe, der (reell- bzw. algebraisch-abgeschlossenen) K¨orper, der Vektorr¨aume, etc.
4.5 Produkte und Ultraprodukte W¨ahrend sich die Vereinigung einer Familie von Strukturen nur unter geeigneten Vertr¨aglichkeitsbedingungen sinnvoll definieren l¨asst, kann man das (direkte) Produkt stets bilden. Dazu erinnern wir an den Begriff der Familie von Mengen: (ai )i∈I ist die auf der Indexmenge I definierte Funktion f mit f (i) = ai f¨ur alle i ∈ I. Das mengentheoretische Produkt einer Familie (Ai )i∈I ist eine Verallgemeinerung des endlichen Cartesischen Produktes:
∏ Ai := {(ai)i∈I | ∀i ∈ I ai ∈ Ai}
Produkt der Mengen (Ai )i∈I
i ∈I
Das Auswahlaxiom der Mengenlehre besagt gerade, dass die Produktmenge nicht-leerer Mengen wiederum nicht-leer ist. Bezeichnungen: Um endliche Folgen von Elementen aus der Produktmenge zu bezeichnen, werden wir Querstriche und obere Indizes verwenden: • a1 = (a1i )i∈I , . . . , an = (ani )i∈I seien n Elemente der Produktmenge A = ∏i ∈I Ai , • a = (a1 , . . . , an ) bezeichnet das entsprechende n-Tupel aus An , • ai = (a1i , . . . , ani ) die i-te Projektion des n-Tupels a = (a1 , . . . , an ).
4.5. P RODUKTE UND U LTRAPRODUKTE
65
4.5.1 Direktes Produkt (Ai )i∈I sei eine Familie von L-Strukturen, I 6= 0. / Das direkte Produkt der (Ai )i∈I ist die L-Struktur A = ∏i ∈I Ai , die wie folgt erkl¨art ist: (P1) A := ∏i ∈I Ai ist der Grundbereich von A, (P2) RA (a) : ⇐⇒ ∀i ∈ I RAi (ai ) f¨ur jedes Relationszeichen R von L, (P3) f A (a) := ( f Ai (ai ))i∈I f¨ur jedes Funktionszeichen f von L, (P4) cA := (cAi )i∈I f¨ur jede Individuenkonstante c von L. F¨ur eine endliche Indexmenge I = {1, . . . , m} schreibt man auch A1 × . . . × Am , und sind alle Strukturen dieselbe Struktur A, so bezeichnet man das direkte Produkt auch mit AI und nennt es direkte Potenz von A. Beispiele 1. Ist R der gew¨ohnliche Vektorraum u¨ ber den reellen Zahlen, so ist Rn das nfache direkte Produkt (die n-te Potenz) von R, denn die Operationen werden nach P3 komponentenweise erkl¨art. Allgemeiner ist das direkte Produkt von Gruppen wieder eine Gruppe. 2. Das direkte Produkt A × A der linearen Ordnungen A = (R, <) ist jedoch nur eine partielle Ordnung, denn nach P2 werden die Relationen im Produkt ebenfalls komponentenweise erkl¨art, was in diesem Fall aber bedeutet, dass etwa die Paare (0, 1) und (1, 0) in der Ordnungsrelation des Produktes unvergleichbar sind. Ebenso ist das direkte Produkt des K¨orpers der reellen Zahlen mit sich kein K¨orper, da im Produkt Nullteiler auftauchen: (0, 1) · (1, 0) = (0, 0) bei komponentenweiser Multiplikation! Da sich nicht alle Eigenschaften von allen Strukturen auf das direkte Produkt u¨ bertragen lassen, wird man versuchen, die Eigenschaften von sehr vielen Strukturen zu erhalten. Der Begriff von “sehr vielen” Elementen von I (oder von einer “sehr großen” Teilmenge von I) wird durch den Begriff des Filters umschrieben: 4.5.2 Filter und Ultrafilter Es sei I 6= 0/ eine Menge und P(I) := {X | X ⊆ I} ihre Potenzmenge. Eine Menge F ⊆ P(I) heißt (echter) Filter auf I gdw
4.5. P RODUKTE UND U LTRAPRODUKTE
66
(F1) 0/ 6∈ F und I ∈ F, (F2) A ∈ F und A ⊆ B ⊆ I =⇒ B ∈ F, (F3) A, B ∈ F =⇒ A ∩ B ∈ F. F¨ur einen Ultrafilter auf I gilt zus¨atzlich f¨ur alle A ⊆ I: (F4) (entweder) A ∈ F oder I\A = {x ∈ I | x 6∈ A} ∈ F. Ultrafilter haben besonders sch¨one Eigenschaften, die sie f¨ur die Logik interessant machen: Ist U Ultrafilter auf I, so gilt f¨ur alle A, B ⊆ I: (U1) A 6∈ U ⇐⇒ I\A ∈ U, (U2) A ∈ U ∧ B ∈ U ⇐⇒ A ∩ B ∈ U, (U2) A ∈ U ∨ B ∈ U ⇐⇒ A ∪ B ∈ U. Beispiele und Bemerkungen 1. F¨ur jedes 0/ 6= A ⊆ I ist F(A) := {X ⊆ I | A ⊆ X} ein Filter, der von A erzeugte Hauptfilter. Dieser ist ein Ultrafilter genau dann, wenn A nur ein Element besitzt. Interessanter sind Ultrafilter, die keine Hauptfilter sind, sie werden auch freie Ultrafilter genannt (w¨ahrend die Hauptultrafilter durch ein Element fixiert sind). 2. Hat I = {a, b} zwei Elemente a 6= b, so gibt es auf I die Filter {I}, {{a}, I} und {{b}, I}; die letzten beiden sind Hauptultrafilter, {I} ist zwar Hauptfilter, aber kein Ultrafilter. Allgemeiner ist auf einer endlichen Menge I jeder Filter ein Hauptfilter (erzeugt vom Durchschnitt der endlich-vielen Elemente des Filters). 3. Auf einer unendlichen Menge M ist die Menge {X ⊆ M | X co-endlich (d. h. M \ Xendlich)} ein Filter auf M, der kein Hauptfilter (und auch kein Ultrafilter) ist und welcher im Falle M = N F R E´ CHET-Filter genannt wird. Ultrafilter, die den obigen Filter erweitern, k¨onnen keine endlichen Mengen als Elemente enthalten und sind somit freie Ultrafilter.
67
4.5. P RODUKTE UND U LTRAPRODUKTE
Die Existenz von freien Ultrafiltern auf unendlichen Mengen ist nicht trivial; man beweist sie mit Hilfe des Auswahlaxioms (bzw. des a¨ quivalenten Z ORNschen Lemmas), das wir im Rahmen der Mengenlehre gesondert behandeln werden. Außerdem benutzen wir die finite intersection property (endliche-DurchschnittsEigenschaft) f¨ur eine Menge E: (fip) Jeder Durchschnitt von endlich-vielen Elementen aus E ist 6= 0. / 4.5.3 Ultrafiltersatz, Boolesches Primidealtheorem (i) Ist E ⊆ P(I) eine Menge mit der Eigenschaft (fip), so existiert ein Ultrafilter U auf I mit E ⊆ U. Insbesondere: (ii) Jeder Filter F l¨asst sich erweitern zu einem Ultrafilter U ⊇ F.
Bezogen auf einen Ultrafilter U auf einer Indexmenge I k¨onnen wir die Elemente von U auffassen als Teilmengen von I, die “fast alle” Elemente von I enthalten, und die Eigenschaften, die in “fast allen” Strukturen Ai gelten, werden sich wegen der besonderen “logischen” Eigenschaften von Ultrafiltern auf das entsprechende Ultraprodukt u¨ bertragen. Zun¨achst erkl¨aren wir Produkte modulo einem Filter: 4.5.4 Reduziertes Produkt Es sei F ein Filter auf der Menge I und (Ai )i∈I eine Familie von L-Strukturen. F¨ur zwei a, b ∈ A = ∏i ∈I Ai setzen wir a ∼F b : ⇐⇒ {i ∈ I | ai = bi } ∈ F (wir k¨onnen es lesen als “a ist - bez¨uglich F - fast u¨ berall gleich b”) und erhal¨ ¨ ten eine Aquivalenzrelation auf A; mit aF bezeichnen wir die zugeh¨orige Aquivalenzklasse, und f¨ur endliche Folgen a = (a0 , . . . , an ) schreiben wir auch kurz a/F = (a0 /F, . . . , an /F). Das reduzierte Produkt A/F = ∏i ∈I Ai /F wird nun wie folgt definiert: (R1) A/F := {aF | a ∈ A} ¨ ist die Menge der Aquivalenzklassen als Grundbereich, (R2) RAF (aF ) : ⇐⇒ {i ∈ I|RAi (ai )} ∈ F f¨ur jedes Relationszeichen R von L,
68
4.5. P RODUKTE UND U LTRAPRODUKTE
(R3) f AF (aF ) := ( f Ai (ai ))i∈I /F = f A (a)/F f¨ur jedes Funktionszeichen f von L, (R4) cA/F := (cAi )i∈I /F = cA /F f¨ur jede Individuenkonstante c von L. Das bedeutet also, dass im Falle einer 2-stelligen Relation R im reduzierten Produkt a R b gilt gdw f¨ur die Komponenten ai R bi in “fast allen” Strukturen Ai gilt (wie speziell oben im Falle der Gleichheitsrelation =). (Nat¨urlich muss man nach¨ pr¨ufen, dass die obige Definition korrekt ist, d. h. dass sie nur von den Aquivalenzklassen (und nicht von deren Repr¨asentanten) abh¨angig ist.) Sind alle Strukturen Ai = A, so spricht man von einer reduzierten Potenz A, ist der Filter F ein Ultrafilter, von einem Ultraprodukt bzw. einer Ultrapotenz. Wir kommen nun zum fundamentalen Satz u¨ ber Ultraprodukte: 4.5.5 Satz von Ło´s I sei eine nichtleere Menge und U ein Ultrafilter auf I. Ferner sei (Ai )i∈I eine Familie von L-Strukturen und A = ∏i ∈I Ai das Produkt. Dann gilt f¨ur alle L-Formeln ϕ und alle Belegungen a: A/F |= ϕ[a] ⇐⇒ {i ∈ I | Ai |= ϕ[ai ]} ∈ U, d. h. eine Formel gilt im Ultraprodukt gdw sie (f¨ur die entsprechenden Komponenten) in fast allen Faktoren gilt. Zum Beweis des Satzes von Ło´s f¨uhren wir folgende Bezeichnung ein: F¨ur eine L-Formel ϕ(v0 , . . . , vn−1 ) und ein n-Tupel a von Elementen aus A heißt kϕ(a)k := {i ∈ I | Ai |= ϕ[ai ]}
die Boolesche Ausdehnung von ϕ(a).
Lemma (i) k¬ϕ(a)k = I\kϕ(a)k, (ii) k(ϕ ∧ ψ)(a)k = kϕ(a)k ∩ kψ(a)k, (iii) k(ϕ ∨ ψ)(a)k = kϕ(a)k ∪ kψ(a)k,
69
4.5. P RODUKTE UND U LTRAPRODUKTE
(iv) F¨ur alle (n-1)-Tupel a von Elementen aus A und f¨ur alle b ∈ A gilt: kϕ(a, b)k ⊆ k(∃vn ϕ)(a)k, und es gibt stets ein b ∈ M mit kϕ(a, b)k = k(∃vn ϕ)(a)k. Beweis: (i)-(iii) und der erste Teil von (iv) folgen direkt aus der Definition der Booleschen Ausdehnung (und des Wahrheitspr¨adikates). Um den letzten Teil zu beweisen, beachten wir, dass es zu jedem i ∈ k(∃vn ϕ)(a)k ein bi ∈ Ai gibt mit Ai |= ϕ[ai , bi ]; f¨ur jedes andere j ∈ I\k(∃vn ϕ)(a)k w¨ahlen wir irgendein b j ∈ A j aus und erhalten damit eine Folge b = (bi )i∈I mit b ∈ A, f¨ur die auch k(∃vn ϕ)(a)k ⊆ kϕ(a, b)k gelten muss. Zusammen mit dem ersten Teil ergibt sich also hier die Gleichheit. Dieses Lemma zusammen mit den Eigenschaften (U1)-(U3) eines Ultrafilters ergeben nun leicht einen Beweis des Satzes von Ło´s: Zun¨achst zeigt man, dass sich (R3) und (R4) der Definition des reduzierten Produktes auf beliebige Terme u¨ bertragen lassen: t A/U (a/U) = (t Ai (ai ))i∈I /U = t A (a)/U, also gilt (R2) und damit die Behauptung des Satzes - auch f¨ur atomare Formeln (also der Form R(t1 , . . . ,tm )). Nun benutzen wir Induktion u¨ ber den Formelaufbau, um sie f¨ur beliebige Formeln nachzuweisen. Sei etwa ϕ = ¬ψ und die Behauptung des Satzes f¨ur die Formel ψ bewiesen, d. h. in der neuen Bezeichnungsweise: A/F |= ψ[a] ⇐⇒
kψ(a)k ∈ U,
also auch
A/F 6|= ψ[a] ⇐⇒
kψ(a)k 6∈ U,
daraus
A/F |= ¬ψ[a] ⇐⇒
kψ(a)k 6∈ U
nach der Wahrheitsdefiniton,
A/F |= ¬ψ[a] ⇐⇒
I\kψ(a)k ∈ U, da U Ultrafilter und
A/F |= ¬ψ[a] ⇐⇒
k¬ψ(a)k ∈ U
nach obigem Lemma.
70
4.5. P RODUKTE UND U LTRAPRODUKTE
¨ Somit haben wir die Behauptung auch f¨ur ϕ = ¬ψ bewiesen. Ahnlich argumentiert man im Falle der aussagenlogischen Zeichen ∧ und ∨. Sei nun schließlich ϕ = ∃vn ψ. Dann gilt A/F |= ∃vn ψ[a/U] ⇐⇒ ⇐⇒ ⇐⇒ ⇐⇒
A/F |= ψ[a/U, b] A/F |= ψ[a/U, b/U] kψ(a/U, b)k ∈ U k∃vn ψ(a/U)k ∈ U
f¨ur ein b ∈ A/U f¨ur ein b ∈ A f¨ur ein b ∈ A nach Ind.vor. nach obigem Lemma (iv).
Damit ist der Satz von Ło´s bewiesen.
Korollar I sei eine nichtleere Menge, U ein Ultrafilter auf I und A sei eine L-Struktur. Dann gibt es eine kanonische Einbettung j : A −→ AI /U,
definiert durch j(a) = (a)i∈I
(welche also jedem Element aus A die konstante Folge (a,a,. . . ) zuordnet), und es gilt: (i) j : A −→ AI /U ist eine elementare Einbettung, insbesondere (ii) A ≡ AI /U. Beispiele 1. F¨ur einen Hauptultrafilter sind die obigen Ergebnisse trivial: Wird U durch { j} erzeugt, so ist das Ultraprodukt A = ∏i ∈I Ai isomorph zu A j , die kanonische Einbettung des Korollars ein Isomorphismus. 2. Ist A = N das Standardmodell der nat¨urlichen Zahlen, U ein Ultrafilter auf I = N, so ist die Ultrapotenz NI /U elementar-¨aquivalent zum Standardmodell N, insbesondere auch ein Modell der P EANO-Axiome. Ist U ein freier Ultrafilter, so ist die kanonische Einbettung nicht surjektiv, die Ultrapotenz mithin ein (¨uberabz¨ahlbares) Nicht-Standardmodell von PA. 3. F¨ur eine Primzahl p sei F p der Primk¨orper der Charakteristik p, U ein freier Ultrafilter auf der Menge P der Primzahlen. Dann ist das Ultraprodukt ∏ p ∈P F p ein K¨orper der Charakteristik 0, denn f¨ur die Aussage χ p , welche ausdr¨uckt, dass ein K¨orper die Charakteristik p hat, gilt: {i ∈ P|Fi |= χ p } = {p} 6∈ U.
71
4.5. P RODUKTE UND U LTRAPRODUKTE
Wir tragen jetzt den modelltheoretischen Beweis des Kompaktheitssatzes nach (D. S COTT 1955): 4.5.6 Kompaktheitssatz F¨ur jede Theorie T und jeden Satz σ der Sprache von T gilt: (i) T |= σ =⇒ es gibt ein endliches T0 ⊆ T mit T |= σ , (ii) jedes endliche T0 ⊆ T hat ein Modell =⇒ T hat ein Modell. Beweis von (ii): Σ sei die Menge der Axiome von T, wobei wir annehmen k¨onnen, dass alle Formeln in Σ S¨atze sind (sonst ersetze man sie jeweils durch ihren universellen Abschluss). Nach Voraussetzung gibt es f¨ur jedes endliche ∆ ⊆ Σ ein Modell A∆ |= ∆; wir w¨ahlen also als Indexmenge I := {∆ | ∆ ⊆ Σ, ∆ endlich} und werden ein Modell von Σ als ein Ultraprodukt finden f¨ur einen geeigneten Ultrafilter auf I. Dazu definieren wir f¨ur jeden Satz σ ∈ Σ die Menge σˆ := {∆ ∈ I | σ ∈ ∆} ⊆ I
und setzen
E := {σˆ | σ ∈ Σ} ⊆ P(I).
E hat die Eigenschaft (fip) des Ultrafiltersatzes 4.5.3, da σˆ 1 , . . . , σˆ n ∈ E =⇒ {σ1 , . . . , σn } ∈ σˆ 1 ∩ . . . ∩ σˆ n , also existiert ein Ultrafilter U auf I mit E ⊆ U. Wir behaupten nun, dass A = ∏ A∆ |= Σ : ∆∈I
Sei σ ∈ Σ. Dann gilt f¨ur alle ∆ ∈ I: ∆ ∈ σˆ =⇒ σ ∈ ∆ =⇒ A∆ |= σ . Somit σˆ ⊆ {∆ ∈ I | A∆ |= σ }, und wegen σˆ ∈ U
ist auch die Obermenge
{∆ ∈ I | A∆ |= σ } ∈ U. Letzteres besagt aber nach dem Satz von Ło´s: A |= σ . (i) folgt aus (ii), indem man die Tatsache benutzt, dass f¨ur jeden Satz σ gilt: T |= σ ⇐⇒ T ∪ {¬σ } hat ein Modell.
¨ 4.6. M ODELLVOLLST ANDIGKEIT
72
Weitere Folgerungen aus dem Kompaktheitssatz: 1. Ist K eine endlich-axiomatisierbare Klasse von L-Strukturen (also eine ECKlasse), so gibt es zu jedem Axiomensystem Σ f¨ur K eine endliche Teilmenge von Σ, welche K axiomatisiert. 2. K ist eine EC-Klasse genau dann, wenn K und das Komplement von K EC∆ -Klassen sind. 3. Eine Klasse K von L-Strukturen ist eine EC∆ -Klasse gdw K abgeschlossen ¨ ist unter Ultraprodukten und elementarer Aquivalenz.
4.6 Modellvollst¨andigkeit Definition (1) Eine Theorie T heißt modellvollst¨andig gdw T ∪ D(A) ist vollst¨andig (bzgl. der Sprache LA ) f¨ur jedes A |= T. Mit Hilfe des Diagrammlemmas 4.2.1 ergibt sich, dass eine Theorie T modellvollst¨andig ist gdw f¨ur alle A, B |= T gilt: A ⊆ B =⇒ A 4 B. Insbesondere folgt aus dem Kettenlemma 4.4.4 und dem Satz 4.4.6 von C HANG Ł O S´ -S ZUSKO, dass jede modellvollst¨andige Theorie induktiv ist, also ein Axiomensystem aus ∀∃-S¨atzen besitzt. (2) Ein Modell P |= T einer Theorie T heißt Primmodell von T gdw es sich in jedes Modell von T einbetten l¨asst. Beispiele und Bemerkungen 1. AA ist (wegen des Diagrammlemmas 4.2.1) stets ein Primmodell von D(A). 2. Ist die Theorie T modellvollst¨andig und besitzt T ein Primmodell, so ist T vollst¨andig.
¨ 4.6. M ODELLVOLLST ANDIGKEIT
73
3. In der Algebra wird der Begriff des Primk¨orpers eingef¨uhrt: dieser ist ein Primmodell in obigem Sinne, und zwar ist der K¨orper Q der rationalen Zahlen ein Primmodell der Theorie der K¨orper der Charakteristik 0, w¨ahrend Z/p, der Restklassenk¨orper modulo p, das Primmodell der Theorie der K¨orper der Charakteristik p ist (p eine Primzahl). Die Theorie der K¨orper TF allein besitzt offenbar keinen Primk¨orper, sie ist weder vollst¨andig noch modellvollst¨andig. 4. Der K¨orper der reellen algebraischen Zahlen ist Primk¨orper der Theorie TRCF der reell-abgeschlossenen K¨orper, diese Theorie ist modellvollst¨andig und somit vollst¨andig. 5. Der K¨orper der algebraischen Zahlen ist Primk¨orper der Theorie der algebraisch-abgeschlossenen K¨orper der Charakteristik 0. Die Theorie TACF der algebraisch-abgeschlossenen K¨orper (ohne Festlegung der Charakteristik) ist zwar modellvollst¨andig, aber nicht vollst¨andig. Die obige Charakterisierung der modellvollst¨andigen Theorien deutet darauf hin, dass man in solchen Theorien Eigenschaften (fast) quantorenfrei ausdr¨ucken kann: Definition T sei eine Theorie der Sprache L, A eine L-Struktur. 1. T l¨asst (schwache) Quantorenelimination zu gdw zu jeder L-Formel ϕ eine quantorenfreie (bzw. ∃-) Formel ψ existiert mit T |= ϕ ↔ ψ. 2. A 41 B : ⇐⇒ A ⊆ B und f¨ur alle ∃-Formeln ψ(v1 , . . . , vn ) und alle a1 , . . . an ∈ A gilt: A |= ϕ[a1 , . . . an ] ⇐⇒ B |= ϕ[a1 , . . . an ]. 3. A heißt T- e.c. (T-existentiell-abgeschlossen) gdw f¨ur alle L-Strukturen B gilt: A ⊆ B |= T =⇒ A 41 B. 4. ET := {A | A T- e.c.}.
¨ 4.6. M ODELLVOLLST ANDIGKEIT
74
4.6.1 Robinsonscher Test F¨ur eine Theorie T sind folgende Aussagen a¨ quivalent: (i) T ist modellvollst¨andig, (ii) T l¨asst schwache Quantorenelimination zu, (iii) jede ∃-Formel ϕ ist in T a¨ quivalent zu einer ∀-Formel δ , (iv) f¨ur alle A, B |= T gilt: A ⊆ B =⇒ A 41 B, (v) f¨ur alle A, B |= T gilt: Ist f : A → B eine Einbettung, so ist f eine elementare Einbettung. (vi) Mod(T) = ET . Hierin ist (iv) das eigentliche Test-Kriterium, das insbesondere f¨ur Anwendungen auf algebraische Theorien noch etwas abgeschw¨acht werden kann.1 Um ein Kriterium f¨ur die vollst¨andige Elimination von Quantoren zu erhalten, muss man die Eigenschaft der Modellvollst¨andigkeit verst¨arken: Definition Eine Theorie T heißt substrukturvollst¨andig gdw T ∪ D(A) ist vollst¨andig f¨ur jedes A |= T∀ , d. h. T ∪ D(A) ist vollst¨andig f¨ur jede Substruktur A eines Modells A ⊆ B |= T. Satz F¨ur eine Theorie T sind folgende Aussagen a¨ quivalent: (i) T ist substrukturvollst¨andig, (ii) T l¨asst Quantorenelimination zu. Insbesondere gilt f¨ur eine ∀-Theorie T: T l¨asst Quantorenelimination zu gdw T modellvollst¨andig ist. 1 S.
etwa das Buch von R AUTENBERG , W.: Einf¨uhrung in die mathematische Logik, vieweg 2002, Kap. 5.5
¨ 4.6. M ODELLVOLLST ANDIGKEIT
75
Beispiele 1. Die Theorie TACF der algebraisch-abgeschlossenen K¨orper ist modellvollst¨andig, legt man auch die Charakteristik fest, so ist sie vollst¨andig. 2. Die Theorie TRCF der reell-abgeschlossenen K¨orper ist modellvollst¨andig und vollst¨andig. Sie stimmt u¨ berein mit der Theorie des angeordneten K¨orpers der reellen Zahlen. 3. Die Theorie der Vektorr¨aume u¨ ber den rationalen Zahlen ist modellvollst¨andig (eine ∃-Aussage u¨ ber eine Konjunktion von Basisformeln besagt in diesem Falle die L¨osbarkeit eines Systems von linearen Gleichungen und Ungleichungen). 4. Die Theorie der Gleichheit (also ohne nicht-logischen Axiome!) ist weder vollst¨andig noch modellvollst¨andig. Sie erlaubt auch keine Quantorenelimination, allerdings ist in dieser Theorie jede Formel a¨ quivalent zu einer aussagenlogisch aus Anzahlformeln und den Formeln vi = v j zusammengesetzten Formel. 5. Die Theorie DLO + OE der dichten linearen Ordnungen ohne Endpunkte ist vollst¨andig, modellvollst¨andig und erlaubt Quantorenelimination. 6. Die Theorie Th(N, <) ist vollst¨andig, aber nicht modellvollst¨andig. Theorien mit Quantorenelimination sind meistens entscheidbar, d. h. es gibt ein effektives Verfahren (dieser Ausdruck wird sp¨ater pr¨azisiert werden), welches f¨ur jeden Satz der Sprache von T angibt, ob dieser Satz in T gilt oder nicht. So sind die Theorien • DLO + OE, • die Theorie des (angeordneten) K¨orpers der reellen Zahlen (= Theorie der reell-abgeschlossenen K¨orper) und • die Theorie des K¨orpers der komplexen Zahlen (= Theorie der algebraischabgeschlossenen K¨orper der Charakteristik 0) vollst¨andig und entscheidbar. Dagegen ist dagegen die Theorie der nat¨urlichen Zahlen Th(N, +, ·, 0, 1) unentscheidbar. N¨aher gehen wir hierauf in den abschließenden Kapiteln ein.
76
Teil II Collegium Logicum
77 Mein teurer Freund, ich rat´ Euch drum Zuerst Collegium Logicum. Da wird der Geist Euch wohl dressiert In spanische Stiefeln eingeschn¨urt, Daß er bed¨achtiger so fortan Hinschleiche die Gedankenbahn. J. W. v. Goethe: Faust I
Alle Menschen sind sterblich, Sokrates ist ein Mensch, also ist Sokrates sterblich. So lautet ein bekanntes Beispiel eines logischen Schlusses. Dabei sagt die Logik nichts aus u¨ ber die G¨ultigkeit der Einzelaussagen, insbesondere behauptet sie nicht die Sterblichkeit von Sokrates, sondern die Wahrheit dieser Aussage (der Conclusion) unter Annahme, dass die beiden vorangehenden Aussagen (die Pr¨amissen) wahr sind. Nach dem gleichen Muster k¨onnte man auch folgern: Alle Tappel haben einen Deppel, Knobbel ist ein Tappel, also hat Knobbel einen Deppel. Bereits A RISTOTELES (384 - 322 v. Chr.) hat in seiner Syllogistik damit begonnen, derartige Schlussweisen zu formalisieren und diese systematisch auf ihre G¨ultigkeit zu untersuchen2 . Auch erste Ans¨atze einer Aussagenlogik finden sich bei A RISTOTELES ; sie wird vor allem in der Stoa und in der Scholastik weiterentwickelt. Den obigen Schluss k¨onnen wir in moderner Symbolik in der Form ∀X(M(X) → T (X)), M(S) also: T (S) schreiben. Daraus wird deutlich, dass der Schluss ganz allgemein und allein aufgrund seiner Form gilt - die Untersuchung derartiger Schlussweisen ist Gegenstand der Mathematischen Logik (auch Formale Logik, Symbolische Logik oder Metamathematik, von Philosophen auch Moderne Logik oder Logistik genannt). 2 I.
Susan Russinoff hat 1999 darauf hingewiesen, dass die endg¨ultige Klassifizierung der Syllogismen erst 1883 von einer Sch¨ulerin des amerikanischen Logikers C.S. P EIRCE dargestellt wurde: Christine Ladd-Franklin. Bereits 1882 hatte sie alle Voraussetzungen f¨ur eine Promotion an der John Hopkins University erf¨ullt; da sie aber damals als Frau nicht zugelassen wurde, erhielt sie ihren Ph.D.-Grad erst 1926, und ihre Arbeit blieb u¨ ber hundert Jahre unbeachtet.
78
Die Mathematische Logik ist (i) eine Logik f¨ur die Mathematik; sie untersucht Ausdrucksm¨oglichkeiten in formalen Sprachen und Schlussweisen, wie sie in der Mathematik insbesondere f¨ur axiomatische Theorien gebr¨auchlich sind. Das bedeutet - thematisch - nat¨urlich eine starke Einschr¨ankung gegen¨uber der allgemeinen (philosophischen) Logik, aber - methodisch - erm¨oglicht diese Beschr¨ankung es andererseits, sie selbst als (ii) eine formale mathematischen Theorie zu entwickeln. Dadurch kann die Mathematische Logik (als Metatheorie) u¨ ber die Mathematische Logik selbst (und zwar nun als formale mathematische Theorie) Aussagen machen. Diese sind m¨oglicherweise r¨uckbez¨uglich und damit h¨aufig widerspruchsvoll (z. B.: Antinomie des L¨ugners); in diesem Fall jedoch kann man sie nach K. ¨ G ODEL benutzen, um die Grenzen ihrer eigenen Methode aufzeigen (etwa ¨ in Form der G ODEL schen Unvollst¨andigkeitss¨atze). Nachdem wir im ersten Teil bereits formale Sprachen und ihre Semantik entwickelt haben, wollen wir uns nun der Syntax zuwenden und mit Hilfe des Beweisbegriffes die allgemeinen logischen Schlussweisen untersuchen, wie sie in der Mathematik verwendet werden.
79
Kapitel 5 Die Aussagenlogik Die Aussagenlogik untersucht die Verkn¨upfungen “nicht”, “und”, “oder”, “wenn . . . dann” und “genau dann, wenn”, die wir bereits inhaltlich benutzt haben. Diese Operationen kommen auch in der Umgangssprache vor, allerdings m¨oglicherweise mit zus¨atzlichen Aspekten (temporal, lokal, in Erweiterungen auch modal), die u¨ ber den Gebrauch in der Mathematik hinausgehen und hier nat¨urlich unber¨ucksichtigt bleiben sollen. Aufgrund dieser Einschr¨ankung wird die Aussagenlogik (AL) zu einem einfachen Kalk¨ul (dem Aussagenkalk¨ul) der beiden Wahrheitswerte W und F ; mathematisch gesehen handelt es sich um eine sehr einfache Theorie - die Algebra der zwei Werte 0 und 1. Wir wollen sie hier trotzdem ausf¨uhrlicher behandeln, denn • die AL ist Grundlage der Computerlogik mit zahlreichen Anwendungen (etwa auf die Untersuchung von Schaltungen) und • sie ist Bestandteil fast jeder weiteren Logik, insbesondere der sp¨ater einzuf¨uhrenden Pr¨adikatenlogik (PL). • Grundlegende Begriffsbildungen, die besonders f¨ur die PL wichtig werden, k¨onnen hier in einer einfachen Situation vorbereitet werden. Beginnen werden wir mit dem Aufbau einer formalen Sprache, wie wir sie schon f¨ur die Pr¨adikatenlogik in 2.4 kennengelernt haben: Aus einer vorgegebenen Liste von Zeichen oder • Symbolen (entsprechend dem Alphabet einer nat¨urlichen Sprache) werden nach bestimmten formalen Gesetzen Zeichenreihen gebildet und als
5.1. S YNTAX DER AUSSAGENLOGIK
80
• Formeln (entsprechend den W¨ortern einer nat¨urlichen Sprache) ausgezeichnet; die Bedeutung der Formeln wird dann durch • Interpretationen (Modelle) festgelegt.
5.1 Syntax der Aussagenlogik Mit Hilfe der Symbole ¬ (nicht), ∧ (und), ∨ (oder), → (wenn . . . dann), ↔ (genau dann . . . wenn) und den Aussagenvariablen (f¨ur aussagenlogisch nicht weiter zerlegbare Grundaussagen) definieren wir den Begriff einer aussagenlogischen Formel, abgek¨urzt a. F., wie folgt: 5.1.1 Definition der aussagenlogischen Formeln (F1) A0 , A1 , A2 , . . . sind a. F., und zwar Ausagenvariable. (F2) Ist ϕ eine a. F., so auch ¬ ϕ. (F3) Sind ϕ und ψ a. F., so auch (ϕ ∧ ψ), (ϕ ∨ ψ), (ϕ → ψ) und (ϕ ↔ ψ). (F4) Das sind alle a. F. Aussagenlogische Formeln werden wir wie oben mit kleinen griechischen Buchstaben ϕ, ψ, χ, . . . bezeichnen, Aussagenvariable auch mit A, B,C, . . . Achtung: Formeln sind formale endliche Zeichenreihen; ihre Bedeutung haben wir zwar oben bereits in Klammern angegeben, aber davon werden (und d¨urfen) wir zun¨achst keinen Gebrauch machen! Beispiele f¨ur aussagenlogische Formeln sind: A, ¬A, ¬¬¬B, (((¬¬A ∨ B) ∧ ¬A) → (A ∧ ¬C)) Dagegen sind A¬, B∨), A ∧ ¬C keine aussagenlogischen Formeln.
5.1. S YNTAX DER AUSSAGENLOGIK
81
5.1.2 Klammerregeln Klammern dienen der eindeutigen Darstellbarkeit von Formeln, k¨onnen zur besseren Lesbarkeit jedoch in einigen F¨allen eingespart werden: ¨ • Außere Klammern k¨onnen fortgelassen werden: Schreibe A ∧ ¬C statt (A ∧ ¬C). • ∧ und ∨ “binden st¨arker” als → und ↔: schreibe B ∧ ¬A → A ∨ ¬C statt ((B ∧ ¬A) → (A ∨ ¬C)). Dagegen werden wir ∧ und ∨ gleichberechtigt behandeln, d. h. bei (¬¬A ∨ B) ∧ ¬A sowie (A ∨ B) ∧C bzw. A ∨ (B ∧C). kann man keine weiteren Klammern einsparen. • F¨ur ∧ und ∨ benutzen wir die assoziative Schreibweise: A ∨ B ∨C steht f¨ur (A ∨ (B ∨C)) und A ∧ B ∧C f¨ur (A ∧ (B ∧C)). Die andere m¨ogliche Klammerung f¨uhrt formal zu einer anderen, inhaltlich jedoch a¨ quivalenten Formel. Rechtsklammerung werden wir sp¨ater auch w¨ahlen bei •
A→B→C
f¨ur
A → (B → C),
welches jedoch nicht a¨ quivalent zu (A → B) → C ist! Gelegentlich findet man weitere Vereinbarungen u¨ ber das Fortlassen von Klammern; g¨anzlich entbehrlich sind sie bei der polnischen Notation: Hier schreibt man etwa Nϕ f¨ur ¬ϕ, Aϕψ f¨ur ϕ ∨ ψ, Kϕψ f¨ur ϕ ∧ ψ, so dass ¬(p ∨ q) ∧ (p ∧ ¬¬q) in polnischer Notation KNApqK pNNq geschrieben wird.
82
5.1. S YNTAX DER AUSSAGENLOGIK
5.1.3 Induktion und Rekursion Eine explizite Definition des Begriffs “a. F.” w¨urde diesen auf bereits bekannte zur¨uckf¨uhren und von der Form sein ϕ ist a. F. :⇐⇒ . . ., wobei rechts eine Eigenschaft von ϕ steht (das Definiens), in welcher das Definiendum, n¨amlich a. F., selbst nicht vorkommt. Dagegen ist die Definition 5.1.1 rekursiv, indem zwar auf der rechten Seite auch das zu Definierende vorkommt, aber zur¨uckgef¨uhrt auf k¨urzere Ausdr¨ucke. Eine rekursive Definition hat den Vorzug, dass sie in der Regel zugleich ein Verfahren enth¨alt, in endlich vielen Schritten “effektiv” nachzupr¨ufen, ob der vorgelegte Ausdruck der Definitionsanforderung gen¨ugt oder nicht. Man sagt in diesem Fall auch: Das Pr¨adikat z1 . . . zn ist eine aussagenlogische Formel ist entscheidbar, d. h. es gibt ein “mechanisches” Verfahren, das - angewandt auf eine vorgegebene endliche Zeichenreihe z1 . . . zn - nach endlich-vielen Schritten feststellt, ob z1 . . . zn eine aussagenlogische Formel ist oder nicht. Eine Pr¨azisierung der Begriffe “entscheidbar”, “effektives” Verfahren werden wir sp¨ater vornehmen. Ein weiterer Vorteil einer rekursiven Definition liegt darin, dass man eine Aussage u¨ ber den neuen Begriff beweisen kann, indem man sie (1) zun¨achst f¨ur den Anfangsfall und dann (2) f¨ur die aufbauenden F¨alle nachweist, also vom einfachen Fall zum komplizierten u¨ bergeht - man spricht dann von einem Beweisverfahren durch Induktion. Bekannt ist das entsprechende ¨ die naturlichen ¨ Induktionsprinzip fur Zahlen Es sei E eine Eigenschaft mit (i) E(0), (ii) falls E(n), so auch E(n0 ).
Induktionsanfang Induktionsschluss
Dann gilt E(n) f¨ur alle nat¨urlichen Zahlen n. Dabei besteht der Induktionsschluss aus der Induktionsvoraussetzung E(n) und der Induktionsbehauptung E(n0 ). Wenn man die gew¨ohnliche Ordnung auf den nat¨urlichen Zahlen benutzt, kann man das Induktionsprinzip auch in der folgenden Form anwenden:
83
5.1. S YNTAX DER AUSSAGENLOGIK
¨ die naturlichen ¨ (Starkes) Induktionsprinzip fur Zahlen Es sei E eine Eigenschaft mit (ii’) falls E(m) f¨ur alle m < n, so auch E(n).
Induktionsschluss
Dann gilt E(n) f¨ur alle nat¨urlichen Zahlen n. Diese beiden Induktionsprinzipien sind untereinander und mit dem Minimumsprinzip a¨ quivalent: ¨ die naturlichen ¨ Minimumsprinzip fur Zahlen Falls es eine nat¨urliche Zahl m mit der Eigenschaft E(m) gibt, so gibt es eine kleinste derartige Zahl. Aussagen u¨ ber alle Formeln kann man durch Induktion f¨uhren, indem man ein Komplexit¨atsmaß einf¨uhrt, d. h. eine Funktion k, die allen Formeln eine nat¨urliche Zahl zuordnet, so dass k(ϕ) < k(¬ϕ), z. B.:
k(ϕ), k(ψ) < k(ϕ ∗ ψ),
lz(ϕ) = Anzahl der logischen Verkn¨upfungen ¬, ∧, ∨, →, ↔ in ϕ, l(ϕ) = Anzahl aller Zeichen in ϕ (L¨ange von ϕ).
Besonders n¨utzlich ist daf¨ur die Rangfunktion, rekursiv definiert durch ρ(Ai ) = 0, ρ(¬ϕ) = ρ(ϕ) + 1, ρ(ϕ ∗ ψ) = max(ρ(ϕ), ρ(ψ)) + 1, wobei ∗ = ∧, ∨, →, ↔ . ¨ 5.1.4 Beweis durch Induktion uber den Formelaufbau Es sei E eine Eigenschaft mit (i) E(A) gilt f¨ur alle Ausagenvariablen A, (ii) gilt E(ϕ), so auch E(¬ϕ), und (iii) gelten E(ϕ) und E(ψ), so auch E(ϕ ∗ ψ) f¨ur ∗ = ∧, ∨, → und ↔ . Dann gilt E(ϕ) f¨ur alle a. F. ϕ. Legt man ein Komplexit¨atsmaß k zugrunde, so kann man die drei Bedingungen (i) - (iii) ersetzen durch eine einzige:
5.1. S YNTAX DER AUSSAGENLOGIK
84
(ii’) Gilt E(ψ) f¨ur alle ψ mit k(ψ) < k(ϕ), so auch E(ϕ). Die Rangfunktion haben wir oben durch Rekursion definiert; damit dies zul¨assig ist, ben¨otigen wir die Eindeutige Lesbarkeit von Formeln Es sei ϕ eine a. F. Dann ist ϕ entweder eine Aussagenvariable oder l¨asst sich auf genau eine Weise in der Form ¬ψ, (ψ ∧ χ), (ψ ∨ χ), (ψ → χ) oder (ψ ↔ χ) schreiben. Zum Beweis benutze man das folgende (technische) Lemma: Lemma Es sei ϕ eine a. F., w eine endliche Zeichenreihe. Dann gilt: Falls die Zeichenreihe ϕw eine a. F. ist, so ist w leer, also ϕw = ϕ. Dieses Lemma - zugleich ein gutes Beispiel f¨ur eine syntaktische Aussage! - beweist man am besten durch Induktion u¨ ber die Anzahl l(ϕ w) der Zeichen in ϕ w. Neben der rekursiven Definition eines Pr¨adikats (wie im Falle des Formelbegriffs) haben wir im Falle der Rangfunktion eine rekursive Definition einer Funktion. Auch derartige Funktionen haben ihr Vorbild in der Zahlentheorie, wo man etwa die Funktion n! rekursiv definiert durch 0! = 1, (n + 1)! = n!(n + 1). Diese Definition liefert nur deshalb eine Funktion, weil f¨ur eine Zahl n 6= 0 der Vorg¨anger m von n (mit m0 = n) eindeutig bestimmt ist. Die entsprechende Voraussetzung f¨ur den Formelbegriff haben wir gerade mit der eindeutigen Lesbarkeit der Formeln bewiesen.
85
5.2. S EMANTIK DER AUSSAGENLOGIK
¨ 5.1.5 Definition durch Rekursion uber den Formelaufbau Zu gegebenen Funktionen g0 , . . . , g5 (geeigneter Stellenzahl) l¨asst sich eine Funktion g auf der Menge der a. F. definieren durch: g(A) = g0 (A) g(¬ϕ) = g1 (g(ϕ)) g(ϕ ∧ ψ) = g2 (g(ϕ), g(ψ)) g(ϕ ∨ ψ) = g3 (g(ϕ), g(ψ)) g(ϕ → ψ) = g4 (g(ϕ), g(ψ)) g(ϕ ↔ ψ) = g5 (g(ϕ), g(ψ))
5.2 Semantik der Aussagenlogik Die Bedeutung der aussagenlogischen Verkn¨upfungen wird u¨ blicherweise durch die Wahrheitstafeln festgelegt - die aussagenlogischen Verkn¨upfungen werden dadurch zu Funktionen auf den Wahrheitswerten • W (“wahr”), manchmal auch mit 1 oder V bezeichnet, und • F (“falsch”), manchmal auch mit 0 oder Λ bezeichnet. (Wir behandeln hier die 2-wertige Logik, nehmen also an, dass es genau zwei Wahrheitswerte gibt, n¨amlich W und F.) 5.2.1 Wahrheitsfunktionen 1-stellige Wahrheitsfunktionen id
¬
F
W W W F
F W
F F
W W F
Unter den vier 1-stelligen gibt es nur eine nicht-triviale Wahrheitsfunktion, 2 die die Wahrheitswerte vertauscht und der Negation entspricht. Es gibt 22 = 16 2-stellige Wahrheitsfunktionen; lassen wir die trivialen weg, so erhalten wir:
86
5.2. S EMANTIK DER AUSSAGENLOGIK
2-stellige (nichttriviale) Wahrheitsfunktionen W W F F
W F W F
∧
∨
→
←
∇
↔
a
`
↓
↑
W F F F
W W W F
W F W W
W W F W
F W W F
W F F W
F W F F
F F W F
F F F W
F W W W
Neben den bereits eingef¨uhrten tritt hier noch das entweder-oder ∇ auf, das weder-noch ↓ (“nor”, P EIRCE) sowie ↑ (“nand”, S HEFFER´s stroke). 3 Weiterhin gibt es bereits 22 = 256 3-stellige Wahrheitsfunktionen, allgemein n 22 n-stellige Wahrheitsfunktionen, auf die wir sp¨ater noch zur¨uckkommen werden. Wir wollen nun jeder aussagenlogischen Formel ϕ(A1 , . . . , An ) in den Aussagenvariablen A1 , . . . , An den Wahrheitswert zuordnen, der sich durch Auswertung gem¨aß den Wahrheitstafeln ergibt. Dieser Wert h¨angt ab (1) von den Wahrheitswerten, die die Aussagenvariablen erhalten, sowie davon, (2) wie ϕ aus den Aussagenvariablen mit Hilfe der aussagenlogischen Verkn¨upfungen zusammengesetzt ist: 5.2.2 Interpretation von aussagenlogischen Formeln ϕ sei eine aussagenlogische Formel, V sei eine beliebige (u. U. unendliche) Menge von Aussagenvariablen. Man bezeichnet mit f: V → {W,F} B(V) := { f | f : V −→ {W,F}} V (ϕ) F(V) := {ϕ|V (ϕ) ⊆ V }
Belegung von V (mit Wahrheitswerten), Menge der Belegungen von V. Menge der Aussagenvariablen in ϕ Menge der Formeln mit Variablen in V.
Es sei nun ϕ eine aussagenlogische Formel mit Variablen in V, f : V −→ {W, F} eine Belegung mit V (ϕ) ⊆ V . Dann definieren wir f(ϕ) als Wahrheitswert (oder: Interpretation) von ϕ unter der Belegung f durch Rekursion u¨ ber den Aufbau von ϕ wie folgt: f (ϕ) = f (A),
f alls ϕ = A eine Aussagenvariable ist,
f (¬ϕ) = ¬ f (ϕ), f (ϕ ∗ ψ) = f (ϕ) ∗ f (ψ).
87
5.2. S EMANTIK DER AUSSAGENLOGIK
Dabei steht * f¨ur die 2-stelligen Operationen. Zu beachten ist, dass auf der linken Seite innerhalb der Klammern die Symbole f¨ur die aussagenlogischen Verkn¨upfungen, auf der rechten Seite aber die zugeordneten Operationen stehen, die man aus den Wahrheitstafeln entnimmt (und die wir dort der Einfachheit halber auch mit den entsprechenden Symbolen bezeichnet haben). Beispiel Es sei ϕ = ¬(A ↔ C) ∧ ¬D, also V (ϕ) = {A,C, D}. Ferner sei V = {A, B,C, D}, und f : V −→ {W, F} sei definiert durch f (A) = W, f (B) = W, f (C) = F, f (D) = W. Dann erh¨alt man durch sukzessive Berechnung (entsprechend der rekursiven Definition):
f
A
B
C
D
A↔C
¬(A ↔ C)
D
¬D
ϕ
W
W
F
W
F
W
W
F
F
f (ϕ) h¨angt hier nat¨urlich nicht von f (B) ab, da B nicht in ϕ vorkommt. Allgemein gilt: Satz f (ϕ) h¨angt nur von f V (ϕ) (und nat¨urlich von ϕ) ab, d. h. sind f und g zwei Belegungen, die (mindestens) auf V (ϕ) definiert sind und dort u¨ bereinstimmen, so ist f (ϕ) = g(ϕ). Beweis: durch Induktion u¨ ber den Formelaufbau von ϕ.
5.2.3 Definition der wichtigsten semantischen Begriffe Es seien ϕ, ψ ∈ F(V ). ag[ϕ] : ⇐⇒ kd[ϕ] : ⇐⇒ er f b[ϕ] : ⇐⇒ ϕ aq ¨ ψ : ⇐⇒ ϕ impl ψ : ⇐⇒ ⇐⇒
¨ f ur ¨ alle f ∈ B(V ) gilt : f (ϕ) = W ϕ ist allgemeingultig f ur ¨ alle f ∈ B(V ) gilt : f (ϕ) = F ϕ ist kontradiktorisch ¨ es gibt ein f ∈ B(V ) mit : f (ϕ) = W ϕ ist erfullbar f ur ¨ alle f ∈ B(V ) gilt : f (ϕ) = f (ψ) ϕ ist a¨ quivalent zu ψ f ur ¨ alle f ∈ B(V ) gilt : f (ϕ) = W ⇒ f (ψ) = W ag[ϕ → ψ] ϕ impliziert ψ
88
5.2. S EMANTIK DER AUSSAGENLOGIK
Einfache Beispiele ag[A ∨ ¬A], kd[A ∧ ¬A], er f b[A], er f b[¬A], aber A (und auch ¬A) sind weder allgemeing¨ultig noch kontradiktorisch. Es gilt offenbar: ag[ϕ]
⇐⇒
kd[¬ϕ]
er f b[ϕ]
⇐⇒
nicht kd[ϕ]
ag[¬ϕ]
=⇒
nicht ag[ϕ] (aber die Umkehrung gilt i. a. nicht)
ag[ϕ ∧ ψ]
⇐⇒
ag[ϕ] und ag[ψ]
er f b[ϕ ∨ ψ]
⇐⇒
er f b[ϕ] oder er f b[ψ]
ag[ϕ] oder ag[ψ]
=⇒
ag[ϕ ∨ ψ]
er f b[ϕ ∧ ψ]
=⇒
er f b[ϕ] und er f b[ψ] (i. a. ohne Umkehrung!)
(i. a. ohne Umkehrung!)
Bemerkung Die hier eingef¨uhrten Pr¨adikate sind entscheidbar. Ein Entscheidungsverfahren liefert (unmittelbar nach Definition) die Wahrheitstafelmethode; dieses Verfahren besitzt jedoch exponentielle Komplexit¨at: Hat ϕ n Variable, so hat B(V (ϕ)) bereits 2n Elemente! F¨ur jedes einzelne f ∈ B(V (ϕ)) muss man f (ϕ) berechnen, wobei die Komplexit¨at dieser Berechnung abh¨angig ist von der Anzahl der logischen Symbole in ϕ. Damit l¨asst sich die Aussagenlogik kalk¨ulm¨aßig behandeln - man spricht daher auch vom Aussagenkalk¨ul. Dagegen wird sich sp¨ater zeigen, dass die Allgemeing¨ultigkeit einer pr¨adikatenlogischen Aussage sich i. a. nicht mehr entscheiden l¨asst; trotzdem spricht man (aus Gr¨unden, die sp¨ater im Rahmen einer Axiomatisierung deutlicher werden) auch vom Pr¨adikatenkalk¨ul.
89
5.2. S EMANTIK DER AUSSAGENLOGIK
¨ 5.2.4 Einige wichtige allgemeingultige Formeln A ∨ ¬A A→A ¬(A ∧ ¬A) ¬(A ↔ ¬A) ¬A → (A → B) A ∧ (A → B) → B ¬B ∧ (A → B) → ¬A A → A∨B A∧B → A (A → B) ∧ (B → C) → (A → C) (A ∨ B) ∧ (A → C) ∧ (B → C) → C ((A → B) → A) → A
tertium non datur Selbstimplikation Gesetz vom Widerspruch Gesetz vom Widerspruch regula falsi modus ponens (als Gesetz) modus tollens (als Gesetz) (hintere) Abschw¨achung (vordere) Abschw¨achung Kettenschluss Gesetz der Fallunterscheidung Formel von Peirce
Einige dieser allgemeing¨ultigen Formeln ergeben g¨ultige Implikationen, wie z. B. A impl A, A impl B und B impl C =⇒ A impl C, A impl B und B impl A =⇒ A aq ¨ B. ¨ 5.2.5 Einige wichtige Aquivalenzen ¬ ¬ A aq ¨ A A → B aq ¨ ¬B → ¬A ¬(A → B) aq ¨ (A ∧ ¬B) ¬(A ∨ B) aq ¨ (¬A ∧ ¬B) ¬(A ∧ B) aq ¨ (¬A ∨ ¬B) A → (B → C) aq ¨ A∧B →C A → B ∨C aq ¨ (A → B) ∨ (A → C) A → B ∧C aq ¨ (A → B) ∧ (A → C) A ∨ B → C aq ¨ (A → C) ∧ (B → C) A ∧ B → C aq ¨ (A → C) ∨ (B → C)
Gesetz der doppelten Verneinung Kontraposition de M ORGANsches Gesetz de M ORGANsches Gesetz Importation / Exportation Distrib. der Implikation “von rechts” Distrib. der Implikation “von rechts”
Zu beachten ist der Wechsel von ∨ zu ∧ (und umgekehrt) in den beiden letzten Formeln!
90
5.2. S EMANTIK DER AUSSAGENLOGIK
5.2.6 Boolesche Gesetze A∩B = B∩A A∪B = B∪A A ∩ (B ∩C) = (A ∩ B) ∩C A ∪ (B ∪C) = (A ∪ B) ∪C A∩A = A A∪A = A A ∩ (B ∪C) = (A ∩ B) ∪ (A ∩C) A ∪ (B ∩C) = (A ∪ B) ∩ (A ∪C) A ∩ (B ∪ A) = A A ∪ (B ∩ A) = A A ∪ −A = V, A ∩ −A = 0/ − −A = A − 0/ = V, −V = 0/ − (A ∩ B) = − A ∪ − B − (A ∪ B) = − A ∩ − B
Kommutativgesetze Assoziativgesetze Idempotenzgesetze Distributivgesetze Absorptionsgesetze Komplementgesetze
de M ORGANsche Gesetze
Dieses sind die Gesetze einer B OOLEschen Algebra, und zwar in mengentheoretischer Form ausgedr¨uckt. Die entsprechenden aussagenlogischen Gesetze erh¨alt man, wenn man folgende Ersetzungen vornimmt: mengentheoretisch = − ∩ ∪ 0/ V
aussagenlogisch a¨ q ¬ ∧ ∨ A ∧ ¬A A ∨ ¬A
Die obigen Gesetze haben wir f¨ur Aussagenvariable aufgeschrieben; sie gelten aber allgemeiner f¨ur a. F. anstelle der Aussagenvariablen. Diese Tatsache ergibt sich aus der 5.2.7 Einsetzungsregel ϕ(A) ϕ[ψ/A] .
5.2. S EMANTIK DER AUSSAGENLOGIK
91
Damit ist gemeint: Wenn der obere Teil allgemeing¨ultig ist, so auch der untere. Dabei schreiben wir auch ϕ(A), um anzudeuten, dass die Aussagenvariable A in ϕ(A) vorkommt, und mit ϕ[ψ/A] bezeichnen wir die Formel, die aus ϕ wie folgt hervorgeht: Setze in ϕ an allen Stellen, an denen die Aussagenvariable A vorkommt, die Formel ψ ein. Beispiel Es ist ag[A ∨ ¬A] und damit auch ag[ϕ ∨ ¬ϕ] f¨ur jede Formel ϕ. 5.2.8 Ersetzungsregel ϕ ↔ψ χ ↔ χ(ψ/ϕ) Dabei bezeichnet χ(ψ/ϕ) die Formel, die aus der Formel χ wie folgt hervorgeht: Ersetze in χ an einigen (m¨oglicherweise allen) Stellen die Formel ϕ durch die Formel ψ. Beispiel Es ist ag[¬ ¬ A ↔ A], nach der Einsetzungsregel also auch ag[¬ ¬ ϕ ↔ ϕ], und somit erh¨alt man aus einer Formel χ eine a¨ quivalente Formel, indem man an einigen (oder allen Stellen) ¬ ¬ ϕ durch ϕ ersetzt. Beweis der Einsetzungsregel: Es sei ϕ ∗ := ϕ[ψ/A] mit V (ϕ) = {A, A1 , . . . , An } und V (ψ) = {B1 , . . . , Bm }, somit: V (ϕ ∗ ) = {A1 , . . . , An , B1 , . . . , Bm }. F¨ur eine beliebige Belegung g : V (ϕ ∗ ) −→ {W, F} ist zu zeigen: g(ϕ ∗ ) = W . Dazu definiere man eine Belegung f : V (ϕ) −→ {W, F} durch f (A) = g(ψ), f (Ai ) = g(Ai ) und zeige: g(ϕ ∗ ) = f (ϕ), also = W , da ag[ϕ].
Beweis der Ersetzungsregel: Es sei χ ∗ := χ(ψ/ϕ) und f : V (χ) ∪V (χ ∗ ) −→ {W, F} eine beliebige Belegung. Zeige: f (χ) = f (χ ∗ ) durch Induktion u¨ ber den Formelaufbau von χ.
92
5.3. N ORMALFORMEN
5.3 Normalformen In diesem Abschnitt werden wir uns mit aussagenlogischen Formeln besch¨aftigen, die nur die Operationen ¬, ∨, ∧ enthalten und B OOLEsche Formeln genannt werden. 5.3.1 Boolesche Umformung Zu jeder aussagenlogischen Formel ϕ gibt es eine a¨ quivalente B OOLEsche Formel ϕ b , die dieselben Aussagenvariablen wie ϕ enth¨alt: ϕ a¨ q ϕ b , wobei V (ϕ) = V (ϕ b ). Beweis: Eliminiere die Symbole → und ↔ durch Umformungen zu a¨ quivalenten Formeln; d. h. ersetze in ϕ jede Teilformel der Form ψ → χ durch die a¨ quivalente Formel ¬ψ ∨ χ, ψ ↔ χ durch die a¨ quivalente Formel (¬ψ ∨ χ) ∧ (¬χ ∨ ψ). Bemerkung ¨ Indem man die entsprechenden Aquivalenzen benutzt, kann man auch noch ∨ durch ¬ und ∧ (bzw. ∧ durch ¬ und ∨ ) ausdr¨ucken und erreichen, dass ϕ b nur noch ¬ und ∧ (bzw. ¬ und ∨) enth¨alt, was im Hinblick auf manche Anwendungen (z. B. Dualit¨atssatz) aber nicht immer erw¨unscht ist. Tats¨achlich kann man eine aussagenlogische Formel in eine a¨ quivalente umformen, die nur noch eine aussagenlogische Operation (n¨amlich ↓ bzw. ↑) enth¨alt. Endliche Konjunktionen und Disjunktionen ϕ1 ∧ ϕ2 ∧ ϕ3 := ϕ1 ∧ (ϕ2 ∧ ϕ3 ), V ϕi = ϕ1 Vi=1,...,n V i=1,...,n ϕi = ϕ1 ∧ i=2,...,n ϕi
allgemein: f¨ur n = 1, f¨ur n > 1,
und analog definiert man die endlichen Disjunktionen
W
i=1,...,n ϕi .
Eine Formel ist in konjunktiver Normalform (KNF) gdw sie eine Konjunktion von Disjunktionen ist, wobei die einzelnen Disjunktionsglieder kein ∧ und kein ∨ mehr enthalten, d. h. wenn sie von der folgenden speziellen Form ist V
i=1,...,n
W
j=1,...,mi ϕi j ,
93
5.3. N ORMALFORMEN
wobei jedes ϕi j eine Aussagenvariable oder eine negierte Aussagenvariable ist, in disjunktiver Normalform (DNF) gdw sie von der Form W
i=1,...,n
V
j=1,...,mi ϕi j
ist, wobei wiederum jedes ϕi j eine Aussagenvariable oder eine negierte Aussagenvariable ist. (Insbesondere sind A ∨ ¬B sowie A ∧ ¬B in konjunktiver und zugleich in disjunktiver Normalform.) Satz (Boolesche Normalform) Zu jeder aussagenlogischen Formel ϕ gibt es a¨ quivalente Formeln ϕ k bzw. ϕ d in konjunktiver bzw. disjunktiver Normalform, die dieselben Aussagenvariablen wie ϕ enthalten: ϕ a¨ q ϕ k a¨ q ϕ d , wobei V (ϕ) = V (ϕ k ) = V (ϕ d ), ϕ k in KNF, ϕ d in DNF. Beweis: Eine disjunktive NF l¨asst sich aus ϕ mittels folgender Umformungen konstruieren: (1) ϕ a¨ q ϕ b
f¨ur eine B OOLE´sche Formel ϕ b .
(2) ϕ b a¨ q ϕ n f¨ur eine Formel ϕ n , wobei in ϕ n ein Negationszeichen h¨ochstens ¨ vor Aussagenvariablen vorkommt; dazu benutze man folgende Aquivalenzen: ¬¬ψ a¨ q ψ , ¬(ψ ∨ χ) a¨ q ¬ψ ∧ ¬χ, ¬(ψ ∧ χ) a¨ q ¬ψ ∨ ¬χ (De Morgan). (3) eliminiere in ϕ n ∧ “vor” ∨ mittels der Distributivgesetze: ψ ∧ (χ ∨ δ ) a¨ q (ψ ∧ χ) ∨ (ψ ∧ δ ) (ψ ∨ χ) ∧ δ a¨ q (ψ ∧ δ ) ∨ (χ ∧ δ ) Als Ergebnis erh¨alt man eine disjunktive NF ϕ d , welche zu ϕ a¨ quivalent ist. Die im 2. Schritt erhaltene Formel ϕ n , in welcher das Negationszeichen h¨ochstens vor Aussagenvariablen vorkommt, nennt man auch eine Negationsnormalform von ϕ. Um eine konjunktive NF zu erhalten, bilde man zuerst wieder eine Negationsnormalform und wende im 3. Schritt die dualen Distributivgesetze an (vertausche ∧ mit ∨). (Der Beweis liefert ein effektives Verfahren, um ϕ zu einer a¨ quivalenten konjunktiven bzw. disjunktiven Normalform umzuformen.)
94
5.3. N ORMALFORMEN
¨ Boolesche Normalformen 5.3.2 Entscheidungsverfahren fur (i) ϕ sei in KNF. Dann gilt: ag[ϕ ] ⇔ in jedem Konjunktionsglied von ϕ kommt mindestens eine Aussagenvariable zusammen mit ihrer Negation vor. (ii) ϕ sei in DNF. Dann gilt: kd[ϕ ] ⇔ in jedem Disjunktionsglied von ϕ kommt mindestens eine Aussagenvariable zusammen mit ihrer Negation vor. Beispiel (A ∨ D ∨ ¬A) ∧ (¬B ∨ A ∨ A ∨ B) ∧ (¬A ∨ B ∨ ¬B ∨ A ∨C) ist allgemeing¨ultig, nicht aber (¬A ∨ B ∨ A) ∧ (¬B ∨ A ∨ A ∨ D). Beweis von (i): Es ist ag[
V
i=1,...,n
W
j ϕi j ]
⇐⇒ f ur ¨ alle i = 1, ..., n : ag[
W
j ϕi j ].
Gibt es zu jedem i ein j und ein k, so dass ϕi j = A und ϕik = ¬A f¨ur eine W Aussagenvariable A ist, so ist f¨ur jedes i ϕi j allgemeing¨ultig, also gilt “⇐”. Vj W Zum Beweis der Umkehrung sei ϕ = i=1,...,n j ϕi j in KNF, aber in (mindeW stens) einem Konjunktionsglied, etwa ϕi = j ϕi j , komme keine Aussagenvariable mit ihrer Negation vor. Dann k¨onnen wir eine Belegung f : V (ϕ) −→ {W, F} definieren mit falls A in ϕi negiert vorkommt, W, f (A) = F, falls A in ϕi unnegiert vorkommt, beliebig, etwa W , falls A in ϕ nicht vorkommt. i
Dann wird f (ϕi ) = F und damit auch f (ϕ) = F, also ist ϕ nicht allgemeing¨ultig. Hiermit erh¨alt man ein weiteres Verfahren, die Allgemeing¨ultigkeit einer aussagenlogischen Formel ϕ zu testen: Forme ϕ in eine KNF um und pr¨ufe nach, ob die Bedingung von 5.3.2 (i) erf¨ullt ist. Auch dieses Entscheidungsverfahren ist von exponentieller Komplexit¨at wegen der Notwendigkeit, bei der Umformung in eine KNF das Distributivgesetz anzuwenden. Dabei werden aus Konjunktionen von Disjunktionen wesentlich l¨angere Disjunktionen von Konjunktionen (und umgekehrt): Das allgemeine Distributivgesetz lautet:
95
5.3. N ORMALFORMEN
V
i=1,...,n
W
j=1,...,mi ϕi j
a¨ q
W
f ∈P
V
i=1,...,n ϕi f (i) ,
wobei P = { f | f : {1, . . . , n} −→ N mit 1 ≤ f (i) ≤ mi f ur ¨ alle i = 1, . . . , n}. Falls n alle mi = 2 sind, so hat P die Anzahl 2 . Der folgende Satz besagt, dass sich jede n-stellige Wahrheitsfunktion mittels der B OOLEschen Operationen ¬, ∨, ∧ darstellen l¨asst, und aus dem Beweis ergibt sich zugleich eine Darstellung in disjunktiver bzw. konjunktiver Normalform: 5.3.3 Boolescher Repr¨asentationssatz Es sei G eine beliebige n-stellige Wahrheitsfunktion, also G : B(V ) −→ {W, F}, wobei V die Menge der Aussagenvariablen {A1 , . . . , An } ist. Dann existiert eine B OOLEsche Formel ϕ in diesen Ausagenvariablen, d. h. mit V (ϕ) = V , deren Auswertung nach den Wahrheitstafeln gerade die Funktion G ergibt: G(g) = g(ϕ) f¨ur alle g ∈ B(V ). Beweis: Wir definieren zun¨achst f¨ur jedes f ∈ B(V ) eine Formel ϕ f , die genau bei der Belegung f wahr wird (was wir unten mit (*) zeigen werden): f (A1 )
ϕ f = A1
f (An )
∧ . . . ∧ An
F , wobei AW i = Ai , Ai = ¬Ai .
Es sei M := { f ∈ B(V ) | G( f ) = W }. Dann ist ϕ :=
W
f ∈M ϕ f
eine B OOLEsche Formel (in disjunktiver NF), die die Behauptung erf¨ullt, weil sie gerade f¨ur alle f ∈ M wahr und sonst falsch wird: g(ϕ) = W (*)
⇐⇒ ⇐⇒ ⇐⇒ ⇐⇒
g(ϕ f ) = W f =g g∈M G(g) = W.
f¨ur ein f ∈ M f¨ur ein f ∈ M
Zum Beweis von (*) beachte, dass f¨ur alle i = 1, . . . , n: f (A )
g(ϕ f ) = W =⇒ g(Ai i ) = W =⇒ [ f (Ai ) = W =⇒ g(Ai ) = W ] und =⇒ [ f (Ai ) = F =⇒ g(Ai ) = F], also f = g,
5.3. N ORMALFORMEN
96
und offenbar gilt auch umgekehrt f (ϕ f ) = W . Was passiert, wenn die Funktion G u¨ berall den Wert F annimmt? Dann ist die Menge M leer und die zugeh¨orige Formel ϕ eine Disjunktion u¨ ber eine leere Indexmenge, und eine solche Disjunktion erkl¨art man als “falsch”. Da wir hierf¨ur keine Konstante in der aussagenlogischen Sprache haben, benutzen wir daf¨ur (wie auch im Satz von B OOLE) die Formel A0 ∧ ¬A0 , a¨ hnlich erkl¨art man die Konjunktion u¨ ber eine leere Indexmenge f¨ur stets “wahr” (und kann sie mit A0 ∨ ¬A0 gleichsetzen). Ein alternativer Beweis (welcher zugleich eine konjunktive NF liefert) geht aus von der Menge N := { f ∈ B(V ) | G( f ) = F}. Folgerungen aus dem obigen Satz (bzw. aus dem Beweis) ergeben sich f¨ur • die Schaltalgebra , ¨ • den Ubergang von einer DNF zu einer a¨ quivalenten KNF, • die Existenz nur endlich-vieler Formeln ϕ mit Variablen A1 , . . . , An , die nicht miteinander a¨ quivalent sind (dagegen gibt es stets unendlich viele zueinander a¨ quivalente Formeln). 5.3.4 Das Dualit¨atsprinzip Im folgenden betrachten wir nur B OOLE´sche Formeln! Wir definieren drei syntaktische Operationen f¨ur B OOLE´sche Formeln: D(ϕ) :
vertausche ∨ mit ∧ in ϕ : duale Formel zu ϕ,
N(ϕ) :
setze vor jede Aussagenvariable in ϕ ein ¬-Zeichen,
∗
N (ϕ) :
setze vor jede Aussagenvariable in ϕ ein ¬-Zeichen, falls dort keines steht, sonst streiche es!
97
5.3. N ORMALFORMEN
Beispiele D(¬(¬A ∨ B) ∧ ¬C) N(¬(¬A ∨ B) ∧ ¬C) N ∗ (¬(¬A ∨ B) ∧ ¬C) DN ∗ (¬(¬A ∨ B) ∧ ¬C) DN ∗ (A) DN ∗ (A ∧ B) DN ∗ (A ∨ B)
= = = = = = =
¬(¬A ∧ B) ∨ ¬C ¬(¬¬A ∨ ¬B) ∧ ¬¬C ¬(A ∨ ¬B) ∧C ¬(A ∧ ¬B) ∨C ¬A ¬A ∨ ¬B aq ¨ ¬(A ∧ B) ¬A ∧ ¬B aq ¨ ¬(A ∨ B)
Offensichtlich sind N(ϕ) und N ∗ (ϕ) miteinander a¨ quivalent, und die letzten drei Formeln kann man verallgemeinern zum Teil a) von Satz a) ¬ϕ aq ¨ D(N ∗ (ϕ)) b) ϕ aq ¨ ψ ⇐⇒ Dϕ aq ¨ Dψ
Bildung der Negation Dualit¨atssatz
und b) leicht aus a) folgern, was wir hier nicht ausf¨uhren. Nat¨urlich kann man eine Aussage negieren, indem man einfach das Negationszeichen davorschreibt; Teil a) des obigen Satzes gibt eine sinnvollere Darstellung, in welcher das Negationszeichen “nach innen” verschoben wird (obwohl man in praktischen F¨allen es nicht gleich bis vor die atomaren Teilformeln verschieben wird). Der Dualit¨atssatz erkl¨art u. a., weshalb die B OOLE´schen Gesetze in jeweils doppelter Form auftreten.
¨ 5.4. D ER SEMANTISCHE F OLGERUNGSBEGRIFF : E RF ULLBARKEIT
98
¨ 5.4 Der semantische Folgerungsbegriff: Erfullbarkeit Eine Formel ist allgemeing¨ultig, wenn sie uneingeschr¨ankt den Wert W erh¨alt. Diesen Begriff werden wir jetzt relativieren zum Folgerungsbegriff: Aussagenlogische Folgerungen ϕ sei eine Formel, T eine (m¨oglicherweise unendliche) Menge von Formeln, V eine Menge von Aussagenvariablen mit T ⊆ F(V ), ϕ ∈ F(V ), und schließlich sei f : V −→ {W, F} eine Belegung der Variablen in V . f |= ϕ f |= T erfb[ϕ] erfb[T] T |= ϕ
: : : : :
⇐⇒ ⇐⇒ ⇐⇒ ⇐⇒ ⇐⇒
f (ϕ) = W f¨ur alle ψ ∈ T : f |= ψ es gibt ein f mit f |= ϕ es gibt ein f mit f |= T f¨ur alle f : falls f |= T, so f |= ϕ
¨ f erfullt ϕ ¨ T f erfullt ¨ ϕ ist erfullbar ¨ T ist erfullbar ϕ folgt aus T
T |= ϕ besagt also: alle Belegungen f , die T erf¨ullen, erf¨ullen auch ϕ, oder vereinfacht: ϕ ist immer dann wahr, wenn alle Formeln in T wahr sind.
Falls T endlich ist, schreiben wir auch ϕ1 , . . . , ϕn |= ϕ f¨ur {ϕ1 , . . . , ϕn } |= ϕ, und aus 0/ |= ϕ wird nat¨urlich |= ϕ, so dass |= ϕ ⇐⇒ ag[ϕ] . Beispiele (a) ϕ |= ϕ, (b) ϕ |= ϕ ∨ ψ, (c) ϕ, ψ |= ϕ ∧ ψ, (d) ϕ → ψ ∧ δ , (e) δ → ¬ψ |= ¬ϕ, aber: A 6|= A ∧ B. Im Falle der Ersetzungsregel gilt: ϕ ↔ ψ |= χ ↔ χ(ϕ/ψ); im Falle der Einsetzungsregel gilt jedoch i. a. nicht: ϕ(A) |= ϕ[ψ/A]!
¨ 5.4. D ER SEMANTISCHE F OLGERUNGSBEGRIFF : E RF ULLBARKEIT
99
Satz ϕ1 , . . . , ϕn |= ϕ ⇐⇒ |= ϕ1 ∧ . . . ∧ ϕn → ϕ
Der Folgerungsbegriff f¨ur endliche Formelmengen l¨asst sich somit zur¨uckf¨uhren auf den Begriff der Allgemeing¨ultigkeit, der allgemeine Folgerungsbegriff aber auch auf den Erf¨ullbarkeitsbegriff: Als Verallgemeinerung von ag[ϕ] ⇐⇒ nicht erfb[¬ϕ] erhalten wir den ¨ 5.4.1 Zusammenhang zwischen Folgerung und Erfullbarkeit T |= ϕ ⇐⇒ nicht erfb[T ∪ {¬ϕ}] T 6|= ϕ ⇐⇒ erfb[T ∪ {¬ϕ}] Lemma erfb[T] ⇐⇒ es existiert kein ϕ mit T |= ϕ und T |= ¬ϕ ⇐⇒ es existiert ein ϕ mit T 6|= ϕ Bemerkungen 1. Ist T endlich, so ist entscheidbar, ob T |= ϕ oder T 6|= ϕ. Es ist aber m¨oglich, dass weder T |= ϕ noch T |= ¬ϕ gilt (wenn T n¨amlich zu wenig Information u¨ ber die Variablen in ϕ enth¨alt, z. B. A 6|= B und A 6|= ¬B f¨ur zwei verschiedene Variable A und B)! Denn es gilt zwar T |= ¬ϕ =⇒ T 6|= ϕ (f¨ur erf¨ullbares T), aber nicht umgekehrt! 2. Ist T endlich, so gibt es eine effektive Aufz¨ahlung der Folgerungsmenge {ϕ | T |= ϕ}. 3. Allgemeiner: Gibt es eine effektive Aufz¨ahlung von T, so gibt es auch eine effektive Aufz¨ahlung der Folgerungsmenge {ϕ | T |= ϕ}.
5.5. D ER SYNTAKTISCHE F OLGERUNGSBEGRIFF : B EWEISBARKEIT
100
5.5 Der syntaktische Folgerungsbegriff: Beweisbarkeit 5.5.1 Axiomensysteme und Beweise Ein (formales) Axiomensystem A wird bestimmt durch 1. die Sprache von A, gegeben durch eine (i. a. abz¨ahlbare) Menge von Symbolen, dem Alphabet der Sprache von A, z. B. A0 , A1 , . . . , ¬, ∨, ∧, →, ↔, (, ) im Falle der Aussagenlogik, 2. eine Menge von Formeln als bestimmte endliche Folgen von Symbolen, z. B. den aussagenlogischen Formeln, 3. eine Menge von Axiomen, wobei jedes Axiom eine Formel ist, z. B. ϕ ∨ ¬ϕ, ϕ → ¬¬ϕ, ϕ, ψ ϕ oder , ψ δ ϕ, ϕ → ψ ϕ , modus ponens: . z. B. ¬¬ϕ ψ
4. eine Menge von Regeln der Form
Es sei nun A ein Axiomensystem, ϕ eine Formel, T eine Menge von Formeln (der Sprache von A). Ein (A-)Beweis von ϕ aus T ist eine endliche Folge (ϕ1 , . . . , ϕn ) von Formeln, so dass (B1) ϕn = ϕ, (B2) f¨ur jedes m ≤ n gilt: (1) ϕm ist Axiom von A oder (2) ϕm ist Formel aus T oder (3) es gibt ein i < m, so dass ϕm aus ϕi hervorgeht durch Anwendung einer Regel von A oder (4) es gibt i, j < m, so dass ϕm aus ϕi und ϕ j hervorgeht durch Anwendung einer Regel von A mit 2 Pr¨amissen. Wir schreiben (analog zum semantischen Folgerungsbegriff): T `A ϕ : ⇐⇒ es gibt einen A-Beweis von ϕ aus T `A ϕ : ⇐⇒ 0/ ` ϕ
ϕ ist aus T beweisbar, ϕ ist (in A ) beweisbar.
5.5. D ER SYNTAKTISCHE F OLGERUNGSBEGRIFF : B EWEISBARKEIT
101
Statt T `A ϕ werden wir auch kurz T ` ϕ schreiben, wenn das Axiomensystem aus dem Zusammenhang bekannt (oder unwesentlich) ist, statt “ϕ ist aus T beweisbar” auch “ϕ folgt aus T” oder “ϕ ist aus T ableitbar” sagen. 5.5.2 Korrektheit und Vollst¨andigkeit A korrekt : ⇐⇒ f¨ur alle ϕ: `A ϕ ⇒ |= ϕ, A korrekt bzgl. Folgerungen : ⇐⇒ f¨ur alle ϕ, T: T `A ϕ ⇒ T |= ϕ, A (syntaktisch) widerspruchsfrei : ⇐⇒ es gibt ein ϕ mit 6`A ϕ, A (semantisch) vollst¨andig : ⇐⇒ f¨ur alle ϕ: |= ϕ ⇒ `A ϕ. A vollst¨andig bzgl. Folgerungen : ⇐⇒ f¨ur alle ϕ, T: T |= ϕ ⇒ T `A ϕ. In einem korrekten Axiomensystem sind alle beweisbaren Aussagen allgemeing¨ultig, f¨ur ein vollst¨andiges Axiomensystem gilt die Umkehrung. Vollst¨andigkeit und Korrektheit zusammen besagen also, dass genau die allgemeing¨ultigen Aussagen beweisbar sind. • Ein korrektes Axiomensystem ist widerspruchsfrei: die Aussagenvariable A ist nicht allgemeing¨ultig, kann dann also auch nicht beweisbar sein. • In einem widerspruchsvollen (d. h. nicht widerspruchsfreien) Axiomensystem ist alles beweisbar; • ein widerspruchsfreies Axiomensystem (mit modus ponens als Regel) enth¨alt keinen Widerspruch in dem Sinne, dass keine Formel und zugleich auch ihre Negation beweisbar ist: Bemerkung Enth¨alt A den modus ponens als Regel und gilt `A ϕ → (¬ϕ → ψ) oder `A ¬ϕ → (ϕ → ψ), so: A widerspruchsfrei ⇐⇒ es gibt keine Formel ϕ mit `A ϕ und `A ¬ϕ.
5.5. D ER SYNTAKTISCHE F OLGERUNGSBEGRIFF : B EWEISBARKEIT
102
Satz T und S seien Formelmengen, ϕ eine Formel. 1. Ist ϕ ∈ T oder ϕ Axiom von A, so gilt T `A ϕ. 2. (Endlichkeitssatz f¨ur `) Falls T `A ϕ, so existiert ein endliches T0 ⊆ T mit T0 `A ϕ. 3. (Transitivit¨at von `) Falls T `A ϕ und S `A ψ f¨ur jedes ψ ∈ T, so S `A ϕ. 4. A enthalte den modus ponens als Regel. Dann gilt: T `A ϕ und T `A ϕ → ψ =⇒ T `A ψ. . 5.5.3 Beispiele von Axiomensystemen Es gibt zahlreiche Beispielen f¨ur Axiomensysteme der Aussagenlogik mit unterschiedlichen Vorz¨ugen und Nachteilen, wir erw¨ahnen nur die folgenden: (a) Hilbert-Bernays • Sprache: A, B,C, . . . , ¬, ∨, ∧, →, ↔, (, ) • Axiome: 1. A → (B → A) (A → (A → B)) → (A → B) (A → B) → ((B → C) → (A → C)) 2. A ∧ B → A A∧B → B (A → B) → ((A → C) → (A → B ∧C)) 3. A → A ∨ B B → A∨B (A → C) → ((B → C) → (A ∨ B → C)) 4. (A ↔ B) → (A → B) (A ↔ B) → (B → A) (A → B) → ((B → A) → (A ↔ B)) 5. (A → B) → (¬B → ¬A) A → ¬¬A ¬¬A → A
(bis hier: Positive Logik)
(bis hier: Minimalkalk¨ul) (bis hier: Intuistionistische Logik) (klassische Logik)
5.5. D ER SYNTAKTISCHE F OLGERUNGSBEGRIFF : B EWEISBARKEIT
103
• Regeln: Einsetzungsregel:
ϕ(A) ϕ, ϕ → ψ und modus ponens: ϕ[ψ/A] ψ
Interessant ist hier die Gruppierung der Axiome nach den einzelnen aussagenlogischen Operationen, zudem ist die Anordnung der letzten Axiome so gew¨ahlt, dass man durch Weglassen verschiedene Teilsysteme der Aussagenlogik erh¨alt, die sich durch ihre jeweiligen Anforderungen an die Negation unterscheiden. (b) Shoenfield • Sprache: A, B,C, . . . , ¬, ∨, (, ) Die u¨ brigen aussagenlogischen Operationen werden wie u¨ blich definiert, endliche Folgen von Disjunktionen und Implikationen werden durch Klammerung von rechts definiert: ϕ1 → ϕ2 . . . → ϕn : ↔ ϕ1 → (ϕ2 → (. . . ϕn )), ϕ1 ∨ ϕ2 . . . ∨ ϕn : ↔ ϕ1 ∨ (ϕ2 ∨ (. . . ϕn )). • Axiome: ¬ϕ ∨ ϕ
(tertium non datur)
• Regeln: Expansion: K¨urzung:
ψ ϕ ∨ψ ϕ ∨ϕ ϕ
Assoziativit¨at: Schnitt:
ϕ ∨ (ψ ∨ δ ) (ϕ ∨ ψ) ∨ δ ϕ ∨ ψ, ¬ϕ ∨ δ ψ ∨δ
Die Axiome sind hier als Formelschemata aufgeschrieben, so dass keine Einsetzungsregel erforderlich ist. (c) Nicod Dieses Axiomensystem kommt allein mit einer aussagenlogischen Verkn¨upfung aus, n¨amlich mit ↑ (wobei A ↑ B bedeutet: nicht A oder nicht B), außerdem wird auch nur nur ein Axiomenschema und nur eine Regel ben¨otigt: (α ↑ (β ↑ γ)) ↑ {[δ ↑ (δ ↑ δ )] ↑ [(ε ↑ β ) ↑ ((α ↑ ε) ↑ (α ↑ ε))]} α, α ↑ (β ↑ γ) γ
¨ 5.6. VOLLST ANDIGKEIT UND KOMPAKTHEIT
104
Das ist wohl das allerk¨urzeste (wenn auch nicht besonders intuitive) Axiomensystem. Hat ein Axiomensystem wenig Grundsymbole und/oder wenig Axiome und Regeln, so l¨asst sich seine Korrektheit i. a. sehr schnell zeigen, dagegen werden Beweise in einem solchen System sehr lang und umst¨andlich, und die Vollst¨andigkeit ist dann entsprechend m¨uhsam zu zeigen. Alle diese Axiomensysteme sind korrekt, widerspruchsfrei und vollst¨andig, jedoch nicht bez¨uglich Folgerungen, wenn sie die Einsetzungsregel enthalten. Um diese Regel zu vermeiden, muss man die Axiome (wie in den letzten beiden Axiomensystemen) als Formelschemata schreiben! Die Korrektheit beweist man in allen F¨allen durch Induktion u¨ ber die L¨ange eines Beweises, d. h. man zeigt • die Axiome sind allgemeing¨ultig und • sind die Pr¨amissen einer Regel allgemeing¨ultig, so auch die Konklusion. Gilt außerdem: • aus der (den) Pr¨amisse(n) einer Regel folgt die Konklusion, so sind die Axiomensysteme auch korrekt bzgl. Folgerungen; modus ponens und die u¨ brigen betrachteten Regeln - außer der Einsetzungsregel! - erf¨ullen diese Bedingung. So kann man leicht nachweisen, dass das Axiomensystem von S HOEN FIELD korrekt bez¨ uglich Folgerungen ist.
5.6 Vollst¨andigkeit und Kompaktheit Die Vollst¨andigkeit eines Axiomensystems ist i. a. schwieriger als seine Korrektheit zu beweisen, und wie es auch kein irgendwie “kanonisches” Axiomensystem f¨ur die Aussagenlogik gibt, so gibt es auch keine Standardmethode zum Nachweis der Vollst¨andigkeit, vielmehr muss man die Beweismethode dem Charakter des jeweiligen Axiomensystems anpassen. Hier wollen wir als Beispiel das Axiomensystem von S HOENFIELD behandeln. Der Beweisbegriff ` bezieht sich also auf dieses System; die Ergebnisse gelten jedoch (mit m¨oglicherweise anderen Beweisen) auch f¨ur andere vollst¨andige Axiomensysteme der Aussagenlogik! Kommutativit¨at ϕ ∨ψ ` ψ ∨ϕ
¨ 5.6. VOLLST ANDIGKEIT UND KOMPAKTHEIT
105
Beweis: Aus der Voraussetzung ϕ ∨ ψ und dem Axiom ¬ϕ ∨ ϕ erh¨alt man mittels der Schnittregel: ψ ∨ ϕ. Das bedeutet also, dass man
ϕ ∨ψ ψ ∨ϕ
als Regel hinzunehmen kann (man sagt auch, dass diese Regel ableitbar sei). Modus Ponens ϕ, ϕ → ψ ` ψ d. h. auch der modus ponens
ϕ, ϕ → ψ ψ
ist eine ableitbare Regel. Beweis: Aus ϕ (Voraussetzung) ψ ∨ϕ (Expansion) erhalten wir mit Komm. und der Vor. ¬ϕ ∨ ψ ϕ ∨ ψ, ¬ϕ ∨ ψ (Schnitt) ψ ∨ψ ψ (K¨urzung) Die Kommutativregel, Expansionsregel und die Assoziativregel lassen sich verallgemeinern, wobei wir mit einem Spezialfall beginnen: Lemma F¨ur 1 ≤ i < j ≤ n gilt:
ϕi ∨ ϕ j ` ϕ1 ∨ . . . ∨ ϕn .
Beweis durch Induktion u¨ ber n, wobei man n > 2 annehmen kann: Setze ϕ := ϕ3 ∨ . . . ∨ ϕn . Dann ist zu zeigen: ϕi ∨ ϕ j ` ϕ1 ∨ (ϕ2 ∨ ϕ). Fall 1: i ≥ 2. Dann gilt ϕi ∨ ϕ j ` ϕ2 ∨ ϕ nach Induktionsvoraussetzung (da ϕ1 weggelassen wurde, handelt es sich nur noch um n − 1 Formeln). Also gilt nach der Expansionsregel: ϕi ∨ ϕ j ` ϕ1 ∨ (ϕ2 ∨ ϕ). Fall 2: i = 1, j ≥ 3. Dann ist aus der Voraussetzung ϕi ∨ ϕ j beweisbar:
¨ 5.6. VOLLST ANDIGKEIT UND KOMPAKTHEIT
ϕ1 ∨ ϕ ϕ ∨ ϕ1 ϕ2 ∨ (ϕ ∨ ϕ1 ) (ϕ2 ∨ ϕ) ∨ ϕ1 ϕ1 ∨ (ϕ2 ∨ ϕ)
106
nach Ind.vor. f¨ur die n − 1 Formeln ohne ϕ2 nach Komm. mit der Expansionsregel mit der Assoziativregel nach Komm.
Fall 3: i = 1, j = 2. Dann ist aus der Voraussetzung ϕi ∨ ϕ j , d. h. ϕ1 ∨ ϕ2 beweisbar: ϕ ∨ (ϕ1 ∨ ϕ2 ) (ϕ ∨ ϕ1 ) ∨ ϕ2 ϕ2 ∨ (ϕ ∨ ϕ1 ) (ϕ2 ∨ ϕ) ∨ ϕ1 ϕ1 ∨ (ϕ2 ∨ ϕ)
mit der Expansionsregel mit der Assoziativregel nach Komm. mit der Assoziativregel nach Komm.
¨ Mit a¨ hnlichen kombinatorischen Uberlegungen zeigt man: 5.6.1 Verallgemeinerte Expansion F¨ur n, m ≥ 1, i1 , . . . im ∈ {1, . . . , n} gilt:
ϕi1 ∨ . . . ∨ ϕim ` ϕ1 ∨ . . . ∨ ϕn .
Beweis durch Induktion u¨ ber m: Fall 1: m = 1, i1 = i. Dann gilt ϕi nach Induktionsvoraussetzung, also: (ϕi+1 ∨ . . . ∨ ϕn ) ∨ ϕi ϕi ∨ ϕi+1 ∨ . . . ∨ ϕn ϕ1 ∨ . . . ∨ ϕn
mit der Expansionsregel nach Komm. mit der Expansionsregel (i − 1)-mal.
Fall 2: m = 2. Dieser Fall ergibt sich aus dem vorigen Lemma zusammen mit Komm. Fall 3: m ≥ 3. Setze ϕ := ϕ1 ∨ . . . ∨ ϕn . Aus der Voraussetzung ϕi1 ∨ . . . ∨ ϕim (ϕi1 ∨ ϕi2 ) ∨ . . . ∨ ϕim (ϕi1 ∨ ϕi2 ) ∨ ϕ (ϕ ∨ ϕi1 ) ∨ ϕi2 (ϕ ∨ ϕi1 ) ∨ ϕ
folgt mit der Assoziativregel nach Ind.vor. f¨ur m − 1 Formeln mit Komm.- und Assoziativregel nach Ind.vor. f¨ur 2 Formeln (m = 2)
¨ 5.6. VOLLST ANDIGKEIT UND KOMPAKTHEIT
(ϕ ∨ ϕ) ∨ ϕi1 (ϕ ∨ ϕ) ∨ ϕ ϕ
107
mit der Komm.- und Assoziativregel nach Induktionsvor. f¨ur 2 Formeln (m = 2) nach Assoziativregel und Fall 1.
Dabei z¨ahlt bei der Induktionsvoraussetzung f¨ur m − 1 Formeln die Formel (ϕi1 ∨ ϕi2 ) als eine Formel! Mit der Kommutativregel erhalten wir hieraus auch die Umkehrung der Assoziativregel: (ϕ ∨ ψ) ∨ δ ϕ ∨ (ψ ∨ δ ) ¨ 5.6.2 Lemma uber die Negation (i) ϕ ∨ ψ ` ¬¬ϕ ∨ ψ (ii) ¬¬ϕ ∨ ψ ` ϕ ∨ ψ (iii) ¬ϕ ∨ δ , ¬ψ ∨ δ ` ¬(ϕ ∨ ψ) ∨ δ ¨ Den Beweis u¨ berlassen wir als Ubungsaufgabe. Nunmehr k¨onnen wir den (schwachen) Vollst¨andigkeitssatz beweisen als 5.6.3 Tautologiesatz (i) |= ϕ =⇒ ` ϕ (ii) ϕ1 , . . . , ϕn |= ϕ =⇒ ϕ1 , . . . , ϕn ` ϕ Beweis: Zun¨achst zeigen wir, dass (ii) bereits aus (i) folgt: Sei ϕ1 , . . . , ϕn |= ϕ. Dann gilt |= ϕ1 → . . . → ϕn → ϕ, also nach (i): ` ϕ1 → . . . → ϕn → ϕ ϕ1 ` ϕ1 → . . . → ϕn → ϕ, ϕ1 ` ϕ2 → . . . → ϕn → ϕ, ϕ1 , ϕ2 ` ϕ3 → . . . → ϕn → ϕ, ϕ1 , . . . , ϕn ` ϕ.
und also auch woraus mit modus ponens folgt ebenso: usw. bis
Der Beweis von (i) erfolgt durch eine raffiniert angesetzte Induktion: Wir zeigen |= ϕ1 ∨ . . . ∨ ϕn =⇒ ` ϕ1 ∨ . . . ∨ ϕn
¨ 5.6. VOLLST ANDIGKEIT UND KOMPAKTHEIT
108
durch Induktion u¨ ber Σi=1,...,n lz(ϕi ), wobei lz(ϕ) = Anzahl der logischen Zeichen in ϕ ist: 1. Fall: Jedes ϕi ist eine Aussagenvariable oder eine negierte Aussagenvariable. Falls |= ϕ1 ∨ . . . ∨ ϕn , so muss ein ϕi = ¬ϕ j f¨ur ein j sein. Es ist dann aber ϕi ∨ ϕ j ein Axiom, also beweisbar, und damit nach 5.6.1 auch ` ϕ1 , . . . , ϕn . Falls der 1. Fall nicht vorliegt, so ist mindestens ein ϕi keine Aussagenvariable und auch keine negierte Aussagenvariable; durch Vertauschen k¨onnen wir annehmen, dass diese Voraussetzung auf ϕ1 zutrifft. 2. Fall: ϕ1 = ψ ∨ δ f¨ur ein ψ bzw. δ . Dann folgt aus der Annahme: |= ψ ∨ (δ ∨ . . . ∨ ϕn ), also gilt nach Induktionsvoraussetzung (hier liegt der Trick des Beweises!) auch ` ψ ∨ (δ ∨ . . . ∨ ϕn ) und nach der Assoziativregel dann auch ` ϕ1 ∨ . . . ∨ ϕn . 3. Fall: ϕ1 = ¬¬ψ f¨ur ein ψ. Dann folgt aus der Annahme |= ψ ∨ ϕ2 ∨ . . . ∨ ϕn , also nach Induktionsvoraussetzung auch ` ψ ∨ ϕ2 ∨ . . . ∨ ϕn , und nach Lemma 5.6.2 (i) gilt dann ` ϕ1 ∨ . . . ∨ ϕn . 4. Fall: ϕ1 = ¬(ψ ∨ δ ) f¨ur ein ψ bzw. δ . Dann ist unter der Annahme |= ¬(ψ ∨ δ ) ∨ ϕ2 ∨ . . . ∨ ϕn , auch |= ¬ψ ∨ ϕ2 ∨ . . . ∨ ϕn und |= ¬δ ∨ ϕ2 ∨ . . . ∨ ϕn , und somit ` ¬ψ ∨ ϕ2 ∨ . . . ∨ ϕn und ` ¬δ ∨ ϕ2 ∨ . . . ∨ ϕn nach Ind.vor., woraus ` ϕ1 ∨ . . . ∨ ϕn mit Lemma 5.6.2 (iii) folgt. Mit Hilfe des Tautologiesatzes kann man nun beweisen: 5.6.4 Deduktionstheorem T ` ϕ → ψ ⇐⇒ T ∪ {ϕ} ` ψ Wir werden dieses rein syntaktische Ergebnis sp¨ater im Rahmen der Pr¨adikatenlogik auch rein syntaktisch beweisen. 5.6.5 Widerspruchsfreiheit und Vollst¨andigkeit von Theorien Widerspruchsfreiheit (Konsistenz) und Vollst¨andigkeit haben wir als syntaktische Begriffe in 5.5.2 f¨ur Axiomensysteme definiert; der erste Begriff wird entsprechend auf Formelmengen (sp¨ater: Theorien) u¨ bertragen. Aufpassen muss man
¨ 5.6. VOLLST ANDIGKEIT UND KOMPAKTHEIT
109
dagegen bei dem Begriff der Vollst¨andigkeit: Dieser wird im Falle von Formelmengen eine andere Bedeutung haben als f¨ur Axiomensysteme. Immerhin wird er f¨ur Formelmengen mit dem fr¨uher bereits eingef¨uhrten Begriff der (semantischen) Vollst¨andigkeit (s. 4.1.1) u¨ bereinstimmen, und zwar auf Grund des gleich zu beweisenden Vollst¨andigkeitssatzes. Bis zum Beweis dieses Satzes werden wir vollst¨andig in dem unten stehenden syntaktischen Sinne verwenden: T konsistent: T vollst¨andig:
⇐⇒ es gibt ein ϕ mit T 6` ϕ ⇐⇒ es gibt kein ϕ mit T ` ϕ und T ` ¬ϕ ⇐⇒ f¨ur alle ϕ gilt: T ` ϕ oder T ` ¬ϕ.
Somit ist eine Formelmenge T vollst¨andig und konsistent ⇐⇒ f¨ur alle ϕ gilt: entweder T ` ϕ oder T ` ¬ϕ. Gleichbedeutend damit ist die Aussage, dass die Menge der Folgerungen aus T C(T) := {σ | T ` σ } maximal konsistent ist, d. h. C(T) ist konsistent, besitzt aber keine echte konsistente Erweiterung. Eine Theorie ist inkonsistent (oder widerspruchsvoll) gdw. sie nicht konsistent ist; a¨ hnlich wie im Fall der semantischen Analoga (5.4.1) h¨angen Beweisbarkeit und (In-)konsistenz miteinander zusammen: ¨ 5.6.6 Lemma uber Beweisbarkeit und Konsistenz (i) T 6` ϕ
⇐⇒ T ∪ {¬ϕ} konsistent,
(ii) T ` ϕ
⇐⇒ T ∪ {¬ϕ} inkonsistent.
Beweis: Gilt T ` ϕ, so erst recht T ∪ {¬ϕ} ` ϕ und nat¨urlich auch T ∪ {¬ϕ} ` ¬ϕ, also ist T ∪ {¬ϕ} inkonsistent. Ist umgekehrt T∪{¬ϕ} inkonsistent, so ist alles beweisbar, insbesondere auch T ∪ {¬ϕ} ` ϕ und nach dem Deduktionstheorem T ` ¬ϕ → ϕ, woraus T ` ϕ folgt. Damit haben wir (ii) gezeigt (und damit auch (i)). Den verallgemeinerten Vollst¨andigkeitssatz werden wir nun in der Form ¨ jede konsistente Theorie ist erfullbar
¨ 5.6. VOLLST ANDIGKEIT UND KOMPAKTHEIT
110
beweisen. Dazu werden wir in zwei Schritten zeigen: • jede konsistente Menge T l¨asst sich zu einer maximal konsistenten Menge erweitern, • eine maximal konsistente Menge ist (in kanonischer) Weise erf¨ullbar. 5.6.7 Vervollst¨andigung Zu jeder konsistenten Formelmenge T gibt es eine maximal konsistente Erweiterung TV ⊇ T. Beweis: Es sei ϕ0 , . . . , ϕn , . . . eine Aufz¨ahlung aller Formeln. Durch Induktion erweitern wir T, indem wir T0 = T setzen und ( Tn falls Tn ` ϕn , Tn+1 = Tn ∪ {¬ϕn } sonst. Nach obigem Lemma 5.6.6 (i) bleibt Tn+1 auch im “sonst”-Fall konsistent, so dass alle Tn konsistent sind und damit auch die Vereinigung TV :=
[
Tn
n∈N
(nach dem Endlichkeitssatz f¨ur die Beweisbarkeit, s. 5.5.2). Da die Formel ϕn oder ihre Negation sp¨atestens im (n + 1)-ten Schritt zu T hinzugef¨ugt werden, ist TV auch vollst¨andig. 5.6.8 Verallgemeinerter Vollst¨andigkeitssatz T |= ϕ
=⇒
T ` ϕ,
T |= ϕ
⇐⇒
T ` ϕ.
(ii) T konsistent
=⇒
T hat ein Modell,
T konsistent
⇐⇒
T hat ein Modell.
(i)
also
Beweis von (i) mittels (ii): T 6` ϕ
=⇒ T ∪ {¬ϕ} konsistent =⇒ T ∪ {¬ϕ} erf¨ullbar =⇒ T 6|= ϕ.
nach 5.6.6 (i) nach (ii)
also
¨ 5.6. VOLLST ANDIGKEIT UND KOMPAKTHEIT
111
(Umgekehrt kann man aus (i) auch leicht (ii) erhalten!) Beweis von (ii): Es sei T konsistent, TV eine maximale konsistente Erweiterung von T. Wir definieren dann eine Belegung f von allen Aussagenvariablen durch f (A) = W ⇐⇒ TV ` A. Dann gilt allgemeiner f¨ur alle Formeln ϕ: (∗)
f |= ϕ ⇐⇒ TV ` ϕ.
Diese Behauptung beweist man leicht durch Induktion u¨ ber ρ(ϕ): 1. Ist ϕ eine Aussagenvariable, so gilt (*) nach Definition von f . 2. Ist ϕ = ¬ψ, so f |= ϕ ⇐⇒
f 6|= ψ
⇐⇒
TV 6` ψ
⇐⇒ ⇐⇒
nach Ind.vor. f¨ur ψ
TV ` ¬ψ da TV maximal konsistent TV ` ϕ
3. Ist ϕ = ψ ∨ δ , so f |= ϕ ⇐⇒ ⇐⇒ ⇐⇒
f |= ψ oder f |= δ TV ` ψ oder TV ` δ nach Ind.vor. f¨ur ψ, δ TV ` ϕ,
¨ wobei sich die letzte Aquivalenz wie folgt ergibt: Gilt TV ` ψ oder TV ` δ , so auch TV ` ϕ nach der (verallgemeinerten) Expansionsregel. Sei umgekehrt TV ` ϕ vorausgesetzt. Falls weder TV ` ψ noch TV ` δ , so gilt wegen der (syntaktischen) Vollst¨andigkeit von TV : TV ` ¬ψ und TV ` ¬δ , also nach 5.6.2 (iii): TV ` ¬(ψ ∨ δ ), d. h. TV ` ¬ϕ, und TV w¨are damit inkonsistent, Widerspruch! Mit Hilfe des Endlichkeitssatzes (aus 5.5.2) erhalten wir als Korollar den 5.6.9 Kompaktheitssatz der Aussagenlogik T ist erf¨ullbar ⇐⇒ jedes endliche T0 ⊆ T ist erf¨ullbar.
112
Kapitel 6 Die Pr¨adikatenlogik ¨ die Pr¨adikatenlogik 6.1 Ein Axiomensystem fur Wir haben gesehen, dass es f¨ur den aussagenlogischen Wahrheitsbegriff, ag[ϕ], verschiedene Entscheidungsverfahren gibt und f¨ur endliche Formelmengen T der aussagenlogische Folgerungsbegriff, T |= ϕ, entscheidbar ist, da man nur endlichviele Belegungen der Aussagenvariablen nachzupr¨ufen hat. Dagegen erfordert der Wahrheitsbegriff |= ϕ (und ebenso der semantische Folgerungsbegriff T |= ϕ) der Pr¨adikatenlogik den Nachweis der G¨ultigkeit von ϕ in allen Strukturen der zugeh¨origen Sprache bzw. in allen Modellen von T, und hierzu hat man nicht nur sehr viele Strukturen, sondern unter diesen i. a. auch noch unendliche Strukturen zu untersuchen, so dass wir in diesem Falle keine Entscheidbarkeit erwarten k¨onnen. Daher ist es von Bedeutung, dass es auch einen syntaktischen Beweisbegriff, T ` ϕ, gibt, welcher mit dem semantischen u¨ bereinstimmt (verallgemeinerter Vollst¨andigkeits- und Korrektheitssatz). Damit erhalten wir zwar kein Entscheidungsverfahren, aber immerhin die M¨oglichkeit, alle Folgerungen aus einer Theorie in standardisierter Weise aufzuz¨ahlen. Außerdem zeigt ein vollst¨andiges Axiomensystem mit seinen Axiomen und Regeln an, auf welche grundlegende Prinzipien der Folgerungsbegriff zur¨uckzuf¨uhren ist. ¨ Beim Ubergang von der Aussagenlogik zur Pr¨adikatenlogik kommen zu den aussagenlogischen Symbolen hinzu: • atomare Formeln (anstelle der Aussagenvariablen), • die Quantoren (wobei wir den ∀-Quantor mittels ∃ definieren) sowie • die Gleichheit = (als 2-stelliges logisches Relationszeichen).
¨ DIE P R ADIKATENLOGIK ¨ 6.1. E IN A XIOMENSYSTEM F UR
113
Entsprechend werden die aussagenlogischen Axiome und Regeln erg¨anzt um zus¨atzliche Axiome und Regeln f¨ur die neuen logischen Symbole. 6.1.1 Axiomensystem von Shoenfield Wie im Falle der Aussagenlogik gibt es verschiedene vollst¨andige und korrekte Axiomensysteme f¨ur die Pr¨adikatenlogik; wir wollen hier wieder ein spezielles Axiomensystem nach S HOENFIELD behandeln, dessen aussagenlogischen Teil wir bereits in 5.5.3 (b) angegeben haben: Axiome: (1) aussagenlogische Axiome: (2) Substitutionsaxiome:
¬ϕ ∨ ϕ
ϕ[t/x] → ∃xϕ, falls t in ϕ substituierbar ist.
(3) Gleichheitsaxiome: 1. x = x 2. x1 = y1 ∧ . . . ∧ xm = ym → Fx1 . . . xm = Fy1 . . . ym f¨ur jedes m-stellige Funktionszeichen F 3. x1 = y1 ∧ . . . ∧ xn = yn ∧ Rx1 . . . xn → Ry1 . . . yn f¨ur jedes n-stellige Relationszeichen R Das letzte Gleichheitsaxiom wird insbesondere auch f¨ur die 2-stellige Gleichheitsrelation gefordert! Das Substitutionsaxiom besagt, dass man eine Existenzaussage nachweisen kann, indem man ein Beispiel angibt. Regeln: Zu den uns bereits bekannten aussagenlogischen Regeln Expansion: K¨urzung:
ψ ϕ ∨ψ ϕ ∨ϕ ϕ
Assoziativit¨at: Schnitt:
kommt eine Quantorenregel hinzu: ϕ →ψ ∃-Einf¨uhrung: , ∃xϕ → ψ
ϕ ∨ (ψ ∨ δ ) (ϕ ∨ ψ) ∨ δ ϕ ∨ ψ, ¬ϕ ∨ δ ψ ∨δ
falls x in ψ nicht frei vorkommt.
¨ DIE P R ADIKATENLOGIK ¨ 6.1. E IN A XIOMENSYSTEM F UR
114
Bemerkungen 1. Die Regel der ∃-Einf¨uhrung heißt auch Vordere Partikularisierung. Die angef¨ugte Variablenbedingung ist notwendig, sonst w¨urde man aus der beweisbaren Formel x = y → x = y durch ∃-Einf¨uhrung die Formel ∃x(x = y) → x = y und mit der beweisbaren Formel ∃x(x = y) auch die Formel x = y als beweisbar erhalten, welche aber nicht wahr ist, da sie nur in 1-elementigen Strukturen gilt. (Inhaltlich kann man auch so argumentieren: Es gilt x = 3 → x ist Primzahl, aber nicht ∃x(x = 3) → x ist Primzahl!) 2. Wo benutzt man die ∃-Einf¨uhrung? Nehmen wir an, dass wir in einem Beweis zu der Aussage ϕ(x) → ψ gelangt sind. Um hieraus die Aussage ψ zu erhalten, brauchen wir - wenn ψ von der Wahl eines x nicht abh¨angt (formal: wenn x in ψ nicht frei vorkommt) - nur zu versuchen, die Voraussetzung ϕ(x) f¨ur (mindestens) ein x nachzuweisen (formal: die Aussage ∃xϕ(x) zu beweisen). Dann k¨onnen wir n¨amlich mittels ∃-Einf¨uhrung und modus ponens tats¨achlich die gew¨unschte Aussage ψ erhalten. Den Beweisbegriff f¨ur ein Axiomensystem der Pr¨adikatenlogik (wie das oben angegebene System von S HOENFIELD) k¨onnen wir w¨ortlich vom Aussagenkalk¨ul u¨ bernehmen: 6.1.2 Definition eines Beweises Ein Beweis von ϕ aus T ist eine endliche Folge (ϕ1 , . . . , ϕn ) von Formeln, so dass (B1) ϕn = ϕ, (B2) f¨ur jedes m ≤ n gilt: (1) ϕm ist Axiom oder (2) ϕm ist Formel aus T oder (3) es gibt ein i < m, so dass ϕm aus ϕi hervorgeht durch Anwendung einer Regel oder (4) es gibt i, j < m, so dass ϕm aus ϕi und ϕ j hervorgeht durch Anwendung einer Regel mit 2 Pr¨amissen. Wir schreiben wieder: T ` ϕ : ⇐⇒ es gibt einen Beweis von ϕ aus T ` ϕ : ⇐⇒ 0/ ` ϕ
ϕ ist aus T beweisbar, ϕ ist beweisbar.
115
6.2. D ER TAUTOLOGIESATZ
Bemerkung Die Beweisbarkeit l¨asst sich auch rekursiv wie folgt charakterisieren: (S1) Jedes logische Axiom und jedes Axiom von T sind aus T beweisbar. (S2) Ist die Pr¨amisse (bzw. sind die Pr¨amissen) einer Regel aus T beweisbar, so auch ihre Konklusion. ¨ Satz uber die Verallgemeinerte Korrektheit T ` ϕ =⇒ T |= ϕ Beweisskizze: Es sei A |= T. Zeige (∗) T ` ϕ =⇒ A |= ϕ durch Induktion gem¨aß der induktiven Definition (S1), (S2): 1. ϕ ist logisches Axiom. Zeige, dass dann A |= ϕ. 2. ϕ ist Axiom von T. Dann gilt die Beh. (*) offenbar wegen A |= T. 3. ϕ ist Konklusion einer Regel, deren Pr¨amisse(n) aus T beweisbar ist (sind). Gehe die einzelnen Regeln durch und zeige, dass sich G¨ultigkeit in A von den Pr¨amissen auf die Konklusion vererbt.
6.2 Der Tautologiesatz Hier wollen wir erl¨autern, in welcher Weise das Axiomensystem von S HOEN FIELD die Aussagenlogik enth¨alt und “aussagenlogisch vollst¨andig” ist (Tautologiesatz): Den Grundbestandteilen der aussagenlogischen Sprache, also den Aussagenvariablen, entsprechen in der pr¨adikatenlogischen Sprache die atomaren Formeln (Primformeln), w¨ahrend die aussagenlogischen Operationen hier selbst wieder vorkommen. Andererseits gibt es pr¨adikatenlogische Formeln, die nicht atomar, aber auch aussagenlogisch nicht weiter zerlegbar sind; diese werden zusammen mit den atomaren Formeln elementar genannt:
116
6.2. D ER TAUTOLOGIESATZ
Definition einer Tautologie ϕ elementar : ⇐⇒ ϕ atomar oder beginnt mit dem Quantor ∃. B Bewertung von L : ⇐⇒ B : {ϕ | ϕ elementare L-Formel} −→ {W, F}. Die Bewertungen der elementaren Formeln treten an die Stelle der Belegungen f der Aussagenvariable in der Aussagenlogik; ebenso wie sich diese (mittels der Wahrheitstafeln) fortsetzen lassen zum Wahrheitswert f (ϕ) einer aussagenlogischen Formel ϕ, k¨onnen wir jede Bewertung B fortsetzen zu einer Abbildung B : {ϕ | ϕ L-Formel} −→ {W, F} durch die Festlegungen B(¬ϕ) = W
⇐⇒
B(ϕ) = F,
B(ϕ ∨ ψ) = W
⇐⇒
B(ϕ) = W oder B(ψ) = W.
An die Stelle der entsprechenden semantischen Begriffe der Aussagenlogik treten nun die folgenden: |=AL ϕ: ⇐⇒ (B(ϕ) = W f¨ur alle Bewertungen B) ϕ ist Tautologie, T |=AL ϕ: ⇐⇒ (B(ϕ) = W f¨ur alle Bew. B, f¨ur die B(ψ) = W f¨ur alle ψ ∈ T) ϕ ist tautologische Folgerung aus T. Beispiele Tautologien sind: ϕ ∨ ¬ϕ, ϕ ∨ ψ ↔ ψ ∨ ϕ, nicht aber (obwohl wahre Aussagen): x = x, x = y → y = x, ∃x(x = x); tats¨achlich sind die letzten Formeln nicht aussagenlogisch, sondern erst pr¨adikatenlogisch wahr (als elementare Formeln k¨onnten sie einfach mit F belegt werden). Tautologiesatz (i) Falls T ` ϕ1 , . . . , ϕn und ϕ1 , . . . , ϕn |=AL ϕ, so T ` ϕ, (ii) falls T endlich und T |=AL ϕ, so T ` ϕ, (iii) falls |=AL ϕ, so ` ϕ, und somit T ` ϕ f¨ur jede Tautologie ϕ. Beweis: Offensichtlich folgt (i) aus (ii) , und (ii) folgt aus (iii): Sei
6.3. S UBSTITUTION UND UNIVERSELLER A BSCHLUSS
T = {ϕ1 , . . . , ϕn } und T |=AL ϕ, ϕ1 , . . . , ϕn |=AL ϕ. |=AL ϕ1 → . . . → ϕn → ϕ, ` ϕ1 → . . . → ϕn → ϕ ϕ1 , . . . , ϕn ` ϕ.
117
also Dann gilt auch also nach (iii) und daraus mit modus ponens auch
Somit bleibt nur (iii), d.h. die einfache Vollst¨andigkeit des aussagenlogischen Teils, zu beweisen. Dazu geht man wie beim Beweis des Vollst¨andigkeitssatzes f¨ur die Aussagenlogik vor und erh¨alt |=AL ϕ =⇒|= Aϕ , wobei Aϕ die aussagenlogische Formel ist, die aus ϕ entsteht, indem man die elementaren Formeln ϕ1 , . . . , ϕn durch Aussagenvariable A1 , . . . , An ersetzt. Der Vollst¨andigkeitssatz f¨ur die Aussagenlogik ergibt nun ` Aϕ , und aus einem aussagenlogischen Beweis von Aϕ erh¨alt man einen (pr¨adikatenlogischen) Beweis von ϕ, indem man in diesem Beweis nun umgekehrt die Aussagenvariable A1 , . . . , An durch die elementaren Formeln ϕ1 , . . . , ϕn ersetzt. Aufgrund der Aussage (i) des Tautologiesatzes k¨onnen wir somit aussagenlogische Argumente (pr¨aziser: tautologische Folgerungen) in pr¨adikatenlogische Folgerungen u¨ bernehmen, wovon wir im folgenden h¨aufig stillschweigend Gebrauch machen werden.
6.3 Substitution und universeller Abschluss Den ∀-Quantor haben wir definiert durch ∀xϕ ↔ ¬∃x¬ϕ, somit gilt auch ∃xϕ
↔ ¬∀x¬ϕ
und
¬∀xϕ
↔ ∃x¬ϕ
und
¬∃xϕ
↔ ∀x¬ϕ.
Die folgenden S¨atze bezeichnen ableitbare Regeln bzw. beweisbare Formeln, die somit bei Beweisen verwendet werden k¨onnen:
6.3. S UBSTITUTION UND UNIVERSELLER A BSCHLUSS
118
6.3.1 Hintere Generalisierung ϕ → ψ ` ϕ → ∀xψ, falls x in ϕ nicht frei vorkommt (Variablen-Bedingung). Beweis: (1)
ϕ →ψ
(2)
¬ψ → ¬ϕ
Voraussetzung tautologisch aus (1)
(3) ∃x¬ψ → ¬ϕ
mit ∃-Einf¨uhrung (die Var.bedingung ist erf¨ullt!)
(4) ϕ → ¬∃x¬ψ
tautologisch aus (3)
ϕ → ∀xψ
nach Definition des ∀-Quantors
Diese Regel l¨asst sich in folgendem Fall anwenden: Zu beweisen sei die Aussage ϕ → ∀xψ. Dazu setzen wir ϕ voraus und zeigen die Behauptung ∀xψ wie folgt: Sei “x beliebig” (das heißt inhaltlich: wir d¨urfen kein x w¨ahlen, f¨ur das ϕ bereits eine besondere Eigenschaft festlegt - wie z. B. “x ist Primzahl” oder “x ist das gr¨oßte Element”, formal haben wir die Bedingung, dass x nicht frei in ϕ vorkommt). K¨onnen wir damit ψ(x) beweisen, so haben wir nach der obigen Regel die Aussage ϕ → ∀xψ gezeigt. ¨ 6.3.2 Satz uber die Generalisierung ϕ ` ∀xϕ Beweis : (1)
ϕ
(2)
¬∀xϕ → ϕ
(3) ¬∀xϕ → ∀xϕ (4)
∀xϕ
Voraussetzung tautologisch: Abschw¨achung von (1) mit ∀-Einf¨uhrung (die Var.bedingung ist erf¨ullt!) tautologisch aus (3)
Das bedeutet also: Um ∀xϕ(x) aus T zu beweisen, gen¨ugt es ϕ(x) (f¨ur ein “beliebiges x”) aus T herzuleiten.
6.3. S UBSTITUTION UND UNIVERSELLER A BSCHLUSS
119
6.3.3 Substitutionsregel ϕ(x1 , . . . , xn ) ` ϕ(t1 , . . . ,tn ) Beweis durch Induktion nach n: n = 1:
(1)
ϕ
Voraussetzung
∀x1 ϕ d.h. ¬∃x1 ¬ϕ
Generalisierung
(2) ¬ϕ[t1 /x1 ] → ∃x1 ¬ϕ
Substitutionsaxiom
(3) ¬∃x1 ¬ϕ → ϕ[t1 /x1 ]
tautologisch aus (2)
ϕ[t1 /x1 ]
aus (1) und (3) mit modus ponens
n ≥ 1: Setze ϕ 0 = ϕ[t1 /x1 , . . . ,tn /xn ] und w¨ahle n neue Variable y1 , . . . , yn , die weder in ϕ noch in ϕ 0 vorkommen. (Dadurch erreichen wir, dass f¨ur die neuen Variablen die hintereinander ausgef¨uhrte Substitution mit der simultanen Substitution u¨ bereinstimmt.) Wenden wir nun den Fall n = 1 sukzessive an, so erhalten wir aus ϕ: ϕ[y1 /x1 ], ϕ[y1 /x1 , y2 /x2 ], . . . , ϕ[y1 /x1 , . . . , yn /xn ] und ebenso aus dem Fall n = 1: ϕ[y1 /x1 , . . . , yn /xn ][t1 /y1 ] = ϕ[t1 /x1 , . . . , yn /xn ], ϕ[t1 /x1 ,t2 /x2 , . . . , yn /xn ], . . . , ϕ[t1 /x1 ,t2 /x2 . . . ,tn /xn ].
Die Bedeutung ist klar: Unter der Annahme ϕ(x1 , . . . , xn ) gilt diese Aussage generell (Generalisierung), also insbesondere f¨ur beliebige (substituierbare) Terme (wobei diese wiederum neue Variable einf¨uhren k¨onnen). - Als Verallgemeinerung des Substitutionsaxioms erhalten wir (zusammen mit seiner dualen Fassung (ii)): 6.3.4 Substitutionssatz (i) ϕ[t1 /x1 , . . . ,tn /xn ] → ∃x1 . . . ∃xn ϕ (ii) ∀x1 . . . ∀xn ϕ → ϕ[t1 /x1 , . . . ,tn /xn ]
6.3. S UBSTITUTION UND UNIVERSELLER A BSCHLUSS
120
(In beiden F¨allen sei vorausgesetzt, dass t1 , . . . ,tn f¨ur x1 , . . . , xn in ϕ substituierbar sind.) Beweis von (i): Aus den Substitutionsaxiomen folgt durch mehrfache Anwendung: ϕ → ∃xn ϕ ∃xi−1 . . . ∃xn → ∃xi ∃xi−1 . . . ∃xn ϕ ϕ → ∃x1 . . . ∃xn ϕ
und daraus folgt die Behauptung mit der Substitutionsregel. (ii) beweist man analog (oder durch Kontraposition aus (i)).
Beachte, dass die Umkehrungen von (i) und (ii), ϕ(t1 , . . . ,tn ) → ∀x1 . . . ∀xn ϕ, nicht wahr sind! (Was f¨ur bestimmte Objekte gilt, gilt nicht f¨ur beliebige: quod licet iovi...!) Distributionsregel ϕ → ψ ` ∃xϕ → ∃xψ ϕ → ψ ` ∀xϕ → ∀xψ Beweis: (1)
ϕ →ψ
(2) ψ → ∃xψ ϕ → ∃xψ
Voraussetzung Substitutionssatz tautologisch aus (1), (2)
∃xϕ → ∃xψ mit ∃-Einf¨uhrung (die Variablenbedingung ist erf¨ullt!) Den zweiten Teil beweist man analog (“dual”).
Bereits fr¨uher hatten wir f¨ur eine Formel ϕ = ϕ(x1 , . . . , xn ) mit x1 , . . . , xn als frei vorkommenden Variablen definiert: ∀x1 . . . ∀xn ϕ
der (universelle) Abschluss von ϕ.
Dieser ist immer ein Satz (d. h. eine Formel ohne frei vorkommende Variable).
6.4. E RSETZUNG UND U MBENENNUNG , G LEICHHEIT
121
6.3.5 Abschluss-Satz Ist ϕ ∀ der universelle Abschluss von ϕ, so sind beide deduktionsgleich: T ` ϕ ⇐⇒ T ` ϕ ∀ . Beweis: Benutze die Generalisierungsregel bzw. den Substitutionssatz.
Somit ist es gleichbedeutend, aus einer Theorie T eine Formel ϕ(x, y, . . .) oder ihren universellen Abschluss ∀x∀y ϕ(x, y, . . .) zu beweisen: ∀x∀y ϕ(x, y, . . .) folgt aus T gdw ϕ(x, y, . . .) f¨ur “beliebige” x, y aus T folgt.
6.4 Ersetzung und Umbenennung, Gleichheit Wie in der Aussagenlogik gilt auch hier, dass der Wahrheitswert einer Formel sich nicht a¨ ndert, wenn man innerhalb der Formel eine Teilformel durch eine andere mit gleichem Wahrheitswert ersetzt. Hier zeigen wir das syntaktische Gegenst¨uck: Ersetzt man innerhalb einer Formel ϕ eine Teilformel durch eine a¨ quivalente, so erh¨alt man wiederum eine zu ϕ a¨ quivalente Formel. (Dabei braucht man die erw¨ahnte Teilformel nat¨urlich nicht u¨ berall zu ersetzen.) 6.4.1 Ersetzungstheorem Es gelte T ` ψi ↔ ψi0 f¨ur i = 1, . . . n, und die Formel ϕ 0 entstehe aus ϕ, indem in ϕ einige (oder alle) Teilformeln der Form ψi durch ψi0 ersetzt werden. Dann gilt auch T ` ϕ ↔ ϕ 0 . Beweis durch Induktion u¨ ber den logischen Aufbau von ϕ. Satz (Umbenennung von gebundenen Variablen) Falls die Variable y in ψ nicht vorkommt: ` ∃xψ ↔ ∃yψ[y/x]
6.4. E RSETZUNG UND U MBENENNUNG , G LEICHHEIT
122
Beweis: (1)
ψ[y/x] → ∃xψ
(2) ∃yψ[y/x] → ∃xψ (3)
ψ → ∃yψ[y/x]
(4) ∃xψ → ∃yψ[y/x]
Substitutionsaxiom ∃-Einf¨uhrung in (1). Außerdem Substitutionsaxiom ∃-Einf¨uhrung in (3)
Dabei liegt in (3) eine Anwendung des Substitutionsaxioms auf die Formel ψ[y/x] vor, wobei ψ[y/x][x/y] wieder die Formel ψ ergibt, da x nicht in ψ vorkommt. Dagegen wird in (2) nur ben¨otigt, dass x nicht frei in ψ vorkommt. ¨ die Notwendigkeit der Variablenbedingung: Beispiel fur Es sei ψ = ∃y(y 6= x). Dann ist nicht allgemeing¨ultig (und damit auch nicht beweisbar): ∃x∃y(y 6= x) ↔ ∃y∃y(y 6= y). Tats¨achlich ist hier ψ[y/x][x/y] = ∃y(y 6= y) 6= ψ. Wir werden jetzt h¨aufig der Einfachheit halber, soweit kein Missverst¨andnis zu bef¨urchten ist, ϕ(t1 , . . . ,tn ) statt ϕ[t1 /x1 , . . . ,tn /xn ] schreiben. Definition Die Formel ϕ ∗ entsteht aus der Formel ϕ durch Umbenennung von gebundenen Variablen gdw in ϕ Teilformeln der Form ∃xψ(x) durch ∃yψ(y) ersetzt werden (wobei y nat¨urlich eine neue Variable ist, die in ∃xψ(x) nicht vorkommt). Satz (Gebundene Umbenennung) Falls ϕ ∗ aus der Formel ϕ durch Umbenennung von gebundenen Variablen entsteht, so erh¨alt man eine a¨ quivalente Formel: ` ϕ ↔ ϕ∗ 6.4.2 Eigenschaften des Gleichheitspr¨adikates Zum Schluss behandeln wir noch Aussagen u¨ ber die Gleichheit: In den Axiomen kommt an erster Stelle zwar nur die Reflexivit¨at der Gleichheit vor, die u¨ brigen
6.4. E RSETZUNG UND U MBENENNUNG , G LEICHHEIT
123
Eigenschaften sind aber in dem dritten Schema enthalten, in welchem die Relation R auch das Gleichheitszeichen sein darf, so dass sich hier auch die Transitivit¨at ¨ der Gleichheit versteckt. Es fehlt f¨ur eine Aquivalenzrelation somit nur noch die Symmetrie: Lemma `s=t ↔t =s Beweis: (1)
x=x
Gleichheitsaxiom
(2) x = y ∧ x = x ∧ x = x → y = x
Gleichheitsaxiom mit Rx1 x2 als x1 = x2
(3)
x=y→y=x
tautologisch aus (1), (2)
(4)
s=t →t =s
Substitutionsregel aus (3), ebenso
(5)
t =s→s=t
Prinzip der Nichtunterscheidbarkeit (i) s0 entstehe aus s durch Ersetzung einiger (oder aller) Teilterme ti durch ti0 . Dann gilt: ` t1 = t10 ∧ . . . ∧ tn = tn0 → s = s0 . (ii) ti und ti0 seien Terme, die in ϕ substituierbar seien. Dann gilt: ` t1 = t10 ∧ . . . ∧ tn = tn0 → (ϕ(t1 , . . . ,tn ) ↔ ϕ(t10 , . . . ,tn0 )). Beweis: Wegen der Substitutionsregel brauchen wir (i) und (ii) nur f¨ur Variable xi , yi statt der Terme ti ,ti0 zu beweisen. (i) beweist man durch Induktion u¨ ber den Aufbau von s (mit Hilfe der Gleichheitsaxiome), (ii) a¨ hnlich durch Induktion u¨ ber den Formelaufbau von ϕ. Das ist das wichtigste Ergebnis u¨ ber die Gleichheit (in einfachster Form bereits in den Gleichheitsaxiomen enthalten): Im mathematischen Gebrauch (und nicht nur hier) ist die Gleichheitsbeziehung fast niemals die reine Identit¨at (etwa ¨ im Sinne der syntaktischen Gleichheit), sondern stets nur eine Aquivalenzrelation und zus¨atzlich eine Kongruenzrelation bez¨uglich der Grundbegriffe der jeweiligen Theorie.
¨ 6.5. P R ANEXE N ORMALFORMEN
124
6.5 Pr¨anexe Normalformen Wir setzen unsere Untersuchungen fort mit weiteren Gesetzen u¨ ber Quantoren, die u. a. dazu f¨uhren, pr¨anexe Normalformen zu erhalten, in welchen alle Quantoren am Anfang der Formel (als Pr¨afix) stehen. In der Aussagenlogik konnten wir konjunktive und disjunktive Normalformen z. B. f¨ur Entscheidungsfragen benutzen; eine entsprechende Anwendung fehlt in der Pr¨adikatenlogik, da diese unentscheidbar ist. Man kann aber pr¨anexe Normalformen zur Klassifikation der Kompliziertheit benutzen (so wie man ein Polynom nach seinem Grad klassifizieren kann) und z. B. zeigen, 1. dass Formeln mit einem bestimmten Pr¨afix noch entscheidbar, ab einem bestimmten Grad der Komplexit¨at aber unentscheidbar sind, 2. Formeln aufgrund ihres Pr¨afixes bestimmte modelltheoretische Eigenschaften haben. 3. Die Bedeutung der Quantorenreihenfolge am Anfang tritt außerdem offen zutage, wenn man etwa Eigenschaften der Stetigkeit mit derjenigen der gleichm¨aßigen Stetigkeit vergleicht, oder die Existenz eines gr¨oßten Elementes: ∃x∀y(y < x) mit der Aussage, dass zu jedem Element ein gr¨oßeres existiert: ∀y∃x(y < x). Aus der Definition des ∀-Quantors mittels des ∃-Quantors ergibt sich: 6.5.1 Umformungen mit der Negation (i)
` ¬∀xϕ ↔ ∃x¬ϕ
(ii)
` ¬∃xϕ ↔ ∀x¬ϕ
6.5.2 Umformungen mit Konjunktion und Disjunktion Falls x in ψ nicht frei vorkommt und Q den ∃- oder ∀-Quantor bezeichnet: (i)
` Qxϕ ∨ ψ ↔ Qx(ϕ ∨ ψ)
(ii)
` ψ ∨ Qxϕ ↔ Qx(ψ ∨ ϕ)
¨ Ahnliche Aussagen gelten, wenn auf beiden Seiten ∨ durch ∧ ersetzt wird.
¨ 6.5. P R ANEXE N ORMALFORMEN
125
Beweis: Wir zeigen nur (i): (1)
ψ → ϕ ∨ψ
(2)
ϕ ∨ ψ → ∃x(ϕ ∨ ψ)
(3)
ψ → ∃x(ϕ ∨ ψ)
(4)
ϕ → ϕ ∨ψ
(5)
∃xϕ → ∃x(ϕ ∨ ψ)
Tautologie Substitutionsaxiom tautologisch aus (1), (2) , ebenso Tautologie Distributionsregel, angewandt auf (4)
(6) ∃xϕ ∨ ψ → ∃x(ϕ ∨ ψ). tautologisch aus (3), (5). F¨ur die Umkehrung: (7)
ϕ → ∃xϕ
Substitutionsaxiom, daraus
(8)
ϕ ∨ ψ → ∃xϕ ∨ ψ
als tautologische Folgerung
(9) ∃x(ϕ ∨ ψ) → ∃xϕ ∨ ψ
mit ∃-Einf¨uhrung (x nicht frei in ϕ)
6.5.3 Umformungen mit der Implikation Falls x in ψ nicht frei vorkommt: (i)
` (∀xϕ → ψ) ↔ ∃x(ϕ → ψ)
(ii)
` (ψ → ∀xϕ) ↔ ∀x(ψ → ϕ)
(iii)
` (∃xϕ → ψ) ↔ ∀x(ϕ → ψ)
(iv)
` (ψ → ∃xϕ) ↔ ∃x(ψ → ϕ)
Diese Ergebnisse kann man auf die fr¨uheren zur¨uckf¨uhren, indem man die ¨ Aquivalenz (ϕ → ψ) ↔ (¬ϕ ∨ ψ) benutzt. Dadurch wird zugleich auch deutlich, warum in (i) und (iii) die Quantoren wechseln: die linke Seite des → erh¨alt bei der Umformung ein ¬-Zeichen! ¨ Die folgenden Aquivalenzen kann man sich als eine Art Assoziativgesetz merken, wenn man den ∃-Quantor als verallgemeinertes ∨, den ∀-Quantor als verallgemeinertes ∧ auffasst: Lemma (i)
` ∃x(ϕ ∨ ψ) ↔ ∃xϕ ∨ ∃xψ
(ii)
` ∀xϕ ∧ ∀xψ ↔ ∀x(ϕ ∧ ψ)
Die folgenden Ergebnisse gelten auch ohne Variablenbedingung, daf¨ur i. a. aber nur in jeweils einer Richtung:
¨ 6.5. P R ANEXE N ORMALFORMEN
126
Lemma ` ∀xϕ → ∃xϕ ` ∃x(ϕ ∧ ψ) → ∃xϕ ∧ ∃xψ ` (∀xϕ ∨ ∀xψ) → ∀x(ϕ ∨ ψ) ` (∃xϕ → ∃xψ) → ∃x(ϕ → ψ) ` ∀x(ϕ → ψ) → (∀xϕ → ∀xψ) Definition (pr¨anex) ϕ heißt offen gdw ϕ keine Quantoren enth¨alt, ϕ heißt pr¨anex gdw ϕ offen ist oder von der Form Q1 x1 . . . Qn xn ψ mit ψ offen, Qi ein Quantor (∃ oder ∀). Dabei heißt der Quantorenblock Q1 x1 . . . Qn xn das Pr¨afix von ϕ, ψ die Matrix von ϕ. ¨ Satz uber die pr¨anexe Normalform Zu jeder Formel ϕ (ausgedr¨uckt mit ¬, ∨, ∧, →, ↔, ∃, ∀) existiert eine pr¨anexe Formel ϕ p mit ` ϕ ↔ ϕ p. ϕ p heißt (eine) pr¨anexe Normalform von ϕ. Den Beweis f¨uhrt man durch Induktion u¨ ber den Aufbau der Formel ϕ. Wir wollen stattdessen skizzieren, wie man eine pr¨anexe Normalform konkret erh¨alt: Gegeben sei eine Formel ϕ, von der wir annehmen k¨onnen, dass sie außer den Quantoren nur die B OOLEschen Operationen ¬, ∨, ∧ enth¨alt. (1) Mit Hilfe von 6.5.1 und den entsprechenden aussagenlogischen Umformungen bringe man in ϕ das ¬-Zeichen so weit nach innen, bis es h¨ochstens vor atomaren Formeln steht; das Ergebnis ist eine a¨ quivalente Formel ϕ n (Negations-Normalform). (2) Bringe den in ϕ n am weitesten links stehenden Quantor (u. U. nach geeigneter Umbenennung) an den Anfang der Formel und erstrecke seinen
¨ 6.5. P R ANEXE N ORMALFORMEN
127
¨ Wirkungsbereich auf die ganze Formel; benutze dazu die folgenden Aquivalenzen (aus den vorhergehenden Lemmata): ∀vϕ(v) ∧ θ
∀vϕ(v) ∨ θ
↔ ∀v(ϕ(v) ∧ θ )
falls v nicht in θ
↔ ∀v(ϕ(v) ∧ θ 0 (v))
falls θ = ∀vθ 0 (v)
↔ ∀z(ϕ(z) ∧ θ )
mit geeignetem z
↔ ∀v(ϕ(v) ∨ θ )
falls v nicht in θ
↔ ∀z(ϕ(z) ∨ θ )
mit geeignetem z
Die Umbenennung der Variablen v in eine geeignete neue Variable z kann man nat¨urlich immer vornehmen; die vorhergehenden Umformungen sind - soweit m¨oglich - jedoch vorzuziehen, um die neue Formel nicht unn¨otig kompliziert zu machen. Auf a¨ hnliche Weise verfahre man im Falle eines ∃-Quantors. Damit erhalten wir eine zu ϕ n a¨ quivalente Formel ϕ 0 der Form Qvδ . Bringt man dann in gleicher Weise die in δ vorkommenden Quantoren “an den Anfang”, so erh¨alt man als Endergebnis eine pr¨anexe Formel ϕ p , die zu ϕ a¨ quivalent ist. Bemerkung: Wie im Falle der konjunktiven bzw. disjunktiven Normalform ist eine pr¨anexe Normalform niemals eindeutig bestimmt (trotzdem spricht man h¨aufig von der pr¨anexen Normalform, da zumindest alle untereinander a¨ quivalent sind). ¨ die Pr¨adikatenlogik 6.5.4 Das Dualit¨atsprinzip fur Wir setzen hier voraus, dass die Formeln (außer den Quantoren) wieder nur die B OOLEschen Operationen ¬, ∨, ∧ enthalten. Dann definiert man in Verallgemeinerung des aussagenlogischen Falles: D(ϕ) :
vertausche in ϕ ∨ mit ∧ und ∃ mit ∀ : duale Formel zu ϕ,
N(ϕ) :
setze vor jede atomare Formel in ϕ ein ¬-Zeichen,
∗
N (ϕ) :
setze vor jede atomare Formel in ϕ ein ¬-Zeichen, falls dort keines steht, sonst streiche es!
Beispiel: Es sei
ϕ = ∀x(P(x) → ∃yR(y, x)), d. h. nach Elimination von →: ϕ ↔ ∀x(¬P(x) ∨ ∃yR(y, x)).
¨ 6.5. P R ANEXE N ORMALFORMEN
128
Dann ist D(ϕ) = ∃x(¬P(x) ∧ ∀yR(y, x)) N(ϕ) = ∀x(¬¬P(x) ∨ ∃y¬R(y, x)) N ∗ (ϕ) = ∀x(P(x) ∨ ∃y¬R(y, x)) DN ∗ (ϕ) = ∃x(P(x) ∧ ∀y¬R(y, x))
¨ Ahnlich wie in der Aussagenlogik erh¨alt man (hier in syntaktischer Form): Satz a) ` ¬ϕ ↔ D(N ∗ (ϕ)) b) ` (ϕ ↔ ψ) ⇐⇒ ` (Dϕ ↔ Dψ)
Bildung der Negation Dualit¨atssatz
Beschr¨ankte Quantoren Man kann diese Ergebnisse auch auf beschr¨ankte Quantoren erweitern: Ist ϕ
= ∀x(P(x) → ψ(x)), d. h. ↔ ∀x(¬P(x) ∨ ψ(x)), so ist
¬ϕ ↔ ∃x(P(x) ∧ ¬ψ(x)). d. h. die beschr¨ankten Quantoren ∀x(P(x) → . . .) und
∃x(P(x) ∧ . . .)
sind dual zueinander. Besonders h¨aufig kommt ein derartiger Quantor in der Analysis vor als ∀ε > 0 ψ :↔ ∀ε (ε > 0 → ψ) Mit Hilfe des obigen Satzes lassen sich also Aussagen der folgenden Form leicht negieren: ¬∀x ∀ε > 0 ∃δ > 0 ψ ↔ ∃x ∃ε > 0 ∀δ > 0 ¬ψ.
6.6. DAS D EDUKTIONSTHEOREM
129
6.6 Das Deduktionstheorem Beim Beweisen steht man oft vor der folgenden Aufgabe: In einer Theorie T soll eine Implikation der Form ϕ → ψ gezeigt werden. Dazu benutzt man das folgende Argument: “Vorausgesetzt sei ϕ. Dann . . . (hier folgt der Beweis mit den zus¨atzlichen Annahmen aus T) . . . : ψ. Also haben wir T ` ϕ → ψ gezeigt.” Das Deduktionstheorem rechtfertigt dieses Argument, falls eine wichtige Einschr¨ankung beachtet wird: Deduktionstheorem T[σ ] sei die Theorie T mit σ als zus¨atzlichem Axiom und σ ein Satz. Dann gilt: T ` σ → ψ ⇐⇒ T[σ ] ` ψ Der Beweis von “⇒” ist trivial und macht nur vom modus ponens Gebrauch: Es gelte T ` σ → ψ, dann offensichtlich also auch T[σ ] ` σ → ψ. Da ferner T[σ ] ` σ , so mit modus ponens T[σ ] ` ψ. Der Teil “⇐” ist interessanter und auch weniger trivial: Beim Beweis von ψ aus T[σ ] k¨onnte das Zusatzaxiom σ an mehreren Stellen benutzt worden sein! Wir werden zeigen, dass man aus einem Beweis von ψ aus T[σ ] (mit leichten Modifikationen) einen Beweis von σ → ψ aus T erh¨alt, indem man im ersten Beweis jede Beweiszeile δ durch σ → δ ersetzt, wobei das Zusatzaxiom σ in die beweisbare Formel σ → σ u¨ bergeht und damit entbehrlich wird. Aufpassen muss man allerdings im Falle der ∃-Einf¨uhrungsregel, dass die Variablenbedingung nicht verletzt wird; die Voraussetzung, dass σ ein Satz ist, wird hier ben¨otigt (k¨onnte hier aber auch entsprechend abgeschw¨acht werden). Beweis von “⇐”: Wir zeigen T[σ ] ` ψ =⇒ T ` σ → ψ durch Induktion u¨ ber die L¨ange eines Beweises (d. h. Anzahl der Formeln im Beweis) von ψ: a) ψ ist Axiom von T[σ ]: dann ist entweder (i) ψ Axiom von T und damit T ` ψ, also auch T ` σ → ψ, oder (ii) ψ = σ und damit wegen T ` σ → σ auch T ` σ → ψ.
130
6.6. DAS D EDUKTIONSTHEOREM
b) ψ ist logisches Axiom. Dann gilt T ` ψ, also auch (als tautologische Folgerung) T ` σ → ψ. Damit haben wir den Induktionsanfang behandelt. Der Induktionsschluss (ψ ist Folgerung mittels einer Regel) l¨asst sich auch in 2 F¨alle aufgliedern: c) Es gibt Formeln ψ1 bzw. ψ1 und ψ2 , so dass ψ aus diesen mittels einer aussagenlogischen Regel folgt (und damit tautologisch folgt), wobei T[σ ] ` ψ1 und T[σ ] ` ψ2 . Nach Induktionsvorausetzung gilt ferner T ` σ → ψi f¨ur i = 1, 2 und damit als tautologische Folgerung auch T ` σ → ψ. d) ψ ist Folgerung aus ψ1 mittels der Regel der ∃-Einf¨uhrung, also ψ1 = δ1 → δ2 und ψ = ∃xδ1 → δ2 f¨ur Formeln δ1 , δ2 , wobei x in δ2 nicht frei vorkommt. Dann: (1)
T ` σ → (δ1 → δ2 )
nach Induktionsvoraussetzung
(2)
T ` δ1 → (σ → δ2 )
tautologisch (aus (1)
(3) T ` ∃xδ1 → (σ → δ2 )
mit ∃-Einf¨uhrung
(4) T ` σ → (∃xδ1 → δ2 )
tautologisch aus (3), also
(5)
T`σ →ψ
Dabei war die ∃-Einf¨uhrung in (3) erlaubt, denn x kommt nach Voraussetzung in δ2 nicht frei vor, aber auch nicht frei in σ (da nach Annahme σ ein Satz ist), also kommt x in σ → δ2 nicht frei vor. Korollar T sei eine Theorie der Sprache L, γ1 , . . . , γn seien L -S¨atze und ψ eine L-Formel. Dann gilt: T ` γ1 ∧ . . . ∧ γn → ψ ⇐⇒ T[γ1 , . . . , γn ] ` ψ Bemerkungen 1. Dass das Deduktionstheorem nicht f¨ur beliebige Formeln gilt, zeigt das Beispiel ϕ = (x = y), wobei A |= ∀x∀y ϕ ⇐⇒ |A| hat genau ein Element: Es ist T[x = y] ` ∀x∀y(x = y), aber T 6` x = y → ∀x∀y(x = y), wenn T ein Modell mit mindestens zwei Elementen hat.
6.7. E RWEITERUNGEN VON T HEORIEN , W IDERSPRUCHSFREIHEIT
131
2. Aus dem Beweis ergibt sich, dass σ auch eine Formel sein kann, vorausgesetzt, dass beim Beweis von ψ aus T[σ ] die ∃-Einf¨uhrungsregel nicht f¨ur eine Variable benutzt wurde, die in σ frei vorkommt. Ansonsten l¨asst sich das Deduktionstheorem f¨ur eine Formel ϕ auch in der Form T ` ϕ ∀ → ψ ⇐⇒ T[ϕ] ` ψ umformulieren, wobei ϕ ∀ der universelle Abschluss von ϕ ist. 3. Falls T ` ψ, so existieren nach dem Endlichkeitssatz f¨ur die Beweisbarkeit endlich viele ϕ1 , . . . , ϕn in T mit ϕ1 , . . . , ϕn ` ψ; sind die Axiome ϕ1 , . . . , ϕn S¨atze (man kann sie anderenfalls wegen des Abschluss-Satzes durch ihre universellen Abschl¨usse ersetzen), so gilt also ` ϕ1 ∧ . . . ∧ ϕn → ψ. Damit l¨asst sich die Beweisbarkeit in einer Theorie (prinzipiell) auf logische Beweisbarkeit zur¨uckf¨uhren; ist ein konkreter Beweis von ψ aus T gegeben, so lassen sich aus diesem Beweis die S¨atze ϕ1 , . . . , ϕn in T mit ϕ1 ∧ . . . ∧ ϕn ` ψ auch konkret angeben, nicht notwendig aber, wenn man nur von der Beweisbarkeit ausgeht!
6.7 Erweiterungen von Theorien, Widerspruchsfreiheit Theorien erweitert man oft durch Hinzunahme neuer Axiome (z. B. des Kommutativgesetzes zu den Gruppenaxiomen oder der Negation des Parallelenaxioms zur “Absoluten” Geometrie), manchmal wird dabei auch noch die Sprache erweitert (Gruppentheorie → K¨orpertheorie → Theorie der angeordneten K¨orper). 6.7.1 Erweiterungen und Expansionen a) Eine Sprache L0 heißt Erweiterung der Sprache L (L ⊆ L0 ) gdw. jedes (nicht-logische) Symbol von L auch Symbol von L0 ist (also jede L-Formel auch eine L0 -Formel ist). b) Eine Theorie T0 der Sprache L0 heißt Erweiterung der Theorie T der Sprache L (T ⊆ T0 ) gdw (i) L0 Erweiterung der Sprache L ist und (ii) f¨ur alle Formeln ϕ der Sprache L: T ` ϕ ⇒ T0 ` ϕ.
132
6.7. E RWEITERUNGEN VON T HEORIEN , W IDERSPRUCHSFREIHEIT
¨ c) Gilt in (ii) sogar die Aquivalenz, also (zus¨atzlich zu (i)) (iii) f¨ur alle Formeln ϕ der Sprache L: T ` ϕ ⇐⇒ T0 ` ϕ, so heißt T0 konservative Erweiterung von T. H¨aufig erweitert man eine Theorie T durch Definitionen: F¨uhrt man f¨ur eine Formel ϕ(~x) ein neues Relationszeichen R ein, so bedeutet dies, dass man T zu einer Theorie T0 erweitert, die als neues Axiom erh¨alt: R(~x) ↔ ϕ(~x). Ebenso bei der Einf¨uhrung neuer Funktionszeichen: Hier muss man zun¨achst nachweisen, dass T ` ∀~x ∃!y ϕ(~x, y), worauf man durch f (~x) = y ↔ ϕ(~x, y) die Theorie T um das neue Funktionszeichen f mit obigem Axiom erweitert. In beiden F¨allen ist die neue Theorie eine konservative Erweiterung der alten Theorie T. d) Falls T ⊆ T0 und T0 ⊆ T , so heißt T a¨ quivalent zu T0 (und dann wird oft T mit T0 identifiziert, da sie sich in diesem Fall (m¨oglicherweise) nur durch ihre Axiomatisierung, nicht aber in ihren Konsequenzen voneinander unterscheiden). Insbesondere unterscheiden wir nicht zwischen einer Theorie T und ihrer Folgerungsmenge C(T) := {σ | T ` σ }. Mit Hilfe des Vollst¨andigkeitssatzes werden wir sp¨ater zeigen, dass Theorien genau dann a¨ quivalent sind, wenn sie dieselben Modelle haben. Beachte, dass a¨ quivalente Theorien in derselben Sprache formuliert sind und dass eine konservative Erweiterung T0 von T zwar nur dieselben Aussagen der (kleineren) Sprache von T abzuleiten gestattet, dar¨uber hinaus jedoch m¨oglicherweise weitere Aussagen u¨ ber die erweiterte Sprache zul¨asst. e) Ist L ⊆ L0 , A eine L-Struktur und A0 eine L0 -Struktur, so heißt A0 Expansion von A : ⇐⇒ |A| = |A0 | und sA = sA logischen Symbole s von L.
0
f¨ur alle nicht-
Man schreibt dann auch A = A0 L und nennt umgekehrt A auch die Einschr¨ankung oder das Redukt von A0 auf die Sprache L.
6.7. E RWEITERUNGEN VON T HEORIEN , W IDERSPRUCHSFREIHEIT
133
So ist z. B. ein K¨orper (K, +, ·, 0, 1) eine Expansion der additiven Gruppe (K, +, 0) des K¨orpers. Eine Erweiterung einer Theorie T der Sprache L zu einer Theorie T0 der Sprache L0 kann dadurch erfolgen, dass nur die Sprache erweitert wird, aber keine weiteren nicht-logischen Axiome hinzukommen (T0 heißt dann rein sprachliche ¨ Erweiterung von T) oder es k¨onnen (wie beim Ubergang von der Gruppen- zur K¨orpertheorie) noch weitere nicht-logische Axiome hinzukommen. Wir behandeln zun¨achst den ersten Fall: ¨ 6.7.2 Satz uber rein sprachliche Erweiterungen von Theorien T und T0 seien Theorien der Sprache L bzw. L0 , wobei L ⊆ L0 . Haben T und T0 dieselben Axiome, so ist T0 konservative Erweiterung von T: f¨ur alle Formeln ϕ von L gilt: T ` ϕ ⇐⇒ T0 ` ϕ. Vorbemerkung: Der Teil der Behauptung von links nach rechts ist trivial (da jedes Axiom von T auch Axiom von T0 ist, ist jeder Beweis von ϕ aus T auch ein Beweis von ϕ aus T0 ), aber die Umkehrung ist keineswegs trivial, da ein Beweis von ϕ aus T0 logische Axiome (bzw. Regeln) f¨ur Formeln der erweiterten Sprache benutzen kann (auch wenn die zus¨atzlichen Symbole der Sprache L0 in ϕ selbst nicht mehr vorkommen). Ein semantischer Beweis (mit |= statt ` ) ist jedoch einfach: ist A0 |= T0 , so ist die Einschr¨ankung A = A0 L ein Modell von T. Beweis des Satzes: In einer Formel ψ der (gr¨oßeren) Sprache L0 streichen wir die nicht zu L geh¨origen Symbole und ersetzen sie in harmloser Weise mittels einer Variablen y : Es sei ψy die Formel der Sprache L , die aus ψ entsteht, indem in ψ Rt1 . . .tn (falls R nicht in L) durch y = y, Ft1 . . .tm (falls F nicht in L) durch y, c
(falls c nicht in L) durch y ersetzt wird.
Wir zeigen nun f¨ur alle Formeln ψ der Sprache L0 : (*) f¨ur alle Variablen y bis auf endlich-viele Ausnahmen gilt T0 ` ψ ⇒ T ` ψy . Da f¨ur Formeln ψ in L offenbar ψy = ψ ist, so folgt hieraus dann die Behauptung. Die Aussage (*) beweisen wir durch Induktion u¨ ber die L¨ange eines Beweises von T0 ` ψ:
6.7. E RWEITERUNGEN VON T HEORIEN , W IDERSPRUCHSFREIHEIT
134
1. ψ ist nicht-logisches Axiom von T0 . Dann ist ψ auch (nicht-logisches) Axiom von T, also T ` ψ und dann auch T ` ψy f¨ur alle Variablen y (da hier ψy = ψ). 2. ψ ist logisches Axiom von T0 . 2.1 ψ = ¬θ ∨ θ . Dann ist ψy = ¬θy ∨ θy f¨ur jedes y und T ` ψy f¨ur alle Variablen y. 2.2 ψ = θ [t/x] → ∃xθ . Dann ist ψy = θy [t0 /x] → ∃xθy f¨ur alle y, die in θ nicht vorkommen und f¨ur einen Term t0 von L. Somit T ` ψy f¨ur alle Variablen y bis auf endlich-viele. 2.3 ψ = (x = x). Dann ist ψy = (x = x). 2.4 ψ ist eines der Gleichheitsaxiome. Dann ist ψy = ψ oder von der Form θ → y = y, jedenfalls T ` ψy f¨ur alle Variablen y. 3. (Induktionsschritt): ψ ist Konklusion einer Regel mit den Pr¨amissen ψ1 . . . ψn (n = 1, 2), wobei nach Induktionsvoraussetzung T ` (ψi )y f¨ur i ≤ n und alle Variablen y bis auf endlich-viele gilt. 3.1 Im Falle einer aussagenlogischen Regel ist ψ tautologische Folgerung aus ψ1 , . . . , ψn , dann ist aber auch ψy tautologische Folgerung aus (ψ1 )y , . . . , (ψn )y und somit T ` ψy . 3.2 Im Falle der vorderen Partikularisierung ist n = 1 und ψ = ∃xϕ → θ und ψ1 = ∃xϕ → θ mit x nicht frei in θ . Dann ist ψy = ∃xϕy → θ und (ψ1 )y = ϕy → θ mit x nicht frei in θ f¨ur y 6= x. Also T ` ψy f¨ur jedes y 6= x mit T ` (ψ1 )y und damit T ` ψy f¨ur alle y bis auf endlich-viele. Das folgende Korollar haben wir einfacher schon in der modelltheoretischen Fassung (3.1.1) erhalten: Korollar T sei eine Theorie der Sprache L, c eine neue Konstante, die in L nicht vorkommt. Dann gilt:
6.7. E RWEITERUNGEN VON T HEORIEN , W IDERSPRUCHSFREIHEIT
T ` ϕ[c/x] ⇐⇒ T ` ∀xϕ.
135
Hier haben wir erneut ein bekanntes Beweisprinzip (vgl. Satz u¨ ber die Generalisierung) erhalten: Um aus den Axiomen einer Theorie T eine Aussage ∀xϕ(x) zu bewiesen, gen¨ugt es, die Aussage ϕ(c) f¨ur eine geeignete Konstante c (ein “beliebiges, aber festes” c) herzuleiten. Im Rahmen der Aussagenlogik hatten wir bereits fr¨uher die Widerspruchsfreiheit einer Aussagenmenge formuliert, entsprechend definieren wir im Falle der Pr¨adikatenlogik: 6.7.3 Widerspruchsfrei/widerspruchsvoll T konsistent :
⇐⇒
es gibt einen Satz σ der Sprache von T mit: T 6` σ ,
T inkonsistent :
⇐⇒
f¨ur alle S¨atze σ der Sprache von T gilt: T ` σ .
Diese Definition (statt konsistent sagt man auch widerspruchsfrei, statt inkonsistent auch widerspruchsvoll) hat den Vorzug, dass sie auch f¨ur Sprachen ohne ¨ das ¬-Zeichen sinnvoll ist; hier ergibt sich f¨ur unsere Sprachen die Aquivalenz mit der erwarteten Charakterisierung: Lemma T konsistent ⇐⇒ es gibt keinen Satz σ mit T ` σ und T ` ¬σ . Beweis von “⇒”: Falls T ` σ und T ` ¬σ f¨ur einen Satz σ , so nach dem Tautologiesatz T ` σ ∧ ¬σ und somit T ` ψ f¨ur alle S¨atze ψ. “⇐”: W¨ahle f¨ur σ den Satz ∀x(x = x); dann gilt T ` σ , also nach Vor. T 6` ¬σ , und damit ist mindestens ein Satz aus T nicht beweisbar. Bemerkungen 1. Ist T0 Erweiterung von T und ist T0 konsistent, so auch T. 2. Ist T0 konservative Erweiterung von T, so gilt: T konsistent gdw T0 konsistent.
6.7. E RWEITERUNGEN VON T HEORIEN , W IDERSPRUCHSFREIHEIT
136
Nimmt man zu einer Theorie T eine Menge Γ Formeln (als zus¨atzliche Axiome) hinzu, so ist die entstehende Erweiterung T[Γ] widerspruchsvoll, wenn endlich-viele der neuen Axiome einen Widerspruch zur Theorie T ergeben. Da man hier endlich-viele Axiome durch ihre Konjunktion ersetzen kann, gen¨ugt der folgende Satz: 6.7.4 Beweisbarkeit und Widerspruchsfreiheit Ist ϕ ∗ der universelle Abschluss von ϕ, so gilt: T ` ϕ ⇐⇒ T[¬ϕ ∗ ] widerspruchsvoll, T 0 ϕ ⇐⇒ T[¬ϕ ∗ ] widerspruchsfrei. Beweis von “⇒”: Falls T ` ϕ, so auch T ` ϕ ∗ und damit erst recht T[¬ϕ ∗ ] ` ϕ ∗ . Andererseits gilt aber nat¨urlich auch T[¬ϕ ∗ ] ` ¬ϕ ∗ . Somit ist T[¬ϕ ∗ ] widerspruchsvoll. “⇐”: Es sei T[¬ϕ ∗ ] widerspruchsvoll. Dann ist alles beweisbar, insbesondere T[¬ϕ ∗ ] ` ϕ ∗ . Nach dem Deduktionstheorem: T ` ¬ϕ ∗ → ϕ ∗ , also T ` ϕ ∗ und damit auch T ` ϕ. Damit kann die Beweisbarkeit eines Satzes auf die Widerspruchsfreiheit einer geeignet erweiterten Theorie zur¨uckgef¨uhrt werden: T 0 σ ⇐⇒ T[¬σ ] ist widerspruchsfrei Schon im Rahmen der Aussagenlogik haben wir bemerkt, dass auch der Folgerungsbegriff sich auf den entsprechenden Erf¨ullbarkeitsbegriff zur¨uckf¨uhren l¨asst: T 6|= σ ⇐⇒ T[¬σ ] ist erf¨ullbar Wie im Falle der Aussagenlogik k¨onnen wir den Vollst¨andigkeitssatz damit auf den Modellexistenz-Satz zur¨uckf¨uhren: Jede widerspruchsfreie Theorie T ist erf¨ullbar. Tats¨achlich ist diese Aussage a¨ quivalent zum Vollst¨andigkeitssatz; beide stellen einen Zusammenhang zwischen einem syntaktischen Begriff (beweisbar, widerspruchsfrei) und einem semantischen Begriff (folgt aus, erf¨ullbar) her. Der Modellexistenzsatz erscheint hier nur in seiner einfachsten Form; in der Modelltheorie werden allgemeinere Fassungen dieses Satzes behandelt, in denen aus syntaktischen Eigenschaften einer formalen Theorie Aussagen u¨ ber semantische Eigenschaften m¨oglicher Modelle gemacht werden.
137
6.8. T ERMMODELLE
6.8 Termmodelle T sei eine Theorie der Sprache L. Um ein Modell A von T zu finden, muss man wenigstens den Individuenkonstanten der Sprache Werte zuordnen; unter g¨unstigen Voraussetzungen erh¨alt man dann durch geeignete Festlegungen der Interpretation der Relations- und Funktionssymbole bereits ein Modell. So findet man z. B. im Falle der Gruppentheorie (und a¨ hnlich im Falle der Theorie der K¨orper) das einfachste Modell: W¨ahle ein Element e als (Interpretation des) neutrales Element(es) und setze e ◦ e = e, e−1 = e : G = ({e}, ◦,−1 , e) ist eine Gruppe! Diesen Ansatz wollen wir weiterverfolgen: 6.8.1 Kanonische Struktur einer Theorie, Termstruktur Die Elemente von eines Modell A einer Theorie T m¨ussen mindestens Interpretationen der konstanten Terme als Elemente enthalten. Daher definieren wir: K := {t | t konstanter (d. h. variablenfreier) L-Term}. Zus¨atzlich ist zu beachten ist, dass aus den Axiomen der Theorie T folgen kann, dass verschiedene Terme gleichgesetzt werden sollen (z. B. 0 + 1 = 1 + (0 · 1) in der K¨orpertheorie). Daher werden wir Terme identifizieren, wenn die Theorie es verlangt: s ∼ t : ⇐⇒ T ` s = t
f¨ur s,t ∈ K.
¨ Diese Relation ist (wegen der Gleichheitsaxiome!) eine Aquivalenzrelation auf K, ¨ s := {t ∈ K | s ∼ t} zugeh¨orige Aquivalenzklasse. ¨ A := {s | s ∈ K} Menge der Aquivalenzklassen wird der Individuenbereich der gesuchten Struktur sein, in dem t A = t f¨ur alle t ∈ K gelten wird. Dazu legen wir die Interpretation der weiteren nicht-logischen Zeichen wie folgt fest: cA
=
c
F A (t1 , . . . ,tm )
=
F(t1 , . . . ,tm )
RA (t1 , . . . ,tn )
⇐⇒
T ` R(t1 , . . . ,tn )
138
6.8. T ERMMODELLE
Dass diese Definitionen “wohldefiniert” sind (d. h. nicht von der Wahl der ¨ Repr¨asentanten der jeweiligen Aquivalenzklassen abh¨angen), folgt wiederum aus den Gleichheitsaxiomen (Prinzip der Nichtunterscheidbarkeit, s. 6.4.2). Damit ist (f¨ur K 6= 0/ ) nun eine L-Struktur A = AT = (A, RA , . . . F A , . . . cA , . . .) definiert, die kanonische Struktur der Theorie T. Eine Struktur bzw. ein Modell, dessen Elemente Interpretationen von konstanten Termen sind (wie die obige kanonische Struktur) nennt man auch eine Termstruktur bzw. ein Term-Modell. ¨ 6.8.2 Satz uber Termmodelle F¨ur alle atomaren S¨atze σ gilt: (∗) AT |= σ ⇐⇒ T ` σ . Beweis: Zeige zun¨achst durch Induktion u¨ ber den Termaufbau: (1) t A = t f¨ur alle t ∈ K. (*) beweist man dann durch Induktion u¨ ber die Formell¨ange: (2) Ist σ = R(t1 , . . . ,tn ), so AT |= σ ⇐⇒
RA (t1A , . . . ,tnA )
nach Def. von |=
⇐⇒
RA (t1 , . . . ,tn )
nach(1)
⇐⇒
T ` R(t1 , . . . ,tn ) nach Def. von RA
(3) Ist σ der Satz s = t, so AT |= σ ⇐⇒ ⇐⇒ ⇐⇒
sA = t A s=t
nach Def. von |= nach (1)
T ` s = t nach Def. von t
K¨onnten wir die Aussage (*) f¨ur alle S¨atze zeigen, so w¨are die Struktur AT ein Modell von T. Im allgemeinen gilt dies aber nicht, T kann zwar widerspruchsfrei sein, aber m¨oglicherweise zu wenig Information enthalten: Um den Induktionsbeweis weiterf¨uhren zu k¨onnen, m¨usste gelten:
¨ 6.9. V ERVOLLST ANDIGUNG VON T HEORIEN
139
(a) analog zu AT |= ¬σ
⇐⇒
AT 6|= σ :
T ` ¬σ
⇐⇒
T 6` σ ,
(b) analog zu AT |= ∃xϕ
⇐⇒
es ex. ein t ∈ K mit AT |= ϕ[t/x] :
T ` ∃xϕ
⇐⇒
es ex. ein t ∈ K mit T ` ϕ(t).
Die Eigenschaft (a) charakterisiert gerade die konsistenten und (syntaktisch) vollst¨andigen Theorien, dagegen erf¨ullen Henkin-Theorien die Eigenschaft (b). Wir werden zeigen, dass man beide Eigenschaften durch eine geeignete Erweiterung von T erhalten kann.
6.9 Vervollst¨andigung von Theorien Wie im Falle der Aussagenlogik nennen wir eine Theorie T der Sprache L (syntaktisch) vollst¨andig gdw f¨ur jeden L-Satz σ gilt: T ` σ oder T ` ¬σ . Da T konsistent ist gdw nicht zugleich T ` σ und T ` ¬σ gelten, so ist T konsistent und (syntaktisch) vollst¨andig gdw f¨ur jeden L-Satz σ gilt: entweder T ` σ oder T ` ¬σ . Der Vollst¨andigkeitsbegriff im semantischen Sinne (f¨ur jeden L-Satz σ gilt: T |= σ oder T |= ¬σ ) wird mit obigem u¨ bereinstimmen, sobald wir den Vollst¨andigkeitssatz bewiesen haben. Solange soll vollst¨andig hier im syntaktischen Sinne gemeint sein (und besser durch den a¨ quivalenten Begriff maximal konsistent ersetzt werden). Daneben haben wir noch den Begriff des vollst¨andigen Axiomensystems; dieser ist von den Begriffen der vollst¨andigen Theorie streng zu unterscheiden. Daher beachte man: Der Vollst¨andigkeitssatz f¨ur die Pr¨adikatenlogik besagt nicht, dass jede Theorie vollst¨andig ist!
¨ 6.9. V ERVOLLST ANDIGUNG VON T HEORIEN
140
Die Vollst¨andigkeit eines Axiomensystems f¨ur die Logik bedeutet, dass es gen¨ugend Axiome und Regeln enth¨alt, um alle wahren S¨atze zu beweisen; bez¨uglich der Folgerungsbeziehung besagt der Vollst¨andigkeitssatz, dass alle S¨atze, die in allen Modellen einer Theorie T gelten, aus T mit den Axiomen und Regeln des Axiomensystems beweisbar sind. Daraus folgt keineswegs, dass alle Theorien vollst¨andig sind, h¨aufig sollen sie sogar unvollst¨andig sein, um m¨oglichst viele Modelle mit sehr unterschiedlichen Eigenschaften zuzulassen (wie die algebraische Theorien der Gruppen, Ringe oder K¨orper). F¨ur den Beweis des Vollst¨andigkeitssatzes der Pr¨adikatenlogik ben¨otigen wir allerdings den Begriff der vollst¨andigen Theorie und die M¨oglichkeit, eine beliebige konsistente Theorie zu einer maximal konsistenten Theorie zu erweitern. 6.9.1 Satz von Lindenbaum T sei eine konsistente Theorie der abz¨ahlbaren Sprache L. Dann existiert eine maximal konsistente Erweiterung TV von T in derselben Sprache L. Beweis: Da die Sprache L abz¨ahlbar ist, existiert eine Aufz¨ahlung (σn |n ∈ N) aller L-S¨atze. Setze (rekursiv) ( Tn , falls Tn ` σn , T0 = T und Tn+1 = Tn [¬σn ] sonst. Schließlich sei
TV :=
S
n∈N Tn .
Da nach Konstruktion von Tn+1 gilt: Tn ` σn oder Tn+1 ` ¬σn , so auch TV ` σn oder TV ` ¬σn , und damit ist TV eine vollst¨andige Theorie. Zum Beweis der Konsistenz von TV zeigt man durch Induktion, dass alle Tn konsistent sind: Ist Tn widerspruchsfrei, so auch Tn+1 , wobei man im “sonst”-Fall 6.7.4 benutzt). Die Widerspruchsfreiheit von TV folgt dann aus dem Endlichkeitssatz f¨ur die Beweisbarkeit. Bemerkungen • Der Beweis des Satzes von L INDENBAUM zeigt, dass die Existenz einer Vervollst¨andigung von der Wahl der Aufz¨ahlung der S¨atze der Sprache abh¨angt; i. a. hat eine (konsistente aber selbst nicht vollst¨andige) Theorie sehr viele Vervollst¨andigungen!
141
6.10. H ENKIN -T HEORIEN
• T ist konsistent und vollst¨andig gdw C(T) := {σ | T ` σ } (die Menge aller Folgerungen aus T) eine maximale konsistente Theorie ist. • Um den Satz von L INDENBAUM f¨ur beliebige Sprachen zu beweisen, muss man also zeigen, dass sich jede konsistente Theorie zu einer maximalen konsistenten Theorie erweitern l¨asst. Dazu ben¨otigt man (zumindest im Fall u¨ berabz¨ahlbarer Sprachen) das Auswahlaxiom, etwa in Form des Z ORNschen Lemmas (s. 3.5.4).
6.10 Henkin-Theorien Wir behandeln jetzt Theorien, in denen der Existenzquantor in S¨atzen eliminiert werden kann, und zwar durch eine Konstante als Beispiel: Definition einer Henkin-Theorie Eine Theorie T der Sprache L heißt Henkin-Theorie gdw f¨ur jeden L-Satz der Form σ = ∃xϕ gilt: Es gibt einen konstanten Term t der Sprache L mit T ` ∃xϕ → ϕ(t) und somit T ` ∃xϕ ↔ ϕ(t). A sei L-Struktur mit Individuenbereich A. Bereits fr¨uher haben wir die Sprache LA eingef¨uhrt, die zus¨atzliche Namen a f¨ur jedes Element a ∈ A enth¨alt. In der Struktur AA wird a durch a selbst interpretiert, und mit DL (A) = Th(AA ) = {σ | AA |= σ , σ LA -Satz} haben wir das elementare Diagramm von A bezeichnet. Beispiele (i) Th(A) und DL (A) sind stets konsistente und vollst¨andige Theorien, letztere ist offenbar eine H ENKIN-Theorie. Als Folgerung aus dem Vollst¨andigkeitssatz wird sich ergeben, dass umgekehrt jede konsistente und vollst¨andige Theorie von der Form Th(A) ist f¨ur ein A. (ii) Konkrete Beispiele sind
142
6.10. H ENKIN -T HEORIEN
• die Theorie der dichten linearen Ordnung ohne Endpunkte: konsistent und vollst¨andig (s. 4.1.2), aber (in der Sprache allein mit <-Zeichen) keine H ENKIN-Theorie, • die Gruppentheorie ist konsistent, aber unvollst¨andig: Das Kommutativgesetz ∀x∀y(x ◦ y = y ◦ x) ist weder beweisbar noch widerlegbar, aber auch die Theorie der A BELschen Gruppen ist offenbar noch unvollst¨andig. ¨ • Die P EANO-Arithmetik PA ist unvollst¨andig (G ODEL scher Unvollst¨andigkeitssatz). • Dagegen ist die Theorie des Standardmodells von PA, Th(N,0 , 0), eine vollst¨andige H ENKIN-Theorie. Eine H ENKIN-Theorie muss zu jedem Existenzsatz einen konstanten Term als Beispiel besitzen, i. a. besitzen nat¨urlich vorgegebene Theorien nicht gen¨ugend derartige Beispiele. Man kann jedoch durch Hinzunahme gen¨ugend vieler Konstanten eine Theorie zu einer H ENKIN-Theorie erweitern: 6.10.1 Henkin-Erweiterungen Es sei T eine Theorie der Sprache L. W¨ahle f¨ur jeden L-Satz der Form σ = ∃xψ eine neue (d. h. in der Sprache L bisher nicht vorkommende) Konstante cσ und bilde die erweiterte Sprache L∗ := L ∪ {cσ | σ L-Satz der Form ∃xψ}, T∗ := T[Γ] mit den HENKIN-Axiomen in der Sprache L∗ : Γ := {∃xψ(x) → ψ(cσ ) | σ L-Satz der Form ∃xψ}. T∗ braucht aber noch keine H ENKIN-Theorie zu sein, da man mit Hilfe der neuen Konstanten m¨oglicherweise neue Existenzs¨atze finden kann, f¨ur die keine Beispiele in der Sprache L∗ vorhanden sind. Man muss daher diesen Prozess unendlich oft iterieren: Setze L0 = L ,
T0 = T
Theorie der Sprache L
Ln+1 = L∗n , Tn+1 = T∗n Theorie der Sprache Ln+1 . Schließlich sei S LH = n∈N Ln ,
TH =
S
n∈N Tn
die Henkin-Erweiterung der Theorie T.
143
6.10. H ENKIN -T HEORIEN
¨ Satz uber Henkin-Erweiterungen (i) TH ist eine H ENKIN-Theorie, (ii) TH ist eine konservative Erweiterung von T, (iii) ist die Sprache L abz¨ahlbar, so auch die Sprache LH . Beweis: (i) und (iii) sind klar (Abz¨ahlbarkeit einer Sprache bedeutet, dass die Menge der Symbole der Sprache abz¨ahlbar ist). Zum Beweis von (ii) sei T0 die Theorie der Sprache LH mit denselben nicht-logischen Axiomen wie T. Dann ist T0 eine rein sprachliche Erweiterung von T und somit konservative Erweiterung von T. Wir zeigen nun die Behauptung, indem wir nachweisen: (+) ist ϕ Formel der Sprache L und gilt TH ` ϕ, so auch T0 ` ϕ. Sei also ϕ L-Formel mit TH ` ϕ. Dann gibt es endlich viele S¨atze der Form σi = ∃xψi (x) → ψi (ci ) mit ci = c∃xψi (i = 1, . . . , n), so dass T0 ` σ1 ∧ . . . ∧ σn → ϕ. Wir zeigen T0 ` ϕ durch Induktion nach n: Jeder Satz σi ist ein Satz der Sprache Lmi f¨ur ein mi , wobei wir annehmen k¨onnen, dass m1 ≥ m2 , . . . , mn . Das bedeutet dann insbesondere, dass die Konstante c1 in den S¨atzen σ2 , . . . , σn und damit auch in den Formeln ψ1 , . . . , ψn , ϕ nicht vorkommt. Also existiert eine Variable y, die nicht in diesen Formeln vorkommt, mit (s. Beweis von 6.7.2) T0 ` (∃xψ1 (x) → ψ1 (y)) ∧ σ2 ∧ . . . ∧ σn → ϕ. T0 ` (∃xψ1 (x) → ψ1 (y)) → (σ2 ∧ . . . ∧ σn → ϕ) T0 ` ∃y(∃xψ1 (x) → ψ1 (y)) → (σ2 ∧ . . . ∧ σn → ϕ). ` ∃y(∃xψ1 (x) → ψ1 (y)), 0 T ` σ2 ∧ . . . ∧ σn → ϕ.
Dann: und mit ∃-Einf¨uhrung Nun gilt aber und somit haben wir
¨ Ahnlich (bzw. nach Ind.vor.) kann man die u¨ brigen Pr¨amissen eliminieren und erh¨alt schließlich T0 ` ϕ.
¨ ¨ 6.11. D ER G ODELSCHE VOLLST ANDIGKEITSSATZ
144
6.11 Der G¨odelsche Vollst¨andigkeitssatz ¨ Dieser Satz wurde zuerst von Kurt G ODEL f¨ur abz¨ahlbare Sprachen bewiesen: G¨odel, Kurt Die Vollst¨andigkeit der Axiome des logischen Funktionenkalk¨uls. Monatshefte Math. Phys. 37 (1930), 349-360. und f¨ur beliebige Sprachen 1936 von I. M ALCEV. Unsere Beweismethode geht zur¨uck auf Henkin, Leon The completeness of the first-order functional calculus. Journal of Symbolic Logic 14 (1949), 159 - 166, s.a.: Henkin, Leon The discovery of my completeness proof. Bull. Journal of Symbolic Logic 2,2 (1996), 127 - 158, Leblanc-Roeper-Than-Weaver Henkin´s completeness proof: Forty years later. Notre Dame Journal of Formal Logic 32 (1991), 212 - 232. Die H ENKINsche Methode hat den Vorzug, dass man sie vielf¨altig abwandeln kann, um - in Abh¨angigkeit von speziellen Eigenschaften einer Theorie T - Modelle von T mit besonderen Eigenschaften zu erhalten. Wie schon erw¨ahnt, l¨asst sich der Vollst¨andigkeitssatz in zwei a¨ quivalenten Fassungen angeben: 6.11.1 Vollst¨andigkeit der Pr¨adikatenlogik / Modellexistenz-Satz (1)
T |= σ =⇒ T ` σ ,
(2) T konsistent =⇒ T erf¨ullbar. Beweis: Wie im Falle der Aussagenlogik (siehe auch 6.7.4) folgt (1) aus (2) (die Umkehrung ist noch einfacher zu zeigen), so dass wir nur (2) zu beweisen brauchen. Sei also T eine konsistente Theorie der Sprache L. Wir erweitern T zun¨achst zu einer H ENKIN-Theorie TH in der Sprache L0 := LH und bilden dann eine Vervollst¨andigung dieser Theorie: T ⊆ TH ⊆ (TH )V = T0
¨ ¨ 6.11. D ER G ODELSCHE VOLLST ANDIGKEITSSATZ
145
Da beim zweiten Schritt die Sprache nicht mehr erweitert wird, ist T0 nicht nur vollst¨andig und konsistent, sondern auch eine H ENKIN-Theorie geblieben. Nun w¨ahlen wir das Termmodell A0 von T0 und zeigen, dass f¨ur alle S¨atze σ der Sprache L0 gilt: (∗) A0 |= σ ⇐⇒ T0 ` σ . Insbesondere ist dann A0 ein Modell von T und damit A := A0 L, die Einschr¨ankung auf die Sprache L, ein Modell von T. Die Behauptung (*) zeigen wir durch Induktion u¨ ber den Aufbau von σ : 1. Fall: σ ist atomar. Dieser Anfangsfall ist gerade Inhalt des Satzes 6.8.2 u¨ ber Termmodelle. 2. Fall: σ = ¬ψ. Dann gilt nach Definition von |=: A0 |= ¬ψ ⇐⇒ A0 6|= ψ und entsprechend T0 ` ¬ψ ⇐⇒ T0 6` ψ, wegen der Vollst¨andigkeit und Konsistenz von T0 . Somit folgt die Behauptung aus der Induktionsvoraussetzung. 3. Fall: σ = ψ ∨ θ . Dann gilt wieder nach der Definition von |=: A0 |= ψ ∨ θ ⇐⇒ A0 |= ψ oder A0 |= θ und entsprechend (∗∗) T0 ` ψ ∨ θ ⇐⇒ T0 ` ψ oder T0 ` θ , denn in (**) gilt “⇒” mittels aussagenlogischer Abschw¨achung. F¨ur den Beweis von “⇐” nehmen wir an, dass T0 ` ψ
oder T0 ` θ
nicht gilt, also
T0 6` ψ
und T0 6` θ
und somit
0
T ` ¬ψ
und T0 ` ¬θ
wegen der Vollst¨andigkeit von T0 . Dann gilt aber als tautologische Folgerung: T0 ` ¬(ψ ∨ θ ), und das heißt T0 6` ψ ∨ θ wegen der Konsistenz von T0 . 4. Fall: σ = ∃xψ. Dann gilt wieder nach der Definition von |=: A0 |= ∃xψ ⇐⇒ es ex. ein a ∈ |A0 | mit A0 |= ψ[a]. Da A0 ein Termmodell ist, so ist jedes a ∈ |A0 | von der Form a = t = t A f¨ur einen konstanten Term t, also: 0
¨ ¨ 6.11. D ER G ODELSCHE VOLLST ANDIGKEITSSATZ
146
A0 |= ∃xψ ⇐⇒ es ex. ein t ∈ K mit A0 |= ψ[t/x]. Entsprechend gilt, da T0 H ENKIN-Theorie ist: T0 ` ∃xψ ⇐⇒ es ex. ein t ∈ K mit T0 ` ψ(t). Somit folgt die Behauptung auch in diesem Fall aus der Induktionsvoraussetzung. Im Falle einer abz¨ahlbaren Sprache l¨asst sich der Satz von L INDENBAUM und damit auch der Vollst¨andigkeitssatz ohne Voraussetzung des Auswahlaxioms beweisen. Auf diesen Fall bezieht sich als Korollar auch der 6.11.2 Satz von L¨owenheim Ist T eine konsistente Theorie in einer abz¨ahlbaren Sprache, so besitzt T ein abz¨ahlbares Modell. ¨ Das Ergebnis von L OWENHEIM findet sich in der Form Hat eine Theorie T in einer abz¨ahlbaren Sprache L ein Modell, so auch ein abz¨ahlbares Modell. bereits in der Arbeit ¨ M¨oglichkeiten im Relativkalk¨ul. Math. Ann. 76, L¨owenheim, Leopold Uber (1915), 447 - 470. (Die Verallgemeinerungen nach S KOLEM -TARSKI haben wir bereits mit modelltheoretischen Methoden in 4.2.3 und 4.2.4 behandelt.) Aus dem Vollst¨andigkeitssatz folgt auch das Korollar (i) Sind T und T0 Theorien in derselben Sprache L, so gilt: T ⊆ T0 ⇐⇒ Mod(T) ⊇ Mod(T0 ), T = T0 ⇐⇒ Mod(T) = Mod(T0 ). (ii) Eine Theorie T ist konsistent und vollst¨andig gdw es eine Struktur A gibt mit T = Th(A). Dabei meinen wir hier mit T = T0 : T a¨ quivalent zu T0 , d. h. C(T) = C(T0 ). Als weitere wichtige Folgerung aus dem Vollst¨andigkeitssatz (und dem Endlichkeitssatz f¨ur die Beweisbarkeit) erhalten wir erneut den
¨ ¨ 6.11. D ER G ODELSCHE VOLLST ANDIGKEITSSATZ
147
6.11.3 Kompaktheitssatz Σ sei eine Menge von S¨atzen, σ ein Satz. Dann gilt: (1) T |= σ ⇒ es existiert ein endliches T0 ⊆ T mit T0 |= σ , (2) hat jedes endliche Σ0 ⊆ Σ ein Modell, so hat auch Σ ein Modell. (Nat¨urlich gelten auch die jeweiligen Umkehrungen.)
148
Teil III ¨ Naturliche Zahlen und Unvollst¨andigkeit
149
Hans Magnus Enzensberger: Hommage a` G¨odel M¨unchhausens Theorem, Pferd, Sumpf und Schopf, ist bezaubernd, aber vergiß nicht: M¨unchhausen war ein L¨ugner. G¨odels Theorem wirkt auf den ersten Blick etwas unscheinbar, doch bedenk: G¨odel hat recht. In jedem gen¨ugend reichhaltigen System // lassen sich S¨atze formulieren, die innerhalb des Systems // weder beweis- noch widerlegbar sind, es sei denn das System // w¨are selber inkonsistent.
Du kannst deine eigene Sprache // in deiner eigenen Sprache beschreiben: aber nicht ganz. Du kannst dein eignes Gehirn // mit deinem eignen Gehirn erforschen: aber nicht ganz. Usw. Um sich zu rechtfertigen // muß jedes denkbare System sich transzendieren, // d.h. zerst¨oren. Gen¨ugend reichhaltig oder nicht: Widerspruchsfreiheit ist eine Mangelerscheinung oder ein Widerspruch.
(Gewißheit = Inkonsistenz.) Jeder denkbare Reiter, // also auch M¨unchhausen, also auch du bist ein Subsystem // eines gen¨ugend reichhaltigen Sumpfes. Und ein Subsystem dieses Subsystems // ist der eigene Schopf, dieses Hebezeug // f¨ur Reformisten und L¨ugner. In jedem gen¨ugend reichhaltigen System, also auch in diesem Sumpf hier, lassen sich S¨atze formulieren, die innerhalb des Systems weder beweis- noch widerlegbar sind. Diese S¨atze nimm in die Hand und zieh! (Zitiert nach: Hans Magnus Enzensberger: Die Elixiere der Wissenschaft. Frankfurt a.M.: Suhrkamp 2002)
150
In diesem Teil gehen wir aus von den nat¨urlichen Zahlen als algebraische Struktur mit den Operationen der Addition und Multiplikation und zus¨atzlicher Ordnung. Als Axiomensystem f¨ur die elementaren Eigenschaften dieser Struktur haben wir bereits das Axiomensystem von G. P EANO erw¨ahnt und gesehen, dass es nicht ausdrucksstark genug ist, um die Struktur der nat¨urlichen Zahlen bis auf Isomorphie festzulegen. Tats¨achlich ist es sogar nach einem ber¨uhmten Satz von ¨ K. G ODEL unvollst¨andig, und wir werden sehen, dass dieses Problem sich auch durch die Hinzunahme weiterer Axiome nicht beseitigen l¨asst. Dazu werden wir mit den Methoden der mathematischen Logik Pr¨adikate und Funktionen nat¨urlicher Zahlen nach ihrer Komplexit¨at klassifizieren, insbesondere den Begriff der Berechenbarkeit und der Entscheidbarkeit pr¨azisieren, um damit M¨oglichkeiten und Grenzen der Beweisbarkeit f¨ur mathematischer Theorien, vor allem f¨ur die Zahlentheorie und auch die Logik selbst aufzuzeigen. Eine ausf¨uhrlichere Darstellung der Theorie der Berechenbarkeit findet man im Skriptum K. Ambos-Spies: Theoretische Informatik (http://www.math.uni-heidelberg.de/logic/skripten.html).
151
Kapitel 7 Berechenbare Funktionen 7.1 Turing-Maschinen Eine TURING-Maschine M besitzt als Speicher ein nach beiden Seiten unbeschr¨anktes Band, das in unendlich viele Felder eingeteilt ist. Jedes Feld kann einen Buchstaben aus dem endlichen Alphabet s1 , . . . , sn der Maschine M aufnehmen. Dabei sind zu jedem Zeitpunkt nur endlich viele Felder belegt, wobei wir vereinbaren k¨onnen, dass die leeren Feldern durch ein zus¨atzliches Symbol s0 gekennzeichnet sind. Der Zugriff auf das Speicherband erfolgt durch einen kombinierten Lese- und Schreibkopf von der Gr¨oße eines Feldes. Das Feld, auf das der Kopf zeigt, heißt das Arbeitsfeld. Dieses Feld kann eingelesen und neu beschriftet werden. Weiterhin kann sich der Kopf um ein Feld nach links oder rechts bewegen. Durch Wiederholung dieser elementaren Operationen kann also jede Stelle des Bandes besucht, die dort stehende Information gelesen und gegebenenfalls ersetzt oder erg¨anzt werden. Außerdem ist M zu jedem gegebenen Zeitpunkt in einem von endlich-vielen Zust¨anden q1 , . . . , qr , die Einfluss auf das Verhalten von M haben. Es gibt somit 3 Typen von Operationen, genannt Anweisungen, die M ausf¨uhren kann, wenn M im Zustand qi u¨ ber einem Feld steht, in dem das Zeichen s j eingetragen ist, und die wie folgt bezeichnet werden: (a) qi s j sk ql :
l¨osche s j und schreibe daf¨ur sk ,
(b) qi s j R ql :
bewege den Kopf ein Feld weiter nach rechts,
(c) qi s j L ql :
bewege den Kopf ein Feld weiter nach links.
152
7.1. T URING -M ASCHINEN
Anschließend gehe M in allen F¨allen in den Zustand ql u¨ ber. Ein Programm f¨ur M ist eine endliche Liste von Anweisungen der obigen Formen (a) - (c), welches konsistent ist, d. h. zu einem gegebenen Paar qi , s j (f¨ur die Ausgangssituation) gibt es in der Liste h¨ochstens eine Anweisung, die hiermit beginnt. Beispiel: Das Alphabet von M bestehe aus den Symbolen 0, 1 (und x f¨ur ein leeres Feld), m¨ogliche Zust¨ande seien q1 , q2 . Das Programm P bestehe aus den folgenden 4 Anweisungen: q1 0 R q1 q1 1 0 q2 q2 0 R q2 q2 1 R q1 Anfangs stehe M im Zustand q1 u¨ ber dem ersten Feld des Bandes, das von hier ab weitere n aufeinander folgende Felder mit dem Symbol 1 enth¨alt, w¨ahrend die u¨ brigen Felder leer sind: ...
x
x
x
↓ 1 1
1
1
1
1
x
x
x
...
Folgt M den obigen Anweisungen, so kann es diese ausf¨uhren, bis der folgende Endzustand erreicht ist: ↓ ... x x x 0 1 0 1 0 1 x x x ... Wir wollen nun erkl¨aren, wie eine T-Maschine mit vorgegebenen Programm eine Funktion berechnet. Da es vorkommen kann, dass Rechnungsprogramme bei Anwendungen auf bestimmte Anfangswerte m¨oglicherweise nicht stoppen (weil sie z. B. in eine Schleife geraten), werden wir jetzt statt totaler Funktionen f : Nk → N auch partielle Funktionen zulassen: Definition f ist eine partielle k-stellige Funktion auf den nat¨urlichen Zahlen gdw f : D → N f¨ur eine Teilmenge D ⊆ Nk .
7.2. URM- BERECHENBARE F UNKTIONEN
153
In diesem Falle bedeute f (~x) ↓:
⇐⇒
f ist an der Stelle ~x definiert
f (~x) ↑:
⇐⇒
f ist an der Stelle ~x nicht definiert
f (~x) ' g(~x) :
⇐⇒
( f (~x) ↓ ⇐⇒ g(~x) ↓) und ( f (~x) ↓=⇒ f (~x) = g(~x)).
TURING-berechenbare Funktionen Zur Darstellung von Zahlen, von denen eine Rechnung ausgeht, w¨ahlen wir s1 = 1 und benutzen es als Marke, indem n + 1 aufeinander folgende Felder mit Inhalt 1 (umgeben von Leerfeldern am Anfang und am Ende) die Zahl n darstellen. Eine partielle Funktion f : D → N wird von M berechnet, wenn M, beginnend im Anfangszustand q1 u¨ ber dem ersten Feld, welches die Zahl n darstellt, genau dann u¨ ber dem Band in einem Endzustand stoppt, wenn n ∈ D ist, und in diesem Fall das Symbol 1 genau f (n)-mal auf dem Band im Endzustand eingetragen ist (in obigem Beispiel ist f (5) = 3). Eine a¨ hnliche Definition legt man im Falle mehrstelliger Funktionen fest. Eine partielle Funktion f heißt TURING-berechenbar genau dann, wenn es eine T-Maschine M gibt mit einem Programm, welches f berechnet.
7.2 URM-berechenbare Funktionen S HEPERDSON -S TURGIS haben 1963 eine Variante eines Maschinenmodells vorgeschlagen: Eine unbeschr¨ankte Register-Maschine (URM) besitzt eine unendliche Anzahl von Registern R1 , . . . , Rl , die jeweils eine Zahl enthalten; rn sei die Zahl im Register Rn . Diese Zahlen werden von einer URM gem¨aß folgenden Typen von Anweisungen abge¨andert: O(n): S(n): T (m, n): J(m, n, q):
0 → Rn rn + 1 → Rn rm → Rn falls rn = rm ,
bzw. rn := 0 ersetze rn durch 0 bzw. rn := rn + 1 addiere 1 zu rn bzw. rn := rm ersetze rn durch rm so gehe zur q-ten Anweisung u¨ ber, sonst zur n¨achsten.
Ein Programm ist nun wieder eine nummerierte endliche Folge derartiger Anweisungen. Soll eine URM mit einem Programm P = (I1 , . . . , Ik ) eine Berechnung durchf¨uhren, so muss ein Anfangszustand der Registerinhalte gegeben sein, in welchem die URM mit der ersten Anweisung beginnt und worauf sie dann den weiteren Anweisungen der Liste folgt.
154
7.3. C HURCHSCHE T HESE
Beispiel: I1 :
J(1, 2, 6)
I2 :
S(2)
I3 :
S(3)
I4 :
J(1, 2, 6)
I5 :
J(1, 1, 2)
I6 :
T (3, 1)
Beginnt die URM mit den Zahlen 9 im 1. und 5 im 2. Register (und 0 in allen anderen), so erzeugt sie nach einigen Schritten die Zahl 4 im 3. Register und landet dann bei der Anweisung I6 , welche die Zahl 4 in das 1. Register u¨ bertr¨agt; da keine weitere Anweisung folgt, stoppt hier das Programm. Es sei nun f eine partielle n-stellige Funktion auf den nat¨urlichen Zahlen, P ein Programm und a1 , . . . , an , b seien vorgegebene Zahlen. Dann konvergiert das mit a1 , . . . , an beginnende Programm gegen die Zahl b, formal: P(a1 , . . . , an ) ↓ b, gdw es nach endlich-vielen Schritten stoppt und die Zahl b im 1. Register steht. P berechnet f gdw f¨ur alle a1 , . . . , an , b gilt: P(a1 , . . . , an ) ↓ b gdw f (a1 , . . . , an ) ist definiert und = b. f ist URM-berechenbar gdw es ein Programm P gibt, welches f berechnet.
7.3 Churchsche These Es gibt weitere Ans¨atze, den Begriff der berechenbaren Funktion zu pr¨azisieren: ¨ • G ODEL -H ERBRAND -K LEENE (1936): mittels eines Gleichungskalk¨uls definierte allgemein-rekursive Funktionen • C HURCH (1936): λ -definierbare Funktionen ¨ • G ODEL -K LEENE (1936): µ-rekursive Funktionen (s.u.) • P OST (1943): berechenbare Funktionen mittels kanonischer Deduktionssysteme • M ARKOV (1951): berechenbare Funktionen mittels Algorithmen u¨ ber endlichen Alphabeten
¨ ¨ 7.4. AUFZ AHLBARKEITSS ATZE
155
Alle diese Definitionen haben sich als formal a¨ quivalent herausgestellt, außerdem ist bisher jede einzelne der (im intuitiven Sinne) berechenbaren Funktionen auch berechenbar in dem obigen formalen Sinne, was Anlass zu folgender Annahme gegeben hat: Churchsche These: Die (intuitiv) berechenbaren Funktionen sind genau die (in einem der obigen Sinne) formal berechenbaren Funktionen. Ohne ausf¨uhrliche Beweise erg¨anzen wir einige wichtige
7.4 Aufz¨ahlbarkeitss¨atze • Da sich alle Programme effektiv aufz¨ahlen lassen, gibt es eine effektive Aufz¨ahlung ϕ0 , ϕ1 , . . . , ϕn , . . . aller einstelligen berechenbaren (partiellen) Funktionen. Mit einem Diagonalargument erh¨alt man hieraus: • es gibt eine totale Funktion f : N → N, die nicht berechenbar ist: ( ϕn (n) + 1 falls ϕn (n) definiert ist, f (n) = 0 sonst. • Somit gibt es zwar eine Abz¨ahlung aller totalen berechenbaren Funktionen, aber diese Abz¨ahlung kann selbst nicht berechenbar sein. • Auch die folgenden Pr¨adikate sind nicht entscheidbar (d. h. ihre charakteristischen Funktionen sind nicht berechenbar): ϕn (n) ist definiert, ϕn ist totale Funktion, ϕn ist die konstante Funktion 0, ϕn = ϕm , das n-te Programm mit Eingabe n (allgemeiner mit Eingabe m) stoppt nach endlich-vielen Schritten (das Halteproblem). • Existenz universaler Funktionen (bzw. Programme): Zu jeder berechenbaren 2-stelligen Funktion f gibt es eine totale berechenbare Funktion k mit f (n, m) = ϕk(n) (m); die 2-stellige Funktion ϕ(n, m) = ϕn (m) ist berechenbar.
7.5 Primitiv-rekursive Funktionen Zu den intuitiv berechenbaren Funktionen geh¨oren sicher die folgenden
156
7.5. P RIMITIV- REKURSIVE F UNKTIONEN
Anfangsfunktionen R1 0(x) = 0 R2 S(x) = x + 1 R3 Pin (x1 , . . . , xn ) = xi
Nullfunktion Nachfolgerfunktion i-te Projektion
Durch Einsetzen von Funktionen in bereits vorgegebene Funktionen erhalten wir eine neue Funktion durch Substitution R4 f (~x) ' h(g1 (~x), . . . , gk (~x)) Wichtig ist nun das folgende Prinzip - nach diesem Muster werden n¨amlich die arithmetischen Operationen Addition, Multiplikation und Potenz gebildet: Primitive Rekursion R5 f (~x, 0) ' g(~x) f (~x, y + 1) ' h(~x, y, f (~x, y)) Die Klasse PRIM aller primitiv-rekursiven (abgek¨urzt: p.r.) Funktionen ist die kleinste Klasse von Funktionen, die die Anfangsfunktionen enth¨alt und abgeschlossen ist unter Substitution und primitiver Rekursion. Diese Funktionen sind insbesondere totale Funktionen. Beispiele primitiv-rekursiver Funktionen Die folgenden Funktionen sind primitiv-rekursiv: x+y x·y xy max(x, y) min(x, y) |x − y|
˙ = x−y
( x−y 0
falls x ≥ y, sonst
Summe Produkt Potenz Maximum Minimum absolute Differenz
Differenz auf N
157
7.5. P RIMITIV- REKURSIVE F UNKTIONEN
sg(x) =
sg(x) =
( 0
falls x = 0,
1
falls x > 0
( 1
falls x = 0,
0
falls x > 0
Signum, Vorzeichen
Antisignum, negiertes Vorzeichen
Beweis: Addition, Multiplikation und die Potenz sind offenbar primitiv-rekursiv. ˙ F¨ur die u¨ brigen F¨alle ben¨otigt zeigt man zuerst, dass die Vorg¨angerfunktion x−1 primitiv-rekursiv ist, und zwar wegen ˙ 0−1 = 0 ˙ (x + 1)−1 = x ˙ durch primitive Rekursion und definiert dann − ˙ x−0 = x ˙ + 1) = (x−y) ˙ −1 ˙ x−(y ˙ definieren: Die u¨ brigen Funktionen kann man direkt mittels + und − |x − y| max(x, y) min(x, y) sg(x) sg(x)
= = = = =
˙ + (y−x) ˙ (x−y) ˙ x + (y−x) ˙ − y| max(x, y)−|x ˙ 1−x ˙ 1−sg(x)
7.5.1 Abschlusseigenschaften Primitiv-rekursive Funktionen sind abgeschlossen unter (i) Fallunterscheidung: Sind g, f0 , f1 , . . . , fk primitiv-rekursiv, so auch f mit f0 (~x) f alls g(~x) = 0, f ~x) f alls g(~x) = 1, 1 f (~x) = . . .. .. f (~x) f alls g(~x) ≥ k. k
7.6. R EKURSIVE UND PARTIELL - REKURSIVE F UNKTIONEN
158
(ii) beschr¨anktem µ-Operator: Ist g primitiv-rekursiv, so auch f mit f (~x, z) = µy < z (g(~x, y) = 0), wobei µy < z R(~x, y) =
( das kleinste y < z mit R(~x, y) falls ein solches existiert z
sonst.
7.6 Rekursive und partiell-rekursive Funktionen Ein Beispiel einer berechenbaren, aber nicht p.r. Funktion ist die Die Ackermannsche Funktion: Diese ist eine 2-stellige Funktion, die durch die folgenden Gleichungen rekursiv bestimmt ist: A(0, y) = y + 1 A(x + 1, 0) = A(x, 1) A(x + 1, y + 1) = A(x, A(x + 1, y)) Es handelt sich hier um eine doppelte Rekursion, trotzdem kann man leicht nachpr¨ufen, dass sich jeder Wert A(x, y) von endlich-vielen “fr¨uheren” Werten A(u, v) mit u < x oder u = x ∧ v < y bestimmen l¨asst. Schreiben wir Fn (m) f¨ur A(n, m), so erhalten wir:
F0 (m) = m + 1 F1 (m) = m + 2 F2 (m) ≈ 2m F3 (m) ≈ 2m 2 ..
F4 (m) ≈ 2
2.
(m − mal)
Das bedeutet also, dass die ACKERMANNsche Funktion die Grundrechenarten iteriert und insbesondere in der ersten Stelle (die die Anzahl der Iterationen angibt)
7.6. R EKURSIVE UND PARTIELL - REKURSIVE F UNKTIONEN
159
sehr schnell w¨achst. Tats¨achlich majorisiert sie jede p.r. Funktion: Ist f eine kstellige p.r. Funktion, so gibt es eine Zahl n mit f (x1 , . . . , xk ) ≤ Fn (max(x1 , . . . , xk )) f¨ur alle x1 , . . . , xk . Somit kann die 2-stellige Funktion A nicht p.r. sein (obwohl andererseits alle Fn p.r. sind!). Dass die ACKERMANNsche Funktion trotzdem berechenbar ist, ersieht man daraus, dass sie aus einer p.r. Funktion erhalten werden kann mittels Minimalisierung R6 f (~x) ' µy (g(~x, y) ' 0), d. h. das kleinste y so dass (i) g(~x, z) definiert ist f¨ur alle z ≤ y und f (~x) = (ii) g(~x, y) = 0, falls ein derartiges y existiert, undefiniert sonst. Dieses Prinzip kann von totalen zu partiellen Funktionen f¨uhren (z. B. f¨ur g(x, y) = |x − y2 |). Die Klasse R (oder C) aller rekursiven Funktionen ist die kleinste Klasse von Funktionen, die die Anfangsfunktionen enth¨alt und abgeschlossen ist unter Substitution, primitiver Rekursion und Minimalisierung. Man spricht mitunter auch von allgemein-rekursiven, µ-rekursiven Funktionen oder (auf Grund der C HURCHschen These) von den berechenbaren Funktionen (C = computable functions). Von rekursiven Funktionen werden wir vorwiegend im Falle totaler berechenbarer Funktionen sprechen. Jede p.r. Funktion ist also auch eine rekursive Funktion (w¨ahrend die ACKER MANN sche Funktion ein Beispiel f¨ ur eine rekursive, aber nicht p.r. Funktion ist), und die Abschlusseigenschaften 7.5.1 gelten (geeignet modifiziert f¨ur partielle Funktionen) auch f¨ur rekursive Funktionen. Definition Eine zahlentheoretische Relation R ⊆ Nk heißt primitiv-rekursiv bzw. rekursiv (oder auch: entscheidbar) gdw ihre charakteristische Funktion cR primitivrekursiv bzw. rekursiv ist, wobei ( 1 falls R(~x), cR (~x) = 0 sonst.
7.6. R EKURSIVE UND PARTIELL - REKURSIVE F UNKTIONEN
160
Somit sind z. B. die Pr¨adikate x = y, x 6= y, x ≤ y, x < y primitiv-rekursiv. Partielle Entscheidbarkeit Eine Relation R ⊆ Nk heißt partiell- (oder positiv-) entscheidbar bzw. r.e. gdw. sie Definitionsbereich einer berechenbaren Funktion ist: R r.e. : ⇐⇒ R = {~x | f (~x) ↓} f¨ur eine berechenbare Funktion f . In diesem Fall kann man f¨ur f auch die partielle charakteristische Funktion von R w¨ahlen: R r.e. ⇐⇒ pcR ist rekursiv, ( 1 falls ~x ∈ R, wobei pcR (~x) = undefiniert sonst. W¨ahrend es also f¨ur eine entscheidbare Relation R ein effektives Verfahren gibt, welches die Frage beantwortet, ob R zutrifft oder nicht, kann man f¨ur eine partiell-entscheidbare Relation somit nur den Fall best¨atigen, dass die Relation zutrifft. Die Bezeichnung r.e. = recursively enumerable = rekursiv-aufz¨ahlbar, in der neueren Literatur auch c.e. = computably enumerable, erkl¨art sich aus der folgenden Charakterisierung: Eine nicht-leere Teilmenge A ⊆ N ist partiell entscheidbar gdw sie Wertebereich einer rekursiven Funktion ist, also von einer rekursiven Funktion aufgez¨ahlt wird: A r.e. ⇐⇒ A = 0/ ∨ A = { f (x) | x ∈ N} f¨ur eine rekursive Funktion f : N → N. Jede rekursive Relation ist auch r.e.; die Umkehrung gilt, wenn auch das Komplement r.e. ist: A ⊆ Nk ist entscheidbar gdw A und Nk − A sind r.e. Ist wieder ϕn die n-te berechenbare Funktion (in einer geeigneten effektiven Aufz¨ahlung), so sind die Mengen {n | ϕn (n) ↓}
r.e., aber nicht rekursiv, w¨ahrend
{n | ϕn (n) ↑}
nicht einmal r.e. ist.
Von besonderer Bedeutung wird sp¨ater sein, dass f¨ur Theorien T mit einer rekursiven Menge von Axiomen die Folgerungsmenge C(T) = {σ | T ` σ } r.e. ist. Insbesondere ist also eine rekursiv-axiomatisierbare vollst¨andige Theorie entscheidbar!
161
Kapitel 8 ¨ die Eine Basistheorie fur ¨ naturlichen Zahlen Als Axiomensystem f¨ur die nat¨urlichen Zahlen w¨ahlt man meistens die P EANOArithmetik PA (siehe 3.5.3) mit den unendlich-vielen Induktionsaxiomen. F¨ur viele Zwecke reicht jedoch eine Teiltheorie mit endlich-vielen Axiomen aus:
8.1 Axiome von PA− Diese Theorie wird in einer Sprache L mit den Symbolen 0, 1, <, +, · formalisiert. Die ersten Axiome besagen, dass Addition und Multiplikation assoziativ und kommutativ sind sowie das Distributivgesetz erf¨ullen, ferner dass 0 und 1 neutrale Elemente f¨ur die jeweiligen Operationen und 0 ein Nullteiler ist: A1 A2 A3 A4 A5
(x + y) + z = x + (y + z) (x · y) · z = x · (y · z) x+y = y+x x·y = y·x x · (y + z) = x · y + x · z
A6 x + 0 = x ∧ x · 0 = 0 A7 x·1 = 1
Dabei benutzen wir die in der Algebra u¨ blichen Klammeregeln (· bindet st¨arker als +). F¨ur die <-Beziehung gelten die Gesetze einer linearen Ordnung, welche mit Addition und Multiplikation vertr¨aglich ist: A8 A9
¬x<x x < y∧y < z → x < z
8.1. A XIOME VON PA−
162
A10 x < y ∨ x = y ∨ y < x A11 x < y → x + z < y + z A12 0 < z ∧ x < y → x · z < y · z Eine Zahl kann von einen gr¨oßeren subtrahiert werden: A13 x < y → ∃z (x + z = y) und schließlich ist 1 ist der Nachfolger von 0 und 0 das kleinste Element (wobei wie u¨ blich x ≤ y : ⇐⇒ x = y ∨ x < y): A14 0 < 1 ∧ ∀x (0 < x → 1 ≤ x) A15 ∀x (0 ≤ x) Aus A14 folgt mit A11, dass allgemeiner x + 1 der Nachfolger von x ist und damit die Ordnung diskret ist: x < x + 1 ∧ ∀y (x < y → x + 1 ≤ y). Beispiele: 1. In der P EANO-Arithmetik PA kann man die <-Beziehung definieren durch x < y ↔ ∃z (x + z + 1 = y) und damit alle Axiome von PA− erhalten. Insbesondere ist das Standardmodell N mit der gew¨ohnlichen <-Beziehung, den u¨ blichen Operationen und den nat¨urlichen Zahlen 0,1 ein Modell von PA− . 2. Die Menge Z[X] der Polynome in einer Unbestimmten X und mit ganzzahligen Koeffizienten ist mit den u¨ blichen Operationen ein kommutativer Ring. Man kann diesen Ring ordnen, indem man f¨ur ein Polynom p = an X n + . . . a1 X + a0 mit h¨ochstem Koeffizienten an 6= 0 setzt: an X n + . . . a1 X + a0 > 0 : ⇐⇒ an > 0 und damit Polynome p, q ∈ Z[X] ordnet durch p < q : ⇐⇒ q − p > 0. Die Teilmenge Z[X]+ der Polynome p ∈ Z[X] mit p ≥ 0 wird damit zu einem Modell von PA− , in welchem das Polynom X gr¨oßer als alle konstanten Polynome und damit “unendlich groß” ist. In einem Ring liegt bez¨uglich der Addition eine Gruppe vor, w¨ahrend A13 nur eine eingeschr¨ankte Inversenbildung zul¨asst. Ersetzt man in PA− die Axiome A13 und A15 durch das Axiom
163
8.2. E NDERWEITERUNGEN
A16 ∀x ∃z (x + z = 0) so erh¨alt man die algebraische Theorie DOR der diskret geordneten Ringe, deren Modelle z. B. die Ringe Z und Z[X] sind. Jedes Modell M von PA− kann man zu einem Modell R der Theorie DOR erweitern (nach demselben Muster, wie man die nat¨urlichen Zahlen zum Ring der ganzen Zahlen erweitert), so dass die nicht-negativen Elemente von R mit dem urspr¨unglichen Modell u¨ bereinstimmen. Umgekehrt ist auch f¨ur jedes Modell R der Theorie DOR die Einschr¨ankung auf die nicht-negativen Elemente ein Modell von PA− , so dass man PA− als Theorie (des nicht-negativen Teils) diskret geordneter Ringe bezeichnen kann.
8.2 Enderweiterungen Bereits bei der Behandlung von Nonstandard-Modellen von PA hatten wir bemerkt, dass sich das Standardmodell in jedes andere Modell von PA einbetten l¨asst. Dies gilt bereits f¨ur die Modelle der Theorie PA− . Definition L sei eine Sprache, welche ein 2-stelliges Symbol < enthalte, M und N seien LStrukturen mit M ⊆ N. Dann heißt N Enderweiterung von M (und entsprechend M Anfangssegment von M) genau dann, wenn die gr¨oßere Menge N unterhalb eines Elementes von M kein weiteres hinzuf¨ugt: M ⊆end N : ⇐⇒ f¨ur alle x ∈ M, y ∈ N : (y
(n-mal)
dargestellt, wobei 0 die Konstante 0 ist. Satz Es sei M |= PA− . Dann wird durch die Abbildung n 7→ nM eine Einbettung des Standardmodells N auf ein Anfangssegment von M definiert. Insbesondere ist (mittels Identifizierung) jedes Modell von PA− isomorph zu einer Enderweiterung des Standardmodells N.
164
8.3. A RITHMETISCHE F ORMELN
Beweis: Durch einfache Induktion zeige man f¨ur alle nat¨urlichen Zahlen n, k, l: n = k + l =⇒ PA− ` n = k + l n = k · l =⇒ PA− ` n = k · l n < k =⇒ PA− ` n < k PA− ` ∀x ( x ≤ k
→
x = 0 ∨ . . . ∨ x = k)
Die ersten 3 Aussagen werden wir sp¨ater f¨ur alle rekursiven Funktionen bzw. Relationen verallgemeinern; aus ihnen folgt, dass die Abbildung n 7→ nM ein Homomorphismus und wegen der letzten Aussage eine Einbettung auf ein Anfangssegment von M ist. Bemerkung Das Standardmodell hat kein echtes Anfangssegment, und Z[X]+ hat N als einziges echtes Anfangssegment. Andererseits hat jedes Modell M |= PA− eine echte Enderweiterung, welche ebenfalls ein Modell von PA− ist, n¨amlich den nichtnegativen Teil des Polynomringes R[X], wobei R der diskret geordnete Ring ist, welcher dem Modell M zugeordnet ist.
8.3 Arithmetische Formeln F¨ur Terme t und Formeln ϕ der Sprache von PA− schreiben wir ∃x < t ϕ f¨ur ∃x(x < t ∧ ϕ) ∀x < t ϕ f¨ur ∀x(x < t → ϕ) und nennen ∃x < t und ∀x < t beschr¨ankte Quantoren. Definition ϕ ist ∆0 -Formel: ⇐⇒ ϕ enth¨alt h¨ochstens beschr¨ankte Quantoren, ϕ ist Σ1 -Formel: ⇐⇒ ϕ = ∃~x ψ f¨ur eine ∆0 -Formel ψ, ϕ ist Π1 -Formel: ⇐⇒ ϕ = ∀~x ψ f¨ur eine ∆0 -Formel ψ, Dieses ist der Anfang der Hierarchie der arithmetischen Formeln; setzt man Σ0 = Π0 = ∆0 , so kann man fortsetzen:
165
8.3. A RITHMETISCHE F ORMELN
ϕ ist Σn+1 -Formel ⇐⇒ ϕ = ∃~x ψ f¨ur eine Πn -Formel ψ, ϕ ist Πn+1 -Formel ⇐⇒ ϕ = ∀~x ψ f¨ur eine Σn -Formel ψ. Eine Σ3 -Formel ist also von der Form ∃~x ∀~y ∃~z ψ, wobei ψ h¨ochstens beschr¨ankte Quantoren enth¨alt. Das bedeutet also, dass man beschr¨ankte Quantoren nicht mitz¨ahlt, mit Σ bzw. Π anzeigt, dass die Formel mit einer (endlichen) Folge von ∃-Quantoren bzw. ∀-Quantoren beginnt und der Index die Quantorenbl¨ocke z¨ahlt. Es kommt also weniger auf die Anzahl der Quantoren an als die Anzahl der Quantorenwechsel. Bei dieser Klassifizierung unterscheidet man nicht zwischen logisch a¨ quivalenten Formeln, so dass etwa jede Πn -Formel f¨ur n < m auch eine Σm - und Πm Formel ist (indem man der Formel einfach zus¨atzliche Quantoren u¨ ber nicht vorkommende Variablen voranstellt). Somit kann man dann auch die Formelmengen ∆n = Σn ∩ Πn definieren. Es ergibt sich daraus folgendes Bild der arithmetischen Hierarchie: Σ1 ∆0
Σ2 @ @ @
∆1 @
@ @ Π1
@ @ @
∆2
∆3
@
@ @ Π2
...... @ @ @
Viele n¨utzliche Eigenschaften nat¨urlicher Zahlen lassen sich mittels ∆0 -Formeln ausdr¨ucken, z. B.: x ist irreduzibel ⇐⇒ 1 < x ∧ ∀u < x ∀v < x ¬(u · v = x). Von besonderer Bedeutung ist, dass ∆0 -Formeln in einer Struktur dasselbe bedeuten wie in allen Enderweiterungen:
8.4. E RHALTUNGSEIGENSCHAFTEN UNTER E NDERWEITERUNGEN
166
8.4 Erhaltungseigenschaften unter Enderweiterungen N, M seien Strukturen der Sprache L von PA− , N ⊆end M,~a ∈ N. Dann gilt: (i) jede ∆0 -Formel ϕ(~v) ist absolut: N |= ϕ[~a] ⇐⇒ M |= ϕ[~a], (ii) jede Σ1 -Formel ϕ(~v) ist aufw¨arts-persistent: N |= ϕ[~a] =⇒ M |= ϕ[~a], (iii) jede Π1 -Formel ϕ(~v) ist abw¨arts-persistent: M |= ϕ[~a] =⇒ N |= ϕ[~a], (iv) jede ∆1 -Formel ϕ(~v) ist absolut: N |= ϕ[~a] ⇐⇒ M |= ϕ[~a]. Beweis von (i) durch Induktion u¨ ber den Formelaufbau von ϕ(~v), wobei nur der Fall eines beschr¨ankten Quantors von Interesse ist. Da aber M Enderweiterung von N ist, werden von M unterhalb eines Elementes von N keine neuen Elemente eingef¨ugt, so dass ein beschr¨ankter Quantor in beiden Strukturen dasselbe besagt. Es sei Σ1 -Th(N) := {σ | σ Σ1 -Satz mit N |= σ }. Dann gilt: Korollar PA− ` Σ1 -Th(N) Beweis: Es sei N |= PA− . Nach kann 8.2 man annehmen, dass N ⊆end N, und die Behauptung folgt dann aus 8.4 (ii). Somit kann man in der Theorie PA− alle Σ1 -S¨atze beweisen, die im Standardmodell gelten, aber bereits nicht mehr alle wahren Π1 -S¨atze, denn der Π1 -Satz, welcher besagt, dass jede Zahl gerade oder ungerade ist: (∗) ∀x ∃y ≤ x (x = 2 · y ∨ x = 2 · y + 1)
8.4. E RHALTUNGSEIGENSCHAFTEN UNTER E NDERWEITERUNGEN
167
ist im Standardmodell wahr, nicht aber in dem PA− -Modell Z[X]+ . Bereits wahre ∀-S¨atze (d.h. S¨atze der Form ∀~x ψ mit quantorenfreiem ψ), die im Standardmodell gelten, brauchen nicht in PA− beweisbar zu sein, z. B. ist auch der ∀-Satz ∀x, y(x2 6= 2 · y2 ) im Standardmodell wahr, nicht aber in PA− beweisbar (Z/(X 2 − 2Y 2 ) ist ein Gegenbeispiel). Somit ist der obige Satz (*) ein Beispiel f¨ur einen Π1 -Satz, der kein ∀-Satz ist, wo man also auf den beschr¨ankten Quantor nicht verzichten kann! ¨ (Ubrigens kann man leicht zeigen, dass Z[X]+ immerhin ein Modell aller ∀-S¨atze ist, die im Standardmodell gelten.)
168
Kapitel 9 Definierbarkeit berechenbarer Funktionen Hier soll gezeigt werden, dass die rekursive Relationen mit den Mengen u¨ bereinstimmen, die sich durch eine ∆1 -Formeln in den nat¨urlichen Zahlen definieren lassen, und dass der Graph einer rekursiven Funktion durch eine Σ1 -Formeln in den nat¨urlichen Zahlen definiert werden kann. Mit N bezeichnen wir im folgenden auch das Standardmodell (N, <, +, ·, 0, 1). Wir beginnen mit dem
9.1 Lemma F¨ur jede ∆0 -Formel θ (~v) ist die Relation R(~a) ⇐⇒ N |= θ (~a) primitiv-rekursiv. Beweis: Wir zeigen durch Induktion u¨ ber lz(θ ), dass die zugeh¨orige charakteristische Funktion ( 1 falls N |= θ (~x) cθ (~x) = 0 sonst primitiv-rekursiv ist: Zun¨achst sind die Funktionen x + 1, x + y, x · y p.r. und damit definiert jeder Term in N eine primitiv-rekursive Funktion. Da auch die Funktio˙ primitv-rekursiv sind (und die p.r. Funktionen eq(x, y) = sg(|x − y|) und sg(y−x)
169
9.1. L EMMA
nen abgeschlossen sind unter Substitution), gilt die Behauptung f¨ur die atomaren Formeln t = s,t < s. F¨ur den Fall der aussagenlogischen Operationen benutze man ˙ θ (~x), cθ ∧ψ (~x) = min(cθ (~x), cψ (~x)), cθ ∨ψ (~x) = max(cθ (~x), cψ (~x)). c¬θ (~x) = 1−c Ist schließlich θ eine ∆0 -Formel, t ein Term und ψ(~x) = ∀y < t(~x) θ (~x, y), so folgt die Behauptung aus cψ (~x) = eq(t(~x), (µy < t(~x)(cθ (~x, y) = 0)). ¨ Ahnlich argumentiert man im Falle der Formel ∃y < t(~x) θ (~x, y) (oder f¨uhrt diesen Fall mittels der Negation auf den fr¨uheren zur¨uck). Die Umkehrung des obigen Lemmas gilt nicht: es gibt primitiv-rekursive Mengen, die durch keine ∆0 -Formel in den nat¨urlichen Zahlen definierbar sind. - Dagegen kann man die folgenden Pr¨adikate und Funktionen als p.r. nachweisen: x|y: P(x): pn
↔ ∃z ≤ y (x · z = y) x teilt y ↔ ∀u ≤ x (u|x → u = x ∨ u = 1) x ist Primzahl = (n + 1)te Primzahl : p0 = 2, p1 = 3, p3 = 5, p4 = 7, p5 = 11 . . .
Damit k¨onnen wir endliche Mengen nat¨urlicher Zahlen durch Zahlen codieren, z. B. (n0 , n1 , . . . , nk ) durch pn00 +1 · pn11 +1 · . . . · pnk k +1 . Definieren wir f¨ur x, y ∈ N hx, yi :=
(x + y)(x + y + 1) + y, 2
so erhalten wir eine Paarfunktion N2 ↔ N, die man durch Iteration erweitern kann, indem man hx1 , x2 , . . . xk i = hx1 , hx2 , . . . xk ii setzt. Tats¨achlich ben¨otigen wir aber zus¨atzlich eine Funktion, die uniform jede endliche Menge nat¨urlicher Zahlen durch eine einzelne Zahl codiert:
¨ 9.2. G ODELS L EMMA
170
9.2 G¨odels Lemma Es gibt es eine primitiv-rekursive Funktion β , so dass f¨ur jedes k und f¨ur jede endliche Folge x0 , x1 , . . . xk−1 ∈ N gilt: es gibt eine nat¨urliche Zahl c mit f¨ur alle i < k : β (c, i) = xi . Tats¨achlich gibt es eine ∆0 -Formel θ (x, y, z), so dass N |= ∀x, y ∃!y θ (x, y, z), und die Formel θ (x, y, z) u¨ ber den nat¨urlichen Zahlen die Funktion β definiert. Beweis: Es sei x0 , x1 , . . . xk−1 eine Folge nat¨urlicher Zahlen. Setze m := b! mit b := max(k, x0 , x1 , . . . xk−1 ). Dann ist die Folge der Zahlen m + 1, 2m + 1, . . . k · m + 1 paarweise teilerfremd. Nach dem Satz u¨ ber simultane Kongruenzen (Chinesischer Restsatz) gibt es eine nat¨urliche Zahl a mit a ≡ xi
mod((i + 1)m + 1) f¨ur alle i < k.
Nun kann man ha, mi als Code der Folge x0 , x1 , . . . xk−1 w¨ahlen, denn hieraus erh¨alt man f¨ur jedes i < k die xi zur¨uck als Rest der Division von a durch die Zahl (i + 1)m + 1. Bezeichnet rest(x : y) = z den Rest bei der Division von x durch y (falls y 6= 0 und rest(x : 0) = 0), so ist dieses eine p.r. Funktion mit einer ∆0 Definition. Eine weitere p.r. Funktion erhalten wir durch α(a, m, i) = rest(a : (1 + i)m + 1). Bezeichnen p1 , p2 die Umkehrfunktionen der obigen Paarfunktion hx, yi, f¨ur die also gilt hp1 (x), p2 (x)i = x, wobei p1 (x), p2 (x) ≤ x, so sind auch diese p.r., und wir erhalten schließlich die G¨odelsche β -Funktion als β (c, i) = α(p1 (c), p2 (c), i). F¨ur eine partielle Funktion f bezeichne Γ f den Graphen von f , also die Relation Γ f (~x, y) : ⇐⇒ f (~x) = y.
¨ REKURSIVE F UNKTIONEN 9.3. D EFINIERBARKEITSSATZ F UR
171
¨ rekursive Funktionen 9.3 Definierbarkeitssatz fur Eine partielle Funktion f ist berechenbar genau dann, wenn ihr Graph Γ f u¨ ber den nat¨urlichen Zahlen durch eine Σ1 -Formel definierbar ist, d. h. wenn es eine Σ1 -Formel θ gibt, so dass f¨ur alle ~x, y ∈ N gilt: Γ f (~x, y) ⇐⇒ N |= θ [~x, y]. Beweis: Wir zeigen zun¨achst den einfacheren Teil (⇐): Sei θ = ∃~z ψ eine Σ1 Formel, welche den Graphen Γ f einer partiellen Funktion f definiere, ψ(~x,~z, y) also eine ∆0 -Formel. Dann erhalten wir nach dem Lemma 9.1 eine berechenbare Funktion g durch g(~x) = µz(N |= ∃y,~z ≤ z (hy,~zi = z ∧ ψ(~x,~z, y))). Es ist dann p1 (g(~x)) das kleinste y mit N |= θ [~x, y], falls ein solches y existiert, und undefiniert sonst, denn f¨ur jedes~x ∈ N gibt es h¨ochstens ein y mit N |= θ [~x, y]. Somit ist p1 (g(~x)) ∼ = f (~x), und damit ist f berechenbar. Zum Beweis von (⇒) nennen wir partielle Funktionen f , deren Graph sich durch eine Σ1 -Formel u¨ ber den nat¨urlichen Zahlen definieren lassen Funktionen mit einem Σ1 -Graphen und zeigen, dass die Menge dieser Funktionen die Anfangsfunktionen enth¨alt und unter Substitution, primitiver Rekursion und unter dem µ-Operator abgeschlossen ist. Dabei beschr¨anken wir uns auf den einzigen ¨ Schritt, der etwas schwieriger ist und die G ODEL sche β -Funktion benutzt: Die Funktion f entstehe aus Funktionen g, h durch primitive Rekursion: f (~x, 0) ∼ = g(~x) f (~x, y + 1) ∼ = h(~x, y, f (~x, y)) Dabei k¨onnen wir annehmen, dass die Graphen von g und h durch Σ1 -Formeln definierbar sind. Um damit den Graphen von f zu beschreiben, beachten wir, dass sich der Wert von f (~x, y) berechnet durch die vorangegangenen Werte u0 = f (~x, 0), u1 = f (~x, 1), . . . , uy = f (~x, y), die wir mittels der β -Funktion durch eine einzige Zahl u codieren k¨onnen. Wir m¨ussen nun aber in dieser Folge die Funktion f eliminieren, um eine explizite Definition zu erhalten. Der erste Wert u0 ist durch den Graphen von g festgelegt ist und die weiteren ui+1 bestimmen sich aus ui gem¨aß den Rekursionsbedingungen mittels des Graphen von h:
¨ 9.4. R EPR ASENTIERBARKEIT
172
∀i < y ∃r, s ∈ N [β (u, i) = r ∧ β (u, i + 1) = s ∧ Γh (~x, i, r, s)] Diese Formel l¨asst sich (indem man ein gen¨ugend großes w w¨ahlt) umformen zu ∃w ∈ N ∀i < y ∃r, s < w [β (u, i) = r ∧ β (u, i + 1) = s ∧ Γh (~x, i, r, s)]. Der letzte Wert der obigen Folge, die durch die Zahl u codiert wird, ist der Funktionswert von f an der Stelle (~x, y). Damit erhalten wir als Beschreibung des Graphen von f : Γ f (~x, y, z) ⇐⇒ ∃u, v, w ∈ N (Γg (~x, v) ∧ β (u, 0) = v ∧ β (u, y) = z ∧ ∀i < y ∃r, s < w [β (u, i) = r ∧ β (u, i + 1) = s ∧ Γh (~x, i, r, s)]), ⇐⇒ N |= Θ[~x, y, z] f¨ur eine Σ1 -Formel Θ.
Nennt man eine Menge A ⊆ Nk , die durch eine Formel in Γ u¨ ber den nat¨urlichen Zahlen definierbar ist, ein Γ-Menge, so erhalten wir eine neue Charakterisierung der ersten Stufen der arithmetischen Hierarchie:
Korollar (i) Die Σ1 -Mengen sind die r.e. Relationen R ⊆ Nk , (ii) Die Π1 -Mengen sind die Komplemente von r.e. Relationen, (iii) die ∆1 -Mengen sind die die rekursiven Relationen R ⊆ Nk . F¨ur Anwendungen auf Theorien f¨ur die nat¨urlichen Zahlen ben¨otigen wir eine Variante der Definierbarkeitsergebnisse:
9.4 Repr¨asentierbarkeit T sei eine Theorie der zahlentheoretischen Sprache L, welche PA− erweitert. Eine (totale) Funktion f : Nk → N ist in T repr¨asentierbar gdw es eine L-Formel θ (x1 , . . . , xk , y) gibt, so dass f¨ur alle n1 , . . . , nk , m ∈ N
¨ 9.4. R EPR ASENTIERBARKEIT
(a) (b)
173
T ` ∃!yθ (n1 , . . . , nk , y) und f (n1 , . . . , nk ) = m =⇒ T ` θ (n1 , . . . , nk , m).
Ebenso ist eine Menge S ⊆ Nk in der Theorie T repr¨asentierbar gdw es eine L-Formel θ (x1 , . . . , xk ) gibt, so dass f¨ur alle n1 , . . . , nk ∈ N (c) (d)
(n1 , . . . , nk ) ∈ S ⇒ T ` θ (n1 , . . . , nk ) und (n1 , . . . , nk ) 6∈ S ⇒ T ` ¬θ (n1 , . . . , nk ).
Ist die Funktion f (oder die Menge S) durch eine Σ1 -Formel repr¨asentierbar, so heißt f (bzw. S) Σ1 -repr¨asentierbar. Die Definition der Rep¨asentierbarkeit ist so gew¨ahlt, dass diese Eigenschaft erhalten bleibt, wenn man die Theorie T erweitert. Satz (i) Jede rekursive Funktion f : Nk → N ist in PA− Σ1 -repr¨asentierbar. (ii) Jede rekursive Menge S ⊆ Nk ist in PA− Σ1 -repr¨asentierbar. Beweis von (i): f : Nk → N sei eine rekursive Funktion, ihr Graph Γ f ist also u¨ ber den nat¨urlichen Zahlen durch eine Σ1 -Formel ∃~z ϕ(~x, y,~z) definierbar, wobei ϕ nur beschr¨ankte Quantoren enth¨alt. Da jede Formel der Form ∃~z ϕ in PA− a¨ quivalent ist zu ∃u ∃~z (~z < u ∧ ϕ), k¨onnen wir annehmen, dass~z nur eine einzelne Variable z ist. Wir bilden nun die ∆0 -Formel ψ(~x, y, z) ϕ(~x, y, z) ∧ ∀u, v ≤ y + z (u + v < y + z → ¬ϕ(~x, u, v)) und weisen nach, dass die Σ1 -Formel ∃z ψ(~x, y, z) die Funktion f in T repr¨asentiert: Zun¨achst zeigen wir (b) und nehmen dazu an, dass f (n1 , . . . , nk ) = m gilt, also N |= ∃z ϕ(n1 , . . . , nk , m, z). Die Zahl m ist dabei als Funktionswert eindeutig bestimmt. W¨ahle l als die kleinste Zahl, so dass N |= ϕ(n1 , . . . , nk , m, l). Dann gilt offenbar auch N |= ψ(n1 , . . . , nk , m, l), also auch N |= ∃zψ(n1 , . . . , nk , m, z). Als Σ1 Satz bleibt dieser Satz bei allen Enderweiterungen des Standardmodells zu einem Modell von PA− erhalten, gilt also in allen Modellen von PA− , und somit gilt PA− ` ∃zψ(n1 , . . . , nk , m, z) nach dem Vollst¨andigkeitssatz. Der Nachweis von (a) benutzt ein a¨ hnliches Argument: Es sei f (n1 , . . . , nk ) = m und l wieder die kleinste Zahl, so dass N |= ψ(n1 , . . . , nk , m, l) gilt. Sei M |= PA− . Dann ist zu zeigen, dass m das einzige Element von M ist, welches die Formel ψ(n1 , . . . , nk , x, l) in M erf¨ullt. Dass es u¨ berhaupt in M die Formel erf¨ullt,
¨ 9.4. R EPR ASENTIERBARKEIT
174
liegt an der Absolutheit von ∆0 -Formeln. Sind a, b ∈ M zwei Elemente, so dass M |= ψ(n1 , . . . , nk , a, b), so m¨ussen (nach der Definition von ψ) a, b ≤ k + l und damit in N sein. Damit gilt dann wieder wegen der Absolutheit von ∆0 -Formeln auch N |= ψ(n1 , . . . , nk , a, b), woraus N |= ∃z ψ(n1 , . . . , nk , a, z) und damit a = m folgt. Der Teil (ii) folgt nun hieraus: Ist S rekursiv, so ist die charakteristische Funktion cS berechenbar, also nach (i) durch eine Σ1 -Formel θ (~x, y) in PA− repr¨asentiert. Dann wird S repr¨asentiert durch die Formel θ (~x, 1), denn es gilt PA− ` ¬θ (~x, 1) ⇐⇒ PA− ` θ (~x, 0).
175
Kapitel 10 Unvollst¨andigkeit und Unentscheidbarkeit ¨ Die beiden G ODEL schen Unvollst¨andigkeitss¨atze beruhen auf 1. einer Codierung der Formeln der Sprache durch Zahlen (G¨odel-Nummern), wodurch syntaktische Eigenschaften von Formeln als zahlentheoretische Aussagen in der Sprache der P EANO-Arithmetik selbst ausgedr¨uckt werden k¨onnen und 2. einem Diagonalverfahren.
10.1 G¨odel-Nummern ¨ Zun¨achst ordnen wir jedem Term t der Sprache L von PA− eine Zahl, die G ODEL Nummer ptq, durch primitive Rekursion wie folgt zu: p0q = 1 p1q = 3 pvi q = 32 · 5i ps + tq = 33 · 5psq · 7ptq ps · tq = 34 · 5psq · 7ptq 2 3 ¨ So ist z. B. pv3 + 1q = 33 · 53 ·5 · 73 . Ahnlich kann man nun den Formeln ihre ¨ jeweilige G ODEL -Nummer zuordnen:
10.2. D IAGONALISIERUNGSLEMMA
176
ps = tq = 2 · 5psq · 7ptq ps < tq = 2 · 3 · 5psq · 7ptq p¬ϕq = 2 · 32 · 5pϕq pϕ ∨ ψq = 2 · 33 · 5pϕq · 7pψq p∃vi ϕq = 2 · 34 · 5i · 7pϕq
Nat¨urlich gibt es auch viele andere M¨oglichkeiten einer Codierung; wichtig ist hier nur, dass es sich um eine berechenbare injektive Abbildung aller L-Formeln1 auf eine berechenbare Teilmenge Fml ⊆ N handelt und dass die die Umkehrabbildung (definiert auf der Menge Fml) ist ebenfalls berechenbar ist (so dass wir ¨ aus der G ODEL -Nummer pϕq die Formel ϕ wieder ausrechnen k¨onnen). Im folgenden ben¨otigen wir die Diagonal-Funktion d, definiert durch ( p∀y (y = n → σ (y))q, falls n = pσ (v0 )q f¨ur eine L-Formel σ (v0 ) d(n) = 0 sonst.
10.2 Diagonalisierungslemma T sei eine L-Theorie, θ (v0 ) eine L-Formel mit der einen freien Variablen v0 . Falls die Diagonalfunktion d in T repr¨asentierbar ist, so gibt es einen L-Satz G mit der Eigenschaft T ` G ↔ θ (pGq). Ist d durch eine Σ1 -Formel in T repr¨asentierbar und θ (v0 ) eine Π1 -Formel, so kann G als Π1 -Satz gew¨ahlt werden. Beweis: Ist d sei in T durch die Formel δ (x, y) repr¨asentiert, so definiere ψ(v0 ) := ∀y (δ (v0 , y) → θ (y)), 1 Berechenbare
Funktionen haben wir hier nur als zahlentheoretische Funktionen eingef¨uhrt, es ist jedoch nahe liegend, diesen Begriff auch auf andere Bereiche (wie endliche Folgen von Symbolen) auszudehnen.
¨ 10.3. S ATZ VON G ODEL -ROSSER
177
und setze n := pψ(v0 )q. (Achtung: n ist tats¨achlich eine Zahl, in welcher nat¨urlich ¨ die Variable v0 nicht vorkommt; dagegen geht die G ODEL -Nummer von v0 in die Berechnung von n ein!) F¨ur G w¨ahlt man nun den Satz G := ∀y (y = n → ψ(y)). ¨ Dann hat also G die G ODEL -Nummer d(pψ(v0 )q). Ist δ (x, y) eine Σ1 -Formel und θ (v) eine Π1 -Formel, so sind ψ und G (¨aquivalent zu) Π1 -Formeln. Somit bleibt zu zeigen, dass T ` G ↔ θ (pGq): Es gilt offenbar
(1)
T ` G ↔ ψ(n), T ` G ↔ ∀y(δ (n, y) → θ (y)).
d. h. nach Def. von ψ
Dass d in T durch δ (x, y) repr¨asentiert wird, besagt aber d(n) = pGq ⇒ T ` δ (n, pGq)
und
T ` ∃!y δ (n, y).
Somit gilt insbesondere (2)
T ` ∀y (δ (n, y) ↔ y = pGq) T ` G ↔ ∀y (y = pGq) → θ (y)), T ` G ↔ θ (pGq).
und zusammen mit (1) folgt daraus also
10.3 Satz von G¨odel-Rosser T sei eine rekursive Menge von (G¨odel-Nummern von) L-S¨atzen, so dass gilt: (i) T enth¨alt keinen Widerspruch, d. h. es gibt keinen L-Satz σ mit pσ q ∈ T und zugleich p¬σ q ∈ T, (ii) T enth¨alt alle Σ1 und Π1 -S¨atze, die in PA− gelten: {pσ q | σ ∈ Σ1 ∪ Π1 , σ Satz , PA− ` σ } ⊆ T. Dann ist T Π1 -unvollst¨andig in folgendem Sinne: es gibt einen Π1 -Satz τ mit pτq 6∈ T und p¬τq 6∈ T.
¨ ¨ 10.4. 1. G ODELSCHER U NVOLLST ANDIGKEITSSATZ
178
Beweis: Da T rekursiv ist, gibt es eine Σ1 -Formel θ (v), so dass f¨ur alle n ∈ N n ∈ T =⇒ PA− ` θ (n), n 6∈ T =⇒ PA− ` ¬θ (n). Nach dem Diagonalisierungslemma 10.2 gibt es einen Π1 -Satz τ mit PA− ` τ ↔ ¬θ (pτq). Mit (ii) folgt daraus pτq ∈ T ⇒ PA− ` θ (pτq) ⇒ PA− ` ¬τ ⇒ p¬τq ∈ T und ebenso mit (i) p¬τq ∈ T ⇒ pτq 6∈ T ⇒ PA− ` ¬θ (pτq) ⇒ PA− ` τ ⇒ pτq ∈ T, so dass weder pτq noch p¬τq in T sein k¨onnen.
Eine Theorie T heißt rekursiv-axiomatisierbar gdw sie ein Axiomensystem ¨ Σ besitzt, f¨ur welches die Menge der G ODEL nummern {pσ q | σ ∈ Σ} rekursiv ist.
10.4 1. G¨odelscher Unvollst¨andigkeitssatz T sei eine konsistente2 und rekursiv-axiomatisierbare Theorie der Sprache L, welche die Theorie PA− erweitert. Dann ist T Π1 -unvollst¨andig, d. h. es gibt einen Π1 -Satz τ mit T 6` τ und T 6` ¬τ. Beweis: Wir nehmen an, dass T sowohl konsistent und rekursiv-axiomatisierbar als auch Π1 -vollst¨andig ist und leiten daraus einen Widerspruch ab: Setze S := {pσ q | σ ∈ Σ1 ∪ Π1 , σ Satz , T ` σ }. Dann ist S rekursiv (denn um nachzupr¨ufen, ob ein Σ1 oder Π1 -Satz σ in S ist, braucht man nur die rekursive Aufz¨ahlung der in T beweisbaren S¨atze der Form 2 Die
¨ urspr¨ungliche Fassung des G ODEL schen Satzes hatte die st¨arkere Voraussetzung der ωKonsistenz von T (d. h. f¨ur alle L-Formeln θ (v) mit T ` θ (n) f¨ur alle n ∈ N ist T[∀v θ (v)] konsistent). ROSSER hat 1936 die obige st¨arkere Version bewiesen.
¨ ¨ 10.4. 1. G ODELSCHER U NVOLLST ANDIGKEITSSATZ
179
σ bzw. ¬σ zu durchlaufen, wegen der Π1 -Vollst¨andigkeit muß einer der beiden ¨ nach endlich-vielen Schritten auftauchen). Somit l¨asst sich der Satz von G ODEL ROSSER anwenden, wonach S Π1 -unvollst¨andig ist, ein Widerspruch! Jede konsistente Erweiterung T von PA− hat nach dem Satz von L INDEN BAUM 6.9.1 eine vollst¨andige und konsistente Erweiterung, von denen also keine rekursiv (d. h. entscheidbar) sein kann. Aus dem obigen Satz kann man u¨ brigens folgern, dass jede rekursive konsistente Erweiterung von PA− sogar 2ℵ0 -viele Erweiterungen und ebenso viele abz¨ahlbare Modelle besitzt, die nicht elementara¨ quivalent sind (s. R. Kaye [1991], pp. 39ff). ¨ Mit Hilfe einer G ODEL -Nummerierung kann man syntaktische Eigenschaften von Formeln in zahlentheoretische Eigenschaften u¨ bersetzen. Da auch Beweise endliche Folgen von Formeln sind, kann man auch diese durch nat¨urliche Zahlen codieren und L-Formeln BewT , bewbT finden, so dass (i) BewT (n, m) ausdr¨uckt: “n ist die Nummer eines Beweises einer Formel ϕ ¨ mit der G ODEL nummer m” und ¨ (ii) bewbT (m) :↔ ∃n BewT (n, m) ausdr¨uckt: “m ist die G ODEL nummer einer Formel ϕ, welche in T beweisbar ist.” Ist die Theorie T rekursiv-axiomatisierbar, so ist das Beweispr¨adikat rekursiv und das Beweisbarkeitspr¨adikat r.e. Ferner kann man dann f¨ur eine geeignete Σ1 Formel θ = bewbT die folgenden Ableitbarkeits-Bedingungen nachweisen: T ` σ =⇒ T ` θ (pσ q) T ` θ (pσ → τq)
→
(θ (pσ q) → θ (pτq))
T ` θ (pσ q)
→
θ (p(θ (pσ q)q)
¨ (Dabei sind σ , τ beliebige S¨atze der Sprache L, und die G ODEL -Nummern n sollten in diesen Formeln jeweils durch die entsprechenden Terme n ersetzt sein. Zum Nachweis ben¨otigt man allerdings eine st¨arkere Theorie als PA− , etwa PA.) Unter Benutzung eines derartigen Beweisbegriffes kann man auch die Konsistenz einer Theorie formalisieren, etwa ConT :↔ ¬θ (p0 = 1q). Damit kann man dann zeigen:
¨ ¨ 10.5. 2. G ODELSCHER U NVOLLST ANDIGKEITSSATZ
180
10.5 2. G¨odelscher Unvollst¨andigkeitssatz T sei eine Theorie der Sprache L, f¨ur welche ein formales Beweispr¨adikat θ = θT mit den obigen Bedingungen existiere (z. B. T = PA). Dann gilt: T ist konsistent =⇒ T 6` ConT . Beweis: (Skizze) Nach dem Diagonalisierungslemma existiert ein Satz τ, so dass: (∗)
T ` τ ↔ ¬θ (pτq).
Falls T ` τ, so folgt aus der 1. Ableitbarkeitsbedingung: T ` θ (pτq), also nach (*) T ` ¬τ, d. h. T ist inkonsistent. Damit haben wir: (∗∗)
T konsistent =⇒ T 6` τ.
Man zeige, dass sich dieser Beweis formalisieren und mit Hilfe des durch θ in T formalisierten Beweispr¨adikates darstellen l¨asst, also T ` ConT → ¬θT (pτq). Sei nun T konsistent, also nach (**) T 6` τ. Dann ist wegen (*) auch T 6` ¬θ (pτq) und somit auch T 6` ConT . Dieser Satz besagt also, dass man selbst mit den Mitteln der P EANO-Arithmetik keinen Beweis der Konsistenz dieser Theorie finden kann (ein Beweis der Konsistenz einer Theorie T w¨urde u¨ berdies nur u¨ berzeugend sein, wenn er unter schw¨acheren Voraussetzungen m¨oglich w¨are, als sie Theorie T zur Verf¨ugung stellt), und diese Aussage gilt auch f¨ur alle weiteren formalen Theorien, in welcher sich die P EANO-Arithmetik interpretieren l¨asst (wie z. B. die u¨ bliche axiomatische Mengenlehre).
10.6 Wahrheit ist nicht arithmetisch definierbar W¨ahrend sich die u¨ blichen syntaktischen Begriffe, die zu einer formalen Sprache L gebildet werden, in der Sprache der Zahlentheorie definieren lassen und ihre wesentlichen Eigenschaften zumindest in der Theorie PA beweisen lassen, ist dies f¨ur den semantischen Wahrheitsbegriff nicht m¨oglich:
181
10.7. U NENTSCHEIDBARKEIT
Satz von Tarski Es sei M |= PA− . Dann gibt es keine L-Formel θ (v), so dass f¨ur alle nat¨urlichen Zahlen n M |= θ (n) ⇐⇒ n = pσ q f¨ur einen L-Satz σ mit M |= σ . Beweis: Wenn es eine solche Wahrheitsdefinition θ g¨abe, so k¨onnte man nach dem Diagonalisierungslemma 10.2 einen Satz G finden, so dass PA− ` G
↔
M |= G
⇐⇒
¬θ (G),
insbesondere
M |= ¬θ (pGq).
Andererseits m¨usste f¨ur die Wahrheitsdefinition gelten: M |= G ⇐⇒ M |= θ (pGq), was aber zum Widerspruch f¨uhrt!
10.7 Unentscheidbarkeit Wie im vorigen Abschnitt werden wir gelegentlich eine formale Theorie T mit pTq = {pσ q | σ Satz mit T ` σ }, ¨ der Menge der G ODEL -Nummern der in T beweisbaren S¨atze identifizieren. So heißt eine Theorie T entscheidbar gdw pTq entscheidbar (d. h. rekursiv) ist; ist T nicht entscheidbar, so heißt T unentscheidbar. F¨ur eine entscheidbare Theorie T gibt es also ein effektives Verfahren, welches nach endlich-vielen Schritten feststellt, ob ein vorgegebener Satz (in der Sprache der Theorie) in T beweisbar ist oder nicht. Indem man die Diagonalfunktion d benutzt, kann man nach der Methode des ¨ Satzes von G ODEL -ROSSER 10.3 zeigen:
Satz Ist T eine konsistente Theorie der Sprache L, so sind nicht die Diagonalfunktion d und zugleich die Menge pTq in T repr¨asentierbar.
10.7. U NENTSCHEIDBARKEIT
182
Beweis: Wir nehmen an, dass sowohl d durch eine Formel δ (x, y) wie auch die Menge pTq durch eine Formel ϕT (v0 ) in T repr¨asentiert werden und w¨ahlen θ = ¬ϕT . Aus dem Diagonalisierungslemma 10.2 erhalten wir dann die Existenz einer Formel G mit (∗) T ` G ↔ ¬ϕT (pGq). 1. Fall: T ` G, also pGq ∈ pTq. Dann gilt wegen der Repr¨asentierbarkeit: T ` ϕT (pGq) und mit (*) auch T ` ¬G, d. h. T w¨are widerspruchsvoll. 2. Fall: T 6` G, also pGq 6∈ pTq. Dann gilt wiederum wegen der Repr¨asentierbarkeit: T ` ¬ϕT (pGq), mit (*) also T ` G, Widerspruch!
Folgerungen und Bemerkungen (i) Ist T eine konsistente Theorie der Sprache L, welche PA− erweitert, so ist T unentscheidbar. (Denn dann ist jede rekursive Funktion, also auch d, in T repr¨asentierbar.) Da dieses f¨ur die endlich-axiomatisierbare Theorie PA− gilt, so erhalten wir: (ii) Die Pr¨adikatenlogik, d. h. {pσ q | σ Satz mit ` σ }, ist unentscheidbar. (C HURCH 1936) Tats¨achlich gilt bereits: (iii) Die Pr¨adikatenlogik mit einem 2-stelligen Relationszeichen ist unentscheidbar (ebenso die PL mit mindestens zwei 1-stelligen oder mindestens einem 2-stelligen Funktionszeichen). (T RACHTENBROT 1953) Denn es gibt eine endlich-axiomatisierbare Teiltheorie der Mengenlehre (in der Sprache mit der ∈-Relation), in welcher sich alle rekursiven Funktionen repr¨asentieren lassen. Dagegen ist (iv) die monadische Pr¨adikatenlogik (mit nur 1-stelligen Relationszeichen außer der Gleichheit) entscheidbar. (B EHMANN 1922) (v) Die Theorie der Gruppen ist unentscheidbar (M ALCEV 1961), die Theorie der A BELschen Gruppen dagegen ist entscheidbar (W. S MIELEW 1949). Ein Beispiel eines Entscheidungsverfahrens f¨ur eine algebraische Theorie behandeln wir im n¨achsten Teil.
183
10.7. U NENTSCHEIDBARKEIT
¨ die Pr¨adikatenlogik Das Entscheidungsproblem fur ¨ ¨ Ohne Beweis (s. hierzu etwa B ORGER -G R ADEL -G UREVICH 1997) f¨uhren wir die folgenden Ergebnisse an: • entscheidbar (bez¨uglich Allgemeing¨ultigkeit) sind Formeln der Pr¨adikatenlogik mit folgenden Pr¨afixtypen: ∀...∀∃...∃ ∀...∀∃∀...∀ ∀ . . . ∀ ∃∃ ∀ . . . ∀
(ohne =-Zeichen!)
• unentscheidbar (bez¨uglich Allgemeing¨ultigkeit) sind bereits Formeln der Pr¨adikatenlogik mit folgendem Pr¨afix (selbst ohne =-Zeichen): ∃∀∃ • Reduktionstypen (d. h. Allgemeing¨ultigkeit ist auf Formeln dieses Typs zur¨uckzuf¨uhren) sind die folgenden Formelklassen:
∃∃∃ ∀ . . . ∀ ∃∃ ∀ . . . ∀∃ ∃∃ ∀ ∃ . . . ∃ ∀∃∀∃...∃
184
Teil IV Reelle Zahlen und Entscheidbarkeit
185
Kapitel 11 Quantorenelimination W¨ahrend die Theorie der nat¨urlichen Zahlen unentscheidbar ist, sich also auch nicht rekursiv axiomatisieren l¨asst, ist die Theorie der reellen Zahlen entscheidbar und hat eine nat¨urliche Axiomatisierung als Theorie reell-abgeschlossener K¨orper. Meistens erfolgt der Nachweis der Entscheidbarkeit einer Theorie T dadurch, dass man • nachweist, dass jede Formel sich zu einer (in T a¨ quivalenten) quantorenfreien Formel umwandeln l¨asst und • die G¨ultigkeit einer quantorenfreien Formel in der Theorie T (besonders einfach) entscheidbar ist. Auf modelltheoretische Methoden zur Quantorenelimination hatten wir schon in 4.6 hingewiesen; hier wollen wir ein Verfahren (nach P.J. C OHEN) darstellen, das speziell auf die Theorie der reellen Zahlen zugeschnitten ist.
11.1 Theorie der reellen Zahlen In diesem Teil sei L = LOR die Theorie der geordneten Ringe mit den nichtlogischen Symbolen <, +, −, ·, 0, 1, so dass zu den Symbolen der Sprache der nat¨urlichen Zahlen noch ein 1-stelliges Zeichen − f¨ur die Subtraktion hinzukommt. Die Theorie TRCF der reell-abgeschlossenen K¨orper l¨asst sich in dieser Sprache formulieren mit den Axiomen f¨ur
186
11.2. E FFEKTIVE F UNKTIONEN
(1) angeordnete K¨orper, etwa die Axiome A1-A12 von PA− , verst¨arkt durch Axiome A16
∀x(x + (−x) = 0)
A17
∀x(x 6= 0 → ∃y x · y = 1)
u¨ ber die Umkehroperationen, sowie den ¨ Polynome (2) Zwischenwertsatz fur x < y ∧ p(x) < 0 < p(y) → ∃z (x < z < y ∧ p(z) = 0), wobei p(x) ein beliebiges Polynom in x der Form an xn + . . . a0 ist. Als Standardstruktur dieser Theorie betrachten wir hier die reellen Zahlen R = (R,
11.2 Effektive Funktionen Eine k-stellige Relation R ⊆ Rk heißt effektiv gdw es eine quantorenfreie Formel ϕ gibt, welche R u¨ ber den reellen Zahlen definiert: R(x1 , . . . , xk ) ⇐⇒ R |= ϕ[x1 , . . . , xk ], eine k-stellige Funktion f : D → R mit D ⊆ Rk heißt effektiv gdw (i) der Definitionsbereich D von f effektiv ist und (ii) f¨ur jede effektive Relation R(z1 , . . . , zn , y) auch die Relation S(z1 , . . . , zn , x1 , . . . , xk ) = R(z1 , . . . , zn , f (x1 , . . . , xk )) effektiv ist. Effektive Relationen sind also Teilmengen von Rk , die durch Gleichungen und Ungleichungen der Form p(x1 , . . . , xk ) = 0, p(x1 , . . . , xk ) > 0, wobei p(x1 , . . . , xk ) ∈ Z[x1 , . . . , xk ], sowie aus B OOLEschen Kombinationen von solchen Mengen gebildet werden.
11.2. E FFEKTIVE F UNKTIONEN
187
Beispiele √ Neben den elementaren Operationen (s. u.) ist die Funktion x effektiv: Der De√ finitionsbereich ist die effektive Menge {x | x ≥ 0}, und es ist etwa x < 17 ⇐⇒ 0 ≤ x < 172 . Lemma Die Funktionen x + y, −x, x · y, x : y sind effektiv. Beweis: In den ersten drei F¨allen ist die Behauptung unmittelbar klar, im Falle der Division ist der Definitionsbereich die effektive Menge {x, y | |y 6= 0}. Sei nun R(z1 , . . . , zn , y) eine effektive Relation. Dann ist die Relation R(z1 , . . . , zn , x : y) eine B OOLEsche Kombination von Relationen der Form n x x an + . . . + a1 + a0 > 0 bzw. = 0, y y welche a¨ quivalent zu der atomaren Formel an xn + . . . + an−1 xn−1 y + . . . a1 xyn−1 + a0 yn > 0 bzw. = 0, ist (wobei n als gerade Zahl angenommen werden kann).
Lemma Die Komposition effektiver Funktionen ist wieder effektiv, und somit sind alle rationalen Funktionen f ∈ Q(x1 , . . . , xn ) effektiv. F¨ur reelle Zahlen erweitern wir die Vorzeichenfunktion durch f¨ur x > 0, 1 sgn(x) = 0 f¨ur x = 0, −1 f¨ur x < 0. Diese Funktion ist offenbar effektiv, allgemeiner gilt: Lemma Nimmt die Funktion f : D → Z nur endlich-viele Werte (und zwar ganze Zahlen) an, so ist f effektiv gdw f¨ur jedes j ∈ Z die Relation f (~x) = j effektiv ist.
11.2. E FFEKTIVE F UNKTIONEN
188
Beweis: j1 , . . . , jk seien die endlich-vielen Werte von f . Der Teil (⇒) ist trivial. Ist umgekehrt R(~z, y) eine effektive Relation und sind alle Relationen f (~x) = j effektiv, so ist auch die Relation R(~z, f (~x)) effektiv, da sie a¨ quivalent ist zu ( f (~x) = j1 ∧ R(~z, j1 )) ∨ . . . ∨ ( f (~x) = jk ∧ R(~z, jk )). Wie im Falle der rekursiven Funktionen sind auch die effektiven Funktionen unter Fallunterscheidungen abgeschlossen: Lemma Sind f1 , f2 effektive Funktionen und ist die Relation A(~x) effektiv, so ist auch die Funktion ( f1 (~x) falls A(~x), f (~x) = f2 (~x) falls ¬A(~x) effektiv (¨ahnlich f¨ur mehr als 2 Funktionen).
Lemma Eine Funktion f ist effektiv gdw f¨ur jede nat¨urliche Zahl d ≥ 0 und jedes Polynom q(y) ∈ R(y) vom Grad d die Funktion sgn(q( f (~x))) eine effektive Funktion von ~x und den d + 1 Koeffizienten von q ist. Beweis von (⇒): Es ist z. B. sgn(q( f (~x))) < 1 ⇐⇒ q( f (~x)) ≤ 0 ⇐⇒ R( f (~x)), wobei R(y) das Pr¨adikat q(y) ≤ 0 ist. (⇐): Da jede effektive Relation R(~z, y) eine B OOLEsche Kombination von Pr¨adikaten der Form p(~z, y) > 0 und p(~z, y) = 0 mit p ∈ Z[~z, y] ist, gen¨ugt es zu zeigen, dass f¨ur solche Polynome auch die Relation p(~z, f (~x)) > 0 effektiv ist. Dazu fasse man das Polynom p(~z, y) als Polynom q(y) ∈ Z[~z][y] auf, d. h. als Polynom in y mit Koeffizienten aus Z[~z]. Dann gilt p(~z, f (~x)) > 0 ⇐⇒ sgn(q( f (~x))) = 1. Nach Voraussetzung ist sgn(q( f (~x))) eine effektive Funktion von ~x und den Koeffizienten von q und somit auch eine effektive Funktion von ~x und~z.
11.2. E FFEKTIVE F UNKTIONEN
189
Das Hauptergebnis besagt nun, dass die reellen Nullstellen eines Polynoms effektive Funktionen der Koeffizienten sind, wie man es z. B. f¨ur quadratische Gleichungen ax2 + bx + c = 0 kennt: p 1 (−b ± b2 − 4ac), 2a woraus abzulesen ist, dass die L¨osungen effektive Funktionen der Koeffizienten a, b, c sind: x=
Hauptlemma Es sei p(x) = an xn + . . . + a0 ∈ R(x) ein reelles Polynom mit den Koeffizienten ~a = (a0 , . . . , an ). Dann gibt es effektive Funktionen ξ1 (~a), . . . , ξn (~a) und k = k(~a), so dass ξ1 (~a) < . . . < ξk (~a) s¨amtliche reellen Nullstellen von p(x) sind. Beweis durch Induktion u¨ ber n : Bilde die Ableitung p0 (x) = n an xn−1 + . . . + 2 a2 + a1 , auf welche wir die Induktionsvoraussetzung anwenden k¨onnen, so dass die Nullstellen von p0 unter den t1 < . . . < tm mit m = n − 1 vorkommen, wobei die ti0 s effektive Funktionen von ~a sind. p(x) ist monoton in jedem der offenen Intervalle (−∞,t1 ), (t1 ,t2 ), . . . , (tm−1 ,tm ), (tm , +∞). Also kann es in jedem dieser Intervalle h¨ochstens eine Nullstelle von p(x) geben; zus¨atzlich k¨onnen die Endpunkte t1 , . . . ,tm weitere Nullstellen sein. Somit ist die Anzahl der Nullstellen bestimmt durch die Werte sgn(p(t1 )), . . . , sgn(p(tm )), sgn(p0 (t1 − 1)), sgn(p0 (tm + 1)). Mittels Fallunterscheidung kann man also die Anzahl der Nullstellen k(~a) als effektive Funktion von ~a bestimmen. Wir m¨ussen nun auch die Nullstellen selbst als effektive Funktion angeben. Dazu w¨ahlen wir eine Nullstelle ξ = ξ (~a), die etwa im Intervall (t1 ,t2 ) liege, wobei p(t1 ) > 0 und p(t2 ) < 0 sei. Nach dem vorhergegangenen Lemma gen¨ugt es zu zeigen, dass f¨ur jede Zahl d ≥ 1 und jedes Polynom q(x) vom Grad d die Funktion sgn(q(ξ )) effektiv ist (in ~a und den Koeffizienten von q(x)).
11.2. E FFEKTIVE F UNKTIONEN
190
Wir k¨onnen nun weiterhin annehmen, dass Grad(q(x)) < n ist. denn anderenfalls dividieren wir q durch p mit dem Rest r, also q(x) = p(x) g(x) + r(x) mit Grad(r(x)) < n, und ersetzen in sgn(q(ξ )) das Polynom q durch den Rest r, und beachten, dass die Koeffizienten von r effektive Funktionen der Koeffizienten von p und q sind. Somit k¨onnen wir die Induktionsvoraussetzung auch auf das Polynom q anwenden, dessen Nullstellen unter den u1 < . . . < um vorkommen m¨ogen, die effektiv von den Koeffizienten von q abh¨angen. Das Vorzeichen von q(x) in den (m + 1) Intervallen (−∞, u1 ), (u1 , u2 ), . . . , (um−1 , um ), (um , +∞), aus denen wir jeweils die Punkte s1 = u1 − 1, s2 =
u1 + u2 um−1 + um , . . . , sm = , sm+1 = um + 1 2 2
ausw¨ahlen, wird durch (m + 1) effektive Funktionen in diesen Punkten sgn(q(s1 )), sgn(q(s2 )), . . . , sgn(q(sm )), sgn(q(sm+1 )) bestimmt. Schließlich wird die Lage von ξ relativ zu den u0i s festgelegt durch die Lage von t1 und t2 zu den u0i s und durch die sign(p(ui ))0 s. Somit k¨onnen wir Fallunterscheidungen benutzen, um - wie erforderlich - sgn(q(ξ )) als effektive Funktion in ~a und den Koeffizienten von q(x) zu bestimmen. Damit erhalten wir als entscheidenden Schritt zur Quantorenelimination das Lemma Ist R(x1 , . . . , xk ) eine effektive Relation, so auch die Relation S(x2 , . . . , xk ) := ∃x1 R(x1 , . . . , xk ). Beweis: Als effektive Relation ist R(x1 , . . . , xk ) eine B OOLEsche Kombination von Ungleichungen der Form pi (x1 ) > 0, 1 ≤ i ≤ l, wobei die pi (x) als Polynome in den Unbestimmten x2 , . . . xk mit ganzzahligen Koeffizienten aufgefasst werden k¨onnen. Aufgrund des Hauptlemmas sind die Nullstellen der pi (x) effektive Funktionen der x2 , . . . xk ; die Nullstellen seien bezeichnet mit ξ1 , . . . , ξm . Die pi (x) k¨onnen also nur an diesen Stellen ihr Vorzeichen wechseln, und damit ist die Relation ∃x1 R(x1 , . . . , xk )
11.2. E FFEKTIVE F UNKTIONEN
191
a¨ quivalent zu einer endlichen Disjunktion der Form R(η1 , x2 , . . . , xk ) ∨ . . . ∨ R(ηn , x2 , . . . , xk ), wobei die η1 , . . . , ηn eine Liste aller Zahlen ξi , (ξi + ξ j )/2 und der ξi ± 1 ist. Da dieses effektive Funktionen der x2 , . . . xk sind, so ist auch die obige Disjunktion ein effektives Pr¨adikat von x2 , . . . xk . Satz Jede k-stellige Relation A ⊆ Rk , die u¨ ber R definierbar ist, ist effektiv. Beweis: Es sei A ⊆ Rk u¨ ber R definiert durch eine Formel ϕ(x1 , . . . , xk ). Es gen¨ugt zu zeigen, dass ϕ in R a¨ quivalent ist zu einer quantorenfreien Formel ϕ ∗ . F¨ur quantorenfreies ϕ setzen wir einfach ϕ ∗ = ϕ. Der Induktionsschritt f¨ur die aussagenlogischen Verkn¨upfungen ist trivial, und f¨ur den Fall ϕ(~y) = ∃x ψ(x,~y) k¨onnen wir das obige Lemma anwenden: Nach Induktionsvoraussetzung ist ψ(x,~y) u¨ ber R a¨ quivalent zu einer quantorenfreien Formel ψ(x,~y)∗ , die also eine effektive Relation R(x,~y) u¨ ber R definiert. Nach obigem Lemma ist die Relation S(~y) := ∃x R(x,~y) effektiv, also definierbar durch eine quantorenfreie Formel ϕ ∗ . Korollar F¨ur eine Relation R ⊆ R sind folgende Bedingungen a¨ quivalent: (i) R ist effektiv, (ii) R ist definierbar u¨ ber R, Eine entsprechende Aussage gilt f¨ur Funktionen f : D → R, D ⊆ Rk . Beweis: F¨ur Relationen folgt die Aussage aus dem vorigen Satz, f¨ur Funktionen kann man sie hierauf zur¨uckf¨uhren: Ist f effektiv, so ist der Graph y = f (~x) effektiv, also durch eine quantorenfreie Formel definierbar. Ist umgekehrt f (d. h. der Graph y = f (~x)) durch eine quantorenfreie Formel definierbar und ist R(~z, y) eine effektive Relation, so ist die Relation R(~z, f (~x)) a¨ quivalent zu der definierbaren Relation ∃y (y = f (~x) ∧ R(~z, y)), also nach den obigen Ergebnissen ebenfalls effektiv. Damit ist dann auch f als effektiv nachgewiesen.
192
Kapitel 12 Entscheidbarkeit 12.1 Reell-abgeschlossene K¨orper Da wir f¨ur die Ergebnisse des vorigen Kapitels u¨ ber definierbare Relationen von reellen Zahlen nur die Eigenschaften eines reell-abgeschlossenen K¨orpers benutzt haben, erhalten wir den ¨ ¨ reell-abgeschlossene K¨orper Satz uber die Quantorenelimination fur Zu jeder LOR -Formel ϕ gibt es eine quantorenfreie Formel ϕ ∗ mit TRCF ` ϕ ↔ ϕ ∗ . Außerdem l¨asst sich die Formel ϕ ∗ mittels eines Algorithmus’ aus ϕ bestimmen. Korollar (i) Die Theorie TRCF der reell-abgeschlossenen K¨orper ist entscheidbar. (i) Die Theorie TRCF der reell-abgeschlossenen K¨orper ist vollst¨andig, und zwar ist TRCF = Th(R). Beweis: Wegen der Quantorenelimination gibt es eine Funktion e, die jeder Formel ϕ eine in TRCF a¨ quivalente quantorenfreie Formel ϕ ∗ zuordnet, und zwar ¨ kann die Funktion e als rekursive Funktion (der G ODEL -Nummern) gew¨ahlt werden. Im Falle eines Satzes σ der Sprache LOR erh¨alt man einen quantorenfreien Satz σ ∗ , der also eine B OOLEsche Kombination von atomaren S¨atzen der Form t = s und t < s ist. Die G¨ultigkeit solcher S¨atze (z. B. 0 + (1 + 0) < (1 + 1) · −(1 ·
12.2. P RESBURGER -A RITHMETIK
193
(1 + 0)) + 1) l¨asst sich aber leicht ausrechnen. Zugleich sehen wir hieraus, dass f¨ur einen Satz σ die G¨ultigkeit in der Theorie TRCF gleichbedeutend ist mit der G¨ultigkeit in dem Modell R, woraus sich die Aussage (ii) ergibt. ¨ Ahnliche Ergebnisse gelten f¨ur die Theorie (in der Sprache der K¨orper) TACF der algebraisch-abgeschlossenen K¨orper: Fr¨uher hatten wir bereits bemerkt, dass diese Theorie modellvollst¨andig ist (s. 4.6) und Quantorenelimination besitzt; legt man auch die Charakteristik fest, so ist sie entscheidbar und vollst¨andig, und zwar stimmt sie im Falle der Charakteristik 0 u¨ berein mit der Theorie der komplexen Zahlen.
12.2 Presburger-Arithmetik W¨ahrend die Theorie der nat¨urlichen Zahlen mit Addition und Multiplikation nach den Ergebnissen des vorigen Kapitels unentscheidbar ist, geh¨ort die Theorie der nat¨urlichen Zahlen, beschr¨ankt auf Ordnung und Addition, nach M. P RES BURGER zu den entscheidbaren Theorien. F¨ ur den Nachweis benutzen wir ein Lemma, das auch in anderen F¨allen der Quantorenelimination n¨utzlich ist: Lemma Eine Theorie T l¨asst Quantorenelimination zu gdw jede einfache ∃-Formel der Form (∗) ∃x (ψ1 ∧ . . . ∧ ψn ) (wobei die ψi also Basis-Formeln sind) in T a¨ quivalent ist zu einer quantorenfreien Formel. Dabei kann man im Falle, dass die Sprache L mindestens eine Konstante besitzt, zus¨atzlich annehmen, dass unter den ψi keine Formel von der Form x = x, x 6= x, x = t ist (wobei x nicht in t vorkommt). Beweis: Man kann annehmen, dass eine vorgegebene Formel in pr¨anexer Normalform Q1 x1 . . . Qn xn ψ ist, wobei - etwa im Falle Qn = ∃ wiederum ψ in disjunktiver Normalform ist. Wegen der Umformungsregel 6.5.2 (i) kann man den Existenzquantor mit den Disjunktionen vertauschen, so dass man eine Formel der Form (*) erh¨alt, in welcher sich nach Voraussetzung der Quantor eliminieren l¨asst (im Falle des ∀-Quantors kommt man durch Bildung der Negation auf den obigen Fall zur¨uck). Somit lassen sich der Reihe nach s¨amtliche Quantoren eliminieren.
194
12.2. P RESBURGER -A RITHMETIK
Der Zusatz folgt aus den logischen Umformungen ∃x(x = t ∧ χ(x)) ↔ χ(t) x = x ↔ c = c,
(falls x nicht in t)
x 6= x ↔ c 6= c.
Die Theorie Th(N, <, +, 0, 1) selbst l¨asst Quantorenelimination erst zu, wenn man die Sprache erweitert durch zus¨atzliche einstellige Pr¨adikate m| f¨ur alle nat¨urlichen Zahlen m > 0, die explizit definierbar sind durch m|x :↔ ∃y my = x,
wobei my := y + . . . + y, (−m)y = −my | {z } m−mal
(d. h. in Th(N, <, +, 0, 1) sind alle Quantoren - bis auf die obigen! - eliminierbar). Um dieses Ergebnis nachzuweisen, ist es bequem, von den nat¨urlichen zu den ganzen Zahlen Z und zur entsprechenden Struktur zur Sprache L0 (mit nichtlogischen Symbolen <, +, −, 0, 1) bzw. zur erweiterten Sprache L (mit den zus¨atzlichen Symbolen 2|, 3|, . . .) u¨ berzugehen. Die Theorie ZG hat folgende Axiome: 1. Axiome f¨ur eine geordnete A BELsche Gruppe, 2. ∀x (0 < x ↔ 1 ≤ x), 3. δm := ∀x
W
k<m m|x + k
f¨ur m = 2, 3, . . .
ZG0 sei die entsprechende Theorie in der Sprache ohne die Symbole m|; ZG ist somit eine Erweiterung von ZG0 durch Definitionen, also eine konservative Erweiterung. Die Modelle von ZG0 heißen Z-Gruppen; es l¨asst sich zeigen, dass diese genau die geordneten A BELschen Gruppen sind, die zum “Standardmodell” (Z, <, +, −, 0.1) elementar-¨aquivalent sind. Zum Nachweis der Quantorenelimination kann man sich nach obigem Lemma auf einfache ∃-Formeln beschr¨anken. Da in ZG gilt t 6= s ↔ s < t ∨ t < s, m 6 | t ↔
_
m|t + i, m|t ↔ m| − t,
0
kann man sich auf Formeln der Gestalt (obere Zahlen sind hier Indizes, keine Exponenten!) ∃x (
^
i
nx = ti0 ∧
^ i
ti1 < nx ∧
^ i
nx < ti2 ∧
^ i
mi |nx + ti3 )
195
12.2. P RESBURGER -A RITHMETIK j
beschr¨anken, wobei die Variable x in den Termen ti nicht vorkommt. (Zun¨achst kann die Zahl n noch von i abh¨angen und verschiedene Werte in den einzelnen Konjunktionen annehmen; durch Multiplikation mit einer geeigneten Zahl kommt man dann jedoch auf die obige Form mit einem gemeinsamen Wert f¨ur n.) Diese Formel l¨asst sich nun weiter umformen zu ∃y (
^
y = ti0 ∧
^
i
ti1 < y ∧
i
^
y < ti2 ∧
i
^
mi |y + ti3 ∧ n|y),
i
wobei man (wiederum nach obigem Lemma) annehmen kann, dass das erste Konjunktionsglied fehlt, und das letzte Konjunktionsglied n|y kann man zu dem vorletzten z¨ahlen. Damit erhalten wir eine Formel der Form (+) ∃x (
^
ti1 < x ∧
i
^ i
x < ti2 ∧
^
mi |x + ti3 ).
i≤k3
Falls die ersten beiden Konjunktionsglieder fehlen, ist diese Formel in ZG W V a¨ quivalent zu 1≤ j≤m i≤k3 mi | j +t 3j , wobei m das kleinste gemeinsame Vielfache der Zahlen m0 , . . . , mk ist. Falls k1 6= 0, so ist die obige Formel a¨ quivalent zu _ ^
[
n
ti1 ≤ tn1 ∧
_
^
1≤ j≤m i
tn1 + j < ti2 ∧
^
mi |tn1 + j + ti3 )].
i≤k
Eine a¨ hnliche Umformung erh¨alt man im Falle k1 = 0, k2 6= 0. Daraus ergibt sich nun - a¨ hnlich wie im Falle der reell-abgeschlossenen K¨orper: Satz (i) Die Theorie ZG l¨aßt Quantorenelimination zu, ist modellvollst¨andig und vollst¨andig. (i) Die Theorie ZG0 ist vollst¨andig und entscheidbar. ZG0 ist u¨ brigens auch modellvollst¨andig, erlaubt aber keine Quantorenelimination.
196
Kapitel 13 Literatur Geschichte B OCHENSKI , J.M.: Formale Logik. Alber, Freiburg 1966 D UMMETT, M.: Frege. Harvard Univ. Press 1991 D RUCKER , T H . (ed.): Perspectives on the history of mathematical logic. Birkh¨auser 1991 K UTSCHERA , F. V.: Gottlob Frege. Eine Einf¨uhrung in sein Werk. de Gruyter 1989 H ASENJAEGER , G.: Grundbegriffe und Probleme der math. Logik. Alber, Freiburg 1962 K NEALE , W. und M.: The development of logic. Oxford Univ. Press 1962 S CHOLZ , H.: Abriß der Logik. Alber, Freiburg 1996
Mathematische Logik A SSER , G.: Einf¨uhrung in die mathematische Logik I-III. Teubner 1981 E BBINGHAUS -F LUM -T HOMAS: Einf¨uhrung in die mathematische Logik. Spectrum Akademischer Verlag 1996 H ILBERT-B ERNAYS: Grundlagen der Mathematik I,II. Springer 1934/39, Neuauflage: 1968/70 H ILBERT-ACKERMANN: Grundz¨uge der mathematischen Logik. Springer (mehrere Auflagen) M ATES , B.: Elementare Logik. Vandenhoeck & Ruprecht 1978 M ENDELSON , E.: Introduction to Math. Logic. Chapman & Hall 1997
197
N OVIKOV, P.S.: Grundz¨uge der Mathematischen Logik. vieweg 1973 P RESTEL , A.: Einf¨uhrung in die Mathematische Logik und Modelltheorie. vieweg 1986 R AUTENBERG , W.: Einf¨uhrung in die Mathematische Logik. vieweg 2002 R ASIOWA -S IKORSKI: The Mathematics of Metamathematics. Polish Scientific Publ. 1968 S HOENFIELD , J.R.: Mathematical Logic. Addison-Wesley 1967 S IEFKES , D.: Formalisieren und Beweisen. vieweg 1990 T OURLAKIS , G.: Lectures in Logic and Set Theory. Cambridge 2003 T USCHIK -W OLTER: Mathematische Logik - kurzgefaßt. Spectrum Akademischer Verlag 2002
Mengenlehre C ANTOR , G.: Gesammelte Abhandlungen. Springer 1980 D EISER , O.: Einf¨uhrung in die Mengenlehre. Springer 2004 E BBINGHAUS , D.: Einf¨uhrung in die Mengenlehre. Spectrum Akademischer Verlag 2003 F ELGNER, U. (Herausgeber): Mengenlehre. Wiss. Buchgesellschaft 1979 F RAENKEL , A.- BAR H ILLEL , Y. - L E´ VY, A.: Foundations of Set Theory. Amsterdam 1973 F RIEDRICHSDORF, U.-P RESTEL , A.: Mengenlehre f¨ur den Mathematiker. vieweg 1985 J ECH , T H .: Set Theory. Springer 2003 L E´ VY, A.: Basic Set Theory. Springer 1979
Modelltheorie C HANG -K EISLER: Model Theory. Elsevier 1990 H ODGES , W.: Model Theory. Cambridge Univ. Press 1993 K AY, R.: Models of Peano Arithmetic. Oxford University Press 1991 M ARKER , D.: Model Theory. An Introduction Springer 2002 ROTHMALER , P.: Einf¨uhrung in die Modelltheorie. Spectrum 1995
198
Berechenbarkeit, Unentscheidbarkeit, Unvollst¨andigkeit ¨ B ORGER , E.: Berechenbarkeit, Komplexit¨at, Logik. vieweg 1992 ¨ ¨ B OGER -G R ADEL -G UREVICH: The classical decision problem. Springer 1997 C UTLAND , N.: Computability Cambridge University Press 1980 K AYE , R.: Models of Peano Arithmetic Clarendon Press 1991
Informatik, autom. Beweisen, Varia BARWISE , J. (ed.): Handbook of Mathematical Logic. Elsevier 1982 G ABBAY-G UENTHNER (ed.): Handbook of Philosophical Logic. Kluwer 2003 F ITTING , M.: First-order logic and automated theorem proving. Springer 1990 H EINEMANN -W EIHRAUCH: Logik f¨ur Informatiker Teubner 1991 H OFSTADTER , D.R.: G¨odel, Escher, Bach. Basic Book 1979, deutsch bei Klett-Cotta und dtv ¨ S CH ONING , U.: Logik f¨ur Informatiker B.I. Verlag 1987 Bibliographie ¨ G.H. M ULLER und V. L ENSKI (ed.): Ω-Bibliography of Mathematical Logic. Vol. I-VI. Springer 1987, fortgesetzt im internet unter: http://www-logic.uni-kl.de/BIBL/index.html Weitere links auch u¨ ber http://www.math.uni-heidelberg.de/logic/wwwlinks.html Skripten im Internet u¨ ber die links http://www.math.uni-heidelberg.de/logic/skripten.html http://www.uni-bonn.de/logic/world.html Biographien: http://www-groups.dcs.st-and.ac.uk/ history/BiogIndex.html ¨ Zeitschriften uber Mathematische Logik Annals of Pure and Applied Logic Archive of Mathematical Logic Fundamenta Mathematicae Journal of Symbolic Logic, Bulletin of Symbolic Logic Mathematical Logic Quarterly (fr¨uher: Zeitschrift f. math. Logik und Grundl. der Math.) Notre Dame Journal of Formal Logic