1
Bertrand Russell
Einführung in die mathematische Philosophie
R. LÖWIT • WIESBADEN
Alle Rechte vorbehalten Einzig...
81 downloads
1079 Views
927KB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
1
Bertrand Russell
Einführung in die mathematische Philosophie
R. LÖWIT • WIESBADEN
Alle Rechte vorbehalten Einzig berechtigte Übertragung aus dem Englischen
Inhalt Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 1. Die Folge der natürlichen Zahlen . . . . . . . . . . . . . . . . . . . . . . . 11 2. Die Definition der Zahl. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 3. Endlichkeit und mathematische Induktion . . . . . . . . . . . . . . . 31 4. Die Definition der Ordnung. . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 5. Die Beziehungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 6. Ähnlichkeit von Beziehungen . . . . . . . . . . . . . . . . . . . . . . . . . . 65 7. Rationale, reelle und komplexe Zahlen . . . . . . . . . . . . . . . . . . . 76 8. Unendliche Kardinalzahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 9. Unendliche Folgen und Ordinalzahlen. . . . . . . . . . . . . . . . . . 103 10. Limes und Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 11. Limes und Stetigkeit bei Funktionen. . . . . . . . . . . . . . . . . . . . 121 12. Die Theorie der Auswahlen und das multiplikative Axiom . 132 13. Das Axiom der Unendlichkeit und die logischen Typen . . . 147 14. Die Unverträglichkeit und die Theorie der Deduktion .. . . . 160 15. Satzfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172 16. Beschreibungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184 17. Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198 18. Mathematik und Logik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212 Schlagwortverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225
Einleitung Dieses Buch soll im wesentlichen eine „Einführung“ sein: es will keine erschöpfende Darstellung der behandelten Probleme geben. Sein Ziel ist, gewisse Ergebnisse, die bisher nur den Kennern des Logik-Kalküls zugänglich waren, in einer Form wiederzugeben, die dem Anfänger möglichst wenig Schwierigkeiten bereitet. Es wurde mit der größten Sorgfalt darauf geachtet, jede dogmatische Behauptung über Gebiete, die tatsächlich noch zweifelhaft sind, zu vermeiden. Diese Absicht war zum Teil für die Auswahl des Stoffes maßgebend. Die Anfangsgründe der mathematischen Logik sind nicht so genau bekannt wie ihre späteren Teile, aber sie sind philosophisch mindestens ebenso interessant wie diese. Der Inhalt der kommenden Kapitel ist zum großen Teil keine eigentliche „Philosophie“. Die hier betrachteten Probleme wurden solange zur Philosophie gerechnet, als ihre wissenschaftliche Behandlung noch nicht befriedigte. Das Wesen des Unendlichen und der Stetigkeit z. B. gehörte früher zur Philosophie und gehört heute zur Mathematik. Wahrscheinlich kann man die hierbei erreichten exakten Resultate nicht zur mathematischen Philosophie im strengen Sinn rechnen. Von der Philosophie der Mathematik wird man natürlich erwarten, daß sie Fragen behandelt, die an der Grenze unseres Wissens liegen, bei denen also eine relative Sicherheit noch nicht erreicht ist. Eine spekulative Behandlung dieser Fragen wird kaum fruchtbringend sein, solange man die mehr wissenschaftlichen Teile der Prinzipien der Mathematik nicht kennt. Ein Buch über diese Gebiete kann daher beanspruchen, als eine Einführung in die mathematische Philosophie zu gelten. Es beschäftigt sich aber nicht mit der eigentlichen Philosophie, ausgenommen an den Stellen, bei denen es sich außerhalb seines Gebietes bewegt. Immerhin untergräbt das
10
hier dargestellte wissenschaftliche System für seine Anhänger anscheinend viele Behauptungen der herkömmlichen Philosophie und sogar vieles von dem, was heute noch gilt. In dieser Hinsicht und wegen ihrer Anwendungsmöglichkeit auf noch ungelöste Probleme ist die mathematische Logik für die Philosophie von Bedeutung. Aus diesem Grund und wegen der Wichtigkeit des Gegenstands an sich ist eine kurze Darstellung der Hauptergebnisse der mathematischen Logik, bei der weder Kenntnis noch Eignung für die mathematische Symbolik vorausgesetzt wird, für die Philosophie wertvoll. Hier wie auf anderen Gebieten ist für die kommende Untersuchung die Methode wichtiger als das Resultat. Die Methode kann jedoch innerhalb der Grenzen eines Buches wie des vorliegenden nicht gut dargestellt werden. Hoffentlich interessiert es manche Leser in dem Maße, daß sie sich dann dem Studium der Methode zuwenden, welche die mathematische Logik bei der Untersuchung der traditionellen Probleme der Philosophie verwendet. Aber dieses Thema soll in den folgenden Zeilen nicht behandelt werden.
1. Die Folge der natürlichen Zahlen Das Studium der Mathematik kann, ausgehend von den allgemein bekannten Teilen, nach zwei entgegengesetzten Richtungen hin verfolgt werden. Die übliche Richtung ist konstruktiv, sie führt zu einer Schritt für Schritt sich steigernden Komplikation: von den ganzen Zahlen gelangt sie zu den Brüchen, reellen Zahlen, komplexen Zahlen, von der Addition und Multiplikation zur Differentiation und Integration und so weiter bis zur höheren Mathematik. Die andere Richtung ist weniger bekannt. Sie schreitet analytisch zu immer größerer Abstraktion und logischer Einfachheit fort. Sie fragt nicht, was man aus den ursprünglichen Grundannahmen definieren und ableiten kann, sondern was für allgemeinere Begriffe und Prinzipien gefunden werden können, durch die unser Ausgangspunkt definiert oder abgeleitet werden kann. Die Verfolgung dieser umgekehrten Richtung charakterisiert die mathematische Philosophie im Gegensatz zur gewöhnlichen Mathematik. Der Unterschied liegt aber wohlverstanden nicht im Wesen der Sache, sondern beruht auf dem Standpunkt des Forschers. Als die alten griechischen Geometer von den empirischen Regeln der ägyptischen Landmesser zu den allgemeinen Sätzen, durch die diese Regeln gerechtfertigt wurden, und von ihnen zu Euklids Axiomen und Postulaten übergingen, trieben sie nach der obigen Erklärung mathematische Philosophie. Wenn man aber einmal bis zu den Axiomen und Postulaten gelangt ist, so gehört ihre deduktive Verwendung, wie wir sie bei Euklid finden, zur Mathematik im gewöhnlichen Sinn. Der Unterschied zwischen Mathematik und mathematischer Philosophie hängt von den Zielen ab, die sich die Forschung stellt, und von dem Stand der Forschung, nicht aber von den Sätzen, die ihren Gegenstand bilden.
12
Man kann den gleichen Unterschied noch anders ausdrücken. Die einfachsten und leichtesten Dinge in der Mathematik kommen, logisch genommen, nicht am Anfang. Sie gehören ihrer logischen Deduktion nach irgendwo in die Mitte. Geradeso, wie man diejenigen Gegenstände am besten wahrnimmt, die weder sehr nah noch sehr fern, weder sehr klein noch sehr groß sind, so sind auch diejenigen Begriffe am einfachsten zu verstehen, die weder sehr kompliziert noch sehr einfach sind; einfach im logischen Sinn verstanden. Zur Erweiterung unseres Gesichtsfeldes brauchen wir zwei Instrumente, das Fernrohr und das Mikroskop. So brauchen wir auch zwei Instrumente zur Erweiterung unserer logischen Kräfte, eines, das uns vorwärts zur höheren Mathematik führt, ein anderes, das uns rückwärts zur logischen Grundlage der Dinge führt, die wir in der Mathematik für gesichert halten. Wir werden sehen, daß wir durch die Analyse unserer gewöhnlichen mathematischen Begriffe eine neue Einsicht, neue Kraft und die Möglichkeit erlangen werden, ganz neue mathematische Probleme zu lösen, wenn wir nach unserer Rückkehr aufs neue vorwärts gehen. Der Zweck dieses Buches besteht darin, die mathematische Philosophie einfach und ohne den fachwissenschaftlichen Apparat darzulegen. Wir dehnen unsere Untersuchungen nicht auf solche Gebiete aus, die noch zweifelhaft oder so schwierig sind, daß eine elementare Behandlung kaum möglich ist. Eine vollständige Behandlung findet man in den Principia mathematica1). Dieses Buch ist nur als Einführung gedacht. Leute von Durchschnittsbildung werden als Ausgangspunkt der Mathematik natürlich die Folge der ganzen Zahlen 1, 2, 3, 4, … usw. ansehen. Wahrscheinlich würde erst jemand, der eine gewisse mathematische Bildung besitzt, auf den Gedanken kommen, mit der 0 statt mit der 1 anzufangen. Wir nehmen diesen Grad von Bildung an und legen unserer Behandlung die Folge 0, 1, 2, 3, … n, n +1, … 1 ) Cambridge University Press, Bd. I, 1910; Bd. II, 1911; Bd. III, 1913. Von A. N. Whitehead und B. Russell.
13
zugrunde. Diese Folge wollen wir im folgenden die »Folge der natürlichen Zahlen“ nennen. Nur ein hoher Grad von Kultur macht es uns möglich, diese Folge als Ausgangspunkt zu wählen. Es hat sicher viele Jahrhunderte gedauert, bevor man entdeckt hat, daß ein Pärchen Fasanen und ein Paar Tage beides Beispiele für die Zahl 2 sind. Dazu gehört ein beträchtliches Abstraktionsvermögen. Die Entdeckung, daß 1 eine Zahl ist, muß schwer gewesen sein. Was die 0 betrifft, so ist sie erst in neuester Zeit hinzugekommen. Die Griechen und Römer kannten eine solche Ziffer nicht. Hätten wir unsere Untersuchung der mathematischen Philosophie in früherer Zeit geschrieben, so hätten wir mit etwas weniger Abstraktem als der Folge der natürlichen Zahlen anfangen müssen. Wir hätten sie als eine Station auf unserer Rückreise angetroffen. Wenn einmal die logischen Grundlagen der Mathematik bekannter sind, werden wir in der Lage sein, noch weiter rückwärts anzufangen, also in einem Punkt, der in der heutigen Analyse viel später auftritt. Augenblicklich aber scheinen die natürlichen Zahlen das einfachste und bekannteste in der Mathematik darzustellen. Obwohl sie uns vertraut sind, werden sie noch lange nicht verstanden. Nur sehr wenige Menschen besitzen eine Definition der „Zahl“, der „0“ oder der „1“. Man sieht leicht, daß man ausgehend von der 0 jede andere natürliche Zahl durch fortgesetzte Addition von 1 erreichen kann. Aber wir werden eben zu definieren haben, was unter „Addition von 1“ und „fortgesetzt“ zu verstehen ist. Diese Fragen sind keineswegs leicht. Man glaubte bis in die neueste Zeit, daß man zum mindesten einige von diesen ersten Begriffen der Arithmetik ohne weiteres hinnehmen müsse, weil sie zu einfach und ursprünglich seien, als daß man sie definieren könnte. Da alle definierten Ausdrücke wieder durch andere Ausdrücke definiert werden, ist es klar, daß unser menschliches Wissen sich zufrieden geben muß, irgend welche Ausdrücke als an sich ohne Definition verständlich hinzunehmen. Denn wir brauchen einen Ausgangspunkt für unsere Definitionen. Es ist nicht sicher, ob es Ausdrücke gibt, die nicht definiert werden können. Vielleicht können wir, soweit wir auch mit
14
unserer Definition zurückgehen, immer noch weiter zurückgehen. Andererseits ist es auch möglich, daß wir einmal, wenn unsere Analyse weit genug fortgeschritten ist, zu Begriffen kommen, die wirklich einfach sind und die ihrer logischen Natur nach eine analytische Definition nicht zulassen. Wir brauchen diese Frage hier nicht zu entscheiden. Für uns genügt folgende Bemerkung: Da die menschlichen Kräfte endlich sind, so müssen die uns bekannten Definitionen immer von irgend welchen Ausdrücken ausgehen, die augenblicklich, aber vielleicht nicht endgültig undefiniert sind. Man kann die gesamte herkömmliche reine Mathematik, einschließlich der analytischen Geometrie, als eine Reihe von Sätzen über die natürlichen Zahlen auffassen; d. h. die vorkommenden Ausdrücke lassen sich mit Hilfe der natürlichen Zahlen definieren, und die Sätze lassen sich aus den Eigenschaften der natürlichen Zahlen unter Hinzunahme der Begriffe und Sätze der reinen Logik ableiten. Es ist eine ziemlich neue Entdeckung, daß die ganze übliche reine Mathematik sich aus den natürlichen Zahlen ableiten läßt; aber man hat es lange vermutet. Pythagoras glaubte, daß nicht nur die Mathematik, sondern überhaupt alles aus den Zahlen abgeleitet werden könne. Dabei entdeckte er das stärkste Hindernis auf dem Weg der sogenannten „Arithmetisierung“ der Mathematik. Pythagoras stieß auf die inkommensurablen Größen, im besonderen die Inkommensurabilität der Seite des Quadrats mit der Diagonale. Wenn die Länge der Seite 1 cm beträgt, so ist die Länge der Diagonale in cm die Quadratwurzel aus 2, und das schien überhaupt keine Zahl zu sein. Das so entstandene Problem wurde erst in unseren Tagen gelöst. Vollständig gelöst wurde es nur durch die Zurückführung der Arithmetik auf die Logik, die in den folgenden Kapiteln auseinandergesetzt wird. Vorderhand wollen wir die Arithmetisierung der Mathematik hinnehmen, obwohl dies eine Leistung von größter Wichtigkeit war. Nachdem man die gesamte übliche reine Mathematik auf die Theorie der natürlichen Zahlen zurückgeführt hatte, war es die nächste Aufgabe der logischen Analyse, diese Theorie auf die geringste Zahl
15
von Voraussetzungen und undefinierten Ausdrücken zurückzuführen, aus denen sie abgeleitet werden konnte. Das hat Peano geleistet. Er zeigte, daß die gesamte Theorie der natürlichen Zahlen aus drei Grundbegriffen und fünf Grundsätzen unter Hinzunahme der Sätze der reinen Logik entwickelt werden kann. Diese drei Begriffe und fünf Sätze wurden so die Garanten der ganzen üblichen reinen Mathematik. Konnte man sie definieren oder mit Hilfe anderer Sätze beweisen, so gilt dies für die ganze reine Mathematik. Ihr logisches „Gewicht“, wenn man diesen Ausdruck einführen darf, ist gleich dem der Gesamtheit der Wissenschaften, die sich auf die Theorie der natürlichen Zahlen gründen. Die Wahrheit dieses ganzen Systems ist gesichert, wenn die Wahrheit der fünf Grundsätze gewährleistet ist, vorausgesetzt natürlich, daß der dabei verwendete logische Apparat keinen Irrtum enthält. Die Arbeit, die Mathematik zu analysieren, ist durch diese Leistung Peanos außerordentlich erleichtert worden. Die drei Grundbegriffe in Peanos Arithmetik sind: 0, Zahl, Nachfolger. Unter „Nachfolger“ versteht er die nächste Zahl in der natürlichen Ordnung, d. h. der Nachfolger von 0 ist 1, der Nachfolger von 1 ist 2 usw. Unter „Zahl“ versteht er in diesem Zusammenhang die Menge der natürlichen Zahlen1). Er nimmt nicht an, daß wir alle Elemente dieser Menge kennen, sondern nur, daß wir wissen, was unter der Behauptung, dies und das ist eine Zahl, zu verstehen ist. Geradeso, wie wir den Sinn des Satzes: „Hans ist ein Mensch“ verstehen, obwohl wir nicht alle Menschen einzeln kennen. Die fünf Grundsätze von Peano lauten: (1) 0 ist eine Zahl. (2) Der Nachfolger irgend einer Zahl ist eine Zahl. (3) Es gibt nicht zwei Zahlen mit demselben Nachfolger. (4) 0 ist nicht der Nachfolger irgend einer Zahl. (5) Jede Eigenschaft der 0, die auch der Nachfolger jeder Zahl mit dieser Eigenschaft besitzt, kommt allen Zahlen zu.
1) Wir verwenden „Zahl“ hier in diesem Sinne. Später werden wir dieses Wort in einem allgemeineren Sinn verwenden.
16
Der letzte Satz ist das P r i n z i p d e r m a t h e m a t i s c h e n I n d u k t i o n . Wir werden darüber im folgenden sehr viel zu sagen haben. Augenblicklich kommt es für uns nur als Bestandteil der Peanoschen Analyse der Arithmetik in Betracht. Sehen wir einmal zu, auf welche Weise die Theorie der natürlichen Zahlen aus diesen drei Begriffen und fünf Sätzen folgt. Zunächst definieren wir 1 als „den Nachfolger von 0“, 2 als den „Nachfolger von 1“ usw. Natürlich können wir mit diesen Definitionen beliebig weit gehen. Denn wegen (2) wird jede Zahl, die wir erreichen, einen Nachfolger haben, und wegen (3) kann dies keine der bisher definierten Zahlen sein. Denn wäre dies der Fall, so hätten zwei verschiedene Zahlen denselben Nachfolger. Und wegen (4) kann keine der Zahlen, die wir in der Folge der Nachfolger erreichen, die 0 sein. So ergibt die Folge der Nachfolger eine endlose Reihe von immer neuen Zahlen. Wegen (5) kommen in dieser Folge, die mit 0 beginnt und von einem Nachfolger zum nächsten fortschreitet, alle Zahlen vor. Denn a) 0 gehört zu dieser Folge, und b) wenn eine Zahl n dazu gehört, so gilt dies auch vom Nachfolger, und daher gehört gemäß der mathematischen Induktion jede Zahl zur Folge. Angenommen, wir wollen die Summe von zwei Zahlen definieren. Wir nehmen irgend eine Zahl m, dann definieren wir m + 0 als m und m + (n + 1) als den Nachfolger von m + n. Wegen (5) erhalten wir so eine Definition der Summe von m+n, welches auch die Zahl n sei. Ähnlich können wir das Produkt von zwei beliebigen Zahlen definieren. Der Leser kann sich leicht davon überzeugen, daß jeder gewöhnliche elementare Satz der Arithmetik aus unseren fünf Annahmen bewiesen werden kann, und wenn er irgend welche Schwierigkeiten hat, so kann er den Beweis bei Peano nachlesen. Jetzt müssen wir zu Betrachtungen übergehen, die uns notwendigerweise über Peano hinaus zu Frege führen. Peano stellt die letzte Vollendung der „Arithmetisierung“ der Mathematik dar, während es Frege als erstem gelungen ist, die Mathematik zu „logisieren“, d. h. die arithmetischen Begriffe, die, wie seine Vorgänger dargetan haben, für die Mathematik ausreichen, auf die Logik zurückzu-
17
führen. Wir werden in diesem Kapitel Freges Definition der Zahl und besonderer Zahlen tatsächlich nicht bringen, sondern nur einige Gründe anführen, warum Peanos Behandlung nicht so endgültig ist, wie es scheint. Zunächst lassen sich die drei Grundbegriffe Peanos, nämlich „0“, „Zahl“ und „Nachfolger“ auf unendlich viele Arten deuten, und jede von ihnen genügt den fünf Grundsätzen. Einige Beispiele: (1)„0“ soll 100 und „Zahl“ soll die Zahlen von 100 aufwärts bedeuten. Dann wird unseren Grundsätzen Genüge geleistet. Selbst (4) gilt, denn obwohl 100 der Nachfolger von 99 ist, so ist 99 keine „Zahl“ in dem Sinn, den wir jetzt dem Wort „Zahl“ geben. Offensichtlich kann man dieses Beispiel statt mit 100 mit jeder beliebigen Zahl bilden. (2)„0“ soll die übliche Bedeutung haben, aber unter „Zahl“ soll eine „gerade Zahl“ in der üblichen Bezeichnungsweise und unter „Nachfolger“ einer Zahl die Zahl verstanden werden, die aus ihr durch Addition von 2 entsteht. Dann bedeutet „1“ die Zahl 2, „2“ bedeutet die Zahl 4 usw. Die Folge der Zahlen lautet dann: 0, 2, 4, 6, 8, … Wieder werden alle fünf Annahmen Peanos erfüllt. (3)Es soll „0“ die Zahl 1 bedeuten, „Zahl“ soll die Folge 1 1 1 1 1, /2, /4, /8, /16 , … und „Nachfolger“ „die Hälfte von“ bedeuten. Für diese Folge treffen dann alle fünf Axiome von Peano zu. Es ist klar, daß man diese Beispiele ins Unendliche vermehren kann. In der Tat: hat man irgend eine unendliche Folge x0, x1, x2, x3, x4, … xn, … die keine Wiederholungen aufweist, einen Anfang hat und keine Glieder besitzt, die vom Anfang an durch eine endliche Zahl von Schritten nicht erreicht werden können, so haben wir eine Folge von Elementen, für welche Peanos Axiome gelten. Dies erkennt man leicht, obwohl der formale Beweis etwas umständlich ist. „0“ sei x0, „Zahl“ jedes Element der Folge, und „Nachfolger“ von x“ soll xn+1 sein. Dann gilt Folgendes:
18
(1)„0 ist eine Zahl“, d. h. x0 ist ein Glied der Folge. (2)„Der Nachfolger irgend einer Zahl ist wieder eine Zahl“, d. h. neh-men wir irgend ein Glied xn der Folge, so gehört xn+1 ebenfalls zur Folge (3)„Nicht zwei Zahlen haben denselben Nachfolger“, d. h. wenn xm und xn zwei verschiedene Glieder der Folge sind, so sind xm+1 und xn+1 verschieden. Dies folgt aus der Voraussetzung, daß in der Folge keine Wiederholungen vorkommen. (4)„0 ist nicht der Nachfolger irgend einer Zahl“, d. h. kein Glied in der Folge kommt vor x0 . (5)„Jede Eigenschaft von x0 , die dem xn+1 zukommt, wenn xn sie besitzt, ist allen Zahlen gemeinsam“. Dies folgt aus der entsprechenden Eigenschaft der Zahlen. Eine Folge der Form x , x1, x2 , … xn , … in der es ein erstes Glied gibt, jedes Glied einen Nachfolger besitzt, (so daß es kein letztes Glied gibt,) keine Wiederholungen vorkommen und wo jedes Glied vom Beginn an durch eine endliche Zahl von Schritten erreicht werden kann, heißt eine Progression. Progressionen sind für die Prinzipien der Mathematik von großer Wichtigkeit. Wie wir gerade gesehen haben, genügt jede Progression den fünf Axiomen Peanos. Man kann auch umgekehrt beweisen, daß jede Folge, die Peanos fünf Axiomen genügt, eine Progression ist. Daher kann man die fünf Axiome dazu verwenden, um die Gesamtheit der Progressionen zu definieren: „Progressionen“ sind „solche Folgen, welche den fünf Axiomen genügen“. Irgend eine Progression kann zur Grundlage der reinen Mathematik gewählt werden. Ihr erstes Glied können wir „0“, die ganze Folge ihrer Glieder „Zahlen“ und das nächste Glied in der Progression „Nachfolger“ nennen. Die Progression braucht nicht aus Zahlen zu bestehen; an ihre Stelle können Raum- oder Zeitpunkte oder irgend welche andere Elemente treten, wenn es nur unendlich viele gibt. Jede der verschiedenen Progressionen erlaubt eine verschiedene Auslegung aller Sätze der üblichen reinen Mathematik. Alle diese Auslegungen sind gleichberechtigt.
19
Wir haben in Peanos System keine Möglichkeit, zwischen den verschiedenen Interpretationen seiner Grundbegriffe zu unterscheiden. Es wird vorausgesetzt, daß wir die Bedeutung „0“ kennen und nicht annehmen, daß mit diesem Symbol 100 oder Kleopatras Nadel oder irgend etwas anderes gemeint sei. Diese Tatsache, daß „0“, „Zahl“ und „Nachfolger“ durch die fünf Axiome Peanos nicht definiert werden können, sondern unabhängig davon verstanden werden müssen, ist sehr wichtig. Unsere Zahlen brauchen wir nicht bloß zur Verifikation mathematischer Formeln, sie sollen auch auf alltägliche Dinge richtig anwendbar sein. Wir müssen zehn Finger, zwei Augen und eine Nase haben. Ein System in dem „1“ 100 und „2“ 101 usw. bedeutet, kann für die reine Mathematik ganz gut brauchbar sein, jedoch nicht für die Bedürfnisse unseres täglichen Lebens. „0“, „Zahl“ und „Nachfolger“ müssen eine solche Bedeutung haben, daß wir sie auf Finger, Augen und Nase richtig anwenden können. Wir haben schon eine gewisse Kenntnis, was wir unter „l“, „2“ usw. verstehen, obwohl sie nicht hinreichend zergliedert oder analytisch ist. Unsere Verwertung der Zahlen in der Arithmetik muß diesem Wissen entsprechen. Wir sind dessen nicht sicher, daß dies bei Peanos Methode zutrifft. Stellen wir uns auf seinen Standpunkt, so können wir bloß behaupten: „Wir wissen, was „0“, „Zahl“ und „Nachfolger“ ist, aber wir sind nicht imstande, es mit Hilfe anderer einfacherer Begriffe zu erklären.“ Diese Stellungnahme ist ganz berechtigt, wenn wir dazu genötigt sind, und i r g e n d e i n m a l tritt für jeden diese Notwendigkeit ein. Aber die Aufgabe der mathematischen Philosophie besteht darin, diesen Punkt möglichst weit hinauszuschieben. Die logische Theorie der Arithmetik erlaubt uns dies für lange Zeit. Man könnte vielleicht den Vorschlag machen: „0“, „Zahl“ und „Nachfolger“ sollen nicht Begriffe darstellen, deren Bedeutung wir zwar kennen, aber nicht definieren können, sondern i r g e n d w e l c h e Elemente, die den fünf Axiomen Peanos genügen. Sie sind dann nicht mehr Elemente, die eine bestimmte, wenn auch undefinierte Bedeutung haben: es sind veränderliche Elemente geworden, über die wir gewisse Hypothesen machen, nämlich die in
20
den fünf Axiomen aufgestellten. In anderer Hinsicht aber sind sie unbestimmt. Wenn wir diesen Vorschlag annehmen, so sind unsere Sätze nicht für eine bestimmte Folge von Elementen, genannt die natürlichen Zahlen, bewiesen, vielmehr für alle Folgen von Elementen mit gewissen Eigenschaften. Dieses Vorgehen ist keineswegs fehlerhaft. In der Tat stellt es eine für gewisse Zwecke vollkommen berechtigte Verallgemeinerung dar. Aber aus zwei Gründen kann man auf diese Weise nicht zu angemessenen Grundlagen der Arithmetik gelangen. Zunächst weiß man nicht, ob es irgendwelche Folgen von Elementen gibt, die Peanos fünf Axiome erfüllen. Man hat nicht den gerinsten Anhaltspunkt, der uns zur Auffindung derartiger Folgen führen könnte. Zweitens, wie schon oben bemerkt, sollen unsere Zahlen für das Zählen der gewöhnlichen Gegenstände brauchbar sein, und dazu müssen unsere Zahlen eine bestimmte Bedeutung und nicht bloß gewisse formale Eigenschaften haben. Diese bestimmte Bedeutung wird in der logischen Theorie der Arithmetik definiert.
2. Die Definition der Zahl Die Frage: „Was ist eine Zahl?“ ist oft gestellt, aber erst in unserer Zeit korrekt beantwortet worden. Die Antwort gab Frege 1884 in seinen Grundlagen der Arithmetik1). Obschon dieses Buch ganz kurz, nicht schwer und von der allergrößten Wichtigkeit ist, wurde es fast nicht beachtet, und die in ihm enthaltene Definition der Zahl blieb so gut wie unbekannt, bis sie durch den Verfasser 1901 wieder entdeckt wurde. Wenn wir versuchen, die Zahl zu definieren, so müssen wir uns zuerst gewissermaßen über die Grammatik unserer Untersuchungklarwerden. Viele Philosophen nehmen sich bei diesem Unterfangen tatsächlich vor, die Anzahl zu definieren, was etwas ganz anderes ist. Zahl ist das Eigentümliche an den Zahlen, wie Mensch das Eigentümliche an den Menschen ist. Eine Anzahl von Dingen ist nicht ein Beispiel für eine Zahl, sondern für irgend eine besondere Zahl. Ein Trio von Menschen ist ein Beispiel für die Zahl 3, und die Zahl 3 ist ein Beispiel für eine Zahl; aber das Trio ist kein Beispiel für eine Zahl. Dies scheint elementar und kaum beachtenswert zu sein; gleichwohl hat sich gezeigt, daß dieser Unterschied für die Philosophen mit wenigen Ausnahmen zu subtil gewesen ist. Eine bestimmte Zahl ist nicht identisch mit einer Ansammlung von so viel Elementen, wie diese Zahl beträgt. Die Zahl 3 ist nicht identisch mit dem Trio Brown, Jones und Robinson. Die Zahl 3 ist etwas, das alle Trios gemeinsam haben und sie von anderen Ansammlungen unterscheidet. Eine Zahl ist etwas, das gewisse Ansammlungen charakterisiert, nämlich diejenigen, welche diese Zahl besitzen. 1 ) Die gleiche Antwort findet sich vollständiger und ausführlicher in seinen „Grundgesetzen der Arithmetik“ Bd. I, 1893.
22
Statt „Ansammlungen“ werden wir künftig den Ausdruck „Menge“ gebrauchen. In der Mathematik bezeichnet man sie außerdem auch mit Mannigfaltigkeit. Wir werden später viel mit Mengen zu tun haben. Vorderhand wollen wir von ihnen so wenig wie möglich sagen. Aber einige Bemerkungen müssen doch schon jetzt gemacht werden. Eine Menge kann auf zwei Weisen definiert werden, die auf den ersten Blick ganz verschieden erscheinen. Wir können ihre Glieder aufzählen, z. B. wenn wir sagen: die Menge, die ich meine, besteht aus Brown, Jonas, Robinson. Oder wir können eine definierende Eigenschaft anführen, z. B. wenn wir von „der Menschheit“ oder „den Einwohnern von London“ sprechen. Die Methode, durch Aufzählen zu definieren, wird „Umfangsdefinition“, diejenige, die eine definierende Eigenschaft angibt, „Inhaltsdefinition“ genannt. Von diesen beiden Definitionen ist die Inhaltsdefinition logisch wichtiger. Dies wird durch zwei Betrachtungen gezeigt: (1) die Umfangsdefinition kann immer auf eine Inhaltsdefinition, (2) die Inhaltsdefinition oft nicht einmal theoretisch auf eine Umfangsdefinition zurückgeführt werden. Zu jedem dieser Punkte ein Wort der Erläuterung. (1)Brown, Jones und Robinson besitzen zusammen eine gewisse Eigenschaft, die nichts sonst im ganzen Universum besitzt, nämlich die Eigenschaft, entweder Brown oder Jones oder Robinson zu sein. Diese Eigenschaft kann verwandt werden zu einer Inhaltsdefinition der aus Brown und Jones und Robinson bestehenden Menge. Betrachten wir die Formel: „x ist Brown oder x ist Jones oder x ist Robinson.“ Diese Formel ist gerade für drei x richtig, nämlich für Brown und Jones und Robinson In dieser Hinsicht ähnelt sie einer kubischen Gleichung mit ihren drei Wurzeln. Man kann sie zur Bestimmung einer Eigenschaft wählen, die den Gliedern der aus diesen drei Männern bestehenden Menge gemeinsam und ihnen eigentümlich ist. Ähnlich kann man offenbar bei irgend einer anderen, durch den Umfang gegebenen Menge vorgehen. (2) Es ist klar, daß wir in der Praxis oft sehr viel von einer Menge wissen, ohne imstande zu sein, ihre Glieder aufzuzählen. Niemand kann alle Menschen oder selbst alle Einwohner von Lon-
23
don wirklich aufzählen, und doch ist sehr viel über jede dieser Mengen bekannt. Dies zeigt zur Genüge, daß wir zur Kenntnis einer Menge nicht n o t w e n d i g ihre Umfangsdefinition brauchen. Bei der Betrachtung der unendlichen Mengen erkennen wir aber, daß für Wesen mit endlicher Lebensdauer eine Aufzählung selbst theoretisch nicht möglich ist. Wir können nicht alle natürlichen Zahlen aufzählen. Sie lauten: 0, 1, 2, 3 u n d s o w e i t e r . Irgend einmal müssen wir uns mit diesem „und so weiter“ zufrieden geben. Wir können nicht alle Brüche oder irrationalen Zahlen oder alle Elemente irgend einer anderen unendlichen Menge aufzählen. Somit kann unsere Kenntnis über alle solche Mengen nur aus einer Inhaltsdefinition stammen. Diese Bemerkungen sind für die Definition der Zahl in dreifacher Hinsicht wichtig. In erster Linie bilden die Zahlen selbst eine unendliche Menge und können daher nicht durch Aufzählen definiert werden. Zweitens stellen die Mengen mit einer gegebenen Zahl von Elementen wahrscheinlich eine unendliche Menge dar: z. B. gibt es vermutlich eine unendliche Menge von Trios auf der Welt; denn wäre dies nicht der Fall, so wäre die Gesamtzahl der Dinge in der Welt endlich, was, obwohl möglich, unwahrscheinlich ist. Drittens wünschen wir die „Zahl“ derart zu definieren, daß unendliche Zahlen möglich sind; somit müssen wir in der Lage sein, von der Zahl der Elemente in einer unendlichen Menge zu sprechen. Und eine solche Menge muß vermöge ihres Inhalts definiert werden, d. h. durch eine allen ihren Elementen gemeinsame und sie auszeichnende Eigenschaft. Für manche Zwecke sind eine Menge und eine sie definierende Eigentümlichkeit praktisch vertauschbar. Der wesentliche Unterschied zwischen beiden besteht in der Tatsache, daß es nur eine Menge gibt, die eine gegebene Folge von Elementen hat, während es immer mehrere verschiedene charakteristische Eigenschaften gibt, durch die eine gegebene Menge definiert werden kann. Die Menschen können definiert werden als federlose Zweifüßler oder als vernünftige Tiere oder (korrekter) mit Hilfe der Merkmale, mit denen Swift die Yahoos ausgestattet hat. Gerade weil es niemals nur
24
eine einzige definierende charakteristische Eigenschaft gibt, müssen wir von den Mengen Gebrauch machen; denn sonst könnten wir uns mit den ihren Elementen gemeinsamen und sie kennzeichnenden Eigenschaften begnügen1). Irgend eine dieser Eigenschaften kann an Stelle der Menge treten, sobald es nicht auf Eindeutigkeit ankommt. Kehren wir nun zur Definition der Zahl zurück. Es leuchtet ein, daß die Zahl ein Mittel ist, gewisse Mengen zusammenzufassen, nämlich diejenigen, die eine gewisse Zahl von Elementen haben. Wir können uns alle Paare zu einem Bündel vereinigt vorstellen, alle Trios zu einem anderen usf. So erhalten wir verschiedene Bündel von Mengen; jedes Bündel besteht aus allen Mengen, die eine gewisse Zahl von Gliedern haben. Jedes Bündel ist eine Menge, deren Glieder Mengen sind; somit ist jede eine Menge von Mengen. Das Bündel mit allen Paaren z. B. ist eine Menge von Mengen: jedes Paar ist eine Menge mit zwei Gliedern, und das ganze Bündel von Paaren ist eine Menge mit einer unendlichen Zahl von Gliedern, von denen jedes eine Menge mit zwei Gliedern ist. Wie sollen wir entscheiden, ob zwei Mengen zum gleichen Bündel gehören? Die Antwort, die sich von selbst darbietet, lautet: Ermittle, wieviel Glieder jede hat, und tue sie in das gleiche Bündel, wenn sie die gleiche Zahl von Gliedern hat. Aber dabei wird vorausgesetzt, daß wir die Zahlen definiert haben und daß wir ermitteln können, wieviele Glieder eine Menge hat. Das Zählen ist für’uns eine so alltägliche Sache, daß wir diese Voraussetzung sehr leicht übersehen können. Das Zählen ist uns zwar geläufig, in Wirklichkeit ist es aber logisch ein sehr komplizierter Vorgang. Überdies ist dieses Verfahren nur zur Feststellung der Zahl der Elemente einer endlichen Menge verwendbar. Unsere Definition der Zahl darf nicht von vornherein von der Ausnahme ausgehen, daß alle Zahlen endlich sind; und jedenfalls
1 ) Später werden wir zeigen, daß die Mengen als logische, aus definierenden, charakteristischen Eigenschaften konstruierte Fiktionen betrachtet werden können. Für unsere jetzigen Zwecke bedeutet es aber eine Vereinfachung, wenn wir so tun, als ob
25
ziehen wir einen Zirkel-Schluß, wenn wir das Zählen zur Definition der Zahlen benutzen, da die Zahlen beim Zählen gebraucht werden. Wir brauchen daher eine andere Methode, um zu entscheiden, ob zwei Mengen die gleiche Zahl von Elementen haben. Tatsächlich ist es logisch einfacher, festzustellen, ob zwei Mengen die gleiche Zahl von Elementen haben, als zu defi nieren, welches diese Zahl ist. Ein Beispiel wird dies klar machen. Wenn es nirgends in der Welt Vielweiberei oder Vielmännerei gäbe, so wäre offenbar die Zahl der zu irgend einem Zeitraum lebenden Ehemänner genau gleich der Zahl der Ehefrauen. Wir brauchen weder eine Volkszählung noch die Kenntnis der wirklichen Zahl der Ehemänner und Ehefrauen, um dessen sicher zu sein. Wir wissen, daß die Zahl in beiden Mengen die gleiche sein muß, weil jeder Ehemann eine Ehefrau und jede Ehefrau einen Ehemann hat. Die Beziehung von Ehemann zu Ehefrau ist, wie man sich ausdrückt, „ein-eindeutig“. Eine Beziehung wird dann „ein-eindeutig“ genannt, falls, wenn x die betref fende Beziehung zu y hat, kein anderes Element x’ die gleiche Beziehung zu y und x die gleiche Beziehung außer zu y zu keinem anderen Element y’ hat. Wenn nur die erste dieser beiden Bedingungen erfüllt ist, heißt die Beziehung „ein-mehrdeutig“; ist nur die zweite erfüllt, so spricht man von „mehr-eindeutig“. Es ist zu beachten, daß in diesen Definitionen die Zahl 1 nicht vorkommt. In christlichen Ländern ist die Beziehung von Ehemann zu Ehefrau ein-eindeutig; in mohammedanischen ist sie ein-mehrdeutig; in Tibet mehr-eindeutig; diejenige von Sohn zu Vater ist mehr-eindeutig, aber diejenige von ältestem Sohn zu Vater ein-eindeutig. Die Beziehung von n zu n+1, wo n eine beliebige Zahl ist, ist ein-eindeutig; ebenso die Beziehung von n zu 2n oder 3n. Bei Beschränkung auf positive Zahlen ist die Beziehung von n zu n2 ein-eindeutig; werden aber negative Zahlen zugelassen, so wird sie zwei-eindeutig, weil n und –n das gleiche Qudrat haben. Diese Beispiele dürften zur Klärung der Begriffe ein-eindeutige, ein-mehrdeutige und mehr-eindeutige Beziehungen genügen. Diese Beziehungen
26
spielen eine große Rolle in den Prinzipien der Mathematik, nicht nur bei der Definition der Zahlen, sondern auch in vielen anderen Zusammenhängen. Zwei Mengen werden „äquivalent“ genannt, wenn es eine eineindeutige Beziehung gibt, die jedes Element der einen Menge einem Element der anderen Menge zuordnet in der gleichen Weise, in der die Beziehung der Heirat Ehemänner und Ehefrauen einander zuordnet. Um diese Definition präziser zu fassen, wollen wir zuvor einige Begriffe einführen. Die Menge derjenigen Elemente, die eine gegebene Beziehung zu irgend etwas haben, wird der B e r e i c h dieser Beziehung genannt: So sind Väter der Bereich der Beziehung Vater zu Kind, Ehemänner der Bereich der Beziehung von Ehemann zu Ehefrau, Ehefrauen der Bereich der Beziehung von Ehefrau zu Ehemann, und Ehemänner und Ehefrauen zusammen sind der Bereich der Beziehung Ehe. Die Beziehung von Ehefrau zu Ehemann heißt das I n v e r s e der Beziehung von Ehemann zu Ehefrau. In ähnlicher Weise ist k l e i n e r das Inverse von g r ö ß e r , s p ä t e r das Inverse von f r ü h e r usw. Allgemein ist das Inverse einer gegebenen Beziehung diejenige Beziehung, die zwischen y und x gilt, sobald die gegebene Beziehung zwischen x und y besteht. Der inverse Bereich einer Beziehung ist der Bereich ihres Inversen: so ist die Menge der Ehefrauen der i n v e r s e B e r e i c h der Beziehung von Ehemann zu Ehefrau. Unsere Definition der Äquivalenz können wir nunmehr wie folgt aussprechen: Eine Menge wird einer anderen Menge „äquivalent“ genannt, wenn es eine ein-eindeutige Beziehung gibt, deren Bereich aus der einen Menge besteht, während die andere Menge den inversen Bereich bildet. Es ist leicht zu beweisen: (1) jede Menge ist sich selbst äquivalent; (2) wenn eine Menge α einer Menge β äquivalent ist, dann ist β auch α äquivalent; und (3) wenn α äquivalent β und β äquivalent γ ist, dann ist α äquivalent γ. Eine Beziehung wird r e f l e x i v genannt, wenn sie die erste dieser Eigenschaften, s y m m e t r i s c h , wenn
27
sie die zweite, und transitiv, wenn sie die dritte besitzt. Offenbar muß eine symmetrische und transitive Beziehung in ihrem ganzen Bereich reflexiv sein. Beziehungen mit diesen Eigenschaften sind wichtig, und es ist zu beachten, daß die Äquivalenz auch eine Beziehung dieser Art ist. Dem gewöhnlichen Menschenverstand ist es klar, daß zwei endliche Mengen dann und nur dann die gleiche Anzahl von Elementen haben, wenn sie äquivalent sind. Der Akt des Zählens besteht in der Aufstellung einer ein-eindeutigen Beziehung zwischen der Folge der gezählten Gegenstände und den natürlichen Zahlen (ausgenommen 0), die bei dem Prozeß aufgebraucht werden. Demgemäß schließt der gewöhnliche Verstand, daß in der zu zählenden Menge so viele Gegenstände vorhanden sind, wie es Zahlen gibt bis zur letzten Zahl, die beim Zählen gebraucht wird. Und wir wissen auch, daß es bei Beschränkung auf endliche Zahlen gerade n Zahlen von 1 bis n gibt. Daraus folgt also, daß die letzte Zahl, die beim Zählen einer Menge gebraucht wird, die Zahl der Elemente in der Menge ist, vorausgesetzt, daß die Menge endlich ist. Aber dieses Ergebnis hängt, abgesehen von seiner ausschließlichen Anwendbarkeit auf endliche Mengen, von der als wahr angenommenen Tatsache ab, daß zwei äquivalente Mengen die gleiche Zahl von Gliedern haben; denn wenn wir z. B. 10 Gegenstände zählen, so zeigen wir, daß die Folge dieser Gegenstände äquivalent ist mit der Folge der Zahlen von 1 bis 10. Der Begriff der Äquivalenz ist logisch bei der Operation des Zählens vorausgesetzt und logisch einfacher, obwohl wir mit ihm weniger vertraut sind. Beim Zählen muß man die zu zählenden Gegenstände in einer gewissen Ordnung folgen lassen, als erstes, zweites, drittes usw., aber das Wesen der Zahl besteht nicht in der Ordnung: Die Ordnung ist, logisch gesprochen, ein Zusatz ohne Bedeutung, eine unnötige Komplikation. Der Begriff der Äquivalenz setzt nicht den Begriff der Ordnung voraus: z. B. sahen wir, daß die Zahl der Ehemänner gleich der Zahl der Ehefrauen ist, ohne daß wir eine Reihenfolge unter ihnen aufgestellt hätten. Auch verlangt der Begriff der Äquivalenz nicht, daß
28
einander äquivalente Mengen endlich seien. Man nehme z. B. die natürlichen Zahlen (ausgenommen 0) auf der einen und die Brüche mit dem Zähler 1 auf der anderen Seite: offenbar können wir 2 und ½, 3 und ⅓ usw. einander zuordnen und dadurch die Äquivalenz der beiden Mengen beweisen. Wir können also mit Hilfe des Begriffes der Äquivalenz entscheiden, ob zwei Mengen zum gleichen Bündel gehören, in dem Sinne, in dem wir diese Frage vorhin in diesem Kapitel aufgeworfen haben. Wir brauchen ein Bündel, das die Menge enthält, die keine Elemente hat: dieses Bündel gibt uns die Zahl 0. Dann brauchen wir ein Bündel mit allen Mengen, die ein Element haben: dieses Bündel gibt uns die Zahl 1. Für die Zahl 2 haben wir ein Bündel mit allen Paaren nötig; dann eines mit allen Trios usw. Wird irgend eine Menge gegeben, so können wir das Bündel, in das sie gehört, als Menge aller ihr „äquivalenten“ Mengen definieren. Man sieht sehr leicht ein, daß, wenn z. B. eine Menge drei Elemente hat, die Menge aller ihr äquivalenten Mengen die Menge der Trios ist. Gleichgültig, welche Gliederzahl eine Menge haben mag – diejenigen Mengen, die ihr „äquivalent“ sind, haben die gleiche Gliederzahl. Wir können dies als D e f i n i t i o n von „die gleiche Gliederzahl haben“ ansehen. Augenscheinlich erhalten wir so bei Beschränkung auf endliche Mengen die üblichen Ergebnisse. Bis jetzt haben wir nichts vorausgesetzt, was irgendwie paradox wäre. Aber nun, da wir zur wirklichen Definition der Zahlen kommen, stoßen wir unweigerlich auf Verhältnisse, die im ersten Augenblick paradox erscheinen. Dieser Eindruck wird jedoch bald schwinden. Wir denken natürlich, daß die Menge der Paare etwas von der Zahl 2 Verschiedenes ist. Aber über die Menge der Paare besteht keine Unsicherheit. An ihr kann nicht gezweifelt werden, und ihre Definition macht keine Schwierigkeit, während auf der anderen Seite die Zahl 2 in irgend einem Sinne etwas Metaphysisches ist, von dem wir niemals das sichere Gefühl haben, daß es existiert oder daß wir es ergründet haben. Es ist daher klüger, uns mit der Menge der Paare zu begnügen, deren wir sicher sind, als einer problematischen Zahl 2 nachzujagen, die sich uns immer listig entziehen wird. Dem-
29
gemäß stellen wir folgende Definition auf: Die Zahl einer Menge ist die Menge aller ihr äquivalenten Mengen. Die Zahl eines Paares ist somit die Menge aller Paare. In der Tat: die Menge aller Paare ist die Zahl 2, auf Grund unserer Definition. Auf Kosten einer kleinen Absonderlichkeit gewinnen wir durch diese Definition einen bestimmten und unzweideutigen Begriff; und es ist nicht schwierig, zu beweisen, daß die so definierten Zahlen alle Eigenschaften haben, die wir von den Zahlen erwarten. Wir können nun weiter gehen und allgemein die Zahlen definieren als irgend eines der Bündel, in die sich die Mengen nach ihrer Ähnlichkeit gruppieren. Eine Zahl wird eine Folge von Mengen sein, derart, daß zwei beliebige einander äquivalent sind und keine Menge außerhalb einer innerhalb der Reihe äquivalent ist. Mit anderen Worten: eine Zahl (allgemein) ist eine Menge, die die Zahl einer ihrer Glieder ist; oder noch einfacher: Eine Zahl ist etwas, das die Zahl einer Menge ist. Eine solche Definition scheint dem Wortlaut nach einen Zirkelschluß zu enthalten, aber das ist in Wirklichkeit nicht der Fall. Wir definieren „die Zahl einer gegebenen Menge“ ohne Benutzung des allgemeinen Begriffs der Zahl; daher können wir die Zahl unter Verwendung des Ausdrucks „die Zahl einer gegebenen Menge“ allgemein definieren, ohne irgend einen logischen Irrtum zu begehen. Definitionen dieser Art sind tatsächlich sehr häufig. Die Menge der Väter z. B. wäre zu definieren, indem man zuerst definiert, was der Vater von jemandem ist; dann besteht die Menge der Väter aus allen Menschen, die jemandes Vater sind. Analog: wenn wir Quadratzahlen zu definieren haben, so müssen wir erst definieren, was wir unter dem Quadrat einer Zahl verstehen, und dann definieren wir die Quadratzahlen als diejenigen Zahlen, die Quadrate von anderen Zahlen sind. Dieses Verfahren ist sehr gebräuchlich, und es ist wichtig, sich darüber klar zu sein, daß es legitim und sogar oft notwendig ist. Wir haben nun eine Definition der Zahlen gegeben, die für endliche Mengen ausreicht. Wir müssen noch nachweisen, daß sie auch für
30
unendliche Mengen genügt. Aber zuerst bedürfen wir einer Festlegung dessen, was wir unter „endlich“ und „unendlich“ verstehen. Dies soll in einem späteren Kapitel geschehen.
3. Endlichkeit und mathematische Induktion Die Folge der natürlichen Zahlen kann, wie wir im ersten Kapitel gesehen haben, vollständig definiert werden, wenn wir wissen, was die drei Ausdrücke „0“, „Zahl“ und „Nachfolger“ bedeuten. Aber wir können einen Schritt weiter gehen. Wir können nämlich alle natürlichen Zahlen definieren, wenn wir die Bedeutung von 0 und Nachfolger kennen. Die Betrachtung, wie das ausgeführt werden kann und warum dieses Verfahren nicht über das Endliche hinaus anwendbar ist, wird uns das Verständnis für den Unterschied zwischen Endlichkeit und Unendlichkeit erleichtern. Wir wollen uns noch nicht mit der Definition von „0“ und „Nachfolger“ beschäftigen. Einstweilen soll angenommen werden, daß wir den Sinn dieser Ausdrücke verstehen. Wir zeigen dann, wie man alle anderen natürlichen Zahlen ableiten kann. Man sieht leicht, daß wir jede beliebige, vorgegebene Zahl – sagen wir 30000 – erreichen können. Wir definieren zunächst „1“ als den „Nachfolger von 0“, dann „2“ als den „Nachfolger“ von „1“ usw. Bei einer beliebig vorgegebenen Zahl wie 30 000 können wir den Beweis, daß man sie auf diese Weise durch schrittweises Vorgehen erreichen kann, tatsächlich experimentell führen, falls wir die Geduld haben. Wir können soweit gehen, bis wir wirklich zu 30 000 kommen. Dieses Verfahren führt bei jeder natürlichen Zahl zum Ziel, aber es beweist nicht den allgemeinen Satz, daß jede solche Zahl auf diese Weise, nämlich durch schrittweises Vorgehen von jeder Zahl zu ihrem Nachfolger, ausgehend von der 0, erreicht werden kann. Kann man es anders beweisen? Wir wollen die Frage von einer andern Seite Betrachten. Welches sind die Zahlen, die man erreichen kann, wenn die Elemente „0“ und „Nachfolger“ gegeben sind? Gibt es irgend eine Methode, durch
32
die wir die ganze Menge dieser Zahlen definieren können? Wir bekommen 1 als den Nachfolger von 0, 2 als den Nachfolger von 1, 3 als den Nachfolger von 2 usw. Gerade dieses „undsoweiter“ wollen wir durch einen weniger vagen und weniger unbestimmten Begriff ersetzten. Man könnte versucht sein, zu sagen, „undsoweiter“ bedeute, daß der Prozeß des Fortschreitens zum Nachfolger b e l i e b i g e n d l i c h oft wiederholt werden soll. Aber das Problem, mit dem wir uns beschäftigen, ist doch gerade die Definition der „endlichen Zahl“. Und deswegen dürfen wir diesen Begriff in unserer Definition nicht verwenden. Bei unserer Definition dürfen wir nicht annehmen, daß wir schon wissen, was eine endliche Zahl ist. Der Schlüssel zu unserem Problem liegt in der mathematischen Induktion. Man erinnert sich aus dem ersten Kapitel. Es war dies der fünfte der fünf Grundsätze für die natürlichen Zahlen. Er besagte: Jede Eigenschaft, die der 0 und dem Nachfolger jeder Zahl mit dieser Eigenschaft zukommt, kommt allen natürlichen Zahlen zu. Der Satz war damals als ein Prinzip aufgestellt. Jetzt werden wir ihn als Definition ansehen. Es ist nicht schwer zu erkennen, daß die Begriffe, für die der Satz gilt, identisch sind mit den Zahlen, die von 0 an schrittweise von der einen zur nächsten erreicht werden können. Dieser Punkt ist so wichtig, daß wir auf ihn näher eingehen wollen. Wir tun gut daran, mit einigen Definitionen zu beginnen, die uns auch in anderem Zusammenhang von Nutzen sind. Eine Eigenschaft heißt „erblich“ in der natürlichen Zahlenfolge, wenn folgendes gilt: immer wenn sie der Zahl n zukommt, soll sie auch der Zahl n+1, dem Nachfolger von n zukommen. In ähnlicher Weise heißt eine Menge „erblich“, wenn folgendes gilt: ist n ein Element der Menge, so soll es auch n+1 sein. Man sieht leicht, obwohl wir dies noch nicht wissen dürfen, daß eine erbliche Eigenschaft eine solche ist, die allen natürlichen Zahlen gemeinsam ist, die nicht kleiner sind als eine bestimmte Zahl, z. B. allen Zahlen, die nicht kleiner als 100, oder allen, die nicht kleiner als 1000, oder auch allen, die nicht kleiner als 0 sind, d.h. allen ohne Ausnahme.
33
Eine Eigenschaft soll „induktiv“ heißen, wenn sie eine erbliche Eigenschaft ist, die der 0 zukommt. Ähnlich heißt eine Menge induktiv, wenn sie eine erbliche Menge ist, welche die 0 als Element enthält. Gegeben sei eine erbliche Menge, zu der die 0 gehört; so folgt daraus, daß auch die 1 eines ihrer Elemente ist, denn eine erbliche Menge enthält die Nachfolger ihrer Elemente, und 1 ist der Nachfolger von 0. Hat man eine erbliche Menge, zu der die 1 gehört, so folgt daraus in ähnlicher Weise, daß auch die 2 dazu gehört usw. Wir können also durch ein schrittweises Verfahren beweisen, daß eine beliebig vorgegebene natürliche Zahl – sagen wir 30 000 – ein Mitglied jeder induktiven Menge ist. Wir definieren die „Nachkommenschaft“ einer gegebenen natürlichen Zahl hinsichtlich der Beziehung „unmittelbarer Vorgänger“ (was die Umkehrung von Nachfolger ist) als alle diejenigen Elemente, die zu jeder erblichen Menge gehören, zu der die gegebene Zahl gehört. Es ist wiederum leicht zu s e h e n , daß die Nachkommenschaft einer natürlichen Zahl aus ihr selbst und allen größeren natürlichen Zahlen besteht. Aber auch dies wissen wir noch nicht offiziell. Nach den obigen Definitionen besteht die Nachkommenschaft der 0 aus denjenigen Gliedern, die zu jeder induktiven Menge gehören. Jetzt ist es nicht schwer, zu zeigen, daß die Nachkommenschaft der 0 und diejenigen Elemente, die, von der 0 ausgehend, durch sukzessive Schritte vom einen zum nächsten erreicht werden können, diesselbe Menge sind. Denn zunächst gehört die 0 zu beiden Mengen in dem Sinn, wie wir unsere Ausdrücke definiert haben. Wenn zweitens n zu beidenMengen gehört, so gehört auch n+1 dazu. Man muß aber beachten, daß wir uns hier auf einem Gebiet bewegen, wo genaue Beweise unmöglich sind. Denn wir vergleichen einen relativ vagen Begriff mit einem relativ präzisen. Der Begriff „diejenigen Elemente, die von der 0 aus durch sukzessive Schritte von einem zum nächsten erreicht werden können“, ist vag, obwohl es so aussieht, als ob er eine bestimmte Bedeutung hätte. Dagegen ist „Nachkommenschaft der 0“
34
gerade an der Stelle präzis und deutlich, wo der andere Begriff verworren ist. Man kann sagen: er gibt das wieder, was wir ausdrücken wollten, als wir von den Gliedern sprachen, die von der 0 aus durch sukzessive Schritte erreicht werden können. Jetzt können wir folgende Definition aufstellen: D i e „ n a t ü r l i c h e n Z a h l e n“ s i n d d i e Na c h k o m m e n s c h a f t d e r 0 hinsichtlich der Beziehung „unmittelbarer V o r g ä n g e r “ (was das Umgekehrte von Nachfolger ist). Es ist uns demnach gelungen, eine von den drei Grundbegriffen von Peano durch die beiden anderen auszudrücken. Infolge dieser Definition werden zwei Grundsätze unnötig, denn sie folgen aus der Definition. Es sind dies der Satz, daß 0 eine Zahl ist, und der Satz von der mathematischen Induktion. Der Satz, wonach der Nachfolger einer natürlichen Zahl existiert und selbst wieder eine natürliche Zahl ist, wird nur in der abgeschwächten Form gebraucht: „jede natürliche Zahl hat einen Nachfolger“. Wir können natürlich „0“ und „Nachfolger“ durch die allgemeine Definition der Zahl ausdrücken, zu der wir im zweiten Kapitel gelangt sind. Die Zahl 0 ist die Zahl der Elemente einer Menge, die keine Mitglieder besitzt, d. h. der sogenannten „Nullmenge“. Nach der allgemeinen Definition der Zahl ist die Zahl der Elemente der Nullmenge die Menge aller Mengen, die der Nullmenge äquivalent sind, d. h. (wie leicht zu beweisen) die Menge, die nur aus der Nullmenge selbst besteht, d. h. die Menge, deren einziges Mitglied die Nullmenge ist. (Sie ist nicht etwa identisch mit der Nullmenge, denn sie hat ein Element, nämlich die Nullmenge selbst, wogegen die Nullmenge kein Element besitzt. Eine Menge mit einem Element ist niemals identisch mit diesem einen Element. Dies werden wir bei der Mengentheorie noch eingehend auseinandersetzen). Wir haben also die folgende rein logische Definition: 0 i s t d i e M e n g e , deren einziges Element die Nullmenge ist. Es bleibt noch „der Nachfolger“ zu definieren. Gegeben sei irgend eine Zahl n, a sei eine Menge, die n Elemente besitzt, und x ein Element, das nicht Element von a ist. Dann hat die Menge, die aus a und x zusammen besteht, n+1 Elemente. Wir haben also folgende Definition:
35
Der Nachfolger der Zahl der Elemente in einer Menge α ist die Zahl der Elemente der Menge, die aus β und einem x besteht, wo x ein Element ist, das nicht zu der Menge gehört. Wir brauchen noch einige Feinheiten, um diese Definition zu vervollständigen, aber dies interessiert uns hier nicht 1). Man erinnert sich, daß wir bereits im zweiten Kapitel eine logische Definition der Zahl der Elemente einer Menge gegeben haben. Wir definieren sie nämlich als die Menge aller Mengen, die der gegebenen ähnlich sind. Wir haben demnach die drei Grundbegriffe Peanos auf logische Begriffe zurückgeführt. Wir haben für sie Definitionen gegeben, die sie zu etwas Bestimmtem machen. Man kann ihnen nicht mehr unendlich viele Bedeutungen unterlegen, wie dies der Fall war, als sie nur insoweit bestimmt waren, daß sie den fünf Axiomen Peanos genügten. Wir haben sie aus den fundamentalen Begriffen, die man schlechthin annehmen muß, entfernt und so die deduktive Gliederung der Mathematik vergrößert. Was die fünf Grundsätze betrifft, so ist es uns bereits gelungen, zwei von ihnen durch unsere Definition der natürlichen Zahlen zu beweisbaren Sätzen zu machen. Wie steht es mit den übrigen dreien? Es ist sehr leicht zu beweisen, daß 0 nicht der Nachfolger irgend einer Zahl ist und daß der Nachfolger irgend einer Zahl selbst wieder eine Zahl äst. Eine gewisse Schwierigkeit bietet nur noch der übrig bleibende Grundsatz, wonach nicht zwei Zahlen denselben Nachfolger haben. Diese Schwierigkeit entsteht nur, wenn die Gesamtzahl der Individuen in der Welt endlich ist. Gegeben seien zwei Zahlen m und n, von denen keine die Gesamtzahl der Individuen in der Welt sein soll. Dann kann man leicht beweisen, daß m + 1 = n + 1 ist, wenn m = n ist. Aber nehmen wir an, daß die Gesamtzahl der Individuen in der Welt, sagen wir, 10 wäre, dann gäbe es keine Menge von 11 Individuen, und die Zahl 11 wäre die Nullmenge, ebenso wäre es die Zahl 12. Wir hätten also: 11 = 12; 10 und 11 hätten also denselben Nachfolger, obwohl 10 ungleich 11 ist. Wir hätten l
) Vgl. Principia Mathematica. Bd. II, Satz 110.
36
also zwei verschiedene Zahlen mit demselben Nachfolger. Dieses Unglück kann dem dritten Axiom nicht passieren, wenn die Zahl der Individuen in der Welt nicht endlich ist. Wir werden auf dieses Problem später (im 13. Kapitel) noch zurückkommen. Unter der Annahme, daß die Zahl der Individuen in der Welt nicht endlich ist, ist es uns gelungen, Peanos drei Grundbegriffe zu definieren; wir sehen auch, wie man seine fünf Grundsätze durch Grundbegriffe und Sätze der Logik beweisen kann. Daraus folgt, daß die gesamte reine Mathematik, soweit sie aus der Theorie der natürlichen Zahlen abgeleitet werden kann, nur eine Erweiterung der Logik ist. Die Ausdehnung dieses Resultats auf die modernen Zweige der Mathematik, die man aus der Theorie der natürlichen Zahlen nicht ableiten kann, bietet keine prinzipielle Schwierigkeit, wie wir an anderer Stelle bewiesen haben 1). Der Prozeß der mathematischen Induktion, durch die wir die natürlichen Zahlen definierten, läßt sich verallgemeinern. Wir definierten die natürlichen Zahlen als die „Nachkommenschaft“ von 0 hinsichtlich der Beziehung einer Zahl zu ihrem unmittelbaren Nachfolger. Nennen wir diese Beziehung N, so wird jede Zahl m diese Beziehung zu m+1 besitzen. Eine Eigenschaft heißt „erblich bezüglich N“ oder einfacher „N-erblich“, wenn Folgendes gilt: wenn die Eigenschaft einer Zahl m zukommt, so soll sie auch m+l zukommen, d. h. der Zahl, zu der m die Beziehung N besitzt, und eine Zahl n soll zur „Nachkommenschaft“ von m bezüglich N gehören, wenn n jede N-erbliche Eigenschaft besitzt, die m zukommt. Diese Definitionen lassen sich nicht bloß auf N, sondern auf jede beliebige Beziehung anwenden. Wenn also R eine irgendwie geartete Beziehung ist, so können wir die folgenden Definitionen aufstellen 2):
1 ) Für die nicht rein analytische Geometrie vgl. Principles of Mathematics, Teil 6; für die analytische Dynamik ebenda Teil 7. 2 ) Diese Definition und die verallgemeinerte Theorie der Induktion verdankt man Frege. Sie wurden schon i. J. 1879 in seiner „Begriffsschrift“ veröffentlicht. Trotz des großen Wertes dieser Arbeit war ich meines Erachtens der erste Mensch, der sie überhaupt gelesen hat — und das über 20 Jahre nach ihrer Veröffentlichung.
37
Eine Eigenschaft heißt R-erblich, wenn Folgendes gilt: wenn sie einem Element x zukommt und x hat die Beziehung R zu y, so kommt sie auch y zu. Eine Menge heißt R-erblich, wenn ihre definierende Eigenschaft R-erblich ist. Ein Element x heißt ein R-Vorfahr des Elements y, wenn y jede R-erbliche Eigenschaft von x besitzt, unter der Voraussetzung, daß x ein Element ist, das die Beziehung R zu irgend etwas hat oder zu dem irgend etwas die Beziehung R hat. (Durch diesen Zusatz sollen nur triviale Fälle ausgeschlossen werden.) Die R-Nachkommenschaft eines Elementes x besteht aus allen Elementen, für die x ein R-Vorfahr ist. Die obigen Definitionen sind so gehalten, daß ein Element, das Vorfahr irgend eines ändern ist, auch sein eigener Vorfahr ist und zu seiner eigenen Nachkommenschaft gehört. Dies nur aus Gründen der Bequemlichkeit. Man beachte, daß, wenn wir für R die Beziehung „Vater oder Mutter“ nehmen, „Vorfahr“ und „Nachkommenschaft“ die übliche Bedeutung haben. Nur gehört ein Mensch zu seinen eigenen Vorfahren und zu seiner eigenen Nachkommenschaft. Es ist natürlich sofort klar, daß es möglich sein muß, „Vorfahr“ durch „Vater oder Mutter“ zu definieren. Aber bevor Frege seine verallgemeinerte Theorie der Induktion entwickelt hatte, konnte niemand genau den „Vorfahren“ durch die „Eltern“ definieren. Eine kurze Betrachtung dieses Punktes zeigt die Wichtigkeit der Theorie. Wenn jemand zum erstenmal vor der Aufgabe steht, den „Vorfahren“ durch die „Eltern“ zu definieren, so würde er natürlich Folgendes sagen: A ist ein Vorfahr von Z, wenn es zwischen A und Z eine gewisse Anzahl von Leuten B, C usw. gibt, wo B ein Kind von A ist, jeder „Vater oder Mutter“ des Nächsten ist, bis zum letzten, der Vater oder Mutter von Z ist. Aber diese Definition reicht nur dann aus, wenn wir hinzufügen, daß die Zahl der Zwischenglieder endlich sein muß. Man nehme z. B. folgende Folge: -1, -½, -¼, -⅛ … ⅛, ¼, ½, 1
38
Hier haben wir zunächst eine Reihe von negativen Brüchen ohne Ende, dann eine Reihe von positiven Brächen ohne Anfang. Können wir sagen, daß in dieser Reihe -⅛ ein Vorfahr von ⅛ ist? Nach der obigen Anfängerdefinition wäre es so; nicht aber nach irgend einer Definition, die das, was wir definieren wollen, widergibt. Zu diesem Zweck ist es wesentlich, daß die Zahl der Zwischenglieder endlich ist. Aber wie wir sahen, ist „endlich“ durch die mathematische Induktion zu definieren. Es ist aber einfacher, die allgemeine Vorfahr-Beziehung sofort zu definieren, als sie zuerst nur für den Fall der Beziehung von n zu n+1 zu definieren und dann erst auf die weiteren Fälle auszudehnen. Hier wie überall findet man, daß eine allgemeine Betrachtung vom Anfang an zwar zuerst mehr Gedankenarbeit verlangt, im Lauf der Untersuchung aber Gedankenarbeit spart und die logische Kraft erhöht. Die Verwendung der mathematischen Induktion bei Beweisen war in der Vergangenheit eine Art Mysterium. Man konnte scheinbar keinen ernsthaften Zweifel an der Gültigkeit dieser Beweismethode hegen. Aber niemand wußte, warum sie gültig war. Manche glaubten, sie sei tatsächlich ein Spezialfall der Induktion im logischen Sinn. P o i n c a r é 1 ) hielt sie für ein Prinzip von größter Wichtigkeit, durch das man eine unendliche Zahl von Syllogismen in ein einziges Argument zusammenziehen könne. Wir wissen heute, daß all diese Betrachtungen irrtümlich sind. Die mathematische Induktion ist eine Definition und kein Prinzip. Es gibt gewisse Zahlen, für die sie gilt, und andere (die wir im 8. Kapitel kennen lernen werden), für die sie nicht gilt. Wir d e f i n i e r e n die „natürlichen Zahlen“ als diejenigen, auf die man die mathematische. Induktion bei Beweisen anwenden kann, d. h. als diejenigen, die alle induktiven Eigenschaften besitzen. Daraus folgt, daß solche Beweise auf die natürlichen Zahlen angewandt werden können. Dies ist nicht irgend eine mysteriöse Intuition oder irgend ein Axiom oder Prinzip. Es folgt vielmehr einfach aus dem Satz selbst. Wenn „Vierfüßler“ definiert sind als Tiere mit vier Füßen, so folgt daraus, daß Tiere, die vier Füße haben, Vierfüßler sind. 1) Wissenschaft und Methode, Kap. 4.
39
Ganz ähnlich liegt der Fall der Zahlen, die der mathematischen Induktion genügen. Wir werden den Ausdruck „induktive Zahlen“ in derselben Bedeutung verwenden wie bisher die „natürlichen Zahlen“. Der Ausdruck „induktive Zahlen“ ist vorzuziehen, da er uns daran erinnert, daß der Definition dieser Zahlenreihe die mathematische Induktion zugrunde liegt. Die mathematische Induktion bringt besonders deutlich den wesentlichen Unterschied des Endlichen vom Unendlichen zum Ausdruck. Das Prinzip der mathematischen Induktion läßt sich populär ungefähr so aussprechen: was vom Einen auf das Nächste geschlossen werden kann, das kann auch vom Ersten auf das Letzte geschlossen werden. Dies gilt, wenn die Zahl der Schritte zwischen dem ersten und letzten endlich ist, im anderen Fall nicht. Wer jemals gesehen hat, wie ein Güterzug zu fahren anfängt, wird beobachtet haben, wie der Anstoß mit einem Ruck von einem Wagen zum nächsten geht, bis zuletzt auch der hinterste Wagen läuft. Wenn der Zug sehr lang ist, dauert es auch sehr lange, bevor der letzte Wagen sich bewegt. Wenn der Zug aber unendlich lang wäre, so gäbe es eine unendliche Folge von Stößen, und nie würde der ganze Zug in Bewegung sein. Hätte man eine Folge von Wagen, die nicht länger ist als die Folge der induktiven Zahlen (wie wir später sehen werden, ist dies ein Beispiel für die kleinste unter den unendlich großen Zahlen), so würde jeder Wagen früher oder später anfangen, sich zu bewegen, wenn nur die Maschine fortwährend zieht. Aber es gäbe noch immer weiter hinten befindliche Wagen, die sich noch nicht bewegen. Dieses Bild hilft uns den Schluß von dem „Einen zum Nächsten“ und seinen Zusammenhang mit der Endlichkeit zu illustrieren. Wenn wir zu den unendlichen Zahlen übergehen, wo die Schlüsse, die sich auf die mathematische Induktion gründen, nicht mehr gelten, so werden die Eigenschaften dieser Zahlen ex contrario dazu beitragen, den so ziemlich unbewußten Gebrauch der mathematischen Induktion bei endlichen Zahlen klarzulegen.
4. Die Definition der Ordnung Wir haben nunmehr unsere Analyse der Folge der natürlichen Zahlen so weit geführt, daß wir zu logischen Definitionen der Glieder dieser Folge, der ganzen Menge ihrer Glieder und der Beziehung einer Zahl zu ihrem unmittelbaren Nachfolger gelangt sind. Wir müssen nun den F o 1 g e n charakter der natürlichen Zahlen in der Ordnung 0, 1, 2, 3 …. betrachten. Gewöhnlich denken wir uns die Zahlen in dieser O r d n u n g. Die logische Definition der „Ordnung“ oder der „Folge“ gehört wesentlich mit zur Aufgabe der begrifflichen Erfassung des uns Gegebenen. Der Begriff der Ordnung ist für die Mathematik von ungeheurer Wichtigkeit. Nicht nur die ganzen Zahlen, sondern auch die rationalen Brüche und alle reellen Zahlen besitzen eine Größenordnung. Dies ist ausschlaggebend für ihre meisten mathematischen Eigenschaften. Die Ordnung der Punkte auf einer Geraden ist grundlegend für die Geometrie; ebenso die etwas kompliziertere Ordnung der Geraden durch einen Punkt in einer Ebene, oder der Ebenen durch eine Gerade. Die Dimensionen in der Geometrie sind eine Weiterentwicklung der Ordnung. Der Begriff des L i m e s , der der ganzen höheren Mathematik zugrunde liegt, ist ein Folgebegriff. Es gibt zwar Teile der Mathematik, die sich unabhängig vom Begriffe der Ordnung begründen lassen; aber es sind doch nur wenige, verglichen mit den Teilen, in denen dieser Begriff eine Rolle spielt. Bei dem Versuch einer Definition der Ordnung muß zuerst klargestellt werden, daß keine Menge von Elementen gerade ausschließlich e i n e Ordnung hat. Eine Menge von Elementen hat alle Ordnungen, deren sie fähig ist. Manchmal ist eine Ordnung für uns so viel geläufiger und natürlicher, daß wir dazu neigen, sie für d i e Ordnung dieser Menge anzusehen; aber dies ist ein Fehler.
41
Die natürlichen Zahlen – oder die „induktiven“ Zahlen, wie wir sie auch nennen werden – stellen wir uns am bequemsten der Größe nach geordnet vor; aber man kann sie auf unendlich viel andere Arten anordnen. Wir können beispielsweise zuerst alle ungeraden und dann alle geraden Zahlen betrachten; oder zuerst 1, dann alle geraden Zahlen, dann alle ungeraden Vielfachen von 3, dann alle Vielfachen von 5, die nicht Vielfache von 2 oder 3 sind, dann alle Vielfachen von 7, die nicht Vielfache von 2, 3 oder 5 sind, usw. mit allen Primzahlen. Wenn wir sagen, daß wir die Zahlen in diese verschiedenen Ordnungen „bringen“, so ist das ein ungenauer Ausdruck: in Wirklichkeit richten wir unser Augenmerk auf gewisse Beziehungen zwischen den natürlichen Zahlen, die ihrerseits diese oder jene Ordnung erzeugen. Wir können die natürlichen Zahlen ebensowenig „anordnen“ wie den Sternhimmel; aber gerade so, wie wir bei den Fixsternen entweder auf ihre Helligkeitsordnung oder ihre Verteilung über das Firmament achten können, so können wir mannigfache Beziehungen zwischen den Zahlen beobachten, die man zu zahlreichen verschiedenen, gleich zulässigen Ordnungen unter den Zahlen verwenden kann. Und was für Zahlen gilt, gilt in gleicher Weise für Punkte auf einer Geraden oder Zeitpunkte: eine Ordnung ist üblicher, aber andere sind ebenso gültig. Wir können z. B. auf einer Geraden zuerst alle Punkte mit ganzzahligen, dann die mit nicht ganzzahligen rationalen, dann die mit algebraischen nicht rationalen usw. Koordinaten nehmen, indem wir so in beliebiger Weise von Komplikation zu Komplikation fortschreiten. Die sich ergebende Ordnung wird derart sein, daß die Punkte der Geraden sie sicherlich aufweisen, gleichgültig, ob wir davon Notiz nehmen oder nicht. Die einzige Willkür hinsichtlich der verschiedenen Ordnungen einer Menge von Elementen besteht in unserer Aufmerksamkeit; denn die Elemente selbst haben stets alle Ordnungen, deren sie fähig sind. Aus dieser Überlegung ergibt sich als wichtiges Ergebnis, daß wir bei der Definition der Ordnung nicht auf die Natur der zu ordnenden Mengen sehen müssen, da ja eine Menge viele Ordnungen hat. Die Ordnung liegt nicht in der M e n g e der Elemente, sondern in einer
42
Beziehung zwischen den Gliedern der Menge, auf Grund deren die einen als früher und die anderen als später erscheinen. Der Umstand, daß eine Menge viele Ordnungen haben kann, liegt an der Tatsache, daß es viele zwischen den Gliedern einer einzigen Menge geltende Beziehungen geben kann. Welche Eigenschaften muß eine Beziehung besitzen, um eine Ordnung her vorzubringen? Die wesentlichen Merkmale einer Beziehung, welche zur Herstellung einer Ordnung dienen kann, ergeben sich, wenn man beobachtet, daß man auf Grund einer solchen Beziehung imstande sein muß, zu sagen, daß von irgend zwei Elementen in der zu ordnenden Menge das eine „vorangeht“ und das andere „folgt“. Um nun diese Ausdrücke in ihrer üblichen Bedeutung anwenden zu können, verlangen wir, daß die Ordnungsbeziehung drei Eigenschaften hat: (1)Wenn x dem y vorangeht, darf y nicht auch dem x vorangehen. Dies ist eine einleuchtende Eigenschaft der Art von Beziehungen, die zu Folgen führen. Wenn x kleiner ist als y, dann ist y nicht auch kleiner als x. Wenn x zeitlich früher ist als y, dann ist y nicht auch früher als x. Wenn x links von y ist, dann ist y nicht links von x. Andererseits besitzen Beziehungen, die keine Folgen erzeugen, oft diese Eigenschaft nicht. Wenn x ein Bruder oder eine Schwester von y ist, so ist y ein Bruder oder eine Schwester von x. Wenn x gleichlang wie y ist, so ist y gleichlang wie x. Wenn x ungleich wie y ist, so ist y ungleich wie x. In allen diesen Fällen besteht die Beziehung, falls sie zwischen x und y gilt, auch zwischen y und x. Aber bei Folgebeziehungen kann das nicht vorkommen. Eine Beziehung, die diese erste Eigenschaft auf weist, wird asymmetrisch genannt. (2)Wenn x dem y und y dem z vorangeht dann muß x dem z vorangehen. Dies kann durch die gleichen Beispiele wie vorhin erläutert werden:k l e i n e r , f r ü h e r , l i n k s v o n . Aber als Beispiele für Beziehungen, die diese Eigenschaft n i c h t haben, dienen nur zwei von unseren drei weiteren Beispielen: ist x Bruder oder Schwester von y und y von z, so braucht x nicht Bruder oder Schwester von z zu sein, da x und z die gleiche Person sein können. Ebenso verhält es
43
sich mit der Verschiedenheit der Länge, nicht aber mit der Gleichheit der Länge, die unsere zweite, aber nicht unsere erste Eigenschaft hat. Dagegen hat die Beziehung „Vater“ die erste, aber nicht die zweite unserer Eigenschaften. Eine Beziehung mit der zweiten Eigenschaft heißt t r a n s i t i v . (3) Von irgend zwei gegebenen Elementen unserer zu ordnenden Menge muß eines vorangehen und das andere folgen. Von irgend zwei ganzen oder gebrochenen oder rellen Zahlen beispielsweise ist eine kleiner und die andere größer; aber für zwei komplexe Zahlen ist dies nicht richtig. Von zwei Zeitpunkten muß der eine früher als der andere sein; aber von Ereignissen kann dies nicht behauptet werden, da sie gleichzeitig stattfinden können. Von zwei Punkten auf einer Geraden muß einer links vom anderen liegen. Eine Beziehung mit dieser dritten Eigenschaft heißt z u s a m m e n h ä n g e n d . Besitzt eine Beziehung diese drei Eigenschaften, so gehört sie zu denjenigen, die eine Ordnung unter den Elementen, zwischen denen sie besteht, hervorbringen; und immer, wenn eine Ordnung existiert, kann irgend eine sie erzeugende Beziehung mit diesen drei Eigenschaften ausfindig gemacht werden. Bevor wir diese Behauptung erläutern, führen wir einige Definitionen ein. (1)Von einer Beziehung wird gesagt, sie sei aliorelativ1), oder sie sei i n d e r B e z i e h u n g Ve r s c h i e d e n h e i t e n t h a l t e n , oder s i e i m p l i z i e r e d i e B e z i e h u n g Ve r s c h i e d e n h e i t , wenn kein Element diese Beziehung zu sich selbst hat. So sind beispielsweise „größer“,„verschieden in der Größe“,„Bruder“,„Ehemann“, „Vater“ aliorelativ; aber „gleich“, „von den gleichen Eltern geboren“, „guter Freund“ sind es nicht. (2)Das Quadrat einer Beziehung ist diejenige Beziehung, die zwischen zwei Elementen x und z gilt, wenn es ein Zwischenelement y derart gibt, daß die gegebene Beziehung zwischen x und y und zwi-
1
) Dieser Ausdruck stammt von C. F. Peirce.
44
schen y und z besteht. So ist „Großvater väterlicherseits“ das Quadrat von „Vater“, „größer um 2“ das Quadrat von „größer um 1“ usw. (3)Der B e r e i c h einer Beziehung besteht aus all denjenigen Elementen, die die Beziehung zu irgend etwas haben, und der i n v e r s e B e r e i c h besteht aus all denjenigen Elementen, zu denen irgend etwas die Beziehung hat. Diese Ausdrücke sind schon definiert worden, aber sie wurden hier wieder erwähnt wegen der folgenden Definition: (4)Das F e l d einer Beziehung setzt sich aus ihrem Bereich und ihrem inversen Bereich zusammen. (5)Von einer Beziehung wird gesagt, sie e n t h a l t e eine andere Beziehung, oder sie w e r d e von einer anderen Beziehung impliziert, wenn sie gilt, sobald die andere gilt. Man sieht ein, daß eine asymmetrische Beziehung dasselbe ist wie eine Beziehung, deren Quadrat aliorelativ ist. Es kommt oft vor, daß eine Beziehung aliorelativ ist, ohne asymmetrisch zu sein, obwohl eine asymmetrische Beziehung stets aliorelativ ist. Z. B. „Verheiratet mit“ ist aliorelativ, aber symmetrisch; denn wenn x mit y, so ist auch, y mit x verheiratet. Jedoch unter den t r a n s i t i v e n Beziehungen sind alle aliorelativen asymmetrisch u n d u m g e k e h r t . Aus diesen Definitionen ergibt sich, daß eine transitive Beziehung eine solche ist, die von ihrem Quadrat impliziert wird oder, wie wir auch sagen, ihr Quadrat „enthält“. So ist „Vorfahr“ transitiv, weil der Vorfahr eines Vorfahren ein Vorfahr ist; aber „Vater“ ist nicht transitiv, weil der Vater eines Vaters von x nicht Vater von x ist. Eine transitive aliorelative Beziehung ist eine solche, die ihr Quadrat enthält und in Verschiedenheit enthalten ist; oder, was auf dasselbe hinauskommt, eine solche Beziehung, deren Quadrat diese zugleich mit der Beziehung Verschiedenheit impliziert. Denn wenn eine Beziehung transitiv ist, so ist Asymmetrie gleichwertig mit Aliorelativität. Eine Beziehung ist z u s a m m e n h ä n g e n d , wenn sie bei irgend zwei verschiedenen Elementen ihres Feldes zwischen dem ersten und dem zweiten oder zwischen dem zweiten und dem ersten
45
besteht (wobei die Möglichkeit nicht ausgeschlossen ist, daß beides zutrifft, was bei Asymmetrie aber nicht vorkommen kann). Man erkennt, daß z. B. die Beziehung „Vorfahr“ aliorelativ und transitiv, aber nicht zusammenhängend ist. Weil sie nicht zusammenhängend ist, kann diese Beziehung nicht dazu dienen, alle Menschen in eine Folge zu ordnen. Die Beziehung „kleiner oder gleich“ zwischen Zahlen ist transitiv und zusammenhängend, aber nicht asymmetrisch oder aliorelativ. Die Beziehung „größer oder kleiner“ zwischen Zahlen ist aliorelativ und zusammenhängend, aber nicht transitiv; denn ist x größer oder kleiner als y und y größer oder kleiner als z, so kann es vorkommen, daß x und z die gleiche Zahl ist. Somit sind die drei Eigenschaften: (1) aliorelativ, (2) transitiv und (3) zusammenhängend zu sein voneinander unabhängig, da eine Beziehung zwei beliebige von ihnen ohne die dritte besitzen kann. Wir stellen nun die folgende Definition auf: Eine Beziehung ist eine Fo1gebeziehung, wenn sie aliorelativ, transitiv und zusammenhängend ist; oder was das gleiche bedeutet: wenn sie asymmetrisch, transitiv und zusammenhängend ist. Eine Folge ist dasselbe wie eine Folgebeziehung. Man hätte vielleicht denken können, daß eine Folge das Feld einer Folgebeziehung sei, nicht die Folgebeziehung selbst. Aber dies wäre ein Irrtum. Z. B. 1, 2, 3; 1, 3, 2; 2, 3, 1; 2, 1, 3; 3, 1, 2; 3, 2, 1 sind 6 verschiedene Folgen die alle dasselbe Feld haben. Wäre das Feld die Folge selbst, so gäbe es zu einem gegebenen Feld nur eine Folge. Die obigen sechs Folgen unterscheiden sich einfach durch die in den sechs Fällen verschiedenen ordnenden Beziehungen. Ist die ordnende Beziehung gegeben, so sind Feld und Ordnung bestimmt. Somit kann die ordnende Beziehung, aber nicht das Feld als die Folge angesehen werden. Sei irgend eine Folgebeziehung – nennen wir sie P – gegeben, so werden wir sagen, daß hinsichtlich dieser Beziehung x dem y „vorangeht“, wenn x die Beziehung P zu y hat, was wir kurz „xPy“ schreiben
46
werden. Die drei charakteristischen Eigenschaften, die P haben muß, um eine Folgebeziehung zu sein, sind: (1)Es darf niemals xPx sein, d. h. kein Element darf sich selbst vorangehen. (2)P2 muß P implizieren, d. h. wenn x dem y und y dem z vorangeht, so muß x auch dem z vorangehen. (3)Wenn x und y zwei verschiedene Elemente des Feldes von P sind, so ist entweder xPy oder yPx, d. h. eins der beiden muß dem anderen vorangehen. Der Leser kann sich leicht davon überzeugen, daß, sobald eine Ordnungsbeziehung diese drei Eigenschaften aufweist, auch die charakteristischen Merkmale, die wir von Folgen erwarten, zu finden sind, und u m g e k e h r t . Wir sind daher dazu berechtigt, das Obige als Definition der Ordnung oder Folge zu betrachten. Und man wird bemerken, daß die Definition in rein logischen Ausdrücken gehalten ist. Obwohl eine transitive, asymmetrische, zusammenhängende Beziehung stets vorhanden ist, wo es eine Folge gibt, so ist es nicht immer diejenige Beziehung, die als natürlichste Erzeugung der Folge angesehen wird. Die natürliche Zahlenfolge möge zur Erläuterung dienen. Wir legten bei der Betrachtung der natürlichen Zahlen die Beziehung der unmittelbaren Nachfolge zugrunde, d. h. die Beziehung zwischen aufeinanderfolgenden ganzen Zahlen. Diese Beziehung ist asymmetrisch, aber nicht transitiv oder zusammenhängend. Wir können jedoch aus ihr durch die Methode der mathematischen Induktion die „Vorfahrbeziehung“ ableiten, die wir im vorigen Kapitel betrachteten. Diese Beziehung ist dasselbe wie „kleiner“ oder „gleich“ unter induktiven Zahlen. Um die Folge der natürlichen Zahlen zu erzeugen, brauchen wir die Beziehung „kleiner als“ mit Ausschluß von „gleich“. Dies ist die Beziehung von m zu n, wenn m ein Vorfahr von n, aber nicht identisch mit n ist, oder (was dasselbe ist), wenn der Nachfolger von m ein Vorfahr von n ist, in dem Sinn, daß eine Zahl ihr eigener Vorfahr ist. Damit stellen wir die folgende Definition auf:
47
Eine induktive Zahl m heißt k l e i n e r als eine andere Zahl n, wenn n jede erbliche Eigenschaft des Nachfolgers von m besitzt. Es ist leicht einzusehen und nicht schwer zu beweisen, daß die so definierte Beziehung „kleiner als“ asymmetrisch, transitiv und zusammenhängend ist und die induktiven Zahlen zu ihrem Feld hat. So erhalten die induktiven Zahlen mittels dieser Beziehung eine Ordnung in dem oben definierten Sinne, und diese Ordnung ist die sogenannte „natürliche“ Ordnung oder Größenordnung. Die Erzeugung von Folgen mit Hilfe von Beziehungen, die mehr oder weniger derjenigen von n zu n+1 ähneln, ist sehr üblich. Die Folge der Könige von England z. B. ist erzeugt durch die Beziehungen eines jeden zu seinem Nachfolger. Auf diese Weise kann man sich am einfachsten eine Folge entstanden denken, falls diese Methode anwendbar ist. Bei dieser Methode gehen wir von jedem Element zum nächsten, so lange es ein nächstes gibt, oder rückwärts zu dem vorhergehenden, so lange eines vorher ist. Dabei wird immer die verallgemeinerte Form der mathematischen Induktion vorausgesetzt, damit wir „früher“ und „später“ in einer so erzeugten Reihe definieren können. In Analogie mit den „echten Brüchen“ wollen wir als „echte Nachkommenschaft von x hinsichtlich R“ die Menge derjenigen Elemente bezeichnen, die zur R-Nachkommenschaft irgend eines Elementes gehören, zu dem x die Beziehung R hat. (Dabei ist „Nachkommenschaft“ in dem oben definierten Sinn zu verstehen, wonach ein Element zu seiner eigenen Nachkommenschaft gehört.) Mit Hilfe der Grunddefinition können wir die „echte Nachkommenschaft“ wie folgt definieren: Die „echte Nachkommenschaft“ von x hinsichtlich R besteht aus allen Elementen mit jeder R-erblichen Eigenschaft, die jedes Element besitzt, zu dem x die Beziehung R hat. Es ist darauf zu achten, daß diese Definition so weit gefaßt werden mußte, daß sie anwendbar ist nicht nur, wenn es nur ein Element gibt, zu dem x die Beziehung R hat, sondern auch (wie z. B. bei der Beziehung von Vater zu Kind), wenn es mehrere Elemente gibt, zu denen x die Beziehung R hat. Wir definieren weiter:
48
Ein Element x ist ein „echter Vorfahr“ von y hinsichtlich R, wenn y zu der echten Nachkommenschaft von x hinsichtlich R gehört. Wir werden kurz von „R-Nachkommenschaft“ und „R-Vorfahren“ sprechen, wenn diese Ausdrücke passender erscheinen. Wir kehren nunmehr zur Erzeugung von Folgen durch die zwischen aufeinanderfolgenden Elementen bestehende Beziehung R zurück. Wenn diese Methode möglich sein soll, so muß die Beziehung „echter R-Vorfahr“ aliorelativ, transitiv und zusammenhängend sein. Unter welchen Umständen wird dies der Fall sein? Sie wird immer transitiv sein; gleichgültig, von welcher Art die Beziehung R ist: „R-Vorfahr“ und „echter R-Vorfahr“ sind stets beide transitiv. Aber nur unter gewissen Umständen wird sie aliorelativ oder zusammenhängend sein. Als Beispiel diene die Beziehung linker Nachbar an einem runden Tisch, an dem 12 Personen sitzen. Wenn wir diese Beziehung R nennen, so besteht die echte R-Nachkommenschaft einer Person aus allen denjenigen, die beim Herumgehen um den Tisch von rechts nach links erreicht werden können. Dazu gehört jeder am Tisch, einschließlich die Person selbst, da 12 Schritte uns zu unserem Ausgangspunkt zurückbringen. In einem solchen Fall erhalten wir somit, obwohl die Beziehung „echter R-Vorfahr“ zusammenhängend und R selbst aliorelativ ist, keine Folge, weil „echter R-Vorfahr“ nicht aliorelativ ist. Aus diesem Grunde können wir nicht sagen, daß eine Person hinsichtlich der Beziehung „rechts von“ oder hinsichtlich ihrer daraus abgeleiteten Vorfahrbeziehung vor einer anderen kommt. Dies war ein Beispiel, bei dem die Vorfahr-Beziehung zusammenhängend, aber nicht in Verschiedenheit enthalten war. Ein Beispiel, wo sie in Verschiedenheit enthalten, aber nicht zusammenhängend ist, ergibt sich aus der gewöhnlichen Bedeutung des Wortes „Vorfahr“. Ist x ein echter Vorfahr von y, so können x und y nicht die gleiche Person sein; aber es ist nicht richtig, daß von irgend zwei Personen die eine ein Vorfahr der anderen sein muß.
49
Häufig ist die Frage wichtig, unter welchen Bedingungen Folgen durch Vorfahrbeziehungen erzeugt werden können, die aus Beziehungen des Aufeinanderfolgens abgeleitet worden sind. Einige der wichtigsten Fälle sind: Sei R eine mehr-eindeutige Beziehung, und beschränken wir unsere Betrachtung auf die Nachkommenschaft eines Elementes x. Bei dieser Beschränkung muß die Beziehung „echter R-Vorfahr“ zusammenhängend sein; zur Sicherstellung der Folgeeigenschaft muß sie daher nur noch in Verschiedenheit enthalten sein. Dies ist eine Verallgemeinerung des Beispiels mit dem Tisch. Eine andere Verallgemeinerung besteht darin, für R eine ein-eindeutige Beziehung zu nehmen und sowohl die Vorfahren wie die Nachkommen von x einzubeziehen. Auch hier ist die einzige für die Folgenerzeugung erforderliche Bedingung die, daß die Beziehung „echter R-Vorfahr“ in Verschiedenheit enthalten ist. Die Erzeugung der Ordnung mittels Beziehungen des Aufeinanderfolgens ist zwar von Wichtigkeit in ihrem eigenen Gebiete, aber weniger allgemein als die Methode, die die Ordnung durch eine transitive Beziehung definiert. Es kommt bei einer Folge oft vor, daß es zwischen irgend zwei beliebig benachbart ausgewählten Elementen eine unendliche Zahl von Zwischenelementen gibt. Als Beispiel betrachten wir die der Größe nach geordneten Brüche. Zwischen irgend zwei Brüchen gibt es andere, z. B. das arithmetische Mittel der beiden. Folglich gibt es kein Paar aufeinanderfolgender Brüche. Wenn wir bei der Definition der Ordnung auf das Aufeinanderfolgen angewiesen wären, würden wir nicht imstande sein, die Größenordnung unter Brüchen zu definieren. Aber in Wirklichkeit setzen die Beziehungen g r ö ß e r und k l e i n e r unter Brüchen nicht eine Erzeugung aus Beziehungen des Aufeinanderfolgens voraus. Die Beziehungen g r ö ß e r und k l e i n e r unter Brüchen haben die drei zur Definition von Folgebeziehungen nötigen charakteristischen Eigenschaften. In allen solchen Fällen muß die Ordnung mittels einer t r a n s i t i v e n Beziehung definiert werden, da nur eine derartige Beziehung fähig ist, eine unendliche Zahl von Zwischenelementen zu überspringen. Die Methode, die sich auf das Aufeinanderfolgen
50
gründet, ist wie diejenige des Zählens beim Ermitteln der Zahl einer Menge auf das Endliche zugeschnitten; sie kann selbst auf gewisse unendliche Folgen ausgedehnt werden, nämlich auf diejenigen, bei denen trotz der unendlichen Gesamtzahl die Zahl der Elemente zwischen irgend zweien immer endlich ist; aber sie darf nicht als allgemein angesehen werden. Nicht bloß das. Man muß sich bemühen, alle Denkgewohnheiten, die mit der Ausnahme der Allgemeingültigkeit dieser Methode zusammenhängen, abzulegen. Tut man dies nicht, so werden Folgen ohne aufeinanderfolgende Elemente wunderlich verblüffend bleiben. Und solche Folgen sind von grundlegender „Wichtigkeit für das Verständnis von Stetigkeit, Raum, Zeit und Bewegung. Es gibt viele Mittel, durch die Folgen erzeugt werden können, aber stets kommt es auf die Ermittlung oder Bildung einer asymmetrischen, transitiven und zusammenhängenden Beziehung hinaus. Einige dieser Mittel sind von besonderer Wichtigkeit. Dies werde an der Folgenerzeugung mittels einer Dreigliederbeziehung, die wir „zwischen“ nennen können, erläutert. Diese Methode ist in der Geometrie sehr nützlich und soll als eine Einleitung in die Beziehungen mit mehr als zwei Gliedern dienen. Man wird sie am besten in geometrischer Einkleidung verstehen. Auf einer Geraden im gewöhnlichen Raum seien irgend drei Punkte gegeben; dann muß einer von ihnen zwischen den beiden anderen liegen. Dies trifft bei Punkten auf einem Kreise oder irgend einer geschlossenen Kurve nicht zu, weil wir bei irgend drei gegebenen Punkten auf einem Kreise vom-einen zum anderen gehen können, ohne den dritten zu berühren. In der Tat ist der Begriff „zwischen“ charakteristisch für offene Folgen – oder für Folgen im eigentlichen Sinn – im Gegensatz zu den (wie wir sie nennen können) „zyklischen“ Folgen wo, wie bei den Leuten am runden Tisch, eine genügend lange Reise uns zu unserem Ausgangspunkt zurückbringt. Dieser Begriff des „zwischen“ kann als Grundbegriff der gewöhnlichen Geometrie genommen werden; aber augenblicklich wollen wir nur seine Anwendung auf eine einzige Gerade und auf
51
die Ordnung der Punkte auf einer Geraden betrachten1). Nehmen wir irgend zwei Punkte a und b, so besteht die Gerade (a b) aus drei Teilen (außer a und b selbst): (1)Punkte zwischen a und b. (2)Punkte x derart, daß a zwischen x und b liegt. (3)Punkte y derart, daß b zwischen y und a, liegt. Somit kann die Definition der Geraden (a b) unter Verwendung der Beziehung „zwischen“ ausgedrückt werden. Damit diese Beziehung „zwischen“ die Punkte auf der Geraden von links und rechts anordnet, brauchen wir gewisse Annahmen, nämlich die folgenden: (1)Wenn etwas zwischen a und b ist, so sind a und b nicht identisch. (2)Etwas zwischen a und b ist auch zwischen b und a. (3)Etwas zwischen a und b ist nicht identisch mit a (folglich auch nicht mit b, gemäß 2). (4)Wenn x zwischen a und b ist, so ist etwas zwischen a und x auch zwischen a und b. (5)Wenn x zwischen a und b und b zwischen x und y ist, dann ist b zwischen a und y. (6)Wenn x und y zwischen a und b sind, dann sind entweder x und y identisch, oder x ist zwischen a und y oder zwischen y und b. (7)Wenn b zwischen a und x ist und auch zwischen a und y, dann sind entweder x und y identisch, oder x ist zwischen b und y oder y zwischen b und x. Diese sieben Eigenschaften gelten offenbar im Falle der Punkte auf einer Geraden im gewöhnlichen Raum. Irgend eine Dreigliederbeziehung, die diese Eigenschaften hat, bringt Folgen hervor, wie aus den folgenden Definitionen zu ersehen ist. Um etwas Bestimmtes zu haben, setzen wir a links von b voraus. Dann sind die Punkte der Geraden (a b): (1) solche, zwischen denen und b der Punkt a liegt – diese nennen wir links von a gelegen; (2) a selbst; (3) solche zwischen a und b; (4) b selbst; (5) solche, 1
) Vgl. Rivista di Matematica, IV, S. 55 ff.; Principles of Mathematics, S. 394 (§
52
zwischen denen und a der Punkt b liegt – diese nennen wir rechts von b gelegen. Wir können nun allgemein definieren, daß von zwei Punkten x und y auf der Geraden (a b) in jedem der folgenden Fälle x „links von“ y ist: (1)Wenn x und y beide links von a sind und y zwischen x und a ist; (2)wenn x links von a ist und y gleich a oder b oder zwischen a und b oder rechts von b ist; (3)wenn x gleich a und y zwischen a, und b oder gleich b oder rechts von b ist; (4)wenn x und y beide zwischen a und b sind und y zwischen x und b ist; (5)wenn x zwischen a und b und y gleich b oder rechts von b ist; (6)wenn x gleich b und y rechts von b ist; (7)wenn x und y beide rechts von b sind und x zwischen b und y ist. Aus den 7 Eigenschaften, mit denen wir die Beziehung „zwischen“ ausgestattet haben, kann, wie man bemerken wird, gefolgert werden, daß die oben definierte Beziehung „links von“ eine F o l g e beziehung nach unserer Definition ist. Es ist von Wichtigkeit, zu beachten, daß nichts in den Definitionen oder in der Beweisführung sich darauf gründet, daß wir unter „zwischen“ die so bezeichnete wirkliche, im empirischen Raum auftretende Beziehung verstehen. Irgend eine Dreigliederbeziehung mit den obigen sieben rein formalen Eigenschaften leistet bei der Beweisführung die gleichen Dienste. Eine zyklische Ordnung wie bei den Punkten auf einem Kreis kann nicht mittels der Dreigliederbeziehung „zwischen“ erzeugt werden. Wir brauchen eine Beziehung mit vier Gliedern, die „Trennung der Paare“ genannt werden kann. Dieser Fall soll durch Betrachtung einer Reise um die Erde erläutert werden. Man kann von England nach Neuseeland über den Suezkanal oder über San Franzisko fahren; wir können nicht mit Bestimmtheit sagen, daß einer von diesen beiden Orten „zwischen“ England und Neuseeland liegt.
53
Aber wenn jemand diesen Weg bei einer Reise um die Welt wählt, so sind, in welchem Sinne er auch herumgehen mag, die Zeitpunkte seines Eintreffens in England und Neuseeland voneinander getrennt durch die Zeitpunkte in Suez und St. Franzisko und umgekehrt. Wenn wir allgemein irgend vier Punkte auf einem Kreise nehmen, so können wir sie derart in zwei Paare – sagen wir a und b sowie x und y – teilen, daß man, um von a nach b bzw. von x nach, y zu gelangen, entweder über x oder y bzw. über a oder b gehen muß. Unter diesen Umständen sagen wir, daß das Paar (a, b) durch das Paar (x, y) „getrennt“ wird. Durch diese Beziehung kann eine zyklische Ordnung auf eine ähnliche, jedoch etwas kompliziertere Weise erzeugt werden wie eine offene Ordnung durch die Beziehung „zwischen“.1) Der Zweck der zweiten Hälfte dieses Kapitels war, einen Begriff von der Erzeugung der Folgebeziehungen zu geben. Sind solche Beziehungen definiert, so entsteht die besonders in der Philosophie der Geometrie und Physik wichtige Aufgabe, sie aus anderen Beziehungen abzuleiten, die nur einen Teil der für Folgen erforderlichen Eigenschaften besitzen. Aber wir können angesichts des Charakters dieses Buches den Leser nur darauf aufmerksam machen, daß es ein solches Problem gibt.
1 ) Vgl. Principles of Mathematics, S. 205 (§ 194), und die dort gegebenen Hinweise.
54
5. Die Beziehungen Ein großer Teil der Philosophie der Mathematik handelt von B e z i e h u n g e n , und die verschiedenen Arten von Beziehungen finden verschiedenartige Anwendungen. Es kommt oft vor, daß eine Eigenschaft, die a l l e n Beziehungen zukommt, nur für gewisse Arten von Beziehungen von Bedeutung ist. In diesen Fällen kann der Leser die Tragweite einer Behauptung über eine solche Eigenschaft nicht erkennen, wenn er nicht diejenigen Beziehungen kennt, für die sie von Nutzen ist. Aus diesem Grunde und auch wegen des wesentlichen Interesses des Gegenstandes ist es von Vorteil, eine ungefähre Aufstellung der mathematisch wichtigeren Beziehungen gegenwärtig zu haben. Wir hatten es im vorhergehenden Kapitel mit einer äußerst wichtigen Klasse, nämlich den F o 1 g e beziehungen zu tun. Jede der drei Ei gen schaf ten, die zusammen die Definition der Folge ausmachten, – nämlich A s y m m e t r i e , T r a n s i t i v i t ä t und Z u s a m m e n h a n g –, hat ihre eigene Bedeutung. Wir wollen zunächst von diesen dreien sprechen. A s y m m e t r i e , d. h. die Eigenschaft der Unverträglichkeit mit dem Inversen, ist eine charakteristische Eigenschaft von allergrößtem Interesse und von allergrößter Wichtigkeit. Um ihre Funktionen klarzulegen, betrachten wir verschiedene Beispiele. Die Beziehung E h e m a n n ist asymmetrisch, ebenso die Beziehung E h e f r a u ; d. h. wenn a der Ehemann von b ist, so kann b nicht der Ehemann von a sein; ähnlich im Falle der E h e f r a u . Andererseits ist die Beziehung „verheiratet mit“ symmetrisch: wenn a mit b, dann ist b mit a verheiratet. Angenommen nun, es sei uns die Beziehung
55
v e r h e i r a t e t m i t gegeben und wir wollen daraus die Beziehung E h e m a n n ableiten. E h e m a n n ist das gleiche wie eine m ä n n l i c h e v e r h e i r a t e t e P e r s o n oder e i n e m i t e i n e r F r a u v e r h e i r a t e t e P e r s o n ; somit kann die Beziehung E h e m a n n aus v e r h e i r a t e t m i t abgeleitet werden, indem man entweder den Bereich auf männliche oder den inversen auf weibliche Personen beschränkt. An diesem Beispiel erkennen wir, daß es manchmal möglich ist, eine gegebene symmetrische Beziehung ohne Zuhilfenahme einer weiteren Beziehung in zwei asymmetrische zu spalten. Doch geht das nur in den seltenen und außergewöhnlichen Fällen, wo es zwei sich gegenseitig ausschließende Mengen – sagen wir: α und β – gibt, derart, daß falls die Beziehung zwischen zwei Elementen besteht, das eine Element zu α und das andere zu β gehört. So gehört bei v e r h e i r a t e t m i t ein Glied der Beziehung zu der Menge der Männer und das andere zu der der Frauen. Unter solchen Umständen ist die in ihrem Bereich auf α oder β beschränkte Beziehung asymmetrisch. Bei der Behandlung von Folgen mit mehr als zwei Elementen kommen Fälle dieser Art nicht vor; denn in einer Folge gehören alle Elemente, ausgenommen das erste und letzte (wenn sie existieren), sowohl zum Bereich wie zum inversen Bereich der erzeugenden Beziehung, so daß eine Beziehung wie Ehemann, wo der Bereich und der inverse Bereich sich nicht überdecken, ausgeschlossen ist. Die Frage der K o n s t r u k t i o n von Beziehungen, die irgend eine nützliche Eigenschaft aufweisen sollen, auf Grund von Operationen an Beziehungen, die nur Rudimente der betreffenden Eigenschaften besitzen, ist von beträchtlicher Bedeutung. Transitivität und Zusammenhang sind manchmal leicht herzustellen wenn die ursprünglich gegebene Beziehung sie nicht besitzt: z. B. ist die aus irgend einer Beziehung R vermöge verallgemeinerter Induktion abgeleitete Vorfahrbeziehung transitiv; ist R mehr-eindeutig, so ist die Vorfahrbeziehung bei Beschränkung auf die Nachkommenschaft eines gegebenen Elementes zusammenhängend. Aber Asymmetrie ist sehr viel schwieriger zu konstruieren. Die Methode, mittels der
56
wir E h e m a n n a u s v e r h e i r a t e t mit abgeleitet haben, ist, wie wir sahen, nicht anwendbar auf die wichtigsten Fälle wie g r ö ß e r , v o r , r e c h t s v o n , w o Bereich und inverser Bereich ineinandergreifen. In allen diesen Fällen können wir natürlich durch Zusammenfügen der gegebenen Beziehung und ihres Inversen eine symmetrische Beziehung erhalten. Aber von dieser symmetrischen können wir zur ursprünglichen asymmetrischen Beziehung nur mit Hilfe irgend einer asymmetrischen Beziehung zurückkehren. Nehmen wir die Beziehung g r ö ß e r : die Beziehung g r ö ß e r oder k l e i n e r – d. h. u n g l e i c h – ist symmetrisch, aber nichts an dieser Beziehung weist darauf hin, daß sie die Summe zweier asymmetrischer Beziehungen ist. Betrachten wir eine Beziehung wie „von ungleicher Gestalt“. Sie ist nicht die Summe einer asymmetrischen Beziehung und ihres Konversen, da die Gestalten keine Folge bilden; aber nichts läßt erkennen, daß sie sich von der Beziehung „von ungleicher Größe“ unterscheidet, wenn wir nicht schon wissen, daß Größen in den Beziehungen größer oder kleiner zueinander stehen. Diese Ausführungen sollen einen Begriff von der grundlegenden Stellung der Asymmetrie als Eigenschaft von Beziehungen geben. Für die Klassifikation der Beziehungen ist die Asymmetrie viel wichtiger als die Implikation der Verschiedenheit. Asymmetrische Beziehungen implizieren die Verschiedenheit, aber das Umgekehrte ist nicht der Fall. „Ungleich“ z. B. impliziert die Verschiedenheit, ist aber symmetrisch. Wenn wir soweit wie möglich Sätze mit Beziehungen vermeiden und sie durch solche, die den Gegenständen Prädikate zuschreiben, ersetzen wollen, so gelingt dies im allgemeinen nur, falls man sich auf symmetrische Beziehungen beschränkt. Diejenigen symmetrischen Beziehungen, die, wenn sie transitiv sind, nicht die Verschiedenheit implizieren, können als Behauptungen eines gemeinsamen Prädikats, diejenigen, die die Verschiedenheit implizieren, als Behauptungen unvereinbarer Prädikate angesehen werden. Als Beispiel betrachten wir die Beziehung der Ä q u i v a l e n z z w i s c h e n M e n g e n , durch die wir die Zahlen definiert haben. Diese Beziehung ist symmetrisch und transitiv und impliziert nicht die Verschiedenheit. Es
57
wäre also möglich, obgleich weniger einfach als das von uns eingeschlagene Verfahren, die Zahl einer Menge als ein Prädikat der Menge aufzufassen. Zwei äquivalente Mengen würde dann das gleiche Zahlenprädikat zukommen, während zwei nicht äquivalente Mengen verschiedene Zahlenprädikate hätten. Diese Methode, Beziehungen durch Prädikate zu ersetzen’ ist formal möglich (obgleich oft sehr umständlich), soweit die betreffenden Beziehungen symmetrisch sind; aber sie ist formal unmöglich bei asymmetrischen Beziehungen, weil sowohl Gleichheit wie Verschiedenheit der Prädikate symmetrisch ist. Asymmetrische Beziehungen sind sozusagen die relationalsten Relationen und die wichtigsten für den Philosophen, der die tiefste logische Natur der Beziehungen studieren will. Eine andere Art von Beziehungen von größtem Nutzen sind die ein-mehrdeutigen Beziehungen. Das sind Beziehungen, die höchstens ein Element zu einem gegebenen Element haben kann, wie Vater, Mutter, Ehemann (ausgenommen in Tibet), Quadrat von, Sinus von usw. Aber Vater oder Mutter, Quadratwurzel usw. sind nicht einmehrdeutig. Man kann mittels eines Kunstgriffs alle Beziehungen durch ein-mehrdeutige Beziehungen formal ersetzen. Nehmen wir die Beziehung k l e i n e r unter den induktiven Zahlen. Zu jeder Zahl n größer als 1 gibt es nicht nur eine Zahl, die in der Beziehung k l e i n e r zu n steht. Wir können vielmehr die ganze Menge der Zahlen, die kleiner als n sind, bilden. Das ist eine bestimmte Menge. Keine andere Menge hat dieselbe Beziehung zu n. Wir können die Menge der Zahlen, die kleiner als n sind, die „echten Vorfahren“ von n nennen, in dem Sinne, wie wir von Vorfahren und Nachkommen bei der mathematischen Induktion gesprochen haben. Dann ist „echte Vorfahren“ eine ein-mehrdeutige Beziehung (einmehrdeutig soll immer ein-eindeutig einschließen), da jede Zahl eine einzige Menge von Zahlen bestimmt, die sich aus ihren echten Vorfahren zusammensetzt. Somit kann die Beziehung k l e i n e r a l s ersetzt werden durch die Beziehung e c h t e V o r f a h r e n v o n . Wenn eine Menge in einer ein-mehrdeutigen Beziehung zu irgend etwas steht so kann man unter Zuhilfenahme der Beziehung des Zugehörens zu dieser Menge auf diese Weise immer eine nicht
58
ein-mehrdeutige Beziehung formal ersetzen. Peano, der aus irgend einem Grunde immer instinktiv eine Beziehung als ein-mehrdeutig auffaßt, behandelt in dieser Weise diejenigen Beziehungen, die es von Natur nicht sind. Die Zurückführung auf ein-mehrdeutige Beziehungen mittels dieses Verfahrens stellt jedoch, obgleich formal möglich, keine technische Vereinfachung dar. Und es sprechen alle Gründe für die Annahme, daß diese Methode nicht als eine philosophische Analyse angesehen werden kann – und wäre es auch nur, weil die Mengen als „logische Fiktionen“ betrachtet werden müssen. Wir werden daher wie bisher die ein-mehrdeutigen Beziehungen als eine besondere Art von Beziehungen ansehen. Ein-mehrdeutige Beziehungen finden sich in allen Sätzen von der Form „der Soundso von Demunddem“. „Der König von England“, „die Frau desSokrates“, „der Vater von John Stuart Mill“ usw. beschreiben eine Person mittels einer ein-mehrdeutigen Beziehung zu einem gegebenen Element. Eine Person kann nicht mehr als einen Vater haben, daher beschreibt „der Vater von John Stuart Mill“ eine einzige Person, selbst wenn wir nicht wissen, wen. Von den Beschreibungen werden wir noch viel zu reden haben, aber augenblicklich haben wir es mit den Beziehungen zu tun, und die Beschreibungen kommen daher nur als Beispiele für die Anwendung ein-mehrdeutiger Beziehungen in Betracht. Es muß darauf hingewiesen werden, daß alle mathematischen Funktionen sich aus ein-mehrdeutigen Beziehungen ergeben; der Logarithmus von x, der Kosinus von x usw. sind, wie der Vater von x, Ausdrücke, die durch die ein-mehrdeutige Beziehung Logarithmus, Kosinus, usw. zu einem gegebenen Element x beschrieben werden. Der Begriff der F u n k t i o n braucht nicht auf Zahlen beschränkt oder so, wie es in der Mathematik üblich ist, angewandt zu werden; er kann ausgedehnt werden auf alle Fälle von ein-mehrdeutigen Beziehungen, und „der Vater von x“ ist mit demselben Recht eine Funktion mit dem Argument x, wie „der Logarithmus von x. Funktionen in diesem Sinne sind b e s c h r e i b e n d e Funktionen. Wie wir später sehen werden, gibt es Funktionen noch allgemeinerer und grundlegenderer Art, nämlich die S a t z f u n k t i o n e n ; aber vorläufig wenden wir
59
unsere Aufmerksamkeit nur den beschreibenden Funktionen zu, d. h. „dem Element, das die Beziehung R zu x hat“ oder kurz »dem R von x“, wobei R eine ein-mehrdeutige Beziehung ist. Es ist zu beachten, daß, wenn „das R von x“ ein bestimmtes Ding beschreiben soll, x ein Element sein muß, zu dem etwas die Beziehung R hat, und es darf nicht mehr als ein Element geben, das die Beziehung R zu x hat, weil das korrekt angewandte Wort „das“ die Eindeutigkeit implizieren muß. So können wir von „dem Vater von x“ sprechen, wenn x ein menschliches Wesen ausgenommen Adam und Eva ist; aber nicht, wenn x ein Tisch, ein Stuhl oder sonst etwas ist, das keinen Vater hat. Wir werden sagen, daß das R von x „existiert“, wenn es gerade ein und nur ein Element gibt, das in der Beziehung R zu x steht. Ist also R eine ein-mehrdeutige Beziehung, so existiert das R von x dann und nur dann, falls x zum inversen Bereich von R gehört. Indem wir „das R von x“ als eine Funktion im mathematischen Sinne auffassen, sprechen wir von x als dem „Argument“ der Funktion, und wenn y das Element ist, das die Beziehung R zu x hat, d. h. wenn y das R von x ist, so soll y der „Wert“ der Funktion für das Argument x heißen. Bei einer ein-mehrdeutigen Beziehung R ist der Umfang der möglichen Argumente der Funktion durch den inversen Bereich und der Umfang der Funktionswerte durch den Bereich von R gegeben. Zum Umfang der möglichen Argumente der Funktion „der Vater von x“ gehören somit alle, die Väter haben, d. h. der inverse Bereich der Beziehung Vater, während der Umfang der möglichen Funktionswerte aus allen Vätern besteht, d. h. aus dem Bereich der Funktion. Viele der wichtigsten Begriffe der Logik der Beziehungen sind beschreibende Funktionen, z. B.: d a s I n v e r s e , B e r e i c h , i n v e r s e r B e r e i c h , F e l d . Andere Beispiele werden uns weiterhin begegnen. Unter den ein-mehrdeutigen Beziehungen sind die e i n e i n d e u t i g e n eine besonders wichtige Klasse. Wir hatten schon bei der Definition der Zahl Gelegenheit, von ein-eindeutigen Beziehungen zu sprechen, aber wir müssen sie selbst genau kennen lernen, nicht bloß ihre formale Definition. Ihre formale Definition kann
60
aus derjenigen der ein-mehrdeutigen Beziehungen folgendermaßen abgeleitet werden: sie sind einmehrdeutige Beziehungen, die gleichzeitig die Inversen von solchen sind, d. h. sie sind Beziehungen, die sowohl ein-mehrdeutig wie mehr-eindeutig sind. Ein-mehrdeutige Beziehungen können definiert werden als Beziehungen, bei denen, wenn x die fragliche Beziehung zu y hat, es kein anderes Element x’ gibt, das ebenfalls die Beziehung zu y hat; oder sie können auch so erklärt werden: für zwei gegebene Elemente x und x' haben die Elemente, zu denen x, und diejenigen, zu denen x' die betreffende Beziehung hat, kein Glied gemeinsam; oder sie können definiert werden als Beziehungen, bei denen das relative Produkt mit dem Inversen die Identität impliziert. Dabei ist das „relative Produkt“ zweier Beziehungen R und S diejenige Beziehung, die zwischen x und z besteht, wenn es ein Zwischenelement y derart gibt, daß x die Beziehung R zu y und y die Beziehung S zu z hat. So ist z. B. das relative Produkt der Beziehung von Vater zu Sohn mit ihrem Inversen die Beziehung, die zwischen x und einem Mann z gilt, wenn es eine Person y gibt, so daß x der Vater von y und y der Sohn von z ist. Es ist klar, daß dann x und z die gleiche Person sein müssen. Nehmen wir andererseits die Beziehung von Vater oder Mutter zu Kind, die nicht ein-mehrdeutig ist, so können wir icht mehr beweisen, daß wenn x Vater oder Mutter von y und y das Kind von z ist, x und z die gleiche Person sein müssen, weil die eine der Vater und die andere die Mutter von y sein kann. Dies zeigt deutlich, daß es eine wesentliche Eigenschaft der ein-mehrdeutigen Beziehungen ist, daß das relative Produkt einer Beziehung und ihres Inversen die Identität impliziert. Bei den ein-eindeutigen Beziehungen kommt außerdem noch die Eigenschaft dazu, daß das relative Produkt des Inversen und der Beziehung die Identität impliziert. Wenn x die Beziehung R zu y hat, so ist es zweckmäßig, sich vorzustellen, daß y von x aus durch einen „R-Schritt“ oder „R-Vektor“ und x von y aus durch einen „Rückwärts-R-Schritt“ erreicht wird. Somit können wir die charakteristische Eigenschaft der ein-mehrdeutigen Beziehungen, mit der wir uns befaßt haben, so ausdrücken: ein R-Schritt gefolgt
61
von einem Rückwärts-R-Schritt muß uns zu unserem Ausgangspunkt zurückführen. Bei anderen Beziehungen ist dies keineswegs der Fall; z. B. das relative Produkt der Beziehung von Kind zu Vater oder Mutter mit ihrem Inversen ist die Beziehung „selbst oder Bruder oder Schwester“, und das relative Produkt der Beziehung von Enkelkind zu Großvater oder Großmutter mit ihrem Inversen ist „selbst oder Bruder oder Schwester oder Vetter oder Base“. Es ist zu beachten, daß das relative Produkt zweier Beziehungen im allgemeinen nicht kommutativ ist, d. h. das relative Produkt von R und S ist im allgemeinen nicht die gleiche Beziehung wie das relative Produkt von S und R. Beispielsweise ist das relative Produkt von Vater oder Mutter und Bruder: Vater oder Mutter, jedoch das relative Produkt von Bruder und Vater oder Mutter: Onkel. Ein-eindeutige Beziehungen stellen eine gegenseitige gliedweise Zuordnung zweier Mengen in der Art her, daß jedes Element in der einen Menge sein zugeordnetes in der anderen hat. Solche Zuordnungen sind am einfachsten zu verstehen, wenn die beiden Mengen keine gemeinsamen Elemente haben wie die Menge der Ehemänner und die Menge der Ehefrauen; denn in diesem Fall wissen wir sofort, ob ein Element als ein solches anzusehen ist, v o n dem die zuordnende Beziehung R ausgeht, oder als ein solches, z u dem sie hingeht. Es empfiehlt sich, die Bezeichnungen d a s R e f e r e n s für das Element, v o n dem die Beziehung ausgeht, und d a s R e l a t u m für das Element, z u dem die Beziehung hingeht, einzuführen. Wenn x und y Ehemann und Ehefrau bedeuten, dann ist hinsichtlich der Beziehung „Ehemann“ x das Referens und y das Relatum, aber hinsichtlich der Beziehung „Ehefrau“ ist y das Referens und x das Relatum. Eine Beziehung und ihr In-verses haben, wie wir uns ausdrücken wollen, entgegengesetzte „Richtung“; somit ist die „Richtung“ einer Beziehung, die von x nach y geht, entgegengesetzt der Richtung, die die entsprechende Beziehung von y nach x besitzt. Die Tatsache, daß eine Beziehung eine „Richtung“ hat, ist fundamentaler Natur; die Möglichkeit, eine Ordnung durch geeignete Beziehungen zu erzeugen, ist zum Teil durch sie begründet. Man
62
wird bemerken, daß die Menge aller möglichen Referentien einer gegebenen Beziehung ihr Bereich und die Menge aller möglichen Relata ihr inverser Bereich ist. Aber sehr oft tritt der Fall ein, daß der Bereich und der inverse Bereich einer ein-eindeutigen Beziehung übereinander greifen. Nehmen wir die ersten 10 ganzen Zahlen, 0 ausgenommen, und addieren zu jeder 1, so erhalten wir die ganzen Zahlen 2, 3, 4, 5, 6, 7, 8, 9, 10, 11. Dies sind die gleichen Zahlen wie vorher, nur daß 1 am Anfang weggenommen und 11 am Ende hinzugefügt worden ist. Es sind noch immer 10 Zahlen; sie sind den vorigen Zahlen durch die ein-eindeutige Beziehung von n zu n+1 zugeordnet. Anstatt 1 zu addieren, könnte man auch jede Zahl verdoppeln, so daß die Zahlen 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 entstehen. Hier sind noch fünf Zahlen unserer ersten Zahlenfolge, nämlich 2 , 4 , 6 , 8 , 1 0 , vorhanden. Die Beziehung einer Zahl zu ihrem Doppelten ist wieder eine ein-eindeutige Beziehung. Oder wir hätten auch jede Zahl durch ihr Quadrat ersetzen können, wodurch sich die Reihe l, 4, 9, 16, 25, 36, 49, 64, 81, 100 ergeben hätte. Bei diesem Verfahren bleiben nur die drei Zahlen 1, 4, 9 unserer ursprünglichen Reihe übrig. Solche Zuordnungsmethoden können endlos variiert werden. Am interessantesten ist dabei der Fall, wo der inverse Bereich unserer ein-eindeutigen Beziehung ein Teil des Bereiches, aber nicht der ganze Bereich ist. Wenn wir, statt den Bereich auf die ersten 10 ganzen Zahlen einzuschränken, die Gesamtheit der induktiven Zahlen in Betracht gezogen hätten, so würden die obigen Beispiele diesen Fall darstellen. Wir schreiben die Zahlen, um die es sich handelt, in zwei Zeilen, indem wir die einander zugeordneten Zahlen untereinander setzen. Je nachdem die Zuordnung durch die Beziehung von n zu n+1 oder durch diejenige einer Zahl zu ihrem doppelten oder diejenige einer Zahl zu ihrem Quadrat bewerkstelligt wird, bilden wir jeweils die beiden Folgen:
63
1, 2, 3, 4, 5, … n … 2, 3, 4, 5, 6, … n+l … oder 1, 2, 3, 4, 5, … n … 2, 4, 6, 8, 10, … 2n … oder l, 2, 3, 4, 5, ……. l, 4, 9, 16, 25, … n² … Jedesmal treten in der oberen Zeile alle induktiven Zahlen und in der darunterstehenden nur ein Teil von ihnen auf. Fälle dieser Art, wo der inverse Bereich ein „echter Teil“ des Bereiches (d. h. ein Teil und nicht das Ganze) ist, werden uns wieder bei der Behandlung der Unendlichkeit beschäftigen. Vorläufig wollen wir nur von ihrer Existenz Notiz nehmen und bemerken, daß sie untersucht werden müssen. Eine andere Klasse von Zuordnungen, die zuweilen von Bedeutung ist, sind die „Permutationen“, bei denen der Bereich und der inverse Bereich identisch sind. Betrachten wir als Beispiel die sechs möglichen Anordnungen von drei Buchstaben: a, b, c a, c, b b, c, a b, a, c c, a, b c, b, a Jede dieser Anordnungen kann aus irgend einer der übrigen mit Hilfe einer Zuordnung erhalten werden. Bei der ersten (a, b, c) und letzten (c, b, a) z. B. entspricht a dem c, b sich selbst und c dem a. Die Kombination zweier Permutationen ist offenbar wieder eine Permutation, d. h. die Permutationen einer gegebenen Klasse bilden eine sogenannte „Gruppe“. Diese verschiedenen Arten von Zuordnungen sind in mannigfachen Zusammenhängen für verschiedene Zwecke von Wichtigkeit. Der allgemeine Begriff der ein-eindeutigen Zuordnungen besitzt in der Philosophie der Mathematik eine grenzenlose Bedeutung. Dies
64
haben wir zum Teil schon gesehen; im folgenden werden wir diese Erfahrung in noch viel stärkerem Maße machen. Eine Anwendung dieses Begriffs soll uns in unserem nächsten Kapitel beschäftigen.
6. Ähnlichkeit von Beziehungen Wir fanden im zweiten Kapitel, daß zwei Mengen die gleiche Zahl von Elementen haben, wenn sie „äquivalent sind“, d. h. wenn es eine eineindeutige Beziehung gibt, deren Bereich die eine und deren inverser Bereich die andere Menge ist. In einem solchen Fall sprechen wir von einer „ein-eindeutigen Zuordnung“ zwischen den beiden Mengen. Im gegenwärtigen Kapitel wollen wir eine Beziehung zwischen Beziehungen definieren, die bei den Beziehungen dieselbe Rolle spielen wird wie die Äquivalenz der Mengen bei den Mengen. Diese Beziehung werden wir „Ähnlichkeit von Beziehungen“ nennen. Wie ist diese Ähnlichkeit zu definieren? Wir werden wiederum den Begriff der Zuordnung heranziehen, indem wir annehmen, daß man dem Bereich der einen Beziehung den Bereich der anderen und dem inversen Bereich der einen den inversen Bereich der anderen entsprechen lassen kann. Aber das reicht noch nicht aus, damit zwischen den beiden Beziehungen die von uns gewünschte Ähnlichkeit bestehe. Wir möchten gern, daß, falls die eine Beziehung zwischen zwei Elementen gilt, die andere Beziehung zwischen den ihnen entsprechenden Elementen gelten soll. Das einfachste Beispiel dieser Art ist die Landkarte. Ist ein Ort nördlich von einem anderen, so befindet sich die entsprechende Stelle auf der Karte oberhalb der anderen; liegt ein Ort westlich von einem anderen, so befindet sich die entsprechende Stelle auf der Karte links von der anderen und so fort. Die Struktur der Karte entspricht der Gegend, die sie darstellt. Die räumlichen Beziehungen auf der Karte haben „Ähnlichkeit“ mit den räumlichen Beziehungen in der aufgenommenen Gegend. Diese Art von Zusammenhang zwischen Beziehungen wollen wir jetzt definieren.
66
Wir können gleich von vornherein mit Vorteil eine gewisse Einschränkung einführen. Wir wollen uns bei der Definition der Ähnlichkeit nur mit solchen Beziehungen befassen, die „Felder“ besitzen, aus deren Bereich und inversem Bereich man also eine einzige Menge bilden kann. Dies ist nicht immer der Fall. Als Beispiel führen wir die Beziehung „Bereich.“ an, d. i. die Beziehung, die der Bereich einer Beziehung zu der Beziehung selbst hat. Der Bereich dieser Beziehung besteht aus allen Mengen, da jede Menge der Bereich irgend einer Beziehung ist; den inversen Bereich bilden alle Beziehungen, da jede Beziehung einen Bereich hat. Aber Mengen und Beziehungen können nicht zu einer neuen, einzigen Menge zusammengesetzt werden, da sie von verschiedenem logischem „Typus“ sind. Wir brauchen hier auf die schwierige Lehre von den Typen nicht einzugehen. Aber es ist doch gut, von ihrer Existenz wenigstens Kenntnis zu nehmen, wenn wir auch nicht darauf eingehen wollen. Wir können dann ohne nähere Begründung behaupten, daß eine Beziehung nur ein „Feld“ hat, wenn sie sozusagen „homogen“ ist, d. h., wenn ihr Bereich und ihr inverser Bereich vom gleichen logischen Typus sind. Um einen ungefähren Begriff von einem „Typus“ zu geben, führen wir an, daß Individuen, Mengen von Individuen, Beziehungen zwischen Mengen, Beziehungen von Mengen zu Individuen usw. von verschiedenem logischem Typus sind. Nun ist der Begriff der Ähnlichkeit, angewandt auf nicht homogene Beziehungen, ziemlich bedeutungslos. Daher werden wir bei der Definition der Ähnlichkeit von Beziehungen unser Problem vereinfachen, indem wir von dem „Feld“ einer der betreffenden Beziehungen sprechen. Dies schränkt die Allgemeinheit unserer Definition etwas ein. Aber diese Einschränkung ist praktisch belanglos und einmal festgesetzt, braucht sie nicht mehr erwähnt zu werden. Wir können definieren: zwei Beziehungen P und Q sind „ähnlich“, wenn es eine ein-eindeutige Beziehung S gibt, deren Bereich das Feld von P und deren inverser Bereich das Feld von Q ist, derart, daß, wenn ein erstes Element die Beziehung P zu einem anderen zweiten hat, das dem ersten entsprechende Element die
67
Beziehung Q zu dem dem zweiten entsprechenden Element besitzt u n d u m g e k e h r t . Eine Figur wird dies deutlich machen. Seien x und y zwei Elemente, die in der Beziehung P stehen, dann soll es zwei andere Elemente z und w geben, so daß x die Beziehung S zu z, y die Beziehung S zu w und z die Beziehung Q zu w hat. Wenn das für jedes Paar von Elementen, wie x und y, und die Umkehrung für jedes Paar von Elementen, wie z und w, zutrifft, so gibt es offenbar für jeden Einzelfall, in dem die Beziehung P gilt, einen entsprechenden Fall, in dem die Beziehung Q gilt und umgekehrt. Dies wollten wir durch unsere Definition erreichen. In der soeben skizzierten Definition können wir einige Überflüssigkeiten weglassen, indem wir bemerken, daß bei Erfüllung der obigen Bedingungen die Beziehung P das gleiche ist wie das relative Produkt von S und Q und dem Inversen von S. Also kann der P-Schritt von x nach y dadurch ersetzt werden, daß man hintereinander den S-Schritt von x nach z, den Q-Schritt von z nach w und den Rückwärts-S-Schritt von w nach y ausführt. Somit können wir die folgende Definition aufstellen: Eine Beziehung S wird ein „Korrektor“ oder ein „Ordnungs-Korrelator“ zweier Beziehungen P und Q genannt, wenn S ein-eindeutig ist, das Feld von Q als inversen Bereich besitzt und wenn P das relative Produkt von S und Q und dem Inversen von S ist. Zwei Beziehungen P und Q sollen „ähnlich“ heißen, wenn es wenigstens einen Korrelator von P und Q gibt. Diese Definitionen leisten alles, was wir oben als notwendig festgestellt hatten. Zwei ähnliche Beziehungen haben, wie ersichtlich, alle Eigenschaften gemeinsam, die nicht von den tatsächlich auftretenden Elementen
68
ihrer Felder abhängen. Impliziert z. B. die eine Verschiedenheit, so gilt dies auch für die andere; ist die eine transitiv, so ist es audi die andere. Ebenso verhält es sich mit dem Zusammenhang. Ist daher die eine eine Folgebeziehung, so ist es auch die andere. Ist ferner die eine ein-mehrdeutig oder ein-eindeutig, so auch die andere. Ebenso verhält es sich bei allen allgemeinen Eigenschaften der Beziehungen. Selbst Aussagen, bei denen die tatsächlichen Elemente des Feldes einer Beziehung auftreten, brauchen an und für sich nicht richtig zu sein, wenn man sie auf eine ähnliche Beziehung anwendet. Aber sie lassen sich stets in analoge Behauptungen überführen. Durch solche Betrachtungen werden wir zu einem Problem geführt, das in der mathematischen Philosophie eine Bedeutung hat, die bis jetzt keineswegs gebührend anerkannt ist. Unser Problem kann so formuliert werden: Es sei eine Aussage in einer Sprache gegeben, von der wir Grammatik und Syntax, nicht aber den Wortschatz kennen. Welches sind dann die möglichen Bedeutungen einer solchen Aussage und diejenigen der unbekannten Worte, die aus ihr eine wahre Behauptung machen? Dieses Problem ist deswegen wichtig, weil es, weit mehr als man annehmen möchte, den Zustand unserer Kenntnis der Natur darstellt. Wir wissen, daß gewisse wissenschaftliche Sätze – die sich in den am meisten fortgeschrittenen Wissenschaften in mathematischen Symbolen ausdrücken, – mehr oder weniger von der Welt gelten. Aber wir befinden uns in großer Verlegenheit darüber, wie die in diesen Sätzen auftretenden Ausdrücke auszulegen sind. Über die F o r m der Natur wissen wir weit mehr als über ihren I n h a l t (um für einen Augenblick diese beiden altmodischen Worte zu gebrauchen). Wenn wir also ein Naturgesetz aussprechen, so wissen wir nur, daß ei wahrscheinlich i r g e n d e i n e Auslegung der darin auftretenden Ausdrücke gibt, so daß das Gesetz näherungsweise richtig ist. Somit ist die Frage von großer Wichtigkeit: Welches sind die möglichen Bedeutungen eines Gesetzes, das in Ausdrücken gehalten ist, deren wesentliche Bedeutung wir nicht kennen, sondern bloß die Grammatik und die Syntax? Und dies ist die oben aufgeworfene Frage.
69
Doch wollen wir jetzt unsere Aufmerksamkeit nicht der allgemeinen Frage zuwenden; sie wird uns in einem späteren Stadium beschäftigen. Zuerst muß das Problem der Ähnlichkeit selbst weiter untersucht werden. Da zwei ähnliche Beziehungen in allen Eigenschaften übereinstimmen, mit Ausnahme derjenigen, die davon abhängen, daß die Felder gerade aus den betreffenden Elementen bestehen, ist es wünschenswert, eine Bezeichnungsweise zu haben, die alle Beziehungen zusammenfaßt, die zu einer gegebenen Beziehung ähnlich sind. Genau wie wir die Menge der einer gegebenen Menge äquivalenter Mengen ihre „Zahl“ genannt haben, so können wir die Gesamtheit aller einer gegebenen Beziehung ähnlichen Beziehungen ihre „Zahl“ nennen. Um aber eine Verwechslung mit den zu Mengen gehörigen Zahlen zu vermeiden, wollen wir in diesem Falle von einer „Beziehungszahl“ sprechen. Somit haben wir die folgenden Definitionen: Die „Beziehungszahl“ einer gegebenen Beziehung ist die Menge aller zu ihr ähnlichen Beziehungen. „Beziehungszahlen“ sind die Gesamtheit aller Mengen von Beziehungen, die Beziehungszahlen verschiedener Beziehungen sind; oder, was auf dasselbe hinauskommt, eine Beziehungszahl ist eine Menge von Beziehungen, die aus allen Beziehungen besteht, die mit einem Element der Menge ähnlich sind. Wenn wir von Mengenzahlen im Gegensatz zu den Beziehungszahlen sprechen wollen, so werden wir sie „Kardinalzahlen“ nennen. Somit beziehen sich die „Kardinalzahlen“ auf die Menge. Dazu gehören die gewöhnlichen ganzen Zahlen des täglichen Lebens und auch gewisse unendliche Zahlen, von denen wir später reden werden. Unter „Zahlen“ schlechtweg verstehen wir immer K a r d i n a l zahlen. Die Definition einer Kardinalzahl lautet, wie man sich erinnern wird, folgendermaßen: Die „Kardinalzahl“ einer gegebenen Menge ist der Inbegriff aller ihr ähnlichen Mengen. Die unmittelbarste Anwendung finden die Beziehungszahlen bei den F o l g e n . Zwei Folgen können als gleichlang angesehen werden, wenn sie die gleiche Beziehungszahl haben. Z w e i e n d l i c h e Folgen werden dann und nur dann die gleiche Beziehungszahl
70
haben, wenn ihre Felder die gleiche Kardinalzahl von Elementen haben - d. h. eine Folge von z.B 15 Elementen besitzt die gleiche Beziehungszahl wie irgend eine andere Folge von 15 Elementen, aber nicht wie eine Folge von 14 oder 16 Elementen und natürlich nicht wie eine Beziehung, die keine Folgebeziehung ist. Folglich besteht in dem ganz besonderen Fall der endlichen Folgen ein Parallelismus zwischen Kardinal-und Beziehungszahlen. Die Beziehungszahlen der Folgen mögen als „Folgenzahlen“ bezeichnet werden (die gewöhnlich so genannten Ordinalzahlen bilden eine Teilmenge von ihnen); also ist eine endliche Folgenzahl bestimmt, wenn wir die Kardinalzahl der Elemente des Feldes einer Folge mit der fraglichen Folgenzahl kennen. Wenn n eine endliche Kardinalzahl ist, so nennt man die Beziehungszahl einer Folge mit n Elementen die „Ordinalzahl“ n. (Es gibt auch unendliche Ordinalzahlen, die wir in einem späteren Kapitel behandeln werden.) Ist die Kardinalzahl der Elemente des Feldes einer Folge unendlich, so ist die Beziehungszahl der Folge durch die Kardinalzahl allein noch nicht bestimmt; in der Tat gibt es zu einer unendlichen Kardinalzahl unendlich viele Beziehungszahlen, wie wir bei der Betrachtung der unendlichen Folgen sehen werden. Bei einer unendlichen Folge kann das, was wir ihre „Länge“ nennen wollen, nämlich ihre Beziehungszahl, ohne Veränderung der Kardinalzahl variieren; bei einer endlichen Folge aber kann dies nicht vorkommen. Wir können Addition und Multiplikation bei Beziehungszahlen ebensogut wie bei Kardinalzahlen definieren. Man kann eine ganze Arithmetik der Beziehungszahlen entwickeln. Wie man dabei vorzugehen hat, sieht man leicht bei den Folgenzahlen. Wir wollen z. B. die Summe von zwei sich nicht überdeckenden Folgen derartig definieren, daß die Beziehungszahl der Summe gleich der Summe der Beziehungszahlen der beiden Folgen ist. Von vornherein ist klar, daß es eine O r d n u n g zwischen den beiden Folgen geben muß: eine von ihnen muß vor der anderen kommen. Sind also P und Q die erzeugenden Beziehungen der beiden Folgen, so wird in der Folge die ihre Summe darstellt (wobei P vor Q kommen soll), jedes Element des Feldes von P jedem Element des Feldes von Q
71
vorangehen. Somit lautet die Folgebeziehung, die als die Summe von P und Q zu definieren ist, nicht einfach „P oder Q“, sondern „P oder Q oder die Beziehung irgend eines Elementes des Feldes von P zu irgend einem Element des Feldes von Q“. Unter der Annahme, daß P und Q sich nicht überdecken, ist dies eine Folgebeziehung, aber „P oder Q“ ist keine Folgebeziehung, da sie nicht zusammenhängend ist; denn sie gilt nicht zwischen einem Element des Feldes von P und einem solchen des Feldes von Q. Infolgedessen kann die Summe zweier Beziehungszahlen mit Hilfe der oben definierten Summe von P und Q definiert werden. Ähnlich hat man bei der Definition der Produkte und Potenzen vorzugehen. In der so entstehenden Arithmetik gilt das kommutative Gesetz nicht: Die Summe oder das Produkt zweier Beziehungszahlen hängt im allgemeinen von der Reihenfolge ab. Dagegen gilt das assoziative Gesetz und die eine Form des distributiven Gesetzes und zwei von den formalen Potenzgesetzen nicht nur für Folgenzahlen, sondern für alle Beziehungszahlen. Die Arithmetik der Beziehungen ist in der Tat ein zwar ganz neuer, jedoch durchaus beachtenswerter Zweig der Mathematik. Die Folgen sind zwar das offensichtlichste Anwendungsgebiet der Beziehungsähnlichkeit, man darf aber nicht glauben, daß es keine anderen wichtigen Anwendungen gibt. Wir haben bereits die Landkarte erwähnt, und wir hätten von diesem Beispiel ausgehend unsere Untersuchungen allgemein auf die Geometrie ausdehnen können. Wenn wir das System der Beziehungen, vermöge dessen eine Geometrie auf eine gewisse Klasse von Elementen angewendet werden kann, vollständig beziehungsähnlich mit einem System machen können, das für eine andere Klasse von Elementen gilt, dann ist die Geometrie der beiden Klassen vom mathematischen Standpunkt aus ununterscheidbar, d. h. alle Sätze sind dieselben, abgesehen davon, daß sie im einen Falle auf die eine Klasse von Elementen, im anderen Fall auf die andere Klasse angewandt werden. Wir wollen dies an der im 4. Kapitel betrachteten „Zwischenbeziehung“ erläutern. Damals sahen wir, daß eine Dreigliederbeziehung mit gewissen formalen, logischen Eigenschaften Folgen erzeugt und „Zwischenbeziehung“ genannt werden kann. Wir können sie dazu verwenden, um die
72
durch zwei gegebene Punkte a, und b bestimmte Gerade zu definieren; diese besteht aus a und b und allen Punkten x, wobei zwischen den drei Punkten a, b, x in irgend einer Reihenfolge die Zwischenbeziehung gilt. O. Veblen hat gezeigt, daß unser ganzer Raum als das Feld einer Zwischenbeziehung mit drei Elementen betrachtet und unsere Geometrie durch die Eigenschaften definiert werden kann, die wir unserer Zwischenbeziehung zuschrieben1). Nun ist es gerade so leicht, Ähnlichkeit zwischen Drei- wie zwischen Zweigliederbeziehungen zu definieren. Sind S und B’ zwei Zwischenbeziehungen, so daß „xB(y, z)“ bedeutet „x ist zwischen y und z hinsichtlich B“, so soll S ein Korrektor von B und B’ heißen, wenn das Feld von B’ der inverse Bereich von S und derart beschaffen ist, daß die Beziehung B zwischen drei Elementen dann und nur dann gilt, wenn B’ zwischen den ihnen durch S zugeordneten Elementen besteht. Wir sagen B und B’ sind ähnlich, wenn es wenigstens einen Korrelator zwischen B und B’ gibt. Falls B und B’ in diesem Sinne ähnlich sind, so kann der Leser sich leicht davon überzeugen, daß die durch B und B’ erzeugten Geometrien sich in nichts voneinander unterscheiden. Daraus folgt, daß der Mathematiker sich nicht mit dem besonderen Wesen oder der inneren Natur seiner Punkte, Geraden und Ebenen zu beschäftigen braucht. Dies gilt sogar, wenn er in Bezug auf die angewandte Mathematik spekulative Überlegungen anstellt. Wir können sagen, daß die angenäherte Richtigkeit der jenigen Teile der Geometrie, die nicht Definitionssache sind, empirisch evident ist. Aber was ein .Punkt“ sein soll, ist nicht empirisch evident. Er muß etwas sein, das so nahe wie möglich unseren Axiomen genügt, aber er braucht nicht „sehr klein“ oder „ohne Teile“ zu sein. Ob er es ist oder nicht, ist gleichgültig, so lange er die Axiome erfüllt. Wenn wir aus unserem empirischen Material eine logische Konstruktion herstellen können, sie sei so kompliziert, wie sie wolle, so kann diese Konstruktion, wenn sie unsere geometrischen Axiome befriedigt,
‘) Dies gilt nicht für einen elliptischen Raum, sondern nur für Räume, in denen die Gerade eine offene Reihe ist. „Moderne Mathematik“, herausgegeben von J. W. A. Young, S. 3—51 („Grundlagen der Geometrie“ von O. Veblen).
73
mit vollem Recht als „Punkt“ bezeichnet werden. Wir dürfen nicht behaupten, daß sonst nichts Punkt genannt werden kann; wir können nur sagen: das von uns konstruierte Objekt genügt für die Geometrie; vielleicht ist es nur eines der vielen Objekte, von denen jedes den gleichen Zweck erfüllen würde, aber das geht uns nichts an, da dieses Objekt die empirische Wahrheit der Geometrie in genügendem Maße sicherstellt, soweit die Geometrie nicht Definitionssache ist. Dies alles bildet nur eine Illustration des allgemeinen Prinzips, wonach das, was die Mathematik und zum großen Teil die Physik ausmacht, nicht in der wesentlichen Natur unserer Begriffe besteht, sondern in der logischen Natur ihrer gegenseitigen Beziehungen. Zwei ähnlichen Beziehungen wollen wir die gleiche „Struktur“ zuschreiben. Für mathematische (nicht aber für rein philosophische) Zwecke ist das einzig wichtige an einer Beziehung nicht ihr inneres Wesen, sondern die Fälle, in denen sie gilt. Gerade wie eine Menge durch verschiedene Begriffe gleichen Umfangs – wie „Mensch“ und „federloser Zweifüßler“ – definiert werden kann, so können zwei begrifflich verschiedene Beziehungen in den gleichen Fällen gelten. Ein „Beispiel“, für das die Beziehung gilt, mu5ß aufgefaßt werden als ein geordnetes Paar von Elementen, derart, daß eines der Elemente das erste und das andere das zweite ist; natürlich muß das Paar so sein, daß sein erstes Element die betreffende Beziehung zu seinem zweiten hat. Nehmen wir z. B. die Beziehung „Vater“: Wir definieren den „Umfang“ dieser Beziehung als die Menge aller geordneten Paare (x, y), bei denen x der Vater von y ist. Vom mathematischen Standpunkt aus kommt es bei der Beziehung „Vater“ nur darauf an, daß sie diesen Inbegriff geordneter Paare definiert. Allgemein gesprochen: Der „Umfang“ einer Beziehung ist die Menge derjenigen geordneten Paare (x, y), bei denen x die betreffende Beziehung zu y hat. Wir können nun einen Schritt weiter in der Abstraktion gehen und die „Struktur“ betrachten. Falls die Beziehung einfach genug ist, können wir eine Karte von ihr entwerfen. Der Bestimmtheit halber nehmen wir eine Beziehung, deren Umfang aus folgenden Paaren besteht: ab, ac, ad, bc, ce, de, de, wo a, b, c, d, e fünf beliebige Elemente
74
sind. Wir zeichnen die „Karte“ dieser Beziehung, indem wir, wie in der Figur 5 Punkte in einer Ebene durch Pfeile verbinden. Diese Karte gibt das wieder, was wir die „Struktur“ der Beziehung nennen wollen. Es ist klar, daß die „Struktur“ der Beziehung nicht von den besonderen Elementen abhängt, die das Feld der Beziehung bilden. Das Feld kann geändert werden, ohne daß die Struktur sich ändert, und die Struktur kann sich ändern, ohne daß dies beim Feld der Fall ist. Im nebenstehenden Beispiel ändern wir durch Hinzufügen des Paares ae die Struktur, aber nicht das Feld. Zwei Beziehungen haben, wie wir uns ausdrücken wollen, die gleiche „Struktur“, falls die gleiche Karte für beide gilt, oder was auf dasselbe hinauskommt, wenn jede eine Karte der anderen sein kann (denn jede Be ziehung kann als ihre eigene Karte angesehen werden). Eine kurze Über le gung ergibt, daß dies genau dasselbe wie „Ähnlichkeit“ ist. Damit soll gesagt sein, daß zwei Beziehungen die gleiche Struktur haben, wenn sie ähnlich sind, d. h. wenn sie die gleiche Beziehungszahl haben. Somit ist die von uns definierte „Beziehungszahl“ genau das gleiche, was dunkel mit dem Wort „Struktur“ gemeint ist – ein Wort, das trotz seiner Wichtigkeit (soweit mir bekannt) bisher noch nie genau definiert worden ist. Die herkömmliche Philosophie hätte sich viele Spekulationen sparen können, wenn sie sich der Wichtigkeit der Struktur und der Schwierigkeit, hinter sie zu kommen, bewußt gewesen wäre. So wird z. B. oft gesagt, daß Raum und Zeit subjektiv sind, daß sie aber objektive Gegenbilder besitzen; oder, daß die Erscheinungen subjektiv sind, aber durch Dinge an sich verursacht werden, die unter sich Unterschiede voneinander aufweisen, die den Unterschieden bei den zugehörigen Erscheinungen entsprechen. Bei derartigen Hypothesen wird allgemein angenommen, daß wir von den objektiven Gegenbil-
75
dern sehr wenig wissen. Wenn die aufgestellten Hypothesen korrekt wären, so würden aber die objektiven Gegenbilder eine Welt bilden, die die gleiche Struktur, wie die Welt der Erscheinungen besitzt. Dies würde uns ermöglichen, aus den Erscheinungen die Wahrheit aller Sätze zu schließen, die unter Verwendung abstrakter Begriffe aufgestellt werden können und von denen man weiß, daß sie auf die Erscheinungen zutreffen. Ist die Erscheinungswelt dreidimensional, so ist es auch die Welt hinter den Erscheinungen; ist die Erscheinungswelt euklidisch, so muß es auch die andere sein usw. Kurz, jeder Satz, der eine mitteilbare Bedeutung hat, gilt für beide Welten oder für keine: Der einzige Unterschied muß gerade in dem Wesen der Individualität liegen, das mit Worten nicht zu fassen und unbeschreiblich ist, aber das gerade deshalb für die Wissenschaft bedeutungslos ist. Nun verwerfen die Philosophen die Erscheinungen nur aus dem Grunde, um sich und anderen einzureden, daß die wirkliche Welt ganz verschieden von der Welt der Erscheinungen ist. Wir alle können mit ihrer Absicht, einen solchen wünschenswerten Satz zu beweisen, sympathisieren. Aber wir können sie nicht zu ihrem Erfolge beglückwünschen. Einige von ihnen behaupten zwar nicht, daß es objektive Gegenbilder zu den Erscheinungen gäbe. Auf diese trifft die obige Behauptung nicht zu. Diejenigen aber, die die Existenz von Gegenbildern behaupten, sind meistens sehr zurückhaltend über diesen Gegenstand, wahrscheinlich, weil sie instinktiv fühlen, daß bei weiterer Verfolgung eine zu große Annäherung zwischen der wirklichen und der Erscheinungswelt zutage treten würde. Wenn sie die Angelegenheit weiter verfolgen würden, so könnten sie kaum an den Konsequenzen, auf die wir hingewiesen haben, vorübergehen. In solchen wie in anderen Fällen ist der Begriff der Struktur oder Beziehungszahl von Wichtigkeit.
76
7. Rationale, reelle und komplexe Zahlen Wir haben jetzt gelernt, die Kardinalzahlen und Beziehungszahlen zu definieren. Die gewöhnlich so genannten Ordinalzahlen sind nur ein Spezialfall der letzteren. Jede dieser Zahlen kann offenbar endlich oder unendlich sein. Aber man kann aus ihnen nicht ohne weiteres die übliche Erweiterung des Zahlbegriffs, nämlich die negativen, gebrochenen, irrationalen und komplexen Zahlen ableiten. Im vorliegenden Kapitel werden wir kurz die logischen Definitionen dieser verschiedenen Erweiterung geben. Einer der Irrtümer, der die Aufstellung von korrekten Definitionen hierfür verhindert hat, ist die allgemeine Auffassung, daß jede Erweiterung einer Zahl die früheren Arten als spezielle Fälle umfaßt. Bei der Betrachtung der positiven und negativen ganzen Zahlen glaubte man, die positiven Zahlen mit den ursprünglichen, vorzeichenlosen ganzen Zahlen identifizieren zu können. Man glaubte auch, daß ein Bruch mit dem Nenner 1 mit der natürlichen Zahl, die ihren Zähler darstellt, identifiziert werden könne. Den Irrationalzahlen, z. B. der Quadratwurzel aus 2 glaubte man einen Platz zwischen den rationalen Brüchen anweisen zu können. Man hielt sie für größer als einige von ihnen und kleiner als andere. Rationale und irrationale Zahlen sollte man dann in eine Menge, die der reellen Zahlen, zusammenfassen können. Erweitert man den Zahlbegriff derart, daß er auch die komplexen umfaßt, d. h. Zahlen, zu denen die Quadratwurzel aus - 1 gehört, so glaubte man, die reellen Zahlen als solche komplexe betrachten zu können, deren imaginärer Teil (d. h. der Teil, der mit der Quadratwurzel aus - 1 multipliziert ist) 0 ist. All diese Annahmen waren irrig. Man muß
77
sie, wie wir sehen werden, ausschalten, wenn man korrekte Definitionen geben will. Beginnen wir mit den positiven und negativen ganzen Zahlen. Wenn man einen Augenblick nachdenkt, so ist es klar, daß + 1 und - 1 Beziehungen sein müssen. Tatsächlich sind sie jeweils zueinander invers. Die selbstverständliche, hinreichende Definition ist: +1 ist die Beziehung von n + 1 zu n und - 1 ist die Beziehung von n zu + 1. Wenn allgemein m eine induktive Zahl ist, so ist +m die Beziehung von n + m zu n (für jedes n) und - m ist die Beziehung von n zu n + m. Nach dieser Definition ist +m eine Beziehung, die ein-eindeutig ist, so lange n eine Kardinalzahl ist (endlich oder unendlich) und m eine induktive Kardinalzahl ist. Aber +m läßt sich unter keinen Umständen mit m identifizieren, denn dies ist nicht eine Beziehung, sondern eine Menge von Mengen. Tatsächlich unterscheidet sich +m genau so in jeder Einzelheit von m wie - m. Die Brüche sind interessanter als die positiven oder negativen ganzen Zahlen. Man braucht die Brüche für viele Zwecke, am offensichtlichsten vielleicht bei Messungen. Mein Freund und Mitarbeiter Dr. A. N. Whitehead hat eine Theorie der Brüche entwickelt, die besonders für Messungen geeignet ist. Sie ist in den Principia mathematica (Band 3, Satz 300 und ff., besonders 303) dargestellt. Aber wenn wir nur gewisse Objekte mit vorgeschriebenen rein mathematischen Eigenschaften definieren wollen, so läßt sich dieser Zweck durch eine einfachere Methode erreichen, von der wir im folgenden Gebrauch machen werden. Wir definieren den Bruch m/n als die Beziehung zwischen zwei induktiven Zahlen x und y, wenn xn = ym. Diese Definition ermöglicht uns den Beweis, daß min eine ein-eindeutige Beziehung ist, unter der Voraussetzung, daß weder m noch n null ist. Und natürlich ist n/m die zu m/n inverse Beziehung. Nach der obigen Definition ist es klar, daß der Bruch m/1 eine solche Beziehung zwischen zwei ganzen Zahlen x und y ist, so daß x = my ist. Diese Beziehung läßt sich genau wie die Beziehung +m unter keinen Umständen mit der induktiven Kardinalzahl m identifizieren. Denn eine Beziehung und eine Menge von Mengen sind Objekte von
78
vollkommen verschiedener Art1). Man sieht, daß 0/n immer dieselbe Beziehung ist, was auch die induktive Zahl n sein mag. Sie ist kurz gesagt die Beziehung der 0 zu irgend einer andern induktiven Kardinalzahl. Wir können sie die Null der rationalen Zahlen nennen Sie ist natürlich nicht identisch mit der Kardinalzahl 0. Umgekehrt ist die Beziehung m/0 immer dieselbe, welches auch die induktive Zahl m ist. Es gibt keine induktive Kardinalzahl, die m/0 entspricht. Wir können sie die „Unendlichkeit der Rationalzahlen’’ nennen. Dies ist ein Beispiel für das in der Mathematik traditionelle Unendlich und wird durch das Zeichen ∞ dargestellt. Es ist dies eine ganz andere Art von Unendlichkeit als die echte, von Cantor eingeführte, die wir in unserem nächsten Kapitel behandeln werden. Die Unendlichkeit der Rationalzahlen setzt bei der Definition oder dem Gebrauch keine unendliche Mengen oder, unendlich große ganze Zahlen voraus. Tatsächlich ist es kein sehr wichtiger Begriff und wir könnten ihn vollständig weglassen, wenn dazu irgend ein Anlaß vorhanden wäre. Das Cantorsche Unendlich andererseits ist von der größten und fundamentalsten Wichtigkeit; sein Verständnis bahnt den Weg zu ganz neuen Bereichen der Mathematik und Philosophie. Man beachte, daß die Null und die Unendlichkeit als einzige unter den Brüchen nicht ein-eindeutig sind. Die Null ist einmehrdeutig, die Unendlichkeit mehr-eindeutig. Es ist nicht schwierig, größer und kleiner zwischen Brüchen (oder Verhältnissen) zu definieren. Gegeben seien zwei Brüche m/n und p/q. Dann soll m/n kleiner als p/q sein, wenn mq kleiner ist als pn. Ohne Schwierigkeit kann man beweisen, daß die so definierte Relation „kleiner als“ eine Folgebeziehung ist, so daß die Brüche nach der Größe geordnet eine Folge bilden. In dieser Folge ist null das kleinste und unendlich das größte Element. Wenn wir null und unendlich aus unserer Reihe weglassen, so gibt es keinen kleinsten und keinen größten Bruch mehr. Wenn m/n von null und unendlich l ) In der Praxis werden wir natürlich auch weiterhin von einem Bruch sagen er sei größer oder kleiner als 1 und meinen damit größer oder kleiner als der Bruch 1/i. Unter der stillschweigenden Voraussetzung, daß der Bruch Vi und die Kardinalzahl 1 verschieden sind, braucht man diesen Unterschied nicht immer pedantisch zu betonen.
79
verschieden ist, so ist offenbar m/2n kleiner und 2m/n ist größer als m/n, obwohl keines von beiden 0 oder unendlich ist. Daher ist m/n weder der kleinste noch der größte Bruch. Wenn man also 0 und Unendlich wegläßt, so gibt es keinen kleinsten und keinen größten Bruch, denn m/n war willkürlich gewählt. Ebenso können wir beweisen, daß, so benachbart zwei Brüche auch sein mögen, es noch immer Brüche dazwischen geben muß. Angenommen m/n und p/q seien zwei Brüche und p/q sei der größere, dann sieht (oder beweist) man leicht, daß (m + p)/(n + q) größer ist als m/n und kleiner als p/q. Daher ist die Reihe der Brüche von der Art, daß keine zwei Elemente aufeinander folgen. Vielmehr gibt es zwischen je zweien immer noch weitere und da es zwischen diesen wieder andere Elemente gibt und so weiter ad infinitum, so müssen ersichtlich zwischen je zwei beliebig benachbarten Brüchen unendlich viele liegen1). Eine Folge welche diese Eigenschaft besitzt, daß es zwischen je zwei Elementen immer weitere gibt, so daß keine zwei aufeinanderfolgenden existieren, heißt „dicht“. Die Brüche bilden also nach der Größe geordnet eine dichte Folge. Solche Folgen haben viele wichtige Eigenschaften. Es sei ausdrücklich darauf hingewiesen, daß die Brüche ein Beispiel einer dichten Folge liefern, die rein logisch ohne irgend welche Verwendung von Raum, Zeit oder anderer empirischer Daten erzeugt ist. Positive und negative Brüche lassen sich genau so definieren, wie wir positive und negative ganze Zahlen definierten. Haben wir zunächst die Summe von zwei Brüchen m/n und p/q als (mq + pri)/nq definiert, so definieren wir + p/q als die Beziehung von m/n + p/q zu m/n, wo m/n irgend ein Bruch ist. - p/q ist natürlich das Inverse von + p/q. Dies ist nicht die einzig mögliche Definition der positiven und negativen Brüche, aber für unseren Zweck hat sie den Vorzug, eine leichtverständliche Übertragung der bei den ganzen Zahlen befolgten Methode zu bilden.
l ) Genau genommen setzt diese Behauptung ebenso wie die folgenden das Axiom der Unendlichkeit voraus, das in einem späteren Kapitel behandelt werden wird.
80
Wir kommen jetzt zu einer interessanteren Erweiterung des Zahlbe griffs, nämlich zu den sogenannten reellen Zahlen. Das sind die Zahlen, die die Irrationalzahlen umfassen. Im ersten Kapitel hatten wir Gelegenheit, die „inkommensurablen“ Zahlen und ihre Entdeckung durch Pythagoras zu erwähnen. Durch sie, d. h. durch die Geometrie kam man zuerst auf den Gedanken der irrationalen Zahlen. Ein Quadrat, dessen Seite ein cm lang ist, wird eine Diagonale haben, deren Länge in cm die Quadratwurzel aus 2 ist. Aber wie die Alten entdeckten, gibt es keinen Bruch, dessen Quadrat 2 ist. Dieser Satz wird im 10. Buch Euklids bewiesen. Als Euklid noch als Schulbuch verwendet wurde, war dies eines von den Büchern, das, wie die Schulkinder meinen, glücklicherweise verloren gegangen ist. Der Beweis ist außerordentlich einfach. Angenommen, m/n sei die Quadratwurzel aus 2, so daß m2/n2= 2, d. h. m2 = 2n2, dann ist m2 eine gerade Zahl. Daher muß auch m eine gerade Zahl sein, denn das Quadrat einer ungeraden Zahl ist ungerade. Wenn aber m gerade ist, so muß sich m2 durch 4 teilen lassen, denn wenn m = 2p, so ist m2 = 4p2. Wir haben also 4p2 = 2n2, wo p die Hälfte von m ist, also 2p2 = n2 und daher ist auch n/p die Quadratwurzel aus 2. So können wir fortfahren: wenn n = 2q, so wird auch p/q die Quadratwurzel aus 2 sein usw. für eine unendliche Reihe von Zahlen, von denen jede die Hälfte des Vorgängers ist. Aber das ist unmöglich. Wenn wir eine Zahl durch 2 dividieren und die Hälfte wieder halbieren und so weiter, so müssen wir nach endlich viel Schritten zu einer ungeraden Zahl kommen. Wir können den Beweis vereinfachen durch die Annahme, daß der Bruch m/n ursprünglich bereits gekürzt sei. In diesem Fall können m und n nicht beide gerade sein und trotzdem haben wir gesehen, daß, wenn m/n = 2 ist, sie es sein müssen. Es kann also keinen Bruch m/n geben, dessen Quadrat 2 ist. Also wird kein Bruch die Länge der Diagonale eines Quadrats genau wiedergeben, dessen Seite 1 cm lang ist. Dies erscheint wie eine Herausforderung, die die Natur der Arithmetik bietet. So stolz der Arithmetiker (wie Pythagoras) auch auf die Macht der Zahlen sein mag, so lacht die Natur ihn aus, indem sie ihm Längen vorsetzt,
81
die durch die Einheit nicht zahlenmäßig ausgedrückt werden können. Aber das Problem blieb nicht in dieser geometrischen Form. Als man die Algebra erfand, entstand dasselbe Problem sofort bei der Lösung von Gleichungen. Es nahm aber hier eine allgemeinere Form an, denn dazu gehörten die komplexen Zahlen. Es ist klar, daß man Brüche finden kann, deren Quadrat sich von 2 um immer weniger unterscheidet. Wir können eine aufsteigende Folge von Brüchen bilden, deren Quadrate stets kleiner sind als 2; die sich aber von der 2, wenn wir weit genug fortschreiten, um weniger als jeden vorgegebenen Betrag unterscheiden. Angenommen also, ich setze einen kleinen Betrag, sagen wir ein Billionstel von vornherein fest, so werden von einem bestimmten Element an, sagen wir vom zehnten, alle Elemente unserer Folge Quadrate haben, die sich von 2 um weniger als diesen Betrag unterscheiden. Hätte ich einen noch kleineren Betrag angenommen, so hätte ich in der Folge noch weiter gehen müssen. Aber früher oder später hätten wir ein Element erreicht, sagen wir das zwanzigste, so daß alle folgenden Elemente Quadrate besitzen, die sich von der 2 um weniger als diesen kleinen Betrag unterscheiden. Wenn wir uns an die Arbeit machen, nach den üblichen arithmetischen Regeln die Quadratwurzel aus 2 zu ziehen, so werden wir einen unendlichen Dezimalbruch bekommen, der wenn auf so und so viele Stellen berechnet, die obigen Bedingungen erfüllt. Wir können ebensogut eine fallende Folge von Brüchen bilden, deren Quadrate alle größer sind als 2, aber bei späteren Elementen der Folge nimmt der Unterschied immer ab. Früher oder später unterscheidet sich sein Quadrat von 2 um weniger als irgend ein angegebener Betrag. Auf diese Weise haben wir scheinbar die Wurzel 2 umzingelt. Man kann sich schwer vorstellen, daß sie uns immer entschlüpfen wird. Trotzdem können wir auf diese Weise die Quadratwurzel aus 2 tatsächlich nicht erreichen. Wenn wir a l l e Brüche in zwei Klassen teilen, je nachdem ihre Quadrate kleiner sind als 2 oder nicht, so finden wir, daß alle diejenigen, deren Quadrate nicht kleiner sind als 2, Quadrate besitzen, die größer als 2 sind. Die Brüche, deren Quadrat kleiner als 2 ist, haben
82
kein Maximum und die, deren Quadrat größer ist als 2, haben kein Minimum. Die Differenz zwischen den Zahlen, deren Quadrat etwas kleiner ist als 2, und den Zahlen, deren Quadrat etwas größer ist als 2, besitzt keine untere Grenze außer der Null. Wir können, kurz gesagt, alle Brüche in zwei Klassen teilen, so daß alle Elemente der einen Klasse kleiner sind als alle anderen, so daß die eine kein Maximum und die andere kein Minimum besitzt. Zwischen diesen beiden Klassen aber, da wo Wurzel 2 sein sollte, ist nichts. Obwohl wir also unsere Einschnürung so dicht wie möglich gemacht haben, so haben wir sie doch an der falschen Stelle zugezogen und die Wurzel 2 nicht gefangen. Die obige Methode, alle Elemente einer Folge in zwei Klassen zu teilen, von denen die eine ganz vor der anderen kommt, ist durch Dedekind1) allgemein bekannt geworden. Sie heißt daher ein „Dedekindscher Schnitt“. Mit Rücksicht auf das, was am Schnittpunkt selbst passiert, gibt es vier Möglichkeiten: 1. Die Unterklasse hat ein Maximum und die Oberklasse ein Minimum. 2. Ein Maximum bei der einen und kein Minimum bei der anderen. 3. Kein Maximum bei der einen, aber ein Minimum bei der anderen. 4. Weder ein Maximum bei der einen, noch ein Minimum bei der anderen. Ein Beispiel für den ersten Fall ist jede Folge mit aufeinander folgenden Elementen. In der Folge der ganzen Zahlen z. B. muß eine Unterklasse mit irgend einer Zahl n enden und die Oberklasse muß dann mit n +1 beginnen. Ein Beispiel für den zweiten Fall bildet die Folge der Brüche, wenn wir als Unterklasse alle Brüche kleiner als 1 (1eingeschlossen) und als Oberklasse alle Brüche größer als 1 nehmen. Ein Beispiel für den dritten Fall erhalten wir, wenn wir als Unterklasse alle Brüche kleiner als 1 und als Oberklasse alle Brüche von 1 an (1 eingeschlossen) nehmen. Der vierte Fall tritt wie wir gesehen haben ein, wenn wir in unserer Unterklasse alle Brüche nehmen, deren Quadrat kleiner ist als 2 und in unserer Oberklasse alle Brüche deren Quadrat größer ist als 2.
1
) Stetigkeit und irrationale Zahlen, 2. Aufl. Braunschweig 1892.
83
Den ersten unserer vier Fälle können wir außer acht lassen. Denn er entsteht nur, wenn es aufeianderfolgende Elemente gibt. Im zweiten Fall nennen wir das Maximum der Unter klasse den unteren Limes der Oberklasse oder von jeder Folge von Elementen, die aus der Oberklasse derart ausgewählt ist, daß kein Element der Oberklasse vor allen andern kommt. Im dritten Fall nennen wir das Minimum der Oberklasse, den oberen Limes der Unterklasse oder von jeder Folge von Elementen, die aus der Unterklasse derart ausgewählt ist, daß kein Element der Unterklasse nach allen andern kommt. Im vierten Fall sagen wir, daß eine „Lücke“ existiere: weder die Oberklasse noch die Unterklasse hat einen Limes oder ein letztes Element. Diesen Fall können wir auch einen irrationalen Schnitt nennen. Denn die Klassen der Folge der Brüche weisen Lücken auf, wenn sie irrationalen Zahlen ent sprechen. Die irrtümliche Auffassung, daß es in der Folge der Brüche „Limites“ geben müsse, hat die Aufstellung einer richtigen Theorie der Irrationalzahlen verzögert. Der Begriff des „Limes“ ist von der allergrößten Wichtigkeit. Bevor wir weitergehen, müssen wir ihn definieren. Ein Element x heißt ein „oberes Limes“ einer Menge α hinsichtlich einer Beziehung P, wenn (1) α kein Maximum in P hat, (2) jedes Element von α, das zum Feld von P gehört, dem x vorangeht, (3) jedes Element des Feldes von P, das dem x vorangeht, auch irgend einem Element von α vorangeht (unter „Vorangehen“ verstehen wir „hat die Beziehung P zu etwas“). Dabei soll „Maximum“ wie folgt definiert sein: Ein Element x heißt ein „Maximum“ einer Menge α hinsichtlich der Beziehung P, wenn x ein Element von α und vom Feld von P ist und die Beziehung P zu keinem anderen Element von α hat. Diese Definitionen setzen nicht voraus, daß die Begriffe, auf die sie angewandt werden, quantitativ seien. Man betrachte z. B. eine Folge von Zeitpunkten, die nach dem Prinzip von früher und später geordnet sind. Ihr „Maximum“ wird (wenn es existiert) der letzte Zeitpunkt sein. Sind sie aber nach dem Prinzip von später und früher geordnet, so wird ihr „Maximum“ (wenn eines existiert) der erste Zeitpunkt sein.
84
Das „Minimum“ einer Menge bezüglich P ist ihr Maximum bezüglich des Inversen von P und der „untere Limes“ bezüglich P ist der obere Limes bezüglich des Inversen von P. Die Begriffe Limes und Maximum setzen nicht als wesentlich voraus, daß die Beziehungen für die sie definiert sind, Folgebeziehungen seien. Aber ihre wirklichen Anwendungsmöglichkeiten sind unbedeutend falls es sich nicht um eine Folge- oder Quasifolgebeziehung handelt. Sehr oft ist auch der Begriff „oberer Limes oder Maximum“ von Wichtigkeit. Wir bezeichnen ihn als „obere Grenze“. Die „obere Grenze“ einer Teilfolge von Elementen, die aus einer Folge ausgewählt sind, ist somit ihr letztes Glied, wenn ein solches existiert; im ändern Fall ist es das erste Element nach allen, wenn ein solches existiert. Wenn es weder ein Maximum noch einen Limes gibt, so gibt es auch keine obere Grenze. Die „untere Grenze“ ist entsprechend der untere Limes oder das Minimum. Kehren wir zu den vier Arten des Dedekindschen Schnittes zurück, so sehen wir, daß in den drei ersten Fällen jede Klasse eine Grenze hat (je nachdem obere oder untere). Bei der vierten Art aber existiert keine Grenze. Wenn die Unterklasse eine obere Grenze hat, so ist klar, daß die Oberklasse eine untere Grenze hat. Im zweiten und dritten Fall sind die beiden Grenzen identisch. Im ersten Fall sind sie aufeinanderfolgende Elemente der Folge. Eine Folge heißt „Dedekindisch“, wenn jede Klasse eine obere bezw. untere Grenze hat. Wir haben gesehen, daß die Folge der nach der Größe geordneten Brüche nicht Dedekindisch ist. Durch die Gewohnheit, sich durch die räumliche Vorstellung beeinflussen zu lassen, ist man zu der Vermutung gekommen, daß Folgen Limites besitzen müssen in den Fällen, wo es merkwürdig aussehen würde, wenn keine existierten. Da man einsah, daß die Brüche, deren Quadrat kleiner ist als 2, keinen rationalen Limes besitzen, so erlaubte man sich, einen irrationalen Limes zu „postulieren“, der die Dedekindsche Lücke ausfüllen sollte. Dedekind stellte in der oben erwähnten Arbeit das Axiom auf, daß die Lücke immer ausgefüllt werden, d. h. daß jede Klasse eine Grenze haben müsse. Aus diesem Grund nennt
85
man die Folgen, bei denen sein Axiom gilt, „Dedekindisch“. Es gibt aber unendlich viele Folgen, für die es nicht gilt. Die Methode, das zu „postulieren“, was man braucht, hat viele Vorteile. Es sind dieselben, wie die Vorteile des Diebstahls gegenüber der ehrlichen Arbeit. Wir wollen dies anderen überlassen und mit unserer ehrlichen Arbeit fortfahren. Es ist klar, daß ein irrationaler Dedekindscher Schnitt eine Irrationalzahl in gewisser Beziehung „darstellt“. Dies ist aber zunächst nur ein vages Gefühl. Um diese Darstellung zu verwenden, müssen wir aus ihr irgendwie eine exakte Definition herausholen. Hierzu müssen wir unser Gefühl eines besseren belehren: eine Irrationalzahl ist nicht der Limes einer Folge von Brüchen. Die Brüche, mit dem Nenner eins, sind nicht identisch mit den ganzen Zahlen. Genau so sind die rationalen Zahlen, die größer oder kleiner als Irrationalzahlen sein können oder Irrationalzahlen als Limites besitzen, nicht mit den Brüchen zu identifizieren. Wir müssen eine neue Art von Zahlen, die sog. „reellen Zahlen“ definieren, von denen einige rational, andere irrational sind. Die rationalen „entsprechen“ den Brüchen in derselben Weise, wie der Bruch n/1 der ganzen Zahl n entspricht. Aber sie sind nicht identisch mit den Brüchen. Um ihre Natur aufzuklären, beachte man, daß eine Irrationalzahl durch einen irrationalen Schnitt und ein Schnitt durch seine Unterklasse dargestellt ist. Beschränken wir uns auf Schnitte, bei denen die Unterklasse kein Maximum hat, so wollen wir die Unterklasse ein „Segment“ nennen. Dann sind die Segmente, die den Brüchen entsprechen, diejenigen, die aus allen Brüchen bestehen, die kleiner sind als der entsprechende Bruch. Dieser ist ihre Grenze. Dagegen besitzen die Segmente, die Irrationalzahlen entsprechen, keine Grenze. Gehören zwei Segmente, mit oder ohne Grenze, zu einer Folge, so muß das eine Segment einen Teil des anderen bilden, also können alle Segmente vermöge der Beziehung des Ganzen zu einem Teil in eine Folge angeordnet werden. Eine Folge mit Dedekindschen Lücken, in der es Segmente ohne Grenze gibt, erzeugt mehr Segmente, als sie Elemente besitzt. Denn jedes Element wird ein Segment definieren, welches das betreffende Element als Grenze besitzt. Dazu kommen dann noch die Segmente ohne Grenze.
86
Wir sind jetzt in der Lage, eine reelle Zahl und eine Irrationalzahl zu definieren. Eine „reelle Zahl“ ist ein Segment in der Folge der nach der Größe geordneten Brüche. Eine „Irrationalzahl“ ist ein Segement in der Folge der Brüche, das keine Grenze besitzt. Eine „rationale reelle Zahl“ ist ein Segment in der Folge der Brüche, das eine Grenze besitzt. Also besteht eine rationale reelle Zahl aus allen Brüchen, die kleiner sind als ein gewisser Bruch und sie ist diejenige rationale reelle Zahl, die diesem Bruch entspricht. Die reelle Zahl 1 z. B. ist die Menge der echten Brüche. In den Fällen, in denen wir naturgemäß annahmen, daß eine Irrationalzahl der Limes einer Folge von Brüchen sei, ist sie in Wahrheit der Limes der entsprechenden Folge von rationalen reellen Zahlen in der Folge der nach Ganzen und Teilen geordneten Segmente. √2 z. B. ist der obere Limes all derjenigen Segmente der Folge der Brüche, die den Brüchen entsprechen, deren Quadrat kleiner ist als 2. Noch — einfacher: √2 ist das Segment, das aus allen Brüchen besieht, deren Quadrat kleiner ist als 2. Man beweist leicht, daß die Folge der Segmente einer bestimmten Folge Dedekindisch ist. Denn, wenn irgend eine Folge von Segmenten gegeben ist, so ist ihre Grenze ihre logische Summe, d. h. die Menge all derjenigen Elemente, die mindestens einem Segment der Folge angehören1). Die obige Definition der reellen Zahlen ist ein Beispiel einer „Konstruktion“ im Gegensatz zum „Postulat“. Ein anderes Beispiel war
1 )Vollständig ist das Problem der Segmente und Dedekindisdien Schnitte in den Principia Mathematica Bd. II, Satz 210—214 untersucht. Eine genauere Behandlung der reellen Zahlen findet man im Bd. III, Satz 310 ff. und in den „Principles of Mathe-
87
die Definition der Kardinalzahlen. Der große Vorzug dieser Methode besteht darin, daß sie keine neuen Annahmen braucht, sondern uns erlaubt, deduktiv von den ursprüglichen logischen Daten auszugehen. Die Definition der Addition und Multiplikation für die oben definierten reellen Zahlen macht keine Schwierigkeiten. Gegeben seien zwei reelle Zahlen μ, und v. Jede ist eine Menge von Brüchen. Man nehme irgend ein Element von μ und irgend ein Element von v und addiere sie nach der Additionsregel der Brüche. Man bilde die Menge aller Summen, die durch Variation der ausgewählten Elemente von μ und v entsteht. Dies gibt eine Menge von Brüchen und es ist leicht zu beweisen, daß diese neue Menge ein Segment in der Reihe der Brüche ist. Wir definieren es als die Summe von μ und v. Kürzer können wir die Definition wie folgt ausdrücken: Die arithmetische Summe von zwei reellen Z a h l e n ist die Menge der arithmetischen Summen eines Elements der einen und eines Elements der anderen, die auf alle möglichen Weisen gebildet sind. Das arithmetische Produkt von zwei reellen Zahlen können wir genau so definieren, indem wir ein Element der einen Menge mit einem Element der anderen auf jede mögliche Weise multiplizieren. Die Menge der so erzeugten Brüche ist als das Produkt der beiden reellen Zahlen definiert. (Bei all diesen Definitionen ist die Folge der Brüche derart zu definieren, daß 0 und Unendlich ausgeschlossen sind.) Die Ausdehnung unserer Definition auf die positiven und negativen reellen Zahlen, ihre Addition und Multiplikation bietet keine Schwierigkeiten. Jetzt sind noch die komplexen Zahlen zu definieren. Die komplexen Zahlen lassen zwar eine geometrische Darstellung zu. Aber sie sind für die Geometrie nicht so unbedingt erforderlich wie die Irrationalzahlen. Eine „komplexe Zahl“ bedeutet eine solche Zahl, die auch die Quadratwurzel einer negativen Zahl als Zahl mit einschließt. Sie kann ganz, gebrochen oder reell sein. Da das Quadrat einer negativen Zahl positiv ist, so muß eine Zahl, deren Quadrat negativ ist, eine neue Art Zahl sein. Bezeichnet man die Quadrat-
88
wurzel aus -1 mit i, so läßt sich jede Zahl, bei der die Quadratwurzel einer negativen Zahl auftritt, in der Form x+yi darstellen, wo x und y reelle Zahlen sind. Der Teil yi heißt der „imaginäre“ Teil dieser Zahl, x der „reelle“ (der Ausdruck reelle Zahl soll den Gegensatz zum Imaginären betonen). Trotz des Fehlens einer genauen Definition wurden die komplexen Zahlen lange Zeit von den Mathematikern gewohnheitsgemäß verwendet. Man nahm einfach an, daß sie den gewöhnlichen arithmetischen Regeln gehorchen. Auf Grund dieser Annahme war es vorteilhaft, sie zu verwenden. Man benötigt sie mehr in der Algebra und Analysis als in der Geometrie. Man will z. B. sagen können: jede quadratische Gleichung hat zwei Wurzeln, jede kubische Gleichung drei usw. Aber wenn wir uns auf reelle Zahlen beschränken, so hat eine Gleichung wie x2 + 1=0 keine Wurzeln und eine Gleichung wie x3 - 1=0 hat nur eine Wurzel. Jede Verallgemeinerung der Zahlen entstand zunächst aus der Notwendigkeit, irgend ein einfaches Problem zu lösen: Man braucht die negativen Zahlen, damit die Subtraktion immer möglich sei; denn sonst wäre a - b sinnlos, wenn a kleiner als b. Man brauchte die Brüche, damit die Division immer möglich sei; die komplexen Zahlen, damit das Wurzelziehen und die Lösung von Gleichungen immer möglich sei. Aber die Verallgemeinerungen der Zahlen werden durch die reine Notwendigkeit derselben nicht g e s c h a f f e n . Geschaffen werden sie durch die Definition, und auf diese Definition der komplexen Zahlen müssen wir jetzt unsere Aufmerksamkeit richten. Eine komplexe Zahl kann einfach als ein geordnetes Paar von reellen Zahlen betrachtet und definiert werden. Hier sind wie bei ändern Problemen viele Definitionen möglich. Nötig ist nur, daß die angenommene Definition auf gewisse Eigenschaften führen muß. Wenn wir die komplexen Zahlen als geordnete Paare von reellen Zahlen definieren, so sichern wir uns sofort einige der verlangten Eigenschaften: Man braucht zwei reelle Zahlen, um eine komplexe Zahl zu bestimmen; unter diesen können wir eine erste und eine zweite unterscheiden. Zwei komplexe Zahlen sind nur dann identisch, wenn die erste reelle Zahl des einen Paares gleich ist der ersten reellen Zahl des zweiten
89
Paares und wenn auch die zweiten Zahlen in beiden Paaren gleich sind. Was wir sonst noch benötigen, läßt sich durch die Definition der Additions- und Multiplikationsregeln sichern. Es soll gelten (x + yi) + (x’ + y’i) = (x + x) + (y + y’)i (x + yi) (x’ + y’i) = (xx’ - yy) + (xy’ + x’y)i Hat man zwei geordnete Paare von reellen Zahlen (x, y) und (x’, y’) so soll demnach ihre Summe das Paar (x+x’, y+y’) und ihr Produkt das Paar (xx’ - yy’ xy’ + x’y) sein. Nach diesen Definitionen sind wir sicher, daß unsere geordneten Paare die gewünschten Eigenschaften besitzen. Man nehme z. B. das Produkt der Paare (0, y) und (0, y’). Das ist nach der obigen Regel das Paar (- yy’, 0), also ist das Quadrat des Paares (0, 1) das Paar (- 1, 0). Nun haben diejenigen Paare, in denen das zweite Element 0 ist, nach der üblichen Bezeichnungsweise, den imaginären Teil 0. In der Darstellung x + yi lauten sie x + 0i und dies kann man natürlich einfach x schreiben. Genau wie es natürlich (aber irrig) ist, die Brüche mit dem Nenner 1 mit den ganzen Zahlen zu identifizieren, so ist es natürlich (aber irrig), die komplexen Zahlen, deren imaginärer Teil 0 ist, mit den reellen Zahlen zu identifizieren. Obwohl dies theoretisch ein Irrtum ist, ist dies in der Praxis üblich. Man kann „x + 0i“ einfach durch „x“ ersetzen und „0 + yi“ durch „yi“, wenn wir uns erinnern, daß „x“ in Wirklichkeit keine reelle Zahl, sondern ein Spezialfall einer komplexen Zahl ist. Und wenn y = 1 ist, so kann man „yi“ natürlich durch „i“ ersetzen. Also ist das Paar (0, 1) durch i dargestellt und das Paar (- 1, 0) durch - 1. Nach unsern Multiplikationsregeln ist das Quadrat von (0, 1) gleich (- 1, 0) d. h. das Quadrat von » ist - 1. Das war verlangt. Also genügen unsere Definitionen für alle notwendigen Zwecke. Es ist leicht, die komplexen Zahlen in der Ebene geometrisch zu deuten. Dieses Problem wurde durch W. K. Clifford in seinem Buch „Der gesunde Menschenverstand in den exakten Wissenschaften“ sehr schön auseinandergesetzt. Dies Buch hat große Verdienste, aber es wurde in einer Zeit geschrieben, als die Wichtigkeit von rein logischen Definitionen noch nicht erkannt war.
90
Die komplexen Zahlen von höherer Ordnung sind nicht entfernt so wichtig und nützlich wie die eben definierten. Aber sie werden hin und wieder in der Geometrie verwandt. Man kann dies z. B. in Dr. Whiteheads „Universaler Algebra“ nachlesen. Die Definition von komplexen Zahlen der Ordnung n erhält man durch eine naheliegende Erweiterung der von uns gegebenen Definition. Man definiert eine komplexe Zahl der Ordnung n als eine ein-mehrdeutige Beziehung, deren Bereich aus gewissen reellen Zahlen besteht und deren inverser Bereich aus den ganzen Zahlen von 1 bis n besteht1). Dies wird gewöhnlich durch die Bezeichnung (x1, x2, x3, … x“) wiedergegeben. Dabei geben die Indizes jeweils die Korrelation mit den auftretenden ganzen Zahlen an. Die Korrelation ist ein-mehrdeutig, nicht notwendig ein-eindeutig, denn xr und xs, können gleich sein, selbst wenn r und 5 nicht gleich sind. Die obige Definition wird zusammen mit einer geeigneten Multiplikationsregel allen Zwecken genügen, für die man komplexe Zahlen höherer Ordnung braucht. Wir sind jetzt mit unserer Übersicht der Erweiterungen des Zahlenbegriffs, bei denen das Unendliche nicht vorkommt, fertig. Die Anwendung der Zahlen auf unendliche Mengen ist unsere nächste Aufgabe.
1
) Vgl. Principles of Mathematics § 360, S. 379.
8. Unendliche Kardinalzahlen Die Definition der Kardinalzahlen des zweiten Kapitels wurde im dritten Kapitel auf die endlichen Zahlen, d. h. die gewöhnlichen, natürlichen Zahlen angewandt. Wir nannten sie „induktive Zahlen“; denn wir sahen, daß sie als diejenigen Zahlen zu definieren sind, die die mathematische Induktion ausgehend von der 0 befolgen. Aber wir haben noch nicht solche Mengen betrachtet, die eine nicht induktive Zahl von Elementen besitzen, und wir haben noch nicht untersucht, ob man solchen Mengen überhaupt eine Zahl zuschreiben kann. Dies ist ein altes Problem, das in unseren Tagen hauptsächlich durch Georg Cantor gelöst worden ist. Im vorliegenden Kapitel werden wir versuchen, die Theorie der transfiniten oder unendlichen Kardinalzahlen darzustellen, zu der seine Entdeckungen in Verbindung mit den Untersuchungen von Frege über die logische Theorie der Zahlen führt. Man kann es nicht als sicher hinstellen, daß es tatsächlich irgendwelche unendlichen Mengen in der Welt gibt. Die Annahme, daß sie existieren, ist das sog. „Unendlichkeitsaxiom“. Es gibt verschiedene Wege, auf denen man, wie es scheint, zu einem Beweis dieses Axioms gelangen könnte. Aber man fürchtet mit Recht, daß sie alle trügerisch sind und, daß es keinen schlüssigen logischen Grund gibt, wonach wir an seine Wahrheit glauben müssen. Gleichzeitig gibt es aber sicher keinen logischen Grund gegen die Existenz unendlicher Mengen. Wir sind daher logisch berechtigt, die Hypothese der Existenz solcher Mengen zu untersuchen. Für unseren jetzigen Zweck ist die praktische Form dieser Hypothese die Annahme: wenn n eine beliebige induktive Zahl ist, so soll n nicht gleich n + 1 sein. Die Identifizierung dieser Annahme mit der Existenz von unendli-
92
chen Mengen erfordert verschiedene Feinheiten, die wir vorläufig zurückstellen, bis wir in einem späteren Kapitel das Axiom der Unendlichkeit an sich betrachten werden. Augenblicklich werden wir nur annehmen, daß, wenn n eine induktive Zahl ist, n nicht gleich n + 1 ist. Dies ist schon in Peanos Annahme enthalten, daß keine zwei induktiven Zahlen denselben Nachfolger haben. Denn, wenn n = n + 1, so haben n - l und n denselben Nachfolger, nämlich n. Wir nehmen also nichts an, was nicht schon in den Peanoschen Grundsätzen enthalten ist. Betrachten wir die Menge der induktiven Zahlen selbst. Sie ist eine wohldefinierte Menge. Zunächst ist eine Kardinalzahl eine Menge von Mengen, die alle miteinander, aber mit keiner ändern Menge äquivalent sind. Wir definieren dann als „induktive Zahlen“ diejenigen unter den Kardinalzahlen, die zur Nachkommenschaft der 0 hinsichtlich der Beziehung von n zu n + 1 gehören. Das sind diejenigen Zahlen, die jede Eigenschaft der 0 und der Nachfolger von Zahlen mit dieser Eigenschaft besitzen, wobei der „Nachfolger“ von n die Zahl n +1 ist. Damit ist die Menge der „induktiven“ Zahlen vollkommen definiert. Nach unserer allgemeinen Definition der Kardinalzahl ist die Zahl der Elemente in der Menge der induktiven Zahlen zu definieren als all diejenigen Mengen, die der Menge der induktiven Zahlen ähnlich sind. Diese Menge von Mengen i s t entsprechend unserer Definition die Zahl der induktiven Zahlen. Nun sieht man leicht, daß diese Zahl keine induktive Zahl ist. Wenn n eine induktive Zahl ist, so ist die Zahl der Zahlen von 0 bis n (mit Einschluß der beiden Grenzen) gleich n + 1. Daher ist die Gesamtzahl der induktiven Zahlen größer als n, gleichgültig, welche induktive Zahl n auch sein mag. Wenn wir die induktiven Zahlen ihrer Größe nach in einer Folge anordnen, so hat diese Folge kein letztes Glied. Aber wenn n eine induktive Zahl ist, so hat jede Folge, deren Feld n Elemente hat, ein letztes Element, wie leicht zu beweisen ist. So kann man ad libitum fortfahren. Daher ist die Zahl der induktiven Zahlen eine neue Zahl, die sich von ihnen allen unterscheidet und nicht alle induktiven Eigenschaften besitzt. Es kann passieren, daß 0 eine gewisse Eigenschaft hat und, daß, wenn n sie besitzt, auch n
93
+ 1 sie besitzt; trotzdem wird diese neue Zahl sie nicht besitzen. Die Schwierigkeiten, die die Theorie der unendlichen Zahlen so lange aufhielten, rührten von der falschen Auffassung her, daß mindestens einige von den induktiven Eigenschaften allen Zahlen zukommen müssen. Ja, man glaubte, daß man dies zugeben müsse, wenn man nicht mit sich selbst in Widerspruch geraten wolle. Der erste Schritt zum Verständnis der unendlichen Zahlen besteht in der Erkenntnis, daß diese Auffassung irrtümlich ist. Der bemerkenswerteste und erstaunlichste Unterschied zwischen einer induktiven Zahl und dieser neuen Zahl ist, daß sie unverändert bleibt, wenn man zu ihr 1 addiert oder von ihr subtrahiert, wenn man sie verdoppelt oder halbiert oder irgend eine derjenigen Operationen vornimmt, von denen wir annehmen, daß sie eine Zahl vergrößern oder verkleinern müssen. Die Tatsache der Invarianz gegenüber einer Addition von 1 wird von Cantor zur Definition der von ihm so genannten „transfiniten Kardinalzahlen“ verwendet. Aber aus verschiedenen Gründen, die sich zum Teil im folgenden zeigen werden, ist es besser, eine unendliche Kardinalzahl als eine Zahl zu definieren, die nicht alle induktiven Eigenschaften besitzt, d. h. ganz einfach eine nichtinduktive Zahl ist. Immerhin ist die Eigenschaft der Invarianz gegenüber der Addition von 1 sehr wichtig, und wir müssen bei ihr eine Zeitlang verweilen. Die Aussage, eine Menge habe eine Zahl, die durch Addition von 1 nicht verändert wird, ist identisch mit folgendem: Wenn wir ein Element x nehmen, das nicht zur Menge gehört, so können wir eine ein-eindeutige Beziehung aufstellen, deren Bereich die Menge und deren inverser Bereich die um x vermehrte Menge ist. Denn in diesem Fall ist die Menge äquivalent der Summe aus der Menge selbst und dem Element x, d. h. mit einer Menge, die ein Element mehr besitzt. Sie hat also dieselbe Zahl wie eine Menge mit einem Element mehr. Nennen wir diese Zahl n, so ist n = n + 1. In diesem Fall haben wir ebensogut n = n - 1, d. h. es gibt ein-eindeutige Beziehungen deren Bereich aus der ganzen Menge und deren inverse Bereiche aus der Menge, abgesehen von einem Element, bestehen. Man kann zeigen, daß diese Fälle dieselben sind, wie die scheinbar
94
allgemeineren Fälle, in denen i r g e n d e i n Teil, der nicht mit dem Ganzen identisch ist, in eine eineindeutige Beziehung zum Ganzen gebracht werden kann. Ist dies möglich, so sagt man, daß der Korrektor die ganze Menge auf einen Teil ihrer selbst abbildet, reflektiert. Aus diesem Grunde werden wir solche Mengen „reflexiv“ nennen. Also: eine „reflexive“ Menge hat die Eigenschaft, einem echten Teil ihrer selbst ähnlich zu sein (ein „echter Teil“ ist ein Teil, der kleiner ist als das Ganze). Eine „reflexive“ Kardinalzahl ist die Kardinalzahl einer reflexiven Menge. Wir wollen diese Eigenschaft der Reflexion genauer betrachten. Eines der auffälligsten Beispiele einer „Reflexion“ ist die Roycesche Auffassung der Landkarte. Er nimmt an, man solle eine Landkarte von England auf einem Teil der Oberfläche Englands zeichnen. Wenn eine Landkarte genau ist, so entspricht sie vollkommen ein-eindeutig dem Original; also hat un se re Karte, die ein Teil ist, eine ein-eindeutige Beziehung mit dem Ganzen und muß dieselbe Zahl von Punkten enthalten wie das Ganze.Diese Zahl muß also reflexiv sein.Royce interessiert sich nun für die Tatsache,daß die Landkarte, wenn sie korrekt sein soll, auch eine Karte von der Karte enthalten muß und diese muß nun wiederum eine Karte von der Karte von der Karte enthalten usw. i n s u n e n d l i c h e . Dieser Punkt ist interessant, braucht uns aber augenblicklich nicht zu beschäftigen. Tatsächlich wird es besser sein, von solchen Phantasien zu vollständig bestimmten Erläuterungen überzugehen. Zu diesem Zweck betrachten wir am besten die Zahlenfolge selbst. Die Beziehung von n zu n +1 ist, beschränkt auf induktive Zahlen, ein-eindeutig, hat zum Bereich alle induktiven Zahlen und alle ausgenommen der 0 zum inversen Bereich. Also ist die ganze Menge der induktiven Zahlen dem ähnlich, was aus der Menge wird, wenn wir die 0 weglassen. Sie ist also nach unserer Definition eine „reflexive“ Menge und die Zahl ihrer Elemente ist eine „reflexive“ Zahl. Ebenso ist die Beziehung von n zu 2n, beschränkt auf induktive Zahlen, ein-eindeutig, hat alle induktiven Zahlen zum Bereich und
95
nur die geraden induktiven Zahlen zum inversen Bereich. Also ist die Gesamtzahl der induktiven Zahlen dieselbe wie die Zahl der geraden induktiven Zahlen. Diese Eigenschaft wurde von Leibniz (und vielen anderen) als Beweis dafür verwendet, daß unendliche Zahlen unmöglich sind. Man betrachtete es als einen Widerspruch in sich, daß „der Teil gleich dem Ganzen sein sollte“. Aber dies ist eine der Phrasen, die deswegen so einleuchtend sind, weil man ihre Unbestimmtheit nicht erkennt. Das Wort „gleich“ hat viele Bedeutungen. Aber wenn es das bedeuten soll, was wir „äquivalent“ nannten, so besteht kein Widerspruch. Denn eine unendliche Menge kann recht gut Teile haben, die ihr selbst äquivalent sind. Wer dies als unmöglich betrachtet, hat gewöhnlich unbewußt allen Zahlen Eigenschaften zugeschrieben, die nur durch die mathematische Induktion bewiesen werden können. Die Gewöhnung an sie läßt diese Eigenschaften zu Unrecht als auch jenseits des Endlichen geltend erscheinen. Wenn wir eine Menge auf einen Teil ihrer selbst „abbilden“ können, so wird dieselbe Beziehung notwendigerweise diesen Teil auf einen kleineren Teil abbilden usw. ad infinitum. So haben wir z. B. gesehen, daß man alle induktiven Zahlen auf die geraden Zahlen abbilden kann. Wir können durch, dieselbe Beziehung (von n zu 2n) die geraden Zahlen auf die Multipla von 4 abbilden, diese auf die Multipla von 8 usw. Dies ist ein abstraktes Analogon zu dem Kartenproblem von Royce. Die geraden Zahlen sind eine „Karte“ aller induktiven Zahlen, die Multipla von 4 sind eine Karte der Karte, die Multipla von 8 sind eine Karte der Karte der Karte usw. Wenn wir denselben Prozeß auf die Beziehung von n zu n + 1 angewandt hätten, so hätte unsere „Karte“ aus allen induktiven Zahlen ausgenommen der 0 bestanden, die Karte der Karte hätte aus allen von 2 aufwärts bestanden, die Karte der Karte der Karte aus allen von 3 aufwärts, usw. Diese Beispiele sollen uns mit dem Begriff der reflexiven Mengen vertraut machen, so daß scheinbar paradoxe arithmetische Sätze leicht in die Sprechweise der Abbildungen und Mengen übertragen werden können, wobei sie weniger paradox erscheinen.
96
Es ist nützlich, eine Definition der induktiven Kardinalzahlen zu geben. Zu diesem Zweck definieren wir zuerst die Folgen der Art der nach der Größe geordneter Kardinalzahlen. Diese Folgen, die sog. „Progressionen“, wurden im ersten Kapitel bereits betrachtet. Sie können durch eine Beziehung des Aufeinanderfolgens erzeugt werden: Jedes Element der Folge muß einen Nachfolger haben, aber es gibt nur eines, das keinen Vorgänger hat und jedes Element der Folge gehört zur Nachkommenschaft dieses Elementes hinsichtlich der Beziehung „unmittelbarer Vorgänger“. Diese charakteristischen Eigenschaften lassen sich in folgende Definition zusammenfassen1): Eine „Progression“ ist eine ein-eindeutige Beziehung derart, daß es gerade ein Element gibt, das zum Bereich, aber nicht zum inversen Bereich gehört, wobei der Bereich identisch ist mit der Nachkommenschaft dieses einen Elements. Es ist leicht einzusehen, daß die so definierte Progression den 5 Peanoschen Axiomen genügt. Das Element, das zum Bereich, aber nicht zum inversen Bereich gehört, ist das, was er „0“ nennt. Das Element, zu dem ein Element die ein-eindeutige Beziehung hat, ist der »Nachfolger“ des Elements und der Bereich der ein-eindeutigen Beziehungen ist das, was er „Zahl“ nennt. Demnach lautet die Übersetzung der fünf Axiome: (1) „0 ist eine Zahl“ wird zu: „Das Element des Bereichs, das nicht Element des inversen Bereichs ist, ist ein Element des Bereichs“. Dies bedeutet: Das von uns definierte Element existiert wirklich. Das soll das „erste“ Element sein. (2) „Der Nachfolger einer Zahl ist eine Zahl“ wird zu: „Das Element, zu dem ein bestimmtes Element des Bereichs die betreffende Beziehung hat, ist selbst ein Element des Bereichs“. Dies wird, wie folgt, bewiesen. Nach Definition gehört jedes Element des Bereichs zur Nachkommenschaft des ersten Elements. Daher muß der Nachfolger eines Elements des Bereichs zur Nachkommenschaft des ersten Elements gehören (denn die Nachkommenschaft eines Elements umfaßt immer ihre eigenen Nachfolger, nach der allgemeinen Definition 1
) Vgl. Principia Mathematica Bd. II, Satz 123.
97
der Nachkommenschaft) und muß daher ein Element des Bereiches sein, denn nach der Definition ist die Nachkommenschaft des ersten Elements identisch mit dem Bereich. (3)„Nicht zwei Zahlen haben denselben Nachfolger.“ Dies bedeutet bloß, daß die Beziehung ein-mehrdeutig ist, was sie nach Definition ist (da sie ein-eindeutig ist). (4)„0 ist nicht der Nachfolger irgend einer Zahl“ wird zu: „Das erste Element ist kein Element des inversen Bereichs.“ Dies folgt wieder unmittelbar aus der Definition. (5)Die mathematische Induktion wird zu: „Jedes Element des Bereichs gehört zur Nachkommenschaft des ersten Elements.“ Dies ist ein Teil unserer Definition. Die Progressionen besitzen also nach unserer Definition die fünf formalen Eigenschaften, aus denen Peano die Arithmetik ableitet. Man kann leicht zeigen, daß zwei Progressionen „ähnlich“ sind in dem Sinn, wie wir die Ähnlichkeit von Beziehungen im sechsten Kapitel definierten. Wir können natürlich eine Folgebeziehung aus der ein-eindeutigen Beziehung ableiten, durch die wir eine Progression definieren. Die anzuwendende Methode ist im vierten Kapitel erklärt und die Beziehung ist die eines Elements zu einem Element seiner eigenen Nachkommenschaft hinsichtlich der ursprünglichen ein-eindeutigen Beziehung. Zwei transitive, asymmetrische Beziehungen, welche Progressionen erzeugen, sind aus denselben Gründen ähnlich, aus denen die entsprechenden ein-eindeutigen Beziehungen ähnlich sind. Die Menge aller solcher transitiven Erzeuger von Progressionen ist eine „Folgenzahl“ im Sinne von Kapitel sechs. In der Tat ist sie die kleinste der unendlichen Folgenzahlen. Cantor hat ihr den Namen ω gegeben und sie dadurch berühmt gemacht. Aber für den Augenblick beschäftigen wir uns mit Kardinalzahlen. Da zwei Progressionen ähnliche Beziehungen sind, so folgt, daß ihre Bereiche (oder ihre Felder, was auf dasselbe hinauskommt) äquivalente Mengen sind. Die Bereiche der Progressionen bilden eine Kardinalzahl, denn jede Menge, die dem Bereich einer Progression äquivalent ist, ist selbst, wie man leicht beweisen kann, der Bereich einer Progression.
98
Diese Kardinalzahl ist die kleinste der unendlichen Kardinalzahlen. Sie ist diejenige, die Cantor mit dem hebräischen Aleph mit dem Index 0 bezeichnet hat, um sie von den größeren unendlichen Kardinalzahlen, welche andere Indizes besitzen, zu unterscheiden. Der Name der kleinsten unendlichen Kardinalzahl ist also א0. Die Aussage, daß eine Menge א0 Elemente hat, bedeutet dasselbe wie: sie ist selbst ein Element von א0 und das ist dasselbe wie: die Elemente dieser Menge können in eine Progression geordnet werden. Offenbar bleibt jede Progression eine Progression, wenn wir eine endliche Zahl von Gliedern weglassen, oder jedes zweite Glied oder alle, ausgenommen jedes zehnte oder jedes hundertste. Diese Methoden, eine Progression zu verdünnen, verändern ihre Progressionsnatur nicht und verkleinern daher die Zahl der Elemente nicht, die א0 bleibt. Tatsächlich ist jede Auswahl aus einer Progression selbst wieder eine Progression, wenn sie kein letztes Element besitzt, gleichgültig wie spärlich die Elemente auch verteilt sein mögen. Man nehme z. B. die induktiven Zahlen von der Form nⁿ oder nⁿ Solche Zahlen werden in der Zahlenreihe nach und nach sehr selten, trotzdem gibt es gerade so viel von ihnen als es induktive Zahl insgesamt gibt, nämlich א0. Umgekehrt können wir auch zu den induktiven Zahlen weitere Elemente dazu fügen, ohne ihre Zahl dadurch zu vermehren. Man nehme z. B. die Brüche. Man könnte vielleicht denken, daß es viel mehr Brüche als ganze Zahlen gibt, denn die Brüche, deren Nenner 1 ist, entsprechen den ganzen Zahlen und sie scheinen doch nur einen unendlich kleinen Teil der Brüche zu bilden. Aber tatsächlich ist die Zahl der Brüche genau dieselbe wie die der induktiven Zahlen, nämlich א0. Dies sieht man leicht, wenn man die Brüche auf folgende Weise in einer Folge anordnet: Wenn die Summe von Zähler und Nenner in einem Bruch kleiner ist als im anderen, so stelle man den einen vor den anderen. Wenn die Summe in beiden gleich ist, nehme man zuerst den mit dem kleineren Zähler. So entsteht die Folge 1 , ½ , 2 , ⅓ , 3 , ¼ , ⅔ , 3 / 2 , 4 , 1 / …
99
Diese Folge ist eine Progression und alle Brüche kommen in ihr früher oder später vor. Wir können also alle Brüche in eine Progression anordnen. Ihre Zahl ist daher א0. Aber nicht alle unendlichen Mengen besitzen א0 Elemente. Die Zahl der reellen Zahlen z. B. ist größer als x“. Sie ist tatsächlich 2א0 . Es ist nicht schwer zu beweisen, da 2ⁿ größer ist als n, selbst wenn n unendlich ist. Am einfachsten beweist man zunächst, daß eine Menge mit n Elementen 2ⁿ Teilmengen enthält, mit anderen Worten, es gibt 2ⁿ Methoden, irgendwelche Elemente aus Elementen aus ihr auszusuchen (wobei wir den extremen Fall, wo wir alle oder keine aussuchen, einschließen). Zweitens ist zu beweisen, daß die Zahl der Teilmengen einer Menge immer größer ist als die Zahl der Elemente der Menge. Von diesen beiden Sätzen ist der erste für den Fall endlicher Zahlen wohl bekannt, und es ist nicht schwer, ihn auf unendliche Zahlen auszudehnen. Der Beweis des zweiten ist so einfach und instruktiv, daß wir ihn hier geben wollen: Zunächst ist klar, daß die Zahl der Teilmengen einer gegebenen Menge, sagen wir α, mindestens ebenso groß ist wie die Zahl der Elemente, denn jedes Element stellt ja selbst eine Teilmenge dar, und wir haben daher eine Zuordnung aller Elemente zu einigen der Teilmengen. Wenn also die Zahl der Teilmengen nicht gleich der Zahl der Elemente ist, so muß sie größer sein. Nun ist es leicht zu beweisen, daß die Zahl nicht gleich ist: Gegeben sei eine ein-eindeutige Beziehung, deren Bereich aus den Elementen besteht und deren inverser Bereich in der Menge der Teilmengen enthalten sei. Dann zeigt man, daß es mindestens eine Teilmenge geben muß, die nicht zum inversen Bereich gehört. Der Beweis lautet wie folgt1): Wenn eine ein-eindeutige Zuordnung R zwischen allen Elementen von α und einigen der Teilmengen besteht, so kann es vorkommen, daß ein gegebenes Element x einer Teilmenge zugeordnet ist, zu der es als Element gehört. Oder es kann vorkommen, daß x einer Teilmenge
1 ) Dieser Beweis ist mit einigen Vereinfachungen aus Cantor entnommen. Vgl. Jahresbericht der deutschen Mathematikvereinigung 1, (1892), S. 77.
100
zugeordnet ist, zu der es nicht als Element gehört. Bilden wir die Menge β aller Elemente x, die zu Teilmengen zugeordnet sind, zu denen sie nicht als Element gehören. Dies ist eine Teilmenge von a, der kein Element von α zugeordnet ist. Denn nehmen wir zunächst die Elemente von β, so ist jedes von ihnen (nach Definition) einer Teilmenge zugeordnet, zu der es nicht als Element gehört. Keines ist daher der Teilmenge β zugeordnet. Nehmen wir dann diejenigen Elemente, die nicht Elemente von β sind, so ist jedes von ihnen (nach Definition) irgend einer Teilmenge zugeordnet, zu der er als Element gehört. Es ist daher wieder nicht β zugeordnet, also ist kein Element von a der Teilmenge β zugeordnet. Da R eine b e l i e b i g e ein-eindeutige Zuordnung aller Elemente zu einigen Teilmengen ist, so folgt daraus, daß es keine Zuordnung aller Elemente zu a l 1 e n Teilmengen gibt. Der Beweis gilt auch dann, wenn β keine Elemente besitzt; damit wird bloß die Nullmenge ausgelassen. Also ist in jedem Fall die Zahl der Teilmenge nicht gleich der Zahl der Elemente und daher ist sie wie vorher vorausgesetzt größer. Kombinieren wir dieses Resultat mit dem Satz, daß wenn n die Zahl der Elemente ist, dann 2ⁿ die Zahl der Teilmengen ist, so haben wir den Satz, daß 2ⁿ immer größer ist als n, selbst wenn n unendlich ist. Hieraus folgt, daß es kein Maximum der unendlichen Kardinalzahlen gibt. Wie groß auch eine unendliche Zahl n sein mag, 2ⁿ wird noch größer sein. Die Arithmetik der unendlichen Zahlen sieht etwas merkwürdig aus, bis man sich daran gewöhnt hat. Wir haben z. B. א0 + 1 = א0 א0 + n = א0, wo n eine induktive Zahl ist, א0 = א0. (Dies ergibt sich wie bei den Brüchen, denn da ein Bruch durch zwei induktive Zahlen definiert ist, sieht man leicht, daß die Zahl der Brüche das Quadrat der Zahlen der induktiven Zahlen ist, d. h. sie ist א02. Sie ist auch א0, wie wir gesehen haben.) Ferner א0n = א0, wo n eine induktive Zahl ist. Dies folgt aus א02 = א0 durch Induktion, denn wenn א0n = א0 so ist א0n+1 = א20. Aber 2א0 > א0
101
Dabei ist, wie wir später sehen werden, 2א0 eine sehr wichtige Zahl, nämlich die Zahl der Elemente in einer „stetigen“ Folge im Cantorschen Sinn. Nimmt man an, daß Raum und Zeit in diesem Sinn kontinuierlich sind (und das tut man gewöhnlich in der analytischen Geometrie und Kinematik), so ist dies die Zahl der Punkte im Raum oder die Zahl der Zeitmomente. Es ist auch die Zahl der Punkte in jedem endlichen Teil des Raumes gleichgültig, ob er linear, flächenhaft oder körperlich ist. Neben א0 ist 2א0 die wichtigste und interessanteste unendliche Kardinalzahl. Obwohl Addition und Multiplikation mit unendlichen Kardinalzahlen immer möglich sind, sind Subtraktion und Division nicht mehr bestimmt und können daher nicht so verwendet werden, wie in der elementaren Arithmetik. Man betrachte zunächst die Subtraktion: so lange die abgezogene Zahl endlich ist, ist alles schön und gut. Wenn die andere Zahl reflexiv ist, bleibt sie unverändert. Daher ist א0- n = א0, wenn n endlich ist. So weit gibt die Subtraktion vollkommen eindeutige Resultate. Anders ist es, wenn wir א0 von sich selbst abziehen. Wir können dann jedes Resultat von 0 bis א0 bekommen. Das läßt sich an Beispielen leicht einsehen. Man ziehe von den induktiven Zahlen die folgenden Mengen von א0 Elementen ab: (1) alle induktiven Zahlen, so bleibt Null. (2) alle induktiven Zahlen von n aufwärts, so bleiben alle Zahlen von 0 bis n - 1, also n Elemente übrig. (3) alle ungeraden Zahlen, so bleiben alle geraden Zahlen, also א0 Zahlen übrig. All dies sind verschiedene Methoden א0 von sich selbst abzuziehen, und sie geben lauter verschiedene Resultate. Was die Division betrifft, so folgen ganz ähnliche Resultate aus der Tatsache, daß א0 unverändert bleibt, wenn man es mit 2 oder 3 oder irgend einer endlichen Zahl n oder mit א0 multipliziert. Daraus folgt, daß א0 dividiert durch א0 jeden Wert von 1 bis zu א0 besitzen kann. Aus der Mehrdeutigkeit der Subtraktion und Division folgt, daß die Begriffe der negativen Zahlen und Brüche sich nicht auf unendliche Zahlen ausdehnen lassen. Die Addition, Multiplikation und
102
das Potenzieren gehen ganz gut, aber die umgekehrten Operationen Subtraktion, Division und Wurzelziehen sind mehrdeutig und die Begriffe, die aus ihnen hervorgehen, verlieren ihren Sinn, sobald unendliche Zahlen in Betracht kommen. Die charakteristische Eigenschaft, durch die wir die Endlichkeit definierten, war die mathematische Induktion. Wir definierten eine Zahl als endlich, wenn sie der mathematischen Induktion von 0 an genügt, und eine Menge war endlich, wenn ihre Zahl endlich ist. Diese Definition führt zu dem Resultat, zu dem sie führen mußte: die endlichen Zahlen sind die Zahlen, die in der gewöhnlichen Zahlenreihe 0, 1, 2, 3, usw. auftreten. Aber die unendlichen Zahlen, die wir jetzt betrachteten, waren nicht nur nicht induktiv, sondern auch r e f l e x i v . Cantor benutzte diese Eigenschaft zur D e f i n i t i o n des Unendlichen und glaubte, daß dies mit dem Nichtinduktivsein gleichwertig ist. Nach ihm ist jede Menge und jede Kardinalzahl entweder induktiv oder reflexiv. Dies mag richtig sein. Wahrscheinlich läßt es sich auch beweisen. Aber die Beweise, die bisher von Cantor und anderen (worunter auch der Autor in früheren Tagen zu rechnen ist) aufgestellt worden sind, sind falsch. Die Gründe dafür werden wir darlegen, wenn wir zur Betrachtung des „multiplikativen Axioms“ kommen. Heute wissen wir nicht, ob es Mengen und Kardinalzahlen gibt, die weder reflexiv noch induktiv sind. Wenn n eine solche Kardinalzahl wäre, so wäre n = n + 1 falsch. Trotzdem wäre n keine der „natürlichen“ Zahlen und würde gewisse induktive Eigenschaften nicht besitzen. Alle b e k a n n t e n unendlichen Mengen und Kardinalzahlen sind reflexiv. Aber augenblicklich muß man die Möglichkeit offen lassen, daß es bisher unbekannte Beispiele von Mengen und Kardinalzahlen gibt, die weder reflexiv noch induktiv sind. Vorläufig nehmen wir folgende Definitionen an: Eine e n d l i c h e Menge oder Kardinalzahl i s t i n d u k t i v . Eine u n e n d l i c h e Menge oder Kardinalzahl i s t n i c h t i n d u k t i v . Alle r e f l e x i v e n Mengen und Kardinalzahlen sind unendlich, aber es ist bisher noch nicht bekannt, ob alle unendlichen Mengen und Kardinalzahlen reflexiv sind. Wir kommen hierauf noch im 12. Kapitel zurück.
9. Unendliche Folgen und Ordinalzahlen Eine „unendliche Folge“ läßt sich definieren als eine Folge, deren Feld eine unendliche Menge ist. Wir hatten bereits Gelegenheit eine Art von unendlichen Folgen, nämlich die Progressionen, zu betrachten. In diesem Kapitel werden wir das Problem allgemeiner untersuchen. Die bemerkenswerteste Eigenschaft einer unendlichen Folge ist, daß ihre Folgenzahl durch bloßes Umstellen ihrer Glieder geändert werden kann. Hierin besteht ein gewisser Gegensatz zwischen Kardinalzahlen und Folgenzahlen. Est ist möglich, daß die Kardinalzahl einer reflexiven Menge unverändert bleibt, obwohl man Glieder zu ihr addiert. Dagegen ist es möglich, die Folgenzahl einer Folge zu verändern, ohne irgendwelche Glieder dazu zu tun oder wegzunehmen, also nur durch Umordnen. Gleichzeitig ist es aber bei jeder unendlichen Folge auch möglich, wie bei den Kardinalzahlen Elemente hinzuzufügen, ohne die Folgenzahl zu verändern. Alles hängt von der Art ab, wie sie hinzugefügt werden. Um dies klarzustellen beginnen wir am besten mit Beispielen. Betrachten wir zunächst die verschiedenen Arten von Folgen, die man aus den induktiven Zahlen ableiten kann, wenn man sie auf verschiedene Arten anordnet. Wir beginnen mit der Folge l, 2 , 3 , 4 , … n , … Sie stellt, wie wir schon gesehen haben, die kleinste der unendlichen Folgenzahlen, dasCantorsche ω, dar. Gehen wir dazu über, diese Reihe zu verdünnen, indem wir sukzessive die erste gerade Zahl, der wir begegnen, an das Ende stellen. Wir bekommen dann folgende Folgen:
104
1, 3, 4, 5, … n, … 2 1, 3, 5, 6, … n + 1, … 2, 4 1, 3, 5, 7, … n + 2, … 2, 4, 6 usw. Denken wir uns diesen Prozeß so oft wie möglich wiederholt, so bekommen wir zuletzt die Folge 1, 3, 5, 7, … 2n + 1, …2, 4, 6, 8, …2n …, worin zuerst alle ungeraden und dann alle geraden Zahlen auftreten. Die Folgenzahlen dieser verschiedenen Folgen sind: ω + 1, ω + 2, ω + 3, … 2ω. Jede von diesen Zahlen ist „größer“ als jede ihrer Vorgänger im folgenden Sinn: Eine Folgenzahl heißt „größer“ als eine andere, wenn jede Folge, der die erste Zahl zukommt, einen Teil besitzt, dem die zweite Zahl zukommt, aber keine Folge, der die zweite Zahl zukommt, einen Teil besitzt, dem die erste Zahl zukommt. Wenn wir die zwei Folgen 1, 2, 3, 4, … n, … 1, 3, 4, 5, …n + 1, …2 vergleichen, so sehen wir, daß die erste demjenigen Teil der zweiten äquivalent ist, der entsteht, wenn wir das letzte Element, nämlich die Zahl 2 weglassen. Die zweite aber ist keinem Teil der ersten äquivalent (dies ist evident, läßt sich aber auch leicht beweisen). Infolgedessen hat nach unserer Definition die zweite Folge eine größere Folgenzahl als die erste, d. h. ω + 1 ist größer als ω. Aber wenn wir ein Element an den Beginn der Progression und nicht an das Ende setzen, so haben wir noch immer eine Progression. Daher ist 1 + ω = ω. Also ist 1 + ω nicht gleich ω + 1. Dies ist eine charakteristische allgemeine Eigenschaft der Beziehungsarithmetik. Wenn µ und v zwei Beziehungszahlen sind, so ist im allgemeinen µ + v verschieden von v + µ. Der Fall der endlichen Ordinalzahlen, wo Gleichheit herrscht, ist eine besondere Ausnahme. Die Folge die wir am Schluß erhielten, bestand zuerst aus allen ungeraden Zahlen und dann aus allen geraden. Ihre Folgenzahl ist 2ω. Diese Zahl ist größer als ω oder ω + n, wo n endlich ist. Man muß beachten, daß
105
in Übereinstimmung mit der allgemeinen Definition der Ordnung jede dieser Anordnungen von ganzen Zahlen als das Resultat einer ganz bestimmten Beziehung zu betrachten ist. Z. B. läßt sich die Anordnung, die nur die 2 an das Ende stellt, durch folgende Beziehung definieren: „x und y sind endliche Zahlen und entweder ist y = 2 und x ist nicht 2, oder keines von beiden ist 2 und x ist kleiner als y“. Diejenige Anordnung, die zuerst alle ungeraden und dann alle geraden Zahlen aufstellt, läßt sich folgendermaßen definieren: „x und y sind endliche ganze Zahlen und entweder ist x ungerade und y ist gerade oder x ist kleiner als y und beide sind ungerade oder beide gerade“. Wir werden uns von nun an im allgemeinen nicht dabei aufhalten, diese Formeln anzugeben, aber die Tatsache, daß man sie aufstellen kann, ist wichtig. Die Zahl, die wir 2ω nannten, nämlich die Zahl der Folge die aus zwei Progressionen besteht, heißt manchmal ω · 2. Die Multiplikation hängt wie die Addition von der Reihenfolge der Faktoren ab. Eine Progression von Paaren gibt eine Folge von der Form x₁, y₁, x₂, y₂, x₃, y₃ … xⁿ, yⁿ, …, die selbst eine Progression ist. Aber ein Paar Progressionen gibt eine Folge, die doppelt so lang ist als eine Progression. Man muß daher zwi schen 2ω und ω · 2 unterscheiden.Der Sprachgebrauch schwankt.Wir werden 2ω für ein Paar Progressionen und ω · 2 für eine Progression von Paaren verwenden. Diese Festsetzung bestimmt natürlich unsere allgemeine Deutung von „α · β“, wo α und β Beziehungszahlen sind, „α · β“ bezeichnet eine geeignet konstruierte Summe von α Beziehungen, von denen jede β Elemente besitzt. Wir können den Verdünnungsprozeß der induktiven Zahlen beliebig weit fortsetzen, z. B. können wir zuerst die ungeraden Zahlen, dann die Doppelten, dann die Doppelten von diesen nehmen usw. Wir bekommen so die Folge 1, 3, 5, 7, … ; 2, 6, 10, 14, … ; 4, 12, 20, 28, … ; 8, 24, 40, 56, …
106
Deren Zahl ist ω2, da sie eine Progression von Progressionen ist. Jede Progression in dieser neuen Folge kann natürlich wieder ebenso verdünnt werden, wie die ursprüngliche Progression. So können wir übergehen zu ω3, ω₄, … ωm, usw. Wie weit wir auch gegangen sind, wir können immer noch weiter gehen. Die Folge aller Ordinalzahlen, die auf diese Weise durch Verdünnen der Progressionen erhalten werden kann, ist länger als irgend eine Folge, die durch das bloße Umordnen der Elemente einer Progression erreicht werden kann (dies ist nicht schwer zu beweisen). Man kann zeigen, daß die Kardinalzahl der Menge dieser Ordinalzahlen größer als א0 ist. Es ist die Zahl, die Cantor א1 nennt. Die Ordinalzahl der Folge aller der Größe nach geordneten Ordinalzahlen,die man aus א0 konstruieren kann,heißt ω1.Also hat eine Folge, deren Ordinalzahl ω1 ist, ein Feld mit der Kardinalzahl א1. Von ω1 und א1 können wir zu ω2 und א2 durch einen Prozeß übergehen, der genau analog ist dem, durch den wir von ω und א0 nach ω1 und אt gelangten. Nichts hindert uns daran, auf diese Weise zu immer neuen Kardinal- und Ordinalzahlen ins unendliche vorzugehen. Aber es ist nicht einmal bekannt, ob 2א0 gleich irgendeiner der Kardinalzahlen in der Folge der Alephs ist. Es ist nicht einmal bekannt, ob sie mit ihnen der Größe nach vergleichbar ist. Denn, man muß sich darüber klar sein, sie könnte weder gleich noch größer noch kleiner, als irgend eines des Alephs sein. Diese Frage hängt mit dem multiplikativen Axiom zusammen, das wir später betrachten werden. Alle Folgen, die wir bisher in diesem Kapitel behandelt haben, waren das, was man „wohlgeordnet“ nennt. Eine wohlgeordnete Folge ist eine Folge, die einen Anfang hat, aufeinanderfolgende Elemente besitzt und nach jeder Auswahl von Elementen ein darauffolgendes Element besitzt, vorausgesetzt, daß nach der Auswahl noch irgendwelche Elemente existieren. Dies schließt einerseits die dichten Folgen aus, in denen es zwischen je 2 Elementen weitere Elemente gibt und andererseits die Folgen, die keinen Anfang haben, oder in denen es Teile gibt, die keinen Anfang haben. Die Folge der negativen ganzen
107
Zahlen nach der Größe geordnet, hat keinen Anfang und endet mit -1. Sie ist also nicht wohlgeordnet. Aber in der umgekehrten Ordnung genommen, beginnend mit -1, ist sie wohlgeordnet, denn sie ist ja eine Progression. Die Definition lautet: Eine „wohlgeordnete“ Folge ist eine solche, in der jede Teilmenge, ausgenommen natürlich die Nullmenge, ein erstes Element besitzt. Eine „Ordinalzahl“ bedeutet die Beziehungszahl einer wohlgeordneten Folge. Sie ist also ein Spezialfall einer Folgenzahl. Für die wohlgeordneten Folgen gilt eine verallgemeinerte Form der mathematischen Induktion. Eine Eigenschaft heißt „transfinit erblich“, wenn folgendes gilt: Wenn sie einer gewissen Auswahl der Elemente einer Folge zukommt, so kommt sie auch ihren unmittelbaren Nachfolgern zu, unter der Voraussetzung, daß solche existieren. In einer wohlgeordneten Folge kommt eine transfinit erbliche Eigenschaft des ersten Elementes der Folge der ganzen Folge zu. So kann man viele Sätze über wohlgeordnete Folgen beweisen, die nicht für alle Folgen gelten. Es ist leicht, die induktiven Zahlen in eine nicht wohlgeordnete Folge, ja sogar in eine dichte Folge anzuordnen. Wir können z. B. folgende Methode verwenden: Man betrachte die Dezimalbrüche von 0, 1 (eingeschlossen) bis zu 1 (ausgeschlossen) geordnet nach der Größe. Sie bilden eine dichte Folge, denn zwischen irgend zweien gibt es immer noch unendlich viele andere. Man lasse jetzt das Komma bei jeder Zahl weg und wir haben eine dichte Folge, die aus allen endlichen ganzen Zahlen besteht. Dabei fehlen nur diejenigen, die sich durch 10 teilen lassen. Wenn wir die durch 10 teilbaren Zahlen dazunehmen wollen, so ist das ohne Schwierigkeiten möglich. Anstatt mit 0, 1 zu beginnen, wollen wir alle Dezimalbrüche nehmen, die kleiner als 1 sind. Wenn wir das Komma entfernen, so wollen wir alle Nullen, die am Beginn unseres Dezimalbruches stehen, auf das rechte Ende bringen. Läßt man sie aus und kehrt man zu denen zurück, die keine Nullen am Anfang haben, so können wir die Anordnung unserer ganzen Zahlen, wie folgt, festlegen: von zwei ganzen Zahlen, die nicht mit derselben
108
ersten Ziffer beginnen, soll die mit der kleineren ersten Ziffer zuerst kommen. Von zwei ganzen Zahlen, die mit derselben ersten Ziffer beginnen, aber sich in der zweiten Stelle unterscheiden, soll die mit der kleineren zweiten Stelle zuerst kommen. Aber zu allererst kommt die ohne zweite Stelle usw. Ganz allgemein: wenn zwei ganze Zahlen in ihren ersten n Stellen übereinstimmen, aber sich in ihrer rc + lten unterscheiden, so kommt diejenige zuerst, die entweder keine n + 1te Stelle hat oder eine n + 1te Stelle hat, die kleiner ist als die der andern. Diese Anordnung erzeugt, wie der Leser sich leicht überzeugen kann, eine dichte Folge, die aus allen ganzen Zahlen besteht, die nicht durch 10 teilbar sind. Wie wir sahen, bietet die Aufnahme der durch 10 teilbaren keine Schwierigkeit. Aus diesem Beispiel folgt, daß es möglich ist, dichte Folgen zu konstruieren, die א0 Elemente besitzen. Tatsächlich haben wir bereits gesehen, daß es א0 Brüche gibt und die Brüche, nach der Größe geordnet, bilden eine dichte Folge. Hierfür haben wir also ein zweites Beispiel. Wir werden auf dieses Problem im nächsten Kapitel zurückkommen. Für die transfiniten Kardinalzahlen gelten die üblichen formalen Gesetze des Addierens, Multiplizierens und Potenzierens. Für die transfiniten Ordinalzahlen aber gelten nur einige davon, und zwar gelten diese dann auch für alle Beziehungszahlen. Unter den „üblichen formalen Gesetzen“ verstehen wir die folgenden: (1)Das kommutative Gesetz: α + β = β + α und α · β = β · α. (2)Das assoziative Gesetz: (α + β + γ = α + (β + γ) und (a · β) · γ = α · (β · γ). (3)Das distributive Gesetz: α (β + γ) = αβ + αγ. Wenn das kommutative Gesetz nicht gilt, muß die obige Form des distributiven Gesetzes unterschieden werden von (β + γ) α = βα + γα. Man sieht sofort, daß die eine Form richtig und die andere falsch sein kann.
109
4. Die Gesetze des Potenzieren: α β · α γ = α β+γ; α γ · β γ = (aβ)γ; (α β)γ = α βγ All diese Gesetze gelten für Kardinalzahlen, gleichgültig, ob sie endlich oder unendlich sind und für endliche Ordinalzahlen. Wenn wir aber zu den unendlichen Ordinalzahlen übergehen oder zu den Beziehungszahlen im allgemeinen, so gelten einige, andere nicht. Das kommutative Gesetz gilt nicht, das assoziative Gesetz aber gilt. Das distributive Gesetz gilt in der Form (β + γ)α = βα + γα aber nicht in der Form α(β + γ) = αβ + αγ. (Dabei haben wir, was die Anordnung der Faktoren in dem Produkt betrifft, uns der obigen Bezeichnungsweise angeschlossen.) Die Exponentialgesetze α β · α γ = α β+γ und (aβ)γ = α βγ gelten noch, dagegen gilt das Gesetz α γ · β γ = (aβ)γ nicht mehr, denn es hängt natürlich mit dem kommutativen Gesetz der Multiplikation zusammen. Die Definition der Multiplikation und des Potenzierens, die in den obigen Sätzen vorausgesetzt sind, sind einigermaßen kompliziert. Der Leser, der sie und den Beweis der Gesetze kennen lernen will, muß im zweiten Band der Principa Mathematica Satz 172—176 nachlesen. Die ordinale transfinite Arithmetik wurde von Cantor vor der kardinalen transfiniten Arithmetik entwickelt, denn sie besitzt verschiedene mathematisch-technische Anwendungsmöglichkeiten, die ihn darauf führten. Aber vom Standpunkt der Philosophie der Mathematik ist sie weniger wichtig und weniger grundlegend als die Theorie der transfiniten Kardinalzahlen. Die Kardinalzahlen sind wesentlich einfacher als die Ordinalzahlen. Es ist ein merkwürdiger historischer Zufall, daß diese zuerst als Abstraktion aus jenen auftraten und erst allmählich an sich untersucht wurden. Dies gilt nicht für Freges Arbeit, in der die Kardinalzahlen, sowohl
110
die endlichen wie die transfiniten, vollkommen unabhängig von den Ordinalzahlen betrachtet wurden. Aber Cantors Arbeit machte die Welt auf diesen Gegenstand aufmerksam, während Freges Arbeit ziemlich unbekannt blieb, wahrscheinlich vor allem wegen der Schwierigkeit seines Symbolismus. Die Mathematiker haben wie die anderen Menschen größere Schwierigkeiten beim Verständnis und Gebrauch von Begriffen, die verhältnismäßig „einfach“ im logischen Sinn sind als bei Verwendung von komplizierten Begriffen, die ihrer gewöhnlichen Praxis besser angepaßt sind. Aus diesem Grund erkannte man nur langsam die wahre Bedeutung der Kardinalzahlen für die mathematische Philosophie. Die Ordinalzahlen sind keineswegs unwichtig, aber ihre Bedeutung reicht nicht an die der Kardinalzahlen heran, und sie gehen zum großen Teil in dem allgemeineren Begriff der Beziehungszahlen auf.
10. Limes und Stetigkeit Der Begriff des „Limes“ hat in der Mathematik fortgesetzt größere Bedeutung erlangt als man anfangs dachte. Die ganze Differentialund Integralrechnung, eigentlich, die ganze höhere Mathematik, beruht auf ihm. Früher nahm man an, daß es sich dabei im Grunde um unendlich kleine Größen handle, aber Weierstraß wies nach, daß dies ein Irrtum ist: Immer, wo man glaubte, daß unendlich kleine Größen auftreten, trat in Wirklichkeit eine Folge endlicher Größen auf, die Null zu ihrem unteren Limes hatten. Man faßte gewöhnlich den „Limes“ als einen wesentlich quantitativen Begriff auf, nämlich als eine Größe, der sich andere immer mehr nähern, derart, daß es darunter solche gibt, die sich um weniger als eine vorgeschriebene Größe von ihr unterscheiden. Aber tatsächlich ist der Begriff des „Limes“ ein reiner Ordnungsbegriff, der gar nichts mit Quantität zu tun hat (ausgenommen, wenn zufällig die betreffende Folge quantitativ ist). Ein Punkt auf einer Geraden kann der Limes einer Folge von Punkten auf der Geraden sein, ohne daß man Koordinaten oder Messungen oder irgend etwas Quantitatives einzuführen braucht. Die Kardinalzahl א0 ist der Limes (der Größe nach) der Kardinalzahlen 1, 2, 3, … n, …, obwohl der numerische Unterschied zwischen א0 und einer endlichen Kardinalzahl konstant unendlich ist: Vom quantitativen Gesichtspunkt aus streben die endlichen Zahlen nicht gegen א0. Die Zahl א0 ist deshalb der Limes der endlichen Zahlen, weil sie in der Zahlenfolge unmittelbar nach ihnen kommt; dies ist eine Ordnungsund nicht eine Größenbeziehung. Es gibt verschiedene Formen des Begriffes „Limes“. Sie sind von steigender Kompliziertheit. Die einfachste und grundlegendste
112
Form, aus der die übrigen sich herleiten, ist schon definiert worden. Wir wollen hier die Definitionen, die dazu führen, in einer so allgemeinen Form wiederholen, daß nicht vorausgesetzt wird, daß die betreffende Beziehung eine Folgebeziehung sei. Die Definitionen sind die folgenden: Die „Minima“ einer Menge α hinsichtlich einer Beziehung P sind diejenigen Elemente von α und dem Feld von P (falls sie existieren), zu denen kein Element von α die Beziehung P hat. Die „Maxima“ hinsichtlich P sind die Minima hinsichtlich des Inversen von P. Die „Sequenten“ einer Menge α hinsichtlich einer Beziehung P sind die Minima der „Nachfolger“ von α, und die „Nachfolger“ von α sind diejenigen Elemente des Feldes von P, zu denen jedes der Menge α und dem Feld von P gemeinsame Element die Beziehung P hat. Die „Präzedenten“ hinsichtlich P sind die Sequenten des Inversen von P. Die „oberen Limites“ von α hinsichtlich P sind die Sequenten, vorausgesetzt, daß α kein Maximum hat; besitzt aber α ein Maximum, so gibt es keine oberen Limites. Die „unteren Limites“ hinsichtlich P sind die oberen Limites hinsichtlich der Inversen von P. Wenn P zusammenhängend ist, so kann eine Menge höchstens ein Maxi-num, ein Minimum, eine Sequente usw. haben Somit können wir in den in der Praxis vorkommenden Fällen von „dem Limes“ (falls vorhanden) sprechen. Wenn P eine Folgebeziehung ist, so vereinfacht sich die obige Definition des Limes beträchtlich. In diesem Falle können wir zuerst die „obere Grenze“ einer Menge α definieren, d. h. ihre Limites oder ihr Maximum, und dann weiterhin die Fälle unterscheiden, in denen die obere Grenze Limes ist und die, in denen die obere Grenze Maximum ist. Zu diesem Zweck führen wir am besten den Begriff des „Segments“ ein. Wir werden mit dem Ausdruck „das durch die Menge α definierte Segment von P“ alle diejenigen Elemente bezeichnen, die die Beziehung P zu einem oder einigen Elementen von α haben.
113
Dies wird ein Segment in dem im 7. Kapitel definierten Sinne sein; in der Tat ist jedes Segment in diesem Sinne durch i r g e n d e i n e Menge α definiert. Ist P eine Reihenbeziehung, so besteht das durch α definierte Segment aus allen Elementen, die irgend einem Element von α vorangehen. Hat aα ein Maximum, so bilden alle Vorgänge des Maximums das Segment. Hat aber aα kein Maximum, so geht jedes Element von aα irgend einem anderen Element von aα voran und die ganze Menge aα ist daher in dem durch aα definierten Segment enthalten. Als Beispiel nehmen wir die Menge der Brüche ½ , ¾ , ⅞ , ₁₅/₁⁶ , … , also alle Brüche von der Form 1 - ½ⁿ für verschiedene endliche Werte von n. Diese Reihe von Brüchen hat kein Maximum und es ist klar, daß das durch sie definierte Segment (in der Gesamtreihe der der Größe nach geordneten Brüche) die Menge aller echten Brüche ist. Oder betrachten wir andererseits die Primzahlen, aufgefaßt als eine Auswahl aus den der Größe nach geordneten (endlichen und unendlichen) Kardinalzahlen. In diesem Falle besteht das Segment aus allen endlichen ganzen Zahlen. Wenn P eine Folgebeziehung ist, ist die „obere Grenze“ einer Menge α das Element x (falls vorhanden), dessen Vorgänger das durch α definierte Segment bilden. Ein „Maximum“ von α ist eine obere Grenze, die zu α gehört. Ein „oberer Limes“ ist eine obere Grenze, die nicht zu α gehört. Wenn eine Menge keine obere Grenze hat, so besitzt sie weder ein Maximum noch einen Limes. Dies ist der Fall bei einem „irrationalen“ Dedekindschen Schnitt, bei einer sogenannten Lücke. Somit ist der „obere Limes“ einer Folge von Elementen α hinsichtlich einer Folgebeziehung P dasjenige Element x (falls vorhanden), das nach allen α’s kommt, aber so beschaffen ist, daß jedes frühere Element vor irgend einem aα kommt. Wir können als „obere Limespunkte“ einer Folge von Elementen β alle diejenigen definieren, die obere Limites einer aus β gewählten Folge von Elementen sind. Wir werden natürlich obere und untere Liniespunkte zu unterscheiden haben.
114
Betrachten wir z. B. die Folge der Ordinalzahlen: 1, 2, 3 … ω, ω + 1 , … 2 ω, 2 ω + 1 , … 3 ω, … ω2, … ω3 … . Die oberen Limespunkte des Feldes dieser Folge sind die Elemente ohne unmittelbaren Vorgänger, d. h. 1, ω, 2 ω, 3 ω, … ω2, ω2 + ω, … 2 ω2, … ω3 Die oberen Limespunkte des Feldes dieser neuen Folge sind 1, ω2, 2 ω2, … ω3, ω3 + ω2… Andererseits besitzt die Folge der Ordinalzahlen – wie jede wohlgeordnete Folge – keine unteren Limespunkte, weil es keine Elemente ohne unmittelbaren Nachfolger gibt, ausgenommen das letzte. Aber bei einer Folge von der Art der Brüche ist jedes Element sowohl ein oberer wie ein unterer Limespunkt für eine passend gewählte Teilfolge. Betrachten wir die Folge der reellen Zahlen und wählen aus ihr die rationalen reellen Zahlen aus; dann hat diese Menge (die rationalen Zahlen) alle reellen Zahlen zu oberen und unteren Limespunkten. Die Limespunkte einer Menge werden ihre „erste Ableitung“ genannt und die Limespunkte der ersten Ableitung die zweite Ableitung usw. Mit Bezug auf die Limites können wir verschiedene Grade der so ge nannten „Stetigkeit“ einer Folge unterscheiden. Das Wort „Stetigkeit“ wurde lange gebraucht, ohne daß man es bis zur Zeit von Dedekind und Cantor genau definiert hätte. Beide gaben dem Ausdruck eine genaue Bedeutung, aber Cantors Definition ist enger als die von Dedekind: eine Folge mit Cantorscher Stetigkeit muß auch Dedekindsche Stetigkeit besitzen, aber das Umgekehrte ist nicht der Fall. Von vornherein würde man versucht sein, die Stetigkeit von Folgen durch das, was wir „Dichtheit“ genannt haben, zu definieren, also die Tatsache, daß es zwischen irgend zwei Elementen der Folge weitere gibt. Aber dies wäre eine ungeeignete Definition. Denn in Folgen von der Art der Brüche existieren Lücken. Wir sahen im 7. Kapitel, daß man die Folge der Brüche auf unzählige Weisen in zwei Teile zerlegen kann, derart, daß der eine ganz dem anderen vorangeht. Dabei hat der eine kein letztes und der andere kein erstes Element. Ein solcher Zustand läuft dem vagen Gefühl von dem Wesen der
115
„Stetigkeit“ zuwider, und zeigt, was wichtiger ist, daß die Folge der Brüche nicht zu den Folgen gehört, die für viele mathematische Zwecke erforderlich sind. In der Geometrie müssen wir beispielsweise verlangen, daß zwei gerade Linien, die sich schneiden, einen Punkt gemeinsam haben. Ware aber die Folge der Punkte auf einer Geraden ähnlich der Folge der Brüche, so könnten die beiden Geraden sich in einer „Lücke“ kreuzen und keinen Punkt gemeinsam haben. Dies ist ein grobes Beispiel, aber man kann noch viele andere geben, die zeigen, daß die Dichtheit nicht als mathematische Definition der Stetigkeit anzusehen ist. Vor allem die Bedürfnisse der Geometrie haben zur Definition der „Dedekindschen“ Stetigkeit geführt. Wir erinnern daran, daß definitionsgemäß eine Folge eine Dedekindsche ist, wenn jede Teilmenge des Feldes eine obere Grenze hat. (Es genügt anzunehmen, daß es immer eine o b e r e oder daß es immer eine u n t e r e Grenze gibt. Aus der einen Voraussetzung folgt die andere.) Mit anderen Worten: eine Folge ist Dedekindisch, wenn sie keine Lücken aufweist. Die Abwesenheit von Lücken kann entweder daher rühren, daß die Elemente Nachfolger haben oder daher, daß Limespunkte, aber keine Maxima vorhanden sind. Somit ist eine endliche oder eine wohlgeordnete Folge Dedekindisch, ebenso die Folge der reellen Zahlen. Die erste Art Dedekindsche Folgen wird durch die Annahme der Dichtheit ausgeschlossen; in diesem Falle muß unsere Folge eine Eigenschaft besitzen, die für manche Zwecke passend Stetigkeit genannt werden kann. Somit werden wir zu der Definition geführt: Eine Folge besitzt „Dedekindsche Stetigkeit“, wenn sie Dedekindisch und dicht ist. Aber diese Definition ist für viele Anwendungen noch zu weit. Nehmen wir z. B. an, daß wir dem geometrischen Raum solche Eigenschaften zuschreiben wollen, daß man die Lage eines Punktes durch reelle Koordinaten angeben kann. Dies wird durch die Dedekindsche Stetigkeit allein nicht gewährleistet. Wir müssen sicher sein, daß jeder Punkt, für den nicht rationale Koordinaten angegeben werden können, als der Limes einer Folge von Punkten mit
116
rationalem Koordinaten angesehen werden kann. Dies ist eine neue Eigenschaft, die man aus unserer Definition nicht ableiten kann. Wir werden dadurch zu einer näheren Untersuchung der Limites bei den Folgen geführt. Diese Untersuchung wurde von Cantor angestellt und bildet die Grundlage seiner Stetigkeitsdefinition. Auf den ersten Blick sieht man aber noch nicht, wie diese Definition mit den Betrachtungen, durch die man auf sie geführt wurde, zusammenhängt. Wir werden deshalb zuerst die Cantorschen Auffassungen über diesen Gegenstand besprechen, bevor wir seine Definition der Stetigkeit geben. Cantor nennt eine Folge „perfekt“, wenn alle ihre Punkte Limespunkte sind und alle ihre Limespunkte zu ihr gehören. Aber diese Definition drückt nicht genau das aus, was er meint. Die Forderung, daß alle Punkte Limespunkte sein sollen, bleibt unverändert bestehen; diese Eigenschaft kommt den dichten Folgen und nur diesen zu, wenn alle Punkte obere oder untere Limespunkte sein sollen. Aber wenn man nur annimmt, daß sie Limespunkte schlechthin sind, so gibt es andere Folgen, die diese Eigenschaft besitzen z. B. die Folge der Dezimalbrüche, wenn ein unendlicher Dezimalbruch, der von einer Stelle an lauter Neuner aufweist, von dem entsprechenden endlichen Dezimalbruch unterschieden und unmittelbar vor ihn gestellt wird. Eine derartige Reihe ist fast dicht, enthält jedoch außergewöhnliche Elemente, die aufeinanderfolgen und von denen das erste keinen unmittelbaren Vorgänger und das zweite keinen unmittelbaren Nachfolger hat. Abgesehen von solchen Folgen sind die Folgen, bei denen jeder Punkt ein Limespunkt ist, dicht; und dies gilt ohne Einschränkung, wenn festgesetzt wird, daß jeder Punkt ein oberer (bzw. ein unterer) Limespunkt sein soll. Obgleich Cantor es nicht ausdrücklich ausspricht, müssen wir verschiedene Arten von Limespunkten unterscheiden, je nach der Art der kleinsten Teilreihe durch die sie definiert werden können. Cantor nimmt an, daß sie durch Progressionen oder Regressionen (das Gegenteil der Progressionen) zu definieren sind. Wenn jedes Element unserer Folge der Limes einer Progression oder Regression ist, so nennt Cantor die Folge „insichdicht“.
117
Wir kommen nun zur zweiten Eigenschaft, durch die perfekte Folgen zu definieren sind, nämlich die Eigenschaft, die Cantor „abgeschlossen sein“ nennt. Wie wir sahen, wurde diese Eigenschaft zuerst dadurch definiert, daß alle Limespunkte einer Folge zu ihr gehören. Doch hat dies nur dann eine wirkliche Bedeutung, wenn unsere Folge als Teilfolge einer größeren Folge gegeben wird (wie z. B. bei einer Auswahl von reellen Zahlen), und die Limespunkte mit Rücksicht auf die größere Folge zu nehmen sind. Wenn andererseits eine Folge nur für sich betrachtet wird, so muß sie ihre Limespunkte enthalten. Was Cantor meint, ist nicht genau das, was er sagt: in der Tat drückt er sich bei anderen Gelegenheiten etwas anders aus und das meint er wirklich. Er meint eigentlich, daß jede Teilfolge, bei der man einen Limes erwartet, einen solchen innerhalb der gegebenen Folge besitzt; d. h. jede Teilfolge ohne Maximum hat einen Limes. Oder jede Teilfolge hat eine obere Grenze. Aber Cantor fordert dies nicht für jede Teilfolge, sondern nur für Progressionen und Regressionen. (Es ist nicht ersichtlich, inwieweit er dies als eine Einschränkung erkennt.) Somit finden wir schließlich die gewünschte Definition: Eine Folge ist „abgeschlossen“, wenn jede in der Folge enthaltene Progression oder Regression einen Limes innerhalb der Folge hat. Ferner haben wir die Definition: Eine Folge ist „perfekt“, wenn sie in sich dicht und abgeschlossen ist, d. h. wenn jedes Element der Limes einer Progression oder Regression ist und jede in der Folge enthaltene Progression oder Regression einen Limes innerhalb der Folge hat. Cantor will eine solche Definition der Stetigkeit geben, die Anwendung finden soll auf die Folge der reellen Zahlen und die mit ihr ähnlichen Folgen, aber nicht auf andere. Zu diesem Zweck müssen wir eine weitere Eigenschaft hinzunehmen. Unter den reellen Zahlen sind einige rational, andere irrational; obwohl die Zahl der irrationalen größer ist als die der rationalen, gibt es zwischen irgend zwei beliebig benachbarten reellen noch rationale Zahlen. Die Zahl der rationalen Zahlen ist, wie wir sahen, א0. Daraus ergibt sich die weitere Eigenschaft, die zur vollkommenen Charakterisierung der Stetigkeit ausreicht, nämlich die Eigenschaft, eine Menge von א0
118
Elementen derart zu enthalten, daß zwischen irgend zwei beliebig benachbarten Elementen unserer Folge ein Element dieser Menge vorhanden ist. Diese Eigenschaft zusammen mit der, perfekt zu sein, definiert vollständig eine Menge von Folgen, die alle miteinander ähnlich sind und somit eine Folgenzahl bilden. Dies ist die Menge der nach Cantor stetigen Folgen. Wir können diese Definition etwas vereinfachen. Zunächst definieren wir: Eine „Mittelmenge“ einer Folge ist eine Teilmenge des Feldes, derart, daß Elemente aus ihr zwischen irgend zwei Elementen der Folge vorhanden sind. So sind die rationalen Zahlen eine Mittelmenge in der Folge der reellen Zahlen. Offenbar kann es Mittelmengen nur in dichten Folgen geben. Mithin ist die Cantorsche Definition gleichbedeutend mit der folgenden: Eine Folge ist „stetig“, wenn sie (1) Dedekindisch ist, (2) eine Mittelmenge mit א0 Elementen enthält. Um Verwechslungen zu vermeiden, werden wir in diesem Falle von „Cantorscher Stetigkeit“ sprechen. Man erkennt, daß aus ihr die Dedekindsche Stetigkeit folgt, aber das Umgekehrte ist nicht der Fall. Alle Folgen mit Cantorscher Stetigkeit sind einander ähnlich, nicht aber alle Folgen mit Dedekindscher Stetigkeit. Die Begriffe L i m e s und S t e t i g k e i t , die wir definiert haben, dürfen nicht verwechselt werden mit den Begriffen des Limes einer Funktion bei Annäherung an ein gegebenes Argument oder mit der Stetigkeit einer Funktion in der Umgebung eines gegebenen Arguments. Dies sind verschiedene Begriffe, die sehr wichtig, jedoch aus den obigen ableitbar und komplizierter sind. Die Stetigkeit der Bewegung (wenn die Bewegung überhaupt stetig ist) ist ein Beispiel für die Stetigkeit einer Funktion; andererseits ist die Stetigkeit von Raum und Zeit (wenn sie stetig sind) ein Beispiel für die Stetigkeit von Folgen oder (um sich vorsichtiger auszudrücken) für eine Art von Stetigkeit, die durch geeignete mathematische Operationen auf
119
Folgenstetigkeit zurückgeführt werden kann. Angesichts der grundlegenden Wichtigkeit der Bewegung für die angewandte Mathematik, sowie auch aus anderen Gründen wird es gut sein, kurz die Begriffe des Limes und der Stetigkeit in ihrer Anwendung auf Funktionen zu behandeln; aber dieser Gegenstand bleibt am besten einem eigenen Kapitel vorbehalten. Die Definitionen der Stetigkeit, von Dedekind und Cantor, zeigen keine sehr große Übereinstimmung mit der vagen Vorstellung, die der Mann auf der Straße oder der Philosoph gedanklich mit dem Wort Stetigkeit verbindet. Für diese Leute besteht die Stetigkeit mehr darin, daß jegliche Unterscheidung aufhört, ungefähr so wie bei dichtem Nebel alle Unterschiede verwischt sind. Ein Nebel erzeugt den Eindruck einer Ausdehnung ohne bestimmte Vielfältigkeit oder Unterteilung. Das ist es, was ein Metaphysiker unter „Stetigkeit“ versteht; er erklärt sehr richtig, daß die Stetigkeit seines Geisteslebens und desjenigen der Kinder und Tiere von dieser Art sei. Die allgemeine Idee, die ungefähr durch diese „Stetigkeit“ oder das Wort „Fluß“ angedeutet wird, ist sicher gänzlich verschieden von dem, was wir definiert haben. Als Beispiel nehmen wir die Folge der reellen Zahlen. Jede Zahl ist, was sie ist, vollständig bestimmt und unnachgiebig; sie geht nicht etwa unmerklich in die andere über; sie ist eine strenge Einheit für sich und ihr Abstand von jeder anderen Einheit ist endlich, obwohl er kleiner als jeder vorgegebene endliche Betrag gemacht werden kann. Die Frage nach dem Zusammenhang zwischen der unter den reellen Zahlen bestehenden Stetigkeit und der Stetigkeit, wie sie z. B. das in einem gegebenen Augenblick von uns Gesehene aufweist, ist schwierig und verwickelt. Es kann nicht behauptet werden, daß die beiden Arten einfach identisch sind. Aber es kann meines Erachtens sehr wohl behauptet werden, daß die in diesem Kapitel dargelegte mathematische Auffassung ein abstraktes logisches Schema abgibt, auf das ein irgendwie als stetig definierbares empirisches Material durch in die geeignete Behandlung zurückgeführt werden kann. Es wäre ganz unmöglich, diese Behauptung in diesem Buch zu rechtfertigen. Wenn der Leser
120
sich hierfür interessiert, so möge er einen Versuch des Verfassers, diese Behauptungen insbesondere für die Zeit zu rechtfertigen, im Monist von 1914/15 oder in „Our Knowledge of the External World“ nachlesen. Mit diesen Angaben müssen wir dieses Problem, so interessant es ist, verlassen, um uns mehr mathematischen Gegenständen zuzuwenden.
1 1 . Limes und Stetigkeit bei Funktionen In diesem Kapitel werden wir die Definition des Limes einer Funktion betrachten (falls ein solcher existiert), wenn das Argument sich, einem gegebenen Wert nähert und was unter einer „stetigen Funktion“ zu verstehen ist. Beide Begriffe gehören zur eigentlichen Mathematik. Daher wäre es kaum nötig, sich damit in einer bloßen Einführung in die mathematische Philosophie zu beschäftigen. Aber vor allem hat die sog. Infinitesimalrechnung dazu geführt, daß sich in den Köpfen der Kathederphilosophen verkehrte Vorstellungen über unsern Gegenstand so fest eingewurzelt haben, daß man eine länger fortgesetzte beträchtliche Anstrengung aufbringen muß, um sie auszurotten. Seit Leibniz glaubt man, daß die Differential- und Integralrechnung auf infinitesimalen Größen beruhe. Die Mathematiker (besonders Weierstraß) zeigten, daß dies ein Irrtum ist. Aber die einmal eingebürgerten Irrtümer (was z. B. Hegel über die Mathematik sagt) sterben schwer aus. Die Philosophen pflegen die Arbeit von Leuten wie Weierstraß zu ignorieren. In den üblichen Mathematikbüchern werden Limites und Stetigkeit von Funktionen durch Ausdrücke definiert, in denen der Begriff der Zahl vorkommt. Wie Dr. Whitehead gezeigt hat, ist dies nicht wesentlich ₁). Trotzdem werden wir mit den Definitionen der Lehrbücher beginnen und später zeigen, wie man diese Definitionen derart verallgemeinern kann, daß sie sich auf Folgen beziehen und nicht bloß auf solche, die numerischer Natur oder numerisch meßbar sind. Betrachten wir eine gewöhnliche mathematische Funktion f(x), wo x und f(x) reelle Zahlen sind und f(x) einwertig ist; d. h. wenn ₁
) Vgl. Principia Mathematica, Bd. II, Satz 230—234.
122
x gegeben ist, so kann f(x) nur einen Wert annehmen. Wir nennen x „das Argument“ und f(x) den „Funktionswert für das Argument x“. Die rohe Vorstellung von einer sogenannten stetigen Funktion, wofür wir noch eine genaue Definition suchen, besteht in folgendem: kleinen Unterschieden des x sollen kleine Unterschiede des f(x) entsprechen. Machen wir die Unterschiede des x klein genug, so können wir die Unterschiede des f(x) kleiner als jeden angegebenen Betrag machen. Wenn eine Funktion stetig sein soll, so können wir keine plötzlichen Sprünge brauchen, so daß eine noch so kleine Änderung eines bestimmten Wertes von x eine Änderung des f(x) hervoruft, die einen bestimmten, vorher gegebenen endlichen Wert überschreitet. Die gewöhnlich in der Mathematik vorkommenden einfachen Funktionen haben diese Eigenschaft: z. B. x2, x3, … log x, sin x usw. Aber es ist keineswegs schwierig, unstetige Funktionen zu definieren. Als ein nicht mathematisches Beispiel betrachte man den „Geburtsort der jüngsten zur Zeit t lebenden Person“. Das ist eine Funktion von t, ihr Wert ist konstant, vom Zeitpunkt einer Geburt bis zum Zeitpunkt der nächsten. Dann springt der Wert plötzlich vom einen Geburtsort zum anderen. Ein entsprechendes mathematisches Beispiel wäre „die größte in x enthaltene ganze Zahl“, wo x eine reelle Zahl ist. Diese Funktion bleibt von einer ganzen Zahl bis zur nächsten konstant. Dann macht sie plötzlich einen Sprung. Die stetigen Funktionen sind uns tatsächlich vertrauter, trotzdem bilden sie die Ausnahme – es gibt unendlich mehr unstetige Funktionen als stetige. Viele Funktionen sind für einen oder mehrere Werte der Veränderlichen unstetig, für alle anderen aber stetig. Als Beispiel nehme man sin 1/x. Die Funktion sin Θ durchläuft alle Werte von -1 bis zu +1, sooft Θ von -π/2 bis + π/2 oder von π/2 bis 3π/2 oder allgemein von (2n - 1) π/2 bis (2n + 1)π/2 läuft, wobei n irgend eine ganze Zahl ist. Wir wollen jetzt 1/x für ein sehr kleines x betrachten. Wenn x abnimmt, so sieht man, daß 1/x immer rascher wächst, so daß es immer schneller den Bereich der Werte von einem Vielfachen von π/2 bis zum nächsten durchläuft, wenn x kleiner und kleiner wird. Infolgedessen geht, wenn x wächst, ein 1/x rascher und rascher von
123
-1 zu +1 und wieder zurück. Nehmen wir irgend ein Intervall um 0, z. B. das Intervall von -ε bis +ε, wobei ε irgend eine sehr kleine Zahl ist, so wird sin 1 /x in diesem Intervall eine unendliche Zahl von Schwankungen durchlaufen. Wir können die Schwankungen nicht verkleinern, indem wir das Intervall kleiner machen. Die Funktion ist also um das Argument 0 herum unstetig. Es ist leicht, Funktionen zu konstruieren, die an verschiedenen Stellen oder an א0 Stellen oder überall unstetig sind. Beispiele hiefür findet man in jedem Buch über reelle Funktionen. Gehen wir jetzt dazu über, eine genaue Definition der Behauptung zu suchen, eine Funktion ist stetig für ein gegebenes Argument, wobei Argument und Funktionswert reelle Zahlen sind. Zunächst definieren wir die „Umgebung“ einer Zahl x als alle Zahlen von x - ε bis x + ε. ε ist eine beliebige Zahl, wobei jedoch nur kleine ε von Bedeutung sind. Offenbar hängt die Stetigkeit an einem bestimmten Punkt mit dem Verhalten in j e d e r noch so kleinen Umgebung dieses Punktes zusammen. Wir fordern: wenn a das Argument ist, für das unsere Funktion stetig sein soll, so definieren wir zunächst eine Umgebung, sagen wir α, die den Wert f(a) enthält, den die Funktion für das Argument a annimmt. Nehmen wir eine genügend kleine Umgebung von a, so sollen alle Funktionswerte für Argumente in dieser Umgebung in der Umgebung a enthalten sein, gleichgültig, wie klein a auch gewählt sein mag. Wenn wir also verlangen, daß unsere Funktion sich von f(a) nur um einen sehr kleinen Betrag unterscheiden soll, so können wir immer ein Gebiet von reellen Zahlen finden, in deren Mitte a liegt, derart, daß f(x) sich in diesem ganzen Gebiet von f(a) nicht um mehr als den vorgeschriebenen kleinen Betrag unterscheidet. Dies soll gelten, wie klein der Betrag auch sei, den wir gewählt haben. So werden wir auf die folgende Definition geführt: Eine Funktion f(x) soll „stetig“ für das Argument a heißen, wenn für jede positive, beliebig kleine, von der Null verschiedene Zahl σ eine von 0 verschiedene positive Zahl ε existiert, derart, daß für alle Werte von σ, die dem absoluten Betrag nach kleiner sind als ε 1 ), die Differenz f(a + σ) - f(a) absolut genommen, kleiner ist als σ.
124
In dieser Definition wird durch σ zunächst eine Umgebung von f(a), nämlich die Umgebung von f(a) - σ bis f(a) + σ bestimmt. Dann behauptet die Definition, daß wir (durch das ε) eine Umgebung definieren können, nämlich die Umgebung von a - ε bis a + ε, so daß für alle Argumente innerhalb dieser Umgebung der Funktionswert innerhalb der Umgebung von f(a) - σ bis f(a) + σ liegt. Wenn dies für jede beliebige Wahl von σ möglich ist, heißt die Funktion für das Argument a „stetig“. Bis jetzt haben wir den „Limes“ einer Funktion für ein gegebenes Ar gu ment nicht definiert. Hätten wir dies getan, so hätten wir die Stetigkeit einer Funktion anders definieren können: eine Funktion ist an einem Punkt stetig, wenn ihr Funktionswert gleich ist dem Limes ihres Funkti ons wer tes, wenn das Argument sich dem Punkte von unten oder oben nähert. Aber nur ausnahmsweise „brave“ Funktionen haben einen bestimmten Limes, wenn das Argument sich einem gegebenen Punkt nähert. Im allgemeinen schwankt eine Funktion. Wenn man irgend eine noch so kleine Umgebung eines beliebigen Argumentes betrachtet, so wird den Argumenten innerhalb dieser Umgebung ein ganzes Gebiet von Funktionswerten entsprechen. Da dies die Regel ist, wollen wir diesen Fall zunächst betrachten. Untersuchen wir, was geschehen kann, wenn das Argument sich irgend einem Wert von a von unten nähert. Deshalb wollen wir den Verlauf bei Argumenten betrachten, die in dem Intervall a - ε bis a liegen, ε ist irgend eine Zahl, wobei nur kleine ε wichtig sind. Die Funktionswerte für die Argumente von a - ε bis a (a ausgeschlossen) bilden eine Folge von reellen Zahlen. Sie definieren einen gewissen Ausschnitt aus der Folge der reellen Zahlen. Er besteht aus denjenigen Zahlen, die nicht größer sind als irgend ein Funktionswert für die Argumente von a - ε bis a. Gegeben sei eine beliebige Zahl in diesem Ausschnitt, so gibt es für die Argumente zwischen a - ε und a, d. h. für Argumente, die sich von a nur um sehr wenig unterscheiden (wenn ε sehr klein ist), Funktionswerte, die min1 ) Eine Zahl heißt dem absoluten Betrag nach kleiner als ε, wenn sie zwischen -ε und +ε liegt.
125
destens so groß sind wie diese Zahl. Nehmen wir alle möglichen ε und alle möglichen entsprechenden Ausschnitte. Den Durchschnitt aller dieser Ausschnitte wollen wir den „letzten Ausschnitt“ nennen, wenn das Argument sich a nähert. Wenn wir also sagen, daß die Zahl z zum letzten Ausschnitt gehört, so bedeutet dies: wie klein wir auch ε nehmen, so gibt es noch immer Argumente zwischen a - ε und a, für die der Funktionswert nicht kleiner ist als z. Wir können genau denselben Prozeß auf obere Ausschnitte anwenden, d. h. auf Ausschnitte, die von irgendwoher bis zum obersten Punkt reichen, an Stelle vom untersten Punkt bis irgendwohin. Dabei nehmen wir diejenigen Zahlen, die nicht kleiner sind als alle Funktionswerte für Argumente von a - ε bis a. Sie definieren einen oberen Ausschnitt, der mit ε variiert. Nehmen wir den Durchschnitt aller dieser Ausschnitte für alle möglichen ε, so bekommen wir den „letzten oberen Ausschnitt“. Wenn man sagt, daß eine Zahl z zum letzten oberen Ausschnitt gehört, so bedeutet dies: wie klein wir auch ε machen, so gibt es immer Argumente zwischen a - ε und a, für die der Funktionswert nicht größer ist als z. Wenn eine Zahl z sowohl zum letzten Ausschnitt wie zum letzten oberen Ausschnitt gehört, so werden wir sagen, daß sie zur „letzten Schwankung“ gehört. Wir können dies veranschaulichen, indem wir nochmals die Funktion sin 1 /x betrachten, wo x sich dem Wert 0 nähert. Um im Rahmen der obigen Definitionen zu bleiben, werden wir annehmen, daß wir uns diesem Wert von unten nähern. Beginnen wir mit dem „letzten Ausschnitt“. Zwischen -ε und 0 wird die Funktion für alle ε für gewisse Argumente den Wert 1 annehmen, niemals aber einen größeren Wert. Also besteht der letzte Ausschnitt aus allen reellen, positiven und negativen Zahlen unterhalb 1 (1 eingerechnet) d. h. er besteht aus allen negativen Zahlen, zusammen mit der 0 und den positiven Zahlen bis zu 1 (1 eingerechnet). Ähnlich besteht der „letzte obere Ausschnitt“ aus allen positiven Zahlen zusammen mit der 0 und den negativen Zahlen bis zu -l (-1 eingerechnet). Also besteht die „letzte Schwankung“ aus allen reellen Zahlen von -1 bis zu +1 inklusive der Grenzen.
126
Wir können im allgemeinen sagen, daß die „letzte Schwankung“ einer Funktion, wenn das Argument sich der Zahl a von unten nähert, aus all den Zahlen x besteht, die die Eigenschaft haben, daß, wie nah wir auch dem a kommen, wir immer noch Werte finden, die so groß wie x und so klein wie x sind. Die letzte Schwankung kann keine Elemente, ein Element oder viele Elemente enthalten. In den beiden ersten Fällen hat die Funktion bei Annäherung von unten einen bestimmten Limes. Wenn die letzte Schwankung ein Element besitzt, so ist dies ziemlich einleuchtend. Gleichermaßen gilt dies, wenn sie keines hat. Denn es ist nicht schwer zu beweisen, daß, wenn die letzte Schwankung 0 ist, die Grenze des letzten Ausschnittes identisch ist mit der Grenze des letzten oberen Ausschnittes. Dies kann als der Limes der Funktion bei Annäherung von unten definiert werden. Wenn aber die letzte Schwankung viele Elemente besitzt, so besitzt die Funktion bei Annäherung von unten keinen bestimmten Limes. In diesem Fall können wir die oberen und unteren Limites der letzten Schwankung (d. h. die untere Grenze des letzten oberen Ausschnittes und die obere Grenze des letzten Ausschnittes) als untere und obere Limites ihrer „letzten“ Funktionswerte bei Annäherung von unten betrachten. Ähnlich bekommen wir untere und obere Limites für die „letzten“ Funktionswerte bei Annäherung von oben. Wir haben also im allgemeinen v i e r Limites einer Funktion bei Annäherung an ein gegebenes Argument. Der Limes für ein gegebenes Argument a existiert nur dann, wenn alle vier untereinander gleich sind und er hat dann eben diesen gemeinsamen Wert. Wenn dies auch der F u n k t i o n s w e r t für das Argument a ist, so ist die Funktion für dieses Argument stetig. Dies können wir als eine Definition der Stetigkeit betrachten. Sie ist mit unserer früheren Definition gleichwertig. Wir können den Limes einer Funktion für ein gegebenes Argument, wenn er existiert, auch ohne die letzte Schwankung und die vier Limites des allgemeinen Falles definieren. Die Definition geht in diesem Fall genau wie die frühere Definition der Stetigkeit vor sich. Wir definieren zuerst den Limes bei Annäherung von unten. Wenn ein bestimmter Limes bei Annäherung des Argumentes an a von
127
unten existieren soll, so ist notwendig und hinreichend, daß, wenn irgend eine kleine Zahl σ vorgegeben ist, zwei Funktionswerte für Argumente, die genügend nahe bei a liegen (aber beide kleiner als a sind), sich um weniger als σ unterscheiden. Mit ändern Worten: wenn e genügend klein ist und unsere Argumente zwischen a – ε und a liegen (a ausgeschlossen), so ist die Differenz zwischen den Funktionswerten für diese Argumente kleiner als σ. Dies soll für jedes σ gelten, wie klein es auch sein mag. In diesem Fall hat die Funktion einen Limes bei Annäherung von unten. Der Fall, daß ein Limes bei Annäherung von oben existiert, wird entsprechend definiert. Selbst wenn beide Limites existieren, so brauchen sie nicht identisch zu sein. Und wenn sie identisch sind, brauchen sie noch nicht mit dem F u n k t i o n s w e r t für das Argument a identisch zu sein. Nur im letzten Fall nennen wir die Funktion s t e t i g für das Argument a. Eine Funktion heißt schlechthin „stetig“, wenn sie für jedes Argument stetig ist. Eine andere, etwas verschiedene Methode zu einer Definition der Stetigkeit zu gelangen, besteht in folgendem: Wir sagen, eine Funktion strebt schließlich in die Menge α hinein, wenn es irgend eine reelle Zahl gibt, derart, daß für dieses Argument und alle größeren Argumente der Funktionswert ein Element der Menge α ist. Entsprechend werden wir sagen, eine Funktion strebe bei unterer Annäherung des Argumentes an x in α hinein, wenn es ein Argument y kleiner als x gibt, derart, daß für das ganze Invertall von γ (eingeschlossen) bis x (ausgeschlossen) die Funktionswerte Elemente von α sind. Wir können jetzt sagen, eine Funktion sei für das Argument a, für das sie den Wert f(a) annimmt, stetig, wenn sie folgenden vier Bedingungen genügt: (1) Gegeben sei eine reelle Zahl kleiner als f(a), so soll die Funktion bei unterer Annäherung des Argumentes an a in die Nachfolgermenge dieser Zahl streben. (2) Gegeben sei eine reelle Zahl, größer als f(a), so soll die Funktion bei unterer Annäherung an das Argument a. in die Vorgängermenge dieser Zahl streben.
128
(3) und (4) Die entsprechenden Bedingungen für die Annäherung an a von oben. Der Vorteil dieser Art der Definition besteht darin, daß sie die Stetigkeitsbedingung in vier Bedingungen auflöst, die aus der Betrachtung von Argumenten und Funktionswerten entstehen, die jeweils größer oder kleiner als das Argument und der Funktionswert sind, für den die Stetigkeit zu definieren ist. Wir können jetzt unsere Definitionen derart verallgemeinern, daß sie für Folgen gelten, die nicht numerisch sind oder nicht als numerisch meßbar bekannt sind. Ein bequemes Beispiel ist die Bewegung. Es gibt eine Geschichte von H. G. Wells, die für diesen Fall den Unterschied zwischen dem Limes einer Funktion für ein gegebenes Argument und dem Funktionswert für dasselbe Argument erläutert. Der Held der Geschichte besaß ohne sein Wissen die Fähigkeit, seine Wünsche zu verwirklichen. Ein Polizist griff ihn an. Er schrie: „Hol Dich der Teufel!“ und der Polizist war verschwunden. Wenn f(t) die Lage des Polizisten zur Zeit t ist und t0 der Moment des Ausrufs, so wäre der Limes der Lage des Polizisten, wenn t sich dem t0 von unten nähert, die Berührung mit unserem Helden, dagegen der Funktionswert für das Argument t0 war die Hölle. Aber solche Vorkommnisse gelten in der wirklichen Welt als selten und man nimmt, wenn auch ohne genügende Beweise an, daß alle Bewegungen stetig seien. Hat man also einen Körper, dessen Lage zur Zeit t f(t) ist, so ist f(t) eine stetige Funktion von t. Die Bedeutung der „Stetigkeit“ in solchen Sätzen wollen wir jetzt so einfach wie möglich definieren. Die Definitionen, die wir für den Fall von Funktionen mit reellem Argument und Funktionswert gegeben haben, kann man leicht auf einen allgemeineren Fall ausdehnen. P und Q seien zwei Beziehungen; wir können sie uns am besten als Folgebeziehungen vorstellen, obwohl dies für unsere Definition nicht nötig ist. Ferner sei R eine ein-mehrdeutige Beziehung, deren Bereich im Feld von P enthalten ist, während ihr konverser Bereich im Feld von Q enthalten ist. Dann ist R (in einem verallgemeinerten Sinn)
129
eine Funktion, deren Argumente zum Feld von Q gehören, während ihre Funktionswerte zum Feld von P gehören. Man betrachte z. B. ein Teilchen, das sich auf einer Geraden bewegt. Q seien die Zeitpunkte, P die Reihe der Punkte auf unserer Geraden von links nach rechts. R zeigt die Beziehung der Lage, die unser Teilchen auf der Geraden zur Zeit a einnimmt zu dieser Zeit a, so daß das „R von a“ seine Lage zur Zeit a bedeutet. An diesem Beispiel möge man während unserer Definitionen denken. Die Funktion R soll für das Argument a stetig sein, wenn für ein gegebenes Intervall a der P-Folge das den Funktionswert für das Argument a enthält, ein Intervall in der Q-Folge existiert, das a nicht als Endpunkt enthält, derart, daß für dieses ganze Intervall die Funktionswerte Elemente von a sind. („Intervall“ bedeutet dabei alle Elemente zwischen irgend zweien. Wenn also x und y zwei Elemente des Feldes von P sind und x die Beziehung P zu y hat, so soll das „P-Intervall x bis y“ alle Elemente z bedeuten, derart, daß x die Beziehung P zu z hat und z die Beziehung P zu y hat. Dazu gehören dann noch je nach der Definition x und y selbst.) Den „letzten Ausschnitt“ und die „letzte Schwankung“ können wir leicht definieren. Um den „letzten Ausschnitt“ zu definieren, wenn das Argument sich a von unten nähert, nehme man irgend ein Argument y, das dem a vorangeht (d. h. die Beziehung Q zu a hat). Dann nehme man die Funktionswerte für alle Argumente bis zu y (y eingeschlossen) und bilde den Ausschnitt von P, den diese Werte definieren, also diejenigen Elemente der P-Reihe, die früher oder identisch sind mit jedem dieser Werte. Man bilde alle Ausschnitte für alle y, die a vorangehen und nehme ihren Durchschnitt. Dies soll der letzte Ausschnitt sein. Der letzte obere Ausschnitt und die letzte Schwankung werden dann genau so wie früher definiert. Die Übertragung der Definition der Konvergenz und die beiden dadurch entstehenden Definitionen der Stetigkeit gehen ohne Schwierigkeiten vor sich. Wir sagen, daß eine Funktion R „schließlich in Q in die Menge a hineinstrebt“, wenn es ein Element y des inversen Bereiches von
130
R und des Feldes von Q gibt, derart, daß der Funktionswert für y und für jedes Argument, zu dem y die Beziehung Q hat, ein Element von α ist. Wir sagen, daß R „in Q bei Annäherung an ein gegebenes Argument a in a hineinstrebt’’, wenn es ein Element y gibt, das die Beziehung Q zu a hat und zum inversen Bereich von R gehört derart, daß der Funktionswert für irgend ein Argument im Q-Intervall von y (eingeschlossen) nach a (ausgeschlossen) zu α gehört. Von den vier Bedingungen, denen eine Funktion genügen muß, wenn sie für das Argument a stetig sein soll, lautete die erste, wenn der Funktionswert für das Argument a mit b bezeichnet wird, folgendermaßen: Gegeben sei irgend ein Element, das die Beziehung P zu b besitzt, so soll R in Q bei unterer Annäherung an das Argument a in die Nachfolgermenge von b hinsichtlich P streben. Die zweite Bedingung erhält man, wenn man die Beziehung P durch die inverse Beziehung ersetzt. Die dritte und vierte erhält man aus der ersten und zweiten, indem man Q durch die inverse Beziehung ersetzt. Der Begriff des Limes oder der Stetigkeit einer Funktion enthält also seinem Wesen nach nichts Quantitatives. Beides läßt sich allgemein definieren und viele Sätze lassen sich für irgend zwei beliebige Folgen beweisen. Die eine ist dabei die Argumentfolge, die andere die Folge der Funktionswerte. Man wird sehen, daß in den Definitionen keine infinitesimalen Größen auftreten. Es kommen unendliche Mengen von Intervallen vor, die immer kleiner werden und keinen Limes besitzen mit Ausnahme von Null, nicht aber nichtendliche Intervalle. Dies entspricht der Tatsache, daß, wenn wir eine Strecke von der Länge eines Zentimeters halbieren, dann wieder halbieren und immer so weiter, wir auf diese Weise niemals unendlich kleine Intervalle bekommen. Denn nach n Halbierungen ist die Länge unseres Stückes 2ⁿ –1 Zentimeter. Dies ist eine endliche Größe, welche endliche Zahl auch n sein mag. Der Prozeß der fortgesetzten Halbierungen führt nicht auf Teile, deren Ordinalzahl unendlich wäre, denn er ist ein wesentlich schrittweiser Prozeß. Infinitesimale Größen erreicht man also auf diese Weise nicht. Der
131
Wirrwarr in diesem Gebiet hängt mit den Schwierigkeiten, denen wir bei der Betrachtung der Unendlichkeit und der Stetigkeit begegnet sind, zusammen.
12. Die Theorie der Auswahlen und das multiplikative Axiom In diesem Kapitel haben wir es mit einem Axiom zu tun, das logisch formuliert, aber nicht bewiesen werden kann, und das in einigen Gebieten der Mathematik von Vorteil, obwohl durchaus nicht unentbehrlich ist. Der Vorteil besteht darin, daß viele interessante Sätze, deren Annahme natürlich erscheint, ohne seine Hilfe nicht bewiesen werden können; aber es ist nicht unentbehrlich, weil selbst ohne jene Sätze die Objekte, auf die sich diese Sätze beziehen, noch weiterhin, wenn auch in etwas verstümmelter Form, bestehen bleiben. Bevor wir das multiplikative Axiom aussprechen, müssen wir zuerst die Theorie der Auswahlen und die Definition der Multiplikation bei einer unendlichen Zahl von Faktoren erklären. Bei der Definition der arithmetischen Operationen besteht das einzig korrekte Verfahren darin, eine Menge (oder Beziehung bei Beziehungszahlen) mit der gesuchten Zahl von Elementen tatsächlich zu konstruieren. Das erfordert manchmal ein gewisses Maß von Scharfsinn, ist aber unerläßlich für den Beweis der Existenz der definierten Zahl. Nehmen wir als einfachstes Beispiel den Fall der Addition. Es sei eine Kardinalzahl μ und eine Menge α mit μ Elementen gegeben. Wie soll μ + μ definiert werden? Zu diesem Zwecke müssen wir z w e i Mengen mit je μ Elementen haben, die sich nicht überdecken dürfen. Solche Mengen können wir aus α auf verschiedene Weise konstruieren. Am einfachsten vielleicht so: bilden wir einmal alle geordneten Paare, deren erstes Element eine aus einem einzigen Gliede von α bestehende Menge und deren zweites Element die Nullmenge ist; ferner bilden wir alle geordneten Paare mit der Nullmenge als erstem und einer aus einem einzigen Elemente von α bestehenden Menge
133
als zweitem Element. Diese beiden Mengen von Paaren haben kein Element gemeinsam und die logische Summe der beiden Mengen hat μ + μ Elemente. Genau so können wir μ + v definieren, wo μ, die Zahl einer Menge α und v die Zahl einer Menge β ist. Bei solchen Definitionen handelt es sich in der Regel bloß um einen geeigneten technischen Kunstgriff. Im Fall der Multiplikation mit unendlich vielen Faktoren jedoch gehen aus der Definition wichtige Probleme hervor. Die Multiplikation mit endlich vielen Faktoren bietet keine Schwierigkeit. Es seien zwei Mengen α und β gegeben, von denen die erste μ und die zweite v Elemente hat; dann können wir μ · v definieren als die Zahl der geordneten Paare, die gebildet werden können, indem man das erste Glied aus α und das zweite Glied aus β auswählt. Bei dieser Definition wird offenbar nicht vorausgesetzt, daß α und β sich nicht überdecken sollen; sie bleibt sogar bestehen, wenn α und β identisch sind. Ist z. B. α die Menge mit den Elementen x1, x2, x3, dann besteht die zur Definition des Produktes μ · μ erforderliche Menge aus folgenden Paaren: (x1, x1), (x1, x2), (x1, x3); (x2, x1), (x2, x2), (x2, x3); (x3 x1), (x3 x2), (x3 x3). Diese Definition bleibt anwendbar, wenn μ oder v oder beide unendlich sind, und sie kann schrittweise auf zwei, drei, vier oder irgend eine endliche Zahl von Faktoren ausgedehnt werden. Hierbei ergibt sich keine Schwierigkeit, nur kann diese Definition nicht auf eine unendliche Zahl von Faktoren ausgedehnt werden. Auf das Problem der Multiplikation, wenn die Zahl der Faktoren unendlich sein kann, kommt man auf folgende Weise: Nehmen wir an, wir haben eine Menge ϰ, die aus Mengen besteht und die Zahl der Elemente jeder dieser Mengen sei gegeben. Wie sollen wir das Produkt aller dieser Zahlen definieren? Gelingt es uns, unsere Definition allgemein zu formulieren, so besteht sie zu Recht, wenn ϰ endlich oder unendlich ist. Es ist darauf zu achten, daß das Problem darin besteht, den Fall zu beherrschen, daß ϰ selbst unendlich ist, und nicht den Fall, daß die Elemente von ϰ unendlich sind. Wenn ϰ nicht unendlich
134
ist, so ist die oben definierte Methode genau so brauchbar, wenn die Elemente von ϰ unendlich, wie wenn sie endlich sind. Es handelt sich darum, eine Methode für den Fall zu finden, daß ϰ unendlich ist, wenn auch seine Elemente endlich sind. Die folgende Methode, die Multiplikation allgemein zu definieren, stammt von Dr. Whitehead. Sie ist erklärt, auseinandergesetzt und des näheren behandelt in den Principia Mathematica Bd. I, Satz 80ff., und Bd. II, Satz 114. Nehmen wir vorderhand einmal an, daß ϰ eine Menge von Mengen ist, von denen sich keine zwei überdecken – sagen wir, die Wahlbezirke eines Landes, in dem es kein Plural-Wahlrecht gibt, wobei jeder Wahlkreis als eine Menge von Wählern betrachtet wird. Nehmen wir uns nun vor, aus jeder dieser Mengen ein Element als ihren Vertreter auszusuchen, wie es die Wahlkreise bei der Wahl zum Parlament tun. Wir nehmen dabei an, daß gesetzlich jeder Wahlkreis einen Mann aus der Wählerschaft dieses Kreises zu wählen hat. Wir kommen so zu einer Menge von Vertretern, die unser Parlament bildet. Dabei hat jeder Wahlkreis einen Mann gewählt. Wie viele verschiedene Möglichkeiten gibt es, ein Parlament zu wählen? Jeder Kreis kann irgend einen seiner Wahlberechtigten wählen und kann daher, falls β Wähler in einem Kreis vorhanden sind, β Wahlen vornehmen. Die Wahlen der verschiedenen Kreise sind voneinander unabhängig; somit ist es klar, daß bei endlicher Anzahl der Kreise die Zahl der möglichen Parlamente durch Multiplikation der Zahlen der Wähler der einzelnen Kreise erhalten wird. Wissen wir aber nicht, ob es endlich oder unendlich viele Kreise sind, so können wir die Zahl der möglichen Parlamente als Definition des Produktes der Zahlen der verschiedenen Kreise ansehen. So definiert man unendliche Produkte. Von diesem Beispiel, das uns zur Erläuterung gedient hat, gehen wir nun zu exakten Behauptungen über. ϰ sei eine Menge von Mengen, und wir nehmen vorläufig an, daß sich keine zwei Elemente von ϰ überdecken. Wenn also α und β zwei verschiedene Elemente von ϰ sind, dann ist kein Element der einen Menge gleichzeitig ein Element der anderen. Eine
135
Menge werden wir eine „Auswahl“ aus ϰ nennen, wenn sie aus gerade einem Element aus jeder Menge von ϰ besteht; d. h. μ ist eine „Aus wahl“ aus x, wenn jedes Element von p zu einer Menge von ϰ gehört, und wenn α eine Menge von ϰ ist, so sollen μ, und α genau ein Element ge mein sam haben. Die Menge der „Auswahlen“ aus ϰ soll die „multiplikative Men ge“ von ϰ heißen. Die Anzahl der Elemente in der multiplikativen Menge von ϰ, d. h. die Zahl der möglichen Auswahlen aus ϰ wird als das Produkt der Zahlen der Mengen von ϰ definiert. Diese Definition gilt unabhängig davon, ob ϰ endlich oder unendlich ist. Bevor wir uns mit diesen Definitionen ganz zufrieden geben können, müssen wir die Einschränkung aufheben, daß keine zwei Mengen von ϰ sich überdecken dürfen. Zu diesem Zwecke definieren wir an Stelle einer „Auswahl“ genannten Menge zuerst eine Beziehung, die wir „Selektor“ nennen wollen. Eine Beziehung R soll ein „Selektor“ aus ϰ heißen, wenn sie aus jeder Menge von ϰ ein Element als Vertreter dieser Menge auszeichnet, d. h. wenn es für jede gegebene Menge α von ϰ gerade ein x gibt, das Element von a ist und die Beziehung R zu α hat; das ist alles, was von R verlangt wird. Die formale Definition lautet: Ein „Selektor“ aus einer Menge von Mengen ϰ ist eine einmehrdeutige Beziehung, die ϰ zu ihrem inversen Bereich hat derart, daß, wenn x diese Beziehung zu einer Menge α von ϰ hat, x ein Element von α ist. Ist R ein Selektor aus ϰ und α eine Menge von ϰ, und x das Element, das die Beziehung R zu α hat, so soll x der „Vertreter“ von α hinsichtlich der Beziehung R heißen. Eine „Auswahl“ aus ϰ wird nun als der Bereich eines Selektors definiert; und die multiplikative Menge ist, wie vorhin, die Menge der Auswahlen. Wenn aber die Mengen von ϰ sich überdecken, so kann es mehr Selektoren als Auswahlen geben, da ein Element x, das zu zwei Mengen α und β gehört, einmal als Vertreter von α und einmal als Vertreter von β ausgewählt werden kann. Wir haben also in beiden Fällen verschiedene Selektoren, aber dieselbe Auswahl. Für die Definition
136
der Multiplikation sind die Selektoren wichtiger als die Auswahlen. Somit definieren wir: „Das Produkt der Zahlen der Elemente einer Menge von Mengen ϰ“ ist die Zahl der Selektoren aus ϰ. Im Anschluß daran können wir das Potenzieren definieren. μv würde natürlich als die Zahl der Selektoren aus v Mengen von je μ. Elementen zu definieren sein. Aber gegen diese Definition können Einwände gemacht werden. Bei ihrer Aufstellung ist nämlich das multiplikative Axiom (von dem wir gleich sprechen werden) unnötigerweise benutzt worden. Wir nehmen statt dessen folgende Konstruktion vor: α sei eine Menge mit μ Elementen und β eine Menge mit v Elementen. y sei ein Element von β. Wir bilden die Menge aller geordneten Paare, die y zum zweiten und ein Element von α zum ersten Glied haben. Zu einem gegebenen y gibt es μ solche Paare, da jedes Element von α als erstes Glied genommen werden kann und α μ Elemente hat. Bilden wir nun alle Mengen dieser Art, indem wir y variieren lassen, so erhalten wir zusammen v Mengen, da y jedes Element von β sein kann und β v Elemente aufweist. Von diesen v Mengen ist jede eine Menge von Paaren, nämlich von allen Paaren, die aus einem veränderlichen Element von α und einem festen Element von β gebildet werden können. Wir definieren μv als die Zahl der Selektoren aus der Menge, die aus diesen v Mengen besteht. Wir können ebensogut μv definieren als die Zahl der Auswahlen; denn da unsere Mengen von Paaren sich gegenseitig ausschließen, ist die Zahl der Selektoren die gleiche wie die Zahl der Auswahlen. Eine Auswahl aus unserer Menge von Mengen ist eine Folge geordneter Paare, von denen genau eines irgend ein gegebenes Element von β zum zweiten Glied hat, während das erste Glied irgend ein Element von α ist. Somit ist μv definiert durch die Selektoren aus einer gewissen Menge von v Mengen mit μ, Elementen, aber die Menge hat eine gewisse Struktur und eine durchsichtigere Zusammensetzung als im allgemeinen Fall. Die Bedeutung dieser Tatsache für das multiplikative Axiom wird sich alsbald zeigen.
137
Was vom Potenzieren gilt, gilt auch vom Produkt zweier Kardinalzahlen. Wir könnten „μ · v“ definieren als die Summe der Zahlen von v Mengen, von denen jede μ Elemente hat; aber wir ziehen es vor, μ · v zu definieren als die Zahl der geordneten Paare, die aus einem Element von α gefolgt von einem Element aus β gebildet werden können. Dabei hat a μ und β v Elemente. Auch diese Definition ist so formuliert, daß dabei das multiplikative Axiom nicht vorausgesetzt wird. Auf Grund unserer Definition können wir die gewöhnlichen formalen Gesetze der Multiplikation und des Potenzierens beweisen. Aber eine Sache können wir nicht beweisen: wir können nicht beweisen, daß ein Produkt nur dann gleich Null ist, wenn einer der Faktoren Null ist. Bei endlich vielen Faktoren ist das beweisbar, nicht aber bei unendlich vielen. Mit anderen Worten: wir können nicht beweisen, daß es für eine gegebene Menge von Mengen, von denen keine Null ist, Selektoren geben muß; oder, daß es, wenn eine Menge sich gegenseitig ausschließender Mengen gegeben ist, wenigstens eine Menge geben muß, die aus je einem Element aus jeder der gegebenen Mengen besteht. All das kann nicht bewiesen werden; und obwohl es auf den ersten Blick offenbar richtig zu sein scheint, wird man dennoch bei weiterem Nachdenken zu Zweifeln geführt, die sich Schritt für Schritt verstärken, bis wir uns zuletzt damit zufrieden geben, die Annahme und damit ihre Folgen festzustellen, ebenso wie wir das Parallelenaxiom aufstellen, ohne zu glauben, daß wir seine Gültigkeit oder Ungültigkeit erkennen können. Die Annahme besteht kurz gesagt darin, daß Selektoren und Auswahlen existieren, wenn wir sie erwarten. Es gibt verschiedene gleichbedeutende Arten diese Annahme exakt auszudrücken. Wir können mit der folgenden beginnen: „Bei einer gegebenen Menge sich gegenseitig ausschließender Mengen, von denen keine Null ist, gibt es mindestens eine Menge, die genau ein Element mit jeder der gegebenen Mengen gemeinsam hat.“ Diesen Satz werden wir das „multiplikative Axiom“1) nennen. Zuerst wollen wir verschiedene, gleichwertige Formen dieser Behauptung geben und dann gewisse Gedankengänge betrachten, bei denen 1
) S. Principia Mathematica, Bd. I, Satz 88. Auch Bd. III, Satz 257—258.
138
die Wahrheit oder Falschheit dieser Behauptung für die Mathematik von Interesse ist. Das multiplikative Axiom kommt auf dasselbe hinaus wie die Behauptung, daß ein Produkt nur Null ist, wenn wenigstens einer seiner Faktoren Null ist; d. h. wenn beliebig viele Kardinalzahlen miteinander multipliziert werden, so kann das Resultat nur 0 sein, wenn eine der betreffenden Zahlen 0 ist. Das multiplikative Axiom ist gleichwertig mit dem Satz: wenn R eine Beziehung ist und ϰ irgend eine in dem inversen Bereich von R enthaltene Menge, so gibt es mindestens eine ein-mehrdeutige Beziehung, die R impliziert und ϰ zu ihrem inversen Bereich hat. Das multiplikative Axiom bedeutet endlich dasselbe wie folgende Annahme: Ist α eine Menge und ϰ alle Teilmengen von α mit Ausnahme der Nullmenge, dann gibt es wenigstens einen Selektor aus ϰ. Dies ist die Form, in der das Axiom zum erstenmal der gelehrten Welt durch Zermelo in seinem „Beweis, daß jede Menge wohlgeordnet werden kann“1) mitgeteilt wurde. Zermelo betrachtete das Axiom als eine unzweifelhafte Wahrheit. Man muß zugeben, daß es vor seiner ausdrücklichen Aufstellung von den Mathematikern ohne Beunruhigung angewendet worden ist; aber sie haben es augenscheinlich unbewußt getan. Das Verdienst von Zermelo, es ausdrücklich aufgestellt zu haben, ist ganz unabhängig von der Frage, ob es wahr oder falsch ist. Zermelo hat in dem oben erwähnten Beweis gezeigt, daß das multiplikative Axiom gleichbedeutend ist mit dem Satze, daß jede Menge wohlgeordnet werden kann, d. h. in eine Folge geordnet werden kann, bei der jede Teilmenge ein erstes Element hat (die Nullmenge natürlich ausgeschlossen). Der vollständige Beweis dieses Satzes ist schwierig, aber das allgemeine Prinzip, auf dem er beruht, ist nicht schwer einzusehen. Es bedient sich der Form, die wir „Zermelosches Axiom“ nennen, d. h. es wird angenommen, daß es für eine gegebene
1 ) Mathematische Annalen, Bd. 59, pp. 514—516. Diese Form soll weiterhin als Zermelosches Axiom bezeichnet werden.
139
Menge α mindestens eine ein-mehrdeutige Beziehung R gibt, deren inverser Bereich aus allen vorhandenen Teilmengen von aα besteht, so daß, wenn x die Beziehung R zu ξ hat, x ein Element von ξ ist. Eine derartige Beziehung hebt aus jeder Teilmenge einen „Vertreter“ heraus; es wird natürlich oft vorkommen, daß zwei Teilmengen denselben Vertreter haben. Das Verfahren von Zermelo besteht darin, mit Hilfe von R und der transfiniten Induktion die Elemente von α einzeln auszuzählen. Wir nehmen zuerst den Vertreter von α; er sei x1. Dann kommt der Vertreter der Menge, die aus allen Elementen von aα mit Ausnahme von x1 besteht; er sei x2. Er muß von x1 verschieden sein, weil jeder Vertreter ein Element seiner Menge ist und x1 aus dieser Menge ausgeschlossen ist. Verfahren wir ebenso mit dem Element x2 und sei x3 der Vertreter des Restes. Auf diese Weise erhalten wir zuerst eine Progression x1, x2, … xn, …, wenn wir annehmen, daß α nicht endlich ist. Nehmen wir die ganze Progression weg, so sei xω der Vertreter des Restes von α. So können wir fortfahren, bis nichts mehr übrig bleibt. Die sukzessiven Vertreter werden eine wohlgeordnete Folge bilden, die aus allen Elementen von α besteht. (Wir haben natürlich den Beweis nur in großen Zügen angedeutet.) Dieser Satz heißt das „Zermelosche Theorem“. Das multiplikative Axiom kommt auch auf dasselbe hinaus wie die Annahme, daß von irgend zwei voneinander verschiedenen Kardinalzahlen eine die größere sein muß. Wenn das Axiom falsch wäre, dann würde es Kardinalzahlen μ und v derart geben, daß μ weder kleiner noch gleich noch größer als v ist. Wir haben gesehen, daß möglicherweise א1 und 2א0 ein Beispiel für ein solches Paar bilden. Es gibt noch viele andere Formen des Axioms, aber die obigen sind die wichtigsten von den gegenwärtig bekannten. Über die Wahrheit oder Falschheit des Axioms in irgendeiner Form ist zurzeit nichts bekannt. Die Sätze, die sich auf das Axiom stützen, ohne daß man weiß, daß sie mit ihm gleichwertig sind, sind zahlreich und wichtig. Wählen wir zuerst den Zusammenhang von Addition und Multiplikation. Wir denken natürlich, daß die Summe von v sich, gegenseitig aus-
140
schließenden Mengen, von denen jede μ Elemente hat, μ · v Elemente haben muß. Bei endlichem v kann dies bewiesen werden. Ist jedoch v unendlich, so ist der Beweis nur mit Hilfe des multiplikativen Axioms möglich, ausgenommen, wenn infolge eines besonderen Umstandes die Existenz gewisser Selektoren bewiesen werden kann. Dabei tritt das multiplikative Axiom in folgender Weise auf: Nehmen wir an, wir hätten zwei Mengen von v sich gegenseitig ausschließenden Mengen, von denen jede μ Elemente hat, und wir wollen beweisen, daß die Summe der einen Menge ebensoviel Elemente hat, wie die Summe der anderen Mengen. Zu diesem Zwecke müssen wir eine ein-eindeutige Beziehung angeben. Da es nun in jedem Falle v Mengen sind, gibt es irgend eine ein-eindeutige Beziehung zwischen den beiden Mengen von Mengen; aber wir brauchen eine ein-eindeutige Beziehung zwischen ihren Elementen. Betrachten wir eine ein-eindeutige Beziehung S zwischen den Mengen. Wenn ϰ und λ die beiden Mengen von Mengen sind und α ein Element von ϰ, dann gibt es ein Element β von λ, das dem α hinsichtlich S zugeordnet ist. Nun haben die Mengen α und β je β Elemente und sind daher miteinander äquivalent. Es gibt also ein-eindeutige Zuordnungen zwischen α und β. Das Schlimme ist, daß es so viele gibt. Um eine ein-eindeutige Zuordnung der Summe von ϰ zur Summe von λ zu erhalten, haben wir e i n e A u s w a h l aus einer Menge von Mengen von Korrelatoren zu treffen, wobei eine Menge aus dieser Menge aus allen ein-eindeutigen Korrelatoren von α mit β besteht. Sind ϰ und λ unendlich, so können wir im allgemeinen nicht wissen, ob eine solche Auswahl möglich ist, es sei denn, wir wissen, daß das multiplikative Axiom wahr ist. Daher können wir die übliche Verknüpfung zwischen Addition und Multiplikation nicht herstellen. Diese Tatsache hat merkwürdige Folgen. Wir wissen zunächst, daß א02 = א0 + א0 = א0 ist. Daraus wird gewöhnlich geschlossen, daß die Summe von א0 Mengen, von denen jede א0 Elemente hat, selbst א0 Elemente haben muß, aber dies ist ein Trugschluß, weil wir nicht wissen, ob die Zahl der Elemente in einer solchen Summe א0 · א0 und folglich א0 ist. Dies ist von Bedeutung für die Theorie der transfiniten
141
Ordinalzahlen. Es ist leicht zu beweisen, daß eine Ordinalzahl, die א0 Vorgänger hat, zu der von Cantor so genannten „zweiten Klasse“ gehören muß. Eine Folge mit dieser Ordinalzahl hat in ihrem Feld א0 Elemente. Ebenso sieht man leicht, daß, wenn wir irgend eine Progression von Ordinalzahlen der zweiten Klasse haben, die Vorgänger ihres Limes höchstens eine Summe von א0 Mengen mit א0 Elementen bilden. Daraus wird geschlossen – irrtümlicherweise, falls das multiplikative Axiom nicht wahr ist –, daß es א0 Vorgänger des Limes gibt und daher der Limes zu den Zahlen der „zweiten Klasse“ gehört. Mit anderen Worten: man nimmt an, es sei bewiesen, daß irgend eine Progression von Ordinalzahlen der zweiten Klasse einen Limes hat, der wiederum eine Ordinalzahl der zweiten Klasse ist. Dieser Satz mit seinem Korollar, das ω₁ (die kleinste Ordinalzahl der dritten Klasse) nicht der Limes irgend einer Progression ist, liegt fast der ganzen anerkannten Theorie «der Ordinalzahlen der zweiten Klasse zugrunde. Wegen der Art und Weise, in der das multiplikative Axiom dabei eingeht, kann der Satz und sein Korollar nicht als bewiesen angesehen werden. Sie können wahr sein oder nicht. Gegenwärtig kann man nur behaupten, daß wir es nicht wissen. Somit muß der größere Teil der Theorie der Ordinalzahlen der zweiten Klasse als unbewiesen betrachtet werden. Eine andere Erläuterung möge dazu beitragen, diesen Punkt klarer zu machen. Wir wissen, daß zweimal א0 = א0 ist. Deshalb vermuten wir, daß die Summe von א0 Paaren א0 Elemente haben muß. Dies kann zwar manchmal bewiesen werden, ein allgemein gültiger Beweis ist aber nur unter Annahme des multiplikativen Axioms möglich. Dies zeigt die Geschichte von dem Millionär, der stets ein Paare Strümpfe kaufte, wenn er ein Paar Schuhe kaufte und niemals sonst. Er hatte eine solche Leidenschaft für beides, daß er schließlich א0 Paar Schuhe und א0 Paar Strümpfe besaß. Das Problem ist: Wieviel Schuhe und wieviel Strümpfe hatte er schließlich? Man würde natürlich annehmen, daß er zweimal so viel Schuhe und zweimal so viel Strümpfe besaß als Paare von jedem, und daß er daher א0 von jedem hatte, weil diese Zahl durch Verdoppelung nicht vermehrt wird. Aber dies
142
bietet ein Beispiel der schon bemerkten Schwierigkeit, die Summe von v Mengen mit μ Elementen mit dem Produkt μ · v zu verknüpfen. Manchmal kann man dies tun, manchmal nicht. In unserem Falle kann es für die Schuhe durchgeführt werden, nicht aber für die Strümpfe, es sei denn mit Hilfe eines sehr künstlichen Tricks. Der Grund für den Unterschied besteht in folgendem: Bei Schuhen können wir zwischen rechts und links unterscheiden und daher eine Auswahl eines Schuhs aus jedem Paar vornehmen, wir können nämlich alle rechten oder alle linken Schuhe auswählen; aber bei den Strümpfen bietet sich von selbst kein solches Auswahlprinzip dar. Ohne die Annahme des multiplikativen Axioms sind wir nicht sicher, daß es eine Menge gibt, die aus einem Strumpf von jedem Paare besteht. Daher das Problem. Wir können die Sache anders wenden. Um zu beweisen, daß eine Menge א0 Elemente hat, ist es notwendig und hinreichend, eine Methode zu finden, ihre Elemente in eine Progression anzuordnen. Bei den Schuhen besteht dabei keine Schwierigkeit. Die P a a r e bilden eine Menge von der Zahl א0und daher das Feld einer Progression. In jedem Paar nehme man zuerst den linken Schuh und dann den rechten Schuh und lasse die Ordnung der Paare unverändert. Auf diese Weise erhalten wir eine Progression aller Schuhe. Aber bei den Strümpfen müssen wir willkürlich bei jedem Paar einen ersten Strumpf aussuchen; aber eine unendliche Zahl von willkürlichen Wahlakten ist eine Unmöglichkeit. So lange wir keine R e g e l für die Auswahl aufstellen können, d. h. eine Beziehung, die ein Selektor ist, wissen wir nicht einmal, ob eine Auswahl selbst theoretisch möglich ist. Wenn es sich um Objekte im Raume handelt, wie Strümpfe, können wir natürlich immer irgend ein Auswahlprinzip aufstellen. Nehmen wir z. B. die Schwerpunkte der Strümpfe: es gibt Punkte p im Raume, so daß bei jedem Paar die Schwerpunkte der beiden Strümpfe nicht genau den gleichen Abstand von p haben; somit können wir bei jedem Paar den Strumpf auswählen, dessen Schwerpunkt näher an p gelegen ist. Aber es gibt keinen theoretischen Grund, daß eine Auswahlmethode von dieser Art immer möglich sein muß. Der Fall der Strümpfe kann bei
143
einigermaßen gutem Willen des Lesers als Beispiel dafür dienen, wie eine Auswahl unmöglich sein kann. Man beachte, daß, w e n n es möglich w ä r e , aus jedem Paar einen Strumpf auszuwählen, so würde daraus folgen, daß die Strümpfe nicht in eine Progression angeordnet werden k ö n n e n ; wir hätten daher nicht א0 Strümpfe. Dieser Fall zeigt, wie eine Menge mit einer unendlichen Zahl μ von Paaren eine andere Zahl von Gliedern haben kann wie eine andere Menge von μ Paaren; denn sind א0 Paar Schuhe gegeben, so hat man sicher א0 Schuhe, aber bei den Strümpfen sind wir dessen nicht sicher, es sei denn daß wir das multiplikate Axiom annehmen, oder uns wie oben, irgend einer zufälligen geometrischen Auswahlmethode bedienen. Ein anderes wichtiges Problem, das mit dem multiplikativen Axiom zusammenhängt, ist die Beziehung der Reflexivität zur Nichtinduktivität. Wir erinnern daran, daß wir im achten Kapitel ausführten, daß eine reflexive Zahl nicht induktiv sein muß, daß aber das Umgekehrte (so viel man heute weiß) nur mit Hilfe des multiplikativen Axioms bewiesen werden kann. Das kommt folgendermaßen zustande: Es ist leicht zu beweisen, daß eine reflexive Menge Teilmengen mit א0 Elementen enthält. (Die Menge kann natürlich selbst א0 Elemente besitzen). Somit haben wir zu beweisen (falls es uns gelingt), daß man aus den Elementen einer gegebenen, nichtinduktiven Menge eine Progression auswählen kann. Nun zeigt man ohne Schwierigkeit, daß eine nichtinduktive Menge mehr Elemente haben muß als irgend eine induktive oder, was auf dasselbe hinauskommt, daß, wenn α eine nichtinduktive Menge und v irgend eine induktive Zahl ist, es Teilmengen von α mit v Elementen gibt. Somit können wir eine Folge von endlichen Teilmengen von α bilden: zuerst eine Menge ohne Elemente, dann Mengen mit einem Element (so viele als es Elemente von α gibt), ferner Mengen mit zwei Elementen usf. Auf diese Weise bekommen wir eine Progression von Zusammenfassungen von Teilmengen. Jede Zusammenfassung besteht aus allen denjenigen Teilmengen, die eine gewisse gegebene endliche Zahl von Elementen haben. Bis jetzt haben wir das multiplikative Axiom noch
144
nicht gebraucht. Aber wir haben auch nur bewiesen, daß die Zahl der Zusammenfassungen der Teilmengen von α eine reflexive Zahl ist. Wenn also μ die Zahl der Elemente von α ist, so daß 2μ die Zahl der Teilmengen von α und 2₂μ die Zahl, der Zusammenfassungen der Teilmengen ist, dann ist, wenn μ, nichtinduktiv ist, 2₂μ reflexiv. Aber das ist nicht annähernd das, was wir beweisen wollten. Um über diesen Punkt hinwegzukommen, müssen wir das multiplikative Axiom anwenden. Aus jeder Menge von Teilmengen wollen wir eine auswählen, indem wir die Teilmenge übergehen, die allein aus der Nullmenge besteht. Wir suchen also eine Teilmenge aus, die ein Element hat, sagen wir α₁; eine mit zwei Elementen, sagen wir α₂; eine mit drei, α₃; usw. (Wir können dies machen, wenn das multiplikative Axiom vorausgesetzt wird; sonst wissen wir nicht, ob wir dies immer ausführen können.) Wir haben nun eine Progression α₁, α₂, α₃, … von Teilmengen von α an Stelle einer Progression von Zusammenfassungen von Teilmengen; somit sind wir unserem Ziele einen Schritt näher gekommen. Wir wissen nun, daß unter Annahme des multiplikativen Axioms, 2μ eine reflexive Zahl sein muß, wenn μ eine nichtinduktive Zahl ist. Ferner müssen wir folgendes bemerken: Obwohl wir nicht sicher sind, daß neue Elemente von α bei irgend einem bestimmten Gliede in der Progression α₁, α₂, α₃, … auftreten, müssen sicherlich neue Elemente fortwährend von Zeit zu Zeit hinzukommen. Erläutern wir dies. Die Menge α₁, die aus einem Element besteht, ist ein Anfang; das eine Element sei x₁. Die Menge α2, die aus zwei Elementen besteht, kann x₁ enthalten oder nicht; enthält sie x₁ so führt sie ein neues Element ein; wenn nicht, so muß sie zwei neue Elemente, sagen wir x2 und x3 einführen. Dann ist es möglich, daß α₃ aus x1, x2, x3 besteht und somit keine neuen Elemente hinzukommen, dann wird aber durch α4 ein neues Element hineingebracht. Die ersten v Mengen α₁, α₂, α₃, … αv enthalten allerhöchstens 1 + 2 + 3 + … + v Elemente, d. h. v (v + 1)/2 Elemente; somit wäre es möglich, wenn es in den ersten v Mengen keine Wiederholungen gäbe, nur mit Wiederholungen von der v + 1-ten zur v (v + 1)/2-ten Menge wei-
145
terzugehen. Aber hernach würden die alten Elemente nicht mehr zahlreich genug sein, um die nächste Menge mit der richtigen Zahl von Elementen, d. h. v (v + 1)/2 + 1 zu bilden, daher müssen spätestens an diesem Punkt, wenn nicht schon früher, neue Elemente auftreten. Wenn wir demnach aus unserer Progression α, α, α, … all die Mengen fortlassen, die ganz aus Elementen bestehen, die in vorhergehenden Mengen auftraten, so müssen wir noch immer eine Progression haben. Die neue Progression heiße β, β, β, … (es wird α = β und α= β sein, weil α und α neue Elemente einführen m ü s s e n . Es kann α = β sein oder nicht, aber, allgemein gesprochen, wird βμ = αv sein, wo v eine Zahl ist, die größer als μ ist, d. h. die β’s sind e i n i g e der α’s). Nun sind die β’s so beschaffen, daß irgend eines von ihnen, z. B. βμ, Elemente enthält, die nicht in irgend einem früheren β vorkommen. Sei γμ der Teil von βμ der aus neuen Elementen besteht. Wir erhalten auf diesem Wege eine neue Progression γ, γ, γ, … (Wieder ist γ identisch mit β und mit α; enthält α nicht das eine Element von αdann ist γ = β = α, enthält aber α dies eine Element, so besteht γ aus dem anderen Element von α). Diese neue Progression der γ’s besteht aus sich gegenseitig ausschließenden Mengen. Daher wird eine Auswahl aus ihnen eine Progression sein, d. h. wenn x das Element von γ, x, ein Element von γ, x ein Element von γ usw. ist, dann ist x x, x, … eine Progression und eine Teilmenge von α. Unter der Voraussetzung des multiplikativen Axioms ist eine solche Auswahl möglich. Indem wir so das Axiom zweimal anwenden, können wir beweisen, daß, wenn das Axiom wahr ist, jede nicht-induktive Kardinalzahl reflexiv sein muß. Man könnte dies auch aus dem Zermeloschen Theorem ableiten, das besagt, daß, wenn das Axiom wahr ist, jede Menge wohlgeordnet werden kann; denn eine wohlgeordnete Folge muß entweder eine endliche oder reflexive Zahl von Elementen in ihrem Felde haben. Ein Vorteil der obigen direkten Beweisführung gegenüber der Ableitung aus dem Zermeloschen Theorem liegt darin, daß sie nicht die allgemeine Richtigkeit des multiplikativen Axioms voraussetzt, sondern nur seine Richtigkeit für eine Menge von א0 Mengen. Es ist
146
möglich, daß das Axiom für א0Mengen zutrifft, aber nicht für eine größere Zahl von Mengen. Aus diesem Grunde ist es besser, sich, wenn möglich, mit der beschränkteren Annahme zu begnügen. Die Voraussetzung, die bei der obigen direkten Beweisführung gemacht worden ist, lautet: Ein Produkt von א0 Faktoren ist nur Null, wenn einer der Faktoren Null ist. Wir können diese Annahme in der Form aussprechen: „א0 ist eine M u l t i p l i k a t i o n s z a h l . “ Dabei ist eine Zahl v definitionsgemäß eine „Multiplikationszahl“, wenn ein Produkt von v Faktoren nur Null ist, falls einer der Faktoren Null ist. Man kann beweisen, daß eine endliche Zahl stets eine Multiplikationszahl ist, aber wir können dies nicht für eine unendliche Zahl beweisen. Das multiplikative Axiom ist gleichwertig mit der Behauptung, daß a l l e Kardinalzahlen Multiplikationszahlen sind. Aber um die reflexiven mit den nichtinduktiven Zahlen zu identifizieren, oder um das Problem der Schuhe und Strümpfe zu behandeln, oder um zu zeigen, daß irgend eine Progression von Zahlen der zweiten Klasse selbst zur zweiten Klasse gehört, brauchen wir nur die weniger weit gehende Annahme, daß א0 eine Multiplikationszahl ist. Es ist nicht unwahrscheinlich, daß die in diesem Kapitel diskutierten Gegenstände noch zu vielen Entdeckungen führen werden. Es könnten Fälle gefunden werden, wo Sätze, die das multiplikative Axiom zu enthalten scheinen, ohne dessen Hilfe bewiesen werden können. Es ist denkbar, daß das multiplikative Axiom in seiner allgemeinen Form sich als unrichtig herausstellt. Für diesen Standpunkt erweist sich das Zermelosche Theorem als die beste Handhabe: es könnte dargetan werden, daß das Kontinuum oder eine noch dichtere Menge nicht wohlgeordnet werden kann, was infolge des Zermeloschen Theorems die Unrichtigkeit des multiplikativen Axioms beweisen würde. Aber bis jetzt wurde keine Methode ausfindig gemacht, solche Resultate zu erzielen, und die ganze Sache bleibt in Dunkel gehüllt.
13. Das Axiom der Unendlichkeit und die logischen Typen Das Axiom der Unendlichkeit ist eine Annahme, die wie folgt ausgesprochen werden kann. „Wenn n irgend eine induktive Kardinalzahl ist, so gibt es mindestens eine Menge von Individuen mit n Elementen.“ Wenn dies gilt, so müssen selbstverständlich viele Mengen von Individuen mit n Elementen existieren und die Gesamtzahl der Individuen in der Welt ist keine induktive Zahl. Denn auf Grund des Axioms gibt es mindestens eine Menge mit n + 1 Elementen. Daraus folgt, daß es viele Mengen von n Elementen gibt, und daß n nicht die Zahl der Individuen in der Welt ist. Da n irgend eine induktive Zahl ist, so folgt daraus (wenn unser Axiom richtig ist), daß die Zahl der Individuen in der Welt jede induktive Zahl übersteigen muß. Mit Rücksicht auf die im vorigen Kapitel erörterte mögliche Existenz von Kardinalzahlen, die weder induktiv noch reflexiv sind, können wir aus unserem Axiom nicht schließen, daß es mindestens א0 Individuen gibt, so lange wir das multiplikative Axiom nicht annehmen. Aber wir wissen, daß es mindestens א0 Mengen von Mengen gibt. Denn die induktiven Kardinalzahlen sind Mengen von Mengen und bilden, wenn unser Axiom richtig ist, eine Progression. Die Art und Weise, wie man dazu kommt, dieses Axiom zu fordern, möge durch folgende Überlegung erläutert werden. Eine der Annahmen Peanos ist, daß keine zwei induktiven Kardinalzahlen denselben Nachfolger besitzen. m + 1 = n+ 1 soll also nicht gelten, ausgenommen m = n, wenn m und n induktive Kardinalzahlen sind. Im achten Kapitel hatten wir Gelegenheit, eine im wesentlichen damit identische Annahme zu benützen. Sie lautet:
148
wenn n eine induktive Kardinalzahl ist, so ist n nicht gleich n + 1. Man könnte denken, daß sich dies beweisen lasse. Beweisen kann man nur: Wenn α eine induktive Menge ist und n die Zahl ihrer Elemente, so ist n nicht n + 1. Dieser Satz ist leicht durch Induktion zu beweisen. Man könnte glauben, daß daraus der andere folge. Aber tatsächlich ist dies nicht der Fall, denn die Menge a braucht ja nicht zu existieren. Man kann nur schließen: Wenn n eine induktive Kardinalzahl ist, derart, daß es mindestens eine Menge mit n Elementen gibt, so ist n nicht gleich n + 1. Das Axiom der Unendlichkeit versichert uns (zu Recht oder Unrecht), daß es Mengen mit n Elementen gibt. Dies erlaubt uns zu behaupten, daß n nicht gleich n +1 ist. Aber ohne dieses Axiom ständen wir vor der Möglichkeit, daß sowohl n wie n + 1 die Nullmenge sind. Wir wollen diese Möglichkeit durch ein Beispiel erläutern. Angenommen es gäbe genau neun Individuen auf der Welt. (Bei der Frage, was das Wort „Individuum“ bedeutet, muß ich den Leser noch um Geduld bitten.) Die induktiven Kardinalzahlen von 0 bis 9 hätten dann die erwarteten Eigenschaften, aber 10 (also 9 + 1 definiert) wäre die Nullmenge. Man erinnere sich, daß n + 1 wie folgt definiert werden kann: n + 1 ist die Menge all der Mengen, welche ein Element x besitzen, derart, daß wenn wir x wegnehmen, eine Menge von n Elementen übrig bleibt. Wenden wir diese Definition an, so sehen wir, daß im angenommenen Fall 9 + 1 eine Menge ist, welche keine Mengen enthält, d. h. sie ist die Nullmenge. Das Gleiche gilt für 9 + 2 oder allgemein für 9 + n, ausgenommen n ist 0. Also werden 10 und alle folgenden induktiven Kardinalzahlen miteinander identisch sein. Denn sie sind alle die Nullmenge. In diesem Fall würden die induktiven Kardinalzahlen keine Progression bilden und der Satz, daß keine zwei denselben Nachfolger haben, wäre nicht richtig. Denn sowohl auf 9 wie 10 folgt die Nullmenge und 10 ist selbst die Nullmenge. Um solche arithmetische Katastrophen zu verhüten, brauchen wir das Unendlichkeitsaxiom. So lange wir uns auf die Arithmetik der endlichen ganzen Zahlen beschränken und weder unendliche ganze Zahlen noch unendliche
149
Mengen noch unendliche Folgen von endlichen ganzen Zahlen oder Brüchen einführen, können wir alle erwünschten Resultate auch ohne das Unendlichkeitsaxiom ableiten. D. h. wir können uns mit der Addition, Multiplikation und dem Potenzieren von endlichen ganzen Zahlen und Brüchen beschäftigen, nicht aber mit unendlichen ganzen Zahlen oder Irrationalzahlen. Die Theorie der transfiniten und der reellen Zahlen bleibt uns also verschlossen. Wir wollen jetzt erklären, wie diese verschiedenen Resultate zustande kommen. Angenommen die Zahl der Individuen in der Welt sei n, so ist die Zahl der Mengen von Individuen 2ⁿ. Dies gilt infolge des allgemeinen Satzes, der im achten Kapitel erwähnt ist, wonach die Zahl der Mengen, die in einer Menge mit n Elementen enthalten sind, 2ⁿ ist. Nun ist 2ⁿ immer größer als n, also ist die Zahl der Mengen in der Welt größer als die Zahl der Individuen. Wenn wir also wie oben annehmen, die Zahl der Individuen sei 9, so ist die Zahl der Mengen 29, d. h. 512. Wenn wir also unsere Zahlen nicht zum Rechnen mit Individuen, sondern zum Rechnen mit Mengen verwenden, so würde unsere Arithmetik in Ordnung sein, bis wir die Zahl 512 erreichen: die erste Zahl, die wieder 0 wird, ist 513. Gehen wir jetzt zu Mengen von Mengen über, so geht es uns noch besser. Ihre Zahl ist 2512 und dies ist so groß, daß jede Einbildungkraft versagt, denn diese Zahl hat ungefähr 153 Stellen. Bei den Mengen von Mengen bekommen wir eine Zahl, die durch 2 hoch einen Exponenten dargestellt wird, der ungefähr 153 Stellen hat. Die Zahl der Stellen ist ungefähr dreimal so groß wie 10152. In der Zeit der Papierknappheit ist es nicht wünschenswert, eine solche Zahl hinzuschreiben. Wollen wir noch größere Zahlen, so können wir dies durch ein weiteres Vorwärtsdringen in der logischen Hierarchie erreichen. Auf diese Weise können wir, wenn wir genügend weit gehen, jeder beliebig vorgeschriebenen induktiven Kardinalzahl einen Platz unter den von Null verschiedenen Zahlen anweisen. Wir brauchen hiezu nur weit genug in der Hierarchie fortzufahren1).
1 ) Man vergleiche Principia Mathematica, Bd. II, Satz 120 ff. Wegen des Problems bei den Brüchen ebenda Bd. III, Satz 303 ff.
150
Mit den Brüchen verhält es sich ganz ähnlich. Wenn der Bruch die er warteten Eigenschaften haben soll, so muß es genügend viele Objekte von jeder Art, die gezählt werden sollen, geben, um uns davor zu sichern, daß nicht plötzlich die Nullmenge uns in den Weg tritt. Davor können wir uns ohne das Unendlichkeitsaxiom bei jedem gegebenen Bruch schützen, indem wir in unserer Hierarchie weit genug vorwärts gehen. Gelingt es uns nicht durch das Abzählen von Individuen, so können wir versuchen, Mengen von Individuen abzuzählen. Gelingt auch dies noch nicht, so können wir es mit Mengen von Mengen versuchen usw. Selbst wenn es noch so wenig Indivi-, duen in der Welt gibt, so werden wir immer eine Stufe erreichen, wo es viel mehr als μ Objekte gibt, gleichgültig, welche induktive Zahl μ sein mag. Dies gilt, selbst wenn es überhaupt keine Individuen gäbe. Denn dann gäbe es wenigstens eine Menge, nämlich die Nullmenge, zwei Mengen von Mengen (nämlich die Nullmenge der Mengen und die Menge, deren einziges Element die Nullmenge der Individuen ist), vier Mengen von Mengen von Mengen, 16 beim nächsten Schritt, dann 65536 usw. Wenn wir also irgend einen beliebigen Bruch oder irgend eine beliebige induktive Kardinalzahl erreichen wollen, so brauchen wir hierzu das Unendlichkeitsaxiom nicht. Wenn wir aber die ganze Menge oder Folge der induktiven Kardinalzahlen oder der Brüche behandeln wollen, so brauchen wir das Axiom. Um die Existenz von א₀ zu beweisen, brauchen wir die ganze Menge der induktiven Kardinalzahlen, für die Existenz von Progressionen die ganze geordnete Folge. Das gelingt durch Konstruktion einer einzigen Folge oder Menge, für die keine induktive Kardinalzahl 0 ist. Wir brauchen die ganze Folge der nach der Größe geordneten Brüche, um die reellen Zahlen als Segmente zu definieren. Diese Definition gibt nur dann die gewünschten Resultate, wenn die Folge der Brüche dicht ist und dies ist unmöglich, wenn in dem betreffenden Stadium die Gesamtzahl der Brüche endlich ist. Die Annahme, daß man das Unendlichkeitsaxiom durch Konstruktionen von der Art der eben betrachteten b e w e i s e n könne, liegt nahe. Ich habe dies früher selbst geglaubt. Man könnte sagen:
151
nehmen wir an, die Zahl der Individuen sei n, wo n auch 0 sein kann, ohne daß dadurch unser Beweis hinfällig würde. Bilden wir jetzt die Gesamtheit der Individuen, Mengen, Mengen von Mengen usw., so ist die Zahl der Elemente unserer ganzen Reihe: n + 2n+22ⁿ … ad infinitum und das ist א₀. Nehmen wir also alle Arten von Objekten zusammen und beschränken wir uns nicht auf Objekte von einem Typus, so bekommen wir bestimmt eine unendliche Menge und brauchen daher das Unendlichkeitsaxiom gar nicht. So könnte man sagen. Bevor wir auf dieses Argument eingehen, ist das erste, worauf wir zu achten haben, daß darin eine Art Hokuspokus vorkommt: irgend etwas erinnert an den Zauberer, der Dinge aus dem Hut herausholt. Der Mann, der ihm den Hut geliehen hat, weiß ganz bestimmt, daß zuvor kein lebendes Kaninchen darin war, aber er ist in Verlegenheit, wenn er sagen soll, wie das Kaninchen hineingekommen ist. So ist der Leser, wenn er einen robusten Wirklichkeitssinn hat, gefühlsmäßig überzeugt, daß es unmöglich ist, aus einer endlichen Menge von Individuen eine unendliche Menge herauszuquetschen. Trotzdem kann er vielleicht nicht sagen, wo der Fehler in der obigen Konstruktion liegt. Man darf zwar auf solche Gefühle nicht allzuviel geben. Wie andere Gefühle können sie uns leicht irreführen, aber sie geben eine erste Anregung, jede Argumentation sehr genau zu betrachten, die solche Gefühle hervorruft. Wenn man die obige Argumentation genauer untersucht, so wird man meines Er-achtens finden, daß sie falsch ist, obwohl der Fehler sehr subtil ist und es keineswegs leicht ist, ihn immer konsequent zu vermeiden. Den dabei vorkommenden Irrtum kann man die „Verwechslung von Typen“ nennen. Um das Problem der „Typen“ vollständig auseinanderzusetzen, würde man ein ganzes Buch brauchen. In diesem Buch sollen aber entsprechend seinem Zweck diejenigen Probleme nicht behandelt werden, die noch dunkel und strittig sind. Wir wollen vielmehr zum Vorteil des Anfängers nur diejenigen Teile darstellen, die als mathematisch gesicherte Wahrheiten betrachtet werden können. Nun gehört die Theorie der Typen keineswegs zu
152
den abgeschlossenen und gesicherten Teilen unseres Gegenstandes. Ein großer Teil der Theorie ist noch heute chaotisch, verworren und dunkel. Aber die Notwendigkeit i r g e n d e i n e r Typenlehre ist weniger zweifelhaft als die genaue Form, die sie anzunehmen hat. Im Zusammenhang mit dem Unendlichkeitsaxiom sieht man die Notwendigkeit einer solchen Theorie besonders leicht ein. Diese Notwendigkeit ergibt sich z. B. aus dem „Widerspruch der größten Kardinalzahl“. Wir sahen im achten Kapitel, daß die Zahl der Mengen, die in einer gegebenen Menge enthalten sind, stets größer ist als die Zahl der Elemente dieser Menge selbst. Hieraus schlössen wir, daß es keine größte Kardinalzahl gibt. Aber wenn wir, wie eben vorgeschlagen, die Individuen, die Mengen von Individuen, die Mengen von Mengen von Individuen usw. zusammenwerfen, so bekommen wir eine Menge, die ihre eigenen Teilmengen als Elemente enthält. Die Menge aller zählbaren Objekte, gleichgültig welcher Art, muß, wenn sie existiert, die größtmögliche Kardinalzahl besitzen. Da alle ihre Teilmengen Elemente von ihr sind, so kann es nicht mehr Teilmengen als Elemente geben. Hier kommen wir also auf einen Widerspruch. Als ich im Jahre 1901 zum erstenmal auf diesen Widerspruch stieß, versuchte ich irgend einen Fehler in Cantors Beweis zu entdecken, wonach es keine größte Kardinalzahl gibt. Er ist im achten Kapitel wiedergegeben. Als ich diesen Beweis auf die angenommene Menge aller denkbaren Objekte anwandte, kam ich auf folgenden neuen und einfacheren Widerspruch. Die betrachtete Menge, die alles umfassen soll, muß sich selbst als Element enthalten. Mit anderen Worten: wenn es so etwas wie „alles“ gibt, so ist „alles“ etwas Bestimmtes und ist ein Element der Menge „alles“. Aber normalerweise ist eine Menge nicht ein Element ihrer selbst. Die Menschheit z. B. ist kein Mensch. Bilden wir die Vereinigung aller Mengen, die nicht Elemente ihrer selbst sind, so ist dies eine Menge. Ist sie nun ein Element ihrer selbst oder nicht? Gilt dies, so ist sie eine der Mengen, die nicht Elemente ihrer selbst sind, d. h. sie ist nicht ein Element ihrer selbst. Ist sie es nicht, so ist sie nicht eine der Mengen, die nicht Elemente ihrer selbst sind, d. h.
153
sie ist ein Element ihrer selbst. Also enthält sowohl die Hypothese, daß sie ein Element ihrer selbst ist, wie daß sie es nicht ist, ihr Gegenteil. Dies ist ein Widerspruch. Ähnliche Widersprüche kann man ohne weiteres je nach Wunsch aufstellen. Die Auflösung dieser Widersprüche mit Hilfe der Typenlehre ist vollständig in den Principia Mathematica auseinandergesetzt¹). Etwas kürzer in Artikeln des Verfassers im „American Journal of Mathematics“2) und in der „Revue de Metaphysique et Morale“3). Für den Augenblick muß ein Umriß der Lösung genügen. Der Fehler besteht in der Bildung dessen, was man eine unreine Menge nennen kann, d. h. einer Menge, die in bezug auf ihren „Typus“ nicht rein ist. Wie wir in einem späteren Kapitel sehen werden, sind die Mengen logische Fiktionen. Eine Behauptung, die sich scheinbar auf eine Menge bezieht, hat nur dann einen Sinn,’wenn man sie in eine Form bringen kann, in der die Menge nicht mehr vorkommt. Dies begrenzt die Art und Weise, in der nominelle, aber nicht reelle Bezeichnungen für Mengen sinnvoll vorkommen können: Ein Satz oder eine Reihe von Symbolen, in denen solche Pseudonamen in unrichtiger Weise vorkommen, ist nicht falsch, sondern einfach sinnlos. Genau so sinnlos ist die Annahme, eine Menge sei ein Element ihrer selbst oder sie sei es nicht. Allgemeiner ist die Annahme, eine Menge von Individuen sei ein Element einer anderen Menge von Individuen oder sie sei es nicht, unsinnig. Indem man symbolisch eine Menge aufbaut, deren Elemente nicht alle denselben Grad in der logischen Hierarchie besitzen, verwendet man die Symbole derart, daß sie überhaupt nichts mehr symbolisieren. Wenn es also n Individuen auf der Welt gibt und 2ⁿ Mengen von Individuen, so können wir keine neue Menge bilden, die sowohl aus den Individuen wie den Mengen besteht und n + 2ⁿ Elemente besitzt.
¹) Bd. I, Einführung Kap. 2, Satz 12 und 20; Bd. II Vorwort. 2 ) Begründung der mathematischen Logik durch die Theorie der Typen, Bd. 30, 1908, S. 222—262. 3 ) Die Paradoxien der Logik 1906, S. 627—650.
154
So bricht unser Versuch der Notwendigkeit des Unendlichkeitsaxioms zu entgehen, zusammen. Ich behaupte nicht, damit die Lehre von den Typen erläutert oder mehr als eine rohe Andeutung gegeben zu haben, warum ein solcher Satz für uns notwendig ist. Ich wollte nur so viel sagen, wie notwendig war, um zu zeigen, daß wir die Existenz von unendlichen Zahlen und Mengen durch die obigen Zauberermethoden nicht b e w e i s e n können. Immerhin existieren noch gewisse andere, mögliche Methoden, die wir betrachten müssen. In den „Principles of Mathematics“ sind im § 339 (S. 357) eine Reihe von Argumenten aufgeführt, die angeblich die Existenz von unendlichen Mengen beweisen. Insofern als dabei angenommen wird, daß n nicht gleich n + 1 ist, wenn n eine induktive Kardinalzahl ist, sind sie bereits untersucht. In Platos Parmenides wird argumentiert: Wenn eine solche Zahl wie 1 existiert, so hat 1 eine Existenz, aber 1 ist nicht mit der Existenz identisch, daher sind 1 und die Existenz zusammen 2. Es gibt also eine Zahl 2. Die Zahl 2 zusammen mit der Zahl 1 und der Existenz gibt eine Menge von 3 Elementen usw. Dieser Schluß ist falsch. Zunächst, weil die „Existenz“ kein Ausdruck ist, der eine bestimmte Bedeutung besitzt. Dann, und dies ist wichtiger, wenn man eine bestimmte Bedeutung dafür erfinden würde, so würde man sehen, daß die Zahlen keine Existenz haben. Denn sie sind tatsächlich sog. „logische Fiktionen“. Wir werden dies sehen, wenn wir zur Definition der Mengen kommen. Der Schluß,daß die Zahl der Zahlen von 0 bis n (beide eingeschlossen) n + 1 ist, gründet sich auf die Annahme, daß bis zu n (n eingeschlossen) keine Zahl ihrem Nachfolger gleich ist. Das ist aber, wie wir gesehen haben, nicht immer richtig, wenn das Unendlichkeitsaxiom falsch ist. Man muß sich klar machen, daß die Gleichung n = n + 1 , die für ein endliches n richtig sein kann, wenn n die Gesamtzahl der Individuen in der Welt überschreitet, etwas total anderes ist wie dieselbe Gleichung, angewandt auf eine reflexive Zahl. Für eine reflexive Zahl bedeutet sie: Gegeben sei eine Menge von n Elementen, so ist diese Menge derjenigen „äquivalent“, die entsteht, wenn man ein anderes neues Element hinzufügt. Wendet man sie aber auf eine
155
Zahl an, die für die wirkliche Welt zu groß ist, so bedeutet sie nur, daß es keine Menge von n Individuen und auch keine Menge von n + 1 Individuen gibt. Sie bedeutet nicht: wenn wir die Hierarchie der Typen weit genug emporsteigen, so daß die Existenz einer Menge von n Elementen gesichert ist, so werden wir finden, daß diese Menge einer andern Menge mit n + 1 Elementen „äquivalent“ ist. Denn für ein induktives n ist dies nicht der Fall, ganz unabhängig von der Wahrheit oder Falschheit des Unendlichkeitsaxioms. Bei Bolzano1) und Dedekind2) findet sich ein Schluß, der die Existenz von reflexiven Mengen beweisen soll. In Kürze besteht er in folgendem: ein Objekt ist nicht identisch mit dem Begriff eines Objekts, vielmehr gibt es (zum mindesten im Reich der Existenz) zu jedem Objekt einen Begriff. Die Beziehung eines Objekts zu seinem Begriff ist ein-eindeutig, aber die Begriffe bilden nur einen Teil der Objekte. Also bildet die Beziehung „Begriff von“ die ganze Menge der Objekte auf ein Teil ihrer selbst, nämlich auf den aus Begriffen bestehenden Teil ab. Also ist sowohl die Menge der Objekte wie die der Begriffe unendlich. Dieser Schluß ist nicht bloß an sich interessant, sondern auch, weil die darin vorkommenden Fehler (oder das, was ich als solche betrachte) instruktiv sind. Der Hauptfehler besteht in der Annahme, daß es zu jedem Objekt einen Begriff gebe. Natürlich ist es furchtbar schwer, zu entscheiden, was unter einem „Begriff “ zu verstehen ist. Nehmen wir an, wir wüßten es. Beginnen wir also z. B. mit Sokrates, so müssen wir annehmen, es gäbe einen Begriff von Sokrates usw. Nun ist es deutlich, daß all diese Begriffe keine tatsächliche Existenz im gewöhnlichen Sinn besitzen. Nach dem dritten oder vierten Schritt werden sie mythisch. Wenn das Argument aufrecht erhalten werden soll, so müssen die gewünschten „Begriffe“ platonische Ideen sein, die irgendwo im Himmel liegen. Auf der Erde sind sie sicher nicht. Aber dann wird es sofort zweifelhaft, ob es solche Begriffe gibt. Wenn wir um ihre Existenz wissen sollen, so
1
) Bolzano, Paradoxien des Unendlichen, S. 13. ) Dedekind, Was sind und was sollen die Zahlen? Nr. 66.
2
156
muß dies in irgend einer logischen Theorie begründet sein, die die Notwendigkeit beweist, daß es zu jedem Ding einen Begriff gibt. Dieses Resultat können wir sicher nicht empirisch erhalten, oder es wie Dedekind auf „meine Gedankenwelt“ anwenden. Wenn wir uns damit beschäftigen würden, die Beziehung zwischen Begriff und Objekt genau zu untersuchen, so müßten wir auf eine Reihe von psychologischen und logischen Untersuchungen eingehen, die für unseren Hauptzweck unwichtig sind. Aber noch weitere Punkte sind zu beachten. Wenn „Begriff “ logisch verstanden werden soll, so kann er mit dem Objekt i d e n t i s c h sein, oder er kannfür eine B e s c h r e i b u n g im Sinn von Kapitel 16 gelten. Im ersten Fall versagt der Schluß. Denn zum Beweis der Reflexion war es wesentlich, daß Objekt und Begriff verschieden sind. Auch im zweiten Fall versagt der Schluß. Denn die Beziehung zwischen Objekt und Beschreibung ist nicht ein-eindeutig: zu einem gegebenen Objekt gibt es unzählige richtige Beschreibungen. So kann man Sokrates als den „Lehrer von Plato“ beschreiben oder als den „Philosophen, der den Schierlingsbecher trank“, oder als den „Mann der Xantippe“. Wenn wir uns für die andere Hypothese entscheiden und die „Idee“ psychologisch deuten, so muß man darauf bestehen, daß es überhaupt keine bestimmte psychologische Wesenheit gibt, welche man denBegriff des Objektes nennen könnte: Es gibt unzählige Meinungen und Einstellungen und wir können jede einen Begriff des Objektes nennen. In dem Sinn, wie wir sagen können, „ich habe einen ganz anderen Begriff von Sokrates als du“. Aber es gibt kein zentrales Wesen (außer Sokrates selbst), das die verschiedenen „Begriffe von Sokrates“ verbindet. Es gibt also keine eineindeutige Beziehung von Begriff und Objekt, wie sie der Schluß annimmt. Wie wir bereits bemerkt haben, ist es auch psychologisch gar nicht wahr, daß es für mehr als einen ganz winzigen Teil der Dinge dieser Welt Begriffe (im weitesten Sinn dieses Wortes) gebe. Aus allen diesen Gründen muß die obige Argumentation zugunsten der logischen Existenz von reflexiven Mengen verworfen werden.
157
Was man auch über die logischen Argumente sagen mag, man könnte denken, daß die aus Raum, Zeit, Verschiedenheit der Farben usw. ableitbaren empirischen Argumente schon vollkommen hinreichen, um die tatsächliche Existenz einer unendlichen Zahl von Einzelheiten zu beweisen. Ich glaube dies nicht. Wir haben keinen vernünftigen Grund, ausgenommen das Vorurteil, um an eine unendliche Ausdehnung von Raum und Zeit zu glauben, wenigstens wenn man Raum und Zeit als physikalische Tatsachen und nicht als mathematische Fiktionen ansieht. Wir betrachten naturgemäß Raum und Zeit als stetig oder zum mindesten als dicht. Aber auch das ist hauptsächlich ein Vorurteil. Die Quantentheorie der Physik zeigt – gleichgültig, ob sie richtig oder falsch ist –, die Tatsache, daß die Physik niemals einen Stetigkeitsbeweis aufstellen kann. Das Gegenteil aber ist vielleicht möglich. Unsere Sinne sind nicht fein genug, um zwischen einer stetigen Bewegung und einer raschen, diskreten Aufeinanderfolge zu unterscheiden. Im Kino kann dies jedermann sehen. Eine Welt, in der jede Bewegung aus einer Reihe von kleinen endlichen Stößen bestände, würde sich empirisch von einer Welt mit stetiger Bewegung nicht unterscheiden. Aus Raummangel kann ich diese Thesen nicht genügend verteidigen. Ich will sie hier nur andeuten, um den Leser darauf hinzuweisen. Wenn sie gelten, so folgt, daß kein empirischer Grund für die Annahme existiert, die Zahl der Einzelheiten in der Welt sei unendlich. Ein solcher Grund kann niemals existieren. Wir haben heute auch keinen empirischen Grund, um diese Zahl für endlich zu halten. Dagegen ist es theoretisch vorstellbar, daß es eine Tages Hinweise in dieser Richtung geben kann, die allerdings nicht beweisend sind. Aus der Tatsache, daß das Unendliche keinen Widerspruch in sich enthält, aber logisch auch nicht beweisbar ist, müssen wir schließen, daß wir a p r i o r i nichts darüber wissen können, ob die Zahl der Dinge in der Welt endlich oder unendlich ist. In der Leibnizschen Ausdrucksweise schließen wir also, daß einige der möglichen Welten endlich, andere unendlich sind. Wir haben kein Mittel, um zu wissen, zu welcher dieser beiden Kategorien unsere wirkliche Welt
158
gehört. Das Unendlichkeitsaxiom ist in einigen möglichen Welten richtig, in anderen falsch. Ob es in unserer Welt richtig oder falsch ist, darüber können wir nichts aussagen. Während dieses ganzen Kapitels wurden die Synonyme „Individuum“ und „Einzelheit“ ohne Erklärung verwendet. Ohne eingehende Behandlung der Theorie der Typen ist eine solche Erklärung unmöglich. Damit würden wir aber den Rahmen des vorliegenden Buches überschreiten. Bevor wir diesen Gegenstand verlassen, wollen wir mit ein paar Worten das Dunkel erhellen, das sonst die Bedeutung dieser Begriffe umgeben würde. In einem gewöhnlichen Satz können wir ein Verbum, das ein Prädikat oder eine Beziehung aussagt, von den Substantiven unterscheiden, welche das Subjekt des Attributs oder die Glieder der Beziehung ausdrücken. Der Satz „Cäsar lebte“, schreibt Cäsar ein Prädikat zu. Der Satz „Brutus tötete Cäsar“ drückt eine Beziehung zwischen Brutus und Cäsar aus. Verwenden wir das Wort „Subjekt“ in einem verallgemeinerten Sinn, so können wir Brutus und Cäsar die Subjekte dieses Satzes nennen: die Tatsache, daß Brutus grammatikalisch Subjekt und Cäsar Objekt ist, ist logisch gleichgültig, denn wir können dieselbe Beziehung in dem Satz ausdrücken: „Cäsar wurde von Brutus getötet“, wo Cäsar grammatikalisch Subjekt ist. Also wird in einfacheren Sätzen ein Prädikat oder eine Beziehung auftreten, die für ein, zwei oder mehrere Subjekte im verallgemeinerten Sinn oder zwischen ihnen gilt. (Eine Beziehung kann mehr als zwei Elemente besitzen, z. B. „A gibt B dem C“ ist eine Beziehung zwischen drei Elementen.) Bei einer genaueren Untersuchung findet man oft, daß die scheinbaren Subjekte keine wirklichen Subjekte sind, sondern analysiert werden können. Daraus folgt nur, daß neue Subjekte an ihre Stelle treten. Es kann auch vorkommen, daß man das Verbum zum grammatikalischen Subjekt machen kann. So können wir sagen: „Töten ist eine Beziehung, die zwischen Brutus und Cäsar gilt.“ Aber in diesen Fällen ist die Grammatik irreführend und in einer richtigen Behauptung nach den Regeln, die eine philosophische Grammatik beherrschen sollten, erscheinen Brutus und Cäsar als Subjekte und töten als das Verbum.
159
Wir sind also auf die Vorstellung von Ausdrücken gekommen, die in Sätzen n u r als Subjekte vorkommen und niemals anders. Dies ist ein Teil der alten, scholastischen Definition der S u b s t a n z . Aber die zeitliche Dauer, die diesem Begriff zukommen sollte, bietet für uns kein Interesse. Wir wollen als „Eigennamen“ diejenigen Ausdrücke bezeichnen, die in Sätzen nur als S u b j e k t e vorkommen können. Dabei ist „Subjekt“ in dem eben erläuterten verallgemeinerten Sinn gemeint. Wir wollen ferner Individuen oder „Einzelheiten“ als die Objekte definieren, die durch Eigennamen bezeichnet werden können. (Es wäre besser, sie direkt zu definieren und nicht durch die Art von Symbolen, durch die sie symbolisiert sind. Aber um dies zu tun, müßten wir uns allzusehr mit Metaphysik befassen.) Es ist natürlich möglich, daß dieser Regreß endlos ist: was als Individualität erscheint, ist in Wirklichkeit bei genauerer Betrachtung eine Menge oder eine Art Komplex. In diesem Fall müßte das Unendlichkeitsaxiom natürlich richtig sein. Im ändern Fall muß es der Analyse theoretisch möglich sein, bis zum letzten Subjekt vorzudringen. Damit würde sich die Bedeutung der Einzelheiten und Individuen ergeben. Das Unendlichkeitsaxiom soll sich nach unserer Annahme auf die Zahl dieser Individuen beziehen. Es gilt für sie, es gilt für die Mengen von ihnen, für die Mengen von Mengen von ihnen usw. Ist es für sie falsch, so ist es für die ganze Hierarchie falsch. Es ist also natürlich, das Axiom von ihnen und nicht von irgend einer anderen Stelle der Hierarchie auszusagen. Aber es scheint keine Methode zu geben, um festzustellen, ob das Axiom wahr oder falsch ist.
14. Die Unverträglichkeit und die Theorie der Deduktion Wir haben nunmehr – zwar etwas eilig – den Teil der Philosophie der Mathematik durchgemustert, bei dem eine kritische Prüfung des Begriffes M e n g e nicht nötig ist. Im vorigen Kapitel sahen wir uns aber Problemen gegenübergestellt, die eine solche Prüfung unabweisbar verlangten. Bevor wir uns daran machen können, müssen wir gewisse andere Gebiete der Philosophie der Mathematik betrachten, die wir bisher nicht beachtet haben. Bei einer synthetischen Darstellung kommt das, was wir jetzt behandeln werden, zuerst; es ist grundlegender als alles, was wir bis jetzt diskutiert haben. Drei Gegenstände werden uns beschäftigen, bevor wir zur Theorie der Mengen kommen, nämlich 1. die Theorie der Deduktion, 2. die Satzfunktionen, 3. die Beschreibungen. Der dritte Gegenstand gehört zwar nicht zu den logischen Voraussetzungen der Theorie der Mengen, bildet aber ein einfaches Beispiel für die A r t von Theorie, die man für die Behandlung der Mengen braucht. In diesem Kapitel werden wir uns mit dem ersten Gegenstand, der Theorie der Deduktion, befassen. Die Grammatik ist eine deduktive Wissenschaft: sie geht von gewissen Prämissen aus und gelangt vermöge eines strengen, deduktiven Verfahrens zu den verschiedenen Sätzen, aus denen sie besteht. Früher waren freilich die mathematischen Deduktionen oft keineswegs streng; aber vollkommene Strenge ist auch ein kaum erreichbares Ideal. Trotzdem ist ein unstrenger mathematischer Beweis mangelhaft; man darf nicht mit der Ausrede kommen, daß dem gesunden Menschenverstand das Ergebnis richtig erscheint, denn wollten wir uns damit zufrieden geben, so wäre es besser, auf jede
161
Beweisführung zu verzichten, als den gesunden Menschenverstand durch Schwindelmanöver zu retten. Kein Appell an den gesunden Menschenverstand oder an die „Anschauung“, sondern nur strenge deduktive Logik soll in der Mathematik vorkommen, nachdem einmal die Prämissen aufgestellt worden sind. Kant bemerkte, daß die Geometer seiner Zeit ihre Sätze nicht rein logisch beweisen konnten, sondern auf die Figur hinweisen mußten. Er stellte daher eine Theorie der mathematischen Beweisführung auf, nach der der Schluß nie streng logisch erfolgt, sondern immer von der sogenannten „Anschauung“ unterstützt werden muß. Die moderne mathematische Richtung mit ihrem wachsenden Streben nach Strenge steht zu dieser Kantschen Theorie im Gegensatz. Was zu Kants Zeiten in der Mathematik nicht bewiesen werden konnte, das kannte man nicht – z. B. das Parallelenaxiom. In der Mathematik und durch mathematische Methoden kann nur das erkannt werden, was sich rein logisch ableiten läßt. Was sonst noch zur menschlichen Kenntnis gehört, muß anders ermittelt werden, empirisch, durch die Sinne oder durch irgend welche Erfahrungen, aber nicht a priori. Die positiven Gründe für diese Behauptung findet man gelegentlich in den Principia Mathematica; eine Verteidigung gegen andere Meinungen steht in den Principles of Mathematics. Wir können den Leser hier nur auf diese Werke verweisen, da der Gegenstand zu ausgedehnt ist, um eilig behandelt zu werden. Vorläufig werden wir annehmen, daß die gesamte Mathematik deduktiv ist und zur Untersuchung der Deduktion übergehen. Bei der Deduktion gibt es einen oder mehrere Sätze, die Prämissen genannt werden, aus denen wir einen Satz ableiten, der Schluß genannt wird. Es ist für unsere Zwecke bequem, falls es ursprünglich verschiedene Prämissen gibt, sie in einen einzigen Satz zu verschmelzen, so daß wir sowohl von der Prämisse wie von dem Schluß sprechen können. Somit können wir die Deduktion als einen Prozeß ansehen, mittels dessen wir auf Grund der Kenntnis eines gewissen Satzes, der Prämisse, zur Kenntnis eines gewissen anderen Satzes, des Schlusses, übergehen. Aber einen derartigen Prozeß werden wir nur dann als l o g i s c h e Deduktion betrachten, wenn er k o r r e k t
162
ist, d. h. wenn eine solche Beziehung zwischen Prämisse und Schluß besteht, die uns dazu berechtigt, an den Schluß zu glauben, wenn wir wissen, daß die Prämisse wahr ist. Diese Beziehung ist für die logische Theorie der Deduktion von größtem Interesse. Um imstande zu sein, in zwingender Weise die Wahrheit eines Satzes zu erschließen, müssen wir wissen, daß irgend ein anderer Satz wahr ist, und daß zwischen beiden Sätzen eine Beziehung von der Art besteht, die man „Folgen“ oder „Implikation“ nennt, d. h. daß (wie wir sagen) aus der Prämisse der Schluß „folgt“. (Wir werden diese Beziehung bald definieren.) Oder wir können wissen, daß ein gewisser anderer Satz falsch ist und daß es eine Beziehung zwischen den beiden Sätzen gibt von der Art der sogenannten „Disjunktion“, die durch „p oder q“ 1) ausgedrückt wird, so daß wir aus der Kenntnis, daß der eine falsch ist, schließen können, daß der andere wahr ist. Oder wir wollen die F a l s c h h e i t eines Satzes folgern, nicht seine Wahrheit. Dies kann aus der Wahrheit eines anderen Satzes geschlossen werden, vorausgesetzt, daß wir wissen, daß die beiden Sätze „unverträglich“ sind, d. h. daß, wenn der eine wahr ist, der andere falsch ist. Dies kann auch aus der Falschheit eines anderen Satzes geschlossen werden, wenn gerade solche Verhältnisse vorliegen, daß die Wahrheit dieses anderen Satzes aus der Wahrheit des einen Satzes geschlossen werden könnte; d. h. aus der Falschheit von p können wir die. Falschheit von q folgern, wenn aus q p folgt. Dies sind vier Beispiele für den Schluß. Wenn wir unsere Aufmerksamkeit auf den Schluß richten, so scheint es natürlich, das „Folgen“ als die Grundbeziehung anzunehmen, da es die Beziehung ist, die zwischen p und q bestehen muß, wenn wir imstande sein sollen, die Wa h r h e i t von q aus der Wa h r h e i t von p zu schließen. Aus technischen Gründen ist dies jedoch nicht die beste Wahl für den Grundbegriff. Bevor wir an die Grundbegriffe und die Definitionen gehen, wollen wir die verschiedenen Funktionen
1
) Wir werden mit den Buchstaben p, q, r, s, t veränderliche Sätze bezeichnen.
163
von Sätzen betrachten, die durch die oben erwähnten Beziehungen zwischen Sätzen nahegelegt werden. Die einfachste dieser Funktionen ist die Negation „Nicht-p“. Das ist diejenige Funktion von p, die wahr ist, wenn p falsch ist, und falsch, wenn p wahr ist. Es ist zweckmäßig, die Wahrheit oder Falschheit eines Satzes als seinen „Wahrheitswert“ ) zu bezeichnen; d. h. W a h r h e i t ist der „Wahrheitswert“ eines wahren Satzes und F a l s c h h e i t derjenige eines falschen. Somit hat Nicht-p den entgegengesetzten Wahrheitswert von p. Als nächste Funktion nehmen wir die D i s j u n k t i o n „p oder q“. Das ist eine Funktion, deren Wahrheitswert Wahrheit ist, wenn p wahr ist und auch, wenn q wahr ist, jedoch Falschheit, wenn sowohl p wie q falsch sind. Dann kommt die K o n j u n k t i o n „p und q“. Diese hat Wahrheit zum Wahrheitswert, wenn p und q beide wahr sind; andernfalls ist ihr Wahrheitswert Falschheit. Ferner die U n v e r t r ä g l i c h k e i t , d.h. „p und q“ sind nicht beide wahr“. Sie ist die Negation der Konjunktion; sie ist auch die Disjunktion der Negation von p und q, d. h. „Nicht-p oder Nicht-q“. Ihr Wahrheitswert ist Wahrheit, wenn p falsch ist und ebenso, wenn q falsch ist; ihr Wahrheitswert ist Falschheit, wenn p und q beide wahr sind. Endlich das F o l g e n , d. h. „aus p folgt q“ oder „wenn p dann q“. Dies soll im weitesten Sinn verstanden werden, so daß wir die Wahrheit von q folgern können, wenn wir wissen, daß p wahr ist. Somit verstehen wir unter Folgen: „Wenn p nicht falsch ist, dann ist q wahr“ oder „entweder ist p falsch oder q wahr.“ (Die Tatsache, daß „Folgen“ andere Bedeutungen haben kann, geht uns nichts an; die gegebene Bedeutung paßt am besten für unsere Zwecke.) Somit soll „aus p folgt q“ bedeuten: „Nicht-p oder q“. Der Wahrheitswert ist Wahrheit, wenn p falsch ist, ebenso wenn q wahr ist, und ist Falschheit, wenn p wahr und q falsch ist. Wir haben somit 5 Funktionen: Negation, Disjunktion, Konjunktion, Unverträglichkeit und Folgen. Wir hätten noch andere anführen ) Dieser Ausdruck stammt von Frege.
164
können, z. B. die konjunktive Verneinung, „Nicht-p und Nicht-q“. Aber die obigen 5 werden uns genügen. Die Negation unterscheidet sich von den übrigen vier dadurch, daß sie eine Funktion e i n e s Satzes ist, während die anderen Funktionen von z w e i Sätzen sind. Aber alle fünf stimmen darin überein, daß ihr Wahrheitswert nur von dem der Sätze abhängt, die ihre Argumente sind. Ist die Wahrheit oder Falschheit von p oder von p und q (je nach dem Fall) gegeben, so haben wir auch die Wahrheit oder Falschheit der Negation, Disjunktion, Konjunktion, Unverträglichkeit oder des Folgens. Eine Funktion von Sätzen mit dieser Eigenschaft heißt eine „Wahrheitsfunktion“. Die ganze Bedeutung einer Wahrheitsfunktion erschöpft sich in der Angabe der Umstände, unter denen sie wahr oder falsch ist.„Nicht-p“ z. B. ist einfach diejenige Funktion von p, die wahr ist, wenn p falsch ist und falsch, wenn p wahr ist: man hat ihr keine weitere Bedeutung zuzuschreiben. Das gleiche gilt für „p oder q“ und den Rest. Daraus folgt, daß zwei Wahrheitsfunktionen, die den gleichen Wahrheitswert für alle Argumentwerte haben, ununterscheidbar sind. Z. B. ist „p und q“ die Negation von „Nicht-p oder Nicht-q“ und u m g e k e h r t ; somit kann jede dieser Funktionen als die Negation der anderen d e f i n i e r t werden. Eine weitere Bedeutung, als die Angabe, unter welchen Bedingungen eine Wahrheitsfunktion wahr oder falsch ist, kommt ihr nicht zu. Es ist klar, daß die obigen fünf Wahrheitsfunktionen nicht alle voneinander unabhängig sind. Wir können einige durch die anderen definieren. Es ist nicht schwer, ihre Zahl auf 2 zu reduzieren; in den Principia Mathematica wird hierfür die Negation und Disjunktion gewählt. Das Folgen wird dann als „Nicht-p oder q“ definiert; Unverträglichkeit als „Nicht-p oder Nicht-q“; Konjunktion als die Negation der Unverträglichkeit. Aber Sheffer1) hat gezeigt, daß wir uns mit e i n e m Grundbegriff für alle 5 begnügen können, und Nicod 2), daß wir dadurch die für die Theorien der Deduktion nö-
1 2
) Trans. Am. Math. Soc., Bd. 14, S. 481—488. ) Pioc. Camb. Phil. Soc., Bd. 19, Januar 1917.
165
tigen Grundsätze auf zwei nicht formale und ein formales Prinzip zurückführen können. Zu diesem Zwecke können wir als den einen undefinierbaren Begriff entweder die Unverträglichkeit oder die konjunktive Negation nehmen. Wir wählen den ersteren. Unser Grundbegriff ist nun eine gewisse Wahrheitsfunktion, die wir „Unverträglichkeit“ nennen und mit p/q bezeichnen wollen. Die Negation kann sofort als die Unverträglichkeit eines Satzes mit sich selbst definiert werden, d. h. „Nicht-p“ wird als »p/p“ definiert. Die Disjunktion ist die Unverträglichkeit von Nicht-p mit Nicht-q, d. h. (p/p)/(q/q). Das Folgen ist die Unverträglichkeit von p mit Nicht-q, d. h. p/(q/q). Die Konjunktion ist die Negation der Unverträglichkeit, d. h. (p/q)/(plq). Somit sind unsere vier anderen Funktionen mit Hilfe der Unverträglichkeit definiert. Offenbar kann man beliebig viele Wahrheitsfunktionen aufstellen, indem man mehr Argumente einführt oder die Argumente wiederholt. Wir haben zu untersuchen, in welchem Zusammenhange dies alles mit dem Schlußverfahren steht. Wenn wir wissen, daß p wahr ist und daß aus p q folgt, so können wir weiterhin q behaupten. Es spielt unvermeidlich immer i r g e n d e t w a s Psychologisches beim Schließen hinein: Schließen ist eine Methode, durch die wir zu einer neuen Kenntnis gelangen; nicht psychologisch an ihr ist die Beziehung, die uns erlaubt, korrekt zu schließen; aber der wirkliche Übergang von der Behauptung von p zur Behauptung von q ist ein psychologischer Prozeß und wir dürfen nicht versuchen, ihn rein logisch darstellen zu wollen. In der mathematischen Praxis haben wir beim Schließen immer irgend einen Ausdruck mit veränderlichen Sätzen, sagen wir p und q, von dem wir wissen, daß er vermöge seiner Form für alle Werte von p und q wahr ist; wir haben ferner einen anderen Ausdruck, einen Teil des ersten, von dem wir auch wissen, daß er für alle Werte von p und q wahr ist; und auf Grund der Prinzipien des Schließens sind wir imstande, diesen Teil unseres ursprünglichen Ausdrucks wegzulassen und den Rest zu behaupten. Diese etwas abstrakte Schilderung möge durch einige Beispiele erklärt werden.
166
Angenommen, wir kennen die fünf formalen Prinzipien der Deduktion, die in den Principia Mathematica aufgezählt sind. (Nicod hat sie auf eines reduziert, aber dies ist ein komplizierter Satz. Daher wollen wir erst diese fünf nehmen.) Diese fünf Sätze lauten: (1) Aus „p oder p“ folgt p, d. h. wenn entweder p wahr ist oder p wahr ist, dann ist p wahr. (2) Aus q folgt „p oder q“’, d. h. die Disjunktion „p oder q“ ist wahr, wenn eine ihrer Alternativen wahr ist. (3) Aus „p oder q“ folgt „q oder p“. Diesen Satz würden wir nicht brauchen, wenn wir eine theoretisch bessere Bezeichnungsweise hätten, da in dem Begriff der Disjunktion keine Ordnung enthalten ist, so daß „p oder q“ und „q oder p“ identisch sein sollten. Weil aber unsere Symbole in jedem Fall eine Ordnung mit sich bringen, so müssen wir geeignete An nahmen machen, die bewirken, daß es auf die Ordnung nicht ankommt. (4) Wenn entweder p oder „q oder r“ wahr ist, dann ist entweder q oder „p oder r“ wahr. (Die Verbindung, die durch diesen Satz hergestellt wird, vermehrt seine deduktive Kraft.) (5) Wenn aus q r folgt, dann folgt aus „p oder q“ „p oder r“. Dies sind die formalen Prinzipien der Deduktion, wie sie in den Principia Mathematica angewendet werden, Ein formales Prinzip der Deduktion findet eine doppelte Anwendung, und um dies klar zu machen, haben wir die obigen fünf Sätze angeführt. Es kann als Prämisse eines Schlusses und zur Bestätigung der Tatsache, daß aus der Prämisse der Schluß folgt, verwandt werden. Das Schema eines Schlusses besteht aus einem Satz p und einem Satz „aus p folgt q“, woraus wir q schließen. Wenn wir es nun mit den Prinzipien der Deduktion zu tun haben, so muß unser Apparat von Grundsätzen sowohl das p wie das „aus p folgt q“ unserer Schlüsse enthalten. Das soll heißen: Unsere Regeln der Deduktion sind nicht nur als Regeln zu verwenden wozu sie bei der Aufstellung von „aus p folgt q“ gebraucht werden, sondern auch als substantielle Prämissen, d. h. als das p unseres Schlußschemas. Angenommen z. B., wir wollen beweisen: wenn aus p q und aus q r folgt, dann folgt aus p r.
167
Wir haben hier eine Beziehung zwischen drei Sätzen, die Folgen behaupten. Setzen wir p1 = aus p folgt q, p2 = aus q folgt r und p3 = aus p folgt r. Dann haben wir zu beweisen: aus p1 folgt, daß aus p2 p3 folgt. Jetzt benützen wir das fünfte unserer obigen Prinzipien, setzen an Stelle von p Nicht-p und erinnern uns daran, daß „Nicht-p oder q“ nach Definition das gleiche bedeutet wie „aus p folgt q“. Somit ergibt unser fünftes Prinzip: Wenn aus q r folgt, dann folgt aus „aus p folgt q“ der Satz „aus p folgt r“, d. h. „aus p2 folgt, daß aus p1 p3 folgt“. Dies sei der Satz A. Aber unser viertes Prinzip ergibt, wenn wir Nicht-p und Nichtq an die Stelle von p und q setzen und die Definition des Folgens beachten: „Wenn aus p folgt, daß aus q r folgt, dann folgt aus q auch, daß aus p r folgt.“ Schreiben wir für p p2, für q p1 und für r p3, so wird daraus:„Wenn aus p2 folgt, daß aus p1 pa folgt, dann folgt aus p1 auch, daß aus p2 p3 folgt.“ Dies sei der Satz B. Nun haben wir mit Hilfe des fünften Prinzips bewiesen, daß „aus p2 folgt, daß aus p1 p3 folgt“, was wir A genannt haben. Hier haben wir ein Beispiel für ein Schlußschema, wo A das p unseres Schemas und B das „aus p folgt q“ darstellt. Somit gelangen wir zum Satz q, nämlich „aus p1 folgt, daß aus p2 p3 folgt“. Das war der zu beweisende Satz. Bei diesem Beweis tritt unser fünftes Prinzip, das A ergibt, als eine substantielle Prämisse auf; während unser viertes Prinzip, das B ergibt, verwandt worden ist, um die F o r m des Schlusses zu erhalten. Die formalen und materiellen Verwendungen von Prämissen in der Theorie der Deduktion hängen eng miteinander zusammen, und es kommt nicht so sehr darauf an, sie voneinander zu unterscheiden, vorausgesetzt, daß wir im Auge behalten, daß sie theoretisch verschieden sind. Die älteste Methode, aus einer Prämisse neue Resultate abzuleiten, wird durch die obige Deduktion illustriert. Sie kann aber selbst kaum
168
eine Deduktion genannt werden. Wir müssen annehmen, daß die Grundsätze, wie sie auch lauten mögen, für alle möglichen Werte der in ihnen vorkommenden veränderlichen Sätze p, q, r gelten. Wir können daher an Stelle von p irgend einen Ausdruck setzen, dessen Wert immer ein Satz ist, z. B. Nicht-p oder „aus s folgt t“, usw. Mittels solcher Substitutionen erhalten wir eigentlich eine Reihe von besonderen Fällen unserer ursprünglichen Sätze, praktisch genommen aber nur scheinbar neue Sätze. Die Zulässigkeit solcher Substitutionen muß auf Grund eines nichtformalen Schlußprinzips sicher gestellt werden1). Wir können nun das einzige formale Schlußprinzip aufstellen, auf das Nicod die obigen fünf Prinzipien zurückgeführt hat. Zu diesem Zweck wollen wir zuerst zeigen, wie gewisse Wahrheitsfunktionen durch die Unverträglichkeit definiert werden können. Wir sahen schon, daß p/(q/q) bedeutet „aus p folgt q“. Wir bemerken nun, daß p/(q/r) bedeutet „aus p folgt sowohl q wie r“ Denn dieser Ausdruck bedeutet „p ist unverträglich mit der Unverträglichkeit von q mit r“, d. h. „aus p folgt, daß q und r nicht unverträglich sind“, d. h. „aus p folgt, daß q und r beide wahr sind“ – denn, wie wir gesehen haben, ist die Konjunktion von q und r die Negation ihrer Unverträglichkeit. Ferner bemerken wir, daß t/(t/t) bedeutet „aus t folgt t selbst“. Dies ist ein Spezialfall von p/(q/q). — Die Negation von p wollen wir mit p bezeichnen; p/s bedeutet also die Negation von p/s, d. h. es drückt die Konjunktion von p und s aus. Daraus folgt, daß — (s/q) p/s die Unverträglichkeit von s/q mit der Konjunktion von p und s zum Ausdruck bringt; mit anderen Worten, es wird behauptet, daß, wenn p und s beide wahr sind, s/q falsch ist, d. h. s und q sind beide wahr;
1 ) In den Principia Mathematica und in der oben erwähnten Arbeit von Nicod wird kein solches Prinzip aufgestellt, obgleich dies hätte geschehen müssen.
169
oder noch einfacher, es wird behauptet, daß aus p und s zusammen s und q zusammen folgen. Nun setzen wir P = p / (q/r), π = t / (t/t), — Q = (s/q) / p/s, dann lautet das einzige formale Schlußprinzip von Nicod P/(π/Q); mit anderen Worten, aus P folgt sowohl n wie Q. Ferner verwendet er ein nicht formales Prinzip, das zur Theorie der Ty pen gehört (mit der wir uns nicht zu befassen brauchen) und eines, das folgendem Prinzip entspricht: sei p und „aus p folgt q“ gegeben, dann können wir q behaupten. Dieses Prinzip lautet: „Wenn p/(r/q) und p wahr sind, dann ist q wahr.“ Mit Hilfe dieses Apparats ergibt sich die ganze Theorie der Deduktion, ausgenommen die Deduktionen der Existenz oder aus der Existenz oder der allgemeinen Wahrheit von „Satzfunktionen“, die wir im nächsten Kapitel betrachten werden. Meines Erachtens herrscht bei einigen Autoren eine gewisse Konfusion über die Beziehung zwischen Sätzen, vermöge deren ein Schluß gültig ist. Damit es gültig ist, q aus p zu schließen, ist nur notwendig, daß p und der Satz „Nicht-p oder q“ wahr ist. Wenn dieser Fall zutrifft, so ist es klar, daß q wahr sein muß. Aber ein Schluß wird nur dann wirklich vorliegen, wenn der Satz Nicht-p oder q“ auf andere Weise bekannt ist als vermöge der Kenntnis von Nicht-p oder von q. Sobald p falsch ist, ist „Nicht-p oder q“ wahr, aber unbrauchbar für einen Schluß, der die Wahrheit von p verlangt. Wenn man schon weiß, daß q wahr ist, so weiß man natürlich auch, daß „Nicht-p oder q“ wahr ist, was aber wieder für einen Schluß nutzlos ist, da q schon bekannt ist und nicht erst geschlossen zu werden braucht. In der Tat, es ensteht nur dann ein Schluß, wenn „Nicht-p oder q“ erkannt werden kann, ohne daß man schon weiß, welche der beiden Alternativen die Disjunktion wahr macht. Dies ist der Fall,
170
wenn gewisse formale Beziehungen zwischen p und q bestehen, z. B. wissen wir: wenn aus r die Negation von s folgt, so folgt aus s die Negation von r. Zwischen den Sätzen „aus r folgt Nicht-s“ und „aus s folgt Nicht-r“ besteht eine derartige formale Beziehung, so daß wir w i s s e n , daß aus dem ersten der zweite folgt, ohne daß wir erst zu wissen brauchen, daß der erste falsch oder der zweite wahr ist. In solchen Fällen ist die Beziehung des Folgens beim Schließen von praktischem Nutzen. Aber diese formale Beziehung wird nur gebraucht, um zu w i s s e n , daß entweder die Prämisse falsch oder der Schluß wahr ist. Die Wahrheit von „Nicht-p oder q“ wird für die G ü l t i g k e i t des Schlusses benötigt; was sonst gebraucht wird, dient nur zur praktischen Erleichterung des Schließens. Professor C. J. Lewis1) hat besonders die engere formale Beziehung unter sucht, die wir „formale Ableitbarkeit“ nennen können. Er behauptet, daß die weitere Beziehung „Nicht-p oder q“ nicht „Folge“ genannt werden sollte. Das ist aber nur eine Bezeichnungsfrage. Wenn wir unsere Worte konsequent gebrauchen, kommt es wenig darauf an, wie wir sie definieren. Der wesentliche Punkt, in dem sich meine Theorie von der des Prof. Lewis unterscheidet, ist: er behauptet, wenn ein Satz q „formal ableitbar“ aus einem anderen Satz p ist, dann empfinden wir eine Beziehung zwischen ihnen, die er „strenges Folgen“ nennt; dies sei nicht die Beziehung „Nicht-p oder q“, sondern eine engere Beziehung, die nur gilt, wenn es gewisse formale Zusammenhänge zwischen p und q gibt. Ich behaupte dagegen: mag die von ihm angegebene Beziehung existieren oder nicht, sie wird auf jeden Fall in der Mathematik nicht gebraucht und soll daher aus denkökonomischen Gründen in unseren Apparat von Grundbegriffen nicht aufgenommen werden; wenn die Beziehung der „formalen Ableitbarkeit“ zwischen zwei Sätzen besteht, so haben wir den Fall vor uns, wo offensichtlich entweder der erste Satz falsch oder der zweite wahr ist. Ober diesen Tatbestand hinaus braucht nichts in unsere Prämissen aufgenommen zu werden. Endlich können die einzelnen Gründe, die Prof. Lewis gegen den von mir vertretenen Standpunkt 1
) Vgl. „Mind“, Bd. 21, 1912, S. 522—531 und Bd. 23, 1914, S. 240—247.
171
anführt, einzeln widerlegt werden. Sie scheinen plausibel auf Grund einer versteckten und unbewußten Annahme eines Standpunktes, den ich ablehnen muß. Daher behaupte ich abschließend, daß wir keine Form des Folgens als Grundbegriff einzuführen brauchen, die nicht durch eine Wahrheitsfunktion ausdrückbar ist.
15. Satz-Funktionen Als im vorhergehenden Kapitel von Sätzen die Rede war, wurde nicht versucht, das Wort „Satz“ zu definieren. Obgleich das Wort formal nicht definiert werden kann, muß doch etwas über seine Bedeutung gesagt werden, um die sehr häufige Verwechslung mit den „Satzfunktionen“ zu vermeiden, die den Gegenstand dieses Kapitels bilden. Wir verstehen unter einem „Satz“ in erster Linie eine Bildung aus Worten, die ausdrückt, daß etwas entweder wahr oder falsch ist. Ich sage „in erster Linie“, weil ich nichts außer Wortsymbolen oder sogar bloßen Gedanken symbolischen Charakters ausschließen will. Doch sollte meiner Meinung nach das Wort „Satz“ beschränkt werden auf das, was man in gewissem Sinne „Symbole“ nennen kann, und weiterhin auf solche Symbole, die Wahrheit oder Falschheit zum Ausdruck bringen. So sind „zwei und zwei ist vier“ und „zwei und zwei ist fünf “ Sätze. Ebenso „Sokrates ist ein Mensch“ und „Sokrates ist kein Mensch“. Die Behauptung „welches auch die Zahlen a und b seien, (a + b) 2 = a 2 + 2ab + b 2 “ ist ein Satz; aber die bloße Formel „(a + b) 2 = a 2 + 2ab + b z “ ist kein Satz, da sie nichts Bestimmtes behauptet, so lange uns nicht gesagt wird, oder wir Anlaß haben an zu neh men, daß a und b alle möglichen Werte oder ganz bestimmte Werte annehmen sollen. Das erstere wird in der Regel bei der Aufstellung mathematischer Formeln stillschweigend vorausgesetzt, die dadurch zu Sätzen werden; werden aber derartige Voraussetzungen nicht gemacht, so sind sie „Satzfunktionen“. Eine „Satzfunktion“ ist nämlich ein Ausdruck, der eine oder mehrere unbestimmte Bestandteile in der Weise enthält, daß der Ausdruck zu einem Satz wird, wenn diesen Bestand-
173
teilen Werte zugeschrieben werden. Mit anderen Worten, es handelt sich um eine Funktion, deren Werte Sätze sind. Doch muß diese letztere Definition mit Vorsicht gebraucht werden. Eine beschreibende Funktion, z. B. „der schwerste Satz in dem mathematischen Lehrbuch von A“ ist keine Satzfunktion, obgleich ihre Werte Sätze sind. Aber in einem solchen Falle sind die Sätze nur beschrieben: in einer Satzfunktion müssen die Werte Sätze aussprechen. Beispiele von Satzfunktionen sind leicht anzugeben: „x ist ein Mensch“ ist eine Satzfunktion. So lange x unbestimmt bleibt, ist sie weder wahr noch falsch; wenn jedoch x ein Wert erteilt wird, so wird daraus ein wahrer oder falscher Satz. Jede mathematische Gleichung ist eine Satzfunktion. So lange die Veränderlichen keine bestimmten Werte haben, stellt die Gleichung nur einen Ausdruck dar, der der Bestimmung bedarf, um ein wahrer oder falscher Satz zu werden. Haben wir es mit einer Gleichung mit einer Veränderlichen zu tun, so wird sie richtig, wenn die Veränderliche gleich einer Wurzel der Gleichung gesetzt wird, sonst wird sie falsch; eine „Identität“ hingegen ist richtig, wenn die Veränderliche irgend eine Zahl ist. Die Gleichung einer ebenen Kurve oder einer Fläche im Raume ist eine Satzfunktion, die wahr ist für die Werte der Koordinaten, die zu Punkten auf der Kurve oder der Fläche gehören, falsch dagegen für andere Werte. Ausdrücke der üblichen Logik, wie z. B. „alle A sind B“, sind Satzfunktionen: A und B müssen bestimmte Mengen sein, damit solche Ausdrücke wahr oder falsch werden. Der Begriff „Fälle“ oder „Beispiele“ steht mit den Satzfunktionen in Zusammenhang. Betrachten wir z. B. die Methode der sog. „Verallgemeinerung“ und nehmen wir ein sehr einfaches Beispiel: „Auf den Blitz folgt der Donner“. Wir haben eine Anzahl von „Beispielen“ dafür, d. h. eine Anzahl von Sätzen, wie „dies ist ein Blitz und auf ihn folgt ein Donner“. Wofür sind diese Vorkommnisse „Beispiele“? Sie sind Beispiele der Satzfunktion: „Wenn x ein Blitz ist, so ist x von einem Donner begleitet.“ Das Verfahren der Verallgemeinerung (um dessen Berechtigung wir uns glücklicherweise nicht zu kümmern brauchen) besteht im dem Übergang von einer Anzahl solcher Bei-
174
spiele zu der a l l g e m e i n e n Wahrheit der Satzfunktion: „Wenn x ein Blitz ist, so folgt auf x ein Donner.“ Man erkennt, daß auf ähnliche Weise immer Satzfunktionen auftreten, wenn wir von Beispielen oder Fällen sprechen. Wir brauchen nicht fragen oder darauf antworten wollen: „Was ist eine Satzfunktion?“ Eine alleinstehende Satzfunktion muß als ein bloßes Schema aufgefaßt werden, nur als Schale, als leeres Gefäß für eine Bedeutung, nicht als etwas an sich Sinnvolles. Wir haben es, grob gesprochen, mit zwei Arten von Satzfunktionen zu tun: einmal in Verbindung mit den Begriffen „wahr in allen Fällen“ und „wahr in einigen Fällen“; zweitens in Verbindung mit der Theorie der Mengen und Beziehungen. Den zweiten Gegenstand wollen wir einem späteren Kapitel vorbehalten; mit dem ersten wollen wir uns jetzt beschäftigen. Wenn wir sagen, etwas ist „immer wahr“, oder „wahr in allen Fällen“, so ist klar, daß dabei „etwas“ nicht ein Satz sein kann. Ein Satz ist wahr oder falsch und weiter nichts. Es gibt kein Beispiel und keine Fälle für „Sokrates ist ein Mensch“ oder „Napoleon starb auf St. Helena“. Das sind Sätze, und die Bedeutung, sie seien „in allen Fällen“ richtig, hätte keinen Sinn. Diese Ausdrucksweise ist nur bei Satzfunktionen anwendbar. Als Beispiel diene die Art und Weise, wie man sich oft ausdrückt, wenn es sich um die Feststellung einer Ursache handelt.(Wir haben es nicht mit der Wahrheit oder Falschheit einer Behauptung zu tun, sondern nur mit ihrer logischen Analyse.) Man sagt uns, daß auf A in jedem Falle B folgt. Gibt es nun „Beispiele“ für A, so muß A ein allgemeiner Begriff sein, von dem es einen Sinn hat zu behaupten „x₁ ist ein A“, „x₂ ist ein A“, „x₃ ist ein A“, wo x₁, x2, x₃ spezielle, nicht miteinander identische Fälle sind. Bei unserem vorigen Beispiel mit dem Blitz behaupten wir, daß auf den Blitz (A) der Donner (B) folgt. Aber die einzelnen Blitze sind besondere Fälle, die nicht identisch sind, jedoch die Eigenschaft miteinander gemein haben. Blitze zu sein. Man kann eine gemeinsame Eigenschaft allgemein nur durch die Behauptung ausdrücken, daß eine einer Zahl von Objekten gemeinsame Eigen-
175
schaft eine Satzfunktion ist, die wahr wird, wenn irgend eines dieser Objekte als Wert der Veränderlichen genommen wird. Dann sind alle Objekte „Beispiele“ für die Richtigkeit der Satzfunktion. Denn eine Satzfunktion ist, obgleich sie selbst weder wahr noch falsch sein kann, für gewisse Beispiele richtig und für gewisse andere falsch, wenn sie nicht „immer richtig“ oder „immer falsch“ ist. Wenn wir, um zu unserem Beispiel zurückzukehren, behaupten, daß auf A in jedem Falle B folgt, so meinen wir damit: Was auch x sei, so folgt darauf, wenn es ein A ist, ein B; d. h. wir behaupten, daß eine gewisse Satzfunktion „immer wahr“ ist. Aussprüche, die Worte wie „alle“, „jeder“, „ein“, „der“, „einige“ enthalten, müssen durch Satzfunktionen erläutert werden. Dabei kann das Auftreten der Satzfunktionen mit Hilfe von zwei von den obigen Worten, nämlich „alle“ und „einige“, erklärt werden. Man kann letzten Endes nur zweierlei mit einer Satzfunktion anfangen: erstens kann man behaupten, daß sie in allen Fällen richtig ist, zweitens, daß sie wenigstens in einem Falle oder in einigen Fällen richtig ist (wie wir sagen werden, wobei wir voraussetzen, daß es sich dabei nicht notwendiger weise um mehrere Fälle handelt). Alle anderen Anwendungsarten der Satzfunktionen können auf diese zwei zurückgeführt werden. Behaupten wir, daß eine Satzfunktion in „allen Fällen“ oder „immer“ (ohne zeitliche Bedeutung) richtig ist, so meinen wir, daß alle ihre Werte wahr sind. Wenn „φ(x)“ die Funktion ist und a ein Gegenstand, der ein Argument von „φ(x)“ sein kann, dann ist φ(a) wahr, wie a auch gewählt sein mag. Z. B. „wenn a ein Mensch ist, so ist a sterblich“ ist richtig, ob a ein Mensch ist oder nicht; denn jeder Satz dieser Form ist wahr. Somit ist „wenn x ein Mensch ist, so ist x sterblich“ eine Satzfunktion, die „immer wahr“ oder „wahr in allen Fällen“ ist. Andererseits kommt die Behauptung „es gibt keine Einhorne“ auf dasselbe hinaus wie die Behauptung „die Satzfunktion ,φ(x) ist kein Einhorn‘ ist in allen Fällen wahr.“ Die Behauptungen des vorigen Kapitels, die sich auf Sätze bezogen, z. B. „aus ,p oder q‘ folgt ,q oder p‘“ sind in Wirklichkeit Behauptungen, daß gewisse Satzfunktionen in allen Fällen wahr sind. Wir
176
behaupten nicht, daß z. B. dieses Prinzip nur für dieses oder jenes besondere p oder q gilt, sondern daß es wahr ist für jedes p oder q, das ihm eine Bedeutung verleiht. Die Bedingung dafür, daß eine Funktion für ein gegebenes Argument eine B e d e u t u n g hat, kommt auf dasselbe hinaus wie die Bedingung dafür, daß es einen richtigen oder falschen Wert für das Argument gibt. Das Studium der Bedingungen, wann etwas sinnvoll ist, gehört zur Lehre von den Typen, die wir nicht über die im vorigen Kapitel entworfene Skizze hinaus verfolgen wollen. Nicht nur die Prinzipien der Deduktion,sondern alle Grundsätze der Logik bestehen aus Behauptungen, daß gewisse Satzfunktionen stets wahr sind. Wenn das nicht der Fall wäre, so würden sie sich auf besondere Dinge oder Begriffe beziehen – Sokrates oder rote Farbe oder Ost und West oder sonst was – und es ist offensichtlich nicht die Aufgabe der Logik, Behauptungen aufzustellen, die nur für ein besonderes Ding oder einen besonderen Begriff wahr sind, nicht aber für andere. Ein Teil der Definition der Logik (nicht die ganze Definition) sagt aus, daß alle ihre Sätze vollständig allgemein sind, d. h. sie bestehen alle aus der Behauptung, daß eine gewisse Satzfunktion, die keine konstanten Elemente enthält, stets wahr ist. Wir werden im letzten Kapitel auf die Satzfunktionen zurückkommen, die keine konstanten Elemente enthalten. Vorläufig wollen wir zu dem anderen übergehen, was man mit einer Satzfunktion anfangen kann, nämlich zur Behauptung, daß sie „manchmal wahr“ ist, d. h. wenigstens in einem Falle wahr ist. Wenn wir sagen, „es gibt Menschen“, so bedeutet das, daß die Satz funkti on „x ist ein Mensch“ manchmal wahr ist. Mit der Behauptung „einige Menschen sind Griechen“ meinen wir: die Satzfunktion „x ist ein Mensch und ein Grieche“ ist manchmal wahr. Sagen wir „es gibt noch Menschenfresser in Afrika“, so bedeutet das: die Satzfunktion „x ist ein Menschenfresser, der jetzt in Afrika lebt“ ist manchmal wahr, d. h. wahr für einige Werte von x. „Es gibt wenigstens n Individuen in der Welt“ bedeutet, daß die Satzfunktion „α ist eine Menge von Individuen und ein Element der Kardinalzahl n“ manchmal wahr ist, oder wie wir sagen können,
177
füf gewisse Werte von α richtig ist. Diese Ausdrucksweise paßt besser, wenn es sich darum handelt, den veränderlichen Bestandteil zu bezeichnen, der das Argument unserer Satzfunktion bilden soll. Die obige Satzfunktion z. B., die wir kurz ausdrücken wollen „α ist eine Menge mit n Individuen“, enthält zwei Veränderliche, α und n. Das Axiom der Unendlichkeit lautet in der Sprache der Satzfunktionen: Die Satzfunktion „wenn n eine induktive Zahl ist, so ist es für einige Werte von α richtig, daß α eine Menge von n Individuen ist“ ist für alle möglichen Werte von n wahr. Hier tritt eine untergeordnete Funktion „α ist eine Menge von n Individuen“ auf, von der gesagt wird, daß sie hinsichtlich α manchmal wahr ist; und von der Behauptung, daß dies eintritt, wenn n eine induktive Zahl ist, wird hinsichtlich n gesagt, daß sie immer wahr ist. Die Behauptung, daß eine Funktion φ(x) immer wahr ist, ist die Negation der Behauptung, daß Nicht-φ(x) manchmal wahr ist, und die Behauptung, daß φ(x) manchmal wahr ist, ist die Negation der Behauptung, daß Nicht-φ(x) immer wahr ist. So ist die Aussage „alle Menschen sind sterblich“ die Negation der Behauptung, daß die Funktion „x ist ein nichtsterblicher Mensch“ manchmal wahr ist. Und die Aussage „es gibt Einhorne“ ist die Negation der Behauptung, daß die Funktion „x ist kein Einhorn“ immer wahr ist1). Mit φ(x) ist „niemals wahr“ oder „immer falsch“ meinen wir, daß Nicht-φ(x) stets wahr ist. Wir können von „immer“ und „manchmal“ eines als Grundbegriff auswählen und das andere mittels dieses einen und der Negation definieren. Wählen wir etwa „manchmal“ als Grundbegriff, so können wir definieren: „φ(x) ist immer wahr“ soll bedeuten, „es ist falsch, daß Nicht-φ(x) manchmal wahr ist.“ Aber aus Gründen, die mit der Theorie der Typen zusammenhängen, scheint es korrekter, sowohl „immer“ wie „manchmal“ zu Grundbegriffen zu wählen und init ihrer Hilfe die Negation von Sätzen, in denen sie auftreten, zu definieren. D. h. nehmen wir an, daß wir schon die Negation von Sätzen vom Typus x definiert (oder zum Grundbegriff genommen) haben, dann definieren wir: die Negation von „φ(x) ist stets wahr“ ist „Nicht-φ(x) 1
) Die Ableitung wird in den Principia Mathematica Bd. I, Sat7. 9 gegeben.
178
ist manchmal wahr“ und die Negation von φ(x) ist manchmal wahr“ ist ,,Nicht-φ(x) ist immer wahr“. Ähnlich können wir rückwärts die Disjunktion und die anderen Wahrheitsfunktionen, soweit sie sich auf Sätze mit scheinbaren Veränderlichen beziehen, mit Hilfe von Definitionen und Grundbegriffen für Sätze definieren, in denen keine scheinbaren Veränderlichen auftreten. Sätze ohne scheinbare Veränderliche heißen „elementare Sätze“. Von diesen können wir Schritt für Schritt nach den soeben angedeuteten Methoden zur Theorie der Wahrheitsfunktionen aufsteigen, die sich auf Sätze mit ein, zwei, drei, … n Veränderlichen (wo n irgend eine bestimmte endliche Zahl ist) beziehen. Die Formen, die in der üblichen formalen Logik als die einfachsten angesehen werden, sind es keineswegs. Jede enthält die Behauptung aller Werte oder einiger Werte einer zusammengesetzten Satzfunktion. Nehmen wir z. B. „alle S sind P“. Sei S durch eine Satzfunktion φ(x) und P durch eine Satzfunktion ψ(x) definiert. Wenn z. B. S Menschen bedeutet, so ist φ(x) „x ist menschlich“; bedeutet P Sterbliche, dann lautet ψ(x) „es gibt einen Zeitpunkt, wo x stirbt“. „Alle S sind P“ bedeutet dann: „Aus φ(x) folgt ψ(x)“ ist immer wahr. Man wird bemerken, daß „alle S sind P“ nicht nur für solche Elemente gilt, die tatsächlich S’s sind; es wird auch etwas ausgesagt, über Elemente, die keine S’s sind. Nehmen wir an, es kommt uns ein x in den Weg, von dem wir nicht wissen, ob es ein S ist oder nicht; unsere Behauptung „alle S sind P“ sagt uns trotzdem etwas über x aus, nämlich, daß x ein P ist, wenn x ein S ist, und das ist genau so richtig, wenn x kein S ist, wie wenn es ein S ist. Wenn es in beiden Fällen nicht gleich richtig wäre, so wäre die reductio ad absurdum keine gültige Methode; denn sie besteht im wesentlichen in der Benutzung von Implikationen in Fällen, wo die Voraussetzung (wie sich später herausstellt) falsch ist. Wir können es auch anders wenden. Um den Ausdruck „alle S sind P“ zu verstehen, braucht man nicht die Elemente S aufzählen zu können; wissen wir, was ein S oder ein P bedeutet, so können wir vollständig verstehen, was tatsächlich mit „alle S sind P“ behauptet wird, auch wenn wir
179
von den wirklichen einzelnen S und P noch so wenig wissen. Dies beweist, daß nicht nur die wirklichen S in der Behauptung „alle S sind P“ eine Rolle spielen, sondern alle diejenigen Elemente, bei denen die Voraussetzung, sie seien S sinnvoll ist, also alle S’s so wie alle Nicht-S’s – mithin alles, was zu dem entsprechenden logischen „Typus“ gehört. Was von dem Auftreten des Wortes alle gilt, gilt auch von dem Wort einige. „Es gibt Menschen“ z. B. bedeutet, daß „x ist menschlich“ für einige Werte von x wahr ist. Hier kommen alle Werte von x in Frage (d. h. alle Werte, die der Behauptung „x ist menschlich“ eine Bedeutung verleihen, gleichgültig, ob sie wahr oder falsch ist), nicht nur diejenigen, die tatsächlich Menschen sind. (Dies wird deutlich, wenn wir beweisen wollten, daß eine derartige Behauptung falsch ist.) Jede Behauptung mit „alle“ oder „einige“ bezieht sich somit nicht nur auf die Argumente, die eine gewisse Funktion wahr machen, sondern auf alle, die sie sinnvoll machen, also auf alle, für die sie überhaupt einen Wert hat, sei er wahr oder falsch. Wir können nun in unserer Erläuterung der üblichen Formen der altmodischen formalen Logik fortfahren. Mit S bezeichnen wir diejenigen Elemente x, für die φ(x) wahr ist, mit P diejenigen, für die ψ(x) wahr ist. (In einem späteren Kapitel werden wir sehen, daß alle Mengen so aus Satzfunktionen abgeleitet werden.) Dann gilt: „Alle S sind P“ bedeutet: „,aus φ(x) folgt ψ(x)‘ ist immer wahr“. „Einige S sind P“ bedeutet: „,φ(x) und ψ(x)‘ ist manchmal wahr“. „Kein S ist ein P“ bedeutet: „,aus φ(x) folgt Nicht-(ψx)‘ ist immer wahr“. „Einige S sind keine P“ bedeutet: „,φ(x) und Nicht-(ψx)‘ ist manchmal wahr“. Man wird bemerken, daß nicht φ(x) und ψ(x) die Satzfunktionen sind, die hier für alle oder einige Werte behauptet werden, sondern Wahrheitsfunktionen von φ(x) und ψ(x) mit dem g l e i c h e n Argument x. Was damit gemeint ist, macht man sich am einfachsten klar,
180
wenn man nicht von dem allgemeinen φ(x) und ψ(x) ausgeht, sondern von φ(a) und ψ(a), wo a irgend eine Konstante ist. Betrachten wir z. B. „alle Menschen sind sterblich“. Wir beginnen mit: „Wenn Sokrates menschlich ist, dann ist Sokrates sterblich“, und setzen dann überall, wo „Sokrates“ vorkommt, dafür eine Veränderliche x ein. Obgleich x eine unbestimmte Veränderliche bleibt, muß trotzdem sichergestellt werden, daß sie in „φ(x)“ wie in „ψ(x)“ den gleichen Wert hat, wenn wir behaupten, daß „aus φ(x) folgt ψ(x)“ immer wahr ist. Zu diesem Zwecke gehen wir besser von einer Funktion aus, deren Werte sich so verhalten wie „aus φ(a) folgt φ(a)“ und nicht von zwei einzelnen Funktionen φ(x) und ψ(x); denn im letzten Falle sind wir niemals sicher, daß das x, weil es unbestimmt bleibt, in beiden Funktionen denselben Wert hat. Der Kürze halber sagen wir „aus φ(x) folgt immer ψ(x)“ anstatt: „aus φ(x) folgt ψ(x) ist immer wahr“. Sätze der Form „aus φ(x) folgt immer φ(x)α heißen „formale Implikationen“; die gleiche Bezeichnung wird auch bei mehreren Veränderlichen verwendet. Die obigen Definitionen zeigen, daß solche Sätze wie „alle S sind P“, mit denen die traditionelle Logik beginnt, keineswegs die einfachste Form haben. Es ist bezeichnend für die mangelhafte Analyse der bisherigen Logik, daß sie „alle S sind P“ als einen Satz von der gleichen Form wie „x ist ein P“ ansieht. Sie behandelt also „alle Menschen sind sterblich“ als einen Satz von der gleichen Form wie „Sokrates ist sterblich“. Wie wir soeben gesehen haben, ist der erste von der Form „aus φ(x) folgt immer ψ(x)“, während der zweite von der Form „ψ(x)“ ist. Die ausdrückliche Trennung dieser beiden Formen durch Peano und Frege war ein ganz wesentlicher Fortschritt der symbolischen Logik. Man sieht, daß „alle S sind P“ und „kein S ist ein P“ sich eigentlich der Form nach nicht unterscheiden. Es ist nur Nicht-φ(x) für ψ(x) eingesetzt worden. Ebenso verhält es sich mit „einige S sind P“ und „einige S sind nicht P“. Man wird auch bemerken, daß die üblichen Formen der Umkehrung fehlerhaft sind, wenn man sich auf den einzig technisch erträglichen Standpunkt stellt, daß Sätze
181
wie „alle S sind P“ nicht die „Existenz“ von S’s nach sich ziehen, d. h. nicht verlangen, daß es Elemente S gibt. Die obigen Definitionen führen zu dem Resultat, daß, wenn φ(x) immer falsch ist, d. h. wenn es keine S’s gibt, dann die beiden Behauptungen, „alle S sind P“ und „kein S ist ein P“ gleichzeitig wahr sind, was auch immer P ist. Denn nach der Definition des vorigen Kapitels bedeutet „aus φ(x) folgt ψ(x)“, „Nicht-φ(x) oder ψ(x)“, und das ist immer wahr, wenn Nicht-φ(x) immer wahr ist. Im ersten Augenblick könnte dieses Ergebnis bei dem Leser den Wunsch aufkommen lassen, man solle für beides nicht die gleiche Definition geben, aber eine geringe praktische Erfahrung zeigt bald, daß zwei verschiedene Definitionen unzweckmäßig wären und die wichtigen Begriffe verschleiern würden. Der Satz „aus φ(x) folgt immer ψ(x) und φ(x) ist manchmal wahr“ ist wesentlich zusammengesetzter Natur, und es wäre sehr ungeschickt, ihn als Definition von „alle S sind P“ hinzustellen; denn dann hätten wir keinen Ausdruck mehr für „aus q>(x) folgt immer y(x)“, was hundertmal öfter gebraucht wird. Bei unseren Definitionen jedoch folgt aus „alle S sind P“ nicht „einige S sind P“, da die erste Behauptung die Nichtexistenz von S zuläßt, die zweite aber nicht. Somit wird die Umkehrung per accidens ungültig und einige Formen des Syllogismus sind hinfällig, z.B. Darapti: „Alle M sind S, alle M sind P, somit sind einige S P“ ist ungültig, wenn es keine M gibt. Der Begriff der „Existenz“ tritt in verschiedenen Formen auf, von denen uns eine im nächsten Kapitel beschäftigen wird. Aber die Grundform läßt sich unmittelbar aus dem Begriff „manchmal wahr“ herleiten. Wir sagen ein Argument a „befriedigt“ eine Funktion φ(x), wenn ψ(a) wahr ist. Das hat denselben Sinn wie die Behauptung, eine Gleichung wird durch ihre Wurzeln befriedigt. Wenn nun φ(x) manchmal wahr ist, so können wir sagen, daß es x’s gibt, für die φ(x) wahr ist, oder wir können sagen, „es e x i s t i e r e n Argumente, die φ(x) befriedigen“. Das ist die grundlegende Bedeutung des Wortes „Existenz“. Die anderen Bedeutungen sind entweder daraus abgeleitet oder führen bloß zu einer Begriffsverwirrung. Es ist korrekt zu sagen „es gibt Menschen“, wenn wir darunter verstehen, daß „x ist ein
182
Mensch“ manchmal wahr ist. Aber der Pseudo-Syllogismus: „es gibt Menschen, Sokrates ist ein Mensch, also existiert Sokrates“ ist Unsinn, da „Sokrates“ nicht wie „Mensch“ ein unbestimmtes Argument einer gegebenen Satzfunktion ist. Es handelt sich um einen ziemlich ähnlichen Trugschluß wie bei der Argumentation: „Die Menschen sind zahlreich, Sokrates ist ein Mensch, also ist Sokrates zahlreich.“ In diesem Falle ist die Unsinnigkeit der Schlußfolgerung offenbar, aber im Falle der Existenz ist dies aus Gründen, die erst im nächsten Kapitel deutlich zutage treten werden, nicht so klar. Für den Augenblick wollen wir bloß die Tatsache feststellen, daß man zwar korrekterweise behaupten darf „es existieren Menschen“, daß es aber nicht korrekt oder vielmehr bedeutungslos ist, einem gegebenen besonderen Wert x, der zufällig ein Mensch ist, eine Existenz zuzuschreiben. Allgemein: „es existieren Elemente, die φ(x) befriedigen“ bedeutet „φ(x) ist manchmal wahr“; aber „a existiert“ (wo a ein Element ist, das φ(x) befriedigt,) ist ein bedeutungsloses Wortgebilde. Vergegenwärtigt man sich diesen einfachen Trugschluß, so wird man viele alte philosophische Rätsel über die Bedeutung der Existenz auflösen können. Auch bei anderen Begriffen hat die Philosophie ein heilloses Durcheinander dadurch angerichtet, daß sie Sätze und Satzfunktionen nicht in genügendem Maße auseinanderzuhalten verstand. Es handelt sich um die „Modalitäts“begriffe: n o t w e n d i g , m ö g l i c h , und u n m ö g l i c h . Nach der traditionellen Ansicht sind die wahren Sätze notwendig oder nur möglich (assertorisch); die falschen Sätze hingegen unmöglich (nämlich dann, wenn ihr Gegenteil notwendig ist) oder nur zufällig nicht richtig. In Wirklichkeit hat man sich aber niemals klar Rechenschaft gegeben, was durch die Einführung des Notwendigkeitsbegriffes noch zum Wahrheitsbegriff hinzugefügt wurde. Bei den Satzfunktionen ist die Dreiteilung klar. Der unbestimmte Wert „φ(x)“ einer gewissen Satzfunktion ist n o t w e n d i g , wenn die Funktion stets wahr ist, m ö g l i c h , wenn sie manchmal wahr und u n m ö g l i c h , wenn sie niemals wahr ist. Dieser Fall tritt z. B. in der Wahrscheinlichkeitsrechnung auf. Angenommen, aus einer Urne, die eine Anzahl Kugeln enthält,
183
werde eine Kugel x gezogen: sind alle Kugeln weiß, dann ist „x ist weiß“ notwendig; sind einige weiß, so ist es möglich; ist keine weiß, so ist es unmöglich. Man weiß hier von x nur, daß es einer gewissen Satzfunktion genügt, nämlich „x war eine Kugel in der Urne“. Dieser Fall liegt allgemein bei Wahrscheinlichkeitsproblemen vor und auch öfters im praktischen Leben z. B. wenn uns jemand besucht, von dem wir nur wissen, daß er einen Empfehlungsbrief von einem unserer Freunde bringt. In allen derartigen Fällen, wie überhaupt bei allem, was mit Modalität zu tun hat, ist die Satzfunktion von Wichtigkeit. Für ein klares Denken ist es auf sehr vielen Gebieten von der allergrößten Bedeutung, sich an die scharfe Trennung von Satzfunktionen und Sätzen zu gewöhnen. Es ist eine Schande für die Philosophie, daß sie das bisher nicht zustande gebracht hat.
16. Beschreibungen Wir behandelten im vorigen Kapitel die Worte a l l e und e i n i g e ; in diesem Kapitel werden wir das Wort d e r (d.h. den Artikel in der Einzahl) und im nächsten Kapitel das Wort d i e (d. h. den Artikel in der Mehrzahl) betrachten.Man könnte meinen, es sei übertrieben, einem Wort ein ganzes Kapitel zu widmen, aber für den philosophischen Mathematiker handelt es sich um zwei Worte von sehr großer Bedeutung: ich würde mich mit der Lehre von diesem Wort, wie Brownings Grammatiker mit der Partikel δε, noch beschäftigen, selbst wenn ich auf dem letzten Loch pfeifen würde, und nicht bloß im Gefängnis säße. Wir haben schon gelegentlich die „beschreibenden Funktionen“ erwähnt, d. h. Ausdrücke wie „der Vater von x“ oder der Sinus von x“. Diese Ausdrücke sind definierbar, falls man zuerst die „Beschreibungen“ definiert hat. Eine Beschreibung kann zweierlei Art sein, bestimmt oder unbestimmt (mehrdeutig). Eine unbestimmte Beschreibung ist eine Redensart von der Form „ein Soundso“; eine bestimmte Beschreibung hat die Form „der Soundso“. Beginnen wir mit der ersten Form. „Wen hast du getroffen?“ „Ich traf einen Menschen.“ „Das ist eine sehr unbestimmte Beschreibung.“ Wir gehen also bei unserer Terminologie nicht vom gewöhnlichen Sprachgebrauch aus. Unsere Frage ist: was behaupte ich eigentlich, wenn ich sage, „ich traf einen Menschen“? Nehmen wir für den Augenblick an, daß meine Behauptung wahr ist, und daß ich tatsächlich Hans getroffen habe. Es ist klar, ich behaupte nicht „ich traf Hans“. Ich kann sagen „ich traf einen Menschen, aber es war nicht Hans“; dann lüge ich zwar, aber
185
ich widerspreche mir nicht selbst, was der Fall wäre, wenn ich mit der Behauptung, ich traf einen Menschen, sagen wollte, daß ich Hans getroffen habe. Es ist auch klar, daß derjenige, zu dem ich so spreche, mich verstehen kann, auch wenn er ein Fremder ist und niemals etwas von Hans gehört hat. Aber wir können weiter gehen: nicht bloß Hans, sondern überhaupt kein wirklicher Mensch geht in meine Behauptung ein. Dies ergibt sich sofort, wenn die Behauptung falsch ist. Denn dann gibt es keinen Grund, Hans vor irgend jemand anders zu bevorzugen. In der Tat behält die Behauptung eine Bedeutung, obgleich sie möglicherweise nicht richtig ist, selbst, wenn es überhaupt keine Menschen gäbe. „Ich traf ein Einhorn“ oder „ich traf eine Seeschlange“ ist eine vollkommen sinnvolle Behauptung, wenn wir wissen, was ein Einhorn oder eine Seeschlange sein soll, d. h. wie die Definition dieser Fabeltiere lautet. Somit geht nur die Idee, wie wir es nennen können, in unseren Satz ein. Beim „Einhorn“ z. B. handelt es sich nur um die Idee: es gibt nicht noch ein schattenhaftes, unwirkliches Etwas, das man „ein Einhorn“ nennen kann. Daher ist es klar, daß der Satz „ich traf ein Einhorn“, weil er eine Bedeutung hat (obwohl er falsch ist), bei richtiger Analyse nicht einen Bestandteil „ein Einhorn“ enthält, obgleich die Idee „Einhorn“ in ihm enthalten ist. Die Frage der „Unwirklichkeit“, die uns an dieser Stelle entgegentritt, ist sehr wichtig. Der größte Teil der Logiker hat, irregeführt durch die Grammatik, diese Frage verkehrt behandelt. Sie betrachteten die grammatische Form als Führerin durch die Analyse und hielten sie für zuverlässiger als sie tatsächlich ist. Sie erkannten nicht, welche Unterschiede der grammatischen Form von Wichtigkeit sind. „Ich traf Hans“ und „ich traf einen Menschen“ werden gewöhnlich als Sätze der gleichen Form angesehen, während sie in Wirklichkeit von ganz verschiedener Form sind: der erste Satz macht eine wirkliche Person, Hans, namhaft, während der zweite eine Satzfunktion enthält und explizit lautet: Die Funktion „ich traf x und x ist menschlich“ ist manchmal wahr. (Man wird sich daran erinnern, daß nach Vereinbarung unter „manchmal“ nicht notwendig mehr als einmal zu verstehen
186
ist.) Dieser Satz ist offensichtlich nicht von der Form „ich traf x“, die die Existenz des Satzes „ich traf ein Einhorn“ rechtfertigt, obwohl es nichts derartiges wie „ein Einhorn“ gibt. Manche Logiker, denen der Apparat der Satzfunktionen nicht zu Gebote stand, haben sich dazu entschlossen, unwirkliche Objekte einzuführen, z. B. behauptet Meinong1), daß wir von „den goldenen Bergen“, „dem runden Quadrat“ usw. sprechen können; wir können mit diesen Subjekten wahre Sätze aufstellen; daher müssen sie eine Art logische Existenz besitzen, da sonst die Sätze, in denen sie auftreten, bedeutungslos wären. Bei derartigen Theorien scheint mir ein Mangel an Wirklichkeitssinn vorzuliegen, wie er auch bei den abstraktesten Betrachtungen vorhanden sein sollte. Ich möchte behaupten, daß die Logik ebensowenig ein Einhorn zulassen darf, wie die Zoologie; denn die Logik befaßt sich geradesogut mit der realen Welt wie die Zoologie, wenn auch mit ihren abstrakteren und allgemeineren Eigenschaften. Es ist eine jammervolle und armselige Ausrede, wenn man sagt, daß Einhorne in der Wappenkunde oder in der Literatur oder in der Phantasie vorkommen. In der Wappenkunde gibt es kein Tier aus Fleisch und Blut, das aus eigener Kraft atmet und sich bewegt. Es gibt nur eine Abbildung oder eine Beschreibung in Worten. Ebenso will man mit der Behauptung, daß z. B. Hamlet in seiner eigenen Welt, nämlich in der Welt der Shakespeareschen Phantasie lebt, gerade so wie (sagen wir) Napoleon in der gewöhnlichen Welt, absichtlich Konfusion hervorbringen, oder der Betreffende ist selbst unglaublich konfus. Es gibt nur eine Welt, die „wirkliche“ Welt: Shakespeares Phantasie gehört dazu, und die Gedanken, die er beim Verfassen von Hamlet hatte, sind wirklich. Ebenso die Gedanken, die wir beim Lesen des Stückes haben. Darin besteht das eigentliche Wesen der Fiktion: nur die Gedanken, Gefühle usw. bei Shakespeare und seinen Lesern sind real, und es gibt nicht noch außerdem einen objektiven Hamlet. Wenn man auch alle Gefühle, die Napoleon bei Geschichtsschreibern und Geschichtslesern geweckt hat, zusammennimmt, so gelangt man 1
) Untersuchungen zur Gegenstandstheorie und Psychologie, 1904.
187
nicht zu dem wirklichen Menschen; aber bei Hamlet hat man ihn vollständig erreicht. Hätte niemand sich in Gedanken mit Hamlet beschäftigt, dann bliebe nichts von ihm übrig; hätte sich niemand in seinen Gedanken mit Napoleon befaßt, so würde er bald dafür gesorgt haben, daß jemand es tut. Der Sinn für Wirklichkeit ist für die Logik eine Lebensfrage. Die Taschenspielerei, die uns einreden will, daß Hamlet eine andere Art Wirklichkeit besitzt, leistet dem Denken einen schlechten Dienst. Bei der Durchführung einer Analyse von Sätzen mit Einhornen, goldenen Bergen, runden Quadraten und anderen derartigen Pseudo-Objekten braucht man einen sehr robusten Wirklichkeitssinn. Wenn wir dem Wirklichkeitsgefühl folgen, so müssen wir bei der Analyse von Sätzen darauf bestehen, daß nichts „Unwirkliches“ zugelassen wird. Aber hinterher können wir doch die Frage auf werfen, wenn es nichts Unwirkliches g i b t , wie k o n n t e n wir dann irgend etwas Unwirkliches zulassen? Die Antwort lautet: Bei der Behandlung von Sätzen haben wir es in erster Linie mit Symbolen zu tun, und wenn Gruppen von Symbolen ohne Bedeutung eine Bedeutung zugeschrieben wird, so begehen wir den Irrtum, Unwirklichkeiten zuzulassen. Unwirklichkeiten in dem einzig möglichen Sinn, nämlich in der Form beschriebener Objekte. In dem Satz „Ich traf ein Einhorn“ bilden die ganzen vier Worte zusammen einen sinnvollen Satz und das Wort „Einhorn“ allein hat eine Bedeutung, genau so wie das Wort „Mensch“, aber die z w e i Worte „ein Einhorn“ bilden keine Teilgruppe, die für sich eine Bedeutung hat. Wenn wir dann fälschlicherweise diesen beiden Worten eine Bedeutung zuschreiben, so halsen wir uns „ein Einhorn“ und das Problem auf, wie so ein Ding in einer Welt vorkommen kann, in der es keine Einhorne gibt. „Ein Einhorn“ ist eine unbestimmte Beschreibung, die nichts beschreibt; nicht aber eine unbestimmte Beschreibung, die etwas Unwirkliches beschreibt. Ein derartiger Satz wie „x ist unwirklich“ hat nur dann eine Bedeutung, wenn „x“ eine bestimmte oder unbestimmte Beschreibung ist, in diesem Fall ist der Satz wahr, wenn „x“ eine Beschreibung ist, die nichts beschreibt. Aber die Beschreibung „x“ (gleichgültig, ob sie etwas oder nichts beschreibt) ist auf keinen
188
Fall ein Bestandteil des Satzes, in dem sie auftritt; wie soeben „ein Einhorn“, ist sie eine Teilgruppe, die für sich keine Bedeutung hat. All das folgt aus der Tatsache, daß, wenn „x“ eine Beschreibung ist, „x ist unwirklich“ oder „x existiert nicht“ kein Unsinn ist, sondern stets einen Sinn hat und manchmal wahr ist. Wir können nun daran gehen, ganz allgemein die Bedeutung von Sätzen mit mehrdeutigen Beschreibungen zu definieren. Nehmen wir an, daß wir eine Behauptung über „ein Soundso“ machen wollen, wo die „Soundsos“ Objekte mit einer gewissen Eigenschaft φ sind, d. h. Objekte x, für die die Satzfunktion φ(x) wahr ist (wenn z. B. „ein Mensch“ das „ein Soundso“ ist, so ist φ(x) „x ist menschlich“). Behaupten wir, „ein Soundso“ hat die Eigenschaft ψ, so wollen wir damit ausdrücken, daß „ein Soundso“ diejenige Eigenschaft hat, die x besitzt, wenn ψ(x) wahr ist. (Z. B. bei „ich traf einen Menschen“ lautet ψ(x) „ich traf x“). Nun hat der Satz, daß „ein Soundso“ die Eigenschaft ψ hat, nicht die Form „ψ(x)“. Wäre das der Fall, so könnte „ein Soundso“ für eine geeignetes x mit x identisch werden; und obwohl dies (in einem gewissen Sinn) in einigen Fällen zutreffen kann, so ist es gewiß nicht richtig bei Beispielen wie „ein Einhorn“. Gerade der Umstand, daß die Behauptung, ein Soundso hat die Eigenschaft ψ, nicht die Form ψ(x) hat, macht es möglich, daß „ein Soundso“ in einem gewissen klar definierbaren Sinn „unwirklich“ ist. Die Definition lautet folgendermaßen: Die Behauptung „ein Objekt mit der Eigenschaft φ hat die Eigenschaft ψ“ bedeutet: „die gleichzeitige Behauptung von φ(x) und ψ(x) ist nicht immer falsch“. Soweit die Logik in Frage kommt, ist dies der gleiche Satz, wie „einige φ’s sind ψ’s“; aber sprachlich besteht ein Unterschied, weil im ersten Fall die Einzahl, im andern die Mehrzahl vorkommen wird. Das ist aber nicht die Hauptsache. Der wichtige Punkt besteht darin, daß bei richtiger Analyse Sätze, in denen dem Wortlaute nach „ein Soundso“ vorkommt, keinen Bestandteil enthalten, der durch diesen
189
Ausdruck dargestellt wird. Aus diesem Grunde können solche Sätze eine Bedeutung haben, selbst wenn es kein Soundso gibt. Die Definition der E x i s t e n z , angewandt auf mehrdeutige Beschreibungen, ergibt sich aus dem am Schlüsse des vorigen Kapitels Gesagten. Wir sagen „Menschen existieren“ oder „ein Mensch existiert“, wenn die Satzfunktion „x ist menschlich“ manchmal wahr ist; allgemein existiert „ein Soundso“, wenn „x ist ein Soundso“ manchmal wahr ist. Wir können dies anders formulieren. Der Satz „Sokrates ist ein Mensch“ ist zweifellos ä q u i v a l e n t mit „Sokrates ist menschlich“, aber es ist nicht genau der gleiche Satz. Das i s t in „Sokrates ist menschlich“ drückt die Beziehung zwischen Subjekt und Prädikat aus; das i s t in „Sokrates ist ein Mensch“ die Identität. Es ist eine Schande für das Menschengeschlecht, daß es das gleiche Wort „ist“ für diese beiden vollständig verschiedenen Begriffe gebraucht – eine Schande, die die symbolische logische Sprache natürlich wieder gut macht. Die Identität in „Sokrates ist ein Mensch“ besteht zwischen einem benannten Objekt (wir sehen „Sokrates“ als einen Namen an, was später noch eingeschränkt werden wird) und einem mehrdeutig beschriebenen Objekt. Ein mehrdeutig beschriebenes Objekt „existiert“, wenn wenigstens ein derartiger Satz wahr ist, d. h., wenn es wenigstens einen wahren Satz gibt von der Form „x ist ein Soundso“, wo „x“ ein Name ist. Es ist für die mehrdeutigen (im Gegensatz zu den bestimmten) Beschreibungen charakteristisch, daß es eine ganze Anzahl wahrer Sätze der obigen Form geben kann – Sokrates ist ein Mensch, Plato ist ein Mensch usw. Aus jedem dieser Sätze folgt „es existiert ein Mensch“. Bei bestimmten Beschreibungen aber kann die entsprechende Satzform, nämlich „x ist der Soundso“ (wo „x“ ein Name ist) höchstens für einen Wert von x wahr sein. Diese Bemerkung leitet zu den bestimmten Beschreibungen über, die in ähnlicher Weise wie die unbestimmten Beschreibungen, aber etwas komplizierter zu definieren sind. Wir kommen nun zum Hauptgegenstand des gegenwärtigen Kapitels, der Definition des Wortes d e r (Artikel in der Einzahl). Ein sehr wichtiger Punkt der Definition von „ein Soundso“ ist auch
190
bei der Definition von „der Soundso“ von Bedeutung; die gesuchte Definition ist eine Definition der Sätze, in denen dieser Ausdruck vorkommt, nicht eine Definition des isolierten Ausdrucks selbst. Bei „ein Soundso“ ist das völlig klar: niemand kann „ein Mensch“ als ein bestimmtes Objekt ansehen, das allein für sich definiert werden kann. Sokrates ist ein Mensch, Plato ist ein Mensch, Aristoteles ist ein Mensch. Wir können aber nicht schließen, „ein Mensch“ sei dasselbe wie „Sokrates“, und auch dasselbe wie „Plato“ und ebenso dasselbe wie „Aristoteles“, da doch diese drei Namen verschiedene Bedeutungen haben. Selbst wenn wir alle Menschen der Welt aufgezählt hätten, so bliebe nichts übrig, von dem wir sagen könnten: dies ist ein Mensch, und nicht bloß das, sondern dies ist d e r „ein Mensch“, die Quintessenz desjenigen, was gerade einen unbestimmten Menschen darstellt, ohne irgend ein bestimmter Mensch zu sein. Es besteht natürlich kein Zweifel darüber, daß jedes Ding auf der Welt bestimmt ist: wenn es ein Mensch ist, so ist es ein bestimmter Mensch und nicht irgend ein anderer. Somit ist es unmöglich, ein Wesen „ein Mensch“ in der Welt ausfindig zu machen, das den Gegensatz zum speziellen Menschen bilden würde und demgemäß ist es natürlich, nicht „ein Mensch“ selbst, sondern nur die Sätze, in denen dieser Ausdruck vorkommt, zu definieren. Die gleiche Bemerkung trifft bei der Ausdrucksweise „der Soundso“ zu, wenn es auch auf den ersten Blick nicht so offensichtlich ist. Wir wollen den Nachweis dafür erbringen, indem wir den Unterschied zwischen einem N a m e n und einer b e s t i m m t e n B e s c h r e i b u n g näher betrachten. Nehmen wir den Satz „Scott ist der Verfasser von Waverley“. Hier kommt ein Name „Scott“ und eine Beschreibung „der Autor von Waverley“ vor und von beiden wird behauptet, daß sie sich auf dieselbe Person beziehen. Die Unterscheidung zwischen einem Namen und allen anderen Symbolen soll folgendermaßen erklärt werden: Ein Name ist ein einfaches Symbol, das etwas bedeutet, das nur als Subjekt auftreten kann, also was wir im 13. Kapitel als „Individuum“ definiert haben. Ein einfaches Symbol ist dadurch gekennzeichnet,
191
daß es nicht aus Teilen besteht, die ihrerseits Symbole sind. „Scott“ ist ein einfaches Symbol. Es besteht zwar aus Teilen (nämlich aus den einzelnen Buchstaben), aber diese Teile sind keine Symbole. Hingegen ist „der Verfasser von Waverley“ kein einfaches Symbol, denn die einzelnen Worte, aus denen der Ausdruck besteht, sind Symbole. Wenn es auch vielleicht möglich ist, weiter zu analysieren, was ein „Individuum“ zu sein s c h e i n t , so werden wir uns hier mit den (wie wir sie nennen wollen) „relativen Individuen“ begnügen. Dies sollen Elemente sein, die in dem ganzen fraglichen Zusammenhang niemals zergliedert werden und nur als Subjekte auftreten. In diesem Falle beschränken wir uns entsprechend auf „relative Namen“. Vom Standpunkt unseres gegenwärtigen Problems der Definition der Beschreibung aus brauchen wir uns nicht um die Frage zu kümmern, ob es absolute oder nur relative Namen gibt; denn hierbei handelt es sich um verschiedene Stufen in der Hierarchie der „Typen“. Hier haben wir dagegen nur zwei solche Dinge wie „Scott“ und „der Verfasser von Waverley“ zu vergleichen, die sich beide auf dasselbe Objekt beziehen, so daß dabei das Problem der Typen nicht auftritt. Deshalb dürfen wir für den Augenblick die Namen als etwas Absolutes behandeln; von dieser Annahme wird nirgends Gebrauch gemacht werden; dadurch wird nur die Ausdrucksweise etwas vereinfacht. Wir haben somit zwei Dinge zu vergleichen: 1. ein N a m e , der ein einfaches Symbol ist, das direkt ein Individuum bezeichnet, das die Bedeutung des Symbols darstellt. Dieses Symbol bewahrt seine Bedeutung auf Grund eigenen Rechts unabhängig von den Bedeutungen aller übrigen Worte. 2. Eine B e s c h r e i b u n g , die aus verschiedenen Worten besteht, deren Bedeutungen schon festgesetzt worden sind. Aus ihnen ergibt sich, was jedesmal als die „Bedeutung“ der Beschreibung anzusehen ist. Ein Satz, in dem eine Beschreibung vorkommt, ist nicht identisch mit dem, was aus dem Satz wird, wenn dafür ein Name eingesetzt wird, selbst dann nicht, wenn der Name dasselbe Objekt benennt, das die Beschreibung beschreibt. „Scott ist der Verfasser
192
von Waverley“ ist doch ein anderer Satz wie „Scott ist Scott“: der erste Satz ist eine Tatsache der Literaturgeschichte, der zweite eine Trivialität. Wenn eine andere Person als Scott für „der Verfasser von Waverley“ eingesetzt wird, so wird der Satz falsch und ist daher sicherlich nicht mehr der gleiche Satz wie vorher. Man könnte dem entgegenhalten, daß unser Satz wesentlich die gleiche Form hat wie (sagen wir) „Scott ist Sir Walter“, wo von zwei Namen gesagt wird, sie bezögen sich auf dieselbe Person. Darauf ist zu antworten: wenn „Scott ist Sir Walter“ tatsächlich bedeuten soll „die Person namens Scott“ ist die Person namens „Sir Walter“, dann werden die Namen als Beschreibungen gebraucht, d. h. das Individuum wird nicht benannt, sondern als diejenige Person beschrieben, die diesen Namen hat. In dieser Weise werden die Namen sehr häufig in der Praxis angewendet. In der Regel wird phraseologisch nicht angedeutet, ob sie in diesem Sinn oder a l s Namen gemeint sind. Wird ein Name direkt gebraucht, nur um das, wovon wir oben gesprochen haben, zu bezeichnen, so ist er nicht ein Teil der behaupteten T a t s a c h e , oder wenn unsere Behauptung zufällig falsch ist, ein Teil der falschen Behauptung: er ist nur ein Teil des Symbolismus, mit dessen Hilfe wir unseren Gedanken Ausdruck verleihen. Um uns auszudrücken, brauchen wir etwas, das beispielsweise in eine fremde Sprache übersetzt werden kann. Es besteht in etwas, das durch die tatsächlichen Worte getragen wird, wovon es aber keinen Teil bildet. Auf der anderen Seite kommt in einem Satz über „die Person namens Scott“ der tatsächliche Name „Scott“ vor und nicht bloß in der Sprache, in der wir die Behauptung ausdrücken. Unser Satz wird geändert, wenn wir dafür „die Person namens ,Sir Walter‘“einsetzen. Wenn wir aber die Namen als Namen anwenden, ist es ganz gleichgültig, ob wir „Scott“ oder „Sir Walter“ sagen, genau so gleichgültig, ob wir unsere Behauptung englisch oder französisch formulieren. Somit ist, solange die Namen als Namen gemeint sind, „Scott ist Sir Walter“ der gleiche triviale Satz wie „Scott ist Scott“. Damit ist der Beweis zu Ende geführt, daß „Scott ist der Verfasser von Waverley“ nicht
193
der gleiche Satz ist wie derjenige, der daraus hervorgeht, wenn man an Stelle von „der Verfasser von Waverley“ irgend einen beliebigen Namen einsetzt. Wenn wir eine Veränderliche gebrauchen und von einer Satzfunktion φ(x) sprechen, dann besteht der Prozeß, allgemeine Aussagen über x auf besondere Fälle anzuwenden in der Substitution eines Namens für den Buchstaben „x“; dabei ist φ eine Funktion, deren Argumente Individuen sind. Sei φ(x) „immer wahr“: es sei z. B. der „Satz von der Identität“ x = x. Wenn wir für „x“ irgend einen beliebigen Namen einsetzen, so erhalten wir einen wahren Satz. Nehmen wir für den Augenblick an, daß „Sokrates“, „Plato“ und „Aristoteles“ Namen sind (eine sehr voreilige Annahme), so können wir aus dem Satz von der Identität schließen, daß Sokrates Sokrates, Plato Plato und Aristoteles Aristoteles ist. Aber wir würden einen Irrtum begehen, wenn wir ohne weitere Prämissen schließen würden: der Verfasser von Waverley ist der Verfasser von Waverley. Denn wenn wir in einem Satz für „der Verfasser von Waverley“ einen Namen substituieren, so verändern wir, wie wir soeben gesehen haben, diesen Satz. D. h. falls wir dieses Ergebnis in unserm Fall anwenden: wenn „x“ ein Name ist, so ist „x = x“ nicht der gleiche Satz, wie „der Verfasser von Waverley ist der Verfasser von Waverley“, ganz gleichgültig, was für ein Name „x“ ist. Wir können daher aus der Tatsache, daß alle Sätze der Form „x = x“ wahr sind, nicht ohne weiteres den Schluß ziehen, daß der Verfasser von Waverley der Verfasser von Waverley ist. In der Tat sind Sätze von der Form „der Soundso ist der Soundso“ nicht immer wahr: es ist notwendig, daß der Soundso existiert (dieser Ausdruck wird alsbald definiert werden). Es ist falsch, daß der gegenwärtige König von Frankreich der gegenwärtige König von Frankreich ist oder daß ein rundes Quadrat ein rundes Quadrat ist. Wenn wir an die Stelle einer Beschreibung einen Namen setzen, können Satzfunktionen, die „immer wahr“ sind, falsch werden, falls die Beschreibung nichts beschreibt. Das ist gar nicht geheimnisvoll, wenn wir uns vergegenwärtigen (wie wir im vorigen Abschnitt bewiesen haben),
194
daß das Einsetzen einer Beschreibung keinen Wert der fraglichen Satzfunktionen ergibt. Wir können jetzt Sätze, in denen eine bestimmte Beschreibung auftritt, definieren. „Der Soundso“ unterscheidet sich von „ein Soundso“ allein durch die Einzigartigkeit. Wir können nicht von „dem Einwohner von London“ sprechen, weil London zu bewohnen ein Attribut ist, das nicht bloß einem einzigen Menschen zukommt. Wir können nicht von „dem gegenwärtigen König von Frankreich“ sprechen, weil es keinen gibt; wohl aber von „dem gegenwärtigen König von England“. Somit enthalten Sätze mit „der Soundso“ stets die entsprechenden Sätze mit „ein Soundso“ mit dem Zusatz, daß es nicht mehr als einen Soundso gibt. Ein Satz wie „Scott ist der Verfasser von Waver-ley“ könnte nicht wahr sein, falls der Roman Waverley nie mals geschrieben worden wäre oder wenn er verschiedene Verfasser hätte; ebenso verhält es sich mit jedem anderen Satz, der aus einer Satzfunktion von x durch die Substitution von „der Verfasser von Waverley“ für „x“ hervorgeht. Man kann sagen, „der Verfasser von Waverley“ bedeutet: der Wert von x, für welchen „x schrieb Waverley“ wahr ist. Somit ist z. B. in dem Satz „der Verfasser von Waverley war ein Schotte“ folgendes enthalten: (1) „x schrieb Waverley“ ist nicht immer falsch; (2) „wenn x und y Waverley schrieben, so sind x und y identisch“ ist immer wahr; (3) „wenn x Waverley schrieb, so war x ein Schotte“ ist immer wahr. Diese drei Sätze lauten in gewöhnlicher Ausdrucks weise: (1) wenigstens eine Person schrieb Waverley; (2) höchstens eine Person schrieb Waverley; (3) wer immer auch Waverley schrieb, war ein Schotte. Diese drei Sätze sind in „der Verfasser von Waverley war ein Schotte“ enthalten. Umgekehrt folgt aus den drei Sätzen zusammen (aber nicht aus zwei von ihnen), daß der Autor von Waverley ein Schotte war. Daher können die drei Sätze als Definition der Bedeutung des Satzes „der Verfasser von Waverley war ein Schotte“ angesehen werden.
195
Wir können diese drei Sätze etwas vereinfachen. Der erste und zweite sind äquivalent mit: es gibt ein Element c derart, daß „x schrieb Waverley“ wahr ist, wenn x das c ist, und falsch, wenn x nicht c ist. Mit anderen Worten: es gibt ein Element c derart, daß „x schrieb Waverley“ immer äquivalent ist mit „x ist c“. (Zwei Sätze sind „äquivalent“, wenn beide wahr oder beide falsch sind.) Wir haben hier zuerst zwei Funktionen von x: „x schrieb Waverley“ und „x ist c“ und bilden dann eine Funktion von c, indem wir die Äquivalenz dieser beiden Funktionen von x für alle Werte von x betrachten; hierauf gehen wir zur Behauptung über, daß die resultierende Funktion von c „manchmal wahr“ ist, d. h. daß sie für wenigstens einen Wert von c wahr ist. (Sie kann offenbar für nicht mehr als einen Wert von c wahr sein.) Diese beiden Bedingungen zusammen sollen nach Definition die Bedeutung von „der Verfasser von Waverley existiert“ wiedergeben. Jetzt können wir „das Element, das der Funktion φ(x) genügt, existiert“ definieren. Das ist die allgemeine Form des obigen Spezialfalls: „Der Verfasser von Waverley“ ist „das Element, das der Funktion ,x schrieb Waverley’ genügt“. Und „der Soundso“ steht immer in Beziehung zu einer Satzfunktion, nämlich zu derjenigen, die die Eigenschaft definiert, die aus einem Ding ein Soundso macht. Unsere Definition lautet: „Das Element, das der Funktion φ(x) genügt, existiert“ bedeutet: „es gibt ein Element c, derart, daß φ(x) stets äquivalent ist mit ,x ist c‘“. Um nun „der Verfasser von Waverley war ein Schotte“ zu definieren, müssen wir den dritten Satz, nämlich „wer immer auch Waverley schrieb, war ein Schotte“ heranziehen. Dieser wird erfüllt sein, wenn wir nur noch hinzufügen, daß das fragliche c ein Schotte sein soll. Somit bedeutet „der Verfasser von Waverley war ein Schotte“ folgendes: „Es gibt ein Element c derart, daß (1) ,x schrieb Waverley‘ immer äquivalent ist mit ,x ist c‘, (2) c ein Schotte ist.“ Und allgemein: „das Element, das φ(x) genügt, genügt ψ(x)“ soll nach Definition bedeuten:
196
„Es gibt ein Element c derart, daß (1) φ(x) stets äquivalent mit ,x ist c‘ ist, (2) ψ(c) wahr ist.“ So lautet die Definition von Sätzen, in denen Beschreibungen auftreten. Man kann von einem beschriebenen Element vielerlei wissen, d. h. zahlreiche Sätze über „den Soundso“ kennen, ohne tatsächlich zu wissen, was der Soundso ist, d. h. ohne irgend einen Satz der Form „x ist der Soundso“ zu kennen, wo „x“ ein Name ist. In einem Detektivroman werden Aussagen über „den Mann, der die Tat begangen hat“ in der Hoffnung gesammelt, daß so schließlich der Beweis erbracht wird, daß A der Täter ist. Wir können sogar so weit gehen und behaupten, daß in jedem derartigen mit Worten ausdrückbaren Wissen – mit Ausnahme der Worte „dies“ und „das“ und einigen anderen Worten, deren Bedeutung sich mit der Anwendung ändert – keine Namen im strengen Sinn des Wortes auftreten. Die scheinbar vorkommenden Namen sind in Wirklichkeit Beschreibungen. Es hat einen Sinn zu untersuchen, ob Homer gelebt hat; dies könnten wir nicht, wenn „Homer“ ein Name wäre. Der Satz „der Soundso existiert“ hat eine Bedeutung, ob er wahr oder falsch ist; ist aber a der Soundso (wo „a“ ein Name ist), dann haben die Worte „a existiert“ keine Bedeutung. Nur bei bestimmten oder unbestimmten Beschreibungen hat es einen Sinn von Existenz zu sprechen; denn, wenn „a“ ein Name ist, so muß er etwas benennen: was nicht irgend etwas benennt, ist kein Name. Wenn es daher ein Name sein soll, so ist es ein bedeutungsloses Symbol, während hingegen eine Beschreibung wie „der gegenwärtige König von Frankreich“ nicht die Eigenschaft einbüßt, in einem sinnvollen Zusammenhang vorzukommen, weil diese Beschreibung nichts beschreibt. Denn es handelt sich hier um ein k o m p l e x e s Symbol, dessen Bedeutung sich aus der seiner Bestandteile ergibt. Fragen wir, ob Homer existiert, so brauchen wir das Wort „Homer“ als abgekürzte Beschreibung: wir können es z. B. ersetzen durch „der Verfasser der Ilias und Odyssee“. Die gleichen Betrachtungen gelten in fast allen Fällen, wo es sich um Eigennamen zu handeln scheint. Treten in Sätzen Beschreibungen auf, so muß man das „primäre“ von dem „sekundären“ Auftreten unterscheiden. Der abstrakte Un-
197
terschied besteht in folgendem: Eine Beschreibung tritt „primär“ auf, wenn der Satz, in dem sie vorkommt, dadurch entsteht, daß sie in einer Satzfunktion φ(x) für „x“ eingesetzt wird. Das Resultat einer Beschreibung tritt „sekundär“ auf, wenn sich aus der Substitution nur ein T e i l des betreffenden Satzes ergibt. Durch ein Beispiel wird dies deutlicher werden. Unser Satz sei: Der gegenwärtige König von Frankreich ist kahl. Hier tritt „der gegenwärtige König von Frankreich“ primär auf und der Satz ist falsch. Jeder Satz, in dem eine Beschreibung, die nichts beschreibt, primär auftritt, ist falsch. Nehmen wir aber den Satz: der gegenwärtige König von Frankreich ist nicht kahl. Hier ist zweierlei möglich. Gehen wir von „x ist kahl“ aus, substituieren darin für „x“ „der gegenwärtige König von Frankreich“ und verneinen das Ergebnis, dann tritt der gegenwärtige König von Frankreich sekundär auf und der Satz ist wahr; gehen wir hingegen von „x ist nicht kahl“ aus und ersetzen „x“ durch „der gegenwärtige König von Frankreich“, dann tritt „der gegenwärtige König von Frankreich“ primär auf und der Satz ist falsch. Verwechslung von primärem und sekundärem Auftreten gibt, wenn es sich um Beschreibungen handelt, leicht zu Irrtümern Anlaß. In der Mathematik treten die Beschreibungen meistens in der Form von b e s c h r e i b e n d e n F u n k t i o n e n auf, d. h. „das Element, das die Beziehung R zu y hat“ oder „das R von y“, wie wir in Analogie mit „der Vater von y“ und ähnlichen Ausdrücken sagen können. Der Satz „der Vater von y ist reich“ z. B. bedeutet: die Satzfunktion „c ist reich und ,x erzeugte y‘ ist immer äquivalent mit ,x ist c‘“ ist „manchmal wahr“, d. h. ist wenigstens für einen Wert von c wahr. Offenbar kann sie höchstens für einen Wert wahr sein. Die in diesem Kapitel kurz skizzierte Theorie der Beschreibungen ist für die Logik und die Erkenntnistheorie von der allergrößten Wichtigkeit. Für mathematische Zwecke sind jedoch die mehr philosophischen Teile der Theorie nicht wesentlich. Sie wurden daher in dem obigen Bericht, der sich auf das für die Mathematik unbedingt Erforderliche beschränkte, nicht berücksichtigt.
17. Mengen Im vorliegenden Kapitel werden wir uns mit dem Wort die (Artikel in der Mehrzahl) beschäftigen: die Einwohner von London, die Söhne reicher Leute usw. Mit anderen Worten, wir werden die Mengen betrachten. Wir sahen im 7. Kapitel, daß eine Kardinalzahl zu definieren ist als eine Menge von Mengen und im 3. Kapitel, daß die Zahl 1 zu definieren ist als die Menge aller Einheitsmengen, d. h. aller Mengen, die nur ein Element besitzen, wie man sagen könnte, wenn dies kein circulus vitiosus wäre. Wenn man die Zahl 1 als die Menge aller Einheitsmengen definiert, so müssen natürlich die „Einheitsmengen’’ derart definiert werden, daß man nicht annimmt, daß wir die Bedeutung von „eins“ bereits kennen. Tatsächlich werden sie auf eine Weise definiert, die der Definition der Beschreibungen ganz ähnlich ist: eine Menge α heißt eine „Einheitsmenge’’, wenn die als Funktion von c betrachtete Satzfunktion „,x ist ein α ist immer äquivalent mit ,x ist c‘“ nicht immer falsch ist. Einfacher ausgedrückt: wenn es ein Element c gibt, derart, daß x dann und nur dann ein Element von α ist, wenn x gleich c ist. So erhalten wir eine Definition der Einheitsmenge, wenn wir bereits wissen, was eine Menge im allgemeinen ist. Bisher haben wir bei der Betrachtung der Arithmetik die „Menge“ als einen Grundbegriff behandelt. Aber schon aus den im Kapitel 13 auseinandergesetzten Gründen dürfen wir die „Menge“ nicht als einen Grundbegriff auffassen. Bei ihrer Definition müssen wir ebenso vorgehen wie bei der Definition der Beschreibungen. Die Definition soll also Sätzen, in deren wörtlichem oder symbolischem Ausdruck Worte oder Symbole vorkommen, die offensichtlich Mengen darstellen, eine Bedeutung zuschreiben.
199
Bei einer richtigen Analyse dieser Sätze muß jede Erwähnung des Mengenbegriffs ausgeschaltet sein. Dann dürfen wir sagen, daß die Symbole für Mengen nur Konventionen sind und nicht „Mengen“ genannte Objekte darstellen. Ferner, daß die Mengen tatsächlich, wie die Beschreibungen logische Fiktionen oder, wie wir sagen, „unvollständige Symbole“ sind. Die Mengentheorie ist weniger vollständig als die Theorie der Beschreibungen. Es spricht manches dafür (wie wir im folgenden andeuten werden), die vorzuschlagende Definition der Mengen nicht als vollständig befriedigend zu betrachten. Wir brauchen anscheinend noch einige Feinheiten. Aber die Gründe, die man für die angenäherte Richtigkeit der vorzuschlagenden Definition anführen kann, sind überwältigend. Zuerst müssen wir erkennen, warum die Mengen nicht als ein Teil der letzten Grundlagen der Welt zu betrachten sind. Es ist schwierig, genau zu erklären, was man mit dieser Behauptung meint, aber eine aus ihr folgende Konsequenz wird zur Klärung ihrer Bedeutung beitragen. Hätten wir eine vollständig symbolische Sprache mit einer Definition für alles Definierbare und einem undefinierten Symbol für alles Undefinierbare, so würden die undefinierten Symbole dieser Sprache die Bedeutung der „letzten Grundlagen der Welt“ symbolisch darstellen. Ich behaupte, daß unter diesen undefinierten Symbolen weder ein Symbol für „Mengen“ im allgemeinen noch für spezielle Mengen vorkommen würde. Dagegen müßten alle Einzelheiten dieser Welt Namen haben, die unter den undefinierten Symbolen vorkommen würden. Man könnte versuchen, diesem Schluß durch Verwendung von Beschreibungen auszuweichen. Man nehme z. B. „Das Letzte was Cäsar vor seinem Tode sah“. Dies ist eine Beschreibung irgend einer Einzelheit. Wir können sie in vollkommen legitimier Weise zur Definition dieser Einzelheit verwenden. Ist aber „a“ ein Name hierfür, so ist (wie wir im vorigen Kapitel sahen) ein Satz, in dem „a“ vorkommt, nicht identisch mit dem, was aus diesem Satz wird, wenn wir für „a“ einsetzen „das Letzte was Cäsar vor seinem Tode sah“. Kommt in unserer Sprache der Name „a“ oder irgend
200
ein anderer Name für dieselbe Einzelheit nicht vor, so werden wir auf keine Weise den mit Hilfe von „a“ ausgedrückten Satz dem mit Hilfe der Beschreibung ausgedrückten Satz gegenüberstellen können. Also würden die Beschreibungen auch in einer vollkommenen Sprache die Namen für alle Individualitäten nicht ersetzen können. Dadurch, so behaupten wir, unterscheiden sich die Mengen von den Einzelheiten. Sie brauchen nicht durch undefinierbare Symbole ausgedrückt zu werden. Unsere erste Aufgabe ist, diese Auffassung zu begründen. Wirhabenbereitsgesehen,daßMengennichtalsArtenvonIndividuenaufgefaßtwerdenkönnen,wegendesWiderspruchsbeidenMengen, die nicht Elemente ihrer selbst sind (vgl. Kapitel 13) und weil wir beweisen können, daß die Zahl der Mengen größer ist als die Zahl der Individuen. Man kann die Mengen nicht rein umfangsmäßig einfach als Haufen oder Ansammlungen auffassen. Würden wir dies versuchen, so wäre uns das Verständnis der Nullmenge, die überhaupt keine Elemente besitzt und nicht als ein „Haufen“ betrachtet werden kann, unmöglich. Es wäre uns auch sehr schwer zu begreifen, wie es kommt, daß eine Menge, die nur ein Element hat, nicht mit diesem einen Element identisch ist. Ich will weder behaupten noch verneinen, daß es Dinge von der Art der „Haufen“ gebe. Als mathematischer Logiker ist es nicht meine Aufgabe, über diesen Punkt irgend eine Meinung zu haben. Ich behaupte nur, wenn es solche Haufen gibt, so können wir sie nicht mit den Mengen, die aus ihren Komponenten bestehen, identifizieren. Wir werden eher zu einer befriedigenden Theorie kommen, wenn wir die Mengen mit den Satzfunktionen zu identifizieren versuchen. Jede Menge ist, wie im Kapitel 2 gezeigt, durch irgend eine Satzfunktion definiert, die für die Elemente der Menge richtig und für andere Dinge falsch ist. Wenn aber eine Menge durch eine Satzfunktion definiert werden kann, so kann man sie ebensogut durch eine andere definieren, die richtig bzw. falsch ist, wenn die erste richtig bzw. falsch ist. Aus diesem Grunde kann die Menge nicht mit einer bestimmten derartigen Satzfunktion identifiziert werden, die den
201
Vorzug hätte vor allen andern. Hat man eine derartige Satzfunktion, so gibt es immer viele andere, die wahr sind, wenn sie wahr ist und falsch sind, wenn sie falsdi ist. Wenn dies gilt, so nennen wir zwei Satzfunktionen „formal äquivalent“. Zwei Sätze sind „äquivalent“, wenn beide wahr oder beide falsch sind. Zwei Satzfunktionen φ(x) und ψ(x) sind „formal äquivalent“, wenn φ(x) immer äquivalent ist mit ψ(x). Die Tatsache, daß es zu einer gegebenen Funktion andere, formal äquivalente Funktionen gibt, macht es unmöglich, eine Menge mit einer Funktion zu identifizieren. Denn wir verlangen von Mengen, daß keine zwei verschiedenen Mengen genau dieselben Elemente besitzen. Deswegen müssen zwei formal äquivalente Funktionen dieselbe Menge bestimmen. Wenn wir also entschieden haben, daß die Mengen nicht von derselben Natur sein können wie ihre Elemente, daß sie nicht bloße Haufen oder Anhäufungen sein können und daß sie auch nicht mit den Satzfunktionen identifiziert werden können, so ist es sehr schwer zu sehen, was sie überhaupt sein können, wenn sie mehr als symbolische Fiktionen sein sollen. Finden wir eine Methode, sie als symbolische Fiktionen zu behandeln, so erhöhen wir die logische Sicherheit unserer Position. Denn wir brauchen die Annahme nicht, daß es Mengen gibt, und wir sind nicht gezwungen, das Entgegengesetzte anzunehmen, daß es keine Mengen gibt. Wir machen weder die eine noch die andere Annahme. Dies ist ein Beispiel von Occams Rasiermesser: „Wesenheiten dürfen nicht ohne Notwendigkeit vermehrt werden“. Wenn wir aber die Annahme, daß es Mengen gibt, zurückweisen, so darf man von uns nicht erwarten, daß wir dogmatisch das Gegenteil behaupten. Wir sind in dieser Hinsicht einfach Agnostiker. Wie Laplace können wir sagen, „je n’ai pas besoin de cette hypothèse“. Wir wollen im folgenden die Bedingungen aufstellen, denen ein Symbol genügen muß, wenn es eine Menge vertreten soll. Meines Erachtens findet man, daß die folgenden Bedingungen notwendig und hinreichend sind. (1) Jede Satzfunktion muß eine Menge bestimmen, die aus den Argumenten besteht, für die die Funktion wahr ist. Gegeben sei
202
irgend ein (wahrer oder falscher) Satz über Sokrates. Wir denken uns Sokrates durch Plato, Aristoteles, einen Gorilla, den Mann im Mond oder irgend ein anderes Individuum in der Welt ersetzt. Im allgemeinen werden einige dieser Substitutionen einen richtigen, andere einen falschen Satz geben. Die so bestimmte Menge besteht aus all den Substitutionen, welche einen richtigen Satz geben. Natürlich müssen wir noch entscheiden, was „all die, welche usw.“ bedeutet. Jetzt wollen wir nur feststellen, daß eine Menge durch eine Satzfunktion zu etwas Bestimmtem wird und daß jede Satzfunktion eine entsprechende Menge bestimmt. (2) Zwei formal äquivalente Satzfunktionen müssen dieselbe Menge bestimmen, zwei formal nicht äquivalente verschiedene Mengen. Also ist eine Menge bestimmt durch ihre Mitglieder schaft. Und keine zwei verschiedenen Mengen können dieselbe Mitgliederschaft besitzen. (Wenn eine Menge durch eine Funktion φ(x) bestimmt ist, so sagen wir, daß a ein „Element“ der Menge ist, wenn φ(a) wahr ist.) (3) Wir müssen eine Methode finden, um nicht nur Mengen, sondern auch Mengen von Mengen zu definieren. Wir sahen im Kapitel 2, daß Kardinalzahlen als Mengen von Mengen zu definieren sind. Was man in der Elementarmathematik als „Kombinationen von n Dingen zu je m“ bezeichnet, stellt eine Menge von Mengen dar, nämlich die Menge aller Mengen von m Elementen, die aus einer gegebenen Menge von n Elementen ausgewählt werden kann. Ohne eine symbolische Behandlungsmethode der Mengen von Mengen würde die mathematische Logik zusammenbrechen. (4) Die Vermutung, eine Menge sei ein Element ihrer selbst, oder sie sei es nicht, muß unter allen Umständen sinnlos (nicht falsch) sein. Dies folgt aus dem Widerspruch, den wir im Kapitel 13 behandelten. (5) Endlich – und diese Bedingung ist am schwierigsten zu erfüllen – muß es möglich sein, Sätze zu bilden über a l l e Mengen, die aus Individuen bestehen, oder über a l l e Mengen, die aus Objekten von einem bestimmten logisdien „Typus“ bestehen. Wäre dies nicht
203
der Fall, so würden viele Anwendungen unzulässig sein, z. B. die mathematische Induktion. Definieren wir die Nachkommenschaft eines bestimmten Elements, so müssen wir imstande sein zu sagen: ein Element der Nachkommenschaft gehört zu a l l e n erblichen Mengen, zu denen das gegebene Element gehört. Dazu braucht man gerade diese Art von Totalität. Die Schwierigkeit bei dieser Bedingung ist darin begründet, daß man beweisen kann: es ist unmöglich, von a l l e n Satzfunktionen zu sprechen, welche Argumente von einem gegebenen Typus haben können. Wir wollen vorläufig diese letzte Bedingung und die durch sie auftretenden Probleme außer acht lassen. Die ersten zwei Bedingungen kann man zusammenfassen. Sie behaupten, daß es für jede Gruppe von formal äquivalenten Satzfunktionen eine und nur eine Menge gibt. So könnte man z. B. die Menge der Menschen definieren als die Menge der federlosen Zweifüßler oder der vernünftigen Tiere oder durch irgend eine charakteristische Eigenschaft. Wenn wir nun sagen, daß zwei formal äquivalente Satzfunktionen nicht identisch zu sein brauchen, obwohl sie dieselbe Menge definieren, dann können wir die Richtigkeit dieser Behauptung beweisen, indem wir zeigen, daß eine Behauptung für die eine Funktion richtig, für die andere falsch sein kann. Es kann z. B. richtig sein: „Ich glaube, daß alle Menschen sterblich sind.“ Dagegen kann falsch sein: „Ich glaube, daß alle vernünftigen Tiere sterblich sind.“ Denn ich kann, zu Unrecht, glauben, daß der Phönix ein unsterbliches vernünftiges Tier ist. So kommen wir auf die Betrachtung von B e h a u p t u n g e n ü b e r F u n k t i o n e n oder korrekter, F u n k t i o n e n v o n F u n k t i o n e n . Aussagen über eine Funktion gelten zum Teil auch von der durch die Funktion definierten Menge, zum Teil aber nicht. Die Behauptung „alle Manschen sind sterblich“ enthält die Funktionen „x ist ein Mensch“ und „x ist sterblich“. Wenn wir wollen, können wir auch sagen, sie enthält die Mengen, M e n s c h e n u n d S t e r b l i c h e . Wir können die Behauptung auf beide Weisen interpretieren, denn ihr Wahrheitswert bleibt unverändert, wenn wir für „x ist ein
204
Mensch“ und für „x ist sterblich“ irgend eine formal äquivalente Funktionen einsetzen. Dagegen sahen wir eben, daß die Behauptung „ich glaube, daß alle Menschen sterblich sind“ nicht als eine Aussage über die durch eine dieser Funktionen definierte Menge aufgefaßt werden kann. Denn ihr Wahrheitswert könnte sich ändern durch die Substitution einer formal äquivalenten Funktion (welche jedoch die Menge unverändert läßt). Wir wollen eine Behauptung über eine Funktion φ(x) eine „extensionale“ Funktion der Funktion φ(x) nennen, wenn sie von der Art ist, wie „alle Menschen sind sterblich“, d. h. wenn der Wahrheitswert bei der Substitution irgend einer formal äquivalenten Funktion unverändert bleibt. Wenn eine Funktion einer Funktion nicht extensional ist, so wollen wir sie „intensional“ nennen. Der Satz „Ich glaube, daß alle Menschen sterblich sind“ ist eine intensionale Funktion der Sätze „x ist ein Mensch“ und „x ist sterblich“. Die extensionalen Funktionen einer Funktion können für praktische Zwecke als Funktionen der durch x bestimmten Menge betrachtet werden, intensionale Funktionen aber nicht. Man beachte, daß alle s p e z i e l l e n Funktionen von Funktionen, die wir bisher in die mathematische Logik einführten, extensional sind. Dies gilt z. B. von den beiden grundlegenden Funktion von Funktionen: „φ(x) ist immer wahr“ und „φ(x) ist manchmal wahr“. Der Wahrheitswert beider Funktionen bleibt ungeändert, wenn man für φ(x) irgend eine formal äquivalente Funktion einsetzt. In der Sprache der Mengen: Wenn α die durch φ(x) bestimmte Menge ist, so ist der Satz „φ(x) ist immer wahr“ äquivalent mit dem Satz „alles ist ein Element von α“. Der Satz „φ(x) ist manchmal wahr“ ist äquivalent mit „α hat Elemente“ oder besser „α hat mindestens ein Element“. Man nehme z. B. die im vorigen Kapitel behandelte Existenzbedingung für „das Element, das φ(x) genügt“. Die Bedingung lautet, daß es ein Element c gibt, derart, daß φ(x) immer äquivalent ist mit „x ist c“. Sie ist selbstverständlich extensional und ist äquivalent mit der Behauptung, daß die durch die Funktion φ(x) definierte Menge eine Einheitsmenge ist, d. h. eine Menge, die nur ein Element besitzt, mit anderen Worten eine Menge, die ein Element von 1 ist.
205
Gegeben sei eine Funktion einer Funktion, die extensional oder nicht extensional ist, so können wir aus ihr immer eine zusammenhängende und sicher extensionale Funktion derselben Funktion auf folgende Weise ableiten: Unsere ursprüngliche Funktion einer Funktion möge φ(x) die Eigenschaft f zuschreiben. Man betrachte jetzt die Behauptung „Es gibt eine Funktion mit der Eigenschaft f, die φ(x) formal äquivalent ist“. Dies ist eine extensionale Funktion von φ(x) und sie gilt, wenn unser ursprünglicher Satz gilt. Sie ist formal äquivalent mit der ursprünglichen Funktion von φ(x), wenn diese ursprüngliche Funktion extensional ist. Ist aber die ursprüngliche Funktion intensional, so gilt die neue Funktion in mehr Fällen als die alte. Man betrachte z. B. wieder „ich glaube, daß alle Menschen sterblich sind“ als eine Funktion von „x ist ein Mensch“. Die abgeleitete extensionale Funktion lautet: „es gibt eine zu dem Satz ,x ist ein Mensch‘ formal äquivalente Funktion, derart, daß meiner Ansicht nach alles ihr genügende sterblich ist.“ Dies bleibt richtig, wenn wir den Satz „x ist ein vernünftiges Tier“ für „x ist ein Mensch“ einsetzen, selbst wenn ich zu Unrecht glaube, der Phönix sei vernünftig und unsterblich. Die oben konstruierte Funktion heiße „abgeleitete extensionale Funktion“. Sie lautet: „es gibt eine Funktion, die die Eigenschaft f besitzt und mit φ(x) formal äquivalent ist“, während die ursprüngliche Funktion lautet: die Funktion φ(x) hat die Eigenschaft f“. Wir können die abgeleitete extensionale Funktion so auffassen, daß ihr Argument die durch die Funktion φ(x) bestimmte Menge ist, und daß sie von dieser Menge die Eigenschaft f aussagt. Dies kann als Definition eines Satzes über eine Menge aufgefaßt werden. Wir können also definieren: Wenn wir behaupten, „die durch die Funktion φ(x) bestimmte Menge ist und daß sie von dieser Menge die Eigen-φ(x) der aus f abgeleiteten extensionalen Funktion genügt. Dies gibt jedem Satz über eine Menge, der für eine Funktion sinnvoll gemacht werden kann, eine Bedeutung. Man sieht, daß man auf diese Weise zu den Resultaten gelangt, die man zu einer befriedigenden symbolischen Theorie braucht.1) 1
) Vgl. Principia Mathematica, Bd. I, S. 75—84 und Satz 20.
206
Was wir jetzt über die Definition von Mengen gesagt haben, genügt, um unsere ersten vier Bedingungen zu erfüllen. Die Erfüllung der dritten und vierten Bedingung, nämlich daß Mengen von Mengen möglich sind und daß nicht eine Menge ein Element oder kein Element ihrer selbst sei, kann eigentlich nur mit Hilfe der symbolischen Logik dargestellt werden. Dies geschieht in den Principia Mathematica und wir wollen es hier als gesichert übernehmen. Demnach ist unsere Aufgabe, abgesehen von unserer fünften Bedingung, als erledigt zu betrachten. Aber diese Bedingung, gleichzeitig die wichtigste und schwierigste, ist durch alles bisher Gesagte noch nicht erfüllt. Die Schwierigkeit hängt mit der Theorie der Typen zusammen und muß kurz erklärt werden.1) Wir sahen in Kapitel 13, daß es eine Hierarchie der logischen Typen gibt und daß es falsch ist, wenn man es zuläßt, daß ein Objekt von einem Typus für ein Objekt von einem anderen Typus eingesetzt wird. Nun ist es nicht schwer zu zeigen, daß die verschiedenen Funktionen, die ein gegebenes Objekt a als Argument besitzen können, nicht alle vom gleichen Typus sind. Wir wollen sie alle a-Funktionen nennen. Zuerst können wir diejenigen nehmen, die keine Beziehungen zu irgend einer Menge von Funktionen enthalten. Wir wollen sie „prädikative a-Funktionen“ nennen. Gehen wir jetzt zu Funktionen über, die eine Beziehung zur Gesamtheit der prädikativen a-Funktionen enthalten. Es wäre falsch, ihnen denselben Typus wie den prädikativen a-Funktionen zuzuschreiben. Man nehme eine alltägliche Behauptung: „a ist ein typischer Franzose“. Wie sollen wir einen „typischen“ Franzosen definieren? Wir können ihn als einen Mann definieren, der „alle Eigenschaften besitzt, die die meisten Franzosen besitzen“. Aber, wenn wir nicht „alle Eigenschaften“ auf solche beschränken, die keine Beziehung zur Gesamtheit aller Eigenschaften enthalten, so kommen wir zu dem Resultat, daß die meisten Franzosen nicht typisch im obigen Sinn sind. Die Definition zeigt also, daß es für einen typischen Franzosen wesentlich ist, nicht typisch zu sein. Dies ist kein logischer Wider1 ) Der Leser, der eine genauere Diskussion wünscht, sollte Principia Mathematica, Einführung, Kap. 2 lesen, ebenso Satz 12.
207
spruch, denn es besteht kein Grund, warum es überhaupt typische Franzosen geben sollte. Aber es kennzeichnet die Notwendigkeit, diejenigen Eigenschaften, die eine Beziehung zu einer Gesamtheit von Eigenschaften enthalten, von denen zu trennen, bei denen dies nicht der Fall ist. Wenn wir durch Behauptungen über „alle“ oder „einige“ der Werte, die eine Variable sinnvoll annehmen kann, ein neues Objekt erzeugen, so darf dieses Objekt nicht zu den Werten gehören, die unsere frühere Variable annehmen konnte. Denn in diesem Fall könnte man die Gesamtheit der Werte, die die Veränderliche annehmen kann, nur durch Ausdrücke definieren, in denen sie selbst vorkommt. Wir hätten also einen circulus vitiosus. Wenn ich z. B. sage „Napoleon hatte alle Eigenschaften, die einen großen General ausmachen“, so muß ich „Eigenschaften“ derart definieren, daß dies nicht diesen Satz wieder enthält. D. h. „alle Eigenschaften zu besitzen, die einen großen General ausmachen“, muß nicht selbst eine Eigenschaft in dem vermuteten Sinn sein. Durch dieses ziemlich deutliche Prinzip kommen wir zur Theorie der Typen, durch die wir die Paradoxien des circulus vitiosus vermeiden. Was die a-Funktionen betrifft, können wir annehmen, daß „Eigenschaften“ „prädikative Funktionen“ bedeuten sollen. Wenn ich also sage „Napoleon hatte alle Eigenschaften usw.“, so meine ich damit, „Napoleon genügte allen prädikativen Funktionen usw.“. Diese Behauptung schreibt Napoleon eine Eigenschaft zu, die aber nicht prädikativ ist. Wir entgehen also dem circulus vitiosus. Wenn der Ausdruck „alle Funktionen, die“ vorkommt, so müssen daher die betreffenden Funktionen immer auf einen Typ beschränkt bleiben, wenn ein Zirkelschluß vermieden werden soll. Wie Napoleon und der typische Franzose gezeigt haben, ist der Typus durch den des Arguments noch nicht bestimmt. Um diesen Punkt ganz zu erledigen, bedürften wir einer viel genaueren Diskussion. Das bisher Gesagte zeigt zur Genüge, daß die Funktionen, die ein bestimmtes Argument annehmen können, eine unendliche Folge von Typen bilden. Durch verschiedene technische Kunstgriffe könnten wir eine Veränderliche konstruieren, die die n ersten Typen durchläuft, wobei n endlich ist, aber wir können
208
keine Variable konstruieren, die alle Typen durchläuft. Könnten wir dies, so würde schon diese Tatsache sofort einen neuen Typus von Funktionen mit den gleichen Argumenten erzeugen und der ganze Prozeß würde nochmals von vorn anfangen. Wir nennen die prädikativen a-Funktionen den e r s t e n Typus von a-Funktionen. Diejenigen a-Funktionen, die eine Beziehung auf die Gesamtheit des ersten Typus enthalten, nennen wir den z w e i t e n Typus, usw. Keine variable a-Funktion kann all diese verschiedenen Typen durchlaufen: sie muß bei irgend einem bestimmten aufhören. Diese Betrachtungen sind für unsere Definition der abgeleiteten extensionalen Funktion von Wichtigkeit. Wir sprachen damals von einer „Funktion, die mit φ(x) formal äquivalent ist“. Wir müssen uns über den Typ dieser Funktion entscheiden. Jede Entscheidung ist gut, aber irgend eine Entscheidung unvermeidlich. Wir wollen die angenommene formal äquivalente Funktion ψ nennen. Dann erscheint ψ als eine Variable und muß daher von einem bestimmten Typus sein. Von dem Typ von φ können wir nur das eine aussagen, daß diese Funktion Argumente von einem bestimmten Typus annimmt, z. B. daß sie eine a-Funktion ist. Aber dadurch wird, wie wir gerade gesehen haben, ihr Typus nicht bestimmt. Wenn wir, wie unsere fünfte Forderung verlangt, in der Lage sein sollen, a l l e Mengen zu behandeln, deren Elemente von einem bestimmten Typus a sind, so müssen wir alle diese Mengen durch eine Funktion von einem bestimmten Typus definieren können, d. h. es muß einen bestimmten Typus von a-Funktionen geben, z. B. den n-ten, derart, daß jede a-Funktion mit einer vom n-ten Typus formal äquivalent ist. Wenn dies der Fall ist, so wird jede extensionale Funktion, die für alle a-Funktionen vom n-ten Typus gilt, für jede beliebige aFunktion gelten. Der Nutzen der Mengen besteht hauptsächlich darin, daß mit ihrer Verwendung eine Annahme verknüpft ist, die zu diesem Resultat führt. Diese Annahme heißt „Reduzibilitätsaxiom“ und läßt sich, wie folgt, ausdrücken: „Es gibt einen Typus von a-Funktionen, sagen wir τ, derart, daß
209
irgend eine gegebene a-Funktion formal äquivalent ist mit irgend einer Funktion des betreffenden Typus.“ Wenn dieses Axiom angenommen wird, so benützen wir Funktionen von diesem Typus, um unsere zugeordnete extensionale Funktion zu definieren. Behauptungen über alle a-Mengen (d. h. alle Mengen, die durch a-Funktionen definiert sind) lassen sich auf Behauptungen über alle a-Funktionen vom Typus τ zurückführen. Solange man sich praktisch nur mit extensionalen Funktionen von Funktionen befaßt, erhält man Resultate, die sonst den unmöglichen Begriff „alle a-Funktionen“ vorausgesetzt hätten. Das ist insbesondere für die mathematische Induktion eine Lebensfrage. Aus dem Reduzibilitätsaxiom folgt alles für die Mengentheorie wirklich Wesentliche. Es lohnt sich daher zu fragen, ob wir Gründe haben, es für richtig zu halten. Dieses Axiom ist wie das multiplikative Axiom und das Unendlichkeitsaxiom für gewisse Resultate notwendig, nicht aber für die Existenz des deduktiven Schließens an sich. Die im Kapitel 14 erläuterte Theorie der Deduktion und die Gesetze für die Behandlung von Sätzen mit „alle“ und „einige“ gehören zum eigentlichen Gefüge des mathematischen Schließens. Diese oder ähnliche Gesetze sind unbedingt notwendig um überhaupt irgend welche Resultate zu erzielen. Wir können sie nicht als Hypothesen verwenden und hypothetische Konsequenzen daraus ziehen. Denn sie sind sowohl Deduktionsregeln wie Prämissen. Sie müssen absolut wahr sein. Sonst folgt das, was wir aus ihnen schließen, nicht einmal aus den Voraussetzungen. Dagegen könnte das Reduzibilitätsaxiom, genau wie unsere beiden früheren mathematischen Axiome ganz gut als Hypothese betrachtet werden und nicht als tatsächliche Wahrheit. Wir können die aus ihm abgeleiteten Konsequenzen als hypothetisch betrachten. Wir können auch die Konsequenzen ziehen und annehmen, sie seien falsch. Es ist also nur eine praktische Annahme, keine notwendige. Da die Theorie der Typen sehr kompliziert ist und alles, ausgenommen die allgemeinsten Prinzipien, dabei unsicher ist, kann man heute noch nicht sagen, ob es nicht möglich ist,
210
überhaupt ohne das Reduzibilitätsaxiom auszukommen. Nehmen wir an, die oben skizzierte Theorie sei richtig, was können wir dann über die Wahrheit oder Falschheit des Axioms aussagen? Man beachte, daß das Axiom eine verallgemeinerte Form der Leibnizschen Identität des Ununterscheidbaren ist. Leibniz nahm als logisches Prinzip an, daß zwei verschiedene Subjekte sich in ihren Prädikaten unterscheiden müssen. Nun bilden die Prädikate nur einen Teil der sog. prädikativen Funktionen. Zu ihnen gehören auch die Beziehungen zu gegebenen Elementen und verschiedene Eigenschaften, die man nicht als Prädikate ansehen kann. Also ist die Leibnizsche Annahme viel enger als unsere. (Natürlich nicht in s e i n e r Logik, in der alle Sätze auf die Subjekt-Prädikatform zurückführbar sein sollen.) Aber soweit ich sehen kann, haben wir keinen hinreichenden Grund, diese Annahme anzuerkennen. Abstrakt logisch betrachtet, könnte es sehr wohl zwei Dinge mit denselben Prädikaten im obigen engen Sinn geben. Wie sieht unser Axiom aus, wenn wir über die Prädikate in diesem engeren Sinn hinausgehen? In der tatsächlichen Welt haben wir wegen der raum-zeitlichen Differenziertheit scheinbar keinen Grund, an seiner empirischen Wahrheit für Einzelheiten zu zweifeln: keine zwei Einzelheiten haben genau dieselben RaumZeitbeziehungen zu allen anderen. Wäre dies der Fall, so wäre dies eine zufällige Tatsache der Welt, in der wir uns gerade befinden. Die reine Logik und die reine Mathematik (was dasselbe ist) soll (in der Leibnizschen Ausdrucksweise) in allen möglichen Welten wahr sein, nicht nur in dieser Hausierer- und Schieberwelt, in die das Mißgeschick uns verschlagen hat. Der Logiker muß eine gewisse geistige Würde bewahren. Er muß sich nicht dazu hergeben, sich bei seinen Schlüssen auf die Dinge seiner Umwelt zu stützen. Von diesem rein logischen Gesichtspunkt betrachtet, sehe ich keinen Grund für die Annahme, das Reduzibilitätsaxiom sei logisch notwendig. Damit würde man behaupten, es sei wahr in allen möglichen Welten. Wenn wir dieses Axiom in einem System der Logik zulassen, so begehen wir also einen Fehler, selbst wenn das Axiom empirisch wahr ist. Aus diesem Grund können wir die Mengentheorie noch
211
nicht als so vollkommen betrachten wie die Theorie der Beschreibungen. Dazu müßte die Theorie der Typen weiter ausgebaut werden. Hoffentlich kommen wir damit zu einer Mengentheorie, die solche zweifelhaften Annahmen nicht braucht. Aber es ist vernünftig, die hier dargestellte Theorie in ihren Hauptzügen als richtig zu betrachten. Richtig ist die Zurückführung der Sätze, die nominell von Mengen handeln, auf Sätze über die sie definierenden Funktionen. Daß wir auf diese Weise die Mengen als Wesenheiten vermeiden, scheint mir ein gesundes Prinzip zu sein, wenn auch im Einzelnen noch manches zu verbessern sein mag. Gerade weil ich davon fest überzeugt bin, habe ich die Mengentheorie mit aufgenommen, obwohl ich, soweit wie möglich, alles ausschließen wollte, was noch ernsthaft angezweifelt werden kann. Die oben skizzierte Mengentheorie reduziert sich also auf ein Axiom und eine Definition. Der Bestimmtheit halber wollen wir sie nochmal wiederholen. Das Axiom lautet: E s g i b t e i n e n Ty p u s τ d e r a r t , d a ß , w e n n φ eine Funktion ist, die ein gegebenes Objekt a als Argument annehmen kann, eine Funktion ψ v o m Ty p u s τ e x i s t i e r t , d i e f o r m a l ä q u i v a l e n t mit φ ist. Die Definition lautet: We n n φ e i n e F u n k t i o n i s t , d i e e i n g e g e b e n e s Objekt a als Argument annehmen kann und τ d e r i m o b i g e n A x i o m e r w ä h n t e Ty p u s i s t , s o ist der Satz, daß die durch φ bestimmte Menge die Eigenschaft f hat, dasselbe wie der Satz, d a ß e s e i n e F u n k t i o n v o m Ty p u s τ g i b t , d i e m i t φ formal äquivalent ist und die Eigenschaft f besitzt.
18. Mathematik und Logik Mathematik und Logik waren, historisch gesprochen, zwei ganz getrennte Arbeitsgebiete. Die Mathematik hing mit den Naturwissenschaften, die Logik mit den Geisteswissenschaften zusammen. Aber beide haben sich in der modernen Zeit entwickelt. Die Logik wurde mathematischer, die Mathematik logischer. Infolgedessen ist es heute ganz unmöglich, einen Trennungsstrich zwischen beiden zu ziehen. Tatsächlich sind sie eins. Sie unterscheiden sich wie der Knabe und der Mann: Die Logik ist die Jugend der Mathematik und die Mathematik ist das Mannesalter der Logik. Gegen diese Auffassung wehren sich die Logiker, die ihre Zeit mit dem Studium der klassischen Texte verbracht haben und daher unfähig sind, eine Arbeit mit symbolischer Beweisführung zu verstehen und die Mathematiker, die nur eine Technik gelernt haben, und sich nicht die Mühe gegeben haben, ihre Bedeutung oder Rechtfertigung zu untersuchen. Beide Typen werden heute glücklicherweise seltener. Ein großer Teil der modernen mathematischen Arbeiten liegt augenscheinlich an der Grenze der Logik, ein großer Teil der modernen Logik ist symbolisch und formal. Die ganz enge Verwandtschaft der Logik und Mathematik muß jedem gebildeten geistigen Arbeiter in die Augen springen. Der Beweis ihrer Identität muß natürlich im einzelnen geführt werden. Beginnt man mit Voraussetzungen, die nach der allgemeinen Anschauung zur Logik gehören und kommt man auf deduktivem Weg zu Resultaten, die ebenso augenscheinlich der Mathematik angehören, dann gibt es keinen Punkt, wo ein scharfer Trennungsstrich gezogen werden kann, so daß die Logik links und die Mathematik rechts liegt. Wenn jemand noch immer
213
die Identität von Logik und Mathematik nicht anerkennen will, so können wir ihn herausfordern: Sage uns, wo deiner Meinung nach die Logik im Verlauf der Definitionen und Deduktionen der Principia Mathematica endet und die Mathematik beginnt? Jede Antwort muß ganz willkürlich sein. In den ersten Kapiteln dieses Buches gingen wir aus von den natürlichen Zahlen. Wir definierten zunächst die „Kardinalzahl“, dann zeigten wir, wie man den Begriff der Zahl verallgemeinert und analysierten die dieser Definition zugrunde liegenden Begriffe. So kamen wir dazu, uns mit den Fundamenten der Logik zu beschäftigen. In einer synthetischen deduktiven Behandlung kommen diese Grundlagen zuerst und zu den natürlichen Zahlen kommt man erst nach einer langen Reise. Diese Behandlung ist zwar formal korrekter als die hier angenommene. Aber sie ist für den Leser schwieriger. Denn die letzten logischen Vorstellungen und Sätze, von denen man ausgeht, sind uns fern und fremd im Vergleich mit den natürlichen Zahlen. Sie stellen die letzte Grenze des Wissens dar; was darüber hinausgeht, ist unbekannt. Dieses Gebiet beherrschen wir bis heute noch nicht. Man pflegte zu sagen, die Mathematik sei die Wissenschaft von der „Quantität“. „Quantität“ ist ein unklares Wort. Um argumentieren zu können, wollen wir es durch das Wort „Zahl“ ersetzen. Aber die Behauptung, daß die Mathematik die Wissenschaft von der Zahl ist, wäre aus zwei verschiedenen Gründen unrichtig. Zunächst gibt es anerkannte Gebiete der Mathematik, die nichts mit Zahlen zu tun haben z. B. jede Geometrie, die keine Koordinaten oder Zahlenangaben verwendet. Die projektive und deskriptive Geometrie z. B. hat bis zu dem Punkt, wo die Koordinaten eingeführt werden, nichts mit Zahlen zu tun, ja nicht einmal mit Quantitäten im Sinn von g r ö ß e r u n d k l e i n e r . Andrerseits konnte man mit Hilfe von Definition der Kardinalzahlen, der Theorie der Induktion und Vorfahrbeziehungen, der allgemeinen Theorie der Reihen und der Definitionen der arithmetischen Operationen einen großen Teil von dem, was früher nur unter Zuhilfenahme der Zahlen bewiesen wurde, verallgemeinern. Infolgedessen zerfällt das frühere Gebiet der
214
Arithmetik jetzt in eine Reihe von getrennten Arbeitsgebieten, von denen sich keines speziell mit Zahlen beschäftigt. Die elementarsten Eigenschaften der Zahlen betreffen die ein-eindeutigen Beziehungen und die Äquivalenz zwischen Mengen. Die Addition beschäftigt sich mit dem Aufbau von sich gegenseitig ausschließenden Mengen, die jeweils mit einer Gesamtheit von Mengen äquivalent sind, von denen man nicht weiß, ob sie sich gegenseitig ausschließen. Die Multiplikation geht in der Theorie der „Selektionen“ auf, d. h. in einer gewissen Art von ein-eindeutigen Beziehungen. Die Endlichkeit gehört zum allgemeinen Studium der Vorfahrbeziehungen und darunter fällt die ganze Theorie der mathematischen Induktion. Die ordinalen Eigenschaften der verschiedenen Zahlenfolgen, die Elemente der Theorie der Stetigkeit von Funktionen und der Grenzwerte von Funktionen lassen sich so verallgemeinern, daß in ihnen keine wesentliche Beziehung zu den Zahlen mehr enthalten ist. Beim formalen Denken verallgemeinert man prinzipiell so weit als möglich, weil wir dann die Gewißheit haben, daß die Resultate eines gegebenen Deduktionsprozesses möglichst weit anwendbar sind. Indem wir die Überlegungen der Arithmetik verallgemeinern, folgen wir nur einer Vorschrift, die in der ganzen Mathematik anerkannt ist. Durch diese Verallgemeinerung haben wir tatsächlich eine Reihe von neuen deduktiven Systemen geschaffen, in denen die traditionelle Arithmetik gleichzeitig aufgelöst und erweitert ist. Ob eines dieser neuen deduktiven Systeme, z. B. die Auswahltheorie zur Logik oder zur Arithmetik gehören soll, ist vollkommen willkürlich und läßt sich nicht zwingend entscheiden. Wir stehen also der Frage gegenüber: was ist der Gegenstand, den wir nach Belieben Mathematik oder Logik nennen können. Gibt es irgend eine Methode, ihn zu definieren? Gewisse Merkmale dieses Gegenstandes ergeben sich unmittelbar. Zunächst handelt es sich nicht um spezielle Dinge oder spezielle Eigenschaften. Wir beschäftigen uns formal mit dem, was man über irgend ein Ding oder irgend eine Eigenschaft aussagen kann. Wir sind geneigt zu sagen: eins und eins sind zwei, nicht
215
aber: Sokrates und Plato sind zwei. Denn in unserer Eigenschaft als Logiker oder reine Mathematiker haben wir niemals etwas von Sokrates oder Plato gehört. In einer Welt ohne solche Individuen würde noch immer der Satz eins und eins sind zwei gelten. Als reine Mathematiker oder Logiker sind wir nicht in der Lage, irgend etwas Tatsächliches zu erwähnen; denn wenn wir es tun, so führen wir etwas Unwesentliches und Nichtformales ein. Wir können dies am Syllogismus erläutern. Die traditionelle Logik sagt: „Alle Menschen sind sterblich, Sokrates ist ein Mensch, also ist Sokrates sterblich.“ Offenbar wollen wir damit nur sagen: Aus den Prämissen folgt der Schluß, nicht aber: Prämisse und Schluß sind tatsächlich wahr. Selbst die konservativste Logik sagt ausdrücklich, daß die tatsächliche Wahrheit der Voraussetzung für die Logik gleichgültig ist. Also muß der obenstehende klassische Syllogismus zunächst wie folgt abgeändert werden: „Wenn alle Menschen sterblich sind und Sokrates ein Mensch ist, dann ist Sokrates sterblich.“ Wir beobachten nun, daß zum Ausdruck gebracht werden soll, daß diese Argumentation wegen ihrer Form, nicht aber vermöge der darin vorkommenden besonderen Elemente gültig ist. Hätten wir den Satz „Sokrates ist ein Mensch“ aus unseren Prämissen weggelassen, so hätten wir einen nicht formalen Schluß gehabt, der nur deswegen zulässig ist, weil Sokrates tatsächlich ein Mensch ist. In diesem Fall hätten wir die Argumentation nicht verallgemeinern können. Aber wenn wie eben, die Argumentation f o r m a l ist, so hängt nichts von den darin vorkommenden Elementen ab. Wir können also setzen: α für M e n s c h e n , β für S t e r b l i c h e und x für Sokrates, wobei α und β irgend welche Mengen sind und x irgend ein Einzelelement. Wir kommen dann zu der Behauptung: „Gleichgültig, was für mögliche Werte x, α und β haben mögen, wenn nur alle α’s und auch β’s sind und x ein α ist, dann ist x ein β.“ Mit anderen Worten: „Die Satzfunktion ,wenn alle α’s β’s sind und x ist ein α, dann ist x ein β‘ ist immer wahr.“ Hier haben wir endlich einen Satz der Logik, nämlich denjenigen, der mit der traditionellen Behauptung über Sokrates, Menschen und Sterbliche nur angedeutet wird.
216
Wenn unser Ziel das formale Schließen ist, so müssen wir am Ende immer zu Behauptungen dieser Art kommen, in der keine tatsächlichen Dinge oder Eigenschaften mehr erwähnt sind. Dazu führt uns nur der Wunsch, unsere Zeit nicht damit zu vergeuden, für einen Spezialfall das zu beweisen, was sich allgemein beweisen läßt. Es wäre lächerlich, für Sokrates eine lange Argumentation anzustellen und dann genau dasselbe nochmal für Plato durchzuführen. Wenn unser Schluß derart ist, daß er, sagen wir, für alle Menschen gilt, so werden wir ihn für ein „x“ unter der Annahme beweisen „x ist ein Mensch“. Unter dieser Voraussetzung wird die Argumentation ihre hypothetische Gültigkeit behalten, selbst wenn x kein Mensch ist. Aber dann werden wir finden, daß unser Schluß noch immer gilt, selbst wenn wir die Annahme, x sei ein Mensch, ersetzen durch die Annahme, er sei ein Affe, eine Gans oder ein Ministerpräsident. Wir werden also unsere Zeit nicht mit der Annahme verschwenden, x sei ein Mensch, sondern wir werden sagen, x ist ein α, wo α irgend eine Menge von Individuen ist, oder φ(x), wo φ(x) irgend eine Satzfunktion von vorgegebenem Typus ist. Daß wir in der Logik oder reinen Mathematik jede Erwähnung spezieller Dinge oder Eigenschaften unterlassen, folgt also notwendigerweise aus der Tatsache, daß diese Wissenschaft, wie wir sagen, „rein formal“ ist. Jetzt stehen wir vor einem Problem, das leichter aufzustellen als zu lösen ist. Es lautet: „Aus welchen Teilen besteht ein logischer Satz?“ Ich kenne die Antwort nicht, aber ich will wenigstens erklären, wie das Problem entsteht. Nehmen wir z. B. den Satz „Sokrates war vor Aristoteles“. Hier haben wir offenbar eine Beziehung zwischen zwei Elementen und die Bestandteile des Satzes (und der entsprechenden Tatsache) sind einfach die zwei Elemente und ihre Beziehung, also Sokrates, Aristoteles und „vor“. (Ich lasse den Umstand außer acht, daß Sokrates und Aristoteles nicht einfach sind, ebenso den Umstand, daß die Ausdrücke, die scheinbar ihre Namen darstellen, in Wirklichkeit verstümmelte Beschreibungen sind. Beide Tatsachen sind für das augenblickliche Problem gleichgültig.) Wir können diese Sätze in der allgemeinen Form „x R y“ darstellen, was zu lesen ist „x hat die Beziehung R zu y“
217
Nur diese allgemeine Form kann in logischen Sätzen vorkommen, nicht aber irgend einer ihrer Spezialfälle. Sollen wir daraus schließen, daß die allgemeine Form selbst einen Teil eines solchen logischen Satzes bildet? Gegeben sei der Satz „Sokrates ist vor Aristoteles“, so haben wir gewisse Teile und eine gewisse Form. Aber die Form ist nicht selbst ein neuer Teil. Denn wenn dies der Fall wäre, so brauchten wir eine neue Form, um sie selbst und die anderen Teile zu umfassen. Wir können tatsächlich alle Teile eines Satzes als Variable auffassen und die Form unverändert lassen. Dies tun wir, wenn wir ein Schema verwenden, wie „x R y“, das jeden beliebigen Satz einer gewissen Menge von Sätzen vertritt, nämlich diejenigen, welche Beziehungen zwischen zwei Elementen behaupten. Wir können zu allgemeinen Behauptungen übergehen, wie „x R y ist manchmal wahr“, d. h. es gibt Fälle, wo duale Beziehungen gelten. Diese Behauptung wird zur Logik (oder Mathematik) in dem von uns gebrauchten Sinn gehören. Aber bei dieser Behauptung erwähnen wir keine speziellen Dinge oder spezielle Beziehungen. Denn kein spezielles Ding und keine spezielle Beziehung kann jemals in einem Satz der reinen Logik auftreten. Demnach bleiben nur die reinen Formen als die einzig möglichen Teile von logischen Sätzen übrig. Ich will nicht positiv behaupten, daß die reinen Formen, z. B. die Form „x R y“ tatsächlich in den Sätzen der betrachteten Art vorkommen. Die Frage der Analyse solcher Sätze ist schwierig. Die Betrachtungen von der einen oder anderen Seite kommen miteinander in Konflikt. Wir wollen uns auf diese Frage nicht einlassen, aber wir können als erste Annäherung annehmen, daß die Formen Bestandteile der logischen Sätze sind. Wir können erklären (wenn auch nicht formell definieren), was wir unter der Bedeutung eines Satzes verstehen: Die „Form“ eines Satzes ist das, was in ihm unverändert bleibt, wenn jeder Teil des Satzes durch einen andern ersetzt wird. Also „Sokrates ist früher als Aristoteles“ hat dieselbe Form wie „Napoleon ist größer als Wellington“, obwohl beide Sätze sich in allen Teilen unterscheiden.
218
Wir können demnach feststellen: Es ist für mathematisch« oder logische Sätze notwendig, aber nicht hinreichend, daß man sie aus einem Satz ableiten kann, der keine Veränderlichen enthält (d. h. Werte wie alle, manche, ein, die usw.), wobei man jeden Teil in eine Veränderliche verwandelt und behauptet, daß das Resultat immer wahr oder manchmal wahr ist. Ferner, daß es immer wahr ist für einige der Veränderlichen, daß das Resultat manchmal wahr ist für andere Veränderliche oder irgend eine Variante dieser Formen. Anders ausgedrückt: die Logik oder Mathematik beschäftigt sich nur mit Formen und sie beschäftigt sich mit ihnen nur, insofern sie behauptet, daß sie immer oder manchmal wahr sind, wobei immer und manchmal auf alle mögliche Weise permutiert werden können. In jeder Sprache gibt es einige Worte, deren einzige Aufgabe es ist, eine Form anzudeuten. Diese Worte sind im allgemeinen am meisten in den Sprachen verbreitet, die am wenigsten Flexionen haben. Man betrachte den Satz: „Sokrates ist menschlich.“ Dabei ist das „ist“ nicht ein Teil des Satzes, sondern gibt nur die subjekt-prädikative Form an. Ähnlich deuten in dem Satz „Sokrates ist früher als Aristoteles“ die Worte „ist“ und „als“ nur die Form an. Der Satz ist derselbe wie: „Sokrates geht dem Aristoteles voran“. Hier sind diese Worte verschwunden und die Form ist auf andere Weise angedeutet. Die Form kann gewöhnlich anders als durch spezielle Worte angedeutet werden. Durch die Anordnung der Worte kann man die Form schon in hohem Maße zum Ausdruck bringen. Aber dieses Prinzip darf nicht übertrieben werden, z. B. ist es schwierig einzusehen, wie man molekulare Formen von Sätzen (die sog. Wahrheitsfunktionen) in geeigneter Weise überhaupt ohne Worte ausdrücken könnte. Wir sahen in Kapitel 14, daß ein einziges Wort oder Symbol für diesen Zweck ausreicht, nämlich ein Wort oder Symbol, das die U n v e r t r ä g l i c h k e i t ausdrückt. Aber selbst ohne ein solches Wort wären wir in Schwierigkeiten. Dies ist aber für unseren augenblicklichen Zweck nicht von Wichtigkeit. Wichtig ist dagegen die Beobachtung, daß die Form eine Eigenschaft eines allgemeinen Satzes sein kann, selbst wenn kein Wort oder Symbol in dem Satz die Form bezeich-
219
net. Wenn wir über die Form selbst sprechen wollen, so müssen wir für sie ein Wort haben. Aber wenn wir, wie in der Mathematik, über alle Sätze sprechen wollen, die diese Form haben, so können wir ein solches Wort gewöhnlich entbehren. In der Theorie wenigstens ist es wahrscheinlich niemals unumgänglich nötig. Nehmen wir also an (was meines Erachtens zulässig ist), daß die Formen der Sätze dargestellt werden können durch die Form derjenigen Sätze, in denen sie ohne irgendwelche speziellen Worte für die Formen ausgedrückt sind, so kämen wir zu einer Sprache, in der alles Formale zur Syntax und nicht zum Wortschatz gehört. In dieser Sprache könnten wir alle Sätze der Mathematik ausdrücken, ohne ein einziges Wort der Sprache zu kennen. Die Sprache der mathematischen Logik wäre nach ihrer Vollendung eine solche Sprache. Wir hätten darin auf verschiedene Weisen angeordnete Symbole für Variable, wie „x“, „R“ und „y“. Die Art der Anordnung würde andeuten, daß etwa ein Satz für alle Werte oder einige Werte der Veränderlichen gelten soll. Wir brauchten keine Worte zu kennen. Denn sie hätten nur den Sinn, den Veränderlichen bestimmte Werte zu geben. Und das ist die Aufgabe des angewandten Mathematikers, nicht aber des reinen Mathematikers oder Logikers. In einer solchen Sprache könnte ein Mann, der nur die Syntax und kein einziges Wort aus dem Wortschatz kennt, einen logischen Satz ausdrücken. Aber es gibt auch Worte, die nur die Form ausdrücken, wie z. B. „ist“ und „als“. Und in jedem bisher für die mathematische Logik aufgestellten Symbolismus gibt es Symbole, die eine konstante, formale Bedeutung haben. Wir können als Beispiel das Symbol der Unverträglichkeit nehmen, das beim Aufbau der Wahrheitsfunktionen verwendet wird. Solche Worte und Symbole können in der Logik vorkommen. Die Frage ist: wie müssen wir sie definieren? Die sogenannten „logischen Konstanten“ sind solche Worte oder Symbole. Logische Konstanten können genau so definiert werden, wie wir die Formen definierten. Tatsächlich sind sie im wesentlichen dasselbe. Eine fundamentale logische Konstante ist das gemeinsame Charakteristikum einer Reihe von Sätzen, die auseinander durch
220
gliedweise Substitution der Elemente hervorgehen können. So geht z. B. der Satz „Napoleon ist größer als Wellington“ aus dem Satz „Sokrates ist früher als Aristoteles“ hervor durch die Substitution von „Napoleon“ für „Sokrates“,„Wellington“ für „Aristoteles“ und „größer“ für „früher“. So kann man viele Sätze aus dem Prototyp „Sokrates ist früher als Aristoteles“ ableiten. Andere aber nicht. Diejenigen, bei denen dies möglich ist, sind von der Form „x R y“, d. h. sie drücken duale Beziehungen aus. Sätze wie „Sokrates ist ein menschliches Wesen“ oder „die Athener gaben Sokrates den Schierlingsbecher“ können wir aus dem obigen Prototyp durch wortweise Substitution nicht hervorbringen. Denn der erste ist von der subjektprädikativen Form, der zweite aber drückt eine Dreiglieder-Beziehung aus. Wenn wir irgend welche Worte in unserer rein logischen Sprache haben sollen, so müssen sie „logische Konstanten“ ausdrücken. Eine „logische Konstante“ ist entweder das Gemeinsame für eine Reihe von Sätzen, die auseinander nach der obigen Methode durch gliedweise Substitution ableitbar sind oder sie ist daraus ableitbar. Dieses Gemeinsame nennen wir „Form“. In diesem Sinn sind alle in der reinen Mathematik auftretenden „Konstanten“ logische Konstanten. Die Zahl 1 z. B. läßt sich aus Sätzen von folgender Form ableiten. „Es gibt ein Element c, derart, daß φ(x) dann und nur dann wahr ist, wenn x das c ist.“ Dies ist eine Funktion von φ. Wenn man dem φ verschiedene Werte gibt, so folgen daraus verschiedene Sätze. Wir können (indem wir einige Zwischenschritte, die für unseren augenblicklichen Zweck nicht wichtig sind, auslassen) die obige Funktion von φ als die Bedeutung der Sätze „die durch φ bestimmte Menge ist eine Einheitsmenge“ oder „die durch φ bestimmte Menge ist ein Element von 1“ auffassen. Dabei ist 1 eine Menge von Mengen. So erhalten Sätze, in denen 1 vorkommt, eine Bedeutung, die aus einer gewissen konstanten, logischen Form abgeleitet worden ist. Das gleiche gilt für alle mathematischen Konstanten. Alle sind logische Konstanten oder symbolische Abkürzungen, deren Verwendung im entsprechenden Zusammenhang mit Hilfe von logischen Konstanten vollkommen definiert ist.
221
Obwohl alle logischen (oder mathematischen) Sätze ganz durch logische Konstanten und Variable ausgedrückt werden, können, so gilt das Umgekehrte nicht, daß alle Sätze, die auf diese Weise ausgedrückt werden können, logisch sind. Wir haben damit ein notwendiges, aber nicht hinreichendes Kriterium für mathematische Sätze gefunden. Wir haben den Charakter der Grundbegriffe genügend definiert. Durch sie können alle B e g r i f f e der Mathematik d e f i n i e r t werden, aber die Grundsätze, aus denen alle Sätze der Mathematik a b g e l e i t e t werden können, sind noch nicht genügend definiert. Dies ist ein schwieriges Problem. Die vollständige Lösung ist noch nicht bekannt. Das Unendlichkeitsaxiom bildet ein Beispiel eines Satzes, der zwar in logischen Ausdrücken ausgesprochen werden kann, von dem man aber logisch nicht behaupten kann, er sei wahr. Alle Sätze der Logik haben eine charakteristische Eigenschaft. Man pflegte sie dadurch auszudrücken, daß man sagte, sie seien analytisch oder ihre Verneinungen seien Widersprüche in sich selbst. Diese Ausdrucksweise ist nicht befriedigend. Der Satz Von Widerspruch ist nur einer der logischen Sätze und er hat keinen speziellen Vorrang. Wahrscheinlich benötigt man zum Beweis, daß die Verneinung irgend eines Satzes ein Widerspruch in sich selbst sei, außer dem Satz vom Widerspruch noch andere Deduktionsprinzipien. Trotzdem besteht das gesuchte Charakteristikum der logischen Sätze in dem, was man dunkel ahnte und durch die Behauptung der Ableitbarkeit aus dem Satz vom Widerspruch definieren wollte. Die Behauptung, die Zahl der Individuen im Universum sei n, welche Zahl auch n sein mag, besitzt, wie man sofort sieht, diese charakteristische Eigenschaft, die wir für den Moment Tautologie nennen wollen, nicht. Aber für die verschiedenen Typen könnte man logisch beweisen, daß es Mengen von n Elementen gibt, wo n eine beliebige endliche ganze Zahl ist. Ebenso, daß es Mengen mit א₀ Gliedern gibt, aber bei den Typen selbst wären diese Beweise hinfällig, wie wir in Kapitel 13 sahen. Bei der Frage, ob es n Individuen in der Welt gibt, sind wir auf empirische Beobachtungen angewiesen. Unter den „möglichen
222
Welten“ (im Sinn von Leibniz) gibt es Welten mit einem, zwei, drei . . . . Individuen. Es gibt scheinbar keine logische Notwendigkeit für die Existenz irgend eines Individuums1) oder für die Existenz irgend einer Welt überhaupt. Der onthologische Gottesbeweis würde, wenn er richtig wäre, die logische Notwendigkeit für die Existenz zum mindestens eines Individuums geben. Aber er gilt allgemein als falsch. Tatsächlich beruht er auf einer irrtümlichen Auffassung der Existenz, d. h. ihm fehlt die Erkenntnis, daß die Existenz nur von etwas beschriebenen, nicht von etwas benannten behauptet werden kann. Es ist also sinnlos zu argumentieren, „Dies ist der Soundso“ und „der Soundso existiert“, also „muß dies existieren“. Wenn wir den onthologischen Beweis verwerfen, sind wir scheinbar zur Schlußfolgerung gezwungen, daß die Existenz der Welt ein Zufall, d. h. keine logische Notwendigkeit ist. Wenn dem so ist, so kann kein logisches Prinzip eine „Existenz“ behaupten, es sei denn in hypothetischer Form. Also kann kein logisches Prinzip von der Form sein „die Satzfunktion soundso ist manchmal wahr“. Wenn Sätze dieser Art in der Logik vorkommen, so müssen sie als Hypothesen oder Folgerungen aus solchen auftreten, nicht aber als vollständig assertorische Sätze. Die vollständig assertorischen Sätze der Logik müssen immer den Inhalt haben: irgend eine Satzfunktion ist immer wahr. Folgendes z.B. ist immer wahr: wenn aus p q folgt und aus q r folgt, so folgt aus p r. Oder: wenn alle α’s β’s sind und x ist ein α, dann ist x ein β. Solche Sätze können in der Logik vorkommen. Ihre Wahrheit ist unabhängig von der Existenz der Welt. Wir können behaupten, wenn es keine Welt gäbe, so wären alle allgemeinen Sätze wahr. Denn das Gegenteil eines allgemeinen Satzes ist (wie wir in Kapitel 15 sahen) eine Existenzbehauptung. Wenn es keine Welt gäbe, wäre sie also immer falsch. Die logischen Sätze können also a p r i o r i ohne Kenntnis der tatsächlichen Welt erkannt werden. Wir wissen erst aus der Erfahrung,
1 ) Aus den Grundsätzen in den Principia Mathematica ergibt sich die Existenz mindestens eines Individuums. Aber ich halte das jetzt für einen Fehler an logischer
223
daß Sokrates ein Mensch ist. Daß aber der Syllogismus in seiner abstrakten Form (d. h. ausgedrückt durch Variable) wahr ist, das wissen wir, ohne an die Erfahrung appellieren zu müssen. Dies charakterisiert nicht die logischen Sätze an sich, sondern die Art, wie wir sie erkennen. Dies ist aber auch von Bedeutung für die Frage nach ihrer Natur, denn es gibt gewisse Sätze, bei denen schwerlich anzunehmen ist, daß wir sie ohne Erfahrung wissen können. Es ist klar, daß wir bei der Definition der „Logik“ oder „Mathematik“ aufs neue versuchen müssen, den alten Begriff der „analytischen“ Sätze zu definieren. Wir begnügen uns nicht mehr damit, logische Sätze als diejenigen zu definieren, die aus dem Satz vom Widerspruch folgen. Trotzdem können und müssen wir noch immer zugeben, daß sie von ganz anderer Art sind als die Sätze, die uns die Erfahrung lehrt. Sie haben alle eine charakteristische Eigenschaft, die wir kurz vorher „Tautologie“ nannten. Diese Eigenschaft zusammen mit der Tatsache, daß sie vollkommen durch Variable und logische Konstanten ausgedrückt werden können, gibt die Definition der Logik oder reinen Mathematik. Eine logische Konstante ist dabei definiert durch die Eigenschaft, konstant zu bleiben, selbst wenn in einem Satz alle Bestandteile verändert werden. Augenblicklich kann ich die „Tautologie“ nicht definieren1). Es ist leicht eine Definition vorzuschlagen, die für eine Weile befriedigt. Aber ich kenne keine, die ich für zufriedenstellend halte, obwohl mir gefühlsmäßig das zu definierende Charakteristikum vollkommen vertraut ist. Hier kommen wir eben auf unserer Rückreise in die logischen Grundlagen der Mathematik an die Grenze unseres Wissens. Wir kommen jetzt zum Ende unserer einigermaßen summarischen Einführung in die mathematische Philosophie. Wenn man die logischen Symbole nicht verwendet, ist es unmöglich, die bei diesem Problem auftretenden Ideen adäquat wiederzugeben. Da die gewöhnliche Sprache keine Worte hat, die von sich aus gerade das
1 ) Mein früherer Schüler Ludwig Wittgenstein arbeitete über dieses Problem und machte mich auf die Wichtigkeit der Tautologie für die Definition der Mathematik aufmerksam. Ich weiß nicht, ob er das Problem gelöst hat, nicht einmal, ob er noch lebt.
224
ausdrücken, was wir ausdrücken wollen, muß man, solange wir bei ihr bleiben, die Worte in ungewöhnliche Bedeutungen hineinzwängen. Der Leser wird dann, wenn nicht schon am Anfang, so doch nach einer gewissen Zeit, wieder darauf verfallen, den Worten den ursprünglichen Sinn unterzulegen. Er kommt daher zu falschen Vorstellungen. Dazu kommt noch, daß die gewöhnliche Grammatik und Syntax außerordentlich irreführend sind. Das ist z. B. der Fall bei den Zahlen. »Zehn Menschen“ ist grammatikalisch von derselben Form wie „weiße Menschen“. So daß man auf den Gedanken kommen könnte, zehn sei ein Adjektiv, das die Menschen qualifiziere. Dies ist wiederum der Fall, sobald Satzfunktionen auftreten, insbesondere bei der Existenz und den Beschreibungen. Die Sprache ist irreführend, verschwommen und ungenau, wenn man sie auf die Logik anwendet. Denn hiefür war sie niemals bestimmt. Daher ist der logische Symbolismus für jede genaue und durchgreifende Behandlung unseres Problems unbedingt nötig. Diejenigen Leser, die es zu einer Meisterschaft in den Prinzipien der Mathematik bringen wollen, werden hoffentlich vor der Arbeit der Beherrschung der Symbole nicht zurückschrecken. Denn diese Arbeit ist tatsächlich viel kleiner als man glauben möchte. Wie die obenstehende kurze Übersicht klar gezeigt hat, gibt es in unserem Fach noch unzählige ungelöste Probleme. Viel Arbeit ist noch zu tun. Wenn dieses kleine Buch einen Leser zu einem ernsthaften Studium der mathematischen Logik angeregt hat, so hat es seinen Hauptzweck erfüllt.
Schlagwortverzeichnis
226 abgeschlossen 117 Ableitbarkeit, formale 170 Addition 87 –, Zusammenhang mit Multiplikation 139 a-Funktion 206, -Mengen 208 alle 178, 206 alles 152 Aleph 98 Aliorelativität 43 analythische Sätze 223 anordnen 41 Ansammlung 22, 200 Anschauung 161 äquivalent 26, 65, 155 äquivalente Sätze 195, formal 201 Äquivalenz zwischen Mengen 56 Argument 59, 122, -folge 130 Arithmetik, transfinite 119 Arithmetisierung 14 Artikel in der Einzahl 189, in der Mehrzahl 198 assertorisch 182, 222 assoziatives Gesetz 71, 108 Asymmetrie 42, 54 Ausdehnung von Raum und Zeit 157 Ausschnitt 124, 129, letzter oberer 125, 129 Prinzip 142 Auswahl 132, 135, 140 Axiom 73, 96, der Unendlich keit 79, 147, multiplikatives 102, 138, 209, Peanos 18 Begriff eines Objekts 155 Begriffsschrift 36 Beispiel 73, 173 Bereich 26, 44, 55 Beschreibung 58, 156, 184 Bolzano 155 Bruch 77, 113, nach der Größe geordnet 49 Bruder oder Schwester 42 Bündel 24 Bewegung 50 Beziehung 33, 41, 51, 52, 54, 59, 67, 73, -arithmetik 104, 69, 74, asymmetrische 97, Ehefrau 54, Ehemann 54, Eigenschaft einer 42, inverse 77, Nachbar- 48, ordnende 45, verheiratet mit 54, von n zu n+1 94
Bezeichnung, nominelle 153, reelle 153 Cantor 78, 91, 93, 97, 99, 102, 103, 109, 114, 116, 117 circulus vitiosus 141, 152 Clifford, W. K. 89 Darapti 181 Dedekind 82, 84, 86, 113, 118, 155 Deduktion 160 Definition, logische 40 Dezimalbruch 107 dicht 79, 106 Dichtheit 114 Differentialrechnung 121 Dimension 40 Disjunktion 162, 163 distributiv 71, 108 Division 101 Dreigliederbeziehung 50, 72, 220 Eigenschaft einer Folge 32, 42 Eigenname 159 Eigentümlichkeit, definierende 23 Einheitsmenge 198 Einhorn 175, 177, 185 einige 179 ein-eindeutig 25, 57, 68, 78 einfach im logischen Sinne 110 ein-mehrdeutig 25, 57,68,78,128 Einzelheit 158, 199 elementare Sätze 178 Elemente, die von der 0 aus durch sukzessive Schritte von einem zum nächsten erreicht werden 33 Elemente von Mengen 25 endlich 30, 32, 35 endliche Folgen 70 erblich 32 erblich bezüglich n 36 Existenz 154, 181, 189, 196, 222 Existenzbedingung 204 Exponentialgesetz 109 extensional 204 Euklid 11, 80 Fall 173 Feld 44, 59, 66 Fiktion, logische 24, 153 Fluß 119 folgen 43, 163, strenges 170
227 Folge 40, 45, 50, 69, -begriff 40, 79, -beziehung 45, 128, -Charakter 40, -zahl 70, 97, 103, der Funktionswerte 130, der ganzen Zahlen 12, der natürlichen Zahlen 13, unendliche 70, 103 Formen 80, 217, molekulare 216, subjektprädikative 220 Frege 16, 36, 91, 110, 163, 180 früher 42 Funktion 124, 203, beschreibende 184, 197, brave 124, extensionale 219, 205, 208, im mathematischen Sinn 58, prädikative 206, 210, von Sätzen 163 Funktionswert 122 Geometrie der Klassen 71, deskriptive 213, projektive 213 Gerade im gewöhnlichen Raum 50 Gedankenwelt 156 gerade Zahl 41 Gegenbilder, objektive 75 Gesamtzahl der Individuen 35, 147 Gleichung, kubische 22 gleich 95 goldene Berge 186 Gottesbeweis, ontologischer 222 Grammatik 68 grammatische Form 185 Grenze, obere 84, 112, untere 84 größer 56, 104 größer oder kleiner 45, 56 Grundlagen der Welt 199 Grundbegriffe 15 Grundsätze von Peano 15 Gruppe 64 Hamlet 187 Haufen 201 Hegel 121 Heirat 26 Hierarchie 150, 155, 206, logische 153 hineinstreben in Q in die Menge α129 homogen 66 Idee 156, 185, platonische 155 Identität 60, 173, 193, 210 imaginär 76 imaginärer Teil 88 immer 177 immer wahr 174 implizieren 67
Implikation 56, 162 Individualität 75 Individuum 158, 191 induktiv 33 Induktion, mathematische 32, 38, 97, 107 induktive Zahl 39, 92, 105 Induktion, verallgemeinerte Form der 47, 55, Prinzip der 16 Inhalt 68 Inhaltsdefinition 22 inkommensurable Größe 14, Zahlen 80 Invarianz gegenüber einer Addition 93 in sich dicht 117 Intervall 129 intensional 204 irrationaler Limes 84 irrationaler Schnitt 83, 113 Irrationalzahl 83, 86 Kant 161 Kardinalzahl 69, 106, größte 152, nichtinduktiv 146, Null 78, reflexive 94, unendliche 91,101 Karte einer Beziehung 74 Klasse 22, 82, 141 kleiner als 42, 47, 78, dem absoluten Betrag nach 123, oder gleich 45 Kombination zweier Permutationen 63 kommutativ 108 komplex 43, 76, 81, 87 komplexe Zahlen der Ordnung n 90 Konjunktion 163 Konstante, logische 219, 223 Konstruktion 55, 86 konstruieren 132 Kontinuum 146 Korrelation 90 Korrelator 67, 72, 94, 140 Kosinus 58 Landkarte 65 Länge einer Folge 70 Laplace 201 Leibniz 95, 121, 157, 210, 222 Lewis 171 Limes 40, 111, 116, einer Funktion 118, 121, 126, oberer 83, 112, unterer 83, 114 links von 42, 52 Logik, Definition der 176, formale 179,
228 symbolische 180 Logarithmus 58 Lücke 83, 113 manchmal 177 manchmal wahr 176, 181 Mannigfaltigkeit 22 Maximum 83, 112 Meinung 195 Menge 15, 22, 32, 37, 65, 132, 198, 200, -theorie 34, multiplikative 135, reflexive 94, 155, unreine 153, von Mengen 133 mehr-eindeutig 25, 78 Minimum 83, 112 Mittelmenge 118 Modalitätsbegriff 182 möglich 182 Multiplikation 87,105, -zahl 146, bei unendlichen Zahlen 132, Zusammenhang mit Addition 139 Nachfolger 15, 18, 33, 92, 96, 112, 127, Definition 34 Nachkommenschaft 33, 36, 47, 92, 96 Namen 190 Negation 163 n-erblich 36 Nichtinduktivität 143 nichtinduktivsein 102 Nicod 164, 166, 168 nominell 153 notwendig 182 Null 18, 97 Nullmenge 34, 148, 150, 200 Oberklasse 82 Occam 201 Ordinalzahl 70, transfinite 141 Ordnung 27, 40, 43, 46, 70, Definition 46, Korrelator 67 Paare, geordnete 136 Parallelenaxiom 137 Peano 15, 16, 58, 92, 96,147,180 Peirce 43 perfekt 116 Permutationen 63 Philosophie, mathematische 11 Plato 154 Poincaré 38 Postulat 86
Potenzgesetz 71 potenzieren 108, 136 Prädikat 158, 210 Prämissen 161, 167 Präzedenten 112 Primzahl 41, 113 primär 196 Principia Mathematica 35, 77, 86, 96, 109,121, 134, 138, 150, 153, 161, 164, 166, 168 Principles of Mathematics 36, 51, 86, 90, 154, 161 Produkt von zwei Zahlen 16, 87, 137, unendliches 134 Progression 18, 96, 105, 116, 145 Pseudonamen 153, -Objekt 187, -Syllogismus 181 Punkt 72 Pythagoras 14, 80 Quadrat einer Beziehung 42 Quadratzahlen 29 Quantität 213 Quantentheorie 157 Raum 50, 74, 101, 118 Referens 61 reell 87 rechts von 48 Reduzibilitätsaxiom 208, 210 reductio ad absurdum 178 reflexiv 26, 102 Reflexivität 143 Regression 116 Relatum 61 R-erblich 37 Richtung einer Beziehung 61 R-Nachkommenschaft 37, 47 Royce 94, 95 R-Schritt 60 R-Vektor 60 R-Vorfahr 37, 47 Rückwärts-R-Schritt 60 rundes Quadrat 186 Russell 12 Satz 172, -funktion 59, 169,172 Schluß 39, 161 Schnitt, Dedekindscher 82 Schwankung 123, letzte 125, 129 Seeschlange 185 Segment 86, 112
229 sekundär 197 Selektor 135, 142 Sequente 112 Sheffer 164 Soundso, der 194, ein 188, 194 Sprache der mathematischen Logik 219, symbolische 199 Stetigkeit 50, 101, 114, 118, 123, 127, -definition 116, -beweis 157, einer Funktion 118, 119, schlechthin 127 Struktur 65, 73 Subjekt 210, des Attributs 158, scheinbares 158 Substanz 159 Subtraktion 101 Summe von zwei Zahlen 16, von א₀ Paaren 141 Syllogismus 38, 181, 223 Symbol 173, komplexes 196 Syntax 68 symmetrisch 26 Tautologie 221 Teil eines logischen Satzes 216, echter 63, 94 Teilmenge 107, 138 Totalität 203 transfiniterblich 107 transitiv 27, 43 Trennung der Paare 52 Typus 158, 169, 177, 191, 206, 208, logischer 66, Verwechslung von 151 Typenlehre 152 Umfang 59, 73, -definition 23, der Funktionswerte 59 Umgebung 123 Umkehrung per accidens 181 unendlich 31 Unendlichkeitsaxiom 91, 150,209 Unendlichkeit, echte 78, – der Rationalzahlen 78 ungleich 56 unmöglich 182 Unterklasse 82 Unverträglichkeit 162, 218 Unwirklichkeit 185, 187 Vater 73 Vater oder Mutter 37
Veblen 72 Verallgemeinerung 173 Veränderliche 218, scheinbare 178 Verbum 158 Verdünnungsprozeß 105 Verschiedenheit 43, 67 Vertreter 134, 139 Vorangehen 42, 46 Vorfahr 45, 48, 57, -beziehung 38, 48, 49, 55 Vorgängermenge 128 Vorgänger, unmittelbarer 96 Wahrheitswert 163, 204, -funktion 164 wahr in allen Fällen 174 Wahlbezirk 134 Wahrscheinlichkeitsrechnung IM Weierstraß 121 Wells 128 Welten, mögliche 158, 222 Wert 59, einige 207 Whitehead 12, 77, 90, 121, 1J4 Widerspruch der größten Kardinalzahl 152 wirklich 186 Wittgenstein 223 wohlgeordnet 106, 138 Young 72 Zahl 17, 31, 76, 96, -enprädikat 57, der Mengen in der Welt 148, der Teilmengen 99, einer Menge 29, natürliche 34, nichtinduktive 92, reelle 86, 150, ungerade 41 Zeit 50, 74, 101, 118 Zermelo 138, 139, -Theorem 139, 145, -Axiom 138 Zusammenhang 43, 68, 71 zwischen 50, 52, Zwischenbeziehung 71 zyklisch 50, 58
230
231
232
233