William Ewald Wilfried Sieg
david hilbert’s
Lectures on the Foundations of Arithmetic and Logic 1917–1933
123
David ...
63 downloads
1044 Views
7MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
William Ewald Wilfried Sieg
david hilbert’s
Lectures on the Foundations of Arithmetic and Logic 1917–1933
123
David Hilbert’s Foundational Lectures
Editors
David Hilbert’s Lectures on the Foundations of Arithmetic and Logic 1917–1933
David Hilbert’s Lectures on the Foundations of Mathematics and Physics, 1891–1933 General Editors William Ewald, Michael Hallett, Ulrich Majer and Wilfried Sieg
Volume 1 David Hilbert’s Lectures on the Foundations of Geometry, 1891–1902 Volume 2 David Hilbert’s Lectures on the Foundations of Arithmetic and Logic, 1894–1917 Volume 3 David Hilbert’s Lectures on the Foundations of Arithmetic and Logic, 1917–1933 Volume 4 David Hilbert’s Lectures on the Foundations of Physics, 1898–1914 Classical, Relativistic and Statistical Mechanics Volume 5 David Hilbert’s Lectures on the Foundations of Physics, 1915–1927 Relativity, Quantum Theory and Epistemology Volume 6 David Hilbert’s Notebooks and General Foundational Lectures
William Ewald Wilfried Sieg Editors Michael Hallett Associate Editor
David Hilbert’s Lectures on the Foundations of Arithmetic and Logic 1917–1933 in collaboration with Ulrich Majer and Dirk Schlimm
123
Editors William Ewald Law School University of Pennsylvania Philadelphia, Pennsylvania USA
Wilfried Sieg Department of Philosophy Carnegie Mellon University Pittsburgh, Pennsylvania USA
Ulrich Majer Philosophisches Seminar Universität Göttingen Göttingen Germany
Dirk Schlimm Department of Philosophy McGill University Montréal, Québec Canada
Michael Hallett Department of Philosophy McGill University Montréal, Québec Canada
ISBN 978-3-540-20578-4 ISBN 978-3-540-69444-1 (eBook) DOI 10.1007/978-3-540-69444-1 Springer Heidelberg New York Dordrecht London Library of Congress Control Number: 2013938947 © Springer-Verlag Berlin Heidelberg 2013 This work is subject to copyright. All rights are reserved by the Publisher, whether the whole or part of the material is concerned, specifically the rights of translation, reprinting, reuse of illustrations, recitation, broadcasting, reproduction on microfilms or in any other physical way, and transmission or information storage and retrieval, electronic adaptation, computer software, or by similar or dissimilar methodology now known or hereafter developed. Exempted from this legal reservation are brief excerpts in connection with reviews or scholarly analysis or material supplied specifically for the purpose of being entered and executed on a computer system, for exclusive use by the purchaser of the work. Duplication of this publication or parts thereof is permitted only under the provisions of the Copyright Law of the Publisher’s location, in its current version, and permission for use must always be obtained from Springer. Permissions for use may be obtained through RightsLink at the Copyright Clearance Center. Violations are liable to prosecution under the respective Copyright Law. The use of general descriptive names, registered names, trademarks, service marks, etc. in this publication does not imply, even in the absence of a specific statement, that such names are exempt from the relevant protective laws and regulations and therefore free for general use. While the advice and information in this book are believed to be true and accurate at the date of publication, neither the authors nor the editors nor the publisher can accept any legal responsibility for any errors or omissions that may be made. The publisher makes no warranty, express or implied, with respect to the material contained herein. Printed on acid-free paper Springer is part of Springer Science+Business Media (www.springer.com)
This Volume is dedicated to the memory of David Hilbert, on the occasion of his 151st birthday.
David Hilbert. Courtesy of the Voit Collection in the Manuscript Division of the Niedersächsische Staats- und Universitätsbibliothek, Göttingen.
Preface The present Volume is the third in a series of six presenting a selection from Hilbert’s previously unpublished lecture notes on the foundations of mathematics and physics during the period 1890 to 1933. The Hilbert Nachlaß contains approximately eighty lecture notebooks, covering all aspects of his mathematical activity, and spanning almost the entirety of his teaching career; some are in his own hand, others were carefully worked out by his assistants as official protocols of his lectures. Roughly one quarter of these notebooks deal with foundational subjects. Hilbert’s lecture courses represent an enormous fund of learning and invention, and embrace almost every subject common in the mathematical sciences of his time. The notes therefore provide a remarkable record, sometimes almost from day to day, of the development of his ideas, and show, in addition, his engagement with the work of other scientific figures of the first rank. The present Volume treats Hilbert’s lectures on logic, arithmetic and proof theory from the autumn of 1917 on. During this period Hilbert actively resumed his research investigations into the foundations of mathematics, and undertook his intensive collaboration with Paul Bernays, who wrote up many of the lecture notes reproduced in this Volume. The period covered here sees the emergence of modern mathematical logic; the explicit posing of questions of completeness, decidability, and consistency for logical systems; the investigations of the relative strengths of various logical calculi; the formulation of the decision problem; the birth of proof theory and the energetic pursuit by Hilbert and by Bernays of technical work on the Hilbert consistency programme. These developments can here be followed in greater detail than has been possible from the published record alone: one sees the variety of approaches, the shifts in strategy, and obtains a fuller picture of the motivation for Hilbert’s investigations, as well as of his intellectual relationship to the work of such contemporaries as Russell, Whitehead, Brouwer, and Weyl. The widespread picture of Hilbert as a naïve ‘formalist’ disappears, to be replaced by a much more subtle and nuanced record of the development of Hilbert’s views on the philosophy of mathematics. The structure of this Edition, the nature, location, and condition of the Hilbert lecture notes, their provenance, and what we have been able to reconstruct of their history, are all described in the general ‘Introduction to the Edition’, which is to be found at the beginning of Volume 1 (Hallett and Majer 2004 ). That Introduction also explains in detail the criteria for the selection of the texts, the way in which they were edited, and general matters of textual policy. Those matters are uniform for the entire Edition, and we have not repeated the full account here. We do, however, include a description of the textual policies in the section ‘The Editing and Reproduction of the Texts’; this section is intended to provide all the basic information necessary to a reading of the texts. This Volume also reprints from Volume 1 (in slightly revised and expanded form) the list of Hilbert’s lecture courses; see pp. 991ff. That these lectures are finally being published is the result of the efforts, over two decades, of many individuals and institutions. The series as a whole IX
X
Preface
is under the supervision of four General Editors, William Ewald, Michael Hallett, Ulrich Majer and Wilfried Sieg, who bear the collective responsibility for editorial policy. For each individual volume, Volume Editors were designated to produce the final selection of texts and to write the scholarly apparatus; this work was carried out in consultation with the General Editors. The designated Editors for this Volume were Ewald and Sieg, in collaboration with Majer and Dirk Schlimm, with Hallett as Associate Editor. As before, the General Editors wish to express their thanks to the Deutsche Forschungsgemeinschaft (DFG) for its generous financial support from 1993 to 2003. To edit even the mere fragment of the voluminous Hilbert Nachlaß that appears in these six volumes required a considerable institutional apparatus located in proximity to the archives in Göttingen. Without the assistance of the DFG, which enabled us to establish a permanent staff in Göttingen, the present Edition could never have been realized. Ulrich Majer, the General Editor who was constantly ‘vor Ort’, supervised the permanent staff and thus had the task of dealing with all the technical problems that an edition of this sort must inevitably face. We again acknowledge the indispensable scholarly, editorial and technical contributions to the Edition as a whole of Ralf Haubrich, Albert Krayer and Tilman Sauer, all at one time full-time members of the permanent staff. We furthermore thank the Institut für Wissenschaftsgeschichte at the University of Göttingen (in particular Lorraine Daston, its former director) for giving the project its first physical home and for recognizing its significance. We are also grateful to the Philosophisches Seminar at the University of Göttingen for space and support. Numerous other institutions and individuals provided significant support for the Edition. In Göttingen, from the first, formative stages of the project, we received encouragement and advice from the late Martin Kneser, Samuel Patterson, Günther Patzig and Helmut Rohlfing. The Mathematisches Institut and the Niedersächsische Staats- und Universitätsbibliothek in Göttingen (SUB), the holders of the original Hilbert documents, granted the necessary permission for publication. At an early stage, Martin Kneser was kind enough to place at our disposal his father Hellmuth’s Mitschriften of the lectures ‘Grundlegung der Mathematik’ and ‘Grundlagen der Arithmetik’ given by Hilbert and Bernays in the Winter Semesters 1921/22 and 1922/23 respectively, as well as notes for some lectures given by Hilbert in February 1924; Martin Kneser also granted permission for their publication. The manuscripts now form part of an archive of Hellmuth Kneser’s papers in the Handschriftenabteilung of the SUB (signature Cod. Ms. H. Kneser), which has also kindly granted permission for their publication. Warm thanks are also due to Frau Brigitte Peterhans of Chicago for allowing us access to a polished Nachschrift by Walter Peterhans of Hilbert’s 1922/23 lectures. (The Nachschrift is described in some detail below; see pp. 569ff. Thanks are also due to the Folkwangmuseum in Essen, where the manuscript now resides, for permission to quote from it.) We also thank Paul Bernays’s nephew, Ludwig Bernays, for permission to reproduce Bernays’s second Habilitationschrift from 1918, which
Preface XI appears as an Appendix to Chapter 1. The Universitätsarchiv of the University of Freiburg kindly granted permission to quote (on p. 291) from a postcard written in 1920 by Bernays to Zermelo, part of the Zermelo Nachlaß kept there. We are also grateful for permission to reprint the various photographs used here. For the first photograph (see p. V), we thank the Voit Collection in the Manuscript Division of the SUB. For the second photograph (p. 273) we thank the late Dorothée Fuchs of Ithaca, New York. She was born in Göttingen, the daughter of the physicist Heinrich Rausch von Traubenberg and the mathematician Marie Rosenfeld, both of whom studied with Hilbert; she later married the mathematician, Wolfgang Fuchs. The photograph was taken in the Hilberts’ garden on the occasion of her receiving a camera for her sixteenth birthday, 27 July 1937. We have been unable to ascertain the origins of the third photograph (p. 653). The two women standing behind Hilbert are said to be the family housekeepers; Hilbert’s wife is to the left. The Institute for Advanced Study in Princeton, through the offices of Harry Woolf and Phillip Griffiths, provided the Editors with a collective working environment in the summer of 1997. The Alexander von Humboldt Stiftung, the Social Sciences and Humanities Research Council of Canada, McGill University, Carnegie Mellon University, the University of Pittsburgh, the University of Pennsylvania Research Foundation, and the John Templeton Foundation have all provided funding for travel and research, or generously supported conferences on the topics of these Volumes. Carnegie Mellon University, the Georg-August Universität, Göttingen and the Universität Bern hosted a series of conferences on Hilbert’s unpublished foundational writings. Catriona Byrne of Springer Verlag has given the Edition abundant support and advice, and has been patient with the inevitable delays; at an earlier stage of the project, similar assistance was provided both by Martin Gilchrist and Elizabeth Johnston of Oxford University Press. A large number of people have been of assistance in various technical and research capacities. For their help we thank: Volker Ahlers, Tobias Brendel, Willem Hagemann, Julia Hartmann, Nina Hehn, Arnim von Helmolt, Stefan Krämer, Pamela Klapproth, Michael Mai, Heiko Schilling, Rebecca Pates, Friedericke Schröder-Pander, Hans-Jakob Wilhelm, and many others. The technical work of Oliver Keller, ably assisted by Stefan Krämer, on the final stages of Volume 1 has also proved indispensable. The typesetting of the book by Hilbert and Ackermann reproduced in Appendix A was mainly done by Andreas Voellmer and Rachel Rudolph, to whom again many thanks. This Volume was originally set up, and the texts processed, under the supervision of Ralf Haubrich, who played an essential role in the design of the editorial apparatus; it was subsequently greatly advanced by Albert Krayer. The later stages of its preparation, organisation and presentation were largely in the hands of Dirk Schlimm, to whom we are enormously indebted. The General Editors William Ewald, Michael Hallett, Ulrich Majer and Wilfried Sieg
Contents
Preface
IX
The Editing and Reproduction of the Texts Introduction 1. 1899–1917: Towards Mathematical Logic. . . . . 2. 1917–1920: Logic and Metamathematics. . . . . 3. 1920–1922: From Logic Towards Proof Theory. . 4. 1922–1925: Finitist Proof Theory. . . . . . . . . 5. 1925–1931: An Elementary Finiteness Theorem? 6. Material Omitted from this Volume. . . . . . . .
XVII . . . . . .
. . . . . .
. . . . . .
. . . . . .
1 4 9 12 17 21 29
Chapter 1 Lectures on the Principles of Mathematics (1917/18) Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . ‘Prinzipien der Mathematik’ . . . . . . . . . . . . . . . . . . . Textual Notes . . . . . . . . . . . . . . . . . . . . . . . . Description of the Text . . . . . . . . . . . . . . . . . . . Appendix: The Bernays Habilitation Thesis of 1918 . . . . . . Introduction to the Bernays Habilitationsschrift . . . . . . . . ‘Beiträge zur axiomatischen Behandlung des Logik-Kalküls’ . Textual Notes . . . . . . . . . . . . . . . . . . . . . . . . Description of the Text . . . . . . . . . . . . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
31 32 59 215 220 222 222 231 269 270
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
Chapter 2 Lectures on Logic (1920) Introduction to the 1920 Lectures . . . . . . . . . . . . . . . . . . . ‘Logik-Kalkül’ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Textual Notes . . . . . . . . . . . . . . . . . . . . . . . . . . . Description of the Text . . . . . . . . . . . . . . . . . . . . . . ‘Probleme der mathematischen Logik’ . . . . . . . . . . . . . . . . Textual Notes . . . . . . . . . . . . . . . . . . . . . . . . . . . Description of the Text . . . . . . . . . . . . . . . . . . . . . . Introduction to the Undated Draft . . . . . . . . . . . . . . . . . . ‘Consistency Proofs for Fragments of Arithmetic (Undated Draft)’ Textual Notes . . . . . . . . . . . . . . . . . . . . . . . . . . . Description of the Text . . . . . . . . . . . . . . . . . . . . . . Photographic Reproduction of a Page from the Manuscript . .
275 276 298 336 339 342 372 375 378 396 410 413 415 XIII
XIV
Contents
Chapter 3 Lectures on Proof Theory (1921/22 – 1923/24) Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . ‘Grundlagen der Mathematik’ (1921/22) . . . . . . . . . . . Textual Notes . . . . . . . . . . . . . . . . . . . . . . . Description of the Text . . . . . . . . . . . . . . . . . . ‘Logische Grundlagen der Mathematik’ (1922/23) . . . . . . Textual Notes . . . . . . . . . . . . . . . . . . . . . . . Description of the Text . . . . . . . . . . . . . . . . . . ‘Logische Grundlagen der Mathematik’ (1923/24) . . . . . . Textual Notes . . . . . . . . . . . . . . . . . . . . . . . Description of the Text . . . . . . . . . . . . . . . . . . Appendix: Kneser’s Mitschriften . . . . . . . . . . . . . . . Introduction to Appendix . . . . . . . . . . . . . . . . . . . Kneser Mitschrift: The lectures from 1921/22 . . . . . . . . Textual Notes . . . . . . . . . . . . . . . . . . . . . . . Description of the Text . . . . . . . . . . . . . . . . . . Kneser Mitschrift: The lectures from 1922/23 . . . . . . . . Textual Notes . . . . . . . . . . . . . . . . . . . . . . . Description of the Text . . . . . . . . . . . . . . . . . . Kneser Mitschrift: The lectures from 1923/24 . . . . . . . . Textual Notes . . . . . . . . . . . . . . . . . . . . . . . Description of the Text . . . . . . . . . . . . . . . . . . Appendix: Bernays’s Note (c. 1923/24) . . . . . . . . . . . . Introduction to Appendix . . . . . . . . . . . . . . . . . . . Bernays’s Note: ‘Wf-Beweis für das logische Auswahlaxiom’ Textual Notes . . . . . . . . . . . . . . . . . . . . . . . Description of the Text . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . .
417 418 431 522 527 528 548 549 550 563 564 565 565 577 595 598 599 631 634 636 644 645 646 646 647 651 652
Chapter 4 Lectures on the Infinite (1924/25, 1931, 1933) 655 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 656 ‘Über das Unendliche’ (1924/25) . . . . . . . . . . . . . . . . . . . 668 Textual Notes . . . . . . . . . . . . . . . . . . . . . . . . . . . 757 Description of the Text . . . . . . . . . . . . . . . . . . . . . . 759 Introduction to ‘Ueber die Grundlagen des Denkens’ . . . . . . . . 761 ‘Ueber die Grundlagen des Denkens’ (c. 1931) . . . . . . . . . . . . 765 Textual Notes . . . . . . . . . . . . . . . . . . . . . . . . . . . 774 Description of the Text . . . . . . . . . . . . . . . . . . . . . . 775 Photographic Reproduction of Two Pages from the Manuscript 776 Introduction to ‘Über das Unendliche’ of May 1933 . . . . . . . . 778 ‘Über das Unendliche’ (23.5.1933) . . . . . . . . . . . . . . . . . 779 Textual Notes . . . . . . . . . . . . . . . . . . . . . . . . . . . 783 Description of the Text . . . . . . . . . . . . . . . . . . . . . . 785 Appendices Introduction to the Appendices . . . . . . . . . . . . . . . . . . . .
787 788
Contents
XV
Appendix A: First Edition of Hilbert-Ackermann (1928) Introduction . . . . . . . . . . . . . . . . . . . . . . . . . Grundzüge der theoretischen Logik . . . . . . . . . . . . Textual Notes . . . . . . . . . . . . . . . . . . . . . Appendix B: Hilbert’s Second Hamburg Lecture (1927) Introduction . . . . . . . . . . . . . . . . . . . . . . . . . ‘Die Grundlagen der Mathematik’ . . . . . . . . . . . . Textual Notes . . . . . . . . . . . . . . . . . . . . . Weyl: ‘Diskussionsbemerkungen’ . . . . . . . . . . . . . Bernays: ‘Zusatz zu Hilberts Vortrag’ . . . . . . . . . . Bernays: Letter to Weyl, January 1928 . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
806 806 809 916 917 917 922 942 943 946 950
Appendix C: Hilbert’s Bologna Lecture (1928) . . . . Introduction . . . . . . . . . . . . . . . . . . . . . . . . ‘Probleme der Grundlegung der Mathematik’ . . . . . Textual Notes . . . . . . . . . . . . . . . . . . . . Appendix D: Hilbert’s Third Hamburg Lecture (1930) Introduction . . . . . . . . . . . . . . . . . . . . . . . . ‘Die Grundlegung der elementaren Zahlenlehre’ . . . . Appendix E: Hilbert’s 1931 Göttingen Lecture . . . . Introduction . . . . . . . . . . . . . . . . . . . . . . . . ‘Beweis des Tertium non datur’ . . . . . . . . . . . . . Textual Notes . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
954 954 957 966 967 967 974 983 983 985 990
Hilbert’s Lecture Courses 1886–1934
. . . . . . . . . . .
991
Bibliography
1011
Name Index
1051
Subject Index
1057
XVIII The Editing and Reproduction of the Texts from Mitschriften of Hilbert’s lectures in the period 1921–1924 composed by Hellmuth Kneser. Roughly half of the Mitschrift for the 1921/22 lectures is given, whereas the other two Mitschriften are presented in full. All other texts given are complete. The texts as published in this Edition are for the most part ‘clear texts’: that is, the originals have been edited to present complete and error-free German sentences. The guiding editorial principle has been to edit the texts with a light hand: to clean up trivial slips of punctuation or spelling, but to record for the reader any change that could even conceivably be regarded as significant. The alterations to the text itself divide into two categories. (i ) A few standard corrections have been carried out without any editorial indication whatsoever. These ‘silent emendations’ include such things as failures to capitalize words or to insert a full stop at the end of a sentence. (ii ) A series of other corrections has been carried out ‘quietly’, i. e., the changes, although not of any special significance, have nevertheless been recorded in the Textual Notes at the end of each document. In some cases, interventions in the text are signalled through Textual Symbols, a full list of which can be found in the last section below. All deletions, additions, corrections or replacements (of one piece of source text by another) which were deemed to be even potentially significant have been noted on the page itself. In doubtful cases, the policy was always in favour of explicit inclusion, either on the page or in the Textual Notes, so that only those alterations which were utterly of no consequence were executed ‘silently’.
1. Presentation of the Documents We have arranged the texts into chapters containing one or more documents. Each chapter has been given an English title; each document or group of documents is preceded by an Introduction discussing the significance, the contents, the historical and scientific background, and, if necessary, any peculiarities of the text. Manuscript pagination is given in the outer page margin; page breaks in the original are indicated by vertical lines ‘|’ in the text. If a page begins with a displayed formula or a new paragraph the vertical line is omitted. The same applies to the publications reproduced in Appendices B–E. Note that page reference to all documents, whether published or unpublished, is always to the original pagination, regardless of whether the document appears in this or any other Volume in the series. The Ausarbeitungen have often been provided with Tables of Contents by their authors, although the documents themselves are usually not separated into sections. As an aid to orientation, these section headings from the Table of Contents have been inserted into the text in angled brackets. In the case of Bernays’s Habilitationschrift given in an Appendix to Chapter 1, a Table of Contents has been added, reflecting the section/sub-section headings in the text.
The Editing and Reproduction of the Texts
XIX
Footnotes in the source text and Hilbert’s marginal remarks, additions or replacements are rendered in a first series of footnotes separated from the main text by a short horizontal line. This first series of notes also marks uncertain or ambiguous readings. Footnotes by the editors (textual remarks as well as substantive comments) are indicated by superscribed Arabic numerals and printed at the bottom of the page in a second series of notes beneath a full horizontal line. These notes (a) point out textual features which are of immediate significance for a proper understanding of the document, including deleted pieces of text; (b) identify places, persons, and literature cited; (c) refer to differences or similarities in other versions of the document (if those exist); (d ) indicate errors in the text; and (e) elaborate on the scientific and historical context. The basic principle is: everything above the line belongs to the text proper; everything below is editorial commentary or deleted text. The list of Textual Notes is attached at the end of each text; as indicated, this list records the less significant differences between the appearance of the text in the original document (including deletions, additions, substitutions, corrections to spelling) and the text as published in this Edition. The Notes are keyed to the text by page and line number; for example ‘63.7’ refers to p. 63 of the Volume, line 7. For this purpose, line numbers for the texts are printed in the inner page margin, every fifth line being counted. After the Textual Notes, there follows a description of the original document. These descriptions are schematised and include the following details about the document: (a) provenance and means of identification, if any; (b) size and appearance of the cover and/or leading page; (c) composition and pagination; (d ) the original title; and (e) whatever information is available on the genesis of the text. These descriptions also describe peculiarities of the document, differences between it and further copies, and so on.
2. Rules for the Constitution of Hilbert’s Annotations In this Edition, Hilbert’s own text is reproduced with especial care, but we follow a slightly more flexible policy for text by his collaborators. It should be noted that, while the Ausarbeitungen were written up by collaborators, they were usually prepared under Hilbert’s direct supervision, and many of these documents actually contain corrections or marginalia in Hilbert’s own hand. These annotations are always explicitly identified and treated with the more stringent policy. Drawings, figures and other sketches, sometimes added or supplemented by Hilbert in order to make the text more intelligible, are inserted or indicated at the appropriate place. These interventions are always noted, either directly on the page or through the Textual Notes. Additions, deletions, and substitutions as well as underlinings are executed only if they are obviously intended as an immediate correction of the Ausarbeitung, i. e., if they are made by Hilbert in connection with, or clearly shortly after, the composition of the text. In all other cases, Hilbert’s annota-
XX The Editing and Reproduction of the Texts tions are reproduced in the footnotes or the Textual Notes according to their significance. Longer remarks and substantial revisions not intended as direct corrections, or which were obviously made well after the composition of the text, are treated precisely like Hilbert’s additional remarks in his own manuscripts. Other changes (for instance, Hilbert’s habit of putting parts of the text in brackets) are listed in the Textual Notes but not executed.
3. Rules for the Constitution of Texts Prepared by Hilbert’s Collaborators Because the Ausarbeitungen are relatively ‘clean’ compared with Hilbert’s manuscripts, a number of modifications (mainly simplifications) of the basic editorial practice were deemed desirable. Obvious errors in spelling are corrected silently; in the case of words spelt correctly but differently in different places in the document (e. g., ‘Princip’ and ‘Prinzip’) the ‘rule of overwhelming use’ has been followed, i. e., we adopt that spelling which is used in the overwhelming majority of cases. In typescripts, commas, semi-colons etc. sometimes occur too far away from the words they follow; such errors have been silently corrected. In the case of mathematical expressions, the number of dots ‘. . . ’ continuing a formula is standardised to three. Multiplication points are either omitted altogether or printed in all instances depending on the local use. Additions, deletions, and substitutions executed by the authors of the text are for the most part executed silently. This includes handwritten addition to typescripts of special symbols and scripts not present on the typewriter keyboard. However, changes which seem substantively relevant are noted. Substantial mistakes are not corrected but pointed out in footnotes. Indentations at the beginning of a paragraph are not reproduced exactly as in the original but are standardised. The same is true for formulas, which are reproduced in a standard form. Furthermore, formulas displayed on a separate line are centred following standard practice. In addition to emphasis by underlining, typical for manuscripts, other forms of emphasis occur in typescripts, above all Sperrschrift (a standard form of emphasis in printed German, with e x t r a s p a c i n g between the letters and words), and vertical lines beside the text, etc. Both underlining and Sperrschrift are reproduced by italics; any combination, like underlining and Sperrschrift together, or double underlining, is not reproduced but noted in the footnotes. The same holds for vertical lines and other forms of emphasis.
4. General Procedure The Layout The typesetting of the source text has meant that the original physical layout is not fully maintained. However, where possible the placement of marginalia is indicated and the original position of diagrams relative to the
The Editing and Reproduction of the Texts
XXI
text has been preserved. The diagrams in the edited text have been reconstructed on the basis of the diagrams in the source text and any accompanying elucidations. Mathematical formulas are printed in italics, in accordance with standard typesetting practice, regardless of whether the formulas in the source text were underlined or not. The handwritten Sütterlin script was not infrequently used in mathematical and logical formulas, though not by Hilbert. Since Sütterlin is a handwritten formal German script, and the Fraktur font is the printed form standardly used in Hilbert’s published texts for the corresponding symbols, we have used the latter to represent any Sütterlin letters. Underlined source text is printed in italics. If an underlining does not extend over a full word or phrase but Hilbert nevertheless clearly intended to emphasize that word or phrase, the full word or phrase is rendered in italics. If a specific feature of underlining (such as underlining by an undulating line or in a different colour) is of possible significance for the text, this will be pointed out in a remark. Footnotes, Marginal Remarks and Larger Pieces of Text As indicated above, footnotes by the author and marginal remarks are printed immediately below the main body of the text and are separated off from it by a short horizontal line. The marginal remarks are often handwritten additions by Hilbert which reflect on the text and thus cannot be integrated into the text itself. As mentioned, in some cases these remarks were clearly added years after the original text was composed. (Of course, the boundaries between later additions and insertions at the time of composition cannot be precisely drawn, and in some cases editorial judgement was called for.) For the footnotes, the original style of numbering, in most cases ‘∗)’, ‘∗∗)’, ∗∗∗ ‘ )’ or ‘1 ’, ‘2 ’, ‘3 ’, has been preserved. But to avoid confusion some slight modifications are sometimes silently introduced, e. g., ‘∗∗)’ instead of ‘∗)’. In a few cases the source text contains inconsistencies (e. g., ‘∗ ’ in the text and ‘∗)’ in the footnote). These inconsistencies have likewise been silently eliminated. The marginal remarks are numbered by superscript uppercase Latin letters (‘A ’, ‘B ’, ‘C ’, etc.). These remarks are found mostly in the margins or at the top or bottom of the page, and occasionally on the blank page verso. They can often be assigned with certainty to a particular point in the text, either because of the positioning of the remark or its content, or because of an insertion sign. If such an assignment is not possible, or not possible without ambiguity, the remark is assigned by the editors to an appropriate location, and the ambiguity is recorded. Occasionally, for elucidation, a detailed description of the original appearance of the page has been provided. Sometimes symbols such as ‘|=’,‘=| ’, ‘ ’, etc. appear in the source text. These symbols indicate the place where longer passages, either written on an extra sheet of paper or occuring on another page and marked by the same symbol, are to be inserted. Normally, the intended insertion is executed without printing the symbol, though its presence is recorded in the Textual Notes.
XXII The Editing and Reproduction of the Texts Spelling and Punctuation As a general rule, the spelling and punctuation of the source text is preserved. There are exceptions, however. Spelling. Hilbert’s own lapses from his usual patterns of spelling, slips of the pen and grammatical mistakes are corrected and listed in the Textual Notes. Examples of such mistakes are1 : ‘auf einer Geraden gelegen Punkte’ instead of ‘auf einer Geraden gelegene Punkte’, ‘eine Zweite Weise’ instead of ‘eine zweite Weise’, ‘die Nachweis’ instead of ‘der Nachweis’. Variations in, and misspelling of, proper names are uniformized respectively corrected and noted in the Textual Notes. For instance, ‘Paskal’ and ‘Herz’ are corrected to ‘Pascal’ and ‘Hertz’. Hilbert’s idiosyncrasies and variations of orthography, however, are not corrected. Examples are the use of both ‘nicht-Euklidische Geometrie’ and ‘nichteuklidische Geometrie’, ‘Variabele’ and ‘Variable’, ‘Gerade’ and ‘Grade’, ‘anderen’ and ‘andern’, ‘gelegene’ and ‘gelegne’. Capitalization and Punctuation. When necessary, the first word of a sentence is silently capitalized; any capitalization or decapitalization executed by the editors within a sentence is recorded in the Textual Notes. Full stops are silently added at the end of sentences, and commas and semi-colons are silently inserted whenever this improves readability. To illustrate, in ‘Doch Vorsicht da sie leicht irreleitet’, Hilbert omits the comma after ‘Vorsicht’; this would stand however, since the omission does not affect readability. Hilbert rarely places a comma after ‘d. h.’; for the same reason, this omission remains uncorrected. Inconsistencies in the patterns of punctuation in enumerations and similar constructions are silently corrected. For example, if the writer gives a list of formulas itemised by ‘1.’, ‘2.’ etc. but omits a full stop after one of the numerals, it is silently added. Missing full stops are also silently added to commonly used abbreviations; for example,‘Bd’, ‘z. B’, ‘etc’, ‘d. h’ and ‘wzbw’ become respectively ‘Bd.’, ‘z. B.’, ‘etc.’, ‘d. h.’, ‘w. z. b. w.’. Incorrect occurrences of full stops, commas and semi-colons in the source text are corrected, the correction being noted in the Textual Notes; an example would be the comma in ‘so giebt es mindestens einen 3ten Punkt, der Geraden’. However, no attempt has been made to impose a consistent scheme of punctuation, and any change of punctuation which may possibly be queried is explicitly noted in the Textual Notes. For mathematical formulas, as opposed to the practice in the case of nonmathematical text, insertion of commas by the editors is noted in the Textual Notes; for example, Hilbert often writes ‘die Punkte A B C liegen’, which would appear here as ‘die Punkte A, B, C liegen’. In enumerations like ‘A, B, . . . , Z’, a comma is inserted silently after the ellipsis when missing, and the number of full stops in an ellipsis has been standardized to three. Thus the frequently observed form ‘A, B, . . Z’ would become ‘A, B, . . . , Z’. Common abbreviations, such as those mentioned above, are not expanded, but less common ones are; this expansion is listed in the Textual Notes. How1 All the examples given here and in the rest of this chapter are taken from Hilbert’s own manuscripts on geometry.
The Editing and Reproduction of the Texts
XXIII
ever, abbreviations in references given in the source text are not expanded; some examples are ‘Math. Vereinig.’, ‘Math. Ann.’, and ‘Math. Zeitschr.’. The abbreviations ‘m’ und ‘n’ are always silently expanded to ‘mm’ and ‘nn’ respectively. Unclear handwriting. Illegible letters or words are indicated in the text by the Textual Symbols ‘?’ (one letter), ‘??’ (several letters) or ‘???’ (word). In the case where a word is clearly identifiable, even though not all of its letters are legible (for instance, because they have not been completely formed), the word is silently completed. Where a letter is ambiguous (for instance, a character could be read as either ‘i’ or ‘e’), it is silently transcribed as one or the other depending on what seems to be demanded by the context. Unresolved ambiguities are recorded either through Textual Symbols or in the footnotes or in the Textual Notes. Omissions and Repetitions Omissions of a word or a phrase or of symbols (like parentheses) have been corrected by the editors; these cases are signalled in the text by angled brackets or, in exceptional cases, recorded in the Textual Notes. Such interventions are made only if the text would be grossly incomplete, incorrect or unintelligible without them. The grammatical errors caused by Repetitions of words are corrected and the corrections recorded in the Textual Notes.
1 2 3 4 5 6 7 8 9 10
Additions, Deletions and Substitutions Handwritten or typewriten corrections to the text either by addition, deletion or substitution are carried out. These are always reported, either directly or through the Textual Notes, in the following cases: (a) Corrections of false starts which indicate a change of intention. For example, in ‘Die Geometrie unterscheidet sich wesentlich von den rein mathematischen Wissensgebieten wie z. B. [[Al]] Zahlentheorie, Algebra, Funktiontheorie’, it is highly likely that ‘Al’ is the beginning of the word ‘Algebra’, in which case ‘Al’ was deleted in order to put ‘Zahlentheorie’ first. (b) Corrections which enhance the precision of the text. (c) Corrections which modify the content of a sentence. Whenever the changes are significant for the understanding of the text, they are reported directly; additions are marked by means of ↑textual symbols↓, deletions in footnotes, and substitutions by a combination of both. In less significant cases the differences between the published text and the source text are treated quietly and recorded in the Textual Notes. The present paragraph contains illustrations of the method followed for recording these insignificant changes, for which purpose we have printed explicit line numbers in the inner margin. (In the text themselves, numbers only appear every five lines.) Note that the published text itself contains no textual symbol or footnote to indicate an alteration; thus, these relatively minor alterations are only to be found by consulting the Textual Notes. These Notes are normally keyed to the pages and lines of the published text by means of the traditional ‘lemma]’ form. For example:
XXIV The Editing and Reproduction of the Texts XXI.1: published] publ. XXI.6: five] ten XXI.6–7: symbol or footnote] symbol ↑or footnote↓ XXI.7: an alteration] [[a difference]]--↑an alteration↓ XXI.7–10: These . . . form.] Added. The word or phrase before the square bracket ‘]’ repeats the reading of the published text, either in full or in abbreviated form; the text after the square bracket reports the source text and/or editorial comments. Note that frequent use is made in the Textual Notes of textual symbols to elucidate the changes made to the text. Completely insignificant corrections are silently executed. Some instances are: Instantaneous corrections so brief that they give no sense of the preliminary intention. For instance, in ‘Um zu dem Gegenstück zu gelangen, bedarf [[d]] es der elementaren Sätze aus der Geometrie’, the deleted ‘d’ would be silently omitted. Corrections of misspelling or false punctuation which do not indicate a change in the sense of the passage. For instance, in ‘Beide Flächen schneiden sich in einer [[B]]--↑b↓estimmten Schraubenlinie’, the information encoded in ‘[[B]]--↑b↓’ would be omitted and the word printed would be ‘bestimmten’. Corrections of non-mathematical text due to slips where there is no significant change in meaning. For example, in ‘Die Schrauben[[linie]]fläche enthält alle Schraubenlinien vom nämlichen h’, the context indicates that ‘Die Schraubenlinie’ would have made no sense and that therefore the writing of ‘-linie’ was a slip. The same holds when there is a change of intention, but one of only minor importance. In the example ‘. . . eine Reihe bedeutender Männer, . . . aus deren [[Untersuchun]] Händen die heutige Geometrie der Lage . . . hervorging’, the change from ‘Untersuchungen’ to ‘Händen’ is merely stylistic and so ‘Untersuchun’ is silently omitted. Corrections of mathematical passages (whether composed of symbols, or of words), which do not affect the sense. One example is given by ‘folglich schneiden sich AA und BB ↑etwa in D↓’. This is rendered in Volume 1 as ‘folglich schneiden sich AA und BB , etwa in D’, since Hilbert employs the letter ‘D’ in the very next sentence to denote the point of intersection in question. Another example would be the rendering of ‘Winkel ↑t↓’ as ‘Winkel t’, on the grounds that although ‘Winkel’ was first written without the term ‘t’, the context makes it clear that the angle denoted elsewhere by ‘t’ is intended. Mistakes of punctuation arising from the execution of an alteration are silently corrected. For example, ‘Linie. ↑und umgekehrt↓’ would be printed as ‘Linie ↑und umgekehrt↓.’ And with ‘M L schneidet dann alle Strahlen c, d, . . . k. [[Ist c der]] in C , D , . . . , K ’, the ‘[[Ist c der]]’ would be silently omitted. For source text reading ‘P1 , P2 , P3 , ↑und wenn alle Punkte auf einer Seite eines Punktes A liegen↓ . . . so giebt . . . ’, the addition would be executed after the ellipsis and not before as in the original.
The Editing and Reproduction of the Texts
XXV
Text Obscured by Pasting Lastly, as with all manuscripts, an attempt has been made, wherever possible, to decipher text which was pasted over. Such passages are described in the Textual Notes (if very short) and in footnotes (if the passage extends over several lines). Textual Symbols The textual symbols used in these volumes are the following: | comment ... dubious ? ?? ??? ↑addition↓ [[deletion]] [[ori]]--↑sub↓
Page break in the source text; the number of the new page is printed in the outer margin. Editioral insertion. Ellipsis. Unsafe reading of words or letters (‘dubious’ is the unsafe word). Unreadable letter. Several unreadable letters. Unreadable word. Addition by the author (‘addition’ is the word added). Deletion by the author (‘deletion’ is the word deleted). Substitution by the author (‘ori’ is replaced by ‘sub’).
William Ewald, Michael Hallett, Ulrich Majer and Wilfried Sieg
The Editing and Reproduction of the Texts
The principal task of this Edition is to present a comprehensive selection from Hilbert’s unpublished lecture notes on the foundations of mathematics and physics. Hilbert left behind a rich collection of writings covering almost the entire span of his teaching career. For the most part, these documents are in Göttingen, either in the Niedersächsische Staats- und Universitätsbibliothek or in the library of the Mathematisches Institut. A description of the archival holdings and of the principles governing the selection of texts for the Edition can be found in the Introduction to the Edition in Volume 1. At the end of the present Volume can be found a list of Hilbert’s lecture courses from 1886 to 1934; this list gives an indication both of the full range of topics covered and of the relevant extant manuscripts. This Volume includes, so far as we are aware, all the surviving, substantive lecture notes on logic and arithmetic, from the autumn of 1917 on, which were prepared under Hilbert’s supervision. A predecessor volume (Volume 2) contains the principal lecture notes up to and including the summer of 1917. For reasons explained in the Introduction, it made sense to split the two logic volumes at the point where Paul Bernays returned to Göttingen as Hilbert’s assistant. Hilbert’s lecture notes fall into three broad categories: (1) Hilbert’s own handwritten notes; (2) official Ausarbeitungen prepared by Hilbert’s assistants under his supervision; and (3) unofficial Mitschriften, i. e., classroom notes taken by somebody who attended the lectures or seminar in question. In general, Hilbert’s own handwritten notes—with frequent interlineations, insertions, deletions, corrections and marginal comments—present the greatest textual difficulties. Most of those texts date from the period prior to 1900. However, for later texts, and certainly for those which form the bulk of the present Volume, the situation is relatively favorable. These texts are for the most part polished typescripts (Ausarbeitungen), carefully prepared by Bernays or other close collaborators, with only occasional handwritten additions by Hilbert or the Ausarbeiter. Except for the Appendices, the texts here are given in chronological order. The chief textual difficulties occur in Hilbert’s undated and untitled draft (the last text in Chapter 2) and his untitled notes from 1923–1924 (which we have called ‘Logische Grundlagen der Mathematik’), the last document (before the Appendices) in Chapter 3. We refer to the Introductions of the respective chapters for more detailed information. In order to clarify and date more sharply the developments reported in Chapter 3, we have reproduced as Appendices to that Chapter material XVII
Introduction∗
The second Volume in this series concludes with Hilbert’s lectures on set theory from the Summer Semester of 1917. Near the end of those lectures, which finished around 15 August, Hilbert remarks without any elaboration that next semester ‘I hope to be able to go more deeply into the foundations of logic’. The present Volume picks up the story some six weeks later, beginning with the 1917/18 Winter Semester lectures ‘Prinzipien der Mathematik’, and ending with a manuscript of a lecture on the infinite from 1933, right at the end of Hilbert’s active research career. The years covered by this Volume saw the most energetic phase of his collaboration with Paul Bernays, the development of axiomatic investigations of logic and arithmetic, the birth of proof theory, and the beginnings of work on the Entscheidungsproblem. These projects were pursued not only by Hilbert and Bernays themselves, but also in collaboration or interaction with, among others, Wilhelm Ackermann, Heinrich Behmann, Gerhard Gentzen, Jacques Herbrand, Johann von Neumann, Moses Schönfinkel and Hermann Weyl. In reading the lecture notes, one should not lose sight of their connection to the wider world of Göttingen mathematics, and it is important to remember that Hilbert always emphasized the connections between foundational questions, questions in the mainstream of mathematics, and questions arising from developments in the natural sciences. The period covered in this volume was a time of intellectual ferment in Göttingen. Noether and her student van der Waerden were laying the groundwork for the new abstract algebra. In physics, the discoveries of Einstein had been absorbed, and physicists like Max Born now turned their attention to the mathematical elaboration of the new quantum mechanics of Heisenberg and Jordan. Hilbert was deeply involved in all these developments and taught or co-taught (with Bernays, with Noether and with Debye, with Courant, and especially with Born) over two dozen seminars ∗ This Introduction and several of the later Introductory Notes have made use of the detailed material and broad considerations set out in Sieg 1999 and Sieg 2002 , which provide a continuous chronological account of the development of Hilbert’s foundational ideas during the years from the late eighteen nineties to the early nineteen thirties. The latter paper and its companion piece Sieg 1990 explore an extension of Hilbert’s Program and its connection to contemporary proof-theoretic work, but also its roots in the nineteenth century transformation of mathematics. These roots are found, in particular, in Dedekind’s work, see Sieg and Schlimm 2005 , and also Sieg 2009 .
1
2
Introduction
and lecture courses that deal with them.1 The mathematical culture of Göttingen in those years was remarkably broad. Weyl moved as freely as Hilbert himself between pure mathematics, mathematical physics and foundations. Born had written up detailed notes for Hilbert’s 1904 lectures ‘Zahlbegriff und Quadratur des Kreises’ and the lectures from 1905 ‘Logische Principien des mathematischen Denkens’, and Courant had done the same for the 1910 lectures ‘Elemente und Prinzipienfragen der Mathematik’. Bernays attended the algebra lectures of Noether and van der Waerden; Herbrand visited Göttingen in early 1931 to interact with Bernays, but also with Emmy Noether; Hilbert commonly met Bernays and his physics assistant, Adolf Kratzer, simultaneously, since each was expected to be able to participate in his discussions with the other. This broad background is a salient aspect of Hilbert’s intellectual life, and his lectures on logic should not be viewed as pursuing an isolated technical programme, but as being part of a much richer investigation of the foundation of the mathematical sciences. In keeping with the influential accounts in Weyl 1944 and Bernays 1935 , it is usual to divide Hilbert’s work in foundations of mathematics into two distinct phases. On this account, the first phase lasts from roughly 1899 to about 1904, when he was mostly occupied with the axiomatics of geometry and the consistency of arithmetic. The second phase is then taken to begin in early 1921 with talks Hilbert gave in Copenhagen and Hamburg; the contents of these talks is conveyed in the paper ‘Neubegründung der Mathematik’, a vigorous response to the contemporaneous writings of Brouwer and Weyl. During this second phase, Hilbert developed proof theory and pursued his quest for what he called a finitist consistency proof of arithmetic. Hilbert is charged also with having adopted a ‘formalist’ philosophy of mathematics, holding (in the words of Ramsey 1926 ) that the propositions of mathematics are ‘meaningless formulae to be manipulated according to certain arbitrary rules’, that ‘mathematical knowledge consists in knowing what formulae can be derived from what others’, and that the term ‘2’ is ‘a meaningless mark occurring in these meaningless formulae’2 . This second phase allegedly culminates in two co-authored books. The Grundzüge der theoretischen Logik, written with Wilhelm Ackermann and published in 1928, presents mathematical logic in its definitive modern form, while the two volume Grundlagen der Mathematik from 1934 and 1939, written with Paul Bernays, provides an encyclopædic synthesis of foundational investigations, and in particular of work in proof theory. Hilbert’s research publications on foundational matters do indeed cease with his Heidelberg talk of August 1904 (published as Hilbert 1905b), and the publication of substantive novel work does not begin until 1922. But the lecture notes tell a more complex story about the development of his thought. That development is dramatically different in important respects from the 1 To gain some idea of this breadth, see ‘Hilbert’s Lecture Courses’ beginning on p. 991 below. 2 See Ramsey 1926 , 339, pp. 2 and 153 respectively of the later reprintings.
Introduction
3
standard account. Hilbert continued to lecture on fundamental matters including, importantly, the foundations of mathematics, throughout the ‘fallow’ period from 1904 to 1922, delivering almost every year a lecture course on foundational subjects. The standard account is, however, correct that his research can be divided into two phases. But the break occurs, not in the early 1920s, but during the summer of 1917, precisely between the lectures on set theory and the 1917/18 lectures on logic. Furthermore, there is no indication whatsoever that the new investigations were initiated as a reaction to Brouwer or Weyl. Rather, what was clearly of great importance in the new examination of logic was the detailed study of Whitehead and Russell’s Principia Mathematica. Two events during the short summer vacation of 1917 signal the beginnings of a turn in Hilbert’s foundational research. Hilbert, as was his custom, travelled to Switzerland; he delivered his programmatic lecture ‘Axiomatisches Denken’ on 11 September to the Swiss Mathematical Society in Zürich. There he invited Paul Bernays, a promising young mathematician with strong philosophical interests, to return to Göttingen as his assistant for the foundations of mathematics.3 Over the next seven years, a new approach to foundational issues was to evolve in a remarkable series of lecture courses. Most of them were developed in cooperation with Bernays, who also bore the major responsibility of writing up formal protocols of the lectures. These are: ‘Prinzipien der Mathematik’ (Winter 1917/18); ‘Logik-Kalkül’ (Winter 1920); ‘Probleme der mathematischen Logik’ (Summer 1920); ‘Grundlagen der Mathematik’ (Winter 1921/22); and ‘Logische Grundlagen der Mathematik’ (Winters 1922/23 and 1923/24); all of the lectures are included here. In this Introduction, we give a broad overview of the early development of Hilbert’s Programme that can be reconstructed only on the basis of these lecture notes. More details and relations to later work in the nineteen-twenties will be found in the introductory notes to the individual chapters. It is often said that Hilbert in the 1920s was pursuing ‘the Hilbert Programme’, which aimed at securing the foundations of analysis against the attacks of Brouwer and Weyl; that he and his students pursued ‘the’ programme with great technical skill, but that ‘it’ was finally refuted by Gödel’s incompleteness results. Such an account overlooks the complex array of considerations that informed Hilbert’s foundational work, the extreme flexibility of his thought, and the way his approach developed and evolved out of his other mathematical preoccupations (and in particular his work on geometry in the 1890s). In interviews he gave in 1977 (see Bernays 1977* ), Bernays points out that a great scientific research programme like Hilbert’s typically develops over a period of years, with a good many false starts. And indeed, what we find in the lecture notes is not a single, dogmatic idée fixe, but rather a collection of insights and strategies that change over time. There is a creative, fluid character to the lecture notes, a groping towards solutions, and a 3 See
the Introduction to Chapter 1, n. 9.
4
Introduction
responsiveness to new ideas. It is hoped that the documents presented here will help to reveal some of that growth and richness.
1. 1899–1917: Towards Mathematical Logic. Hilbert had long viewed the axiomatic method as holding the key to a systematic organization of any sufficiently developed subject. He saw it also as the basis for metamathematical investigations of independence and completeness, as well as for foundational and mathematical reflections. The problem of consistency had been of central importance ever since he turned his attention to geometry and the foundations of analysis in the late 1890s. For example, Hilbert stresses in both his ‘Über den Zahlbegriff’ (Hilbert 1900a) and the subsequent Paris address on mathematical problems (Hilbert 1900b), that a proof of consistency is necessary to underwrite the legitimacy of any axiom system and to establish the existence of its subject-matter. The nineteenth century roots of Hilbert’s work are extremely important; they link his focus on consistency to broader themes within mainstream mathematics, and reveal the major intellectual forces that led him to the initial formulation of a syntactic consistency programme in his Heidelberg address of 1904.4 Consistency had been viewed as a semantic notion by Dedekind and by logicians in the nineteenth century more generally; in his famous monograph on the natural numbers (Dedekind 1888 ) Dedekind had quite explicitly attempted to show — by providing a logical model — that his notion of a simply infinite system does not contain ‘internal contradictions [innere Widersprüche]’ (see Dedekind’s letter to Keferstein of 1890 (Dedekind 1890* ). Hilbert formulated consistency as a syntactic notion in ‘Über den Zahlbegriff’, and also in Grundlagen der Geometrie. That does not mean, however, that he sought to prove consistency by syntactic methods: the (relative) consistency proofs given in Grundlagen der Geometrie are all straightforwardly semantic, using arithmetic models, although information about the possibility or impossibility of proofs is extracted from the semantic arguments. However, to prove the consistency of arithmetic itself, Hilbert thought ‘a suitable modification of known methods of inference’ was needed5 ; and in his Paris lecture on mathematical problems he suggested that a ‘direct method’ of proof could be found: 4 Let us mention stenographically: Dedekind, consistency concerns and semantic argument (Dedekind 1888 and Dedekind 1890* ); Kronecker, emphasis on a thoroughly constructive approach; Cantor, letters to Hilbert and Dedekind on inconsistent multiplicities from 1897 and 1899; Hilbert, from semantic to syntactic arguments (Hilbert 1900b; Hilbert 1905b). These connections are discussed by Sieg 1990 , Sieg 1997 , Sieg 2002 , Sieg and Schlimm 2005 , Ewald 2005 , Stein 1988 , Hallett 1994 , Hallett 1995 and Ferreirós 1999 . Many of the primary works are translated in Ewald 1996 ; additional important secondary literature is referred to in all of these studies. 5 The phrase quoted comes from this passage of the original German:
Um die Widerspruchslosigkeit der aufgestellten Axiome zu beweisen, bedarf es nur einer geeigneten Modification bekannter Schlußmethoden. (Hilbert 1900a, 184.)
Introduction
5
I am convinced that it must be possible to find a direct proof for the consistency of the arithmetical [real number] axioms by means of a careful study and suitable modification of the known methods of reasoning in the theory of irrational numbers.6
Hilbert believed, it seems, that the genetic ‘construction’ of the real numbers, could somehow be exploited to yield a consistency proof in Dedekind’s ‘logicist’ style. This conjecture is supported to some extent by Hilbert’s treatment of arithmetic in contemporaneous lectures, but also by a more methodological statement from the Einleitung of the notes for the lectures on Euclidean geometry of 1898/99. He maintains there: It is important to fix precisely the starting point of our investigations: as given, we consider the laws of pure logic and in particular all of arithmetic. (On the relation between logic and arithmetic, cf. Dedekind, Was sind und was sollen die Zahlen? )7
And, clearly, for Dedekind, arithmetic is part of logic. It appears that Hilbert changed his basic attitude only after the discovery of the elementary contradiction of Russell and Zermelo. That paradox convinced him that there was a deep problem, that difficulties appeared already at an earlier stage, and that the issue had to be addressed in a different way. In late 1904, Hilbert sent a letter to his colleague and friend Adolf Hurwitz, in which he says: It seems that the most various parties are now again taking up the investigation of the foundations of arithmetic. It has been my view for a long time that exactly the most important and most interesting questions were not settled by Dedekind and Cantor (and a fortiori not by Weierstrass and Kronecker). In order to be forced into the position of having to reflect on these matters in a systematic way, I have announced a lecture course on the ‘logical foundations of mathematical thought’ for next semester.8 6 Hilbert
1900b, 265, 1104 of the English translation. In the original German, the passage
reads: Ich bin nun überzeugt, daß es gelingen muß, eine direkten Beweis für die Widerspruchslosigkeit der arithmetischen Axiome zu finden, wenn man die bekannten Schlußmethoden in der Theorie der Irrationalzahlen im Hinblick auf das bezeichnete Ziel genau durcharbeit und in geeigneter Weise modificiert.
In Bernays’s review of Hilbert’s foundational work from 1935, one finds a similar remark in the discussion of these early foundational investigations: Zur Durchführung des Nachweises gedachte Hilbert mit einer geeigneten Modifikation der in der Theorie der reellen Zahlen angewandten Methoden auszukommen. (Bernays 1935 , 198–199.) 7 Hilbert
1899* , 2. The German text is found in Hallett and Majer 2004 , 303:
Es ist von Wichtigkeit, den Ausgangspunkt unserer Untersuchungen genau zu fixieren: Als gegeben betrachten wir die Gesetze der reinen Logik und speciell die ganze Arithmetik. (Ueber das Verhältnis zwischen Logik und Arithmetik vgl. Dedekind, Was sind und was sollen die Zahlen?) 8 The letter is to be found in the Handschriftenabteilung of the Staats- und Universitätsbibliothek of the University of Göttingen, under the signature Cod. Ms. Math. Arch. 76:324. It is undated. However, Hilbert did indeed hold a lecture course in the Summer Semester of 1905 entitled ‘Logische Principien des mathematischen Denkens’ (i. e., Hilbert 1905a* ,
6
Introduction
Lecture notes from the following summer term contain more informative remarks on Dedekind’s ‘epochal’ achievements, but pointedly insist that fundamental difficulties remain: He [Dedekind] arrived at the view that the standpoint of considering the integers as self-evident cannot be sustained; he recognized that the difficulties Kronecker saw in the definition of irrationals arise already for the integers; furthermore, if they are removed here, they disappear there. This work [Was sind und was sollen die Zahlen? ] was epochal, but it furnished nothing definitive; certain difficulties remain. As in the definition of the irrational numbers, the difficulties are here connected above all with the concept of the infinite; . . . 9
This insight sets the stage for Hilbert’s Heidelberg talk of 1904, a talk in which he indicates a novel way of solving the consistency problem for arithmetic, taken now in a much more restricted sense, namely, the arithmetic of the natural numbers alone. Note, however, Hilbert’s expectation that if the problems are resolved for the natural numbers, then they will also be resolved for the reals. The consistency of the Heidelberg system would guarantee, as Hilbert puts it, ‘the consistent existence of the so-called smallest infinite’10 . The system, reproduced in Volume 2 of this series), and internal evidence from the letter suggests that it was written shortly before the turn of the year. These facts date it with high probability to the last few days of 1904. The letter is partially reproduced in Appendix XLIX of Dugac 1976 (and likewise dated 1904), an Appendix which contains excerpts from several letters of Hilbert to Hurwitz; the passage cited is to be found on pp. 271–272. In the original German, it reads: Die Beschäftigung mit den Grundlagen der Arithmetik wird jetzt, wie es scheint, wieder von den verschiedensten Seiten aufgenommen. Dass gerade die wichtigsten u. interessantesten Fragen von Dedekind und Cantor noch nicht (und erst recht nicht von Weierstrass und Kronecker) erledigt worden sind, ist eine Ansicht, die ich schon lange hege und, um einmal in die Notwendigkeit versetzt zu sein, darüber im Zusammenhang nachzudenken, habe ich für nächsten Sommer ein zweistündiges Colleg über die „logischen Grundlagen des math. Denkens“ angezeigt. 9 The lectures were ‘Zahlbegriff und Quadratur des Kreises’. The passage cited is from the Ausarbeitung by Max Born, i. e., Hilbert 1904* , 166. In the original German, the passage reads:
Er drang sich zu der Ansicht durch, dass der Standpunkt mit der Selbstverständlichkeit der ganzen Zahlen nicht aufrecht zu erhalten ist; er erkannte, dass die Schwierigkeiten, die Kronecker bei der Definition der irrationalen Zahlen sah, schon bei den ganzen Zahlen auftreten und dass, wenn sie hier beseitigt sind, sie auch dort wegfallen. Diese Arbeit war epochemachend, aber sie lieferte doch noch nichts definitives, es bleiben gewisse Schwierigkeiten übrig. Diese bestehen hier, wie bei der Definition der irrationalen Zahlen, vor allem im Begriff des Unendlichen; . . . 10 The
remark comes from the following passage:
Indem wir die bekannten Axiome für die vollständige Induktion in die von mir gewählte Sprache übertragen, gelangen wir in ähnlicher Weise zu der Widerspruchsfreiheit der so vermehrten Axiome, d. h. zum Beweise der widerspruchsfreien Existenz des sogenannten kleinsten Unendlich (d. h. des Ordnungstypus 1, 2, 3, . . . ). (Hilbert 1905b, 181.)
Hilbert has a footnote to the word ‘Unendlich’, which states: Vgl. meinen auf dem Internationalen Mathematiker-Kongreß zu Paris 1900 gehaltenen Vortrag: Mathematische Probleme, 2. Die Widerspruchslosigkeit der arithmetischen Axiome [i. e., Hilbert 1900b, 264–266].
Introduction
7
properly formulated, would consist of axioms for identity and Dedekind’s requirements for a simply infinite system; the induction principle (which follows from Dedekind’s minimality condition) is mentioned, but neither formulated properly nor treated in the consistency argument. Using modern notation, the axioms can be stated in this way: (1) x = x (2) x = y ∧ W (x) → W (y) (3) x = y → x = y (4) x = 1. The rules, implicit in Hilbert’s description of ‘consequence’, are modus ponens together with a substitution rule allowing replacement of variables by arbitrary sign combinations. Other ‘modes of logical inferences’ are alluded to, but not stated explicitly and, consequently, not incorporated into the consistency proof. Finally, the view that the problem for the reals is resolved once matters are settled for the natural numbers is strongly reemphasized in the Heidelberg address. Hilbert claims: The existence of the totality of real numbers can be proved in a way similar to that of the existence of the smallest infinite. Indeed, the axioms which I have given for the real numbers can be expressed by precisely such formulas as the axioms just given.
In the same paragraph, Hilbert continues: . . . and the axioms for the totality of real numbers do not differ qualitatively in any respect from, say, the axioms necessary for the definition of the integers. In the recognition of this fact lies, I believe, the real refutation of the conception of arithmetic associated with L. Kronecker . . . 11
For the consistency proof, Hilbert formulates the property of homogeneity: an equation a = b is called homogeneous if and only if a and b have the same number of symbol occurrences. It is easily seen, by induction on derivations, that all equations derivable from axioms (1)–(3) are homogeneous. A contradiction can be obtained only by establishing an unnegated instance of (4) from (1)–(3); such an instance is necessarily inhomogeneous and, thus, not provable. Hilbert comments: The considerations just sketched constitute the first case in which a direct proof of consistency has been successfully carried out for axioms, whereas the method usual in such proofs, particularly in geometry, of some suitable specialization or of the construction of examples, necessarily fails here.12 11 The
passages are both from Hilbert 1905b, 185. In the original German, they are:
Ähnlich wie die Existenz des kleinsten Unendlich bewiesen werden kann, folgt die Existenz des Inbegriffs der reellen Zahlen: in der Tat sind die Axiome, wie ich sie für die reellen Zahlen aufgestellt habe, genau durch solche Formeln ausdrückbar, wie die bisher aufgestellten Axiome.
and . . . und die Axiome für den Inbegriff der reellen Zahlen unterscheiden sich qualitativ in keiner Hinsicht etwa von der zur Definition der ganzen Zahlen notwendigen Axiome. In der Erkenntnis dieser Tatsache liegt, wie ich meine, die sachliche Widerlegung der von L. Kronecker vertretenen . . . Auffassung der Grundlagen der Arithmetik. 12 Hilbert
1905b, 181. In the original German, the passage reads:
8
Introduction
In the Heidelberg talk, Hilbert stresses that the goal is to develop logic and mathematics simultaneously, but the actual work has significant shortcomings: there is no calculus for sentential logic; there is no proper treatment of quantification; and induction is not incorporated. In sum, while there is an important shift from semantic arguments to syntactic ones, the set-up is woefully inadequate as a formal framework for mathematics. The foundational import of the approach adopted by Hilbert in the Heidelberg lecture was incisively challenged, above all by Poincaré. As is wellknown, the main objection centred on the inductive character of the consistency proof, and on this, Poincaré criticized Hilbert’s approach severely and justly. But Poincaré brought out additional methodological shortcomings in Hilbert’s paper. His analysis shifted Hilbert’s attention, not away from foundational concerns per se (for these are well documented in lecture courses held throughout the period from 1905 to 1917), but rather from the specific and novel syntactic approach advocated in the Heidelberg talk. Indeed, the notes for Hilbert’s course on ‘Mengenlehre’ in the Summer Semester of 1917 and the talk ‘Axiomatisches Denken’ (Hilbert 1918a) reveal a logicist tendency in his work. Hilbert says there: Since the examination of consistency is a task that cannot be avoided, it appears necessary to axiomatize logic itself and to establish that number theory and set theory are only parts of logic.13
In this paper, Hilbert reviews the successes of the axiomatic method throughout mathematics. Turning to foundations, he praises Frege and ‘the acute mathematician and logician Russell’, saying that: One could regard the completion of this magnificent Russellian enterprise of the axiomatization of logic as the crowning achievement of the work of axiomatization as a whole.
He continues, But this completion will require further work. When we consider the matter more closely we soon recognize that the question of the consistency of the integers and of sets is not one that stands alone, but that it belongs to a vast domain of difficult epistemological questions, which have a specifically mathematical tint: . . . 14 Die eben skizzierte Betrachtung bildet den ersten Fall, in dem es gelingt, den direkten Beweis für die Widerspruchslosigkeit von Axiomen zu führen, während die sonst — insbesondere in der Geometrie — für solche Nachweise übliche Methode der geeigneten Spezialisierung oder Bildung von Beispielen hier notwendig versagt. 13 Hilbert
1918a, 412. The original German reads:
Da aber die Prüfung der Widerspruchslosigkeit eine unabweisbare Aufgabe ist, so scheint es mir nötig, die Logik selbst zu axiomatisieren und nachzuweisen, daß Zahlentheorie, sowie Mengenlehre nur Teile der Logik sind. 14 Hilbert
1918a, 412. In the original German, the passages read:
In der Vollendung dieses großzügigen Russellschen Unternehmens der Axiomatisierung der Logik könnte man die Krönung des Werkes der Axiomatisierung überhaupt erblicken.
And: Diese Vollendung wird indessen noch neuer und vielseitiger Arbeit bedürfen. Bei näherer Überlegung erkennen wir nämlich bald, daß die Frage der Widerspruchslosigkeit bei den
Introduction
9
He then gives examples of the kind of questions he has in mind, questions that were to occupy him for the next fifteen years, and that he tacitly regards as meta-systemic questions about various axiomatic systems: the problems of consistency, decidability, and provability within mathematics and logic. (See Hilbert 1918a, 412–413.) Far from being a dogmatic formalist, Hilbert appears at this time, as in the earlier phase of his foundational reflections under Dedekind’s influence, to have been (at least) tempted by the logicist programme.
2. 1917–1920: Logic and Metamathematics. In retrospect, Hilbert’s brief remarks at the end of the Zürich address can be seen as his first public announcement of the material he was to begin teaching three weeks later. No doubt the central ideas had been incubating for much longer. The detailed examination of Russell’s writings and of Principia Mathematica started around 1913, and the core idea of posing precise, metamathematical questions about various axiom systems goes back even further to the preparatory studies in the 1890s for his Grundlagen der Geometrie. And yet, neither in the 1917 set theory lectures, nor even in the first weeks of the 1917/18 lectures, is there any indication of the path he was planning to pursue, or of how he proposed to extend the axiomatic method into the realm of logic. Suddenly, probably in early November, his lectures change course. Until that point, his systematic presentation of geometry and the axiomatic method was not radically different from what we find in earlier years, but now he begins systematically to unveil to his students the modern conception of mathematical logic. Over the coming weeks he presents a graduated sequence of axiomatic logical calculi, starting with propositional logic, and ending with (in effect) full second-order logic based on the ramified theory of types with the Axiom of Reducibility. He carefully distinguishes questions that arise within the various axiomatic systems from questions about those systems. Indeed, these lectures mark the start of the metamathematical study of formal logical systems. They explicitly pose an array of questions that were foreign to the logical tradition of Frege-Whitehead-Russell and also to the algebraic tradition of Boole-PeirceSchröder. The logical and mathematical questions are driven from the very beginning by philosophical reflections on the foundations of mathematics, and it is noteworthy that every step taken in expanding the logical framework is semantically motivated. After developing first-order logic, Hilbert turns to higher-order logic as a foundation for analysis; detailed reflection on the paradoxes leads him ‘in the most natural way’ to type theory.15 The formal framework of type theory is seen, however, as too narrow for mathematics, ganzen Zahlen und Mengen nicht eine für sich alleinstehende ist, sondern einem großen Bereiche schwierigster erkenntnistheoretischer Fragen von spezifisch mathematischer Färbung angehört: . . . 15 See
the 1917/18 notes, p. 220, below p. 199.
10
Introduction
because it does not, for example, allow the proper formalization of Cantor’s proof of the existence of uncountable sets. To achieve greater flexibility, Russell’s Axiom of Reducibility is adopted. This broader framework is then used to develop the beginnings of analysis and, in particular, to establish the least upper-bound principle. The notes end with the remark (p. 246): Thus it is clear that the introduction of the Axiom of Reducibility is the appropriate means to turn the calculus of types into a system out of which the foundations for higher mathematics can be developed.16
The protocol for Hilbert’s 1917/18 lectures forms the basis of Chapter 1 of this Volume. In contrast to any earlier text in the history of logic, Hilbert’s 1917/18 lectures could still provide, almost a century later, a satisfactory first introduction to mathematical logic, perhaps with some modest supplementation. In this sense, the lectures are an historical milestone, fully comparable in importance to Frege’s Begriffsschrift and to Whitehead and Russell’s Principia Mathematica. The treatment of the central themes in these lectures is substantially identical with the account found in Hilbert and Ackermann 1928 , a work that has hitherto been taken to lie near the end of Hilbert’s second phase of foundational research; indeed, a comparison of the two texts reveals that large parts of the 1928 book are simply taken verbatim from Bernays’s notes for the 1917/18 lectures. Hilbert’s crediting of Ackermann with coauthorship of one of the pivotal texts in the history of logic is both remarkably generous and at the same time somewhat misleading about the extent of Ackermann’s limited role. To facilitate comparisons between these two texts, and because the first edition of the book by Hilbert and Ackermann is now hard to obtain, we have reproduced it as Appendix A to this Volume. The protocol for the 1917/18 lectures was written by Bernays, who in July of 1918 submitted his (second) Habilitationschrift, in which he analyzed the propositional logic of Principia Mathematica. Bernays’s thesis grew directly out of the Hilbert lectures and contains several important advances: a sharper formulation of the semantic completeness theorem for propositional logic (‘Every valid formula is provable and, conversely, every provable formula is valid’); a careful, model-theoretic investigation of the independence and dependence of various groups of propositional axioms; and an investigation of ways in which axioms can be replaced by rules of inference. Some of these techniques were to be used by Hilbert in subsequent lectures. Bernays’s thesis, previously unpublished17 , is so intimately bound up with the developments chronicled in this Volume that we have included it as an Appendix to Chapter 1 with its own introduction. For two years after the 1917/18 lectures, Hilbert appears to have been occupied with other matters. Though he gave a popular course of lectures in 16 For
the original German, see below, p. 214. of the investigations were published later in Bernays 1926 , though this paper by no means captures the full richness of Bernays’s research. In particular, the completeness result is not mentioned. 17 Some
Introduction
11
1919 entitled ‘Natur und mathematisches Erkennen’18 , his attention was focused primarily on mathematical physics. The 1917/18 lectures were engaged with the logic of Principia Mathematica and do not contain any specifically proof-theoretic considerations. The names of Brouwer and Weyl are nowhere mentioned. But in the two lecture courses he delivered in 1920, Hilbert now explicitly rejects the logicist route, and begins to address the foundational views of Brouwer and Weyl. The response to Brouwer and Weyl comes in two distinct steps: first, Hilbert presents a strictly finitist version of number theory; and then, when that enterprise is shown to lead to a dead end, he takes up the suggestion, broached in the 1904 Heidelberg and 1917 Zürich addresses, of developing a theory of (syntactic) proofs. The ‘Logik-Kalkül’ lectures from the Winter Semester of 1920 recapitulate some of the logical material from the 1917/18 lectures and then turn to a completely different topic, attempting to secure the foundations of ordinary number theory by adopting a radically constructive point of view. From 1905 onwards, Hilbert had repeatedly criticized Kronecker for not being sufficiently radical19 , and pointed out that even the commutative law of arithmetic could not be justified by finitely many instances. Constructive arithmetic, as presented here, is developed on a basis stricter than that which appears a little later as finitist mathematics. It is stricter because the directly meaningful part consists only of equations between specific numerals or, more generally, closed terms; the intuitive general concept of numeral is not yet assumed, and equations like x + y = y + x are given a constructive and extremely rule-based interpretation. For this interpretation, tertium non datur does not hold, as Hilbert and Bernays recognized; consequently, this approach cannot secure the foundations of classical mathematics. However, this deficiency is addressed by a second strategic step which is taken in the lectures ‘Probleme der mathematischen Logik’ held in the following semester. Here, after a careful re-examination of rival approaches to the foundations of mathematics, Hilbert unites the considerations behind a constructive foundation for number theory with the detailed formal logical work. Recall that already in his Heidelberg address of 1904, and again in his Zürich lecture of 1917, Hilbert argued for a ‘Beweistheorie’, but did not then pursue the suggestion systematically. In Section 7 of the lectures ‘Probleme der mathematischen Logik’ we find initial steps, namely a consistency proof for an extremely restricted part of elementary number theory that involves negation applied only to equations; the part of number theory considered here really is the same as that in the Heidelberg lecture of 1904. It is only at this stage that the study of ‘meaningless marks’ enters the picture, but manifestly as a programmatic technical device only, and not as the centrepiece of a philosophy of mathematics. The Ausarbeitungen of ‘Logik-Kalkül’ and ‘Probleme der mathematischen Logik’ make up the bulk of Chapter 2. 18 This 19 See
is Hilbert 1919* , published as Hilbert 1992 . p. 425 below.
12
Introduction
At the very end of ‘Probleme der mathematischen Logik’, Hilbert formulates arithmetic theories going beyond the purely equational theory he had shown to be consistent. Their proof-theoretic treatment required a new perspective and entirely different techniques. The first indications of such novel investigations are preserved, we conjecture, in an untitled manuscript in Hilbert’s hand. This manuscript, which we have entitled ‘Consistency Proofs for Fragments of Arithmetic’, is the third document in Chapter 2. In their ‘Introductory Note’ to that document, Sieg and Tapp give ample evidence for Hilbert’s having composed this manuscript before the spring of 1921. The particular proof-theoretic considerations did not enter Hilbert’s later lectures, since they are incorrect as they stand. Sieg and Tapp, however, reconstruct the intricate proof transformations and succeed in correcting the consistency arguments, using a more complex ordering of proofs than Hilbert had used.
3. 1920–1922: From Logic Towards Proof Theory. Hilbert lectured on these topics in 1921, first (probably) in Göttingen, then in Copenhagen in the spring, and finally in Hamburg in the summer; the latter lectures were the basis for the first publication on his new foundational research, Hilbert 1922b.20 The formal theories he examines there are quasiconstructive on account of a restricted treatment of negation; nevertheless, Hilbert takes a very public and pointed stand against Weyl’s and Brouwer’s rejection of ‘classical’ mathematics. His position stirred deep interest among mathematicians and philosophers. In his celebration of the Hamburg Mathematisches Seminar in Behnke 1976 , Behnke gives a brief description of the impact of the Hamburg lectures in the summer of 1921: 20 In
a footnote to the title of his paper Hilbert 1922b (p. 157), Hilbert writes:
Diese Mitteilung ist der wesentliche Inhalt der Vorträge, die ich im Frühjahr dieses Jahres in Kopenhagen auf Einladung der dortigen Mathematischen Gesellschaft und im Sommer in Hamburg auf Einladung des Mathematischen Seminars der Universität daselbst gehalten habe.
Here, the ‘dieses Jahres’ clearly refers to the year the paper was composed (1921), and not the year it was published (1922). Hilbert’s lectures in Copenhagen in March of 1921 are documented in Sauer and Majer 2009 , 376–377. Hilbert’s visit to Copenhagen was occasioned by the award of an honorary doctorate by the University of Copenhagen, presented on 14 March; on the same day, Hilbert gave a lecture in the University’s Festsal entitled ‘Natur und mathematisches Erkennen’. (The manuscript on which this lecture was based is published in Volume 5 of this series, i. e., Sauer and Majer 2009 , 382–392.) On the two days following, Hilbert then gave lectures entitled ‘Axiomlehre und Widerspruchsfreiheit’. There are brief reports and summaries for all three lectures in the Danish press; see for example the Berlingske Tidende for 15, 16 and 18 March. As far as the lectures in Hamburg are concerned, in the letter from Bernays to Hilbert from 21 October 1921 mentioned below (p. 15) in which he reports on his own lecture at the Jena conference in September 1921, Bernays states: Man fragte mich des öfteren, wie es mit der Publikation Ihrer Hamburger Vorträge stehe. Ich wußte in dieser Hinsicht über Ihre Absichten nicht recht Bescheid. Jedenfalls würde Hecke diese Vorträge gern in der neuen Hamburger Zeitschrift drucken.
This journal was precisely where Hilbert’s ‘Neubegründung’ based on these lectures was published.
Introduction
13
In the summer of 1922 sic, Hilbert presented here in Hamburg his oftencited first article on the ‘Neubegründung der Mathematik’. It was a confrontation with the writings of Hermann Weyl und L. E. J. Brouwer, who, because they had challenged the tertium non datur, and had thereby called into doubt the existence of the real numbers, had caused consternation and unrest among mathematicians. In the discussion on Hilbert’s lectures there spoke Ernst Cassirer, at that time Professor of Philosophy in Hamburg, Heinrich Scholz from Kiel, who later was the founder of mathematical logic in Germany, Kowalewski — Königsberg, who promoted Vaihinger’s ‘as if’ philosophy, and several others. The discussions were livelier and more thorough than is usually the case after a mathematical talk. One understood that Hilbert had set himself the task of definitively securing mathematics against the attacks of the intuitionists.21
Only a few weeks later, Bernays gave a talk at the meeting of the Deutsche Mathematiker-Vereinigung, the German Association of Mathematicians.22 In his article (Bernays 1922a) which emerged from this lecture, Bernays presents the newly evolving ideas for a more substantive proof theory and puts them into a broad systematic and historical context. He analyzes this foundational approach and brings out very clearly the tentative character of the proposed solution. In order to provide a rigorous foundation for arithmetic (including analysis and set theory) one proceeds axiomatically and starts out with the assumption of a system of objects satisfying certain structural conditions. However, in the assumption of such a system ‘lies something so-to-speak transcendental for mathematics, and the question arises as to which principled position one should take [towards that assumption]’23 . Bernays considers two ‘natural’ positions, positions which had been thoroughly explored in the lectures from 1920. The first, attributed to Frege and Russell, attempts to prove the consistency of arithmetic by purely logical means; this attempt is judged to be a 21 Behnke
1976 , 231. In the original German, the passage reads:
Im Sommer 1922 sic trug Hilbert hier seinen viel zitierten ersten Aufsatz zur Neubegründung der Mathematik vor. Es war eine Entgegnung auf die Schriften von Hermann Weyl und L. E. J. Brouwer, die Unruhe unter die Mathematiker gebracht hatten, weil sie das tertium non datur bestritten und damit schon die Existenz der reellen Zahlen in Frage stellten. In den Diskussionen zu Hilberts Vorträgen sprachen Ernst Cassirer, damals Professor der Philosophie in Hamburg, Heinrich Scholz aus Kiel, der spätere Begründer der mathematischen Logik in Deutschland, Kowalewski — Königsberg, der für die Philosophie des ‘Als ob’ von Vaihinger warb, und mancher andere. Die Erörterungen waren viel reger und grundsätzlicher, als es sonst nach mathematischen Vorträgen der Fall zu sein pflegt. Man begriff, daß Hilbert sich um die entscheidende Sicherung der Mathematik gegen Angriffe der Intuitionisten wandte.
Behnke’s reference to ‘Kowalewski — Königsberg’ is presumably to Christian Kowalewski, a mathematician and philosopher at the University of Königsberg, and the brother of the mathematician Gerhard Kowalewski. 22 The meeting took place in Jena from 18 to 24 September 1921; Bernays’s lecture, entitled ‘Über Hilberts Gedanken zur Grundlegung der Arithmetik’, was held on 23 September (see Bernays 1921 ), and was published as Bernays 1922a. 23 See Bernays 1922a, 10. In the original German, the passage reads: . . . liegt nun etwas für die Mathematik gleichsam transzendentes, und da entsteht die Frage, welche grundsätzliche Stellung man dazu einnehmen soll.
14
Introduction
failure. The second position is associated with Kronecker, Poincaré, Brouwer and Weyl. It is seen in counterpoint to the logicist foundations of arithmetic: Since one does not succeed in establishing the logical necessity of the mathematical transcendental assumptions, one asks oneself, is it not possible simply to do without them.24
Thus one attempts a constructive foundation, replacing existential assumptions by construction postulates. The methodological restrictions to which this position leads are viewed as unsatisfactory, as one is forced ‘to give up the most successful, most elegant, and most proven methods only because one does not have a foundation for them from a particular standpoint’25 . From these two foundational positions, Bernays continues, Hilbert takes what is ‘positively fruitful’: from the first, the strict formalization of mathematical reasoning, and from the second, the emphasis on constructions. Hilbert does not want to give up the constructive tendency. On the contrary, he emphasizes it in the strongest possible terms. A constructive attitude is viewed as part of the Ansatz to finding a principled position toward the transcendental assumptions; it takes into account the tendency of the exact sciences to use as far as possible only the most primitive ‘Erkenntnismittel’: From this perspective, we are going to attempt to see whether it is possible to give a foundation for these transcendental assumptions in such a way that only primitive intuitive knowledge is used.26
Bernays emphasizes that taking this perspective does not mean denying any other, stronger form of intuitive evidence. The new approach is thus taken as a tool for an alternative, constructive foundation for all of classical mathematics. The great advantage of Hilbert’s method is judged to be this: [T]he problems and difficulties that present themselves in the foundations of mathematics are transferred from the epistemological-philosophical to the properly mathematical domain.27
In this way Bernays, without great fanfare, presents an illuminating summary of four years of intense work. 24 Bernays
1922a, 13. In the original German, the passage reads:
Da es nicht gelingt, die mathematisch transzendenten Grundannahmen als logisch notwendig zu erweisen, so fragt man sich, ob diese Annahmen nicht überhaupt entbehrt werden können. 25 Bernays
1922a, 14. In the original German, the passage reads:
. . . die erfolgreichsten, elegantesten und bewährtesten Schlußweisen sollen preisgegeben werden, und zwar bloß deshalb, weil man von einem bestimmten Standpunkt keine Begründung für sie hat. 26 Bernays
1922a, 11. In the original German, the passage reads:
Unter diesem Gesichtspunkt werden wir versuchen, ob es nicht möglich ist, jene transzendenten Annahmen in einer solchen Weise zu begründen, daß nur primitive anschauliche Erkenntnisse zur Anwendung kommen. 27 Bernays
1922a, 19. In the original German, the passage reads:
. . . die Probleme und Schwierigkeiten, welche sich in der Grundlegung der Mathematik bieten, aus dem Bereich des Erkenntnistheoretisch-philosophischen in das Gebiet des eigentlich Mathematischen übergeführt werden.
Introduction
15
It is in lectures that began a few weeks later, the lectures of the Winter Semester of 1921/22, that the terms ‘Hilbertsche Beweistheorie’ and ‘finite Mathematik’ appear for the first time. In his outline of the forthcoming lectures (sent to Hilbert on 17 October) Bernays indicated that those lectures were to conclude with a treatment of proof theory: III. Further elaboration of the constructive idea: Construction of proofs, whereby the formalisation of higher inferences can be carried out, and the general problem of consistency becomes accessible. At this point the exposition of proof theory would commence.28
In the outline, Bernays refers to ‘constructive arithmetic’; but in the lectures themselves the terminology is changed to ‘finitist arithmetic’ and ‘finitist mathematics’. Although the term ‘Hilbertsche Beweistheorie’ is selfexplanatory, ‘finite Mathematik’ is not. Does the new terminology signal a novel philosophical perspective, or a precise claim about the foundations of mathematics? For three reasons, neither alternative seems likely. First, the term ‘finitism’ was already in use. In 1919, Felix Bernstein published a very informative paper entitled ‘Die Mengenlehre Georg Cantors und der Finitismus’; it is one of the few papers listed at the end of the Introduction to the Second Edition of Principia Mathematica in 1927.29 Bernstein describes ‘Finitismus’ as a familiar foundational stance that was opposed to set theory since the very beginnings of that theory in Cantor’s and Dedekind’s work. Somewhat indiscriminately, Kronecker and Hermite, Borel and Poincaré, Richard and Lindelöf, and then also Brouwer and Weyl (Weyl’s work Das Kontinuum is cited, i. e., Weyl 1918 ) are viewed as members of the finitist movement. Bernstein’s paper was published before Hilbert and Bernays viewed ‘finite Mathematik’ as foundationally significant for proof theory. The characteristic features of finitism which Bernstein formulates are actually close to those of the ‘finite Mathematik’ emphasised by Hilbert and Bernays in the 1921/22 lectures. Hilbert himself frequently had referred to constructive demands (which he usually associated with Kronecker), and as late as 1931 28 Cod. Ms. Hilbert 21. In the original German, the entire outline for the forthcoming lectures, the ‘Disposition’, reads:
I. Bisherige Methoden der Beweise für Widerspruchslosigkeit oder Unabhängigkeit. A. Methode der Aufweisung. Beispiel des Aussagenkalküls in der mathem[atischen] Logik. B. Methode der Zurückführung. Beispiele: 1) Widerspruchslosigkeit der Euklidischen Geometrie 2) Unabhängigkeit des Parallelenaxioms 3) Widerspruchslosigkeit des Rechnens mit komplexen Zahlen II. Versuche der Behandlung des Problems der Widerspruchslosigkeit der Arithmetik. A. Die Zurückführung auf die Logik bietet keinen Vorteil, weil der Standpunkt der Arithmetik schon der formal allgemeinste ist. (Frege; Russell) B. Die konstruktive Arithmetik: Definition der Zahl als Zeichen von bestimmter Art. III. Die weitere Fassung des konstruktiven Gedankens: Konstruktion der Beweise, wodurch die Formalisierung der höheren Schlußweisen gelingt und das Problem der Widerspruchslosigkeit in allgemeiner Weise angreifbar wird. Hier würde sich dann die Ausführung der Beweistheorie anschließen. 29 See
Whitehead and Russell 1927 , Volume I, xlvi. Bernstein’s paper is Bernstein 1919 .
16
Introduction
he remarked that Kronecker’s conception of mathematics ‘essentially coincides with our finitist mode of thought’.30 Secondly, in the lectures themselves Hilbert and Bernays give no philosophical explication of the term ‘finit’. Rather, they insist that intuitive considerations be used, and they develop elementary number theory on such a foundation; their development is a marvellously detailed presentation of the beginnings of (primitive) recursive number theory. The opposition between ‘finite Mathematik’ and ‘transfinite Mathematik’ is founded on that between ‘finite’ and ‘transfinite Logik’, since the step from ‘finite’ to ‘transfinite Mathematik’ is taken when the classical logical equivalences between the quantifiers are assumed to be valid even when dealing with infinite totalities. But this latter cannot be done in ‘finite Mathematik’: For the assumption of the the unrestricted validity of those equivalences amounts to thinking of totalities with infinitely many individuals as something completed. (Ausarbeitung of the 1921/22 lectures, p. 2a, p. 489 below.)
Thirdly, in 1932 Gödel and Gentzen proved that classical arithmetic is consistent relative to its intuitionistic version: until that time the widespread assumption had been that finitism and intuitionism were co-extensional. Indeed, as late as 1930, in his penetrating analysis of Hilbert’s proof theory, Bernays still emphasizes co-extensionality, and interprets Brouwer’s work as showing that considerable parts of analysis and set theory can be ‘given a finitist foundation’.31 These various considerations, as well as the matter-of-fact way the concept of finitism is introduced in the 1921/22 lectures, suggest that Hilbert and Bernays are employing a familiar, intuitive and informal concept; to that extent, attempts to pin down in the light of modern knowledge precisely what they meant by ‘finitism’ are historically misplaced. In particular, it should be observed that elementary number theory as Hilbert and Bernays develop it should not be understood as all of what they term ‘finite Mathematik’. On the contrary, a dramatic expansion is envisioned (as we will see below, at the beginning of the next section). This expansion is required, on the one hand, to develop analysis and set theory fully and, on the other hand, to recognise on the basis of finitist logic why and to what extent ‘the application of transfinite inferences [in analysis and set theory] always leads to correct results’ (Ausarbeitung of the 1921/22 lectures, p. 4a, p. 490 below). The strategy reflects to some extent what Hilbert had done at the turn of the nineteenth and twentieth centuries, namely, shifting the Kroneckerian constructivity requirements from mathematics itself to metamathematics. In this way, Hilbert and Bernays try to resolve two problems simultaneously: (i ) to fix the standpoint on the basis of which consistency proofs are to be carried out (‘finite Mathematik’), and (ii ) to establish a broad, formal framework within which mathematics can be developed systematically. 30 See 31 See
Hilbert 1931a, 487, below p. 976. Bernays 1930 , 350, 42 in the reprint.
Introduction
17
What we find in the lecture notes is thus not a ‘programme’ whose details were fully specified in advance, but rather something more flexible: they present rapidly developing and innovative mathematical work which tries to overcome the obstinate difficulties of giving consistency proofs for stronger and stronger formal theories, but it is ultimately unsuccessful. This extension will be briefly sketched now; it will be presented in more detail in the Introductions to the individual Chapters. The evolution of these proof-theoretic investigations is complex, and in addition to the official typescripts (Ausarbeitungen) of Hilbert’s lectures, Chapter 3 includes (a) the beginnings of an Ausarbeitung by Bernays of the lectures from 1922/23; (b) some handwritten notes by Hilbert himself for these lectures and beyond; (c) Mitschriften for the 1921/22 lectures, for the 1922/23 lectures, and for three lectures which Hilbert held in the Winter Semester of 1923/24. These Mitschriften are by the mathematician Hellmuth Kneser, and it is doubtful that Hilbert even knew of their existence. Their accuracy, readability, and indeed their fortuitous preservation, have given us enormous insight into the lectures as Hilbert (in the case of the 1922/23 lectures, assisted by Bernays) actually held them.
4. 1922–1925: Finitist Proof Theory. As was previously mentioned, the lectures for the 1921/22 Winter Semester contain for the first time the terms ‘finite Mathematik’, ‘transfinite Schlussweisen’, ‘Hilbertsche Beweistheorie’. The third part of these lectures is entitled ‘Die Begründung der Widerspruchsfreiheit der Arithmetik durch die neue Hilbertsche Beweistheorie’ (see p. 432, below). The clear separation of mathematical and metamathematical considerations allows Hilbert to address, finally, Poincaré’s criticism by distinguishing between contentual metamathematical induction and formal mathematical induction. The understanding of generality is broadened: the interpretation is no longer tied to a formal calculus that permits only the establishment of free-variable statements; rather the intuitive general concept of numeral is assumed as part of the finitist standpoint. With this understanding of universal quantification, the conclusion concerning the non-validity of tertium non datur is obtained again. Hilbert writes, formulating a different consequence of the consistency considerations: Thus we see that, for a strict foundation of mathematics, the usual inference methods of analysis must not be taken as logically trivial. Rather it is precisely the task of the foundational investigation to recognize why it is that the application of transfinite inference methods as used in analysis and axiomatic set theory leads always to correct results. (Ausarbeitung of the 1921/22 lectures, p. 4a; p. 490 below.)
That recognition has to be obtained on the basis of finitist logic; so Hilbert argues that we have to extend our considerations in a different direction in order to go beyond elementary number theory: We have to extend the domain of objects to be considered; i. e., we have to apply our intuitive considerations also to figures that are not number signs.
18
Introduction Thus we have good reason to distance ourselves from the earlier dominant principle according to which each theorem of pure mathematics is in the end a statement concerning integers. This principle was viewed as expressing a fundamental methodological insight, but it has to be given up as a prejudice. (Ibid., p. 490 below.)
This is a strong statement. After all, the position decisively rejected here numbered among its supporters such distinguished mathematicians as Dirichlet, Weierstraß, Dedekind and (perhaps) Kronecker.32 What is the new extended domain of objects, and what has to be retained from the ‘fundamental methodological insight’ ? As to the domain of objects, it is clear that the formulas and proofs from formal theories have to be included; as to methodological requirements, Hilbert remarks: . . . the figures we take as objects must be completely surveyable and only discrete determinations are to be considered for them. It is only under these conditions that our claims and considerations have the same reliability and evidence as is the case in intuitive number theory. (Ausarbeitung of the 1921/22 lectures, p. 5a; p. 490 below.)
From this new standpoint, Hilbert exploits the formalizability of a fragment of number theory and proves its consistency by finitist proof-theoretic means. Here we close the gap to the published record with an almost fully developed programmatic perspective. The dialectic of the developments that emerges from these lectures given between the autumn of 1917 and the spring of 1922 is reflected, as we saw, in Bernays’s description of Hilbert’s work ‘Über Hilberts Gedanken zur Grundlegung der Arithmetik’ (Bernays 1922a); this essay makes beautifully clear the connection to the ‘existential axiomatics’ of the nineteenth century. (This connection is also strikingly made in the Nachschrift of Hilbert’s 1922/23 lectures by Walter Peterhans. See the various extracts given below, pp. 571–576.) In Hilbert’s ‘Neubegründung’ essay (based on lectures given in the spring and summer of 1921, first in Copenhagen, then in Hamburg: see n. 20 above), 32 That Dirichlet and Dedekind held to such a principle is stated in the Vorwort to Dedekind 1888 . For Kronecker’s position, see Kronecker 1887 , 338–339. Hilbert himself alludes to Weierstraß’s adherence to such a principle in his ‘Feriencurs’ for 1896, pp. 6–7; see Hallett and Majer 2004 , 154. This adherence is also stated in Hurwitz’s Mitschrift of Weierstraß’s lectures ‘Einleitung in die Theorie der analytischen Funktionen’ from 1878. Cantor (Cantor 1883a, 553) states the view as follows:
Das eigentliche Material der Analysis wird, ausschliesslich, dieser Ansicht zufolge, von den endlichen, realen, ganzen, Zahlen gebildet und alle in der Arithmetik und Analysis gefundenen oder noch der Entdeckung harrenden Wahrheiten sollen als Beziehungen der endlichen ganzen Zahlen untereinander aufzufassen sein; . . . .
Cantor distances himself from the position stated, but goes on to say that there are undoubtedly certain advantages attached to it, and moreover . . . spricht doch für ihre Bedeutung auch der Umstand, dass zu ihren Vertretern ein Theil der verdienstvollsten Mathematikern der Gegenwart gehört.
It would be an error to think that only a single, explicit principle was endorsed by all of these mathematicians, despite Cantor’s statement. For a discussion of some of the nuances, see Schappacher and Petri 2007 .
Introduction
19
a general consistency result is formulated. But, as the Editors of Hilbert’s Gesammelte Abhandlungen remark, it is provable only in a restricted form (see Hilbert 1935 , p. 176, n. 2).33 This restricted result is actually established in Hilbert’s 1921/22 lectures, as is recorded in the Kneser Mitschrift; cf. the Introduction to Chapter 3, section 2. Indeed, through this Mitschrift, we can say that the proof-theoretic considerations began on 2 February 1922 and ended on 23 February. They concern a basic system of arithmetic and are extended to treat definition by (primitive) recursion and proof by induction; the latter principle is formulated as a rule and restricted to quantifier-free formulas. The part of the official Ausarbeitung which presents a finitist consistency proof was clearly written by Bernays after the term had ended, and contains a different argument; that argument pertains only to the basic system and is sketched in Hilbert 1923a. The more extended argument for a system that incorporates definition by primitive recursion and proof by quantifier-free induction is given in Kneser’s Mitschrift 1922/23, and is discussed below in the Introduction to Chapter 3. From a contemporary perspective, this argument shows something very important. If a formal theory contains a certain class of finitist functions, then it is necessary to appeal to a wider class of functions in the consistency proof: an evaluation function is needed to determine uniformly the numerical value of terms, and such a function is no longer in the given class. The formal system considered in the above consistency proof includes primitive recursive arithmetic, and the consistency proof goes beyond the means available in this arithmetic. At this early stage of proof theory, finitist mathematics is consequently stronger than primitive recursive arithmetic, something that remains constant throughout the development of proof theory by Hilbert and Bernays.34 In his paper of 1925 (Ackermann 1925 , 4–7), Ackermann reviews the consistency proof discussed above in his Section II entitled ‘The consistency proof before the addition of the transfinite axioms [Der Widerspruchsfreiheitsbeweis vor Hinzunahme der transfiniten Axiome]’. The very title reveals the restricted significance of this result, since it concerns a theory that is by definition part of finitist mathematics and thus need not be secured by a consistency proof. The first step which genuinely goes beyond the finitist methods involves the treatment of quantifiers. Already in Hilbert’s ‘Neubegründung’ lectures of 1921 (Hilbert 1922b), we find a brief indication of his approach; this is elaborated in the 1921/22 lectures (see the Kneser Mitschrift for these lectures, pp. 1–12 of Notebook III, below pp. 589–594). The treatment of 33 The
Editors of Volume 3 of Hilbert’s papers are not explicitly named, although various people are thanked by Hilbert in the Foreword ‘für ihre Mitarbeit, für ihre kommentierende Anmerkungen u. s. w.’, including the General Editor Helmut Ulm, as well as Paul Bernays and Arnold Schmidt. It is plausible to assume that Bernays was responsible for the remark mentioned here. See n. 3 and especially n. 6 to Appendix D below. 34 The discussion of the strength of finitist mathematics has been taken up in recent writings; see in particular the various essays on proof theory in Tait 2005 and Zach 2003 . As to the internal developments in the Hilbert School, see Ravaglia 2003* and Sieg 2009 .
20
Introduction
quantifiers is just the first of three steps which have to be taken. The second concerns the incorporation of the general induction principle for number theory, and the third deals with an expansion of proof-theoretic considerations to analysis. In his Leipzig address of September 1922, Hilbert sketched the consistency proof set out in the 1921/22 lectures. The really novel aspect of his prooftheoretic discussion is the treatment of quantifiers with the τ -function, the dual of the later ε-operator. The logical function τ associates with every predicate A(a) a particular object τa (A(a)) or τ A for short. It satisfies the transfinite axiom A(τ A) → A(a), which, according to Hilbert, states ‘if a predicate A holds for the object τ A, then it holds for all objects a’. The τ -operator allows the definition of the quantifiers: (a)A(a) ↔ A(τ A) (Ea)A(a) ↔ A(τ ¬A) Hilbert then extends the consistency argument to the ‘first and simplest case’ going beyond the finitist system. This ‘Ansatz’ will evolve into the εsubstitution method. It is only in the Leipzig address that Hilbert gave proof theory its principled formulation and discussed its refined technical tools; there he gave a hint of the first step that has to be taken in order to obtain consistency proofs for comprehensive theories like full first-order number theory, namely, the treatment of quantifiers. What of the third step, the extension to analysis? In the 1917/18 lectures Hilbert had taken ramified type theory with the axiom of reducibility as the formal frame for the development of analysis. In the Leipzig address he considers a third-order formulation: appropriate functionals (‘Funktionenfunktionen’) allow him to prove (i ) the least upper bound principle for sequences and sets of real numbers, and (ii ) Zermelo’s Choice Principle for sets of sets of real numbers.35 He conjectures that the consistency of the additional transfinite axioms can be patterned after that for τ . He ends the paper with the remark: Through the precise execution of the basic ideas of my proof theory sketched above, the founding of analysis is completed, and the ground prepared for the founding of set theory.36 35 See Hilbert 1923a, 163–165, to be found on pp. 189–191 of the republication in Hilbert 1935 . 36 Hilbert 1923a, 165. In the original German, the passage reads:
Durch die genaue Ausführung der soeben skizzierten Grundgedanken meiner Beweistheorie wird die Begründung der Analysis vollendet und die der Mengenlehre angebahnt.
The passage was altered for the republication in Hilbert’s Gesammelte Abhandlungen: There remains now the task of the precise execution of the basic ideas sketched above; with this execution, the founding of analysis is completed, and the ground for the founding of set theory prepared. [Es bleibt nun noch die Aufgabe einer genauen Ausführung der soeben skizzierten Grundgedanken; mit ihrer Lösung wird die Begründung der Analysis vollendet und die der Mengenlehre angebahnt sein.] (Hilbert 1935 , 191.)
Introduction
21
In Supplement IV of the Second Volume of Grundlagen der Mathematik Hilbert and Bernays give a beautiful exposition of analysis. They state: Here a formalism for the deductive treatment of analysis is presented which, leaving aside inessential differences, is the same as that given in Hilbert’s lectures on proof theory, and is also similar to the one described in Ackermann’s dissertation.37
The concrete proof-theoretic work establishing the consistency of what we call primitive recursive arithmetic was directly continued in Ackermann’s thesis (Ackermann 1924a* ), on which Ackermann 1925 is based. It starts out, as was mentioned, with a concise review of the earlier considerations for quantifier-free systems. Hilbert had replaced the τ -symbol with the ε-symbol in 1923, and in Ackermann’s work the ε-calculus as we know it replaces the τ -calculus of 1922.38 The transfinite axiom for the ε-calculus appears in Section III, entitled ‘The consistency proof after the addition of the transfinite axioms and higher function types [Der Widerspruchsfreiheitsbeweis bei Hinzunahme der transfiniten Axiome und der höheren Funktionstypen]’. For number variables, the crucial axiom is just dual to the τ -axiom and is formulated as A(a) → A(εA); it yields the following definitions of the quantifiers: (Ea)A(a) ↔ A(εA) (a)A(a) ↔ A(ε¬A) The remaining transfinite axioms are adopted from Hilbert’s Leipzig paper (Hilbert 1923a). However, the ε-symbol is actually characterized as the leastnumber operator, and the recursion schema with number variables alone is extended to a schema that also permits function variables. The proof-theoretic argument is complex.39 The connection to the mathematical development in Hilbert’s paper is finally established in Section IV entitled ‘The reach of the transfinite axioms [Die Tragweite der transfiniten Axiome]’. At first it was believed that Ackermann had completed the ‘precise execution’ indicated at the end of the Leipzig talk and had thereby established not only the consistency of full classical number theory, but even that of analysis.
5. 1925–1931: An Elementary Finiteness Theorem? Ackermann’s thesis had just been published when, on 4 June 1925, Hilbert gave a triumphant talk in Münster on his proof-theoretic programme. His lecture ‘Über das Unendliche’ (published as Hilbert 1926 ) is arguably the 37 Hilbert
and Bernays 1939 , 451. In the original German, the passage reads:
Es sei hier ein Formalismus für die deduktive Behandlung der Analysis dargelegt, wie er — bis auf unwesentliche Unterschiede — in den Hilbertschen Vorlesungen über die Beweistheorie aufgestellt wurde und wie er ähnlich auch in der Ackermannschen Dissertation beschrieben ist. 38 See, e. g., Hilbert’s lecture for 1 February 1923, reported in the Kneser Mitschrift, pp. 30ff., pp. 623ff. below. 39 For analysis of this argument, see Zach 2003 and Tapp 2006* .
22
Introduction
most studied of Hilbert’s papers from the 1920s; he not only gives a brilliant exposition of the methodological framework for proof theory, but he also tries to support the work by sketching the ‘fundamental ideas’ for a proof of Cantor’s ‘Kontinuumssatz’. (The methodological framework is also discussed at greater length in the lecture course ‘Über das Unendliche’ presented in Chapter 4.) Hilbert applies here the method of ‘ideal elements’, already discussed by him at length in previous work, most particularly his work on the foundations of geometry from the 1890s, and widely used before this in geometric and algebraic practice.40 Here, Hilbert applies the method in the first place to statements: the genuinely transfinite statements are considered as ‘ideal elements’ whose coherent addition to the finitist basis has to be secured by a consistency proof. As to the ‘Kontinuumssatz’, there are attempts at tackling it in earlier lectures and in further manuscripts preserved in the Nachlaß. However, all this material is, without exception, very difficult to decipher and even more difficult to understand. The broad ideas that appear to have guided Hilbert in this attempt, and their relation to Gödel’s proof of the consistency of the Continuum Hypothesis relative to the other axioms of set theory, are discussed by Robert Solovay in Volume III of Gödel’s Collected Works.41 As for concrete progress in the basic proof-theoretic programme, Hilbert asserts that the consistency of the ‘arithmetic axioms’ has been established. Hilbert goes on: In fact, we can carry out this demonstration, and with it we arrive at a justification for the introduction of our ideal statements. Thus, we experience the pleasant surprise that this gives us the solution of a problem that became pressing a long time ago, namely, the problem of proving the consistency of the arithmetic axioms.42
The triumphalism displayed by Hilbert was misplaced. It turned out that the consistency proofs of Ackermann (and von Neumann) established the consistency only of arithmetic with quantifier-free induction; for further discussion, see the Introductions to Chapter 3 and to Appendix B below. The major document included in Chapter 4 is an Ausarbeitung of the lecture course ‘Über das Unendliche’ held by Hilbert in the Winter Semester of 40 For discussions of Hilbert’s earlier appeal to the method of ‘ideal objects’ and ‘ideal elements’, see Majer 1993 and Hallett 2008 , 216–218. 41 See Solovay 1995 , §5, esp. 121. See also Kanamori and Dreben 1996 , §7, which brings out forcefully the novelty and fruitfulness of Hilbert’s central ideas, even though the proof, of course, does not succeed. Of especial interest are Gödel’s remarks in a letter of 25 June 1969 to Constance Reid; the letter is published in Volume V of the Collected Works, Gödel 2003b, 188–189. See also Gödel’s letter to van Heijenoort from 8 July 1965, Gödel 2003b, 324. 42 Hilbert 1926 , 179. In the German original, the passage reads:
Tatsächlich läßt sich dieser Nachweis erbringen, und damit gewinnen wir die Berechtigung zur Einführung unserer idealen Aussagen. Zugleich noch erkennen wir die freudige Überraschung, daß wir damit ein Problem lösen, das längst brennend geworden ist, nämlich das Problem, die Widerspruchsfreiheit der arithmetischen Axiome zu beweisen.
The same passage is repeated almost word for word (but without the paragraph break) in Hilbert’s Hamburg address in 1927, Hilbert 1928a, 74; see below, p. 931.
Introduction
23
1923/24. It bears many similarities to, and also exhibits deviations from, the famous paper which has just been discussed. The other items in Chapter 4 are a short essay (possibly prepared for a public lecture) entitled ‘Über die Grundlagen des Denkens’ from 1931 or 1932, and a short lecture on the infinite from 1933. It is unfortunate that there are extant no lecture (or other) notes from 1925 through to the early 1930s which offer insight into Hilbert’s perspective on the further development of proof theory.43 Given this, we have chosen to include some of Hilbert’s previously published work in Appendices B–E, reprinting four papers from the period 1927 to 1931. The special circumstances under which they were presented are discussed in the Introductions to the respective Appendices; their content is discussed briefly below, and more extensively in the general introduction to the Appendices. In so far as they are able, these Introductions serve to make clear the striking discontinuities between the papers in Appendices B and C and those in D and E. The change in Hilbert’s approach is attributed to the impact of Gödel’s Incompleteness Theorems. But first, a word about Appendix A. This Appendix reproduces Hilbert’s famous textbook on logic from 1928, the Grundzüge der theoretischen Logik, co-authored with Wilhelm Ackermann. This book does not reflect the prooftheoretic work of the 1920s; the intention was always to present that in a separate book co-authored with Bernays.44 Nevertheless, the Hilbert and Ackermann book, now somewhat hard to obtain, is a central, indeed classical text in the development of mathematical logic. Moreover, because of its historical centrality, it is important to be able to compare it closely with Hilbert’s lectures of 1917/18 and the two lecture courses from 1920, and thus to see that the core content of the book is taken over from those lectures. § 6.2 of the Introduction to Chapter 1 provides a detailed comparison of the book with those earlier lectures, and the Introduction to Appendix A gives a brief synopsis of the source of the various sections of the book based on an abbreviated translation of the book’s Inhaltsverzeichnis. Appendix B reprints a paper (Hilbert 1928a) which is based on a lecture Hilbert gave in Hamburg in July of 1927. The general considerations by and large follow the presentation in ‘Über das Unendliche’ from some two years earlier, but contain also some new aspects. In particular, the lecture includes more detailed proof-theoretic considerations and a sketch of Ackermann’s new approach. More of the mathematical details of this new approach are given in Bernays’s ‘Zusatz’, and also in a letter Bernays wrote to Weyl on 5 January 1928. Both this letter and the ‘Zusatz’ are reprinted in Appendix B, as 43 A
possible exception is Collatz’s protocol of Hilbert’s lectures on set theory from 1929, though see below, p. 29. 44 In a letter to Weyl of 5 January 1928 (reproduced in Appendix B, below), Bernays remarks that only one chapter of the Hilbert and Bernays book had so far been drafted. However, by the beginning of 1931, a presentation of the proof-theoretic work was close to completion. See the remark of Bernays from the Foreword to Hilbert and Bernays 1934 , V–VI.
24
Introduction
is the paper containing Weyl’s ‘Diskussionsbemerkungen’, which directly followed Hilbert’s Hamburg lecture. Weyl’s remarks contain deep and important philosophical insights concerning Hilbert’s general approach. Appendix C contains the first version (Hilbert 1929 ) of the paper which resulted from Hilbert’s address to the International Congress of Mathematicians in Bologna in September 1928. In this address, Hilbert stated that the consistency of full number theory had been secured by the proofs of Ackermann and von Neumann; according to Bernays in his Introductory Remarks to the Second Volume of Grundlagen der Mathematik, that belief was sustained until 1930. (See Hilbert and Bernays 1939 , VI.) A number of precise metamathematical problems were formulated in Hilbert’s Bologna lecture, among them the completeness question for first-order logic. As to the consistency problem for analysis, Hilbert states that it is just a matter of establishing ‘a purely arithmetic elementary finiteness theorem [ein rein arithmetischer elementarer Endlichkeitssatz ]’. Hilbert’s Bologna address shows dramatically, through its broad perspective and clear formulation of open problems, how far mathematical logic had been moved in roughly a decade. This is a remarkable achievement with impact not just on proof theory; the (in-)completeness theorems, after all, are to be seen as part of this broader foundational enterprise. These theorems give finally a negative answer to the question that serves as the title of this section. They show that there are intrinsic reasons why no striking progress had been made in proof theory in the late 1920s, even though extraordinarily talented people were working on the consistency programme. In the Preface to the first volume of Grundlagen der Mathematik, Bernays asserts that a presentation of proof-theoretic work had almost been completed in 1931. But, he continues, the publication of papers by Herbrand and Gödel produced a deeply changed situation that resulted in an extension of the scope of the work and its division into two volumes. The remaining two papers (according to Bernays’s recollection formulated in an interview of 27 August 1977) were an attempt of Hilbert’s to deal with Gödel’s results in a positive way. The interviewer raised the question: ‘How did Hilbert react when he first learned of Gödel’s proof that it is impossible to carry out a consistency proof for number theory inside number theory itself?’45 Here is Bernays’s response: Yes, yes, he was rather irritated about this. But he didn’t react merely negatively; instead he undertook extensions [of the basic system], for example in the Hamburg lecture of 1930. That isn’t the first [Hamburg lecture], nor the second, but the third. There he introduced some further considerations. And then he had a paper, which he called ‘Proof of the tertium non datur ’. 45 In
the original German, the question reads:
Wie hat Hilbert reagiert, als er von Gödels Beweis der Unmöglichkeit, einen Widerspruchsfreiheitsbeweis für die Zahlentheorie in der Zahlentheorie selbst zu führen, erfuhr?
Introduction
25
There he expressed those [considerations] in somewhat further detail. So yes, indeed, he certainly also dealt with this positively.46
The lecture Bernays mentions in his remarks was actually given in December 1930 to the Hamburg Philosophische Gesellschaft; the resulting paper was received on 21 December 1930 for publication in Mathematische Annalen. The mathematical part of the talk seems to be concerned with a version of Gödel’s first incompleteness theorem as it was presented by Gödel at the Königsberg Congress on 7 September 1930. Assuming that classical mathematics is consistent, Gödel argues that: One can give examples of statements (and in fact statements of the type of Goldbach’s or Fermat’s) that are in fact contentually true, but are unprovable in the formal system of classical mathematics. Therefore, if one adjoins the negation of such a proposition to the axioms of classical mathematics, one obtains a consistent system in which a contentually false proposition is provable.47
It is not implausible that Hilbert learned about Gödel’s result shortly after the Congress, possibly even in Königsberg. For details of the historical facts we know, see the discussion in Section 4 of the general Introduction to the Appendices, pp. 796–797 and also the Introductions to Appendices D and E, pp. 967–973 and 983–984 respectively. Hilbert presents the crucial and novel aspect that allows the introduction of universal axioms based on finitist arguments. (See Hilbert 1931a, 491–492, below, pp. 980–980.) More precisely, he adds to the formal system of number theory a finitist inference rule for closed quantifier-free or numeric formulas: If it is shown that, for any given numeral z, the formula A(z) is always a correct numeric formula, then the formula (x)A(x) can be used as a starting formula.48
An extension of Ackermann’s inductive argument to Hilbert’s rule establishes the consistency of the new theory, as Ackermann’s proof was taken to show 46 In
the original German, the passage reads:
Ja, ja, er war ziemlich ärgerlich darüber. Aber er hat nicht bloss negativ reagiert, sondern er hat ja eben auch Erweiterungen vorgenommen, z. B. schon im Hamburger Vortrag von 1930. Das ist weder der erste noch der zweite, das ist der dritte. Da hatte er schon so Einiges eingeführt. Und dann hatte er eine Arbeit, die nannte er ‘Beweis des Tertium non datur ’. Da hat er das noch etwas weitergehend ausgedrückt. Also, er hat sich dann doch auch positiv damit auseinandergesetzt. 47 Hahn
et al. 1931 , 148. The original German reads:
Man kann (unter Voraussetzung der Widerspruchsfreiheit der klassischen Mathematik) sogar Beispiele für Sätze (und zwar solche von der Art des Goldbachschen oder Fermatschen) angeben, die zwar inhaltlich richtig, aber im formalen System der klassischen Mathematik unbeweisbar sind. Fügt man daher die Negation eines solchen Satzes zu den Axiomen der klassischen Mathematik hinzu, so erhält man ein widerspruchsfreies System, in dem ein inhaltlich falscher Satz beweisbar ist.
The background is described in detail in Dawson’s ‘Introductory Note’ (Dawson 1986 ), and also in Dawson 1997 , 68–79. 48 Hilbert 1931a, p. 491; see p. 980 below. For the subsequent introduction of the so-called ω-rule by Bernays, and his correspondence with Gödel, see the Introduction to Appendix D, pp. 969–972.
26
Introduction
the consistency of full number theory. The completeness of the new theory is established as well for statements of the form indicated.49 In the final third of his paper, Hilbert vigorously defends proof theory against various objections, all of which he considers to be unjustified. These objections are numbered and with respect to the second Hilbert writes: It has been said, in criticism of my theory, that the theorems are indeed consistent, but that they are not thereby proved. Certainly they are provable, as I have shown here in simple cases. (Hilbert 1931a, 492, below p. 981.)
This seems to be a reference to Gödel’s Königsberg result and to the crucial, though limited role of the mathematical result described above. However, Hilbert emphasizes then, as he had done in his second Hamburg lecture (see p. 84, below, pp. 940), that proving consistency is the essential task for proof theory: It turns out also in general (as I was convinced from the outset) that securing consistency is the essential thing in proof theory, and that the question of provability is then settled at the same time, possibly with an appropriate extension of the requirements in such a way as to preserve their finitist character. (Ibid.)
It is not clear what Hilbert precisely had in mind with the last claim in this passage: it is concerned with the question of provability, but how is that settled once consistency is obtained? What is to be understood by ‘appropriate extension of the requirements that preserves their finitist character’ ? Perhaps Hilbert is thinking of finitist rules as above, but for more complex statements. The goal, it seems, is to ensure provability of a broader class of statements, while taking for granted that consistency has been, or will be, established. Hilbert’s last paper on proof-theoretic matters, ‘Beweis des Tertium non datur ’, was presented to the Göttingen Gesellschaft der Wissenschaften on 17 July 1931; it is of a completely different character from the Hamburg lecture. The whole paper is deeply technical and difficult to understand. Here we merely mention that Hilbert attempts to construct an argument showing that the addition of the tertium non datur in the form (x)A(x) ∨ (∃x)A(x) to some constructive base theory extends that base theory consistently. The necessity of ‘proving’ the tertium non datur is strongly re-emphasized towards the end of the lecture: The tertium non datur occupies a distinguished position among the axioms and theorems of logic in general: for while all the other axioms and theorems can be immediately traced back without difficulty to definitions, the tertium non datur expresses a new, contentually meaningful fact that stands in need of proof. (Hilbert 1931b, 124–125, below p. 988.) 49 It
should be mentioned that in his 1931 paper (Herbrand 1931 ) Herbrand included Hilbert’s ‘rule’ as part of the system (Axiom Group D) for which consistency is established, and when Gödel established the consistency of classical elementary number theory relative to its intuitionist version, he used Herbrand’s system including Axiom Group D, thus including Hilbert’s ‘rule’. See Gödel 1933 , 35.
Introduction
27
By contrast, Hilbert had pointed out in the Hamburg lecture of 1927 that the consistency of elementary number theory, as supposedly obtained by Ackermann and von Neumann, guarantees the admissibility of all transfinite inferences and in particular of tertium non datur. Hilbert insists here that the new method can be applied to the case of higher function types, so that analysis in particular would be covered. Hilbert ends the paper with an ode to the tertium non datur : Through the tertium non datur, logic attains complete harmony; its theorems assume such a simple form, and the system of its concepts is rounded off in a way that is appropriate for the importance of a discipline expressing the structure of our entire thought. (Hilbert 1931b, 125, below p. 989.)
This paper was undoubtedly written against the background of a full knowledge of Gödel’s results and, it is plausible to assume, von Neumann’s conviction that there is no finitist consistency proof for classical mathematics. The latter had drawn very strong and rather dramatic consequences from Gödel’s results. In a letter to Gödel of 29 November 1930, von Neumann writes: Thus, I think that your result has solved negatively the foundational question: there is no rigorous justification for classical mathematics. What sense to attribute to our hope, according to which it is de facto consistent, I do not know — but in my view that does not change the completed fact.50
It should be emphasized that Gödel himself, even as late as 25 July 1931, defended the view he had expressed at the end of his paper on incompleteness (i. e., Gödel 1931a, 197) that his results do not conflict with Hilbert’s formalist standpoint, and that there may be finitist proofs that cannot be formalized in the system of Principia Mathematica and other equally strong, or even stronger, foundational theories. He writes in a letter to Herbrand: Clearly, I do not claim either that it is certain that some finitist proofs are not formalizable in Principia Mathematica, even though intuitively I tend toward that assumption. In any case, a finitist proof not formalizable in 50 See
Gödel 2003b, 338–341. In the original German, the passage reads:
Infolgedessen halte ich die Grundlagenfrage durch Ihr Resultat für im negativen Sinn erledigt: es gibt keine strenge Rechtfertigung für die klassische Mathematik. Welcher Sinn unserer Hoffnung, wonach sie doch de facto widerspruch[s]frei ist, dann zuzuschreiben ist, weis[s] ich nicht — aber das ändert m. E. nichts an der vollendeten Tatsache.
For the whole correspondence between Gödel and von Neumann, see Gödel 2003b, 336–375, and also Sieg 2003b. At a meeting of the Vienna Circle on 15 January 1931, Gödel reports von Neumann’s view as follows: . . . if there is any sort of finitist consistency proof at all, then it can be formalized. Thus, Gödel’s proof implies the impossibility of any consistency proof.
(Protokoll des Schlick Kreises for the meeting of 15 January 1931; Carnap Archives at the University of Pittsburgh.) This is quoted from Mancosu 1999b, 38; the German original can be found on p. 36. This latter reads: Wenn es einen finiten Widerspruchsbeweis überhaupt gibt, dann lässt er sich auch formalisieren. Also involviert der Gödelsche Beweis die Unmöglichkeit eines Widerspruchsbeweises überhaupt.
28
Introduction Principia Mathematica would have to be quite extraordinarily complicated, and on this purely practical ground there is very little prospect of finding one; but that, in my opinion, does not alter anything about the possibility in principle.51
To overcome the ‘impossibility result’ defended by von Neumann, the restrictions on proof-theoretic methods have to be weakened, and constructive methods stronger than finitist ones have to be allowed. That such methods were in fact available was indicated by the Gödel-Gentzen consistency proof for classical number theory relative (somewhat ironically) to its intuitionist version. That forced the recognition that finitist methods and intuitionist ones were not co-extensional as those in the Hilbert School and, in particular, von Neumann had believed. This relative consistency result pointed the direction for important proof-theoretic work that has been pursued ever since.52 The two volumes of Hilbert and Bernays’s Grundlagen der Mathematik, published in 1934 and 1939, give a superb, masterly presentation of mathematical logic and, in particular, of proof theory. It has been a cornerstone of much subsequent research. The part of mathematical practice that was of special concern to Hilbert and Bernays, namely, analysis, has been shown to be consistent relative to intuitionist principles. In Supplement IV of the second volume (Hilbert and Bernays 1939 ), Hilbert and Bernays developed analysis very elegantly in a form of second-order arithmetic with the full comprehension principle; cf. p. 21 above. On closer examination, one can see that the latter principle as well as induction is needed only for Π11 -formulas. The subsystem (Π11 -CA)0 of second-order arithmetic encapsulates these restrictions, and this has been shown to be consistent relative to ID<ω (O), the intuitionist theory of finite constructive number classes.53 However satisfactory the result we just mentioned may be, it certainly does not support Hilbert’s claim made at the end of his final Hamburg lecture: 51 Gödel to Herbrand, 25 July 1931; see Gödel 2003b, p. 23. In the original German, the passage reads:
Selbstverständlich behaupte ich auch nicht, es sei sicher, daß irgendwelche finite Beweise in den Prin. Math. nicht formalisierbar sind, wenn ich auch gefühlsmäßig eher zu dieser Annahme neige. Jedenfalls müßte ein in den Princ. Math. nicht formalisierbarer finiter Beweis ganz außerordentlich kompliziert sein und es besteht aus diesem rein praktischen Grunde sehr wenig Aussicht einen zu finden, aber das ändert nach meiner Meinung nichts an der prinzipiellen Möglichkeit.
For the correspondence between Gödel and Herbrand, see Gödel 2003b, 14–25, and also Sieg 2003a. 52 See Bernays 1967 , p. 502. Gödel and Gentzen established their results independently and at about the same time. Gödel’s version of the result is in Gödel 1933 . Gentzen’s paper was to appear in Mathematische Annalen, but Gentzen withdrew it having learned of the Gödel paper. For more information, see p. 802, below. 53 The papers Feferman 1970 and Friedman 1970 , in particular, demonstrate the reduction of (Π11 -CA)0 to the classical theory of finite tree classes ID<ω (W); the final step to the intuitionist ID<ω (O) was taken in Sieg’s Stanford thesis, Sieg 1977* . — (Π11 -CA)0 is the strongest subsystem of arithmetic considered in Reverse Mathematics; see Simpson 1999 . For a glimpse at the progress that has been made in proof-theoretic investigations, see Pohlers 2009 .
Introduction
29
I believe that, with proof theory, I have completely achieved what I wanted and promised: the question of the foundations of mathematics is hereby, as I believe, finally eliminated.54
Proof theory has not eliminated foundational questions. Rather, it has introduced, and continues to introduce, mathematical methods, posing sharply formulated problems, and philosophical issues, calling for deep reflection; together, they are of the utmost significance for gaining a proper perspective on the fundamental questions.
6. Material Omitted from this Volume. This Volume reproduces the principal archival texts concerned with logic and foundations of mathematics from 1917 on, supplemented by some published works that are either now difficult to obtain, or germane to the development of Hilbert’s thought during the period in question. None of the Volumes in this series is intended to be complete, but it is nevertheless important to give a brief sketch of material omitted. After all, the list of Hilbert’s lecture courses (reproduced at the end of this Volume) mentions several courses given by Hilbert which might appear relevant to this Volume. In most cases, however, there are no notes extant for these courses, though detailed Mitschriften may eventually come to light. A known exception is the lecture ‘Mengenlehre’ given in the summer term of 1929, for which there exists a very careful protocol by Lothar Collatz, mentioned in Menzler-Trott’s book on Gentzen, Menzler-Trott 2007 , n. 8, pp. 22–23. These notes show that Hilbert’s course was an adaptation of the set theory course Hilbert gave in 1917. The final third discusses the finitist consistency programme, but this is carried out only in a very elementary way. The Collatz-Notes will be taken fully into account in Volume 2 of this series, in connection with the Göttingen notes for the 1917 lectures on set theory.) For two of the three courses on ‘Zahlbegriff und Quadratur des Kreises’ in the relevant period, those for 1924/25 and 1928/29, there do exist some handwritten notes, but these consist of only two pages and a few lines respectively, and in both cases are little more than introductory remarks. More relevantly, these notes are to be found pasted into the Ausarbeitung for the 1904 course with the same title prepared by Max Born, which is reproduced in Volume 2 of this series. This suggests (although it does not establish) that there was nothing substantially new in Hilbert’s presentation. There do exist notes associated with the courses ‘Einleitung in die Philosophie auf Grund moderner Wissenschaft’ (1931/32), and ‘Grundlagen der Logik, allgemeinverständlich (für Hörer aller Fakultäten)’ (1933/34). However, in both cases, the notes consist only of a page and are at a very general level. Apart from these specific courses, there also exist notes for general lectures on the foundations of science which contain sections of great importance for understanding various aspects of Hilbert’s approach to the foundations 54 Hilbert
1931a, 494, below p. 982.
30
Introduction
of mathematics. This holds especially for the Ausarbeitungen of ‘Natur und mathematisches Erkennen’ (1919) by Paul Bernays (Hilbert 1919* ) and of ‘Wissen und mathematisches Denken’ (1922/23) by Wilhelm Ackermann (Hilbert 1922/23b* ). However, these are wide-ranging and more popular lectures, and the foundations of logic and arithmetic are not their central focus. The decision was therefore taken not to publish them in this Volume. It is intended that this Edition be completed with a final Volume 6 containing some of these more popular works as well as excerpts from Hilbert’s Notebooks. In addition to the manuscripts just cited, there exist many other items in Hilbert’s Nachlaß which contain material clearly related to the development of his approach to logic, the axiomatisation of arithmetic, the development of the ε-calculus, and consistency proofs for one or more restricted systems. Nevertheless, these notes are scattered, disconnected and often difficult to decipher, to reconstruct and to date. The decision was therefore taken to omit them from this Edition. William Ewald and Wilfried Sieg
Chapter 1 Lectures on the Principles of Mathematics
‘Prinzipien der Mathematik’ (WS 1917/18)
Appendix: The Bernays Habilitation Thesis of 1918
W. Ewald and W. Sieg (eds.), David Hilbert’s Lectures on the Foundations of Arithmetic and Logic 1917–1933, DOI 10.1007/978-3-540-69444-1_1, © Springer-Verlag Berlin Heidelberg 2013
31
32
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Introduction The following lectures, delivered during the Winter Semester 1917/18, are a pivotal event in the development of mathematical logic and mark the start of Hilbert’s long and fruitful collaboration with Paul Bernays. Towards the end of his lectures on set theory in the preceding Summer Semester, Hilbert had stated (p. 146), ‘I hope to be able to explore a foundation for logic more deeply next semester’.1 Those earlier lectures had been concerned with the mathematical articulation of set theory and with the prospects for a settheoretic reduction of mathematics. For Chapter IV of the set theory course, Hilbert had announced an enticing and enigmatic title: ‘Applications of Set Theory to Mathematical Logic’. The lectures, however, did not reach the topic of logic proper, and give no hint of the approach Hilbert began exploring a few months later.2 In the present lectures, Hilbert returns to a central part of a project that he had broached a dozen years earlier in his Heidelberg address of 1904 and had also explored in his logic lectures of 1905, but which had lain fallow since then: the axiomatic investigation of logic. Other aspects of that early project were to be developed in the coming years; but these lectures present systematically and for the very first time the central ideas of modern mathematical logic. The presentation is substantially identical to that in the monograph Hilbert published jointly with Wilhelm Ackermann in 1928 (Hilbert and Ackermann 1928 ), with a sharp eye for the way in which an axiomatic treatment can be used to address problems of consistency, completeness, and the relative strength of various logical systems. First-order logic is clearly demarcated and distinguished both from the propositional calculus and from higher-order systems. The questions asked, and the techniques introduced, have profoundly influenced the subsequent development of the subject. Indeed, these lectures are one of the great landmarks in the history of logic.
1. Intellectual Context. In his Heidelberg address Hilbert had proposed a simultaneous development of logic and arithmetic, and he had given a syntactic consistency proof for a very weak fragment of arithmetic within a broader, but only vaguely conceived programme. His approach was severely criticized by Poincaré (especially in the series of papers Poincaré 1905b, Poincaré 1906a and Poincaré 1906b), and in the intervening years he did not pursue these ideas further. Indeed, the lecture notes for his course on set theory from the Summer Semester of 1917 reveal a strong interest in exploring Russell’s logicist programme. Whether he regarded these explorations as a complement or as an alternative 1 The
original German reads: ‘Auf eine Begründung der Logik hoffe ich im nächsten Semester näher eingehen zu können’. 2 Hilbert’s 1917 lectures on set theory (Hilbert 1917* ) can be found in Volume 2 of this series.
Introduction
33
to his 1904 views is not certain. It should be noted that already in the years around 1900 Hilbert had expressed deep sympathies for Dedekind’s approach to the foundations of arithmetic, and that Dedekind in the preface to Was sind und was sollen die Zahlen? (Dedekind 1888 ) had famously asserted that arithmetic was ‘merely a part of logic’.3 Dedekind did not possess a precise formulation of logic and in particular lacked the apparatus of quantification theory, so a logicist reduction in the sense of Frege or Russell was not available to him. And yet, in the set theory course Hilbert presents the main developments of Dedekind’s essay because — so Hilbert in this course — that essay presents in the clearest possible way the ‘view of arithmetic as a purely logical, analytic science’ (Hilbert 1917* , 139).4 Since Dedekind’s logicist reduction is unsuccessful (assuming, as it does, the existence of a system of everything thinkable), Hilbert gives in the next section Peano’s axioms for the natural numbers5 but remarks forcefully that this is but a first step in the foundational investigation: So the natural numbers indeed possess a special position in mathematics, and if we wish to ground the axioms for them yet more deeply by a reduction to the laws of logic itself, we are facing one of the most difficult problems altogether of mathematics. Poincaré even holds the view that this is not at all possible; but one could rest content with that view only if it had been proved that the further reduction of the axioms for arithmetic is impossible, which is not the case. I hope to be able to explore a foundation for logic more deeply next semester. So if we now take the point of view of Peano, i. e., if we set up the axioms of arithmetic, but forego their further reduction and take over uncritically the usual laws of logic, then we have to realize that we have not overcome the difficulties for a first philosophical-epistemological foundation; rather, we have just cut them off. (Hilbert 1917* , 145–146.)6 3 For example, on p. 2 of the Ausarbeitung of his lectures on Euclidean geometry from 1898/99, Hilbert says:
Es ist von Wichtigkeit, den Ausgangspunkt unserer Untersuchung genau zu fixiren: Als gegeben betrachten wir die Gesetze der reinen Logik und speciell die ganze Arithmetik. (Ueber das Verhältnis zwischen Logik und Arithmetik vgl. Dedekind, Was sind und was sollen die Zahlen?) Unsere Frage wird dann sein: Welche Sätze müssen wir zu dem eben definierten Bereich „adjungieren“, um die Euklidische Geometrie zu erhalten? (Hilbert 1899* , 2.)
Hilbert’s 1898/99 lectures on Euclidean geometry are published in Volume 1 of this series (see Hallett and Majer 2004 ), 221–406; the passage quoted is on p. 303, and an English translation can be found below, p. 5. 4 In the original German, the passage reads: Wir wollen den Gedankengang dieser Arbeit in den Hauptzügen wiedergeben, weil die Auffassung der Arithmetik als einer rein logischen, analytischen Wissenschaft darin ihren prägnantesten Ausdruck findet. 5 Hilbert remarks on p. 145 of the set theory lectures that ‘Peano brought to light the axioms hidden in Dedekind’s essay’. More fully, Hilbert remarks (in the original German) that ‘Peano . . . die bei Dedekind verborgenen Axiome ans Licht ziehen und an die Spitze seiner Begründung der Theorie der ganzen Zahlen stellen konnte’. 6 The original German reads:
Die ganzen Zahlen nehmen also tatsächlich in der Mathematik eine Sonderstellung ein; und wenn wir die Axiome derselben noch weiter begründen wollen durch Zurückführung auf die
34
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
The set theory lectures do not go into details and give no sign of the stage Hilbert’s thoughts had reached. Even before the First World War, Hilbert’s interest in Russell’s work had led to a plan to invite Russell to Göttingen, a plan thwarted only by the outbreak of war. During the war, Hilbert actually wrote to Russell, and mentioned type theory briefly in his lectures on the principles of mathematics in the Winter Semester 1914/15 (see Hilbert 1914/15* ).7 As is explained in greater detail in Volume 2 of this series, between 1914 and 1917 several members of the Hilbert School gave lectures on logic and the foundations of mathematics to the Colloquium of the Göttingen Mathematical Society. In particular, the meetings during the month of July 1917 were entirely given over to foundational questions. On 3 and 10 July, Hilbert’s student Heinrich Behmann lectured on ‘The Russell-Whitehead Theory and the Foundations of Arithmetic’. On 17 and 24 July, Felix Bernstein lectured on ‘The History of Set Theory’, and on 31 July, Hilbert himself reported on his course of lectures on set theory. The Summer Semester ended on 15 August. Hilbert’s remark in his lectures about hoping to be able to explore a foundation for logic more deeply in the coming semester thus falls squarely within this period and may possibly have been prompted by Behmann’s report on the Principia. There are certainly signs that Principia, the chief technical advance since he had last intensively worked on foundations of mathematics, loomed large in Hilbert’s thought during the summer of 1917. On 11 September, Hilbert was in Zürich to deliver his lecture ‘Axiomatisches Denken’. After discussing the axiomatic method and the reduction of mathematics to set theory, he succinctly sets forth the issues that were to be at the heart of the lectures to come, beginning with a statement of the logicist credo: Since the examination of consistency is a task that cannot be avoided, it appears necessary to axiomatize logic itself and to prove that number theory and set theory are only parts of logic. Gesetze der Logik selbst, so stehen wir vor einem p. 146 der schwierigsten Probleme der Mathematik überhaupt. Poincaré vertritt sogar den Standpunkt, dass dies gar nicht möglich ist, aber damit könnte man sich erst zufrieden geben, wenn der Unmöglichkeitsbeweis für die weitere Zurückführung der Axiome der Arithmetik geführt wäre, was nicht der Fall ist. Auf eine Begründung der Logik hoffe ich im nächsten Semester näher eingehen zu können. Wenn wir uns also jetzt auf den Peanoschen Standpunkt stellen, d. h. wenn wir Axiome der Arithmetik aufstellen, aber d. h. auf eine weitere Zurückführung derselben verzichten und die gewöhnlichen Gesetze der Logik ungeprüft übernehmen, so müssen wir uns bewusst sein, dass wir dadurch die Schwierigkeiten einer ersten philosophisch-erkenntnistheoretischen Begründung nicht überwunden, sondern nur kurz abgeschnitten haben. 7 The
correspondence exchanged between Russell and Hilbert at that time can be found in Sieg 1999 . Hilbert had also done some concrete work on propositional logic before the war. That is documented both by lectures, for example, the course ‘Logische Principien des mathematischen Denkens’ of 1905 (reproduced in Volume 2 of this series), and also by remarks of Heinrich Behmann who wrote in 1927: As far as I can recollect, I learned the normal-form procedure . . . from Hilbert, who indeed even before the war was independently occupied with the problem of the symbolic representation of logic, and in particular with propositional logic’. (Behmann to Scholz, 29 December 1927; the German text is quoted in Mancosu 1999a, 322, n. 3.)
Introduction
35
This method was prepared long ago, not least by Frege’s profound investigations; it has been most successfully executed by the acute mathematician and logician Russell. One could regard the completion of this magnificent Russellian enterprise of the axiomatization of logic as the crowning achievement of the work of axiomatization as a whole. But this completion will require further work. When we consider the matter more closely, we soon recognize that the question of the consistency for integers and for sets is not one that stands alone, but that it belongs to a vast domain of difficult epistemological questions which have a specifically mathematical tint: for example (to characterize this domain of questions briefly), the problem of the solvability in principle of every mathematical question, the problem of the subsequent checkability of the results of a mathematical investigation, the question of a criterion of simplicity for mathematical proofs, the question of the relationship between content and formalism in mathematics and logic, and finally the problem of the decidability of a mathematical question in a finite number of operations. (Hilbert 1918a, 412–413.)8
Hilbert’s core insight was the realization that the axiomatic method he had developed in the work on geometry in the late 1890s could be extended to the logic of Principia and that the latter could provide a foundation for all of mathematics. The detailed pursuit of that goal required the presentation of a formal language (for capturing the logical form of informal statements), the use of a formal calculus (for representing the structure of logical arguments), and the formulation of logical principles (for defining mathematical objects that can then be shown to satisfy certain axioms). This project was to be executed in the 1917/18 lectures with focus, elegance, and directness. It seems likely that on this September visit to Zürich Hilbert asked Bernays, who had been a student in Göttingen, to return to assist him in his logical investigations.9 8 The
original German reads:
Da aber die Prüfung der Widerspruchslosigkeit eine unabweisbare Aufgabe ist, so scheint es nötig, die Logik selbst zu axiomatisieren und nachzuweisen, daß Zahlentheorie, sowie Mengenlehre nur Teile der Logik sind. Dieser Weg, seit langem vorbereitet — nicht zum mindesten durch die tiefgehenden Untersuchungen von Frege — ist schließlich am erfolgreichsten durch den scharfsinnigen Mathematiker und Logiker Russell eingeschlagen worden. In der Vollendung dieses großzügigen Russellschen Unternehmens der Axiomatisierung der Logik könnte man die Krönung des Werkes der Axiomatisierung überhaupt erblicken. Diese Vollendung wird indessen noch neuer und vielseitiger Arbeit bedürfen. Bei näherer Überlegung erkennen wir nämlich bald, daß die Frage der Widerspruchslosigkeit bei den ganzen Zahlen und Mengen nicht eine für sich alleinstehende ist, sondern einem großen Bereiche schwierigster erkenntnistheoretischer Fragen von spezifisch mathematischer Färbung angehört: ich nenne, um diesen Bereich von Fragen kurz zu charakterisieren, das Problem der prinzipiellen Lösbarkeit einer jeden mathematischen Frage, das Problem der nachträglichen Kontrollierbarkeit des Resultates einer mathematischen Untersuchung, ferner die Frage nach einem Kriterium für die Einfachheit von mathematischen Beweisen, die Frage nach dem p. 413 Verhältnis zwischen Inhaltlichkeit und Formalismus in Mathematik und Logik und endlich das Problem der Entscheidbarkeit einer mathematischen Frage durch eine endliche Anzahl von Operationen. 9 Constance Reid (Reid 1970 , 150–151) says that in the spring of 1917 Hilbert was in Zürich, and went for a walk on the Zürichberg with Bernays and Pólya; the conversation was about philosophy, and at the end of the walk Hilbert invited Bernays to become his assistant. She does not give a precise date for the walk, and she gives no source. In contrast,
36
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
2. Broad Overview. When reading these lectures, it is important to bear in mind the circumstances under which they were delivered. During the Winter Semester Hilbert carried a heavy teaching load, lecturing on Mondays between 9 and 11 a.m. on ‘The Theory of the Electron’, and then again from 4–6 p.m. with Emmy Noether on ‘Mathematical Principles’. (No record of the contents of the lectures with Noether appears to have survived.) On Wednesdays from 4–6 p.m. he lectured with Peter Debye on ‘The Structure of Matter’. The logic lectures came last, once a week, on Thursdays between 9 and 11 a.m. In addition, Hilbert was also intensively involved at this time in research on the foundations of mathematical physics, and the rigours of wartime had imposed genuine Bernays himself, in his short autobiography (Bernays 1976b, xiv–xv), says the invitation was issued later, ‘in the autumn of 1917’ when Hilbert visited Zürich to deliver the lecture ‘Axiomatisches Denken’. He says the same thing in his 1977 interviews (Bernays 1977* ), and also in a letter to Reid dated 27 November 1968 (Bernays’s Nachlaß, Wissenschaftshistorische Sammlung in the library of the Eidgenössische Technische Hochschule (ETH), Zürich). For some reason, Reid did not follow Bernays’s letter, and records concerning Bernays in the Göttingen University Archives tend to support her account. The Bernays folder contains several post-war documents concerning restitution for his dismissal in 1933. The first of these is a memorandum dated 23 January 1959 from the Kurator of the University of Göttingen stating that ‘Paul Isaak Bernays was employed at the Mathematical Institute of the University of Göttingen from 1.4.1917 to the end of December, 1921, as Hilfsassistent, and then as ausserplanmässiger Assistent until 31 August 1933’. Two further memoranda from the Kurator (dated 7 July and 22 September 1959) give the same dates. A fourth memorandum from the Minister of Culture of Lower Saxony (dated 23 March 1961) states that, ‘Vom 1.4.1917 bis 31.12.1921 war er Hilfsassistent und seit dem 1.1.1922 ausserplanmässiger Assistent. Am 10.3.1922 wurde er zum nicht beamteten apl. Professor ernannt’. But these memoranda (and Reid’s chronology) are almost certainly mistaken. The Bernays folder also contains a nearly contemporaneous brief autobiographical note written by Bernays at the time of his Habilitation in Göttingen, i. e., during the summer of 1918. Bernays wrote that ‘Seit Oktober 1917 bin ich als Assistent am hiesigen mathematisch-physikalischen Seminar bei Herrn Geheimrat Hilbert beschäftigt’. Careful archival research by Ulrich Majer brought out the following facts. During the wartime, Hilbert was entitled to only a single Assistent, who, from 1 October 1916 until the end of March, 1918, was officially the physicist Richard Bär. Bär’s appointment was renewed for one year in June 1917. But Bär’s mother died that summer, and he returned permanently to Zürich on 16 August, relinquishing his post. This opened the position that Hilbert would offer to Bernays a few weeks later. In an assessment of Bernays’s Habilitation thesis found in Bernays’s Habilitation file, Hilbert wrote that ‘During the two last semesters, he [Bernays] has performed exceptionally important services for me [ausserordentlich wichtige Dienste geleistet]’. Hilbert’s assessment is dated 19 July 1918; the ‘last two semesters’ would have been the Summer Semester of 1918 and the Winter Semester of 1917/18. (The various pieces of evidence on which Majer relied to piece together this account are in Bernays’s personnel file in the Göttingen University Archives, in particular in the notebook recording the ‘Assistentenvorgänge’, but also in letters of 16.4.1917 and 20.10.1917 from the Ministerium in Berlin to the Kurator of the University.) From all this evidence we conclude that Reid’s chronology is incorrect, and that Bernays returned to Göttingen, as he said, in September or October 1917. The dates in the memoranda from 1959 either are due to a clerical error or more likely derive from an intentional back-dating of Bernays’s employment into Bär’s term, presumably an effort by an anonymous bureaucrat to award Bernays extra compensation.
Introduction
37
burdens. The speed with which his logical ideas emerge in the lectures is therefore quite remarkable. Hilbert begins the lectures by announcing his intention to talk about the axiomatic method in geometry, arithmetic, and mechanics. The first sixtypages of Bernays’s typescript (Part A, fully one-quarter of the total) are devoted to a recapitulation of Hilbert’s ideas on axiomatics. Most of this material goes back to the mature period of his foundational investigation of geometry (1898–1903) and was quite familiar. There is certainly a thematic appropriateness to his beginning with the axioms of geometry. After all, his new material would in effect demonstrate how the axiomatic techniques from the geometry lectures — and which had been the leitmotiv of his intervening work in physics — could be extended to encompass logic. The emphasis throughout Part A is not on the negative goal of avoiding paradox, but squarely on the programmatic gains for mathematics from axiomatization, and from what in the lecture ‘Axiomatisches Denken’ he had called the ‘deepening of the foundations [Tieferlegung der Fundamente]’. Hilbert stresses that the axiomatic method yields deep insights into the structure of the theory and the inter-relationships between the theorems of geometry, and he spends several lectures illustrating the point, exploring in particular the role played by continuity assumptions in elementary geometry. There is no mention of any ‘crisis in the foundations of mathematics’ as a motivating factor for his axiomatic investigations; the disagreements with Weyl and Brouwer, who are not mentioned either in these lectures or in ‘Axiomatisches Denken’, still lie a few years in the future. At the end of the discussion of geometry, Hilbert announces that he has said enough to explain the fundamental ideas of axiomatics. He will not, as originally planned, treat the principles of mechanics, but will instead direct his attention immediately to the logical foundations of mathematics. What follows in Part B of the notes is an incisive and carefully organized development of the very core of modern mathematical logic. Systemic and meta-systemic issues are clearly distinguished; metamathematical questions about consistency and completeness are crisply formulated. Each step forward is programmatically motivated. At each stage, Hilbert strips away extraneous matters, isolating the essentials before moving on. Part B of the notes is divided into five chapters: (1) The Propositional Calculus; (2) The Predicate Calculus and the Class Calculus; (3) Transition to the Function Calculus; (4) Systematic Presentation of the Function Calculus; (5) The Extended Function Calculus. Here the predicate calculus is just monadic logic. The class calculus is its semantic, Boolean interpretation via sets. The function calculus (which was
38
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
renamed the ‘predicate calculus’ in Hilbert and Bernays 1934 ) is in essence many-sorted first-order logic with variables for sentences as well as for functions (i. e., relations).10 The extended function calculus is the corresponding second-order system, but with quantifiers allowed to range, not just over settheoretical objects, but also over propositions. The derivation of antinomies in this calculus leads to the ramified version, thus the ‘modified extended function calculus’. The Axiom of Reducibility is introduced for treating arithmetic and analysis. Each transition from one section to the next is systematically argued for, usually by pointing out that the existing calculus, in some way or other, is in need of augmentation or ‘completion’. Broadly speaking, the chief accomplishment of these lectures consists in: (1) the presentation of a series of precisely formulated axiomatic calculi; (2) the formulation and investigation of metalogical questions such as decidability, independence, consistency and completeness; and, finally, (3) the development of arithmetic, including analysis, within the strict confines of these systems. Their genuinely distinctive contribution lies in the metalogical investigations. However, even the axiomatic calculi in the tradition of Frege, Peano, Schröder, and Russell are more sharply presented than by Hilbert’s predecessors, and the sharper formulation is essential to the metamathematical advances. The development of analysis, finally, is more straightforwardly mathematical. We consider these three steps respectively in the next three sections.
3. Logical Calculi and Existential Axiomatics. Hilbert had given axioms for propositional logic in his 1905 lectures (see Hilbert 1905a* , 225–228) and in his 1914/15 lectures (see Hilbert 1914/15* , 210).11 Those axioms were algebraically-motivated equations to be manipulated in the style of Boole and Schröder. Indeed, the logical calculus is characterised in the 1917/18 lectures as ‘the application of the formal methods of algebra to the realm of logic’ (p. 63). Exactly the same algebraic system is presented here in the treatment of the propositional calculus (pp. 64–66). As in the earlier lecture notes, the axioms are motivated by analogy to axioms for arithmetical operations and are presented as having content; they are not simply viewed as part of a bare formalism to be manipulated in accordance with syntactic rules. A similar expository device is found in the textbook by 10 Weyl’s contemporaneous Das Kontinuum (Weyl 1918 ) presents first-order logic in a very similar way and builds on the analysis in Weyl 1910 , which first isolated the language of first-order logic. Weyl does not introduce a formal logical calculus, but formulates firstorder logic with propositional variables and sees as a main task of logic the description of syntactic structures that will allow one to establish all the (semantic) logical consequences of given assumptions (pp. 9–10). Weyl also says (p. 4) that existential judgements presuppose a ‘closed system of determinate, independently existing objects’. Hilbert, as we shall see, made similar remarks about universal quantification. These are suggestive similarities; but it is uncertain precisely how or whether Hilbert and Weyl influenced each other. This is discussed in detail in Sieg 1999 , 15, 21–22. 11 All this material can be found in Volume 2 of this series.
Introduction
39
Hilbert and Ackermann (Hilbert and Ackermann 1928 ), where the formalism is introduced only after the reader has become familiar with the workings of the logical notation. Besides these algebraic axioms, two further systems of axioms are given, namely, for propositional connectives and quantifiers. The axiomatization of the propositional fragment of the function calculus (pp. 129–35) displays the influence of Principia, for the axioms are, with slight modifications, identical to the primitive propositions in Part I, Section A, *1 there. This influence is explicitly acknowledged in the Hilbert and Ackermann book (Hilbert and Ackermann 1928 , 23). There it is also pointed out that Bernays had shown in the meantime that the axiom expressing the Russellian ‘principle of permutation’ (∗1·5), namely X ∨ (Y ∨ Z) → Y ∨ (X ∨ Z), is derivable from the other axioms. In contrast to ∗1 of Principia, Hilbert clearly distinguishes the axioms from the rules of inference, and where Principia had employed the primitive proposition ∗1·1: ‘Anything implied by a true elementary proposition is true’, Hilbert provides both an explicit substitution rule (Rule II 1, p. 134) and modus ponens (Rule V, p. 135). This distinction shows a grasp of the purely syntactic character of derivations and is fundamental for the later metamathematical results, because it made possible rigorous proofs by induction on derivations. Of course, that grasp goes back to the Heidelberg talk of 1904, and the analysis is now expanded to quantificational logic. The appropriate axioms and rules of inference he presents here (pp. 133–135) are considerably more perspicuous than the treatment in ∗9 and ∗10 of Principia. Bernays later simplified the quantificational axiomatization, and his improved formulation is given in the Hilbert and Ackermann book (Hilbert and Ackermann 1928 , 53–54).12 Readers who search these lectures for evidence that Hilbert was a dogmatic formalist who viewed mathematics simply as the manipulation of meaningless symbols will be severely disappointed. Such a characterization is already difficult to reconcile with his logicist tendencies and with the metamathematical standpoint itself. Indeed, although it is quite clear that the formal calculi allow logical proofs to be given strictly formally, in complete abstraction from the meanings of the formulas, in the exposition of his logical systems Hilbert does not separate his discussion of the syntax from that of the semantics. The formal calculi are throughout motivated by contentual considerations, and the syntactic conditions are formulated with explicit reference to the underlying semantics. For instance, on pp. 112–113 and 129ff. of the lectures he introduces a many-sorted logic. The argument places of particular functions are related to particular domains, so that if an argument place is filled by the name of an object from an inappropriate domain, then the resulting formula is considered as meaningless [sinnlos]. A similar procedure is followed for quantification on p. 132: if the same quantified variable is used in two distinct argument places related to different domains, the resulting formula is mean12 The
attribution of this simplification to Bernays is given in the book, on p. 54.
40
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
ingless. These conditions can clearly be stated in a purely syntactic way, but the interesting point here is the direct semantic motivation for the restrictive conditions. More generally, in what Hilbert and Bernays call the existential aspect of the axiomatic method, theories are always presented with suitable, nonempty domains [Bereiche] giving the range of the individual variables of the theory. That is, theories are always presented with a ‘universe of discourse’, to use the terminology of the Peirce-Schröder tradition. This practice, influenced also deeply by Dedekind, was constant throughout Hilbert’s career and goes back to his earliest axiomatic theories, e. g., the presentation of the axioms of geometry in the late 1890s, and of those for the arithmetic of real numbers in ‘Über den Zahlbegriff’ of 1900 (Hilbert 1900a). (A particularly clear statement can be found on pp. 45–47 of the ‘Logik-Kalkül’ lectures; see Chapter 2, below, p. 325ff.) There seems to have been a significant philosophical motivation both for Peirce and for Hilbert in this procedure, namely, the avoidance of paradoxes that Hilbert as early as 1905 had seen as engendered by untrammeled quantification. In the ‘Logik-Kalkül’ lectures (pp. 25–26), Hilbert comments again on the importance of specifying domains as ranges for individual variables, adding ‘This remark resolves the difficulties discussed by Russell in the interpretation of universal judgements’. (See below, p. 313.) What is the relationship between the formalism and the associated domain? Derivations are constructed purely formally, but axioms and derived formulas have to be understood semantically: This system of axioms furnishes us with a procedure for executing logical proofs strictly formally, i. e., so that we do not need at all to concern ourselves with the meaning of the judgements represented by the formulas, but need pay attention only to the prescriptions contained in the rules. However, we must assign an interpretation to the signs of our calculus in the symbolic presentation of the premises from which we proceed, as well as in the interpretation of the results obtained through the formal operations. The logical signs are interpreted as before according to the prescribed linguistic reading; and the occurrence of indeterminate statement-signs and function-signs in a formula is to be understood as follows: for arbitrary replacements by determinate statements and functions . . . the claim that results from the formula is correct (pp. 135–136).
This remark is followed by a careful explanation of why the application of the function calculus, given the semantic interpretation (‘inhaltliche Auslegung’ or ‘Deutung’), leads always to correct results. The underlying concept of correctness (‘Richtigkeit’) with respect to a domain is to be understood as follows. (1) If a statement involves no sentential or function variables, then it is ‘correct’ if it is true in the domain, and ‘correctness’ is understood informally in exactly the same way as (in the model-theoretic arguments for independence and relative consistency) in Hilbert’s work on geometry or, for that matter, in Gödel’s dissertation (Gödel 1929 , or Gödel 1930a). (2) If a statement does contain such variables, then it is correct provided that ‘for
Introduction
41
arbitrary replacements by determinate statements and functions . . . the claim that results from the formula is correct’.
4. Metalogical Issues. It was the hallmark of Hilbert’s foundational investigations ever since the early work on the foundations of geometry to emphasize and treat systematically metalogical issues. In his hands the axiomatic method was expanded to a subtle tool for the epistemologically motivated analysis of axiomatic systems; for example, this expansion allowed him to investigate the role of continuity assumptions in the development of elementary geometry. The broad issues were highlighted in his 1917 lecture, ‘Axiomatisches Denken’ (Hilbert 1918a). 4.1 Decidability. Immediately after the long passage from ‘Axiomatisches Denken’ quoted on p. 34 above, Hilbert remarks: ‘Of the questions mentioned, the last, namely the one concerning decidability in a finite number of operations, is the bestknown and the most discussed, for it goes to the essence of mathematical thought’ (Hilbert 1918a, 413).13 Similarly, in the Hilbert and Ackermann book, after the Entscheidungsproblem had become a focus of research through the work of Ackermann, Bernays, Schönfinkel and Behmann14 , Hilbert declares (in italics): The solution of the Entscheidungsproblem is of fundamental importance for the theory of any domain whose propositions admit at all of a logical development from finitely many axioms. (Hilbert and Ackermann 1928 , 73–74, below, p. 874.)
Hilbert’s interest in decidability went back at where he discussed the ‘axiom’ of the solvability bert 1900b, 261–262.) In his 1905 lectures, after the normal form theorem, of the decidability of logic, he says:
least to his Paris address, of every problem. (See Hilsketching a proof, based on his system of propositional
. . . we have thereby solved, in the given, most primitive case, the old problem, that every correct result must be attainable through a finite proof. This problem was in fact the starting point for all my investigations in this area, and the solution of this problem in the most general case, the proof that there can be no ignorabimus in mathematics, must also remain the final goal. (Hilbert 1905a* , 249.)15 13 In
the original German, the passage reads:
Unter den genannten Fragen ist die letzte, nämlich die Frage nach der Entscheidbarkeit durch eine endliche Anzahl von Operationen die bekannteste und die am häufigsten diskutierte, weil sie das Wesen des mathematischen Denkens tief berührt. 14 Behmann, in an unpublished lecture of 1921 (Behmann 1921* ), appears to have been the first member of the Hilbert circle to use the term ‘Entscheidungsproblem’; see Mancosu 1999a, 320. 15 The original German reads:
42
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
In view of these strongly worded remarks, it is curious that Hilbert does not mention the decision problem in the 1917/18 lectures. He states and proves the normal form theorem for the propositional calculus and thus had in hand the tools for a decidability proof in what he had called earlier ‘the most primitive case’. Moreover, Bernays gives such a proof for the propositional calculus in his Habilitationsschrift, following the lines of Hilbert’s argument in the 1905 lectures. (See Bernays 1918* , 15–16, below p. 240.) 4.2. Independence and Consistency. At the heart of Hilbert’s investigations of the axioms of geometry lay the question of the independence of various axioms, and in particular of the Axiom of Parallels and the Archimedean axiom. His research yielded a rich harvest of non-Euclidean and non-Archimedean geometries, and enabled him to determine the exact deductive strength of theorems like Desargues’s. Independence results were central to his axiomatic investigations of other areas of mathematics, and already in his 1905 lectures he had stated: It should now be investigated how far the axioms are dependent and independent of each other. . . . What we give here is merely a hint which has not at all been fully carried out . . . and this entire section furnishes materials for the ultimate solution of these interesting questions rather than the ultimate solution itself. (Hilbert 1905a* , 230–231.)16
He then proceeded to prove (p. 233), using an arithmetical model, that his axioms XI and XII were independent of axioms I–X. In the 1917/18 lectures, pp. 68–69, he gives a similar non-derivability proof. But he does not investigate systematically the dependence and independence relations among the propositional axioms, a matter that is fully treated in Bernays’s Habilitationsschrift (Bernays 1918* ), using and extending the model theoretic techniques Hilbert had employed in his lectures in 1905 (Hilbert 1905a* ). Independence of axioms is desirable, but their consistency is absolutely crucial for the axiomatic method, since it is the sine qua non of the legitimacy of any given axiomatic system. Thus, proofs of consistency figured prominently both in Hilbert’s geometrical and arithmetical investigations. The issue for arithmetic is formulated famously as the Second Problem in . . . und wir haben damit in dem vorliegenden primitivsten Falle das alte Problem gelöst, daß jedes richtige Resultat sich durch einen endlichen Beweis erzielen lassen muß. Dies Problem war eigentlich der Ausgangspunkt aller meiner Untersuchungen auf unserm Gebiete und die Erledigung dieses Problemes im allerallgemeinsten Falle, der Beweis, daß es in der Mathematik kein „Ignorabimus“ geben kann, muß auch das letzte Ziel bleiben. 16 The
full original German reads:
Es müßte nun untersucht werden, wie weit die Axiome von einander abhängig und unabhängig sind; dabei ist aber darauf zu achten, daß die Verbindung zwischen den Sätzen wiederum von den Axiomen selbst abhängt, denn diese legen ja erst die logischen Beziehungen fest; ein sehr einfaches Beispiel wird dann gegeben werden. Das Wichtigste aber wäre hier der p. 231 Nachweis, daß die 12 Axiome sich nicht widersprechen, d. h. daß man aus ihnen durch die festgelegten Proceße keine Aussage herleiten kann, die den Axiomen widerspricht, X + X ≡ 0 etwa. Das sind alles hier nur Andeutungen, die noch keineswegs vollkommen durchgeführt sind, und man hat in Einzelheiten noch sehr viel freie Hand; überhaupt liefert dieser ganze Abschnitt vorläufig eigentlich mehr Materialien zu einer endgültigen Lösung der interessierenden Fragen, als eine endgültige Lösung von ihnen.
Introduction
43
Hilbert’s Paris lecture of 1900. It was therefore entirely natural to consider the consistency issue for logical calculi. Indeed, Hilbert stated the problem of proving the consistency of propositional logic in his 1905 lectures (Hilbert 1905a* , 230) and in the 1917/18 lectures (p. 70) he actually proves the consistency of his algebraic version of propositional logic. He does so by furnishing a two-element model: all atomic propositions are interpreted as 0 or 1, ‘or’ is interpreted as the minimum of two numbers, ‘and’ as the maximum, and ‘not’ via the function 1 − X. He observes that all twelve axioms are satisfied in this model and the system is therefore consistent. It should be noted that Axiom I contains the usual axiom for identity, although it is sometimes formulated as a substitution rule. Hilbert also proves the consistency of the function calculus (pp. 150–6). He divides the proof into two parts and considers first the propositional subsystem of the function calculus. As in the algebraic and equational system he has to deal with a stock of formulas generated by axioms and rules of inference. In order to establish the conclusion that the stock of formulas thus generated cannot contain a formula and its negation, he argues by induction on derivations. Hilbert uses the earlier two-valued model and shows that the five propositional axioms all have the value 0 and that the two rules of inference preserve this property. He then extends this interpretation to the quantificational part of the function calculus and shows that all derivable formulas have value 0 (pp. 154–155). Since their negations have value 1, it follows that not every formula is derivable and that the system is consequently consistent.17 But in a footnote immediately after this proof Hilbert observes: One should not overestimate the significance of this result. We do not yet have any guarantee that with the symbolic introduction of contentually unobjectionable presuppositions the system of provable formulas remains free of contradiction. (Loc. cit., p. 156.)
So consistency proofs for expanded axiom systems, in particular for those requiring infinite models, still have to be given. The search for proofs that use only elementary means will lead to the development of quite different, non-model-theoretic forms of consistency proofs. 4.3. Completeness. With only one important exception, the material shared between the Hilbert and Ackermann book of 1928 and the 1917/18 lectures is arranged in the same order. The exception is the treatment of the consistency and completeness of the propositional calculus. In the lectures, this material appears on pp. 140–153, as part of the metamathematical investigation of first-order logic; in the later textbook presentation it has been moved forward to the end of the first chapter, thus appearing at the end of the treatment of the propositional calculus, where it naturally belongs. Hilbert’s treatment of completeness in 17 This consistency proof for the sentential calculus by means of a two-valued model is discussed in Hilbert 1921/22a* , 5–13, as the prime example of a consistency proof by ‘Aufweisung’ or exhibition. See Chapter 3 of this Volume.
44
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
the lectures is roundabout, and it is natural to conjecture that he was still working his way to an appropriate formulation. Indeed, the lecture notes appear to employ the word ‘Vollständigkeit’ in the four distinct senses enumerated in what follows.18 After presenting the twelve algebraic axioms for propositional logic, Hilbert refers to the problems of consistency, independence, and completeness, and says that ‘Here the most important question is that of completeness’ (p. 67). He gives no formal criterion for completeness, but continues: For the goal of symbolic logic consists in developing ordinary logic from the formalized presuppositions. So it is essentially a matter of showing that our axiom system suffices for the construction of ordinary logic. (Loc. cit.)
Having given a proof of the consistency of the algebraic propositional axioms, he says: Now let us return to our earlier train of thought. It is a matter of examining how far it is possible to achieve a systematization of ordinary logic from our calculus. (Loc. cit., p. 70.)
On pp. 76–80, he derives certain basic formulas, showing informally that ‘all simple hypothetical inferences can be derived from the axioms of our calculus’. On p. 80 he asks again ‘whether this calculus suffices for the aims of logic’, and observes that the propositional calculus is inadequate to capture the traditional syllogistic inferences. This observation leads him to develop what he calls here the predicate calculus (i. e., monadic logic). A detailed discussion of Aristotelian syllogistics follows with the final conclusion (p. 106) that ‘the formalism of the predicate calculus encompasses traditional logic’. But he argues on pp. 110–111 that the ‘predicate calculus’ is inadequate for the logical analysis of relations; so it is necessary to expand the calculus to the function calculus. Although the function calculus is adequate for the formalization of logical inferences, it does not suffice for the investigation of the foundations of mathematical theories themselves, and we are driven to a system of higherorder logic, the ‘extended function calculus’ (pp. 188–189). In these passages, Hilbert appears to speak of completeness in an informal, quasi-empirical sense, meaning either (1) ‘capturing all traditional logical inferences’ or (2) ‘being adequate for the analysis of a particular subject matter’.19 It is not until p. 152 that Hilbert states a formal criterion of completeness and gives a completeness proof for the propositional fragment of the function calculus. The discussion of propositional logic lay several weeks in the past; he had already in the earlier discussion, indeed in the 1905 lectures, proved the normal form theorem, which was the key to his completeness proof. In the earlier discussion there is no hint of the new, formal sense of completeness. The proof on pp. 152–153 establishes what today is called (3) 18 A general discussion of the history of the notion of completeness is given in Awodey and Reck 2002 . 19 Cf. Michael Hallett’s discussion of what it meant for Hilbert to give a ‘simple and complete’ axiom system for Euclidean geometry, in § 5 of the Introduction to Chapter 5, Volume 1 of this series (Hallett and Majer 2004 ), pp. 433-434.
Introduction
45
the Post-completeness (or syntactic completeness) of propositional logic: the axiom system is said to be complete in this sense if the addition of a previously unprovable formula to the axioms always results in an inconsistent system. (The similarity of this criterion to Hilbert’s Axiom of Completeness in geometry, the Vollständigkeitsaxiom, should be evident: both demand intuitively that it is impossible to add any further ‘elements’ to the system.) Hilbert’s proof first establishes a Lemma: a formula [Ausdruck ] is a provable propositional formula [logische Aussagen-Formel] if and only if it is the sum of simple products, each of which contains a sentence-letter and its negation. Hilbert then easily shows the syntactic completeness of the axioms. In the course of establishing the Lemma, he also proves a semantic result, namely that every provable propositional formula is identically 0, thus establishing the system’s soundness (and consistency). The converse of soundness is proved in a footnote on p. 153. This establishes, from our perspective, (4) the semantic completeness of the system. Hilbert does not explicitly define the semantic notion of completeness. It is only a few months later that Bernays provides this notion and a direct formulation of the semantic completeness theorem in his Habilitationsschrift (§§ 2–3). Hilbert appears to treat the result formulated in the footnote as not especially significant. On p. 156 he outlines an argument that the function calculus is not Post-complete, but notes that a rigorous proof remains to be found. (Such a proof, along the lines sketched here by Hilbert, was provided by Ackermann in Hilbert and Ackermann 1928 , 66–68). Hilbert, in the 1917/18 lectures, does not even state the problem of the semantic completeness for the function calculus. However, semantic completeness of first-order logic is formulated as an open problem in the Hilbert and Ackermann book: Whether the axiom system is complete at least in the sense that really all logical formulas that are correct for all domains of individuals can be derived from it is an unsolved question. We can only say purely empirically that this axiom system has always sufficed for any application. (Hilbert and Ackermann 1928 , 68, below, p. 869.)
Some commentators have viewed this formulation as an ‘odd obscurity’ (Goldfarb 1979 , 360) or even alluded to it as ‘circular’ (Dreben and van Heijenoort 1986 , 48). As pointed out in Sieg 1999 (p. 21), those views rest on a particular reading of ‘logical formulas’ that is narrowly correct, since Hilbert and Ackermann follow the 1917/18 lecture notes verbatim and define such formulas on p. 54 of the book as those formulas that (i ) do not contain ‘individuelle Zeichen’ (i. e., symbols for determinate individuals or functions), and (ii ) can be proved by appealing only to the logical axioms. Under this reading the formulation is indeed close to non-sensical. However, if one takes into account that ‘logische Formel’ and ‘logischer Ausdruck’ are used repeatedly as indicating just those formulas satisfying (i ), then this formulation — together with the explication of correctness we reviewed at the end of section 3 of this Introduction — is exactly right. Indeed, the formulation of the completeness problem involves then precisely the definition of ‘allgemeingültig’ given in Gödel’s 1930 paper proving completeness; see Gödel 1930a, nn. 3, 4.
46
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Gödel also emphasizes in the first of these footnotes: ‘This paper’s terminology and symbolism follows closely Hilbert and Ackermann 1928 ’. An equally correct formulation of completeness is given in Hilbert’s talk to the International Congress of Mathematicians in Bologna in 1928 (Hilbert 1929 , reprinted as Appendix C to this Volume); validity is defined as non-refutability by an arithmetic model. It is also of interest to note that in one of the alterations to a 1930 ‘reprinting’ of this paper, Hilbert contemplates the incompleteness of axiomatic systems for ‘higher domains [höhere Gebiete]’ of mathematics.20 Both these observations seem to appeal implicitly to the Löwenheim-Skolem theorem. Let us return to the 1917/18 lectures and see how higher areas of mathematics are developed there.
5. Higher-Order Logic and the Development of Arithmetic. If only a formalization of logical reasoning were aimed for, no additional work beyond the presentation of first-order logic in Chapters 1–4 would be needed. But the logical calculus is to play an important role in the investigation of mathematical theories and their relation to logic. This observation leads Hilbert to the development of higher-order logic: The basic discussion of the logical calculus could cease here if we had no other end in view for this calculus than the formalization of logical inference. But we cannot be satisfied with this application of symbolic logic. Not only do we want to be able to develop individual theories from their principles in a purely formal way, but we also want to investigate the foundations of the mathematical theories themselves and examine how they are related to logic and how far they can be built up from purely logical operations and concept formations; and for this purpose the logical calculus is to serve us as a tool. (1917/18 lectures, p. 188.)
If one wants to use the calculus for that logicist purpose, one is led to extend the rules for operating formally within the calculus in ‘a certain direction’: While up to now we have sharply distinguished the statements and functions from the objects, and accordingly have also rigorously kept separate the indeterminate statement- and function-signs from the variables which can be taken as arguments, we shall henceforth allow statements and functions to be taken as values of logical variables in the same way as proper objects, and indeterminate statement signs and function signs to appear as arguments of symbolic expressions. (Ibid.)
Hilbert next explores (on pp. 189–208) the utility of higher-order logic, pointing out that the widening of the function calculus enables one to formalize the axiom of complete induction and to give the usual second-order definition of identity. More importantly, it permits also a Frege-style defi20 See
Hilbert 1930c, 6. The paragraph containing this short remark replaces a short paragraph on p. 139 of the original Bologna paper. In the second reprinting from 1930 (i. e., Hilbert 1930e) as Appendix X to the Seventh Edition of the Grundlagen der Geometrie (Hilbert 1930a), both paragraphs are omitted. See Appendix C for details.
Introduction
47
nition of the natural numbers as properties of predicates. Remarking that it is more natural for a mathematician to think of numbers as properties of sets than as properties of predicates, he enters into a careful examination of the relationship between sets and co-extensional predicates, and between sets of sets and predicates of predicates, showing that the basic concepts of set theory can be translated into the language of the extended function calculus. He introduces (p. 201) additional rules of inference for this extended calculus and illustrates their use. Of course, this unrestrained Fregean approach is not without its risks, and the rest of the lectures (from p. 209 onwards) are a dialectical working out of the technical consequences of the paradoxes. Hilbert first gives a careful exposition of three paradoxes (Russell’s, the Liar, and Richard’s), showing how each can be derived in his formal system. ‘The error’, he concludes on pp. 218–219, ‘can only come from the fact that we did not proceed carefully enough in extending the axiom system for the function calculus; for that original axiom system was provably consistent’. In particular, the transition to higher-order systems involves a logical circle: In the original method of the function calculus we assumed a system or several systems (species) of objects as given in advance, and the operation with the variables (and in particular with the quantifier-signs [Klammerzeichen]) received its logical meaning through the relationship to such totalities of objects. Now, the extension of the calculus consisted in the fact that we regarded the statements, predicates and relations as kinds of objects, and accordingly admitted symbolic expressions whose logical meaning required a reference to the totality of statements or of functions. But this way of proceeding is indeed suspicious, in that those expressions which only receive their content by reference to the totality of statements or of functions are themselves counted among the statements and functions; on the other hand, in order to be able to appeal to the totality of statements or functions, we must regard the statements and functions as being determined in advance. There is thus a sort of logical circle here, and we have grounds to suspect that this circle is the cause of the emergence of the paradoxes. (Loc. cit., 219–220.)
Reflection on this logical circle leads ‘in the most natural way’ to a theory of ‘levels [Stufen]’. Hilbert informally sketches what is in effect a variant of ramified type theory, showing how the distinction of levels allows the paradoxes to be avoided. But now a new worry arises: Could it be that the prohibitions on mingling levels have overly narrowed the range of admissible inferences? Consideration of the definition of identity and of Cantor’s proof of the existence of non-denumerable sets (p. 229) shows that this is indeed the case. To rescue those proofs, Hilbert adopts Russell’s Axiom of Reducibility, and then uses the broader framework to establish the beginnings of Dedekind’s theory of real numbers (and proves, in particular, the least upper bound principle). The notes end with the remark: Thus it is clear that the introduction of the Axiom of Reducibility is the appropriate means to turn the calculus of levels into a system out of which the foundations for higher mathematics can be developed. (Loc. cit., p. 246.)
48
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
This last remark, when taken in conjunction with the remarks quoted above on Russell and Frege in ‘Axiomatisches Denken’ (Hilbert 1918a, 412– 413), may sound like an unqualified endorsement of logicism. Hilbert was certainly at this time intensely interested in Russell’s project, but the remarks quoted from p. 188 make it quite clear that he wants to examine the relation between mathematical theories and logic. Though he explicitly took his distance from the Axiom of Reducibility only in the lectures of 1920, the main consideration for the distancing is already formulated here: The methodological significance of introducing this postulate consists above all in the fact that, in contrast to the previously acknowledged requirement, whereby every function must either be introduced as a basic function by an individual symbol or be representable as a derived function by a symbolic expression, we now regard certain predicates and relations as things existing in themselves, so that their multiplicity depends neither on the definitions actually given, nor in any way on our ability to give a definition. Such a procedure appears at first very strange, but it is unavoidable so long as our goal is to develop the foundations of set theory and analysis from the system of functions of our calculus. (Loc. cit., p. 232.)
Thus, Hilbert’s concluding remark needs to be read with caution: it does not establish that circa 1918 he was in any straightforward sense a logicist. Indeed, the Second Problem from the list of problems given in 1900 is not addressed for the calculus with the Axiom of Reducibility in these lectures and hence remains open.21 The task of attacking that issue, requiring the development of a very different set of tools, was to begin to occupy Hilbert in earnest only in 1920.
6. Some Historical Issues. The novelty of Hilbert’s ideas, and the rapidity with which they appear to have developed, raise delicate questions both about the timing of the principal discoveries and about intellectual influences. On the one hand the intellectual influences point to the past (e. g., to Schröder’s logical work and the impact of Whitehead and Russell’s Principia), and, on the other hand, to the future (e. g., the connection to the monograph published by Hilbert and Ackermann in 1928). It seems also that Frege influenced these (meta-)mathematical developments in Göttingen only via Whitehead and Russell. A great deal remains obscure about the precise intellectual influences on the Hilbert school from these other logical traditions, despite the fact that real progress has been made since the early 1990s. Finally, a third issue concerns the lectures themselves, in the sense of relative contributions to them by Hilbert and Bernays respectively. We address these matters in the following subsections. 21 Except as a matter of quasi-empirical observation: on p. 233, it is remarked that the Axiom of Reducibility does not re-introduce the contradictions which have been avoided by the theory of types. It should be noted that Hilbert’s concluding remark reappears almost verbatim in the Hilbert and Ackermann book (Hilbert and Ackermann 1928 , 118), long after he had distanced himself from logicism.
Introduction
49
6.1. Russellian Connections. As mentioned already, Hilbert’s circle had started to read writings by Russell in 1913. Sieg 1999 analyzes the relevant documents; cf. also n. 7 above. The importance of Behmann as a conduit to Göttingen of Russell’s ideas is emphasized in Mancosu 1999a and Mancosu 2002 . Behmann’s interest in the Principia, presumably instigated by Hilbert, goes back at least as far as 1 December 1914, when he delivered his first talk on it to the Göttingen Colloquium. After being seriously wounded in the war, Behmann returned to Göttingen in 1916, where Hilbert supervised his doctoral dissertation entitled ‘The Transfinite-Number Antinomy and its Resolution in the Theory of Russell and Whitehead’ (Behmann 1918* ). Hilbert wrote an assessment of this dissertation on 1 February 1918 (translated in Mancosu 1999a, 317–318). Since the Winter Semester ended the following day, it is certain that Hilbert was closely occupied with Behmann’s thesis during the final stages of the 1917/18 lectures, specifically concerned as they are with the paradoxes and with type theory. So, in early 1918, Hilbert was supervising two theses that dealt with Whitehead and Russell’s Principia: Behmann’s doctoral dissertation, and also Bernays’s Habilitationsschrift, which was submitted on 9 July 1918. Behmann’s dissertation was not concerned with the logic of Principia, but with its mathematical and set-theoretical portions, in particular, with the paradoxes, the theory of types, and the Axiom of Reducibility. Thus Behmann’s work overlaps both with the set theory lectures and the concluding sections of the 1917/18 lectures. Bernays’s thesis, in contrast, is concerned with an axiomatic analysis of the propositional logic of Principia; set theory and type theory are not dealt with at all. In a letter to Russell from 8 April 1920, Bernays wrote that Hilbert’s 1917/18 lectures had awakened his interest in the Principia, and in interviews given shortly before his death he emphasized both his lack of experience in 1917 with technical logic, and that he had not yet seriously studied Principia. (The relevant passage is quoted in n. 24, below.) 6.2. Relationship to the Textbook Hilbert and Ackermann 1928. It has often been assumed that Hilbert and Ackermann 1928 represents a culmination of the collective research into logic by the members of the Hilbert School. But in fact virtually the whole book beginning with § 10 of Chapter One is taken, often verbatim, from Part B of Bernays’s 1917/18 typescript. §§ 1–9 of Chapter One are taken similarly from Bernays’s typescript of the lectures from the Winter Semester 1920, reproduced in Chapter 2 of this Volume. The most important divergences between the two texts are the following; the list is based on the chapter and section structure of the Hilbert and Ackermann text. (1) Chapter One, §§12–13: The discussion of the completeness and consistency of the propositional calculus has been repositioned, sharpened, and expanded, showing the influence of Bernays 1926 (which is cited, and is a partial digest of Bernays’s Habilitationsschrift) and distinguishing two formal conceptions of completeness (now known as semantic and Post completeness).
50
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Curiously, the formulation of semantic completeness is less perspicuous than in Bernays’s uncited Habilitationsschrift (Bernays 1918* , reproduced below in the Appendix to this Chapter). (2) Chapter Two, §2: The blending of the propositional calculus with the predicate calculus has been shortened and simplified. (3) Chapter Three, §5: The axiom system for the function calculus, and in particular the axioms and inference rules for the quantifiers, have been streamlined; credit for this improvement is given to Bernays. (4) Chapter Three, §9: The lecture notes announce and sketch on p. 156 a proof that the function calculus is not Post-complete, but remark parenthetically that ‘to be sure, a strict formal proof that this formula cannot be derived from the axioms remains to be found’. Ackermann supplies the missing details (and takes credit in a footnote). The problem of the semantic completeness of the function calculus is in addition explicitly stated as an open problem; cf. section 4.3. Gödel addressed and solved the problem in his dissertation, Gödel 1929 . (See also Gödel 1930a.) (5) Chapter Three, §§11–12: Two new sections, on the Entscheidungsproblem and on special cases of the Löwenheim-Skolem results, report on work done after the lecture notes and published elsewhere by Ackermann, Behmann, Bernays, Löwenheim, Schönfinkel, and Skolem. (6) Chapter Four, §§5, 8, and especially 9: The discussion of the theory of types and the Axiom of Reducibility has become sharper and more focused. It should be noted that this very critical attitude was hinted at in the 1917/18 lectures, but explicitly formulated in the clearest way in the 1920 lectures. It should be observed that Ackermann’s only new mathematical contribution to Hilbert and Ackermann is in supplying the details for the proof of the Post-incompleteness of the function calculus; otherwise his role seems to have been more that of textual editor than of co-author. Hilbert’s Preface to the book (dated 16 January 1928) should thus be read with great care: The present book treats theoretical logic (also called mathematical logic, logic-calculus, or algebra of logic) in a form in which I developed and applied it in my university lectures on foundational questions in mathematics (Prinzipien der Mathematik, Winter Semester 1917/18; Logikkalkül, Winter Semester 1920; Grundlagen der Mathematik, Winter Semester 1921/22). In the preparation of these lectures, I was supported and advised in the most essential way by my colleague P. Bernays, who also wrote up the lecture notes in the most careful manner. — Using and supplementing the material that arose in this way, W. Ackermann, a student of mine who, in the meantime, has distinguished himself by independent, important work in the area of foundations of mathematics, provided the present organization and the definitive presentation of the entire material. The book is also to serve both as a preparation and as an aid to understanding for a further book that P. Bernays and I will soon publish, and that treats the foundations of mathematics in accordance with the method that I have presented (likewise with the most active collaboration of P. Bernays)
Introduction
51
in a series of articles [Hilbert 1922b, Hilbert 1923a, Hilbert 1926 ]. (Hilbert and Ackermann 1928 , Vorwort.)22
Hilbert appears here to be distinguishing between the role of Ackermann in polishing the Bernays typescripts and Bernays’s role, first in supporting and advising on the original lectures, and then in actively collaborating on the later material. In his second Hamburg Lecture of 1927, Hilbert calls Bernays his ‘faithful collaborator’ and continues by saying: . . . once again, Bernays has not only offered me continual support through his counsel, but has also contributed his own thoughts and new points of view, so much so, that I would like to designate this work as a common one. It is our intention to publish soon a detailed presentation of the theory. (Hilbert 1928a, 85.)23
This is clearly a reference to work that would become the monumental ‘Hilbert and Bernays’, the two volume treatise Die Grundlagen der Mathematik (Hilbert and Bernays 1934 and 1939 ). 6.3. Collaboration with Bernays24 . These latter remarks raise a question about the nature of Hilbert’s close collaboration with Bernays. That Bernays worked closely with Hilbert in the 1920s is well-known, not least from Hilbert’s own repeated acknowledgements. But the unpublished record suggests a working relationship which began much earlier than has commonly been recognized. And, as we have seen, it is entirely plausible that Bernays had more to do with developing the mathematical content of the Hilbert and Ackermann book than did Ackermann. Bernays had been educated in philosophy and in mathematics at Berlin and Göttingen. He received his doctorate and Habilitation, both in 1912, for work in analytic number theory and in complex analysis. An appointment as Privatdozent at the University of Zürich followed. There he was a colleague of Zermelo and got to know Pólya and Weyl. This time in Zürich appears not to have been entirely happy. He published little and considered seriously giving up his academic career. He was rescued from this ‘somewhat imperfect situation’ by Hilbert, who had apparently learned from Leonard Nelson of his philosophical interests. Most probably in the autumn of 1917, Hilbert invited him to return to Göttingen as his assistant; cf. the end of section 1 above. 22 The
original German of the Preface can be found on p. 809 below. second Hamburg Lecture of 1927, published as Hilbert 1928a, is reproduced below in Appendix B. The passage cited can be found on p. 941. 24 Bernays published a brief biographical reminiscence, Bernays 1976b; moreover, in the the Bernays Nachlaß kept in the Wissenschaftshistorische Sammlung of the library of the ETH in Zürich there are three hour-long tape recordings of interviews with Bernays recorded in July and August 1977 (Bernays 1977* ). Bernays was nearly ninety, in ill-health, and died three weeks after the final interview. His remarks occasionally ramble and contain several minor factual errors as he recalled events that lay some sixty years in the past. But the interviews are otherwise fully consistent with contemporary records, and on the major points they are likely to provide an accurate record of his years with Hilbert. These are the principal sources for the account that follows. 23 Hilbert’s
52
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Bernays’s mathematical research prior to 1917 had been unrelated to logic, and he repeatedly points out how little technical experience he had with logic at the time, noting that he did not even fully understand how free variables functioned, or have a firm grasp of the axioms of the propositional calculus. He also stressed his ignorance of the logical literature.25 Bernays’s task as Hilbert’s assistant was not to help students with their exercises, but rather to have private meetings with Hilbert, where among other things they would discuss the substance of the lectures to come, and to write out the formal protocol, as well as to discuss Hilbert’s approach to foundational questions generally.26 Thus, there is every reason to assume that Hilbert even in 1917 used Bernays as an active sounding board. Bernays’s early importance has in part been overlooked because he published little during the first years of his association with Hilbert, and in his 1935 article on Hilbert’s work he does not even mention these early lectures. (See Bernays 1935 .) But already by 9 July 1918 he had submitted his remarkably incisive (second) Habilitationsschrift, which displays a rapid and creative absorption of Hilbert’s new metamathematical ideas. (For this, see the Appendix to this Chapter.) Hence, as early as the spring of 1918 Bernays was demonstrably engaged in important logical research of his own. Furthermore, in 1921 he wrote two important papers on Hilbert’s axiomatic method (Bernays 1922b) 25 In
the third of the interviews mentioned in n. 24, Bernays says the following:
Und meine eigene Kenntnisse damals waren doch sehr unvollständig, z. B. 1917. Hilbert hat über mathematische Logik gelesen, eine Vorlesung, und die hab’ ich auch ausgearbeitet, und zwar in solcher Weise, daß ich die freien Variablen vermieden habe. Russell hat sich so einiges angeguckt, aber, erstens war mir das überhaupt zu breit, diese Art der Behandlung, und sagte mir nicht in jeder Hinsicht zu. Aber insbesondere hab’ ich das nicht recht verstanden, was das heißt: Für ungefähr alle x, f x, dann folgt f y, nicht wahr — oder so — tatsächlich ist ja auch die Anwendung der freien Variablen etwas technisches, es sind eigentlich zwei Arten der Darstellung der Allgemeinheit — man hat die Allgemeinheit — einerseits die gebundene Variable, andererseits die freie Variable. Solchen Unterschied gibt es nicht in der gewöhnlichen Sprache, nicht wahr. Nun hab’ ich also da zunächst die freien Variablen vermieden, das ist ein mögliches Verfahren, wie es auch später wieder von andern manchmal gemacht worden ist. Das ist also eine Vorlesung, die ist ausgearbeitet worden und hat doch nachher da im Hilbert’schen — da im Lesezimmer vom Institut gestanden. . . . Als ich anfing hatte ich noch nicht einmal alle Regeln des Aussagenkalküls gegenwärtig, sodass mich Hilbert einmal auf eine solche aufmerksam machte. Das kam alles erst so nach und nach — das kann man noch sehen aus der Darstellung in Hilberts erstem Hamburger Vortrag. Die Theorien von Frege — die Arbeiten mit den Grundgesetzen, die hatte ich auch nicht so richtig gelesen. Aber es gibt doch eine philosophische Arbeit von Frege über die Zahlen, wo er ziemlich viel Polemik entwickelt. Die hatte ich gelesen, aber von der Philosophie her war ich mit Freges Ansichten eigentlich gar nicht einverstanden. Ja — mit Hilbert hab’ ich von vornherein nur sehr viel diskutiert — (lacht), wir waren oft nicht derselben Meinung. Aber in formaler Hinsicht bin ich nachher ziemlich weitgehend auf Frege zurückgegangen. Das ist ja auch in gewisser Hinsicht natürlicher, wenn man sozusagen das Gebiet der reinen Folgerungslogik absondern will, dann kann man das ja nicht so machen wie das Russell macht, daß er von vornherein die Implikation definiert durch Negation und Oder. – Es ist ja auch so, daß diese Grundsätze, die bei Russell stehen, die haben ja eigentlich eher einen natürlicheren Sinn, wenn man die Implikation als Grundbeziehung nimmt: So einen Satz wie, Wenn p oder q, so ist auch q oder p — oder so etwas. Wenn man das nun so schreibt wie: Nicht (p oder q) oder (q oder p), dann ist das sehr wenig übersichtlich, nicht wahr. (Bernays 1977* , transcript of third interview, pp. 2–3.) 26 See Bernays 1976b, xv, and Bernays 1977* , transcript of the first interview from 25 July 1977, p. 10. See in addition the passage from the third interview quoted in n. 25, where Bernays remarks that ‘from the outset I discussed matters with Hilbert a great deal — we were frequently not of the same opinion’.
Introduction
53
and on Hilbert’s programme, then in statu nascendi (Bernays 1922a). The proper formulation of the latter would take place only in the coming Winter Semester. And we note that, while Hilbert in his Hamburg lecture of summer 1921 emphasized that Poincaré’s objections had been met by not using induction in the metatheoretic considerations, Bernays clearly saw the need to use induction of a restricted character. One question which has been raised is whether Bernays was somewhat more than a sounding board, assistant and Mitarbeiter, so much so that he was in fact largely responsible for the technical advances which emerged in the period 1917–1918.27 The main substantive basis for this claim is a shorthand notebook in the Bernays Nachlaß at the ETH. The notebook appears to be Bernays’s notes of the actual 1917/18 lectures as delivered by Hilbert, and contains much less material than does the official protocol.28 In particular, the material on completeness, consistency, the extended function calculus, set theory, the paradoxes, and type theory is either not mentioned at all in the notebook, or only cursorily sketched. This seems to suggest that much if not all of the lecture protocol was typed up after the lectures had finished, and that the new material, including the important results on metamathematics (which are the distinctive contribution of the 1917/18 lectures) was furnished during this process, Bernays being responsible for it.29 This suggestion seems to us implausible for the following reasons. (1) Hilbert in the lectures on set theory in the Summer Semester of 1917 had announced his plans to lecture on a deeper foundation for logic, had already clearly formulated his metalogical questions in ‘Axiomatisches Denken’ (Hilbert 1918a). Given this formulation, the technical details of the propositional completeness and consistency proofs in the typed protocol are not difficult, especially for a mathematician of Hilbert’s powers, and especially given how much he had already done in his 1905 lectures; and of course the entire metamathematical approach flows out of his earlier work using the axiomatic method. It seems unlikely that Hilbert, with this degree of preparation and build-up, would somehow have forgotten to discuss precisely the core metalogical issues he had identified in ‘Axiomatisches Denken’, and instead have contented himself with talking about the axioms of geometry and the Aristotelian syllogism. Similarly, it seems unlikely that Bernays, a newcomer to the field, would, after the completion of the lecture course, have taken up 27 In
a helpful article on the early history of completeness, Richard Zach takes such a position. He says: I would like to argue here that Bernays was in fact instrumental already for the technical advances made in 1917-18, and that the development of propositional and first-order logic in [the 1917-18 lecture notes] is at least as much due to Bernays as it is to Hilbert. (Zach 1999 , 345.) 28 The shorthand notebook is pocket-size consisting of fifty-five small pages with a dozen to twenty handwritten lines to the page; it is thus scarcely long enough to record an entire lecture course. 29 This seems to be Zach’s conjecture; see op. cit., p. 346.
54
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Hilbert’s enterprise and inserted into Hilbert’s lecture protocols, without any comment, what were in fact his own major research discoveries. (2) The extensive material on second-order logic, type theory, and the Axiom of Reducibility at the end of the typed protocol draws heavily on a detailed technical knowledge of Russell’s mathematical logic. Yet, as we have seen, Bernays strongly emphasized his lack of experience in logic in 1917, and in particular his ignorance of the Principia. Indeed, Paolo Mancosu notes that Bernays wrote to Russell in 1920 saying that he ‘began studying Russell’s Principia only in 1917/18 after Hilbert’s 1917/18 lecture course’ (Mancosu 1999a, n. 9, 323). This chronology is consistent with everything Bernays says in his 1977 interviews. (3) Hilbert, in contrast, was deeply immersed in the details of Russell’s logicism precisely during the closing weeks of the semester. Heinrich Behmann’s extensive dissertation on Russell’s solution to the paradoxes was approved by Hilbert on 1 February, the day before the semester ended.30 In his written evaluation to the faculty (quoted in Mancosu 1999a, 326–327), Hilbert singled out for special praise Behmann’s treatment of type theory and the Axiom of Reducibility, and pointed out connections between this latter axiom and his own Axiom of Completeness (Vollständigkeitsaxiom) for Euclidean geometry and the theory of real numbers. Hilbert describes these issues as extremely difficult and extraordinarily important; he clearly regarded them as demanding further intensive effort, and it is plain that his attention was deeply engaged. (4) The direct statements of Bernays and Hilbert agree both in describing the series of lectures as Hilbert’s, and in noting the fact of Bernays’s active assistance. Hilbert, as we have seen, is explicit on both points in the Vorwort to Hilbert and Ackermann 1928 ; indeed, some of the clearest evidence for the contribution of Bernays to the series of early lecture notes comes from Hilbert’s forceful statement. Bernays, for his part, both in print and in private correspondence, always spoke of himself as writing out Hilbert’s lectures, and as assisting on Hilbert’s project: this is true of his letters to Russell (8 April 1920 and 19 March 1921), of his published 1976 autobiographical sketch (Bernays 1976b), and of his 1977 interviews (Bernays 1977* ). The Preface to his contemporaneous 1918 Habilitationsschrift (Bernays 1918* ) in particular explicitly assigns the propositional completeness theorem to Hilbert’s 1917/18 lectures. In short, what is ascertainable about the relative contributions of Hilbert and Bernays to the 1917/18 lecture notes can be summarized as follows. Bernays and Hilbert from the very beginning discussed the mathematical substance of Hilbert’s logical programme, and Hilbert found this assistance invaluable. Although the two protagonists agree that the lectures are Hilbert’s lectures and that the Habilitationsschrift is Bernays’s thesis, there is no way on the basis of the surviving materials to exclude the possibilities (a) that 30 The
dissertation is Behmann 1918* .
Introduction
55
Bernays may have influenced the formulation of the technical results in the lecture notes, (b) that Hilbert (who surely continued to ponder these matters after the end of the semester) may have influenced the sharp syntax-semantics distinction in the Habilitationsschrift, or indeed (c) that Hilbert may have offered advice to Bernays on his independence results, which employ techniques that Hilbert had introduced as early as his 1905 lectures. It is reasonable to assume that Hilbert and Bernays discussed all these matters in depth in private conversation, and that each exerted an influence on the work of the other. Beyond that the evidence runs out. 6.4 Working methods and ‘nostrification’. The lecture notes for 1917/18 provide an illustration of Hilbert’s working methods, and more broadly of the style of mathematics practiced in Göttingen under his influence. It is well-known that he did not like to read mathematical journals. Otto Blumenthal reports that he once dejectedly told Hilbert that he had just discovered that the most significant result in his doctoral thesis had already appeared in print. Hilbert’s response was, ‘Warum kennen Sie auch so viel Literatur? ’ (Blumenthal 1922 , 72.) It would be an error to see Hilbert’s response as entirely a joke. If Hilbert was planning to work in a new area he would rely on his assistants and students to sketch out for him some of the central results; but he then consciously preferred to think through the details on his own. This gave him a better feel for the material than if he had simply looked it up, and often in the process he would hit upon a fresh approach. In the present case it is highly unlikely that Hilbert worked patiently through the three volumes of Principia Mathematica. Instead it appears that he used Heinrich Behmann (and perhaps others) to give him a summary of the core ideas of Whitehead and Russell, and in particular to tell him about ramified type theory. He then subjected the ideas of the Principia to a relentless process of analysis and simplification, stripping away all excess baggage; some of this work no doubt took place in his conversations with Bernays. Hermann Weyl once attempted ‘to characterize in a few words the peculiarly Hilbertian brand of mathematical thinking’: It [his brand of thinking] is reflected in his literary style, which is one of great lucidity. It is as if you were on a swift walk through a sunny open landscape; you look freely around, demarcation lines and connecting roads are pointed out to you, before you must brace yourself to climb the hill; then the path goes straight up, no ambling around, no detours. (Weyl 1944 , 616; 134 in the reprinting.)
Richard Courant made a similar observation: [Hilbert] was a most concrete, intuitive mathematician who invented, and very consciously used, a principle; namely, if you want to solve a problem first strip the problem of everything that is not essential. Simplify it, specialize it as much as you can without sacrificing its core. Thus it becomes simple, as simple as it can be made, without losing any of its punch, and then you solve it. The generalization is a triviality which you don’t have to pay too
56
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
much attention to. This principle of Hilbert’s proved extremely useful for him and also for others who learned it from him; unfortunately it has been forgotten. (Courant 1981 , 161.)
The present lecture notes provide an excellent documentation of this process. Having made his radical simplifications to the Principia, Hilbert then reconstructed the entire edifice in his own style, employing techniques that went back to his work on the axiomatics of geometry two decades earlier: the construction of a carefully graduated set of axiomatic systems; the meticulous examination of the limitations of each system, followed by a carefully motivated strengthening; the explicit posing of meta-systemic questions about completeness, consistency, and decidability. The upshot of this work was a re-working of the entire subject from the ground up, and the making of it into something of Hilbert’s own. This general technique of re-thinking the ideas of other mathematicians, of fitting them into the Hilbert style of mathematics, seems to have been known colloquially in Göttingen as ‘nostrification’. According to Constance Reid, There were many levels of this process: “conscious nostrification” — “unconscious nostrification” — even “self-nostrification”. This last occurred when one came up with a marvelous new idea which he later discovered had already appeared in earlier work of his own. (Reid 1976 ; the passage and all quotations from Reid in this paragraph occur at the beginning of chapter 13.)
This method, in the hands of a Hilbert, had great strengths which are evident throughout the 1917/18 lectures. But in the phrase ‘unconscious nostrification’ there are hints of a problem which Courant explicitly noted: Everybody with some education at the time could have known that Hilbert had a little bit of this spirit of aggressive adventure in him. “Never mind what all these people have done, I will do it independently”. This was very much all right, but it did create in Hilbert’s students and assistants a feeling of neglect. A certain duty exists, after all, for a scientist to pay attention to others and give them credit. The Göttingen group was famous for the lack of a feeling of responsibility in this respect. We used to call this process — learning something, forgetting where you learned it, then perhaps doing it better yourself, and publishing it without quoting correctly — the process of “nostrification”. This was a very important concept in the Göttingen group.
Ironically, the most extreme example of the dangers of ‘nostrification’ involves Courant himself. In her biography of Courant, Constance Reid says that Norbert Wiener, when a student in Göttingen, accused Courant of failing to cite his work properly. This was not an isolated incident; she quotes Kurt Friedrichs as saying, ‘It was always happening to him. Norbert Wiener was very offended.’ (The italics are Reid’s.) Wiener, she says, was indeed so bitter that years later he wrote a novel about a professor, obviously based on Courant, who ‘was unkind to gifted young people but took over their ideas’. As Courant and Weyl and Bernays and Blumenthal all recognized, Hilbert’s insouciance towards the published literature, his ‘spirit of adventure’, his insistence on thinking things through for himself, was, in his hands, an enormously powerful tool, and the source of many of his greatest advances.
Introduction
57
They also attest that his intellectual example helped create the effervescent atmosphere of Göttingen mathematics, and inspired in his students a remarkable degree of independent creativity. But there was a danger, and Hilbert’s attitude undoubtedly created risks for his followers of the sort Courant both mentions and illustrates. Hilbert’s own practice appears to have been more cautious, and despite his nonchalant attitude towards the published literature, it is difficult to document specific instances where he improperly failed to assign credit to others. In his lecture notes he appears rather to have enjoyed telling his students about the work of Dedekind or Cantor or Kronecker and then offering his own criticisms and observations. In the present lectures it is clear that he consciously set out to make the work of Whitehead and Russell his own — that he ‘nostrified’ it in the best sense of the term. But both in his lectures to the Göttingen students and in the monograph universally known as ‘Hilbert and Ackermann’ he gave full acknowledgment; and, as we have seen, his most striking departure from the normal standards of scientific attribution consists in giving his young student credit as the full co-author of a book that was almost entirely his own work. 6.5 The Text of the Lectures. As for as the physical text itself, like most ‘officially’ instigated protocols the typescript was eventually bound and placed in the Lesezimmer of the Mathematisches Institut in Göttingen. Since, in his lectures, Hilbert frequently refers to earlier protocols for details of proofs or theoretical developments, it seems overwhelmingly likely the protocols were intended to benefit those following the lectures, and were made available as soon as possible. Some protocols might have been made available as soon as they were composed, lecture by lecture, or section by section. But it is highly probable that some protocols were prepared only after the entire course had been completed; practices no doubt varied from assistant to assistant or from course to course. It is not known exactly when the typescript of these lectures reached its final form. Internal evidence suggests that it was composed as the lectures were delivered. For example, the typescript begins by announcing that Hilbert will talk about the axioms of mechanics, but then Hilbert announces (p. 62) that he has changed his plan. The Table of Contents bears a separate pagination, suggesting that it was added only after the body of the text was complete. More significantly, at nine places (pp. 18–19, 27–28, 40–41, 50–51, 69–70, 77-78, 96–97, 117–118 and 187–188) the typescript terminates in midsection on an incomplete page, to be resumed on a fresh page. Since the new pages begin with remarks like ‘Zu dem geometrischen Axiomsystem, dessen Aufstellung ich das letzte Mal beendet hatte . . . ’ (p. 19), ‘Wir waren bei der Aufgabe stehen geblieben, die Unabhängigkeit . . . ’ (p. 28), or ‘Wir waren in der Theorie der Flächeninhalte bei der Aufgabe angelangt, zu beweisen, dass . . . ’ (p. 51), or ‘Wir haben das vorige Mal an Beispielen gesehen, . . . ’ (p. 97), it is clear that such breaks reflect directly at least some of the rather artificial interruptions imposed by the delivery of lectures. However, since Hilbert must have delivered some fifteen lectures during the eighteen-week
58
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
semester (allowing for holidays), it seems clear that Bernays at several points has run together two or more lectures. There are two copies of the text in the current Lesesaal of the Mathematisches Institut in Göttingen. One copy, the one which forms the basis of this Chapter, bears numerous pencilled annotations in Hilbert’s hand. The other copy is essentially identical, with the same type image and the same typing errors, but without annotations. Since the typeface is somewhat fainter, it was most probably the carbon copy of the annotated copy. Both the binding and the pages of this unmarked copy show more signs of wear and use; it is therefore reasonable to suppose that this was the copy originally deposited in the Lesezimmer of the Mathematisches Institut, the other being Hilbert’s own. (For more details about the two texts, see the ‘Description of the Text’ following the Textual Notes.) It is to be noted that, in Hilbert’s own handwritten list of his lecture courses, the 1917/18 lectures receive the fuller (and more accurate) title ‘Prinzipien der Mathematik und Logik’. See the list of Hilbert’s lecture courses at the end of this Volume, p. 1002, n. 50. William Ewald and Wilfried Sieg
‘Prinzipien der Mathematik’
59
Prinzipien der Mathematik
Vorlesung von D. HILBERT 1
5
Ausgearbeitet von Paul Bernays 1
Göttingen Wintersemester 1917/18.
Inhalts-Uebersicht. A. Axiomatische Methode, erläutert an den Axiomen der Geometrie.
10
15
20
25
Einleitung: Axiome der Arithmetik 1. Aufstellung des Axiomen-Systems. Axiome der Verknüpfung und der Anordnung Axiome der Kongruenz; Entwicklung einiger Konsequenzen (Satz vom Aussenwinkel, Halbierung einer Strecke) Parallelen-Axiom und Axiome der Stetigkeit 2. Beweise für Widerspruchslosigkeit und Unabhängigkeit. Widerspruchslosigkeit des Axiomen-Systems Unabhängigkeit des letzten Kongruenz-Axioms von allen übrigen Axiomen Unabhängigkeit des Parallelen-Axioms Unabhängigkeit des Archimedischen Axioms sowie des Vollständigkeits-Axioms 3. Aufbau der Geometrie unter Vermeidung der Stetigkeits-Axiome. Aufweisung zweier Mängel in der gewöhnlichen Darstellung der Elementar-Geometrie 1–1 Added
by Bernays.
I
Seite 1–4 4–7 8–17 17–18 19–23 24–26 27–34 34–37
37–40
60
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Begründung der Proportionen-Lehre Die Lehre von den Flächeninhalten 1) Definition von „Zerlegungsgleichheit“, „Ergänzungsgleichheit“, „Inhaltsmass“ 2) Unterscheidung von rechts und links, negative Strecken 3) Beweis des Satzes, dass ergänzungsgleiche Polygone gleiches Inhaltsmass haben; Folgerungen 4) Beweis der Umkehrung
41–48 49–62 49–51 49–51 52–53 53–58
5
59–61
B. Mathematische Logik. 1. Der Aussagen-Kalkül. Die Axiome des Kalküls 63–67 Erste Konsequenzen: Beispiel eines Unabhängigkeits-Beweises 67–69 Beweis der Widerspruchslosigkeit 70 Weitere Entwicklung des Kalküls: das Dualitäts-Prinzip; Be71–75 merkung über die Anzahl der notwendigen Verknüpfungszeichen Ableitung der Prinzipien hypothetischer Schlüsse: Bemerkun76–80 gen zur Formalistik des Kalküls 2. Prädikaten-Kalkül und Klassen-Kalkül. Inhaltliche Umdeutung der Symbolik des Aussagen-Kalküls im 81–84 Sinne des Prädikaten-Kalküls Uebergang zum Klassen-Kalkül 85–88 Notwendigkeit der Erweiterung des Kalküls zur Darstellung 89–90 partikulärer Urteile Einführung der Ungleichungen (Anzahl der notwendigen Ver91–93 knüpfungs-Zeichen) Beispiele für die Ausführung logischer Schlüsse im Prädikaten94–96 und Klassen-Kalkül Anwendungsbeispiele 97–98 Systematische Ableitung der traditionellen Aristotelischen 98–106 Schlüsse vom Standpunkt des Prädikaten-Kalküls Andeutungen über die formale Ausgestaltung des Operierens 106–107 mit Ungleichungen 3. Ueberleitung zum Funktionen-Kalkül. Vereinigung des Prädikaten-Kalküls mit dem Aussagen-Kalkül Beispiele für die Unzulänglichkeit der bisherigen Methode Methodische Grundgedanken des Funktionen-Kalküls; neue Art der Bezeichnung („Primzahl sein“, Liegen eines Punktes auf einer Geraden, Beziehung „zwischen“, Beziehung des Kleineren zum Grösseren); Anzahl der notwendigen logischen Zeichen Vorläufige Orientierung über die Methode des Funktionen-Kalküls (Darstellungen und Beweisführungen) 1) Zahlentheoretische Axiome 2) „Sohn und Vater“, „Ursache und Wirkung“
108–110 110–112 112–117
10
15
20
25
30
35
40
118–129 118–119 119–123
‘Prinzipien der Mathematik’
5
10
15
20
25
30
35
40
45
3) Allgemeine Fragen der Vertauschbarkeit von Klammerzeichen; gewöhnliche und gleichmässige Konvergenz 4. Systematische Darstellung des Funktionen-Kalküls. 1) Axiome des Funktionen-Kalküls Bezeichnungen Grundformeln und Grundregeln Erläuternde Bemerkungen (inhaltliche Deutung, formale Eigenschaften des Axiomen-Systems) Methode der formalen Entwicklung des Kalküls („logische Formeln“, „logische Aussagen-Formeln“, „abgeleitete Regeln“) 2) Das System der logischen Aussagen-Formeln Ableitung der Formeln (1)–(20) sowie der Regeln a)–i) Normaldarstellung von Ausdrücken Widerspruchslosigkeit und Vollständigkeit des engeren Axiomen-Systems 3) Das Gesamt-System der logischen Formeln Widerspruchslosigkeit des ganzen Axiomen-Systems; Unvollständigkeit des Systems Ableitung der Formeln (21)–(36) sowie der Regeln k)–n) Regel p) : Festhalten von Variablen; Anwendungen Regel q) : Bildung der Negation; erweitertes Dualitäts-Prinzip; Formeln (25 ), (26 ), (28 ), (31 ), (33 ) Regel r) : Vertauschung von Klammer-Zeichen Regel s) : Distributive Anwendung von Klammer-Zeichen auf Folge-Beziehungen Normalform für beliebige Ausdrücke; Regel t): Gleichheit zweier richtigen Formeln 4) Beispiele für die Anwendung des Funktionen-Kalküls zu formalen Beweisführungen Schlüsse mit einer singulären Prämisse („Cajus“, „gerade Primzahl“) Geometrisches Beispiel Beweis der Transitivität der Beziehung des Kleineren zum Grösseren (für positive Grössen) Abschliessende Bemerkung 5. Der erweiterte Funktionen-Kalkül. 1) Die Methode der unbeschränkten Erweiterung des Funktionen-Kalküls (Gleichstellung der unbestimmten Aussage- und Funktions-Zeichen mit den Variablen.) a) Verschiedene Gründe, welche uns zu diesem Verfahren bestimmen. Darstellung logischer Formeln als allgemeine Behauptungen; Prinzip der vollständigen Induktion; Ausdruck dafür, dass eine Formel nicht allgemein richtig ist; Satz von
61
123–129
129–133 133–135 135–138 138–140
140–149 149–150 150–153
154–156 157–167 168–169 169–172 173–174 174–176 176–179
180–181 182–184 184–186 187
188–191
62
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
der Existenz des Gegenteils Definition der Identität; Eigenschaften von Relationen (Symmetrie, Transitivität); Aequivalenz-Beziehung zwischen Prädikaten; Definition der Zahlen als Eigenschaften von Prädikaten b) Behandlung der Mengenlehre mit Hilfe des erweiterten Kalküls. Beziehung zwischen Mengen und Prädikaten; Bedingung für Prädikate, die als Eigenschaften von Mengen aufgefasst werden können Zusammenhang zwischen Mengen von Mengen und Prädikaten-Funktionen; Erläuterung an Beispielen (Menge aller Teilmengen einer gegebenen Menge) Vereinigungs-Menge und Durchschnitt einer Menge von Mengen c) Axiomatische Festlegung des erweiterten Verfahrens. Erweiterung des Axiomen-Systems durch Hinzufügung neuer Regeln Beispiele für formale Beweisführungen im erweiterten Kalkül; Ableitung von Eigenschaften der Identitätsbeziehung sowie des Satzes von der Existenz des Gegenteils 2) Die Paradoxien. Paradoxie des Begriffes „imprädikabel“ Paradoxie des Lügners Paradoxie der kleinsten (im 20. Jahrhundert) nicht definierten Zahl 3) Die Modifikation des erweiterten Kalküls. a) Die Methode des Stufen-Kalküls Anfechtbarkeit des vorherigen Verfahrens; Gedanke der Stufen-Unterscheidung Formale Einführung des Stufen-Kalküls; Index-Bezeichnung, Stufenzählung, Aenderung der Regeln Auflösung der Paradoxien durch die Stufenunterscheidung b) Mängel des Stufen-Kalküls Schwierigkeit in Betreff der Identitätsbeziehung; deren vorläufige Lösung Unzulänglichkeit des Stufen-Kalküls für die Grundlegung der höheren Mathematik; Beispiel des Cantorschen Beweises für die Existenz überabzählbarer Mengen
191–193
5
194–195 10
196–199
199–200 15
200–202 202–208 20
209–211 211–213 213–218
25
219–221 30
221–222 223–226 35
226–228 229–231 40
‘Prinzipien der Mathematik’
63 Seite
5
c) Das Axiom der Reduzierbarkeit Aufstellung des Axioms; Methodische Bedeutung der Einführung des Axioms; Vermeidung der Widersprüche Anwendung auf die Identitätsbeziehung Anwendung bei dem Cantorschen Beweise Anwendung auf die Dedekindsche Theorie der reellen Zahlen
231–234 234–235 235–237 237–246
VII
64 1
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Ich will in dieser Vorlesung die charakteristische Art mathematischer Wahrheiten und mathematischer Schlussweisen entwickeln und erklären und endlich die allgemeine wissenschaftliche und erkenntnistheoretisch-logische Bedeutung der Mathematik erörtern. Ich teile die Vorlesung in zwei Hauptabschnitte, deren erster von der axiomatischen Methode, der zweite von mathematischem Denken und Logik überhaupt handeln soll.
5
A. Axiomatische Methode. Die Methode der Axiomatik soll an den drei Gebieten der Arithmetik, der Geometrie und der Mechanik erläutert werden.
Einleitung: Axiome der Arithmetik
2
Bei der axiomatischen Behandlung der Arithmetik wollen wir die übliche Logik und den gewöhnlichen Anzahlbegriff voraussetzen. Ferner wollen wir Gleichungen von der Form a = b hier so verstehen, dass sie besagen, der mit a bezeichnete Gegenstand sei derselbe wie der mit b bezeichnete Gegenstand, sodass wir z. B. den Satz, dass zwei Grössen, die einer dritten gleich sind, untereinander gleich sind, nicht eigens als arithmetisches Axiom aufzuzählen haben. Die Axiome beziehen sich auf ein als gegeben angenommenes System von Dingen, die „Zahlen“, die wir durch Buchstaben (a, b, . . . ) bezeichnen, und die Theorie der Arithmetik besteht in der Entwicklung aller der Sätze, die sich über diese Dinge aus den Axiomen logisch folgern lassen. Die Axiome der Arithmetik zerfallen in vier Axiom|gruppen, welche nunmehr der Reihe nach aufgezählt werden sollen. I. Axiome der Verknüpfung. 1) a + b = c (Möglichkeit der Addition). 2) Lösbarkeit der Gleichungen a + x = b, y + a = b (eindeutige Umkehrbarkeit der Addition d. h. Möglichkeit der Subtraktion). 3) Existenz der Null; a + 0 = 0 + a = a. 4) a · b = c (Möglichkeit der Multiplikation). 5) Lösbarkeit der Gleichungen a · x = b, y · a = b, falls a = 0 ist (eindeutige Umkehrbarkeit der Multiplikation d. h. Möglichkeit der Division). 6) Existenz der Eins; a · 1 = 1 · a = a. II. Axiome der Rechnung. 7) a + (b + c) = (a + b) + c (associatives Gesetz der Addition). 8) a + b = b + a (kommutatives Gesetz der Addition). 9) a · (b · c) = (a · b) · c (associatives Gesetz der Multiplikation). 10) a · (b + c) = a · b + a · c (erstes distributives Gesetz der Multiplikation). 11) (a+b) · c = a · c+b · c (zweites distributives Gesetz der Multiplikation). 12) a · b = b · a (kommutatives Gesetz der Multiplikation). III. Axiome der Anordnung. 13) Von zwei verschiedenen Zahlen a, b ist eine die grössere und eine die kleinere; a > b, b < a.
10
15
20
25
30
35
40
‘Prinzipien der Mathematik’
5
10
15
20
25
30
35
14) Wenn a > b und b > c, so ist a > c (Transitivität der Grössenbeziehung). 15) Wenn a > b, so ist a + c > b + c und c + a > c + b. 16) Wenn a > b, c > 0, so ist ac > bc, ca > cb. IV. Axiome der Stetigkeit. 17) Wenn a > 0 und b > 0, so ist, für hinreichend viele Summanden a, a + a + . . . + a > b (Archimedisches Axiom). 18) Es ist nicht möglich, dem System der Zahlen noch weitere Dinge hinzuzufügen, sodass auch in dem so entstehenden erweiterten System sämtliche Axiome 1–17) erfüllt sind (Vollständigkeitsaxiom).
3
Allgemein ist ein Axiomensystem in dreierlei Hinsicht zu prüfen: einmal auf seine Widerspruchslosigkeit, ferner auf die logischen Abhängigkeitsbeziehungen zwischen den Axiomen und schliesslich auf seine Vollständigkeit, d. h. daraufhin, ob alle Fragen, welche die betrachteten Gegenstände und die in den Axiomen vorkommenden Beziehungen zwischen ihnen betreffen, mit Hilfe der Axiome prinzipiell logisch entscheidbar sind. Was bei dem vorliegenden Axiomensystem die Frage der logischen Abhängigkeiten betrifft, so sind nicht etwa die 18 Axiome alle voneinander unabhängig. Einige Abhängigkeiten sind sogar unmittelbar ersichtlich, z. B. dass Axiom 11) aus 10) und 12) folgt. Als nicht so triviale Abhängigkeiten seien erwähnt, dass sich 8) aus den Axiomen der ersten Gruppe unter Hinzuziehung von 10) und 11) beweisen lässt, ferner, dass das kommutative Gesetz der Multiplikation 12) aus den vorangehenden Axiomen und den Axiomen 13) bis 17), von denen übrigens das letzte nicht zu entbehren ist, gefolgert werden kann. Wenn somit die einzelnen aufgezählten Axio|me zum Teil gegenseitige Abhängigkeiten aufweisen, so sind doch die Axi- 4 omgruppen voneinander unabhängig, in dem Sinne, dass keine Axiomgruppe aus den übrigen drei beweisbar ist. Die Fragen der Widerspruchslosigkeit und der Vollständigkeit unseres arithmetischen Axiomensystems lassen wir einstweilen unerörtert. Bei der Axiomatik der Geometrie legen wir nicht nur eine Art, sondern drei Arten von Gegenständen zugrunde, Punkte (A, B, . . . ) Geraden (a, b, . . . ) Ebenen (α, β, . . . ) So wie wir für die Arithmetik die Logik als bekannt vorausgesetzt haben, setzen wir hier bei den Axiomen der Geometrie die Arithmetik voraus. Wie bei den arithmetischen Axiomen unterscheiden wir auch bei den Axiomen der Geometrie mehrere Axiomgruppen, und zwar sind es hier fünf.
1. Aufstellung des Axiomen-Systems. 40
65
Axiome der Verknüpfung und der Anordnung I. Axiome der Verknüpfung. 1) Zwei verschiedene Punkte A, B bestimmen stets eine Gerade a.
66
5
6
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Von der anschaulich bekannten Art, wie die Bestimmung einer Geraden durch zwei Punkte stattfindet, was man im Sprachgebrauch durch Wendungen wie „die Gerade a verbindet die Punkte A, B “, „die Gerade a geht durch die Punkte A, B “ oder „die Punkte A, B liegen auf der Geraden a“ auszudrücken pflegt, soll hier abstrahiert werden. Sofern man dieser Abstraktion eingedenk ist, kann man nachträglich jene Ausdrücke des Sprachgebrauches als Rede|weisen auch bei den axiomatischen Betrachtungen wieder einführen. 2) Irgend zwei voneinander verschiedene Punkte einer Geraden bestimmen nur diese eine Gerade. Dabei ist unter einem „Punkt einer Geraden a“ ein solcher Punkt zu verstehen, zu welchem es einen zweiten Punkt gibt, mit dem zusammen er die Gerade a bestimmt.A Das Axiom besagt also: wird die Gerade a einerseits durch die Punkte A, B, andererseits durch die Punkte C, D bestimmt und ist A von C verschieden, so bestimmen auch A und C die Gerade a. 3) Auf einer Geraden gibt es stets wenigstens zwei Punkte, in einer Ebene gibt es stets wenigstens drei nicht auf einer Geraden gelegene Punkte. Die bisherigen Axiome betreffen die Verknüpfungsverhältnisse von Geraden und Punkten in einer Ebene. Zu diesen „ebenen“ Verknüpfungsaxiomen kommen nun noch folgende räumlichen Verknüpfungsaxiome: 4) Drei nicht auf einer und derselben Geraden liegende Punkte A, B, C bestimmen eine Ebene α. 5) Irgend drei Punkte einer Ebene, die nicht auf einer und derselben Geraden liegen, bestimmen diese Ebene. Dabei ist „Punkt einer Ebene“ entsprechend zu verstehen wie beim zweiten Axiom „Punkt einer Geraden“. 6) Wenn zwei Punkte A, B einer Geraden in einer Ebene α liegen, so liegt jeder Punkt dieser Geraden in α. 7) Wenn zwei Ebenen einen Punkt gemeinsam haben, so haben sie wenigstens noch einen weiteren | Punkt gemein. 8) Es gibt wenigstens vier nicht in einer Ebene gelegene Punkte. Aus diesen Axiomen der ersten Gruppe lässt sich bereits ein Teil der Geometrie als eine in sich geschlossene Theorie entwickeln. Den Inhalt dieser Theorie bilden die auf Geraden und Ebenen bezüglichen Schnittpunktsätze.
5
10
15
20
25
30
II. Axiome der Anordnung. Hier handelt es sich um die axiomatische Charakterisierung derjenigen Verhältnisse, die wir mit dem Worte „zwischen“ zum Ausdruck bringen. 1) Sind A, B, C drei Punkte einer Geraden und liegt B zwischen A und C, so liegt B auch zwischen C und A. 2 A Punkt einer Geraden soll heissen, dass zu ihm noch ein anderer Punkt gefunden werden kann, der mit ihm zusammen die Gerade bestimmt. Added by Hilbert (pencil), written in the margin at the top of the page.
2 Added
by Hilbert (pencil) in the left-hand margin:
A
B
C
35
‘Prinzipien der Mathematik’
5
10
15
20
25
30
67
2) Sind A und C zwei Punkte einer Geraden, so gibt es mindestens einen Punkt B auf der Geraden, der zwischen A und C liegt, und mindestens einen Punkt D, sodass C zwischen A und D liegt. 3 3) Unter drei Punkten einer Geraden gibt es stets einen und nur einen, der zwischen den beiden anderen liegt. Zu diesen Axiomen, welche die Ordnungsbeziehungen auf einer Geraden betreffen und daher als „lineare“ Anordnungsaxiome bezeichnet werden können, tritt nun noch folgendes „ebene“ Anordnungsaxiom: 4) Es seien A, B, C drei nicht in einer Geraden gelegene Punkte und a eine Gerade in der durch die drei Punkte bestimmten Ebene, die durch keinen der Punkte A, B, C geht; 4 wenn dann die Gerade a durch einen Punkt | der Strecke AB geht, so geht sie entweder durch einen Punkt der Strecke BC oder einen Punkt der Strecke AC. Unter einem Punkt der Strecke AB ist dabei ein solcher Punkt zu verstehen, welcher auf der durch A und B bestimmte Geraden zwischen A und B liegt. Aus den Axiomen der Anordnung lassen sich mannigfache Folgerungen ziehen: insbesondere ergibt sich aus ihnen, dass eine Gerade durch jeden ihrer Punkte in zwei „Halbstrahlen“, eine Ebene durch jede in ihr gelegene Gerade in zwei „Halbebenen“ und der Raum durch jede Ebene in zwei „Halbräume“ zerlegt wird. Diese Zerlegung ergibt sich z. B. beim Raum so, dass für eine Ebene zwei nicht auf α gelegene Punkte A, B zu demselben durch α bestimmten Halbraum gehören oder „auf derselben Seite von α liegen“, wenn es auf der durch A, B bestimmten Geraden zwischen A und B keinen Punkt der Ebene α gibt, während im gegenteiligen Falle A, B auf verschiedenen Seiten von α liegen. Weiter lässt sich dann der Satz beweisen, dass eine Ebene durch jedes in ihr gelegene einfache Polygon1) in zwei „Bereiche“ zerlegt wird, derart, dass zwei Punkte eines und desselben Bereiches ohne Ueberschreitung des Polygones durch einen Streckenzug verbunden werden können, während ein Punkt des einen Bereiches mit einem Punkte des anderen Bereiches nicht auf diese Weise verbindbar ist.2) 1) Ein Polygon heisst einfach, wenn jeder Eckpunkt nur zwei Seiten und jeder andere seiner Punkte nur einer Seite angehört. 2) Wie die Ausdrücke „Streckenzug“ und „verbindbar“ zu verstehen sind, ergibt sich nach dem Vorangehenden leicht.
3 Added
by Hilbert (pencil) in the left-hand margin: A
4 Added
by Hilbert (pencil) in the left-hand margin:
a C A
B
B
C
D
7
68 8
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Zu den bisher besprochenen zwei Axiomgruppen, von denen die erste, die Gruppe der Verknüpfungsaxiome, die projektiven Eigenschaften, die zweite, die Gruppe der Anordnungsaxiome, die Topologie des Raumes zum Ausdruck bringt, kommt nun als nächste die Gruppe der Kongruenzaxiome, aus denen sich die Möglichkeit der geometrischen Bewegungen, d. h. der (nichtidentischen) kongruenten Abbildungen des Raumes auf sich selbst ergibt.
5
Axiome der Kongruenz; Entwicklung einiger Konsequenzen (Satz vom Aussenwinkel, Halbierung einer Strecke) III. Axiome der Kongruenz. 1) Sind h und h zwei Halbstrahlen mit den Ausgangspunkten A, A , so entspricht jedem Punkt B auf h eindeutig ein Punkt B auf h durch eine Beziehung, die wir als Kongruenz oder Gleichheit der Strecken AB und A B bezeichnen und die wir symbolisch durch die Formel
10
AB ≡ A B ausdrücken. 5 Diese Beziehung der Strecken-Kongruenz ist, wie schon die Benennung zum Ausdruck bringt, eine gegenseitige, sodass
15
AB ≡ A B gleichbedeutend ist mit
9
A B ≡ AB; ferner ist sie unabhängig von der Reihenfolge, in der die Endpunkte der Strecke genannt werden, sodass in jeder Strecken-Kongruenz für AB auch BA gesetzt werden kann. Auf Grund dieses Axioms 1) können wir von Streckenabtragung im üblichen Sinne sprechen und den Satz aufstellen: eine Strecke AB lässt sich auf eine gegebene Gerade von einem gegebenen | Punkte aus nach einer gegebenen Seite hin stets und nur auf eine Weise abtragen. 2) Ist AB ≡ A B und A B ≡ A B , so ist AB ≡ A B (Transitivität der Strecken-Kongruenz). 3) Sind A, B, C drei Punkte auf einer Geraden a, A , B , C Punkte auf einer Geraden a , liegt ferner B zwischen A und C, B zwischen A und C und ist AB ≡ A B , BC ≡ B C , 5 Added
by Hilbert (pencil) in the left-hand margin:
B h A A
h
B
20
25
30
‘Prinzipien der Mathematik’
69
so ist
AC ≡ A C . (Addirbarkeit gleicher Strecken.) 6 Dies sind die linearen Kongruenz-Axiome. Für die ebenen Kongruenz-Axiome brauchen wir die Einführung des Winkel begriffes. Unter einem Winkel verstehen wir den Inbegriff zweier von einem und demselben Punkt ausgehenden Halbstrahlen h, k, 7 die nicht zusammen eine Gerade ausmachen 7 . Wir schreiben dafür (h, k). Die beiden Halbstrahlen heissen die Schenkel, ihr gemeinsamer Ausgangspunkt der Scheitel des Winkels. Sind a, b die beiden Geraden, auf denen bezüglich die Schenkel h, k eines Winkels liegen, und ist α die durch a und b bestimmte Ebene, so sagen wir von einem Punkte, dass er im Innern des Winkels liege, wenn er in α auf derselben Seite von a liegt wie der Halbstrahl k und zugleich auf derselben Seite von b wie der Halbstrahl h. Wir führen nun die Kongruenz von Winkeln ganz entsprechend wie die Kongruenz von Strecken ein. 4) Sind h und h zwei bezüglich von A, A ausgehende Halbstrahlen und sind a, a die Geraden, auf denen sie liegen, so entspricht jedem Halbstrahl k, der von A ausgeht, 8 innerhalb einer | bestimmten durch a begrenzten Halbebene eindeutig ein von A ausgehender Halbstrahl k vermöge einer Beziehung, die wir als Kongruenz oder Gleichheit der Winkel (h, k) und (h , k ) bezeichnen und für die wir symbolisch schreiben (h, k) ≡ (h , k ). Diese Beziehung der Winkel-Kongruenz ist eine gegenseitige, und sie ist eindeutig bestimmt durch die Winkel, d. h. unabhängig davon, in welcher Reihenfolge die den Winkel bildenden Halbstrahlen genannt werden. Indem wir entsprechend wie von Streckenabtragung von der Antragung eines Winkels an einen Halbstrahl reden, können wir aus dem Axiom 4) folgenden Satz entnehmen: jeder Winkel kann in einer gegebenen Ebene an einen gegebenen Halbstrahl nach einer gegebenen Seite stets und nur auf eine Weise angetragen werden. 6
5
10
15
20
25
30
6–6 Added
by Hilbert (pencil) in the left-hand margin; parentheses added by the Editors. by Hilbert (pencil). 8 Added by Hilbert (pencil) in the left-hand margin:
7–7 Added
k
A
h k a
h A a
10
70
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
5) Wenn für zwei Punkte-Tripel (Dreiecke), ABC und A B C , die Kongruenzen AB ≡ A B , AC ≡ A C , BAC ≡ B A C gelten, so sind auch die Kongruenzen ABC ≡ A B C , ACB ≡ A C B
11
12
erfüllt. Die Winkelbezeichnung ist hierbei bekanntermassen so zu verstehen, dass z. B. BAC den Winkel bedeutet, dessen Schenkel die beiden von A ausgehenden, bezüglich durch B und C führenden Halbstrahlen bilden. Man nennt diesen Winkel auch den von den „Seiten“ AB und AC „eingeschlossenen“ oder den der Seite BC „gegenüberliegenden“ Winkel. Zu dieser Aufstellung der fünf Kongruenz-Axiome ist zu bemerken, dass die darin enthaltenen Annahmen nicht alle voneinander logisch unabhängig sind. Z. B. lassen sich einige in den Axiomen 1) und 4) gemachten Voraussetzungen ersparen, wodurch freilich der gedankliche Inhalt der Kongruenz-Axiome eher komplizierter wird. Ebenso wie bei den Axiomen der Anordnung ist auch bei der Gruppe der Kongruenz-Axiome kein räumliches Axiom nötig. Es ist zu beachten, dass gemäss der Charakterisierung der Kongruenzbeziehung durch die Kongruenz-Axiome auch symmetrische Figuren (im gewöhnlichen Sinne des Wortes) als kongruent zu gelten haben. 9 Das Hauptresultat, das sich aus den Kongruenz-Axiomen ergibt, ist folgender allgemeine Satz: Sind A1 , A2 , . . . , An und A1 , A2 , . . . , An zwei kongruente Punktsysteme, d. h. zwei Punktsysteme von der Art, dass die durch Verbindung entsprechender Punkte entstehenden Seiten und Winkel paarweise kongruent sind, ist ferner P ein ganz beliebiger Punkt, so kann ein Punkt P so bestimmt werden, dass A1 , A2 , . . . , An , P und A1 , A2 , . . . , An , P wiederum kongruente Punktsysteme bilden. Da man die Punkt-Zahl n für die beiden Systeme ganz beliebig wählen kann und für n = 1 über die Lage von A und A nichts vorauszusetzen ist, so ergibt sich aus diesem Satz, dass jede geradlinige Figur an eine beliebige Stelle des Raumes verlegt werden kann. Hier will ich noch etwas näher darauf eingehen, wie sich mit Hilfe der aufgezählten Axiome der Kongruenz ein grosser | Teil der geläufigen planimetrischen Sätze ergibt. Zunächst ergibt sich unmittelbar aus dem Axiom 5) der Satz von der Gleichheit der Basis-Winkel im gleichschenkligen Dreieck; man braucht dazu das Axiom nur auf den Fall anzuwenden, wo A mit A, B mit C und C mit B zusammenfällt. Ferner beweist man aus den Axiomen 1), 4) und 5) leicht die beiden ersten Dreiecks-Kongruenzsätze, die in der gebräuchlichen Ausdrucksweise lauten: Wenn zwei Dreiecke in zwei Seiten und dem von ihnen eingeschlossenen Winkel übereinstimmen, so sind sie kongruent. Wenn zwei 9 Hilbert
(pencil) has circled this paragraph and has drawn an arrow indicating that it is to be placed after the next paragraph.
5
10
15
20
25
30
35
40
‘Prinzipien der Mathematik’
5
10
15
20
25
30
35
40
71
Dreiecke in einer Seite und den beiden anliegenden Winkeln übereinstimmen, so sind sie kongruent. Wie üblich, definieren wir nun: Zwei Winkel mit gleichem Scheitelpunkt heissen Nebenwinkel , wenn sie einen Halbstrahl gemeinsam haben und die anderen beiden Halbstrahlen in einer und derselben Geraden auf entgegengesetzten Seiten des Scheitelpunktes liegen. Zwei Winkel heissen Scheitelwinkel , wenn die Schenkel des einen Winkels die Verlängerungen der Schenkel des anderen Winkels bilden. Ein Winkel heisst ein rechter , wenn er seinem Nebenwinkel gleichB ist Den Nachweis, dass es rechte Winkel gibt, kann man in der Weise führen, dass er zugleich die Konstruktion einer Senkrechten (im üblichen Sinne) zu einer gegebenen Geraden a durch einen Punkt P ausserhalb der Geraden liefert. Dazu verbinde man P mit irgend einem P Punkt A auf a, trage den Winkel, den P A mit einem der auf der Geraden a von A ausgehenden Halbstrahlen bildet, nach der dem Punkte a B A P entgegengesetzten Seite an a an; auf den so | erhaltenen Halbstrahl trage man von A aus die Strecke AP ab und verbinde den dadurch erQ haltenen Endpunkt Q mit P . Da P und Q auf entgegengesetzten Seiten von a liegen, so enthält die Strecke P Q einen Punkt B der Geraden a. Stimmt B mit A überein, so ist bereits P A senkrecht zu a. Anderenfalls folgt aus der Kongruenz der Dreiecke P AB und QAB, dass P B auf a senkrecht steht. Durch mehrmalige Anwendung des ersten Kongruenzsatzes und unter Hinzuziehung des Axioms 3) ergibt sich der Satz, dass die Nebenwinkel gleicher Winkel wiederum gleich sind; und hieraus folgt insbesondere, dass Scheitelwinkel einander gleich sind. Des weiteren kann man nun durch eine längere Reihe von Schlüssen beweisen, dass für die Winkel folgende den Axiomen 2) und 3) für die Strecken ganz analogen Sätze gelten: Sind zwei Winkel einem dritten kongruent, so sind sie untereinander kongruent. Sind h, k, l, desgleichen h , k , l drei von einem Punkte ausgehende Halbstrahlen, liegt ferner k im Innern des Winkels (h, l), k im Innern des Winkels (h , l ) und ist (h, k) ≡ (h , k ), (k, l) ≡ (k , l ), so ist auch (h, l) ≡ (h , l ). Aus dem ersten dieser beiden Sätze ergibt sich als Folgerung, dass alle rechten Winkel einander gleich sind.1) 1) Dass Euklid diesen Satz als besonderes Axiom aufgeführt hat, braucht nicht auf einer Verkennung logischer Abhängigkeiten zu beruhen. Vielmehr lässt das System B
kongruent Added by Hilbert (pencil).
13
72
Zur leichteren Formulierung der weiteren Folgerungen empfiehlt sich die Einführung der Grössen-Vergleichung von Strecken und Winkeln. Sind AB und CD irgend zwei Strecken, so sagen wir, AB ist kleiner als CD, wenn bei der Abtragung der Strecke AB auf die Gerade CD von C aus in der Richtung nach D der erhaltene Endpunkt D zwischen C und D liegt, und wir sagen, AB ist grösser als CD, wenn D ausserhalb von CD liegt. Hiernach ist klar, dass von den drei Beziehungen: „AB ist gleich CD“, „AB ist kleiner als CD“, „AB ist grösser als CD“ stets eine und nur eine erfüllt ist. Dass die gegebene Definition von „grösser“ und „kleiner“ uns tatsächlich eine Grössen-Vergleichung der Strecken liefert, beruht auf folgenden aus den linearen Kongruenz-Axiomen beweisbaren Sätzen: Die Beziehungen des „kleiner“, „grösser“ oder „gleich“ zwischen zwei Strecken AB und CD sind unabhängig davon, von welchem der beiden Endpunkte der Strecke CD aus die Abtragung stattfindet, sie bleiben ungeändert, wenn eine der beiden Strecken durch eine kongruente ersetzt wird. Ferner ist jede der Beziehungen transitiv, z. B.: wenn AB kleiner ist als A B und A B kleiner als A B , so ist auch AB kleiner als A B . In ganz entsprechender Weise ergibt sich die Winkel-Vergleichung, natürlich unter Anwendung der ebenen Kongruenz-Axiome. Mit Benutzung dieser Grössen-Vergleichung der Winkel können wir nun den Satz aussprechen: Jeder Nebenwinkel | eines Dreieckswinkels ist grösser als jeder der beiden anderen Dreieckswinkel, oder in üblicher Ausdrucksweise: jeder Aussenwinkel eines Dreiecks ist grösser als jeder der beiden ihm gegenüberliegenden Winkel im Dreieck. Zufolge des Satzes von den Scheitelwinkeln lässt sich der aufgestellte Satz auf folgende Behauptung reduzieren: Ist ABC ein Dreieck und D ein Punkt auf der Verlängerung der Seite BC über B hinaus, so ist ABD grösser als BAC. E Angenommen zunächst, es wäre ABD gleich A BAC, so trage man die Strecke AC von B D aus auf die Gerade BC in der Richtung nach D ab und verbinde den erhaltenen Endpunkt E B mit A; es würde dann folgen, dass Dreieck ABC C dem Dreieck BAE kongruent, also CBA gleich EAB wäre; andererseits müsste auf Grund der Voraussetzung und des Satzes über Nebenwinkel CBA dem Nebenwinkel von CAB kongruent sein;
5
10
15
20
25
30
15
Lectures on the Principles of Mathematics (1917/18)
14
Chapter 1
der bei Euklid jenem Satz vorausgehenden axiomatischen Annahmen (deren Formulierung nicht so bis ins Letzte detailliert ist, dass ihre Auslegung vollkommen eindeutig wäre) ohne Zwang eine Auffassung zu, auf Grund deren der fragliche Satz nicht aus ihnen beweisbar ist.
35
‘Prinzipien der Mathematik’
5
10
15
20
25
73
es müsste also EA in die Verlängerung von AC A fallen. Das ist aber unmöglich, da 10 durch A und C nur eine Gerade existirt und 10 A ja nicht auf der Geraden BC liegt. Nun bliebe noch die MögD lichkeit, dass ABD kleiner wäre als BAC; in diesem Falle könnte man BAC von B aus B an AB (d. h. an den die Strecke AB enthaltenden Halbstrahl) nach der Seite des Punktes C D hin antragen. Der hierdurch erhaltene Halbstrahl würde im Innern des Scheitelwinkels von ABC, seine Verlängerung also im Innern von ABC liegen; diese Verlängerung müsste daher | die Strecke AC schneiden, und wir würden so auf den vorherigen, bereits als unmöglich erkannten Fall zurückgeführt. Aus dem Satz über die Aussenwinkel erhält man als direkte Folgerung, dass von einem Punkte nach einer Geraden nur eine einzige Senkrechte gezogen werden kann. Ferner ergibt sich auf bekannte Weise der Satz, dass der grösseren von zwei ungleichen Dreiecksseiten auch der grössere Winkel gegenüberliegt1) 11 und umgekehrt (indirekt beweisen!!!) 11 , und daraus kann man weiter schliessen, dass in jedem Dreieck die Summe zweier Seiten grösser ist als die dritte. Schliesslich sei hier noch der Beweis für die Möglichkeit der Halbierung einer Strecke angegeben. Er beruht auf folgender Konstruktion: Man wähle irgend einen Punkt D ausserhalb der gegebenen Strecke AB, verbinde D mit A und B, trage dann DAB von B aus an AB (d. h. an den von B aus durch A führenden Halbstrahl) nach der zum Punkte D entgegengesetzten Seite der Geraden AB an, trage auf den so erhaltenen freien Schenkel die Strecke AD ab und verbinde den hierdurch bestimmten Punkt D mit D. 1) Der Satz, dass gleichen Dreieckswinkeln gleiche Seiten gegenüberliegen, braucht nicht erst hieraus bewiesen zu werden, sondern folgt unmittelbar aus dem zweiten Kongruenzsatz.
10–10 Added
by Hilbert (pencil). by Hilbert (pencil). On the reverse of the previous page, Hilbert has added the following two figures, which appear to refer to his remark ‘indirekt beweisen!!!’
11–11 Added
He then adds a third figure, possibly meant to illustrate the further conclusion:
16
74
Chapter 1
Lectures on the Principles of Mathematics (1917/18) D
Gemäss dem Satz über die Aussenwinkel muss BD ganz im Innern des Winkels ADB liegen, die Strecke DD muss daher die Strecke AB in A B einem Punkte M schneiden. Nun ergibt sich, M wenn noch D mit A verbunden wird, aus dem ersten Kongruenzsatz, dass DB ≡ D A und DBA ≡ D AB ist. Hieraus folgt nach dem D vorhin erwähnten Additionssatz für Winkel, dass DAD ≡ D BD, daraus weiter nach dem ersten Kongruenzsatz, dass ADD ≡ BD D ist und schliesslich ergibt die An|wendung des zweiten Kongruenzsatzes auf die Dreiecke AM D und BM D die Gleichheit der Strecken AM und M B, sodass M als Mittelpunkt der Strecke AB erwiesen ist.
17
5
10
Parallelen-Axiom und Axiome der Stetigkeit Ich gehe nun über zu dem Parallelen-Axiom. IV. Parallelen-Axiom.
15
Dieses spezifisch Euklidische Axiom hat vor allem die axiomatischen Fragen angeregt. Allerdings war man sich bei der anfänglichen Problemstellung vielfach nicht darüber klar, dass zum Verständnis des Parallelen-Axioms bereits die vorangehenden Axiome notwendig sind. Ich gebe folgende Formulierung des Axioms: Es sei a eine beliebige Gerade und A ein Punkt ausserhalb dieser Geraden; dann gibt es in der durch A und a bestimmten Ebene α nicht mehr als eine Gerade b, die durch A geht und a nicht schneidet. 12 Dass stets eine Gerade durch A geht, welche in der Ebene α liegt und a nicht schneidet, wird in diesem Axiom nicht behauptet. Dies folgt aber bereits aus den früheren Axiomen; denn zieht man durch A die Senkrechte s zu a und dann die Senkrechte b zu s, so können sich a und b nicht schneiden, weil sonst von dem Schnittpunkt zwei verschiedene zu s senkrechte Gerade gezogen werden könnten.C C
A a
12 Added
b
Ziehe irgendwie AB und trage ) an AB in A ab, so schneidet b nicht a. Denn 13
B by Hilbert (pencil) in the left-hand margin:
A α a
13 Diagram
and comment added by Hilbert (pencil) in the left-hand margin, apparently as an alternative to ‘zieht . . . könnten.’; from ‘Denn’ Hilbert (pencil) has drawn an arrow across the bottom of the page to the underlined phrase, ‘Widerspruch . . . Aussenwinkel’ in the following marginal note. It is unclear whether this entire group of changes constituted a single alteration, or whether Hilbert added the arrow later.
20
25
‘Prinzipien der Mathematik’
5
75
Wir nennen zwei Gerade, die in einer Ebene liegen und sich nicht schneiden, parallel. Aus dem Axiom IV) folgt in bekannter Weise die Gleichheit von Gegenwinkeln und Wechselwinkeln an Parallelen (in der gewöhnlichen Bedeutung der Ausdrücke).D Die letzte Gruppe von Axiomen ist ganz analog der | Gruppe der Stetigkeitsaxiome bei der Arithmetik. V. Axiome der Stetigkeit. 1) Axiom des Messens: Sind A, B zwei Punkte einer Geraden a und ist CD irgend eine Strecke, so kann eine Anzahl (n) von Punkten A1 , A2 , . . . , An auf a in dieser Reihenfolge 14 so gewählt werden, dass
10
AA1 ≡ A1 A2 ≡ A2 A3 ≡ . . . ≡ An−1 An ≡ CD
15
20
ist und dass B zwischen A und An liegt. 14 15 (Archimedisches Axiom) 15 16 Auf diesem Axiom beruht die Möglichkeit der zahlenmässigen Vergleichung beliebiger Strecken. In seiner Anwendung auf die räumlich-physikalische Längenmessung bringt das Axiom die logisch nicht selbstverständliche Voraussetzung, 17 wenn auch sehr anschauliche Tatsache 17 , zum Ausdruck, dass wir beliebige himmlische Entfernungen mit irdischen Massstäben messen können 18 und ebenso jede intramolekulare oder intraatomare Länge und Grösse durch unsere gewöhnlichen Maasstäbe tatsächlich messbar ist 18 .E D
b
Denn mache die Winkel )) gleich, so ba. Denn schnitten sich a und b, so Widerspruch gegen Satz vom Aussenwinkel . Also Wechselwinkel bei en immer gleich. Winkelsumme im = 2 Rechte. Denn
a
E
Wir können sagen, dass dieses Axiom in der Wirklichkeit gilt, ist die wichtigste und merkwürdigste Grundeinsicht in der Astronomie und in der Physik. Dass das nicht zu sein brauchte, dass die Logik es nicht verlangt, werde ich noch zeigen. Merkwürdig, dass unsere Sinne + Apparate gerade Gültigkeit des Arch. Axioms noch zeigen! 14–14 Hilbert
(pencil) rewrote the typescript here, which originally read: ‘so gewählt werden, dass die Strecke AA1 kleiner als AA2 , diese kleiner als AA3 . . . u. s. w. ist, dass AA1 ≡ A1 A2 ≡ A2 A3 ≡ . . . ≡ An−1 An ≡ CD ist und dass AB kleiner als AAn ist.’ 15–15 Added by Hilbert (pencil). 16 Added 17–17 Added 18–18 Added
by Hilbert (pencil) in the left-hand margin: by Hilbert (pencil). by Hilbert (pencil).
A
A1 A2 A3
B An
18
76
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
2) Vollständigkeits-Axiom: Die Gegenstände der Geometrie (Punkte, Geraden, Ebenen) bilden ein System von Dingen, welches bei Aufrechterhaltung sämtlicher genannten Axiome keiner Erweiterung mehr fähig ist.F
2. Beweise für Widerspruchslosigkeit und Unabhängigkeit.
19
5
Widerspruchslosigkeit des Axiomen-Systems
20
Zu dem geometrischen Axiomensystem, dessen Aufstellung ich das letzte Mal beendet hatte, sei zunächst bemerkt, dass die Anordnung der Axiome im einzelnen zwar eine gewisse Willkür aufweist, im grossen aber doch mit Notwendigkeit bestimmt ist. Bei Untersuchungen über mögliche Vereinfachungen dieses Axiomensystems hat man darauf zu achten, dass Kürzungen durch eine Reduktion der Annahmen nicht immer von Vorteil sind, insofern dadurch die Uebersicht leiden kann. Wenden wir uns nun zur genaueren Diskussion des vorgelegten Systems der geometrischen Axiome, so ist zuerst die Frage der Widerspruchslosigkeit zu behandeln. Diese Frage ist darum die wichtigste, weil durch einen Widerspruch, zu dem die Konsequenzen aus den Axiomen führen würden, dem ganzen System seine Bedeutung genommen wäre. Das Axiomensystem ist ja so aufzufassen, dass über dem Ganzen die Annahme steht, es gebe drei Arten von Dingen, die wir als Punkte, Geraden und Ebenen bezeichnen und zwischen denen gewisse Beziehungen bestehen, welche durch die Sätze, die wir Axiome nennen, beschrieben werden. Diese Annahme wäre offenbar gegenstandslos, wenn man von den Axiomen durch richtige Schlussfolgerungen zu einem Satz und auch zu seinem Gegenteil gelangen könnte. Die Unmöglichkeit eines solchen Falles nennen wir die Widerspruchslosigkeit des Axiomensystems. Den Beweis der Widerspruchslosigkeit für die Axiome der Geometrie werde ich führen durch Aufweisung eines Systems von Gegenständen, die miteinander in solcher Weise verknüpft sind, dass sich eine Zuordnung dieser Gegenstände und Verknüp|fungen zu den in den geometrischen Axiomen vorkommenden Gegenständen und Beziehungen herstellen lässt, bei welcher sämtliche Axiome erfüllt sind. Die Gegenstände, auf die ich mich hierbei als auf etwas Gegebenes berufe, sind der Arithmetik entnommen, und das Beweisverfahren kommt also darauf hinaus, dass die Widerspruchslosigkeit der Geometrie auf die Widerspruchslosigkeit der Arithmetik zurückgeführt wird, indem gezeigt wird, dass ein Widerspruch, der sich bei den Folgerungen aus den geometrischen Axiomen ergäbe, auch innerhalb der Arithmetik einen Widerspruch zur Folge haben müsste. F
sind die geom. Seitenstücke zu dem Archimed. Axiom bei den reellen Zahlen. S. 3. dass jeder ↑Dezimalbruch ↓ Fundamentalreihe oder jedem Dedekindschen Schnitt auch wirklich eine reelle Zahl entspricht. Added in Hilbert’s hand (pencil) immediately beneath this paragraph.
10
15
20
25
30
35
‘Prinzipien der Mathematik’
5
10
77
Zur Ausführung des angedeuteten Nachweises brauche ich nur die Gesichtspunkte der analytischen Geometrie anzuwenden, und zwar will ich mich hier der Einfachheit halber auf die Geometrie der Ebene beschränken. Als Punkte nehme ich Paare von Zahlen1) (x, y), wobei zwei Punkte dann und nur dann als identisch gelten sollen, wenn die entsprechenden Zahlen beider Paare übereinstimmen. 19 Eine Gerade sollen drei Zahlen bedeuten, 19 von denen die beiden ersten nicht zugleich Null sind; sie wird also dargestellt durch ein Zahlen-Tripel (u, v, w), für welches u2 + v 2 > 0 ist, und zwei solche Tripel (u, v, w) und (u , v , w ) stellen dann und nur dann dieselbe Gerade dar, wenn u : v : w = u : v : w
15
ist.G Dass ein Punkt (x, y) auf einer Geraden (u, v, w) liegt, soll besagen, dass die Gleichung ux + vy + w = 0 erfüllt ist. Auf Grund dieser Festsetzungen sind zunächst die (ebenen) Verknüpfungsaxiome erfüllt. Ferner zeigt man leicht, dass die Punkte einer Geraden stets aus einem Gleichungssystem der Form x = at + c,
20
25
30
y = bt + d
erhalten werden, in welchem a, b, c, d festzuhalten sind und t alle reellen Werte durchläuft, sodass jedem Werte von t genau ein Punkt auf der Geraden entspricht. Da die reellen Zahlen eine natürliche Ordnung besitzen, so ergibt sich aus dieser „Parameter-Darstellung“ einer Geraden ohne weiteres eine Anordnung der Punkte auf der Geraden, indem wir bei drei zu den ParameterWerten t1 , t2 , t3 gehörigen Punkten P1 , P2 , P3 sagen, dass P2 zwischen P1 und P3 liegt, wenn die Zahl t2 zwischen t1 und t3 liegt, d. h. wenn t3 − t2 dasselbe Vorzeichen hat wie t2 − t1 . Bei diesen Definitionen gelten offenbar die linearen Anordnungs-Axiome. Dass auch die ebenen Anordnungs-Axiome gültig sind, beruht darauf, dass jede Gerade (u, v, w) eine Einteilung der nicht auf ihr liegenden Punkte in zwei Klassen bestimmt, indem diese Punkte (x, y) danach unterschieden werden, 1)
Unter „Zahlen“ sind hier stets endliche, reelle Zahlen zu verstehen.
G
u2 + v 2 = 1 u0 v>0
19–19 Hilbert
falls u = 0
20
has changed the first part of the sentence, which originally read ‘Eine Grade soll ein Verhältnis dreier Zahlen bedeuten’. 20 Equations added by Hilbert (pencil) in the left-hand margin as alternative to the clause ‘für . . . ist’, which he has enclosed in parentheses.
21
78
22
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
ob für sie der Ausdruck ux + vy + w positives oder negatives Vorzeichen hat.1) Bezeichnen wir diese zwei Klassen als die beiden durch die Gerade (u, v, w) bestimmten Halbebenen, so gilt, wie sich beweisen lässt, der Satz, dass zwei nicht auf der Geraden gelegene Punkte dann und nur dann zu derselben Halbebene gehören, wenn ihre Verbindungsstrecke die Gerade nicht schneidet. Um eine passende Definition der Kongruenz zu erhalten, brauchen wir nur zu bedenken, dass die kongruenten Transformationen in der Ebene sich alle aus Parallel-Verschiebungen und Drehungen, eventuell noch in Verbindung mit einer Umklappung, zusammensetzen lassen. Wir erklären demgemäss zwei Figuren als kongruent, wenn sie durch Anwendung von Substitutionen der drei Arten c d x = √ x− √ y x = x x = x + a 2 2 2 c +d c + d2 d c y = √ x+ √ y y = −y y = y + b 2 2 2 c +d c + d2 ineinander übergeführt werden können. Damit ist dann insbesondere die Strecken-Kongruenz und die Winkel-Kongruenz so definiert, dass alle KongruenzAxiome befriedigt werden. Auch das Parallelen-Axiom ist auf Grund unserer Festsetzungen erfüllt. Ist nämlich (u, v, w) eine Gerade und (a, b) ein Punkt ausserhalb dieser Geraden, so ist ua + vb + w = 0. Soll eine Gerade (u , v , w ) durch (a, b) gehen und mit (u, v, w) keinen Punkt gemeinsam haben, so muss einerseits
5
10
15
20
u a + v b + w = 0 sein, andererseits dürfen die Gleichungen ux + vy + w = 0,
u x + v y + w = 0
25
keine gemeinsame Lösung (x, y) besitzen. Diese Forderungen sind dann und nur dann erfüllt, wenn (für einen gewissen Proportionalitäts-Faktor q) die Gleichungen u = qu, 23
v = qv,
w = −q(ua + vb)
bestehen. Da hierdurch das Zahlenverhältnis u : v : w eindeutig | bestimmt ist, so gibt es nur eine durch (a, b) gehende Gerade, welche die Gerade (u, v, w) nicht schneidet. Was schliesslich die Stetigkeits-Axiome betrifft, so folgt für das Axiom des Messens die Gültigkeit bei den gegebenen Definitionen unmittelbar aus der Gültigkeit des Archimedischen Axioms in der Arithmetik; und das Vollständigkeits-Axiom muss deshalb erfüllt sein, weil es im gegenteiligen Falle, wie man einfach beweisen kann, eine Gerade geben müsste, auf der man unter Aufrechterhaltung aller linearen Axiome Punkte hinzufügen könnte, eine 1)
Das für eine Klasse geltende Vorzeichen ist nicht unabhängig von der gewählten Darstellung (u, v, w) der Geraden bestimmt, wohl aber ist die Klassen-Einteilung unabhängig von dieser Darstellung.
30
35
‘Prinzipien der Mathematik’
5
10
15
79
solche Möglichkeit aber dem arithmetischen Vollständigkeits-Axiom widerstreiten würde. Somit ist der Beweis der Widerspruchslosigkeit für die geometrischen Axiome in dem vorher erläuterten Sinne erbracht. Wir haben uns dazu der geläufigen Methode der analytischen Geometrie bedient. Auch wenn uns diese Methode noch nicht bekannt wäre, müssten wir durch die Frage nach der Widerspruchslosigkeit der Euklidischen Geometrie auf den Gedanken der analytischen Geometrie geführt werden. Dieser grosse von Cartesius herrührende Gedanke, welcher in der Entwicklung der Mathematik als historisch zufällig auftritt, erscheint also in diesem Zusammenhang als eine Notwendigkeit, wie es überhaupt charakteristisch für die axiomatische Methode ist, dass sie historisch zufällig Erscheinendes als 21 notwendig erweist. Die Lösung der Frage nach der Widerspruchslosigkeit lässt sich hier bei der Geometrie verhältnismässig einfach bewerkstelligen; sonst ist gerade diese Frage eine der schwierigsten und besonders in der Grössenlehre bildet sie ein noch unge|löstes Problem. Unabhängigkeit des letzten Kongruenz-Axioms von allen übrigen Axiomen
20
25
30
35
Wir wollen uns nun den Fragen der Abhängigkeit zuwenden, welche in Hinsicht auf die Einsichten, zu denen sie uns führen, noch fruchtbarer sind. Vor allem haben wir dabei auf die Axiomgruppen im ganzen zu achten, von denen wir erwarten müssen, dass sie voneinander unabhängig sind. Um die wichtigsten Beispiele herauszugreifen, will ich für jede der Axiomgruppen III, IV, V den Nachweis ihrer Unabhängigkeit von den übrigen Axiomgruppen dem Grundgedanken nach ausführen, wobei ich mich wieder auf die ebene Geometrie beschränken will. Zunächst soll für die Gruppe III der Unabhängigkeits-Beweis geliefert werden, indem gezeigt wird, dass das Axiom III 5) von sämtlichen übrigen Axiomen unabhängig ist, d. h. nicht aus ihnen bewiesen werden kann. Die Aufgabe dieses Unabhängigkeits-Beweises besteht darin, die Möglichkeit einer modifizierten Geometrie1) nachzuweisen, bei welcher alle in unserem System aufgestellten Axiome gelten mit Ausnahme des Axioms III 5). Dazu verfahren wir ganz ähnlich wie beim Beweise der Widerspruchslosigkeit. Wir verstehen wieder unter einem Punkt ein Zahlenpaar (x, y), unter einer Geraden das Verhältnis dreier Zahlen u, v, w, von denen u und v nicht zugleich 0 sind. Dass ein Punkt (x, y) auf einer Geraden (u, v, w) liegt, soll wieder besagen, dass die Gleichung ux + vy + w = 0 besteht. 1) Es ist üblich, Axiomen-Systeme, die sich nur wenig von dem System der geometrischen Axiome unterscheiden, im weiteren Sinne auch als „Geometrien“ zu bezeichnen. 21 Added
by Hilbert (pencil): logisch
24
80 25
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Ferner definieren wir die Anordnung der Punkte auf einer Geraden genau wie vorhin und die Winkel-Kongruenz erklären wir wieder mit Hilfe der Substitutionen, welche bezüglich einer Parallelverschiebung, einer Drehung und einer Umklappung entsprechen. Dann sind alle Axiome der Gruppen I, II, IV, erfüllt, und von der dritten Gruppe bleibt das Axiom 4) gültig. Nun führen wir die Strecken-Kongruenz in der Weise ein, dass wir einer durch zwei Punkte P1 = (x1 , y1 ) und P2 = (x2 , y2 ) bestimmten Strecke die Zahl L(P1 P2 ) = (x2 − x1 + y2 − y1 )2 + (y2 − y1 )2 als ihre „Länge“ zuordnen und zwei Strecken als kongruent bezeichnen, wenn sie gleiche Länge haben. Bei dieser Festsetzung wird offenbar den Axiomen III 1) und 2) Genüge geleistet. Auch das Axiom III 3) bleibt gültig. Denn sind P1 , P2 , P3 drei Punkte auf einer Geraden g, P1 , P2 , P3 drei Punkte auf einer Geraden g und liegt P2 zwischen P1 und P3 , P2 zwischen P1 und P3 , so können die Parameter-Darstellungen von g und g x = at + c y = bt + d
10
15
x = a t + c y = b t + d
derart gewählt werden, dass für die Werte von t und t , welche bezüglich den genannten Punkten auf g und g entsprechen, die Ungleichungen t1
t1 < t2 < t3 , bestehen. Wird zur Abkürzung (a + b)2 + b2 = w,
5
<
t2
<
20
t3
(a + b )2 + b2 = w
gesetzt, so erhält man 26
L(P1 P2 ) = w(t2 − t1 ),
L(P2 P3 ) = w(t3 − t2 ),
L(P1 P3 ) = w(t3 − t1 )
L(P1 P2 )
L(P2 P3 )
L(P1 P3 )
=w
(t2
−
t1 ),
=w
(t3
−
t2 ),
=w
(t3
−
25
t1 )
und daraus weiter L(P1 P3 ) = L(P1 P2 ) + L(P2 P3 ) L(P1 P3 ) = L(P1 P2 ) + L(P2 P3 ) Aus diesen Gleichungen geht nun unmittelbar hervor, dass unter der Voraussetzung der Gleichungen L(P1 P2 ) = L(P1 P2 ),
30
L(P2 P3 ) = L(P2 P3 )
auch die Gleichung
L(P1 P3 ) = L(P1 P3 ) besteht. Das ist aber gerade der Inhalt des Axioms III 3). Auf Grund der Darstellung der Länge einer Strecke P1 P2 durch den Ausdruck w(t2 − t1 ) ergibt sich auch der Nachweis, dass für die betrachtete Geometrie die Axiome der Stetigkeit erhalten bleiben.
35
40
‘Prinzipien der Mathematik’
5
10
15
81
Somit erweisen sich alle Axiome als gültig, abgesehen von III 5). Sollte dieses Axiom auch noch erfüllt sein, so müsste auch der erste DreiecksKongruenzsatz bestehen. Das ist jedoch nicht der Fall, wie folgendes Beispiel lehrt: Werden bezüglich mit O, A, B, C die Punkte (0, 0), (1, 0), (0, 1), ( 12 , 12 ) bezeichnet, so ist 1 L(OC) = L(OC), L(AC) = L(BC) = 2 und ACO ≡ BCO; es müsste also gemäss dem Kongruenzsatz L(OA) = L(OB) sein, während tatsächlich √ L(OA) = 1, L(OB) = 2 ist. Damit ist der Nachweis für die Unabhängigkeit des Axioms III 5) von allen anderen Axiomen erbracht.
27
Unabhängigkeit des Parallelen-Axioms
20
25
30
35
Nach demselben Prinzip, das wir hier befolgt haben, will ich nun die Unabhängigkeit des Parallelen-Axioms von den übrigen Axiomen beweisen. Ich will ein System von Dingen und Beziehungen zwischen diesen derart angeben, dass von allen geometrischen Axiomen einzig das Parallelen-Axiom unerfüllt ist. Dieses Verfahren ist nichts anderes als der Aufbau einer Geometrie, die man als nicht-Euklidische Geometrie bezeichnet, und wir erkennen hier, dass die nicht-Euklidische Geometrie erfunden werden musste, um die Unbeweisbarkeit des Parallelen-Axioms aus den anderen Axiomen einzusehen. Wir waren bei der Aufgabe stehen geblieben, die Unabhängigkeit des Axioms IV von den übrigen geometrischen Axiomen, d. h. die Möglichkeit einer nichteuklidischen Geometrie nachzuweisen. Für diesen Nachweis will ich mich wie bei den vorhergehenden Beweisen des analytischen Verfahrens bedienen, will aber daneben auch die geometrische Interpretation der analytischen Ausdrücke in einer gewöhnlichen Koordinaten-Ebene anwenden, sodass ich die Beziehungen der aufzustellenden nichteuklidischen Geometrie mit Hilfe von Beziehungen aus der gewöhnlichen Euklidischen Geometrie erkläre. Als Punkte der nichteuklidischen Geometrie nehme ich die Zahlenpaare (x, y), für welche y > 0 ist, geometrisch gesprochen die Punkte der oberen Halbebene. Unter einer Geraden will ich verstehen entweder einen Halbkreis der oberen Halbebene, dessen Mittelpunkt auf der x-Achse liegt, oder einen zur x-Achse senkrechten Halbstrahl in der oberen Halbebene (den man gewissermassen als Halbkreis mit unendlich grossem Radius auffassen kann).1) Dabei ist zu 1)
Der Kürze halber sollen im Folgenden die zur x-Achse senkrechten Halbstrahlen auch mit als Halbkreise bezeichnet werden.
28
82
29
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
beachten, dass die auf der x-Achse gelegenen Endpunkte der Halbkreise nicht mit zu den nichteuklidischen Geraden gehören. Der Ausdruck „ein Punkt liegt auf einer Geraden“ soll im gewöhnlichen Sinne verstanden werden, und die Anordnung der Punkte auf einer Geraden soll gemäss der natürlichen Anordnung der Punkte auf den Halbkreisen bestimmt werden. Auf Grund der bisherigen Festsetzungen sind die (ebenen) Axiome der Verknüpfung und Anordnung sämtlich erfüllt. Nun müssen wir die Kongruenz-Beziehungen für Strecken und Winkel einführen. Als Winkel zweier sich schneidender Geraden soll derjenige Euklidische Winkel gerechnet werden, den die Tangenten der beiden darstellenden Halbkreise in deren Schnittpunkt miteinander bilden. Bei dieser Definition bleibt die Möglichkeit und Eindeutigkeit der Winkel-Antragung erhalten. Soll auch die Möglichkeit der Strecken-Abtragung für die nichteuklidische Geometrie allgemein bestehen, so dürfen wir für die Bestimmung der Längen nicht die gewöhnliche Längenmessung auf den Halbkreisen zugrunde legen, sondern müssen eine solche Modifikation vornehmen, dass die nichteuklidische Länge einer Geraden unendlich wird. Dies erreichen wir dadurch, dass wir in dem Integral, durch welches die Bogenlänge dargestellt wird, zu dem Integranden einen Faktor hinzufügen, der bei der Annäherung an die x-Achse hinreichend stark ins Unendliche wächst; und zwar wählen wir den einfachsten Faktor von der verlangten Beschaffenheit, nämlich y1 . Wir definieren also als Länge der Verbindungsstrecke zweier Punkte P1 , P2 den Ausdruck t2 dx 2 dy 2 + dt dt dt y t1
5
10
15
20
30
dy worin zur Berechnung der Differentialquotienten dx dt , dt eine Parameter-Darstellung des von P1 nach P2 führenden Halbkreisbogens zugrunde zu legen ist und t1 , t2 die den Endpunkten P1 , P2 entsprechenden Parameter-Werte bedeuten. Dass gemäss dieser Längenmessung die nichteuklidischen Geraden tatsächlich nach beiden Seiten hin unendlich lang | sind, davon können wir uns durch direkte Rechnung überzeugen. Ist nämlich das Euklidische Bild der Strecke P1 P2 geradlinig, so wählen wir (unter der Annahme y1 < y2 ) als Parameter t die Ordinate y und erhalten für die gesuchte Länge den Ausdruck y2 dy y2 = log y y1 y1
der unendlich wird, sowohl wenn y1 gegen 0 abnimmt, wie auch, wenn y2 ins Unendliche wächst. Stellt sich die Strecke P1 P2 Euklidisch als Halbkreis dar, so nehmen wir (unter der Annahme x1 < x2 ) die Abscisse x als Parameter und erhalten, wenn a die Abscisse des Halbkreis-Mittelpunktes und r den Halbkreis-Radius
25
30
35
40
‘Prinzipien der Mathematik’
83
bedeutet, auf Grund der Beziehungen dy x − a 22 =− , dx y
(x − a)2 + y 2 = r2 , als Wert der Länge: x2 2 1 + (x−a) y2
y
x2 dx = r · x1
x1
1 = log 2
5
10
15
20
dx r2 − (x − a)2
r + (x2 − a) r − (x1 − a) · r − (x2 − a) r + (x1 − a)
,
also einen Ausdruck, der unendlich wird, wenn x1 bei festem x2 dem Werte (a − r) oder x2 bei festem x1 dem Werte (a + r) zustrebt, d. h. wenn einer der beiden Endpunkte an die x-Achse heranrückt. Definieren wir jetzt zwei Strecken als kongruent, wenn sie gleiche nichteuklidische Länge haben, so wird der Forderung der Möglichkeit und Eindeutigkeit der Streckenabtragung genügt, und alle linearen Kongruenz-Axiome sind gültig. Die Wahl des Zusatzfaktors unter dem Integral, die durch die Forderung der unendlichen Länge für die nichteuklidischen Geraden noch in weitgehendem Masse unbestimmt gelassen wird, | haben wir zunächst nur mit Rücksicht auf die Einfachheit getroffen. Diese spezielle Wahl der Funktion y1 wird aber dadurch wesentlich, dass sie die Erhaltung der Gültigkeit des Axioms III 5) und damit des ersten Dreiecks-Kongruenzsatzes für unsere nichteuklidische Geometrie bewirkt. Um diese Tatsache zu beweisen, fassen wir die Punkt-Koordinaten x, y zu komplexen Zahlen z = x + iy zusammen und betrachten die Substitutionen der Form az + b Z= cz + d worin a, b, c, d reelle Zahlen bedeuten, die der Bedingung ad − bc = 1
25
30
unterworfen sind. Durch eine solche Substitution wird, wie man in der Funktionen-Theorie beweist, eine umkehrbar eindeutige, winkeltreue Abbildung der oberen Halbebene auf sich selbst vermittelt, bei der eine Gerade oder ein Kreis wieder in eine Gerade oder einen Kreis übergeführt wird und insbesondere jede unserer nichteuklidischen Geraden wieder in eine nichteuklidische Gerade übergeht. Auch die nichteuklidischen Längen bleiben dabei ungeändert. Denn 22 Added
by Hilbert (pencil) to the right of these equations:
y
P1 r a
P2 r x1 x2
x
31
84
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
sind P1 P2 und P1 P2 zwei vermöge der Abbildung einander entsprechende Strecken, und ist x(t), y(t) eine Parameter-Darstellung von P1 P2 , welcher eine komplexe Funktion z(t) = x(t) + iy(t) der reellen Variablen t entspricht, so erhält man eine Parameter-Darstellung von P1 P2 aus der komplexen Funktion a · z(t) + b = X(t) + iY (t). c · z(t) + d Nach unserer Definition ist die Länge von P1 P2 gleich t2 dz dt dt, y(t) Z(t) =
5
t1
32
und entsprechend die Länge von P1 P2 gleich t2 dZ dt dt. Y (t) t1
Diese beiden Ausdrücke sind aber gleich; denn es ist dZ dZ dz ad − bc dz 1 = dt dz · dt = (cz + d)2 · dt = |cz + d|2
dz · dt
10
und (wenn durch Ueberstreichung einer komplexen Zahl die konjugiert-komplexe Zahl bezeichnet wird) Z −Z ad − bc z−z 1 = · = · y(t), 2i (cz + d)(cz + d) 2i |cz + d|2 sodass die Integranden der beiden Integrale übereinstimmen. Dieselben Erhaltungs-Eigenschaften wie die eben betrachteten Substitutionen besitzt, wie unmittelbar ersichtlich, auch die Spiegelungs-Transformation Y (t) =
x = −x,
15
y = y,
durch welche gleichfalls die obere Halbebene in sich übergeführt wird; und das Gleiche gilt daher auch von denjenigen Substitutionen, welche man durch Kombination der Spiegelung mit einer der früheren Substitutionen erhält. In der so erweiterten Gesamtheit von Transformationen gibt es (wie sich durch Anwendung der Gruppen-Eigenschaft dieser Transformationen zeigen lässt) stets eine und nur eine Substitution, welche einen gegebenen Winkel unserer nichteuklidischen Geometrie in einen vorgeschriebenen kongruenten Winkel
20
25
‘Prinzipien der Mathematik’
85
(bei willkürlich festgesetzter Zuordnung der Schenkel) überführt.H Auf Grund dieses Umstandes können wir nun folgendermassen schliessen: Es seien ABC und A B C zwei nichteuklidi|sche Dreiecke, welche die Voraussetzungen des ersten Kongruenz-Satzes AB ≡ A B ,
5
10
15
20
25
30
AC ≡ A C ,
BAC ≡ B A C
erfüllen. Dann wählen wir unter den betrachteten Substitutionen diejenige, welche den Winkel BAC in den Winkel B A C überführt. Da bei dieser Substitution die Längen erhalten bleiben, so muss B in B und C in C übergehen. Es wird also das Dreieck ABC auf das Dreieck A B C abgebildet. Dies ist aber wegen der Winkeltreue und Längentreue der Transformation nur dadurch möglich, dass die entsprechenden Seiten und Winkel der beiden Dreiecke kongruent sind. Es gilt also für die definierte nichteuklidische Geometrie auch das letzte Kongruenz-Axiom. Dass auch die Axiome der Stetigkeit erfüllt sind, ergibt sich hier ganz ebenso wie bei der gewöhnlichen analytischen Geometrie. Es steht also einzig das Parallelen-Axiom in Frage, und dieses gilt nun für die definierte Geometrie keineswegs. Um dies einzusehen, betrachte man irgend einen der zur x-Achse senkrechten Halbkreise, welcher eine nichteuklidische Gerade a darstellt. A sei ein Punkt (der oberen Halbebene) ausserhalb von a. Dann gibt es genau zwei Orthogonalkreise (im weiteren Sinne, sodass auch einer von ihnen eine Gerade sein kann) durch A, welche den Halbkreis a in einem Punkte der x-Achse berühren. Durch diese beiden nichteuklidischen Geraden werden vier Scheitelräume abgegrenzt, in deren einem die Gerade a vollständig enthalten ist, sodass a von keiner | der in dem anstossenden Winkelräumen a A verlaufenden, durch A gehenden Geraden, und übrigens auch nicht von den beiden begrenzenden Geraden getroffen wird. Es gibt also für eine Gerade unserer nichteuH
y
i bleibt invariant ai + b ci + d az + b Z= , −bz + a i=
i
a=d
b = −c
a2 + b 2 = 1 a = sin φ,
x 2.) b = 0 c=0 a Z = z = a2 z d
der Punkt wandert auf der y-Achse! 23
23 Added
by Hilbert (pencil) on the reverse of p. 32.
33
b = cos φ
34
86
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
klidischen Geometrie durch einen ausserhalb gelegenen Punkt kontinuierlichunendlich viele nichtschneidende Geraden.I Somit ist gezeigt, dass das Parallelen-Axiom aus den übrigen (ebenen) Axiomen der Geometrie nicht bewiesen werden kann. Nun handelt es sich noch darum, den entsprechenden Nachweis für die Gruppe der StetigkeitsAxiome zu erbringen.
5
Unabhängigkeit des Archimedischen Axioms sowie des Vollständigkeits-Axioms
f (t)+g(t)
. Weiter überzeugt man sich g(t) liegen stets noch Funktionen, z. B. 2 leicht, dass für diese Grössen-Vergleichung alle arithmetischen AnordnungsAxiome gelten; insbesondere gilt auch hier der Satz, dass aus f > g, p > 0 auf f p > gp geschlossen werden kann. Hingegen trifft das Archimedische Axiom hier nicht zu; denn, wie gross ich auch die Zahl der Summanden wähle, so ist doch eine Summe 1 + 1 + . . . + 1 stets kleiner als die Funktion t. I
Die Legendreschen Sätze gelten. Die Winkelsumme im Dreieck variert zwischen 0 und 2R 24
24 Remark
Nahezu = 2R
seh r kl ein
35
Ziehen wir zunächst das Axiom des Messens V 1) in Betracht. Zum Beweise der Unabhängigkeit dieses Axioms von den Axiomen der ersten vier Gruppen können wir so verfahren, dass wir die analytische Geometrie modifizieren, indem wir anstelle des Systems der reellen Zahlen ein „nichtarchimedisches Zahlensystem“ einführen, d. h. ein System von Gegenständen, für welche die elementaren Rechen-Operationen und die Beziehungen des „grösser“ und „kleiner“ so definiert sind, dass alle arithmetischen Axiome gelten mit Ausnahme der Stetigkeits-Axiome. Das einfachste Beispiel eines nichtarchimedischen Zahlensystems liefert die Gesamtheit der rationalen Funktionen einer Variablen t mit ganzen rationalen Koeffizienten (worin natürlich die rationalen Konstanten inbegriffen sind). Für diese Funktionen sollen die Rechen-Operationen in der gewöhnlichen Weise ausgeführt werden, sodass die arithmetischen Axiome der Verknüpfung und der Rechnung ohne weiteres erfüllt sind, und die Ordnung nach der Grösse soll so bestimmt sein, dass f (t) grösser | als g(t) heisst, wenn für alle hinreichend grossen positiven Werte von t die Differenz f (t) − g(t) positiv ist. Da eine rationale Funktion, sofern sie nicht identisch gleich 0 ist, höchstens endlich viele Nullstellen besitzt, so ist ersichtlich, dass nach dieser Definition unter zwei verschiedenen unserer Funktionen stets eine und nur eine die grössere ist. Ferner gibt es zu jeder Funktion f (t) eine grössere, nämlich f (t) + 1 und eine „kleinere“, nämlich f (t) − 1, und zwischen zwei verschiedenen Funktionen f (t) und
added by Hilbert (pencil) in left-hand margin; the diagrams are on the reverse of p. 33, facing p. 34.
10
15
20
25
30
35
‘Prinzipien der Mathematik’
5
10
15
20
25
30
35
40
87
Dieses so einfach konstruierte nichtarchimedische Zahlensystem genügt jedoch nicht vollständig für den gewünschten Unabhängigkeits-Beweis, weil zur Bildung der für die analytische Geometrie erforderlichen Rechenausdrücke die elementaren Operationen nicht ausreichen, sondern noch Ausdrücke der Form √ a2 + b2 A , also Quadratwurzeln aus Quadratsummen hinzugenommen werden müssen. Wir müssen daher die betrachtete Funktionengesamtheit so weit ausdehnen, dass darin jede Gleichung der Form U 2 = f 2 + g 2 für gegebene Funktionen f und g der Gesamtheit lösbar ist. So werden wir darauf geführt, ein Funktionen-System S zu betrachten, welches sich charakterisieren lässt als die kleinste Gesamtheit | von Funktionen mit folgenden drei Eigenschaften: 1. Sie enthält eine Variable t; 2. Sie enthält zugleich mit zweien ihrer Elemente, f und g, deren Differenz f − g und, falls nicht g identisch gleich 0 ist, den Quotienten f /g; 3. Sie enthält zugleich mit jedem ihrer Elemente f die Lösung (genauer die beiden nur durch das Vorzeichen unterschiedenen Lösungen) der Gleichung U 2 = 1 + f 2 .B Gemäss allgemeinen Sätzen der Algebra sind die Elemente dieses Systems S algebraische Funktionen von t, auf welche die elementaren Rechen-Operationen in gewöhnlicher Weise anwendbar sind und welche (abgesehen von der Konstanten 0) ebenso wie die rationalen Funktionen höchstens endlich viele Nullstellen besitzen. Wir können daher auf das System S die vorhin angegebene Definition für die Grössen-Beziehung anwenden und erhalten so ein nichtarchimedisches Zahlen-System. Führen wir dieses Zahlen-System anstelle des Systems der reellen Zahlen in die analytische Geometrie ein, so ergibt sich eine Geometrie, welche den Axiomen der ersten vier Gruppen genügt, während sie das Axiom des Messens nicht erfüllt; und damit ist die Unabhängigkeit des Axioms V 1) von den vorhergehenden Axiomen bewiesen. An die eben ausgeführte Ueberlegung lässt sich in einfacher Weise ein Unabhängigkeits-Beweis für das Vollständigkeits-Axiom anschliessen. Dazu betrachten wir das System s, welches aus allen im System S enthaltenen Konstanten besteht. Da innerhalb dieses Systems alle für die analytische Geometrie benötigten Rechen-Operationen ausführbar sind, so können wir das System s anstelle des Systems aller reellen Zahlen für die Definition einer analytischen Geometrie zugrunde legen, und es wer|den dann die Axiome der vier ersten Gruppen befriedigt. Da ferner die beim System S definierte Grössenvergleichung für die Elemente von s mit der gewöhnlichen Grössen-Vergleichung zusammenfällt, so bleibt auch das Axiom des Messens gültig. Dagegen ist das Axiom der Vollständigkeit nicht erfüllt, weil das System s nicht sämtliche √ reellen Zahlen enthält; z. B. lässt sich ziemlich einfach zeigen, dass die Zahl 3 2 nicht in s vorkommt. Bei geometrischer Einkleidung läuft diese Argumentation auf den Nachweis hinaus, dass die in den geometrischen Axiomen geforderten Konstruktionen des Ziehens einer Geraden durch zwei gegebene Punkte, des StreckenAbtragens und des Winkel-Antragens für sich noch nicht ausreichen, um von A B
Vgl. S. 22. Added by Hilbert (pencil) in left-hand margin. d. h. der Prozess 1 + f 2 . Added by Hilbert (pencil) in left-hand margin.
36
37
88
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
der Einheits-Strecke ausgehend alle in der gewöhnlichen analytischen Geometrie vorkommenden Strecken zu konstruieren.C Wir haben nunmehr die wichtigsten Beispiele von Unabhängigkeits-Beweisen kennen gelernt. Mit diesen Beweisen für die gegenseitige Unabhängigkeit der Axiomgruppen sind aber die axiomatischen Untersuchungen über logische Abhängigkeits-Verhältnisse noch nicht abgeschlossen. Man begnügt sich in der Axiomatik nicht damit, zu wissen, dass sich das aufgestellte System von Axiomen nicht wesentlich reduzieren lässt, sondern man wünscht auch durch die axiomatische Methode einen tieferen Einblick in den Zusammenhang der geometrischen Sätze zu gewinnen. Ich möchte von der Art der Betrachtung, auf die es hier ankommt, einige der populärsten Anwendungen der Nicht-Archimedischen Geometrie vortragen. C
Wenn man irgendein Axiom weglässt, bleiben die anderen erst recht unabhängig — ausgenommen, wenn V2 in Frage kommt. Wenn wir z. B. V1 weglassen, so ändert sich auch wesentlich der Inhalt von V2. Es ist sogar die Frage, ob V2 dann überhaupt möglich ist. Ich glaube ja, wenn man „alle“ Nicht-Archimedischen Zahlen als Punkte deutet!? Hierzu noch den Zusatz vgl. Einbanddeckel! 25
25 Added by Hilbert (pencil) in the left-hand margin. The reference is to a passage in Hilbert’s hand (ink) on the inside ‘Einbanddeckel’ in which the typescript is bound: ‘Zu S. 37 Wir haben die Unabhängigkeit der Axiome der Gruppe III, der Gruppe IV und schliesslich der Gruppe V von den übrigen festgestellt. In gewissem Sinne ist es auch fruchtbar, die Unabhängigkeit der Gruppe II zu untersuchen. Nämlich wir lassen das Axiom fallen, dass von 3 Punkten stets einer zwischen den beiden Anderen liegt und fordern nur die lineare Anordnung der Punkte. Dann muss offenbar die Gerade geschlossen sein und daher nach Archimedes endlich. Und dann können wir beweisen, dass jede Gerade jede andere schneiden muss, also IV keinen Sinn hat bez. sicher erfüllt ist in der Formulirung, dass es höchstens eine Gerade durch A geben darf, die a nicht schneidet. Beweis: AB ⊥ a.
A a C
B
D
Ich trage die Hälfte der Länge von a von B aus auf a nach rechts und links ab u. erhalte dann den selben Punkt C = D. Ich verbinde C mit A. Die Verlängerung über A hinaus trifft D, da ja D = C. Folglich schneidet jede Gerade durch A die Gerade a. Diese elliptische Geometrie hat desshalb die grösste Bedeutung, weil sie die in Wirklichkeit geltende ist. Sie wird durch die Punkte der Halbkugel representirt, wobei die Vis-à-vis-punkte des Grenzkreises als paarweise mit einander identisch anzurechnen sind. Sie steht mit dem Parallelenaxiom nicht im Widerspruch, wenn wir dasselbe so formuliren, dass durch A höchstens eine Gerade gehen soll, die a nicht schneidet. So können wir auch sagen, dass Gruppe II von allen übrigen Axiomgruppen unabhängig ist. Vielleicht setzt man übrigens lieber IV schon an zweite Stelle!’
5
10
‘Prinzipien der Mathematik’
89
3. Aufbau der Geometrie unter Vermeidung der Stetigkeits-Axiome.
38
Aufweisung zweier Mängel in der gewöhnlichen Darstellung der Elementar-Geometrie
5
10
15
20
25
30
35
Ich will zeigen, dass es in der Begründung der Elementar-Geometrie verschiedene Stellen gibt, die der Verbesserung bedürftig sind. Es handelt sich dabei vornehmlich um zwei Punkte in den üblichen Darstellungen der Planimetrie, auf die ich zunächst einmal hinweisen möchte, ohne sie schon gleich in der Kürze erledigen zu können. Wenn man in Anlehnung an Euklid die Entwicklung der Planimetrie durchführt, so kommt man an eine Stelle, die aus dem Rahmen des bis dahin befolgten Gedankenganges herausfällt. Diese findet sich bei der Begründung der Proportionen-Lehre, wo der Satz aufgestellt wird, dass die Abschnitte, welche auf den Schenkeln eines Winkels durch zwei sie schneidende, zueinander parallele Gerade erzeugt werden, in gleichem Längenverhältnis stehen. 26 Dieser Satz ist in dem Spezialfall, wo man weiss, dass die Längen der Abschnitte auf einem der Halbstrahlen kommensurabel sind, mit Hilfe des zweiten Kongruenzsatzes beweisbar; im allgemeinen Falle ist jedoch dazu die Anwendung der Stetigkeit erforderlich. Diese Benutzung der Stetigkeit tritt hier als eine der bisherigen Betrachtung ganz fremde Schlussweise auf, und zwar erscheint das noch besonders deshalb unbefriedigend, weil jener Proportionssatz u. a. auch zum Beweise einiger Schnittpunktssätze angewandt wird, die ihrem Inhalte nach von den Gesetzen der Stetigkeit unabhängig zu sein scheinen. So wird die Frage nahegelegt, ob sich jene Stetigkeits-Betrachtung nicht umgehen lässt. Diese Frage wäre in bejahendem Sinne gelöst, wenn es gelänge, der Formel des Proportions-Satzes eine | von der Stetigkeit unabhängige Bedeutung zuzuschreiben. Während bei der eben besprochenen Stelle nur in Hinsicht auf die Einheitlichkeit der Beweismethoden ein Mangel zu konstatieren ist, findet sich bei dem anderen Punkt, den ich erwähnen will, etwas direkt logisch Anfechtbares in der Argumentation. Dies tritt bei der Begründung der Lehre von den Flächeninhalten auf. In üblicher Weise verfährt man dabei folgendermassen: es werden kongruente Dreiecke als inhaltsgleich bezeichnet, ferner auch solche Dreiecke, die in kongruente Teile zerlegt werden können oder die durch Subtraktion kongruenter Dreiecke entstanden sind. Von dieser Bedeutung der Inhalts-Gleichheit macht man Gebrauch beim Beweise des Satzes, 26 Added
by Hilbert (pencil) in the left-hand margin:
39
90
40
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
dass Dreiecke mit gleicher Grundlinie und gleicher Höhe inhaltsgleich sind. Gegen dieses Verfahren ist an sich nichts einzuwenden; man kann in der Tat Inhalts-Gleichheit so definieren: Figuren haben gleichen Inhalt, wenn sie nach Hinzufügung kongruenter Figuren in paarweise kongruente Teile zerlegt werden können. Nun braucht man aber für die Lehre von den Flächeninhalten auch die Umkehrung des eben erwähnten Dreiecks-Satzes, nämlich den Satz, dass zwei Dreiecke, wenn sie gleichen Inhalt und gleiche Grundlinie haben, auch gleiche Höhe besitzen. Um diesen Satz indirekt zu beweisen, zeigt Euklid zunächst, dass wenn zwei inhaltsgleiche Dreiecke mit gleicher Grundlinie verschiedene Höhe hätten, dann eines der beiden Dreiecke einem Teildreieck inhaltsgleich sein müsste, und zur Ausschliessung dieses Falles wendet er dann das Prinzip an, dass der Teil nicht gleich dem Ganzen sein kann. Diese Schlussweise ist aber unzulässig; | denn da wir bereits die Bedeutung der Inhaltsgleichheit festgelegt haben, steht es uns nicht mehr frei, jenes Prinzip als Voraussetzung zu nehmen. Diese Voraussetzung könnte ja sogar mit unserer Definition der Inhaltsgleichheit unverträglich sein.D Indem sich Euklid auf jenen allgemeinen Grössensatz beruft, bringt er zwei Begriffe von Inhaltsgleichheit durcheinander. Hier liegt also eine Unrichtigkeit in dem Beweisverfahren vor. Soll es uns gelingen, die Schlussweise korrekt zu gestalten, so müssen wir für den von Euklid benutzten Satz, dass der Teil nicht gleich dem Ganzen sein kann, einen Beweis erbringen. Mit der Ausführung dieses Beweises werden wir uns also zu befassen haben.E D Der Satz, dass der Teil < als das Ganze ist, gilt nur für endliche Gesammtheiten; die Teilung eines Dreieckes in Teildreiecke ist aber unbegrenzt möglich! Added by Hilbert (pencil) in left-hand margin. E
Beispiel, wie von 2 einander sogar kongruenten ebenen Flächenstücken das eine Teil des anderen ist:
The diagrams and note are added by Hilbert (pencil) on the lower (blank) page.
5
10
15
20
‘Prinzipien der Mathematik’
5
Das Problem der Beseitigung der beiden von mir hervorgehobenen traditionellen Lücken im Aufbau der Planimetrie, von denen die eine in der Proportionenlehre, die andere in der Lehre von den Flächeninhalten auftritt, lässt sich in der Ausdrucksweise der Axiomatik dahin präzisieren, dass es darauf ankommt, die Theorie der Strecken-Verhältnisse und der Inhalte von Polygonen ohne Benutzung der Stetigkeits-Axiome zu begründen und somit überhaupt im Aufbau der Geometrie der geradlinigen (ebenen) Figuren die Anwendung jener Axiome zu vermeiden. Dieses Ziel lässt sich nun in der Tat erreichen, und ich will den Weg dazu in den Hauptzügen darstellen.
20
25
30
35
40
41
Begründung der Proportionen-Lehre
10
15
91
Hierfür ist vor allem nötig, eine Strecken-Rechnung mit alleiniger Bezugnahme auf die ersten vier Axiom-Gruppen in die Geometrie einzuführen. Wir wollen also für die Strecken-Längen (die im Folgenden durch kleine lateinische Buchstaben bezeichnet werden sollen) die elementaren Rechenoperationen mit Hilfe der geometrischen Begriffsbildungen so definieren, dass die gewöhnlichen Rechenregeln gültig sind. Wie die Addition und die Subtraktion (einer kleineren Strecke von einer grösseren) zu erklären ist, ersieht man unmittelbar auf Grund des Axioms III 3)F . Dagegen ist die Erklärung der Multiplikation nicht ohne weiteres gegeben. Wir führen sie folgendermassen ein: Man trage die Strecken a, b, deren Produkt gebildet werden soll, auf einen der Schenkel eines rechten Winkels, dessen Scheitelpunkt O heisse, von O aus ab. Die Endpunkte der abgetragenen Strecken mögen mit A, B bezeichnet werden. Ferner werde eine willkürlich gewählte, | von da an aber festzuhaltende Streckenlänge gleich 1 gesetzt. Diese „Einheits-Strecke“ werde von O aus auf den zweiten Schenkel des rechten Winkels abgetragen, wodurch man den Punkt E erhalte. Da die Punkte A, B, E nicht auf einer Geraden liegen, so gibt es, wie man in üblicher Weise zeigt, einen eindeutig bestimmten Punkt M , für welchen die Abstände von jenen drei Punkten einander gleich sind. Ferner gibt es auf der durch O und E gehenden Geraden im allgemeinen einen und nur einen von E verschiedenen Punkt C, für welchen M C ≡ M E ist; und zwar liegt dieser auf dem Halbstrahl OE. Nur im Falle, wo M E auf der Geraden OE senkrecht steht, gibt es keinen derartigen Punkt. Wir definieren nun in dem erstgenannten Falle die Länge c der Strecke OC als das Produkt a · b von a und b; und in dem Ausnahmefalle setzen wir a · b gleich der Länge 1 der Strecke OE, (die wir, der Einheitlichkeit der Schreibweise halber, in diesem Falle zugleich auch mit OC bezeichnen wollen). Die hiermit gegebene Erklärung der Multiplikation kommt geometrisch darauf hinaus, dass wir die Produktbildung gemäss dem Sekantensatz der Kreislehre einrichten, wobei dem Ausnahmefall die Ersetzung einer Sekante durch eine Tangente entspricht. Aus dieser Bemerkung erhalten wir auch die F
S. 9 Added by Hilbert (pencil) in left-hand margin.
42
92
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
5
10
15
Anweisung, wie wir in dem bisher noch unerledigten Fall zu verfahren haben, wo a = b ist, also A mit B zusammenfällt. Wir müssen dann M so bestimmen, dass M A ≡ M E ist und M A auf OA senkrecht steht. Bei dieser Art der Definition des Produktes ergibt sich ohne weiteres das kommutative Gesetz ab = ba, ferner die eindeutige Umkehrbarkeit der Multi43 plikation und auch die Gleichung | 1 · a = a, gemäss welcher die mit 1 benannte Länge tatsächlich die Rolle der Einheit für unsere Multiplikation spielt. Zu den weiteren Gesetzen gelangen wir nicht so direkt, sondern auf einem Umwege, indem wir nämlich finden, dass sich die zu der Produktbildung angewandte Konstruktion durch eine andere ersetzen lässt. Auf diese Tatsache führt uns die Beachtung des Umstandes, dass die vier Punkte A, B, C, E gleichen Abstand von M haben, also, gemäss der in der Kreislehre üblichen Ausdrucksweise, ein Sehnenviereck bilden. Hieraus folgt, wie man in der Elementargeometrie (auf Grund der Axiome I–IV) beC weist, dass ABC entweder gleich dem WinM kel AEC oder gleich dessen Nebenwinkel ist, c und dies besagt für unsere Figur, dass jedenfalls E 1 AEO ≡ ABC ist, sodass, wenn wir OE auf OB und OA auf OC von O aus abtragen, die O A B Verbindungslinie der erhaltenen Endpunkte zu 1) a Demnach können wir den BC parallel wird. b Punkt C, dessen Abstand uns das Produkt ab angibt, auch so finden, dass wir auf den einen Schenkel des rechten Winkels die Strecke OE von der Länge 1 und die Strecke OB von der Länge b, auf den anderen Schenkel die Strecke OA von der Länge a abtragen, dann E mit A verbinden und zu dieser Verbindungslinie durch B die Parallele ziehen, von der sich auf Grund des Parallelen-Axioms beweisen lässt, dass sie den zweiten Schenkel des rechten Winkels schneiden muss. 27 Ist C der Schnittpunkt, so 44 ist die Länge | von OC gleich dem Produkt von a und b. 1)
Bei dieser Ueberlegung wurde nur der Hauptfall in Betracht gezogen, dass A, B, C, E vier voneinander verschiedene Punkte sind. Die Ausnahmefälle, wo A mit B oder C mit E zusammenfällt, lassen sich in entsprechender Weise erledigen. 27 Hilbert (pencil) has altered the diagram of the typescript from the original (below, left). In the left-hand margin, he has added ‘E A BC’, and then a second diagram (below, right) on the reverse of p. 42, facing p. 43:
ab C
M
O
A
B
A
a
E
O 1
E
B b
20
25
30
‘Prinzipien der Mathematik’
5
10
15
20
93
Bei dieser Konstruktionsweise des Produktes ist die eindeutige Umkehrbarkeit der Multiplikation sowie das Bestehen der Gleichung 1 · a = a wiederum unmittelbar einzusehen. Hingegen erscheint hier das kommutative Gesetz keineswegs als trivial. Tragen wir nämlich auf dem einen Schenkel des rechten Winkels vom Scheitel O aus die Strecken B OE, OA, OB ab, deren Längen bezüglich 1, a, b seien, auf den anderen A Schenkel die Strecken OA , OB , OC b E mit den Längen a, b, a · b, wobei zua 1 nächst AA parallel zu BB und gemäss der Konstruktions-Regel EA parallel zu C O A B BC sein muss; dann besagt das koma mutative Gesetz, dass die durch A zu b ab EB gezogene Parallele durch den Punkt C geht. 28 Berücksichtigen wir, dass die Punkte E und A auf dem einen Schenkel, B auf dem anderen Schenkel des rechten Winkels ganz willkürlich gewählt werden können, so erhalten wir einen Schnittpunktsatz, welcher einen Spezialfall des Pascal’schen Satzes über die Sehnen-Sechsecke von Kegelschnitten darstellt, und den wir folgendermassen formulieren können: Liegen die Ecken eines Sechsecks abwechselnd auf dem einen und dem anderen Schenkel eines rechten Winkels, liegen ferner zwei Paare von Gegenseiten auf parallelen Geraden und werden durch die Seiten eines dieser Paare auf dem einen Schenkel des rechten Winkels ebenso grosse
28 In the diagram, the letters ‘a’, ‘b’, ‘ab’, and the braces have been added by Hilbert (pencil); the capital letters ‘A’, ‘B’, etc., are in ink, presumably written by Bernays. Originally, the horizonal letters, and not the vertical ones, had primes (A , B , C ), but this was changed by Hilbert. Hilbert (pencil) added a slightly modified diagram on the reverse of p. 43, facing p 44:
B ab A a A
E b
B
94
Lectures on the Principles of Mathematics (1917/18)
Abschnitte erzeugt wie auf dem anderen Schenkel, so liegt auch das dritte Paar von Gegenseiten auf parallelen Geraden. Die | Gültigkeit dieses Satzes haben wir dadurch bewiesen, dass wir die Aequivalenz der zweiten ProduktKonstruktion mit der ersten aufgedeckt haben, bei welcher die Kommutativität der Multiplikation selbstverständlich ist. Auf Grund des gefundenen Schnittpunktsatzes ergibt sich nun auch das assoziative Gesetz für die Multiplikation. Um dies einzusehen, 29 tragen wir auf den ersten Schenkel des rechten Winkels die Strecken OE, OB, OP , OQ ab mit den Längen 1, b, p = ab, q = cb, auf den anderen Schenkel die Strecken OA , OC , OP , OQ , OR mit den Längen a, c, p, q, r = cp, und betrachten das Sechseck R P P BQ Q, dessen Ecken abwechselnd auf dem einen und dem anderen Schenkel des rechten Winkels liegen. Hierin ist P P parallel zu QQ , und gemäss der Regel der zweiten Produkt-Konstruktion sind BQ und P R beide zu EC , also auch zueinander parallel; ferner ist OP = OP , OQ = OQ . Also müssen gemäss dem Schnittpunktsatz BP und QR einander parallel sein. Nun ist aber auf Grund der Produkt-Konstruktion BP parallel zu EA , folglich ist auch QR parallel zu EA . Dies bedeutet aber, dass r = aq,
cp = aq,
5
10
15
c(ab) = a(cb)
oder auch, wegen der Gültigkeit des kommutativen Gesetzes, (ab)c = a(bc) ist.
by Hilbert (pencil) on the reverse of p. 44, facing p. 45:
hier 1, p abgetragen
29 Added
hier 1, b abgetragen
45
Chapter 1
cb = q Q ab = p P b B
1 E
O
A a
Q C P R c p = ab q = cb cp = r
hier a abgetragen hier c abgetragen
20
‘Prinzipien der Mathematik’
5
10
15
20
25
30
95
Somit erweist sich auch das assoziative Gesetz für die Strecken-Multiplikation als gültig. 30 Nun bleibt nur noch das distributive Gesetz zu beweisen. Und dieses ergibt sich sofort aus der zweiten Produkt-Konstruktion vermittelst derselben Schlüsse, durch welche man im Falle kommensurabler Abschnitte den Strecken-Proportionssatz beweist. Hiermit ist nun die Strecken-Rechnung vollständig begründet, indem wir uns davon überzeugt haben, dass wir auf die eingeführte Addition und Multiplikation der Strecken die Regeln der Arithmetik anwenden dürfen. Dadurch sind wir jetzt auch imstande, den Strecken-Proportionen ohne Zuhilfenahme der Stetigkeits-Axiome eine Deutung zu geben. Wir fassen nämlich eine Proportion a:b=c:d lediglich als eine andere Schreibweise auf für die Strecken-Gleichung ad = bc. Dass bei dieser Interpretation der Strecken-Proportionen sich die bekannten Sätze der Proportionslehre ergeben, wird erwiesen sein, wenn wir auf Grund unserer Definitionen den Satz beweisen können, das in „ähnlichen“ Dreiecken, d. h. in Dreiecken mit paarweise gleichen Winkeln, die entsprechenden Seiten proportional sind. Und dies ist in der Tat möglich. Zunächst folgt aus der zweiten Methode der Produkt-Konstruktion, dass D in ähnlichen rechtwinkligen Dreiecken 31 die Katheten proportional sind. Sind nämlich a, b die Katheten-Längen in d B l dem einen, c, d die Längen der entspreb a chenden Katheten in dem anderen rechtC A E winkligen Dreieck, so trage man von dem 1 Scheitelpunkt O eines rechten Winkels c auf den einen Schenkel die Strecken OE, OA und OC mit den Längen 1, a, c, auf 30 Added
by Hilbert (pencil) on the reverse of p. 44, facing p. 45:
a(b + c) ab ac ab a 1
b
a(b + c) = ab + ac 31 The
c b
labeling of the diagram is in ink, presumably carried out by Bernays.
46
96
47
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
den anderen Schenkel die Strecken OB, OD mit den Längen b, d ab. Dann sind zu|nächst die Dreiecke OAB, OCD bezüglich kongruent zu den beiden gegebenen Dreiecken, ihre entsprechenden Winkel sind also gleich, und daher ist die Gerade AB parallel zu CD. Zieht man nun durch E die Parallele zu diesen beiden Geraden, welche den zweiten Schenkel in einem Punkte schneidet, dessen Abstand von O gleich l sei, so ergeben sich die Gleichungen b = la, d = lc, lad = blc = lbc,
5
ad = bc, d. h.
48
10
a : b = c : d. Nachdem für diesen Spezialfall der Satz bewiesen ist, kann man folgendermassen weiter schliessen: Es seien irgend zwei ähnliche Dreiecke und gegeben, deren Seitenlängen bezüglich mit a, b, c und a , b , c bezeichnet werden mögen. 32 Für jedes der beiden Dreiecke werde der Schnittpunkt zweier Winkelhalbierenden bestimmt, der, wie gewohntermassen zu beweisen ist, auch auf der dritten Winkelhalbierenden liegt und für welchen die nach den drei Seiten gezogenen Senkrechten gleiche Länge haben. Die gemeinsame Länge dieser Lote sei für das eine Dreieck r, für das andere r . Die Abschnitte, welche auf den entsprechenden Seiten mit den Längen a und a durch die Lote erzeugt werden, mögen in entsprechender Reihenfolge u, v und u , v heissen. Durch die Winkelhalbierenden und die von ihrem Schnittpunkte ausgehenden Lote wird jedes der beiden Dreiecke in sechs rechtwinklige Teildreiecke zerlegt, und zwar sind die Teildreiecke von bezüglich denen von ähnlich, weil die Hälften gleicher Winkel wiederum gleich sind. Es müssen also in den entsprechenden Teildreiecken die Katheten proportional sein. | Somit erhalten wir u : r = u : r v : r = v : r ur = u r vr = v r ar = (u + v)r = ur + vr = u r + v r = (u + v )r = a r,
a:a =r:r, 32 Added
by Hilbert (pencil) on the reverse of p. 46, facing p. 47:
r r u
v a
15
20
25
30
‘Prinzipien der Mathematik’
97
und ebenso findet man b : b = r : r ,
5
10
15
20
c : c = r : r ,
womit die behauptete Proportionalität bewiesen ist. Auf Grund dieses Hauptsatzes der Proportionenlehre gewinnt man nun die Grundlagen der analytischen Geometrie in gewohnter Weise durch Einführung des Koordinaten-Begriffes; insbesondere ergibt sich dabei ohne Schwierigkeit der Satz, dass die Gleichung einer Geraden linear ist, ferner die Pythagoräische Gleichung für die Seiten eines rechtwinkligen Dreiecks. Auch lassen sich die trigonometrischen Funktionen an dieser Stelle auf die übliche elementare Art ohne Heranziehung von Begriffsbildungen aus der Analysis einführen. Es zeigt sich also, dass man die analytische Geometrie aufbauen kann, ohne auf Stetigkeit Bezug zu nehmen. Dieses Ergebnis schliesst jedoch nicht die Möglichkeit aus, dass man bei der weiteren Ausgestaltung der analytischen Geometrie an Stellen gelangt, wo die Anwendung der Stetigkeit nicht mehr vermieden werden kann. Insbesondere bleibt daher die von uns aufgeworfene Frage noch unentschieden, ob sich bei der Begründung der Lehre von den Flächeninhalten der Polygone die Anwendung der Stetigkeits-Axiome ausschalten lässt. Um unser Problem schärfer zu fassen, empfiehlt es sich, folgende Bezeichnungen einzuführen: Die Lehre von den Flächeninhalten 1) Definition von „Zerlegungsgleichheit“, „Ergänzungsgleichheit“, „Inhaltsmass“
25
30
Wir nennen zwei einfache1) Polygone zerlegungsgleich, wenn sie in eine endliche Anzahl von Dreiecken zerlegt werden können, die paarweise einander kongruent sind. Unter „Zerlegungen“ wollen wir dabei nur die eigentlichen Zerlegungen verstehen, für welche alle Seiten der Teildreiecke im Innern oder auf dem Rande des Polygons liegen. Ferner nennen wir zwei Polygone ergänzungsgleich, wenn es möglich ist, sie durch Hinzufügung von zerlegungsgleichen Polygonen zu zerlegungsgleichen Polygonen zu ergänzen. Gehen wir mit diesen Begriffsbildungen an die Betrachtung der elementargeometrischen Sätze über Flächengleichheit und der damit zusammenhängenden Konstruktions-Aufgaben, so finden wir, dass es sich hier immer um 1)
Was Einfachheit eines Polygons bedeuten soll, wurde an früherer StelleG erklärt. Im Folgenden sollen, wenn von Polygonen die Rede ist, stets einfache Polygone gemeint sein.
G
S. 7 Added by Hilbert (pencil) in the margin next to the typed footnote.
49
98
50
51
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
die Ergänzungsgleichheit der Figuren handelt. 33 Die Sätze z. B., dass zwei Parallelogramme und ebenso zwei Dreiecke mit gleicher Grundlinie und Höhe einander gleich sind, dass sich zu jedem Polygon ein Dreieck von gleicher Fläche bestimmen lässt, sowie auch der Pythagoräische Lehrsatz werden alle in dem Sinne bewiesen, dass die Ergänzungsgleichheit der betreffenden Polygone erkannt wird. Die Herleitung aller dieser Sätze geschieht vollkommen ohne Anwendung von Stetigkeits-Betrachtungen. Jedoch ist mit all diesen Beweisen für Ergänzungsgleichheit zunächst sehr wenig gewonnen, solange man nicht weiss, ob der Umkehrungssatz gilt, dass ergänzungsgleiche Dreiecke mit gleicher Grundlinie auch gleiche Höhe besitzen müssen. Denn ohnedies bliebe ja die Möglichkeit, dass überhaupt alle Polygone einander | ergänzungsgleich wären, und dann würden die bewiesenen Sätze gar nichts besagen. Wir müssen also zu beweisen suchen, dass jener Umkehrungssatz gültig ist, oder, allgemeiner ausgedrückt, dass ein Polygon nicht einem Teilpolygon ergänzungsgleich sein kann. Dieser Satz, den man geneigt sein könnte wegen seiner äusseren Analogie mit dem früher erwähnten allgemeinen Grössensatz, dass der Teil nicht gleich dem Ganzen sein kann, für selbstverständlich zu halten, hat in Wahrheit auf Grund der dem Worte „ergänzungsgleich“ zukommenden Bedeutung einen sehr komplizierten Inhalt und darf nicht unbewiesen hingenommen werden, es sei denn, dass man ein neues Axiom in die Geometrie einführen will. Ich werde nun zeigen, dass sich der genannte Umkehrungssatz tatsächlich mit Hilfe unserer Streckenrechnung beweisen lässt. Zugleich wird aus diesem Beweise hervorgehen, dass das Rechnen mit Polygon-Inhalten ohne Zuhilfenahme von Stetigkeitsbetrachtungen eingeführt werden kann. Wir waren in der Theorie der Flächeninhalte bei der Aufgabe angelangt, zu beweisen, dass zwei Dreiecke auf gleicher Grundlinie, wenn sie ergänzungsgleich sind, auch gleiche Höhe besitzen müssen.1)H Um diesen Beweis zu führen, verwenden wir einen neuen Begriff, den des Inhaltsmasses von Dreiecken und von Polygonen. Ich will zunächst das Inhaltsmass für Dreiecke definieren.I 1)
Es sei bemerkt, dass die Ausdrücke „Grundlinie“ und „Höhe“ im Vorhergehenden wie im Folgenden ihre landläufige Bedeutung haben sollen.
der kritische Satz bei Euklid! Added by Hilbert (pencil) in left-hand margin. Noch 3ter Begriff von Inhaltsgleichheit Added by Hilbert (pencil) in left-hand margin. H I
33 Diagrams
added by Hilbert (pencil) on the reverse of p. 48, facing p. 49:
5
10
15
20
25
30
‘Prinzipien der Mathematik’
5
10
15
20
99
Zieht man in einem Dreieck mit den E Ecken A, B, C, dessen Seiten und zugleich D deren Längen in üblicher Weise mit a, b, c hb C a bezeichnet werden mögen, von A und B die ha b Senkrechten nach den Seiten a und b, deB ren Längen bezüglich ha und hb , und deren c 34 Fusspunkte D und E seien, so besteht auf A Grund der Aehnlichkeit der Dreiecke ADC und BEC die Proportion a : hb = b : h a , d. h. es ist a · ha = b · hb . Das Produkt aus der Grundlinie und Höhe eines Dreiecks ist also unabhängig von der Wahl der Grundlinie durch das Dreieck bestimmt. Ich nenne nun die Hälfte von diesem Produkt, also die Streckenlänge 12 aha , das Inhaltsmass J() = J(ABC) des Dreiecks. Diese Bezeichnung rechtfertigt sich dadurch, dass zunächst kongruenten Dreiecken gleiches Inhaltsmass zukommt und dass ferner folgender Satz gilt: Bei jeder Zerlegung eines Dreiecks in (endlich viele) Teildreiecke ist das Inhaltsmass des ganzen Dreiecks gleich der Summe der Inhaltsmasse der Teildreiecke. 35 2) Unterscheidung von rechts und links, negative Strecken
25
30
Der Beweis dieses Satzes bildet den Hauptpunkt unserer Ueberlegung. Wir machen dazu wesentlich Gebrauch von den Axiomen der Anordnung. Aus diesen ergibt sich die Möglichkeit der Unterscheidung von rechts und links in dem Sinne, dass in bezug auf einen Halbstrahl h einer Geraden g die Punkte der einen durch g bestimmten Halbebene als rechts von h, die Punkte der anderen Halbebene als links von h liegend erklärt werden, wobei zwischen irgend zwei von einem Punkte ausgehenden Halbstrahlen h, k die Beziehung besteht, dass die Punkte von k (abgesehen von dem Anfangspunkt) rechts oder links von h liegen, je nachdem die Punkte von h links oder rechts von k liegen. Die Unterscheidung von rechts und links in bezug auf die Halbstrahlen liefert so34 Added
by Hilbert (pencil) on the reverse of p. 50, facing p. 51:
C E
A
D
B
35 This sentence is marked by Hilbert (pencil) with two vertical, parallel strokes in the left-hand margin. Hilbert (pencil) has also enclosed ‘Diese . . . ferner’ in the preceding sentence in parentheses, and underlined ‘rechtfertigt’.
52
100
53
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
fort eine entsprechende Unterscheidung in bezug auf gerichtete Strecken (d. h.: Strecken mit vorgeschriebener Reihenfolge der Endpunkte), indem wir sagen, ein Punkt liege rechts oder links von einer Strecke AB, je nachdem er rechts oder links von dem in A beginnenden, durch B führenden Halbstrahl liegt. Dabei ergibt sich, dass die Punkte, welche rechts von der Strecke AB liegen, links von BA liegen und umgekehrt. Ferner gilt folgender Satz: Wenn die inneren Punkte eines Dreiecks ABC links von AB liegen, so liegen sie auch links von BC und links von CA. Es bestehen demnach bei einer gegebenen zyklischen Anordnung der Ecken eines Dreiecks nur zwei Möglichkeiten: entweder liegt das Innere des Dreiecks zur Linken der drei Strecken AB, BC, CA, oder es liegt zur Rechten dieser drei Strecken. Im ersten Fall wollen wir sagen, das Dreieck werde positiv umlaufen, im zweiten Falle, es werde negativ umlaufen. Ausser den hiermit eingeführten Begriffsbildungen benutzen wir noch das Rechnen mit den negativen Strecken und der Nullstrecke, dessen Begründung sich besonders einfach durch Betrachtung von gerichteten Strecken auf einer Geraden ausführen lässt.
5
10
15
3) Beweis des Satzes, dass ergänzungsgleiche Polygone gleiches Inhaltsmass haben; Folgerungen Es werde nun für irgend drei Punkte P , Q, R der Ebene, die nicht auf einer Geraden liegen, mit dem Symbol [P QR] entweder das Inhaltsmass J(P QR) des Dreiecks P QR oder dessen entgegengesetzter Wert −J(P QR) bezeichnet, je nachdem das Dreieck bei der Anordnung seiner Ecken in der Reihenfolge P , Q, R positiv oder negativ umlaufen wird, sodass also
20
[P QR] = − [P RQ] ist. Mit Hilfe dieses Zeichens gewinnen wir eine neue Darstellung für das Inhaltsmass eines Dreiecks. Ist nämlich ABC ein positiv umlaufenes Dreieck und O ein Punkt ausserhalb des Dreiecks, von dem überdies angenommen werden soll, dass er nicht auf der Verlängerung einer Dreiecksseite liege,1) so besteht die Gleichung
25
[OAB] + [OBC] + [OCA] = J(ABC).
30
Beim Beweise hierfür kann ohne Einschränkung der Allgemeinheit angenommen werden, dass die Strecke OC in dem Winkelraum zwischen OA und OB liegt, weil ja beide Seiten der behaupteten Gleichung einzeln bei zyklischer Vertauschung der Punkte A, B, C ungeändert bleiben. Es sind dann noch die zwei Möglichkeiten zu sondern, dass der Schnittpunkt D der Geraden OC mit der Strecke AB sich zwischen O und C oder auf der Verlängerung der Strecke OC befindet. 1)
Diese an sich sehr wohl vermeidbaren speziellen Festsetzungen über die Lage von O sind hier nur zur Abkürzung des Beweises getroffen.
35
‘Prinzipien der Mathematik’
5
Im ersten Fall werden die Dreiecke OBC und OCA bei der genannten Anordnung der Ecken positiv umlaufen, während OAB einen negativen Umlauf darstellt. Demnach ist [OBC] = J(OBC),
10
101 54
A 1 O 2
4 D 3
C
B
[OCA] = J(OCA),
[OAB] = −J(OAB).
Betrachten wir in den Dreiecken ODA, DCA und OCA bezüglich OD, DC und OC als die Grundlinien, so ergibt sich als Höhe jedesmal die vom Punkte A auf OC gefällte Senkrechte. Hieraus folgt, weil die Strecken OD und DC durch Addition die Strecke OC liefern,A J(ODA) + J(DCA) = J(OCA). Aus gleichen Gründen erhält man J(ODB) + J(DCB) = J(OBC) J(ODB) + J(ODA) = J(OAB)
15
J(DCA) + J(DCB) = J(ABC). Addiert man die ersten beiden Gleichungen und substrahiert die dritte, so ergibt sich J(DCA) + J(DCB) = J(OCA) + J(OBC) − J(OAB),
20
und hieraus folgt auf Grund der vierten Gleichung sowie der aufgeschriebenen Beziehungen zwischen den Klammersymbolen und den Inhaltsmassen die behauptete Relation J(ABC) = [OBC] + [OCA] + [OAB] . 25
In entsprechender Weise lässt sich auch der zweite Fall erledigen. Durch die Anwendung der gefundenen Umformung für das Inhaltsmass eines Dreiecks gelangen wir nun folgendermassen zum Ziel: gegeben sei ein Dreieck mit den Ecken A, B, C und eine Zerlegung des Dreiecks in Teildreiecke 1 , . . . , n . Wir wählen einen | Punkt O ausserhalb von ; dieser liegt A
[OCA] = 1 + 4 = J(OCA) [OBC] = 2 + 3 = J(OBC) [OAB] = 2 + 1 = J(OAB) 4 + 3 = J(ABC) Folglich J(ABC) = J(OBC) + J(OCA) − J(OAB)
d. h.
Added by Hilbert (pencil) to the right of the equations below, as an alternative to these and the associated text down to ‘Relation’ (101.23).
55
102
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
dann auch ausserhalb aller Teildreiecke. 36 Jetzt betrachten wir die Summe J(1 ) + . . . + J(n ) und formen jeden ihrer Summanden nach der eben abgeleiteten Regel um. Sind Aν , Bν , Cν , die Ecken von ν , und zwar in der Anordnung, die dem positiven Umlauf entspricht, so haben wir J(ν ) zu ersetzen durch [OAν Bν ]+ [OB
ν Cν ] + [OCν Aν ]. Im ganzen erhalten wir also einen Ausdruck der Form [OP Q], wobei über die Strecken P Q zu summieren ist, welche die Seiten der Teildreiecke bilden und die Ordnung der Endpunkte jeweils gemäss dem positiven Umlauf zu wählen ist. Bei dieser Summation heben sich nun alle Glieder, die von den inneren Teilungslinien herrühren, gegenseitig auf. Denn liegt P Q im Innern von , so grenzen längs dieser Strecke zwei Dreiecke aneinander, und wenn das eine Dreieck zur Linken von P Q liegt, so liegt das andere zur Rechten von P Q, also zur Linken von QP . Demnach liefert die Strecke die beiden Summenglieder [OP Q] und [OQP ]; diese sind aber entgegengesetzt gleich. Es bleiben somit nur solche Summanden [OP Q] übrig, bei denen P Q ganz auf einer Dreiecksseite liegt. Seien etwa D1 , D2 , . . . Dr die aufeinanderfolgenden Teilpunkte auf der Seite BC, so liefern die Teilstrecken dieser Seite zu der Gesamtsumme den Beitrag [OBD1 ] + [OD1 D2 ] + . . . [ODr C] .
56
In diesem Ausdruck hat jeder Summand dasselbe Vorzeichen wie [OBC], nämlich das positive oder negative, je nachdem A und O auf derselben Seite oder auf verschiedenen Seiten der Geraden BC liegen. Ferner ist die Summe der absoluten Werte der Glieder | gleich der Summe der Inhaltsmasse J(OBD1 ), J(OD1 D2 ), . . . , J(ODr C), die, wie man leicht erkennt, zusammen J(OBC) ergeben. Folglich ist
5
10
15
20
25
[OBD1 ] + [OD1 D2 ] + . . . + [ODr C] = [OBC] . Indem wir diese Ueberlegung in gleicher Weise für die beiden anderen Dreiecksseiten ausführen, erhalten wir im ganzen [OP Q] = [OBC] + [OCA] + [OAB] = J(), J(1 ) + . . . + J(n ) = [OP Q] = J(), 36 Added
by Hilbert (pencil) on the reverse of p. 54, facing p. 55:
O C
Cν Aν A
Dr Bν P
D2 D1 Q B
30
‘Prinzipien der Mathematik’
5
10
15
20
25
30
103
d. h., die Summe der Inhaltsmasse für die Teildreiecke ist gleich dem Inhaltsmass des ganzen Dreiecks. Aus diesem Ergebnis können wir jetzt ohne Schwierigkeit folgenden allgemeineren Satz ableiten: Für jede Zerlegung eines Polygons in Dreiecke ist die Summe der Inhaltsmasse der Teildreiecke die gleiche. Sind nämlich Z1 und Z2 zwei Zerlegungen des Polygons in Dreiecke, so erhalten wir durch Ueberlagerung dieser beiden Zerlegungen eine engere Einteilung des Polygons, bei der als Teilfiguren auch Polygone mit mehr als drei Ecken auftreten können. 37 Indem wir diese Polygone wiederum in Dreiecke zerlegen, gewinnen wir eine Zerlegung Z3 , welche sowohl eine Unterteilung von Z1 , wie auch eine solche von Z2 darstellt. Wenden wir auf jedes der Teildreiecke, die zu den Zerlegungen Z1 und Z2 gehören, den bewiesenen Satz über die Dreieckszerlegung an, so ergibt sich, dass die Summe der Inhaltsmasse für die Teildreiecke bei der Zerlegung Z3 einerseits gleich der entsprechenden Summe für Z1 andererseits gleich der entsprechenden Summe für Z2 ist. Folglich stimmt die Summe der Inhaltsmasse der Teildreiecke | bei der Einteilung Z1 mit derjenigen bei Z2 überein. Somit ist bei der Zerlegung eines Polygons in Dreiecke die Summe der Teildreiecks-Inhalte unabhängig von der Art der Zerlegung bestimmt. Diese Summe können wir daher als das Inhaltsmass eines Polygons definieren. Gemäss dieser Definition kommt zerlegungsgleichen Polygonen dasselbe Inhaltsmass zu. Ferner ist bei einer beliebigen Zerlegung eines Polygons in Teilpolygone 38 das Inhaltsmass 38 des Ganzen gleich der Summe der 39 Inhaltsmasse 39 der Teile. Aus der Vereinigung dieser beiden Tatsachen folgt, dass ergänzungsgleiche Polygone gleiches Inhaltsmass besitzen. Denn sind zwei Polygone, P und Q, ergänzungsgleich, so kann an P ein Polygon P und an Q ein mit P zerlegungsgleiches Polygon Q derart angesetzt werden, dass die entstehenden Polygone P + P und Q + Q zerlegungsgleich sind. 40 Dabei ist J(P ) = J(Q ) und J(P + P ) = J(Q + Q ); 37 Added
by Hilbert (pencil) on the reverse of p. 55, facing p. 56:
38–38 Substituted
by Hilbert (pencil) for: der Inhalt by Hilbert (pencil) for: Inhalte 40 Added by Hilbert (pencil) on the reverse of p. 56, facing p. 57:
39–39 Substituted
57
104
58
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
ferner ist J(Q + Q ) = J(Q) + J(Q ); J(P + P ) = J(P) + J(P ), also folgt durch Subtraktion J(P) = J(Q). Um demnach von zwei Figuren zu beweisen, dass sie nicht ergänzungsgleich sind, brauchen wir nur zu zeigen, dass sie verschiedenes Inhaltsmass haben. Wenden wir diese Schlussweise auf zwei Dreiecke an, deren Grundlinien beide die Länge a haben. Die zugehörigen Höhen mögen bezüglich h und h sein. Sollen die Dreiecke ergänzungsgleich sein, so müssen sie die Bedingung 1 1 ah = ah , 2 2 d. h. h = h erfüllen. Zwei Dreiecke mit gleicher Grundlinie können also nur dann ergänzungsgleich sein, wenn ihre Höhen gleich sind. 41 Es sind also 2 Dreiecke keineswegs immer ergänzungsgleich, im Gegenteil. 41 So ergibt sich auf Grund der Einführung des Inhaltsmasses ohne Mühe der Beweis jenes Satzes, dessen Begründung das Ziel der vorangehenden Untersuchungen bildete. Auch der Beweis des allgemeineren Satzes, dass ein Polygon nicht einem Teilpolygon ergänzungsgleich sein kann, folgt jetzt ohne weiteres. Es ist nur nötig, zu zeigen, dass ein Polygon P, das in zwei oder mehrere Teile P1 , . . . , Pn zerlegt ist, nicht dasselbe Inhaltsmass wie P1 haben kann, und dies ist unmittelbar ersichtlich aus der Gleichung J(P) = J(P1 ) + . . . + J(Pn ), 42 zufolge deren P ein grösseres Inhaltsmass besitzt als jedes der Teilpolygone. Als spezielle Folgerung lässt sich hieraus folgender Satz entnehmen: Zerlegt man ein Rechteck in mehrere Dreiecke und lässt auch nur eines dieser Dreiecke fort, so kann man mit den übrigen Dreiecken das Rechteck nicht mehr ausfüllen. Dieser Satz ist von einigen Mathematikern als Axiom aufgestellt, von anderen mit Hilfe des Archimedischen Axioms bewiesen worden. Unser Verfahren lehrt, dass der Satz unabhängig vom Archimedischen Axiom gültig ist.1) 1) Ein Beispiel dafür, dass die Einführung des Archimedischen Axioms nicht ohne Einfluss auf die Theorie der Polygon-Flächen ist, bildet der Satz, dass Dreiecke
P
41–41 Added 42 Hilbert
P
Q
Q
by Hilbert (pencil). (pencil) has changed the index here, and two lines above, from ‘n’ to ‘2’.
5
10
15
20
25
30
‘Prinzipien der Mathematik’
105
Die letzten Folgerungen haben sich aus dem Satz ergeben, dass ergänzungsgleiche Polygone gleiches Inhaltsmass besitzen. Von diesem Satz lässt sich nun auch die Umkehrung bewei|sen und damit die Theorie der Polygoninhalte in prinzipieller Hinsicht zum Abschluss bringen. 4) Beweis der Umkehrung
5
10
15
20
25
59
Bei diesem Beweise werden wir davon Gebrauch machen, dass zwei Polygone, die einem dritten ergänzungsgleich sind, auch untereinander ergänzungsgleich sind. Dies soll daher zuerst nachgewiesen werden. 43 Es seien die Polygone P1 und P2 dem Polygon Q ergänzungsgleich. Dann können die Polygone E1 , F1 , E2 , F2 so gewählt werden, dass E1 mit F1 , E2 mit F2 , (P1 + E1 ) mit (Q + F1 ), (P2 + E2 ) mit (Q + F2 ) zerlegungsgleich ist. Dabei können F1 und F2 sich teilweise überdecken. Es werde die in F1 und F2 gemeinsam enthaltene, aus einem oder mehreren Polygonen bestehende Teilfigur G genannt, und die nach Weglassung von G aus F1 und F2 zurückbleibenden Reststücke mögen bezüglich G1 , G2 heissen. G1 und G2 haben jedenfalls keine inneren Punkte gemeinsam. Man ziehe nun in P1 +E1 und Q+F1 die Teilungslinien, aus denen sich die Zerlegungs-Gleichheit dieser Polygone ergibt; entsprechend ziehe man die Teilungslinien in P2 +E2 und Q+F2 . Auf diese Weise erhält man für das Polygon Q + G + G1 + G2 zwei Zerlegungen. Diese vereinige man durch Ueberlagerung zu einer neuen Einteilung und stelle daraus durch weitere Unterteilung eine Zerlegung in Dreiecke her. Hierbei werden die Teildreiecke der anfänglichen Einteilung von Q + F1 zerlegt, und es lassen sich die entsprechenden Zerlegungen bei den zugehörigen kongruenten Dreiecken der Einteilung von P1 + E1 anbringen. Ferner kann man die bei der engeren Teilung erhaltenen Teildreiecke von G2 (auf mannigfache Art) so an P1 + E1 anset|zen, dass keinerlei gegenseitige Ueberdeckung der Figuren stattfindet. Auf diese Weise wird zu P1 +E1 ein mit G2 zerlegungsgleiches Polygon H1 derart hinzugefügt, dass bei mit gleicher Grundlinie und Höhe zerlegungsgleich sind. Dieser lässt sich mit Hilfe des Archimedischen Axioms beweisen, während er in einer nicht-Archimedischen Geometrie nicht zu gelten braucht, wie man aus dem von uns früher betrachteten Spezialfall einer nicht Archimedischen Geometrie ersehen kann. 43 Added
by Hilbert (pencil) on the reverse of p. 58, facing p. 59:
G1 P2
E2
P 1 E1
Q
F1 G F2
G2
60
106
61
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
geeigneter Zerlegung von P1 + E1 + H1 die Teildreiecke zu denjenigen aus der engeren Einteilung von Q+G+G1 +G2 paarweise kongruent sind. Ganz ebenso kann man nun auch zu P2 + E2 ein solches mit G1 zerlegungsgleiches Polygon H2 hinzufügen, dass P2 + E2 + H2 eine Zerlegung in Teildreiecke gestattet, welche den Teildreiecken aus der engeren Zerlegung von Q + G + G1 + G2 wiederum paarweise kongruent sind. Demgemäss sind die Polygone P1 + E1 + H1 und P2 + E2 + H2 zerlegungsgleich. Ausserdem ist E1 mit F1 , d. h. mit G + G1 zerlegungsgleich, ebenso H1 mit G2 ; also ist auch E1 + H1 mit G + G1 + G2 zerlegungsgleich; und in gleicher Weise folgt, dass E2 + H2 zerlegungsgleich ist mit G + G1 + G2 . Indem wir nun noch einmal die Methode der Ueberlagerung von Einteilungen anwenden, können wir hieraus schliessen, dass E1 + H1 zerlegungsgleich ist mit E2 + H2 . Und damit ergibt sich, dass P1 mit P2 ergänzungsgleich ist. Den hiermit bewiesenen Satz können wir zunächst dazu benutzen, um nach der bekannten Euklidischen Methode zu zeigen, dass jedes Polygon ergänzungsgleich ist mit einem rechtwinkligen Dreieck, dessen eine Kathete die Länge 1 hat. 44 Und nun 44 schliessen wir folgendermassen weiter: Es seien zwei Polygone von gleichem Inhaltsmass a gegeben. Zu jedem von ihnen bestimmen wir dann ein ergänzungsgleiches rechtwinkliges Dreieck mit einer Kathete von der Länge 1. | Da ergänzungsgleiche Polygone gleiches Inhaltsmass besitzen, so muss für jedes der beiden rechtwinkligen Dreiecke das Inhaltsmass gleich a, also die zweite Kathete gleich 2a sein; folglich sind die beiden Dreiecke kongruent. Die beiden Polygone sind daher einem und demselben Dreieck ergänzungsgleich, also auch untereinander ergänzungsgleich. Somit erweisen sich die Begriffe der Ergänzungs-Gleichheit und der Gleichheit des Inhaltsmasses als sachlich gleichbedeutend. 45 Das Inhaltsmass ist also wirklich ein Mass für den Inhalt! 45 Es sei erwähnt, dass eine solche Uebereinstimmung bei der Lehre von den Rauminhalten der Polyeder nicht mehr stattfindet. Hier können wir zwar wiederum so verfahren, dass wir zunächst für das Tetraeder das Inhaltsmass definieren (als ein Drittel des Produktes aus Grundfläche und Höhe) und dann die Rauminhalte der Polyeder mit Hilfe von Zerlegungen in Tetraeder erklären. Auch gilt dann der Satz, dass „ergänzungsgleiche“ Polyeder gleiches Inhaltsmass besitzen müssen; jedoch ist die Umkehrung davon nicht richtigB . Die Lehre von den Raum-Inhalten kann daher nicht auf dieselbe Weise begründet werden wie die Theorie der Flächeninhalte in der Ebene. Bereits Gauss hat diese Unmöglichkeit vermutet; in neuerer Zeit ist es Dehn gelungen, einen strengen Nachweis dafür zu erbringen. Hiermit möchte ich den geometrischen Teil meiner Vorlesung abschliessen. Der Zweck, den ich mit dem Eingehen auf die Grundlagen der Geometrie verbunden habe, bestand darin, den Grundgedanken der Axiomatik deutlich zu machen, zu zeigen, welche Aufgaben man sich bei einer Axiomatik stellt auch nicht insbd. [[eine ? ]] deleted by Hilbert (pencil) Archimedes Added by Hilbert (pencil) in left-hand margin. B
44–44 Replaced 45–45 Added
by Hilbert (pencil) with: Zu dem Zwecke by Hilbert (pencil) on the page opposite, with an indication placing it here.
5
10
15
20
25
30
35
40
‘Prinzipien der Mathematik’
5
10
107
und zu welchen Einsichten sie führt. Ich glaube, dass dieser Zweck durch das | Bisherige bereits zur Genüge erreicht ist, und ich möchte darum nicht erst noch, wie ich anfangs beabsichtigte, die Prinzipien der Mechanik behandeln, sondern mich gleich den logischen Grundlagen der Mathematik zuwenden. Wir haben uns bisher bei den axiomatischen Untersuchungen so eingestellt, dass wir die Logik in gewohnter Weise anwandten, ohne diese selbst einer Kritik zu unterwerfen. Auch den Begriff der ganzen Zahl im gewöhnlichen Gebrauch haben wir zugrunde gelegt und haben die Schwierigkeiten, die im Begriffe der Anzahl selbst liegen, beiseite geschoben. Es soll nun das Hauptziel unserer weiteren Betrachtungen sein, diese vorher beiseite gelassenen Fragen aufzunehmen. Als Einleitung dazu will ich zunächst ein besonderes Gebiet der Logik, den sogenannten Logik-Kalkül besprechen.
B Mathematische Logik. 46 1. Der Aussagen-Kalkül.
15
Die Axiome des Kalküls
20
25
30
35
Der Logik-Kalkül besteht in der Anwendung der formalen Methode der AlgebraC auf das Gebiet der Logik. Wir haben es dabei wiederum mit einer Art von Axiomatik zu tun, die sich aber dadurch von den Systemen mathematischer Axiomatik abhebt, dass hier die mathematischen Aussagen selbst als die Dinge betrachtet werden, die wir der Untersuchung zu unterwerfen haben. Und zwar sollen nicht nur richtige Aussagen (etwa „7 ist eine Primzahl“), sondern auch falsche (z. B. „2 + 3 = 7“) als Gegenstände in Betracht gezogen werden. Es soll aber jede von diesen Aussagen eindeutig entweder als wahr oder als falsch charakterisiert sein. Als Zeichen für die als Gegenstände betrachteten Aussagen wählen wir grosse lateinische Buchstaben. Den Sätzen unseres logischen Kalküls geben wir die Form von Gleichungen1) , indem wir zwei Aussagen gleichsetzen, sowohl wenn sie beide richtig sind, wie auch dann, wenn sie beide falsch sind. Um mit Hilfe der Gleichungen die Wahrheit oder Falschheit einer Aussage symbolisch darstellen zu können, wählen wir unter den richtigen Aussagen und unter den falschen Aussagen je einen Repräsentanten. Diese beiden Repräsentanten bezeichnen wir mit 0 und 1, und zwar verstehen wir unter 0 diejenige Aussage, welche nichts behauptet und daher nicht falsch sein kann, unter 1 die Aussage, welche alles behauptet und daher jedenfalls falsch ist. 1) Wir wenden in dem Kalkül die algebraischen Zeichen an, insoweit wenigstens eine Missdeutung in arithmetischem Sinne nicht zu befürchten ist. (Wo es darauf ankommt, die logischen Verknüpfungs-Symbole von den arithmetischen äusserlich zu unterscheiden, kann dies etwa durch Verdoppelung von Strichen geschehen.) C
‘(Mathematik)’ Added by Hilbert (pencil) as alternative to ‘Algebra’.
46 Added
by Hilbert (ink) at the top of the page.
62
63
108 64
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
In diesem Sinne formulieren wir unsere erste Annahme: I. Es gibt zwischen Aussagen eine Beziehung der Gleichheit X = Y . Dabei erfüllt jede Aussage X die Gleichung X = X, und zwei Aussagen, die gleich sind, können für einander eingesetzt werden. Ferner gibt es zwei individuell bestimmte Aussagen 0, 1 derart, dass jede Aussage X einer und nur einer der beiden Gleichungen X = 0,
65
X=1
genügt. Als Verknüpfungen zwischen den Aussagen führen wir diejenigen Beziehungen ein, welche sich bereits in der Sprache als die einfachsten darstellen. Es sind die durch die Worte „und“, „oder“ ausgedrückten Beziehungen. Die Einführung geschieht durch folgende beiden Axiome: II. Aus zwei Aussagen X, Y entsteht „additiv“ eine neue Aussage X + Y , deren Sinn das Zusammenbestehen von X und Y ist. III. Aus zwei Aussagen X, Y entsteht „multiplikativ“ eine Aussage X × Y (auch kurz XY geschrieben), welche besagt, dass von X und Y mindestens eines gilt. Die bisher aufgezählten Annahmen entsprechen den Verknüpfungs-Axiomen in der Arithmetik. In Analogie zu den Rechengesetzen stellen wir nun folgende Regeln auf: IV. X + Y = Y + X. V. X + (Y + Z) = (X + Y ) + Z. VI. XY = Y X. VII. X(Y Z) = (XY )Z. VIII. X(Y + Z) = XY + XZ.1) Diese Gleichungen können insofern als logische Axiome gelten, als sie bei der inhaltlichen Deutung Sätze ergeben, die logisch selbstverständlich sind. Am unmittelbarsten ist dies bei den Vertauschungsregeln IV und VI ersichtlich, indem die Aussage „X und Y “ von der Aussage „Y und X“, und ebenso die Aussage „X oder Y “ von der Aussage „Y oder X“ nur sprachlich, nicht aber dem Sinne nach verschieden ist. Die Gleichungen V und VII bringen zum Ausdruck, dass die durch die Worte „und“, „oder“ bezeichneten Verknüpfungen (die Konjunktion und die Disjunktion) beide assoziativen Charakter haben. Die Gleichung VIII stellt folgenden etwas komplizierteren Sachverhalt dar: dass entweder X gilt oder Y mit Z zusammen gilt, is gleichbedeutend damit, dass sowohl von dem Aussagen-Paar X, Y wie von dem Paare X, Z je mindestens eine Aussage gilt. In formaler Hinsicht hat die Gleichung den Charakter des distributiven Gesetzes. Durch die Entdeckung eines solchen 1)
5
Für die Anwendung der Additions- und Multiplikationszeichen ist zu beachten, dass ebenso wie in der Algebra durch einen Ausdruck X + Y Z die Addition von X zu dem Produkt Y × Z bezeichnet werden soll, sodass man zur Darstellung der Multiplikation einer Summe X + Y mit Z den Summenausdruck in Klammern einzuschliessen hat.
10
15
20
25
30
35
‘Prinzipien der Mathematik’
5
10
15
20
25
30
35
40
distributiven Gesetzes ist der Logik-Kalkül eigentlich erst ermöglicht worden, insofern erst damit | eine bedeutsamere Analogie zwischen der Logik und der Algebra aufgewiesen wurde. Vergleichen wir die symbolischen Operationen, wie sie durch die bisherigen Axiome definiert sind, mit den Rechen-Operationen der Arithmetik, so bemerken wir, dass die inversen Operationen fehlen. Hierfür findet nun im Logik-Kalkül ein gewisser Ersatz statt durch die Bildung des „Gegenteils“ einer Aussage, welches wir mit folgendem Axiom einführen: Durch jede Aussage X ist eine andere Aussage X (das Gegenteil von X) bestimmt, die mit X zusammenhängt durch die beiden Gleichungen IX. X + X = 1, X. X × X = 0. Wie man auf Grund der logischen Interpretation sofort erkennt, stellen diese Gleichungen den Satz vom Widerspruch und den Satz vom ausgeschlossenen Dritten dar. Schliesslich postulieren wir noch für die Aussage 1 folgende zwei Beziehungen: XI. 1 + 1 = 1. XII. X × 1 = X. Von diesen besagt die erste, dass die Konjunktion zweier falschen Aussagen wieder eine falsche Aussage ergibt; die andere liefert folgenden logischen Satz: wird über zwei Aussagen, von denen die eine falsch ist, die Behauptung aufgestellt, dass mindestens eine unter ihnen richtig ist, so ist diese Behauptung dann und nur dann wahr, wenn die zweite Aussage richtig ist. In formaler Beziehung wird durch die Gleichung XII die Aussage 1 | als Invariante der Multiplikation gekennzeichnet. Hiermit haben wir ein Axiomensystem der Logik aufgestellt. Als charakteristischer Unterschied dieses Systems gegenüber der Arithmetik ist hervorzuheben, dass hier für alle auftretenden Rechenausdrücke nur zwei Werte, 0 und 1, in Betracht kommen. Wie bei jeder Axiomatik lassen sich auch für dieses System die Fragen nach der Widerspruchslosigkeit, nach den logischen Abhängigkeiten und nach der Vollständigkeit aufwerfen. Am wichtigsten ist hier die Frage der Vollständigkeit. Denn das Ziel der symbolischen Logik besteht ja darin, aus den formalisierten Voraussetzungen die übliche Logik zu entwickeln. Es kommt also wesentlich darauf an, zu zeigen, dass unser Axiomensystem zum Aufbau der gewöhnlichen Logik ausreicht. Als Vorbereitung hierzu will ich zunächst einige einfache Folgerungen aus den Axiomen entwickeln, die zugleich als Beispiele für die Anwendung des Logik-Kalküls Interesse bieten. 1) X + X = X. Denn X + X = X1 + X1 = X(1 + 1) X(1 + 1) = X1 = X
(nach XII und VIII), (nach XI und XII).
2) X + 1 = 1. 45
109
Denn X + 1 = X + (X + X) = (X + X) + X (X + X) + X = X + X = 1
(nach IX und V), (nach 1) und IX).
66
67
110
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
3) X + 0 = X. Denn X + 0 = X1 + XX = X(1 + X) X(1 + X) = X(X + 1) = X1 = X 68
(nach XII, X und VIII), (nach IV, 2) und XII).
4) XX = X. Denn XX = XX + 0 = XX + XX XX + XX = X(X + X) = X1 = X
(nach 3) und X), (nach VIII, IX und XII).
5
5) X0 = 0. Denn X0 = X(XX) = (XX)X (XX)X = XX = 0
(nach X und VII), (nach 4) und X).
Aus den Formeln 3) und 5) ersehen wir, dass sich 0 in Bezug auf die Addition und Multiplikation wie die Null in der Arithmetik verhält, und die Formel 2) zeigt, dass 1 sich bei der Addition so verhält, wie ∞ in der Arithmetik.
10
Erste Konsequenzen: Beispiel eines Unabhängigkeits-Beweises An dieser Stelle möchte ich ein Beispiel für einen Unmöglichkeitsbeweis vorführen. Wir haben bei der Ableitung der Sätze 1)–5) wesentlich Gebrauch gemacht von den Axiomen XI und XII. Man könnte bei der Aufstellung des Axiomensystems versucht sein, diese Gleichungen durch die entsprechenden, für die Aussage 0 geltenden Beziehungen 0 × 0 = 0,
69
70
X +0=X
zu ersetzen, von denen die erste aus 5) folgt und die zweite mit 3) identisch ist. Damit dies angängig wäre, müssten aus dem geänderten Axiomensystem die Gleichungen XI und XII bewiesen werden können. Es lässt sich jedoch zeigen, dass es unmöglich ist, aus den Axiomen I–X in Verbindung mit den Gleichungen 3) und 5) die Formeln XI und XII abzuleiten. Deuten wir nämlich die Buchstaben unseres Kalküls | als ganze Zahlen, die Gleichungen als Zahlen-Kongruenzen nach dem Modul 2 und geben den Zeichen 0, 1, + ihre gewöhnliche arithmetische Bedeutung; verstehen wir ferner unter X die Funktion 1 − X und unter XY diejenige Funktion zweier (ganzzahliger) Variablen, welche konstant gleich 0 ist, so werden die Axiome I–X sowie die Gleichungen 3), 5) befriedigt. Dagegen sind die Gleichungen XI und XII nicht erfüllt. Somit kann ein formaler Beweis von XI und XII auf Grund der Gleichungen I–X, 3), 5) sicher nicht geführt werden.
15
20
25
30
Beweis der Widerspruchslosigkeit Bei der Entwicklung der Konsequenzen aus den Axiomen des LogikKalküls habe ich zuletzt ein spezielles Beispiel für einen UnabhängigkeitsBeweis eingeschaltet. Ich will nun, ehe ich an das Vorhergehende anknüpfe, erst noch den Nachweis für die Widerspruchslosigkeit unseres Axiomensystems erbringen. Dieser lässt sich auf folgende einfache Art führen:
35
‘Prinzipien der Mathematik’
111
Man beschränke den Bereich der Aussagen, indem man überhaupt nur die beiden Aussagen 0 und 1 zulässt, und deute dementsprechend die Gleichungen als eigentliche Identitäten. Ferner definiere man Summe und Produkt durch die 8 Gleichungen 5
10
15
20
25
30
35
0+0=0
0×0=0
0+1=1 1+0=1
0×1=0 1×0=0
1+1=1
1 × 1 = 1,
welche dadurch charakterisiert sind, dass sie in richtige arithmetische Gleichungen übergehen, sofern man die symbolische Summe durch den Maximalwert der Summanden und das symbolische Produkt durch den Minimalwert der Faktoren ersetzt. Als Gegenteil der Aussage 0 erkläre man die Aussage 1 und als Gegenteil von 1 die Aussage 0. Diese Definitionen führen jedenfalls zu keinem Widerspruch, da in jeder von ihnen ein neues Zeichen erklärt wird. Andrerseits kann man durch endlich viele Versuche feststellen, dass bei den getroffenen Festsetzungen allen Axiomen I–XII Genüge geleistet wird. Diese Axiome können daher gleichfalls keinen Widerspruch ergeben. So lässt sich für unseren Kalkül die Frage der Widerspruchslosigkeit vollkommen zur Entscheidung bringen. Weitere Entwicklung des Kalküls: das Dualitäts-Prinzip; Bemerkung über die Anzahl der notwendigen Verknüpfungszeichen Kehren wir nun zu unserem vorherigen Gedankengange zurück. Es handelt sich darum, zu prüfen, inwieweit es möglich ist, aus den Axiomen unseres Kalküls eine Systematisierung der üblichen Logik zu gewinnen. In Hinsicht auf die formalen Beweise, die wir zu diesem Zwecke führen, ist zu beachten, dass wir dabei von der im Axiom I enthaltenen Voraussetzung, dass jede Aussage entweder gleich 0 oder gleich 1 ist, keinerlei Gebrauch machen.1) Diese Bemerkung wird an späterer Stelle von Wichtigkeit sein. Anschliessend an die bisher abgeleiteten Gleichungen 1)–5) beweisen wir jetzt folgenden Satz: 6) Das Gegenteil einer Aussage X ist durch die Gleichungen IX und X eindeutig bestimmt.2) Zum Beweise nehmen wir an, es seien Y und Z beide Gegenteil von X; es soll gezeigt werden, dass dann Y gleich Z ist. In der Tat ist X + Y = X + Z = 1,
XY = XZ = 0,
1) Wesentlich benutzen wir hingegen von dem Axiom I die Annahme, dass gleiche Aussagen für einander eingesetzt werden dürfen. 2) Genau genommen hätten wir bisher nicht von „dem“ Gegenteil, sondern nur von „einem“ Gegenteil einer Aussage sprechen dürfen.
71
112
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
folglich (nach 3), XII, VIII, IV, VI, V) Y = Y + 0 = Y 1 + XZ = Y (X + Z) + XZ = Y X + (Y + X)Z = XY + Z(X + Y ) = 0 + Z1 = Z. 72
Aus dem Satz 6) ergibt sich auf Grund der Symmetrie der Bedingungen IX und X unmittelbar die Konsequenz, dass das Gegenteil des Gegenteils wieder die ursprüngliche Aussage ist. Es besteht also die symbolische Beziehung
5
X = X. Da ferner gleiche Aussagen füreinander eingesetzt werden können, so folgt, dass von gleichen Aussagen auch das Gegenteil gleich ist; d. h.: wenn X = Y ist, so ist X = Y . Wenden wir den Satz 6) auf die Aussagen 0 und 1 an, so finden wir auf Grund der Gleichungen 0×1=0 0+1=1
(nach XII) (nach 2)),
dass von den Aussagen 0 und 1 die eine das Gegenteil der anderen ist. Betreffs der Darstellung des Gegenteils von einer Summe oder einem Produkt gilt folgende Regel: 7) Sind X, Y irgend zwei Aussagen, und sind X, Y bezüglich das Gegenteil von X und Y , so ist das Gegenteil der Summe X + Y gleich dem Produkt aus X und Y , und das Gegenteil des Produktes XY gleich der Summe von X und Y ; symbolisch geschrieben: X +Y =X ×Y,
15
20
XY = X + Y .
Zum Beweise des ersten Teils der Behauptung brauchen wir gemäss Satz 6) nur die Gleichungen X + Y + XY = 1,
10
25
(X + Y )XY = 0
zu verifizieren. Diese sind tatsächlich erfüllt; denn 73
X + Y + XY = X + (X + X)Y + XY = X(1 + Y ) + X(Y + Y ) = X1 + X1 = X + X = 1 (nach XII, IX, VI, VIII, V, IV, 2)), und
30
(X + Y )XY = XXY + XY Y = 0Y + X0 = 0 + 0 = 0 (nach VI, VIII, VII, X, 5), 3)). Der zweite Teil der Behauptung lässt sich auf den ersten zurückführen. Setzt man nämlich X = U , Y = V , so folgt nach dem bisher bewiesenen U + V = UV und durch nochmalige Bildung des Gegenteils U + V = UV , also, da U = X, V = Y ist, X + Y = XY .
35
‘Prinzipien der Mathematik’
5
10
15
20
113
Durch Anwendung des Satzes 7) sind wir imstande, von jeder beliebigen, durch einen symbolischen Ausdruck gegebenen Aussage das Gegenteil in entwickelter Form zu bilden; denn jeder solche symbolische Ausdruck wird ja durch Aneinanderfügung von Additionen und Multiplikationen erhalten. Das Verfahren, zu dem wir so gelangen, wird als „dualistische Umformung“ bezeichnet. Es besteht darin, dass man jede Addition durch eine Multiplikation, jede Multiplikation durch eine Addition und jede vorkommende Aussage durch ihr Gegenteil, insbesondere also 0 durch 1 und 1 durch 0 ersetzt. Wendet man die dualistische Umformung auf beide Seiten einer richtigen Gleichung an, so erhält man wieder eine richtige Gleichung; denn, wie wir aus Satz 6) entnommen haben, bleibt | eine Gleichung richtig, wenn beide Seiten bezüglich durch ihr Gegenteil ersetzt werden. Hat man es insbesondere mit einer identischen Gleichung zu tun, so ist die Ersetzung der unbestimmten Aussage-Symbole X, Y , . . . durch die Symbole der gegenteiligen Aussagen X, Y , . . . nicht nötig, da ja das Gegenteil einer beliebig bestimmbaren Aussage wiederum ganz beliebig ist. Somit geht jede richtige identische Gleichung wieder in eine richtige Gleichung über, wenn man jede Summe durch ein Produkt, jedes Produkt durch eine Summe ersetzt und 0 mit 1 vertauscht. Insbesondere gilt dies also von allen unter den Axiomen vorkommenden Gleichungen. So besteht z. B. neben dem distributiven Gesetz VIII
74
X(Y + Z) = XY + XZ ein zweites distributives Gesetz X + Y Z = (X + Y ) × (X + Z), 25
30
welches aus dem vorigen durch dualistische Umformung hervorgeht.1) Die allgemeine Regel, zu der wir hier geführt sind, dass einer jeden für den Logik-Kalkül geltenden Beziehung vermittelst der dualistischen Umformung wieder eine gültige Beziehung entspricht, wird (ebenso wie das analoge Gesetz in der projektiven Geometrie) das Prinzip der Dualität genannt. Die letzten Ergebnisse haben wir als Folgerungen aus dem Satz 7) gewonnen. Dieser liefert uns noch eine weitere wichtige Einsicht. Schreiben wir nämlich die Behauptung von 7) für | die Aussagen X und Y auf und berücksichtigen, dass X = X, Y = Y ist, so finden wir: X + Y = XY,
35
40
X × Y = X + Y.
Aus diesen Gleichungen geht hervor, dass wir das Produkt von zwei Aussagen darstellen können mit Hilfe der Addition und der Bildung des Gegenteils von Aussagen (wofür wir auch kurz „Negation“ sagen wollen), und dass andererseits die Summe zweier Aussagen darstellbar ist mit Hilfe der Multiplikation und der Negation. Es zeigt sich somit, dass man beim Aufbau des Logik-Kalküls die Verknüpfungen Summe und Produkt nicht beide als Grundbeziehungen einzuführen braucht, dass es vielmehr genügt, je nach Belieben 1)
In diesem zweiten distributiven Gesetz tritt die Abweichung des logischen Kalküls von dem Formalismus der Arithmetik besonders deutlich zutage.
75
114
76
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
die eine von ihnen als Grundbeziehung zu wählen durch welche dann in Verbindung mit der Beziehung des Gegenteils die andere definiert werden kann. Um daher die in unserem Kalkül darstellbaren Beziehungen aussprechen zu können, haben wir nur drei Relations-Namen nötig; wir kommen nämlich aus mit den Verbindungsworten „und“, „nicht“, „gleich“, und ebenso auch mit den Worten „oder“, „nicht“, „gleich“.1) Diese Bemerkung ist freilich solange unerheblich, als wir noch nicht wissen, ob unser Kalkül für die Logik etwas leistet. Wir werden durch diesen Gedanken wiederum auf unsere Hauptfrage geführt, inwieweit sich die üblichen logischen Schlussweisen mit Hilfe des Kalküls systematisieren lassen. | In dieser Hinsicht können wir nun feststellen, dass alle einfachen hypothetischen Schlussweisen aus den Axiomen unseres Kalküls ableitbar sind.
5
10
Ableitung der Prinzipien hypothetischer Schlüsse: Bemerkungen zur Formalistik des Kalküls Zunächst erweist sich, dass die hypothetische Beziehung „aus X folgt Y “, oder anders formuliert „wenn X richtig ist, so ist Y richtig“, in unserer Symbolik zur Darstellung gebracht werden kann. Diese Beziehung lässt sich nämlich auch so aussprechen: „entweder ist X falsch, oder Y ist richtig“; und dieser Satz wird dargestellt durch die Gleichung
15
XY = 0,
20
für die wir zur Abkürzung das Zeichen X → Y verwenden wollen. Ferner gelten inbezug auf die so definierte Relation des Folgens einer Aussage aus einer anderen alle die Sätze, welche die Prinzipien des hypothetischen Schliessens ausmachen. Es sollen hier die wichtigsten mit Beweis aufgeführt werden. 1.) X → X, d. h.: aus X folgt X. Denn XX = 0 (nach X). 2.) X + Y → X, d. h.: wenn X mit Y zusammen besteht, so sind X und Y auch einzeln wahr. Denn
25
30
(X + Y ) × X = XY X = Y 0 = 0 (nach 7), VI, VII, X, 5)).
77
3.) Besteht die Beziehung X → Y und ist X = 0, so ist auch Y = 0, d. h.: wenn Y aus X folgt und X wahr ist, so ist auch Y wahr. Denn gemäss der Voraussetzung ist XY = 0, 1)
X = 0,
Dazu kommen dann allerdings noch diejenigen logischen Zeichen (Interpunktionen), welche entsprechend den Klammern zur Zusammenfassung und Trennung von Ausdrücken erforderlich sind.
35
‘Prinzipien der Mathematik’
115
folglich Y = (X + X)Y = XY + XY = 0Y + 0 = 0 (nach XII, IX, VIII, VI, 5), 3)). 5
4.) Besteht die Beziehung X → Y , so gilt auch Y → X, d. h.: wenn Y aus X folgt, so folgt aus dem Gegenteil von Y das Gegenteil von X. Denn da Y = Y ist, so lässt sich die vorausgesetzte Gleichung XY = 0 auch schreiben:
10
15
Y X = 0, und diese Gleichung stellt die behauptete Beziehung Y → X dar. 5.) Besteht die Beziehung X → Y und ist Y = 1, so ist X = 1, d. h.: wenn Y aus X folgt und Y falsch ist, so ist X falsch. Dies ergibt sich durch Vereinigung der beiden vorigen Sätze. 6.) Wenn die Beziehungen X → Y und Y → Z gelten, so gilt auch X → Z, d. h.: wenn Y aus X und Z aus Y folgt, so folgt auch Z aus X. Denn nach Voraussetzung ist XY = 0,
Y Z = 0,
folglich auch ZXY = 0, 20
XY Z = 0
(nach 5) ),
und daher auch 0 = XZY + XZY = XZ(Y + Y ) = XZ (nach 3), VI, VII, VIII, IX, XII).
25
30
Die Ableitung der hypothetischen Schlussweisen aus dem logischen Kalkül, zu deren Ausführung wir gelangt sind, will ich noch durch einige formale Bemerkungen ergänzen, die als weitere Sätze formuliert werden mögen. (Die Numerierung schliesst sich an die des vorigen Males an.) 7.) Unter den Bedingungen X → Y und X → Z gilt stets auch X → Y +Z. Der Beweis ergibt sich ohne weiteres auf Grund des distributiven Gesetzes. 8.) Besteht die Beziehung X → Y , so gilt für jedes Z auch die Beziehung X + Z → Y + Z. Denn mit Benutzung der Voraussetzung XY = 0 erhält man X + Z(Y + Z) = XZ(Y + Z) = XZY + XZZ = Z0 + X0 = 0 (nach 7), VIII, VI, VII, 5), 3) ). 9.) Die Beziehung X → Y ist gleichbedeutend mit
35
Y = XY. Denn aus XY = 0 ergibt sich (nach XII, IX, VIII, VI, 3) ) Y = Y (X + X) = Y X + Y X = XY + 0 = XY, und umgekehrt folgt aus Y = XY : XY = XXY = 0Y = 0
(nach X, VI, VII, 5) ),
78
116
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
d. h. X → Y. 10.) Die Beziehung X → Y ist gleichbedeutend mit X = X + Y. 79
Denn nach Satz 4.) ist X → Y gleichbedeutend mit Y → X; diese Beziehung kann nach Satz 9.) ersetzt werden durch X = Y X, | und diese Gleichung besagt (nach 7) ) dasselbe wie X = Y + X. 11.) Die Beziehungen X → Y und Y → X sind dann und nur dann beide erfüllt, wenn X = Y ist. Denn aus X = Y folgt (nach X und VI) XY = XX = 0,
X → Y,
Y X = Y Y = 0,
Y → X;
andererseits erhalten wir aus X → Y , Y → X gemäss dem Satz 9.) die Gleichungen Y = XY, X = Y X, also (nach VI) X = Y. Wir können diesen Satz noch auf eine andere Form bringen. Die Bedingungen X → Y , Y → X liefern nämlich (mit Hilfe von 3) ) die Gleichung XY + Y X = 0, und von dieser kann man auf Grund der Sätze 2.) und 3.) auch wieder zu jenen Bedingungen gelangen. Demnach ergibt sich, dass die Gleichung X = Y dieselbe Bedeutung hat wie XY +Y X = 0. Es lässt sich also in unserem Kalkül jede Gleichung „auf Null reduzieren“. Auf Grund des Dualitäts-Prinzips ergibt sich hieraus auch ohne weiteres, dass jede Gleichung auf Eins reduziert werden kann. 12.) Besteht eine Gleichung U X + V X = 0, so ist U V = 0. Denn die Voraussetzung ergibt (gemäss 2.), 3.) und VI) XU = 0, XV = 0, 80
X→U X → V,
5
10
15
20
25
30
und daraus folgt nach Satz 9.) U = XU,
V = XV,
also (nach VI, VII, 5) ). U V = XU XV = XXU V = 0 Durch den Satz 12.) wird ein Verfahren angegeben, um aus einer Gleichung der Form U X + V X = 0 die Aussage X, wie man sagt, zu „eliminieren“. Dieses Verfahren kommt sachlich auf eins hinaus mit der Anwendung des Schlussprinzips 6.). In der Tat lehrt der Satz 6.), auf die Aussagen U , X, V angewandt: Wenn U → X zugleich mit X → V erfüllt ist, d. h. wenn U X + XV = 0 ist, so besteht U → V , d. h. U V = 0; und da U = U ist, so stimmt diese Behauptung mit Satz 12.) überein.
35
40
‘Prinzipien der Mathematik’
117
Als spezielle Folgerung aus Satz 12.) findet man (indem man U und V beide durch das Zeichen Y ersetzt): Ist XY = 0 und XY = 0, so ist Y = 0, was sich natürlich auch direkt ergibt. Der hierzu duale Satz lautet: 5
10
15
20
25
Ist X + Y = 1 und X + Y = 1, so ist Y = 1. — Hiermit sind die grundlegenden Sätze unseres Kalküls entwickelt. Es fragt sich, ob wir mit diesem Kalkül für die Zwecke der Logik auskommen. Nun haben wir zwar gefunden, dass eine ganze Reihe logischer Schlussweisen sich durch den Kalkül begründen lassen, jedoch bemerkt man leicht, dass man damit keineswegs alle Schlussformen beherrscht. Selbst jene einfachen Arten von Schlüssen, welche in der traditionellen Logik durch die | Stichworte „barbara, celarent, darii . . . “ bezeichnet zu werden pflegen, lassen sich nicht in den Kalkül einordnen, und zwar deshalb nicht, weil durch diesen das Charakteristische der allgemeinen und der partikulären Urteile, nämlich die Art ihrer Beziehung auf Gegenstände, nicht zum Ausdruck gebracht werden kann. Wollen wir also die Methoden des Schliessens durch die symbolische Logik beherrschen, so dürfen wir uns nicht damit begnügen, die Aussagen als ungetrenntes Ganzes zu Objekten des Kalküls zu machen, sondern sind genötigt, näher auf den Inhalt der Aussagen einzugehen. Durch diese Erwägung werden wir zu einer Erweiterung des logischen Kalküls veranlasst, und zwar wollen wir diese Erweiterung schrittweise vornehmen. Der erste Schritt, den wir in diesem Sinne vollziehen, besteht darin, dass wir dem bisher betrachteten Kalkül, ohne ihn formal zu ändern, eine neue Bedeutung geben.
81
2. Prädikaten-Kalkül und Klassen-Kalkül. Inhaltliche Umdeutung der Symbolik des Aussagen-Kalküls im Sinne des Prädikaten-Kalküls
30
35
40
Es sollen jetzt unter den Zeichen X, Y , . . . nicht mehr ganze Aussagen verstanden werden, sondern unvollständige Sätze, die man aus einfachen Aussagen etwa von der Form „S ist P “ oder „S erfüllt die Bedingung P “ in der Weise erhält, dass man das Subjekt, d. h. dasjenige, worüber etwas ausgesagt wird, weglässt. Den Buchstaben-Symbolen entsprechen demnach Ausdrücke wie „ist sterblich“, „ist teilbar“, „hat eine Ursache“; sie stellen also das dar, was man in der Logik als Prädikate zu bezeichnen pflegt. Demgemäss wollen wir auch den neu einzuführenden Kalkül zum Unterschied gegen den bisherigen, welcher ein Aussagen-Kalkül ist, als einen Prädikaten-Kalkül bezeichnen. Prädikate sind, für sich genommen, weder wahr noch falsch. Daher müssen in einem Kalkül, dessen Objekte die Prädikate sind, die Gleichungen anders interpretiert werden, als es bisher in dem Aussagen-Kalkül geschah. Jedoch genügt folgende geringe Modifikation: Eine Gleichung X = Y soll besagen, dass in Bezug auf einen und denselben als Subjekt genommenen Gegenstand die Prädikate X und Y beide richtige oder beide falsche Aussagen ergeben,
82
118
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
d. h., nach der in der Logik üblichen Ausdrucksweise, dass X und Y gleichen Umfang haben. Diese Bedingung wird z. B. erfüllt durch die Prädikate „ist ein gleichseitiges Dreieck“, „ist ein gleichwinkliges Dreieck“. Der gegebenen Definition für die Gleichheit müssen wir nun auch die Erklärung der Zeichen 0, 1 und des Gegenteils anpassen. 0 bedeute: „ist, was es ist“, also ein Prädikat, das jedem Gegenstande zukommt.
5
1 bedeute: „ist, was es nicht ist“, ein Prädikat, das keinem Gegenstande zukommt. Unter dem Gegenteil X von X verstehen wir das Prädikat, welches einem Gegenstande zukommt, wenn X für ihn eine falsche Aussage ergibt. Stellt also X das Prädikat „ist schön“ dar, so bedeutet X: „ist nicht schön“.1)
83
84
Für die Summe und das Produkt entnehmen wir wie bisher die Bedeutung aus den sprachlichen Verknüpfungen mit „und“ und „oder“, sodass z. B., wenn bezüglich X, Y die Prädikate „ist vergänglich“, | „besitzt Erkenntnis“ darstellen, X +Y das Symbol ist für das Prädikat „ist vergänglich und besitzt Erkenntnis“, XY das Symbol für „ist vergänglich oder besitzt Erkenntnis“. Damit sind jetzt die Bedeutungen für alle Zeichen im Prädikaten-Kalkül festgelegt. Die Gleichungen erhalten dabei den Sinn von allgemeinen Urteilen. Insbesondere drückt eine Gleichung X = 0 aus, dass das Prädikat X allen Gegenständen zukommt, und eine Gleichung X = 1 besagt, dass X keinem Gegenstande zukommt. Um die gewöhnlichen allgemeinen Urteile wie etwa „alle Menschen sind sterblich“ zur Darstellung zu bringen, kann man zunächst ein solches Urteil in der Form aussprechen: „es gibt keinen Gegenstand, der zugleich ein Mensch ist und nicht sterblich ist“. Führt man dann für das Prädikat „ist ein Mensch“ das Zeichen X, für „ist sterblich“ das Zeichen Y ein, so ergibt sich als symbolische Darstellung des Urteils: X+Y = 1. Entsprechend wird ein negatives allgemeines Urteil wie „kein Mensch ist vollkommen“ durch eine Gleichung: X + Y = 1 dargestellt, worin X, Y bezüglich die Prädikate „ist ein Mensch“, „ist vollkommen“ bedeuten und deren genaue Interpretation lautet: „es gibt nichts, was zugleich ein Mensch und vollkommen ist“. Fragen wir uns nun, in wieweit durch die vollzogene Umdeutung der Symbole eine Aenderung des Axiomensystems notwendig wird, so bemerken wir, dass auch bei der neuen Auffassung sämtliche als Axiome aufgestellten Gleichungen richtige, und zwar logisch selbstverständliche Sätze zum Ausdruck bringen. Auch bleibt die Regel gültig, dass gleiche Aussagen für einan|der eingesetzt werden können, da durch eine solche Ersetzung die in einer Gleichung dargestellte Behauptung ihre sachliche Bedeutung nicht ändert. Nur in einem Punkte findet eine Abweichung statt: wir können im Prädikaten-Kalkül nicht voraussetzen, dass für jedes X von den Gleichungen X = 0, X = 1 mindestens eine erfüllt ist. Dies würde ja besagen, dass jedes Prädikat entweder allen Gegenständen oder keinem Gegenstande zukommt, was gewiss nicht zutrifft. (Auch die Voraussetzung, dass die Gleichun1)
Das so definierte Gegenteil stimmt mit dem überein, was man in der Logik das „kontradiktorische Gegenteil“ nennt.
10
15
20
25
30
35
40
‘Prinzipien der Mathematik’
5
10
15
119
gen X = 0 und X = 1 nicht beide für dasselbe X bestehen können, werden wir im Prädikaten-Kalkül nicht einführen.) Dieser Unterschied hat aber auf die formalen Beziehungen keinen weiteren Einfluss. Denn, wie bereits hervorgehoben wurde, haben wir bei den formalen Entwicklungen im Aussagen-Kalkül die Tatsache, dass jede Aussage entweder gleich 0 oder gleich 1 ist, niemals benutzt. Daher können wir den Formalismus des Aussagen-Kalküls vollständig beibehalten und brauchen nur die Deutung der Beziehungen zu ändern. Beispielsweise können wir von der Darstellung eines allgemeinen Urteils durch eine Gleichung X + Y = 1 wieder zu folgenden anderen Darstellungen übergehen: XY = 0, Y = XY, X = X + Y. Für diese Beziehung zwischen X und Y führen wir wie früher das Symbol X → Y ein, welches wiederum bedeutet: „aus X folgt Y “. In der Tat kann ja der Inhalt einer Behauptung wie „alle Menschen sind sterblich“ auch wiedergegeben werden durch den Satz: „aus dem Mensch-sein folgt das Sterblich-sein“. Uebergang zum Klassen-Kalkül
20
25
30
35
40
Ehe wir den Prädikaten-Kalkül in Hinsicht auf seine Verwendbarkeit für die Logik näher untersuchen, wollen wir erst noch eine dritte Art der Interpretation unseres Kalküls in Betracht ziehen. Es handelt sich dabei nicht wieder um einen Uebergang zu neuen logischen Beziehungen, sondern es wird nur den im Prädikaten-Kalkül ausdrückbaren Tatsachen eine veränderte Darstellung gegeben, welche für die Zwecke der Veranschaulichung Vorteil bietet. Diese Aenderung der Darstellung besteht darin, dass wir die Prädikate, statt sie nach ihrem Inhalt zu bestimmen, durch ihren Umfang charakterisieren. Jedem Prädikate entspricht eine Einteilung aller Gegenstände in zwei „Klassen“ 1) , indem ein Gegenstand zur einen oder zur anderen Klasse gerechnet wird, je nachdem ihm das betreffende Prädikat zukommt oder nicht zukommt. (Natürlich ist dabei der Fall nicht ausgeschlossen, dass eine der beiden Klassen gar keinen Gegenstand enthält.) Diese durch die Prädikate bestimmten Klassen sollen jetzt als Objekte eines Kalküls genommen werden, welchen wir demgemäss „Klassen-Kalkül“ nennen. (Als Symbole für die Klassen gebrauchen wir kleine lateinische Buchstaben.) Die Einführung des Klassen-Kalküls wollen wir so gestalten, dass einerseits die formale Uebereinstimmung mit dem bisherigen Kalkül möglichst deutlich hervortritt und dass wir andererseits mit der in der Mengenlehre üblichen Bezeichnungsweise im Einklang bleiben. Jede Klasse ist eine Gesamtheit von Gegenständen, | denen ein bestimmtes Prädikat zukommt, und zugleich auch eine solche Gesamtheit von Gegenständen, denen ein bestimmtes Prädikat (nämlich das Gegenteil des ersten Prädikates) nicht zukommt. Ist x die Klasse der Gegenstände, denen X nicht 1) In der Mathematik wendet man anstelle des Ausdrucks „Klasse“ gewöhnlich das Wort „Menge“ an.
85
86
120
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
zukommt, so wollen wir symbolisch schreiben K(X) = x. Nun stellen wir folgende Definitionen auf: K(0) = 0,
87
88
K(1) = 1.
Ist K(X) = x, so werde K(X) = x gesetzt. Ist K(X) = x, K(Y ) = y, so werde K(X + Y ) = x + y und K(XY ) = xy gesetzt. Ist K(X) = x, K(Y ) = y, so soll die Gleichung x = y gleichbedeutend sein mit X = Y . Bei diesen Festsetzungen ist ersichtlich, dass alle formalen Gesetze des Prädikaten-Kalküls sich auf den Klassen-Kalkül übertragen lassen. Es kommt nun darauf an, dass wir uns den Sinn der Festsetzungen klar machen. Gemäss der Definition der Prädikate 0, 1 ist K(0) die Klasse der Gegenstände, welche nicht das sind, was sie sind, und K(1) ist die Klasse derjenigen Gegenstände, welche das sind, was sie sind. Demnach enthält die Klasse 0 keinen Gegenstand, die Klasse 1 alle Gegenstände. x ist die Klasse der Gegenstände, für welche X falsch, mithin X richtig ist; sie besteht also aus den Gegenständen, welche nicht zu x gehören. Die durch x + y dargestellte Klasse besteht aus denjenigen Gegenständen, für welche X +Y falsch, folglich X + Y richtig, also XY richtig ist, d. h. aus den Gegenständen, für welche entweder X falsch oder Y falsch ist, die also zu mindestens einer der Klassen x, y | gehören. Die Klasse xy besteht aus denjenigen Gegenständen, für welche XY falsch, folglich XY richtig, also X + Y richtig ist, d. h. aus den Gegenständen, für die sowohl X wie Y falsch ist, welche also den beiden Klassen x, y angehören. Die Erklärung der Gleichheit besagt auf Grund der für die Prädikaten-Gleichheit gegebenen Definition, dass zwei Klassen dann und nur dann gleich sind, wenn sie dieselben Gegenstände enthalten. Die ausgeführte Erörterung lehrt uns, dass wir die Erklärungen für die symbolischen Ausdrücke des Klassen-Kalküls von der Beziehung zu den Prädikaten ganz frei machen können. In solch einer unabhängigen Form lauten die Definitionen folgendermassen: 0 ist die Klasse, welche nichts enthält, 1 die Klasse, welche alle Gegenstände enthält. Die Klasse x besteht aus den Gegenständen, welche in x nicht vorkommen; sie heisst die „Komplementär-Klasse“ zu x. x + y bedeutet die Klasse, welche durch Vereinigung der Klassen x und y entsteht; man nennt sie die „logische Summe“ von x und y. xy bedeutet die Klasse der Gegenstände, welche den Klassen x und y gemeinsam sind; sie wird als „logisches Produkt“ oder „Durchschnitt“ oder auch „gemeinsamer Teil“ von x und y bezeichnet. Zwei Klassen heissen gleich, wenn sie dieselben Gegenstände enthalten. Nachdem so der Klassen-Kalkül begründet ist, wollen wir zusehen, welche Form darin die allgemeinen Urteile annehmen. Betrachten wir wieder das Beispiel „alle Menschen sind sterblich“: | X, Y seien die Prädikate „ist ein Mensch“, „ist sterblich“. K(X) = x ist dann die Klasse der Dinge, welche nicht
5
10
15
20
25
30
35
40
45
‘Prinzipien der Mathematik’
5
10
15
20
121
Menschen sind, und K(Y ) = y die Klasse der unsterblichen Dinge. Wird also die Klasse der Menschen mit u, die der sterblichen Dinge mit v bezeichnet, so ist x = u, y = v. Die Gleichung XY = 0, welche das darzustellende Urteil ausdrückt, geht nun über in xy = 0, und bei Einführung von u, v erhält man daraus uv = 0. Nach den Regeln des Kalküls kann für diese Gleichung auch u = uv geschrieben werden, und diese Gleichung besagt, dass der gemeinsame Teil von u und v mit der Klasse u übereinstimmt, dass also die Gegenstände der Klasse u sämtlich unter den Gegenständen der Klasse v vorkommen, kurz, dass u ein Teil von v ist. Das Urteil „alle Menschen sind sterblich“ lässt sich negativ auch so aussprechen „kein Mensch ist unsterblich“. Dieser Umformung entspricht die symbolische Darstellung durch die Klassen u (Klasse der Menschen) und y (Klasse der unsterblichen Dinge). Zwischen u und y erhalten wir aus der Gleichung uv = 0 die Beziehung uy = 0, welche besagt, dass die Klassen u und y keinen Gegenstand gemeinsam haben. Es entspricht also bei der Darstellung im Klassen-Kalkül dem positiven Ausdruck eines allgemeinen Urteils das Enthalten-sein einer Klasse in einer anderen, dem negativen Ausdruck das Getrennt-sein zweier Klassen. Auf diese Weise erhalten die Urteile eine sehr anschauliche Interpretation, die man noch dadurch zu unterstützen pflegt, dass man die Klassen sinnbildlich durch Kreis-Flächen darstellt. Notwendigkeit der Erweiterung des Kalküls zur Darstellung partikulärer Urteile
25
30
35
40
Die Umdeutung, welcher wir unsere Symbolik bei dem Uebergang von dem Aussagen-Kalkül zum Prädikaten-Kalkül und zum Klassen-Kalkül unterzogen, haben wir zu dem Zweck vorgenommen, die Ableitung der in der üblichen Logik behandelten Schlussweisen aus unserem Kalkül zu ermöglichen. Hierfür ist eine Vorbedingung, dass wir allgemeine und partikuläre Urteile mit Hilfe der symbolischen Beziehungen darstellen können. Von der Darstellbarkeit der allgemeinen Urteile haben wir uns bereits überzeugt. Wie steht es aber mit den partikulären Urteilen? Ein partikuläres Urteil lässt sich stets auffassen als das Gegenteil eines allgemeinen Urteils. Z. B. ist die Behauptung „einige Zahlen sind gerade“ das Gegenteil des falschen allgemeinen Urteils „alle Zahlen sind ungerade“. Nun können wir zwar im Prädikaten-Kalkül das Gegenteil eines Prädikates bilden, aber damit erhalten wir nicht das Gegenteil eines Urteils im ganzen. Das Gegenteil eines falschen Urteils muss ein richtiges Urteil sein; wird aber in einem falschen allgemeinen Urteil wie „alle Zahlen sind ungerade“ das Prädikat durch sein Gegenteil ersetzt, so erhält man den Satz „alle Zahlen sind nichtungerade“, also anstelle des richtigen partikulären Urteils „einige Zahlen sind gerade“ das allgemeine Urteil „alle Zahlen sind gerade“, welches wiederum falsch ist. Man kann also nicht durch Bildung des Gegenteils von dem Prädikat aus allgemeinen Urteilen partikuläre Urteile erhalten.
89
122
90
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Dass es aber auch nicht auf irgend eine andere Art möglich ist, mit Hilfe der bisherigen Ausdrucksmittel des Prä|dikaten-Kalküls die partikulären Urteile zur Darstellung zu bringen1) , können wir uns folgendermassen klar machen: Alle Sätze unseres Kalküls haben die Form von Gleichungen. Wie wir wissen, lässt sich jede Gleichung auf 1 reduzieren, und eine solche auf 1 reduzierte Gleichung besagt in der Deutung des Prädikaten-Kalküls, dass Gegenstände von gewissen Eigenschaften nicht vorkommen. Eine Behauptung von dieser Art ist jedenfalls dann richtig, wenn es überhaupt keine Gegenstände gibt, und unter dieser Voraussetzung ist also jede Prädikaten-Gleichung in trivialer Weise erfüllt.2) Demnach ist es unmöglich, durch die bisherige Symbolik des Prädikaten-Kalküls positive Behauptungen über Existenz von Gegenständen auszudrücken. Dies wird aber gerade bei der Darstellung der partikulären Urteile erfordert; denn jedes partikuläre Urteil enthält eine Behauptung, dass es Gegenstände gibt, welche gewisse Eigenschaften besitzen, bezw. nicht besitzen.
5
10
15
Einführung der Ungleichungen (Anzahl der notwendigen Verknüpfungs-Zeichen)
91
Wir sind daher genötigt, unsere Symbolik zu erweitern. Dies soll in der Weise geschehen, dass wir das Gegenteil einer Prädikaten-Gleichung X = Y in Form einer Ungleichung X = Y schreiben. Durch eine solche Ungleichung wird ausgedrückt, dass Gegenstände vorhanden sind, denen von den Prädikaten X, Y das eine zukommt, das andere dagegen nicht zukommt. Insbesondere besagt eine Ungleichung der Form X = 0, dass es Ausnahmen gibt von der Regel, wonach allen Gegenständen X zukommt; und eine Ungleichung X = 1 bedeutet: es kommt vor, dass X für einen Gegenstand zutrifft. Durch jede dieser beiden speziellen Formen von Ungleichungen können die partikulären Urteile dargestellt werden. Z. B. kann das Urteil „einige Zahlen sind ungerade“ folgendermassen umgeformt werden: „es gibt Ausnahmen von 1)
Beim Aussagen-Kalkül, wo sich ja die Negation auf die Aussagen im ganzen bezieht, kann allerdings eine Gleichung auch ein partikuläres Urteil darstellen. Hierbei findet jedoch das partikuläre Urteil als solches, d. h. im Unterschiede vom allgemeinen Urteil, keinen symbolischen Ausdruck. 2) Es ist zu bedenken, dass die Gegenstände, auf welche wir die Prädikate unseres Kalküls beziehen, nicht Dinge im allgemeinsten Sinne und ebensowenig reale Dinge zu sein brauchen, sondern dass es angängig ist, je nach der Anwendung, die man von dem Kalkül machen will, bestimmte Arten von (wirklichen oder uneigentlichen) Gegenständen ausschliesslich in Betracht zu ziehen, also z. B. bei zahlentheoretischen Ueberlegungen ausschliesslich ganze Zahlen, bei Betrachtungen der Euklidischen Geometrie nur Punkte, Geraden und Ebenen als Gegenstände zu nehmen. Aus diesem Grunde ist die Möglichkeit des vollständigen Fehlens von Gegenständen nicht nur formal zuzulassen, sondern kann auch bei Anwendungen des PrädikatenKalküls, etwa wenn es sich um Fragen der Widerspruchslosigkeit von Annahmen handelt, ernstlich in Betracht kommen.
20
25
‘Prinzipien der Mathematik’
5
10
15
20
25
30
35
40
123
der Regel, wonach alle Zahlen gerade sind“, und ferner lässt sich das Urteil auch so aussprechen: „es kommt vor, dass eine Zahl nicht gerade ist“. Diesen beiden Formulierungen entsprechen bei der symbolischen Darstellung, wenn wir die Prädikate „ist eine Zahl“, „ist gerade“ bezüglich mit X, Y bezeichnen, die Ungleichungen XY = 0, X + Y = 1. Ganz entsprechend wie für den Prädikaten-Kalkül lassen sich nun auch beim Klassen-Kalkül die Ungleichungen einführen. Für die Anwendungen genügt es, zwei spezielle Formen von Ungleichungen zu betrachten, nämlich xy = 0 und xy = 0. Die Bedeutung der ersten ist: es gibt Ausnahmen von der Regel, wonach alle Gegenstände der Klasse x auch zu y gehören. Die zweite | besagt: es kommt vor, dass ein Gegenstand sowohl zu x wie zu y gehört. Bei der bildlichen Darstellung der Klassen x, y durch Kreisflächen wird die erste Ungleichung dadurch veranschaulicht, dass der Kreis x mindestens teilweise ausserhalb des Kreises y liegt, und die zweite Ungleichung dadurch, dass sich die Kreise x und y mindestens teilweise überdecken. Die Einführung der Ungleichungen in den Prädikaten-Kalkül hat die Bedeutung einer Unterscheidung zweier Arten von Negation, nämlich der Negation eines Prädikates von der Negation der Allgemeinheit eines Urteils. Diese Unterscheidung ist bedingt durch die Spaltung der Aussagen in Subjekt und Prädikat, von der wir bei der geänderten Deutung unseres Kalküls ausgegangen sind.1) Während nämlich für eine Aussage als Ganzes nur die zwei Möglichkeiten bestehen, dass sie richtig oder falsch ist (X = 0 oder X = 0), kommen bei einem Prädikate X die vier Fälle in Betracht: dass es für alle Gegenstände zutrifft (X = 0), dass es nicht für alle Gegenstände zutrifft (X = 0), dass es für alle Gegenstände unzutreffend ist (X = 0), dass es nicht für alle Gegenstände unzutreffend ist (X = 0); und zwar ergibt sich diese Vierzahl der Fälle dadurch, dass in dem Urteil, welches der Gleichung X = 0 entspricht, einerseits das Prädikat selbst, andrerseits seine Anwendbarkeit auf alle Gegenstände verneint werden kann. Aus dieser beim Prädikaten-Kalkül eintretenden Verdoppelung der Mannigfaltigkeit der dar|zustellenden logischen Beziehungen erklärt sich das Bedürfnis nach einer Erweiterung der Symbolik durch ein neues Verknüpfungszeichen. Da das Ungleichheits-Zeichen allein schon zur Vervollständigung des Prädikaten-Kalküls ausreicht und da sich andererseits die Gleichungen des Kalküls, wie wir wissen, sämtlich mit Hilfe der drei Verknüpfungen „und“, „nicht“, „gleich“ (abgesehen von den Interpunktionen) ausdrücken lassen, so folgt, dass wir in der Sprache des Prädikaten-Kalküls mit den vier Verknüpfungszeichen „und“, „nicht“, „gleich“, „ungleich“ auskommen können. 47 Dem Einwand gegenüber, dass ja noch 0 und 1 hier ebenfalls die Rolle von sin1)
Auf dieser Sonderung von Subjekt und Prädikat beruht es ja auch, dass dem Prädikaten-Kalkül als gleichberechtigt der Klassen-Kalkül zur Seite tritt. Man könnte diesen Kalkül, der sich auf die Klassen von Aussage-Subjekten bezieht, zum Zweck der schärferen Gegenüberstellung auch als Subjekten-Kalkül bezeichnen. 47–47 Added
by Hilbert (ink).
92
93
124
94
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
gulären Zeichen spielen, begegnen wir, indem wir noch besser statt „gleich“, „ungleich“ vielmehr „gleich Eins“ und „ungleich Eins“ nehmen. 47 Um mit den Ungleichheitszeichen im Kalkül operieren zu können, müssen wir noch ein Axiom einführen, das sich auf Ungleichungen bezieht. Wir stellen es in folgender Form auf: Unter den Bedingungen X = 1 und X → Y ist stets Y = 1, d. h.: wenn es Gegenstände gibt, denen das Prädikat X zukommt, und wenn jedem Gegenstand, welchem X zukommt, auch Y zukommt, so gibt es Gegenstände, denen Y zukommt. Was wir hiermit postulieren, ist eine logische Umkehrung des Satzes 5.) bei Zugrundelegung der Deutungsweise des Prädikaten-Kalküls. Nachdem hiermit unser Kalkül die erforderliche Ergänzung erfahren hat, wollen wir jetzt zur Anwendung des Kalküls auf die Lehre von den logischen Schlüssen übergehen, und zwar wollen wir zunächst vier spezielle Beispiele von Schlussfiguren der traditionellen Logik betrachten. Dabei handelt es sich zu|nächst um die symbolische Darstellung der Schlüsse, welche sowohl für die Bezeichnungen des Prädikaten-Kalküls wie für die des Klassen-Kalküls angegeben werden soll, und dann um die formale Ableitung des Schlusses aus den Prämissen, die wir nur im Prädikaten-Kalkül ausführen wollen, während wir beim Klassen-Kalkül, der ja in formaler Hinsicht nichts grundsätzlich Neues bietet, von der Methode der bildlichen Darstellung Gebrauch machen werden.
5
10
15
20
Beispiele für die Ausführung logischer Schlüsse im Prädikaten- und Klassen-Kalkül 1. Beispiel: „Alle Menschen sind sterblich, alle Mathematiker sind Menschen, folglich sind alle Mathematiker sterblich.“ X : „ist ein Mathematiker“ Y →Z z Y : „ist ein Mensch“ X→Y y Z : „ist sterblich“ X→Z x Der Beweis folgt unmittelbar aus Satz 6.). x : Klasse der Mathematiker y = yz y : Klasse der Menschen x = xy z : Klasse der Sterblichen x = xz
95
2. Beispiel: „Kein Menschenwerk ist vollkommen, jede Theorie ist Menschenwerk, folglich ist keine Theorie vollkommen.“ X : „ist eine Theorie“ Y →Z Y : „ist ein Menschenwerk“ X→Y Z : „ist vollkommen“ X→Z Der Beweis wird wieder direkt durch den Satz 6.) z x geliefert. x : Klasse der Theorien yz = 0 y y : Klasse der Menschenwerke x = xy z : Klasse der vollkommenen Dinge xz = 0
25
30
35
40
‘Prinzipien der Mathematik’
5
10
15
20
25
30
125
3. Beispiel: „2 ist eine gerade Zahl, 2 ist eine Primzahl, also ist nicht jede Primzahl ungerade“. Um den Schluss in das übliche Schema der Schlussfiguren einzuordnen, geben wir ihm folgenden etwas geänderten Ausdruck: „es gibt etwas, das gleich 2 ist und gerade ist; alles, was gleich 2 ist, ist eine Primzahl; folglich gibt es gerade Primzahlen“. Schematisch noch einfacher ist folgende Formulierung: „Einiges, was gleich 2 ist, ist gerade; alles, was 2 ist, ist eine Primzahl; folglich sind einige Primzahlen gerade.“ X : „ist eine Primzahl“ Y + Z = 1 z Y : „ist gleich 2“ Y →X x Z : „ist gerade“ X + Z = 1 y Beweis: Y → X, also nach Satz 8.), Y + Z → X + Z; Y + Z = 1, folglich, gemäss dem Ungleichungs-Axiom, X + Z = 1. x : Klasse der Primzahlen yz = 0 y : Klasse der Zahlen, die gleich 2 sind y = yx z : Klasse der geraden Zahlen xz = 0 4. Beispiel: „Was sich (mit Zirkel und Lineal) konstruieren lässt, ist algebraisch; nicht jede Grösse ist algebraisch; folglich ist nicht jede Grösse konstruierbar“. X : „ist eine Grösse“ Z→Y x Y : „ist algebraisch“ X + Y = 1 Z : „ist konstruierbar“ X + Z = 1 Beweis: Z → Y ; also, nach Satz 4.), Y → Z und nach Satz 8.) X + Y → X + Z; X + Y = 1, folglich, nach dem z Ungleichungs-Axiom, X + Z = 1. y x : Klasse der Grössen z = zy y : Klasse dessen, was algebraisch ist xy = 0 z : Klasse dessen, was konstruierbar ist xz = 0 Anwendungsbeispiele
35
40
Wir haben das vorige Mal an Beispielen gesehen, wie sich der PrädikatenKalkül zur Darstellung und Ableitung von Schlüssen verwenden lässt. Es mögen hier nachträglich drei einfache Beispiele von solchen Schlüssen gegeben werden, die sich mit Hilfe des Aussagen-Kalküls ausführen lassen. 1. „Wenn jede stetige Funktion in einem abgeschlossenen Gebiet einen kleinsten Wert besitzt, so ist jede ganzzahlige algebraische Gleichung im Bereiche der komplexen Zahlen lösbar; nun besitzt jede stetige Funktion in einem abgeschlossenen Gebiet ein Minimum; also hat jede ganzzahlige algebraische Gleichung im Bereiche der komplexen Zahlen eine Lösung.“ Bezeichnet man mit X den Satz von der Existenz des Minimums einer stetigen Funktion in einem abgeschlossenen Gebiet, mit Y den Satz von der
96
97
126
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Lösbarkeit jeder algebraischen Gleichung im Komplexen, so erhält man die symbolische Darstellung: X = 0,
X → Y,
folglich
Y = 0,
welche den Schluss als eine direkte Anwendung von Satz 3.) erkennen lässt. 2. „Wenn jede reelle Zahl algebraisch ist, so ist die Menge der reellen Zahlen abzählbar; nun ist aber die Menge der reellen Zahlen nicht abzählbar; also ist nicht jede reelle Zahl algebraisch.“ X bedeute die Behauptung, dass jede reelle Zahl algebraisch ist, Y die Behauptung der Abzählbarkeit der Menge aller reellen Zahlen. Dann lautet die symbolische Darstellung: X → Y, 98
Y = 1,
folglich
Y → Z,
also
10
X = 1.
Diese Schlussfolgerung geschieht nach dem Satz 5.). 3. „Wenn für die Ebene die Anordnungs-Axiome der Euklidischen Geometrie gelten, so lässt sich jedem Dreieck in der Ebene eindeutig ein Umlaufssinn zuordnen; wenn jedem Dreieck der Ebene ein Umlaufssinn zukommt, so teilt jedes einfache Polygon die Ebene in zwei getrennte Gebiete; demnach folgt aus der Gültigkeit der Anordnungs-Axiome der Satz, dass durch jedes einfache Polygon die Ebene in zwei Gebiete zerfällt.“ X bezeichne die Behauptung der Gültigkeit der Anordnungs-Axiome, Y den Satz, dass jedem Dreieck eindeutig ein Umlaufssinn zugeschrieben werden kann, und Z den Satz, dass jedes einfache Polygon die Ebene in zwei Gebiete zerlegt. Dann lässt sich der Schluss in der Form schreiben: X → Y,
5
15
20
X → Z,
wodurch er als Anwendung des Satzes 6.) kenntlich wird. — Systematische Ableitung der traditionellen Aristotelischen Schlüsse vom Standpunkt des Prädikaten-Kalküls
99
Nachdem wir uns an einzelnen typischen Beispielen die Anwendbarkeit unseres Kalküls zur Ausführung von Schlüssen verdeutlicht haben, wollen wir jetzt in allgemeinerer Weise die Beziehung des Prädikaten-Kalküls zur klassischen Logik untersuchen. Es handelt sich darum, zu erkennen, wie sich die klassischen Aristotelischen Schlussfiguren in unseren Prädikaten-Kalkül einordnen, wie sie sich vom Standpunkt dieses Kalküls systematisieren und begründen lassen. Die charakteristischen Eigenschaften der zu betrachtenden Schlüsse sind folgende: Sie bestehen aus drei Sätzen, von denen der dritte (der Schlusssatz) eine logische Folge der beiden ersten (der Prämissen) bildet. Jeder der drei Sätze hat | eine der vier Formen: „alle A sind B“ „einige A sind B“ „kein A ist B“ „einige A sind nicht B“
(allgemein bejahendes Urteil) (partikulär bejahendes Urteil) (allgemein verneinendes Urteil) (partikulär verneinendes Urteil),
25
30
35
40
‘Prinzipien der Mathematik’
5
zu deren abgekürzter Bezeichnung man die Vokale a, i, e, o (in der angegebenen Reihenfolge) zu verwenden pflegt.1) (Als gemeinsames Zeichen für die vier Urteilsformen möge das Symbol AB dienen.) In den drei Sätzen treten im ganzen drei Begriffe auf, der Subjektsbegriff (S), der Prädikatsbegriff (P), und der Mittelbegriff (M); und zwar hat der Schlusssatz die Form SP, und von den Prämissen enthält die erste die Begriffe M und P, die zweite enthält M und S. Demnach ergeben sich folgende vier „Figuren“ von Schlüssen:2) MP SM SP
10
15
20
PM SM SP
MP MS SP
PM MS SP
Da bei jeder der vier Schlussfiguren für einen jeden der drei Sätze des Schlusses je nach seiner Zugehörigkeit zu einer der Urteilsformen a, i, e, o vier Möglichkeiten bestehen, so wären, rein kombinatorisch betrachtet, 256 verschiedene Arten von | Schlüssen denkbar. Jedoch wird durch die Forderung, dass der Schlusssatz aus den Prämissen folgen soll, die Anzahl der Möglichkeiten wesentlich beschränkt. Die Aristotelische Logik lehrt, dass 19 verschiedene Schlussarten zulässig sind. Man hat für diese Schlussarten dreisilbige Merkworte eingeführt, in denen die Vokale der Reihe nach die Urteilsformen angeben, zu welchen bezüglich die drei Sätze des Schlusses gehören. Bei dieser Benennung erhalten wir folgende Uebersicht: 1. Figur. barbara celarent darii ferio
25
30
127
2. Figur. cesare camestres festino baroco
3. Figur. datisi ferison disamis bocardo darapti felapton
4. Figur. camenes fresison dimatis bamalip fesapo
Diese Zusammenstellung von Schlüssen wollen wir nun an Hand des Prädikaten-Kalküls daraufhin prüfen, ob sie wirklich alle in Betracht kommenden Schlussarten enthält und ob alle darin aufgezählten Schlussweisen der Anforderung der logischen Bündigkeit genügen. Hierzu stellen wir uns zunächst die vier Formen a, i, e, o eines Urteils AB symbolisch dar. Bezeichnen X, Y die Prädikate „ist A“, „ist B“, so lauten die symbolischen Beziehungen, auf 1 reduziert: X + Y = 1,
35
1)
X + Y = 1,
X + Y = 1,
X + Y = 1.
Die Bezeichnung ist so gewählt, dass die beiden Formen von bejahenden Urteilen durch die beiden ersten Vokale des Wortes „affirmo“ (ich bejahe), die beiden Formen verneienender Urteile durch die Vokale des Wortes „nego“ (ich verneine) benannt werden. 2) Man beachte, dass die Festlegung der Reihenfolge von S und P im Schlusssatz keine Beschränkung der Allgemeinheit darstellt, da ja eine Schlussfigur mit PS als Schlusssatz stets aus einer der vier genannten Figuren durch blosse Aenderung der Bezeichnung hervorgeht.
100
128
101
102
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Aus dieser Schreibweise ergeben sich ohne weiteres die auf die betrachteten Urteilsformen bezüglichen traditionellen Regeln | über die Entgegensetzung (Opposition) und die Umkehrung, indem von den vier Urteilen das letzte als das Gegenteil des ersten, das zweite als das Gegenteil des dritten ausgedrückt ist und ferner die beiden mittleren Formeln in bezug auf X und Y symmetrisch sind, sodass sich das Urteil „einige A sind B“ als gleichbedeutend erweist mit „einige B sind A“ und ebenso das Urteil „kein A ist B“ als gleichbedeutend mit „kein B ist A“, während bei den Urteilen der Formen a und o eine solche Umkehrung nicht möglich ist. Wenden wir jetzt diese Darstellungsweise der vier Urteilsformen bei den Schlüssen an, indem wir für die Prädikate „ist S “, „ist M “, „ist P “ bezüglich die Zeichen X, Y , Z einführen, so kommen die charakteristischen Merkmale der betrachteten Schlussformen folgendermassen zum Ausdruck: Jeder Schluss besteht aus drei Formeln, von denen jede eine auf 1 reduzierte Gleichung oder Ungleichung ist, auf deren linker Seite eine zweigliedrige Summe steht. Diese Summe hat bei der ersten Prämisse eine der vier Formen Y +Z, Y +Z, Z +Y , Z +Y , bei der zweiten Prämisse eine der Formen Y +X, Y +X, X +Y , X +Y , beim Schlusssatz eine der beiden Formen X + Z, X + Z. (Man beachte, dass das Gegenteil von X, Y oder Z nur als zweites Glied einer Summe auftreten kann.) Zu diesen formalen Bedingungen tritt nun noch die Forderung, dass die dritte Formel eine Folge der beiden ersten sein soll in dem Sinne, dass beim Einsetzen bestimmter Prädikate für X, Y , Z die beiden ersten Formeln nicht erfüllt sein können, ohne dass auch die dritte gültig ist. Es kommt jetzt darauf an, | zu untersuchen, wie durch diese Forderung die Mannigfaltigkeit der zulässigen Formel-Kombinationen beschränkt wird. Für diese Diskussion ist die Bemerkung nützlich, dass wir, ohne an der Gültigkeit einer Formel etwas zu ändern, zwei Glieder einer Summe miteinander vertauschen können, dass ferner die Reihenfolge der Prämissen unwesentlich ist und dass wegen der Allgemeinheit, mit der eine Schlussfolgerung gelten soll, die Benennung der Prädikate nichts ausmacht. Auf Grund dieser Tatsachen können wir jedes Paar von Prämissen auf eine von folgenden 6 Normalformen zurückführen: I)
U +V V +W II) U + V V +W
=1 =1 =1 =1
III)
U +V V +W IV) U + V V +W
= 1 =1 = 1 =1
V)
U +V V +W VI) U + V V +W
= 1 = 1 = 1 = 1,
5
10
15
20
25
30
35
wobei die im Schlusssatz stehende Summe eine von den Formen U + W,
U + W,
U + W,
U +W
annimmt. Von der neuen Schreibweise der Schlüsse gelangt man zu den früheren Formeln dadurch zurück, dass man für V entweder Y oder Y substituiert, ferner U , W oder aber W , U einem der Paare X, Z; X, Z; X, Z; X, Z gleichsetzt und dann alle möglichen Vertauschungen von Summen-Gliedern in Betracht zieht, welche (bei geeigneter Reihenfolge der Prämissen) auf eines der formal zulässigen Drei-Formel-Systeme führen.
40
45
‘Prinzipien der Mathematik’
5
10
15
Prüfen wir nun jene 6 Paare von Prämissen I)–VI) darauf hin, was aus ihnen gefolgert werden kann, so finden wir zunächst, dass sich aus I), IV), V) kein Schluss der verlangten Art | ergibt. I) ist nämlich für V = 1 bei ganz beliebigen U , W erfüllt. IV) ist für V = 0 erfüllt, sofern nur U = 1 ist, und V) ist für V = 0 erfüllt, sofern nur U = 1 und W = 1 ist. Auch die Prämissen VI) liefern keinen der in Betracht kommenden Schlusssätze. Denn damit sie (durch geeignete Wahl von V ) befriedigt werden können, genügt es, dass U = 1, W = 1 ist und ausserdem U = W , d. h. mindestens eine der beiden Ungleichungen U + W = 1, U + W = 1 erfüllt ist, wie man im Falle U + W = 1 durch Einsetzen von V = W , im Falle U + W = 1 durch Einsetzen von V = U ersieht. Die genannten Bedingungen U = 1, W = 1, U = W sind jedoch mit der Falschheit eines jeden der in Frage stehenden Schlusssätze vereinbar.1) Demnach kommen für unsere Schlüsse einzig die Fälle II) und III) in Betracht. Die Prämissen II) lauten in veränderter Schreibung: U →V,
20
V → W.
V → W.
Man schliesst daraus gemäss Satz 8.) und dem Ungleichungs-Axiom: U + V → U + W , U + W = 1. Ist umgekehrt die Bedingung U + W = 1 | erfüllt, so werden die Prämissen III) durch V = W befriedigt. Somit ergibt sich, dass die von uns betrachteten Schlüsse sich alle auf zwei Hauptformen zurückführen lassen, nämlich U +V =1 (A) V + W = 1 U +W =1
30
35
103
Sie liefern nach Satz 6.) die Beziehung U → W , d. h. U + W = 1, und diese Bedingung ist auch zur Lösbarkeit der Gleichungen II) hinreichend, da ja V = W eine Lösung ergibt. Die Prämissen III) lassen sich schreiben in der Form: U + V = 1,
25
129
U +V = 1 (B) V + W = 1 U + W = 1
Es handelt sich nun noch darum, von diesen beiden Hauptformen vermittelst der verschiedenen zulässigen Transformationen wieder zu den früheren Darstellungen überzugehen, an Hand deren wir die verschiedenen Aristotelischen Schlussarten unterscheiden können. Dabei müssen wir die formalen Beschränkungen der Schlüsse berücksichtigen, gemäss denen die verneinten Prädikate X, Y , Z nur an zweiter Stelle in einer Summe auftreten dürfen und X niemals im Schlusssatz vorkommt. Ferner ist zu beachten, dass bei der Hauptform (A) die Vertauschung von U mit W keine neuen Schlussarten liefert. 1)
Während die Bedingungen U = 1, W = 1 unter Voraussetzung der Prämissen VI) notwendig sind, ist U = W nicht notwendig; vielmehr lassen sich die Prämissen auch für U = W erfüllen, sofern es nur mehr als einen Gegenstand gibt, für welchen das Prädikat U zutrifft.
104
130
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Demnach erhalten wir alle aus der Hauptform (A) entspringenden Schlussweisen durch die Substitutionen: U = X, V = Y , W = Z; U = X, V = Y , W = Z; U = X, V = Y , W = Z, von denen (bei geeignet gewählter Reihenfolge der Prämissen sowie der Summen-Glieder) die erste auf die Schlüsse camestres und camenes, die zweite auf celarent und cesare, die dritte auf barbara führt; und für die Hauptform (B) erhalten wir die verschiedenen Schlussarten aus den Substitutionen: 105
U = X, V = Y, W = Z; U = X, V = Y , W = Z;
U = X, V = Y, W = Z; U = Z, V = Y, W = X;
5
10
U = Z, V = Y, W = X, von denen die erste die Schlüsse ferio, festino, ferison, fresison, die zweite darii und datisi, die dritte baroco, die vierte disamis und dimatis, und die fünfte bocardo ergibt. (Man beachte, dass bei den Schlüssen, welche aus einer und derselben Substitution gewonnen werden, die Vokale der Merkworte übereinstimmen.) Die angestellte Ueberlegung zeigt uns, dass es von Schlüssen der verlangten Art 15 verschiedene Formen gibt; diese gehören alle zu den Aristotelischen Schlüssen, sodass die klassische Zusammenstellung der Schlussformen alle möglichen Fälle erschöpft. Jedoch haben wir nicht sämtliche der Aristotelischen Schlussweisen bei unserem Verfahren wiedergefunden, vielmehr fehlen in der erhaltenen Uebersicht die vier Schlussarten
15
20
darapti, bamalip, felapton, fesapo.
106
Diese Diskrepanz rührt davon her, dass die Deutung der positiven allgemeinen Sätze („alle A sind B“) bei Aristoteles mit unserer Interpretation der Gleichungen X + Y = 0 insofern nicht vollkommen in Einklang steht, als nach Aristoteles ein Urteil „alle A sind B“ nur dann als wahr gilt, wenn es Gegenstände gibt, welche A sind. Unsere Abweichung von Aristoteles in diesem Punkte wird durch die Rücksicht auf die mathematischen Anwendungen der Logik gerechtfertigt, bei denen die Zugrundelegung der Aristotelischen Auffassung unzweckmässig wäre. Dass jene vier erwähnten Schlüsse von unserem Standpunkt wirklich nicht zulässig sind, kann man daraus ersehen, dass | bei ihnen die Prämissen allgemein sind, also im Kalkül die Form von Gleichungen haben, während der Schlusssatz partikulär, also durch eine Ungleichung darzustellen ist; in der Tat lässt sich ja, wie früher bemerkt, aus dem Erfüllt-sein von Gleichungen des Prädikaten-Kalküls niemals das Bestehen einer Ungleichung folgern. Aus unserer Betrachtung über die Aristotelischen Schlüsse geht hervor, dass wir mit dem Formalismus des Prädikaten-Kalküls die traditionelle Logik beherrschen. Jene klassischen Schlussformen stellen sich im PrädikatenKalkül als einfachste Fälle von Eliminations-Aufgaben dar. Allerdings führt in Hinsicht auf die Möglichkeit der logischen Folgerungen der Prädikaten-Kalkül nicht weiter als die klassische Logik, jedoch ist er dieser insofern überlegen, als
25
30
35
40
‘Prinzipien der Mathematik’
131
er die in der üblichen Logik nicht weiter begründbaren Schlussweisen auf einfachere Prinzipien zurückzuführen gestattet und uns dadurch zugleich einen systematischeren Ueberblick über die verschiedenen möglichen Schlussarten liefert. 5
10
15
20
25
30
35
Andeutungen über die formale Ausgestaltung des Operierens mit Ungleichungen Zur Abrundung des Prädikaten-Kalküls müssen wir noch eine formale Ergänzung anbringen, welche sich auf das Rechnen mit Ungleichungen bezieht. Wir haben bisher das formale Operieren mit den Ungleichungen nur insoweit begründet, als es zur Ausführung von Schlüssen unumgänglich notwendig ist. Hierfür braucht man lediglich die auf 1 reduzierten Ungleichungen in Betracht zu ziehen, und so bezieht sich das von uns angewandte Ungleichungs-Axiom auch ausschliesslich auf solche Ungleichungen. | Wollen wir in dem Formalismus der Ungleichungen entsprechende Symmetrieen und eine entsprechende Mannigfaltigkeit der Darstellungsmöglichkeiten wie bei dem Formalismus der Gleichungen erhalten, so müssen wir zwischen den auf 1 reduzierten Ungleichungen und den allgemeinen Ungleichungen der Form X = Y eine formale Beziehung herstellen. Dies geschieht am einfachsten, indem wir die Beziehung X = Y (unter Ausschaltung der früher für sie gegebenen inhaltlichen Erklärung) durch diejenige auf 1 reduzierte Ungleichung definieren, welche das Gegenteil der mit X = Y äquivalenten, auf 1 reduzierten Gleichung bildet. Nach Satz 11.) ist X = Y gleichbedeutend mit XY + Y X = 0, also gemäss dem Dualitätsprinzip auch mit (X + Y )(Y + X) = 1, was ausgerechnet XY + XY = 1 ergibt. Wir erklären demnach X = Y als abgekürzten Ausdruck für die Beziehung XY + XY = 1. Als Beispiel dafür, wie man mit dieser Definition formal operieren kann, möge der Beweis folgendes Satzes dienen: Wenn X = Y , so besteht auch X = Y . Gemäss unserer Definition besagt die Voraussetzung: XY + XY = 1, und die Behauptung besagt XY + XY = 1. Da XY + XY = XY + XY , so ist der aufgestellte Satz bewiesen, sofern allgemein aus U = 1, U = V auf V = 1 geschlossen werden kann. Dies folgt aber sofort aus unserem UngleichungsAxiom, weil sich nach Satz 11.) aus U = V die Beziehung U → V ergibt. Setzen wir in dem bewiesenen Satze für Y das spezielle Prädikat 1, so finden wir (mit Benutzung der Beziehung 1 = 0): Aus X = 1 folgt X = 0.
3. Ueberleitung zum Funktionen-Kalkül. Vereinigung des Prädikaten-Kalküls mit dem Aussagen-Kalkül
40
Mit der Entwicklung der formalen Konsequenzen, welche die neu eingeführte Definition nach sich zieht, gelangt der Prädikaten-Kalkül zu seinem äusseren Abschluss. Jedoch erhalten wir damit noch keineswegs einen be-
107
108
132
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
friedigenden Abschluss des Logik-Kalküls überhaupt. Denn unsere logische Symbolik weist in ihrer bisherigen Form noch wesentliche Mängel auf. Ein solcher Mangel zeigt sich zunächst darin, dass der Aussagen-Kalkül und der Prädikaten-Kalkül getrennt nebeneinander stehen. Zu einer Methode, durch welche sich dieser Uebelstand beheben lässt, gelangen wir auf Grund der Erwägung, dass die Beziehungen des Prädikaten-Kalküls ja Aussagen darstellen, welche dem Aussagen-Kalkül unterworfen werden können. Dieser Gedanke führt zur Aufstellung eines kombinierten Kalküls, dessen Beziehungen Aussagen-Gleichungen sind, in welchen als Glieder der symbolischen Ausdrücke teils die speziellen Aussagen 0, 1, teils Prädikaten-Relationen auftreten (die zur Deutlichkeit der Schreibweise zwischen Klammern zu setzen sind). Die Deutung der Formeln ergibt sich dabei ohne weiteres aus der Bedeutung der Prädikaten-Gleichungen und der Aussagen-Gleichungen. Beispielsweise besagt die Formel (X + Y = Z) = 0, dass die Prädikaten-Beziehung X + Y = Z zutrifft;
5
10
15
(X = 1) + (Y → Z) = 1
109
bedeutet, dass die Beziehungen X = 1 und Y → Z nicht beide zusammen erfüllt sind; (X = 0) + (Y → Z) → (U → V ) besagt: „aus dem Bestehen von X = 0 und dem Nicht-Bestehen von | Y → Z, folgt das Nicht-Bestehen von U → V . Die identisch geltenden Beziehungen dieses zusammengesetzten Kalküls haben die Bedeutung von Sätzen des Prädikaten-Kalküls, und wir erhalten daher durch solche Identitäten formale Darstellungen von Definitionen, Axiomen und Lehrsätzen, die wir bisher nur sprachlich zum Ausdruck bringen konnten. So z. B. lautet in der neuen symbolischen Darstellung die Definition des Zeichens „→“ (X → Y ) = (XY = 0), der Satz 3.) wird ausgedrückt durch die Formel
20
25
30
(X → Y ) + (X = 0) → (Y = 0), Satz 11.) durch die Formel (X → Y ) + (Y → X) = (X = Y ). Diese Methode der Vereinigung des Aussagen-Kalküls mit dem Prädikaten-Kalkül bildet eine natürliche Verallgemeinerung desjenigen Verfahrens, welches wir bei der Einführung der Ungleichungen befolgt haben. Denn indem wir das Gegenteil einer Prädikaten-Gleichung bildeten, haben wir auf die Prädikaten-Gleichung die Negation des Aussagen-Kalküls angewandt. Auf diesem Zusammenhange der Prädikaten-Ungleichungen mit dem AussagenKalkül beruht es auch, dass in dem erweiterten Kalkül die Anwendung des Ungleichheits-Zeichens entbehrlich wird. Denn eine Prädikaten-Beziehung X = Y kann ja, mit Anwendung des Negations-Zeichens für Aussagen, durch das Symbol (X = Y ) dargestellt werden, sodass z. B. das von uns angewandte
35
40
‘Prinzipien der Mathematik’
133
Ungleichungs-Axiom sich in der Form (X → Y ) + (X = 1) → (Y = 1)
5
10
15
20
25
30
35
40
schreiben lässt. Die einfache Behauptung einer Prädikaten-Un|gleichung X = Y kann sogar ohne Anwendung des Negations-Zeichens durch die Gleichung (X = Y ) = 1 ausgedrückt werden. Da sich alle Aussagen-Gleichungen wie auch alle Prädikaten-Gleichungen auf 1 reduzieren lassen, so genügen zur Darstellung der Beziehungen des erweiterten Kalküls (abgesehen von den Klammern) drei Verknüpfungs-Symbole, nämlich die Zeichen +, = 1, und das Negations-Zeichen.
110
Beispiele für die Unzulänglichkeit der bisherigen Methode Obwohl nun die Verbindung des Prädikaten-Kalküls mit dem AussagenKalkül uns einen Gewinn an formalen Ausdrucksmöglichkeiten verschafft, so bleibt doch auch in der erweiterten Form der Prädikaten-Kalkül prinzipiell unzulänglich zur Behandlung der logischen Grundlagen der Mathematik. Er versagt nämlich bereits überall da, wo es darauf ankommt, eine Beziehung zwischen mehreren Gegenständen zur symbolischen Darstellung zu bringen. Nehmen wir z. B. den Satz: „Wenn B zwischen A und C liegt, so liegt B auch zwischen C und A.“ Diesen können wir zwar im gewöhnlichen AussagenKalkül in der Form X → Y aufschreiben, und dieselbe Darstellung erhält der Satz auch im Prädikaten-Kalkül (da er ja folgendermassen formulierbar ist: „Wenn ein geordnetes Punkte-Tripel die Eigenschaft hat, dass der zweite Punkt zwischen dem ersten und dritten liegt, so besitzt es auch die Eigenschaft, dass der zweite Punkt zwischen dem dritten und ersten liegt“). Jedoch kommt bei dieser symbolischen Schreibweise das logisch Wesentliche der behaupteten Beziehung gar nicht zum Ausdruck, und daher lässt sich diese Darstellung auch nicht dazu verwenden, um aus dem betrachteten | Satze die sich aus ihm ergebenden mathematischen Folgerungen abzuleiten. (Hieran ändert sich natürlich auch nichts, wenn wir die Darstellungsweise des erweiterten Kalküls (X → Y ) = 0 benutzen.) Zur Verdeutlichung des hier vorliegenden Sachverhaltes möge noch ein weiteres, übrigens nicht der Mathematik angehöriges Beispiel angeführt werden. Es ist gewiss eine logisch selbstverständliche Behauptung: „wenn es einen Sohn gibt, so gibt es einen Vater“; und von einem logischen Kalkül, der uns befriedigen soll, können wir verlangen, dass er diese Selbstverständlichkeit in Evidenz setzt, in dem Sinne dass der behauptete Zusammenhang vermittelst der symbolischen Darstellung als Folge von einfachen logischen Prinzipien kenntlich wird. Davon ist aber bei unserem bisherigen Kalkül keine Rede. Wir können hier zwar (unter Anwendung des kombinierten Kalküls) die betrachtete Behauptung symbolisch ausdrücken durch die Formel (X = 1) → (Y = 1), worin X, Y bezüglich die Prädikate „ist ein Sohn“, „ist ein Vater“ bedeuten. Doch vermag uns diese Formel gewiss nicht zur Einsicht in die Wahrheit der
111
134
112
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Behauptung zu verhelfen, da sie ja bei anderer Bedeutung der Buchstaben auch falsche Sätze ausdrücken kann. Es kommt darin dasjenige nicht zur Darstellung, worauf der logische Zusammenhang zwischen Vordersatz und Nachsatz beruht, dass nämlich die Prädikate des Sohn-Seins und des Vater-Seins eine Beziehung des Gegenstandes zu einem anderen Gegenstand enthalten, von dem der betreffende Sohn oder Vater ist. Dieser Umstand kann in der Symbolik des Prädikaten-Kalküls deshalb nicht zur Geltung kommen, weil sich bei dieser die | Prädikate nicht formal zerlegen lassen, sondern immer nur als ungetrenntes Ganzes in die Formeln eingehen. Methodische Grundgedanken des Funktionen-Kalküls; neue Art der Bezeichnung („Primzahl sein“, Liegen eines Punktes auf einer Geraden, Beziehung „zwischen“, Beziehung des Kleineren zum Grösseren); Anzahl der notwendigen logischen Zeichen
113
Somit stellt sich unser Kalkül als ungenügend heraus, und wir sind genötigt, nach einer neuen Art der logischen Symbolik zu suchen. Dazu kehren wir noch einmal zu dem Punkt unserer Betrachtungen zurück, an welchem wir zuerst über den Aussagen-Kalkül hinausgingen. Den entscheidenden Schritt bildete dabei die Spaltung der Urteile in Subjekt und Prädikat. Diese Zerlegung haben wir jedoch nicht vollkommen ausgenutzt, indem wir bei der Darstellung der Aussagen nur die Prädikate, nicht aber die Subjekte explizite bezeichnet haben. Der Grund für diese Beschränkung der Symbolik lag darin, dass wir bestrebt waren, hinsichtlich des Formalismus möglichst wenig von dem Aussagen-Kalkül abzuweichen. Auf diesem Wege haben wir erkannt, dass es genügt, zu den formalen Beziehungen des Aussagen-Kalküls die Ungleichungen hinzuzufügen, um einen Kalkül zu erhalten, aus dem sich (bei geeigneter Deutung der Formeln) die traditionelle Logik entwickeln lässt. Lassen wir nun diesen Gesichtspunkt der Anlehnung an den Aussagen-Kalkül fallen, so bietet sich als naturgemäss das Verfahren dar, die Trennung von Subjekt und Prädikat in der Darstellung der Urteile durch die gesonderte Bezeichnung beider Bestandteile zum Ausdruck zu bringen. Dies tun wir nun in der Weise, dass wir als Symbole für die Prädikate Funktionszeichen mit Leerstellen verwenden und diese Leerstellen durch die Bezeichnungen der Subjekte ausfüllen. Ein vollständiges Urteil stellt sich auf diese Weise als Wert einer Funktion dar. Zum Beispiel wird das Urteil „3 ist | eine Primzahl“ in der Form P (3) ausgedrückt, wobei das Funktionszeichen P die Bezeichnung des Prädikates „ist eine Primzahl“ bildet. Bei dieser Darstellungsweise ergeben sich sogleich wesentliche Vorteile gegenüber dem Prädikaten-Kalkül. Zunächst besteht ein Vorteil darin, dass wir jetzt singuläre Urteile als solche zum Ausdruck bringen können, während wir sie beim Prädikaten-Kalkül zum Zweck der Darstellung in allgemeine Urteile transformieren müssen. So lässt sich ja z. B. der Satz „3 ist eine Primzahl“ nur dadurch im Prädikaten-Kalkül ausdrücken, dass man ihn zu einem allgemei-
5
10
15
20
25
30
35
40
‘Prinzipien der Mathematik’
5
10
15
20
25
30
35
40
45
135
nen Urteil „alles, was 3 ist, ist eine Primzahl“ oder: „aus dem 3-Sein folgt das Primzahl-Sein“ umformt. Ein weiterer Vorzug der neuen Symbolik liegt in dem Umstande, dass diejenigen Prädikate, welche eine Beziehung zwischen mehreren Gegenständen enthalten, in dieser Eigenschaft als Relationen kenntlich werden, indem sie sich als Funktionen mit mehreren Leerstellen ausdrücken. Dabei kommt die Anzahl der Gegenstände, zwischen denen die Beziehung besteht, durch die Anzahl der Leerstellen zum Ausdruck, ferner lässt sich eine bestimmte Reihenfolge der Leerstellen fixieren, und eventuell vorhandene Gattungs-Unterschiede zwischen den Gegenständen können durch passende Bezeichnungen (z.B. Wahl verschiedener Alphabete) hervorgehoben werden. So stellt sich z. B. die arithmetische Ungleichung 2 < 3 in der neuen Bezeichnung als Funktionswert < (2, 3) dar, wobei der Beziehung des KleinerSeins eine Funktion mit | zwei Leerstellen entspricht, deren Reihenfolge wesentlich ist. Die Beziehung „B liegt zwischen A und C“ kommt in der Form Z(A, B, C), also durch eine Funktion mit drei Leerstellen zum Ausdruck, wobei wiederum die Anordnung der Leerstellen bestimmt sein muss. Die geometrische Beziehung „der Punkt P liegt auf der Geraden g“ drückt sich durch eine Funktion mit zwei Leerstellen aus, welche durch die Zeichen von Gegenständen verschiedener Gattung auszufüllen sind. Um nun von der neuen Darstellung der Urteile ausgehend einen logischen Kalkül zu erhalten, führen wir zunächst das Gegenteil einer Aussage mit der bisherigen Bezeichnung ein (wobei wir der Kürze halber den Negationsstrich nur über das Funktionszeichen setzen). Wir schreiben also, wenn P (3) den Satz „3 ist eine Primzahl“ darstellt, das Urteil „6 ist keine Primzahl“ in der Form P (6). Zu beachten ist dabei, dass die Zeichen „= 0“ und „= 1“ des Aussagen-Kalküls hier wegfallen, indem jede gesondert aufgeschriebene Aussage bereits als Behauptung gilt. Die einfachen Verknüpfungen der Urteile mit „und“, „oder“ und „folgt“ behalten wir bei und bezeichnen sie wie bisher. Nur hat jetzt das Zeichen → nicht die Bedeutung einer Gleichung der Form AB = 0 (wenn A und B Abkürzungen für Aussagen sind), sondern bedeutet die Verknüpfung AB selbst, stellt sich also durch die Negation und das symbolische Produkt allein dar (wie auch umgekehrt jetzt das symbolische Produkt AB durch die Negation und die Folge-Verknüpfung in der Form A → B ausge|drückt werden kann). Zur Bezeichnung des gegenseitigen Folgens zweier Aussagen auseinander wenden wir auch das Gleichheitszeichen an. Wir führen also die Beziehung der Gleichheit auf die symbolische Addition und die Folge-Verknüpfung zurück. Nun fehlt uns noch ein symbolischer Ausdruck für die Allgemeinheit von Urteilen. Um einen solchen zu gewinnen, führen wir nach dem Vorbilde der Mathematik die Variablen ein, d. h. wir leiten aus den bestimmten Aussagen unbestimmte Zeichen in der Weise ab, dass wir die Leerstellen einer Funktion, statt durch individuelle Symbole, durch Buchstaben ohne bestimmte Bedeutung (Variable) ausfüllen. Eine bestimmte Ausfüllung einer Leerstelle heisst ein Wert der betreffenden Variablen, und zwar sind die Werte einer Variablen im allgemeinen auf eine bestimmte Gattung von Gegenständen beschränkt.
114
115
136
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Der Sinn eines allgemeinen Urteils lässt sich nun durch die Behauptung ausdrücken, dass für jede Ausfüllung der Leerstellen einer gewissen Funktion, d.h. also für jedes Wertsystem ihrer Variablen die als Funktionswert sich ergebende Aussage gültig ist. Während es in der Mathematik nicht üblich ist, die Allgemeinheit einer Beziehung eigens symbolisch darzustellen, kommt man in der Logik nicht ohne eine besondere Bezeichnung für die Allgemeinheit aus. Diese Bezeichnung wollen wir hier in der Weise vornehmen, dass wir die zu der betreffenden Funktion gehörigen Variablen in Klammern vor das Funktionszeichen setzen.1) Hiernach wird z. B. das allgemeine Urteil, welches die Transitivität der Beziehung des Kleineren zum Grösseren ausdrückt („wenn x < y und y < z, so ist x < z“) dargestellt durch die Formel
5
10
(x, y, z){<(x, y) + <(y, z) → <(x, z)}.
116
Das vorhin als Beispiel erwähnte geometrische Anordnungs-Axiom erhält jetzt folgenden symbolischen Ausdruck:
15
(A, B, C) (Z(A, B, C) → Z(C, B, A)) .
117
Bei der Bildung des Gegenteils von einer allgemeinen Aussage haben wir wie früher zu beachten, dass das Gegenteil eines allgemeinen Urteils nicht wieder ein allgemeines, sondern ein partikuläres Urteil ist und dass sich daher verschiedene Möglichkeiten für die Entgegensetzung ergeben. Um uns die hierbei vorliegenden Verhältnisse klarzumachen, können wir uns zunächst auf den Fall beschränken, dass die Allgemeinheit sich nur auf eine Variable bezieht1) , sodass sich das allgemeine Urteil in der Form (x)P (x) darstellt. Aus dieser Darstellung ersieht man, dass sich die Negation in dreifacher Weise auf das allgemeine Urteil anwenden lässt. Es kann nämlich erstens die Funktion P durch ihr Gegenteil ersetzt werden, sodass sich (x)P (x) ergibt; zweitens kann das Urteil im ganzen verneint werden, sodass man (x)P (x) erhält;2) und drittens können diese beiden Negationen zugleich vollzogen werden, wodurch (x)P (x) entsteht. Es sind dies dieselben Fälle, die wir bereits beim PrädikatenKalkül zu unterscheiden hatten. Den vier Formeln (x)P (x), (x)P (x), (x)P (x), (x)P (x) entsprechen in der Symbolik des Prädikaten-Kalküls bei gleicher Anordnung die Beziehungen X = 0, X = 0, X = 0, X = 0. Die erste von den Formeln besagt: P (x) ist immer (für jeden Wert der Variablen) richtig; die zweite: P (x) ist immer falsch; die dritte: P (x) ist nicht immer richtig, also manchmal falsch; | die vierte: P (x) ist nicht immer falsch, also manchmal richtig. 1)
Dabei sind im Falle mehrerer Variablen die Allgemeinheiten als sukzessive, d. h. nach dem Schema (x, y)F (x, y) = (x) {(y)F (x, y)} gebildet zu denken. 1) Denn die Behandlung des allgemeinen Falles läßt sich auf diesen Spezialfall zurückführen. 2) Es ist bequem, die Negation eines allgemeinen Urteils so zu schreiben, dass man den Negationsstrich nur über dem Allgemeinheitszeichen anbringt.
20
25
30
35
‘Prinzipien der Mathematik’
137
Für den Ausdruck (x)P (x) schreibt man auch zur Abkürzung (Ex)P (x), (Ex)P (x) bedeutet also: „es gibt Gegenstände x, für welche P (x) besteht“; und entsprechend wendet man im Falle mehrerer auftretender Variablen für (x, y, z, . . . )P (x, y, z, . . . ) 5
10
15
auch das Symbol (Ex, y, z, . . . )P (x, y, z, . . . ) an. Andererseits lässt sich auch mit Hilfe dieses neuen Symbols und des Negations-Zeichens die Bedeutung des Allgemeinheitszeichens erklären; denn es gilt die Beziehung (x)P (x) = (Ex)P (x). Hiermit ist nun ein neuer logischer Kalkül begründet, welchen wir passend den Funktionen-Kalkül nennen können. Bei der Symbolik dieses Kalküls könnten wir wiederum mit drei Verknüpfungszeichen auskommen. Notwendig ist nämlich nur: das Negations-Zeichen; ferner eines der drei Symbole +, ×, →; und dann noch eines von den beiden Zeichen (x), (Ex) 48 . (Natürlich treten zu diesen Symbolen wiederum Klammern als Interpunktionen hinzu.) Vorläufige Orientierung über die Methode des Funktionen-Kalküls (Darstellungen und Beweisführungen) 1) Zahlentheoretische Axiome
20
25
30
35
Ehe ich daran gehe, die Axiome des Funktionen-Kalküls systematisch aufzuzählen, will ich erst die Art der Anwendung dieses Kalküls an einigen Beispielen erläutern; und zwar will ich zunächst zeigen, wie sich die Axiome, durch welche die Ordnungseigenschaften der Zahlenreihe formuliert werden, im Funktionen-Kalkül symbolisch ausdrücken lassen. Diese Axiome lauten: 1. Zu jeder Zahl gibt es eine und nur eine nächstfolgende. 2. Es gibt keine Zahl, auf welche 1 unmittelbar folgt. 3. Zu jeder von 1 verschiedenen Zahl gibt es eine und nur eine unmittelbar vorhergehende. In diesen Sätzen kommen als individuelle Relationen die Beziehungen der unmittelbaren Aufeinanderfolge und die der Verschiedenheit von Zahlen vor; und zwar tritt die Beziehung der Verschiedenheit nicht nur in der Verbindung „von 1 verschieden“, sondern auch implizite in dem Ausdruck „nur eine Zahl“ auf; denn dass es „nur eine“ Zahl von einer gewissen Beschaffenheit gibt, bedeutet, dass es nicht zwei verschiedene solche Zahlen gibt. Die Verschiedenheit bildet das Gegenteil zur arithmetischen Gleichheit. Wir führen daher die Funktionen =(x, y)
(„x ist gleich y“)
F (x, y)
(„y ist die nächstfolgende Zahl zu x“)
und 48 Bernays
has deleted the words: , worin statt des einen Buchstaben x eventuell auch mehrere Buchstaben auftreten können
118
138
119
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
ein und können nun mit diesen Bezeichnungen die genannten Axiome folgendermassen darstellen: 1. (x)(Ey) F (x, y) + (z) F (x, z) → =(y, z) , d. h. „zu jedem x gibt es ein y, das auf x unmittelbar folgt und das einem jeden z, welches auf x unmittelbar folgt, gleich ist“. 2. (Ex)F (x, 1), d. h. „es gibt kein x, auf welches 1 unmittelbar folgt“. 3. (x) =(x, 1) → (Ey) F (y, x) + (z) F (z, x) → =(y, z) , d. h. „zu jedem x, das von 1 verschieden ist, gibt es ein y, auf welches x unmittelbar folgt, und welches einem jeden z, auf das x unmittelbar folgt, gleich ist“.
5
10
2) „Sohn und Vater“, „Ursache und Wirkung“ Wir wollen uns nun über die Methode der Beweisführungen im FunktionenKalkül an einigen einfachen Beispielen orientieren. Wir beginnen mit jenem Satze, dessen Unbeweisbarkeit im Prädikaten-Kalkül eine von den Tatsachen bildete, an denen wir uns die Unzulänglichkeit jenes Kalküls klar gemacht haben. Der Satz lautet:
15
„Wenn es einen Sohn gibt, so gibt es einen Vater“. Der symbolische Ausdruck dieser Behauptung im Funktionen-Kalkül lautet:
120
(Ex)S(x) → (Ex)V (x);
20
dabei bedeutet S(x): „x ist ein Sohn“, und V (x): „x ist ein Vater“. Wie wir schon bemerkten, ist ein Beweis des Satzes nur möglich, wenn wir die vorkommenden Prädikate begrifflich zerlegen. Im Begriff des Sohnes ist einerseits das Prädikat „männlich“ und andererseits die Beziehung des Kindes zu den Eltern enthalten, im Begriff des Vaters die Beziehung zu Frau und Kind. Führen wir demgemäss für „x ist männlich“ das Zeichen M (x) ein und stellen wir die Beziehung „x und y sind die Eltern von z“ (oder genauer: „x und y als Mann und Frau haben z zum Kinde“) | durch das Symbol K(x, y, z) dar, so können wir S(x) und V (x) folgendermassen definieren:
25
S(x) = M (x) + (Eu)(Ev)K(u, v, x)
30
(„x ist ein Sohn“ bedeutet: „x ist männlich, und es gibt ein u und ein v derart, dass u als Mann und v als Frau die Eltern von x sind“.) V (x) = (Ey)(Ez)K(x, y, z) („x ist ein Vater“ bedeutet: „es gibt ein y und ein z derart, dass x und y als Mann und Frau die Eltern von z sind“.) Setzen wir die erhaltenen Ausdrücke für S(x) und V (x) ein, so nimmt die betrachtete Behauptung folgende Form an: (Ex) M (x) + (Eu)(Ev)K(u, v, x) → (Ex)(Ey)(Ez)K(x, y, z). Diese Formel stellt eine Folge-Beziehung zwischen zwei Aussagen dar, und für den Beweis, den wir suchen, kommt es darauf an, von der ersten dieser Aussagen zu der zweiten durch eine Reihe von Folge-Beziehungen zu gelangen,
35
40
‘Prinzipien der Mathematik’
5
139
deren jede durch den Kalkül begründbar ist. Dabei wenden wir das uns vom Aussagen-Kalkül her geläufige, auch im Funktionen-Kalkül gültige Prinzip an, dass aus zwei Aussage-Beziehungen X → Y und Y → Z stets auf X → Z geschlossen werden kann. Der erste Schritt, den wir hierbei auszuführen haben, besteht darin, dass wir das Summenglied M (x) entfernen, welches ja auf der rechten Seite der zu beweisenden Folge-Beziehung nicht auftritt. Setzen wir für den Ausdruck (Eu)(Ev)K(u, v, x), welcher eine Funktion von x darstellt, zur Abkürzung das Zeichen N (x), so erhalten wir S(x) = M (x) + N (x).
10
Nun gilt allgemein, entsprechend der Aussagen-Formel, X + Y → Y , | die Beziehung: (Ex) F (x) + G(x) → (Ex)G(x). Demgemäss ergibt sich in unserem Falle
121
(Ex)S(x) → (Ex)N (x), 15
also beim Einsetzen des Ausdrucks für N (x) (Ex)S(x) → (Ex)(Eu)(Ev)K(u, v, x).
20
25
30
35
Weiter können wir nun durch eine Umbenennung der Variablen erreichen, dass unter dem Funktionszeichen K anstelle von u, v, x so wie auf der rechten Seite der zu beweisenden Formel die Buchstaben x, y, z stehen. Dass eine solche Umbenennung statthaft ist, ergibt sich daraus, dass der Ausdruck (Ex)(Eu)(Ev)K(u, v, x) ja von den Variablen u, v, x gar nicht abhängt, da diese durch die drei voranstehenden Existenzial-Zeichen gewissermassen eliminiert werden.1) Wir dürfen also u, v, x bezüglich durch x, y, z ersetzen und erhalten (Ex)S(x) → (Ez)(Ex)(Ey)K(x, y, z). Somit reduziert sich die Aufgabe unseres Beweises auf die Begründung der Formel (Ez)(Ex)(Ey)K(x, y, z) → (Ex)(Ey)(Ez)K(x, y, z), und diese geschieht durch einen allgemeinen Satz des Funktionen-Kalküls, nach welchem aufeinanderfolgende Existenzial-Zeichen stets vertauscht werden können. Der verlangte Beweis unserer Behauptung ist also im Funktionen-Kalkül tatsächlich durchführbar. Es zeigt sich dabei auch deutlich der Grund, weshalb die Umkehrung: „wenn es einen Va|ter gibt, so gibt es einen Sohn“ nicht abge leitet werden kann. Dies liegt daran, dass die Formel (Ex) F (x) + G(x) → (Ex)G(x) nicht umkehrbar ist (was man am einfachsten erkennt, indem man für F (x) die Funktion G(x) einsetzt). In unserem speziellen Falle kommt dies darauf hinaus, dass zwar jeder Sohn ein Kind, aber nicht jedes Kind ein Sohn ist. 1)
Solche Variablen, die in Verbindung mit einem Allgemeinheits-Zeichen oder einem Existenzial-Zeichen auftreten, spielen eine analoge Rolle wie die IntegrationsVariablen in der Analysis.
122
140
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Den wesentlichsten Punkt des dargestellten Beweisganges bildet die Regel von der Vertauschbarkeit der Existenzial-Zeichen. Diese kommt in einfacherer Form bei einem Satz wie dem folgenden zur Geltung: „Wenn es eine Wirkung gibt, so gibt es eine Ursache“.D Wie man sofort bemerkt, ist dieses Beispiel dem vorigen sehr ähnlich und daher auch auf analoge Weise zu behandeln. Wir stellen zunächst die Behauptung in der Form dar:
5
(Ex)W (x) → (Ex)U (x), wobei W (x) bedeutet „x ist eine Wirkung“ und U (x) bedeutet „x ist eine Ursache“. Nun zerlegen wir wieder die Prädikate U und W durch die Einführung der kausalen Beziehung „x bringt y hervor“, für die wir das Zeichen K(x, y) wählen. Dabei ergeben sich für U (x) und W (x) folgende Ausdrücke:
10
U (x) = (Ey)K(x, y)
123
(„x ist eine Ursache“ bedeutet: „es gibt ein y, welches durch x hervorgebracht ist“), W (x) = (Ey)K(y, x) („x ist eine Wirkung“ bedeutet: „es gibt ein y, durch welches x hervorgebracht ist“). Durch Einsetzung dieser Definitionen bringen wir die Behauptung auf die Form: (Ex)(Ey)K(y, x) → (Ex)(Ey)K(x, y).
15
20
Diese Formel lässt sich noch dadurch umgestalten, dass wir auf der linken Seite (welche ja von x und y unabhängig ist) die Benennungen der Variablen vertauschen. Auf diese Weise erhalten wir als Ausdruck für den aufgestellten Satz die Beziehung (Ey)(Ex)K(x, y) → (Ex)(Ey)K(x, y),
25
welche eine unmittelbare Konsequenz des Satzes von der Vertauschbarkeit der Existenzial-Zeichen bildet. So ergibt sich ohne weiteres der Beweis für unsere Behauptung, und zugleich finden wir, dass auch die Umkehrung richtig ist: „wenn es eine Ursache gibt, so gibt es eine Wirkung“. 3) Allgemeine Fragen der Vertauschbarkeit von Klammerzeichen; gewöhnliche und gleichmässige Konvergenz Die Zulässigkeit der Vertauschung gilt ebenso wie für die ExistenzialZeichen auch für die Allgemeinheits-Zeichen, und zwar lassen sich die beiden Vertauschungs-Sätze vermöge des Zusammenhanges, der zwischen dem D
Jede Wirkung hat eine Ursache ist nicht das Kausalgesetz. Dieses heisst vielmehr Jede Aenderung hat eine Ursache. At his point in the typescript, Hilbert (pencil) has interlineated ‘Jede Wirkung hat eine Ursache’ followed by an asterisk; the rest of the sentence, starting with ‘ist nicht’ and preceded by an asterisk, is added across the foot of the page.
30
‘Prinzipien der Mathematik’
141
Existenzial-Zeichen und dem Allgemeinheits-Zeichen besteht, aufeinander zurückführen. Setzen wir nämlich die Formel (x)(y)F (x, y) = (y)(x)F (x, y) 5
als allgemein gültig voraus, wenden sie auf F (x, y) an und negieren beide Seiten der Gleichung, so erhalten wir zunächst (x)(y)F (x, y) = (y)(x)F (x, y);
10
berücksichtigen wir ferner, dass (auf Grund der auch im neuen Kalkül beste henden Beziehung X = X der Ausdruck (y)F (x, y) durch (y)F (x, y), d. h. durch (Ey)F (x, y) und ebenso der Ausdruck (x)F (x, y) durch (Ex)F (x, y) ersetzt werden kann, so finden wir (x)(Ey)F (x, y) = (y)(Ex)F (x, y),
15
20
woraus durch nochmalige Anwendung der Definition des Existenzial-Zeichens die Beziehung (Ex)(Ey)F (x, y) = (Ey)(Ex)F (x, y) folgt. Die hierbei angewandten Umformungen lassen sich alle rückgängig machen, und daher können wir von der abgeleiteten Gleichung auch wieder zu der Ausgangsformel gelangen. Man könnte nun glauben, es sei jede beliebige Vertauschung von Allgemeinheits-Zeichen und Existenzial-Zeichen zulässig. Dass dies jedoch nicht zutrifft, wird an folgendem einfachen Beispiel ersichtlich: Die Formel
124
(x)(Ey)<(x, y)
25
30
stellt eine richtige Aussage dar, nämlich den Satz, dass es zu jeder Zahl eine grössere gibt. Vertauschen wir hierin (x) mit (Ey), so ergibt sich die Behauptung (Ey)(x)<(x, y), welche in Worten lautet: „es gibt ein y, welches grösser ist als jedes x“; und das ist offenbar falsch. Man kann also nicht allgemein von einer Beziehung (x)(Ey)F (x, y) auf (Ey)(x)F (x, y) schliessen. Wohl aber ist (wie man aus den Axiomen des Funktionen-Kalküls beweisen kann) der umgekehrte Schluss zulässig, d. h. es besteht die Beziehung (Ey)(x)F (x, y) → (x)(Ey)F (x, y).
35
40
Die Einseitigkeit dieser Folge-Beziehung macht sich bei vielen begrifflichen Unterscheidungen, besonders in der Mathematik, geltend. Ein typisches Beispiel hierfür bildet der Unterschied zwischen gewöhnlicher Konvergenz und gleichmässiger Konvergenz. | Betrachten wir zunächst die symbolische Darstellung dieses Unterschiedes. Es handle sich um eine bestimmte Folge eindeutiger arithmetischer Funktionen f1 (x), f2 (x), . . . die (wie wir der Einfachheit halber annehmen wollen) für alle reellen Werte von x definiert sind. Die Aussage, dass diese Funktionen-Folge für jeden Wert von x gegen 0 konvergiert, lässt sich in unserer Symbolik so formulieren: (x)(z) <(0, z) → (Ey)(n) <(y, n) → <(|fn (x)|, z)
125
142
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
(„für beliebiges x gibt es zu jedem z, das grösser als 0 ist, ein y, sodass für alle n, welche grösser als y sind, die Ungleichung |fn (x)| < z erfüllt ist“). Dabei bedeutet |fn (x)| den absoluten Betrag von fn (x), und die Variable n bezieht sich speziell auf die ganzen Zahlen als Gegenstands-Gattung, während x, y und z auf die Gattung der reellen Zahlen bezogen sind.1) Für die Behauptung, dass die Funktionen-Folge gleichmässig für alle Werte von x gegen 0 konvergiert, lautet der symbolische Ausdruck: (z) <(0, z) → (Ey)(x)(n) <(y, n) → <(|fn (x)|, z)
126
(„für jedes z, das grösser als 0 ist, gibt es ein y, sodass für alle x und für alle n, welche grösser als y sind, die Ungleichung |fn (x)| < z erfüllt ist“). Aus diesen Formeln ist nun der Unterschied zwischen den beiden Behauptungen deutlich zu ersehen; er findet seinen Ausdruck | durch die verschiedene Stellung des Allgemeinheits-Zeichens (x). Jedoch dürfen wir uns mit dieser Feststellung nicht begnügen. Denn es könnte ja sein, dass sich nach den Regeln des Kalküls die beiden Formeln ineinander überführen lassen. Und auch wenn eine solche Transformation nicht angebbar ist, so bleibt noch die Frage, ob sich aus der Formalistik des Funktionen-Kalküls die Tatsache entnehmen lässt, dass die Forderung der gleichmässigen Konvergenz die der gewöhnlichen Konvergenz logisch einschliesst. Wir müssen also näher zusehen, inwieweit uns der Kalkül eine Einsicht in die vorliegenden logischen Verhältnisse verschafft. Um die formalen Uebergänge besser zu überblicken, wollen wir für den Ausdruck (n) <(y, n) → <(|fn (x)|, z) zur Abkürzung R(x, y, z) schreiben. Dann lautet die Formel für die gewöhnliche Konvergenz: (x)(z) <(0, z) → (Ey)R(x, y, z) , (1) und die für die gleichmässige Konvergenz: (z) <(0, z) → (Ey)(x)R(x, y, z) .
15
20
(2)
und daraus lässt sich für zwei beliebige Funktionen P (z) und | F (x, z) die Beziehung (z)(x) P (z) → F (x, z) = (z) P (z) → (x)F (x, z) 1)
10
25
Nun lässt sich zunächst die Abweichung der beiden Formeln voneinander durch zwei Umformungen verringern, die wir an der Formel (1) vornehmen. Wir können nämlich erstens die Allgemeinheits-Zeichen (x) und (z) miteinander vertauschen. Zweitens dürfen wir dann das Zeichen (x) hinter das Zeichen → setzen. Denn es gilt allgemein, wenn Z eine Aussage bedeutet: (x) Z → F (x) = Z → (x)F (x) , 127
5
Wir könnten die Bedingung, dass n eine ganze Zahl sein soll, auch explizite in die Formulierung aufnehmen, indem wir, unter Anwendung des Funktions-Zeichens G (x)|, z) ausführfür das Prädikat der Ganzzahligkeit, anstatt (n) <(y, n) → <(|f n
licher (n) G(n) + <(y, n) → <(|fn (x)|, z) schrieben. Jedoch kann auch ohnedies die Beschränkung von n auf ganze Zahlen aus der Formulierung selbst abgelesen werden, da die Beziehung <(|fn (x)|, z) zwischen n, x und z nur für ganzzahliges n definiert ist.
30
35
‘Prinzipien der Mathematik’
5
10
15
20
25
30
35
143
ableiten. Wenden wir diese in unserem Falle auf P (z) = <(0, z) und F (x, z) = (Ey)R(x, y, z) an, so finden wir, dass sich der Ausdruck (z)(x) <(0, z) → (Ey)R(x, y, z) ersetzen lässt durch (z) <(0, z) → (x)(Ey)R(x, y, z) . (1 ) Da die beiden auf (1) angewandten Transformationen auch im umgekehrten Sinne ausführbar sind (weil sie ja auf Gleichheitsbeziehungen beruhen), so ist die Formel (1 ) gleichbedeutend mit (1), d. h. mit der Behauptung der gewöhnlichen Konvergenz. Vergleichen wir nun (1 ) mit (2), so bemerken wir, dass die beiden Beziehungen durch blosse Vertauschung der Zeichen (x) und (Ey) ineinander übergehen. Diese Vertauschung ist aber nach der vorhin von mir angegebenen Regel nicht beiderseitig erlaubt, vielmehr kann nur die einseitige FolgeBeziehung (Ey)(x)F (x, y) → (x)(Ey)F (x, y) angewandt werden. Hierauf beruht es, dass wir die Formel (1 ) aus der Formel (2), jedoch nicht umgekehrt (2) aus (1 ) ableiten können. Der Uebergang von (2) zu (1 ) geschieht folgendermassen1) : Denken wir uns einen beliebigen Wert von z fixiert, sodass die Variabilität von z wegfällt, und schreiben in diesem | Sinne für <(0, z) zur Abkürzung das Aussage-Zeichen A und für R(x, y, z) kurz R(x, y), so gilt zunächst (Ey)(x)R(x, y) → (x)(Ey)R(x, y), und daraus folgt, gemäss der allgemeinen Aussagen-Beziehung (Y → Z) → (X → Y ) → (X → Z) , A → (Ey)(x)R(x, y) → A → (x)(Ey)R(x, y) , also für beliebiges z <(0, z) → (Ey)(x)R(x, y, z) → <(0, z) → (x)(Ey)R(x, y, z) . Bezeichnen wir die Funktionen von z, welche auf der linken und der rechten Seite dieser Formel stehen, bezüglich mit G(z) und H(z), so erhalten wir (mit Rücksicht darauf, dass z willkürlich ist) (z) G(z) → H(z) , und daraus ergibt sich nach einer allgemeinen Regel unseres Kalküls1) (z)G(z) → (z)H(z). Setzen wir hierin für G(z) und H(z) wieder ihre Ausdrücke ein, so finden wir die Beziehung (z) <(0, z) → (Ey)(x)R(x, y, z) → (z) <(0, z) → (x)(Ey)R(x, y, z) , 1)
Die hier gegebene Beweis-Darstellung ist nicht ganz frei von inhaltlicher Argumentation; doch lässt sich auf Grund der noch zu formulierenden Axiome des Funktionen-Kalküls die Ableitung rein formal gestalten. 1) Diese Regel ist gleichbedeutend mit dem Satz 3.) des Prädikaten-Kalküls.
128
144
129
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
welche besagt, dass (1 ) eine Folge von (2) ist. So können wir also mit Hülfe des Funktionen-Kalküls beweisen, dass im Falle einer gleichmässigen Konvergenz auch stets die gewöhnliche Konvergenz vorliegt; und zugleich stellt sich dabei die Nicht-Umkehrbarkeit dieses logischen Abhängigkeits-Verhältnisses als ein Sonderfall eines allgemeinen logi|schen Gesetzes heraus, welches in der Ausdrucksweise des Formalismus als der Satz von der nur einseitigen Vertauschbarkeit eines AllgemeinheitsZeichens mit einem Existenzial-Zeichen zu formulieren ist. Die besprochenen Beispiele dürften genügen, um uns eine Vorstellung davon zu geben, wie man den Funktionen-Kalkül zur Untersuchung logischer Beziehungen gebrauchen kann.
5
10
4. Systematische Darstellung des Funktionen-Kalküls. 1) Axiome des Funktionen-Kalküls Ich will jetzt dazu übergehen, die Axiome dieses Kalküls zu formulieren. Als Vorbereitung dazu will ich eine Uebersicht über die in dem Kalkül gebrauchten Bezeichnungen geben.
15
Bezeichnungen. I. Unbestimmte Zeichen: a) Aussage-Zeichen X, Y , Z, . . . b) Variable x, y, z, . . . c) Funktions-Zeichen (mit Leerstellen) F (.), G( . , . , . . . ), . . .
130
II. Individuelle Zeichen: a) für bestimmte Aussagen (etwa eine Bezeichnung für den Pythagoräischen Lehrsatz oder auch für eine einzelne Behauptung wie „Sokrates war ein Philosoph“) b) für bestimmte Gegenstände (Eigennamen) c) für bestimmte Funktionen (z. B. <(. , . )) Eine bestimmte Funktion heisse ein Prädikat oder eine Relation, | je nachdem sie eine oder mehrere Leerstellen enthält.1) III. Logische Zeichen. a) Grundzeichen: „ “ (Negations-Zeichen) X wird gelesen „X-nicht“. „ד X × Y wird gelesen „X oder Y “. „(x)“ (Allgemeinheits-Zeichen) (x)F (x) wird gelesen „F (x) für alle x“. 1)
Bisher haben wir das Wort „Prädikat“ in weiterem Sinne gebraucht. Es empfiehlt sich, nachdem wir jetzt den Begriff der Funktion eingeführt haben, die Mehrheit der sprachlichen Ausdrücke für die angegebene Unterscheidung auszunützen.
20
25
30
‘Prinzipien der Mathematik’
145
b) Abgeleitete Zeichen:
5
„→“ X → Y („aus X folgt Y “) steht zur Abkürzung für X × Y . „+“ X + Y („X und Y “) " " " " X ×Y. „=“ X = Y („X gleich Y “) " " " " (X → Y )+(Y → X) d. h. zur Abkürzung für X × Y × Y × X. „(Ex)“ (Existenzial-Zeichen) (Ex)F (x) („es gibt ein x, sodass F (x)“) steht zur Abkürzung für (x)F (x). Allgemeinheits-Zeichen und Existenzial-Zeichen sollen gemeinsam „Klammerzeichen“ genannt werden.
10
1) 2) 15
3) 4) 20
25
30
35
40
IV. Klammern, zur Zusammenfassung und Trennung von Zeichen-Verbindungen. — Einführung des Terminus „Ausdruck“. Jedes Aussage-Zeichen ist ein Ausdruck. Ein Funktions-Zeichen, von dem jede Leerstelle entweder durch eine Variable oder durch den Eigennamen eines Gegenstandes ausgefüllt ist, bildet einen Ausdruck. Ist α ein Ausdruck, so sind α und (x)α Ausdrücke; und zur | Abkürzung für (x)α kann allgemein auch (Ex)α geschrieben werden. Sind α und β Ausdrücke, so sind auch α × β, α → β, α + β, α = β Ausdrücke.
Während durch die Zeichen ×, →, +, = zwei Ausdrücke als Glieder eines neuen Ausdrucks miteinander verknüpft werden, beziehen sich die KlammerZeichen und das Negations-Zeichen auf nur einen Ausdruck, welcher der „Wirkungsbereich“ des betreffenden Zeichens heissen soll. Die Klammer-Zeichen haben ausserdem noch eine Beziehung auf eine Variable; nämlich (x) und (Ex) sind bezogen auf x; wir wollen diese Klammer-Zeichen daher „gleichnamig mit x“ nennen. Wenn eine Variable dem Wirkungsbereich eines gleichnamigen Klammer-Zeichens angehört, so wollen wir sagen, das Klammer-Zeichen „gehöre“ zu dieser Variablen, oder auch: das Klammer-Zeichen gehöre zu der durch die Variable ausgefüllten Leerstelle. Ein Ausdruck heisst von einer Variablen x abhängig, oder x ein Argument des Ausdrucks, wenn x in dem Ausdruck vorkommt, ohne dass jedoch zu x ein Klammer-Zeichen gehört. Ein Ausdruck, der von keiner Variablen abhängt, heisst konstant. Insbesondere ist also ein Ausdruck stets dann konstant, wenn er keine Variable enthält; doch ist diese Bedingung nicht notwendig (z.B. stellt (x)F (x) einen konstanten Ausdruck dar). Zur Charakterisierung einer bestimmten Funktion gehört die Beziehung ihrer Leerstellen auf bestimmte Gattungen von Gegenständen. So beziehen sich die Leerstellen der Funktion <(x, y) auf die Gegenstands-Gattung der reellen Zahlen; bei der geometrischen Relation L(P, g): „P liegt auf g“ ist die erste | Leerstelle auf die Gattung der Punkte, die zweite auf die Gattung der Geraden bezogen. Ist in einem Ausdruck eine Leerstelle eines Prädikates oder einer Relation durch die Bezeichnung eines Gegenstandes ausgefüllt,
131
132
146
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
welcher nicht zu der entsprechenden Gegenstands-Gattung gehört, so soll der Ausdruck „sinnlos“ heissen. Desgleichen werde ein Ausdruck sinnlos genannt, wenn darin zu zwei Leerstellen (von einer oder von zwei bestimmten Funktionen), die sich auf verschiedene Gattungen von Gegenständen beziehen, ein und dasselbe Klammer-Zeichen gehört. 49 Ferner heisse ein Ausdruck auch dann sinnlos, wenn darin die Wirkungsbereiche von gleichnamigen Klammerzeichen übereinander greifen. 49 Vereinfachungen der Schreibweise: 1) Statt X × Y wird auch kurz XY geschrieben. 2) Verkürzung von Negations-Strichen: Statt F (x, . . , u) wird F (x, . . , u) geschrieben. "
133
(x)α
"
(x)α
"
5
10
.
(Ex)α (Ex)α . " " " 3) Zur Ersparung von Klammern treffen wir folgende Festsetzungen: a) Wenn zwei oder mehrere Klammer-Zeichen unmittelbar aufeinander folgen, ohne durch eine Klammer getrennt zu sein, so ist dies so aufzufassen, dass ihre Wirkungsbereiche sich bis zu der gleichen Stelle erstrecken. b) In bezug auf die Trennung von Ausdrücken haben die Zeichen = und → den Vorrang vor +, ×; + hat den Vorrang vor ×, und jedes der vier genannten Zeichen hat den Vorrang vor den Klammer-Zeichen. Demgemäss ist z. B. die Formel (x)(y)F (x, y) → X × G(z) + (Eu)H(x, u, z) so zu lesen, wie folgende ausführlichere Schreibweise zeigt: (x) (y)F (x, y) → X × G(z) + (Eu)H(x, u, z) . Dieser Ausdruck ist also von x und z abhängig.
15
20
25
Grundformeln und Grundregeln Axiome des Funktionen-Kalküls. A. Formale Axiome („Logische Grundformeln“). I. 1) XX → X II. 1) (x)Z → Z 2) X → XY 2) (x)F (x) → (Ex)F (x) 3) XY → Y X 3) (x)Z × F (x) → (x)Z × (x)F (x) 4) X(Y Z) → (XY )Z 4) (x) F (x) → G(x) → (x)F (x) → (x)G(x) 5) (x)(y)F (x, y) → (y)(x)F (x, y) 5) (X → Y ) → (ZX → ZY ) 6) (x)(y)F (x, y) → (x)F (x, x). B. Inhaltliche Axiome. (Grundregeln zur Ableitung richtiger Formeln). Ausgangspunkt: Wir nehmen die unter A.I., II. aufgezählten logischen Grundformeln als „richtige Formeln“ an. Ferner können noch andere Formeln als 49–49 Added
by Bernays.
30
35
‘Prinzipien der Mathematik’
147
„richtig“ vorausgesetzt werden, welche entweder die Axiome einer Theorie oder sonstige als gültig angenommene Urteile symbolisch darstellen. Auf diese zugrunde gelegten Ausgangsformeln wenden wir nun folgende Regeln an: 5
10
15
20
25
30
I.
Aus einer richtigen Formel erhält man wieder eine richtige Formel, wenn man irgend eine Variable innerhalb des Wirkungsbereiches des zugehörigen Klammer-Zeichens durch einen in diesem | Wirkungsbereich noch nicht vorkommenden Buchstaben ersetzt.
II. Aus einer richtigen Formel entsteht eine neue, 1) wenn für ein unbestimmtes Aussage-Zeichen überall da, wo es vorkommt, ein und derselbe konstante Ausdruck eingesetzt wird; 2) wenn für ein unbestimmtes Funktions-Zeichen mit den Argumenten x, . . . , u überall, wo es vorkommt, ein und derselbe von den Variablen x, . . . , u und nur von diesen abhängige Ausdruck eingesetzt wird; beides jedoch nur unter der Bedingung, dass die Einsetzung nicht auf einen sinnlosen Ausdruck führt. III. Beginnt eine richtige Formel mit einem unverneinten AllgemeinheitsZeichen, dessen Wirkungsbereich sich auf die ganze Formel erstreckt, so erhält man wieder eine richtige Formel, indem man das AllgemeinheitsZeichen weglässt und für die zugehörige Variable überall, wo sie auftritt, ein und dieselbe Bezeichnung eines bestimmten Gegenstandes einsetzt, sofern nicht etwa dadurch ein sinnloser Ausdruck entsteht. IV. Aus einer richtigen Formel gewinnt man eine neue, 1) wenn man ein unbestimmtes Aussage-Zeichen durchweg durch ein und dasselbe unbestimmte Funktions-Zeichen mit einer einzigen, noch nicht vorkommenden Variablen ersetzt und das gleichnamige Allgemeinheits-Zeichen an den Anfang der Formel stellt; 2) wenn man unter einem unbestimmten Funktions-Zeichen überall da, wo es auftritt, eine noch nicht vorkommende Variable als | Argument hinzufügt und das mit dieser Variablen gleichnamige AllgemeinheitsZeichen an den Anfang der Formel stellt. V. Sind α und α → β richtige Formeln, so ist auch β eine richtige Formel. Oder, in abgekürzter Formulierung: Erfüllte Voraussetzungen können weggelassen werden.
35
40
134
Erläuternde Bemerkungen (inhaltliche Deutung, formale Eigenschaften des Axiomen-Systems) Dieses System von Axiomen liefert uns ein Verfahren, um logische Beweisführungen streng formal zu vollziehen, d. h. so, dass wir uns um den Sinn der durch die Formeln dargestellten Urteile gar nicht zu kümmern brauchen, sondern lediglich die in den Regeln enthaltenen Vorschriften zu beachten haben. Allerdings müssen wir bei der symbolischen Darstellung der Prämissen, von denen wir ausgehen, sowie bei der Interpretation der durch die formalen
135
148
136
137
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Operationen erhaltenen Ergebnisse den Zeichen unseres Kalküls eine Deutung beilegen. Diese Deutung geschieht bei den logischen Zeichen in der bisherigen Weise, entsprechend der vorgeschriebenen sprachlichen Lesart;1) und das Auftreten von unbestimmten Aussage-Zeichen und Funktions-Zeichen in einer Formel ist so zu verstehen, dass bei jeder beliebigen Einsetzung von bestimmten Aussagen und Funktionen (bei welcher die Zahl und die Zusammengehörigkeit der auftretenden Variablen berücksichtigt wird und welche keinen | sinnlosen Ausdruck ergibt) die aus der Formel entstehende Behauptung richtig ist. Dass nun in Verbindung mit dieser inhaltlichen Auslegung die Anwendung des Funktionen-Kalküls, wie er durch die Axiome festgelegt ist, uns stets zu richtigen Resultaten führt, beruht auf folgenden Tatsachen: 1. Die inhaltliche Deutung der abgeleiteten Zeichen ist logisch gleichwertig mit derjenigen Deutung, welche sich gemäss der inhaltlichen Auffassung der Grundzeichen aus der Interpretation der Zeichenverbindungen ergibt, für welche bezüglich die abgeleiteten Zeichen als Abkürzungen dienen. 2. Die Urteile, in welche die formalen Axiome durch unsere Auslegung übergehen, sind sämtlich von der Art, dass wir uns ihrer Wahrheit aus einfachen logischen Gründen versichern können.1) 3. Auf Grund der inhaltlichen Interpretation des Kalküls kommt die Anwendung der Grundregeln, soweit diese nicht blosse Umbenennungen betreffen, auf eins hinaus mit der Anwendung der einfachsten logischen Schlussweisen. Es entspricht nämlich die Regel V. dem Schluss vom Grund auf die Folge („besteht | der Grund, so besteht die Folge“), die Regeln II und III entsprechen 1)
In betreff der Deutung der Klammer-Zeichen ist zu beachten, dass die Allgemeinheit („für alle x“) und die Existenzialbehauptung („es gibt ein x“) stets auf eine bestimmte Gegenstands-Gattung bezogen sein muss. Eine gewisse Schwierigkeit bietet der Fall, dass eine Gegenstands-Gattung überhaupt kein Ding enthält. Wollen wir diesen mit in unsre Untersuchung einbeziehen (was ja nicht unbedingt nötig wäre), so müssen wir, um mit 50 der Regel IV im Einklang zu bleiben, für eine Variable x, die zu einer solchen gegenstandslosen Gattung gehört, die Klammerzeichen (x), (Ex) so deuten, dass Aus|sagen der Form (x)F (x) stets richtig, dagegen Aussagen der Form (Ex)F (x) falsch sind. Zugleich 50 muss man von den formalen Axiomen die Formeln II. 1), 2) ausschalten. Dies hat dann eine Komplikation des Kalküls zur Folge, indem verschiedene elementare Folge-Beziehungen ihre Umkehrbarkeit einbüssen. 1) In welchem Sinne diese Behauptung bei den Formeln II. 1), 2) einer gewissen Einschränkung bedarf, ist in der vorigen Anmerkung erwähnt. 50–50 Substituted
by Bernays for:: den formalen Axiomen II. 1), 2) im Einklang zu bleiben, für eine Variable x, die zu einer solchen gegenstandslosen Gattung gehört, die Klammerzeichen (x), (Ex) so deuten, dass Aussagen der Form (x)F (x) falsch, dagegen Aussagen der Form (Ex)F (x) richtig sind. Eine Formel (Ex)F (x) ist dann also nicht positiv, im Sinne der Behauptung „es gibt ein x, sodass F (x)“, sondern negativ im Sinne der Definition (x)F (x) aufzufassen. Will man sich hingegen für die umgekehrte Deutung entscheiden, wonach eine Aussage (Ex)F (x), gemäss dem positiven Sinn der Existenzialbehauptung, in dem betrachteten Sonderfalle stets falsch und (x)F (x) richtig ist, so
5
10
15
20
‘Prinzipien der Mathematik’
5
10
15
20
25
149
dem Schluss vom Allgemeinen aufs Besondere („was im Allgemeinen gilt, gilt in jedem besonderen Falle“) und die Anwendung der Regel IV ist im Ergebnis gleichbedeutend mit einer logischen Beweisführung,1) in welcher der Schluss vom Allgemeinen aufs Besondere verbunden wird mit dem Schluss vom beliebigen Einzelfall auf die Allgemeinheit („was in jedem beliebigen Einzelfall gilt, das gilt allgemein“). Als charakteristische Eigenschaft des Funktionen-Kalküls ist zu bemerken, dass darin die logische Bedeutung der Negation nur ganz indirekt zur Geltung kommt. Einerseits wird nämlich der Begriff der Falschheit von Aussagen in den Axiomen gänzlich vermieden, und das Gegenteil X einer Aussage X wird rein formal als eine durch X eindeutig bestimmte Aussage eingeführt; andererseits tritt in den logischen Grundformeln das Negationszeichen nirgends explizite auf. Uebrigens sind in diesen Formeln ausser dem Negationszeichen auch die Zeichen + und = | ausgeschaltet. In der Formelgruppe I kommen als logische Zeichen überhaupt nur × und → vor; in den Formeln II ausserdem noch die Klammerzeichen.1) Gemeinsam haben alle diese Formeln, dass sie in der Form von Folge-Beziehungen geschrieben sind; und zwar ist die Folge-Beziehung bei den Formeln I 1), 3), 4) und II 1), 3), 5) umkehrbar, bei den übrigen dagegen nicht. Methode der formalen Entwicklung des Kalküls („logische Formeln“, „logische Aussagen-Formeln“, „abgeleitete Regeln“) Unter den Formeln, die sich mit Hilfe des Funktionen-Kalküls beweisen lassen, nehmen diejenigen eine ausgezeichnete Stellung ein, in denen keine individuellen Zeichen auftreten und bei deren Ableitung ausser den logischen Grundformeln keine weiteren Formeln als Voraussetzungen zugrunde gelegt werden, welche also aus den Axiomen allein schon gefolgert werden können. Diese Formeln, welche für sich ein geschlossenes System bilden, wollen wir 1) In welcher Weise die Regel IV dieser Beweisführung entspricht, möge folgendes Beispiel zeigen: Die Regel IV gestattet, von der Grundformel XX → X zu der Formel (x){F (x)F (x) → F (x)} überzugehen. Diese kann andrerseits unter Anwendung jener Grundformel folgendermassen inhaltlich bewiesen werden: wählen wir für x irgend einen bestimmten Wert a, so ist F (a) eine Aussage; nun gilt für jede Aussage die Beziehung XX → X, also insbesondere F (a)F (a) → F (a); da dies bei beliebiger Wahl von a stattfindet, so besteht für alle x die Beziehung F (x)F (x) → F (x), d. h. es gilt (x){F (x)F (x) → F (x)}. 1) Bei der zweiten Gruppe von Grundformeln liesse es sich durch eine Aenderung zweier Formeln erreichen, dass nur das Allgemeinheitszeichen und das Zeichen → als logische Zeichen auftreten; man könnte nämlich die Formeln II 2), 3) durch folgende zwei ersetzen:
(x) Z → F (x) → Z → (x)F (x)
(x) F (x) → Z → (x)F (x) → (x)Z .
138
150
139
140
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
„logische Formeln“ nennen. Unter den logischen Formeln heben sich wiederum diejenigen ab, in denen als unbestimmte Zeichen nur Aussage-Zeichen vorkommen. Diese mögen „logische Aussagen-Formeln“ heissen. Bei der Ableitung des Systems der logischen Formeln empfiehlt es sich, gewisse sehr häufig wiederkehrende Operationen in Form von abgeleiteten Regeln zusammenzufassen. Durch eine solche Regel wird ein für allemal das Ergebnis des betreffenden | formalen Ueberganges vorweggenommen, und der Beweis für die Regel besteht darin, dass allgemein das Verfahren angegeben wird, durch welches in jedem einzelnen Fall jener Uebergang gemäss den Grundregeln des Kalküls zu vollziehen ist. Durch die Aufstellung der abgeleiteten Regeln werden nicht nur die Rechnungen erheblich abgekürzt, sondern es tritt dadurch auch deutlicher hervor, welche Rolle die verschiedenen logischen Zeichen im Funktionen-Kalkül spielen. Da beim Beweise von logischen Formeln fast immer logische AussagenFormeln vorkommen, so ist es zweckmässig, zunächst das System der logischen Aussagen-Formeln für sich zu entwickeln. Dieses System von Formeln, welches man aus den formalen Axiomen A,I und den Regeln B,II 1) und B,V gewinnt, ist für uns nicht wesentlich neu. Wir können es nämlich in einfacher Weise mit dem Formelsystem unseres anfänglichen Aussagen-Kalküls zur Deckung bringen. Dazu haben wir nur nötig, einerseits in den logischen Aussagen-Formeln des Funktionen-Kalküls überall die Zeichen → und = durch die Ausdrücke zu ersetzen, für welche sie die Abkürzungen bilden, also alle Aussagen-Verbindungen durch , × und + auszudrücken, und andrerseits alle Gleichungen des Aussagen-Kalküls auf 0 zu reduzieren (derart, dass auf der linken Seite die Zeichen 0 und 1 nicht auftreten) und danach überall das Zeichen „= 0“ wegzulassen; wir erhalten dann auf beide Arten dieselbe Gesamtheit von Formeln. Diese Uebereinstimmung ist vom Standpunkt der inhaltlichlogischen Deutung der formalen Beziehungen selbstverständlich, weil ja der Sinn der logischen Zeichen in dem neuen | Kalkül derselbe geblieben ist wie in dem ursprünglichen Aussagen-Kalkül. Hingegen ist die strenge axiomatische Ueberleitung von den Formeln A,I und den auf die Aussagen-Verbindungen bezüglichen Regeln zu dem Axiomen-System des Aussagen-Kalküls ziemlich kompliziert. Wenn wir der neuen Art des Kalküls mit Aussage-Zeichen vor unserem früheren Aussagen-Kalkül den Vorzug geben, so geschieht dies einerseits wegen seines einfacheren Axiomen-Systems, andrerseits wegen der grösseren Mannigfaltigkeit von Darstellungs-Möglichkeiten, welche er bietet.1) 1)
Diese grössere Darstellungsfähigkeit des neuen Kalküls beruht darauf, dass hier die Zeichen → und = in einer Formel mehrmals auftreten können, während die Formeln unseres ursprünglichen Aussagen-Kalküls immer nur eines dieser beiden Zeichen und zwar höchstens einmal enthalten. Allerdings lässt sich der AussagenKalkül von dieser Beschränkung dadurch befreien, dass man seine Gleichungen als Aussagen betrachtet und ihrerseits dem Kalkül unterwirft (entsprechend wie wir es früher mit den Gleichungen des Prädikaten-Kalküls taten), ein Verfahren, das sich beliebig oft iterieren lässt. Diese Erweiterung macht freilich auch eine Ergänzung des
5
10
15
20
25
30
35
‘Prinzipien der Mathematik’
151
2) Das System der logischen Aussagen-Formeln Ableitung der Formeln (1)–(20) sowie der Regeln a)–i)
5
Zur Erläuterung der Methode, nach welcher man, ausgehend von den Grundformeln I, an Hand der Regeln II 1) und V weitere Aussagen-Formeln sowie abgeleitete Regeln gewinnt, mögen hier einige Beweise durchgeführt werden. Formel (1): (X → Y ) → (Z → X) → (Z → Y ) Beweis: In der Grundformel I 5) werde Z für Z (gemäss der Grundregel II 1)) eingesetzt. Dies ergibt (X → Y ) → {ZX → ZY },
10
und hieraus erhält man (1), indem man für ZX und ZY die Abkürzungen Z → X und Z → Y schreibt.
15
20
Regel a): Sind α → β und β → γ richtige Formeln, so ist α → γ eine richtige Formel. (In dieser wie in den folgenden Regeln sollen durch die griechischen Buchstaben stets konstante Ausdrücke bezeichnet werden.) Beweis: Setzen wir in (1) den Ausdruck β für X, γ für Y und α für Z ein, so ergibt sich gemäss der Einsetzungs-Regel1) (β → γ) → (α → β) → (α → γ) . Da nach Voraussetzung β → γ eine richtige Formel ist, so ist gemäss der Grundregel V auch (α → β) → (α → γ) eine richtige Formel; und da ferner α → β eine richtige Formel ist, so ist auch α → γ eine solche. Formel (2): X → X Axiomen-Systems notwendig, indem einige inhaltlichen Sätze des Aussagen-Kalküls als Axiome formalisiert werden müssen. 1) Die Regel II 1) erlaubt nur die Einsetzung für ein einzelnes Zeichen. Es muss daher die Ersetzung verschiedener Zeichen durch andere Ausdrücke hier sowie in allen entsprechenden Fällen mittels eines schrittweisen Vorgehens auf Einsetzungen für je ein einzelnes Zeichen zurückgeführt werden. Bei solchen sukzessiven Einsetzungen hat man darauf zu achten, dass die betreffende Formel nicht vorzeitig spezialisiert wird. Will man z. B. in der Grundformel I 3) die Zeichen X und Y miteinander vertauschen, so darf man nicht in der Weise verfahren, dass man zunächst Y durch X und dann X durch Y ersetzt. Denn dadurch würde man bei der ersten Einsetzung XX → XX und bei der zweiten Y Y → Y Y erhalten. Vielmehr muss man zuerst einen in der Formel noch | p. 142 nicht vorkommenden Buchstaben einführen, indem man etwa für X überall Z einsetzt; hierauf kann man dann Y durch X und schliesslich Z durch Y ersetzen, wodurch man zu dem gewünschten Ergebnis gelangt.
141
152
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Beweis: Die Grundformel I 2) ergibt, wenn X für Y eingesetzt wird1) , X → XX. Aus dieser Formel und der Grundformel XX → X erhält man nach der Regel a) die Formel (2). Formel (3): XX Beweis: (3) ist nur eine andere Schreibart für (2). 142
5
Regel b): Ist αβ eine richtige Formel, so auch βα. Beweis: Wird in I 3) der Ausdruck α für X und β für Y eingesetzt, so ergibt sich αβ → βα als richtige Formel, und hieraus folgt auf Grund der Voraussetzung, dass βα eine richtige Formel ist. Formel (4): XX Beweis: (4) folgt aus (3) gemäss der Regel b).
10
Formel (5): X → X Beweis: (5) ist eine Abkürzung für XX, und diese Formel geht durch Einsetzung von X für X aus (4) hervor. Formel (6): X → X Beweis: Aus I 5) folgt, indem bezüglich X, Y , Z durch X, X, X ersetzt werden: (X → X) → (XX → XX);
15
X → X wird aus (5) erhalten, indem man X für X einsetzt. Also ergibt sich XX → XX,
20
hieraus weiter, wegen (4): XX, und daraus durch Anwendung der Regel b): XX, wofür zur Abkürzung die Formel (6) geschrieben werden kann. Formel (7): (X → Y ) → (Y → X) Beweis: (Y → Y ) → (XY → XY )
143
25
folgt aus I 5); Y → Y wegen (5); also XY → XY . Ferner ergibt sich XY → Y X aus I 3). Die beiden erhaltenen Formeln liefern zusammengenommen XY → Y X, wofür zur Abkürzung (7) geschrieben werden kann. Regel c): Tritt ein Ausdruck α als Bestandteil in einer AussagenVerbindung1) auf, welche in diesem Sinne mit ϕ(α) bezeichnet werden möge2) , 1)
Hier wird wieder die Regel II 1) benutzt. Im Folgenden sollen die Grundregeln II 1) und V sowie die Regel a), von denen wir fortwährend Gebrauch zu machen haben, nicht bei jeder Anwendung eigens angeführt werden. 1) Unter einer „Aussagen-Verbindung“ soll ein Ausdruck verstanden werden, der sich aus unbestimmten Aussage-Zeichen mit Hilfe der logischen Zeichen (ausschliesslich der Klammerzeichen) zusammensetzt. Demnach ist eine Aussagen-Verbindung eine logische Aussagen-Formel, falls sie zufolge der Axiome eine richtige Formel ist. 2) Die Abgrenzung eines Ausdrucks als Bestandteil einer Aussagenverbindung ist ganz beliebig. Daher ist durch die Form von α und durch den Gesamtausdruck noch
30
‘Prinzipien der Mathematik’
5
10
15
20
153
und sind ϕ(α), α → β, β → α richtige Formeln, so ist auch ϕ(β) eine richtige Formel. (ϕ(β) bedeutet hierbei diejenige Formel, welche aus ϕ(α) entsteht, indem β anstelle von α gesetzt wird.) Die Regel lässt sich kurz auch so aussprechen: Zwei Ausdrücke, die in gegenseitiger Folge-Beziehung stehen, dürfen in jeder logischen Aussagen-Formel füreinander eingesetzt werden. Beweis: Da der Fall, dass α mehrfach in ϕ(α) vorkommt, sich auf den Fall des einmaligen Auftretens zurückführen lässt und da jede AussagenVerbindung mit Hilfe der beiden Grundzeichen „ “ und „ד ausgedrückt werden kann, so genügt es, die drei Spezialfälle zu betrachten, dass ϕ(α) entweder α oder von der Form γα oder von der Form αγ ist, wobei unter γ ein beliebiger Ausdruck zu verstehen ist. Im ersten Falle sind nach Voraussetzung α und β → α richtige Formeln. Ferner ist gemäss (7) (β → α) → (α → β) und daher auch α → β eine richtige Formel. Folglich ist auch β, d. h. ϕ(β) eine richtige Formel. Im zweiten Falle, wo γα und α → β richtige Formeln sind, wenden wir die Grundformel I 5) an. Aus dieser ergibt sich (α → β) → (γα → γβ) und damit γα → γβ und hieraus wieder γβ als richtige Formel. γβ ist aber mit ϕ(β) identisch. Der dritte Fall lässt sich auf den zweiten zurückführen. Ist nämlich αγ eine richtige Formel, so ist nach der Regel b) auch γα eine solche. Aus dem Beweise für den zweiten Fall folgt daher, dass γβ eine richtige Formel ist. Also muss auch βγ, wiederum gemäss der Regel b), eine richtige Formel sein. βγ stimmt aber mit ϕ(β) überein.
25
Regel d): Ist ϕ(α) eine logische Aussagen-Formel, so auch ϕ(α) und umgekehrt. Mit anderen Worten: α und α dürfen in jeder logischen AussagenFormel füreinander eingesetzt werden. Beweis: Aus (5) und (6) entnehmen wir, dass α → α und α → α richtige Formeln sind, und hieraus folgt die Behauptung auf Grund der Regel c).
30
Regel e): Ist ϕ(αβ) eine logische Aussagen-Formel, so auch ϕ(βα). (Kommutatives Gesetz für die Verknüpfung ×.) Beweis: Wie sich aus der Grundformel I 3) ergibt, sind αβ → βα und βα → αβ richtige Formeln. Und demgemäss folgt die Behauptung aus der Regel c).
35
Formel (8): (XY )Z → X(Y Z). (Umkehrung von I 4).) Beweis: Gemäss der Formel (3) besteht (XY )Z → Z(XY ). Ersetzen wir hierin gemäss der Regel e) den Ausdruck XY , da wo er zum zweitenmal auftritt, durch Y X, so erhalten wir (XY )Z → Z(Y X). Aus I 4) ergibt sich Z(Y X) → (ZY )X, und aus der vorigen Formel folgt durch Vertauschung der Zeichen X und Z (auf Grund der Einsetzungs-Regel) nicht eindeutig bestimmt, was ϕ(α) bedeuten soll. Sei z. B. X → XY der Gesamtausdruck und X der Bestandteil, so kann in dreierlei Sinn jene Aussagen-Verbindung mit ϕ(X) bezeichnet werden, da nämlich für ϕ(α) jeder der drei Ausdrücke α → XY , X → αY , α → αY gewählt werden kann.— Die Regel c) trifft für jede mögliche Definition von ϕ(α) zu.
144
145
154
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
(ZY )X → X(Y Z). Die drei erhaltenen Formeln liefern nun bei zweimaliger Anwendung der Regel a) die Formel (8). Aus der Formel (8) in Verbindung mit I 4) folgt nun unmittelbar: Regel f): Ist ϕ α(βγ) eine logische Aussagen-Formel, so auch ϕ (αβ)γ . (Assoziatives Gesetz für die Verknüpfung ×.) Auf Grund der Regeln e) und f) können bei aufeinanderfolgenden Verknüpfungen durch × die Klammern weggelassen und die Glieder beliebig geordnet werden. Im Folgenden wollen wir diese Aussagen-Verknüpfungen kurz „Produkte“ nennen. Formel (9): X + Y → Y + X Beweis: Durch Einsetzen von XY in (2) erhält man
5
10
XY → XY , hieraus gemäss der Regel e) XY → Y X, und aus dieser Formel ergibt sich (9) durch Einführung der Abkürzung +. 146
Formel (10): X + Y → Y Beweis: Gemäss der Formel (3) besteht Y Y ; aus I 2) ergibt sich Y Y → Y Y X; also folgt Y Y X, und daher auch XY Y . Wird nun noch XY gemäss der Regel d) durch XY ersetzt, so erhalten wir XY Y . Hierfür kann zur Abkürzung X + Y Y , und dafür wiederum X + Y → Y geschrieben werden. Formel (11): X + Y → X Beweis:
15
20
X + Y → Y + X (nach (9)) Y +X →X (nach (10)), also X + Y → X. Formel (12): X → (Y → X + Y ) Beweis: Die zu beweisende Formel ist eine Abkürzung für XY XY , und diese Formel erhält man, indem man in (4) den Ausdruck XY für X einsetzt.
147
Regel g): α + β ist dann und nur dann eine richtige Formel, wenn sowohl α wie β eine richtige Formel ist.1) Beweis: Dass die Bedingung notwendig ist, lässt sich unmittelbar aus den Formeln (10) und (11) ersehen. Dass sie auch hinreichend ist, ergibt sich folgendermassen: gemäss der Formel (12) ist jedenfalls α → (β → α + β) eine richtige Formel. Sind nun | α und β richtige Formeln, so folgt zunächst, dass β → α + β und daraus weiter, dass α + β eine richtige Formel ist. Regel h): α = β ist dann und nur dann eine richtige Formel, wenn α → β und β → α richtige Formeln sind; und wenn α = β eine richtige Formel ist, so darf β in jeder logischen Aussagen-Formel für α eingesetzt werden. 1) Es wäre ein Irrtum, nach Analogie zu diesem Satze anzunehmen, dass αβ nur dann eine richtige Formel sei, wenn mindestens einer der Ausdrücke α, β eine richtige Formel ist. Das einfachste Gegenbeispiel liefert XX, was eine richtige Formel ist, obwohl X und X für sich es nicht sind.
25
30
35
‘Prinzipien der Mathematik’
5
155
Beweis: Da α = β eine Abkürzung für (α → β) + (β → α) bildet, so folgt der erste Teil der Behauptung unmittelbar aus der vorigen Regel. Die zweite Behauptung ergibt sich aus der ersten nach der Regel c). Unter den vielen Folgerungen, die sich aus der Regel h) ziehen lassen, seien folgende hervorgehoben. Formel (13): X = X Beweis: Mit Hilfe von (2). Formel (14): X = X Beweis: Auf Grund von (5) und (6).
10
15
Regel i): Ist α = β eine richtige Formel, so auch α = β. Beweis: Wegen (13) ist α = α eine richtige Formel. Hierin darf rechts vom Gleichheitszeichen β für α eingesetzt werden. Formel (15): X × Y = X + Y Beweis: Wird in der richtigen Formel XY = XY rechts vom Gleichheitszeichen X für X und Y für Y eingesetzt, so ergibt sich XY = XY , und diese Formel geht durch Einführung der Abkürzung + in (15) über. Formel (16): X + Y = XY Beweis: Führen wir in der Formel X + Y = X + Y rechts vom Gleichheitszeichen für X + Y den definierenden Ausdruck XY ein, so erhalten wir
20
25
30
35
X + Y = XY , daraus nach der Regel i): X + Y = XY , und hieraus gemäss der Regel d) die Formel (16). Aus den Formeln (15) und (16) in Verbindung mit der Regel i) geht das Prinzip der Dualität hervor. Formel (17): (X + Y → Z) = X → (Y → Z) Beweis: Wegen (16) besteht X + Y Z = XY Z. Für die linke Seite dieser Gleichung kann zur Abkürzung X +Y → Z geschrieben werden, für die rechte Seite X → Y Z, also auch X → (Y → Z). Formel (18): (X → Y ) = X + Y Beweis: Gemäss (14) besteht (X → Y ) = XY . Wird hierin auf der rechten Seite Y für Y eingesetzt und für XY zur Abkürzung X + Y geschrieben, so erhält man (18). Formel (19): X + X Beweis: Gemäss (18) besteht (X → X) = X + X. Daraus folgt nach der Regel h): (X → X) → X + X, und hieraus nach (2) die Formel (19). Formel (20): X + (Y + Z) = (X + Y ) + Z Beweis: Durch Anwendung von (13) und Einsetzung des definierenden Ausdrucks für Y + Z folgt X + (Y + Z) = X + Y Z .
148
156
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Entsprechend ergibt sich
X + Y Z = XY Z, und hieraus nach der Regel d): X + Y Z = XY Z; also erhalten wir durch Einsetzung X + (Y + Z) = XY Z. 149
Da man auf die gleiche Weise (X + Y ) + Z = XY Z erhält, so ergibt sich die Formel (20). Die Formeln (9) und (20) besagen, dass die Verknüpfung mit +, welche im Folgenden kurz „Summe“ genannt werden soll, dem kommutativen und dem assoziativen Gesetz genügt. Es lassen sich nun auch die beiden distributiven Gesetze beweisen, doch soll die Ableitung hier nicht ausgeführt werden.
5
10
Normaldarstellung von Ausdrücken
150
Durch Anwendung der für Produkt und Summe gültigen Rechengesetze sowie der Formeln I 1), (14), (15) findet man, dass jede Aussagen-Verbindung sich durch eine solche ersetzen lässt, die aus einer Summe von „einfachen Produkten“ besteht, das heisst von Produkten, in denen erstens je zwei Glieder voneinander verschieden sind und zweitens jedes Glied ein Aussagezeichen oder die Negation eines Aussagezeichens ist.1) So ist z.B. der Ausdruck X = Y ersetzbar durch XY + Y X. Von dieser Form der Darstellung können wir leicht zu einer solchen gelangen, in welcher als logische Zeichen nur Grundzeichen auftreten. Ist nämlich α eine gegebene Aussagen-Verbindung, | so wenden wir zunächst auf α die Umformung1) in eine Summe einfacher Produkte an. Von dieser Summe bilden wir nun das Gegenteil, welches ja gleich α, also auch gleich α ist. Dann erhalten wir gemäss der Formel (16) als Umformung für α ein Produkt von Negationen einfacher Produkte. Nach dieser Methode ergibt sich aus der Umformung (X × Y ) + (X × Y ) des Ausdrucks X = Y die Ersetzbarkeit der Gleichung X = Y durch den Ausdruck XY XY , welcher einfacher ist als derjenige Ausdruck, durch welchen wir die Gleichheit definiert haben. Die Umformung eines Ausdrucks zu einer Summe von einfachen Produkten gewährt insbesondere den Vorteil, dass sie die Entscheidung darüber, ob eine Aussagen-Verbindung eine richtige Formel ist, auf die entsprechende Frage für einfache Produkte zurückführt. Sie bildet daher ein geeignetes Hilfsmittel 1) Die Art der Umformung eines Ausdrucks in eine Summe von einfachen Produkten ist keineswegs eindeutig bestimmt. Auch lässt sich die Eindeutigkeit nicht dadurch erreichen, dass man verlangt, die Gesamtzahl von Produktgliedern solle möglichst gering sein. Dies zeigt sich z. B. an dem Ausdruck (X = Y ) + (Y = Z), der sowohl durch XY + Y Z + ZX wie auch durch XY + Y Z + ZX ersetzt werden kann, ohne dass doch eine Darstellung in der verlangten Form mit weniger als sechs Gliedern möglich wäre. 1) Unter einer „Umformung“ eines Ausdrucks soll dessen Ersetzung durch einen mit ihm in Gleichheitsbeziehung stehenden Ausdruck verstanden werden.
15
20
25
30
‘Prinzipien der Mathematik’
157
bei der Erörterung der allgemeinen axiomatischen Fragen, welche sich an den Kalkül mit Aussage-Zeichen anknüpfen. Von diesen Fragen lassen sich die nach der Widerspruchslosigkeit und der Vollständigkeit hier in besonders einfacher Weise lösen. 5
10
15
20
25
30
35
40
Widerspruchslosigkeit und Vollständigkeit des engeren Axiomen-Systems Den Nachweis für die Widerspruchslosigkeit können wir in ähnlicher Weise wie früher beim Aussagen-Kalkül erbringen. Das Axiomen-System, das wir zu betrachten haben, besteht aus den Grundformeln I 1)–5) und den Regeln II 1) und V. Dieses System von Axiomen wäre als widerspruchsvoll zu bezeichnen, falls sich daraus zwei Formeln ableiten liessen, die zueinander in der Beziehung des Gegenteils stehen. Um einzusehen, dass dieser Fall ausgeschlossen ist, | verfahren wir folgendermassen: wir fassen die Aussage-Zeichen als arithmetische Variable auf, für welche ausschliesslich die Werte 0 und 1 in Betracht kommen. XY deuten wir als arithmetisches Produkt, unter X verstehen wir 1 − X, und die abgeleiteten logischen Zeichen nehmen wir in strengem Sinne als Abkürzungen. Auf Grund dieser Interpretation stellt jede Aussagen-Verbindung eine arithmetische Funktion dar, welche höchstens einen der Werte 0 und 1 annehmen kann. Ist diese Funktion identisch gleich 0, so wollen wir auch von dem entsprechenden symbolischen Ausdruck sagen, dass er identisch gleich 0 sei. Es zeigt sich nun, dass alle logischen Aussagen-Formeln (d. h. also alle aus dem betrachteten Axiomen-System ableitbaren Formeln) identisch gleich 0 sind. Zunächst haben nämlich die fünf Grundformeln sämtlich diese Eigenschaft, wie man direkt verifizieren kann. Ferner wird beim Anwenden der Regel II 1) ein Ausdruck, welcher identisch gleich 0 ist, stets wieder in einen solchen Ausdruck übergeführt, da ja durch Einsetzen eines Ausdrucks anstelle einer Variablen der Wertevorrat einer Funktion nicht vergrössert werden kann. Endlich ist auch ein Ausdruck β, der sich auf Grund der Regel V als richtige Formel erweist, immer dann identisch gleich 0, falls die als richtige Formeln vorausgesetzten Ausdrücke α und αβ beide identisch gleich 0 sind, weil ja dann für jedes Wertsystem der vorkommenden Variablen α gleich 1, also αβ gleich β ist. Aus dieser Bemerkung folgt aber ohne weiteres, dass zwei Ausdrücke, die sich auf Grund der betrachteten Axiome als | richtige Formeln erweisen lassen, nicht aus einander durch Negation hervorgehen können. Denn ist ein Ausdruck α identisch gleich 0, so hat α stets den Wert 1, ist also gewiss nicht identisch gleich 0. Somit ist das System der genannten sieben Axiome in dem angegebenen Sinne widerspruchsfrei. Wenden wir uns nun zu der Frage der Vollständigkeit. Wir wollen das vorgelegte Axiomen-System vollständig nennen, falls durch die Hinzufügung einer bisher nicht ableitbaren Formel zu dem System der Grundformeln stets ein widerspruchsvolles Axiomen-System entsteht.
151
152
158
153
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Um zu entscheiden, ob diese Anforderung erfüllt ist, verschaffen wir uns zunächst ein einfaches Kriterium dafür, wann ein Ausdruck eine logische Aussagen-Formel ist. Dazu machen wir Gebrauch von der Ersetzbarkeit jeder Aussagen-Verbindung durch eine Summe einfacher Produkte. Wie sich aus der Regel g) ergibt, bildet eine Summe von Ausdrücken dann und nur dann eine logische Aussagen-Formel, wenn jedes einzelne Summenglied eine solche Formel ist. Es fragt sich also, wann ein einfaches Produkt eine logische Aussagen-Formel ist. Eine notwendige Bedingung hierfür haben wir bereits bei der arithmetischen Deutung unserer Formeln gefunden; sie besteht darin, dass die betreffende Formel identisch gleich 0 sein muss. Dieser Bedingung kann nun ein einfaches Produkt, wie man sofort erkennt, nur dann genügen, wenn es zwei Glieder enthält, die zueinander in der Beziehung des Gegenteils stehen. Umgekehrt ist aber auch jedes einfache Produkt dieser Art auf Grund der Formeln (3) und I 2) als richtige Formel erweisbar. | Demnach ergibt sich: ein Ausdruck ist dann und nur dann eine logische Aussagen-Formel, wenn er einer Summe von einfachen Produkten gleich ist, von denen jedes mindestens ein Paar zueinander entgegengesetzter Glieder (d. h. ein Aussage-Zeichen und dessen Negation) enthält. Mit Hilfe des erhaltenen Kriteriums können wir uns nun leicht von der Vollständigkeit unseres Axiomen-Systems überzeugen. Sei nämlich α irgend eine aus den Axiomen nicht beweisbare Formel; dann betrachten wir einen Ausdruck β, welcher gleich α ist und die Form einer Summe von einfachen Produkten hat. Da β ebenso wenig wie α eine logische Aussagen-Formel ist, so muss unter jenen einfachen Produkten mindestens eines (γ) vorkommen, bei dem keine zwei Glieder einander entgegengesetzt sind, in welchem daher kein Aussage-Zeichen zweimal auftritt. Setzt man in γ für jedes unverneinte Aussage-Zeichen das Zeichen X, für jedes verneinte das Zeichen X ein, so erhält man ein Produkt der Form X . . . X, welches gemäss I 1) und 2) gleich X ist. Würde nun α als richtige Formel postuliert, so würde sich auch β, ferner gemäss der Regel g) auch γ als richtige Formel ergeben. Auf Grund der Einsetzungs-Regel müsste also X . . . X und ebenso X eine richtige Formel sein. Dann dürfte aber für X auch X eingesetzt werden, und wir erhielten einen Widerspruch. Es stellt sich also das System der betrachteten Axiome in der Tat als vollständig heraus.1) 1)
Zugleich hiermit folgt auch die Umkehrung des Satzes, dass jede logische Aussagen-Formel identisch gleich 0 ist. Gäbe es nämlich eine Formel, welche zwar identisch gleich 0, aber keine logische Aussagen-Formel wäre, so könnte, gemäss der Ueberlegung, die wir beim Beweis der Widerspruchslosigkeit angestellt haben, die Hinzufügung dieser Formel zu den Axiomen nicht auf einen Widerspruch führen.
5
10
15
20
25
30
‘Prinzipien der Mathematik’
159
3) Das Gesamt-System der logischen Formeln
154
Widerspruchslosigkeit des ganzen Axiomen-Systems; Unvollständigkeit des Systems
5
10
15
20
25
30
35
Die Methode der arithmetischen Deutung, mit Hilfe deren sich bei dem zunächst gesondert untersuchten Teilsystem unserer Axiome die Widerspruchslosigkeit und die Vollständigkeit einsehen lässt, ermöglicht es uns auch, das Gesamtsystem der Axiome des Funktionen-Kalküls als widerspruchslos (in dem vorhin angegebenen Sinne) zu erkennen. Hierzu müssen wir die arithmetische Interpretation auf die bisher noch nicht gedeuteten Zeichen ausdehnen. Und zwar soll dies folgendermassen geschehen: Die unbestimmten Funktionszeichen behandeln wir ganz ebenso wie die unbestimmten Aussagezeichen, indem wir ihre Deutung von der Art der Ausfüllung ihrer Leerstellen unabhängig machen;1) d.h. wir fassen ein unbestimmtes Funktionszeichen als eine arithmetische Variable auf, welche der Werte 0 und 1 und keiner anderen fähig ist. Die (logischen) Variablen und die Allgemeinheitszeichen werden nicht mitgelesen. Zur Deutung des Zeichens (Ex) ersetzen wir allgemein (Ex)α durch den definierenden Ausdruck (x)α. Da dieser bei unserer Interpretation gleichbedeutend ist mit α und daher auch mit α, so können die Existenzialzeichen bei der Deutung der Formeln gleichfalls übergangen werden. Unter den individuellen Zeichen sondern wir eine Teilgesamtheit als „individuelle Grundzeichen“ derart aus, dass sich jedes individuelle Zeichen, welches kein Grundzeichen ist, durch | jene Grundzeichen in Verbindung mit unbestimmten und logischen Zeichen definieren lässt, hingegen keines der Grundzeichen durch die übrigen (mit Hilfe unbestimmter und logischer Zeichen) definiert werden kann. Diese Aussonderung ist jedenfalls durchführbar, weil ja die individuellen Zeichen einzelweis gegeben sein müssen. Nachdem wir sie vollzogen haben, legen wir jedem individuellen Grundzeichen, sofern es ein Aussagezeichen oder ein Funktionszeichen ist, den Wert 0 bei, und jedem von den Grundzeichen verschiedenen individuellen Aussage- und Funktionszeichen ordnen wir eindeutig einen definierenden Ausdruck zu, aus welchem wir die Bedeutung des Zeichens entnehmen. Die Eigennamen von Gegenständen werden (so wie die Variablen und die Klammerzeichen) unberücksichtigt gelassen. Bei diesen Festsetzungen gilt jetzt auch für das ganze Axiomen-System unseres Kalküls der Satz, dass jede aus den Axiomen beweisbare Formel identisch gleich 0 ist (d. h. bei der arithmetischen Deutung die Konstante 0 ergibt). Zunächst sind nämlich alle Grundformeln identisch gleich 0, wie man leicht 1)
Natürlich sind Funktionszeichen, bei denen die Anzahl der Leerstellen verschieden ist, als verschiedene Funktionszeichen zu betrachten. Auch wird man der Deutlichkeit halber stets vermeiden, dass in einer und derselben Formel Funktionszeichen mit verschiedener Anzahl der Leerstellen gleichbenannt sind.
155
160
156
157
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
direkt nachprüfen kann; ferner bleibt bei der Anwendung der Regeln I, III, IV die arithmetische Bedeutung der Formeln völlig ungeändert, und bezüglich der Regeln II und V gelten genau dieselben Gründe wie im Falle des vorhin betrachteten engeren Axiomen-Systems. Da nun andrerseits zwei Ausdrücke, von denen der eine die Negation des anderen ist, nicht beide identisch gleich 0 sein können, so folgt, dass unter den Formeln, die sich aus unseren Axiomen ableiten lassen, keine zwei einander entgegengesetzt sein können. Die Bedingung der Widerspruchslosigkeit ist also | erfüllt.1) Der Gedankengang dieses Beweises führt uns auch zur Entscheidung über die Frage der Vollständigkeit, und zwar im verneinenden Sinne. Um nämlich die Unvollständigkeit des Axiomen-Systems festzustellen, brauchen wir nur eine Formel zu finden, welche identisch gleich 0, aber nicht eine Konsequenz der Axiome ist. Eine solche Formel ist (Ex)F (x) → (x)F (x), welche arithmetisch interpretiert (1 − F ) · F , also in der Tat die Konstante 0 ergibt. Dass diese Formel nicht aus den Axiomen folgen kann, geht daraus hervor, dass die Behauptung, welche sie darstellt („wenn es ein x gibt, für das F (x) besteht, so besteht F (x) für alle x“) gewiss nicht allgemein richtig ist (ein streng formaler Beweis für die Unmöglichkeit, die Formel aus den Axiomen abzuleiten, müsste freilich erst noch gefunden werden.) Von den allgemeinen axiomatischen Ueberlegungen wollen wir jetzt zur Betrachtung der Formalistik des Funktionen-Kalküls zurückkehren. Wir haben bisher nur das System der logischen Aussagen-Formeln untersucht und müssen nun zusehen, wie sich von dieser Grundlage aus das Gesamtsystem der logischen Formeln gewinnen lässt, wobei jetzt sämtliche Axiome zur Geltung kommen mit Ausnahme der Regel III, welche sich auf die Einsetzung von individuellen Gegenstands-Bezeichnungen bezieht. Die Methode, | nach welcher man hierbei zu verfahren hat, möge an der Ableitung einiger Formeln und Regeln dargelegt werden. Und zwar wollen wir mit denjenigen Entwicklungen beginnen, welche sich auf die Umkehrbarkeit der Grundformeln II 1), 3), 5) beziehen.
5
10
15
20
25
30
Ableitung der Formeln (21)–(36) sowie der Regeln k)–n) Formel (21) (x) F (x) × F (x) Beweis: (21) folgt aus der Formel (4) nach der Grundregel IV 1). Formel (22) (x) Z × F (x) → Z × (x)F (x). Beweis: Aus der Grundformel I 5) erhalten wir nach der Regel e): (X → Y ) → (XZ → Y Z). Werden hierin für X, Y , Z bezüglich die konstan1) Man darf dieses Ergebnis in seiner Bedeutung nicht überschätzen. Wir haben ja damit noch keine Gewähr dafür, dass bei der symbolischen Einführung von inhaltlich einwandfreien Voraussetzungen das System der beweisbaren Formeln widerspruchslos bleibt.
35
‘Prinzipien der Mathematik’
161
ten Ausdrücke (x)Z, Z, (x)F (x) (nach der Grundregel II 1) ) eingesetzt, so ergibt sich (x)Z → Z → (x)Z × (x)F (x) → Z × (x)F (x) . Wegen (x)Z → Z (Grundformel II 1) ) folgt hieraus (x)Z × (x)F (x) → Z × (x)F (x).
5
Da ferner
(x) Z × F (x) → (x)Z × (x)F (x)
(Grundformel II 3) ),
so folgt (22). 10
15
Formel (23) (x) Z → F (x) → Z → (x)F (x) Beweis: (23) ist eine Abkürzung für (x) Z × F (x) → Z × (x)F (x),
und diese Formel geht aus (22) hervor, indem Z für Z gesetzt wird. Formel (24) Z → (x) Z × F (x) Beweis: Aus der richtigen Formel Z → ZX erhält man gemäss der Regel IV 1): (x) Z → Z × F (x) . Setzt man in der Formel (23) gemäss der Regel II 2) anstelle von F (x) den von x allein abhängigen Ausdruck Z × F (x), so ergibt sich (x) Z → Z × F (x) → Z → (x) Z × F (x) , woraus in Verbindung mit der vorigen Formel die Formel (24) folgt.
20
Formel (25) (x)Z = Z Beweis: Da nach der Grundformel II 1): (x)Z → Z, so genügt es gemäss der Regel h), Z → (x)Z zu beweisen. Die Formel (24) in Verbindung mit der Grundformel II 3) liefert Z → (x)Z × (x)F (x).
25
Ersetzen wir in der (leicht verifizierbaren) logischen Aussagenformel (Z → XY ) = (Y → ZX) die Zeichen X und Y bezüglich durch die konstanten Ausdrücke (x)Z und (x)F (x), so erhalten wir: Z → (x)Z × (x)F (x) = (x)F (x) → Z × (x)Z . Somit besteht
30
35
(x)F (x) → Z × (x)Z. Wird F (x) gemäss der Regel II 2) durch F (x) ersetzt und die Abkürzung (Ex) eingeführt, so folgt (Ex)F (x) → Z × (x)Z. Diese Formel, vereinigt mit (x)F (x) → (Ex)F (x) (Grundformel II 2) ) liefert (x)F (x) → Z × (x)Z. Setzt man nun für F (x) gemäss der Regel II 2) den Ausdruck F (x) × F (x) ein und wendet die Formel (21) an, so ergibt sich Z × (x)Z, wofür auch Z → (x)Z geschrieben werden kann. Formel (26) (x) Z × F (x) = Z × (x)F (x)
158
162
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Beweis: Da (22) bewiesen ist, so genügt es, die Umkehrung Z × (x)F (x) → (x) Z × F (x) abzuleiten. Dies geschieht folgendermassen: Durch Anwendung der Regel IV 1) auf die richtige Formel X → ZX ergibt sich: (x) F (x) → Z ×F (x) . Setzen wir den Ausdruck Z × F (x) anstelle von G(x) in die Grundformel II 4) ein, so erhalten wir (x) F (x) → Z × F (x) → (x)F (x) → (x) Z × F (x) . 159
Diese Formel zusammen mit der vorigen liefert (x)F (x) → (x) Z × F (x) . Ferner besteht Z → (x) Z × F (x) (Formel (24) ). Und aus diesen beiden Beziehungen erhalten wir die behauptete Formel nach folgender Regel: Regel k): Sind α, β, γ konstante Ausdrücke und sind a → γ und β → γ richtige Formeln, so ist auch αβ → γ eine richtige Formel.1) Formel (27) (x) Z → F (x) = Z → (x)F (x) Beweis: (27) wird aus (26) erhalten, indem Z durch Z ersetzt und die Abkürzung → eingeführt wird.
5
10
15
Formel (28) (x)(y)F (x, y) = (y)(x)F (x, y) Beweis: Einerseits besteht (x)(y)F (x, y) → (y)(x)F (x, y)
(Grundformel II 5) ).
Werden andrerseits in dieser Formel die Variablen x und y vertauscht (durch Anwendung der Regel I) und wird F (x, y) gemäss der Regel II 2) durch F (y, x) ersetzt, 51 so ergibt sich
20
(y)(x)F (x, y) → (x)(y)F (x, y).
160
Auf Grund der Regel h) folgt daher die Gleichung (28). Bei den folgenden Beweisen spielt eine gewisse Erweiterungsfähigkeit der Regeln IV eine wichtige Rolle. Dieser wollen wir | in einer abgeleiteten Regel Ausdruck geben, welche gleich in grösserer Allgemeinheit formuliert werden soll. Regel l): Es seien α und β konstante Ausdrücke, x eine in diesen nicht vorkommende Variable. α und β mögen aus α und β dadurch entstehen, dass entweder gewisse in den Ausdrücken vorkommende unbestimmte Aussagezeichen überall, wo sie auftreten, durch Funktionszeichen mit der Variablen x ersetzt werden 1)
Der Beweis dieser Regel, welcher in den Zusammenhang der logischen AussagenFormeln gehört, verläuft so: Aus α → γ entnimmt man αβ → γβ; aus β → γ folgt γβ → γγ. Ferner ist γγ → γ eine richtige Formel. Und aus den drei erhaltenen Beziehungen geht αβ → γ als richtige Formel hervor. 51 F (x, y)
and F (y, x) should be interchanged.
25
30
‘Prinzipien der Mathematik’
163
oder dass bei gewissen in α oder β vorkommenden unbestimmten Funktionszeichen überall, wo sie auftreten, die Variable x als neues Argument hinzugefügt wird, 5
10
15
20
oder dass beiderlei Operationen zugleich ausgeführt werden. (Dabei soll angenommen werden, dass sowohl α wie β mindestens eines der betreffenden unbestimmten Zeichen enthält.1) ) Ist dann α → β eine richtige Formel, so ist auch (x)α → (x)β eine solche; ist ferner α = β eine richtige Formel, so auch (x)α = (x)β . Beweis1) : Um uns die Gültigkeit der Regel klarzumachen, genügt es, einen speziellen Fall zu betrachten, aus dessen Behandlung das im allgemeinen Falle anzuwendende Verfahren ersichtlich ist. Wir wollen die Spezialisierung in der Weise wählen, dass der Uebergang von α und β zu α und β in der Ersetzung eines Aussagezeichens X durch ein Funktionszeichen F (x) und der Hinzufügung des Argumentes x zu einem Funktionszeichen H(y, z) besteht. | Um die Art dieses Ueberganges in der Schreibweise zum Ausdruck zu bringen, wollen wir für die Formel α → β das Symbol Φ X, H(y, z) einfüh ren und dementsprechend die Formel α → β mit Φ F (x), H(x, y, z) bezeichnen. Es soll zunächst gezeigt werden, dass aus Φ X, H(y, z) die Formel (x)Φ F (x), H(x, y, z) abgeleitet werden kann. Ist u eine in Φ X, H(y, z) nicht vorkommende Variable, so ergibt die Anwendung der Regel IV 1), dass mit Φ X, H(y, z) zugleich (u)Φ F (u), H(y, z) eine richtige Formel ist; hieraus folgt nach der Regel IV 2), dass (x)(u)Φ F (u), H(x, y, z) eine richtige Formel ist. Wird ferner in der Formel
161
(x)(u)F (x, u) → (x)F (x, x), 25
30
35
welche aus der Grundformel II 6) durch Umbenennung der Variablen y (gemäss der Regel I) entsteht, anstelle von F (x, u) der von x, u und sonst keiner Variablen abhängige Ausdruck Φ F (u), H(x, y, z) eingesetzt, so erhält man (x)(u)Φ F (u), H(x, y, z) → (x)Φ F (x), H(x, y, z) . Da das erste Glied dieser Folge-Beziehung bereits als richtige Formel erwiesen ist, so ergibt sich (x)Φ F (x), H(x, y, z) als richtige Formel. Mit den anfänglichen Bezeichnungen ausgedrückt lautet das bisherige Ergebnis: auf Grund der vorausgesetzten Beziehung α → β besteht (x)(α → β ). Nun sind die Ausdrücke α und β von x und sonst keiner Variablen abhängig, wir können sie also anstelle von F (x) und G(x) II 4) einsetzen. Dadurch in die Grundformel erhalten wir: (x)(α → β ) → (x)α → (x)β , und damit auch (x)α → (x)β , entsprechend unserer ersten Behauptung. Nehmen wir nun noch α = β als richtige Formel an; dann besteht sowohl α → β wie β → α. Nach dem eben Bewiesenen sind | daher (x)α → (x)β und (x)β → (x)α richtige Formeln. 1) Diese Voraussetzung ist zur Gültigkeit der Regel nicht erforderlich, sie wird hier nur zur Erleichterung des Beweises eingeführt. 1) Man beachte, dass zu diesem Beweise keine der Formeln (21)–(28) gebraucht wird.
162
164
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Und hieraus folgt gemäss der Regel h), dass auch (x)α = (x)β eine richtige Formel ist, womit auch der zweite Teil unserer Behauptung bewiesen ist. Formeln (29)
(x)F (x) = (Ex)F (x) (Ex)F (x) = (x)F (x) Beweis: 1. Aus X = X (Formel (14) ) folgt nach der Regel l)
5
(x)F (x) = (x)F (x), hieraus nach der Regel i): (x)F (x) = (x)F (x), und für die rechte Seite dieser Gleichung kann zur Abkürzung (Ex)F (x) geschrieben werden. 2. Aus der Formel (14) erhält man durch Anwendung der Einsetzungsregel:
10
(x)F (x) = (x)F (x). also, nach der Definition von (Ex): (Ex)F (x) = (x)F (x). Formel (30) (x) F (x) → G(x) → (Ex)F (x) → (Ex)G(x) Beweis: Aus (X → Y ) → (Y → X) (Formel (7) ) erhalten wir nach der Regel l): (x) F (x) → G(x) → (x) G(x) → F (x) . Ferner folgt, wenn wir in der Grundformel II 4) für F (x) und G(x) bezüglich G(x) und F (x) einsetzen: (x) G(x) → F (x) → (x)G(x) → (x)F (x) ,
15
20
und indem wir in der Formel (7) für X und Y die konstanten Ausdrücke (x)G(x) und (x)F (x) setzen, ergibt sich, bei Einführung der Abkürzung (Ex), (x)G(x) → (x)F (x) → (Ex)F (x) → (Ex)G(x) .
163
Die drei erhaltenen Folge-Beziehungen ergeben zusammen (30). Zu dieser Formel (30) ist zu bemerken, dass sie inhaltlich mit dem Ungleichungs-Axiom des Prädikaten-Kalküls gleichbedeutend ist. In Hinsicht auf unseren gegenwärtigen Kalkül können wir sie insbesondere | dazu verwenden, um folgende Ergänzung der Regel l) zu beweisen: Regel m): Es mögen α, β, α , β dieselbe Bedeutung haben wie bei der Regel l). Ist dann α → β eine richtige Formel, so ist auch (Ex)α → (Ex)β eine solche; und ist α = β eine richtige Formel, so auch (Ex)α = (Ex)β . Beweis: 1. Wie wir aus dem Beweis der Regel l) wissen, besteht auf Grund der Voraussetzung α → β die Beziehung (x)(α → β ). Gemäss (30) und der Regel II 2) ist ferner (x)(α → β ) → (Ex)α → (Ex)β eine richtige Formel, also auch (Ex)α → (Ex)β . 2. Im Falle, dass α = β eine richtige Formel ist, ergibt sich aus den Beziehungen α → β und β → α gemäss dem eben Bewiesenen, dass
25
30
35
‘Prinzipien der Mathematik’
5
165
(Ex)α → (Ex)β und (Ex)β → (Ex)α richtige Formeln sind, wodurch sich auch (Ex)α = (Ex)β als richtige Formel erweist. Formel (31) (x) F (x) + G(x) = (x)F (x) + (x)G(x).1) Beweis: Aus X → (Y → X + Y ) (Formel (12)) erhalten wir gemäss der Regel l): (x)F (x) → (x) G(x) → F (x) + G(x) . Aus der Grundformel II 4) und der Einsetzungsregel ergibt sich (x) G(x) → F (x) + G(x) → (x)G(x) → (x) F (x) + G(x) . Also folgt
10
15
(x)F (x) → (x)G(x) → (x) F (x) + G(x) , und hieraus durch Anwendung der Formel (17): (x)F (x) + (x)G(x) → (x) F (x) + G(x) .
Nun müssen wir noch die umgekehrte Folge-Beziehung beweisen. Wir benutzen dazu die Formeln (11) und (10), welche auf Grund der Regel l) die Beziehungen (x) F (x) + G(x) → (x)F (x) (x) F (x) + G(x) → (x)G(x) liefern. Aus diesen ergibt sich die gewünschte Formel (x) F (x) + G(x) → (x)F (x) + (x)G(x)
20
nach folgender Regel:
25
Regel n): Sind α, β, γ konstante Ausdrücke und sind γ → α, γ → β richtige Formeln, so ist auch γ → α + β eine richtige Formel.1) Formel (32) (x) F (x) → Z = (Ex)F (x) → Z Beweis: Aus der Formel XZ = ZX und der Regel l) ergibt sich (x) F (x) × Z = (x) Z × F (x) . Gemäss der Formel (26) besteht also (x) F (x) × Z = Z × (x)F (x). 1)
Es sei besonders hervorgehoben, dass für die Verknüpfung × nicht das Analogon der Formel (31) gilt. Dies kann man sich mit Hilfe der inhaltlichen Deutung leicht klarmachen. Z. B. müsste sonst der Satz: „Jede Zahl ist entweder gerade oder ungerade“ logisch gleichwertig sein mit dem Satz: „entweder sind alle Zahlen gerade, oder alle Zahlen sind ungerade“. 1) Der Beweis hierfür lässt sich folgendermassen führen: aus γ → α und γ → β ergeben sich durch Anwendung der Formel (7) die Beziehungen α → γ und β → γ. Aus diesen folgt nach der Regel k): αβ → γ. Wird nun nochmals (7) angewendet, so erhält man γ → αβ, also (aufgrund der Regel d), bei Einführung der Abkürzung +): γ → α + β.
164
166
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Hierin werde F (x) für F (x) eingesetzt und die (aus ZX = X × Z durch Anwendung der Einsetzungsregel hervorgehende) Beziehung Z × (x)F (x) = (x)F (x) × Z
165
beachtet, welche bei der Einführung der Abkürzung (Ex) in Z × (x)F (x) = (Ex)F (x) × Z
5
übergeht. Dann erhält man: (x) F (x) × Z = (Ex)F (x) × Z, und hieraus durch Anwendung der Abkürzung → die Formel (32). Formel (33) (x) Z + F (x) = Z + (x)F (x) Beweis: Aus Formel (11) erhalten wir nach der Regel IV 1) (x) Z + F (x) → Z . Gemäss (32) besteht (x) Z + F (x) → Z → (Ex) Z + F (x) → Z . Also folgt zunächst (Ex) Z + F (x) → Z. Da ferner zufolge der Grundformel II 2) die Beziehung (x) Z + F (x) → (Ex) Z + F (x)
10
15
besteht, so erhalten wir
(x) Z + F (x) → Z. Aus der Formel (10) ergibt sich durch Anwendung der Regel l): (x) Z + F (x) → (x)F (x). Also besteht nach der Regel n) (x) Z + F (x) → Z + (x)F (x).
20
Um nun noch die umgekehrte Folge-Beziehung zu erhalten, welche gemäss der Formel (17) durch Z → (x)F (x) → (x)(Z + F (x) ersetzbar ist, wenden wir auf die Formel Regel IV 1) Z →(X → Z + X) die an, wodurch wir zu der Beziehung (x) Z → F (x) → Z + F (x) gelangen. Den Ausdruck F (x) → Z + F (x) setzen wir anstelle von F (x) in die Formel (27) ein und finden so: Z → (x) F (x) → Z + F (x) . Nehmen wir hierzu die aus der Grundformel II 4) entspringende Beziehung (x) F (x) → Z + F (x) → (x)F (x) → (x) Z + F (x) ,
166
25
30
so erhalten wir die verlangte Formel. Formel (34) (x) F (x) → (Ey)F (y) Beweis: Aus (32) folgt, wenn Z durch (Ey)F (y) ersetzt wird: (x) F (x) → (Ey)F (y) = (Ex)F (x) → (Ey)F (y) . Ferner erhält man (Ex)F (x) → (Ey)F (y) aus der richtigen Formel (Ex)F (x) → (Ex)F (x), indem man gemäss der Regel I innerhalb des Wirkungsbereiches des zweiten Existenzialzeichens die Variable x durch y ersetzt. Demnach folgt (34).
35
‘Prinzipien der Mathematik’
5
10
15
20
25
30
35
167
Formel (35) (Ex)(y)F (x, y) → (y)(Ex)F (x, y) Dies ist die bereits früher erwähnte Vertauschungs-Formel, von welcher ich hervorgehoben habe, dass sie nur als einseitige Folge-Beziehung gilt.1) Beweis: Aus der Formel (34) erhält man nach der Regel IV 2): (u)(x) F (x, u) → (Ey)F (y, u) . Hierin dürfen zufolge der Grundformel II 5) die Allgemeinheitszeichen vertauscht werden. Ferner ergibt sich aus der Formel (x)(u) F (x, u) → G(u) → (x) (u)F (x, u) → (u)G(u) , welche aus der Grundformel II 4) durch Umbenennung der Variablen und Anwendung der Regel l) hervorgeht, durch Einsetzen des Ausdrucks (Ey)F (y, u) anstelle von G(u): (x)(u) F (x, u) → (Ey)F (y, u) → (x) (u)F (x, u) → (u)(Ey)F (y, u) . Demnach erhalten wir (x) (u)F (x, u) → (u)(Ey)F (y, u) . Nun geht dieser Ausdruck aus der linken Seite der Gleichung (32) hervor, indem für Z der konstante Ausdruck (u)(Ey)F (y, u) und für F (x) der von x allein abhängige Ausdruck (u)F (x, u) eingesetzt wird. Daher ergibt sich auf Grund von (32) und der Einsetzungs-Regel: (Ex)(u)F (x, u) → (u)(Ey)F (y, u). Und hieraus erhalten wir die behauptete Formel, indem wir nach der Regel I die Variable y durch x und darauf die Variable u durch y ersetzen. Formel (36) (x) F (x) → Z → (x)F (x) → Z Beweis: Gemäss (32) kann die behauptete Formel ersetzt werden durch (Ex)F (x) → Z → (x)F (x) → Z , und diese Formel ergibt sich aus (x)F (x) → (Ex)F (x) (Grundformel II 2) ) auf Grund der logischen Aussagen-Formel1) (X → Y ) → (Y → Z) → (X → Z) , in welcher man für X und Y bezüglich (x)F (x) und (Ex)F (x) einzusetzen hat. Es sollen nunmehr einige allgemeine Regeln besprochen werden, die zur Gewinnung eines Ueberblicks über das System der logischen Formeln sowie zur Handhabung des Funktionen-Kalküls besonders wichtig sind. Diese Regeln beziehen sich auf ganz beliebige Ausdrücke unseres Kalküls; sie gelten also auch für solche Formeln, in denen individuelle Zeichen auftreten. 1)
Zur Verhütung eines Missverständnisses sei bemerkt, dass die Einseitigkeit der Folge-Beziehung nur so zu verstehen ist, dass die Beziehung nicht allgemein umkehrbar ist. Wird anstelle von F (x, y) ein spezieller von x und y abhängiger Ausdruck eingesetzt, so kann die entstehende Folge-Beziehung wohl umkehrbar sein. Z. B. trifft dies für jeden Ausdruck von der Form F (x) + G(y) zu. 1) Diese Formel kann man z. B. aus (1) und (17), mit Hilfe des kommutativen Gesetzes für die Summe, ableiten.
167
168 168
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Regel p) : Festhalten von Variablen; Anwendungen Als eine Konsequenz der Regeln l) und m) ergibt sich:
169
Regel p): Steht in einer (konstanten) Formel ein Ausdruck α im Wirkungsbereich eines oder mehrerer Klammer-Zeichen, welche bezüglich zu den Variablen x, y, . . . , u gehören mögen, und ist β ein Ausdruck von der Art, dass α = β eine beweisbare Formel wäre, wenn (für die Anwendung der Einsetzungs-Regel) die Abhängigkeit der Ausdrücke α, β von jenen Variablen x, y, . . . , u vernachlässigt werden dürfte, so geht die betreffende Formel beim Ersetzen von α durch β in einen ihr gleichen Ausdruck über. Insbesondere entsteht also bei dieser Ersetzung aus einer richtigen Formel stets wieder eine richtige Formel. Wie diese Regel aufzufassen ist, wird deutlich werden, indem wir von ihr Anwendungen machen. Es hänge der Ausdruck α allein von den Variablen x, . . . , u ab. Gesetzt, wir dürften diese Abhängigkeit vernachlässigen, so könnten wir α als konstanten Ausdruck behandeln und in die Gleichung X = X einsetzen, und es wäre dann α = α eine beweisbare Formel. Damit also bei einer Formel, in welcher α vorkommt, die Voraussetzungen der Regel p) in bezug auf α erfüllt sind, ist nur nötig, dass zu jeder der Variablen x, . . . , u in der Formel ein KlammerZeichen gehört, und dass die Wirkungsbereiche dieser Klammer-Zeichen den Ausdruck α als gemeinsamen Bestandteil enthalten. Dies findet aber jedenfalls statt, wenn die Formel einen konstanten Ausdruck bildet. Demnach ergibt sich folgender Satz: ein konstanter Ausdruck geht in einen ihm gleichen über, wenn ein darin enthaltener Teil-Ausdruck α durch α ersetzt wird. Auf dieselbe Weise finden wir: Ein konstanter Ausdruck geht in einen ihm gleichen über, wenn ein darin vorkommendes Produkt βγ durch γβ ersetzt wird. Und ganz allgemein übertragen sich so die für die AussagenVerbindungen gültigen Rechen-Regeln auf den Kalkül mit beliebigen Ausdrücken. Regel q) : Bildung der Negation; erweitertes Dualitäts-Prinzip; Formeln (25 ), (26 ), (28 ), (31 ), (33 )
5
10
15
20
25
30
Als weiteres Ergebnis schliesst sich hieran eine Regel über die Umformung des Gegenteils von einem Ausdruck. Regel q): Von einem konstanten Ausdruck, in welchem die Abkürzungen „→“ und „=“ nicht vorkommen, bildet man das Gegenteil, indem man erstens die gleichnamigen Allgemeinheits-Zeichen und Existenzial-Zeichen gegenseitig füreinander einsetzt, zweitens die Zeichen × und + gegenseitig füreinander setzt und drittens die Aussage- und Funktions-Zeichen gegen ihre Verneinungen austauscht. Der Beweis dieser Regel verläuft folgendermassen: Auf Grund der Formeln (29) und der Beziehungen (x)Z = (Ex)Z,
(Ex)Z = (x)Z,
35
40
‘Prinzipien der Mathematik’
169
welche man leicht aus der Formel (25) ableiten kann, ergibt sich durch Anwendung der Einsetzungs-Regel zunächst, dass für einen konstanten oder nur von x abhängigen Ausdruck α die Gleichungen bestehen (x)α = (Ex)α, 5
10
15
20
25
30
(Ex)α = (x)α.
Die Gleichungen gelten also immer dann, wenn (x)α oder (Ex)α ein konstanter Ausdruck ist. Indem wir nun von diesen Formeln und von den Formeln (15), (16) Gebrauch machen, können wir bei einem verneinten Ausdruck der vorausgesetzten Art stets erreichen, dass die Negation von dem Gesamt-Ausdruck auf die Wirkungsbereiche der zu äusserst stehenden Klammer-Zeichen verlegt | wird1) , wobei für diese Klammer-Zeichen und für diejenigen logischen Zeichen, welche sich ausserhalb jener Wirkungsbereiche befinden, die in der Regel q) vorgeschriebenen Ersetzungen bereits vollzogen sind. Die Ausdrücke (Wirkungsbereiche), von denen nunmehr das Gegenteil zu bilden ist, enthalten entweder die zu dem voranstehenden Klammerzeichen gehörige Variable überhaupt nicht, oder wenn sie diese enthalten, dürfen sie doch gemäss der Regel p) beim formalen Operieren so behandelt werden, als ob sie nicht von ihr abhingen (und folglich konstant wären). Es wird also durch unsere Umformung die Negation des Gesamt-Ausdrucks auf die Negation von Ausdrücken mit weniger Argumenten zurückgeführt, und wir erhalten demnach ein Rekursions-Verfahren, von dem jedes in dem Gesamt-Ausdruck auftretende logische Zeichen einmal betroffen wird, und zwar gerade in der Weise, wie es die Regel q) fordert. Dieses Verfahren muss schliesslich bei den Aussageund Funktions-Zeichen (bezw. deren Negationen) anlangen, welche entweder für sich einen Wirkungsbereich bilden oder Glieder einer Summe oder eines Produkts sind, und welche in jedem Falle gemäss den bei der Umformung anzuwendenden Gleichungen mit einer Negation versehen werden, die sich eventuell gegen eine schon vorhandene Verneinung aufheben kann. Die beschriebene Methode der Umformung möge an einem Beispiel erläutert werden. Es handle sich darum, für das Gegenteil des Ausdrucks (x)(Ey) F (x, y) × (Ez)G(x, y, z) die der Re|gel q) entsprechende Darstellung abzuleiten. Bezeichnen wir das nur von x und y abhängige Produkt F (x, y) × (Ez)G(x, y, z) abgekürzt mit H(x, y) und setzen (Ey)H(x, y) anstelle von F (x) in die erste der Formeln (29) ein, so ergibt sich (x)(Ey)H(x, y) = (Ex)(Ey)H(x, y).
35
Gemäss der Regel p) können wir nun für die Operationen innerhalb des Wirkungsbereiches von (Ex) die Variable x unberücksichtigt lassen; wir dürfen also gemäss der zweiten von den Formeln (29) den Ausdruck (Ey)H(x, y) durch (y)H(x, y) ersetzen und erhalten (x)(Ey)H(x, y) = (Ex)(y)H(x, y).
40
1)
Wenn der betrachtete Gesamt-Ausdruck überhaupt keine Variable enthält, so besagt die Regel q) nichts Neues. Wir können daher beim Beweise von diesem Fall absehen.
170
171
170
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Wir wenden nun nochmals die Regel p) an, indem wir den Ausdruck H(x, y) so behandeln, als ob er nicht von x und y abhinge; wir ersetzen also H(x, y), d. h. F (x, y) × (Ez)G(x, y, z) gemäss den Formeln (14) und (15) durch F (x, y)+(Ez)G(x, y, z), und anstelle von (Ez)G(x, y, z) setzen wir gemäss (29): (z)G(x, y, z). So gelangen wir zu der Umformung (x)(Ey) F (x, y) × (Ez)G(x, y, z) = (Ex)(y) F (x, y) + (z)G(x, y, z) ,
172
welche ganz der Regel q) entspricht. Aus der Regel q) lässt sich folgende Erweiterung des Dualitäts-Prinzips entnehmen: Aus einer logischen Formel, welche die Form einer FolgeBeziehung oder einer Gleichung hat, in deren Gliedern die Zeichen „→“ und „=“ nicht vorkommen, entsteht wieder eine logische Formel, wenn man überall die gleichnamigen Allgemeinheits- und Existenzial-Zeichen für einander einsetzt und ebenso die Zeichen × und + gegen einander umwechselt, wobei man im Falle der Folge-Beziehung noch die beiden Glieder zu vertauschen hat. Beweis: Ist α → β eine richtige Formel, so ist gemäss (7) auch β → α eine solche; und mit α = β ist nach der Regel i) zugleich auch α = β eine richtige Formel. Nun können (weil nach Voraussetzung α und β die Zeichen → und = nicht enthalten) gemäss der Regel q) die Ausdrücke α und β durch solche Ausdrücke ersetzt werden, welche bezüglich aus α und β hervorgehen, indem gleichnamige Allgemeinheits- und Existenzial-Zeichen, ebenso die Zeichen × und + gegen einander umgewechselt und die Aussage- und Funktions-Zeichen durch ihre Negationen ersetzt werden. Diese letzte Ersetzung kann aber rückgängig gemacht werden, da einerseits die Ausgangsformel als logische Formel vorausgesetzt ist und daher α und β keine individuellen Zeichen enthalten, andrerseits eine richtige Formel gemäss der Einsetzungs-Regel wieder in eine solche übergeht, wenn man sämtliche unbestimmten Aussage- und FunktionsZeichen durch ihr Gegenteil ersetzt. Das erweiterte Dualitäts-Prinzip liefert uns mit einem Schlage eine grosse Zahl von logischen Formeln, von denen einige hier hervorgehoben seien1) : (25 ) (Ex)Z =Z (26 ) (Ex)Z + F (x) = Z + (Ex)F (x) (33 ) (Ex)Z × F (x) =Z × (Ex)F (x) (31 ) (Ex) F (x) × G(x) = (Ex)F (x) × (Ex)G(x) (28 ) (Ex)(Ey)F (x, y) = (Ey)(Ex)F (x, y) (Ex)F (x, x) → (Ex)(Ey)F (x, y) (dual entsprechend der Grundformel II 6)) 1)
Durch die Bezeichnung der Formeln soll kenntlich gemacht werden, aus welcher der schon bewiesenen logischen Formeln die betreffende Formel gemäss dem Dualitätsprinzip hervorgeht.
5
10
15
20
25
30
35
‘Prinzipien der Mathematik’
171
Regel r) : Vertauschung von Klammer-Zeichen
5
10
15
20
25
Regel r): Ein konstanter Ausdruck geht in einen ihm gleichen über, wenn darin zwei oder mehrere unmittelbar aufeinanderfolgende AllgemeinheitsZeichen, die nicht durch eine Klammer von einander getrennt sind, beliebig umgeordnet werden; dasselbe gilt in Hinsicht auf die Existenzial-Zeichen. Dies ist die schon früher bei der Behandlung von Beispielen erwähnte Vertauschungs-Regel . Beweis: Wir gehen aus von folgenden Formeln: (x)(y)F (x, y) = (y)(x)F (x, y) (x)(y)F (x) = (y)(x)F (x) (x)(y)Z = (y)(x)Z
(x)(y)F (y) = (y)(x)F (y).
Die erste von diesen ist die Formel (28), die anderen drei leiten sich in einfacher Weise aus (25) ab. Indem wir auf diese Gleichungen die EinsetzungsRegel anwenden, finden wir, dass für jeden Ausdruck α, der ausser von x und y von keiner Variablen abhängt, die Gleichung (x)(y)α = (y)(x)α besteht. Hieraus folgt aber gemäss der Regel p), dass für einen ganz beliebigen Ausdruck α die Zeichen-Verbindung (x)(y)α (als Bestandteil eines konstanten Gesamtausdrucks) ersetzt werden kann durch (y)(x)α. Somit ist die Vertauschungs-Regel für zwei Allgemeinheits-Zeichen bewiesen, und daraus ergibt sich ohne weiteres die Vertauschbarkeit auch für mehrere aufeinanderfolgende Allgemeinheits-Zeichen. Um nun auch für die Existenzial-Zeichen die Gültigkeit der Regel einzusehen, brauchen wir nur zu beachten, dass in den Ausgangs-Formeln unseres Beweises auf Grund des Dualitäts-Prinzips die Allgemeinheits-Zeichen durch Existenzial-Zeichen ersetzt werden können und dass bei den weiterhin anzu|wendenden Regeln (II und p) ) die ExistenzialZeichen ganz dieselbe Rolle spielen wie die Allgemeinheits-Zeichen. Regel s) : Distributive Anwendung von Klammer-Zeichen auf Folge-Beziehungen Als eine bei den Anwendungen des Kalküls vielfach nützliche Regel sei noch folgende erwähnt:
30
Regel s): Ist ein Ausdruck der Form (x)(y) . . . (u)(α → β) eine richtige Formel, so gilt dasselbe von (x)(y) . . . (u)α → (x)(y) . . . (u)β
35
173
und ebenso auch von jedem Ausdruck, der aus diesem entsteht, indem auf beiden Seiten der Folge-Beziehung gleichnamige Allgemeinheits-Zeichen durch die entsprechenden Existenzial-Zeichen ersetzt werden. Hiernach können wir z. B. aus der richtigen Formel (x)(y)(z) F (x) → G(y) + G(y) → H(z) → F (x) → H(z) , welche gemäss der Grundregel IV 1) aus der logischen Aussagen-Formel (X → Y ) + (Y → Z) → (X → Z)
174
172
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
erhalten wird, die Beziehung (x)(Ey)(z) F (x) → G(y) + G(y) → H(z) → (x)(Ey)(z) F (x) → H(z) entnehmen, welche sich dann noch (unter Benutzung der Formeln (33) und (25 )) in den Ausdruck (x)(Ey) F (x) → G(y) + (z) G(y) → H(z) → (x)(z) F (x) → H(z) umformen lässt. Bei dem Beweis der Regel haben wir auszugehen von den Formeln I 4) und (30), zu denen noch die Formeln (x) Z → F (x) → (x)Z → (x)F (x) (x) F (x) → Z → (x)F (x) → (x)Z (x) Z → F (x) → (Ex)Z → (Ex)F (x) (x) F (x) → Z → (Ex)F (x) → (Ex)Z 175
hinzutreten, von denen | die erste aus (23) und (25), die zweite aus (36) und (25), die vierte aus (32) und (25 ) folgt und die dritte sich aus der ersten ganz ebenso ableitet wie die Formel (30) aus der Grundformel II 4). Aus dem Bestehen dieser sechs Beziehungen kann auf Grund der EinsetzungsRegel geschlossen werden, dass für irgend zwei Ausdrücke α, β, die entweder konstant sind oder nur von x abhängen, (x)(α → β) → (x)α → (x)β und (x)(α → β) → (Ex)α → (Ex)β richtige Formeln sind. Ist daher (x)(α → β) eine richtige Formel, so gilt dasselbe von (x)α → (x)β und (Ex)α → (Ex)β. Damit ist für den Fall einer einzigen in Betracht kommenden Variablen die Regel s) bewiesen. Wie man von hier aus schrittweise weiter schliesst, soll beim Falle zweier Variablen gezeigt werden. Seien α und β zwei Ausdrücke, welche ausser von x und y von keiner Variablen abhängen, so bestehen zunächst auf Grund des eben Bewiesenen und der Regel l) die Beziehungen (x)(y)(α → β) → (x) (y)α → (y)β und (x)(y)(α → β) → (x) (Ey)α → (Ey)β . Ist also (x)(y)(α → β) eine richtige Formel, so sind es auch (x) (y)α → (y)β und (x) (Ey)α → (Ey)β . Aus diesen beiden Formeln, in welchen ja (y)α, (y)β, (Ey)α, (Ey)β entweder konstante oder nur von x abhängige Ausdrücke sind, folgen aber nach dem schon als richtig erkannten Teil der Regel s) folgende weitere Beziehungen: (x)(y)α → (x)(y)β (x)(Ey)α → (x)(Ey)β (Ex)(y)α → (Ex)(y)β (Ex)(Ey)α → (Ex)(Ey)β.
176
Dies sind also richtige Formeln, sofern (x)(y)(α → β) eine solche ist, entsprechend der Behauptung der Regel s).
5
10
15
20
25
30
35
‘Prinzipien der Mathematik’
173
Normalform für beliebige Ausdrücke; Regel t): Gleichheit je zweier richtigen Formeln
5
10
15
20
25
30
35
Wie es bei den Aussagen-Verbindungen möglich ist, alle Ausdrücke auf eine gemeinsame Form zu bringen, z. B. auf die von Summen einfacher Produkte, so lässt sich auch für diejenigen (konstanten) Ausdrücke, in denen Variable vorkommen, eine gemeinsame Normalform finden. Es kann nämlich jeder konstante Ausdruck durch einen solchen ersetzt werden, in welchem alle vorkommenden Klammerzeichen unverneint am Anfang der Formel stehen, und zwar ohne durch Klammern von einander getrennt zu sein (sodass also ihre Wirkungsbereiche sich alle bis zum Ende der Formel erstrecken).1) Der Vorteil dieser Normal-Darstellung für Beweisführungen beruht darauf, dass gemäss der Regel p) der hinter den Klammerzeichen stehende Ausdruck ganz wie eine Aussagen-Verbindung behandelt werden kann. Auf einen allgemeinen Nachweis für die behauptete Ersetzungs-Möglichkeit wollen wir uns hier der Kürze halber nicht einlassen, sondern uns damit begnügen, die Methode der Umformung an einigen Beispielen zu betrachten. Nehmen wir zuerst das Produkt (x)F (x) × (y)G(y). Um dieses umzuformen, wenden wir die Gleichung Z × (x)F (x) = (x) Z × F (x) (Formel (26) ) an. Aus dieser folgt einerseits, wenn die Vertauschbarkeit der Produkt-Glieder berücksichtigt und (y)G(y) für Z eingesetzt wird: (x)F (x) × (y)G(y) = (x) F (x) × (y)G(y) . Andererseits erhält man daraus durch Umbenennung der Variablen und Ersetzung von F (y) durch G(y) die Gleichung Z × (y)G(y) = (y) Z × G(y) , aus welcher nach der Regel l) die Beziehung (x) F (x) × (y)G(y) = (x)(y) F (x) × G(y) gefolgert werden kann. Im ganzen ergibt sich also (x)F (x) × (y)G(y) = (x)(y) F (x) × G(y) , womit die gewünschte Normalform erreicht ist. Die Anwendung des DualitätsPrinzips auf die erhaltene Gleichung liefert uns für die Summe (Ex)F (x) + (Ey)G(y) die Umformung (Ex)(Ey) F (x) + G(y) . Für den Ausdruck (x)F (x) + (y)G(y) lässt sich (mit Hilfe der Formel (33) ) ganz die entsprechende Umformung ableiten; doch wird man diese im allgemeinen nicht benutzen, weil für die betrachtete Summe eine einfachere Art der Normal-Darstellung existiert. Da nämlich (zufolge der Regel I) (x)F (x) + (y)G(y) = (x)F (x) + (x)G(x) besteht1) , so folgt auf Grund der Formel (31), dass (x)F (x) + (y)G(y) ersetzt werden kann durch (x) F (x) + G(x) . 1)
Diese Art der Darstellung ist wiederum keineswegs eindeutig. Während wir hier die Regel I angewandt haben, um gleiche Benennung der Variablen zu erhalten, müssen wir im Falle eines Produktes (x)F (x) × (x)G(x), 1)
177
174
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Bei dem Ausdruck (x)(y)F (x, y) → (x)G(x) kann man zum Zweck der Umformung zunächst im zweiten Gliede die Variable x durch z ersetzen. Führt man ferner für das Zeichen → den definierenden Ausdruck ein, so erhält man (x)(y)F (x, y) × (z)G(z), 178
wofür wiederum, nach der Negations-Regel q), (Ex)(Ey)F (x, y) × (z)G(z) gesetzt werden kann. | Nun besteht (Ex)F (x) × Z = (Ex) F (x) × Z (nach Formel (33 ) ).
5
Hieraus folgt einerseits durch zweifache Anwendung der Einsetzungs-Regel (Ex)(Ey)F (x, y) × (z)G(z) = (Ex) (Ey)F (x, y) × (z)G(z) , andererseits nach der Regel m) und der Einsetzungs-Regel (Ex) (Ey)F (x, y) × (z)G(z) = (Ex)(Ey) F (x, y) × (z)G(z) ;
10
ferner ergibt sich aus der Formel (26) in Verbindung mit der Regel p) (Ex)(Ey) F (x, y) × (z)G(z) = (Ex)(Ey)(z) F (x, y) × G(z) . Indem man die erhaltenen Gleichungen zusammennimmt und in dem GesamtErgebnis wieder die Abkürzung → einführt, findet man, dass der betrachtete Ausdruck ersetzbar ist durch (Ex)(Ey)(z) F (x, y) → G(z) . (Der Ausdruck, auf den wir hier geführt werden, hat die Eigenschaft, dass darin das Allgemeinheits-Zeichen mit den Existenzial-Zeichen beliebig vertauscht werden darf. So hätten wir z. B. bei unserer Ableitung die Reihenfolge (z)(Ex)(Ey) für die Klammerzeichen erhalten, wenn wir zuerst die Formel (26) und dann die Formel (33 ) benutzt hätten). Entsprechend wie in den behandelten einfachen Fällen gelingt auch bei komplizierteren Ausdrücken die Ueberführung in eine Normalform. Dabei stellt sich insbesondere folgende Regel als gültig heraus:
179
Regel t): Ein konstanter Ausdruck, welcher die Gestalt eines Produktes oder einer Summe hat, worin die Glieder Ausdrücke von der Normalform sind und je zwei Glieder keine gleichbenannten Variablen enthalten, geht in einen ihm gleichen über, | wenn man sämtliche Klammerzeichen in der Reihenfolge, wie sie auftreten, an den Anfang der Formel stellt und im übrigen alles ungeändert lässt. Um für eine richtige Formel eine Normalform zu erhalten, hat man keine Rechnung nötig. Es besteht nämlich der Satz, dass alle richtigen Formeln einander gleich sind, und man kann daher jede von ihnen durch eine beliebige unter ihnen (z. B. durch den Ausdruck X × X) ersetzen. Der Beweis für diese Behauptung ergibt sich einfach so: Es seien α und β richtige Formeln. Setzen wir in der Grundformel I 2) anstelle von X und Y zuerst α, β und dann β, α ein, so erweisen sich α → αβ und β → βα das wir auf eine Normalform bringen wollen, durch Anwendung jener Regel eine verschiedene Benennung der Variablen in den beiden Produkt-Gliedern bewirken, um dann auf die vorhin angegebene Art die Umformung zu gewinnen.
15
20
25
30
35
‘Prinzipien der Mathematik’
5
10
15
175
als richtige Formeln. Gemäss der Regel V und dem kommutativen Gesetz für Produkte sind also βα und αβ, d. h. β → α und α → β richtige Formeln. Somit ist nach der Regel h) auch α = β eine richtige Formel. Diese Ausführungen mögen zur Charakterisierung des Systems der logischen Formeln genügen. Wir wollen nun noch die Methode der formalen Ausführung logischer Schlüsse im Funktionen-Kalkül (die wir vor der Aufstellung der Axiome nur andeutungsweise beschreiben konnten) an ein paar Beispielen darlegen. Das allgemeine hierbei anzuwendende Verfahren besteht darin, dass die Prämissen der Schlüsse symbolisch aufgeschrieben und als richtige Formeln zu den logischen Grundformeln hinzugefügt werden, mit denen zusammen sie die Ausgangs-Formeln für die gemäss den Grundregeln zu vollziehenden formalen Operationen bilden. | Ehe man an die symbolische Formulierung der Voraussetzungen geht, müssen zuerst die individuellen Zeichen eingeführt werden, und bei den bestimmten Funktionen sind die Gegenstands-Gattungen anzugeben, auf welche sich ihre Leerstellen beziehen. Ein Beweis ist geliefert, wenn die symbolische Darstellung der zu beweisenden Behauptung sich als richtige Formel ergibt.
180
4) Beispiele für die Anwendung des Funktionen-Kalküls zu formalen Beweisführungen 20
25
30
35
40
Schlüsse mit einer singulären Prämisse („Cajus“, „gerade Primzahl“) Als erste Beispiele mögen zwei Schlüsse dienen, in welchen singuläre Urteile als Prämissen auftreten. Dies macht sich im Kalkül dadurch geltend, dass die Grundregel III zur Anwendung kommt. Ein Schluss von dieser Art liegt vor bei dem bekannten logischen Schulbeispiel: „Alle Menschen sind sterblich, Cajus ist ein Mensch, also ist Cajus sterblich.“ In diesem Satz kommen drei individuelle Bezeichnungen vor. Den Worten „Mensch“ und „sterblich“ entsprechen zwei Prädikate M (x) und S(x), für welche als gemeinsame zugehörige Gegenstands-Gattung die der Lebewesen (oder auch allgemeiner die aller wirklichen Dinge) betrachtet werden kann. Das dritte individuelle Zeichen ist der Eigenname „Cajus“. Die beiden Prämissen lauten als Formeln geschrieben: (x) M (x) → S(x) und M (Cajus). Der Schlusssatz lautet: S(Cajus). Um diesen zu beweisen, wenden wir auf die erste Prämisse die Regel III an. Diese Anwendung ist möglich, da der mit „Cajus“ bezeichnete Gegenstand ein Lebewesen ist. Somit erhalten wir M (Cajus) → S(Cajus); und da gemäss der zwei|ten Prämisse M (Cajus) eine richtige Formel ist, so ergibt sich nach der Regel V, dass auch S(Cajus) eine richtige Formel ist. Wir wollen nun einen Schluss betrachten, den wir bereits im PrädikatenKalkül formal ausführen konnten, wobei wir jedoch die singulären Prämissen künstlich zu partikulären Urteilen umformen mussten.
181
176
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
„2 ist gerade, 2 ist eine Primzahl, also gibt es mindestens eine gerade Primzahl.“ Hier kommen als bestimmte Funktionen die Prädikate „x ist gerade“ und „x ist eine Primzahl“ vor, welche sich beide auf die Gegenstands-Gattung der ganzen Zahlen beziehen und für die wir die Zeichen Ger (x) und Pr (x) wählen wollen. Als Eigenname tritt die Ziffer 2 auf, welche einen zur Gattung der ganzen Zahlen gehörigen Gegenstand bezeichnet. Die Prämissen lauten: Ger (2) und Pr (2); der Schlusssatz: (Ex) Pr (x) + Ger (x) . Der Beweis wird folgendermassen geführt: In der richtigen Formel (x) F (x) → (Ey)F (y) (Formel (34)) vertauschen wir die Benennungen der Variablen und setzen anstelle von F (x) die Summe Pr (x) + Ger (x) ein. Dann folgt (y) Pr (y) + Ger (y) → (Ex) Pr (x) + Ger (x) . Indem wir hierin gemäss der Grundregel III für y den Eigennamen 2 einsetzen, erhalten wir Pr (2) + Ger (2) → (Ex) Pr (x) + Ger (x) . Da Pr (2) und Ger (2) auf Grund der Prämissen richtige Formeln sind, so ist nach der Regel g) auch Pr (2) + Ger (2) eine solche. Und daraus folgt, dass (Ex) Pr (x) + Ger (x) eine richtige Formel ist. 182
5
10
15
Geometrisches Beispiel Es sollen jetzt noch zwei kompliziertere Beispiele von mathematischen Schlussfolgerungen behandelt werden, und zwar zunächst folgender geometrische Schluss: Voraussetzung: „Durch zwei verschiedene Punkte geht nicht mehr als eine Gerade.“ Behauptung: „Zwei verschiedene Geraden haben nicht mehr als einen Punkt gemeinsam.“ Die hierin auftretenden Funktionen sind die Relation L(x, y): „x liegt auf y“ oder: „y geht durch x“, von der die erste Leerstelle sich auf die Gattung der Punkte, die zweite auf die der Geraden bezieht; ferner die Relation der Verschiedenheit, also das Gegenteil von der Beziehung der Identität ≡(x, y), in welcher x und y beide sowohl Punkte wie Geraden bedeuten können (wobei natürlich die Behauptung der Identität eines Punktes mit einer Geraden stets als falsch zu betrachten ist). Der Deutlichkeit halber wollen wir die Argumente, welche sich auf die Gattung der Punkte beziehen, mit grossen, diejenigen, welche sich auf Geraden beziehen, mit kleinen lateinischen Buchstaben bezeichnen. Eigennamen von Gegenständen kommen in dem Schluss nicht vor. Der symbolische Ausdruck für die Voraussetzung ist (P )(Q) ≡ (P, Q) → (Eg)(Eh) ≡ (g, h) + L(P, g) + L(Q, g) + L(P, h) + L(Q, h) .
20
Die Formel für die Behauptung ist (g)(h) ≡ (g, h) → (EP )(EQ) ≡ (P, Q) + L(P, g) + L(Q, g) + L(P, h) + L(Q, h) .
40
25
30
35
‘Prinzipien der Mathematik’
177
Schreiben wir als Abkürzung für die Summe L(P, g) + L(Q, g) + L(P, h) + L(Q, h)
5
das Zeichen K(P, Q, g, h) und machen von der Definition des Zeichens → Gebrauch, so erhalten wir als Darstellung für die | Voraussetzung: (P )(Q) ≡(P, Q) × (Eg)(Eh) ≡ (g, h) + K(P, Q, g, h) ,
183
und für die Behauptung: (g)(h) ≡(g, h) × (EP )(EQ) ≡ (P, Q) + K(P, Q, g, h) .
10
Um die Existenzial-Zeichen (Eg) (in der ersten Formel) und (EP ) (in der zweiten Formel) von der Negation zu befreien, wenden wir die NegationsRegel q) an. Dadurch geht die Voraussetzung in die Form (P )(Q) ≡(P, Q) × (g)(h) ≡(g, h) × K(P, Q, g, h) , die Behauptung in die Form (g)(h) ≡(g, h) × (P )(Q) ≡(P, Q) × K(P, Q, g, h)
15
20
über. Nun bringen wir die beiden Ausdrücke auf eine Normalform, indem wir von den Regeln p) und t) Gebrauch machen. Gemäss diesen Regeln dürfen in beiden Formeln die im zweiten Produkt-Gliede stehenden Klammer-Zeichen vor das Produkt, also unmittelbar hinter die beiden am Anfang der Formel stehenden Klammer-Zeichen gesetzt werden. Hiernach ergibt sich als Ausdruck für die Voraussetzung die Normalform: (P )(Q)(g)(h) ≡(P, Q) × ≡(g, h) × K(P, Q, g, h) , und für die Behauptung die Normalform: (g)(h)(P )(Q) ≡(g, h) × ≡(P, Q) × K(P, Q, g, h) .
25
30
35
Aus diesen Darstellungen ersieht man nun ohne weiteres, dass die Behauptung sich aus der Voraussetzung ableiten lässt; denn die Formel für die Voraussetzung geht in die Formel der Behauptung über, wenn man auf die Produkte das assoziative und das kommutative Gesetz und auf die Allgemeinheits-Zeichen die Vertauschungs-Re|gel r) anwendet. Zugleich erkennen wir, dass auch umgekehrt von der Gültigkeit der Behauptung auf die der Voraussetzung geschlossen werden kann. Beweis der Transitivität der Beziehung des Kleineren zum Grösseren (für positive Grössen) Das zweite Beispiel für einen komplizierteren mathematischen Schluss soll darin bestehen, dass wir den Satz von der Transitivität der Beziehung des Kleineren zum Grösseren beweisen. Diesen Satz, dessen Darstellung durch die Formel (x)(y)(z) <(x, y) + <(y, z) → <(x, z) uns bereits bekannt ist, wollen wir hier im Sinne der Grössenlehre auffassen; d. h. wir denken uns die Leerstellen der Funktion <(x, y) auf eine bestimmte
184
178
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Grössenart (z. B. Strecken-Längen oder positive Masszahlen) bezogen und betrachten ferner die Relation <(x, y) als abgeleitet aus der Addition der Grössen, indem wir, unter Anwendung des Zeichens R(x, y, z) für die dreigliedrige Beziehung „x vermehrt um y ergibt z“ (oder arithmetisch geschrieben: „x + y = z“), das Symbol <(x, y) als Abkürzung definieren für den Ausdruck (Eu)R(x, u, y) („es gibt ein u, welches zu x hinzugefügt y ergibt“). Setzen wir diese Definition in unsere Behauptung ein, so nimmt diese folgende Gestalt an: (x)(y)(z) (Eu)R(x, u, y) + (Eu)R(y, u, z) → (Eu)R(x, u, z) . In dieser Form lässt sich der betrachtete Satz beweisen, sofern über die Addition der Grössen folgende zwei Voraussetzungen zu Grunde gelegt werden: 1. „Zwei Grössen lassen sich stets addieren“, d. h.
5
10
(x)(y)(Ez)R(x, y, z) („Zu jedem x und jedem y gibt es ein z, sodass x + y = z“). 185
2. „Für die Grössen-Addition gilt das assoziative Gesetz x + (y + z) = (x + y) + z“, d. h. 1) (x)(y)(z)(u)(v)(w) R(x, y, u) + R(y, z, v) + R(u, z, w) → R(x, v, w)
15
(„für alle x, y, z, u, v, w, zwischen denen die Beziehungen x + y = u, y + z = v, u + z = w bestehen, gilt auch x + v = w“). An den symbolischen Formulierungen dieser Voraussetzungen bemerken wir, dass sie die Normalform besitzen. Für den Zweck unseres Beweises wollen wir auch die Darstellung der Behauptung in eine Normalform bringen. Hierzu setzen wir in dem vorliegenden Ausdruck der Behauptung zunächst die Definition des Zeichens → ein. Dadurch erhalten wir, unter Benutzung der Negations-Regel und der Regel2) p): (x)(y)(z) (u)R(x, u, y) × (u)R(y, u, z) × (Eu)R(x, u, z) . Ersetzen wir bei dem zweiten Produkt-Gliede die Variable u durch v, beim dritten u durch w, so wird die Regel t) anwendbar, und wir erhalten als Umformung unserer Formel: (x)(y)(z)(u)(v)(Ew) R(x, u, y) × R(y, v, z) × R(x, w, z) ,
20
25
30
wofür wiederum mit Anwendung der Abkürzungen (x)(y)(z)(u)(v)(Ew) R(x, u, y) + R(y, v, z) → R(x, w, z) 186
geschrieben werden kann. Diese Formel lässt sich nun auf Grund unserer Voraussetzungen folgendermassen ableiten: In dem Ausdruck der ersten Voraussetzung ersetzen wir die 1)
Eine Verwechslung zwischen dem logischen und dem arithmetischen Pluszeichen ist hier wohl nicht zu befürchten, zumal da wir in den Formeln der logischen Symbolik nirgends das arithmetische Pluszeichen verwenden. 2) Gemäss der Regel p) dürfen wir den auf die Klammer-Zeichen (x)(y)(z) folgenden Ausdruck so behandeln, als ob er nicht von x, y, z abhinge. — Auch bei den späteren Umformungen müssen wir von der Regel p) Gebrauch machen, ohne dass es jedesmal ausdrücklich erwähnt werden soll.
35
‘Prinzipien der Mathematik’
5
179
Variablen x, y, z bezüglich durch u, v, w, sodass sich (u)(v)(Ew)R(u, v, w) ergibt. In der Formel für die zweite Voraussetzung ersetzen wir die Variablen y, z, u, v, w bezüglich durch u, v, y, w, z; dann erhalten wir (da ja die Reihenfolge der zu Anfang stehenden Allgemeinheits-Zeichen beliebig ist) (x)(y)(z)(u)(v)(w) R(x, u, y) + R(u, v, w) + R(y, v, z) → R(x, w, z) . Vertauscht man in diesem Ausdruck die beiden ersten Summen-Glieder R(x, u, y) und R(u, v, w) und wendet dann die Formel (17) in Verbindung mit der Regel p) an, so findet man, dass der Ausdruck ersetzbar ist durch (x)(y)(z)(u)(v)(w) R(u, v, w) → R(x, u, y) + R(y, v, z) → R(x, w, z) .
10
Schreiben wir jetzt für R(u, v, w) kurz α und für R(x, u, y) + R(y, v, z) → R(x, w, z) als Abkürzung β. Dann lautet die zweite Voraussetzung: (x)(y)(z)(u)(v)(w)(α → β). Aus dieser Formel folgt gemäss der Regel s) die Beziehung (x)(y)(z)(u)(v)(Ew)α → (x)(y)(z)(u)(v)(Ew)β.
15
Ferner ist (x)(y)(z)(u)(v)(Ew)α, d. h. (x)(y)(z)(u)(v)(Ew)R(u, v, w) zufolge der Formel (25) gleich dem Ausdruck (u)(v)(Ew)R(u, v, w), welcher unsere erste Voraussetzung darstellt. Somit erhalten wir die Formel (x)(y)(z)(u)(v)(Ew)β,
20
welche beim Einsetzen des Ausdrucks für β in die obige Normaldarstellung unserer Behauptung übergeht. Abschliessende Bemerkung
25
Nach der durch die letzten Beispiele gekennzeichneten Methode kann man den Funktionen-Kalkül insbesondere zur axiomatischen Behandlung von Theorien verwenden. Für diesen Zweck ist der Kalkül vor allem aus zwei Gründen sehr geeignet, einmal weil bei seiner Anwendung verhütet wird, dass man unbemerkt Voraussetzungen benutzt, die nicht als Axiome eingeführt sind, und weil ferner durch die Symbolik des Kalküls die logischen AbhängigkeitsVerhältnisse, auf die es ja bei der axiomatischen Untersuchung ankommt, in besonders prägnanter Weise zur Darstellung gelangen.
187
180 188
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
5. Der erweiterte Funktionen-Kalkül. 1) Die Methode der unbeschränkten Erweiterung des Funktionen-Kalküls (Gleichstellung der unbestimmten Aussage- und Funktions-Zeichen mit den Variablen.) a) Verschiedene Gründe, welche uns zu diesem Verfahren bestimmen.
5
Darstellung logischer Formeln als allgemeine Behauptungen; Prinzip der vollständigen Induktion; Ausdruck dafür, dass eine Formel nicht allgemein richtig ist; Satz von der Existenz des Gegenteils
189
Mit dem Bisherigen könnten die grundsätzlichen Erörterungen über den Logik-Kalkül ihren Abschluss finden, wenn wir mit diesem Kalkül nichts anderes bezweckten als die Formalisierung des logischen Schliessens. Mit dieser Anwendung der symbolischen Logik begnügen wir uns aber nicht. Wir wollen nicht nur imstande sein, einzelne Theorien für sich von ihren Prinzipien aus rein formal zu entwickeln, sondern wollen die Grundlagen der mathematischen Theorien selbst auch zum Gegenstand der Untersuchung machen und sie darauf hin prüfen, in welcher Beziehung sie zu der Logik stehen und inwieweit sie aus rein logischen Operationen und Begriffsbildungen gewonnen werden können; und hierzu soll uns der logische Kalkül als Hilfsmittel dienen. Wenn wir nun in diesem Sinne von dem logischen Kalkül Gebrauch machen, so werden wir dazu gedrängt, die Regeln des formalen Operierens in einer gewissen Richtung zu erweitern. Während wir nämlich bisher die Aussagen und Funktionen von den Gegenständen völlig trennten und demgemäss auch die unbestimmten Aussage- und Funktionszeichen von den Variablen, welche Argumente bilden, streng gesondert hielten, werden wir nunmehr zulassen, dass Aussagen und Funktionen in gleicher Weise wie eigentliche Gegenstände als Werte von logischen Variablen genommen werden und dass unbestimmte Aussagezeichen und Funktionszeichen als Argumente von symbolischen Ausdrücken auftreten. Wie man dies zu verstehen hat und wozu diese Erweiterung erforderlich ist, soll an einigen Beispielen dargelegt werden. Betrachten wir zunächst eine beliebige logische Formel, etwa XX → X. Vom Standpunkt unserer inhaltlichen Deutung besagt diese Formel, dass für jede Aussage X die Folge-Beziehung XX → X besteht. Will man diese Behauptung als einen allgemeinen Satz symbolisch ausdrücken, so wird man unter Anwendung des Allgemeinheits-Zeichens die Darstellung (X)(XX → X) wählen, wobei die zu dem Allgemeinheits-Zeichen gehörige Variable X sich auf die Aussagen als Gegenstands-Gattung bezieht. Entsprechend wird man den Satz, dass für alle Aussagen Z und alle Prädikate F (x) die Beziehung (x) Z → F (x) = Z → (x)F (x) besteht, durch die Formel (Z)(F ) (x) Z → F (x) = Z → (x)F (x)
10
15
20
25
30
35
40
‘Prinzipien der Mathematik’
5
10
15
20
25
181
zum Ausdruck bringen, worin die unbestimmten Zeichen Z und F die Rolle von Variablen spielen, von denen die erste sich auf die Gattung der Aussagen, die zweite auf die Gattung der Prädikate bezieht. Ein Fall von gleicher Art liegt vor bei dem Prinzip der vollständigen Induktion, dessen Inhalt sich folgendermassen aussprechen lässt: „Wenn ein Prädikat von der Zahl 1 gilt und wenn es, falls es von irgend einer Zahl gilt, auch von der nächstfolgenden Zahl gilt, so gilt das Prädikat von jeder Zahl.“ Dieses Prinzip können wir für den Kalkül in der Weise zur Geltung bringen, dass wir, unter Anwendung des Funktionszeichens Seq(x, y) für die Beziehung einer Zahl zu der nächstfolgenden („der Zahl x folgt die Zahl y nach“), den Ausdruck P (1) + (x)(y) P (x) + Seq(x, y) → P (y) → (x)P (x)
190
als eine richtige Formel postulieren. Will man nun noch durch die Schreibweise explizite zum Ausdruck bringen, dass die Schlussfolgerung für alle Prädikate P zutrifft, so wird man vor die eben genannte Formel das AllgemeinheitsZeichen (P ) setzen, bei welchem P als Variable auf die Gattung der Prädikate bezogen ist. Man wird also darauf geführt, die Symbole für Aussagen und Funktionen so zu behandeln wie die Variablen x, y, . . . d. h. so, als ob die Aussagen und Funktionen selbst Gegenstände wären. Freilich ist bei den vorläufig angeführten Beispielen dieses Vorgehen wenngleich sehr naheliegend, so doch nicht unerlässlich. Es gibt jedoch Fälle, in denen das Verfahren notwendig ist, wenn man nicht auf wichtige Ausdrucksmöglichkeiten verzichten will. Ein solcher Fall tritt z.B. ein, wenn von einem bestimmten Ausdruck ausgesagt werden soll, dass er keine richtige Formel ist. Eine derartige Aussage lässt sich mit der bisherigen Symbolik des Funktionen-Kalküls nicht wiedergeben; sie wird aber symbolisch darstellbar, wenn wir die angegebene Erweiterung des Kalküls vornehmen. Denn um etwa auszudrücken, dass (x)(y)F (x, y) keine richtige Formel ist, können wir dann die Formel (F )(x)(y)F (x, y),
30
oder auch die mit dieser gleichbedeutende Formel (EF )(Ex)(Ey)F (x, y)
35
anwenden, worin die Klammer-Zeichen (F ) und (EF ) sich auf Funktionen zweier Argumente beziehen. Ebenso verhält es sich bei vielen Sätzen der Logik, | welche allgemein von Aussagen, Prädikaten oder Relationen handeln, z. B. bei dem Satz, dass es zu jeder Aussage X eine Aussage Y derart gibt, dass von den beiden Aussagen mindestens eine und nur eine richtig ist (d. h. also dem Satz von der Existenz des Gegenteils einer Aussage). Hierfür ergibt sich bei der erweiterten Symbolik die Darstellung (X)(EY )(XY + X + Y ),
40
während in der bisherigen Symbolik der Satz sich nicht wiedergeben lässt.
191
182
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Definition der Identität; Eigenschaften von Relationen (Symmetrie, Transitivität); Aequivalenz-Beziehung zwischen Prädikaten; Definition der Zahlen als Eigenschaften von Prädikaten Einen weiteren charakteristischen Fall bildet die Definition der Identität. Die Beziehung der Identität lässt sich definitorisch auf die logischen Grundbeziehungen zurückführen, indem man x als identisch mit y erklärt, sofern jedes Prädikat, das für x zutrifft, auch für y zutrifft und umgekehrt. Im Sinne dieser Erklärung können wir das Funktions-Zeichen der Identität ≡(x, y) als eine Abkürzung auffassen für den Ausdruck (F ) F (x) = F (y) .
192
Dieser Ausdruck enthält nun eine Allgemeinheit in Bezug auf Prädikate, und wir können daher die angegebene Methode der Definition nur in dem erweiterten Kalkül anwenden. Bei den bis jetzt betrachteten Beispielen kommt die Behandlung der Aussagen und Funktionen als Gegenstände allein durch das Auftreten von KlammerZeichen zur Geltung, die sich auf Aussagen oder Funktionen beziehen. Eine noch weitergehende Wirkung jenes Verfahrens besteht darin, dass AussageZeichen oder Funktions-Zeichen als Argumente unter Funktions-Zeichen auftreten, dass also Funktionen von Aussagen und Funktionen von Funk|tionen gebildet werden können. Beispiele für Funktionen von Funktionen liefern die Eigenschaften der Symmetrie und der Transitivität von zweigliedrigen Relationen; diesen entsprechen zwei Funktionen Sym(R) und Tr (R), deren Argument R ein Funktions-Zeichen mit zwei Leerstellen ist und welche symbolisch folgendermassen ausgedrückt werden: Sym(R): (x)(y) R(x, y) → R(y, x) Tr (R): (x)(y)(z) R(x, y) + R(y, z) → R(x, z) . Beide Eigenschaften sind bei der Relation ≡(x, y) erfüllt, bei der Relation <(x, nur die der Transitivität; es stellen also die Formeln y) hingegen Sym ≡(· , ·), Tr ≡(· , ·) , Tr <(· , ·) richtige Behauptungen dar, während Sym <(· , ·) eine falsche Behauptung darstellt. Eine Relation zwischen zwei Prädikaten ist die Beziehung der „Aequivalenz“ Aeq(F, G), welche durch den Ausdruck (x) F (x) = G(x) definiert wird und welche also darin besteht, dass die Prädikate F und G für dieselben Argumentwerte zutreffen bezw. nicht zutreffen. Die Notwendigkeit, Funktionen von Funktionen einzuführen, stellt sich insbesondere bei der Erörterung des Anzahlbegriffs heraus. Eine Anzahl ist kein Gegenstand im eigentlichen Sinne, sondern eine Eigenschaft (ein Prädikat). Welches sind aber die Gegenstände, denen eine Anzahl als Eigenschaft zukommt? Den gezählten Dingen kann die Anzahl nicht als Eigenschaft zugeschrieben werden, da jedes von den Dingen nur eines ist, sodass eine von Eins verschiedene Anzahl danach gar nicht vorkommen könnte. Dagegen lässt sich
5
10
15
20
25
30
35
40
‘Prinzipien der Mathematik’
5
10
15
20
25
183
die Zahl als eine Eigenschaft desje|nigen Begriffes auffassen, unter welchem die gezählten Gegenstände vereinigt werden. So kann z. B. die Tatsache, dass die Anzahl der Erdteile Fünf ist, nicht so ausgedrückt werden, dass jedem Erdteil die Anzahl Fünf zukommt; wohl aber ist es eine Eigenschaft des Prädikates „Erdteil-sein“, dass er auf genau fünf Gegenstände zutrifft. Die Zahlen erscheinen hiernach als Eigenschaften von Prädikaten, und für unseren Kalkül stellt sich also eine Zahl als eine bestimmte Funktion eines veränderlichen Prädikates dar. Die Wichtigkeit dieser Darstellung der Zahlen beruht darauf, dass die Prädikaten-Funktionen, welche die Zahlen bilden, sich vollständig mit Hilfe der logischen Symbole ausdrücken lassen, wodurch es möglich wird, die Zahlenlehre in die Logik einzubeziehen. Für die Zahlen 0, 1, 2, d. h. für die Funktionen 0(P ), 1(P ), 2(P ) sollen hier die Ausdrücke angegeben werden: 0(P ): (x)P (x) („P (x) trifft für kein x zu“) 1(P ): (Ex) P (x) + (y) P (y) → ≡(x, y) („es gibt ein x, für das P (x) besteht und das mit jedem y, für welches P (y) besteht, identisch ist“) 2(P ): (Ex)(Ey) ≡ (x, y) + P (x) + P (y) + (z) P (z) → ≡(x, z) × ≡(y, z) (“es gibt ein x und ein y derart, dass x von y verschieden ist, P (x) und P (y) besteht und dass jedes z, für welches P (z) besteht, mit x oder mit y identisch ist“). Die Auffassung der Zahlen als Eigenschaften von Prädikaten ist vom logischen Standpunkt aus die nächstliegende. Dem Mathematiker ist es geläufiger, die Zahlen als Eigenschaften von Mengen zu betrachten. Dass diese beiden Betrachtungsweisen sach|lich auf dasselbe hinauskommen, wird ersichtlich, wenn wir die Beziehung der Mengen zu den Prädikaten erwägen. b) Behandlung der Mengenlehre mit Hilfe des erweiterten Kalküls. Beziehung zwischen Mengen und Prädikaten; Bedingung für Prädikate, die als Eigenschaften von Mengen aufgefasst werden können
30
35
40
Eine Menge wird entweder durch Aufzählung ihrer Elemente gegeben, oder sie wird erklärt als das System derjenigen Gegenstände, für die ein bestimmtes Prädikat gültig ist. Die erste Art der Bestimmung einer Menge, welche nur bei endlichen Mengen möglich ist, brauchen wir nicht eigens in Betracht zu ziehen, da jede Menge, die man durch Aufzählung erhält, sich auch mit Hilfe eines Prädikates definieren lässt. Z. B. kann eine Menge, die aus drei Gegenständen a, b, c besteht, erklärt werden als die Menge derjenigen Dinge, für welche das Prädikat ≡(x, a) × ≡(x, b) × ≡(x, c) zutrifft. Wir denken uns also jede Menge durch ein Prädikat definiert. Dabei müssen wir beachten, dass zwar jedes Prädikat die zu ihm gehörige Menge, d. h. die Menge der Gegenstände, welchen es zukommt, in eindeutiger Weise bestimmt, dass aber zu einer Menge nicht nur ein definierendes Prädikat gehört, sondern dass vielmehr eine Menge auf verschiedene Arten durch Prä-
193
194
184
195
196
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
dikate definiert werden kann. So ist die Menge der gleichseitigen Dreiecke dieselbe wie die Menge der gleichwinkligen Dreiecke, oder als aussermathematisches Beispiel: die Menge der lebenden Wiederkäuer stimmt überein mit der Menge der lebenden Zweihufer. Die notwendige und hinreichende Bedingung dafür, dass zwei Prädikate ein und dieselbe Menge bestimmen, besteht darin, dass die Prädikate äquivalent sind (in dem vorhin erklärten Sinne). Bezeichnen wir allgemein mit m(P ) die zu einem Prädikate P gehörige Menge, so ist also m(P ) mit m(Q) dann und | nur dann identisch, wenn P mit Q äquivalent ist. Für die Möglichkeit, eine Prädikaten-Funktion F (P ) als Eigenschaft von Mengen zu deuten, kommt es nun darauf an, dass das Zutreffen oder NichtZutreffen von F für ein Prädikat P eindeutig durch die Menge m(P ) bestimmt ist, und nach dem eben Bemerkten besteht die hierfür entscheidende Bedingung darin, dass die Aussagen, welche äquivalenten Prädikaten durch die Funktion F zugeordnet werden, gleichzeitig wahr oder gleichzeitig falsch sind, dass also für die Funktion F die symbolische Beziehung M) (P )(Q) Aeq(P, Q) → F (P ) = F (Q) gültig ist. Diese Bedingung ist nun für die Zahlen als Prädikaten-Funktionen jedenfalls erfüllt; denn trifft ein Prädikat P für genau n Gegenstände1) zu und ist Q äquivalent mit P , d. h. für gerade dieselben Gegenstände zutreffend, für welche P wahr ist, so trifft auch Q genau für n Gegenstände zu. Auf dieser Eigenschaft der Zahlen beruht es, dass sie als Prädikate von Mengen betrachtet werden können, und diese Darstellung der Zahlen als Funktionen von Mengen hat gegenüber ihrer Darstellung als Funktionen von Prädikaten den Vorzug, dass sie die Invarianz der Anzahl bei der Ersetzung eines Prädikates durch ein äquivalentes unmittelbar zu erkennen gibt. Aus der angestellten Ueberlegung geht hervor, dass die Beziehung der Logik zur Zahlentheorie einen Sonderfall einer allgemeineren Beziehung zwischen Logik und Mengenlehre bildet. | Dieses Verhältnis der Mengenlehre zur Logik wollen wir noch etwas näher ins Auge fassen, nicht nur in Anbetracht der Wichtigkeit, welche die Mengenlehre für die Grundlegung der Mathematik besitzt, sondern auch, weil hierbei die Bedeutsamkeit der in Rede stehenden Erweiterung des Funktionen-Kalküls besonders stark zur Geltung kommt. Zusammenhang zwischen Mengen von Mengen und Prädikaten-Funktionen; Erläuterung an Beispielen (Menge aller Teilmengen einer gegebenen Menge) Wir kennen bereits die Beziehung der Mengen zu den Prädikaten. Aus dieser ergibt sich ein Zusammenhang zwischen den Mengen von Mengen und den Prädikaten von Prädikaten, und zwar auf folgende Weise: jede Menge von Mengen M ist definiert durch eine Eigenschaft, welche den ihr angehörigen Mengen zukommt. Diese Eigenschaft der in M als Elemente enthaltenen Men1)
n bedeute irgend eine Zahl.
5
10
15
20
25
30
35
40
‘Prinzipien der Mathematik’
5
10
15
20
25
30
35
40
185
gen bildet indirekt eine Eigenschaft der Prädikate, welche jene Mengen definieren, sie bestimmt also eine Prädikaten-Funktion (ein Prädikaten-Prädikat) F (P ), welche genau für diejenigen Prädikate P zutrifft, für welche die zugehörige Menge m(P ) ein Element der Menge M ist. Eine Funktion von dieser Art möge als eine „der Menge M entsprechende“ Prädikaten-Funktion bezeichnet werden. Ist F (P ) irgend eine der Menge M entsprechende PrädikatenFunktion, so wird die Gesamtheit der Prädikaten-Funktionen, welche M entsprechen, von den mit F (P ) äquivalenten Funktionen gebildet. Eine jede solche Funktion hat die Beschaffenheit, dass sie für äquivalente Prädikate (als Argumentwerte) gleichzeitig wahr oder gleichzeitig falsch ist, d. h. sie genügt der vorhin angegebenen Bedingung M). Sind nämlich P und Q äquivalente Prädikate, so ist m(P ) mit m(Q) identisch; wenn daher F (P ) wahr ist, also m(P ) zu M gehört, so gehört m(Q) zu M; | d. h. F (Q) ist wahr, und ebenso folgt aus der Wahrheit von F (Q) die von F (P ). Es entspricht also jeder Menge von Mengen mindestens eine Prädikaten-Funktion, und jede einer Menge von Mengen entsprechende PrädikatenFunktion erfüllt die Bedingung M). Andererseits wird durch jede der Bedingung M) genügende Prädikaten-Funktion eindeutig eine Menge von Mengen bestimmt, welcher sie entspricht. Denn wenn F (P ) der Bedingung M) genügt, so ist für alle Prädikate P , welche ein und dieselbe Menge definieren, F (P ) zugleich wahr oder zugleich falsch. Bedeutet daher M die Menge derjenigen Mengen, die sich durch ein Prädikat definieren lassen, welchem die Eigenschaft F zukommt, so trifft F (P ) bei allen den und nur den Prädikaten P zu, für welche die Menge m(P ) der Menge M angehört; d. h. die Funktion F entspricht der Menge M. Wir wollen uns diese Verhältnisse durch Betrachtung von Beispielen näher bringen. Zu einer Menge von Mengen gelangt man in besonders einfacher Weise, indem man von einer gegebenen Menge N die Menge ihrer Teilmengen bildet. Es handelt sich nun darum, zu dieser Menge der Teilmengen von N eine entsprechende Funktion zu finden. D sei ein definierendes Prädikat für die gegebene Menge N. Fragen wir uns, durch welche Eigenschaft ein Prädikat P gekennzeichnet wird, das eine Teilmenge von N definiert. Diese Eigenschaft besteht darin, dass jeder Gegenstand, dem das Prädikat P zukommt, ein Element der Menge N ist, dass also für jeden Gegenstand x, bei welchem P (x) zutrifft, auch D(x) zu|trifft. Diese Bedingung stellt sich dar durch den symbolischen Ausdruck (x) P (x) → D(x) , welcher nur von P abhängig ist, der also eine Prädikaten-Funktion Te(P ) bildet. Diese Funktion Te(P ) drückt also eine Eigenschaft aus, welche gerade denjenigen Prädikaten P zukommt, für welche m(P ) eine Teilmenge von N ist, mithin der Menge aller Teilmengen von N angehört. Demnach entspricht die Funktion Te(P ) = (x) P (x) → D(x) der Menge aller Teilmengen der durch das Prädikat D definierten Menge N.
197
198
186
199
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Es sollen nun für einige Prädikaten-Prädikate die entsprechenden Mengen von Mengen bestimmt werden. Der Funktion (Ex)P (x) (für welche P das Argument ist) entspricht die Menge derjenigen Mengen, welche sich durch ein Prädikat definieren lassen, das mindestens einem Gegenstande x zukommt, d. h. die Menge derjenigen Mengen, welche mindestens ein Element enthalten. Bedeutet n eine Zahl, so entspricht dem Prädikate n(P ) die Menge der Mengen, für welche ein sie definierendes Prädikat auf genau n Dinge zutrifft; es entspricht also der Zahl n, aufgefasst als Prädikaten-Funktion, die Menge derjenigen Mengen, welche genau n Elemente enthalten. Für jedes Prädikat P stellt der Ausdruck (x) P (x) × P (x) eine richtige Aussage dar. Es entspricht daher der durch diesen | Ausdruck definierten Funktion von P die Menge aller Mengen. Der durch (Ex) P (x) + P (x) dargestellten Prädikaten-Funktion, welche das Gegenteil der eben betrachteten Prädikaten-Funktion bildet, entspricht die leere Menge (welche keine Menge als Element enthält).
5
10
15
20
Vereinigungs-Menge und Durchschnitt einer Menge von Mengen
200
Auf Grund der gefundenen Korrespondenz zwischen den Mengen von Mengen und den ihnen entsprechenden Prädikaten-Funktionen sind wir jetzt imstande, die Begriffsbildungen der Mengenlehre in die Sprache des FunktionenKalküls zu übersetzen. In welcher Weise dies geschieht, soll an dem Beispiel der „Vereinigungsmenge“ und des „Durchschnitts“ einer Menge von Mengen gezeigt werden. Bedeutet M eine Menge von Mengen, so versteht man unter der Vereinigungsmenge von M das System aller der Gegenstände, welche in irgend einer der Menge M angehörigen Menge als Element vorkommen; und als Durchschnitt von M bezeichnet man das System der Gegenstände, welche gemeinsam in allen Mengen, die Elemente von M sind, vorkommen. Um diese Mengen-Bildungen mit Hilfe unserer Symbolik auszudrücken, führen wir eine der Menge M entsprechende Prädikaten-Funktion F (P ) ein. Aus der zwischen M und der Funktion F (P ) bestehenden Beziehung ergibt sich, dass einerseits für eine Menge, welche Element von M ist, jedes definierende Prädikat P der Bedingung F (P ) genügen muss und dass andererseits jedes Prädikat P , für welches F (P ) zutrifft, ein Element von M definiert. Demnach lassen sich die Elemente der Vereinigungsmenge von M dadurch charakterisieren, dass ihnen ein Prädikat P zukommt, auf welches F (P ) zutrifft, und die Elemente des Durch|schnitts von M sind dadurch gekennzeichnet, dass ihnen jedes Prädikat P zukommt, bei welchem F (P ) zutrifft. Diese Bedingungen können wir nun mit unserer Symbolik zum Ausdruck bringen und erhalten so als definierendes Prädikat für die Vereinigungsmenge
25
30
35
40
‘Prinzipien der Mathematik’
187
von M
(EP ) F (P ) + P (x) , und für den Durchschnitt von M (P ) F (P ) → P (x) ; 5
10
dabei bezeichnet F (P ) eine der Menge M entsprechende Prädikaten-Funktion, und die beiden Ausdrücke hängen daher, wenn M gegeben ist, nur von x ab. In diesen Darstellungen kommt die Behandlung der Funktionen als Gegenstände in zweifacher Weise zur Anwendung, einmal für die Bildung der Prädikaten-Funktion F (P ), und ausserdem wegen des Auftretens der auf die Gattung der Prädikate bezüglichen Klammerzeichen; und wir ersehen aus diesem Beispiel, dass die modifizierte Handhabung des Kalküls unentbehrlich ist, sofern wir die Mengenlehre durch unsere logische Symbolik darstellen wollen. c) Axiomatische Festlegung des erweiterten Verfahrens. Erweiterung des Axiomen-Systems durch Hinzufügung neuer Regeln
15
20
25
30
35
Wir haben bis jetzt die Erweiterung des Kalküls nur in Hinsicht auf symbolische Darstellungen von Sätzen und Definitionen betrachtet. Um diese Erweiterung auch für die formalen Beweisführungen zur Geltung zu bringen, müssen wir zu den bisherigen Grundregeln des formalen Operierens einige ergänzende Regeln hinzufügen. Um uns hierfür die Ausdrucksweise zu erleichtern, wollen wir den Terminus „Argument“ im weiteren Sinne gebrauchen, | indem wir als Argument eines Ausdruckes jedes darin vorkommende unbestimmte Zeichen ansehen, zu welchem kein Klammerzeichen gehört. (Die Bezeichnungen „Variable“, „abhängig“, „konstanter Ausdruck“, „sinnloser Ausdruck“ sollen im bisherigen Sinne verwendet werden). Als stillschweigende Voraussetzung ist bei jeder der folgenden Regeln die einschränkende Bedingung hinzuzudenken, dass durch die betreffende in ihr beschriebene Operation nicht etwa ein sinnloser Ausdruck entsteht. Die Formulierung der Regeln kann nun etwa folgendermassen geschehen: I ) Aus einer richtigen Formel gewinnt man eine neue, wenn man von den darin als Argumente vorkommenden unbestimmten Aussage- oder FunktionsZeichen die gleichnamigen Allgemeinheits-Zeichen (in irgend einer Reihenfolge) an den Anfang der Formel stellt.1) II ) Steht bei einer logischen Formel in einer bestimmten Leerstelle eines Funktions-Zeichens F jedesmal, wenn F vorkommt, eine Variable als Argument, so erhält man wieder eine richtige Formel, indem man jede der Variablen, welche in der betreffenden Leerstelle von F auftreten, innerhalb des 1)
Die Wirkungsbereiche dieser Klammerzeichen sollen sich bis zum Ende der Formel erstrecken, was eventuell durch Klammernsetzung zum Ausdruck zu bringen ist.
201
188
202
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Wirkungsbereiches des zu ihr gehörigen Klammerzeichens durch ein AussageZeichen oder auch jede durch ein Funktions-Zeichen (und zwar jedesmal mit gleich vielen Leerstellen) ersetzt. III ) (Ergänzung der Regel III) ) Es habe eine richtige Formel die Gestalt (X)α oder (F )α, und es gehe β aus α hervor, | indem im ersten Falle das Aussage-Zeichen X überall, wo es auftritt, durch einen und denselben von Argumenten freien Ausdruck ersetzt wird oder im zweiten Falle das FunktionsZeichen F überall, wo es vorkommt, durch einen gewissen Ausdruck mit gleich vielen Argumenten wie F ersetzt wird, wobei die Argumente dieses Ausdrucks jedesmal ebenso wie in F zu wählen sind; dann ist β eine richtige Formel. IV ) Es gehe aus einem Ausdruck α ein Ausdruck β hervor, indem für ein in α als Argument vorkommendes Aussage-Zeichen X durchweg ein und derselbe konstante Ausdruck eingesetzt wird, oder indem für ein in α als Argument vorkommendes Funktions-Zeichen F , in dessen Leerstellen nur Variable auftreten, durchweg ein gewisser Ausdruck ϕ eingesetzt wird, der von gleich vielen Variablen abhängt wie F und in welchem die Variablen jedesmal ebenso benannt sind, wie sie bezüglich in F lauten;1) dann erhält man eine richtige Formel, indem man im ersten Falle den Ausdruck (X)α → β im zweiten Falle den Ausdruck (F )α → β bildet und die mit den Argumenten von β gleichnamigen AllgemeinheitsZeichen in irgend einer Reihenfolge dem betreffenden Ausdruck voranstellt. Die Art, wie diese Regeln anzuwenden sind, soll durch ein paar Beispiele erläutert werden.
5
10
15
20
25
Beispiele für formale Beweisführungen im erweiterten Kalkül; Ableitung von Eigenschaften der Identitätsbeziehung sowie des Satzes von der Existenz des Gegenteils
203
Wie wir bereits wissen, lässt sich in der Symbolik des erweiterten Kalküls die Beziehung der Identität ≡(x, y) durch den Ausdruck (F ) F (x) = F (y) definieren. Soll diese | Definition uns etwas nützen, so müssen sich daraus nach den Regeln des Kalküls die Grundeigenschaften der Identitäts-Beziehung: die Identität jedes Gegenstandes mit sich selbst, die Symmetrie und die Transitivität, ableiten lassen. Dies ist auch tatsächlich (mit Hilfe der neueingeführten Regeln) möglich. Ich will das hierfür anzuwendende Verfahren bei der ersten der drei genannten Eigenschaften darlegen. Diese findet ihren Ausdruck in der Formel (x) ≡(x, x), 1)
Die hier beschriebenen Einsetzungen sind genau diejenigen, welche man bei der Anwendung der früheren Regel II) auszuführen hat.
30
35
‘Prinzipien der Mathematik’
189
welche durch Einsetzen der Definition für die Identität in die Gestalt (x)(F ) F (x) = F (x) übergeht. Um diese Formel abzuleiten, gehen wir von der richtigen Formel (x) F (x) = F (x) 5
10
aus. Vor diese können wir nach der Regel I ) das Allgemeinheits-Zeichen (F ) setzen und haben dann nur noch die beiden Allgemeinheits-Zeichen (x) und (F ) miteinander zu vertauschen, was folgendermassen erreicht wird: In der logischen Formel (y)(x)R(y, x) → (x)(y)R(y, x) ersetzen wir gemäss der Regel II ) die in der ersten Leerstelle von R zweimal auftretende Variable y beidemal durch das Funktions-Zeichen F , sodass sich (F )(x)R(F, x) → (x)(F )R(F, x)
15
ergibt. Vor diesen Ausdruck, welcher kurz mit α bezeichnet werde, setzen wir nach I ) das Zeichen (R) und wenden auf die entstehende Formel (R)α die Regel III ) an, indem wir in α für R(F, x) den Ausdruck F (x) = F (x) einsetzen. So gelangen wir zu der Formel (F )(x) F (x) = F (x) → (x)(F ) F (x) = F (x) ,
20
welche uns unmittelbar die gewünschte Vertauschung der AllgemeinheitsZeichen liefert. Noch von einer anderen, die Identität betreffenden Formel wollen wir den Beweis betrachten. Sie lautet: (1) (F )(x) (Ey) ≡(x, y) + F (y) → F (x)
25
30
35
(„F (x) trifft stets dann zu, wenn es ein y gibt, mit welchem x identisch ist und für welches F (y) zutrifft“). Als Ausgangspunkt des Beweises nehmen wir die logische Formel (x)(y) (z) G(x, y, z) + H(x, y, z) → (z)H(x, y, z) . Hierin ersetzen wir nach II ) die (in der dritten Leerstelle von H beidemal auftretende) Variable z überall durch F und stellen vor die so erhaltene Formel gemäss I ) die mit G und H gleichnamigen Allgemeinheits-Zeichen, sodass sich (G)(H)(x)(y) (F ) G(x, y, F ) + H(x, y, F ) → (F )H(x, y, F ) ergibt. Wird nun gemäss der Regel III ) für G(x, y, F ) der Ausdruck F (x) → F (y) und dann für H(x, y, F ) der Ausdruck F (y) → F (x) eingesetzt, so erhalten wir (x)(y) (F ) F (x) → F (y) + F (y) → F (x) → (F ) F (y) → F (x) , und da für (F ) F (x) → F (y) + F (y) → F (x) zur Abkürzung (F ) F (x) = F (y) , also auch ≡(x, y) geschrieben werden kann, so folgt (2) (x)(y) ≡(x, y) → (F ) F (y) → F (x) .
204
190
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Um von dieser Beziehung zu der Formel (1) zu gelangen, denken wir uns F wieder durch eine Variable ersetzt, d. h. wir betrachten den Ausdruck (x)(y) ≡(x, y) → (z) R(y, z) → R(x, z) . 205
Wenden wir auf diesen unsere ursprünglichen Operationsmethoden an, so finden wir die Beziehung (x)(y) ≡(x, y) → (z) R(y, z) → R(x, z) = (z)(x) (Ey) ≡(x, y) + R(y, z) → R(x, z) , und indem wir nun auf Grund der Regeln II ), I ), III ) — entsprechend wie vorhin — zunächst anstelle von z überall das Zeichen F setzen, darauf das Zeichen (R) vor die Formel stellen und dann das Funktions-Zeichen R(y, F ) durch den Ausdruck F (y) — beziehungsweise R(x, F ) durch F (x) — ersetzen, gelangen wir zu der Gleichung (x)(y) ≡(x, y) → (F ) F (y) → F (x) = (F )(x) (Ey) ≡(x, y) + F (y) → F (x) , welche uns auf Grund der Formel (2) die behauptete Formel (1) liefert. Einen Anwendungsfall für die Regel IV ) bildet die Ableitung der Formel (3) (x)(y) (F ) F (x) → F (y) → (F ) F (y) → F (x) , welche in folgender Weise geschehen kann: Da der Ausdruck F (x) → F (y), wenn darin das Zeichen F durch G ersetzt wird, in G(x) → G(y) übergeht, so ist gemäss der Regel IV ) (x)(y)(G) (F ) F (x) → F (y) → G(x) → G(y) eine richtige Formel. Hierin lässt sich mit Hilfe der ursprünglichen Axiome und der Regeln I ), II ), III ) (welche ganz entsprechend wie bei den vorigen Beispielen anzuwenden sind) eine Versetzung des Zeichens (G) bewirken derart, dass (G) unmittelbar vor das zweite Glied der Folgebeziehung tritt; man erhält also (x)(y) (F ) F (x) → F (y) → (G) G(x) → G(y) .
206
5
10
15
20
25
Auf gleiche Art wie diese Formel gewinnt man die Beziehung (x)(y) (G) G(x) → G(y) → (F ) F (x) → F (y) , und aus dieser in Verbindung mit der vorigen geht (4) (x)(y) (F ) F (x) → F (y) → (F ) F (x) → F (y)
30
hervor.1) Nun ist ferner (x)(y) F (x) → F (y) → F (y) → F (x) eine richtige Formel. Vor diese kann gemäss I ) das Zeichen (F ) gestellt werden, welches mit den beiden folgenden Allgemeinheits-Zeichen (auf Grund der bei 1) Dass wir bei dieser Schlussfolgerung das Zeichen G hilfsweise einführen und nicht gleich zu Anfang F durch F (statt durch G) ersetzen, ist notwendig, weil wir sonst einen sinnlosen Ausdruck erhalten würden und daher die Regel IV ) nicht anwendbar wäre.
35
‘Prinzipien der Mathematik’
191
dem ersten Beispiel ausgeführten Schlussweise) vertauscht werden darf. So entsteht der Ausdruck (x)(y)(F ) F (x) → F (y) → F (y) → F (x) ; 5
und von diesem können wir durch Anwendung der logischen Formel (x)(y)(z) Q(x, y, z) → R(x, y, z) → (x)(y) (z)Q(x, y, z) → (z)R(x, y, z) mit Hilfe der Regeln I ), II ), III ) zu der Formel (x)(y) (F ) F (x) → F (y) → (F ) F (y) → F (x)
10
15
übergehen. Vereinigen wir diese mit der zuvor bewiesenen Formel (4), so erhalten wir die Behauptung (3). — Zugleich mit der Folgebeziehung (3) ergibt sich auch deren Umkehrung (da man ja die Benennungen der Variablen x, y sowie auch die Reihenfolge der zu ihnen gehörigen Klammerzeichen vertauschen kann). Es gilt daher auch die Formel (x)(y) (F ) F (x) → F (y) = (F ) F (y) → F (x) . Von dieser gelangt man weiter zu der Beziehung (x)(y) (F ) F (x) → F (y) = (F ) F (x) → F (y) + F (y) → F (x) , und da hierin für den Ausdruck (F ) F (x) → F (y) + F (y) → F (x)
20
25
ebenso wie vorhin zur Abkürzung ≡(x, y) geschrieben werden kann, so ergibt sich (x)(y) (F ) F (x) → F (y) = ≡(x, y) . Und diese Formel besagt, dass der Ausdruck (F ) F (x) → F (y) gleichbedeutend ist mit der Identitäts-Beziehung, mithin auch zur Definition dieser Beziehung gebraucht werden könnte. Um auch einen Fall zu behandeln, bei welchem unbestimmte AussageZeichen die Rolle von Variablen spielen, will ich für die Formel (X)(EY )(XY + X + Y ),
30
35
welche ich als Darstellung des Satzes von der Existenz des Gegenteils erwähnt habe, die Ableitung angeben. Es werde mit α der Ausdruck XY + X + Y bezeichnet und mit β der Ausdruck X × X + X + X, welcher aus α hervorgeht, indem durchweg X für Y eingesetzt wird. Nach der Regel IV ) ist dann (X) (Y )α → β eine richtige Formel. Nun werde die logische Formel (x) F (x) → G(x) → (x) G(x) → F (x) angewendet. Aus dieser erhalten wir gemäss den Regeln I ), II ) (F )(G) (X) F (X) → G(X) → (X) G(X) → F (X) ,
207
192
208
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
und indem wir hierin gemäss III ) für F (X) und G(X) bezüglich die Ausdrücke (Y )α und β einsetzen, welche ja X als einziges Argument enthalten, finden wir (X) (Y )α → β → (X) β → (Y )α . Da das erste Glied dieser Folge-Beziehung schon als richtige Formel erwiesen ist, so folgt (X) β → (Y )α , d. h. (X) β → (EY )α . Indem wir ferner die Grundformel (x) F (x) → G(x) → (x)F (x) → (x)G(x) heranziehen und wiederum von den Regeln I ), II ), III ) Gebrauch machen, wobei wir jetzt für F (x) und G(x) bezüglich die Ausdrücke β und (EY )α einsetzen, erhalten wir (X) β → (EY )α → (X)β → (X)(EY )α
5
10
und hieraus auf Grund des schon Bewiesenen (X)β → (X)(EY )α.
15
Nun ist aber β und daher nach der Regel I ) auch (X)β eine richtige Formel; folglich ist auch (X)(EY )α, d. h. (X)(EY )(XY + X + Y ) eine richtige Formel, was ja bewiesen werden sollte. Mit dieser Ausgestaltung des Funktionen-Kalküls (dessen Handhabung in der modifizierten Form sich durch Aufstellung abgeleiteter Regeln wesentlich vereinfachen lässt) würden wir nun ganz zufrieden sein, wenn sich nicht zeigte, dass wir uns bei der Erweiterung des Formalismus eine zu grosse Freiheit genommen haben. Es stellen sich nämlich in der Anwendung des erweiterten Axiomensystems Widersprüche heraus, d. h. wir gelangen zur Ableitung von Formeln, die zueinander in der Beziehung des Gegenteils stehen. Von diesen Widersprüchen, auf welche man übrigens auch unabhängig von dem Gebrauch der logischen Symbolik geführt werden kann und die also den Charakter von logischen Paradoxien haben, sollen einige hier dargelegt werden. 209
2) Die Paradoxien.
20
25
30
Paradoxie des Begriffes „imprädikabel“ Es sei P (F ) ein Prädikaten-Prädikat; dann stellt der Ausdruck P (P ), falls er nicht sinnlos ist, eine Aussage dar, welche richtig oder falsch sein kann. Ein Beispiel eines Prädikaten-Prädikates P , für welches P (P ) eine richtige Aussage darstellt, bildet die Negation des Prädikates O(F ), d. h. die Funktion O(F ), welche durch den Ausdruck (Ex)F (x) definiert wird. Denn O(O) stellt sich durch den Ausdruck (EF )O(F ) dar, für welchen wiederum (EF )(Ex)F (x)
35
40
‘Prinzipien der Mathematik’
5
193
geschrieben werden kann, und diese Formel bringt in der Tat ein richtiges Urteil zur Darstellung, nämlich den Satz: „es gibt ein F und ein x derart, dass F (x) besteht“. Dagegen ist O(O) der Ausdruck eines falschen Urteils. Gemäss der Definition von O(F ) ergibt sich nämlich O(O) = (EF )O(F ), (EF )O(F ) = (EF )(Ex)F (x),
10
15
20
25
30
35
40
und nach den Regeln des Kalküls kann (EF )(Ex)F (x) ersetzt werden durch den Ausdruck (F )(Ex)F (x), welcher die falsche Aussage darstellt, dass jede Funktion für mindestens einen Wert ihres Argumentes zutrifft. Der Fall, dass P (P ) ein sinnloser Ausdruck ist, tritt bei allen den Prädikaten ein, bei welchen der Wertbereich des Argumentes auf Prädikate von Relationen beschränkt ist, und die daher nicht selbst dem Wertbereich ihres Argumentes angehören (weil sie ja Prädikate von Prädikaten sind). Wir können nun den Ausdruck P (P ) als Funktion von P auffassen. Diese Funktion drückt die Eigenschaft eines Prädika|tes aus, sich selber zuzukommen. Ihre Leerstelle bezieht sich auf die Gesamtheit derjenigen Prädikate, für welche P (P ) nicht sinnlos ist. Diese Gesamtheit möge mit G bezeichnet werden. Es werde jetzt das Funktions-Zeichen Pd (P ) (zu lesen: „P ist prädikabel“) durch folgende Definition eingeführt: Ist P ein zu G gehöriges Prädikat, so sei Pd (P ) ein Symbol für den Ausdruck P (P ). Ist P ein Prädikat, das nicht zu G gehört, so sei Pd (P ) ein Symbol für den Ausdruck (Ex) P (x) + P (x) . Gemäss dieser Festsetzung wird durch das Zeichen Pd (P ) jedem Prädikat eine Aussage zugeordnet; dabei entspricht einem Prädikat, das nicht zu G gehört, eine falsche Aussage, und einem Prädikat P aus der Gesamtheit G entspricht eine richtige oder eine falsche Aussage, je nachdem P (P ) richtig oder falsch ist. Pd (P ) ist also eine Prädikaten-Funktion, deren Leerstelle sich auf die Gesamtheit aller Prädikate bezieht, und welche genau für diejenigen Prädikate zutrifft, die sich selbst als Eigenschaft zukommen. Ebenso wie Pd (P ) ist auch Pd (P ) ein Prädikaten-Prädikat, für dessen Argument jedes beliebige Prädikat einen möglichen Wert bildet; es kann demnach auch Pd selbst als Wert dieses Argumentes genommen werden, d. h. Pd (Pd ) ist kein sinnloser Ausdruck, oder mit anderen Worten, Pd gehört zu G. Hieraus folgt aber nach der Definition von Pd (P ) auf Grund der Formel X = X die Beziehung Pd (Pd ) = Pd (Pd ), und aus dieser Formel erhalten wir sofort einen Widerspruch; | wird nämlich zur Abkürzung für Pd (Pd ) das Zeichen α gesetzt, so lautet die Formel: α = α, und da dieser Ausdruck durch α + α ersetzbar ist, so ergeben sich α und α als richtige Formeln.
210
211
194
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Ohne Anwendung der Symbolik lässt sich der Widerspruch so formulieren: die Eigenschaft von Prädikaten, sich nicht selbst zuzukommen, trifft auf sich selbst dann und nur dann zu, wenn sie nicht auf sich zutrifft. Diese Paradoxie ist zuerst von Russell entdeckt worden. Man kann sie auch in der Ausdrucksweise der Mengenlehre darstellen. Hier entspricht der Prädikaten-Funktion Pd die Menge aller derjenigen Mengen, welche sich selbst nicht als Element enthalten. Diese Menge ist ihrem Begriff nach widerspruchsvoll; denn gemäss ihrer Definition gehört sie dann und nur dann zu ihren eigenen Elementen, wenn sie nicht zu diesen Elementen gehört. Paradoxie des Lügners
212
Die zweite der zu besprechenden Paradoxien war bereits in der griechischen Philosophie bekannt. Ihre einfachste Fassung ist folgende: es sage jemand: „ich lüge“ oder ausführlicher „ich spreche jetzt einen falschen Satz aus“; dann ist diese Aussage richtig, sofern sie falsch ist, und sie ist falsch, sofern sie richtig ist. Um zu erkennen, dass dieser Widerspruch sich auch aus unserem logischen Kalkül ergibt, brauchen wir an der Formulierung der Paradoxie nur eine geringe Verschärfung vorzunehmen. Es werde mit P eine bestimmte Person benannt, und t sei die abgekürzte Bezeichnung eines bestimmten Zeitintervalles. Innerhalb dieses Zeitraumes t spreche P den Satz aus: „alles, was P in dem Zeitraum t behauptet, ist falsch“; und weiter sage | P während der Zeit t nichts. Diese Annahme ist jedenfalls nicht widerspruchsvoll, da man ja ihre Verwirklichung absichtlich herbeiführen kann. Um sie in der logischen Symbolik zum Ausdruck zu bringen, bezeichnen wir die angeführte Aussage von P mit A und wenden das Funktions-Zeichen Beh(X) an in der Bedeutung „X wird von P im Zeitraum t behauptet“, wobei als Wert des Argumentes X jede Aussage in Betracht kommt. Mit Hilfe dieser Zeichen können wir zunächst die Aussage A durch die Formel (X) Beh(X) → X wiedergeben; und unsere Voraussetzung, dass P innerhalb der Zeit t den Satz A und sonst nichts ausspricht, stellt sich dar durch die beiden Formeln Beh(A), (X) Beh(X) → ≡(A, X) . Nun kommt auf folgende Weise ein Widerspruch zustande: In der richtigen Formel A → A werde im zweiten Gliede für A der Ausdruck (X) Beh(X) → X , welcher ja die symbolische Darstellung der Aussage A bildet, eingesetzt; dann ergibt sich A → (X) Beh(X) → X . Dieser Ausdruck kann ersetzt werden durch (X) A → Beh(X) → X .
5
10
15
20
25
30
35
40
‘Prinzipien der Mathematik’
195
Wird nun gemäss der Regel III ) für X das individuelle Aussage-Zeichen A gesetzt, so folgt A → Beh(A) → A , und diese Formel ist ersetzbar durch Beh(A) → (A → A).
5
Nun ist nach Voraussetzung Beh(A) eine richtige Formel; also | erhalten wir: A → A. Andrerseits lässt sich auch A → A ableiten. Denn zunächst gilt A = (X) Beh(X) → X , also 10
213
A = (EX) Beh(X) + X ;
ferner folgt aus der als richtig vorausgesetzten Formel (X) Beh(X) → ≡(A, X) die Beziehung 15
und hieraus
(X) Beh(X) + X → ≡(A, X)) + X (EX) Beh(X) + X → (EX) ≡(A, X) + X ,
sodass sich
20
A → (EX) ≡(A, X) + X ergibt. Nun wenden wir die kürzlich bewiesene Formel (F )(x) (Ey) ≡(x, y) + F (y) → F (x) an. Ersetzen wir hierin gemäss der Regel II ) die Variablen x, y bezüglich durch die Aussage-Zeichen Y , X und setzen nach der Regel III ) für F (X) den Ausdruck X ein, so erhalten wir (Y ) (EX) ≡(Y, X) + X → Y
25
und daraus durch Einsetzen des Zeichens A für Y nach der Regel III ): (EX) ≡(A, X) + X → A. Diese Formel in Verbindung mit der vorher erhaltenen Beziehung A → (EX) ≡(A, X) + X
30
liefert A → A. Aus den bewiesenen Formeln A → A und A → A folgt aber, dass sowohl A wie A eine richtige Formel ist, sodass wir in der Tat auf einen Widerspruch geführt werden. Paradoxie der kleinsten (im 20. Jahrhundert) nicht definierten Zahl
35
Ich will nun noch eine dritte Paradoxie vorführen, von welcher es mannigfache verschiedene Wendungen gibt. Eine einfache Form der Darstellung ist folgende: Jedes Bezeichnen einer Zahl, geschehe es durch Mitteilung eines konventionellen Zeichens oder | durch Angabe einer definierenden Eigenschaft, erfordert ein gewisses Mindestmass an Zeit. Daher können innerhalb
214
196
215
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
einer endlichen Zeit von endlich vielen Menschen auch nur endlich viele Zahlen bezeichnet werden. Andrerseits gibt es unendlich viele Zahlen. Somit werden von den im 20. Jahrhundert auf Erden lebenden Menschen sicher nicht alle Zahlen bezeichnet; das heisst, es gibt Zahlen, welche im 20. Jahrhundert nicht bezeichnet werden. Unter diesen ist eine die kleinste. Nun ist diese Zahl aber doch im 20. Jahrhundert bezeichnet; denn ich habe sie ja durch die Eigenschaft bestimmt, die kleinste im 20. Jahrhundert nicht bezeichnete Zahl zu sein. Es ergibt sich also die Existenz einer Zahl, die sowohl bezeichnet als nicht bezeichnet ist. Um diese Argumentation für den Zweck der Darstellung in unserem Kalkül etwas zu präzisieren, ersetzen wir den Begriff der Bezeichnung durch einen engeren Begriff; d. h. wir ziehen nur solche Bezeichnungen einer Zahl in Betracht, welche im Sinne unserer logischen Symbolik durch das Aufschreiben eines Ausdrucks für ein die Zahl definierendes Prädikat stattfinden. Dabei verstehen wir unter einem die Zahl x definierenden Prädikat ein solches, das auf die Zahl x, sonst aber auf nichts zutrifft1) . Auf diese Weise gelangen wir zu folgender Fassung der Paradoxie: Es bedeute Scr (P ) die Eigenschaft eines Prädikates P , dass unter den im 20. Jahrhundert aufgeschriebenen Aus|drücken der logischen Symbolik mindestens einer ein Ausdruck für P ist. Das Zeichen <(x, y) werde wie bisher für die Relation „x ist kleiner als y“ angewendet; und zwar sollen die Leerstellen dieser Relation auf die Gattung der gewöhnlichen Zahlen bezogen werden. Ferner möge für den Ausdruck P (x) + (y) P (y) → ≡(x, y) , welcher besagt, dass x durch das Prädikat P definiert wird, zur Abkürzung das Funktions-Zeichen Df (P, x) geschrieben werden, wobei sich also die erste Leerstelle auf die Gattung der Prädikate, die zweite auf die Gattung der Zahlen beziehen soll; und als Abkürzung für (EP ) Df (P, x) + Scr (P ) werde das Symbol Dsc(x) angewendet. Dsc(x) bedeutet also: „unter den im 20. Jahrhundert aufgeschriebenen symbolischen Ausdrücken stellt mindestens einer ein Prädikat dar, welches x definiert“, oder kurz ausgesprochen: „x ist im 20. Jahrhundert mindestens einmal symbolisch definiert“. Schliesslich werde als Abkürzung für den Ausdruck Dsc(x) + (y) <(y, x) → Dsc(y) das Zeichen Mds(x) genommen, sodass also Mds(x) bedeutet: „x hat die Eigenschaft, kleinste im 20. Jahrhundert nicht symbolisch definierte Zahl zu sein“. Als Axiome führe man nun folgende Formeln ein: zunächst die Ausdrücke für die Grundeigenschaften der Relation <(x, y): (x) <(x, x) („niemals ist x kleiner als x“), (x)(y)(z) <(x, y) + <(y, z) → <(x, z) (Transitivitäts-Eigenschaft); 1)
Dass die Zahlen sich als Prädikaten-Funktionen deuten lassen, braucht bei der vorliegenden Argumentation nicht berücksichtigt zu werden.
5
10
15
20
25
30
35
40
‘Prinzipien der Mathematik’
197
sodann zwei von den Formeln, in welchen die Ordnungs-Eigenschaften der Zahlenreihe mit Hilfe der Beziehung <(x, y) dargestellt werden: (x)(y) ≡(x, y) × <(x, y) × <(y, x) 5
216
(Von zwei verschiedenen Zahlen ist mindestens eine kleiner als die andere), (P ) (Ex)P (x) → (Ex) P (x) + (y) <(y, x) → P (y) (Unter allen Zahlen, welche irgend eine bestimmte Eigenschaft erfüllen, gibt es stets eine kleinste); ferner den symbolischen Ausdruck für die Tatsache, dass nicht alle Zahlen im 20. Jahrhundert symbolisch definiert werden können1) : (Ex)Dsc(x);
10
endlich die Formel
15
Scr (Mds), welche besagt, dass ein Ausdruck für Mds(x) im 20. Jahrhundert aufgeschrieben ist, und die also eine richtige Behauptung darstellt, da wir ja vorhin den Ausdruck für Mds(x) aufgeschrieben haben. Jetzt kann man folgende formale Schlussweise ausführen: In der als richtig vorausgesetzten Formel (P ) (Ex)P (x) → (Ex) P (x) + (y) <(y, x) → P (y)
20
setze man gemäss der Regel III ) für P überall das Prädikat Dsc ein und berücksichtige die Formel (Ex)Dsc(x); dann ergibt sich (Ex) Dsc(x) + (y) <(y, x) → Dsc(y) , also bei Anwendung der Abkürzung Mds(x): (Ex)Mds(x). Zufolge der Definition von Mds(x) besteht die Beziehung (x) Mds(x) → Dsc(x) + Mds(x) ;
25
ferner lässt sich mit Hilfe der aufgestellten Axiome die Formel (x) Mds(x) → (y) Mds(y) → ≡(x, y) ableiten. Aus dieser Formel in Verbindung mit der vorigen folgt: (Ex)Mds(x) → (Ex) Dsc(x) + Mds(x) + (y) Mds(y) → ≡(x, y) ,
30
und da die linke Seite dieser Folge-Beziehung bereits als richtige Formel erwiesen ist, so erhält man (Ex) Dsc(x) + Mds(x) + (y) Mds(y) → ≡(x, y) , oder, mit Benutzung der Abkürzung Df : (Ex) Dsc(x) + Df (Mds, x) .
35
Nimmt man hierzu die als Axiom aufgestellte Formel Scr (Mds), so folgt (Ex) Dsc(x) + Df (Mds, x) + Scr (Mds) . 1) Man beachte, dass diese Tatsache noch nicht die Existenz unendlich vieler Zahlen logisch einschliesst. Die Voraussetzung der Unendlichkeit der Zahlenreihe lässt sich also hier vermeiden; man braucht nur die viel geringere Annahme, dass es mehr Zahlen gibt, als symbolische Ausdrücke im 20. Jahrhundert aufgeschrieben werden.
217
198
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Nun wende man auf die Formel (34) (x) F (x) → (Ey)F (y) die Regel II ) an, indem man für x und y bezüglich die Funktions-Zeichen Q, P (mit einer Leerstelle) einsetze. Aus der so entstehenden Formel (Q) F (Q) → (EP )F (P ) erhält man nach der Regel III ) durch Einsetzen des Prädikates Mds anstelle von Q, wenn man danach noch I ) anwendet, die Beziehung (F ) F (Mds) → (EP )F (P ) . Ersetzt man hierin gemäss der Regel III ) das Funktions-Zeichen F (P ) durch den Ausdruck (Ex) Dsc(x) + Df (P, x) + Scr (P ) und berücksichtigt, dass der hierbei anstelle von F (Mds) tretende Ausdruck bereits als richtige Formel erkannt ist, so findet man (EP )(Ex) Dsc(x) + Df (P, x) + Scr (P ) , 218
und hieraus | gewinnt man, unter Benutzung der Vertauschbarkeit der Klammer-Zeichen und der Formel (26 ), die Formel (Ex) Dsc(x) + (EP ) Df (P, x) + Scr (P ) , welche durch Anwendung der Abkürzung Dsc in (Ex) Dsc(x)+Dsc(x) übergeht. Dieser Ausdruck ergibt sich somit als richtige Formel. Andrerseits kann die Negation dieses Ausdrucks (Ex) Dsc(x) + Dsc(x) , welche durch
219
(x) Dsc(x) × Dsc(x) ersetzbar ist, aus der richtigen Formel (x) F (x) × F (x) durch Anwendung der Regel II abgeleitet werden. Es stellt sich also ein Widerspruch heraus. — Mit diesen verschiedenen Widersprüchen können wir uns nun nicht etwa in der Weise abfinden, dass wir die Beweisbarkeit gewisser zu einander entgegengesetzter Aussagen als eine bisher nicht beachtete Tatsache hinnehmen; denn sobald wir irgend zwei einander entgegengesetzte Ausdrücke α und α als richtige Formeln zulassen, so ergibt sich für jeden nicht sinnlosen, konstanten Ausdruck β nach den Regeln des Kalküls (α + α) × β mithin auch α + α → β und infolge davon (weil α + α eine richtige Formel ist) β selbst als eine richtige Formel. Es müsste demgemäss jeder konstante, nicht sinnlose Ausdruck als eine richtige Formel gelten, und damit würde der logische Kalkül bedeutungslos. Wir müssen also aus den gefundenen Widersprüchen schliessen, dass unsere Methode des formalen Operierens in irgend einer Beziehung fehlerhaft ist. Und zwar kann dieser Fehler nur darauf beruhen, dass wir bei der Erweiterung des ursprüng|lich für den Funktionen-Kalkül aufgestellten Axiomen-Systems nicht vorsichtig genug verfahren sind; denn das ursprüngliche Axiomen-System liess sich ja als widerspruchslos nachweisen. Um nun für die erforderliche Korrektur unseres Verfahrens den richtigen Gesichtspunkt zu gewinnen, wollen wir uns noch einmal das Grundsätzliche an der vorgenommenen Erweiterung des Kalküls vergegenwärtigen.
5
10
15
20
25
30
35
40
‘Prinzipien der Mathematik’
199
3) Die Modifikation des erweiterten Kalküls. a) Die Methode des Stufen-Kalküls Anfechtbarkeit des vorherigen Verfahrens; Gedanke der Stufen-Unterscheidung 5
10
15
20
25
30
35
40
Bei der anfänglichen Methode des Funktionen-Kalküls haben wir ein System oder mehrere Systeme (Gattungen) von Gegenständen als von vornherein gegeben angenommen, und durch die Beziehung auf solche Gesamtheiten von Gegenständen erhielt das Operieren mit den Variablen (insbesondere mit den Klammerzeichen) seine logische Bedeutung. Die Erweiterung des Kalküls bestand nun darin, dass wir die Aussagen, Prädikate und Relationen als Arten von Gegenständen betrachteten und demnach symbolische Ausdrücke zuliessen, deren logische Deutung eine Bezugnahme auf die Gesamtheit der Aussagen, bezw. der Funktionen erforderte. Dies Vorgehen ist nun in der Tat bedenklich, insofern nämlich dabei jene Ausdrücke, welche erst durch die Bezugnahme auf die Gesamtheit der Aussagen bezw. der Funktionen ihren Inhalt gewinnen, ihrerseits wieder zu den Aussagen und Funktionen hinzugerechnet werden, während wir doch andererseits, um uns auf die Gesamtheit der Aussagen oder Funktionen beziehen zu können, die Aussagen bezw. die Funktionen als von vornherein bestimmt ansehen müssen. Hier liegt also eine Art von logischem Zirkel vor, und wir haben Grund zu der Annahme, dass dieser Zirkel die Ursa|che für das Zustandekommen der Paradoxien bildet. Somit entsteht für uns, wenn wir auf die Möglichkeit, die Aussagen und Funktionen als Werte von Argumenten logischer Ausdrücke zu nehmen, nicht verzichten wollen, die Aufgabe, das formale Operieren mit den unbestimmten Aussage- und Funktions-Zeichen als Argumenten so zu gestalten, dass jene anfechtbaren Bildungen von Aussagen- und Funktions-Gesamtheiten vermieden werden. Zur Erfüllung dieser Forderung ist wohl Folgendes der natürlichste Weg: Wir nehmen zunächst den ursprünglichen Funktionen-Kalkül und wenden ihn auf ein System oder mehrere Systeme von Gegenständen an. So erhalten wir eine Theorie, welche die Theorie der „ersten Stufe“ heissen möge. Nun bilden wir eine Theorie „zweiter Stufe“, indem wir zu den Gegenständen der anfänglichen Theorie die in ihr vorkommenden Aussagen und Funktionen hinzunehmen und die Beziehungen betrachten, welche in dem so erweiterten Bereich von Gegenständen bestehen. Ebenso wie mit der Theorie erster Stufe können wir nun auch mit der Theorie zweiter Stufe verfahren, d. h. wir können die darin enthaltenen Aussagen und Funktionen zusammen mit den Gegenständen, auf welche sie sich beziehen, zu einem Bereich vereinigen, welcher das System der Gegenstände für eine Theorie dritter Stufe bildet. Und dieser Erweiterungsprozess lässt sich beliebig oft wiederholen. Durch dieses Verfahren erhalten wir einerseits die Möglichkeit, jede vorkommende Aussage, Eigenschaft oder Beziehung zum Gegenstande des Ur-
220
200 221
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
teilens zu machen; andererseits blei|ben wir vor einem fehlerhaften Operieren mit Gesamtheiten von Aussagen oder Funktionen deshalb gesichert, weil ja nur solche Ausdrücke zugelassen werden, die durch sukzessive Stufenbildung erreichbar sind, und für jede Theorie einer bestimmten Stufe die Gesamtheit der Gegenstände, auf welche sie sich bezieht, von vornherein abgegrenzt ist.
5
Formale Einführung des Stufen-Kalküls; Index-Bezeichnung, Stufenzählung, Aenderung der Regeln
222
Um die Stufen-Unterscheidung in unserer Symbolik zur Geltung zu bringen, wollen wir die Aussage- und Funktions-Zeichen mit Zahlen-Indizes versehen. Diese Bezeichnung ist so zu verstehen, dass der Wertbereich eines Aussage-Zeichens Xn , bezw. eines Funktions-Zeichens Fn auf solche Aussagen bezw. Funktionen eingeschränkt ist, welche in der Theorie der n-ten Stufe enthalten sind. Von jedem Ausdruck, welcher eine Aussage oder eine bestimmte Funktion darstellen soll, verlangen wir jetzt, dass jedem darin vorkommenden Aussage- oder Funktions-Zeichen ein Index beigefügt ist, und wir bezeichnen als die Stufenzahl eines solchen Ausdrucks diejenige Zahl, welche auf den höchsten vorkommenden Index zunächst folgt, oder im Falle, dass als unbestimmte Zeichen nur Variable vorkommen, die Zahl 1; dabei sind als vorkommende Indizes auch alle diejenigen mitzurechnen, welche eventuell in der Definition eines zur Abkürzung gebrauchten Zeichens auftreten. Formeln, in denen nicht alle Aussage- oder Funktions-Zeichen einen Index haben (und deren Stufe daher nicht bestimmt ist), lassen wir nur als Hilfsmittel für formale Beweisführungen zu, ohne ihnen eine logische Bedeutung zu geben. Auch sollen | ausser den logischen Grundformeln keine formalen Axiome ohne bestimmte Stufen-Bezeichnung eingeführt werden. An den Regeln I )–IV ) haben wir im Sinne des Stufen-Verfahrens folgende Aenderungen anzubringen: Bei der Anwendung von I ) und IV ) ist jedes der unbestimmten Aussage- und Funktions-Zeichen, zu welchen die der Formel voranzustellenden Allgemeinheitszeichen gehören, innerhalb des Wirkungsbereiches des zu ihm gehörigen Klammerzeichens mit einem bestimmten Index zu versehen. Bei der Anwendung von II ) müssen die einzusetzenden Aussage- oder Funktions-Zeichen alle den gleichen Index erhalten. Bei den Regeln III ) und IV ) sind zunächst in der Formulierung der Voraussetzung die Zeichen X und F bezüglich durch Xn und Fn zu ersetzen, und die Vorschrift für die Einsetzung ist durch die Bedingung zu ergänzen, dass der für Xn oder Fn einzusetzende Ausdruck nicht von höherer als der n-ten Stufe sein darf. Als ein neues Axiom müssen wir noch folgende Regel einführen: V ): Ist ein Aussage-Zeichen Xn oder ein Funktions-Zeichen Fn Argument eines Ausdrucks α und entsteht α aus α, indem jedesmal, wo jenes Zeichen auftritt, der Index um 1 erhöht wird, so ist bezüglich (Xn+1 )α → (Xn )α eine richtige Formel.
oder
(Fn+1 )α → (Fn )α
10
15
20
25
30
35
40
‘Prinzipien der Mathematik’
5
201
Auf diese Art wird eine neue Form des Kalküls, der „Stufen-Kalkül“ begründet, welcher eine Erweiterung des ursprünglichen Funktionen-Kalküls darstellt, da dieser ja als Theorie der ersten Stufe in ihm enthalten ist, der aber im Vergleich mit | unserer vorherigen Erweiterung des Funktionen-Kalküls eine wesentliche Einschränkung der formalen Operationsweise bedeutet.
223
Auflösung der Paradoxien durch die Stufenunterscheidung
10
15
20
25
30
Es kommt nun vor allem darauf an, uns zu überzeugen, dass durch den Stufen-Kalkül die in den Paradoxien hervortretenden Widersprüche vermieden werden. Betrachten wir daraufhin die drei behandelten Paradoxien, so zeigt sich Folgendes. Bei der ersten Paradoxie fällt die Möglichkeit fort, eine auf alle Prädikate P anwendbare Funktion Pd (P ) zu definieren. Nehmen wir statt dessen eine Funktion Pd (Pn ) mit einem bestimmten Zahlwert von n, so gehört diese nicht mehr der Theorie n-ter Stufe an, und dasselbe gilt von Pd (Pn ). Demnach kommt Pd nicht als Wert des Argumentes Pn von Pd in Betracht; d. h. der Ausdruck Pd (Pd ) ist sinnlos und kann als solcher nicht für X in die Formel X = X eingesetzt werden. In der zweiten Paradoxie enthält der Ausdruck (X) Beh(X) → X , welcher die Aussage A darstellt, eine Allgemeinheit, welche sich auf die Gesamtheit aller Aussagen bezieht.1) | Beschränken wir nun gemäss der Forderung des Stufen-Kalküls die Variabilität von X auf eine gewisse Höchststufe, indem wir dem Zeichen X einen Index n beilegen, so wird dadurch die Aussage A als ein Ausdruck (n + 1)-ter Stufe bestimmt, und infolge davon kann dann in der Formel (Xn ) A → Beh(Xn ) → Xn der Ausdruck A nicht als spezieller Wert für X eingesetzt werden, sodass wir nicht zu der Formel A → A gelangen. Das heisst, inhaltlich ausgedrückt: wenn wir, um uns nicht auf die Gesamtheit aller Aussagen zu beziehen, dem Ausspruch von P den geänderten Wortlaut geben: „ jede Behauptung erster Stufe, welche P im Zeitraum t aufstellt, ist falsch“, so kann dieser Satz ohne Widersinn als richtig angenommen werden, weil er ja eine Behauptung zweiter 1) Eine solche Bezugnahme auf die Gesamtheit aller Aussagen (Sätze, Behauptungen, Urteile) findet bei allen Formulierungen dieser Paradoxie statt (sofern sie nicht anderweitigen Einwendungen ausgesetzt sind); nur wird dies im allgemeinen durch den sprachlichen Ausdruck verdeckt. So ist z. B. die Behauptung: „ich spreche jetzt einen falschen Satz aus“ gleichbedeutend mit der Aussage: „es gibt einen falschen Satz, welcher jetzt von mir ausgesprochen wird“, worin eine Beziehung auf die Gesamtheit aller Sätze vorliegt; und wenn jemand sagt: „die Worte, welche ich jetzt ausspreche, sind entweder sinnlos oder besagen etwas Falsches“, oder in negativer Fassung: „die Worte, welche ich jetzt ausspreche, haben keinen richtigen Sinn“, so bedeutet dies: „es gibt keine richtige Behauptung, welche meinen jetzt ausgesprochenen Worten als Inhalt beigelegt werden kann“; und dabei wird wiederum auf die Gesamtheit der Behauptungen Bezug genommen.
224
202
225
226
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Stufe bildet; und entsprechend verhält es sich, wenn in der Formulierung des Ausspruchs von P statt „Behauptung erster Stufe“ gesagt wird „Behauptung von höchstens zweiter Stufe“ oder „Behauptung von höchstens dritter Stufe“ usw. Bei der dritten Paradoxie kommt im Begriff einer symbolisch definierten Zahl die Beziehung auf die Gesamtheit der Prädikate vor, was sich in dem Ausdruck für das Prädikat Dsc(x) durch das Auftreten des ExistenzialZeichens (EP ) geltend macht. Nehmen wir hier im Sinne des Stufen-Kalküls eine Verschärfung der Begriffsbildung vor, indem wir, statt schlechthin von einer symbolisch definierten Zahl zu sprechen, genauer angeben, von welcher Höchststufe der definierende Ausdruck sein soll, so | kommt kein Widerspruch zustande; denn die kleinste der Zahlen, welche im 20. Jahrhundert niemals durch einen Ausdruck von höchstens n-ter Stufe ( — für n ist ein bestimmter Zahlwert zu wählen — ) definiert sind, wird zwar durch diese ihre Eigenschaft definiert, jedoch ist hierbei der definierende Ausdruck von der (n + 1)-ten Stufe. Es lässt sich auch an Hand unserer formalen Durchführung der Paradoxie zeigen, dass der Widerspruch durch die Anwendung des Stufen-Kalküls vermieden wird. Nach der Vorschrift des Stufen-Kalküls muss nämlich zunächst in der Definition von Dsc(x) das Funktions-Zeichen P einen Index n erhalten, wodurch sich Dsc(x) und damit auch Mds(x) als Ausdruck der (n + 1)-ten Stufe ergibt. Ferner sind an der Stelle der Beweisführung, wo auf die Formel (34) die Regel II ) angewendet wird, die statt x und y einzusetzenden Funktions-Zeichen Q, P gemäss der Modifikation jener Regel beide mit demselben Index zu versehen; und zwar muss dieser Index grösser als n gewählt werden, damit für Q dann der Ausdruck (n + 1)-ter Stufe Mds(x) eingesetzt werden kann. Sei nun n + k der den Zeichen P und Q zuerteilte Index; dann ergibt sich, wenn der Beweis wie zuvor geführt wird,1) die Formel (Ex) Dsc(x) + (EPn+k ) Df (Pn+k , x) + Scr(Pn+k ) . Hier kann nun der Ausdruck (EPn+k ) Df (Pn+k , x) + Scr(Pn+k ) nicht mehr durch Dsc(x) ersetzt werden; denn in dem definierenden Ausdruck | für Dsc(x) steht ja nicht Pn+k , sondern Pn . Man wird also nicht zu der Formel (Ex) Dsc(x) + Dsc(x) geführt.
5
10
15
20
25
30
b) Mängel des Stufen-Kalküls Schwierigkeit in Betreff der Identitätsbeziehung; deren vorläufige Lösung Somit finden wir, dass in der Tat durch die Abgrenzung der Stufen unser erweiterter Kalkül von den Widersprüchen, welche ihm bei der unbeschränkten Operationsweise anhaften, befreit wird. Jetzt fragt es sich aber, ob auf 1)
Bei dem am Eingange des Beweises benutzten arithmetischen Axiom hat man das Zeichen P durch Pn+1 zu ersetzen; es kann dann für Pn+1 (x) der Ausdruck (n + 1)-ter Stufe Dsc(x) eingesetzt werden.
35
‘Prinzipien der Mathematik’
5
10
15
20
25
30
35
40
203
diese Weise nicht der Kalkül zu sehr eingeengt wird, sodass uns manche von denjenigen Schlussweisen abgeschnitten werden, welche für die Grundlegung der Mathematik eine wesentliche Rolle spielen und bei denen wir überzeugt sind, dass sie keinen Anlass zu Widersprüchen geben. In dieser Hinsicht kann uns schon der Umstand argwöhnisch machen, dass wir mit unserer Definition der Identität auf eine Schwierigkeit stossen. Da nämlich in dem Definitionsausdruck (F ) F (x) = F (y) dem FunktionsZeichen F ein Index beigefügt werden muss, so erhalten wir statt der einen Identitäts-Beziehung je nach der Wahl des Index verschiedene Relationen ≡1 (x,y), ≡2 (x, y), . . . (wobei ≡n (x, y) zur Abkürzung steht für (Fn ) Fn (x) = Fn (y) ). Dies ist freilich deshalb nicht so schlimm, weil die verschiedenen Relationen alle für dieselben Wertepaare x, y zutreffen bezw. nicht zutreffen, was man sich auf folgende Weise überlegen kann: Zunächst ist klar, dass für jedes n aus der Beziehung (Fn+1 ) Fn+1 (x) = Fn+1 (y) die Beziehung (Fn )(Fn (x) = Fn (y) folgt, weil ja der Wertbereich von Fn in demjenigen von Fn+1 enthalten ist. Uebrigens lässt sich auch rein formal, mit Benutzung | der Regel V ), beweisen, dass (x)(y) ≡n+1 (x, y) → ≡n (x, y)
227
eine richtige Formel ist. Fraglich ist also nur, ob auch die Umkehrung (x)(y) ≡n (x, y) → ≡n+1 (x, y) gilt. Ohne wesentliche Spezialisierung können wir uns auf den Fall n = 1 beschränken. Dann handelt es sich um folgende Behauptung: „sind a und b Gegenstände und trifft jedes Prädikat erster Stufe, wenn es auf a zutrifft, auch auf b zu, so gilt dasselbe für jedes Prädikat zweiter Stufe“; oder anders gewendet: „wenn es ein Prädikat zweiter Stufe gibt, das auf a, aber nicht auf b zutrifft, so gibt es auch ein solches Prädikat von erster Stufe“. Von diesem Satz lässt sich die Gültigkeit auf inhaltliche Art so einsehen: ein Prädikat, das sich auf Gegenstände bezieht, kann nur dadurch ein Ausdruck zweiter Stufe sein, dass darin Klammerzeichen vorkommen, welche zu unbestimmten Aussage- oder Funktions-Zeichen gehören. Die Darstellung eines solchen Prädikates kann so gewählt werden, dass jene Klammerzeichen am Anfang stehen und darauf ein Ausdruck folgt, welcher ausser dem Argument des darzustellenden Prädikates als Argumente nur die zu den voranstehenden Klammerzeichen gehörigen Aussage- und Funktions-Zeichen enthält und in welchem sonst als unbestimmte Zeichen nur Variable vorkommen. Nach der Voraussetzung des zu begründenden Satzes soll es nun ein Prädikat zweiter Stufe geben, das für a, aber nicht für b gilt. Sei nun dieses Prädikat etwa in der Form (F1 )(EG1 )Φ(F1 , G1 , x) darstellbar, wo der | Ausdruck Φ ausser F1 und G1 keine Funktions-Zeichen und auch keine Aussage-Zeichen enthalten soll. Dann besteht einerseits (F1 )(EG1 )Φ(F1 , G1 , a),
228
204
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
andrerseits besteht das Gegenteil von (F1 )(EG1 )Φ(F1 , G1 , b) d. h. (EF1 )(G1 )Φ(F1 , G1 , b). Diese Formel besagt nun, dass es einen Funktions-Ausdruck α von erster Stufe gibt1) , für welchen (G1 )Φ(α, G1 , b) richtig ist. Indem man diesen Ausdruck α in die Formel (F1 )(EG1 )Φ(F1 , G1 , a) anstelle von F1 einsetzt, erhält man (EG1 )Φ(α, G1 , a). Nach dem Sinn dieser Formel gibt es ferner einen Ausdruck β von erster Stufe, für welchen Φ(α, β, a) zutrifft, und indem β statt G1 in die Formel (G1 )Φ(α, G1 , b) eingesetzt wird, folgt Φ(α, β, b). Somit erweist sich Φ(α, β, x) als ein Prädikat, welches dem Gegenstande a, aber nicht dem Gegenstand b zukommt, und dieses Prädikat ist auf Grund unserer Annahmen über den Ausdruck Φ von der ersten Stufe. Unsere Behauptung besteht also für den betrachteten Fall zu Recht. Und in ganz entsprechender Weise lässt sich für jede in Betracht kommende Form des Prädikates zweiter Stufe die Gültigkeit des Satzes erkennen. Diese Betrachtung hat insofern etwas Unbefriedigendes, als sie uns nicht zu einer eigentlichen Ableitung der Formel (x)(y) ≡1 (x, y) → ≡2 (x, y) aus den Axiomen verhilft. Aber jedenfalls zeigt sie uns doch, dass in der Sonderung der Relationen ≡n (x, y) kein prinzipieller Uebelstand vorliegt. 229
5
10
15
20
Unzulänglichkeit des Stufen-Kalküls für die Grundlegung der höheren Mathematik; Beispiel des Cantorschen Beweises für die Existenz überabzählbarer Mengen Nun finden sich aber Schwierigkeiten von erheblicherer Art, wenn wir daran gehen, die Mengenlehre und die Analysis durch unsere logische Theorie zu begründen. Bereits bei dem Versuche, den Cantorschen Beweis für die Existenz überabzählbarer Mengen in die Ausdrucksweise unseres Kalküls zu übertragen, stossen wir auf ein solches Hindernis. Hier wird man anstatt der Menge aller Mengen von ganzen Zahlen, welche ja das einfachste Beispiel einer überabzählbaren Menge bildet, die Menge aller der Prädikate betrachten, welche sich auf ganze Zahlen als Gegenstände beziehen. Dabei muss man sich nun insofern beschränken, als man im Sinne des Stufen-Kalküls nicht schlechthin von der Menge aller Zahlen-Prädikate reden kann; denn zu dieser Menge müsste ja eine definierende Funktion gehören, bei welcher der Wertbereich des Argumentes alle Prädikate ganzer Zahlen ohne Unterschied der Stufe umfasst, und solche Wertbereiche sind ja durch die Regeln des Stufen-Kalküls ausgeschlossen. Es muss also für die Prädikate, welche die Elemente der zu betrachtenden Menge bilden sollen, eine Höchststufe festgelegt werden. Ist nun n die gewählte Stufenzahl, so haben wir es mit der Menge aller Zahlen-Prädikate von höchstens n-ter Stufe zu tun, und es kommt darauf 1)
Der Ausdruck α muss dieselben Argumente enthalten wie F ; er kann insbesondere aus einem individuellen Funktions-Zeichen bestehen.
25
30
35
40
‘Prinzipien der Mathematik’
5
10
15
205
an, diese Menge als überabzählbar zu erweisen, d. h. zu zeigen, dass wenn auf irgend eine Art jeder ganzen Zahl eindeutig ein Prädikat der Menge zugeordnet wird, dann unter den zugeordneten Prädikaten jedenfalls nicht alle Prädikate der Menge vorkommen. Um nach dem Vorbilde des Cantorschen Beweises zu | verfahren, gehen wir von der Annahme aus, es sei irgend eine Zuordnung der verlangten Art gegeben, d. h. eine Relation R(x, Pn ), welche bei festem x genau durch ein Prädikat Pn erfüllt wird, und wir betrachten dasjenige Prädikat Pc(x), welches für eine Zahl x dann und nur dann zutrifft, wenn das ihr zugeordnete Prädikat nicht auf sie zutrifft, d. h. wenn für jedes Pn aus dem Bestehen von R(x, Pn ) das Nicht-Bestehen von Pn (x) folgt. Von diesem Prädikat können wir auf Grund seiner Definition beweisen, dass es mit keinem der den Zahlen zugeordneten Prädikate übereinstimmt. Wäre nämlich Pc der Zahl m zugeordnet, so müsste einerseits R(m, Pc) gelten, andererseits müsste zufolge der Definition von Pc(x) und wegen der Eindeutigkeit der Zuordnung
230
Pc(m) = R(m, Pc) → Pc(m) bestehen, und aus diesen beiden Beziehungen würde sich Pc(m) = Pc(m), 20
25
30
35
40
also ein Widerspruch ergeben. Mit dieser Feststellung müssten wir nun (gemäss der Analogie zu dem Cantorschen Beweise) bereits am Ziele sein. Tatsächlich haben wir jedoch nur die Existenz eines Zahlen-Prädikates erkannt, welches von allen durch die Relation R den ganzen Zahlen zugeordneten Prädikaten verschieden ist, ohne aber nachzuweisen, dass dieses Prädikat zu unserer Menge gehört. Und wenn wir näher zusehen, so bemerken wir, dass diese Forderung gar nicht erfüllt sein kann; denn die Menge enthält ja nur Prädikate n-ter Stufe, während der definierende Ausdruck für Pc(x), welcher (Pn ) R(x, Pn ) → Pn (x) lautet, von der (n + 1)-ten Stufe ist. Es kommt also zufolge der Stufen-Unterscheidung der ge|wünschte Beweis gar nicht zustande. Ganz ähnlich wie bei diesem Beispiel tritt noch an mehreren entscheidenden Stellen der Fall ein, dass wir durch die Sonderung der Stufen daran verhindert werden, gewisse mathematische Schlussweisen durch den logischen Kalkül nachzubilden. Es zeigt sich somit, dass unsere Methode des Stufen-Kalküls die Möglichkeiten des Schliessens über das zulässige Mass hinaus beschränkt, und wir werden daher suchen, eine gewisse Modifikation, und zwar auf möglichst ungezwungene Art, anzubringen, durch die der Kalkül eine grössere Bewegungsfreiheit erhält. Dies lässt sich nun durch die Einführung eines Postulates erreichen, welches von Russell unter dem Namen „Axiom der Reduzierbarkeit“ aufgestellt worden ist.
231
206
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
c) Das Axiom der Reduzierbarkeit Aufstellung des Axioms; Methodische Bedeutung der Einführung des Axioms; Vermeidung der Widersprüche
232
233
Zum Zweck der allgemeinen Formulierung dieses Postulates erweitern wir den bisher nur für Prädikate definierten Begriff der Aequivalenz, indem wir allgemein zwei Funktionen mit gleichen Argumenten als äquivalent erklären, wenn sie für genau dieselben Wertsysteme der Argumente zutreffen. Ferner führen wir als neue Bezeichnung ein, dass ein Ausdruck „prädikativ“ heisse, wenn er die niedrigste mit der Art seiner Argumente vereinbare Stufe besitzt, d. h. diejenige Stufe, welche einem Ausdruck zukommt, der die Argumente des betrachteten Ausdrucks als einzige unbestimmte Zeichen enthält. Bei der Anwendung dieser Terminologie lautet unsere Annahme folgendermassen: „Zu jedem im Stufen-Kalkül vorkommenden Funktions-Ausdruck gibt es einen äquivalenten prädikativen Ausdruck“. Als Spezialfall ist hierin die Annahme enthalten, | dass es zu jeder (im Stufen-Kalkül vorkommenden) Funktion, die nur Variable als Argumente enthält, eine äquivalente Funktion erster Stufe gibt. Und hieraus wiederum gewinnt man durch die Anwendung auf Prädikate den Satz, dass zu jedem Prädikat Pn (x) (mit beliebigem Index n), dessen Argument sich auf die ursprünglichen Gegenstände des Kalküls bezieht, ein äquivalentes Prädikat erster Stufe existiert; d. h. in der Ausdrucksweise des Kalküls: für jeden Index n ist (Pn )(EP1 )(x) Pn (x) = P1 (x) eine richtige Formel. Die methodische Bedeutung der Aufstellung dieses Postulates besteht vor allem darin, dass wir im Gegensatz zu der bisher anerkannten Forderung, wonach jede Funktion entweder als Grundfunktion durch ein individuelles Zeichen eingeführt werden oder als abgeleitete Funktion durch einen symbolischen Ausdruck darstellbar sein muss, nunmehr gewisse Prädikate und Relationen als etwas an sich Bestehendes betrachten, sodass ihre Mannigfaltigkeit weder von den tatsächlich gegebenen Definitionen noch auch überhaupt von unseren Möglichkeiten des Definierens abhängt. Ein solches Vorgehen erscheint zunächst sehr befremdlich, es ist aber unvermeidlich, sofern wir darauf ausgehen, die Grundlagen der Mengenlehre und der Analysis aus dem System der Funktionen unseres Kalküls zu entwickeln. Denn solange wir daran festhalten, dass jede Funktion sich explizite angeben lassen muss, können die Funktionen unseres Kalküls nur eine abzählbare Gesamtheit bilden und können daher nicht ausreichen, um die überabzählbaren | Mannigfaltigkeiten zu repräsentieren, mit denen wir es in jenen mathematischen Disziplinen zu tun haben. Man könnte nun meinen, dass infolge der Annahme des Axioms der Reduzierbarkeit die eben erst vermiedenen Widersprüche sich wieder einstellen. Dass dies aber nicht der Fall ist, lässt sich an den behandelten Paradoxien leicht erkennen.
5
10
15
20
25
30
35
40
‘Prinzipien der Mathematik’
5
10
15
207
Denn was zunächst die ersten beiden Paradoxien betrifft, so findet auf diese unser Postulat gar keine Anwendung, nämlich auf die erste nicht, weil hier die Funktion Pd (Pn ) gemäss ihrer Definition bereits prädikativ ist, und auf die zweite nicht, weil es nur die Funktionsausdrücke, nicht aber die Darstellungen von Aussagen betrifft. Bei der dritten Paradoxie liegt allerdings eine Anwendungsmöglichkeit für unser Postulat vor. Hier beruhte die durch den Stufen-Kalkül bewirkte Aufhebung des Widerspruchs darauf, dass die Stufe der Funktion Mds(x) um 1 höher ist als der Index des (in ihrer Definition implizite auftretenden) FunktionsZeichens P . Dies ist nun eine Gelegenheit, um unsere neue Annahme zur Geltung zu bringen; wir können jetzt die Existenz eines zu Mds(x) äquivalenten Prädikates erster Stufe behaupten. Dadurch wird aber nicht etwa die Wiederkehr des früheren Widerspruchs herbeigeführt. Denn mit der Behauptung der Existenz eines zu Mds(x) äquivalenten Prädikates haben wir ja noch nicht einen symbolischen Ausdruck für ein solches Prädikat aufgeschrieben und können daher nicht voraussetzen, dass die Funktion Scr auf so ein Prädikat zutrifft, sodass eine wesentliche Be|dingung für das Zustandekommen des Widerspruchs wegfällt. Anwendung auf die Identitätsbeziehung
20
25
30
Nachdem wir so die logische Zulässigkeit des Axioms der Reduzierbarkeit an den Paradoxien erprobt haben, will ich nun an Beispielen zeigen, wie die Hindernisse, welche zunächst einer fruchtbaren Anwendung des StufenKalküls entgegenstehen, durch die Einführung dieses Axioms beseitigt werden. Dabei wird übrigens das Axiom nur in der speziellen Form gebraucht werden, in welcher es sich auf Prädikate der ursprünglichen Gegenstände des Kalküls bezieht und durch die Formeln (n = 2, 3, . . . . ) (Pn )(EP1 )(x) Pn (x) = P1 (x) zur Darstellung kommt. Als ein bemerkenswerter Vorteil, den uns die Annahme dieser Formeln verschafft, ist erstlich zu erwähnen, dass sie es uns ermöglicht, die Beziehung (x)(y) ≡1 (x, y) → ≡n (x, y) streng formal (für jeden Wert von n) abzuleiten. Dies gelingt auf folgende Weise: In der Formel (Pn )(EP1 )(x) Pn (x) = P1 (x)
35
40
ersetzen wir die Variable x durch y und vereinigen die so entstehende Formel mit der vorigen, sodass wir (Pn )(EP1 )(x)(y) Pn (x) = P1 (x) + Pn (y) = P1 (y) erhalten. Nun ziehen wir die richtige Formel (Pn )(P1 )(x)(y) Pn (x) = P1 (x) + Pn (y) = P1 (y) → P1 (x) = P1 (y) → Pn (x) = Pn (y)
234
208
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
hinzu, aus welcher nach der Regel s) die Formel (Pn )(EP1 )(x)(y) Pn (x) = P1 (x) + Pn (y) = P1 (y) → (Pn )(EP1 )(x)(y) P1 (x) = P1 (y) → Pn (x) = Pn (y) 235
gefolgert werden kann. Da die linke Seite dieser Folge-Beziehung als richtige Formel erkannt ist, so folgt (Pn )(EP1 )(x)(y) P1 (x) = P1 (y) → Pn (x) = Pn (y) .
5
Hieraus ergibt sich auf Grund der Vertauschungs-Formel (35) sowie der Vertauschungs-Regel für Allgemeinheits-Zeichen die Formel (x)(y)(Pn )(EP1 ){ P1 (x) = P1 (y) → Pn (x) = Pn (y) }, und aus dieser geht durch Umformung der Ausdruck (x)(y) (P1 ) P1 (x) = P1 (y) → (Pn ) Pn (x) = Pn (y)
10
hervor, welcher nichts anderes ist als die ausführliche Schreibweise für die zu beweisende Formel. Anwendung bei dem Cantorschen Beweise
236
Betrachten wir nun das Beispiel des Cantorschen Beweises für die Existenz überabzählbarer Mengen, bei dessen Behandlung der Stufen-Kalkül versagte. Hier wird die vorgefundene Schwierigkeit durch das neue Axiom sofort gelöst, indem sich die Existenz eines zu dem Prädikate (n + 1)-ter Stufe Pc(x) äquivalenten Prädikates erster Stufe ergibt, das als solches zu der betrachteten Menge von Prädikaten gehört und für welches (da es ja auf gerade dieselben Zahlen zutrifft wie Pc) genau so wie für Pc(x) bewiesen werden kann; dass es nicht unter den Prädikaten enthalten ist, welche durch die Beziehung R(x, Pn ) den ganzen Zahlen zugeordnet sind. Hierbei zeigt sich auch, dass schon für n = 1 der Beweis gültig ist, dass also bereits die Menge der Zahlen-Prädikate erster Stufe überabzählbar ist. Im Sinne dieser Ueberlegung gestaltet sich nun die formale Durchführung des Beweises folgendermassen: Es werde für n irgend eine ganze Zahl gewählt, die grösser als 1 ist. Dann | stellt der Ausdruck (P1 ) Rn (x, P1 ) → P1 (x) ein Prädikat des Argumentes x von höchstens n-ter Stufe dar. Die Anwendung der Regel IV ) ergibt daher: (Rn ) (Pn )(EQ1 )(x) Pn (x) = Q1 (x) → (EQ1 )(x) (P1 ) Rn (x, P1 ) → P1 (x) = Q1 (x) . Hier kann nun das Zeichen (Rn ) in das zweite Glied der FolgeBeziehung verlegt werden, sodass vor dem Folge-Zeichen nur der Ausdruck (Pn )(EQ1 )(x) Pn (x) = Q1 (x) stehen bleibt. Dieser Ausdruck geht aber aus der Formel für das Axiom der Reduzierbarkeit hervor, indem das dort auftretende Zeichen P durch Q ersetzt wird, was sich mit Hilfe unserer Regeln erreichen lässt. Demnach erhält man: (Rn )(EQ1 )(x) (P1 ) Rn (x, P1 ) → P1 (x) = Q1 (x) .
15
20
25
30
35
‘Prinzipien der Mathematik’
5
10
15
209
Nimmt man hierzu die aus der Regel IV ) folgende Formel (Rn )(Q1 )(x) (P1 ) Rn (x, P1 ) → P1 (x) → Rn (x, Q1 ) → Q1 (x) und wendet die gewöhnlichen Schlussmethoden des Kalküls an (d. h. die anfänglichen Formeln und Regeln in Verbindung mit den Regeln I ), II ), III ) ), so gelangt man zu der Formel (Rn ) (P1 )(Q1 ) (Ex) Rn (x, P1 ) + Rn (x, Q1 ) → (x) P1 (x) = Q1 (x) → (EQ1 )(x)Rn (x, Q1 ) . Diese Formel besagt nun:„Wenn eine Beziehung n-ter Stufe (— die Zahl n ist dabei beliebig —), welche Gegenstände gewisser Art mit Prädikaten erster Stufe von solchen Gegenständen verknüpft, so beschaffen ist, dass durch sie zwei Prädikate nur dann einem und demselben Gegenstande zugeordnet sein können, wenn sie äquivalent sind, so gibt es unter den Prädikaten der betrachteten Art mindestens eines, welches keinem Gegenstande zugeordnet ist“. | Hierin ist als Spezialfall der Satz enthalten, dass die Prädikate erster Stufe von Zahlen sich nicht umkehrbar eindeutig den Zahlen selbst oder einer Teil-Gesamtheit der Zahlen zuordnen lassen. Und das sollte ja gerade bewiesen werden.1)
237
Anwendung auf die Dedekindsche Theorie der reellen Zahlen
20
25
30
35
Ein besonders wichtiger Anwendungsfall für das Reduzierbarkeits-Axiom findet sich bei der Grundlegung der Theorie der reellen Zahlen. Hier handelt es sich darum, die reellen Zahlen auf die rationalen Zahlen zurückzuführen. Nach Dedekind definiert man eine reelle Zahl als einen „Schnitt“, d. h. als eine Einteilung der rationalen Zahlen in zwei Klassen, bei welcher jede der beiden Klassen mindestens eine Zahl enthält, ferner die erste Klasse keine grösste Zahl enthält und bei der die Zahlen der ersten Klasse sämtlich kleiner sind als die der zweiten Klasse. Dieses Verfahren können wir in unserem Kalkül nachbilden. Wir brauchen ja bei einer Einteilung der beschriebenen Art immer nur die erste der beiden Klassen zu betrachten und haben es dann mit einer Menge von rationalen Zahlen zu tun, welche sich mit Hilfe einer sie definierenden Funktion darstellen lässt. Wir gehen demnach folgendermassen vor: wir nehmen die rationalen Zahlen mit ihren arithmetischen Grundbeziehungen als das System der Gegenstände unseres Kalküls und verstehen unter einer reellen Zahl eine Menge von rationalen Zahlen, für welche | es ein definierendes Prädikat P gibt, das folgenden drei Bedingungen genügt: (Ex)P (x) + (Ex)P (x) (1) 1)
Die Tatsache, dass bei dem erhaltenen allgemeineren Satz anstelle der Voraussetzung der eindeutigen Bestimmtheit des einem Gegenstande zugeordneten Prädikates bloss die schwächere Voraussetzung auftritt, dass einem und demselben Gegenstande nur äquivalente Prädikate zugeordnet sein können, kommt wesentlich zur Geltung, wenn es sich darum handelt, die Ueberabzählbarkeit anstatt für die Menge der Zahlen-Prädikate für die Menge der Zahlen-Mengen zu beweisen.
238
210
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
(„es gibt mindestens eine rationale Zahl, für welche P zutrifft, und mindestens eine, für welche P nicht zutrifft.“) (x) P (x) → (Ey) <(x, y) + P (y) (2) („zu jeder rationalen Zahl, welche die Eigenschaft P besitzt, gibt es eine grössere, welche gleichfalls diese Eigenschaft besitzt.“) (x) P (x) → (y) <(y, x) → P (y) (3) („wenn eine rationale Zahl die Eigenschaft P besitzt, so hat jede kleinere rationale Zahl diese Eigenschaft.“) Verbinden wir die drei angegebenen Ausdrücke durch +-Zeichen, so erhalten wir die Darstellung derjenigen Eigenschaft, durch welche die Prädikate gekennzeichnet sind, die einen Dedekindschen Schnitt bestimmen. Zur Abkürzung für diese Funktion von P wollen wir das Zeichen Ded (P ) gebrauchen. (Man beachte, dass die Funktion Ded (P ) eine von denjenigen PrädikatenFunktionen ist, deren Zutreffen oder Nicht-Zutreffen für ein Prädikat P eindeutig durch die zu P gehörige Menge m(P ) bestimmt ist.) Beispiele von Prädikaten, welche die Bedingung Ded (P ) erfüllen, sind: <(x, 1), wodurch die √ „reelle Zahl 1“ definiert wird; wodurch 2 definiert wird; <(x2, 2),
1 ) , wodurch sich π definieren lässt.1) (Ey) <(x2 , 6 · 2 m
5
10
15
m
239
Wir müssen nun noch der Forderung des Stufen-Kalküls Rechnung tragen, indem wir für die Prädikate, welche wir zur Definition reeller Zahlen zulassen, eine Höchststufe festsetzen. Dies ist nötig, sofern wir, wie es ja in der Analysis fortwährend geschieht, mit Gesamtheiten von reellen Zahlen operieren. Um möglichst einfach zu verfahren, wollen wir die Bestimmung so treffen, dass als reelle Zahlen nur solche Mengen angesehen werden, die sich durch ein Prädikat erster Stufe definieren lassen. Diese Bedingung ist z.B. bei den Mengen erfüllt, welche zu den drei eben angeführten Prädikaten gehören, da ja diese Prädikate von erster Stufe sind. Für die Begründung der Analysis kommt es nun vor allem auf den Beweis des Satzes an, dass jede Menge von reellen Zahlen, sofern sie beschränkt ist, eine obere Grenze besitzt. Um die in diesem Satz neu auftretenden Begriffe im Rahmen unserer logischen Theorie zu erklären, ist es notwendig, zunächst die Grössen-Vergleichung für die reellen Zahlen einzuführen. Durch Anwendung der für die Relation <(x, y) geltenden Formel (x)(y) <(x, y) × <(y, x) × ≡(x, y) lässt sich beweisen, dass für zwei Prädikate P (x), Q(x), welche beide der (in dem Ausdruck von Ded enthaltenen) Bedingung (3) genügen, stets mindestens eine der beiden Beziehungen (x) P (x) → Q(x) , (x) Q(x) → P (x) 1)
Die Zeichenverbindung 6 ·
m
schen Symbolik zu deuten.
1 m2
ist hier im Sinne der gewöhnlichen arithmeti-
20
25
30
35
‘Prinzipien der Mathematik’
5
10
15
20
25
30
35
40
45
211
besteht. Dies bedeutet, dass mindestens eine der beiden Mengen m(P ), m(Q) Teilmenge der anderen ist. Die Bedingung (3) ist aber für jedes definierende Prädikat einer reellen Zahl erfüllt. | Also folgt, dass von zwei Mengen, welche reelle Zahlen bilden, mindestens eine als Teilmenge in der anderen enthalten ist. Und da ausserdem die Beziehung einer Teilmenge zur ganzen Menge transitiv ist (was sich in unserem Kalkül aus der Transitivität der Folge-Beziehung ergibt), so erhalten wir eine Ordnung der reellen Zahlen nach der Grösse, indem wir von zwei verschiedenen reellen Zahlen diejenige, welche Teilmenge der anderen ist, die kleinere und die andre die grössere nennen. Für den Kalkül Grössen-Verhältnis folgendermassen dar: stellt sich dieses Die Formel (x) P (x) → Q(x) (in welcher P und Q definierende Prädikate von reellen Zahlen bedeuten sollen) besagt, dass die reelle Zahl m(P ) eine Teilmenge von m(Q) ist, dass also m(P ) entweder kleiner ist als m(Q) oder mit m(Q) übereinstimmt, oder, was auf dasselbe hinauskommt, dass m(P ) nicht grösser ist als m(Q). Ebenso bedeutet (x) Q(x) → P (x) , dass m(Q) nicht grösser ist als m(P ), dass also m(P ) nicht kleiner ist als m(Q). Der Fall, dass m(P ) kleiner als m(Q) ist, durch das Gegenteil des vorigen wird demnach Ausdrucks, d. h. durch (Ex) P (x) + Q(x) dargestellt. Jetzt können wir die Begriffe der Beschränktheit und der oberen Grenze von Mengen reeller Zahlen nach der üblichen Art folgendermassen definieren: Wir sagen von einer Menge reeller Zahlen M, dass sie eine reelle Zahl m(P ) als obere Schranke habe, wenn ihre Elemente sämtlich nicht grösser als m(P ) sind; und wir nennen eine Menge von reellen Zahlen beschränkt, wenn sie irgend eine obere Schranke besitzt. Ferner bezeichnen wir eine reelle Zahl als obere Grenze einer Menge von reellen Zahlen, falls sie für diese Menge die kleinste obere Schranke bildet. Hiernach ist der Satz von der oberen Grenze gleichbedeutend mit folgender Behauptung: „Wenn eine Menge von reellen Zahlen überhaupt eine obere Schranke hat, so hat sie auch eine kleinste obere Schranke“. Zum Beweise dieser Behauptung verfährt man in der Mathematik so, dass man eine beschränkte Menge von reellen Zahlen als gegeben annimmt, sodann zu dieser Menge (welche ja eine Menge von Mengen rationaler Zahlen ist) die Vereinigungs-Menge bildet und von dieser nachweist, dass sie in bezug auf die ursprüngliche Menge die Eigenschaften der oberen Grenze besitzt. Um nun diesem Gedankengange entsprechend den Beweis mit Hilfe unseres Kalküls auszuführen, denken wir uns zunächst jede Menge M von reellen Zahlen als Menge von Mengen durch eine ihr entsprechende Prädikaten-Funktion F (P ) repräsentiert, sodass also F gerade für diejenigen Prädikate zutrifft, welche eine zu M gehörige reelle Zahl definieren. Da gemäss unserer Festsetzung als reelle Zahlen nur solche Mengen anzusehen sind, die sich durch ein Prädikat erster Stufe definieren lassen, so brauchen als Argumentwerte von F (P ) nur Prädikate erster Stufe in Betracht gezogen zu werden. Was die Bestimmung der Höchststufe für die Funktion F selbst betrifft, so muss diese mindestens gleich 2 gewählt werden, da ja F (P ) als PrädikatenFunktion nicht der ersten Stufe angehören kann; im übrigen ist sie aber ganz beliebig, und wir | wollen, um unsere Betrachtung gemeinsam für alle hier
240
241
242
212
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
möglichen Entscheidungen durchzuführen, (entsprechend, wie wir es schon mehrfach getan haben) mit dem unbestimmten Zahl-Zeichen n als Index von F operieren. (Dass überhaupt für F eine Höchststufe festgelegt wird, ist deshalb erforderlich, weil der Satz von der oberen Grenze sich auf die Gesamtheit der beschränkten Mengen reeller Zahlen bezieht, sodass bei seiner Formulierung das Funktions-Zeichen F als unbestimmtes Zeichen auftritt.) Die Einführung der Prädikaten-Funktionen Fn (P1 ) gestattet uns nun, die verschiedenen logischen Bestandteile des zu beweisenden Satzes in der Symbolik unseres Kalküls auszudrücken. Die Bedingung dafür, dass die durch Fn (P1 ) repräsentierte Menge M eine Menge von reellen Zahlen ist, wird dargestellt durch die Formel (P1 ) Fn (P1 ) → Ded (P1 ) („Fn (P1 ) trifft nur für solche Prädikate zu, welche einen Dedekindschen Schnitt bestimmen“). Die Eigenschaft, welche einem Prädikate P1 zukommt, sofern m(P1 ) eine obere Schranke von M bildet, stellt sich dar durch die Formel Ded (P1 ) + (Q1 ) Fn (Q1 ) → (x) Q1 (x) → P1 (x)
243
(„P1 bestimmt einen Dedekindschen Schnitt, und die Menge m(P1 ) enthält jedes Element m(Q1 ) von M als Teilmenge“), wofür wir zur Abkürzung Sch(P1 , Fn ) schreiben wollen. Und mit Anwendung dieses neuen Symbols lässt sich die Eigenschaft eines Prädikates G1 , eine obere Grenze von M, d. h. eine kleinste obere Schranke von M zu definieren, durch den Ausdruck Sch(G1 , Fn ) + (P1 ) Sch(P1 , Fn ) → (x) G1 (x) → P1 (x) („G1 erfüllt in bezug auf die Menge M die Bedingung Sch und ist eine Teilmenge jeder Menge m(P1 ), bei welcher P1 der Bedingung Sch genügt“) zur Darstellung bringen, für welchen wiederum als abkürzendes Zeichen Gr (G1 , Fn ) gesetzt werden möge.1) Indem wir diese verschiedenen Ausdrücke vereinigen, ergibt sich für den Satz von der oberen Grenze folgende symbolische Formulierung: (Fn ) (P1 ) Fn (P1 ) → Ded (P1 ) + (EP1 )Sch(P1 , Fn ) → (EG1 )Gr (G1 , Fn ) . Suchen wir uns jetzt die Methode der Ableitung dieser Formel an Hand des vorhin angedeuteten Beweisverfahrens zurechtzulegen, so handelt es sich darum, zu einer als gegeben angenommenen beschränkten Menge M von reellen Zahlen, welcher die Prädikaten-Funktion Fn (P1 ) entsprechen möge, die Vereinigungs-Menge zu bilden, d. h. einen definierenden Ausdruck für sie aufzustellen und mit Hilfe dieses Ausdrucks zu beweisen, dass die VereinigungsMenge eine obere Grenze von M bildet. 1)
Für das Folgende ist zu beachten, dass die Ausdrücke Sch(P, Fn ) und Gr (P, Fn ) auch für Prädikate P von höherer als erster Stufe (ohne Sinnlosigkeit) gebildet werden können. Bei der vorliegenden Betrachtung kommt man mit Prädikaten von höchstens n-ter Stufe als Argumentwerten von P aus.
5
10
15
20
25
30
35
‘Prinzipien der Mathematik’
5
10
15
20
25
30
213
Nun lautet, wie wir früher fanden, der Ausdruck, welcher sich aus der allgemeinen Definition der Vereinigungs-Menge ergibt, (bei Einführung unserer Index-Bezeichnung): (EP1 ) Fn (P1 ) + P1 (x) . Von diesem Ausdruck, welcher ja für eine fest gegebene Prädikaten-Funktion Fn ein be|stimmtes Prädikat von x darstellt und der im Folgenden kurz mit Vg(x, Fn ) bezeichnet werde, soll also gezeigt werden, dass er eine reelle Zahl definiert, welche obere Grenze der Menge ist. Nun lässt sich in der Tat (wenn einstweilen Fn wie ein Zeichen für eine bestimmte Funktion behandelt wird) unter Anwendung der Voraussetzungen (P1 ) Fn (P1 ) → Ded (P1 ) (womit Fn (P1 ) als entsprechende PrädikatenFunktion einer Menge von reellen Zahlen charakterisiert wird) und (EP1 )Sch(P1 , Fn ) (wodurch die Annahme der Beschränktheit der durch Fn repräsentierten Menge zum Ausdruck kommt) nach den Regeln unseres Kal- küls beweisen, dass das Prädikat Vg(x, Fn ) der Bedingung Gr Vg(x, Fn ), Fn genügt. Jedoch kann daraus noch nicht geschlossen werden, dass die zu dem Prädikat Vg(x, Fn ) gehörige Menge eine obere Grenze von M bildet. Denn hierzu müsste erst erwiesen sein, dass diese Menge überhaupt eine reelle Zahl ist, und dies ist ja nur dann der Fall, wenn die Menge durch ein Prädikat erster Stufe definierbar ist. Nun ist aber Vg(x, Fn ) sicher kein Ausdruck der ersten Stufe, weil ja darin Zeichen P1 auftritt.1) Wir müssen das unbestimmte also, um die Menge m Vg(x, Fn ) als reelle Zahl zu erkennen, erst | wissen, dass unter den definierenden Prädikaten dieser Menge mindestens eines der ersten Stufe angehört, das heisst dass es ein zu Vg(x, Fn ) äquivalentes Prädikat erster Stufe gibt. Diese Bemerkung weist uns nun geradeswegs auf das Axiom der Reduzierbarkeit hin, welches ja in Anwendung auf das Prädikat Vg(x, Fn ) genau das postuliert, was hier zur Vervollständigung des Beweises nötig ist, nämlich die Existenz eines Prädikates erster Stufe, welches mit jenem Prädikate äquivalent ist. Durch die Einführung dieser Annahme gelangen wir aber sofort zum Ziel. Denn die Bedingung Gr (P, Fn ) ist von der Art, dass sie, wenn ein Prädikat P ihr genügt, auch durch jedes mit P äquivalente Prädikat erfüllt wird. Wenn daher G1 ein mit Vg(x, Fn ) äquivalentes Prädikat erster Stufe ist, so 1)
Diese Schwierigkeit lässt sich nicht etwa dadurch vermeiden, dass man bei der Definition der reellen Zahlen die Forderung der Definierbarkeit durch ein Prädikat erster Stufe dahin abschwächt, dass man nur verlangt, es solle für jede reelle Zahl ein definierendes Prädikat von höchstens n-ter Stufe geben (wo n eine gewisse grössere Zahl als 1 bedeutet). Denn zufolge dieser geänderten Begriffsbestimmung müssten als Argumente der Prädikaten-Funktion F (P ) Prädikate bis zur n-ten Stufe zugelassen werden; es würde daher in dem definierenden Ausdruck für die VereinigungsMenge einer Menge M von reellen Zahlen anstelle von P1 das Zeichen Pn treten und somit würde dieser Ausdruck ein Prädikat von mindestens (n + 1)-ter Stufe darstellen, durch welches dann die zugehörige Menge wiederum noch nicht als reelle Zahl charakterisiert wäre.
244
245
214
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
folgt aus der bewiesenen Beziehung Gr Vg(x, Fn ), Fn , dass auch Gr (G1 , Fn) besteht, und damit erweist sich die Menge m(G1 ), welche mit m Vg(x, Fn ) übereinstimmt, als obere Grenze für die Menge M. Bei Ausschaltung aller inhaltlichen Argumentation nimmt der Beweis folgenden Verlauf: Zunächst werden unabhängig vom Axiom der Reduzierbarkeit die beiden Formeln (Fn ) (P1 ) Fn (P1 ) → Ded (P1 ) + (EP1 )Sch(P1 , Fn ) → Gr Vg(x, Fn ), Fn
5
und
(Fn )(G1 ) (x) Vg(x, Fn ) = G1 (x) → Gr Vg(x, Fn ), Fn → Gr (G1 , Fn )
246
abgeleitet. Dann wird das Axiom der Reduzierbarkeit durch die Formel (Pn )(EP1 )(x) Pn (x) = P1 (x)
10
eingeführt, aus welcher man als Folgerung (unter Anwendung der Regel IV )) (Fn )(EG1 )(x) Vg(x, Fn ) = G1 (x) erhält, und durch die Vereinigung dieser Formel mit den beiden ersten ergibt sich in einfacher Weise die Beziehung (Fn ) (P1 ) Fn (P1 ) → Ded (P1 ) + (EP1 )Sch(P1 , Fn ) → (EG1 )Gr (G1 , Fn ) , welche den symbolischen Ausdruck der zu beweisenden Behauptung bildet. — So zeigt sich, dass die Einführung des Axioms der Reduzierbarkeit das geeignete Mittel ist, um den Stufen-Kalkül zu einem System zu gestalten, aus welchem die Grundlagen der höheren Mathematik entwickelt werden können.
15
20
Textual Notes
215
Textual Notes 60.29:
60.30: 61.40: 64.6: 65.2: 65.30:
65.30: 65.35–37: 65.37: 66.8–9:
66.32: 66.33: 67.18: 67.19: 67.19: 67.27: 68.5–6: 68.15:
69.17: 69.17: 69.18: 69n:
70.12–16: 71.10–25: 71.30–41: 72.7: 72.19: 72.24: 73.18:
Anwendungsbeispiele] In the original table of contents, this entry was mistakenly placed directly above the title of Chapter 2. This is presumably why the page numbers have been circled by Hilbert (pencil). Systematische . . . Prädikaten-Kalküls 98–106] Added by Bernays. )] überhaupt] Added by Hilbert (pencil). )] Added by hand. Bei] Hilbert (pencil) has placed in the left-hand margin: . This sign, like other such signs throughout the typescript, appears to be a marking-off by Hilbert, for some unknown purpose, of some larger portion of text, and to correlate with the sign ⊥ mentioned in textual note 68.15. nicht . . . sondern] Enclosed in parentheses by Hilbert (pencil). wie . . . arithmetischen Axiomen] Enclosed in parentheses by Hilbert (pencil). auch] Enclosed in parentheses by Hilbert (pencil). bestimmen nur diese eine Gerade] The typescript originally read: ‘bestimmen diese Gerade’. Hilbert (pencil) first changed this to ‘bestimmen diese Gerade eindeutig’, then deleted ‘eindeutig’ and added ‘nur’ and ‘eine’. als eine in sich] als in sich Schnittpunktsätze] Underlined by Hilbert (pencil). „Halbstrahlen“] Underlined by Hilbert (pencil). „Halbebenen“] Underlined by Hilbert (pencil). „Halbräume“] Underlined by Hilbert (pencil). einfache Polygon] Underlined by Hilbert (pencil). geometrischen . . . (nichtidentischen)] Enclosed in parentheses by Hilbert (pencil). ausdrücken.] The line continues with ‘Diese . . . ’, but a paragraph break has been signalled by hand. In the left-hand margin, Hilbert (pencil) has placed the sign ⊥. This appears to be a reference to the similar sign in Textual Note 65.30. a] Substituted by Hilbert (pencil) for: g a ] Substituted by Hilbert (pencil) for: g a ] Substituted by Hilbert (pencil) for: g ] In the original diagram, the directions of the parentheses are reversed. They have been changed here in order to make them consistent with the other diagrams. Zu . . . wird.] Enclosed in parentheses by Hilbert (pencil). Den . . . steht.] Enclosed in parentheses by Hilbert (pencil). Des . . . sind.1) ] Enclosed in parentheses by Hilbert (pencil). gleich] The typesript reads ‘gleich gross’; Bernays has deleted ‘gross’. Anwendung] Bernays has crossed out ‘Bedeutung’ and ‘Anwendung’ has been typed in.. im Dreieck] Added by Hilbert (pencil). 1) ] Circled by Hilbert (pencil).
216
Chapter 1
73.21–74.12: 73.24: 74.22: 74.24: 74.26–29: 74n: 74n:
75.5–6: 75n: 76.7–25: 76.26: 76n: 77.9–12: 78.1: 78.8: 78.32: 79.8–12: 79.13:
81.25:
81.27: 81.28–30: 81.33: 81.33–34: 82.14: 84.4: 84.16: 85.20: 85.23: 86.9:
87.39:
88.8–9: 88.12:
Lectures on the Principles of Mathematics (1917/18)
Schliesslich . . . ist.] Enclosed in parentheses by Hilbert (pencil). B] Substituted by Bernays for: D in . . . α] Enclosed in parentheses by Hilbert (pencil). in . . . und] Enclosed in parentheses by Hilbert (pencil). zieht . . . könnten.] Enclosed in parentheses by Hilbert (pencil). schneidet . . . a] Hilbert (pencil) originally wrote ‘b a’ Denn] Hilbert (pencil) originally wrote ‘Denn etc. unten.’ but deleted the last two words (which are partly illegible), and replaced them with the arrow mentioned in the footnote. ganz . . . Arithmetik.] Enclosed in parentheses by Hilbert (pencil). und merkwürdigste] Added by Hilbert (pencil). Zu . . . Axiomensystems.] Enclosed in parentheses by Hilbert (pencil). Widerspruchslosigkeit] Hilbert (pencil) adds as an alternative: -freiheit auch wirklich] Added by Hilbert (pencil). für . . . ist.] Enclosed in parentheses by Hilbert (pencil). 1) ] Circled by Hilbert (pencil). eventuell] ev. schneidet.] Added by Hilbert (pencil) in left-hand margin: ⊥ Dieser . . . erweist.] Enclosed in parentheses by Hilbert (pencil). Die Lösung] Hilbert (pencil) has added a left parenthesis at the beginning of this paragraph; the corresponding right paranthesis is missing. Wir waren] Added by Hilbert (pencil) at the top of the page: Hier! It is unclear what this remark means; but the previous page of the typescript ends half-way down the page. nachzuweisen.] Added by Hilbert (pencil) at the end of the sentence:
mich . . . einer] Enclosed in parentheses by Hilbert (pencil). Als Punkte] Added by Hilbert (pencil) in the left-hand margin:
die Zahlenpaare . . . gesprochen] Enclosed in parentheses by Hilbert (pencil). erhalten.] Added by Hilbert (pencil) in the right-hand margin:
P1 P2 ] Subscripts supplied by Hilbert (pencil). Dieselben] Added by Hilbert (pencil) in the left-hand margin:
Meine Damen und Herren a] Throughout this paragraph and its accompanying diagram, Hilbert has changed ‘g’ to ‘a’, missing the change only at 85.23. a] See previous note. Ziehen] Hilbert (pencil) comments in the left-hand margin: Hier einschalten Kugel- und Strahlengeometrie Kolleg W.S. 21/22 S. 27– 28 vorkommt.] Hilbert (pencil) here comments in the left-hand margin: Allgemeineres Nicht-Archimedisches vgl. die Vorlesung 21/22 S. 29 and adds: ⊥ wünscht . . . zu] Underlined by Hilbert (pencil) with an undulating line. der . . . Geometrie] Added by Hilbert (pencil).
Textual Notes
217
D = C.] After ‘D = C’, Hilbert (ink) deleted his original continuation: BAC ≡ BAD folglich CAB = DAB = 1 Rechtem also hatte die Gerade CAD 88n: Folglich] folglich 90.15: festgelegt] Corrected by Hilbert (pencil) from: fetgelegt 91.11: Hierfür] Added by Hilbert (pencil) in the left-hand margin:
91.32–33: Nur . . . Punkt.] Enclosed in parentheses by Hilbert (pencil). 91.35–37: und in . . . wollen).] Enclosed in parentheses by Hilbert (pencil). 91.41–92.3: Aus . . . steht.] Enclosed in parentheses by Hilbert (pencil). 92.16–17: dem . . . Nebenwinkel ist,] Enclosed in parentheses by Hilbert (pencil). Above the left parenthesis, Hilbert (pencil) has added: AEO 92.25: OE ] OE Corrected by Hilbert (pencil). 92.26: OA ] OA Corrected by Hilbert (pencil). 92.26: E ] E Corrected by Hilbert (pencil). 92.26: A ] A Corrected by Hilbert (pencil). 94.4: mit der ersten] Added by Bernays (ink). 94.13: BQ und P R ] P R und BQ Order reversed by Hilbert (pencil) 96.7: d = lc,] d = lc 96.8: lbc,] lbc 96.26–27: Somit erhalten wir] Added by Bernays (ink). 97.28–29: ergänzungsgleich] Here and in all cognate cases in this and the next two paragraphs, Bernays has changed the terminology from: inhaltsgleich 98.6: erkannt wird] Bernays has added after the sentence the correction sign: F 98.19: komplizierten Inhalt] Underlined by Hilbert (pencil). 100.1: gerichtete Strecken] Underlined by Hilbert (pencil). 100.8–9: bei . . . Dreiecks] Enclosed in parentheses by Hilbert (pencil). 100.13–16: Ausser . . . lässt.] Hilbert (pencil) has added on back of p. 52, facing p. 53: AB + BC = AC! 100.27–28: , von . . . liege,1) ] Enclosed in parentheses by Hilbert (pencil). 102.25: J(ODr C)] Wrongly crossed out by Hilbert (pencil) and replaced by: [OBC] 103.1–2: d. h. . . . Dreiecks.] Marked by Hilbert (pencil) with a stroke in the left-hand margin. 104.5–6: Um . . . haben.] Enclosed in parentheses by Hilbert (pencil). 104.20: oder mehrere] Enclosed in parentheses by Hilbert (pencil). 105.6: werden . . . machen] Enclosed in parentheses by Hilbert (pencil) and then replaced by: beweisen wir zunächst 105.8–106.13: Dies . . . ist.] Enclosed in parentheses by Hilbert (pencil). 106.20: Länge 1.] Länge 1. [[Diese Dreiecke sind nun einander er-]] deleted by Bernays 106.31: Rauminhalte] Typescript reads: Flächeninhalte 106.37: Dehn] Added by Hilbert (pencil). 106.37: erbringen.] Added by Hilbert (pencil) in the left-hand margin: ⊥ 113.2–3: in entwickelter Form] Added by Bernays. 114.32: X,] Added by Bernays. 115.8: auch] [[(unter Anwendung von VI)]] auch Bracketed phrase deleted by Bernays. 115.39: , VII] Added by Bernays. 88n:
218
Chapter 1
116.40: 119.9: 126.35: 128.18: 129.11–12: 130.6:
136.9: 136.21: 136.22:
137.2: 137.13: 138.34–35: 139.22: 139.30: 141.39: 141.42: 142.3: 142.10: 144.21: 144.21: 148n:
149.23–24: 150.3: 150.31: 151.14–15: 152n: 155.19: 157.41: 159n: 161.19: 164.13:
164.28: 166.37: 168.3: 176.28:
Lectures on the Principles of Mathematics (1917/18)
Wenn] wenn wieder] Added by Bernays. Schlusssatz] Schlussatz Schlusssatz] Schlussatz U = 1, W = 1, U = W ] U = 1, W = 1, U = W camestres] Here and in the next two paragaphs, the names for the syllogistic figures have been handwritten by Bernays, mostly in blank spaces left in the typescript. 1) ] Footnote in Bernays’s hand. zunächst] Added by hand, probably that of Bernays. 1) ] Footnote handwritten, almost certainly by Bernays. The next footnote, now note ‘2)’ in this reproduction of the text, was typed and marked in the text as ‘1)’. This handwritten footnote was then added at the very bottom of the page, and marked with a ‘†’ with a corresponding ‘†’ in the text, indicating it as the first footnote on the page. (Ex)P (x) . . . besteht;] Added by Bernays. auskommen] ausreichen Replaced by editor. x und . . . Frau] [[y Frau von x ist und x, y]]--↑x und y als Mann und Frau↓ Substitution by Bernays. Existenzial] Existential Existenzial-Zeichen] Existentialzeichen sind] sind ↑und > 0 ausfallen↓ Added by Hilbert (pencil), as further simplication. Cf. also the following textual notes. |fn (x)|] Absolute value signs deleted by Hilbert (pencil). bedeutet . . . fn (x),] Enclosed in parentheses by Hilbert (pencil). |fn (x)|] Absolute value signs deleted by Hilbert (pencil). F (.)] F (·) G( . , . , . . . )] G(· , · , . . . ) (was ja nicht . . . wir] , so müssen wir ↑(was ja nicht unbedingt nötig wäre)↓ Added by Bernays in the left-hand margin and inserted by a correction mark after ‘wir’. in . . . und] Added by Bernays. logische] Throughout pages 138–140 ‘logische’ is added by Bernays to ‘Aussagen-Formeln’. Verbindungen] Substituted by Bernays for: Formeln (In . . . werden.)] Added by Bernays. zufolge der Axiome] Added by Bernays. für X + Y ] Added by Bernays. stets] Added by Bernays. Funktionszeichen] Funktionzeichen die Formel] Added by Bernays. also . . . (Ex):] [[Andrerseits folgt aus]] deleted by Hilbert (pencil) ↑also, nach↓ added by Bernays der Definition von (Ex): [[und der Regel i) (Ex)F (x) = (x)F (x), also ergibt sich]] deleted by Hilbert (pencil) gegenwärtigen] Added by Bernays. richtigen] Added by Bernays. (konstanten)] Added by Bernays. von der die] Substituted by Bernays for: deren
Textual Notes 176.30: 177.26: 178n: 181.32:
182.26: 182.28: 187.1: 187.3: 187.34: 188.21: 189.8: 189.25: 191.4: 191.35: 194.4: 195.14: 196.32: 198.34: 200.29–30: 200.42: 201.16–17: 203.1: 205.39: 207.40: 209.7: 212.31:
219
≡(x, y)] (x, y) und das] Added by Bernays: das jedesmal] Added by Bernays. (EF )(Ex)(Ey)F (x, y) . . . (EF )] In the last displayed formula, and in the existential (but not the universal) quantifier in the first line after, Bernays has written in ‘F ’ by hand in apparently empty spaces; however, for the sake of uniformity, the Editors have put ‘F ’ throughout, judging the partial change of no systematic significance. Sym(R):] Hilbert (pencil) has inserted the symbol ‘’ after the colon. Beide . . . erfüllt,] Enclosed in parentheses by Hilbert (pencil). M] Added by the Editors. M] Added by the Editors. logischen] Substituted by Bernays for: richtigen F ] F In Bernays’s hand, see textual note 181.32. logischen] Substituted by Bernays for: richtigen logische] Substituted by Bernays for: richtige logischen] Substituted by Bernays for: richtigen logische] Substituted by Bernays for: richtige Russell] Russel (A,X)] (AX) symbolisch] symblisch Widersprüchen] Substituted by Bernays for: Paradoxien , zu . . . gehören,] Added by Bernays. F ] F In Bernays’s hand, see textual note 181.32. in die Formel X = X] Added by Bernays. sodass] Substituted by Bernays for: indem Russell] Russel
→ P1 (x) . . . Pn (y) ] Square brackets added by the Editors. }] Added by the Editors. (EP1 )] (EP )
220
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Description of the Text Collection: Georg-August Universität Göttingen, Mathematisches Institut, Inv. Nr. 6817a. The ms. also bears the numbers 44a and 68, the latter being the number in the present catalogue list. Size: Cover size approximately 23.0 × 28.4 cm; page size approximately 22.2 × 27.5 cm. Cover Annotations: The inscription ‘HILBERT // Prinzipien // der // Mathematik // u. Logik // W.S. // 1917–18’ is in gold lettering on the spine. At the top left of the inside front cover is written ‘87,’ which replaces a stricken through ‘82’. The inside back cover carries the number 6817a written in the top right-hand corner. Composition: Thirteen signatures, consisting of five to twelve pages each, bound together in cardboard covers. The inside front cover has one page of ordinary paper pasted onto it with text in Hilbert’s hand, with the heading ‘Zu S. 37’, likewise in Hilbert’s hand. On p. 37 of the text are pencilled comments, with the instruction ‘Zusatz vgl. Einbanddeckel’, all in Hilbert’s hand. Pagination: The title page is unnumbered; it is followed by 7 pages with the Table of Contents, which are numbered continuously from I to VII in the top righthand corner. The text itself is numbered continuously from 1 to 246, also in the top right-hand corner. Original Title: On the unnumbered initial page of the first signature is typed: ‘PRINZIPIEN DER MATHEMATIK // Vorlesung // von // D. HILBERT // Göttingen // Wintersemester 1917/18’. The first line is underlined. After Hilbert’s name, ‘Ausgearbeitet von // Paul Bernays’ has been inserted by hand by Bernays in black ink. Text: The text is a typescript, typed on one side of the page only. The typist has left space for the insertion of mathematical symbols, special letters, diagrams and formulas, both in-line and displayed. These were inserted by Bernays in black ink, with diagrams in black ink and pencil. Bernays also corrected typographical errors and retraced letters or underlinings that appeared to be too light. Some mistakes were corrected immediately by typing directly over the mistyped letters; some corrections/additions have been typed interlineated. Hilbert has added one heading in black ink, which Bernays seems to have forgotten, since it is in the other copy of the Ausarbeitung, 6817 (see below). All other additions to the text by Hilbert are in pencil. These include corrections and remarks, formulas, and diagrams. A library stamp reading ‘Mathematisches Institut der Universität Göttingen’ is on the back of the title page. Another copy of these lecture notes is also in the library of the Mathematisches Institut, with Inv. Nr. 6817, and other cataloguing numbers 44 and 67. (Neither the number ‘87’, nor what it replaces, ‘82’, are found in this copy.) The pages are slightly bigger than in 6817a, with larger empty margins at the top and bottom; however, the size of the Schriftbild is exactly the same. It bears the stamp ‘Lesezimmer des Math. Phys. Seminars Göttingen’ inside the front cover and on the title page. Notable differences from the copy described above (6817a) are that the title on the spine is given as ‘HILBERT // Prinzipien // der // Mathematik // W.S. 1917/18’, and that the handwritten addition to the title page is missing. Symbols, formulas, diagrams and typographical corrections have also been added by Bernays in black ink; a few footnotes, although identical in content, appear to have been added in a different hand (pp. 115–116, 120–121). This copy contains a few corrections of
Description of the Text
221
typographical errors not in the first copy described, but also misses some. Pages 1 and 186 also contain two corrections in blue ink. The only remarks in pencil in this text are an exclamation mark inserted next to the phrase ‘. . . historisches zufällig Erscheinendes als Notwendig erscheint’ on p. 23, and then on p. 214 the assertion ‘Unter diesen ist eine kleinste’ is underlined with two question marks set in the margin next to it. No other copies are known to exist. This typescript (6817) is a bit fainter than the one described above (6817a), and both the pages and the binding show more signs of wear. This, together with the fact that 6817a has annotations in Hilbert’s hand and the fact that the typewritten parts (including typing errors) are identical, suggests that 6817 and 6817a were both typed at the same time, and that 6817, being fainter, is the carbon copy. If this is correct, it would seem likely that, after the addition of the handwritten formulas and diagrams, both copies were bound, and the carbon copy was deposited in the library, while the other copy was kept by Hilbert. This copy then almost certainly came to the Lesezimmer of the Mathematical Institute after Hilbert’s death. Hilbert’s papers, left to the Mathematical Institute, were taken over by the University Library, at which point some of the bound lecture notes that had been in his possession were transferred to the library of the Institute. This would also explain why two of the inventory numbers of Hilbert’s copy are identical to those of the carbon but with an additional ‘a’, while the current catalogue assigns it a different number. The numbers ‘87’ (replacing ‘82’) appear only on 6817a, Hilbert’s copy.
222
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Appendix: The Bernays Habilitation Thesis of 1918
Introduction to Paul Bernays: ‘Beiträge zur axiomatischen Behandlung des Logik-Kalküls’ (Göttingen Habilitationsschrift, 1918)
In the spring of 1912, Paul Bernays received his Doctorate from the GeorgAugust Universität, Göttingen with a work on analytic number theory and the theory of binary quadratic forms, prepared under the direction of Edmund Landau. At the end of 1912, he submitted a Habilitationsschrift on Picard’s Theorem in function theory to the University of Zürich, and the venia legendi was conferred on 11 December. Bernays was active in Zürich as a Privatdozent for the next five years, although, by his own account, not very happily.1 As was explained in the Introduction to this Chapter, in 1917 Hilbert invited Bernays to come to Göttingen as his Assistent for the foundations of mathematics. Thus Bernays returned to Göttingen and, as he puts it, was ‘rescued from [his] somewhat imperfect situation’ by Hilbert’s interest in questions to do with the foundations of mathematics. As Bernays describes them, his duties were to assist in the preparation of various of Hilbert’s lecture courses, to prepare the protocols of many of them, and to engage in discussion with Hilbert about the latter’s investigations in the foundations of mathematics.2 1 This
account is on p. 11 of the transcript of the first of the interviews with Bernays in 1977 (Bernays 1977* ). 2 Bernays’s responsibilities clearly extended beyond the foundations of mathematics; for instance, he was the Ausarbeiter for courses in the Winter Semester 1918/19 on space and time, and a course in the Summer Semester of 1921 on relativity theory, Hilbert 1918b* and Hilbert 1921* , respectively.
Introduction to the Bernays Habilitationsschrift
223
His first work of this kind was connected to Hilbert’s lectures on the principles of mathematics for 1917/18, for which he prepared the final protocol, reproduced in this Chapter. These lectures were held from October 1917 to early February 1918. Correspondence in the Bernays Nachlaß at the ETH show that he was officially granted leave from the University of Zürich by the Education Council for the Canton only on 7 March 1918 (‘wegen Uebernahme einer Assistentenstelle an der Universität Göttingen’). However, there exists a shorthand notebook of Bernays’s3 which appears to contain notes on many of Hilbert’s actual lectures as they took place. Moreover, as was pointed out in the Introduction to this Chapter, there is internal textual evidence that the protocol for the lectures was to a large extent prepared in step with them. Thus, it seems likely both that Bernays was in Göttingen throughout this period and that he completed work on the protocol soon after the lectures had finished. At this point, if not before, Bernays turned his attention to his own work on logic. (The archival record does not establish precisely when Bernays began his research, nor how closely Hilbert was involved.) On 9 July 1918, he submitted to the Philosophische Fakultät in Göttingen his (second) Habilitationsschrift, a metamathematical investigation of the propositional logic of Whitehead and Russell’s Principia Mathematica (Whitehead and Russell 1910 ; Whitehead and Russell 1912 ; Whitehead and Russell 1913 ). According to the University Archives in Göttingen, Bernays’s Probevorlesung was delivered on 23 December 1918, and the venia legendi was conferred on 14 January 1919; the Education Council officially released Bernays from his position as Privatdozent in the University of Zürich on the very same day (14 January 1919). He was now officially Hilbert’s full-time assistant, which he remained until his supernumerary assistant’s position [außerplanmäßige Assistentenstelle] was terminated by the Curator of the University of Göttingen on 2 August 1933. His right to teach in Göttingen was withdrawn by the Prussian Minister für Wissenschaft on 21 September 1933, on the grounds that he was a ‘non-Aryan’. After six months in Hilbert’s private employ, Bernays took up a teaching position at the Eidgenössische Technische Hochschule (ETH) in Zürich in the summer of 1934, and he remained at the ETH for the rest of his career. This Appendix publishes in full for the first time Bernays’s Göttingen Habilitationsschrift. This work is an incisive application of the metalogical techniques Hilbert had introduced in his lectures some months earlier. Bernays addresses the problems of completeness, consistency, decidability and independence for the axioms of the propositional calculus, and explores the relationship between axioms and rules of inference. Hilbert’s techniques have here been sharpened, and are presented with greater analytical clarity than Hilbert had achieved in the lectures. The thesis is all the more remarkable given that Bernays had begun to study logic in earnest only the previous 3 Document Hs.973:184 in the Bernays Nachlaß, Wissenschaftshistorische Sammlung of the Bibliothek of the Eidgenössische Technische Hochschule (ETH), Zürich.
224
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
autumn.4 Although this text is not by Hilbert himself, we reproduce it here because it is so closely bound up with the developments mapped in Hilbert’s 1917/18 lectures, and sheds such light on Bernays’s own contributions (which were repeatedly stressed by Hilbert), that the development of logic in Göttingen at the hands of Hilbert and Bernays cannot be properly understood without it. The goal Bernays announces is that of a systematic investigation of the propositional axioms of Principia Mathematica, explicitly building on the ideas introduced on pp. 129–153 of Hilbert’s 1917/18 lectures. In his introductory remarks, Bernays briefly mentions the formulations of the propositional calculus in Schröder, Frege, Peano, and Principia Mathematica; as he was aware, the propositional axioms in Hilbert’s lectures were a notational variant of the Principia axioms, but with the addition of an explicit rule of substitution, and with a more precise treatment of modus ponens. The list of sources Bernays cites raises a difficult question about the extent of Bernays’s (and also Hilbert’s) detailed knowledge of the work of their logical precursors. In the Introduction to this Chapter, we quoted some remarks from the interviews Bernays gave in 1977 where he plays down his knowledge of Frege and Russell in particular.5 In fact, the 1918 thesis does not demand a detailed knowledge of logic beyond what is contained in Hilbert’s 1917/18 lecture notes. There is no reason to doubt Bernays’s remarks, but the 1918 thesis shows a greater familiarity with the logical work of Schröder than one might have expected. So it remains somewhat unclear exactly how much of the work of these earlier authors was known in Göttingen, and to whom it was known. As we also noted earlier, Heinrich Behmann was a major source of information about Principia, but the precise extent of the knowledge among the Hilbert circle during the 1920s of Peirce or Schröder or Frege or Peano is hard to establish.
1. Formal Systems. Bernays begins (§1) by describing the formal calculus for propositional logic. In contrast to Hilbert, he proceeds purely syntactically. ‘Expressions [Ausdrücke]’ are defined inductively: ‘alphabetic signs’, i. e., variables such as X, Y , Z, count as expressions; if X and Y are expressions, so are XY and X. Certain expressions are singled out as ‘correct [richtige] formulas’, namely the five enumerated propositional axioms [Grundformeln], and any expression that can be derived from the axioms by the two explicitly-stated rules of substitution and modus ponens. The other propositional connectives are then introduced as definitional abbreviations. (The brief remark in the first footnote to §1, in which Bernays refers to syntactic expressions as ‘operations’, is clearly intended as an informal meta-comment, looking ahead to the intended interpretation, and does not reflect a confusion of syntax with semantics.) 4 See 5 See
p. 52 above. the Introduction to this Chapter, n. 25.
Introduction to the Bernays Habilitationsschrift
225
Only in the next section (§2) does Bernays explain the intended interpretation of his logical calculus. In this presentation, he sharply distinguishes the syntactic properties of the system from the semantic. Such a distinction was, of course, implicit in Hilbert’s axiomatic investigations going back to the mature metamathematical work on geometry in the late 1890s, and is indeed crucial for a rigorous formulation of metamathematics. But Hilbert had hitherto not formulated the distinction with the degree of clarity Bernays achieves here. As we have seen, Hilbert’s axiom systems are always presented with an intended interpretation; and in the 1917/18 lectures, although Hilbert clearly says (p. 135, p. 147 above) that axiomatic deductions are to be carried out purely formally, and although he distinguishes the axiom system from its interpretation, his description of the syntax is nevertheless bound up with semantic notions. (See, for example, his discussion of these matters on pp. 131–132 of the lecture protocol, pp. 145f. above.) Moreover, Hilbert’s expression ‘richtige Formel’ is used ambiguously, sometimes referring to the derivable formulas, and sometimes to the valid formulas; although Hilbert does indeed show that the two classes of formulas are identical, and thus that the ambiguity is harmless, his nomenclature makes the completeness theorem less perspicuous than in Bernays’s presentation.
2. Completeness, Consistency and Decidability. Having drawn a precise distinction between the syntax and the interpretation of the calculus, Bernays next distinguishes between provable formulas and universally valid formulas. He gives the semantics for validity using the notions of ‘true’ and ‘false’, but observes at the end of §2 that nothing hinges on this particular interpretation, and that he could just as well have used an arithmetic interpretation with values 0 and 1. He then succinctly states the crucial theorem linking syntax to semantics: ‘Every provable formula is universally valid, and conversely’. In the course of establishing the syntactic or (in modern terminology) Post-completeness of the propositional calculus, Hilbert in the 1917/18 lectures also established its semantic completeness. Bernays explicitly calls attention to this result in the penultimate paragraph of his introduction. But half of Hilbert’s result is stated by him in a footnote6 , and the property of semantic completeness is not separately formulated. Bernays, in his sharpened version, brings the semantic concept fully into the open for the first time. Bernays proves the first half of his Completeness Theorem, i. e., the Soundness Theorem, using the now-standard technique of induction on syntactic derivations. In effect Bernays here adapts the technique Hilbert had employed in his proof of consistency on pp. 151–153 of the 1917/18 lectures, pp. 157ff. above. These arguments mark the principal point of advance beyond the propositional logic of Whitehead and Russell’s Principia. To give his soundness proof, Bernays employs clear distinctions between syntax and semantics on the 6 Hilbert’s
lecture notes, p. 153, n. 1, above p. 158.
226
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
one hand, and between formulas and rules of inference on the other; without these distinctions a rigorous induction on the class of derivations would not be possible. Both distinctions were blurred in the treatment of propositional logic in the Principia. Bernays next observes that his soundness result immediately establishes both that the calculus is consistent and that not every formula is provable. In the next section (§3) he observes that the converse implication, that every valid formula is provable, would follow from soundness and Post-completeness. He thereupon proves Post-completeness, essentially using the normal-form argument that Hilbert had employed in the 1917/18 lectures. It is to be noted that Bernays formulates Post-completeness somewhat differently from Hilbert’s formulation in the lectures. For Bernays, an axiom system is complete [vollständig] if the addition of any non-derivable formula makes every formula provable, rather than making the system inconsistent; this shrewd reformulation allows his definition of syntactic completeness to be readily extended to systems without negation, which he considers later in the thesis. Bernays then observes (as Hilbert had done in his 1905 lectures, Hilbert 1905a* , 249, although not in the 1917/18 lectures) that the use of normal forms in the consistency proof not only establishes consistency, but provides an effective procedure for deciding, in a finite number of steps, whether any arbitrary expression is a provable formula. ‘Accordingly,’ Bernays concludes, ‘the calculus allows itself to be completely trivialised’ (p. 16).
3. Independence. The greater part of Bernays’s thesis, from §4 to the end, is a careful and systematic investigation of the dependence and independence relationships among various groups of axioms. Hilbert had investigated similar questions in his work on geometry; he had raised the problem for the propositional calculus in his 1905 lectures (Hilbert 1905a* , 230–231) and again briefly in the 1917/18 lectures (p. 67, above p. 109). He there sketched the technique Bernays was to employ in his habilitation: in essence, to show that an axiom is independent, one provides an interpretation in which all axioms but the given one are true, whereas this given one is false.7 This device, as Bernays observes in his prefatory remarks, had earlier been employed by Schröder to establish independence results in §12 of the first volume of his Algebra der Logik (Schröder 1890 , §12, especially p. 288). Bernays here extends Hilbert’s two-valued arithmetical interpretation (pp. 68–69 of Hilbert’s 1917/18 lecture notes), interpreting his calculus in various finite algebraic systems whose elements can be ‘multiplied’ and ‘negated’ in accordance with an explicitly-presented table of operations. 7 See Hilbert’s 1917/18 lectures, pp. 68–69, p. 110 above. It is, of course the same basic technique as Hilbert had used in investigating independence questions in his mature work on geometry.
Introduction to the Bernays Habilitationsschrift
227
4. Axioms and Rules of Inference. One of the significant advances of the 1917/18 lectures over the Principia was Hilbert’s clear distinction between axioms and rules of inference, and his use of this distinction (e. g., p. 151 of the lectures) to prove theorems about the class of formulas by means of induction on the syntactic derivations. (This distinction itself is not new. It was already at least implicit in Euclid, and had been drawn with great clarity by Frege in the Begriffsschrift. Hilbert’s originality consists rather in his use of this distinction to prove metamathematical theorems, first about geometry, and now about logic.) With the new metamathematical approach to logic, it was now natural to inquire, not only about the independence and equivalence of various sets of axioms, but also about the dependency relationships between axioms and various rules of inference. Bernays in the final section of his Habilitationsschrift (§6) explores the extent to which it is possible to replace axioms by rules, investigating several equivalent systems, and showing that it is possible to formulate a complete system of propositional logic with only a single axiom. In contrast to contemporary efforts (e. g., by Sheffer or Nicod or Łukasiewicz) to find axiom systems with ever fewer connectives or axioms, Bernays displays an interest in investigating the relative strengths of various axiomatic calculi, and also recognizes that certain axiomatizations may be of greater practical utility than others.8 In particular, Bernays’s 1918 work anticipates three subsequent developments in logic. First, his study of propositional axiomatics anticipates his own subsequent simplification of the axioms and rules of inference for first-order logic. The axioms, and especially the rules of inference in Hilbert’s 1917/18 lectures (see Hilbert 1917/18* , 133–135, pp. 146–147), are by any measure unwieldy; the elegant axiomatic formulation of quantificational logic in the Hilbert and Ackermann book (see Hilbert and Ackermann 1928 , 54) is explicitly credited to Bernays. Secondly, at the end of §3 (in the ‘Ergänzende Bemerkungen’) he considers the negation-free fragment of propositional logic (i. e., the system consisting of all the provable formulas not containing negation) and states that this fragment can be axiomatized. The strategy of separating out the axioms for various connectives, and then of distinguishing the axioms for finitistically unproblematic connectives (like conjunction or material implication) from the other axioms was to be taken up by Hilbert in the lecture courses that follow, especially in his treatment of quantification via the ‘transfinite axiom’. This strategy clearly mirrors that in Hilbert’s geometrical work, where the aim was not to produce a minimal axiomatisation, but rather to separate out different component axioms into groups, each responsible for a certain central part of the theoretical development. This can often lead to a helpful proliferation of axioms rather than to their reduction in their number. 8 Cf. the discussion in Zach 1999 , 351–352. Post’s work also addressed different ways of reformulating and generalizing the propositional logic of the Principia, pointing both in the direction of Sheffer’s and Nicod’s work, and also in the direction of many-valued logics. See Post 1920 and Post 1921 .
228
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Thirdly, Bernays’s investigation of the way in which axioms can be replaced by rules, together with the idea of grouping together the axioms that govern a particular connective, was taken up by Hilbert in subsequent lecture courses and provides the background to Gentzen’s development of systems of natural deduction.9
5. The Puzzle of Completeness. These are impressive accomplishments, and all the more remarkable as Bernays had been a virtual newcomer to the field in the autumn of 1917. It is surprising that he did not publish his results until 1926 (Bernays 1926 ), and then only in a highly abbreviated form. In the 1977 ETH interviews (Bernays 1977* ), Bernays discussed his Habilitationsschrift and somewhat regretted that he had not published his results earlier and in their entirety.10 He indicates that among mathematicians at the time logic was not taken entirely seriously; also contributing to his somewhat diffident attitude towards his results may have been the observation he made in §3 of the Habilitationsschrift itself (and noted above, p. 226) that the existence of a mechanical decision procedure meant that the calculus had been entirely ‘trivialized’. To a modern eye, perhaps the strangest thing is that, at the time, neither Bernays nor indeed Hilbert placed much emphasis on the Completeness Theorem for propositional logic. For instance, on 8 April 1920 and 19 March 1921 Bernays wrote to Russell11 ; he introduces himself as Hilbert’s assistant, reports that Hilbert has been working intensively on a consistency proof for analysis, and that he himself has obtained some results in his Habilitations9 For
an analysis of the influence of Hilbert and Bernays on Gentzen, see Sieg 2012a. says the following:
10 Bernays
. . . [U]nd nun, also war ich damals Assistent, nicht wahr, das ist natürlich nicht, das steht hier, mit der Assistentenbeschäftigung, das ist nicht so eine Beschäftigung, wie sie hier die Assistenten haben, die die Studenten helfen bei den Übungen, damit hatte ich gar nichts zu tun, sondern das war ganz privatim bei Hilbert, also dass wir einerseits diskutierten über die grundsätzlichen Fragen und dann auch, dass ich ihm für seine Vorlesungen zum Teil half und Ausarbeitungen machte, das war also . . . diese Assistententätigkeit, und dann habe ich mich eben damals schon bald, ich glaube, bis anfangs 1919, habilitiert, zum zweiten mal habilitiert, da habe ich dann schon eine grundlagentheoretische Abhandlung . . . über den Aussagengehalt und über die Axiomatik des Aussagengehalt und so . . . und die . . . , nun, ich war selbst noch so auf . . . es hatte zwar durchaus mathematischen Charakter, aber so die damalige Auffassung war die, dass man diese Grundlagenuntersuchungen, die an die mathematische Logik anknüpften, dass man die mathematisch nicht für voll genommen hat, nicht wahr, ja, das ist ja so ganz nett, das ist so halb spielerisch, nicht wahr, nun, das hat man . . . , und ich war auch so in der Tendenz, so etwas dazu geneigt, nicht wahr, und habe das sozusagen auch nicht ganz für voll genommen, und da hab’ ich das sozusagen nicht so . . . , hatte ich keinen solchen Eifer, das rechtzeitig zu publizieren, und das ist erst sehr viel später, und . . . , doch, eigentlich nicht ganz vollständig, sondern bloss mit gewissen Partien herausgekommen [sic], in den „Mathematische Annalen“, glaub’ ich, war’s, — das weiss ich jetzt nicht mehr genau, ob’s in dieser Zeitschrift oder in einer andern erschien — ja, und . . . ich war dann . . . so ist das, ist Manches, z. B. in den Darstellungen der Entwicklung der mathematischen Logik ist das zum Teil nicht . . . nicht wahr, entsprechend zum Ausdruck gekommen, was ich da in dieser Arbeit hatte. Ja, das war nun also diese Habilitation, und nun war ich also sehr lange, war ich dann sehr lange Assistent von Hilbert, nicht wahr. (Transcript of the first interview from 25.7.1977, p. 13. The ellipses appear in the transcript.) 11 The
letters are preserved in the Russell Archive at McMaster University.
Introduction to the Bernays Habilitationsschrift
229
schrift on the propositional logic of the Principia. He then describes his independence results in some detail, specifically pointing out that what Russell calls the ‘associative principle’ or ‘Assoc.’ can be derived from the other propositional axioms of Principia, and mentions in passing the possibility of the replacement of axioms by rules; but Bernays makes no mention whatsoever of the Completeness Theorem.12 A few years later Bernays published his abbreviated report of the results of the Habilitationsschrift in Bernays 1926 . In that article he makes no reference to the lecture notes for Hilbert’s 1917 course, gives the Completeness Theorem for propositional logic briefly and without fanfare, and once again concentrates on the independence results; the important results on rules of inference are omitted altogether. Curiously, his treatment of completeness in the published article is less perspicuous than his own earlier version in the thesis, and the distinction between syntax and semantics is drawn less lucidly. Moreover, although in the Habilitationsschrift he had explicitly credited the Completeness Theorem to the Hilbert lectures, in the published article this acknowledgement is neglected, thus giving support to the impression that the result was first due to others (e. g., Post in Post 1921 ), and not to Hilbert. Conversely, the textbook published by Hilbert and Ackermann in 1928, a work which transcribes large parts of the Bernays protocol of Hilbert’s 1917/18 lectures13 , and which Bernays surely saw in draft, cites Bernays 1926 , credits that article with the independence results, but does not mention Bernays at all in connection with the completeness results for propositional logic. These facts strongly suggest that, at the time, Bernays’s independence results of 1918 loomed larger in the minds of Hilbert and of Bernays than did the Completeness Theorem. To understand this attitude, it should be remembered, first, that in Hilbert’s geometrical investigations independence results had in fact been at the heart of some of the most significant discoveries, not just in connection with the independence of the Euclidean axiom, but with the discovery of new systems of geometry (non-Archimedean, non-Pythagorean, semi-Euclidean), and, just as importantly, with determining the exact deductive weight of core theorems of plane geometry. Secondly, the proof of propositional completeness was considerably less demanding technically than the proofs of the independence theorems: the completeness result, although conceptually interesting, must at the time have seemed almost a triviality. Thirdly, neither in Hilbert’s 1917/18 lectures nor in Bernays’s Habilitationsschrift was it yet clear which of the various conceptions of completeness would prove most significant. Indeed, although Bernays, in §2 of his thesis, had clearly isolated the concept of semantic completeness, even he in the remainder of the thesis continues to use the term ‘Vollständigkeit’ to designate what we now call Post-completeness. Neither Hilbert in the 1917/18 lectures, nor Bernays in his 1918 Habilitationsschrift, nor in his 1926 article, formulated 12 Whitehead and Russell’s propositional associative principle is 1∗5 (p. 101 of Whitehead and Russell 1910 , or p. 96 in the Second Edition, Whitehead and Russell 1927 , 96). 13 See p. 49 of the Introduction to this Chapter, and also the Introduction to Appendix A.
230
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
the task of proving the semantic completeness of quantificational logic (the restricted functional calculus in Hilbert’s sense). That problem was first posed in the Hilbert and Ackermann textbook of 1928, and again in Hilbert’s 1928 Bologna address (see Hilbert and Ackermann 1928 , 68, and Hilbert 1929 , 140; both works can be found in this Volume, in Appendices A and C respectively). Only after that much more difficult problem had been explicitly raised, and only after the work of Gödel and Tarski had revealed its depth and difficulty, did it become clear, in retrospect, how significant for mathematical logic was the notion of semantic completeness which Bernays had isolated years before. The Habilitationsschrift as reproduced here is taken from a manuscript in Bernays’s hand preserved in his Nachlaß at the ETH in Zürich (Bernays 1918* ). Although the thesis was submitted in Göttingen, no copy appears to have survived there. It is not clear whether the copy in the posssession of the ETH is the original, or Bernays’s final draft or a fair copy written out by him. The manuscript consists of sixty-four pages on foolscap paper, each page consisting of a fairly narrow column occupying only about half to twothirds of the page. The script is beautifully neat and highly legible, and the text is very polished with only a few corrections made by Bernays. The Inhaltsverzeichnis has been added by the Editors, using Bernays’s own section headings where possible. William Ewald
‘Beiträge zur axiomatischen Behandlung des Logik-Kalküls’
231
Beiträge zur axiomatischen Behandlung des Logik-Kalküls
Eingereicht Göttingen 1918. Paul Bernays. Inhaltsverzeichnis
5
10
15
20
25
§ 1. Aufstellung der Axiome. § 2. Logische Deutung des Kalküls. Widerspruchslosigkeit und Vollständigkeit. § 3. Unbetitelt. Ergänzende Bemerkungen zu den §§ 2–3. § 4. Abhängigkeit der Formel 4). Unabhängigkeit der übrigen Grundformeln. Beweis von 2 ) aus den Grundformeln 2), 3), 5): Beweis von 2) aus 2 ), 3), 5): Beweis von 4 ) aus 3), 4), 5): Beweis von 4) aus 3), 4 ), 5): § 5. Unbetitelt. A. Unabhängigkeit der Formel 1) von 2), 3), 4), 5). B. Unabhängigkeit der Formel 2) von den übrigen Grundformeln. 1. Unabhängigkeit der Formel XX von 1), 3), 4), 5). 2. Unabhängigkeit der Formel X(XX) von 1), 3), 4), 5) und XX. 3. Unabhängigkeit der Grundformel 2) von 1), 3), 4), 5) und X(XX). C. Unabhängigkeit der Formel 3) von den übrigen Grundformeln. D. Unabhängigkeit der Grundformel 5) von den Formeln 1) – 4). Zusatz zu § 5. § 6. Formeln und Regeln. Anhang: Der Schrödersche Unabhängigkeits-Satz.
1 3 9 17 20 22 23 23 24 26 28 31 31 32 34 36 38 40 41 57
232 I
II
III
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Innerhalb der mathematischen Logik sondert sich gleichsam von selbst als Teilgebiet ein spezieller Kalkül ab, welcher die Grundlage für alles übrige bildet und durch den diejenigen logischen Schlussweisen formalisiert werden, welche auf den allgemeinsten Eigenschaften der Urteile (ihrer eindeutigen Bestimmtheit in Bezug auf Wahrheit oder Falschheit und ihrer Verbindbarkeit durch Konjunktion und Disjunktion) oder aber auf dem Verhältnis des Teiles zum Ganzen beruhen. Dieser Kalkül, mit dessen Aufstellung die Entwicklung der symbolischen Logik ihren Anfang genommen hat, ist besonders von Schröder sehr eingehend behandelt worden, der in seiner „Algebra der Logik“ 1) vor allem den Dualismus hervorhob, welcher inbetreff der Verknüpfungen durch „und“ und „oder“ besteht.2) Mit der Schröderschen Theorie hat die Entwicklung des Kalküls noch nicht abgeschlossen, vielmehr hat dieser in den späteren Bearbeitungen der mathematischen Logik (bei dem allerdings seine | Bedeutung gegenüber den grosszügigen Problemen der logischen Fundamentierung der Arithmetik zurücktritt) noch wesentliche Umgestaltungen erfahren. Insbesondere hat Frege1) den Kalkül in der Weise modifiziert, dass er den erwähnten Dualismus dazu benutzte, die Anzahl der formalen Operationen zu vermindern. So bringt er alle logischen Beziehungen zwischen Aussagen (Urteilen) mit Hülfe der Negation und der Verknüpfung „wenn a, so b“ 2) zum Ausdruck. Wiewohl dieses Verfahren nun vom axiomatischen Standpunkt einen Fortschritt bedeutet, so ist doch die bei Frege damit verbundene Beschränkung hinsichtlich der Mannigfaltigkeit der symbolischen Darstellungsweisen für die logische Übersicht unzweckmässig. Diesem Mangel haben Whitehead und Russell, die Verfasser der Principia Mathematica 3) , abgeholfen, indem sie, die Gedanken Freges mit den Methoden von Peano (hier wie auch sonst bei vielen Gelegenheiten) vereinigend, neben den Symbolen für die ursprünglich eingeführten formalen Operationen noch Abkürzungen, d. h. Zeichen für gewisse zusammengesetzte | Ausdrücke anwenden, wodurch insbesondere auch der Zusammenhang ihrer Theorie mit der Schröderschen explicite zur Geltung kommt. Ein weiterer Vorzug der Darstellung von Whitehead und Russell besteht darin, dass sie anstelle der unsymmetrischen Beziehung „wenn a, so b“ die symmetrische „a oder b“ als Grundoperation neben der Negation wählen. So erhalten sie für den Kalkül der Aussagen-Beziehungen ein besonders einfaches und übersichtliches 1)
„Vorlesungen über die Algebra der Logik“, Leipzig 1890, Bd. I. Dieser Dualismus hört allerdings auf, ein vollständiger zu sein, sobald man gewisse Beschränkungen in der Formalistik des Kalküls aufhebt. 1) Frege, „Grundgesetze der Arithmetik“, Jena 1893. 2) Diese Verknüpfung ist so aufzufassen, dass sie dann und nur dann etwas falsches bedeutet, wenn a wahr und zugleich b falsch ist. 3) „Principia Mathematica“, Cambridge 1910, Band I. Von dem hier in Rede stehenden Kalkül handelt Part I, Section A, S. 94–131. 2)
5
10
15
20
25
30
35
‘Beiträge zur axiomatischen Behandlung des Logik-Kalküls’
5
10
15
20
25
233
Axiomen-System, das zu einer systematischen Behandlung vom Standpunkt der Axiomatik einladet. Eine solche axiomatische Betrachtung bildet den Inhalt der folgenden Ausführungen. Dass eine derartige Untersuchung nicht unnötig ist, geht schon daraus hervor, dass sich dabei eines der in den Principia Mathematica aufgestellten Axiome als überflüssig erweist. Dieses Axiom (das übrigens auch bei Schröder als abhängige Voraussetzung auftritt) erweckt deshalb den Anschein der logischen Unabhängigkeit, weil darin der assoziative Charakter der „Oder“-Verknüpfung zur Geltung kommt und man von der Algebra her an die Unabhängigkeit des assoziativen Gesetzes von den anderen Rechengesetzen gewöhnt ist. Den Gedanken, die Methoden der Axiomatik auf den logischen Kalkül anzuwenden, hatte bereits Schröder, der für eine spezielle UnabhängigkeitsBehauptung den Beweis erbrachte.1) Diese Schrödersche Beweisführung ist sehr kompliziert. Es gelang mir, sie durch einen ganz einfachen Beweis zu ersetzen, den ich als Anhang zu meinen Betrachtungen darstelle. Die Anregung zu der vorliegenden Untersuchung habe ich durch die Vorlesung empfangen, welche Hilbert im letzten Winter über mathematische Logik hielt.1) In dieser Vorlesung wurde bereits der Beweis für die Widerspruchslosigkeit und für die Vollständigkeit des im folgenden betrachteten Axiomensystems gegeben, den ich in den §§ 2–3, nur in etwas anderer Form der Darstellung, rekapituliere. Auch habe ich mich hinsichtlich der Bezeichnung an die Hilbertsche Vorlesung angeschlossen, nur mit der einen Ausnahme, dass ich das GleichheitsZeichen für eigentliche Identität (Definitions-Gleichheit) verwende, während ich da, wo Hilbert, sowie auch schon Schröder, das Zeichen „=“ gebraucht, das Zeichen „∼“ aus den Principia Mathematica benutze. — 1
Aufstellung der Axiome. § 1.
30
Das Axiomen-System, auf welches sich die folgenden Betrachtungen beziehen, lässt sich folgendermassen charakterisieren: Es handelt sich um einen Kalkül mit Buchstaben-Zeichen („Variablen“) X, Y, Z, . . . . 1)
Vgl. „Algebra der Logik“, § 12, S. 282 und Anhang 4–5, S. 616–643. Derjenige Teil dieser Vorlesung über die „Prinzipien der Mathematik“, welcher von dem im folgenden betrachteten Kalkül handelt, findet sich in der Ausarbeitung auf S. 129–153. 1)
1 The
specific works referred to by Bernays in this Introduction are: Schröder 1890 ; Frege 1893 ; Whitehead and Russell 1910 . The Hilbert lectures are of course those which form the body of this Chapter. Anhang 4–5 of Schröder 1890 (referred to in Bernays’s footnote above) in fact occupies pp. 617–646.
IV
1
234
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Jedes solches Zeichen bildet einen „Ausdruck“ des Kalküls, und zugleich mit X ist auch X ein Ausdruck, welcher als die „Negation von X“ bezeichnet wird. Ferner können zwei Variable X, Y zu einem Ausdruck XY zusammengesetzt werden, welcher das „symbolische Produkt“ von X und Y heisse. Für diese formalen Bildungen sollen unmittelbar keine Eigenschaften postuliert werden. So wird z. B. nicht verlangt, dass das symbolische Produkt assoziativ oder kommutativ ist, und ebensowenig wird vorausgesetzt, dass die Negation sich bei zweimaliger Anwendung aufhebt. Unter den Ausdrücken, welche sich mit Hülfe der eingeführten Operationen zusammensetzen lassen, werden jetzt gewisse als „richtige Formeln“ ausgezeichnet. Dies geschieht in der Weise, dass erstens als richtige Formeln die fünf Ausdrücke („Grundformeln“) 1)
XXX
2)
X(XY )
3)
XY (Y X) X(Y Z) (XY )Z XY ZX(ZY )
4) 5) 2
5
10
15
1)
postuliert werden , und ferner folgende zwei Regeln aufgestellt werden: a) Einsetzungs-Regel: Aus einer richtigen Formel entsteht wieder eine solche, wenn für eine Variable überall, wo sie vorkommt, ein und derselbe Ausdruck eingesetzt wird, und ebenso auch, wenn eine solche Einsetzung für mehrere Variable zugleich ausgeführt wird.2)
20
b) Sind α und β gewisse Ausdrücke und ist sowohl α wie αβ eine richtige Formel, so ist auch β eine richtige Formel.
3
Hiermit ist das Axiomen-System bereits fertig. Nur sollen noch zur Gewinnung einer besseren Übersicht über die formalen Beziehungen des Systems folgende „Abkürzungen“ eingeführt werden: Statt XY kann X → Y geschrieben werden. Statt X Y werde auch X + Y geschrieben und dieser Ausdruck werde „symbolische Summe“ genannt. Ferner möge statt (X → Y ) + (Y → X) auch der Ausdruck X ∼ Y gebraucht werden. Zum Ersparen von Klammern sei festgesetzt, dass für die Trennung von Ausdrücken die Verknüpfungen mit +, →, ∼ vor dem symbolischen Produkt den Vorrang haben und dass die Verknüpfungen mit → und ∼ den Vorrang haben vor der symbolischen Summe. 1) Die Klammern dienen hier wie gewöhnlich in der Mathematik zur Bezeichnung der Reihenfolge, in der die betreffenden Operationen auszuführen sind. 2) Dieser Zusatz über gleichzeitige Einsetzungen wäre entbehrlich, jedoch empfiehlt er sich zur Vermeidung gewisser sonst entstehender formaler Komplikationen.
25
30
35
‘Beiträge zur axiomatischen Behandlung des Logik-Kalküls’
235
Mit Anwendung des Zeichens → lassen sich die fünf Grundformeln so schreiben, dass darin explicite keine Negation vorkommt; sie lauten dann:
5
1) 2)
XX → X X → XY
3) 4)
XY → Y X X(Y Z) → (XY )Z (X → Y ) → ZX → ZY .
5)
Desgleichen kann in der Formulierung der Regel b) der Ausdruck αβ durch α → β ersetzt werden. —
Logische Deutung des Kalküls. Widerspruchslosigkeit und Vollständigkeit. § 2.
10
15
20
25
30
35
Das aufgestellte Axiomen-System könnte kein besonderes Interesse beanspruchen, wenn es nicht einer bedeutsamen inhaltlichen Interpretation fähig wäre. Eine solche Interpretation ergibt sich auf folgende Art: Die Variablen fasse man als Symbole für Aussagen (Sätze) auf. Als charakteristische Eigenschaft der Aussagen soll angesehen werden, dass sie entweder wahr oder falsch und nicht beides zugleich sind. Das symbolische Produkt deute man als die Verknüpfung zweier Aussagen durch „oder“, wobei diese Verknüpfung nicht im Sinne der eigentlichen Disjunktion zu verstehen ist, welche das Zusammenbestehen der beiden Aussagen ausschliesst, sondern vielmehr derart, dass „X oder Y “ dann und nur dann zutrifft (d. h. wahr ist), wenn mindestens eine der beiden Aussagen X, Y zutrifft. X soll das „Gegenteil von X“ bedeuten, d. h. eine eindeutig durch X bestimmte Aussage, welche dann und nur dann zutrifft, wenn X nicht zutrifft. Aus dieser Deutung der Grundoperationen erhält man für die Abkürzungen folgende Interpretation: X → Y bedeutet eine Aussage, welche zutrifft, wenn das Gegenteil von X oder wenn Y zutrifft, die also nur dann falsch ist, wenn X wahr und zugleich Y falsch ist. Sprachlich kann die Verknüpfung von Aussagen durch die SatzVerbindungen „wenn X, so Y “, „aus X folgt Y “ wiedergegeben werden.1) X+Y bezeichnet das Gegenteil einer Aussage, welche dann und nur dann zutrifft, wenn mindestens eine der beiden Aussagen X, Y falsch ist; X+Y 1)
Dieser Gebrauch der Worte „wenn“ und „folgt“ deckt sich freilich nicht vollständig mit der üblichen Art ihrer Anwendung, insofern nämlich die Konjunktion „wenn“ für gewöhnlich nur vor solchen Sätzen steht, deren Wahrheit oder Falschheit als ungewiss betrachtet wird und die p. 5 Verbindung von zwei Sätzen durch „aus . . . folgt . . . “ im Sprachgebrauch die logische Abhängigkeit des zweiten Satzes von dem ersten zum Ausdruck bringt.
4
5
236
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
bedeutet also, dass sowohl X wie Y wahr ist und kann demgemäss sprachlich durch „X und Y “ ausgedrückt werden. Aufgrund dieser Deutung der symbolischen Summe ergibt sich X ∼ Y als die Aussage des Zusammenbestehens von X → Y mit Y → X. Diese Aussage ist dann und nur dann falsch, wenn entweder die Aussage X und zugleich das Gegenteil von Y , oder wenn Y und zugleich das Gegenteil von X zutrifft. Demnach ist sie dann und nur dann wahr, wenn die Aussagen X, Y entweder beide wahr oder beide falsch sind. Diese Beziehung zwischen X und Y bildet das Gegenteil der disjunktiven Verknüpfung. Gemäss der für den Ausdruck X → Y erhaltenen Deutung gehen die fünf Grundformeln in folgende Sätze über:
6
7
1) 2)
„Aus X oder X folgt X.“ „Aus X folgt X oder Y .“
3) 4)
„Aus X oder Y folgt Y oder X.“ „Besteht X oder besteht Y oder Z,
5)
so besteht X oder Y , oder es besteht Z.“ „Wenn Y aus X folgt, so folgt Z oder Y aus Z oder X.“
Die Bedeutsamkeit unseres Axiomen-Systems für die Logik beruht nun auf folgender Tatsache: Versteht man unter einer „beweisbaren“ Formel eine solche, die sich gemäss den Axiomen als richtige Formel erweisen lässt,1) und unter einer „allgemeingültigen“ Formel eine solche, die im Sinne der angegebenen Deutung bei beliebiger Wahl der für die Variablen einzusetzenden Aussagen (also für beliebige „Werte“ der Variablen) stets eine wahre Aussage ergibt, so gilt der Satz: Jede beweisbare Formel ist eine allgemeingültige Formel und umgekehrt. Was zunächst die erste Hälfte dieser Behauptung betrifft, so lässt sie sich folgendermassen begründen: Man verifiziert zuerst, dass sämtliche Grundformeln allgemeingültige Formeln sind. Hierzu hat man nur endlich viele Fälle auszuprobieren, denn die Ausdrücke des Kalküls sind alle von der Art, dass bei der logischen Interpretation ihre Wahrheit oder Falschheit eindeutig bestimmt ist, wenn von jeder der für die Variablen einzusetzenden Aussagen feststeht, ob sie wahr oder falsch ist, während im übrigen der Inhalt dieser Aussagen gleichgültig ist, sodass man als Werte der Variablen anstatt der Aussagen nur Wahrheit und Falschheit zu betrachten braucht. Sind die Grundformeln als allgemeingültig erkannt, so ist nur noch nötig, sich davon zu überzeugen, dass durch die Anwendung der beiden Regeln aus allgemeingültigen Formeln stets wieder nur solche Formeln abgeleitet werden können. Dies folgt für die Regel a) daraus, dass bei jeder Einsetzung die Gesamtheit der durch den betreffenden Ausdruck darstellbaren Aussagen nur spezia1)
Der Begriff der beweisbaren Formel neben dem der richtigen Formel (welcher nicht vollständig abgegrenzt ist) einzuführen, erscheint mir zur Vermeidung eines Zirkels als notwendig.
5
10
15
20
25
30
35
40
‘Beiträge zur axiomatischen Behandlung des Logik-Kalküls’
5
10
15
20
25
30
35
237
lisiert werden kann; und für die Regel b) sieht man es so ein: wenn die beiden Ausdrücke α und αβ, welche bei der Anwendung der Regel schon als richtig erwiesen sein müssen, allgemeingültige Formeln sind, so ist der Ausdruck α für beliebige Werte der darin vorkommenden Variablen falsch, und da αβ gemäss der Deutung des symbolischen Produktes nur dann wahr ist, wenn mindestens einer der Ausdrücke α, β eine wahre Aussage darstellt, so kann αβ nur dann für beliebige Werte der vorkommenden Variablen wahr sein, wenn dasselbe von β gilt; das heisst, der Ausdruck β, welcher sich aus der Anwendung der Regel b) als richtige Formel ergibt, ist eine allgemeingültige Formel. Es zeigt sich also in der Tat, dass jede beweisbare Formel allgemeingültig ist. Hiermit ist zugleich die Widerspruchslosigkeit des Kalküls in dem Sinne bewiesen, dass von zwei beweisbaren Formeln niemals die eine mit der Negation der anderen übereinstimmen kann. Denn aus der | Definition einer allgemeingültigen Formel geht ja unmittelbar hervor, dass α und α nicht zugleich allgemeingültige Formeln sein können. Sehen wir von der inhaltlichen Interpretation des Kalküls ab, so kann von einem Problem der Widerspruchslosigkeit im eigentlichen Sinne nicht mehr die Rede sein, da jede Behauptung des Kalküls darin besteht, dass ein Ausdruck, entweder schlechthin oder bedingungsweise, als richtige Formel erklärt wird und somit durch die positive Form aller Behauptungen das Auftreten von Widersprüchen in trivialer Weise ausgeschlossen ist. Gleichwohl hat das gefundene Ergebnis auch für die rein formale Betrachtung des Kalküls eine grundsätzliche Bedeutung. Wir erkennen nämlich daraus, dass gewiss nicht jeder beliebige Ausdruck des Kalküls eine beweisbare Formel ist, — eine Möglichkeit, die nicht von vornherein ausgeschlossen werden konnte.1) Hinsichtlich der angewandten Beweismethode sei noch besonders bemerkt, dass dabei der spezielle logische Charakter der benutzen Deutung des Kalküls unwesentlich ist. Man kann die Überlegung z. B. auch arithmetisch einkleiden, indem man anstelle von Wahrheit und Falschheit als Werten der Variablen die Zahlen 0 und 1 setzt, | ferner das symbolische Produkt durch das arithmetische Produkt und die Negation von X durch die Funktion (1 − X) deutet. Dabei entspricht einer allgemeingültigen Formel ein solcher Ausdruck, der für jede beliebige Verteilung der Werte 0 und 1 auf die Variablen gleich 0 ist. (Bei diesem Verfahren wird nicht etwa die Widerspruchslosigkeit der Arithmetik benutzt; denn man hat es ja nicht mit der Arithmetik im ganzen zu tun, sondern nur mit der wiederholten Anwendung der 6 Gleichungen 0 · 0 = 0,
0 · 1 = 0, 1 − 0 = 1,
40
1)
1 · 0 = 0,
1 · 1 = 1,
1 − 1 = 0.)
Die Möglichkeit, dass jeder Ausdruck eine richtige Formel ist, bleibt trotzdem bestehen und lässt sich auch jedenfalls nicht durch einen Beweis ausschliessen, da für die Anwendbarkeit des Terminus „richtige Formel“ nur hinreichende, aber keine notwendigen Bedingungen gegeben sind.
8
9
238
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
§ 3.
10
11
Es bleibt nun der zweite Teil der ausgesprochenen Behauptung zu beweisen, dass jede allgemeingültige Formel auch beweisbar ist. Dieser Satz steht in engem Zusammenhange mit der Frage der Vollständigkeit unseres Axiomen-Systems. Wir brauchen nämlich zu seinem Nachweise nur zu zeigen, dass es unmöglich ist, ausser den beweisbaren Formeln noch einen Ausdruck des Kalküls als richtige Formel zu postulieren, ohne dass sämtliche Ausdrücke sich als richtige Formeln ergeben. Denn gesetzt, dieses stehe bereits fest, so können wir folgendermassen argumentieren: Gäbe es eine allgemeingültige, aber nicht beweisbare Formel, dann könnte man diese zu den fünf Grundformeln als | sechste hinzufügen. Hiervon wäre einerseits die Folge, dass jede beliebige Formel beweisbar würde; da andrerseits auch nach der Hinzufügung der neuen Formel alle Grundformeln allgemeingültig wären, so müsste (gemäss der im vorigen Paragraphen angestellten Überlegung) auch jede durch das erweiterte Axiomen-System beweisbare Formel allgemeingültig sein.1) Es würde also folgen, dass jeder beliebige Ausdruck unseres Kalküls eine allgemeingültige Formel ist. Da dies, wie bereits festgestellt wurde, nicht zutrifft, so ist die Annahme der Existenz einer allgemeingültigen, aber nicht beweisbaren Formel falsch. Somit reduziert sich der auszuführende Beweis auf die Begründung folgender Behauptung: Wird das System der beweisbaren Formeln (das ja, wie wir wissen, nicht alle Ausdrücke umfasst) dadurch erweitert, dass man eine nicht zu diesem System gehörige Formel als richtige Formel postuliert (d. h. sie zu den Grundformeln hinzufügt), so ist inbezug auf das so geänderte Axiomen-System jeder beliebige Ausdruck eine beweisbare Formel. Für den Nachweis hiervon ist es nötig, auf den Formalismus des Kalküls näher einzugehen. Da die erforderlichen formalen Ableitungen in den „Principia Mathematica“ und auch zum wesentlichen Teil in der Hilbertschen Vorlesung ausgeführt sind,1) so will ich mich darauf beschränken, den Gedankengang des Beweises anzugeben. Eine wesentliche Rolle bei dieser Überlegung spielt der Begriff der „Äquivalenz“ von Ausdrücken. Zwei Ausdrücke α, β sollen äquivalent heissen, sofern α ∼ β eine beweisbare Formel ist. Die Bezeichnung ist deshalb gerechtfertigt, weil für jeden Ausdruck α die Formel α ∼ α beweisbar ist und weil unter der Voraussetzung, dass α ∼ β und α ∼ γ beweisbare Formeln sind, auch β ∼ γ eine solche ist. Die Wichtigkeit dieser Äquivalenz-Beziehung beruht darauf, dass im Falle der Äquivalenz von α und β aus jeder als richtig erkannten Formel, welche den Ausdruck α irgendwie als Bestandteil enthält, diejenige Formel mit Hülfe der Axiome abgeleitet werden kann, welche entsteht, indem jeder Bestandteil 1)
Man beachte, dass die logische Interpretation des Kalküls und daher auch die Bedeutung des Terminus „allgemeingültige Formel“ von der vorgenommenen Änderung des Axiomen-Systems nicht berührt wird. 1) Vgl. die näheren Angaben auf S. II und IV des Vorworts.
5
10
15
20
25
30
35
40
‘Beiträge zur axiomatischen Behandlung des Logik-Kalküls’
5
239
α durch β ersetzt wird.2) Hieraus folgt | insbesondere, dass wenn der eine von zwei äquivalenten Ausdrücken eine [[richtige]]--↑beweisbare↓ Formel ist, auch der andre eine beweisbare Formel ist.1) Den Ausgangspunkt des zu führenden Beweises bilden einige spezielle Äquivalenzen, welche aus folgenden beweisbaren Formeln zu entnehmen sind: X ∼ X,
XY ∼ X + Y ,
12
X +Y ∼XY,
XY ∼ Y X, X + Y ∼ Y + X, X(Y Z) ∼ Y (XZ), X + (Y + Z) ∼ (X + Y ) + Z, X(Y + Z) ∼ XY + XZ. 10
15
20
Von diesen Formeln entspricht die erste bei der logischen Deutung dem Satze, dass eine doppelte Verneinung mit einer Bejahung gleichbedeutend ist. Aus den beiden nächsten Formeln geht die Methode der „dualen“ Umformung hervor, welche in der Schröderschen Theorie die fundamentale Rolle spielt. Die folgenden Formeln enthalten die Analogie zur Algebra. Insbesondere ersieht man aus diesen, dass bei mehrgliedrigen Summen und Produkten die Reihenfolge und die Art der Zusammenfassung der Glieder für die Beweisbarkeit der Formel, in der die betreffende Summe oder das Produkt vorkommt, gleichgültig ist, sodass man wie in der Algebra die Glieder beliebig ordnen und die zusammenfassenden Klammern weglassen kann. (Die Analogie zwischen dem betrachteten Kalkül und der Algebra ist jedoch keineswegs vollständig. Vielmehr unterscheidet sich unser Kalkül von der Algebra wesentlich dadurch, dass bei ihm Summe und Produkt symmetrisch auftreten, sodass insbesondere neben der Formel X(Y + Z) ∼ XY + XZ auch die Formel X + Y Z ∼ (X + Y )(X + Z)
25
30
als beweisbare Formel („zweites distributives Gesetz“) besteht.) Durch die Anwendung der aufgezählten Formeln ergibt sich für jeden beliebigen Ausdruck α, dass er einem Ausdruck β äquivalent ist, welcher die Form einer Summe von einfachen Produkten besitzt, wobei unter einem „einfachen Produkt“ ein solches verstanden wird, in welchem jedes Glied entweder aus einer Variablen oder aus der Negation einer Variablen besteht. Ein derartiger Ausdruck β soll eine „Normalform von α“ heissen.1) Die Zweckmässigkeit der Einführung solcher Normalformen geht aus dem Umstande hervor, dass ein Summen-Ausdruck dann und nur dann eine beweis2)
Die Abgrenzung eines Ausdrucks α als Bestandteil einer Formel ist durch diese im allgemeinen nicht eindeutig bestimmt. So kann z. B. aus dem Ausdruck αα, wenn er eine beweisbare Formel ist, im Falle der Äquivalenz von α mit β einerseits αβ, andrerseits βα, und natürlich auch ββ abgeleitet werden. 1) Von diesem Satz gilt auch die Umkehrung: Je zwei beweisbare Formeln sind äquivalent. 1) Wie man ohne weiteres sieht, ist die Zuordnung einer Normalform zu einem Ausdruck keineswegs eindeutig.
13
240
14
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
bare Formel bildet, wenn jeder seiner Glieder eine beweisbare Formel ist2) , — was sich als eine Konsequenz der beweisbaren | Formeln X + Y → X,
15
16
X + Y → Y,
X → (Y → X + Y )
ergibt. Aufgrund dieser Tatsachen kann nun so geschlossen werden: Es sei α der nicht-beweisbare Ausdruck, durch dessen Hinzufügung zu den Grundformeln das Axiomen-System erweitert werden soll. β sei eine Normalform von α. Dann ist mit Hülfe des ursprünglichen Axiomen-Systems auch β nicht beweisbar, und es können daher nicht alle die einfachen Produkte, welche die Summenglieder von β bilden, beweisbare Formeln sein. Nun lässt sich aber leicht zeigen, dass ein einfaches Produkt stets dann eine beweisbare Formel ist, wenn darin mindestens eine Variable sowohl unüberstrichen wie auch überstrichen als Glied vorkommt (wenn also z. B. X und X beide als Produktglieder auftreten). Es muss daher unter den einfachen Produkten in β mindestens eines, etwa γ, geben, bei welchem die genannte Bedingung nicht erfüllt ist, sodass darin keine Variable zugleich mit ihrer Negation als Glied vorkommt. Wird jetzt α als Grundformel aufgestellt, so wird β und damit (nach dem Satz über die Summenausdrücke) auch γ eine beweisbare Formel. Auf γ wende man nun die Regel a) an, indem man für alle diejenigen [[unbestimmten Zeichen]]--↑Variablen↓, welche unüberstrichen in γ auftreten, das Zeichen X, und für alle die, welche überstrichen auftreten, den Ausdruck X setze. | (Dies ist auf Grund der besonderen Beschaffenheit des Produktes γ im Sinne der Regel a) ausführbar.) Der Ausdruck, welcher sich hierdurch als richtige Formel ergibt, ist ein Produkt, dessen Glieder sämtlich entweder mit X oder mit X übereinstimmen. Hierin können wegen der Äquivalenz von X mit X die doppelten Überstreichungen weggelassen werden, und von dem so entstehenden Ausdruck XX · · · X gelangt man durch wiederholte Anwendung der Formeln 1) und 5) leicht zu dem Ausdruck X. Für X kann aber nach der Regel a) jeder beliebige Ausdruck eingesetzt werden. Es hat also die Einführung von α als Grundformel die Beweisbarkeit jeder beliebigen Formel zur Folge, was ja bewiesen werden sollte. Diese Betrachtung enthält nicht allein den Beweis für die Vollständigkeit unseres Axiomen-Systems, sondern sie liefert uns überdies noch ein einheitliches Verfahren, durch welches man bei jedem Ausdruck des Kalküls nach endlich vielen Anwendungen der Axiome entscheiden kann, ob er eine beweisbare Formel ist oder nicht. Zum Zweck dieser Entscheidung braucht man nur für den betreffenden Ausdruck eine Normalform zu bestimmen und nachzusehen, ob hierin bei jedem der einfachen Produkte mindestens eine Variable sowohl unüberstrichen wie überstrichen als Glied vorkommt. Trifft dies zu, so ist der | untersuchte Ausdruck eine beweisbare Formel, andernfalls ist er es nicht. 2) Es wäre ein Irrtum, nach Analogie zu diesem Satz zu vermuten, dass ein ProduktAusdruck dann und nur dann eine beweisbare Formel ist, wenn mindestens eines der Glieder eine beweisbare Formel ist.
5
10
15
20
25
30
35
40
‘Beiträge zur axiomatischen Behandlung des Logik-Kalküls’
5
10
15
20
25
30
35
241
Der Kalkül lässt sich demnach vollkommen trivialisieren. Mit Bezug auf die logische Deutung unseres Kalküls, welche ja zu dieser ganzen Überlegung den Anlass gab, erhalten wir das Ergebnis, dass die Gesamtheit der beweisbaren Formeln übereinstimmt mit der Gesamtheit der allgemeingültigen Formeln. Und dies besagt, dass unser Kalkül eine formale Systematisierung derjenigen logischen Gesetze enthält, welche die Beziehungen zwischen Wahrheit und Falschheit von Aussagen betreffen, die unabhängig von der Struktur und dem Inhalt der Aussagen bestehen. In der Tat lassen sich ja alle Beziehungen zwischen Wahrheit und Falschheit von Aussagen mit Hülfe der Konjunktion („und“), der Disjunktion (ausschliessendes „oder“) und der Negation, also auch durch die Symbolik unseres Kalküls zum Ausdruck bringen, und sofern solche Beziehungen für beliebige Aussagen gelten, müssen die ihnen entsprechenden symbolischen Ausdrücke in dem definierten Sinne allgemeingültige Formeln sein. Mit dieser Systematisierung der allgemeinsten Aussagen-Beziehungen, welche der Kalkül vermittelst der betrachteten Art der Interpretation liefert, ist übrigens die Bedeutung dieses Kalküls für die formale Behandlung der Logik noch keineswegs erschöpft. Jedoch will | ich hier auf die weiteren logischen Anwendungsmöglichkeiten des Kalküls nicht eingehen. —
17
Ergänzende Bemerkungen zu den §§ 2–3. Aus den Ergebnissen von § 2 und § 3 lässt sich als spezielle Konsequenz entnehmen, dass zwei Ausdrücke α und β dann und nur dann äquivalent sind, wenn α ∼ β eine allgemeingültige Formel ist, d. h. wenn bei der logischen Deutung die beiden Ausdrücke für beliebige Werte der Variablen zugleich wahr oder zugleich falsch sind. Mit anderen Worten: zwei Ausdrücke sind dann und nur dann äquivalent, wenn sie logisch gleichbedeutend sind. Wird also eine logische Verknüpfung von Aussagen durch einen Ausdruck α dargestellt und ist α mit β äquivalent, so kann auch der Ausdruck β zur Darstellung jener Aussagen-Verknüpfung dienen. Nun folgt zunächst aus dem Umstande, dass die Negation und das symbolische Produkt die einzigen Grund-Operationen unseres Kalküls bilden, dass sich alle mit Hülfe des Kalküls darstellbaren logischen Beziehungen durch jene beiden Operationen allein ausdrücken lassen. Andrerseits bestehen folgende beweisbaren Formeln: XY ∼ X + Y , XY ∼ X → Y.
40
Demnach lassen sich auch alle im Kalkül ausdrückbaren logischen Beziehungen | durch die Negation und die symbolische Summe, oder auch durch die Negation und das Zeichen „→“ zur Darstellung bringen. Dagegen ist es nicht möglich, alle diese Beziehungen mit Hülfe der Negation und des Zeichens „∼“ darzustellen. Z. B. kann bewiesen werden, dass es keinen durch diese beiden Operationen allein zusammensetzbaren Ausdruck gibt, welcher mit XY äquivalent ist. Damit wird zugleich gezeigt, dass man
18
242
19
20
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
nicht alle im Kalkül ausdrückbaren Beziehungen durch Negation und Disjunktion darstellen kann. Denn die Disjunktion von X und Y (welche sich durch (X + Y )(Y + X) ausdrücken lässt) ist, wie bereits erwähnt, nichts anderes als das Gegenteil von X ∼ Y . In diesem Sachverhalt liegt der Grund dafür, dass man in der symbolischen Logik derjenigen „Oder“-Verknüpfung, welche die gleichzeitige Wahrheit der Aussagen einschliesst, vor der disjunktiven Verknüpfung den Vorzug gibt. Die Negation kann für die Darstellung der logischen Beziehungen nicht durch die übrigen Operationen des Kalküls ersetzt werden. Vielmehr gilt folgender durch Anwendung der Normalform leicht beweisbare Satz: Von zwei (im Kalkül ausdrückbaren) Aussagen-Beziehungen, deren eine das Gegenteil der anderen ist, lässt sich immer gerade eine (also auch nur eine) ohne Anwendung des Negations-Zeichens darstellen. Die Betrachtung der negationsfreien Ausdrücke, d. h. der Ausdrücke, in welchen (explicite) kein Negationszeichen vorkommt, führt auf die Frage, ob sich ein negationsfreies Axiomen-System aufstellen lässt, aus welchem alle beweisbaren negationsfreien Formeln unseres Kalküls und nur diese ableitbar sind. Dabei soll unter einem negationsfreien Axiomen-System ein solches verstanden werden, in dessen Formeln und Regeln die Negation weder explicite noch implicite vorkommt, bei welchem also insbesondere die Zeichen „+“ und „→“ nicht Abkürzungen, sondern Symbole für Grundoperatoren bilden. Die gestellte Frage ist zu bejahen. Es ergibt sich nämlich durch ein Verfahren, welches dem in § 3 geführten Vollständigkeits-Beweise genau nachgebildet ist, dass aus der Gesamtheit der beweisbaren negationsfreien Formeln eine endliche Anzahl so ausgewählt werden kann, dass aus ihnen mit Hülfe der Regeln a) und b) alle übrigen Formeln jener Gesamtheit ableitbar sind, und zwar ohne dass irgend einmal für eines der Zeichen „+“ und „→“ der Ausdruck eingesetzt wird, durch welchen das Zeichen als Abkürzung definiert wird. (Die Regel b) ist dabei stets nur in der zweiten Fassung anzuwenden, wo α → β anstelle von αβ steht.)
5
10
15
20
25
30
Abhängigkeit der Formel 4). Unabhängigkeit der übrigen Grundformeln. § 4. Das System der Axiome, wie es im § 1 aufgestellt ist, stimmt im wesentlichen mit demjenigen Axiomen-System überein, welches in den „Principia Mathematica“ bei der Ableitung der allgemeingültigen Aussagen-Beziehungen zugrunde gelegt wird. Eine Abweichung besteht nur darin, dass die Grundformeln 2)
X → XY
und
4)
X(Y Z) → (XY )Z
an die Stelle der Formeln
2)
X →YX
35
40
und
4)
X(Y Z) → Y (XZ)
‘Beiträge zur axiomatischen Behandlung des Logik-Kalküls’
5
10
15
20
25
243
aus den Principia Mathematica gesetzt sind. (Vgl. „Principia Mathematica“, S. 100–101.) 2 (Diese Änderung, bei der ich mich an die Darstellung in Hilberts Vorlesung angeschlossen habe, empfiehlt sich im Interesse der Einfachheit des AxiomenSystems.) 3 Ich will zunächst zeigen, dass das Axiomen-System des § 1 mit dem der Principia Mathematica äquivalent ist. Die sehr einfachen Ableitungen, durch welche dies geschieht, sollen zugleich als Beispiele für die formale Methode des Kalküls dienen. Bei diesen sowie bei allen späteren Beweisen wird von den im § 3 ohne Begründung angeführten Sätzen des Kalküls keinerlei Gebrauch gemacht. Zur Orientierung über die Schreibweise muss ich ein paar Bemerkungen vorausschicken. Die symbolischen Beweisführungen sind so zu verstehen, dass jede Formel an der Stelle, wo sie zum ersten Mal aufgeschrieben wird, bereits als richtige Formel erwiesen ist (sodass z. B. die erste Beweisführung mit einer Grundformel oder einer durch Einsetzung aus einer solchen entstehenden Formel beginnen muss). Der Hinweis auf eine bereits bewiesene Formel soll in der Weise geschehen, dass die betreffende Formel da, wo sie zum ersten Mal auftritt, durch Numerierung (links von der Zeile) bezeichnet und bei ihrer Anwendung durch die Angabe ihrer Nummer (rechts von der Zeile) zitiert wird. Die Anwendung der Regel a) gebe ich jedesmal explicite an. Bei der Anwendung der Regel b) gebrauche ich folgendes Schema: αβ
21
α β,
30
35
wobei statt αβ auch α → β stehen kann. Die Einführung von „Abkürzungen“, bezw. deren Eliminierung soll durch ein vor die Zeile gesetztes „d. h.“ angedeutet werden. Bei einem Abschnitt in der Beweisführung setze ich ein Semicolon. Um häufige Wiederholungen von gleichartigen Schlüssen zu ersparen, empfiehlt es sich, gewisse oftmals gebrauchte formale Übergänge als „abgeleitete Regeln“ (— im Unterschied von den „Grundregeln“ a) und b) —) zu formulieren, auf die man sich jeweils da, wo | ein solcher Übergang erforderlich ist, berufen kann. Derartige Regeln müssen in dem Sinne bewiesen werden, dass die betreffende formale Schlussweise, welche sie vertreten, angegeben wird. (Natürlich lassen sich die abgeleiteten Regeln auch als Sätze über den Kalkül auffassen, jedoch kommt diese Bedeutung der Regeln für die formalen Beweisführungen nicht in Betracht.) 2 The propositions 2 ) and 4 ) correspond to ∗1·3 and ∗1·5 respectively of Whitehead and Russell 1910 , 100–101. They can be found on p. 96 of Volume 1 of the Second Edition, Whitehead and Russell 1927 . 3 The reference to ‘Hilberts Vorlesung’ is to the 1917/18 lectures to be found earlier in this Chapter; Hilbert’s treatment of the Whitehead-Russell system is on p. 133.
22
244
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Der Beweis für die Äquivalenz des Axiomensystems in den Principia Mathematica mit dem hier aufgestellten soll nun nach folgendem Plane geschehen: Erst wird 2 ) aus 2), 3), 5) abgeleitet, sodann 2) aus 2 ), 3), 5). Ferner wird 4 ) abgeleitet aus 3), 4), 5) und darauf 4) aus 3), 4 ), 5).
5
Beweis von 2 ) aus den Grundformeln 2), 3), 5): In 5) wird XY für X, Y X für Y und X für Z eingesetzt: (XY → Y X) → X(XY ) → X(Y X) XY → Y X
(Grundformel 3) )
X(XY ) → X(Y X)
10
(Grundformel 2) )
X(XY )
X(Y X) d. h.
23
X → Y X,
q. e. d.
Den Beweis der Umkehrung will ich mit Hülfe einer abgeleiteten Regel führen. Regel c): Ist α → β eine richtige Formel und γ ein beliebiger Ausdruck, so ist auch γα → γβ eine richtige Formel. Beweis: In 5) wird α für X, β für Y , γ für Z eingesetzt: (α → β) → (γα → γβ) α→β
(nach Voraussetzung)
15
20
γα → γβ. Man beachte, dass hier von den Grundformeln nur die fünfte benutzt wird. Beweis von 2) aus 2 ), 3), 5): In 3) wird X für Y und Y für X gesetzt: Y X → XY,
25
X(Y X) → X(XY ) d. h.
(nach Regel c) )
(X → Y X) → (X → XY ) X →YX X → XY,
(Formel 2 ) ) q. e. d.
Die Formel 5) wird hier indirekt bei der Anwendung der Regel c) benutzt.
30
‘Beiträge zur axiomatischen Behandlung des Logik-Kalküls’
5
10
245
Bei den folgenden Ableitungen findet ausser der Regel c) noch eine weitere abgeleitete Regel Anwendung, welche ebenso wie c) allein aus der Formel 5) beweisbar ist. Regel d): Sind α → β und β → γ richtige Formeln, so ist auch α → γ eine solche. Beweis: β →γ (nach Voraussetzung) αβ → αγ (nach Regel c) ) d. h. (α → β) → (α → γ) α→β
(nach Voraussetzung)
α → γ. Die Anwendung dieser Regel in den Beweisen soll nach dem Schema: α→β β→γ
15
α→γ angedeutet werden, wobei auch die Formel β → γ der Formel α → β voranstehen kann. Beweis von 4 ) aus 3), 4), 5): In 3) wird XZ für X eingesetzt:
20
(XZ)Y → Y (XZ);
(1)
in 4) wird Z für Y und Y für Z eingesetzt: X(ZY ) → (XZ)Y ;
(2)
in 3) wird Y für X und Z für Y eingesetzt:
25
Y Z → ZY X(Y Z) → X(ZY )
(nach Regel c) )
X(ZY ) → (XZ)Y
(Formel (2) )
X(Y Z) → (XZ)Y (XZ)Y → Y (XZ) X(Y Z) → Y (XZ),
30
(Formel (1) ) q. e. d.
Beweis von 4) aus 3), 4 ), 5): In 3) wird Z für X und XY für Y eingesetzt: (3)
Z(XY ) → (XY )Z;
24
246
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
in 4 ) wird Z für Y und Y für Z eingesetzt: X(ZY ) → Z(XY );
(4)
in 3) wird Y für X und Z für Y eingesetzt:
Y Z → ZY X(Y Z) → X(ZY )
(nach Regel c) )
X(ZY ) → Z(XY )
(Formel (4) )
X(Y Z) → Z(XY ) Z(XY ) → (XY )Z X(Y Z) → (XY )Z,
25
5
(Formel (3) ) q. e. d.
(In diesem wie in dem vorigen Beweis wird die Formel 5) implicite bei der Anwendung der Regeln c) und d) gebraucht.) Nach diesen vorbereitenden Betrachtungen gehe ich nunmehr zu dem Nachweise über, dass in unserem Axiomen-System die Formel 4), und ebenso in dem Axiomen-System der Principia Mathematica die Formel 4 ) entbehrlich ist. Hierfür genügt es, zu zeigen, dass die Formel 4) sich aus den Formeln 1), 2), 2 ), 3), 5) ableiten lässt. Denn aufgrund | der eben bewiesenen Abhängigkeiten kann dann die Formel 2 ) oder auch die Formel 2) als Voraussetzung weggelassen werden, und aus 3), 4), 5) kann die Formel 4 ) gefolgert werden, sodass sich einerseits die Formel 4) als beweisbar aus den Formeln 1), 2), 3), 5), andrerseits die Formel 4 ) als beweisbar aus den Formeln 1), 2 ), 3), 5) ergibt. — Da die Formel 5) vorausgesetzt wird, so dürfen bei dem Beweise die Regeln c) und d) benutzt werden. Aus diesen Regeln und der Formel 3) leite ich zunächst noch eine andre Regel ab, welche ein Seitenstück zu c) bildet. Regel e): Ist α → β eine richtige Formel und γ ein beliebiger Ausdruck, so ist αγ → βγ eine richtige Formel. Beweis: In 3) wird α für X, γ für Y eingesetzt: αγ → γα;
(m)
10
15
20
25
30
in 3) wird γ für X und β für Y eingesetzt: γβ → βγ; (n) (nach Voraussetzung) α → β γα → γβ (nach Regel c) )
αγ → γα
(Formel (m) )
αγ → γβ γβ → βγ αγ → βγ,
(Formel (n) ) q. e. d.
35
‘Beiträge zur axiomatischen Behandlung des Logik-Kalküls’
5
247
Jetzt habe ich nur noch nachzuweisen, dass sich aus den Formeln 1), 2), 2 ) mit Hülfe der Grundregeln und der Regeln c), d), e) die Formel 4) ableiten lässt. Dies geschieht folgendermassen: In 2) wird XY für X und Z für Y eingesetzt: XY → (XY )Z X → XY
26
(Grundformel (2) )
X → (XY )Z X((XY )Z) → ((XY )Z)((XY )Z)
(5)
(Regel e) );
in 2 ) wird Y für X und X für Y eingesetzt: 10
Y → XY Y Z → (XY )Z X(Y Z) → X((XY )Z)
(Regel e) ) (Regel c) )
X((XY )Z) → ((XY )Z)((XY )Z) (6) 15
(Formel (5) )
X(Y Z) → ((XY )Z)((XY )Z); in 1) wird (XY )Z für X eingesetzt: ((XY )Z)((XY )Z) → (XY )Z X(Y Z) → ((XY )Z)((XY )Z) X(Y Z) → (XY )Z,
20
(Formel (6) )
q. e. d.
Aus der Anordnung dieses Beweises geht hervor, dass man ohne Anwendung der Formel 1) bis zu der Formel (6): X(Y Z) → ((XY )Z)((XY )Z) gelangen kann. Diese Formel ist also aus den Formeln 2), 2 ) [[3), 5), und daher auch aus 2), 3), 5)]]--↑in Verbindung mit den Regeln c), d), e)↓ ableitbar, eine Tatsache, von der ich an späterer Stelle Gebrauch machen werde.
§ 5. 25
30
35
Nachdem sich so die Abhängigkeit der Formel 4) von den übrigen Grundformeln herausgestellt hat, entsteht jetzt die Frage, ob nicht ebenso gut wie die Formel 4) auch eine andre der fünf Grundformeln aus dem Axiomen-System weggelassen werden kann. Ich werde zeigen, dass dies nicht der Fall ist. Dazu ist es nötig, für jede der Formeln | 1), 2), 3), 5) den UnabhängigkeitsBeweis zu erbringen. Und zwar werde ich in allen vier Fällen nach derselben Methode verfahren, indem ich eine Interpretation des Kalküls angebe, verbunden mit einer Erklärung dessen, was eine „richtige Formel“ heissen soll, gemäss welcher die als unabhängig zu erweisende Formel nicht die Eigenschaft einer richtigen Formel hat, während die übrigen vier Grundformeln diese Eigenschaft besitzen. Hierbei muss natürlich nachgewiesen werden, dass die Regeln a) und b) im Sinne der gewählten Interpretation der Ausdrücke sowie der Definition für richtige Formeln gültig sind.
27
248
28
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Die Widerspruchslosigkeit der angewandten Deutung wird dadurch gewährleistet, dass es sich immer um endliche, vollkommen überblickbare Systeme handelt. Es wird also bei jedem der folgenden Unabhängigkeits-Beweise der Kalkül auf ein endliches System (eine endliche Gruppe im weiteren Sinne des Wortes1) ) zurückgeführt, für dessen Elemente eine Komposition („symbolisches Produkt“) und eine „Negation“ definiert ist, und diese Zurückführung findet in der Weise statt, dass die Variablen des Kalküls auf die Elemente jenes Systems als ihre Werte bezogen werden. Die „richtigen Formeln“ | sollen jedesmal dadurch charakterisiert sein, dass sie für beliebige Werte der vorkommenden Variablen nur Werte eines gewissen Teilsystems T annehmen können. Bei dieser Definitionsweise der richtigen Formeln ist die Gültigkeit der Regel a) von vornherein gesichert, da ja der Bereich der möglichen Werte eines Ausdrucks durch eine Einsetzung höchstens verkleinert werden kann, (sodass die Geltung von a) bei den einzelnen Systemen nicht eigens nachgeprüft zu werden braucht). Die Konstruktion eines Beispiels geschieht demnach so, dass die Elemente des betreffenden Systems aufgezählt werden, dann die Komposition und die Negation definiert und schliesslich das Teilsystem T angegeben wird. Letzteres findet durch eine symbolische Gleichung in der Form T = {· · · } statt, wobei in der geschweiften Klammer die Elemente von T stehen. —
5
10
15
20
A. Unabhängigkeit der Formel 1) von 2), 3), 4), 5). Zum Beweise dient folgendes System: System I: Elemente1) O, E , A . OX = XO = O für alle Werte von X. E X = XE = X
25
A A = O. O = E, 29
E = O,
A =A.
T = {O}.
Eine einfache arithmetische Interpretation dieses Systems erhält man, indem man die Elemente O, E , A als die Restklassen 0, 1, 2 modulo 4 deutet, wobei die Komposition mit der gewöhnlichen Multiplikation übereinstimmt. (Es gilt ja die Kongruenz 2 · 2 ≡ 0 (mod 4).) Wie man aus dieser Deutung ersieht, ist die Komposition des Systems kommutativ und assoziativ. Da ferner zufolge der Gleichungen OO = E O = O,
E E = OE = O,
AA =AA =O 1) Das heisst ohne Voraussetzung des assoziativen Gesetzes und der eindeutigen Umkehrbarkeit für die Komposition. 1) Die Buchstaben O und E verwende ich immer nur zur Bezeichnung solcher Elemente, die sich bei der Komposition bezüglich ebenso verhalten wie die Zahlen 0 und 1 bei der Multiplikation.
30
35
‘Beiträge zur axiomatischen Behandlung des Logik-Kalküls’
249
die Formel XX eine richtige Formel ist, so sind auch die Formeln 3), 4): XY (Y X)
5
und
X(Y Z)((XY )Z)
richtige Formeln. Dass der Ausdruck X(XY ) (Formel 2) ) eine richtige Formel ist, folgt aus den Gleichungen: O(OY ) = E O = O E (E Y ) = OY = O; A (A O) = A O = O,
A (A Y ) = A (A Y ), A (A E ) = A A = O,
A (A A ) = A O = O. 10
15
20
25
Auch die fünfte Grundformel XY {ZX(ZY )} ergibt sich als richtige Formel. Ist nämlich von den Variablen Y , Z eine gleich O, so ist der Gesamtausdruck gleich O. Dasselbe gilt, wenn Y und Z beide gleich A sind. Ist Y = E , so ist XY (ZY ) = XZ = XZ (weil für jeden Wert von X : X = X ist); demnach hat der betrachtete Ausdruck denselben Wert wie ZX(XZ), also (bei beliebigen Werten von X und Z) den Wert O. Ist Z = E , so ist ZX(ZY ) = XY ; der Gesamtausdruck hat daher denselben Wert wie der Ausdruck XY (XY ), also (für beliebige Werte von X, Y ) den Wert O. Da die aufgezählten vier Fälle alle Möglichkeiten erschöpfen, so ist 5) eine richtige Formel. Die Regel b) ist für das System gültig. Denn ist ein Ausdruck α stets gleich O, so ist α stets gleich E , αβ = E β = β, und wenn daher ausser α auch αβ eine richtige Formel ist, so muss β stets den Wert O haben, also eine richtige Formel sein. Demnach sind, abgesehen von der Formel 1), alle unsre Axiome erfüllt. Die Formel 1) ist aber in diesem System keine richtige Formel; denn wird in dem Ausdruck XXX für X der Wert A gesetzt so erhält man A A A = OA = E A = A . —
30
Anmerkung: Während sich die Formel XXX als unabhängig von den Formeln 2)–5) erweist, ist die Formel XX eine Konsequenz der Formeln 2), 3), 4), wie folgende Ableitung zeigt: In 4) wird X für X, X für Y und Y für Z eingesetzt: X(XY ) → (XX)Y X(XY )
35
(7)
(Grundformel 2) ) (XX)Y ;
in 3) wird XX für X eingesetzt: (XX)Y → Y (XX) (XX)Y
(Formel 7) ) Y (XX)
30
250 31
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
hierin wird X(XY ) für Y eingesetzt: X(XY )(XX) X(XY )
(Grundformel 2) )
XX,
q. e. d.
B. Unabhängigkeit der Formel 2) von den übrigen Grundformeln. Bei der Prüfung der Unabhängigkeit der Formel 2) soll die Fragestellung etwas verschärft werden. Es sind folgende Abhängigkeiten zu beachten: Aus der Formel 2) folgt nach der Regel a) die Formel X(XX), d. h. X → XX; aus dieser Formel in Verbindung mit XX → X (Grundformel 1) ) erhält man nach der Regel d) die Formel X → X, d. h. XX. Ich beweise nun: erstens, dass XX nicht aus den Formeln 1), 3), 4), 5) ableitbar ist, zweitens, dass auch nach der Hinzufügung der Formel XX zu jenen vier Grundformeln die Formel X(XX) nicht beweisbar ist, und drittens, dass auch durch die Hinzufügung der Formel X(XX) die Grundformel 2) nicht beweisbar wird.
5
10
15
1. Unabhängigkeit der Formel XX von 1), 3), 4), 5). System II: Elemente O, A , B. OX = XO = O XY = Y X = A 32
für jeden Wert von X für
X = O,
20
Y = O.
O = A , A = O, B = B. T = {O}. Die Komposition dieses Systems ist offenbar kommutativ und auch assoziativ, also ist insbesondere XY (Y X) = XY (XY ), X(Y Z) (XY )Z = X(Y Z) X(Y Z) . Andrerseits ist jedes symbolische Produkt entweder gleich O oder gleich A , und OO = O, A A = OA = O. Folglich sind 3) und 4) richtige Formeln. Ferner ist 1) eine richtige Formel; denn OOO = O, und für X = O ist XX = A , XXX = A X = OX = O. Auch 5) ist eine richtige Formel. Denn wenn Y = O oder Z = O ist, so ist Y Z = O; im Falle Y = O, Z = O ist entweder X = O, XY = A Y = A = O oder X = O, ZX = A = O, sodass in jedem Falle XY ZXZY = O zutrifft. Die Regel b) ist erfüllt; denn wenn der Ausdruck α stets gleich O ist, so ist α stets gleich A , und daher kann αβ nur unter der Bedingung stets gleich O sein, dass β stets den Wert O hat. XX ist aber in diesem System keine richtige Formel; denn
25
30
35
‘Beiträge zur axiomatischen Behandlung des Logik-Kalküls’
251
BB = BB = A . — 2. Unabhängigkeit der Formel X(XX) von 1), 3), 4), 5) und XX. System III: Elemente A , B, C , D. 5
A X = XA = A für alle Werte von X, BX = XB = B für X = A , C C = B, C D = DC = C , DD = D. A = B, B = A , T = {A , C }.
10
15
20
25
C = D,
D = C.
Die Komposition dieses Systems ist kommutativ definiert. Sie ist aber auch assoziativ. Denn ein dreigliedriges symbolisches Produkt ist gleich A , wenn darin A als Glied vorkommt; es ist gleich B, wenn A nicht vorkommt, dagegen B mindestens einmal oder C mindestens zweimal als Glied auftritt; es ist gleich C , wenn A und B darin nicht vorkommen und C genau einmal auftritt; und endlich ist es gleich D, wenn jedes Glied gleich D ist, — sodass also in jedem Falle der Wert des Produktes von der Zusammenfassung der Glieder unabhängig ist. Da andrerseits, zufolge der Gleichungen A A = BA = A ,
BB= A B = A ,
C C = DC = C ,
DD = C D = C ,
33
die Formel XX eine richtige Formel ist, so folgt, dass 3) und 4) richtige Formeln sind. Dass 1) eine richtige Formel ist, ergibt sich daraus, dass für X = C : XX = X, XXX = XX und dass C C C = BC = A C = A ist. Für den Ausdruck der Formel 5) XY ZXZY ergeben sich die möglichen Werte aus folgender Fall-Unterscheidung: a) Ist Y = A oder Z = A , so ist ZY , also auch der Gesamtausdruck gleich A.
30
b) Ist Y = A , Z = A , und X = A oder X = B, so ist XY = X, ZX = X, also entweder XY = A oder ZX = A , mithin der Gesamtausdruck gleich A . c) Ist X = A , B und zugleich Y = B oder Z = B, so ist entweder XY = A oder ZX = A , | folglich der ganze Ausdruck gleich A .
35
d) Ist Y = D, so ist XY = X, XY = X = X (weil X stets denselben Wert wie X hat), und ZY = Z, folglich XY ZXZY = XZXZ = ZXZX; also ist der Ausdruck gleich A oder gleich C (da ja XX diese Eigenschaft hat).
34
252
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
e) Ist Z = D, so ist ZX = X, ZY = Y , folglich XY ZXZY = XY XY , also wiederum der Ausdruck gleich A oder C . f) Ist Y = Z = C und X = A , B, so ist entweder X = C , ZX = C C = B = A oder X = D, XY = DC = C C = A , also in beiden Fällen der Gesamtausdruck gleich A .
35
5
Da hiermit alle möglichen Fälle erschöpft sind, so erweist sich 5) als richtige Formel. Es gilt auch die Regel b); denn ist α eine richtige Formel, so kommen als Werte von α nur B und D in Betracht, und da BX = B für X = A und DX = X für alle Werte von X ist, so kann αβ nur dann eine richtige Formel sein, wenn β ausschliesslich die Werte A , C annimmt also eine richtige Formel ist. Dass nun aber X(XX) für das vorliegende System keine richtige Formel ist, ergibt sich aus dem Falle X = C ; denn C (C C ) = DB = B.
10
3. Unabhängigkeit der Grundformel 2) von 1), 3), 4), 5) und X(XX).
15
System IV: Elemente A , B, C , D. Die Komposition wird am einfachsten beschrieben, indem eine transitive „Grössenbeziehung“ A < B < C < D eingeführt und mit Bezug | auf diese XY als das Minimum von X und Y definiert wird. A = B,
B =A,
C = D,
D = C.
20
T = {A , C }. Dieses System unterscheidet sich von dem vorigen nur dadurch, dass anstelle der Gleichung C C = B hier C C = C tritt. Die Diskussion gestaltet sich daher ganz entsprechend wie bei dem System III. Es finden nur folgende Abweichungen statt: Der assoziative Charakter der Komposition ergibt sich jetzt unmittelbar aus der Definition. Bei der Untersuchung der Grundformel 1) braucht der Fall X = C nicht gesondert behandelt zu werden, da für das vorliegende System allgemein XX = X gilt. Bei der Betrachtung der möglichen Werte des Ausdrucks XY ZXZY ist die Unterscheidung der Fälle d), e), f) durch folgende Überlegung zu ersetzen: wenn X, Y, Z alle von A und B verschieden sind, so sind auch die Ausdrücke XY und ZX von A und B verschieden, daher ist der Gesamtausdruck jedenfalls dann gleich C , wenn Y = C oder Z = C ist; ist aber Y = Z = D, so ist XY ZXZY = X X; der Ausdruck ist also entweder gleich A oder gleich C , (da ja XX nur diese beiden Werte annimmt). Der Ausdruck X(XX) ist jetzt eine richtige Formel, weil stets XX = X ist.
25
30
35
‘Beiträge zur axiomatischen Behandlung des Logik-Kalküls’
253
Gleichwohl ist X(XY ), d. h. die Formel 2) keine richtige Formel; denn C (C B) = DB = B,
und ebenso
D(DB) = C B = B.
—
36
C. Unabhängigkeit der Formel 3) von den übrigen Grundformeln. 5
System V: Elemente A , B, C , D. Für alle Werte von X ist AX =A,
BX = B,
DA = DB = A , A = C,
C X = X.
DC = DD = D.
B = D,
C =A,
D =A.
T = {A }.
10
Ich zeige zunächst, dass die Komposition assoziativ ist. In der Tat ist für alle beliebigen Werte von X, Y : A (XY ) = A = A Y = (A X)Y B(XY ) = B = BY = (BX)Y 15
C (XY ) =
XY
= (C X)Y.
Ferner ist für X = A oder X = B D(XY ) = DX = A = A Y = (DX)Y ; für beliebige Werte von Y ist D(C Y ) = DY = (DC )Y ; 20
für Y = A oder Y = B ist D(DY ) = DA = DY = (DD)Y ; und endlich ist für Y = C oder Y = D D(DY ) = DD = DY = (DD)Y.
25
30
In allen Fällen hat also Z(XY ) denselben Wert wie (ZX)Y . Um daher die Formel 4) als richtige Formel zu erkennen, genügt der Nachweis, dass XX eine richtige Formel ist; und dieser wird durch die Gleichungen A A = CA = A ,
BB = DB = A ,
CC = A C = A ,
DD = A D = A
Da allgemein XX = X ist, so ergibt sich hiermit auch XXX, d. h. 1) als richtige Formel. Dass 2) eine richtige Formel ist, folgt daraus, dass stets X(XY ) = (XX)Y = A Y = A
35
geliefert.
ist.
Für die Bestimmung der möglichen Werte des Ausdruckes XY ZXZY ist zu beachten, dass stets X = B und für Y = B stets Y A = A ist, sodass ein Ausdruck der Form αβ immer dann eine richtige Formel bildet, wenn β eine richtige Formel ist.
37
254
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Hiernach folgt, dass für Z = A oder Z = B der Wert des betrachteten Ausdrucks gleich A ist, weil dann ZXZY = ZZ = A ist, ferner auch für den Fall, dass Z = D und X = C oder = D ist, weil dann ZXZY = DZY = A ZY = A ist, und ebenso im Falle, wo Z = D und Y = A oder = B ist, weil dann ZXZY = ZXA = A ist. Für Z = C ist XY ZXZY = XY XY = A . Endlich hat für ↑den Fall, dass↓ X = A oder = B und zugleich Y = C oder = D ist, der Ausdruck XY einen der Werte C , D, sodass XY ZXZY = A ZXZY = A ist. Da weitere Fälle nicht möglich sind, so ergibt sich 5) als richtige Formel. Auch die Regel b) ist erfüllt, weil für eine richtige Formel α stets αβ = C β = β ist. Hingegen ist für das betrachtete System die Formel 3), d. h. XY (Y X) keine richtige Formel, wie sich an den Fällen
5
10
15
A B(BA ) = A B = C B = B DB(BD) = A B = B 38
herausstellt. —
D. Unabhängigkeit der Grundformel 5) von den Formeln 1) – 4). System VI: Elemente O, E , A , B. OX = XO = O, E X = XE = X für alle Werte von X, desgleichen XX = X.
20
A B = BA = O. O = E,
E = O,
A = B,
B = O.
T = {O}.
Die Komposition dieses Systems kann arithmetisch gedeutet werden, indem man unter den Elementen diejenigen vier Zahlen-Klassen versteht, in welche die Gesamtheit aller ganzen Zahlen zerfällt, wenn als gleichartig zwei Zahlen angesehen werden, deren Quadrate modulo 6 kongruent sind. Ordnet man den Elementen O, E , A , B bezüglich die durch 0, 1, 2, 3 repräsentierten Klassen zu, so stimmt die definierte Komposition mit derjenigen Zusammensetzung der Klassen überein, welche sich aus der gewöhnlichen Multiplikation ergibt. Hieraus ersieht man sofort, dass die Komposition nicht nur kommutativ, sondern auch assoziativ ist. Da ausserdem aufgrund der Gleichungen OO = E O = O, A A = BA = O,
25
30
E E = OE = O, BB = OB = O
35
der Ausdruck XX eine richtige Formel ist, so folgt, dass 3) und 4) richtige Formeln sind. Ferner ergibt sich allgemein XXX = XX = O,
X(XY ) = (XX)Y = OY = O,
sodass sich auch 1) und 2) als richtige Formeln erweisen.
40
‘Beiträge zur axiomatischen Behandlung des Logik-Kalküls’
255
Auch die Regel b) ist gültig; denn, wenn α eine richtige Formel ist, so ist
39
αβ = Oβ = E β = β. Die Formel 5), d. h. XY ZXZY ist aber hier keine richtige Formel; denn für X = B, Y = E , Z = A ergibt sich BE A BA E = O OA = E E A = A ,
5
und ebenso für X = B, Y = A , Z = A : BA A B A A = OA OA = E E A = A . —
10
Im Hinblick auf eine spätere Anwendung will ich hier noch verifizieren, dass für das System VI der Ausdruck XY ZXZY , welcher aus 5) durch Einsetzen von Z für Z entsteht, eine richtige Formel ist. Es sind dazu wieder mehrere Fälle zu unterscheiden: a) für Z = E oder Z = B ist XY ZX ZY = XY OXOY = Y ; b) für Z = O ist Z = E , also XY ZY ZY = XY XY = O;
15
c) für X = O ist XY ZX ZY = E Y O ZY = Y E ZY = Y ZY = Y Y Z = O; d) für X = E ist ZXZY = Z ZY = O, also auch der Gesamtausdruck gleich O; 20
e) für X = Z ist XY ZY = ZY ZY = O, folglich XY ZX ZY = XY ZY ZX = OZX = O; f) für X = Z ist ZXZY = XXXY = XXY = O, also ist auch der Gesamtausdruck gleich O.
25
Da nun für Z = E , B, O, X = O, E entweder X = A = Z oder X = B = A = Z ist, so sind mit den aufgezählten Fällen alle Möglichkeiten erschöpft, und der betrachtete Ausdruck erweist sich somit in der Tat als richtige Formel. —
Zusatz zu § 5. 30
Bei den ausgeführten Unabhängigkeits-Betrachtungen sind die Grundregeln als feststehend angenommen worden. Es bleibt nun noch zu prüfen, ob nicht eine von den beiden Grundregeln entbehrlich ist. Diese Aufgabe bietet keinerlei Schwierigkeit. In Bezug auf die Regel a) lässt sich nicht nur behaupten, dass bei ihrem Wegfall der Bereich der beweisbaren Formeln verkleinert wird, sondern es zeigt sich sogar, dass mit Hülfe
40
256
41
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
der Regel b) allein aus den fünf Grundformeln keine einzige weitere Formel abgeleitet werden kann. Denn damit die Regel b) anwendbar ist, müssen ja zwei Formeln gegeben sein, die sich in der Form α, αβ schreiben lassen. Nun haben zwar alle Formeln 1) – 5) die Form αβ; aber es stimmt dabei niemals der betreffende Ausdruck α mit dem Ausdruck einer der übrigen Grundformeln überein. Man kann also ohne die Regel a) keinen einzigen Schritt tun. Beim Weglassen der Regel b) verhält es sich nicht gleichermassen. Dass jedoch ohne die Regel b) nicht dieselbe Gesamtheit von Formeln beweisbar ist wie mit ihrer Anwendung, wird schon daraus ersichtlich, dass bei einer Anwendung der Einsetzungs-Regel a) die Anzahl der auftretende Variablen (jede in ihrer Vielfachheit gezählt) nur vermehrt, nicht vermindert werden kann, sodass es gewiss nicht möglich ist, allein mit Hülfe der Regel a) die Formel XX abzuleiten, da | diese ja nur zwei Buchstaben-Zeichen enthält, während in jeder der Formeln 1) – 5) die Anzahl der Buchstaben-Zeichen mindestens gleich drei ist. Es erweisen sich also beide Regeln als unentbehrlich. —
5
10
15
Formeln und Regeln. § 6.
42
Durch die bisherige Untersuchung ist das System der Formeln 1), 2), 3), 5) in Verbindung mit den Regeln a), b) als ein vollständiges System unabhängiger Axiome für unseren Kalkül nachgewiesen. In diesem Paragraphen will ich noch etwas auf die Fragen eingehen, welche die Ersetzbarkeit der Grundformeln durch Regeln betreffen. Diese Art der Fragestellung wird uns besonders in einem speziellen Fall, bei der Formel 5), nahegelegt. Betrachten wir nämlich die im vorhergehenden ausgeführten Beweise, so bemerken wir, dass darin die Formel 5) fast immer nur indirekt, d. h. vermittels der Regel c) zur Anwendung kommt. Eine Ausnahme bildet nur der allererste Beweis, bei dem aber offenbar auch die Formel 5) durch die Regel c) vertreten werden kann. Es besteht daher Grund zu der Vermutung, dass man für den Kalkül mit der Regel c) anstelle der Formel 5) auskommt. Diese Vermutung wird als richtig erwiesen sein, wenn es gelingt, die Formel 5) | aus den Formeln 1), 2), 3) mit Hülfe der Grundregeln und der Regel c) abzuleiten. Eine solche Ableitung ist nun tatsächlich ausführbar. Man beweist zunächst wie früher aus c) die Regel d). Aus 1), 2) und der Regel d) erhält man1) die Formel XX. Ferner leitet man aus 1), 2), 3) mit Hülfe der Regeln c) und d) wie im § 4 die Formel 4 ) ab.2) Und aus 4 ) lässt sich folgende Regel entnehmen: 1) 2)
Vgl. den Anfang des Abschnittes B in § 5. Der Beweis für die Formel 2 ) ist hierbei sinngemäss zu modifizieren.
20
25
30
35
40
‘Beiträge zur axiomatischen Behandlung des Logik-Kalküls’
257
Regel f ): Ist α(βγ) eine richtige Formel, so auch β(αγ). Beweis: In 4 ) wird α für X, β für Y und γ für Z eingesetzt: α(βγ) → β(αγ) α(βγ) β(αγ),
5
(nach Voraussetzung) q. e. d.
Jetzt hat man als Beweismittel die Formeln XX und 4 ) sowie die Regeln c), ↑d),↓ und f) zur Verfügung und gelangt mit diesen zu 5) durch folgende Schlussweise: In der Formel XX wird XY für X eingesetzt: XY (XY )
10
X(XY Y ) d. h.
X → XY Y ZX → Z(XY Y )
(8)
15
(Regel f) )
(Regel c) );
in 4 ) wird Z für X, XY für Y , Y für Z eingesetzt: Z(XY Y ) → XY (ZY ) ZX → Z(XY Y )
(Formel (8) )
ZX → XY (ZY ) d. h.
20
XY {ZX(ZY )} (Regel f) ), q. e. d. Wir finden also, dass die Formel 5) durch die Regel c) ersetzbar ist. Man könnte nun denken, dass die Regel c) ihrerseits wiederum durch die Regel d) ersetzt werden kann. Dass dies aber nicht der Fall ist, lehrt das (im § 5 betrachtete) System VI. Für dieses ist nämlich, wie ich gezeigt habe, der Ausdruck
25
d. h.
30
35
ZX{XY (ZY )}
XY {ZX(ZY )}, (X → Y ) → {(Z → X) → (Z → Y )}
eine richtige Formel, und aus dieser Formel lässt sich ohne weiteres die Regel d) ableiten. Dagegen ist für dieses System die Formel 5) keine richtige Formel, sodass nach dem eben Bewiesenen auch die Regel c) für das System nicht gelten kann (da ja die Formeln 1), 2), 3) in Bezug auf das System richtige Formeln sind). — Die Regel c) stellt bei der Zugrundelegung der Regeln a), b) eine schwächere Voraussetzung dar als die Formel 5), insofern c) sich unmittelbar aus a), b) und 5) ergibt, während 5) nicht aus a), b) und c) beweisbar ist. Denn aus blossen hypothetischen Regeln kann ja keine Formel abgeleitet werden. — Nach ganz der selben Methode, wie man aus 5) die Regel c) beweist, erhält man aus den Formeln 1), 2), 3) bezüglich folgende Regeln:
43
258
44
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Regel r1 ): Wenn αα eine richtige Formel ist, so ist auch α eine solche. Regel r2 ): Ist α eine richtige Formel, so ist für einen beliebigen Ausdruck β auch αβ eine richtige Formel. Regel r3 ): Ist αβ eine richtige Formel, so ist auch βα eine solche. Beispielsweise wird die Regel r1 ) aus 1) so bewiesen: In 1) wird α für X eingesetzt: αα → α αα α,
5
(nach Voraussetzung) q. e. d.
Man kann nun, ausgehend von dem aus den Formeln 1), 2), 3) und den Regeln a), b), c) gebildeten Axiomen-System, für jede der drei Formeln prüfen, ob sie durch die ihr entsprechende von den drei Regeln r1 ), r2 ), r3 ) ersetzbar ist. Die Untersuchung ergibt, dass die Formel 1) durch r1 ) ersetzt werden kann, dagegen weder 2) durch r2 ) noch 3) durch r3 ). Für diese Behauptung habe ich jetzt den Nachweis zu erbringen. Um die Ersetzbarkeit von 1) durch die Regel r1 ) zu beweisen, genügt es, die Formel 1) aus 2), 3) und den Regeln a), b), c), r1 ) abzuleiten. Dies geschieht auf folgende Art: Aus c) folgt1) die Regel d); aus 2), 3) und d) folgt 2 ); aus c), d) und 3) folgt die Regel e); und aus 2), 2 ) nebst den Regeln c), d), e) folgt (gemäss der am Ende von § 4 gemachten Bemerkung) die Formel (6):
10
15
20
X(Y Z) → ((XY )Z)((XY )Z). Wir können daher die Formeln 2 ) und (6) bei der Ableitung verwenden und folgendermassen schliessen: In 2 ) wird XX für Y eingesetzt: X → XXX
45
XX → X(XXX)
25
(Regel c) )
d. h. (9)
XX{X(XX X)};
in (6) wird XX für X, X für Y und XX X für Z eingesetzt: XX{X(XX X)} → {(XX X)(XX X)}{(XX X)(XX X)} XX{X(XX X)}
d. h. 1)
30
(Formel (9) )
{(XX X)(XX X)}{(XX X)(XX X)} (XX X)(XX X) (Regel r1 ) ) XX X (Regel r1 ) ) XX → X, q. e. d. —
Das heisst: mit Hülfe der Regeln a), b).
35
‘Beiträge zur axiomatischen Behandlung des Logik-Kalküls’
5
10
Dass die Formel 2) nicht durch die Regel r2 ) ersetzbar ist, ergibt sich aus der Betrachtung des Systems II, bei welchem 1), 3), 5) richtige Formeln sind, folglich auch die Regel c) gilt, und für welches aufgrund der (für jeden Wert von X gültigen) Gleichung OX = O die Regel r2 ) erfüllt ist, während 2) in Bezug auf das System keine richtige Formel bildet. Der Beweis dafür, dass die Regel r3 ) nicht die Formel 3) vertreten kann, wird geliefert durch das System VII: Elemente O, A , B, C . Für jeden Wert von X ist XX = X,
OX = XO = O,
A X = A für X = O, O =A,
15
20
25
A = O,
35
B = C,
XA = X;
BC = C B = O. C = B.
T = {O}
In diesem System ist 2), d. h. X(XY ) eine richtige Formel. Denn der Ausdruck hat für X = O, A offenbar den Wert O, für X = B, C aber ebenfalls, weil BY entweder gleich B oder gleich O, C Y entweder gleich C oder gleich O und BB = C C = O ist. Hieraus folgt insbesondere, dass X(XX) eine richtige Formel ist, und da allgemein XX = X, also XXX = XX = X(XX) ist, so ist 1) eine richtige Formel. r3 ) ist gültig, weil ein Produkt XY nur für solche Werte von X und Y gleich O ist, für die auch Y X gleich O ist. Ferner gilt die Regel b), das A X nur für X = O den Wert O hat. Auch die Regel c) ist erfüllt. Denn wenn α → β, d. h. αβ eine richtige Formel ist, so muss für jedes Wertsystem der Variablen einer von folgenden vier Fällen vorliegen:
α = C, α = B, 30
259
β = O; α = O,
d. h. α = A ;
β = B, β = C,
d. h. α = β = B d. h. α = β = C .
46
In allen diesen Fällen hat der Ausdruck γα → γβ, d. h. γα(γβ) wieder den Wert O, nämlich im ersten Fall, weil γO = O ist, im zweiten Fall, weil γA = γ und γ(γβ) eine richtige Formel ist, im dritten und vierten Fall, weil dann γα = γβ ↑ist↓ und allgemein XX den Wert O hat. γα → γβ ist also stets dann eine richtige Formel, wenn α → β eine solche ist. Die Formel 3) ist aber für dieses System keine richtige Formel; denn BA (A B) = BA = C A = C , C A (A C ) = C A = BA = B.
40
(Man beachte, dass bei diesem System trotz der Gültigkeit von c) die Formel 5) | keine richtige Formel ist, wie sich an dem Falle X = B, Y = Z = C zeigt,
47
260
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
wo XY {ZX(ZY )} = BC {C B(C C )}
48
= C C (OC ) = C (A B) = BA = B ist.) Wir finden somit, dass unser Axiomen-System ersetzbar ist durch das System der Formeln 2), 3) und der Regeln a), b), c), r1 ), während hierin weder 2) durch die Regel r2 ) noch 3) durch r3 ) vertreten werden kann. Will man nun doch die Anzahl der Grundformeln auf Eins reduzieren, so kann man in der Weise verfahren, dass man die Regel r3 ) durch folgendes schärfere Axiom ersetzt: Regel R3 ): Aus einer richtigen Formel entsteht wieder eine solche, wenn man für einen Bestandteil1) der Form αβ den Ausdruck βα setzt, d. h. wenn man in einem in der Formel auftretenden Produkt die Glieder vertauscht. Diese in unserem Kalkül gültige Regel2) enthält r3 ) als spezielle Folgerung, und während r3 ) bei Zugrundelegung der Regeln a), b) eine schwächere Voraussetzung bildet | als die Formel 3) ist die Regel R3 ) in gewissem Sinne eine stärkere Voraussetzung als die Formel 3). Denn aus R3 ) und der Formel XX erhält man (nach den Grundregeln) leicht die Formel 3); dagegen kann aus 3) und XX nicht die Regel R3 ) bewiesen werden.1) Wäre nämlich R3 ) eine Folge von XX und 3), so müsste sich insbesondere aus den Formeln XX, 3) und X(XY ) die Formel X(Y X) nach den Grundregeln ableiten lassen. Dass dies nicht der Fall ist, zeigt folgendes System: System VIII: Elemente O, A , B, C . OX = XO = O für alle Werte von X.
5
10
15
20
25
BC = C B = C C = O; AB =AC =AA =A; BA = C , O =A,
BB = B, A = O,
CA = C. B = C,
C = O.
T = {O}. Hier ist zunächst XX eine richtige Formel. Da ferner jedes Produkt XY , das von Y X verschieden ist, entweder den Wert A oder den Wert C hat und 1)
Als („unechter“) Bestandteil einer Formel ist auch die ganze Formel selbst anzusehen. 2) Den Beweis für die Tatsache, dass die Regel R3 ) in unserem Kalkül gilt, will ich hier nicht geben, da er einerseits nichts Neues bietet und andrerseits zu weit ab führen würde. Ich verweise dafür auf die Hilbertsche Vorlesung. 4 1) Es wäre daher ein Irrtum zu denken, dass die Formel 3) bei Zugrundelegung der Regeln a), b) mit dem kommutativen Gesetz gleichbedeutend ist. 4 See
the 1917/18 lectures, pp. 144-145.
30
‘Beiträge zur axiomatischen Behandlung des Logik-Kalküls’
261
A = C = O ist, so folgt, dass 3), d. h. XY Y X eine richtige Formel ist. Auch X(Y X) ist eine solche. Denn zunächst ist für X = A oder X = C , sowie für X = O oder Y = O der Wert des Ausdrucks gleich O. Nun bleiben nur noch die Fälle X = B, Y = O, und es ist 5
B(BA ) = C C = O,
B(BB) = C B = O,
B(BC ) = C O = O. Auch die Regel b) ist erfüllt, weil OX nur für X = O den Wert O hat. Der Ausdruck X(Y X) ist aber für das System keine richtige Formel, denn
49
B(A B) = C A = C .− 10
15
20
25
30
35
Anmerkung: Durch dieselbe Art der Verallgemeinerung, welche von der Regel r3 ) zu R3 ) führt, gelangt man von r1 ) zu folgender Regel: Regel R1 ): In jeder richtigen Formel kann ein Bestandteil αα durch α ersetzt werden. Es liegen hier wieder die gleichen logischen Verhältnisse vor: während man aus XX und R1 ) leicht die Formel 1) ableitet, kann aus XX und 1) nicht die Regel R1 ) bewiesen werden. Dies zeigt sich an dem System III. Denn für dieses sind 1) und XX richtige Formeln; und aus XX erhält man durch Einsetzung XX(XX). Wäre nun die Regel R1 ) gültig, so müsste auch X(XX) eine richtige Formel sein, was jedoch für das System nicht zutrifft. — Für die Regel r2 ) gibt es keine analoge Verallgemeinerung wie für r1 ) und r3 ). Dies hängt damit zusammen, dass die Formel 2) im Unterschied von 1) und 3) nicht „umkehrbar“ ist; d. h. während zugleich mit XX → X auch X → XX, und zugleich mit XY → Y X auch Y X → XY eine beweisbare Formel ist, ist die Umkehrung von 2), d. h. XY → X nicht beweisbar. — Es kommt nun darauf an, zu zeigen, dass in dem Axiomen-System, welches aus den Formeln 2), 3), und den Regeln a), b), c), r1 ) besteht, die Formel 3) durch die Regel R3 ) ersetzt werden kann. (Dies ist durch das vorige deshalb noch nicht erwiesen, weil ja in dem Axiomen-System, von dem wir hier ausgehen, die Formel XX nicht vorausgesetzt wird.) Es handelt sich also um den Beweis von 3) aus Formel 2) und den Regeln a), b), c), r1 ), R3 ): Zuerst wird aus c) (mit Hülfe der Grundregeln) die Regel d) abgeleitet; aus c) und R3 ) folgt unmittelbar die Regel e), ferner aus 2) und R3 ) die Formel 2 ). Aus 2), 2 ) und den Regeln c), d), e), ergibt sich (was schon vorhin benutzt wurde) die Formel (6): X(Y Z) → ((XY )Z)((XY )Z). Hierin wird X für X, X für Y und Y für Z eingesetzt:
50
262
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
X(XY ) → ((XX)Y )((XX)Y ) X(XY )
(Formel 2) )
((XX)Y )((XX)Y ) (XX)Y (Regel r1 ) ); hierin wird XX für Y eingesetzt:
5
(XX)(XX) XX
(Regel r1 ) );
hierin wird XY für X eingesetzt: XY (XY ) (Regel R3 ) )
XY (Y X) d. h.
51
XY → Y X,
q. e. d.
Somit bildet das Axiomensystem, welches aus der Formel 2) und den Regeln a), b), c), r1 ), R3 ) besteht, einen vollkommenen Ersatz für unser ursprüngliches Axiomen-System. Auch ist in dem neuen Axiomen-System keines der sechs Axiome entbehrlich. Wie dies bewiesen wird will ich kurz andeuten: Die Unabhängigkeit der Formel 2) ergibt sich aus dem System II; die Unabhängigkeit der Regel c) folgt aus dem System VI; (wäre hier die Regel c) gültig, so müsste wegen der bewiesenen Ersetzbarkeit von 5) durch c) die Formel 5) für das System eine richtige Formel sein); die Unabhängigkeit von r1 ) folgt aus dem System I, bei welchem r1 ) nicht gelten kann, weil sonst gemäss dem vorhin bewiesenen die Formel 1) in Bezug auf das System eine richtige Formel wäre; die Unabhängigkeit von R3 ) folgt aus dem System V. Dass die Regel a) nicht entbehrlich ist, folgt daraus, dass bei ihrem Wegfall jede beweisbare Formel die in 2) vorkommenden Variablen X, Y enthalten würde; denn durch die Anwendung der Regeln R3 ) und r1 ) kann nur die Reihenfolge und die Vielfachheit des Auftretens der Variablen geändert werden, die ↑Benutzung der↓ Regel c) kann die Gesamtheit der vorkommenden Variablen höchstens vergrössern, und bei der Anwendung von b) können nur solche Ausdrücke wegfallen, die (bei der Darstellung des Ausdrucks durch die Grundzeichen) unter einem Negationszeichen stehen. Schliesslich ergibt sich die Unabhängigkeit der Regel b) aus folgendem System: System IX: Elemente O, E . OX = XO = O für X = O, E . O = O,
52
E = O.
10
EE = E.
15
20
25
30
35
T = {O}.
Für dieses System ist offenbar 2) eine richtige Formel, und die Regel a), r1 ), R3 ) sind erfüllt; auch gilt c), weil jeder Ausdruck der Form α → β (also auch jeder von der Form γα → γβ) eine richtige Formel ist. Dagegen ist b) ungültig; denn während X und XX richtige Formeln sind, ist X keine richtige Formel. —
40
‘Beiträge zur axiomatischen Behandlung des Logik-Kalküls’
5
263
Eine andre Methode, um mit einer einzigen Grundformel auszukommen, besteht in der Hinzufügung folgender (aus der Formel 4) ableitbaren) Regel: Regel r4 ): Ist α(βγ) eine richtige Formel, so auch (αβ)γ. Die Einführung dieser Regel gestattet uns, einerseits die Formel 3) durch die Regel r3 ) und überdies noch die Formel 2) durch die Vereinigung der (aus 2) folgenden) Regel r2 ) mit der (aus 2), r3 ), r4 ) beweisbaren) Formel XX zu ersetzen, sodass wir zu folgendem Axiomen-System gelangen: Formel XX, Regeln a), b), c), r1 ), r2 ), r3 ), r4 ).
10
Anmerkung: Dass hier die Annahme der Formel XX zusammen mit der Regel r2 ) eine geringere Voraussetzung darstellt, als die Formel 2), kann man sich an dem Umstande klar machen, dass weder in unserem ursprünglichen Axiomen-System (Formel 1), 2), 3), 5), Regeln a), b) )
15
noch in dem modifizierten Axiomen-System (Formel 2), Regeln a), b), c), r1 ), R3 ) ) die Formel 2) durch die Formel XX in Verbindung mit der Regel r2 ) vertreten werden kann. Der Beweis hierfür, den ich | nicht im einzelnen ausführen will, ergibt sich aus dem
20
System X: Elemente O, A , B, C . OX = XO für alle Werte von X; BC = C B = O; in allen übrigen Fällen ist XY = A . O =A,
25
A = O,
B = C,
C = B.
T = {O}.
Hier sind 1), 3), 5) und XX richtige Formeln und die Regeln a), b), c), r1 ), r2 ), R3 ) gültig. Dagegen ist 2) keine richtige Formel, wie man aus den Fällen B(BA ) = B(BB) = C A = A , C (C A ) = C (C C ) = BA = A
30
35
40
ersieht. — Zur Begründung meiner Behauptung, dass das Axiomen-System, welches von der Formel XX und den Regeln a), b), c), r1 ) – r4 ) gebildet wird, unser ursprüngliches Axiomen-System zu ersetzen vermag, genügt es, dass ich aus den aufgezählten Axiomen die Formel 2) und 3) ableite. Beweis von 2) und 3) aus XX und den Regeln a), b), c), r1 ) – r4 ). Zur einfacheren Darstellung schicke ich eine abgeleitete Regel voraus: Regel g): (Umkehrung von r4 ) ): Ist (αβ)γ eine richtige Formel, so auch α(βγ). Beweis: (αβ)γ γ(αβ)
(nach Voraussetzung) (Regel r3 ) )
(γα)β
(Regel r4 ) )
53
264
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
β(γα)
(Regel r3 ) )
(βγ)α α(βγ)
(Regel r4 ) ) (Regel r3 ) ),
q. e. d.
Hiernach ergibt sich die Formel 2) sogleich auf folgende Art: (nach Voraussetzung)
XX
54
(XX)Y
(Regel r2 ) )
X(XY )
(Regel g) ),
d. h. X → XY,
5
q. e. d.
Um nun 3) zu beweisen, leite ich zunächst die Formel e ) ab:
d. h.
XX
(nach Voraussetzung)
XX
(Regel r3 ) )
(XX)Y
(Regel r2 ) )
Y (XX)
(Regel r3 ) )
(Y X)X
(Regel r4 ) )
X(Y X)
(Regel r3 ) )
X → Y X,
10
15
q. e. d.
Unter Anwendung der Formeln 2) und 2 ) kann nun so geschlossen werden: In XX wird XY für X eingesetzt: XY (XY ) (10)
(XY X)Y
(Regel r4 ) )
Y (XY X) X →YX
(Regel r3 ) ); (Formel 2 )
XY X → XY (Y X)
20
(Regel c) )
Y (XY X) → Y {XY (Y X)} (Regel c) ) Y (XY X)
(Formel (10) )
25
Y {XY (Y X)} {XY (Y X)}Y {XY (Y X)}Y X
(Regel r2 ) )
{XY (Y X)}(Y X)
(Regel g) )
(Regel r3 ) )
(Regel r3 ) )
(Y X){XY (Y X)} (Y X){XY (Y X)} XY XY (Y X){XY (Y X)}
(Regel r2 ) )
{XY (Y X)}{XY (Y X)}
(Regel r4 ) )
XY (Y X)
(Regel r1 ) )
(Regel r3 ) )
30
‘Beiträge zur axiomatischen Behandlung des Logik-Kalküls’
d. h.
5
10
15
20
25
30
35
XY → Y X,
265
q. e. d. —
Es bleibt nun noch, von dem neu eingeführten Axiomensystem nachzuweisen, | dass es kein überflüssiges Axiom enthält. Dies geschieht entsprechend wie bei dem vorigen Axiomen-System: Für die Regeln r1 ), r2 ), r3 ) und c) ergibt sich die Unabhängigkeit bezüglich aus der Betrachtung der Systeme I, IV, V, VI, wobei zu beachten ist, dass jedesmal XX eine richtige Formel und die Regel r4 ) erfüllt ist. Die Unabhängigkeit von r4 ) folgt aus dem System VII. (Hier ist z. B. X(Y Y ) eine richtige Formel, (XY )Y dagegen nicht, also r4 ) ungültig.) Dass die Regel b) unabhängig gilt, geht aus dem System IX hervor, bei welchem offenbar r4 ) gilt. Dass die Regel a) nicht entbehrt werden kann, zeigt sich daran, dass ohne ihre Anwendung nur solche Formeln beweisbar wären, in denen die Variable X vorkommt (was sich analog wie bei dem vorigen Axiomensystem ergibt). Und endlich folgt die Unentbehrlichkeit der Formel XX in trivialer Weise daraus, dass aus den Regeln allein (welche ja alle hypothetischen Charakter haben) keine Formel bewiesen werden kann. — Die Ergebnisse der letzten Betrachtungen lassen sich in folgender Übersicht zusammenfassen: Als logisch gleichwertig mit dem Axiomen-System des § 1 und zugleich auch als Systeme von unabhängigen Axiomen haben wir folgende Vereinigungen von Formeln und Regeln erkannt: Formeln 1), 2), 3), 5); Regeln a), b). Formeln 1), 2), 3); Regeln a), b), c). Formeln 2), 3); Regeln a), b), c), r1 ). Formel 2); Regeln a), b), c), r1 ), R3 ). Formel XX; Regeln a), b), c), r1 ), r2 ), r3 ), r4 ). Als unzulänglich zur Ersetzung des anfänglichen Axiomen-Systems sind insbesondere folgende Zusammenstellungen von Formeln und Regeln erwiesen1) : Formeln 1), 2), 3); Regeln a), b), d) (System VI). (System VII). Formeln 1), 2); Regeln a), b), c), r3 ) Formeln 1), 5), XX; Regeln a), b), r2 ), R3 ) (System X). — Bemerkung: Als eine beachtenswerte Unabhängigkeit sei hier noch folgende erwähnt: Es ist unmöglich aus der Formel 2) und den Regeln a), b), c), r1 ), r3 ) die Formel XX abzuleiten. Dies ersieht man aus dem 1)
Ich gebe jedesmal auch das endliche Elementen-System an, aus welchem die Unvollständigkeit der betreffenden Zusammenstellung von Axiomen hervorgeht.
55
56
266
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
System XI: Elemente O, A , B, C . OX = XO = O für alle Werte von X; für X = O ist A X = C ; BA = BB = B, T = {O}.
CA = CC = C,
O =A,
A = B,
BC = C B = O.
B = C,
C = B.
Denn für dieses System ist 2) eine richtige Formel, und die Regeln a), b), c), r1 ), r3 ) sind gültig; hingegen ist XX hier keine richtige Formel, da ja A A = BA = B
ist. —
Anhang: Der Schrödersche Unabhängigkeits-Satz.
57
Es mögen jetzt als „Operationen“ nur die Negation, das symbolische Produkt und die symbolische Summe gelten; und zwar sollen diese alle GrundOperationen sein. Durch Anwendung der Operationen auf die Variablen X, Y, · · · entstehen „Ausdrücke“. Eine Verknüpfung zweier Ausdrücke in der Form α → β heisse eine „Formel “.1) Ferner gebe es zwei individuelle Zeichen O und E . Man betrachte folgendes Axiomen-System: Als „richtige Formeln“ werden postuliert:2) XX → X X → X +X X → XY X +Y → X XY → Y X X +Y → Y +X X →O E →X O → XX X + X → E
58
5
Als Regeln werden aufgestellt: die Einsetzungsregel a); die (bisher schon so benannte) Regel c): ist α → β eine richtige Formel, so auch γα → γβ; die (neue) Regel c ): ist α → β eine richtige Formel, so auch γ + α → γ + β; die (bisher schon so benannte) Regel d): sind α → β und β → γ richtige Formeln, so ist auch α → γ eine solche. Behauptet wird nun, dass die Formeln XY + XZ → X(Y + Z) X + Y Z → (X + Y )(X + Z) 1)
Das Symbol „→“ darf hier nicht wie bisher als Abkürzung angesehen werden; es hat gegenüber den anderen Verknüpfungszeichen eine Sonderstellung. 2) Um von der hier gewählten Schreibweise zu der Schröderschen zu gelangen, hat man Produkte mit Summen p. 58 zu vertauschen, anstelle von X, Y, Z, · · · die Buchstaben a, b, c, · · · zu nehmen, ferner O durch 1, E durch O, das Zeichen „→“ durch „= ( “ und den Negations-Strich durch den Index 1 zu ersetzen.
10
15
20
25
30
‘Beiträge zur axiomatischen Behandlung des Logik-Kalküls’
267
beide nicht durch dieses Axiomen-System beweisbar sind.1) (Die umgekehrten Formeln X(Y + Z) → XY + XZ (X + Y )(X + Z) → X + Y Z 5
können aus den aufgezählten Axiomen abgeleitet werden. Auch folgen die Formeln X(Y Z) → (XY )Z und
10
X + (Y + Z) → (X + Y ) + Z
nach dem in § 4 angewandten Verfahren.) Der Beweis des ausgesprochenen Satzes geschieht mit Hülfe folgendes endlichen Systems: System XII: Elemente O, E , A , B, C . Für alle Werte der Variablen ist
15
XY = Y X, X + Y = Y + X; XX = X + X = X; OX = O, E X = X, O + X = X, E + X = E ; A B = A C = BC = O, A +B = A +C = B +C = E. O = E,
20
30
35
A = B,
B = C,
C =A.
Eine Formel α → β heisst eine richtige Formel, wenn für jedes Wertsystem der Variablen entweder α gleich β oder α gleich E oder β gleich O ist. Die Definition von Produkt und Summe in diesem System lässt sich in einfacher Weise interpretieren, indem man unter den Elementen bezüglich folgende Zahlen-Mengen versteht: O = {1},
25
E = O,
A = {1, 2},
B = {1, 3},
C = {1, 4},
E = {1, 2, 3, 4}.
Das symbolische Produkt zweier von diesen Mengen bedeutet dann den (eindeutig bestimmten) grössten gemeinsamen Teil, und die Summe zweier Mengen bedeutet die (der Elementenzahl nach) kleinste zu dem System gehörige Menge, welche jene beiden Mengen als Teilmengen hat. Es sind nun in Bezug auf das System XII zunächst die zehn als Axiome aufgestellten Formeln richtige Formeln. Für die Formeln X → O, E → X folgt dies unmittelbar aus der Definition der richtigen Formeln. Bei den Formeln O → XX, X+X → E trifft es zu, weil allgemein XX = O und X + X = E ist. Für XX → X, X → X + X folgt es daraus, dass XX = X = X + X ist. Für die Formeln XY → Y X und X + Y → Y + X ergibt es sich ↑dar↓aus, dass Produkt und Summe kommutativ definiert sind. 1) Diese Behauptung geht insofern etwas über den tatsächlich von Schröder aufgestellten Satz hinaus, als Schröder bei diesem Unabhängigkeits-Satz sein Postulat der Existenz einer Negation nicht mit in Betracht zieht.
59
268
60
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Und bei den Formeln X → XY , X + Y → X ist es daraus zu entnehmen, dass für X = E entweder XY = X oder XY = O ist und dass für X = O entweder X + Y = X oder X + Y = E ist. Die Regel a) ist offenbar erfüllt. Ferner gelten die Regeln c) und c ). Denn bei | einer richtigen Formel α → β wird für beliebige Werte der Variablen stets mindestens eine der drei Gleichungen α = β, α = E , β = O erfüllt. Im Falle α = β ist aber für jeden Ausdruck γ auch γα = γβ und γ + α = γ + β. Für α = E ist γα = γ, sodass die beiden Glieder der Formel γα → γβ bezüglich dieselben Werte haben wie die Glieder der richtigen Formel γ → γβ; und es ist γ + α = E . Für β = O ist γβ = O und γ + β = γ, sodass die Glieder der Formel γ + α → γ + β bezüglich die gleichen Werte besitzen wie die Glieder der richtigen Formel γ + α → γ. Die Formeln γα → γβ und γ + α → γ + β haben also zugleich mit α → β die Eigenschaft der richtigen Formeln. Auch die Regel d) ist gültig. Denn sind α → β und β → γ richtige Formeln, so besteht bei beliebigen Werten der Variablen eine der drei Gleichungen α = β, α = E , β = O zusammen mit einer der Gleichungen β = γ, β = E , γ = O; und es liegt daher jedenfalls einer der drei Fälle α = γ, α = E , γ = O vor. α → β ist also eine richtige Formel. Somit sind die aufgestellten Axiome sämtlich erfüllt. Dennoch sind XY + XZ → X(Y + Z)
und
5
10
15
20
X + Y Z → (X + Y )(X + Z)
für das betrachtete System keine richtigen Formeln. Denn setzt man X = A , Y = B, Z = C , so ergibt sich:
25
XY + XZ = A B + A C = O + O = O, X(Y + Z) = A (B + C ) = A E = A ; X + Y Z = A + BC = A + O = A (X + Y )(X + Z) = (A + B)(A + C ) = E E = E . Die Bedingung für die richtigen Formeln ist also bei keiner von den beiden Formeln erfüllt. —
30
Textual Notes
269
Textual Notes 235.24: 235n: 237.34–35: 237.38: 238n: 239n: 240.8: 242.19: 243.7: 246.17: 247.35: 249.29: 250.23: 251.10: 256.10–11: 257.28:
260.15: 260.15: 267.29: 267.29: 267n:
(d. h. wahr ist)] Interlineated by Bernays. im Sprachgebrauch] Interlineated by Bernays. jede beliebige Verteilung der Werte 0 und 1 auf] ↑jede↓ beliebige ↑Verteilung der↓ Werte ↑0 und 1 auf↓ Insertions added by Bernays. wiederholten] widerholten Vorworts] Interlineated by Bernays. wenn er eine beweisbare Formel ist,] Interlineated by Bernays. mit Hülfe des] [[??? de? ]]--↑mit Hülfe des↓ Correction by Bernays. Regeln] Bernays originally wrote ‘Regeln’ twice, then deleted the second occurrence. Principia Mathematica] Principia mathematica der eben bewiesenen] der ↑eben↓ bewiesenen Insertion by Bernays. nachgewiesen] [[jedesmal]] nachgewiesen Deletion by Bernays. Formel XXX als] Formel ↑XXX ↓ als Insertion by Bernays. dieses Systems] Bernays originally wrote, then deleted: dieser Gruppe gleich] [[stets]] gleich Deletion by Bernays. (jede in ihrer Vielfachheit gezählt)] ↑(jede in ihrer Vielfachheit gezählt)↓ Insertion by Bernays. dieses System] dieses [[Gruppe]]--↑System↓ It is possible that Bernays has added an ‘s’ to ‘diese’, thus forming ‘dieses’, when changing from ‘Gruppe’ to ‘System’, although this is not clear from the manuscript. man für einen] man ↑für↓ einen Insertion by Bernays. den] [[durch]] den Deletion by Bernays. System XII] System↑XII↓ Insertion by Bernays. zehn] [[acht]]--↑zehn↓ Substitution by Bernays. sein] [[das]]--↑sein↓ Substitution by Bernays.
270
Chapter 1
Lectures on the Principles of Mathematics (1917/18)
Description of the Text Collection: The version relied upon here is the copy deposited in the Paul Bernays Nachlaß at the Eidgenössische Technische Hochschule, Zürich, Archive und Nachlässe, Hs 973:192. Size: Approximately 33.0 × 21.0 cm. Cover Annotations: None (apart from the catalogue number). Composition: The text consists of a title page and four pages of introduction, followed by sixty pages of text in two signatures. The two signatures are loosely sewn into a binder with a black linen spine and hard blue cardboard covers. The five initial pages are unbound, and have been inserted into the binder as loose sheets. Pagination: The title page is unnumbered; the four introductory pages are numbered I–IV; the sixty pages of text are consecutively numbered 1–60. Original Title: On the title page is written, in Bernays’s hand, ‘Beiträge // zur // axiomatischen Behandlung // des Logik-Kalküls. // Eingereicht Göttingen 1918. // Paul Bernays.’ The portion ‘Eingereicht . . . Bernays’ is clearly an addition and is written, not in black ink, but in blue, ball-point pen, and with shakier handwriting. Text: The same paper has been used throughout the document. The pages bear a watermark with a coat of arms and the annotation, ‘Documenten Canzlei’. The individual pages (including the title page) were all folded in half lengthwise, and only the right hand side of the page was used for writing. The text is very polished, written in Bernays’s hand in black ink, with a very few minor insertions (all by Bernays). The Bernays Nachlaß came to what was then the Wissenschaftshistorische Sammlung of the ETH in two installments in 1977 and 1978. No copy of the original thesis has been found in the Göttingen libraries and archives. It therefore seems most likely that this text was Bernays’s fair copy of the habilitation thesis submitted at Göttingen, and remained in his private possession until it was turned over to the ETH archive. Editorial Remarks. The text is highly polished, and required little editorial work. But a few points should be noted: 1. Orthography. No attempt has been made to standardise Bernays’s orthography. For example, ‘Hülfe’, ‘explicite’, ‘andre’, ‘unsre’, ‘andreseits’, ‘dass’ and ‘sodass’ have not been standardised to the modern spellings, and the ‘ss’-form has never been changed to the ‘ß’-form. Bernays also typically hyphenates compound nouns for technical terms, where there would normally be no hyphenation, for example, ‘Grund-Operationen’ instead of ‘Grundoperationen.’ Bernays also sometimes refers to Whitehead and Russell’s Principia Mathematica by putting the title in Roman letters inside German quotation marks, and sometimes just in Roman letters unadorned. All has been left as it is in the original. Two genuine spelling mistakes by Bernays have been corrected and reported in the Textual Notes. 2. Symbols. Bernays uses a form of script ‘0’ to stand for the zero element and a form of script ‘E’ to stand for the unit element (Einheit) in the various domains used as the basis for propositional interpretations; these have been rendered by ‘O’ and ‘E ’ respectively. Bernays also uses a ‘T’ in Sütterlin script to indicate a subset of the domain; following the Volume’s standard practice, this is rendered as a capital Fraktur ‘T’, thus ‘T’.
Description of the Text
271
3. Formatting. Bernays standardly uses indentation when beginning a new paragraph; however, the indentations are often minimal and hard to identify. A clue is sometimes given by the fact that the previous line ends before the right-hand edge of the column of text. However, when there is little sign of indentation, identification of genuinely new paragraphs is made more difficult by the fact that there might be other reasons for ending the previous line before the margin, for example, the aesthetic desire to avoid hyphenation and begin a new sentence on a new line, rather than having the first word of the sentence at the far right of the previous line (danger: new paragraph signalled, but none intended), or when it just happens by chance that the previous line ends at the right-hand margin (danger: new paragraph intended but not identified). These problems are exacerbated by the fact that the text is composed within a narrow column. Consequently, editorial judgement had to be exercised in identifying new paragraphs. 4. Although the text itself is divided into (usually named) sections and subsections, there is no Inhaltsverzeichnis at the beginning; this has been added here. Bernays’s section headings have been used where these exist; otherwise we have entered ‘§k Unbetitelt’. Bernays standardly writes the section number (thus ‘§1’ etc.) on a separate, centred line after the heading; however, the new Inhaltsverzeichnis lists the section numbers before the heading, with the heading following on the same line. The sub-sections were not numbered; these have been included in the Inhaltsverzeichnis with their own level of indentation.
Hilbert and his wife in their garden, 27 July 1937. Courtesy of Dorothée Fuchs.
Chapter 2 Lectures on Logic
‘Logik-Kalkül’ (WS 1920) ‘Probleme der mathematischen Logik’ (SS 1920) ‘Consistency Proofs for Fragments of Arithmetic’ (undated draft)
W. Ewald and W. Sieg (eds.), David Hilbert’s Lectures on the Foundations of Arithmetic and Logic 1917–1933, DOI 10.1007/978-3-540-69444-1_2, © Springer-Verlag Berlin Heidelberg 2013
275
276
Chapter 2
Lectures on Logic (1920)
Introduction to the 1920 Lectures During the two years following the 1917/18 lectures which form Chapter 1 of this Volume, Hilbert appears to have devoted little time to foundations, at least in public. A letter from Bernays to Russell on 8 April 1920 remarks, ‘As you may know, Professor Hilbert — I am honoured to be his assistant — has been working intensively for a number of years on the problems of mathematical logic’. But Bernays gives no details about Hilbert’s activities.1 Hilbert’s lectures during the period 1918–1920 were primarily on mathematical physics, with a popular course in the special Autumn Semester of 1919 on ‘Natur und mathematisches Erkennen’ (Hilbert 1919* ). But in 1920 he delivered two sets of technical lectures on logic. The first set, ‘Logik-Kalkül’, was presented in the Winter Semester; the second, ‘Probleme der mathematischen Logik’, in the subsequent Summer Semester. The two sets of lectures followed each other in unusually rapid succession. In 1920, as a result of wartime disruptions, the semesters were separated by a spring break of only three weeks; and it was in fact during this spring break that Bernays, who wrote up the notes for both sets of lectures, sent his letter to Russell.2 This was clearly a time of intense logical reflection for Hilbert, and the lectures show him searching for a new direction in his foundational work. The issues raised in the first set of lectures flow directly into the second, with scarcely any overlap in the material covered; indeed, from many points of view they constitute a single course of lectures. For this reason, we have grouped these two sets of lecture notes together into a single chapter. These lecture notes are supplemented by a manuscript in Hilbert’s hand that is remarkably interesting and, though undated, fits into the developments described here. 1 The
German text of the remark is:
Wie Sie wohl wissen, beschäftigt sich Herr Professor Hilbert — dessen Assistent zu sein ich die Ehre habe — seit einigen Jahren besonders eifrig mit den Problemen der mathematischen Logik.
The letter was mentioned above in the Introduction to Chapter 1, at the end of section 6.1. It is found in the Russell Archive at McMaster University. 2 Contrary to the usual sequencing of semesters, the Winter Semester of 1920 preceded the Summer Semester of 1920. In 1919, in order to accommodate soldiers returning to the university at the end of the war, an extra semester was interpolated into the schedule in the autumn, the so-called ‘Herbstzwischensemester’. This extra semester ran from 22 September to 20 December 1919. It was followed by the Winter Semester for 1920, which ran from 5 January to 31 March 1920, and then by the usual Summer Semester for 1920, which ran from 26 April to 15 August 1920. The ‘Logik-Kalkül’ lectures of the Winter Semester were held on Wednesdays and Saturdays, from 12.00–13.00; the lectures ‘Probleme der mathematischen Logik’ were held on Saturdays from 12.00–13.00. This sequence of the two lecture courses is independently clear from their content; see, e. g., p. 2 of the Summer Semester lectures. Bernays wrote up the Winter Semester notes alone; the Summer Semester notes were written up in collaboration with Schönfinkel. On the cover page of the typescript, the collaborator is identified as ‘N. Schönfinkel’. We assume that is a typographical error and that the collaborator was in fact Moses Schönfinkel, who was a student in Göttingen at the time.
Introduction to the 1920 Lectures
277
Although the exact intellectual inspiration for Hilbert’s new logical explorations is difficult to pin down with certainty, he appears to have been reacting, at least in part, to the views of Brouwer and Weyl, whose critique of classical mathematics had been receiving wide currency. These lectures mark the start of Hilbert’s engagement with their foundational views. Several of the themes that were to become central to his work of the 1920s now begin to take shape. In particular, we find a greater concern with securing infinitary mathematics against objections that go back at least to Kronecker. In his Second Problem from the Paris lecture of 1900, Hilbert had already raised the problem of proving the consistency of higher arithmetic, and he had made a start on direct syntactic consistency proofs in his 1904 Heidelberg talk. But these ideas had lain fallow since then. Although the problem of the consistency of arithmetic was not entirely absent in the 1917/18 lectures, it was far from the center of attention, and syntactic consistency proofs are not mentioned. But now these themes move back into the foreground. And the conception of logic has shifted as well. In the earlier lectures from 1917/18 the function of mathematical logic had been described (p. 188) as the investigation of the foundations of mathematical theories and their relationship to logic; but now the function of mathematical logic is to secure the foundations of mathematics against the problems posed by the paradoxes (‘Logik-Kalkül’, p. 47). These new themes do not emerge fully-formed in the 1920 lectures, where Hilbert is still working his way towards what was to become his (and Bernays’s) programmatic approach to proof theory. To an unusual extent, these lectures show Hilbert in the very act of rethinking the foundations of his subject: he probes and examines various contending theories as he searches for a new approach. Let us now consider in more detail the two sets of lecture notes and what they show us about the development of his thought in this transitional year.
1. Logical Calculus. The typescript of the ‘Logik-Kalkül’ lectures from the Winter Semester of 1920 is divided into three parts. Parts One and Two present, in telegraphic style, the propositional calculus and the function calculus. This was material that Hilbert had already treated in detail in the 1917/18 lectures. As in the 1917/18 lectures, the function calculus is essentially many-sorted first-order logic, with the distinction between the various sorts of syntactic variable being directly motivated by semantic considerations. This portion of the typescript contains frequent references back to the 1917/18 lectures, and covers some of the same ground. But Hilbert deviates from his earlier presentation of mathematical logic in several important respects. First, he is even less concerned with drawing an exact distinction between the syntax and the semantics of his logical calculi than he had been in the 1917/18 lectures; instead, the presentation of the formal calculi is interwoven with an account of their standard interpretation. (For example, on pp. 2–4 he makes free use of the intuitive notions of truth and semantic equivalence.) The
278
Chapter 2
Lectures on Logic (1920)
entire treatment is somewhat loose and intuitive; much of Part One found its way into the opening sections (§§1–9) of Hilbert and Ackermann 1928 , where it serves as a motivating, informal introduction to the material taken from the 1917/18 lectures. (Details of the relationship of these lectures to Hilbert and Ackermann 1928 are given in the Introduction to Chapter 1, section 6.2, and the Introduction to Appendix A.) This casual intermingling of syntactic and semantic ideas is noteworthy. Two years earlier Bernays in his Habilitationsschrift (see the Appendix to Chapter 1) had drawn with exemplary clarity the distinction between syntax and semantics, thereby making fully explicit a distinction that Hilbert had tacitly relied upon since his investigations of the foundations of geometry. Hilbert is often depicted as a crude ‘formalist’, yet here his presentation of the formalism is far less rigorous than that of Bernays in 1918. But this seeming retrogression (also for reasons discussed in the Introduction to Bernays’s Habilitationsschrift) should not be entirely surprising. The full, programmatic power of formalization had not yet become evident in the work either of Hilbert or of Bernays, and in 1920 it was not yet clear that the distinction was destined to play a fundamental role in a ‘proof theory’ that was still far from its mature state. At any rate, Hilbert evidently thought that for his purposes in the 1920 lectures the intuitive presentation was adequate: he clearly understood how to distinguish between syntax and semantics with full rigour but in these lectures took a more informal approach. Secondly, Hilbert does not present the propositional calculus as an axiomatic system, but instead gives on pp. 8–9 a set of rules for transforming the equations of the propositional calculus and for determining their ‘correctness [Richtigkeit]’. This development, too, is surprising since Hilbert was such a staunch proponent of the axiomatic method. In dispensing with axioms and relying exclusively on rules, Hilbert takes a step beyond Bernays’s work of 1918 (which did not abandon axioms entirely) and in the direction of Gentzen’s systems of natural deduction. He shows that the rules for propositional logic allow the transformation of any formula into a semantically equivalent conjunctive normal form, and establishes on pp. 9–10 that every propositionally valid (immer or stets richtige) formula is obtainable with the rules. As in the 1917/18 lectures, ‘Richtigkeit’ is used in a context sensitive manner, both as a semantic and as a syntactic notion: thus a formula is ‘(immer) richtig’ if it is logically valid, but the syntactic rules are also called ‘Richtigkeitsregeln’. The informal completeness proof sketched on pp. 9–10 shows that this ambiguity is harmless; Hilbert adds on p. 12 an elimination rule (which allows (X &X)∨Y to be exchanged for Y and vice versa), and shows that the resulting system allows the derivation of all propositional consequences of a given set of axioms. The treatment of quantificational logic proceeds in a similar manner. The semantics is given informally, making use of the intuitive properties of predicates and relations. Variables are introduced with the remark: These variables play the role of arguments of the logical functions [i. e., of the predicates and relations]; the values [of the arguments] are determinate objects. Here one has to take into account that the values that can be substituted for the different arguments (as in arithmetic) are restricted to
Introduction to the 1920 Lectures
279
certain domains of definition [Definitionsbereiche], which are determined by the meaning of the function signs. (‘Logik-Kalkül’, p. 24.)
The ‘all-sign’ (x)P (x) and the ‘exist-sign’ (Ex)P (x) are then introduced with the parenthetical observation (pp. 25–26): The system of objects, i. e., the values of x, to which such a statement relates, is determined by the domain of definition of the argument of the function P . This remark settles the difficulties discussed by Russell in the interpretation of universal judgements.
It is not clear exactly which Russellian discussion is being referred to; but Hilbert, in contrast to Russell, did not allow unrestricted quantification and required his quantifiers to range over what the De Morgan-Peirce-Schröder tradition called a ‘universe of discourse’; cf. the Introduction to Chapter 1 (the 1917/18 lectures), section 3. On pp. 31–33, Hilbert adds to the rules of the propositional calculus a group of rules (separated into transformation rules and correctness rules) for operating with quantificational formulas.3 The result is a completely rule-based version of first-order logic easily seen to be equivalent to the function calculus in the 1917/18 lectures. Hilbert illustrates (pp. 35–45) the operation of the rules and briefly shows how traditional syllogistic logic can be incorporated into the function calculus. ‘We have dissected language in its function as a universal instrument of human thought,’ he concludes, ‘and laid bare the mechanism of logical argumentation’ (pp. 46–47). Thirdly, in his treatment of both of propositional and of predicate logic Hilbert does not investigate (or even mention except in passing) the metalogical issues that had figured so prominently in his earlier lectures and in Bernays’s 1918 Habilitationsschrift. This neglect is parallel to his somewhat casual attitude towards the distinction between syntax and semantics. Questions of completeness, or of the relationship between the formalism and its semantics, have receded into the background. The motivation for this shift appears to be a concern with the analysis of the paradoxes, which at the beginning of the later lectures from the Summer Semester (p. 2) Hilbert would explicitly tie to difficulties with mathematical inference. Already in the Winter Semester lectures (p. 1) he says: In order to eliminate these difficulties [caused by the paradoxes], a precise investigation of the nature and structure of mathematical proof is clearly necessary. A first tool for this is the logical calculus.
The logical calculus seems to have been designed to present propositional and first-order logic in a purely rule-based form which allows logical calculations to be presented as they naturally arise within a mathematical proof, and thus to furnish an analysis of logical inference and of the activity of mathematical reasoning. 3 On p. 31 Hilbert defines a formula (containing indeterminate propositional and function variables) to be correct, if any contentual determination of the indeterminate signs leads to a correct statement.
280
Chapter 2
Lectures on Logic (1920)
This aspect of Hilbert’s logical investigations is lost from view in the later book Hilbert and Ackermann 1928 , where the rule-based version of quantificational logic is omitted altogether, and where the canonical versions of both sentential and first-order logic are presented axiomatically. But in these lectures the goal is to obtain a more direct representation of mathematical thought. In the 1922/23 lectures, Hilbert would formulate a calculus that presents, axiomatically, the elimination and introduction rules for the propositional connectives. Here, in early 1920, on pp. 41–42 of these lectures, Hilbert describes his rules for quantificational logic as ‘defining’ or ‘giving the meaning’ of the quantifiers.
2. Strict Finitist Number Theory. In Part III of the ‘Logik-Kalkül’ lectures, Hilbert turns from the logical formalism to the foundations of arithmetic, and takes the first significant step towards a syntactic approach to consistency proofs since his Heidelberg lecture of 1904. In the paper ‘Axiomatisches Denken’ and in the 1917/18 lectures, Hilbert had noted with approval Russell’s attempts at a logicist reduction, and had applauded the logicist construal of the integers as second-order properties. It is important to observe, however, that already in the 1917/18 lectures Hilbert makes it clear that the existential character of Whitehead and Russell’s Axiom of Reducibility renders it doubtful that a foundational reduction of mathematics to logic had in fact been obtained. In the ‘Logik-Kalkül’ lectures of 1920, Hilbert implicitly rejects the foundational aspirations of the logicist programme; this rejection was to become explicit a few months later in the Summer Semester lectures. Hilbert had hoped that the full extent of the Cantor-Dedekind higher analysis could be given a satisfactory grounding. The type-theoretic reduction in the 1917/18 lectures can be seen as an attempt to address one part of this task ‘from the top down’; the two sets of lectures in 1920, in contrast, attempt to address it ‘from the bottom up’. Accordingly, Hilbert (pp. 45–47) refines his account of the relationship between mathematics and logic, and re-emphasizes the existential aspect of the axiomatic method. In order to develop a mathematical theory by means of the logical calculus, he says, one must be given a system (or systems) of objects. Predicates of and relations between those objects are correlated with appropriate linguistic symbols, and the assumed properties of the basic relations are then expressed by formulas. Those formulas are stipulated as axioms (i. e., as ‘correct formulas’) in the symbolic calculus. ‘On this foundation’, he says on p. 46, ‘the entire theory is developed purely through the application of the rules of the function calculus’. Two features of this extremely compressed formulation should be noticed. First, logic is here seen seen as essentially a set of inferential rules, and as content neutral : rather than providing mathematics with its content (as in logicism), the neutral framework of logical rules has mathematical content superadded to it by the specification of an axiom system. Secondly, an axiom system in Hilbert’s usage is not simply a meaningless collection of linguistic formulas, but rather presupposes ‘a system (or
Introduction to the 1920 Lectures
281
several systems) of objects, between which certain relations with determinate presupposed basic properties are considered’. In other words, for Hilbert the formal calculi always come with an interpretation. This way of applying the logical calculus is entirely appropriate, says Hilbert, so long as we are attempting to derive new results or to give a systematic presentation of a theory. However, the task of mathematical logic is not just to develop appropriate inferential calculi, but also to secure the foundations of mathematics, in particular the theory of the natural numbers, against the paradoxes. ‘From this point of view a genuine consistency proof for the axioms of number theory would be desirable; but nobody has yet been able to provide one’ (p. 48). The strikingly different attempts of Frege and Dedekind to ground number theory through logic or set theory have come to naught; moreover, Hilbert claims, these earlier attempts leave open the question whether every problem in number theory is decidable by means of the usual methods. He goes on: To solve these problems [of consistency and decidability] I see no other alternative than to go through the symbolic development of number theory from the very beginning, and to bring the inferences and concept-formations into a form which excludes paradoxes from the outset and makes the procedure of giving proofs completely surveyable (p. 48).
It should be observed that, although Hilbert now rejects the idea of a reduction of mathematics to logic, he has not returned to the 1904 view that logic and arithmetic are to be developed simultaneously. Rather, he adopts a kind of constructive arithmetic stricter than that which appears later as finitist mathematics. Bernays points out in several places that Hilbert’s views evolved in the direction of finitist mathematics; for example, in 1954 Bernays writes: Originally, Hilbert also intended to take the narrower standpoint that does not assume the intuitive general concept of numeral. That can be seen, for example, from his Heidelberg lecture of 1904 [i. e., Hilbert 1905b]. It was already a kind of compromise that he adopted the finitist standpoint as presented in his publications. (Bernays 1954 , 12.)4
Hilbert takes as the concrete objects the signs of mathematical theories themselves. He describes on pp. 49–53 a strictly finitist fragment of elementary arithmetic, in which one performs calculations with a finite stock of numerals (in his example, the numerals 1 to 4); the latter are introduced as explicit abbreviations for the ‘number signs’ 1, 1 + 1, (1 + 1) + 1, ((1 + 1) + 1) + 1. He observes that for the practical purposes of calculation one never needs 4 The
original German reads:
Ursprünglich wollte auch Hilbert den engeren Standpunkt einnehmen, der nicht den anschaulichen Allgemeinbegriff der Ziffer voraussetzt. Das ist unter anderem aus seinem Heidelberger Vortrag (1904 vide (1905)) zu ersehen. Es war schon eine Art von Kompromiss, dass er sich zu dem in seinen Publikationen eingenommenen finiten Standpunkt entschloss.
Similar remarks occur in the 1977 interviews with Bernays (Bernays 1977* ). Hallett 1995 , 169, 173, cites further evidence of this early ‘strict finitist’ view visible in Hilbert 1905a* . The criticism of Kronecker for being insufficiently radical is repeated in the subsequent lectures in the Summer Semester, p. 21.
282
Chapter 2
Lectures on Logic (1920)
more than a finite stock of such numerals, as the stock can be expanded as needed. However, this way of proceeding is severely limited. It gives us only a procedure for constructing new number signs from old ones, without ever arriving at a system of all number signs (p. 54). It follows that it cannot yield even such simple general number-theoretic formulas as the (unquantified) x + y = y + x. But classical number theory does contain (quantified) theorems about all numbers, where the system of numbers is viewed as a completed whole. The constructive method adopted here must accordingly be enriched. To address this issue, Hilbert next sets up a calculus for operating with free-variable ‘symbolic equations’, such as x + y = y + x between ‘defined symbolic signs’. (A function, as explained on pp. 54–56, is viewed as a symbolic sign that contains variables and is built up by what is in effect primitive recursion: the crucial point is that the functions are constructed in parallel with the number signs themselves, via a rule for proceeding from n to n + 1.) The symbolic equations are not viewed as general statements concerning all numbers or all numerals, but simply as symbolic formulas obtained according to the rules of the calculus. An equation such as x + y = y + x is thus not a statement about all numbers; rather, its meaning is given by the proof which establishes it within the calculus. Indeed, a symbolic equation that contains the variable x is said on p. 56 to be correct, if (i ) the replacement of x by 1 leads to a correct equation, and (ii ) the correctness for x + 1 follows from that for x by ‘certain proof rules’. (Some rules are indicated on pp. 56–57.) A concrete equation like 2 + 3 = 3 + 2 is thus not an instantiation of the general formula, but must be established separately; the utility of the general formula is that the proof of x + y = y + x yields a ‘guide [Wegweiser ]’ to a proof of 2 + 3 = 3 + 2, which itself is an abbreviation for a statement concerning number signs. The meaning of symbolic equations having been thus clarified, we are free if we wish to formulate them in the usual way as universally quantified propositions. But we must not ‘transfer the logical relationships between the universal and existential judgement to these improper [uneigentlich] universal sentences’ (p. 61). Hilbert warns in the extremely compressed final four paragraphs that such a formulation is only a façon de parler, and for the first time he mentions (with approval) Brouwer’s views on the Law of the Excluded Middle, linking them to his own preoccupation with decidability. A genuine universal proposition, he says, is true if and only if it has no counterexample. But in the present circumstances the meaning of the symbolic equations depends on the syntactic rules of proof. In particular, an existence claim must be underwritten by an actual constructive presentation of the relevant object. To assume that the symbolic equations are genuine universal propositions would therefore be tantamount to assuming that, for any symbolic equation, either we can prove it from the rules of the system, or we can exhibit a counterexample from the rules of the system.5 But we are not entitled to assume that 5 Hilbert makes a related point in his lectures from 1924/25 on the infinite, p. 124 (see Chapter 4 of this Volume, below, p. 749), that although certain equations like a + b = b + a
Introduction to the 1920 Lectures
283
every number-theoretic question is decidable in this strong sense; accordingly neither the Law of the Excluded Middle nor the quantifier rules of classical logic are satisfied by the symbolic equations of this presentation of number theory.
3. Interlude: Brouwer and Weyl. Let us briefly take stock. We have seen that the first set of lectures deviates in some striking ways from the lectures of 1917/18. The metalogical questions have receded into the background; the central concerns now are the analysis of mathematical inference, and securing the foundations of arithmetic. The ‘Logik-Kalkül’ lectures end as follows: Through these considerations, we gain an understanding of the paradoxical claim, recently made by Brouwer, that the Law of the Excluded Middle (the ‘tertium non datur’) ceases to be valid for infinite systems (pp. 61–62).
This remark, which dates from late March 1920, is the first mention of Brouwer in Hilbert’s foundational writings. Although the remark is brief, it seems likely that the new themes were at least in part stimulated by the recent foundational work of Brouwer and of Hilbert’s own former student, Hermann Weyl. Clearly, the considerations reported in section 2 above show that the attempt to provide a systematic constructive rebuilding cannot lead to full classical mathematics. Even the basic logical principles lose their validity. Here is the intellectual heart of the dispute that will emerge shortly between ‘formalism’ and intuitionism. (Its core can be traced back to the disagreements between Kronecker and Dedekind in the late 1880s: cf. Kronecker 1887 and Dedekind 1888 .) Most historical accounts of Hilbert’s reaction to Brouwer and Weyl begin with Hilbert’s published talks in Copenhagen and Hamburg in the spring and summer of 1921; the present lecture notes push the story back to the beginning of 1920. It is not certain precisely what Hilbert knew of the foundational work of Weyl and Brouwer at this time, although their ideas loom over both sets of lectures. In May of 1919, Hilbert was elected a foreign member of the Royal Netherlands Academy of Sciences; Brouwer recommended the election. In October of 1919, Brouwer was offered Hecke’s chair at Göttingen (which he eventually declined); Hilbert supported the offer. It is unclear to what extent Brouwer’s philosophical views were considered in the appointment process, if at all. But several of Brouwer’s foundational writings were at the time available in German or English, including the polemical paper ‘Intuitionism and formalism’ (Brouwer 1912 ). The announcements in the Mathematische Annalen of the meetings of the German Association of Mathematicians (Deutsche Mathematiker-Vereinigung) show that there were various talks in Germany during this period on Brouwer’s foundational work, and his ideas were cerare finitistically admissible, their negations are problematic; and that statements about the totality of integers are unacceptable from the point of view of strict finitism if they rest on the tertium non datur (e. g., ‘Either there exists a prime greater than p, or there does not’).
284
Chapter 2
Lectures on Logic (1920)
tainly familiar to Weyl as well as to other third parties. So Hilbert could have learned of Brouwer’s views from any number of sources.6 Weyl published during this same period the monograph Das Kontinuum (Weyl 1918 ); the view of logic and predicative definability developed in this book is substantially identical to that in Weyl’s paper from 1910 (Weyl 1910 ). In the Summer Semester lectures, Hilbert discusses Weyl and was clearly familiar with the predicative mathematics as set forth in those two works. His knowledge of the contents of Weyl’s paper from 1920 ‘Über die neue Grundlagenkrise der Mathematik’ (Weyl 1921 ) raises a different set of issues. In that paper (p. 54, p. 158 of the reprint) Weyl announced ‘Brouwer — das ist die Revolution!’, and declared his allegiance to a broadly intuitionistic view of logic and mathematics. Weyl pointed out significant differences between his position and Brouwer’s, and Brouwer commented in an unpublished handwritten note, that ‘in the end Weyl only half understands what intuitionism is about’.7 The ‘Grundlagenkrise’ paper was submitted for publication on 9 May 1920. Two days later Weyl delivered a lecture in Göttingen on the foundations of analysis. This was three weeks into the Summer Semester, which had started on April 26. On 16 May, Hilbert wrote to Weyl that, if he had known about Weyl’s lecture, he would of course have been present, ‘especially since this topic interests me greatly’. Hilbert continues: I have asked Bernays and Kneser to give me a detailed report of your lecture: it contains all sorts of trains of thought similar to those that I, too, have broached in my lectures in recent semesters, even if our basic tendencies seem to be very different. I very much look forward to the working out of your ideas.8
As far as we are aware, no copy of such a report by Bernays and Kneser has survived. The Hilbert archive contains an undated report, in Bernays’s hand, on a lecture by Weyl on analysis; but the occasion of the lecture is unclear, and its content suggests that it dates from a time before the ‘Grundlagenkrise’ paper.9 Hilbert’s letter is certainly correct in observing that there are remarkable similarities between Weyl’s approach and his own recently completed 1920 Winter Semester lectures. In particular, Weyl advanced the view that quan6 Detailed accounts of the interactions between Brouwer, Weyl, and Hilbert are provided in Chapter 8 of van Dalen 1999 and in Hesseling 1999* (also published as Hesseling 2004 ). 7 The comment comes from a short note on Weyl’s paper (handwritten, in German) in Brouwer’s Nachlaß. See Mancosu 1998 , 122. 8 The German text of the excerpt reads:
Ich habe Bernays und Kneser veranlasst, mir ein ausführliches Referat über Ihren Vortrag zu erstatten: es sind allerlei ähnliche Gedankengänge dabei, wie auch ich sie in meinen Vorlesungen der letzten Semester eingeschlagen habe, wenn auch unsere Grundtendenzen sehr verschieden zu sein scheinen. Auf die Ausarbeitung Ihrer Ideen bin ich sehr gespannt!
The remainder of the letter, whose original is in the Weyl Archive at the ETH, concerns Weyl’s career plans. 9 The document is to be found in the Hilbert Nachlaß, under Cod. Ms. D. Hilbert 685:3.
Introduction to the 1920 Lectures
285
tified statements do not represent genuine judgements (Urteile): universal statements are ‘instructions for judgements [Anweisungen auf Urteile]’, while existential statements are ‘judgement abstracts [Urteilsabstrakte]’. Abstracts of the form ‘there exists an even number’ have value, like a paper currency, only to the extent that they can be ‘cashed in’ as concrete, particular judgements like ‘2 is an even number’. In contrast to Weyl, Hilbert (‘Logik-Kalkül’, pp. 25–26) clearly regards both determinate statements (i. e., those involving no variables, but only proper names) and quantified statements as expressing judgements. But the equations of his numerical calculus are mere ‘symbolic equations’ and (like Weyl’s universally quantified statements) do not express genuine universal judgements. Instead (like Weyl’s ‘instructions for judgements’) they are only guides pointing to proofs; and their determinate value is cashed in through equations between concrete number signs of the form ((1 + 1) + 1) + 1. These are striking similarities between two almost exactly contemporaneous documents. It is not clear whether Hilbert’s views might somehow have been communicated to Weyl in Zürich, or Weyl’s views communicated to Hilbert in Göttingen; but Hilbert’s letter (which, however, refers to the foundations of analysis rather than the interpretation of the quantifiers) indicates that he and Weyl were not in close contact, and that they may have arrived at their logical views independently. The origins of the foundational discussion of the twenties need further study, both historical and mathematical. However, it should be clear that at the time of these lectures, in 1920, Hilbert’s proof-theoretic programme had not yet been formulated. That its formulation and pursuit would significantly change the nature of the discussion with Brouwer and Weyl is evident from Brouwer’s paper ‘Intuitionistic reflections on formalism’ and Weyl’s ‘Comments on Hilbert’s second lecture on the foundations of mathematics’, both from 1927.10 By that time, both Brouwer and Weyl explicitly recognized the continuities between intuitionism and Hilbert’s proof theory. Brouwer even predicted that the ‘disagreement over which is correct . . . will vanish, and the choice between the two activities be reduced to a matter of taste’ (quoted from the English translation in van Heijenoort 1967 , 490). Brouwer imposed some conditions, of course; but none that would be through their mathematical content unacceptable to the proof theorists in Göttingen. Although Weyl in his ‘Comments’ retained a critical attitude towards some of Hilbert’s remarks, he noted that the new situation was brought about through the strict formulation of the finitist programme; this step is for him of ‘immense significance and scope’ (see p. 944 below). Brouwer in his 1927 remarks went even further in emphasizing the continuities, and accused Hilbert of having taken from him without proper attribution the distinction between a language and a metalanguage (loc. cit., 490–492). Brouwer, in his 1907 thesis, had indeed, in the context of a discussion of Hilbert’s 1904 Heidelberg talk, drawn a distinction between languages of the first 10 The papers cited are Brouwer 1928a and Weyl 1928 . The latter is reprinted in this Volume as the second item in Appendix B.
286
Chapter 2
Lectures on Logic (1920)
and the second order; this distinction, according to Brouwer, was implicit in Hilbert 1905b, but not formulated with adequate clarity.11 Brouwer’s thesis was written in Dutch, and there is no sign that Hilbert ever read it. However, Brouwer reports in a footnote to his 1927 lecture that he had described the distinction between languages of different order to Hilbert in some conversations in the autumn of 1909. (The two met that year in Scheveningen; see van Dalen 1999 , 128.) Brouwer is correct that the distinction between uninterpreted syntax and the intuitive metalanguage is not clearly drawn in Hilbert 1905b; and, since this was a central part of his criticism of Hilbert in the thesis, there is no reason to doubt his recollection that a conversation on these topics took place in 1909. However, in the light of the lecture notes contained in this Volume, the accusation that Hilbert obtained the concept of metamathematics from Brouwer is difficult to sustain. The distinction between syntax and semantics is quite clearly worked out in Bernays 1918* , which in turn was an elaboration of ideas in the 1917/18 lectures, which in turn was a conscious elaboration of ideas (both explicit and implicit) about axiomatics that Hilbert had been using since his work on the foundations of geometry at the end of the nineteenth century. There is no sign that Brouwer’s thesis or the conversation of 1909 influenced any of these developments. More significantly, however, in the 1920 lectures, even after the Bernays Habilitation of 1918, Hilbert still does not attach great importance to the distinction between his axiomatic systems and their semantics, and his treatment remains loose and intuitive. For reasons discussed in the Introductory Note to Bernays 1918* , even as late as 1920 it still was not clear to Hilbert or to Bernays that the concept of completeness examined in the Habilitation would turn out to be of central importance to mathematical logic: Bernays himself seems at the time to have regarded the completeness result (which of course rests on a distinction between the axiomatic system and its semantics) as unworthy of publication. Similarly, it was not clear even in 1920 that the strict distinction between formallygiven syntactic calculi and their metamathematical investigation would come to play a central role in a proof-theoretic programme that had not yet been formulated. In other words, whatever Brouwer may have said to Hilbert in 1909, Hilbert in 1920 was scarcely less casual about these matters than he had been in 1904. More importantly, however, the real point of originality in Hilbert was not the distinction between formal calculi and their semantic interpretation. That distinction (as Brouwer recognized in his thesis) goes back at least to Leibniz; and one can find it also in Berkeley, Boole, Peirce, Frege, Poincaré, and many of the algebraists of the nineteenth century. (Numerous examples are given in Ewald 1996 .) Hilbert’s originality was rather to see that this distinction could be put to a powerful, new mathematical use — specifically, that one could pose 11 The thesis is translated in Brouwer 1975 ; the discussion of the relationship between logic and mathematics occupies Part III of the thesis; the specific discussion of Hilbert and of second-order languages is to be found on pp. 92–95.
Introduction to the 1920 Lectures
287
explicit questions about the consistency, completeness, and decidability of an axiomatic system, and that these questions were themselves susceptible of a precise mathematical investigation. This insight, central to his work on the axioms of geometry, surfaced again in the 1904 Heidelberg talk, reappeared in the 1917/18 lectures on logic, and was given its most precise and polished form in his proof-theoretic programme. If one turns to Brouwer’s thesis, one does indeed find a distinction between languages of different order. But Brouwer’s reason for introducing this distinction was primarily philosophical: to argue that logic is a form of ‘applied mathematics’, and to explore the relationship between the language in which mathematics is expressed and the intuitions that make up what he regards as genuine mathematics. Brouwer’s motivation is quite different from Hilbert’s; and in the Brouwer thesis one finds no trace either of the idea of a completeness proof, or of a programme for proving consistency. As for the origins of the expression ‘metamathematics’, Hilbert began to formulate his proof-theoretic programme only after the 1920 lectures, and first began to speak of ‘metamathematics’ in 1921 (see Hilbert 1922b, 174). The term ‘metamathematics’ had originally been employed in Germany in the 1870s. It was coined by philosophers as a sarcastic means of disparaging the new non-Euclidean geometries, and associating them with metaphysics. Helmholtz cheerfully adopted the term for his own purposes in 1878, giving it a positive sense (Ewald 1996 , 685). The term itself is thus likely to have been familiar in Göttingen in the 1920s; but Hilbert’s specific use of it in formulating his proof theory is novel. In sum, despite the similarities that had become evident between intuitionism and proof theory by the late 1920s, it seems most likely that Brouwer and Hilbert arrived at the idea of a metalanguage independently, and in pursuit of different goals. But the comments of Brouwer and of Weyl were made in 1927; let us now return to the summer of 1920.
4. The Summer Semester Lectures. As we saw, at the close of the first set of lectures Hilbert sketched first a calculus with only a finite stock of numerical signs, and then a calculus of free-variable ‘symbolic equations’. Neither calculus turned out to be able to support the edifice of classical arithmetic. Hilbert seems to be following a procedure similar to the one he had employed with such success in the lectures of 1917/18. There, too, he had presented a carefully graduated sequence of calculi, starting with the simplest, locating the exact point at which each calculus fell short, and then using the analysis to create a new, strengthened calculus that could be subjected to the same treatment. This seems to have been one of his techniques for probing the foundations of a subject, and for obtaining clarity about its first principles. The calculi sketched at the end of the first set of lectures do not reappear later: having drawn attention to the Law of Excluded Middle and the problem of infinitary arithmetical judgements, they could now be left behind.
288
Chapter 2
Lectures on Logic (1920)
The probing of these issues continued three weeks later when he began his lectures of the Summer Semester, entitled ‘Probleme der mathematischen Logik’. But the probing now comes from a more philosophical direction. He commences with an analysis of the paradoxes and of various current approaches to the foundations of mathematics, carefully contrasting them with each other and with his own position. This discussion includes his first extended analysis of the views of Brouwer and Weyl. Only in the concluding section of the lectures (§7) does he return to the syntactic investigation of a formal calculus, thereby taking up once more the investigations first broached in the Heidelberg talk of 1904. 4.1. Constructive Restrictions. The lectures open with a detailed discussion of the paradoxes (Richard’s, Russell’s and Burali-Forti’s). Apart from technical details, this material had been covered in earlier lectures (e. g., those on set theory from the summer of 1917, and the 1917/18 lectures), and Hilbert does not break new ground here. Starting with §4, however, he gives his most detailed analysis to date of the conflicting approaches to the foundations of mathematics. Hilbert starts with an examination of the views of Kronecker, and his extensive remarks on pp. 17–22 (below, pp. 353–355) contain valuable information about his view of the content of Kronecker’s foundational opinions. Kronecker had demanded that all mathematical concepts and assertions be decidable in a finite number of steps. This demand led him to pursue what Hilbert terms ‘an ostrich policy’ of burying one’s head in the sand, and thus to reject much of the work of Dedekind, Weierstrass, and Cantor, as well as the tertium non datur. But while Kronecker’s prohibitions throw out the baby with the bath water, from a foundational perspective the criticism does not go far enough: One could accuse these dictators [Kronecker and Poincaré] of many inconsistencies, and show that they do not go far enough in their prohibitions. The conception that they advance simply cannot be consistently carried out. Otherwise, one would have to abandon the simplest mathematical propositions. Already the commutative law of addition cannot be checked in finitely many operations. And the same is true for all number-theoretic theorems (e. g., Fermat’s theorem on the unsolvability in positive integers x, y, z of the equation xp + y p = z p for an odd prime number p). Likewise many forms of inference that one cannot do without for certain purposes in algebra and number theory cannot be employed if one consistently adheres to that standpoint, e. g., the principle that in every sequence of positive integers n1 , n2 , n3 , . . . there is always a first number that is less than or equal to any of the following numbers (p. 21; the original German is on p. 355 below).
Hilbert remarks explicitly that Poincaré did not go as far as Kronecker in his restrictive demands. However, as far as the emerging theory of sets is concerned, Poincaré rejected its methods completely, according to Hilbert on p. 20. Claiming that Minkowski and he were the first amongst the younger mathematicians to take Cantor’s set theory seriously, he points to Zermelo
Introduction to the 1920 Lectures
289
as giving the theory a new foundation by ‘prohibiting only as much as is necessary to remove the contradictions’ (p. 22). Although Hilbert discusses Kronecker’s views in some detail, there is no similarly extended discussion of Poincaré. However, in the Hilbert Nachlaß, there is a three page document in Hilbert’s hand which makes some more detailed remarks about Poincaré, and also, indirectly, Cantor. The document in full reads as follows: Poincaré was certainly the most important and inventive of mathematicians, and the richest in ideas, and this not just among his contemporaries, but throughout a broad and significant period in the development of our science. However, in his judgements concerning the basic questions and the philosophical foundations of this science he was not fortunate. In his investigations concerning the role geometry plays in our knowledge of nature, Poincaré adopted a view which he himself called conventionalism. When I had the honour of giving another lecture to you a year ago, on the occasion of Sommerfeld’s visit, I believe I was able to convince you that Poincaré’s conventionalism cannot in any sense be justified. Nevertheless, Poincaré’s great name has succeeded in bringing it about that celebrated scholars have supported his view, and that opposition to it has only been modest and scarcely recognisable as such. But more disastrous | by far are Poincaré’s views and opinions on the foundations of pure mathematics. Georg Cantor is the creator of set theory, and, for a long time now, this has been a generally acknowledged instrument of the mathematician. But when one speaks of the many-faceted applications of set theory, one means mostly so-called point set theory, that is, that subdomain of Cantor’s theory which takes up immediately problems from analysis, function theory and geometry, but which in essence has as its purpose, and which achieves nothing more, than a refinement and extension of the matters dealt with already by Cauchy and Weierstrass. No: I view the theory of transfinite numbers as the truly singular and original, the proper core of the Cantorian theory. Poincaré, who already refused to recognise the | significant achievements of Dedekind concerning complete induction, had no understanding of the ideas presented in Cantor’s theory. For this, Poincaré invented the mocking term ‘Cantorism’, and went so far as to prophesy that these ideas would soon be seen as a cas pathologique. In contrast to this, Cantor’s theory of transfinite numbers seems to me the most wonderful flowering of the mathematical spirit, and represents one of its highest achievements.12 12 In
the original German, the passage reads:
Poincaré war sicher nicht bloss unter seinen Zeitgenossen, sondern innerhalb einer weitreichenden und bedeutsamen Entwicklungsperiode unserer Wissenschaft, der wichtigste, ideenreichste und erfinderischste Mathematiker; aber in der Beurteilung der Grundfragen und philosophischen Fundamente unserer Wissenschaft war er nicht glücklich gewesen. Bei seinen Untersuchungen über die Rolle, die die Geometrie in der Naturerkenntnis spielt, hat sich Poincaré zu einer Auffassung bekannt, die er selbst als Konventionalismus bezeichnet. Als ich vor einem Jahr gelegentlich der Anwesenheit von Sommerfeld die Ehre hatte, Ihnen ebenfalls einen Vortrag zu halten, glaube ich, Sie überzeugt zu haben, daß dieser Poincarésche Konventionalismus in gar keinem Sinne zu rechtfertigen ist. Und doch hat der große Name Poincarés es mit sich gebracht, daß namhafte Gelehrte jener Auffassung zustimmen und die Entgegnungen nur schüchtern ausfallen und kaum als solche kenntlich sind. Aber noch weit p. 2 verhängnisvoller sind Poincarés Auffassungen und Ansichten über die Grundlagen der reinen Mathematik. Georg Cantor ist der Schöpfer der Mengen-
2
3
290
Chapter 2
Lectures on Logic (1920)
This document is found in a folder (Cod. Ms. D. Hilbert, 579) in Hilbert’s Nachlaß, along with another document on Poincaré in Hilbert’s hand, a formal greeting to him on behalf of the Wolfskehlstiftung at the start of the so-called ‘Poincaré Woche’ in Göttingen in April 1909. The present document, on the other hand, is undated, and its provenance is not known. Some information about its date can be gleaned from evidence it contains. First, it was clearly written after Poincaré’s death in 1912. Secondly, Hilbert, referring to Cantor, says he is (not was) the founder of set theory, and which seems to date the piece to before Cantor’s death in 1918. Thirdly, Sommerfeld visited Göttingen to hold lectures in both 1914 and 1915, which suggests, perhaps, a date somewhere between 1915 and 1916. The only source we have for any detailed criticism by Hilbert of Poincaré’s conventionalism is the third lecture he held in Hamburg in 1923 on the foundations of physics. (See Hilbert 1923e* , 34–40.) In that lecture, Hilbert mentions Einstein (certainly a ‘celebrated scholar’) as having endorsed Poincaré’s view by allowing that Poincaré had correctly represented the relationship between the geometrical and the physical parts of a space-time theory. But in so doing, Hilbert makes clear reference to a remark in Einstein 1921 , published some years after 1916. (See Sauer and Majer 2009 , 429–430, n. 139.) Might this suggest that the remarks on Poincaré reproduced here stem from somewhat later, even though this goes against the internal evidence in the document itself? This is simply not clear. However, even if we can only locate Hilbert’s comments on Poincaré to within the period 1915–1923, they were nevertheless made at a point not too far removed from the composition of the 1920 lectures. 4.2. Zermelo’s Set Theory. At the end of §4, Hilbert states informally what according to Zermelo has to be restricted (the comprehension principle and the union operation) and what is fully available (the power-set operation and the choice principle). In §5 he turns to an incisive exposition of Zermelo’s axiomatic grounding of set theory. It is presented in the typical existential form (also used by Zermelo in his Zermelo 1908b) as dealing with a domain B of objects called sets that stand in two kinds of relations, identity Id(x, y) and elementhood E(x, y); lehre und diese ist seitdem längst ein allgemein anerkanntes Instrument des Mathematikers geworden. Aber wenn man schlechthin von den vielseitigen Anwendungen der Mengenlehre spricht, so meint man meist die sogenannte Punktmengentheorie, d. h. dasjenige Teilgebiet der Cantorschen Lehre, das die Probleme aus der Analysis, Funktionentheorie und Geometrie unmittelbar entnimmt und das im Wesentlichen nichts anderes bezweckt und erreicht als eine Verfeinerung und Erweiterung der schon von Cauchy und Weierstrass behandelten Gegenstände. Nein: das wahrhaft Einzigartige und Originale, den eigentlichen Kern der Cantorschen Lehre erblicke ich in der Lehre der transfiniten Zahlen. Poincaré nun, der schon die bedeutsap. 3men Bestrebungen Dedekinds betreffend das Prinzip der vollständigen Induktion verkannte, zeigte sich den Cantorschen Ideenbildungen gegenüber völlig verständnislos. Poincaré erfand für sie den Spottnamen „Cantorismus“ und verstieg sich sogar zu der Prophezeiung, sie würden demnächst nur noch einen interessanten pathologischen Fall (cas pathologique) darstellen. Hierzu im Gegensatz erscheint mir die Cantorsche Theorie der transfiniten Zahlen als die bewundernswerteste Blüte mathematischen Geistes und eine seiner höchsten Leistungen zu bezeichnen.
Introduction to the 1920 Lectures
291
B must satisfy certain axioms. The first axiom characterizes Id through the standard axioms for identity and, characteristically, E has to satisfy the extensionality principle. The second axiom is Zermelo’s Separation Principle formulated as a schema for all first-order formulas that are built up from the relations Id and E; in this way Zermelo’s ‘definite propositional function [definite Klassenaussage]’ is made precise. The third axiom guarantees the existence of at least one object in B; the existence of the empty set m0 can then be inferred by separation. The third axiom postulates, furthermore, a certain finite operation: if m and a are in B, then m ∪ {a} is in B. It is consequently possible to generate sets by the successor operation that associates with a given set a the set a ∪ {a}; beginning with the empty set m0 one can obtain successively {m0 }, {m0 , {m0 }}, and so on. The latter operation is basic for the formulation of the Axiom of Infinity, which guarantees the existence of a set that has the empty set as an element and is closed under this successor operation. The set a0 of natural numbers is then obtained as the intersection of all such infinite sets. This, of course, adapts Dedekind’s way of defining a ‘simply infinite system’ with the choice of m0 as initial object and the particular successor operation given above. (Cf. Dedekind 1888 .) The remaining axioms are the Power Set Axiom, the Axiom of Union, and the Axiom of Choice. The above system of axioms is essentially that of Zermelo 1908b, except for two important modifications whose significance has to be emphasized. There is first, as we mentioned already, the formulation of the separation principle as a first-order schema that goes back to Weyl’s Habilitationsrede, published as Weyl 1910 . The second difference lies in the particular choice of the set-theoretic successor operation and, consequently, the operation in the third axiom and the Axiom of Infinity. This operation and the resulting finite ordinals are usually associated with von Neumann; cf. von Neumann 1923 . However, as described in Hallett 1984 , 277ff., Zermelo had used the operation to give an independent definition of the ordinal numbers in 1913 and, around 1915, had developed to some extent the theory of these ordinals. That is also done here in §3, where a sharpened version of the Burali-Forti paradox is presented and attributed to Zermelo. Indeed, on a postcard of 30 December 1920, Bernays writes to Zermelo: Also your theory of ordinal numbers was mentioned in the lectures, namely in connection with the Burali-Forti paradox, which thereby obtains a more precise formulation.13 13 Apart
from the usual politenesses at the beginning and end, the card reads as follows (we have set in italics the passage corresponding to that quoted in the text in English): Von dem Göttinger wissenschaftlichen Betriebe wollte ich Ihnen insbesondere erzählen, dass bei einem Kolleg, welches Hilbert im Sommer über „Probleme der mathematischen Logik“ gehalten hat, Ihre Axiomatik der Mengenlehre eingehend behandelt wurde und sehr schön zur Geltung kam. Bei der Formulierung Ihres Axiomen-Systems glaube ich auch eine Kleinigkeit zur Verschärfung der Darstellung beigetragen zu haben, und falls es Sie interresiert, könnte ich Ihnen einmal davon erzählen. Auch Ihre Theorie der Wohlordnungszahlen fand bei der Vorlesung Erwähnung, nämlich im Zusammenhang mit der Paradoxie von Burali-Forti, welche dadurch eine präg-
292
Chapter 2
Lectures on Logic (1920)
Ordinal numbers are defined in §3 as sets M that satisfy three conditions: (i ) m0 is an element of M ; (ii ) if A is an element of M , then A ∪ {A} is either an element of M or identical with M ; (iii) if T is a subset of M , then T is either an element of M or identical with M . A number of theorems are formulated, including this central one: An ordinal never contains itself as an element. Now let W be the set of all ordinals together with m0 ; then W can be shown to satisfy the above three conditions for ordinals, and W must be an element of W , contradicting the theorem just mentioned. Thus, the Burali-Forti paradox has been obtained, ‘which we can call the pinnacle of mathematical paradoxes’ (p. 16). Before Hilbert begins the discussion of Zermelo’s theory, he claims that ‘Zermelo’s axiom system represents the most comprehensive mathematical system’. He supports that claim by the following important observation: The theory which results from the development of the consequences of this axiom system encompasses all mathematical theories (like number theory, analysis, geometry), in the sense that the relations which obtain between the objects of these mathematical disciplines, are represented in a perfectly corresponding way by relations which obtain within a subdomain of Zermelo’s set theory (p. 23; the German original begins on p. 356 below).
This is an illuminating discussion of central aspects of Zermelo’s axiom system, but clearly leaves open the question of its consistency. The logicist approach to that problem is taken up next. 4.3. The Axiom of Reducibility. In §6 (pp. 27–36), Hilbert raises the fundamental question of whether Zermelo’s axiomatic system, which is adequate for the development of all higher analysis, can itself be derived from logic. Revisiting material he had covered in the 1917/18 lectures (pp. 193ff., above pp. 183ff.), he discusses how the concepts of axiomatic set theory can be translated into the language of secondorder quantificational logic. In the earlier lectures (p. 200), he had given the translation of the defining condition for a union of sets, (EP ) (F (P ) + P (x)), initially without special comment. Now, however, he observes straightaway (p. 31) that the second-order quantifier deviates from the requirement of a genetic construction, and involves the same illegitimate mingling of the axiomatic with the genetic that lay at the root of the paradoxes. With an allusion to Weyl’s paper ‘Der circulus vitiosus in der heutigen Begründung der Analysis’ (Weyl 1919 ), he refers to a circulus vitiosus. There are two responses to this dilemma: an axiomatic approach and a genetic one. Russell, taking the axiomatic route, introduces the Axiom of nantere Fassung erhält. Ich nehme an, dass Sie einverstanden damit sind, dass ich Ihre diesbezüglichen Gedanken Hilbert mitgeteilt habe. Jedenfalls geschah die Erwähnung in der Vorlesung unter ausdrücklicher Angabe Ihrer Autorschaft, sodass Sie einerseits für die schärfste Fassung der mengentheoretischen Paradoxie, andrerseits für die umfassendste mathematische Axiomatik als Urheber genannt wurden.
The postcard is to be found in Zermelo’s Nachlaß in the Universitätsarchiv of the University of Freiburg, Zermelo/Bernays Correspondence, Signatur: C 129/10.
Introduction to the 1920 Lectures
293
Reducibility and postulates that for every higher-order predicate there exists a co-extensional predicative one, i. e., one whose order only depends on its arguments.14 In so doing, however, he shifts to an axiomatic treatment that is in no way more fundamental than Zermelo’s and thus implicitly abandons the goal of constructing set theory from logic. Weyl, in contrast, clings to the genetic method, but is forced to abandon impredicative principles and with them large tracts of classical analysis. Like Kronecker, he is forced to a politics of prohibition. ‘The goal of reducing set theory and thereby the usual methods of analysis to logic’, Hilbert concludes (p. 33), ‘has today not been achieved, and is perhaps not achievable at all’. Hilbert’s way out of this impasse emerges directly from the philosophical analysis of the tension between the constructive and the axiomatic methods. He declares his unwavering allegiance to the axiomatic method, which allows the greatest possible freedom to scientific research: ‘It is the essence of this method to clarify the presuppositions and methods of inference one employs in a science. To proceed axiomatically is thus nothing other than to think with consciousness’ (p. 34). But the question of the consistency of the axioms of higher mathematics remains open, and is to be pursued with — in some sense — constructive means. It should be observed that Hilbert’s formulations of the axiomatic method had long contained strong constructivist elements. Indeed, the elementary character of syntactic notions is a normative demand that arises from epistemological considerations. In ‘Axiomatisches Denken’ (Hilbert 1918a), Hilbert remarks that in considering a particular field of knowledge ‘we always see that a few distinguished propositions of the field of knowledge underlie the construction of the framework of concepts, and these propositions then suffice by themselves to build up the entire framework in accordance with logical principles’ (p. 406). The build-up in question is supplied by proofs. Ever since the turn of the century, Hilbert had repeatedly emphasised that proofs consist of a finite number of steps, and that they are to be carried out in an axiomatized system by strictly formal manipulations of the syntax. These ideas, stressed in ‘Axiomatisches Denken’ and in the 1917/18 logic lectures (e. g., p. 135), were already implicit in the Grundlagen der Geometrie of 1899 and are explicit in his Paris and Heidelberg addresses of 1900 and 1904 respectively. (Related epistemological observations had been made by Frege, Helmholtz, Kant, Leibniz, and many others; what is new in Hilbert is the specifically mathematical use to which this observation is put.) However, Hilbert finds connections to constructivist tendencies, not only in the presentation of axiomatic theories, but in the real work of constructive mathematicians, like Brouwer and Weyl. That work can be subsumed under the axiomatic method in a very direct and positive way: But the positive and fruitful results that these two researchers [Brouwer and Weyl] have achieved in their investigations into the foundations of mathe14 See
Hilbert’s lectures from 1917/18, pp. 231-232, above p. 206ff.
294
Chapter 2
Lectures on Logic (1920)
matics can be integrated very well with the axiomatic method and indeed are exactly in its spirit. For what is being investigated here is how a part of analysis can be delimited by a certain narrower system of assumptions (p. 34).
Scientific research gains utmost freedom through the axiomatic method. There is, however, one aspect that is not resolved in a fully satisfactory way; the consistency of the axiomatic theory being investigated should be a matter of certainty. Though that problem has been resolved in the case of geometry, for example, by establishing its consistency relative to the axioms of analysis, for elementary number theory and analysis it remains unresolved. This central problem is to be addressed in the last section of the lectures.
5. Direct Consistency Proofs. The final section of the lecture notes (‘Hilbert’s thoughts regarding a proof of the consistency of number theory’) builds on the foregoing philosophical analysis. The most promising strategy for avoiding the pitfalls inherent in the approaches of Russell and of Weyl, Hilbert says, is to provide a consistency proof for a suitable axiomatic formulation of classical set theory. Hilbert returns to a core idea from his 1904 Heidelberg address: the development of a Beweistheorie that will establish the consistency of formal axiomatic theories. Hilbert publicly formulated the task of giving a direct consistency proof for arithmetic in the Second Problem of his Paris address of 1900; his remarks are sketchy, but indicate that he was thinking of a semantic proof involving as he says ‘a suitable modification of the known methods of reasoning in the theory of irrational numbers’ (Hilbert 1900b, 265, 1104 of the partial translation). In the Heidelberg lecture, he indicated, still vaguely, for the first time what a direct syntactic proof was to look like. Building upon those early investigations, he now sets up a fragment of elementary number theory based on what he stresses are purely formal axioms, which are entirely without content [völlig inhaltslos]. It should be noted that, up to this point in the series of lecture notes, there has been not the slightest trace of formalism as a philosophical position, and indeed we have repeatedly seen that Hilbert treats the distinction between syntax and semantics somewhat casually, especially in contrast to Bernays’s Habilitationsschrift. Certainly there has been no assertion that the natural numbers are ‘just meaningless marks’. The austere syntactic formalism introduced here is plainly used for a limited, programmatic end; it is not a philosophy of mathematics. The only connective is the arrow; negation is supplied only through the symbol for numerical inequality. The two rules of inference for the system are modus ponens and substitution for numerical
Introduction to the 1920 Lectures
295
terms. The axioms are: 1=1 (a = b) → (a + 1 = b + 1) (a + 1 = b + 1) → (a = b) (a = b) → ((a = c) → (b = c)) a + 1 = 1. This fragment, a notational variant of the system considered in the Heidelberg address, is extremely restricted, both logically and mathematically. The symbols =, =, and → are only quasi-logical. There are no general axioms for equality; not even the formula a = a is provable. The arrow symbol is governed only by modus ponens and not by the usual axioms for the material conditional; conjunction and disjunction are omitted entirely, as are the quantifiers. The proof of consistency sketched in the Heidelberg talk employed the property of homogeneity. An equation a = b was said to be homogeneous if and only if a and b have the same number of symbol-tokens. In the new setting here, the 1904 consistency proof would carry over as follows. By induction on proofs, all equations derivable from the first four axioms are easily shown to be homogeneous. Since negation appears only in the fifth axiom a + 1 = 1, a contradiction can arise only if a formula of the form a + 1 = 1 is derivable from the first four axioms. But such a formula would not be homogeneous, and therefore cannot be derived. (Recall that it was the use of induction in this argument which was criticized by Poincaré.) The modified argument which Hilbert now deploys in the 1920 setting avoids the use of induction, at least formally. He proves three lemmas: (1) a derivable formula contains at most two occurrences of ‘→’; (2) no formula of the form (A → B) → C is derivable; and (3) a derivable formula not containing ‘→’ must have the form a = a. It follows from this third lemma that, as before, no formula of the form a + 1 = 1 can be derived from the first four axioms; the system is therefore consistent. This consistency proof reappears, with minor modifications, in the first part of Hilbert’s paper ‘Neubegründung der Mathematik’ based on lectures given in Copenhagen and Hamburg during the spring and summer of 1921. (The paper is Hilbert 1922b, and the proof can be found on pp. 170–173, and also on pp. 170–173 of the reprinting in Hilbert 1935 .) Poincaré vigorously criticized the proof given in the Heidelberg lecture on account of the circularity of the use of mathematical induction to prove the consistency of number theory. (See in particular Poincaré 1906a.) In his 1922 paper, Hilbert says of Poincaré: His objection that this principle [of complete induction] can only be proved by means of complete induction itself is unjustified and is refuted by my theory. (Hilbert 1922b, 161.)15 15 The
original German reads:
296
Chapter 2
Lectures on Logic (1920)
But although the new argument does not directly employ the principle of complete induction, the core of the proof involves the notion of Kürzbarkeit: a formal proof possessing a given property P is kürzbar with respect to P if one or more formulas in the proof can be deleted leaving behind a proof which still possesses P . Hilbert assumes that a proof can in this way always be reduced to a shortest, irreducible form. This assumption, however, is equivalent (for proofs) to the least number principle, which is, in its turn, equivalent to the principle of complete induction. The 1920 lectures end (pp. 43–46) with an early attempt to address the consistency of induction. Hilbert adds to the foregoing axioms the new sign Z (‘is a numeral’) which satisfies the axioms Z(1) and Z(a) → Z(a + 1). Since these two axioms can give rise only to statements of the form Z(t) for some term t, they introduce no inconsistency into the system. Next is added an inference schema: if F (1) and F (a) → F (a + 1) are derivable formulas, then we are entitled to derive Z(a) → F (a). This inference rule represents only a form of quasi-induction: from the derivable formulas 1 = 1 and a = a → a + 1 = a + 1, one cannot derive a = a, but only the weaker Z(a) → a = a; the individual instances still have to be established one numeral at a time. Hilbert shows that the new inference rule leads to no new equations, and the resulting system is accordingly consistent, but the interest of the new rule is limited. The implicit question with which these lecture notes end is thus: Can these elementary syntactic proofs of consistency for highly restricted fragments of arithmetic somehow be extended to provide consistency proofs for increasingly stronger and thus more interesting, mathematical systems? An example of an extended system is investigated in Hilbert’s handwritten notes included as the third text in this Chapter, and to which we have appended a separate Introduction. Though these notes are undated, they appear to fit perfectly into the development towards Hilbert’s finitist proof theory. This development is taken up in the Introduction to the next set of lecture notes given in Chapter 3.
6. Note on the Texts. The text of these lectures is based on two sets of typed lecture notes. The first was prepared by Paul Bernays; the second, by Bernays and Moses Schönfinkel. Both typescripts are extremely clean, with very few handwritten interventions. Interventions of any possible significance have been noted in the text; others are recorded in the Textual Notes. The first typescript, that of ‘Logik-Kalkül’, includes at the beginning an Inhaltsverzeichnis, although the section and subsection headings are not found in the text. We have added them here in angled brackets. Moreover, the text contains headings (‘A. Umformungsregeln’ and ‘B. Richtigkeitsregeln’ to Sein Einwand, dieses Prinzip könnte nicht anders als selbst durch vollständige Induktion bewiesen werden, ist unberechtigt und wird durch meine Theorie widerlegt.
Introduction to the 1920 Lectures
297
section II) for subsections to Part II which are not listed in the Inhaltsverzeichnis; these we have added to that Verzeichnis, also in angled brackets. Pasted into the ‘Logik-Kalkül’ typescript (inside the front cover and on the front end-paper, respectively) are two separate handwritten documents. One of these bears the title ‘Wf.–Beweis für das logische Auswahlaxiom Ab → Aεa Aa im einfachsten Fall ’, and consists of six short (and smallish) notebook pages in Bernays’s handwriting. Written above the title, possibly in Hilbert’s hand, is ‘Einlage in WS. 1920’. However, the material clearly stems from later than this, and has therefore not been included here at this point; it appears as the second Appendix to Chapter 3, below.16 The second addition consists of three pages also in Bernays’s hand; this is a short note about a system for the propositional and predicate calculi based on somewhat different (and recognisably more modern) notation. The note is entitled, ‘Vorschläge zur Bezeichnung’, above which Hilbert has written ‘Aussagenkalkül auf Grund von „und “ und „nicht“ ’. There is no date, but the content is certainly consonant with the ‘Logik-Kalkül’ lectures, and it has been included here following the main body of the typescript. The pages are not numbered by Bernays; they have been assigned the numbering i–iii here, and the addition with its subsections has been listed in the Inhaltsverzeichnis. The second typescript, ‘Probleme der mathematischen Logik’, is divided into two parts with seven sections in all. It has at the beginning a typed Inhaltsübersicht, which includes headings for the two parts and for the sections. The headings for the parts are included in the text itself, and so are those for §§1–3, although those for §§4–7 are not; they have been added here. As noted in the Description of the Text, there is one additional sheet of paper which has been laid inside the front cover bearing comments in Hilbert’s hand. As explained in the Description, although the sheet was apparently deliberately placed with these lecture notes, the comments must stem from at least ten years after the preparation of the Ausarbeitung. William Ewald and Wilfried Sieg
16 A
short analysis of the sketch can be found in Zach 2004 .
298
Chapter 2
Lectures on Logic (1920)
Logik-Kalkül
Vorlesung von Prof. Hilbert Ausgearbeitet von P. Bernays. Wintersemester 1920.
Inhaltsverzeichnis I. Aussagen-Kalkül. 1) Einführung der Symbole, Betrachtung der inhaltlichen Äquivalenzen S. 1–7 2) Regeln für den Kalkül mit Aussagen: Normalform, Bildung von immer richtigen Aussagen-Verknüpfungen, das Schliessen aus Annahmen, Beispiele S. 8–16 3) Bemerkungen über den Kalkül: Dualitätsprinzip, spezielle Normalform S. 16–20 II. Funktionen-Kalkül. 1) Überleitung zum Funktionen-Kalkül, Einführung der weiteren Bezeichnungen S. 20–28 2) Die hinzukommenden Regeln des Funktionenkalküls (Vorbemerkungen, Aufstellung der Regeln, Bemerkungen über abgeleitete Regeln) S. 28–34 A. Umformungsregeln. S. 31–32 B. Richtigkeitsregeln. S. 32–34 3) Anwendungen des Kalküls a) Ableitung von richtigen Formeln S. 35–40 b) Ausführung von Schlüssen der traditionellen Logik, Bemerkung über die Anwendung auf mathematische Theorien S. 40–46 III. Ansatz zur Neubegründung der Zahlentheorie. 1) Das Rechnen mit bestimmten Zahlen S. 47–53
‘Logik-Kalkül’
2) Symbolische Zeichen und symbolische Gleichungen, Beispiele von Beweisen symbolischer Gleichungen; das „tertium non datur“. Handschriftliche Ergänzung von Bernays Vorschläge zur Bezeichnung Systematische Zusammenstellung Grundformeln und Regeln für Aussagen
299
S. 54–62 S. i–iii S. i–ii S. ii–iii S. iii
300
Chapter 2
Lectures on Logic (1920)
I. Aussagen-Kalkül.
1
1) Einführung der Symbole, Betrachtung der inhaltlichen Äquivalenzen
2
Die von Cauchy und Weierstrass begründeten strengen Methoden in der Analysis sind zum vollen Abschluss gebracht worden, und damit sind im Gebiete der Infinitesimalrechnung die grundsätzlichen Schwierigkeiten endgültig beseitigt. Aber nachdem durch Cantors Schöpfung der Mengenlehre eine tiefere Auffassung des Zahlbegriffes angebahnt und ermöglicht worden ist, ist man auf neue Schwierigkeiten gestossen. Um diese Schwierigkeiten zu erledigen, ist offenbar ein genaues Eingehen auf das Wesen und die Struktur mathematischer Beweise erforderlich. Ein erstes Hülfsmittel dazu ist der Logik-Kalkül. Der logische Kalkül besteht in der Anwendung der formalen Methode der Mathematik auf das Gebiet der Logik. Die Grundlage und den Anfang der mathematischen Logik bildet derjenige Kalkül, welcher sich auf die Aussage als Ganzes bezieht, wo also die Aussagen selbst die Gegenstände bilden, mit denen operiert wird. Und zwar werden hier die Aussagen nur daraufhin betrachtet, ob sie wahr oder falsch sind. Wir wenden als unbestimmte Zeichen für Aussagen grosse lateinische Buchstaben X, Y, Z, U, V, . . . an. Für solche Zeichen können also Sätze wie „6 ist eine Primzahl“, „2 ist kleiner als 3“, „Der Punkt P liegt auf | der Geraden g“ A gesetzt werden. Die erste Aufgabe ist nun, die verschiedenen möglichen Modifikationen und Verknüpfungen von Aussagen zur Darstellung zu bringen. Wenn wir dies so ausführen wollen, wie es einerseits unter Anlehnung an die Sprache, andrerseits vom Standpunkt des Mathematikers naheliegt, so empfiehlt es sich, folgende 5 Zeichen anzuwenden: X, „X-nicht“ (das kontradiktorische Gegenteil von X), bedeutet die Aussage, welche wahr ist, wenn X falsch ist. X + Y , „X und Y “ B , bedeutet die Aussage, welche wahr ist, wenn sowohl X wie Y wahr ist. X × Y , „X oder Y “ C , bedeutet die Aussage, welche wahr ist, wenn mindestens eine der Aussagen X, Y wahr ist. Added in the upper margin in pencil in Hilbert’s hand, and placed here by an insertion sign: Die Rose duftet, Sokrates war ein Philosoph B Added in the left-hand margin in pencil: X & Y C Added in the left-hand margin in pencil: X ∨ Y A
5
10
15
20
25
30
‘Logik-Kalkül’
5
10
15
20
25
301
X → Y , „wenn X so Y “, bedeutet die Aussage, welche wahr ist, sofern nicht X wahr und zugleich Y falsch ist. X = Y , „X gleich Y “, bedeutet die Aussage, welche wahr ist, sofern X und Y beide wahr oder beide falsch sind. (Die genannten Wahrheitsbedingungen sind als notwendige und hinreichende zu verstehen.) Für X × Y schreiben wir auch kurz XY . Die Verknüpfung „X oder Y “ darf nicht mit dem ausschliessenden Oder, im Sinne des lateinischen aut-aut verwechselt werden; es hat vielmehr die Bedeutung „oder-auch“, wie sive-sive, vel-vel, d. h. die | Möglichkeit des Zusammenbestehens von X und Y wird mit zugelassen. Die Beziehung „wenn X, so Y “ ist nicht so aufzufassen, als ob damit ein Verhältnis von Grund und Folge besagt werden soll, vielmehr ist die Aussage X → Y immer schon dann richtig, wenn X eine falsche oder auch wenn Y eine wahre Aussage ist. So haben z. B. folgende Aussagen als richtig zu gelten: „wenn 2 mal 2 gleich 4 ist, so ist der Schnee weiss“, „wenn 2 mal 2 gleich 5 ist, so ist der Schnee weiss“, „wenn 2 mal 2 gleich 5 ist, so ist der Schnee schwarz“. Falsch wäre dagegen die Aussage „wenn 2 mal 2 gleich 4 ist, so ist der Schnee schwarz“. Immerhin hat doch die Beziehung X → Y mit der Beziehung von Grund und Folge das gemeinsam, dass im Falle der Wahrheit von X → Y aus dem Bestehen von X das Bestehen von Y entnommen werden kann. Wir wollen sie auch deshalb da, wo wir einen Namen für sie brauchen, kurz als „FolgeBeziehung“ bezeichnen. Die Beziehung X = Y hat nicht etwa den Sinn, dass X mit Y gleichbedeutend ist, sie besteht vielmehr zwischen irgend zwei wahren und auch zwischen irgend zwei falschen Aussagen, sodass z. B. die Aussagen „(2 mal 2 gleich 4) = (der Schnee ist weiss)“
30
und: „(2 > 3) = (der Schnee ist schwarz)“
35
richtig sind. Zur formalen Kennzeichnung der eingeführten Operationen ist zunächst zu bemerken, dass die Negation (X) die einzige eingliedrige Operation ist, während die übrigen alle zweigliedrig sind. Die Operation X hat die Periode zwei. Nämlich X ist gleichbedeutend mit X. —
40
Solche gleichbedeutenden Aussagen wollen wir im folgenden „äquivalent“ (abgekürzt „aeq.“) nennen. Mit den Zeichen + und × kann wie in der Algebra gerechnet werden, das heisst es gilt das kommutative, das assoziative und das distributive Gesetz.
3
4
302
Chapter 2
Lectures on Logic (1920)
Dies beruht darauf, dass folgende Aequivalenzen bestehen: X +Y (X + Y ) + Z XY (XY )Z X(Y + Z)
5
aeq. Y + X aeq. X + (Y + Z) aeq. Y X aeq. X(Y Z) aeq. XY + XZ.
5
Ein Beispiel zur Erläuterung des distributiven Gesetzes ist folgendes: Es werde die Wetterprophezeiung ausgesprochen: „Entweder regnet es heute, oder morgen und übermorgen scheint die Sonne.“ Dieselbe Behauptung kann auch so ausgesprochen werden: „Entweder regnet es heute oder morgen scheint die Sonne, und ferner regnet es entweder heute oder übermorgen scheint die Sonne.“ Wegen des kommutativen und assoziativen Gesetzes können mehrgliedrige Summen und Produkte ohne Klammern geschrieben werden. Zur Ersparung von Klammern setzen wir wie in der Algebra fest, dass + trennt und × bindet. Ebenso wie das + vor dem ×, sollen die Zeichen = und → gegenüber + und × bei der Trennung von Ausdrücken den Vorrang haben. — Die Verknüpfung mit = ist auch kommutativ und assoziativ. Bei der Verbindung der Negation mit + und × sind folgende Aequivalenzen wesentlich: X +Y
aeq. X × Y
10
15
20
(1)
(Es bedeute z. B. X die Behauptung „das Dreieck ist rechtwinklig“, Y bedeute „das Dreieck ist gleichschenklig“; dann bedeutet X + Y : „das Dreieck ist rechtwinklig und gleichschenklig“.
25
Das kontradiktorische Gegenteil hiervon ist die Aussage „das Dreieck ist entweder nicht rechtwinklig oder nicht gleichschenklig“, und diese Aussage wird durch X × Y dargestellt.) X ×Y
6
aeq. X + Y .
(2)
(Beispiel: Bei einer Prüfung in Mathematik wird verlangt, dass der Candidat mindestens in einem der Gebiete Arithmetik und Geometrie beschlagen sei. X bedeute nun die Aussage „der Candidat Schultze kann Arithmetik“, Y bedeute, „der Candidat Schultze kann Geometrie“. Die Anforderung des Examens wird von dem Candidaten erfüllt, wenn XY richtig ist. Fällt nun der | Candidat bei der Prüfung durch, liegt also das Gegenteil von XY vor, so bedeutet dies: „der Candidat Schultze kann nicht Arithmetik und er kann nicht Geometrie“, was durch X + Y dargestellt wird.) — Bei der Betrachtung der Aequivalenzbeziehungen zeigt sich uns eine Vielfachheit der Darstellung von Aussagen durch die eingeführten Zeichen, und es wird so die Frage nahegelegt, ob nicht einige von den Zeichen entbehrlich sind.
30
35
40
‘Logik-Kalkül’
303
Dies ist tatsächlich der Fall. Es bestehen nämlich folgende Aequivalenzen:
5
10
X=Y
aeq. (X → Y ) + (Y → X)
X→Y
aeq. X × Y
X ×Y
aeq.
X +Y
aeq. X × Y .
(Die beiden letzten Beziehungen ergeben sich aus den Aequivalenzen (1) und (2), wenn man noch hinzunimmt, dass X mit X gleichbedeutend ist.) Hieraus geht hervor, dass sich alle in unsern Zeichen darstellbaren Verknüpfungen mit den Zeichen + und allein, und ebenso auch mit × und allein ausdrücken lassen. Desgleichen sind auch → und allein ausreichend. Nämlich X ×Y
15
20
X +Y
aeq. X → Y.
hat Frege, die mit × und hat Russell Die Darstellung mit → und zugrunde gelegt (d. h. unter Benutzung anderer Symbole). Am natürlichsten ist wohl, von der Darstellung durch + und auszugehen, wie es in Brentanos Urteilslehre geschieht. Mit = und allein können nicht alle Verknüpfungen dargestellt werden. So ist schon X + Y nicht mit diesen Zeichen darstellbar. Um dies einzusehen, beachte man zunächst, dass die Negation von X = Y , welche die Bedeutung des ausschliessenden „Oder“ hat, aequivalent ist mit X = Y , ferner dass (X = Y ) = Y
aeq. X.
Daraus entnimmt man leicht, dass jeder Ausdruck, der sich durch Anwendung der Zeichen = und mit den unbestimmten Zeichen X, Y bilden lässt, einem der Ausdrücke: 25
30
X, Y, X, Y , X = X, X = X, X = Y, X = Y aequivalent ist, was jedoch für X + Y nicht zutrifft. — Die Negation ist ganz unentbehrlich. Z. B. lässt sich X ohne Anwendung der Negation nicht darstellen; denn alle mit dem unbestimmten Zeichen X durch Anwendung von +, ×, →, = gebildeten Ausdrücke stellen nur solche Aussagen dar, welche wahr sind, sofern X wahr ist, während ja X falsch ist, wenn X wahr ist. — Bemerkenswert ist, dass die Verknüpfung × durch das Zeichen → allein (ohne Anwendung der Negation) ausgedrückt werden kann. Nämlich X ×Y
35
40
aeq. (X → Y ) → Y.
Für X + Y ist eine solche Darstellung nicht möglich. Als wichtig für die Darstellung der Gleichheits-Beziehung seien noch folgende Aequivalenzen erwähnt: X=Y X=Y
aeq. XY + Y X aeq. (X + Y )(X + Y )
X=Y
aeq. (X + Y ) + (Y + X)
7
304 8
9
Chapter 2
Lectures on Logic (1920)
2) Regeln für den Kalkül mit Aussagen: Normalform, Bildung von immer richtigen Aussagen-Verknüpfungen, das Schliessen aus Annahmen, Beispiele Wir haben bisher die verschiedenen Arten betrachtet, wie man Aussagen mit Hülfe der logischen Zeichen zu neuen Aussagen zusammensetzen kann. Die erste Aufgabe für die Logik ist es nun, diejenigen Verbindungen von Aussagen zu finden, welche stets, d.h. ohne Rücksicht auf den sachlichen Inhalt der Grundaussagen, richtig sind. (Unter „Grundaussagen“ sollen die durch die unbestimmten Zeichen X, Y , . . . repräsentierten Aussagen verstanden werden.) Zu diesem Zwecke bilden wir uns aufgrund der festgestellten ÄquivalenzBeziehungen folgende Regeln für die Umformung von Ausdrücken: a 1) Mit den Zeichen + und × kann wie in der Algebra assoziativ, kommutativ und distributiv gerechnet werden. a 2) X kann ersetzt werden durch X, X + Y durch XY , XY durch X + Y . a 3) X → Y kann durch XY , X = Y durch XY + Y X ersetzt werden. (Es ist hier immer gegenseitige Ersetzbarkeit gemeint.)D Mit Hülfe dieser Regeln kann jeder Ausdruck auf eine „Normalform“ gebracht werden, d. h. umgeformt werden in eine Summe von Produkten, wo jedes Produktglied entweder eine Grundaussage oder die Negation einer solchen ist. Nun erhält man das System der stets richtigen Aussagen-Verbindungen nach folgenden Regeln für Richtigkeit: b 1) XX ist immer richtig. b 2) Wenn X richtig ist, so ist XY richtig. b 3) Wenn X richtig und Y richtig ist, dann ist auch X + Y richtig. (Die Regeln sind so aufzufassen, dass für die unbestimmten Zeichen irgend welche Aussagen und Verbindungen von Aussagen eingesetzt werden können.) b 4) Jede durch Umformung aus einer richtigen Aussage entstehende Aussage ist ebenfalls richtig. Dass in der Tat diese Regeln die Gesamtheit aller stets richtigen Verknüpfungen von Aussagen liefern, kann man sich folgendermassen klar machen: Da jeder Ausdruck entweder selbst eine Normalform ist oder durch Umformung aus einer solchen entsteht, so genügt es einzusehen, dass durch die Regeln b 1), b 2), b 3) alle stets richtigen Normalformen und nur diese erhalten werden. Nun sind die Normalformen, welche gemäss b 1), b 2), b 3) als richtig statuiert werden, dadurch charakterisiert, dass in jedem Produkt mindestens eine der Grundaussagen zugleich mit ihrer Negation als Faktor auftritt. Dass eine solche Normalform bei beliebigem Inhalt der Grundaussagen eine richtige D Added by Hilbert in pencil: Hierzu auch a 4 S. 12. The corresponding paragraph on p. 12 has been singled out by a vertical pencil stroke in the margin.
5
10
15
20
25
30
35
40
‘Logik-Kalkül’
5
10
15
305
Aussage darstellt, geht unmittelbar aus der Bedeutung der Negation sowie der Verknüpfungen „und“ und „oder“ hervor. Aber es sind dies auch die einzigen | Normalformen, die stets richtig sind. Denn wenn bei einem Summengliede einer Normalform (das ja die Form eines Produktes hat) jede Grundaussage entweder nur unverneint oder nur verneint als Faktor auftritt, so kann dies Produkt zu einer falschen Aussage gemacht werden, indem für die unverneinten Zeichen falsche, für die verneinten richtige Aussagen eingesetzt werden; es stellt dann ein Summenglied der Normalform eine falsche Aussage dar, und daher muss auch der ganze Ausdruck eine falsche Aussage darstellen (gleichgültig was man für die noch unbestimmten Zeichen einsetzt). Wie man nach den angegebenen Regeln Aussagen als stets richtig nachweist, will ich an ein paar Beispielen zeigen. Beweis von X = X: Die Umformung nach Regel a 3) ergibt:
10
XX + XX. Da XX richtig ist, so ist nach Regel b 3) auch XX +XX richtig, also nach b 4) auch X=X. Beweis von X + Y → X: Die Umformung ergibt:
20
25
30
35
40
X +Y ×X XY X XXY
(nach a 3) ) (nach a 2) ) (nach a 1) ).
Da XX richtig ist, so ist es nach b 2) auch XXY , mithin auch der anfängliche Ausdruck. Beweis von (X + (X → Y )) → Y : Die Umformung liefert X + XY × Y
(nach a 3) )
X(X + Y ) × Y XXY + Y Y X
(nach a 2) ) (nach a 1) ).
Nun ist XX richtig, also, nach b 2) auch XXY ; Y Y ist richtig, also auch Y Y X; nach b 3) ist also XXY + Y Y X richtig, und ebenso auch der ursprüngliche Ausdruck. — Nachdem wir nun eine Methode erhalten haben, um alle die Verbindungen von Aussagen zu finden, die aus rein logischen Gründen richtig sind, bzw. um von einer Aussagen-Verbindung zu entscheiden, ob sie von dieser Art ist, entsteht nun die weitere Aufgabe, aus gegebenen Voraussetzungen (Axiomen) alle Folgerungen abzuleiten — insoweit dies möglich ist, wenn wir nur die Aussagen als ungetrenntes Ganzes betrachten. Die bisherigen Regeln sind dazu nicht ausreichend. Wird zum Beispiel A und A → B als richtig angenommen, so kann man logisch schliessen, dass B richtig ist. Aber mit unseren bisherigen Regeln lässt sich der Schluss nicht ausführen. Denn um zu der Aussage B zu gelangen, müssen wir jedenfalls die Annahme A → B, d. h. AB (für sich oder mit einem Faktor versehen) als
11
306
12
Chapter 2
Lectures on Logic (1920)
Summenglied einführen. Nun geben uns aber unsere Regeln keine Möglichkeit an die Hand, die vorkommende Aussage A zu entfernen. Es muss also noch eine Regel hinzukommen, welche es ermöglicht, eine Aussage zu eliminieren. Dies geschieht durch die Regel: a 4) (X + X)Y ist ersetzbar durch Y (und umgekehrt). Hiernach kann ein Faktor von der Form X + X immer weggelassen werden. Zu dem Addieren von richtigen Aussagen im Sinne der Regel b 3) und dem Multiplizieren mit einem Faktor, gemäss b 2), kommt also das Dividieren durch X + X hinzu. Mit Hilfe der neuen Regel in Verbindung mit den früheren kann man nun alle Folgerungen aus einem System von Axiomen, soweit sie die Aussagen als Ganzes betreffen, ableiten. In dem erwähnten Fall, wo A und A → B als Axiome genommen werden, geschieht dies so: A ist richtig, also nach b 2) auch AB. A → B kann nach a 3) durch AB ersetzt werden. Nach b 3) ist daher
5
10
15
AB + AB richtig. Dies ist nach a 1) ersetzbar durch (A + A)B und nach a 4) durch B. Nach b 4) ist also auch B richtig. Ein anderes einfaches Beispiel ist folgendes. Ich habe das Axiom, dass A + B richtig ist. Dann ist zunächst, nach b 2) (A + B)A richtig. Da A + BA richtig ist, wie aus der Normalform ABA hervorgeht, so ist
20
(A + B)A + A + BA (nach b 3) ) richtig. Dieser Ausdruck kann aber nach a 1) durch ((A + B) + A + B)A 13
und nach a 4) durch A ersetzt werden. A ist also (nach b 4) ) ebenfalls richtig. Auf diese Weise kann man allgemein bei einem als richtig angenommenen oder als richtig erwiesenen Summen-Ausdruck jedes einzelne Summenglied als richtig erweisen. Unter Anwendung dieser Bemerkung ergibt sich für die Ableitung der Folgerungen aus einem System von Axiomen folgendes allgemeine Verfahren: Man bringe die Axiome auf Normalform und schreibe jedes Summenglied einzeln auf; von den so erhaltenen Aussagen kann man nun irgend welche auswählen, mit Faktoren multiplizieren und addieren, und ferner kann man noch Glieder von der Form XX, bzw. XXY hinzufügen. Durch geeignetes Anordnen, Zusammenfassen, Ausklammern und Dividieren (gemäss a 4) ) erhält man dann alle möglichen Folgerungen in Normalform. Und von den Normalformen kann man dann mit Hülfe der Ersetzungsregeln zu den anderen Darstellungsformen übergehen. Um z. B. aus den Axiomen A = B, B = C zu beweisen, dass A = C richtig ist, schreibt man zunächst die Axiome in Normalform: AB + BA,
BC + CB.
25
30
35
40
‘Logik-Kalkül’
307
Die einzelnen Summenglieder sind AB, BA, BC, CB. Diese multipliziert man bezüglich mit C, C, A, A und addiert: ABC + BAC + BCA + CBA. Durch Umordnung der Summen- und Produktglieder erhält man: BAC + BAC + BCA + BCA,
5
14
hieraus durch Zusammenfassung (B + B)AC + (B + B)CA, und durch Division: 10
15
20
25
30
35
40
AC + CA. Dies ist aber eine Normalform für A = C. — Will man aus AA auf A schliessen, so braucht man nur AA hinzuzufügen. Durch Ausklammern ergibt sich dann (A + A)A, und die Division ergibt A. Ich will noch zwei Beispiele von der Anwendung solcher Schlüsse in der Wissenschaft anführen. Es bedeute A die Aussage „ jede reelle Zahl ist algebraisch“, B bedeute „die Menge der reellen Zahlen ist abzählbar“. In der Mathematik wird gezeigt: erstens: A → B, d. h. „wenn jede reelle Zahl algebraisch ist, so ist die Menge der reellen Zahlen abzählbar“; zweitens: B, d. h. „die Menge der reellen Zahlen ist nicht abzählbar“. Man schreibe nun A → B in Normalform, multipliziere B mit A und addiere, so erhält man BA + BA, und daraus durch Zusammenfassung und Division A; d. h. man findet: „Nicht jede reelle Zahl ist algebraisch.“ Dies ist der Schluss auf die Existenz transzendenter Zahlen. — Es mögen die Aussagen A, B, C folgendes bedeuten: A: „der Additionssatz der Geschwindigkeiten ist gültig.“ B: „das Licht pflanzt sich im Fixsternsystem nach allen Richtungen mit gleicher Geschwindigkeit fort.“ C: „das Licht pflanzt sich auf der Erde nach allen Richtungen mit gleicher Geschwindigkeit fort.“ Dann besteht zunächst der mathematische Satz A + B → C, d. h.: „Wenn der Additionssatz der Geschwindigkeiten gültig ist und das Licht sich im Fixsternsystem nach allen Richtungen mit gleicher Geschwindigkeit fortpflanzt, dann ist auf der Erde die Fortpflanzungsgeschwindigkeit nicht nach allen Richtungen die gleiche.“ Ferner entnehmen wir der physikalischen Erfahrung, dass B und C richtig sind. Wir haben also als Axiome A + B → C,
B,
C.
Das erste bringen wir auf Normalform, B multiplizieren wir mit AC, C mit A und addieren. So erhalten wir ABC + BAC + AC,
15
308
Chapter 2
Lectures on Logic (1920)
hieraus (B + B)AC + AC, AC + AC, (C + C)A
16
und schliesslich A.E Es ergibt sich also die Folgerung, dass der Additionssatz der Geschwindigkeiten nicht gültig ist. — Aus irgend zwei einander widersprechenden Axiomen kann jeder beliebige Satz bewiesen werden. Denn hat man A und A als | Axiome, so braucht man, um auf B zu schliessen, nur A und A mit B zu multiplizieren und zu addieren: AB + AB. Daraus erhält man (A + A)B, also B. —
5
10
3) Bemerkungen über den Kalkül: Dualitätsprinzip, spezielle Normalform
17
Zur Charakterisierung unseres Kalküls sind noch einige Bemerkungen von Wichtigkeit. Die eine knüpft sich an die Regel a 2). Aus dieser lässt sich entnehmen, dass von einem Ausdruck, welcher aus den Grundaussagen und ihren Negationen allein durch Addition und Multiplikation gebildet ist, das Gegenteil dadurch erhalten wird, dass man jede Summe durch ein Produkt, jedes Produkt durch eine Summe ersetzt und die Grundaussagen gegen ihre Negationen umwechselt. Hiervon können wir folgende Anwendung machen. Es sei eine Gleichung als richtig erwiesen (ohne Benutzung von Axiomen). Da X = Y umgeformt werden kann in X = Y , so erhalten wir wieder einen richtigen Ausdruck, indem wir von beiden Seiten der Gleichung die Negationen bilden. Sind nun die beiden Seiten der Gleichung aus Summen und Produkten von Grundaussagen und von deren Negationen zusammengesetzt, so können wir die eben genannte Regel anwenden. Wir erhalten demnach eine Formel, die aus der anfänglichen Gleichung dadurch entsteht, dass Summe mit Produkt und jede Grundaussage mit ihrem Gegenteil vertauscht wird. Da diese Gleichung richtig ist, so können wir sie anwenden, indem wir für eine jede Grundaussage X das Gegenteil X einsetzen. Dadurch heben wir die Vertauschung der Grundaussagen mit ihren Negationen auf. Somit ergibt sich folgendes „Dualitätsprinzip“: Aus einer Gleichung, die auf Grund unserer Regeln richtig ist, und deren beide Seiten aus Grundaussagen E
Alternative proof given by Hilbert in pencil on the facing page: (A & B ∨ C & B & C) → A A∨B∨C &B&C ∨A A∨B∨C ∨B∨C ∨A (A & B & C) ∨ A ∨ B ∨ C ist Nullform.
15
20
25
30
‘Logik-Kalkül’
5
10
15
20
25
30
35
40
309
und deren Negationen nur durch Addition und Multiplikation gebildet sind, erhält man wieder eine richtige Gleichung, indem man Summe und Produkt mit einander vertauscht. So ist z. B. X(Y + Z) = XY + XZ eine richtige Gleichung: es ist die Formel des distributiven Gesetzes. Aus dieser gewinnt man gemäss dem Dualitätsprinzip die Formel X + Y Z = (X + Y )(X + Z), welche gleichfalls richtig ist. Ebenso ist der richtigen Gleichung (X + X)Y = Y nach dem Dualitätsprinzip die ebenfalls richtige Gleichung XX + Y = Y zugeordnet. — Eine andere Bemerkung bezieht sich auf die Frage der Mannigfaltigkeit der Aussagen, welche aus gegebenen Grundaussagen X1 , . . . , Xn gebildet werden können. Wir wollen dabei nur diejenigen Aussagen unterscheiden, welche wesentlich verschiedenen Inhalt haben. Wie man sich leicht überlegt, sind zwei Ausdrücke dann und nur dann (im Sinne unserer anfänglichen Bezeichnung) äquivalent, wenn sie, als die beiden Seiten einer Gleichung genommen, eine nach unseren | Regeln richtige Formel ergeben. Betrachten wir solche äquivalente Ausdrücke als Darstellungen einer und derselben Aussage, so gibt es nur eine bestimmte endliche Anzahl verschiedener Aussagen, welche sich aus den Grundaussagen X1 , . . . , Xn zusammensetzen lassen. Es kommen nämlich zunächst für die Wahrheit oder Falschheit der Grundaussagen 2n Möglichkeiten in Betracht, da ja jede einzelne der Aussagen X1 , . . . , Xn entweder wahr oder falsch sein kann. Eine aus X1 , . . . , Xn zusammengesetzte Aussage ist nun dadurch bestimmt, dass in jedem der 2n Fälle ausgemacht wird, ob sie dabei wahr oder falsch n ist. Diese Bestimmung kann auf 2(2 ) verschiedene Weisen getroffen werden, n und es gibt demnach genau 2(2 ) verschiedene Aussagen, die aus X1 , . . . , Xn zu bilden sind. Die 4 verschiedenen mit X allein gebildeten Aussagen sind X, X, X = X, X = X; die 16 verschiedenen Aussagen, welche man aus X und Y bilden kann, sind X, Y, X + Y, XY, X → Y, Y → X, X = Y, X = X und deren Negationen X, Y , XY , X + Y , X + Y , Y + X, X = Y , X = X. — n Unter den 2(2 ) Aussagen haben zwei eine Sonderstellung, nämlich die immer richtige Aussage, welche z. B. durch X1 = X1 darstellbar ist, und die immer falsche, die durch X1 = X 1 dargestellt wird. Einen formalen Ueberblick über die verschiedenen aus X1 , . . . , Xn zu bildenden Aussagen gewinnt man auf folgendem Wege.
18
310 19
Chapter 2
Lectures on Logic (1920)
Aufgrund unserer Regeln erkennt man leicht, dass jeder mit den Grundaussagen X1 , . . . , Xn gebildete Ausdruck gleich ist (im Sinne einer richtigen Gleichung unseres Kalküls) einer Teilsumme des entwickelten Ausdrucks (X1 + X 1 )(X2 + X 2 )(X3 + X 3 ) . . . (Xn + X n ).
20
(A)
Eine Ausnahme bilden nur die immer richtigen Ausdrücke; diese können wir uns aber durch eine 0-gliedrige Teilsumme repräsentiert denken. Wir erhalten so für jede aus X1 , . . . , Xn gebildete Aussage eine Darstellung durch eine spezielle Normalform, welche, (abgesehen von der Reihenfolge der Summen- und Produktglieder), eindeutig in dem Sinne ist, dass zwei Aussagen, welche (nach unsern Regeln) als gleich erweisbar (also inhaltlich aequivalent) sind, durch dieselbe Formel dargestellt werden. Nun ist die Anzahl der Summanden in der Entwicklung von (A) gleich n 2n , die Anzahl der Teilsummen ist daher 2(2 ) (da jeder Summand entweder beibehalten oder weggelassen werden kann). Wir erhalten also wieder das n System der 2(2 ) verschiedenen möglichen Aussagen, und zwar in einer besonderen Form der Darstellung, wobei die immer richtige Aussage sich als 0-gliedrige Teilsumme, die immer falsche Aussage durch den gesamten Ausdruck (A) darstellt. Es sei noch bemerkt, dass man aus der hier benutzten speziellen Normalform unmittelbar ersehen kann, ob eine Aussage, welche aus den Grundaussagen X1 , . . . , Xn zusammengesetzt ist, ohne Anwendung des Negationszeichens dargestellt werden kann. Dies ist | nämlich, wie man leicht zeigt, dann und nur dann der Fall, wenn in der speziellen Normalform der betrachteten Aussage der Summand X 1X 2X 3 . . . X n n nicht vorkommt. Es sind demnach gerade die Hälfte der 2(2 ) Aussagen ohne die Negation ausdrückbar. —
5
10
15
20
25
II. Funktionen-Kalkül. 1) Überleitung zum Funktionen-Kalkül, Einführung der weiteren Bezeichnungen Die Form des logischen Kalküls, die ich bisher auseinandergesetzt habe, ist nur für diejenigen logischen Zusammenhänge ausreichend, bei denen die Aussagen als ungetrenntes Ganzes auftreten. Sie genügt aber nicht mehr für die Darstellung derjenigen Sätze und Schlussfolgerungen, bei denen die Bestandteile der Aussagen einzeln berücksichtigt werden müssen. Allerdings kann man sich bei den üblichen Schlüssen der Aristotelischen Logik mit einer Umdeutung des bisherigen Kalküls behelfen, indem man die Zeichen X, Y, . . . A, B, . . . nicht als Symbole für Aussagen, sondern für „Prädikate“ nimmt. Man würde dann ein allgemeines Urteil wie „Alle Menschen sind sterblich“ auf die Form zu bringen haben: „Aus dem Mensch-Sein folgt das Sterblich-Sein“,
30
35
40
‘Logik-Kalkül’
311
wo nun für die Prädikate „Mensch-Sein“ und „Sterblich-Sein“ Symbole eingeführt werden können. Nach dieser Methode kann man z. B. den bekannten Schluss „Alle Menschen sind sterblich, Cajus ist ein Mensch; Also ist Cajus sterblich“
5
mit dem bisherigen Logik-Kalkül ausführen: Man formuliert zunächst den Schluss folgendermassen:
21
„Aus dem Mensch-Sein folgt das Sterblich-Sein, Aus dem Cajus-Sein folgt das Mensch-Sein; Also folgt aus dem Cajus-Sein das Sterblich-Sein.“
10
Darauf führt man für die Prädikate „Mensch-Sein“, „Sterblich-Sein“, „CajusSein“ bezüglich die Zeichen A, B, C ein. Dann lässt sich der Schluss symbolisch so schreiben A→B C→A
15
C → B.
20
25
30
35
Man hat also, in Normalform geschrieben, die Axiome AB, CA und daraus soll man CB ableiten. Dies ist aber ein einfacher Anwendungsfall unserer bisherigen Regeln. So ohne Schwierigkeit kommt man jedoch nur in den Fällen durch, wo beide Prämissen des Schlusses allgemeine Urteile sind. Sobald partikuläre Urteile auftreten, wird eine Erweiterung des Kalküls durch Einführung eines neuen logischen Zeichens und der darauf bezüglichen Regeln notwendig. Immerhin gelangt man so zu einem befriedigenden Überblick über die Schlussfiguren der traditionellen Logik. (Siehe die Vorlesung „Prinzipien der Mathematik“ vom Wintersemester 1917/18, 1 S. 81–84, 89–96, 98–107.)F Geht man nun aber über den Rahmen der in der üblichen Logik betrachteten Schlüsse hinaus und wendet sich den komplizierteren Schlussweisen zu, wie sie insbesondere in der Mathematik gebraucht werden, so erweist sich auch jener erweiterte Kalkül als unzulänglich. Es fehlt nämlich hier die Möglichkeit, Beziehungen zwischen verschiedenen Gegenständen zum Ausdruck zu bringen. Nehmen wir z. B. den Satz: „die Vorfahren von den Vorfahren eines Menschen sind selbst Vorfahren dieses Menschen“. Hier kommt man für den Zweck Added by Hilbert in pencil in the left-hand margin, but not directed to any specific place in the text: Also: der Aussagenkalkül lässt sich so ausbessern, dass die Aristotelischen Schlüsse herauskommen — und doch der Kalkül wesentlich der alte bleibt. Aber . . . The elliptical dots are Hilbert’s. F
1 These
lectures form the main part of Chapter 1.
22
312
23
Chapter 2
Lectures on Logic (1920)
der symbolischen Darstellung mit der Einführung des Prädikats Vorfahre-Sein allein nicht aus, sondern es müssen die Individuen bezeichnet werdenG , von denen das eine Vorfahre des anderen ist. Man muss also den Satz etwa auf folgende Form bringen: „wenn x Vorfahre von y und y Vorfahre von z ist, so ist auch x Vorfahre von z.“ Die entsprechende Sachlage wie bei diesem Beispiel finden wir bei fast allen komplizierteren Urteilen vor. Um nun solche Urteile und die aus ihnen gebildeten Schlüsse im logischen Kalkül zu behandeln, bietet sich als naturgemäss das Verfahren, dass man in der Darstellung des Urteils die Gegenstände (Subjekte) von den über sie ausgesagten Eigenschaften (Prädikaten) oder Beziehungen (Relationen) trennt und beides ausdrücklich bezeichnet. Und zwar geschieht dies in der Weise, dass | man zur Bezeichnung der Prädikate (bzw. Relationen) Funktionszeichen mit Leerstellen anwendet, wo dann in die Leerstellen die Bezeichnungen der Gegenstände einzusetzen sind. So ist z. B., wenn das Funktionszeichen P r (mit einer Leerstelle) die Eigenschaft bedeutet, eine Primzahl zu sein, P (5) die Darstellung des Urteils „5 ist eine Primzahl“. Und wenn die Beziehung des Kleineren zum Grösseren durch das Funktionszeichen mit zwei Leerstellen <(. , . ) bezeichnet wird, so ist <(2, 3) der symbolische Ausdruck für das Urteil
10
„2 ist kleiner als 3“.
20
Funktionszeichen mit einer Leerstelle bedeuten Prädikate, solche mit mehreren Leerstellen bedeuten Relationen; wir wollen beides gemeinsam als logische Funktionen bezeichnen. Auf die in der neuen Weise dargestellten Aussagen lässt sich natürlich unser bisheriger Kalkül anwenden. Z. B. wird das Gegenteil der Aussage P (5) durch P (5) dargestellt. (Wir wollen der Kürze halber den Negationsstrich statt über den ganzen Ausdruck nur über das Funktionszeichen setzen.) Der Ausdruck <(2, 3) + <(3, 7) → <(2, 7) stellt die Aussage dar: „wenn 2 kleiner als 3 und 3 kleiner als 7 ist, so ist 2 kleiner als 7.“ Und die Schreibweise in der Normalform lautet:
5
15
25
30
<(2, 3) × <(3, 7) × <(2, 7). 24
Worauf es nun vor allem ankommt, das ist die Darstellung des Allgemeinen und Partikulären in den Urteilen. Wir brauchen also logische Zeichen für „alle“ und „es gibt“, und zwar müssen wir diese Zeichen in bestimmter Weise den Leerstellen der Funktionszeichen zuordnen können. Hierzu führen wir, entsprechend wie in der Mathematik, neben den Zeichen für bestimmte Gegenstände (den Eigennamen) noch Variable x, y, z, u, v, . . . ein, mit denen wir die Leerstellen der Funktionszeichen ausfüllen. Diese Variablen spielen die Rolle von Argumenten der logischen Funktionen, deren Werte bestimmte Gegenstände sind. Dabei hat man zu berücksichtigen, dass die Werte, welche für die verschiedenen Argumente eingesetzt werden können, Added in pencil in the left-hand margin, possibly in Hilbert’s hand: ∨, → G
, &,
35
40
‘Logik-Kalkül’
5
10
15
20
313
(so wie in der Arithmetik) auf gewisse Definitionsbereiche beschränkt sind, welche durch die Bedeutung der Funktionszeichen bestimmt werden. Z. B. die Grundbeziehung der elementaren Geometrie der Ebene: „x liegt auf y“ stellt sich durch ein Funktionszeichen mit zwei Argumenten, etwa L(x, y) dar, wo als Werte für x nur Punkte, als Werte für y nur Geraden in Betracht kommen. Die Werte der logischen Funktionen, die sich beim Einsetzen bestimmter Argument-Werte (d. h. Eigennamen von Gegenständen) ergeben, sind bestimmte Urteile, die wahr oder falsch sein können. Sind dagegen die Leerstellen von Funktionszeichen mit Variablen ausgefüllt, so wird | dadurch kein bestimmtes Urteil dargestellt, sondern wir haben dann nur einen symbolischen Ausdruck, der von den betreffenden Variablen „abhängt“. (In Analogie zur Mathematik wollen wir einen Ausdruck, der von keiner Variablen abhängt, der also ein Urteil darstellt, einen konstanten Ausdruck nennen.) Mit der Bildung der von Variablen abhängigen Ausdrücke gewinnen wir nun die Möglichkeit, die allgemeine und partikuläre Form des Urteils in den mannigfaltigen Kombinationen, wie sie besonders in der Mathematik auftreten, symbolisch auszudrücken (während ja das Einsetzen von bestimmten Argumentwerten nur singuläre Urteile liefert). Die beiden logischen Zeichen, welche wir zu dem Zwecke anwenden, sind das „Allzeichen“ (x) und das „Seinszeichen“ (Ex ), welche beide die Angabe der Variablen enthalten, auf die sie sich beziehen. Der Gebrauch dieser Zeichen ist so, dass (x)P (x) bedeutet:
25
„alle x haben die Eigenschaft P “ 25
und (Ex )P (x) bedeutet: „es gibt ein x mit der Eigenschaft P “.
30
(Der Umkreis der Gegenstände, d. h. der Werte von x, auf den eine solche Aussage zu beziehen ist, wird durch den Definitionsbereich des Argumentes der Funktion P festgelegt. Auf Grund dieser Bemerkung erledigen sich die von | Russell erörterten Schwierigkeiten in der Interpretation des allgemeinen Urteils.) Zwischen der Bedeutung des All- und des Seinszeichens besteht der Zusammenhang, dass (Ex )P (x) gleichbedeutend ist mit (x)P (x),
35
40
ebenso (Ex )P (x) gleichbedeutend mit
(x)P (x),
(Ex )P (x)
"
"
(x)P (x),
(Ex )P (x)
"
"
(x)P (x).
(Bei der Negation eines Ausdrucks, der mit einem All- oder Seinszeichen beginnt, soll der Strich nur über dieses Zeichen gesetzt werden.) Auf Grund dieser inhaltlichen Beziehung lässt sich das Seinszeichen durch das Allzeichen ersetzen, und umgekehrt. Im ganzen sind also die Zeichen für „nicht“, „und“, „alle“ als logische Zeichen ausreichend.
26
314
Chapter 2
Lectures on Logic (1920)
Die einfachsten Typen der Zusammensetzung von All- und Seinszeichen sind folgende: (x)(y)R(x, y) „für alle x und alle y besteht die Beziehung R(x, y)“ (Ex )(Ey)R(x, y) „es gibt ein x und ein y, für welche R(x, y) besteht“
5
(x)(Ey)R(x, y) „zu jedem x gibt es ein y, für welches R(x, y) besteht“
27
28
(Ex )(y)R(x, y) „es gibt ein x, welches zu jedem y in der Beziehung R(x, y) steht“. Um den Sinn der Zusammensetzung deutlicher zu machen, könnte man hier jedesmal noch eine Klammer einfügen, also z. B. schreiben: (x)((y)R(x, y)). Da aber auch ohnedies kein Anlass zu einem Missverständnis vorliegt, pflegt man die Klammer wegzulassen. Als allgemeine Regel für die Schreibweise wollen wir festsetzen, dass für die Trennung von Ausdrücken die bisherigen logischen Zeichen , +, ×, →, = vor den All- und Seinszeichen den Vorrang haben. — Aus der Bedeutung des Allzeichens geht hervor, dass in einem Ausdruck (x)(y)R(x, y) die beiden Allzeichen ohne Änderung des Sinnes der Aussage vertauscht werden können. Dasselbe gilt von den beiden Seinszeichen in einem Ausdruck (Ex )(Ey)R(x, y). Dagegen ist bei einem Ausdruck (x)(Ey)R(x, y) die Reihenfolge der Zeichen (x), (Ey) wesentlich. Z. B. stellt der Ausdruck (x)(Ey)<(x, y), (wenn die Variablen x, y sich auf die reellen Zahlen als Definitionsbereich beziehen), einen richtigen Satz dar, nämlich: „zu jeder Zahl x gibt es eine Zahl y, derart, dass x kleiner ist als y, d. h. „zu jeder Zahl gibt es eine grössere“. Vertauscht man aber hier das Zeichen (x) mit (Ey), so entsteht (Ey)(x)<(x, y), und das ist der Ausdruck eines falschen Satzes, nämlich: „es gibt eine Zahl y, welche grösser ist als jede Zahl x“. Durch die Vertauschung von (x) und (Ey) kommt also eine ganz andere Aussage zustande. Das logische Verhältnis hierbei ist so, dass auf Grund der (später zu beweisenden) Formel (Ey)(x)R(x, y) → (x)(Ey)R(x, y) aus einem richtigen Satz von der Form (Ey)(x)R(x, y) auf (x)(Ey)R(x, y) geschlossen werden kann, aber nicht umgekehrt. — Durch die Anwendung verschiedener Variablen (x, y, z, . . . ) haben wir nun ohne weiteres die Möglichkeit, Beziehungen zwischen mehreren Gegenständen sowie auch Aussagen über solche Beziehungen symbolisch auszudrücken. Beispielsweise wird der vorhin von mir angeführte Satz, dass die Vorfahren von den Vorfahren eines Menschen selbst Vorfahren dieses Menschen sind,
10
15
20
25
30
35
40
‘Logik-Kalkül’
315
nach Einführung des Funktionszeichens V (x, y) für die Beziehung „x ist Vorfahre von y“ durch folgende Formel wiedergegeben: (x)(y)(z)(V (x, y) + V (y, z) → V (x, z)). 5
(Weitere orientierende Beispiele siehe in der Logik-Vorlesung 1917/18: 2 Symbolische Darstellung der zahlentheoretischen Axiome S. 118–119, Beispiel der gewöhnlichen und gleichmässigen Konvergenz, betreffend die Vertauschungsfrage, S. 124–128.) 2) Die hinzukommenden Regeln des Funktionenkalküls (Vorbemerkungen, Aufstellung der Regeln, Bemerkungen über abgeleitete Regeln)
10
15
20
Um nun im Gebiete der erweiterten Symbolik die logischen Schlüsse formal ausführen zu können, müssen | wir zu dem System der bisherigen Regeln noch weitere Regeln hinzufügen, welche sich auf das Operieren mit den Variablen und den neuen logischen Zeichen beziehen. Der Aufstellung dieser Regeln, welche die Grundlage bilden für einen erweiterten Kalkül, den „Funktionenkalkül“, wie ich ihn nennen will, muss ich ein paar Bemerkungen vorausschicken. 1. Zu jedem in einer Formel vorkommenden All- oder Seinszeichen gehört ein bestimmter Bestandteil der Formel, auf den es sich bezieht. Diesen wollen wir den „Wirkungsbereich“ des betreffenden Zeichens nennen. So erstreckt sich z. B. in einer Formel vom Typus
29
(x){F (x) → (Ey)G(x, y)}
25
30
der Wirkungsbereich des Zeichens (x) bis an das Ende der Formel, während bei der Formel (x)F (x) → (Ey)G(y) der Wirkungsbereich des Zeichens (x) nur bis vor das Zeichen → geht. 2. Betreffs der Abhängigkeit der Ausdrücke von Variablen ist zu beachten, dass durch jedes All- oder Seinszeichen die Abhängigkeit von der zugehörigen Variablen in dem Wirkungsbereich jenes Zeichens aufgehoben wird. So ist z.B. ein Ausdruck der Form (x)(Ey)R(x, y, z) nur von z abhängig, und ein Ausdruck wie (x){(Ey)F (x, y) → G(x)}
35
hängt von gar keiner Variablen ab, ist also konstant. Es spielen somit die zu den All- und Seinszeichen gehörigen Variablen eine ähnliche Rolle wie in der Analysis die Integrationsvariablen. Überhaupt besteht auf Grund der folgenden Regeln speziell zwischen dem Allzeichen und dem Integral eine weitgehende formale Übereinstimmung, welche als eine neue
2 These
lectures form the main part of Chapter 1.
30
316
Chapter 2
Lectures on Logic (1920)
bemerkenswerte mathematische Analogie zu den uns schon bekannten algebraischen Analogien des Logik-Kalküls hinzukommt. 3. Bei der Bildung von Ausdrücken im Funktionenkalkül müssen wir, zur Vermeidung von Mehrdeutigkeiten, darauf sehen, dass niemals zwei Wirkungsbereiche von All- oder Seinszeichen, die zu der gleichen Variablen gehören, übereinander greifen. So ist z. B.
5
(x)(y){F (x) → (Ex )G(x, y)} ein unzulässiger Ausdruck, weil hier die Wirkungsbereiche von (x) und (Ex ) übereinander greifen, während ein Ausdruck wie (x)F (x) → (Ex )G(x),
31
wo die beiden Wirkungsbereiche getrennt sind, in unserem Kalkül zulässig ist. Auszuschliessen ist auch die Ausfüllung einer Leerstelle eines Funktionszeichens mit dem Eigennamen eines solchen Gegenstandes, der nicht zu dem betreffenden Definitionsbereich gehört. Desgleichen ist es unstatthaft, dass zwei Leerstellen, welche sich auf ge|trennte Definitionsbereiche beziehen, mit derselben, d. h. zu demselben All- oder Seinszeichen gehörigen Variablen ausgefüllt werden. In den folgenden Regeln hat man es als eine stillschweigende Bedingung für alle Umformungen und Ersetzungen anzusehen, dass sie nicht auf einen Ausdruck führen, welcher in dem eben erläuterten Sinne unzulässig ist. 4. In den Formeln unseres Kalküls treten neben den Zeichen für bestimmte Aussagen, Prädikate und Relationen auch solche Aussage- und Funktionszeichen auf, deren Bedeutung nicht festgelegt ist, wie z. B. das Zeichen X in der Formel XX. Solche Zeichen sollen im Wortlaut der folgenden Regeln kurz „unbestimmte“ Aussage- bezw. Funktionszeichen genannt werden; ferner soll unter einer „richtigen Formel“ ein solcher Ausdruck verstanden werden, der bei beliebiger inhaltlicher Festlegung der vorkommenden unbestimmten Zeichen eine richtige Aussage darstellt. Nach diesen Vorbereitungen will ich nun das System der neu hinzukommenden Regeln aufstellen, in der Form, welche mir für die Zwecke des Kalküls und der Systematik am geeignetsten erscheint.
10
15
20
25
30
A. Umformungsregeln.
32
1.) Eine zu einem Allzeichen gehörige Variable kann in dem Wirkungsbereich dieses Zeichens durch irgendeine andere Variable ersetzt werden. 2.) Zwei unmittelbar aufeinander folgende Allzeichen, deren Wirkungsbereich sich gleich weit erstreckt, können vertauscht werden. 3.) Bezieht sich ein Allzeichen auf einen Summen- oder Produkt-Ausdruck, bei welchem die zugehörige Variable nur in einem Gliede auftritt, so kann das Allzeichen zu diesem Gliede gezogen werden; umgekehrt kann ein Allzeichen, das nur in einem Gliede eines Summen- oder Produkt-Ausdrucks steht, vor diesen ganzen Ausdruck gesetzt werden.
35
40
‘Logik-Kalkül’
317
4.)
5
Ein Ausdruck von der Form (x){F (x) + G(x)} ist ersetzbar durch (x)F (x) + (x)G(x), und umgekehrt. 5.) Ein Ausdruck von der Form (x)F (x) ist durch (Ex )F (x) ersetzbar und umgekehrt. B. Richtigkeitsregeln.
10
15
20
25
30
35
40
1.) Beginnt eine richtige Formel mit einem unverneinten Allzeichen, dessen Wirkungsbereich sich über die ganze Formel erstreckt, so erhält man wieder eine richtige Formel, indem man das Allzeichen weglässt und für die zugehörige Variable überall den Eigennamen eines Gegenstandes einsetzt. 2.) Aus einer richtigen Formel erhält man wieder eine solche, indem man α) für ein unbestimmtes Aussagezeichen überall, wo es vorkommt, einen und denselben konstanten Ausdruck setzt, oder β) für ein unbestimmtes Funktionszeichen mit den Argumenten x, y, z, . . . überall einen und denselben, von den gleichen Argumenten x, y, z, . . . abhängigen Ausdruck einsetzt. 3.) Aus einer richtigen Formel entsteht wieder eine solche, wenn man α) für ein vorkommendes unbestimmtes Aussagezeichen überall ein und dasselbe Funktionszeichen mit einem Argument einsetzt und das zugehörige Allzeichen an den Anfang der Formel stellt. β) in einem vorkommenden unbestimmten Funktionszeichen überall ein und dieselbe (noch nicht vorkommende) Variable als neues Argument hinzufügt und das zugehörige Allzeichen an den Anfang der Formel stellt. 4.) Beginnt eine richtige Formel mit zwei unverneinten Allzeichen, deren Wirkungsbereich bis ans Ende der Formel geht, so erhält man daraus wieder eine richtige Formel, indem man das eine der beiden Allzeichen weglässt und die zugehörige Variable überall durch die Variable des anderen Allzeichens ersetzt. 3 Diese formulierten Regeln haben für den Kalkül die Bedeutung von Axiomen (Grundregeln). Ausser diesen gebraucht man im Kalkül auch „abgeleitete Regeln“, deren | Aufstellung den Sinn hat, dass man gewisse häufig wiederkehrende kombinierte Anwendungen der Grundregeln, um sie nicht jedesmal zu wiederholen, als besondere Regeln ausspricht. Ein erster Anlass zur Aufstellung solcher abgeleiteter Regeln besteht darin, dass die Bevorzugung des Allzeichens vor dem Seinszeichen in den Umformungsregeln sich beseitigen lässt. In der Tat kann man aus den Regeln A. 1) – 5) diejenigen Regeln ableiten, die durch Vertauschung des Allzeichens mit dem Seinszeichen aus ihnen hervorgehen, wobei in der Regel A. 4) noch 3 These ‘Richtigkeitsregeln’ have been renumbered in pencil in the left-hand margin: ‘2β)’ becomes ‘3)’, ‘3)’ becomes ‘4)’, whereby ‘3α)’ implicitly becomes ‘4α)’, ‘3β)’ becomes ‘5)’, ‘4)’ becomes ‘6)’. The hand could be either that of Bernays or of Hilbert.
33
34
318
Chapter 2
Lectures on Logic (1920)
das Zeichen + durch × zu ersetzen ist. Diese Regeln sollen bezüglich mit A. 1 ) – 5 ) bezeichnet werden. In welcher Weise die Ableitung der fünf Regeln (unter Benutzung der alten Regel über die doppelte Negation) geschieht, will ich an dem Falle der Regel A. 1 ) zeigen. Diese lautet: eine zu einem Seinszeichen gehörige Variable kann in dem Wirkungsbereich dieses Zeichens durch irgendeine andere Variable ersetzt werden. Es handelt sich also um den Nachweis dafür, dass z. B. (Ex )F (x) durch (Ey)F (y) ersetzt werden kann. Hierzu ersetzt man zunächst F (x) durch F (x) (nach der alten Regel), sodass (Ex )F (x) entsteht. Dafür kann (nach A. 5) ) (x)F (x) geschrieben, und nun, nach A. 1), die Änderung der Variablen vorgenommen werden. Man erhält also (y)F (y), hieraus, nach A. 5), wieder (Ey)F (y), und somit auch (Ey)F (y).
5
10
3) Anwendungen des Kalküls
35
a) Ableitung von richtigen Formeln Als Beispiele für die Anwendung der Regeln will ich einige Ableitungen von Formeln sowie einige einfache Schlüsse ausführen. Die Methode der Ableitung einer Formel besteht darin, dass man sie soweit umformt, bis man zu einem Ausdruck gelangt, welcher auf Grund der schon abgeleiteten Formeln gemäss der Regeln B als richtige Formel erweisbar ist. Wir stützen uns also hierbei auf die richtigen Formeln des anfänglichen speziellen Kalküls, dessen Formeln und Regeln bei den folgenden Ableitungen als bekannt zugrundegelegt werden. Formel (1): (x)F (x) → (x){F (x)G(x)}. Beweis: Da F (x) ersetztbar ist durch F (x)(G(x) + G(x)), also durch
15
20
F (x)G(x) + F (x)G(x), so kann (x)F (x), gemäss A. 4), ersetzt werden durch:
25
(x){F (x)G(x)} + (x){F (x)G(x)}. Die Formel (1) kann somit umgeformt werden in (x){F (x)G(x)} + (x){F (x)G(x)} → (x){F (x)G(x)}. Diese Formel ergibt sich aber aus der richtigen Aussagen-Formel X + Y → X durch zweimalige Anwendung von B. 2,α), indem man (x){F (x)G(x)} für X und (x){F (x)G(x)} für Y einsetzt. Formel (2): (x)(F (x) → G(x)) → {(x)F (x) → (x)G(x)}. (Diese Folge-Beziehung lässt sich nicht umkehren.) Beweis: Entfernen wir die Zeichen → durch Einführung der Normalform, so erhalten wir aus (2) den Ausdruck:
30
35
(x)(F (x)G(x)) × (x)F (x) × (x)G(x).
36
Dabei ist (x)(F (x)G(x)) × (x)F (x) ersetzbar durch (x)(F (x)G(x)) + (x)F (x),
40
‘Logik-Kalkül’
319
also nach A. 4) durch (x){F (x)G(x) + F (x)}. F (x)G(x) + F (x)
kann durch
F (x)G(x) + F (x)G(x) + F (x)G(x), 5
mithin auch durch G(x) + F (x)G(x) ersetzt werden. Nach A. 4) lässt sich also (x){F (x)G(x) + F (x)}
10
umformen in (x)G(x) + (x)(F (x)G(x)), also in (x)G(x) × (x)(F (x)G(x)), und (2) geht somit über in (x)G(x) × (x)(F (x)G(x)) × (x)G(x).
15
20
Diese Formel wird aber aus der richtigen Aussagen-Formel X × Y × X durch Anwendung von B. 2,α) erhalten, indem man (x)G(x) für X und (x)(F (x)G(x)) für Y einsetzt. Formel (3): (x)(F (x) → G(x)) → {(Ex)F (x) → (Ex)G(x)}. Beweis: Zunächst ist F (x) → G(x) ersetztbar durch G(x) → F (x). Ebenso kann der Ausdruck (Ex )F (x) → (Ex)G(x) ersetzt werden durch: (Ex )G(x) → (Ex )F (x),
und nach A. 5 ) durch
37
(x)G(x) → (x)F (x), 25
sodass (3) übergeht in (x)(G(x) → F (x)) → {(x)G(x) → (x)F (x)}.
30
Diese Formel erhält man aber aus der bewiesenen Formel (2) durch dreimalige Anwendung von B. 2,β), indem man zuerst P (x) anstelle von F (x), dann F (x) anstelle von G(x) und schliesslich G(x) anstelle von P (x) einsetzt. Formel (4): (x){F (x) → (Ey)F (y)}. Beweis: Durch Einführung der Normalform erhält man aus (4) den Ausdruck (x){F (x) × (Ey)F (y)}. Dieser ist nach A. 3) ersetzbar durch: (x)F (x) × (Ey)F (y)
35
und nach A. 5 ) durch
40
(Ex )F (x) × (Ey)F (y). Ersetzt man hier im zweiten Produktglied die Variable y gemäss A. 1) durch x, so entsteht (Ex )F (x) × (Ex )F (x).
320
38
Chapter 2
Lectures on Logic (1920)
Diese Formel erhält man aber aus der richtigen Formel X × X, indem man nach B. 2,α) für X den konstanten Ausdruck (Ex )F (x) einsetzt. Formel (5): (Ey)(x)F (x, y) → (x)(Ey)F (x, y). Dies ist die Formel, auf welcher die einseitige Vertauschbarkeit des Seinszeichens mit dem Allzeichen beruht. (Die Formel kann natürlich ebensogut mit R statt F geschrieben werden). Beweis: Bei Einführung der Normalform geht (5) über in
5
(Ey)(x)F (x, y) × (x)(Ey)F (x, y).
Hier kann nach A. 5 ) das erste Produktglied ersetzt werden durch (y)(x)F (x, y),
10
und indem man hierin nach A. 1) die Variable x durch z und dann y durch x, ferner in dem zweiten Produktglied ebenfalls x durch z ersetzt, erhält man (x)(z)F (z, x) × (z)(Ey)F (z, y). Dieser Ausdruck ist nach A. 3) ersetzbar durch (x){(z)F (z, x) × (z)(Ey)F (z, y)},
15
also auch durch (x){(z)F (z, x) → (z)(Ey)F (z, y)}.
(6)
Um nun diese Formel (6) abzuleiten, gehen wir aus von der Formel (4). Wird hier nach B. 3,β) unter dem Funktionszeichen F die neue Variable z eingeführt, so ergibt sich
20
(z)(x){F (z, x) → (Ey)F (z, y)}, und hieraus nach A. 2) durch Vertauschung der Allzeichen (x)(z){F (z, x) → (Ey)F (z, y)}
(7)
als richtige Formel. Von dieser Formel (7) gelangen wir zu (6), indem wir die Folgebeziehung zwischen (7) und (6), also (x)(z){F (z, x) → (Ey)F (z, y)} → (x){(z)F (z, x) → (z)(Ey)F (z, y)}
39
25
(8)
beweisen. Dies geschieht durch zwei verschiedenartige Anwendungen der Formel (2). Zunächst lässt sich nämlich die zu beweisende For|mel (8) abgekürzt in der Form (x)P (x) → (x)Q(x) schreiben, wo P (x) und Q(x) bezüglich Abkürzungen sind für die beiden nur von x abhängigen Ausdrücke,
30
(z){F (z, x) → (Ey)F (z, y)} und
35
(z)F (z, x) → (z)(Ey)F (z, y). Wird nun in (2) gemäss B. 2,β) für F (x) der Ausdruck P (x) und für G(x) der Ausdruck Q(x) eingesetzt, so erweist sich (x)(P (x) → Q(x)) → {(x)P (x) → (x)Q(x)}
‘Logik-Kalkül’
321
als richtige Formel. Es genügt somit zum Beweise von (8), d. h. von (x)P (x) → (x)Q(x), dass man 5
(x)(P (x) → Q(x)), d. h. die Formel (x) (z){F (z, x) → (Ey)F (z, y)} → {(z)F (z, x) → (z)(Ey)F (z, y)}
(9)
beweist. Dies gelingt, indem man in der Formel (2) erst gemäss A. 1) die Variable x durch z ersetzt, wodurch (z)(F (z) → G(z)) → {(z)F (z) → (z)G(z)} 10
entsteht, sodann nach der Regel B. 3,β) unter dem Funktionszeichen F die Variable x als neues Argument einführt, sodass man (x)((z)(F (z, x) → G(z)) → {(z)F (z, x) → (z)G(z)})
15
erhält, und endlich hierin gemäss B. 2,β) für G(z) den nur von z abhängigen Ausdruck (Ey)F (z, y) einsetzt, wodurch sich in der Tat die Formel (9) ergibt. Formel (10): (x)(F (x)F (x)G(x)). Beweis: In der richtigen Formel XXY wird gemäss B. 3,α) | statt des unbestimmten Aussagezeichens X das Funktionszeichen F (x) eingeführt (unter Voranstellung des Zeichens (x)), sodass (x)(F (x)F (x)Y )
20
entsteht, dann wird in gleicher Weise G(y) anstatt Y eingeführt, sodass man (y)(x)(F (x)F (x)G(y)) erhält. Von dieser Formel gelangt man zu (10), indem man nach B. 4) das Zeichen (y) weglässt und die Variable y durch x ersetzt. —
25
b) Ausführung von Schlüssen der traditionellen Logik, Bemerkung über die Anwendung auf mathematische Theorien
30
Der Zweck der Ableitung solcher allgemeinen Formeln besteht in der Anwendung dieser Formeln zur formalen Ausführung von Schlüssen. Wie sich solche Schlüsse im Funktionenkalkül gestalten, wollen wir an den üblichen Schlussweisen der traditionellen Logik betrachten. Nehmen wir zunächst das berühmte Beispiel: „Alle Menschen sind sterblich, Cajus ist ein Mensch; Also ist Cajus sterblich.“
35
Führt man hier die Funktionszeichen Me(x) für „x ist ein Mensch“ und St(x) für „x ist sterblich“ ein, so lautet die symbolische Darstellung für die erste Prämisse: (x)(Me(x) → St(x)), für die zweite Prämisse: Me(Cajus) und für den Schlusssatz: St(Cajus). Es kommt also darauf an, aus den beiden ersten Formeln die dritte abzuleiten.
40
322 41
Chapter 2
Lectures on Logic (1920)
Dazu brauchen wir | nur nach B. 1) in der ersten Formel für die Variable x, unter Weglassung des Zeichens (x), den Eigennamen „Cajus“ einzusetzen. Es entsteht dann die Formel: Me(Cajus) → St(Cajus), aus welcher in Verbindung mit Me(Cajus) nach den alten Regeln St(Cajus) folgt. Wie wir hier sehen, hat die Regel B. 1) die Bedeutung des Schlusses vom Allgemeinen aufs Besondere. Durch sie wird gewissermassen der Sinn des Allzeichens bestimmt. Der Uebergang vom Einzelurteil zum Existenzialurteil, durch welchen die Bedeutung des Seinszeichens gekennzeichnet wird, findet mit Hülfe der Formel (4) statt. Um z. B. den Uebergang von dem singulären Urteil „Cajus ist ein Mensch“ zu dem Existenzialsatz „es gibt Menschen“ mit unserem Kalkül auszuführen, d. h. um aus Me(Cajus) die Formel (Ex )Me(x) abzuleiten, wendet man auf die Formel (4):
5
10
15
(x)(F (x) → (Ey)F (y)) zuerst die Regel B. 2,β) an, indem man für F das Funktionszeichen Me einsetzt, sodass (x)(Me(x) → (Ey)Me(y)) entsteht. Dann setzt man nach B 1) für x den Namen „Cajus“ ein, wodurch man Me(Cajus) → (Ey)Me(y) erhält. Diese Formel in Verbindung mit Me(Cajus) ergibtH
20
(Ey)Me(y), 42
und hierin hat man nur noch gemäss A. 1) die Variable y durch x zu ersetzen. Auf diese Weise kann man allgemein von einer Formel F (a), wo a ein Eigenname ist, zu (Ex )F (x) gelangen. Dass wir hierfür keine zu B. 1) analoge Grundregel für das Seinszeichen nötig haben, beruht darauf, dass durch die The following derivation is written in pencil in the lower half of the left-hand margin in what appears to be Bernays’s hand. Note the missing brackets in lines 4, 5 and 7: H
(Ex )F (x) ∨ (Ex )F (x) (Ex )F (x) ∨ (Ey)F (y) (x)F (x) ∨ (Ey)F (y) (x){F x ∨ (Ey)F y} (x){F x → (Ey)F y} M (C)(Ey)M (y) M (C) ∨ EyM y (Ey)M y
25
‘Logik-Kalkül’
5
10
15
20
25
30
35
40
323
Regel A. 5) das Seinszeichen auf das Allzeichen und die Negation zurückgeführt ist. Diese Regel kann als die Definition des Seinszeichens aufgefasst werden. — Wenden wir uns nun zu den klassischen Syllogismen, welche man durch die Merkworte zu bezeichnen pflegt. Unter diesen Schlüssen lassen sich zwei Haupttypen unterscheiden. Dem ersten Typus gehören die Schlussfiguren an, deren Schlusssatz ein allgemeines Urteil ist, z. B. Barbara; zu dem zweiten Typus gehören diejenigen, deren Schlusssatz partikulär ist, z. B. Darii. Führen wir für den Subjektsbegriff, den Prädikatsbegriff und den Mittelbegriff bezüglich die Funktionszeichen S(x), P (x), M (x) ein, so erhalten wir für die Schlussfigur Barbara in unserm Kalkül das Schema: (x)(M (x) → P (x)) (x)(S(x) → M (x)) (x)(S(x) → P (x)), d. h. aus den ersten beiden Formeln schliesst man auf die dritte. Dieser Schluss lässt sich mit unseren Regeln folgendermassen begründen: Man bringt zunächst die Folge-Beziehungen auf die Normalform; dann lauten die Prämissen (x)(M (x)P (x)), (x)(S(x)M (x)), und die zu beweisende Formel lautet: (x)(S(x)P (x)). Nun wendet man die Formel (1) an, indem man nach B. 2,β) den Ausdruck M (x)P (x) für F (x) und S(x) für G(x) einsetzt. So erhält man (x)(M (x)P (x)) → (x)(M (x)P (x)S(x)), und diese Formel in Verbindung mit der Prämisse (x)(M (x)P (x)) ergibt (x)(M (x)P (x)S(x)). Nach demselben Verfahren gewinnt man aus der zweiten Prämisse, (x)(S(x)M (x)), die Formel (x)(S(x)M (x)P (x)). Nach den früheren Regeln ergibt sich somit (x)(M (x)P (x)S(x)) + (x)(S(x)M (x)P (x)). Dieser Ausdruck kann aber nach A. 4) durch (x)(M (x)P (x)S(x) + S(x)M (x)P (x)) ersetzt werden, dieser wiederum ist durch (x)(M (x)S(x)P (x) + M (x)S(x)P (x)) und weiter durch (x)(S(x)P (x)) ersetzbar; und dies ist ja die Formel des Schlusssatzes. — Die Schlussfigur Darii hat folgendes Schema: (x)(M (x) → P (x)) (Ex)(S(x) + M (x)) (Ex)(S(x) + P (x)).
43
324
44
45
Chapter 2
Lectures on Logic (1920)
Um hier den Beweis nach unseren Regeln zu führen, leiten wir zunächst aus der ersten Prämisse die Hülfsformel (x){S(x) + M (x) → S(x) + P (x)} ab. Bei Anwendung der Normalform für die Folge-Beziehung bekommt diese Formel die Gestalt: (x){S(x)M (x)S(x) + S(x)M (x)P (x)}, und hierfür kann auf Grund von A. 4) (und wegen der Vertauschbarkeit der Produktglieder) geschrieben werden: (x)(S(x)S(x)M (x)) + (x)(M (x)P (x)S(x)). Nun ergibt sich (x)(S(x)S(x)M (x)) aus der Formel (10), indem man nach B. 2,β) für F (x) und G(x) bezüglich S(x) und M (x) einsetzt, und von der Formel (x)(M (x)P (x)S(x)) habe ich vorhin gezeigt, dass sie aus der Prämisse (x)(M (x) → P (x)) abgeleitet werden kann. Somit ist in der Tat die Hülfsformel bewiesen. Nun ziehen wir die Formel (3) heran, indem wir darin gemäss B. 2,β) für F (x) den Ausdruck S(x) + M (x), für G(x) den Ausdruck S(x) + P (x) einsetzen. So erhalten wir (x){S(x) + M (x) → S(x) + P (x)} → {(Ex)(S(x) + M (x)) → (Ex)(S(x) + P (x))}. Dies ist ein Ausdruck von der Form A → (B → C), wo zur Abkürzung A für die Hülfsformel, B für die zweite Prämisse (Ex) (S(x) + M (x)) und C für die Formel des Schlusssatzes (Ex)(S(x) + P (x)) gesetzt ist. Da A bewiesen und B vorausgesetzt ist, so gelangt man (nach den alten Regeln) zu C. Und diese Formel sollte ja abgeleitet werden. — Auf die beiden behandelten Schlussfiguren Barbara und Darii lassen sich nun die übrigen Syllogismen durch einfache Umformungen zurückführen. | Z.B. wird die Schlussfigur Festino dargestellt durch das Schema (x)(P (x) → M (x)) (Ex)(S(x) + M (x)) (Ex)(S(x) + P (x)).
5
10
15
20
25
30
Hier kann der Ausdruck P (x) → M (x) ersetzt werden durch M (x) → P (x), und das so umgeformte Schema (x)(M (x) → P (x)) (Ex)(S(x) + M (x)) (Ex)(S(x) + P (x)) unterscheidet sich von dem des Schlusses Darii nur dadurch, dass P anstelle von P gesetzt ist, was lediglich einen Unterschied in der Bezeichnungsweise bedeutet. —
35
40
‘Logik-Kalkül’
5
10
15
20
325
In dieser Weise ordnet sich die traditionelle Logik in den Formalismus des Funktionenkalküls ein, und es zeigt sich, dass sie innerhalb dieses Kalküls nur einen sehr speziellen Teil ausmacht. Eigentlich fruchtbar wird der Kalkül erst bei seiner Anwendung zur Darstellung mathematischer Beweise und Theorien. Um eine mathematische Theorie an Hand unseres Kalküls zu entwickeln, hat man zunächst die Grundbeziehungen (bzw. Grundprädikate) einzuführen, indem man jeder ein bestimmtes Funktionszeichen zuordnet und die Definitionsbereiche für die Argumente festlegt. Sodann müssen die vorausgesetzten Eigenschaften dieser Grundbeziehungen, | d. h. die Axiome, denen sie genügen sollen, in der Symbolik unseres Kalküls durch Formeln dargestellt und diese Formeln als richtige Formeln postuliert werden. Auf dieser Grundlage entwickelt sich dann die ganze Theorie allein durch die Anwendung der Regeln des Funktionenkalküls. Unter den Grundbeziehungen muss im allgemeinen die Identität Jd (x, y), d. h. „x ist identisch mit y “ mit aufgeführt werden, (welche allerdings nur von einem formalen Standpunkt als Beziehung aufgefasst werden kann). Die charakteristischen Eigenschaften der Identität stellen sich durch folgende Formeln dar:
46
(x)Jd (x, x) (x)(y)(z){Jd (x, y) → (Jd (x, z) → Jd (y, z))} (x)(y){Jd (x, y) → (F (x) → F (y))}, 25
30
(wobei in der letzten Formel das Zeichen F als unbestimmtes Funktionszeichen anzusehen ist). (Beispiele für die Ausführung mathematischer Schlüsse im Funktionenkalkül siehe in der Logik-Vorlesung 1917/18 S. 182–186. Ferner formale Betrachtungen über den Kalkül, betreffend Normalform, Bildung der Negation, erweitertes Dualitätsprinzip, siehe S. 169–172, 176–178. 4 )
III. Ansatz zur Neubegründung der Zahlentheorie. 1) Das Rechnen mit bestimmten Zahlen
35
Hiermit möchte ich die Untersuchungen über den eigentlichen Logikkalkül abbrechen. Wir haben die Sprache in ihrer Funktion als universales Instrument des menschlichen Denkens zergliedert und den Mechanismus der logi|schen Beweisführung blossgelegt. Jedoch ist die Art der Betrachtungsweise, die wir angewandt haben, insofern unvollständig, als die Anwendung des Logikkalküls auf bestimmte Wis4 The 1917/18 lectures can be found in Chapter 1. Note that while the title on the Ausarbeitung of these lectures is ‘Prinzipien der Mathematik’, in Hilbert’s own catalogue of lecture courses the title is given as ‘Prinzipien der Mathematik und Logik’.
47
326
48
49
Chapter 2
Lectures on Logic (1920)
sensgebiete ein Axiomensystem als Grundlage erfordert. D. h. es muss ein System (bzw. mehrere Systeme) von Gegenständen gegeben sein, zwischen denen gewisse Beziehungen mit bestimmten vorausgesetzten Grundeigenschaften betrachtet werden. Diese Methode ist da vollkommen angemessen, wo es sich um die Gewinnung von neuen Resultaten oder um die systematische Ausgestaltung einer Wissenschaft handelt. In der mathematischen Logik aber hat man noch ein anderes Ziel im Auge, nämlich die Grundlagen der mathematischen Wissenschaften zu befestigen. Man möchte der Mathematik den alten Ruf der Sicherheit wieder verschaffen, welcher ihr durch die Paradoxien der Mengenlehre verloren zu gehen scheint. Zu diesem Zwecke erscheint es als der geeignete Weg, dass man die mathematischen Konstruktionen an das konkret Aufweisbare anknüpft und die mathematischen Schlussmethoden so interpretiert, dass man immer im Bereiche des Kontrollierbaren bleibt. Und zwar wird man hiermit bei der Zahlentheorie den Anfang machen, da hier die einfachsten mathematischen Begriffsbildungen vorliegen. Auch ist es ja seit langem das Bestreben in der | Mathematik, alle Begriffssysteme (Geometrie, Analysis) auf die ganzen Zahlen zurückzuführen. Es könnte nun freilich für das Gebiet der Zahlentheorie eine Neubegründung in dem angedeuteten Sinne als überflüssig erscheinen, da doch die Sätze und Beweise der Zahlentheorie über allem Zweifel erhaben sind. Jedoch ist es vom grundsätzlichen Standpunkt wünschenswert, einen wirklichen Nachweis für die Widerspruchslosigkeit der zahlentheoretischen Axiome zu besitzen, und einen solchen hat man bisher nicht zu führen vermocht. Frege hat dies Problem auf rein logischem Wege zu lösen versucht, und Dedekind hat es mit den Methoden der Mengenlehre in Angriff genommen. Sie haben aber beide ihr Ziel nicht erreicht und haben dies auch offen zugegeben. Ferner ist man auch darüber noch keineswegs im klaren, ob jede Frage der Zahlentheorie nach den üblichen Methoden entscheidbar sein muss. Zur Lösung dieser Probleme sehe ich keine andere Möglichkeit, als dass man den Aufbau der Zahlentheorie von Anfang an durchgeht und die Begriffsbildungen und Schlüsse in eine solche Fassung bringt, bei der von vornherein Paradoxien ausgeschlossen sind und das Verfahren der Beweisführungen vollständig überblickbar wird. Ich will nun im folgenden zeigen, wie ich mir den Ansatz zu einer solchen Begründung der Zahlentheorie denke. Als das Konkrete, wovon wir ausgehen, wollen wir Zeichen nehmen. Und zwar müssen wir bezüglich eines Zeichens | immer die Einstellung haben, dass es unabhängig von Ort und Zeit und den besonderen Bedingungen seiner Herstellung sowie von geringfügigen Unterschieden in der Ausführung als ein und dasselbe wiederzuerkennen ist. Unter den Zeichen sollen zunächst gewisse als „Zahlzeichen“ ausgesondert werden, nach folgenden Festsetzungen: „1“ ist ein Zahlzeichen. Durch Anhängen von „+1“ entsteht aus einem Zahlzeichen wieder ein Zahlzeichen. So sind
5
10
15
20
25
30
35
40
45
‘Logik-Kalkül’
327
z. B.
5
10
15
1 + 1, (1 + 1) + 1, ((1 + 1) + 1) + 1 Zahlzeichen. (Beim Anhängen von +1 soll das vorhergehende Zeichen, sofern es zusammengesetzt ist, in Klammern eingeschlossen werden. Überhaupt sollen Klammern dazu angewandt werden, um Bestandteile von Zeichen abzusondern.) Für ein Zahlzeichen kann ein „Kurzzeichen“ eingeführt werden durch eine Ersetzungsformel von der Form K ≡ Z, wo links das einzuführende Kurzzeichen, in der Mitte das Zeichen der Ersetzbarkeit und rechts ein Zahlzeichen steht, in welchem nur solche Kurzzeichen auftreten dürfen, die bereits früher eingeführt sind. Die Einführung der Kurzzeichen muss demnach in einer bestimmten Reihenfolge geschehen. Die Kurzzeichen sollen mit zu den Zahlzeichen gerechnet werden. Ich stelle folgende Tabelle von Kurzzeichen auf: 2 ≡ 1+1, 3 ≡ 2+1, 4 ≡ 3+1 1 + 2 ≡ (1 + 1) + 1, 2 + 2 ≡ (2 + 1) + 1, 3 + 2 ≡ (3 + 1) + 1,
20
30
35
40
1 + 4 ≡ (1 + 3) + 1 2 + 4 ≡ (2 + 3) + 1 3 + 4 ≡ (3 + 3) + 1
4 + 2 ≡ (4 + 1) + 1, 4 + 3 ≡ (4 + 2) + 1, 4 + 4 ≡ (4 + 3) + 1 1 · 1 ≡ 1, 1 · 2 ≡ (1 · 1) + 1, 1 · 3 ≡ (1 · 2) + 1, 1 · 4 ≡ (1 · 3) + 1 2 · 1 ≡ 2, 3 · 1 ≡ 3,
25
1 + 3 ≡ (1 + 2) + 1, 2 + 3 ≡ (2 + 2) + 1, 3 + 3 ≡ (3 + 2) + 1,
50
2 · 2 ≡ (2 · 1) + 2, 3 · 2 ≡ (3 · 1) + 3,
2 · 3 ≡ (2 · 2) + 2, 3 · 3 ≡ (3 · 2) + 3,
2 · 4 ≡ (2 · 3) + 2 3 · 4 ≡ (3 · 3) + 3
4 · 1 ≡ 4, 4 · 2 ≡ (4 · 1) + 4, 4 · 3 ≡ (4 · 2) + 4, 4 · 4 ≡ (4 · 3) + 4 Als ein inhaltlich aufzufassendes Zeichen soll ausser dem Ersetzungszeichen das Gleichheitszeichen angewandt werden, und zwar soll eine Gleichung, in der auf beiden Seiten Zahlzeichen stehen, dann als richtig gelten, wenn nach Ersetzung aller Kurzzeichen durch die ihnen zugeordneten Zahlzeichen beiderseits dasselbe Zeichen steht. Das schrittweise Entfernen der Kurzzeichen hat hierbei auf eine eindeutige Art zu geschehen, welche an Beispielen deutlich wird, deren allgemeine Formulierung aber sehr umständlich wäre. Als allgemeine Regel ist jedenfalls zu beachten, dass die Ersetzung immer bei den umfassendsten von den auftretenden Kurzzeichen vorgenommen werden muss. (So darf man z. B. bei dem Zeichen 2 + 3 nicht mit der Ersetzung von 2 oder der von 3 beginnen, sondern man hat 2 + 3 im ganzen durch (2 + 2) + 1 zu ersetzen.) Ferner hat man auch darauf zu sehen, dass man durch die Ersetzungen zu einem solchen Zeichen gelangt, dem man (ohne Anwendung von Kurzzeichen) anmerkt, dass es ein Zahl|zeichen ist. Ist z. B. das Zeichen 2+(1+1) vorgelegt, so nützt es nichts, wenn man 2 durch (1 + 1) ersetzt, weil (1 + 1) + (1 + 1) nicht ohne weiteres als Zahlzeichen zu erkennen ist. Man muss vielmehr so verfahren, dass man erst 1 + 1 durch 2 ersetzt, sodass man 2 + 2 erhält, dann hierfür (2+1)+1 und dafür ((1+1)+1)+1 setzt, womit man zu einem Zeichen
51
328
Chapter 2
Lectures on Logic (1920)
gelangt, welches aus 1 durch dreimaliges Anhängen von +1 entsteht, sich also unmittelbar als Zahlzeichen erweist. Ein gutes Beispiel für das Verfahren der Ersetzung bildet der Nachweis für die Richtigkeit der Gleichung 2 · 3 = 3 · 2. Hier hat man die linke Seite nacheinander durch folgende Zeichen zu ersetzen:
5
(2 · 2) + 2, ((2 · 1) + 2) + 2, (2 + 2) + 2, ((2 + 1) + 1) + 2, (3 + 1) + 2,
10
4 + 2, (4 + 1) + 1, ((3 + 1) + 1) + 1, (((2 + 1) + 1) + 1) + 1, ((((1 + 1) + 1) + 1) + 1) + 1,
15
und für die rechte Seite: (3 · 1) + 3, 3 + 3, (3 + 2) + 1, ((3 + 1) + 1) + 1, (((2 + 1) + 1) + 1) + 1,
20
((((1 + 1) + 1) + 1) + 1) + 1, 52
sodass in der Tat beiderseits dasselbe herauskommt.— Indem wir die Gleichungen als Aussagen auffassen, können wir auf sie den Logikkalkül zur Anwendung bringen. Dabei haben wir als das Gegenteil einer Gleichung diejenige Aussage anzusehen, welche richtig ist, wenn nach Ersetzung aller Kurzzeichen (gemäss dem angedeuteten Verfahren) die auf beiden Seiten entstehenden Zahlzeichen verschieden sind. So ist z. B.
25
1 + (1 + 3) = 2 · 2, wofür man kurz
30
1 + (1 + 3) = 2 · 2 zu schreiben pflegt, eine richtige Aussage. Denn die Ersetzung von 1 + (1 + 3) ergibt nacheinander 1 + ((1 + 2) + 1), 1 + (((1 + 1) + 1) + 1), 1 + ((2 + 1) + 1), 1 + (3 + 1), 1 + 4,
35
‘Logik-Kalkül’
329
(1 + 3) + 1, ((1 + 2) + 1) + 1, (((1 + 1) + 1) + 1) + 1; die Ersetzung von 2 · 2 ergibt 5
(2 · 1) + 2, 2 + 2, (2 + 1) + 1, ((1 + 1) + 1) + 1;
10
15
20
und diese beiden Ergebnisse sind ersichtlich verschieden. (Wesentlich dafür, dass die Ungleichung in dem erklärten Sinn wirklich das Gegenteil der Gleichung bildet, ist die Voraussetzung, dass die beiden zu vergleichenden Zeichen Zahlzeichen sind, sodass sie sich jedenfalls durch solche Zeichen ersetzen lassen, die allein durch den Prozess des Anhängens von +1 aus 1 entstehen.) Auch können wir Aussagen mit All- und Seinszeichen formulieren in der Weise, dass wir die für die Variablen in Betracht kommenden Werte durch Aufzählung angeben. Nehmen wir als Werte der Variablen die Zeichen 1, 2, 3, 4, so stellen z. B. folgende Formeln richtige Aussagen dar:
53
(x)(x = x), (x)(y)(x + y = y + x), (Ex)(x = 1), (x){(x = 1) → (Ey)(x = y + 1)}.
25
30
35
(Die Zeichen + und = sind hier natürlich nicht als logische Zeichen anzusehen.) — Das Bisherige ist lediglich eine schärfere Fassung der gewöhnlichen Methode des Rechnens mit kleinen Zahlen. In gleicher Weise lässt sich das gesamte numerische Rechnen darstellen. Man braucht dazu nur in der Einführung von Kurzzeichen so weit zu gehen, wie es durch die praktischen Zwecke erfordert wird. Etwas grundsätzlich Neues kommt aber dabei nicht hinzu. Eine prinzipielle Schwierigkeit tritt erst auf, wenn wir von dem Rechnen mit bestimmten Zahlen zu dem Standpunkt der Zahlentheorie übergehen, wo es sich um Sätze über alle Zahlen handelt. Hier wird das System aller Zahlen als etwas Gegebenes betrachtet. Diese Auffassung verträgt sich aber nicht mit der Methode, wie wir, an das Konkrete anknüpfend, die Zahlen bzw. Zahlzeichen eingeführt haben. Denn wir haben weder ein System aller Zahlen axiomatisch | zugrundegelegt noch auch eine vollständige Definition der Zahl (bezw. des Zahlzeichens) aufgestellt, sondern nur ein Verfahren angegeben, wie man aus Zahlzeichen weitere Zahlzeichen bildet. Und da dieses Verfahren niemals abbricht, so kommen wir dadurch nie zu einem System aller Zahlzeichen.
54
330
Chapter 2
Lectures on Logic (1920)
(Freges Vergleich mit der Häuserreihe, siehe „Grundgesetze der Arithmetik“, 2. S. 129–130) und S. 131. 5 2) Symbolische Zeichen und symbolische Gleichungen, Beispiele von Beweisen symbolischer Gleichungen; das „tertium non datur“.
55
56
Wir müssen also, um von dem gewählten Ausgangspunkt zur Zahlentheorie zu gelangen, die Sätze dieser Theorie anders deuten, als es sonst geschieht. Und zwar können wir das in der Weise tun, dass wir die zahlentheoretischen Formeln, mit denen man Sätze über alle Zahlen ausdrückt, wie z. B. x + y = y + x, bloss als symbolische Formeln auffassen. Um zu erklären, wie ich das meine, muss ich zunächst einige neuen Termini besprechen. Der Uebergang von dem numerischen Rechnen zur Zahlentheorie erfordert die Hinzunahme neuer Zeichen. Es sollen jetzt ausser den Zahlzeichen auch „symbolische Zeichen“ betrachtet werden. Als solche gelten zunächst die „Variablen“ x, y, z, ferner auch zusammengesetzte Zeichen, die mit Variablen gebildet sind, wie z. B. x + y, (x · y) + 2. Ein symbolisches Zeichen, in welchem eine Variable (x, y, z) vorkommt, heisst „Funktion“ dieser Variablen und diese ihr „Argument“. Solche Funktionen sind natürlich zu unterscheiden von den logischen Funktionen im Logikkalkül. Die Bildung von Funktionen wird nun geregelt, indem wir festsetzen, wann ein Zeichen als „definiert“ anzusehen ist. Zu den definierten Zeichen gehören zunächst die Zahlzeichen. Ferner soll eine Funktion von x, f (x), definiert heissen, wenn erstens f (1) definiert ist und zweitens eine Ersetzungsformel angegeben ist, wo links f (x + 1) steht und rechts ein Zeichen steht, das definiert ist, falls f (x) definiert ist. Und zwar bestimmt sich dies letzte nach folgenden Festsetzungen: Aus einem definierten Zeichen entsteht durch Anhängen von (+1) wieder ein definiertes Zeichen. Sind f (x) und g(x) definiert, so ist auch f (g(x)) definiert. Zusatz: Was hier speziell für die Variable x formuliert ist, soll auch für die anderen Variablen y, z gelten. Schliesslich kann auch eine Funktion direkt durch eine Ersetzungsformel definiert werden, wo rechts ein definiertes Zeichen steht. Bei der Definition der Funktionen muss natürlich eine bestimmte Reihenfolge eingehalten werden. Das einfachste Beispiel einer definierten Funktion f (x) ist die Variable x. Hier ist f (1) das Zahlzeichen 1, und die Ersetzungsformel lautet hier einfach x + 1 ≡ x + 1; das rechts stehende Zeichen x + 1 ist ja nach unserer Fest|setzung definiert, wenn x, d. h. also f (x), definiert ist. — Da x definiert ist, so ist es auch x + 1. 5 The reference is to Frege 1903 . The closing bracket after ‘130’ was added in hand, and ‘und S. 131.’ has been added outside the bracket, also by hand. This hand is possibly that of Bernays, although it could be Hilbert’s.
5
10
15
20
25
30
35
40
‘Logik-Kalkül’
5
10
15
20
25
30
35
40
331
x + 2 wird definiert durch die Ersetzungsformel x + 2 ≡ (x + 1) + 1. Bei der Definition von x+y betrachtet man das Zeichen als Funktion von y und stellt die Ersetzungsformel auf: x + (y + 1) ≡ (x + y) + 1. Hiermit ist das Zeichen x + y definiert, da es für den Wert 1 von y in das definierte Zeichen x + 1 übergeht, und die rechte Seite der Ersetzungsformel ein definiertes Zeichen ist, falls (x + y) definiert ist. — Entsprechend den Gleichungen zwischen Zahlzeichen betrachten wir jetzt „symbolische Gleichungen“ zwischen definierten Zeichen. Unter einer symbolischen Gleichung soll eine Gleichung verstanden werden, in der Variable vorkommen und wo auf beiden Seiten definierte Zeichen stehen. — Eine symbolische Gleichung, in der x vorkommt, heisst richtig, wenn sie erstens bei Ersetzung von x durch 1 in eine richtige Gleichung übergeht, und wenn ferner die Richtigkeit für x + 1 aus der für x nach bestimmten Beweisregeln folgt. (Anstelle der Variablen x können auch die anderen Variablen y, z treten.) Von den Beweisregeln will ich hier nur folgende nennen: Zwei Zeichen, die auf den beiden Seiten einer Ersetzungsformel oder einer richtigen Gleichung stehen, kön|nen für einander eingesetzt werden. In einer Ersetzungsformel oder einer richtigen symbolischen Gleichung kann eine vorkommende Variable durch ein beliebiges definiertes Zeichen ersetzt werden. Zwischen je zwei durch einander ersetzbaren definierten Zeichen besteht eine richtige Gleichung. (Anmerkung: Diese Regeln beziehen sich nur auf den Nachweis der Richtigkeit bei symbolischen Gleichungen). Die Methode des Beweises für symbolische Gleichungen will ich an ein paar Beispielen erläutern. Ich wähle zunächst die Gleichung, welche das assoziative Gesetz der Addition zum Ausdruck bringt: x + (y + z) = (x + y) + z (a) Damit hier auf beiden Seiten definierte Zeichen stehen, braucht man nur y + z ganz entsprechend wie x + y, also mit Hülfe der Ersetzungsformel y + (z + 1) ≡ (y + z) + 1 zu definieren. Hierauf ergibt sich x + (y + z) als definiertes Zeichen, indem in x + y für die Variable y das definierte Zeichen y + z eingesetzt wird, und ebenso erweist sich (x + y) + z als definiertes Zeichen, indem man in y + z für y das definierte Zeichen x + y einsetzt. Der Beweis der Gleichung (a) geschieht nun so: Beim Ersetzen von z durch 1 ensteht aus (a) eine richtige Gleichung, gemäss der Ersetzungsformel x + (y + 1) ≡ (x + y) + 1. Ferner folgt aus der Gleichung für z diejenige für z + 1. Denn x + (y + (z + 1)) = x + ((y + z) + 1),
57
332 58
Chapter 2
Lectures on Logic (1920)
da y + (z + 1) ersetzbar ist durch (y + z) + 1. x + ((y + z) + 1) = (x + (y + z)) + 1, wie man findet, indem man in der Ersetzungsformel x + (y + 1) ≡ (x + y) + 1 y + z anstelle von y einsetzt.
5
(x + (y + z)) + 1 = ((x + y) + z) + 1, weil nach unserer Annahme die Gleichung (a) für z richtig sein soll. ((x + y) + z) + 1 = (x + y) + (z + 1), auf Grund der Ersetzungsformel y + (z + 1) ≡ (y + z) + 1,
10
in welcher y durch x + y ersetzt werden kann. Nimmt man die vier erhaltenen Gleichungen zusammen, so ergibt sich: x + (y + (z + 1)) = (x + y) + (z + 1), und dies ist die Gleichung, welche aus (a) entsteht, wenn man z + 1 anstelle von z treten lässt. Um nun auch die Formel des kommutativen Gesetzes, d. h. die Gleichung x+y =y+x
15
(b)
zu beweisen, müssen wir zunächst die Richtigkeit der Gleichung x+1=1+x
59
(c)
feststellen. In der Tat geht diese beim Ersetzen von x durch 1 in die richtige Zahlengleichung 1+1=1+1 über, und aus der Gleichung für x folgt die für x + 1; denn unter der Annahme der Ersetzbarkeit von x + 1 durch 1 + x | hat man
20
(x + 1) + 1 = (1 + x) + 1,
25
und gemäss der Ersetzungsformel x + (y + 1) ≡ (x + y) + 1, worin 1 für x und dann x für y gesetzt werden kann, ist (1 + x) + 1 = 1 + (x + 1), sodass man
30
(x + 1) + 1 = 1 + (x + 1) erhält. Somit ist bewiesen, dass die Gleichung (c) richtig ist, d. h. dass die Gleichung (b) beim Ersetzen von y durch 1 in eine richtige Gleichung übergeht. Nun ist nur noch zu zeigen, dass unter der Annahme der Richtigkeit von (b) auch die entsprechende Gleichung mit y + 1 anstelle von y nach den Beweisregeln gefolgert werden kann. Gemäss der Definition von x + y hat man x + (y + 1) = (x + y) + 1.
35
‘Logik-Kalkül’
333
Auf Grund unserer Annahme ist (x + y) + 1 = (y + x) + 1. Ferner ergibt sich 5
(y + x) + 1 = y + (x + 1), indem man in der Gleichung (x + y) + 1 = x + (y + 1)
10
15
erst z für y, dann y für x und dann x für z setzt. Aus der bewiesenen Gleichung (c) folgt y + (x + 1) = y + (1 + x). Schliesslich ergibt die Gleichung (a), wenn darin 1 für y, dann y für x und x für z gesetzt wird: y + (1 + x) = (y + 1) + x. Und durch Vereinigung der erhaltenen Gleichungen gelangt man zu dem gewünschten Ergebnis:
60
x + (y + 1) = (y + 1) + x. — Der Vorteil bei dieser Methode der Behandlung der Zahlentheorie besteht darin, dass die Behauptungen und Beweise ganz im Bereiche des Kontrollierbaren bleiben. Eine Gleichung wie x+y =y+x
20
25
30
35
40
wird nicht aufgefasst als eine Aussage über alle Zahlen, vielmehr wird sie so gedeutet, dass ihr Sinn sich in einem Beweisverfahren erschöpft, bei welchem jeder Schritt eine vollständig aufweisbare Handlung ist, die nach festgesetzten Regeln vollzogen wird. Die Zahlengleichung 2+3=3+2 darf hiernach nicht als ein Spezialfall der Gleichung x + y = y + x betrachtet werden, sondern sie muss auch nach der Feststellung der Richtigkeit dieser symbolischen Gleichung noch eigens bewiesen werden. Wohl aber liefert uns der Beweis der symbolischen Gleichung einen Wegweiser zum Beweise der speziellen Gleichung. (Danach würde z. B. der Beweis von 2 + 3 = 3 + 2 so verlaufen, dass man aus 1 + 1 = 1 + 1 zuerst 1 + 2 = 2 + 1, daraus 1 + 3 = 3 + 1 und hieraus endlich 2 + 3 = 3 + 2 ableitet.) In dieser Möglichkeit der Uebertragung des Beweises einer symbolischen Gleichung auf bestimmte Zahlengleichungen liegt die Wichtigkeit der symbolischen Gleichungen. Wesentlich hierfür ist, dass die Einführung der Kurzzei|chen bei den Zahlzeichen in der Weise stattfindet, wie es der Definition der symbolischen Zeichen entspricht, d. h. nach der Methode des Fortschreitens von n zu n + 1. Wenn wir uns so die Bedeutung der symbolischen Gleichungen klar gemacht haben, so steht nichts im Wege, diese in der üblichen Weise als allgemeine Sätze zu formulieren. Nur dürfen wir dann nicht die logische Beziehung zwischen dem allgemeinen und dem Existenzial-Urteil ohne weiteres auf diese uneigentlich allgemeinen Sätze übertragen.
61
334
62
i
Chapter 2
Lectures on Logic (1920)
Ein allgemeines Urteil im eigentlichen Sinne ist dann und nur dann richtig, wenn es kein Gegenbeispiel gibt. Bei einer symbolischen Gleichung wissen wir freilich in dem Falle, wo uns ein Gegenbeispiel bekannt ist, dass sie nicht richtig sein kann. Wir können aber nicht sagen, dass eine symbolische Gleichung stets entweder richtig oder durch ein Gegenbeispiel widerlegbar sein muss. Denn die Bedeutung der richtigen Formeln hängt ja von dem System der Beweisregeln ab, und jenes Entweder-Oder wäre nur unter der Voraussetzung selbstverständlich, dass mit Hülfe der Beweisregeln jede nicht widerlegbare symbolische Gleichung bewiesen werden kann.. Diese Voraussetzung würde aber darauf hinauskommen, dass man das Problem der Entscheidbarkeit aller zahlentheoretischen Fragen ohne weiteres als im positiven Sinne gelöst annähme. Wir gewinnen durch diese Ueberlegung ein Verständnis für den Sinn der neuerdings von Brouwer aufgestellten pa|radoxen Behauptung, dass bei unendlichen Systemen der Satz vom ausgeschlossenen Dritten (das „tertium non datur“) seine Gültigkeit verliere.
5
10
15
Handschriftliche Ergänzung von Bernays Vorschläge zur Bezeichnung I Aussagezeichen X, Y , Z, . . . XY : X und Y X ∨ Y : X oder Y (Abkürzung) („∨“ Zeichen von Russell, v Anfangsbuchstabe von „vel“). Funktionszeichen für Prädikate und Relationen F (x, y), P (x) (x): für alle x (Ex ): es gibt ein x (Abkürzung) Negationsstrich. X: X nicht (Gegenteil von X) X → Y : „wenn X, so Y “ X ∼ Y bedeutet: X und Y sind zugleich wahr oder zugleich falsch. („X → Y “ und „X ∼ Y “ sind Abkürzungen.) 6
ii
20
25
30
7
System. Zusammenstellung 1) Variable x, y, . . . 2) Unbest. Aussagezeichen 3) Unbest. Funktionszeichen (mit Leerstellen) 4) Zeichen für individuelle Gegenstände, Aussagen, Prädikate, Relationen I Added by Hilbert in pencil in the upper margin above this heading: Aussagenkalkül auf Grund von „und “ und „nicht“ 6 Written in the lower margin and directed to ‘X → Y ’ and ‘X ∼ Y ’ respectively by arrows are ‘X ∨ Y ’ and ‘X Y ’. All the writing is in pencil; the first formula (‘X ∨ Y ’) is enclosed in a pencilled circle, the other is left open. 7 This is probably an abbreviation of ‘Systematische Zusammenstellung’.
35
‘Logik-Kalkül’
5)
335
Logische Zeichen a) Grundzeichen (Konjunktion)
XY
(Negation)
X 5
(x)
(Allgemeinheit)
b) Abkürzungen XY : X ∨ Y (x)F (x): (Ex )F (x) X ∨Y: X →Y 10
XY ∨ XY : XY ∨ XY 0X ∼ Y Grundformeln und Regeln für Aussagen Terminus „richtige Formel“. „Ausdrücke“ α, β, . . .
15
20
Regeln: 1) α kann durch α ersetzt werden und umgekehrt. 2) αβ kann durch βα ersetzt werden. 3) α(βγ) kann durch (αβ)γ ersetzt werden. 4) Für ein (unbest.) Aussagezeichen kann ein beliebiger Ausdruck α eingesetzt werden. (Das Einsetzen muss an jeder Stelle geschehen, wo das betr. Aussagezeichen vorkommt.) 5) Ist α eine richtige Formel so auch αβ. 6) Sind αβ und αβ richtige Formeln, so auch α. Grundformel: XX.
iii
336
Chapter 2
Lectures on Logic (1920)
Textual Notes 300.15:
300.26: 300.27: 301.3–7: 301.25: 301.26:
301.27–33:
301.35: 301.37: 301.41:
302.4: 302.5: 302.11–12: 302.19: 302.23–30: 302.37:
302.38–40: 303.2: 303.17–31:
303.36–40: 304.10–11: 304.11:
Die Grundlage . . . ] In the margin to the left of the first line of this paragraph is added in pencil a short horizontal stroke with an arrow extending down from its centre. This is clearly meant to mark off a section beginning at this point. A corresponding line with an upward arrow ending the selection is found near the end of p. 3. einerseits] Enclosed in parentheses (pencil). , andrerseits . . . naheliegt,] Enclosed in parentheses (pencil). X = Y . . . XY .] Enclosed in parentheses (pencil). Folge] Hilbert (pencil) has added as an alternative: Folgt bezeichnen.] In the margin to the left of the last line of the paragraph ending with ‘bezeichnen’ is added in pencil a short horizontal stroke with an arrow extending upwards from its centre, i. e., an ‘end selection’ mark. The corresponding ‘begin selection’ mark is found on p. 1 against the paragraph beginning ‘Die Grundlage’ . . . . Die Beziehung . . . sind.] Enclosed in parentheses (pencil). The bracket was originally, and clearly mistakenly, set at the end of p. 3 after ‘Aussagen’. A new bracket has been added after ‘richtig sind.’, although the old bracket after ‘Aussagen’ remains. (X)] (X) X] X Mit den . . . ] In the margin to the left of the first line of this paragraph is added in pencil a short horizontal stroke with an arrow extending down from its centre. This marks off a section beginning at this point. A corresponding ‘end selection’ mark is to be found near the beginning of p. 6. XY ] Changed (in pencil) to: ‘X ∨ Y ’ (XY )Z] Changed (in pencil) to: ‘(X ∨ Y ) ∨ Z’ regnet es] Using a transposition sign, the second occurrence of ‘regnet es’ has been changed to: es regnet Die . . . assoziativ.] Enclosed in parentheses (pencil). Es bedeute . . . Beispiel:] Enclosed in parentheses (pencil). dargestellt wird.) —] In the margin to the left of the last line of the paragraph ending with ‘dargestellt wird.) —’ is added in pencil a short horizontal stroke with a short stroke extending upwards from its centre (like a ‘⊥’), i. e., an ‘end selection’ mark. The corresponding ‘begin selection’ mark is to be found on p. 4 against the paragraph beginning ‘Mit den Zeichnen’ . . . . Bei . . . so] Enclosed in parentheses (pencil). X = Y . . . Y → X] Enclosed in parentheses (pencil). Mit . . . ist. —] Enclosed in parentheses (pencil). Originally a bracket was set earlier after ‘zutrifft. —’, but pencilled markings indicate that this is to be ignored. Als . . . (Y + X)] Enclosed in parentheses (pencil). Zu . . . Äquivalenz-Beziehungen] Enclosed in parentheses (pencil). folgende . . . ] In the margin to the left of this paragraph is added in pencil a short horizontal stroke with an arrow extending down from its centre, a ‘begin selection’ mark. The mark is set against the second
Textual Notes
337
line of the paragraph; since the first line and half of the second (up to, but not including, ‘folgende’) are set in pencilled parentheses, the marking is clearly meant to begin at ‘folgende’. A corresponding ‘end selection’ mark is to be found in the middle of p. 9. 304.18: X = Y durch XY + Y X] Enclosed in parentheses (pencil). 304.33: richtig.] After the line ending in ‘richtig’, a mark (like a ‘⊥’) appears in the left-hand margin indicating the end of the selection begun on p. 8. 306.5–9: a 4) . . . hinzu.] Alongside this paragraph in the left-hand margin is a vertical pencil stroke. In virtue of the marginal note by Hilbert on p. 8, this was almost certainly put here by Hilbert. 310.10: (nach unsern Regeln)] Added by Bernays. 312.2: -Sein . . . Individuen] In the left-hand margin against the fifth line of the paragaph (‘-Sein . . . Individuen’) there is a pencilled mark (a horizontal stroke, with a short arrow extending down from its centre) indicating the beginning of a selection of text. There appears to be no corresponding ‘end selection’ mark. The next similar marginal mark, to be found on p. 25, begins a selection. 312.10–11: oder Beziehungen (Relationen)] Crossed out in pencil. 312.16: P (5)] The letter ‘r’ in ‘P r’ has been crossed out in pencil, changing ‘P r(5)’ to ‘P (5)’; in the next paragraph, the predicate is typewritten ‘P (x)’ and not ‘P r(x)’. 313.11: bestimmtes] Enclosed in parentheses (pencil). 313.18–19: (während . . . liefert).] Enclosed in a second pair of parentheses in pencil, duplicating the typed ones. 313.20: Die beiden . . . ] In the left-hand margin against the beginning of the paragraph there is a pencilled mark (a horizontal stroke, with a short arrow extending down from its centre) indicating the beginning of a selection of text. There appears to be no corresponding ‘end selection’ mark, since a new such ‘begin selection’ mark. The next similar marginal mark, to be found on p. 28, begins a selection. 313.32: des] Added by Bernays. 314.6: besteht“] besteht.“ 314.8: besteht“] besteht. 314.23: (x)(Ey)] Corrected (pencil) from: (x)(Ex ) 314.33–37: Das . . . umgekehrt. —] Enclosed in parentheses (pencil). 315.4–7: Weitere . . . S. 124–128.)] Enclosed in a second pair of parentheses in pencil, duplicating the typed ones. 315.10: Um nun . . . ] In the left-hand margin against the beginning of the paragraph there is a pencilled mark (a double horizontal stroke, with a short stroke extending down from its centre) indicating the beginning of a selection of text. There appears to be no corresponding ‘end selection’ mark. The next similar marginal mark begins a selection, and does not appear until p. 40. 316.3–28: 3. Bei . . . darstellt.] Enclosed in parentheses (pencil). 317.36–318.12:Ein erster . . . (Ey)F (y).] Enclosed in parentheses (pencil). 318.29: Aussagen-] Added by Bernays. 319.16: Aussagen-] Added by Bernays.
338 321.31:
322.25: 322.27: 323.20: 324.10: 324.12: 325.3: 325.4:
325.14:
327.43: 328.4: 328.6: 329.30:
331.36: 334.19: 335.10: 335.16: 335.16: 335.20:
Chapter 2
Lectures on Logic (1920)
„Alle . . . ] Placed in the left-hand margin in pencil against ‘„Alle . . . ’ is a ‘begin selection’ sign ‘ ’. The corresponding ‘end selection’ sign (‘⊥’) comes at the end of p. 41:
ersetzen.] In the left-hand margin is placed the ‘end selection’ mark (like ‘⊥’) corresponding to the ‘begin selection’ mark on p. 40. (Ex )F (x)] E(x)F (x) (S(x)P (x))] (S(x) × P (x)) (S(x)S(x)M (x))] S(x)S(x)M (x) (M (x)P (x)S(x))] M (x)P (x)S(x) sehr] Added by Bernays. Eigentlich . . . ] In the margin to the left of the first line of this paragraph is added in pencil a short horizontal stroke with an arrow extending down from its centre, a ‘begin selection’ mark. A corresponding ‘end selection’ mark appears against the paragraph ending in ‘Funktionenkalküls’ towards the top of p. 46. Funktionenkalküls.] To the left of the end of this paragraph there is an ‘end selection mark (a ‘⊥’) ending the selection of text begun on p. 45. ((1 + 1) + 1) + 1] (1 + 1) + 1 + 1 2.] 2 +2,] +2. Eine prinzipielle . . . ] In the margin to the left of the first line of this paragraph is added in pencil a ‘begin selection’ mark like a ‘ ’. A corresponding ‘end selection’ mark (like a ‘⊥’) appears on p. 54 against the paragraph ending in ‘Zahlzeichen’ towards the top of p. 54. Zeichen,] Zeichen; Aussagezeichen X, Y , Z, . . . ] Added by Bernays. XY ∨ XY ] Immediate correction in Bernays’s hand of: (X → Y )( αβ] Immediate correction in Bernays’s hand of: α + β βα] Immediate correction in Bernays’s hand of: β + α Einsetzen] Added by Bernays.
Description of the Text
339
Description of the Text Collection: Georg-August Universität Göttingen, Mathematisches Institut, Inv. Nr. 16206j. Size: Cover size approximately 23.2 × 28.0 cm; page size approximately 22.1 × 27.4 cm. Cover Annotations: The notation ‘Hilbert // LOGIK- // KALKÜL // W.S. // 1920’ is in gold lettering on the spine. At the top left-hand corner of the inside front cover is written ‘92’ in pencil. The inside back cover has the number 16206j written in the top right-hand corner in black ink. Composition: The typescript consists of a cover page, a typed title page, a page with a typed Inhaltsverzeichnis and 62 typed, numbered pages in numbered sequence. 5 signatures, consisting of 11 to 14 pages each, were used. The pages are typed on one side only, glued along the longer edge, and enclosed in a stiff board cover. There are two sets of pages inserted into the inside front cover. The first set consists of one sheet of paper (approximately 22.5 × 28.5 cm), used lengthways and folded in half along the longer edge to make four pages (approximately 14.25 × 22.5 cm); three of these have been written on in Bernays’s hand and the first bears a heading by him, although there is an additional heading in Hilbert’s hand in blue pencil. The first page also carries two pencilled additions in Bernays’s hand. The fourth (final) page was pasted over its whole area to the first empty right-hand before the title page. This first set of pages is reproduced here as a supplement to the main document. The second set consists of some notes by Bernays; its contents are reproduced as the last Appendix to Chapter 3, and the notes are described further there. Pagination: The title page and the page with the Inhaltsverzeichnis are unnumbered, but the text itself is numbered continuously from 1 to 62. On pages 1–19 the page numbers are positioned in the centre of the upper margin and are typed with dashes either side (as in ‘– 1 –’); from p. 20 onwards the numbers are again typed in the upper margin, although this time without dashes but followed by a full stop (as in ‘1.’), and positioned in the right-hand corner. Original Title: On the unnumbered initial page of the first signature is typed: ‘Logik-Kalkül // Vorlesung // von // Prof. Hilbert // Ausgearbeitet von P. Bernays. // Wintersemester 1920’. Text: The paper of the title page, the Table of Contents and of pp. 20–62 is darker than that of pp. 1–19. The indentations on the reverse of these latter indicate that they have been typed on directly, whereas the darker pages appear to be carbon copies, the ink having a bluish tinge. It is quite possible that the two sets of pages (1–19 and then 20–62 plus the front matter) were composed in distinct stages. One indication might be the difference in page numbering noted above. Moreover, pp. 1–19 employ the typewriter’s symbol for division (‘÷’) as the basis for a plus sign, which has then been completed in ink. Pages 20–62, however, leave place for the addition of a plus sign in ink. The page numbers in the Inhaltsverzeichnis, a few formulas and mathematical symbols, and a few corrections have been inserted in black ink. In addition, typographical errors have been corrected, occasional words or phrases have been added to the text, and letters and underlinings which appeared to be too faint have been retraced. Occasionally, letters/words at the extreme right of the page which have been cut off (perhaps literally, by a paper guillotine) have been added by hand in ink. Some of these additions are identifiably in Bernays’s hand, others are not readily
340
Chapter 2
Lectures on Logic (1920)
identifiable; some of the textual repairs are written in lower case block letters (presumably to imitate the typescript), and the hand is consequently obscured. In addition, there are a few (mostly marginal) additions in Hilbert’s hand. These are: (a) a short addition in the upper margin of p. 2; (b) a reference to ‘a 4 S. 12’ (i. e., to the rule from p. 12 denoted by ‘a 4’), written in the margin of p. 8; (c) some formulas written opposite p. 15 (on the reverse of p. 14); (d ) a vertical pencilled line in the left-hand margin alongside the paragraph on p. 12 containing the rule denoted ‘a 4’ (it is plausible to assume that this line is associated with the marginal remark on p. 8); and (e) a long marginal note on p. 21. An alternative proof is written in the left-hand margin on p. 41, and this seems to be in Bernays’s hand. There are also a few less carefully executed markings and corrections in pencil, both in the margin and on the text itself. Most of these are of two kinds, marginal markings meant to begin and end selections of text, sometimes up to several typescript pages long, and parentheses placed round text in the main body itself, these selections being usually shorter. (All these markings have been recorded in the Textual Notes.) While it is plausible to think that the majority of the additions were made shortly after the preparation of the typescript, it is unclear when the marginal markings or the different kinds of text selection were effected, nor what purposes they were meant to serve. It could be that they were carried out during preparations for later lecture courses, or for the preparation of the Hilbert/Ackermann text of 1928 (Hilbert and Ackermann 1928 , reprinted in Appendix A to this Volume). It is also not fully clear who was responsible for these markings. Hilbert at some stage clearly annotated the typescript, since his hand is identifiable in the instances listed above, and the selecting, and bracketing off, of text was a common practice of his, both in Ausarbeitungen and in his own lecture notes. Therefore, although it is plausible to assume that Hilbert was responsible for the markings, it is simply not possible to say this with certainty. Neither is it clear whether the typescript was deposited in the Lesesaal of the Göttingen Mathematisches Institut immediately upon completion, or whether it remained for a while in Hilbert’s possession. Those handwritten corrections which clearly adjust the text as it was being composed, or shortly after its completion, have for the most part been incorporated silently into the text presented here. The additions to, or comments on, the text (for example, new derivations, new examples of formulas, adjustments of notation), have not been incorporated into the text, but have been noted on the page. These are mostly written in the margins or on the main text, although sometimes they are to be found on the facing page. Some of these interventions were clearly written by Bernays, some of them clearly by Hilbert, and some of them are hard to identify. We have identified the author only when the identity is beyond doubt. The headings listed in the Inhaltsverzeichnis do not appear in the text itself, which suggests that the Inhaltsverzeichnis (and with it the division into sections and subsections) was constructed after the composition of the text. By contrast, two subsection headings which are in the text (‘A. Umformungsregeln’ on p. 31, and ‘B. Richtigkeitsregeln’ on p. 32) are not listed in the Inhaltsverzeichnis. They have been added to the Inhaltsverzeichnis for this edition. There are three variant forms for names of persons, ordinary Roman type, Sperrschrift and underlined. Those in ordinary Roman type have been left unstressed; the other forms have been rendered in italics.
Description of the Text
341
The set of notes constituting the first insertion described above is written in black ink and given the title ‘Vorschläge zur Bezeichnung’ by Bernays; over this, Hilbert has written in blue pencil ‘Aussagenkalkül auf Grund von „und “ und „nicht“ ’. This text has been reproduced here following the main body of the ‘Logik-Kalkül’ lectures. For ease of reference and purposes of clarity, the inscribed pages have been given numbers i–iii.
342
Chapter 2
Lectures on Logic (1920)
Probleme der mathematischen Logik
Vorlesung von Prof. Hilbert. Ausgearbeitet von N. Schönfinkel
5
und P. Bernays. Sommer-Semester 1920.
Inhaltsverzeichnis Einleitung I. Die Paradoxieen. § 1. Die Richardsche Paradoxie § 2. Uebergang vom Cantorschen Diagonalverfahren zum Russellschen Paradoxon; mathematische Verschärfung der Paradoxie § 3. Das Paradoxon von Burali-Forti in Zermeloscher Fassung II. Die Revision der Grundlagen der Arithmetik. § 4. Die Methode der extremen Verbote von Kronecker und Poincaré § 5. Zermelos axiomatische Begründung der Mengenlehre und Analysis § 6. Der Versuch einer Zurückführung der Mathematik auf die Logik; Stellungnahme von Russell und Weyl. — Unentbehrlichkeit der axiomatischen Methode § 7. Die Hilbertschen Gedanken zum Beweis der Widerspruchslosigkeit der Zahlentheorie
1 10
2
6 12
15
16 22
20
27 36.
25
‘Probleme der mathematischen Logik’
343
Einleitung.
5
10
15
20
25
30
35
Sie wissen, dass gegenwärtig im Gebiete der Physik das mathematische Denken sich aufs glänzendste entfaltet und seinen Machtbereich zu imponierender Grösse erweitert hat. Es ist hier ähnlich, wie in den Zeiten der Entdeckung der Infinitesimalrechnung, wo die Forscher sich kaum des Stoffes und der Probleme erwehren konnten, die in allzugrosser Fülle auf sie einstürmten. Damals folgte auf die naive Periode der fortschreitenden Ausgestaltung, in der es vor allem auf die Gewinnung von Ergebnissen ankam, bald eine kritische Periode, in der man die Zulässigkeit der Schlussweisen genau prüfte und die bedrohte Sicherheit des mathematischen Schliessens wiederherstellte. Was nun damals zeitlich nacheinander geschah, spielt sich gegenwärtig zu gleicher Zeit ab: Gerade von Seiten vieler der angesehensten Mathematiker (Brouwer, Weyl) wird heute eine kritische Selbstbesinnung betätigt, die darauf ausgeht, die Bedeutung der mathematischen Begriffsbildungen und Schlussweisen zu klären. Den Anstoss zu dieser kritischen Selbstbesinnung haben die Widersprüche in der Mengentheorie gegeben, die schon seit langem bekannt sind. Und die Kritik ist hier um so notwendiger und eine Klärung dieser Widersprüche um so dringender, als man gerade hoffte, in der Mengenlehre ein strengeres Fundament der Arithmetik zu gewinnen — sind doch die Führer in den Fragen der mathematischen Logik, Frege, Dedekind, gerade darauf ausgegangen, Zahlentheorie und Analysis auf die Mengenlehre zu gründen. So ist man durch die Paradoxien der Mengenlehre dazu veran|lasst worden, überhaupt das mathematische Schliessen einer genauren Revision zu unterwerfen. Einen in dieser Richtung gehenden Ansatz, betreffend eine Neubegründung der Zahlentheorie, habe ich in der Vorlesung des letzten Semesters entwickelt. — 1 Für den Zweck, ein allgemeineres Interesse für die modernen Fragen der mathematischen Logik zu erwecken, ist es wünschenswert, auf die Gründe zurückzukommen, aus denen sich die Notwendigkeit dieser Untersuchungen ergeben hat, welche sonst als unnütze Subtilitäten erscheinen könnten. Ich will also zunächst die Paradoxien der Mengenlehre entwickeln und einige kritische Bemerkungen daran knüpfen. Dann will ich auf die Methoden eingehen, welche mir zu einer einwandfreien Begründung der Mathematik als die geeigneten erscheinen. Zur Einleitung möchte ich zuerst einige mathematische Fehlschlüsse vorführen. (Darlegung dieser Fehlschlüsse s. in der Vorlesung vom Sommer-Semester 1917, S. 124–127. 2 ) 1 This is the course of lectures ‘Logik-Kalkül’ from the Winter Semester of 1920 which forms the first part of this Chapter. 2 Hilbert refers here to the lectures from 1917/18 presented in the main part of Chapter 1. The pages cited deal not so much with ‘Fehlschlüsse’ as with remarks about the interchange of quantifiers, the main analysis being that of the logical difference between the statement of ordinary convergence and that of uniform convergence.
1
2
344
Chapter 2
Lectures on Logic (1920)
Abschnitt I. DIE PARADOXIEN. § 1. Die Richardsche Paradoxie.
3
4
Ich beginne die Erörterung der mengentheoretischen Paradoxien mit der Darstellung des Richardschen Paradoxons: Die Menge der Dualbrüche ist, nach einem bekannten Satz von Cantor, nicht abzählbar. Andrerseits muss jeder Dualbruch durch ein Gesetz gegeben | werden, und das Gesetz muss in deutscher Sprache mitteilbar sein. Nun hat die deutsche Sprache 25 Buchstaben. Nehmen wir dazu zwei Interpunktionen zur Trennung von Worten und von Sätzen, so muss für jeden Dualbruch das Gesetz mit den 27 Zeichen ausdrückbar sein. Eine Aufeinanderfolge von irgend welchen der 27 Zeichen möge ein Schriftsatz heissen. Die Menge der Schriftsätze ist aber abzählbar. Denn man erhält eine Numerierung der Schriftsätze, indem man sie zunächst nach der Anzahl der vorkommenden Zeichen und bei gleicher Anzahl nach dem lexikographischen Prinzip ordnet. Unter den Schriftsätzen bilden nun diejenigen eine Teilmenge, durch welche ein Dualbruch definiert wird. Von dieser Teilmenge behalten wir nur diejenigen Schriftsätze bei, für welche der durch sie erklärte Dualbruch von den bereits (durch einen der vorhergehenden Schriftsätze) definierten Dualbrüchen verschieden ist. Auf diese Weise ergibt sich aus der Abzählung der Schriftsätze eine Abzählung aller Dualbrüche, und es folgt so, dass die Menge der Dualbrüche abzählbar ist. Wir kommen also zu einem Widerspruch. Wir wollen nun und können genauer feststellen, wo dieser Widerspruch liegt und welcher Art er ist. Zu diesem Zwecke brauchen wir nur die beiden einander widersprechenden Beweise zu confrontieren. Der Beweis des Satzes, dass die Menge der Dualbrüche nicht abzählbar ist, geschieht durch das Cantor’sche Diagonalverfahren (Ausführung des Diagonalverfahrens). Wendet man dieses Diagonalverfahren auf die Abzählung der Dualbrüche mit Hilfe der Schrift|sätze an, so findet man folgendes: Unter den Schriftsätzen kommt einer vor, welcher (in gewöhnlicher Schreibweise) lautet: „man bilde einen Dualbruch in der Weise, dass man zunächst die Schriftsätze nach der Zeichenzahl und bei fester Zeichenzahl lexikographisch ordnet, und nur diejenigen übrig behält, die einen vorher noch nicht erklärten Dualbruch definieren; wenn in der so entstehenden Folge von Dualbrüchen der N -te an der N -ten Stelle die Ziffer Null hat, so setze man an dieser Stelle Eins, wenn er dort die Ziffer Eins hat, so setze man Null.“ A Added by Hilbert (pencil) in the left-hand margin and written vertically alongside „man . . . Null.“: Amüsanter! A
5
10
15
20
25
30
35
40
‘Probleme der mathematischen Logik’
5
10
15
20
25
30
35
40
45
345
Von diesem Schriftsatz ist nun die Frage, ob er einen Dualbruch definiert oder nicht. Nehmen wir an, das erste sei der Fall; bedeutet dann m die Anzahl der beizubehaltenden Schriftsätze, welche dem betrachteten Schriftsatz vorangehen, so bemerkt man, dass man für die m + 1-te Dualstelle keine Anweisung bekommt, indem verlangt wird, dass dort 1 steht, falls 0 steht, und dort 0 steht, falls 1 steht. (Wir haben hier also einen ähnlichen Fall, wie bei dem Paradoxon des lügenden Kreters.) Nehmen wir aber an, dass der Schriftsatz keinen Dualbruch definiert, so erhalten wir aus ihm tatsächlich eine Anweisung zur Bildung eines Dualbruches. Wir erhalten hiermit eine neue Fassung des Widerspruches, und zwar zeigt es sich, dass dabei der Begriff des Unendlichen nicht die ausschlaggebende Rolle spielt, welche man ihm zunächst zuzuschreiben versucht ist. Tatsächlich kann auch die Paradoxie auf eine Form gebracht werden, bei welcher weder der Mengenbe|griff noch das Unendliche noch der allgemeine Zahlbegriff benutzt wird. Zu dieser Form der Paradoxie kommen wir durch die Betrachtung des folgenden Schriftsatzes: „Die Anzahl der Schriftsätze, die weniger als fünfhundert Zeichen enthalten, ist kleiner als sieben und zwanzig hoch fünfhundert. Es muss daher unter den Zahlen von Eins bis sieben und zwanzig hoch fünfhundert solche geben, die sich nicht durch einen Schriftsatz von weniger als fünfhundert Zeichen definieren lassen. Man nehme nun die kleinste unter diesen Zahlen.“ Der Schriftsatz scheint eine Zahl zu definieren; wenn dies aber der Fall wäre, so ergäbe sich ein Widerspruch, da die betreffende Zahl gemäss ihrer Definition nicht durch einen Schriftsatz von weniger als 500 Zeichen definierbar sein darf, andrerseits aber der definierende Schriftsatz aus weniger als 500 Zeichen besteht. Diese Paradoxie ist sehr verblüffend. Es lassen sich aber dagegen gewisse Einwände erheben. Die Paradoxie kommt nämlich nur dann zustande, wenn wir annehmen, dass von jedem Schriftsatz eindeutig feststellbar ist, ob er eine Zahl definiert oder nicht. Diese Voraussetzung ist aber keineswegs unanfechtbar. Denn zu einer sprachlichen Mitteilung gehören nicht bloss die Schriftsätze, sondern diese sind bloss die Anregung zu einem psychologischen Prozess. Wie dieser sich abspielt, hängt von der Situation und der Vorgeschichte ab (Kenntnis der deutschen Sprache, mathematische Kenntnisse, Fähigkeit der Auffassung abstrakter Sätze.) In der Praxis ergänzt man die Unbestimmtheiten durch konkrete Hinweise, Betonung, Gestikulation, Zeichnungen, Modelle. Es liegt also in der sprachlichen Mitteilung eine wesentliche Unbestimmtheit vor. Diese müsste erst beseitigt werden, damit die Paradoxie eine strenge Fassung erhält. Die Verfolgung dieses Unternehmens würde uns weit hinein in das Gebiet der mathematischen Logik führen. Hier aber wollen wir zunächst dem Einwande von der Unbestimmtheit der sprachlichen Mitteilung dadurch ausweichen, dass wir die aus dem Cantorschen Diagonalverfahren entsprin-
5
6
346
Chapter 2
Lectures on Logic (1920)
gende Paradoxie in eine Fassung bringen, bei welcher von dem Begriffe des Schriftsatzes kein Gebrauch gemacht wird. § 2. Uebergang vom Cantorschen Diagonalverfahren zum Russellschen Paradoxon; mathematische Verschärfung der Paradoxie.
7
8
Wir wollen zuerst den Cantorschen Satz in etwas modifizierter Form aussprechen: „Die Menge aller Teilmengen von der Menge aller positiven ganzen Zahlen ist nicht abzählbar.“ Denn jede Menge von positiven ganzen Zahlen lässt sich darstellen durch einen Dualbruch, bei welchem an der n-ten Stelle 1 oder 0 steht, je nachdem die Zahl n in der Menge vorkommt oder nicht; und diese Darstellung ist umkehrbar eindeutig. Wie stellt sich nun der Cantorsche Beweis für die Nicht-Abzählbarkeit der Dualbrüche dar, wenn wir ihn auf die Mengen von ganzen Zahlen übertragen? Es ist die Annahme zu widerlegen, dass es eine Abzählung der Mengen von ganzen Zahlen: M 1 , M2 , M3 , . . . gibt, sodass in dieser Reihe alle Mengen von ganzen Zahlen vorkommen. Das Diagonalverfahren führt auf die Menge N , in welcher eine Zahl n dann und nur dann enthalten ist, wenn n nicht in Mn enthalten ist. D. h. N ist die Menge aller der Zahlen, welche nicht in der ihnen durch die Abzählung zugeordneten Menge enthalten sind. Diese Menge kommt sicher nicht unter M1 , M2 , . . . vor. Wäre z. B. N mit der Menge M10 identisch, so müsste die Zahl 10 in N vorkommen, falls sie in M10 vorkommt, und umgekehrt, während die Definition von N gerade vorschreibt, dass die Zahl 10 dann und nur dann in N vorkommt, falls sie nicht in M10 vorkommt. Somit ist die Möglichkeit der angenommenen Abzählung widerlegt. Man spricht von grösserer Mächtigkeit einer Menge gegenüber einer andern, wenn die zweite Menge auf eine Teilmenge der ersten, aber nicht auf die erste Menge selbst umkehrbar eindeutig abbildbar ist. Hiernach besagt der bewiesene Satz, dass die Menge aller Mengen von ganzen Zahlen grössere Mächtigkeit hat als die Menge der ganzen Zahlen. (Diese Menge ist ja umkehrbar eindeutig abbildbar auf die Menge derjenigen Mengen, welche eine ganze Zahl als einziges Element enthalten, also auf eine Teilmenge der ersten Menge, während eine solche Abbildung auf diese ganze Menge nach dem Bewiesenen unmöglich ist.) Wir können dem betrachteten Satze auch noch folgende Wendung geben: Es gibt keine Funktion f (M ), welche jeder Menge M von ganzen Zahlen umkehrbar eindeutig eine ganze Zahl zuordnet.1) Wir führen nochmals den Beweis in einer verallgemeinerungsfähigen Form: 1) Hierbei brauchen nicht alle ganzen Zahlen als Funktionswerte aufzutreten. Die umkehrbare Eindeutigkeit besagt nur, dass jede zugeordnete Zahl zu einer und nur
5
10
15
20
25
30
35
40
‘Probleme der mathematischen Logik’
5
10
15
20
25
30
347
Gäbe es eine Funktion f von der verlangten Eigenschaft, so betrachten wir diejenigen Mengen N , für welche f (N ) nicht Element von N ist. Solche Mengen gibt es jedenfalls. In der Tat, verstehen wir allgemein unter (m) die Menge, die aus einem einzigen Elemente m, unter (m, n) eine Menge, die aus den beiden Elementen m und n besteht, so ist es leicht zu zeigen, dass mindestens eine von den Mengen (1), (2), (1, 2) zu den Mengen N gehört. Wäre nämlich f (1) = 1, f (2) = 2, so müsste, infolge der eindeutigen Umkehrbarkeit der Zuordnung, f (1, 2) von 1 und von 2 verschieden sein. Es muss also mindestens eine von den drei Mengen (1), (2) und (1, 2) eine Menge N sein. 3 Jeder Menge N entspricht nun eine bestimmte ganze Zahl f (N ). Die Menge . Dann ist f (N ) wiederum eine bestimmte aller dieser ZahlenB nennen wir N C ganze Zahl . Wir fragen nun, ob f (N ) in N vorkommt oder nicht. ) komme in N vor: so muss, da N nur aus Zahlen f (N ) besteht, 1) f (N f (N ) gleich einem f (N1 ) sein, also folgt, wegen der umkehrbaren Eindeu ≡ N1 . f (N1 ) kommt aber in N1 nicht vor.D Also tigkeit der Zuordnung, N ) in N nicht vor. kommt f (N nicht vor; dann ist N gleich einem N1 . Nach der Defini2) f (N ) komme in N ) tion der Menge N kommen in ihr alle f (N ) vor. Also auch f (N1 ), d. h. f (N vor. kommt in N Die Annahme, dass es eine Funktion f (M ) von der oben definierten Eigenschaft gibt, führt somit zum Widerspruch. Auf dieselbe Weise zeigt man allgemein: Hat man ein SystemE von Dingen (a), so kann es keine Funktion geben, welche jeder MengeF von Dingen jenes Systems umkehrbar eindeutig ein Ding f (M ) zuordnet. D. h. die Menge der Mengen von Dingen a hat grössere Mächtigkeit als die Menge der Dinge a selbst. Dieser wichtige Satz der Mengenlehre führt nun überraschenderweise zu einer offenbar falschen Folgerung, wenn wir als das System der Dinge die Gesamtheit aller Mengen nehmen. Er besagt dann nämlich: es kann keine Funktion geben, welche jeder Menge M von Mengen eine Menge umkehrbar eindeutig zuordnet. einer Menge M gehört. Das Argument M von f durchläuft aber alle Mengen von ganzen Zahlen. Above ‘Zahlen, Hilbert has written in pencil: Elemente Above ‘bestimmte ganze Zahl’, Hilbert has written in pencil: bestimmtes Element D Written by Hilbert in pencil above ‘kommt . . . nicht’: nach Definition der N E Above ‘System’, Hilbert has written in pencil: Menge F Above ‘Menge’, Hilbert has written in pencil: Teilmenge B C
3 In
the space above the previous paragraph (beginning ‘Gäbe es . . . ’), Hilbert (pencil) has written ‘a, b verschiedene Elemente von M ’; this clearly refers to the present paragraph beginning ‘In der Tat . . . ’, since ‘a’ and ‘b’ have been written above ‘1’ and ‘2’ respectively, apparently as replacements for them.
9
348
10
Chapter 2
Lectures on Logic (1920)
Das ist nun gewiss falsch; denn die Funktion f (M ) = M leistet ja eine solche Zuordnung. Wie kommt nun hier der Widerspruch zustande? . Diese enthält als EleBilden wir, entsprechend wie vorhin, die Menge N mente alle die Funktionswerte f (N ) = N , die nicht Elemente von N sind, ist die Menge derjenigen Mengen von Mengen, welche mit anderen Worten: N lässt sich genau sich nicht selbst als Element enthalten. Für diese Menge N so wie eben nachweisen, dass sie auf einen Widerspruch führt, und es zeigt sich damit, dass in dem Begriff der Menge aller sich nicht selbst enthaltenden Mengen von Mengen ein Widerspruch liegt. Wir können nun noch die (aus dem Zusammenhang mit dem Cantorschen Beweis entsprungene) Beschränkung auf Mengen von Mengen aufheben, dann aller gelangen wir zu dem Russell-Zermeloschen Paradoxon: die Menge N Mengen N , die sich nicht als Element enthalten, ist widerspruchsvoll. 4 sich selbst, so ist sie eine Menge N , darf Enthält nämlich die Menge N sich also nicht enthalten; enthält sie aber sich selbst nicht, so besitzt sie , d. h. in sich als die definierende Eigenschaft der Mengen N , | ist also in N Element enthalten. Nun bietet sich auch hier wieder eine provisorische Auflösung der Paradoxie, indem man den Begriff der Menge aller Mengen, bezw. aller sich nicht enthaltenden Mengen, als einen unbestimmten und nicht mathematisch präzise definierten Begriff ablehnt. Ich werde aber jetzt zeigen, wie man, von einer rein-mathematischen Menge ausgehend und mit den in der Mathematik immer gebrauchten und nie bezweifelten Hilfsmitteln operierend, trotzdem zu einer Paradoxie gelangt. Wir gehen von der Menge A allerG ganzen Zahlen aus, bilden die Menge aller ihrer Teilmengen, von dieser wieder die Menge aller Teilmengen u. s. w. Dann bilden wir die Vereinigungsmenge aller so erhaltenen Mengen; dann wieder die Menge aller ihrer Teilmengen u. s. w. Auf diese Weise gewinnt man durch die beiden mengenerzeugenden ProzesseH der Bildung der Menge aller Teilmengen undI der Vereinigung von Mengen immer neue und höhere Arten der Zusammenfassung. Nun bilden die Elemente aller derjenigen Mengen, welche durch sukzessive Anwendung der beiden Prozesse (beim Ausgehen von A) erhalten werden können, eine Menge M . Diese entsteht durch den Prozess der Vereinigung, angewandt auf solche Mengen, die ihrerseits durch die beiden genannten Prozesse gewonnen werden. T sei die Menge aller Teilmengen von M . Diese wird wiederum aus A durchA blosse Anwendung jener beiden Prozesse erhalten. Es Inserted between ‘A’ and ‘aller’ in pencil: (1, 2, 3, . . . ) Written above ‘der Bildung’ in pencil in what appears to be Hilbert’s hand, and clearly meant to be inserted after ‘Prozesse’ is: 1.) Prozess Pt I Written above ‘der Vereinigung’ in pencil in what appears to be Hilbert’s hand, and clearly meant to be inserted before it, is: 2.) Prozess Pv A Inserted between ‘A’ and ‘durch’ in pencil: (1, 2, 3, . . . ) G
H
4 The
’ is intended. manuscript has ‘N ’ here, but clearly ‘N
5
10
15
20
25
30
35
‘Probleme der mathematischen Logik’
5
10
15
20
25
30
349
muss also jedes ihrer Elemente auch ein Element von M sein (nach Definition von M ). Die Menge T aller Teilmengen von M ist also selbst eine Teilmenge von M . Dies widerspricht aber dem oben bewiesenen Satze, dass die Menge der Teilmengen von einer Menge | grössere Mächtigkeit besitzt als die Menge selbst.B Diese Paradoxie ist sehr lehrreich in dem Sinne, dass sie uns in trefflicher Weise zeigt, wie man beim Umgehen mit den bisher als ganz streng in der Mathematik geltenden Ueberlegungen und Begriffen vorsichtig sein muss, besonders da, wo Ausdrücke wie „alle“, „und so weiter“, gebraucht werden. Allenfalls ist die zuletzt vorgeführte Paradoxie nicht stichhaltig. Wir können da folgenden Einwand machen: Es spielen in der Mathematik und Logik zwei Arten von Definitionen eine Rolle, nämlich: die genetische C , durch Erzeugung, und die axiomatische D , bei der man einen Gegenstand durch seine Eigenschaften charakterisiert. Man könnte sagen, dass hier die beiden Definitionsarten in unzulässiger Weise miteinander vermischt sind. Nämlich, wenn wir die Mengen genetischE definieren, dann bricht unser Verfahren nie ab; es werden immer neue Mengen geschaffen, ich gelange aber niemals zur Gesamtheit aller durch das Verfahren erzeugten Mengen. Allerdings ist diese Gesamtheit eine wohldefinierte Menge — (man betrachtet eine Menge als wohldefiniert, wenn von jedem Dinge bestimmt ist, ob es zur Menge gehört oder nicht); aber sie kommt nicht selbst durch den Erzeugungsprozess zustande. Andererseits, wenn wir die axiomatischeF Methode in reiner Form anwenden, dann können wir zwar eine Menge von Mengen definieren, welche erstens die Menge aller ganzen Zahlen als Element enthält, worin ferner zugleich mit jeder Menge auch die Menge ihrer Teilmengen als Element vorkommt und wo die Vereinigungsmenge von zugehörigen Mengen wieder ein Element der Menge bildet. Aber die so bestimmte Menge braucht dann nicht selbst ein Element der Menge zu sein. Also: bei dem genetischen VerfahrenG gelangen wir überhaupt nicht zu der Gesamtheit aller (durch die beiden genannten Prozesse) erzeugbaren Mengen, bei dem axiomatischen VerfahrenH lässt sich nicht beweisen, dass sie selbst mit unter ihren Elementen auftritt. Nun lässt sich aber die Idee dieser Paradoxie so verschärfen, dass man keinen Einwand mehr erheben kann. Wir kommen damit zu der Paradoxie von B Added by Hilbert (pencil) on the reverse of p. 10, and directed here by means of an insertion sign: Der übliche Beweis zeigt nämlich zugleich, dass die Menge aller Teilmengen von M auch keiner Teilmenge von M aequivalent ist. C Written above ‘genetische’ in Hilbert’s hand (pencil): besser: „konstruktive“ D Written above ‘axiomatische’ in Hilbert’s hand (pencil): besser: „existentiale“ E Here and in the following two paragraphs, Hilbert (pencil) has interlineated the alternative terminology recently noted, without striking out what is given in the typescript: konstruktiv F Hilbert’s alternative terminology: (existentiale) G Hilbert’s alternative terminology: (auf dem konstruktiven Standpunkt) H Hilbert’s alternative terminology: (existentialen Standpunkt)
11
12
350
Chapter 2
Lectures on Logic (1920)
Burali-Forti, deren Ursprung noch auf Cantor zurückgeht, und welche durch Zermelo ihre volle Präzisierung erfahren hat. § 3. Das Paradoxon von Burali-Forti in Zermeloscher Fassung.
13
Wir führen zunächst folgende Bezeichnungen ein: 1) m0 bedeute die Menge, welche gar kein Element enthält, die „Nullmenge“. 5 2) (a) bedeute die Menge, welche a als einziges Element enthält. 3) Sind M und N zwei Mengen, so bedeute M +N ihre Summe (Vereinigung), d. h. die Menge derjenigen Dinge, welche entweder in M oder in N als Elemente vorkommen. 4) Ist M eine Menge von Mengen, so bedeute S(M ) die zugehörige Vereinigungsmenge, d. h. die Summe der zu M gehörigen Mengen oder, anders ausgedrückt: S(M ) ist die Menge der Elemente von den Elementen von M . Definition: Eine Menge M von Mengen soll eine Ordnungszahl heissen, wenn sie folgende drei Bedingungen erfüllt: 1. m0 ist Element von M . 2. Ist eine Menge A Element von M , so ist die Menge A + (A), welche aus A durch Hinzufügung von A selbst als Element entsteht | (die also als Elemente erstens alle Elemente von A und zweitens noch A selbst enthält), entweder identisch mit M oder Element von M . 3. Ist T eine (echte oder unechte) Teilmenge von M , so ist S(T ) entweder identisch mit M oder Element von M .I Zum Nachweis, dass es Ordnungszahlen überhaupt gibt, dienen folgende Beispiele. Die Menge m1 = (m0 ) ist eine Ordnungszahl. — (Das Zeichen = bedeutet hier Identität.) — Denn 1. m0 ist Element von m1 . 2. für das einzige Element m0 von m1 ist m0 + (m0 )6 = m1 , weil ja m0 kein Element enthält. I Hilbert (pencil) has altered ‘drei Bedingungen’ to ‘2 Bedingungen’, altered the first condition by writing ‘1’ instead of ‘m0 ’, crossed out the second and third conditions and substituted his own second condition yielding: . . . 2 Bedingungen erfüllt: 1. 1 ist Element von M . 2. Der durch ein Element bestimmte Abschnitt ist mit dem Element identisch.
5 ‘m ’ has been crossed out in pencil and replaced by ‘1’, ‘(Statt Nullmenge sage 1!)’ has 0 been added in Hilbert’s hand after ‘„Nullmenge“’, and then the whole first item of the list, including the new, pencilled addition, has been enclosed in parentheses in pencil. Following this, the subsequent items have been renumbered, yielding, instead of the items 2), 3), 4) the enumeration 1.), 2.), 3.). While only the additional sentence is clearly in Hilbert’s hand, it is plausible to assume that Hilbert was responsible for all these changes. 6 ‘(1’ was written above ‘(m )’ in pencil, presumably indicating the start of a longer 0 addition; this was then crossed out and replaced by a simple ‘1’ over ‘m0 ’. Presumably the changes are part of Hilbert’s revisions to the beginning of § 3.
5
10
15
20
25
‘Probleme der mathematischen Logik’
351
3. die einzige Teilmenge von m1 ist m1 selbst, und S(m1 ) = m0 ist Element von m1 . (Rechnet man m0 als Teilmenge, so ist wegen S(m0 ) = m0 auch für diese die Bedingung 3. erfüllt.) Ein zweites Beispiel bildet die Menge m2 = (m0 , m1 ).
5
10
Nämlich 1. m0 ist Element von m2 . 2. für die Elemente m0 und m1 gilt, dass m0 + (m0 ) = m1 Element von m2 und m1 + (m1 ) = (m0 , m1 ) mit m2 identisch ist. 3. Für die Teilmengen (m0 ), (m1 ), (m0 , m1 ) sind die zugehörigen Vereinigungsmengen: S((m0 )) = m0 , S((m1 )) = m1 , S((m0 , m1 )) = m0 + m1 = m1 , und dies sind lauter Elemente von m2 . Wird
15
20
25
30
35
40
m2 + (m2 ) = m3 m3 + (m3 ) = m4 .. .. .. . . . gesetzt, so kann man ebenso beweisen, dass m3 , m4 , m5 , m6 . . . Ordnungszahlen sind. Dagegen die Menge m0 ist keine Ordnungszahl, denn sie enthält nicht m0 , weil sie ja überhaupt kein Element enthält. Die Menge m1 ist daher die kleinste Ordnungszahl in dem Sinne, dass sie sowohl Teilmenge wie auch Element jeder anderen Ordnungszahl ist. Allgemein gelten folgende beweisbaren Sätze: 1)) Ist M eine Ordnungszahl, so ist es auch M + (M ). 2)) Ist M eine Menge von Ordnungszahlen, so ist S(M ) eine Ordnungszahl. Man könnte denken, dass der Begriff der Ordnungszahl so weit gefasst sei, dass er (so wie der Begriff der Menge überhaupt) über das Gebiet des mathematisch Scharfen hinausgehe. Dass dies aber nicht der Fall ist, geht aus folgenden Sätzen hervor: 3)) Eine Ordnungszahl enthält sich selbst nie als Element. 4)) Jedes von m0 verschiedene Element einer Ordnungszahl ist selbst eine Ordnungszahl. 5)) Von zwei verschiedenen Ordnungszahlen ist stets die eine ein Element und zugleich eine Teilmenge der andern. Aus diesen Sätzen lässt sich z. B. folgern, dass die Menge M aller Strümpfe weder eine Ordnungszahl noch auch Element einer Ordnungszahl sein kann. Beweis: Erstens kann M keine Ordnungszahl sein, weil m0 kein Element von M ist; denn m0 ist kein Strumpf. Zweitens kann M auch kein Element einer Ordnungszahl sein; denn sonst müsste M nach 4)) entweder selbst eine Ordnungszahl sein, was wir eben | als unzutreffend erkannt haben; oder M müsste mit m0 identisch sein, was auch nicht der Fall ist; denn es gibt doch Strümpfe, und M muss also Elemente enthalten. Man sollte demnach denken, dass die Theorie der Ordnungszahlen ein nicht nur im rein-mathematischen Sinne entwicklungsfähiges, sondern auch
14
15
352
16
Chapter 2
Lectures on Logic (1920)
logisch scharf abgegrenztes Gebiet darstellt. Und trotzdem führt uns auch diese Theorie zu einer Paradoxie: Es sei nämlich W die Menge, die aus allen Ordnungszahlen und noch aus m0 besteht. Dann gilt der Satz: „Die Menge W ist eine Ordnungszahl“. Denn 1. m0 ist Element von W . 2. Ist A ein Element von W , so ist es auch A + (A). In der Tat: A ist entweder m0 oder eine Ordnungszahl, im ersten Falle ist A + (A) identisch mit m0 + (m0 ), d. h. mit (m0 ), d. h. mit m1 ; m1 ist aber eine Ordnungszahl, wie wir vorhin bewiesen haben; also ist A + (A) eine Ordnungszahl. Im zweiten Fall, wo A eine Ordnungszahl ist, folgt aus Satz 1)), dass auch A + (A) eine Ordnungszahl ist. In beiden Fällen ist also A + (A) ein Element von W . 3. Ist T eine Teilmenge von W , so ist S(T ) Element von W . Nämlich T besteht entweder nur aus Ordnungszahlen, oder enthält noch m0 als Element. Bei der Bildung von S(T ) trägt m0 gar nichts bei, und es folgt daher in jedem Falle, gemäss dem Satz 2)), dass S(T ) eine Ordnungszahl ist. Die Bedingungen 1., 2., 3. sind also für W erfüllt. Demnach ist W eine Ordnungszahl und folglich auch Element von W , gemäss der Definition von W . Dies widerspricht aber dem Satz 3)), nach welchem eine Ordnungszahl sich | nicht selbst als Element enthalten kann. Gegen diese Paradoxie gilt keiner der früheren Einwände; sie ist vom Standpunkte der traditionellen Logik völlig stichhaltig. So sind wir von ganz harmlosen Anfängen ausgehend durch eine Kette von Paradoxien, die sich auf natürlichem Wege, gleichsam organisch aus einander entwickelten, schliesslich zu diesem letzten Paradoxon gelangt, welches wir als den Gipfelpunkt mathematischer Paradoxien bezeichnen können.
5
10
15
20
25
Abschnitt II. DIE REVISION DER GRUNDLAGEN DER ARITHMETIK. § 4. Die Methode der extremen Verbote von Kronecker und Poincaré.
17
Wo Widersprüche vorhanden sind, da ist etwas falsch, und es bedarf einer Korrektur. Ein Widerspruch ist wie ein Bazillus, der alles vergiftet, wie ein Funke im Pulverfass, der alles vernichtet. Insbesondere in der Mathematik, der wir doch die alte gerühmte absolute Sicherheit erhalten wollen, müssen Widersprüche ausgeschlossen werden. Es sind also Vorsichtsmassregeln bei Begriffsbildungen und Schlüssen nötig. Eine Auflösung der Paradoxie durch Aufweisen eines Fehlschlusses in dem Sinne, wie es bei dem anfangs erwähnten Scheinbeweis für die Gleichseitigkeit jedes Dreiecks möglich ist oder bei den Widersprüchen der Infinitesimalrechnung, welche sich auf eine falsche Uebertragung | von Eigenschaften der endlichen Rechenoperationen auf die LimesProzesse (fehlerhafte Vertauschung von Grenzübergängen, Verwechslung von Annehmen und Approximieren eines Wertes) zurückführen lassen, ist nach
30
35
40
‘Probleme der mathematischen Logik’
5
10
15
20
25
30
35
40
353
meiner Ansicht nicht möglich, — wenigstens nicht in anschaulich überzeugender Weise. Versuche einer solchen Auflösung sind natürlich gemacht worden. Ich habe sie schon angedeutet und auch zurückgewiesen. Freilich lässt sich darüber viel hin und her reden. Das ist aber weder interessant noch fruchtbar. Es besteht keine Aussicht, einen offensichtlichen Fehler zu finden. Vielmehr werden wir bei näherer Untersuchung gewahr, dass eine Reihe sehr tiefer Probleme mit dieser Paradoxie in Zusammenhang stehen, und diesen Zusammenhang aufzudecken und zu klären wäre ein positiver Gewinn und jedenfalls wichtiger und befriedigender als zweifelhaftes Hin- und Herreden. Wenn wir demgemäss von einer Auflösung des gefundenen Widerspruchs absehen, so ist es doch natürlich notwendig, die Wissenschaft aus der Not der Paradoxien zu retten. Nun sehen wir besonders aus dem letzten Paradoxon, dass jedenfalls nicht beliebige Begriffsbildungen und Schlüsse in der bisher üblichen Weise erlaubt sind. Es ergibt sich daher die Massregel der Verbote, der Diktatur. Der weitgehendsteA und radikalste Diktator auf diesem Gebiete war Kronecker. Sein Standpunkt wird gekennzeichnet durch den Ausspruch: „Die ganzen Zahlen hat Gott erschaffen, alles übrige ist Menschenwerk.“ Insbesondere lehnte er die Mengenlehre ab als ein blosses Spiel der Phantasie mit lauter unerlaubten Kombinationen, die keine mathematischen Begriffe mehr seien. In der Zahlentheorie seien alle Wahrheiten unzweifelhaft, die Beweise unanfechtbar und | jedem gesunden Menschenverstand unmittelbar einleuchtend. 18 Das beruhe auf ihrer beständigen Kontrollierbarkeit. In der Tat, die tiefsten Gesetze der Zahlentheorie, wie z. B. das Reziprozitätsgesetz, oder der Satz, dass jede Primzahl von der Gestalt 4n + 1 durch die Form a2 + b2 darstellbar ist, lassen sich an Hand von Beispielen jedem Mann, dem man auf der Strasse begegnet, klar demonstrieren. Um solche Sätze zu verstehen und im Einzelfall nachzuprüfen, wird nicht mehr erfordert als das gewöhnliche Einmaleins, so wie es eine Köchin braucht. Auf Grund seiner Anschauungsweise verbietet Kronecker schon die ein√ fachste Irrationalzahl 2, indem er anstelle dieses „unzulässigen“ Begriffes den Begriff des Moduls x2 − 2 einführt. Er polemisiert gegen alle massgebenden Vertreter der Mathematik, insbesondere auch gegen Weierstrass, obwohl dieser gerade durch die Strenge seiner Begriffe die Infinitesimalrechnung von allen Schlacken befreit hat. Von der anschaulichen Methode Riemanns, die damals die glänzendsten Erfolge hatte, und der neu aufgetauchten Cantorschen Mengentheorie will er gar nichts wissen, ihren Erfolgen gegenüber bleibt er verschlossen. Er treibt hier eine Vogel-Strauss-Politik. Seine Bemühungen, nun doch wenigstens das, was er in der Algebra nötig braucht, zu retten, werden immer krampfhafter und seine Modultheorie immer abstruser. Kronecker bekämpft jeden Begriff, soweit er Aussagen ermöglicht, deren Richtigkeit nicht durch eine endliche Anzahl von Operationen entscheidbar ist. A
Added in pencil before ‘weitgehendste’, possibly in Hilbert’s hand: erste
354
19
20
Chapter 2
Lectures on Logic (1920)
Z. B. lässt er den Begriff der Irreduzibilität einer ganzen rationalen Funktion (mit ganzzahligen | Koeffizienten) nur unter der Bedingung gelten, dass ein endliches Verfahren zur Entscheidung über die Irreduzibilität angegeben wird. Die Aussage, dass es unendlich-viele Primzahlen gibt, hat nach Kronecker, wie er mir persönlich geäussert hat, keinen Sinn, ehe man nicht zeigt, dass hinter jeder Primzahl in einem angebbaren Zahlenintervall wieder eine Primzahl liegt, so wie es z. B. Euklid getan hat, der bewies, dass zwischen einer Primzahl p und der Zahl (p! + 2) mindestens eine Primzahl auftritt. Behauptungen wie den Dirichletschen Satz, dass in jeder arithmetischen Progression (wo die Differenz zum Anfangsglied teilerfremd ist) unendlich viele Primzahlen vorkommen, erklärt er für unzulässig und durchaus einer Ergänzung bedürftig. Kronecker schränkt also die Logik ein. Wie er das willkürliche Operieren mit den Begriffen „reduzibel“, „irreduzibel“ u. s. w. verbietet, genau so stellt er sich auch den rein-logischen Aussagen gegenüber, wie z. B. dem Prinzip des „tertium non datur“, dessen Anwendung er nur unter der Bedingung zulässt, dass die Möglichkeit einer Entscheidung der Existenzfrage durch ein endliches Verfahren besteht. Soweit kommt Kronecker in der Tat, und diese Folgerichtigkeit ist auch ein Verdienst von ihm, das man anerkennen kann, ohne ihm zu folgen. Denn wir können ihm tatsächlich in seiner übertriebenen Verbots-Politik nicht folgen. So vorzugehen, hiesse, das Kind mit dem Bade ausschütten. Die Irrationalzahl, die Funktionentheorie, die gesamte Analysis mit ihren fein entwickelten Resultaten, die Physik, und dann schliesslich die Mengentheorie, als glänzendste Frucht mathematischer Erkenntnis, sind unentbehrlich. Wir sagen vielmehr, die Verbote müssen so gemacht werden, dass die Wider|sprüche beseitigt werden, dass aber doch alles Wertvolle bestehen bleibt, und zwar nicht nur alle wertvollen Resultate müssen erhalten bleiben, sondern auch die Freiheit der Begriffsbildung und der Schlussmethoden soll nicht über das Mass des Notwendigen hinaus beschränkt sein. Die Nachfolger Kroneckers erkannten dies. Trotzdem ist noch bis heute die Kronecker’sche Tendenz zu einer weitgehenden Beschränkung der mathematischen Begriffsbildung und Schlüsse vielfach von massgebender Seite vertreten worden, und seine Methode der Aufstellung von Verboten ist noch immer sehr beliebt. Als ein Anhänger dieser Richtung ist insbesondere Poincaré zu nennen, vielleicht der glänzendste Vertreter der mathematischen Wissenschaft in der vorigen Generation. Produktiv-sein war seine Stärke. Fantasie, Schöpfungskraft war ihm mehr wie je einem Mathematiker eigen. Hier aber hat er sich nur krittelnd, nur ablehnend und gänzlich unproduktiv verhalten. Kein neuer Gedanke ging von ihm aus, und die damals neue, überall befruchtend wirkende wissenschaftliche Richtung Cantors wurde von ihm als Cantorismus gebrandmarkt. Wie Kronecker, diktiert er Verbote. Z. B. erklärt er, jede Aussage über das Unendliche sei nur insofern zulässig, als sie eine Umformung für eine Aussage über das Endliche darstellt; jedes Theorem sei leer, wenn es sich nicht verifizieren lasse. Von diesem Standpunkte aus lehnt er die Methode
5
10
15
20
25
30
35
40
45
‘Probleme der mathematischen Logik’
5
10
15
20
25
30
35
355
der Mengenlehre gänzlich ab. Z. B. hat der Zermelosche Satz, das jede Menge wohlgeordnet werden kann, für ihn keinen Sinn; und dasselbe gilt von fast allen den Beweisen, die auf mengentheoretischen Prinzipien beruhen, wie etwa dem Beweis dafür, dass die Funktionalgleichung f (x+y) = f (x)+f (y), ausser der trivia|len Lösung f (x) = const. · x, auch noch andere Lösungen besitzt. Allerdings geht Poincaré in seiner ablehnenden Haltung nicht so weit wie Kronecker, der auch alles Anschauliche auszuschalten sucht und die Geometrie nur allenfalls als heuristisches Hülfsmittel gelten lässt. Man könnte diesen Diktatoren manche Inkonsequenz vorhalten und zeigen, dass sie nicht weit genug in ihren Verboten gingen. Die Auffassung, welche sie vertreten, lässt sich überhaupt nicht konsequent durchführen. Man müsste sonst schon die einfachsten mathematischen Sätze fallen lassen. Schon das kommutative Gesetz der Addition kann ja nicht durch endlich viele Operationen kontrolliert werden. Und dasselbe gilt von allen zahlentheoretischen Sätzen, (z. B. dem Fermatschen Satz über die Unlösbarkeit der Gleichung xp +y p = z p durch positive ganze Zahlen x, y, z für eine ungerade Primzahl p). Auch könnten viele Schlussweisen, die man in der Algebra und Zahlentheorie für manche Zwecke notwendig braucht, bei der konsequenten Einhaltung jenes Standpunktes nicht angewandt werden, z. B. das Prinzip, dass es in jeder Folge von positiven ganzen Zahlen n1 , n2 , n3 , . . . stets eine erste Zahl gibt, die von keiner folgenden unterschritten wird. Der Einfluss der Kroneckerschen Richtung war eine Zeitlang sehr stark, und zu meiner Studienzeit war es geradezu anrüchig, sich mit Mengenlehre zu beschäftigen. Durch die mystische Ausschmückung, die Cantor seiner Lehre anfangs gab, wurde die Abneigung gegen sie noch verstärkt. Die ersten in der jüngeren Generation, die ernsthaft für Cantor Partei nahmen, waren Minkowski und ich; und derjenige, der in neuester Zeit, meiner Meinung nach am präzisesten und zu-B|gleich ihrem Geiste angemessen die Theorie neu fundiert hat, ist Zermelo. 7 Er verfährt dem Programm gemäss, nur soviel zu verbieten, als zur Wegräumung der Widersprüche nötig ist. Nach Zermelo darf man nicht: 1) Dinge beliebig zu einer Menge zusammenfassen, insofern sie nicht schon einer Menge angehören (Cantors Forderung konsistenter Mengen wird dadurch präzisiert). B Added by Hilbert (pencil) in the lower margin of p. 21, where ‘neu’ is an addition to the addition: die Mengenlehre neu fundiert hat, ist Zermelo 7 There are several changes to this sentence, all presumably made by Hilbert. First, he has enclosed ‘Die ersten . . . Minkowski und ich: und’ in pencilled brackets, and then also the phrase ‘meiner Meinung . . . und zu-’, where the page ends. (There is a pencilled opening bracket before this ‘und’, but this has been crossed out.) The words added in the lower margin of p. 21 are presumably in place of this second phrase. Assuming that the bracketed parts are indeed to be omitted, this suggests a new sentence:
Derjenige, der in neuester Zeit die Mengenlehre neu fundiert hat, ist Zermelo.
This would demand grammatical alterations to what follows (‘gleich ihrem Geist angemessen’), but presumably Hilbert wanted the sense of this to remain.
21
22
356
Chapter 2
Lectures on Logic (1920)
2) Mengen beliebig vereinigen, sofern sie nicht Elemente einer Menge sind. Alles andere ist erlaubt. Insbesondere wird zugelassen: 1) die Bildung der Menge aller Teilmengen von einer gegebenen Menge 2) die Anwendung des Auswahlprinzips, welches folgendermassen lautet: Die Menge aller Repräsentantenmengen einer existierenden∗) Menge von existierenden Mengen existiert ebenfalls. 8
5
§ 5. Zermelos axiomatische Begründung der Mengenlehre und Analysis.
23
Wir wollen uns nun mit der Zermeloschen Theorie ausführlich beschäftigen. In seinen Untersuchungen macht Zermelo von der auch sonst auf zahlreichen Gebieten mit bestem Erfolg angewandten axiomatischen Methode Gebrauch, auf die wir später noch näher eingehen wollen. Das Axiomensystem von Zermelo stellt die umfassendste mathe|matische Axiomatik dar. Die Theorie, welche sich aus der Entwicklung dieses Axiomensystems in seine Konsequenzen ergibt, schliesst alle mathematischen Theorien (wie Zahlentheorie, Analysis, Geometrie) in sich in dem Sinne, dass die Beziehungen, welche sich zwischen den Gegenständen einer dieser mathematischen Disziplinen finden, vollkommen entsprechend dargestellt werden durch die Beziehungen, welche in einem Teilgebiete der Zermeloschen Mengenlehre stattfinden. Dies hat erstens die Bedeutung, dass im Fall der Widerspruchslosigkeit der Zermeloschen Axiome zugleich die Widerspruchslosigkeit aller der spezielleren mathematischen Theorien feststeht. Ferner bedeutet es, dass alle mathematischen Beziehungen zurückgeführt werden auf: 1) die gewöhnlichen logischen Verknüpfungen („und“, „oder“, „nicht“, „folgt“, „äquivalent“, „alle“, „es gibt“). 2) die uneigentliche Beziehung der Identität: Id (x, y): „x ist dasselbe Ding wie y“ (deren Gegenteil bedeutet: „x ist verschieden von y“), — welche reflexiv , symmetrisch, transitiv ist.2) ∗)
Eine Menge heisst „existierend“, wenn sie von der „Nullmenge“ verschieden ist, d. h. wenn sie mindestens ein Element enthält. 2) 9 „Reflexiv“, d. h. für jedes x gilt Id (x, x); „symmetrisch“, d. h. aus Id (x, y) folgt 8 In this sentence, the second occurrence of ‘existierend’ has first been replaced by ‘eigentlich’ (also in the footnote) and ‘existiert ebenfalls’ by ‘ist ebenfalls eigentlich’. (The first occurrence was also replaced in pencil by ‘eigentlich’, but this replacement has been erased.) The sentence was then crossed out and the footnote enclosed in parentheses; all of this (including presumably the bracketed footnote) is then replaced by:
Zu jeder Menge von Mengen m giebt es eine Representantenmenge d. h. eine Menge, in welcher jede Menge m durch eines ihrer Elemente vertreten ist
This new sentence has been written in the space between the section ending here and § 5; it is in Hilbert’s hand, and presumably all the changes here are his. 9–9 Added by Bernays on a slip of paper pasted onto the left-hand margin.
10
15
20
25
30
‘Probleme der mathematischen Logik’
357
3) die eigentliche mathematische Beziehung E(x, y): „x gehört zu y“, oder: „x ist Element von y“.
5
10
15
20
25
30
35
— welche weder reflexiv noch symmetrisch noch transitiv ist. Als Prädikate und Relationen werden nur solche Ausdrücke eingeführt, welche aus Id (x, y) und E(x, y) mittels der logischen Verknüpfungen und durch Einsetzen von Eigennamen gebildet sind. (Diese Festsetzungen stellen eine Präzisierung des Zermeloschen | Begriffs der definiten Aussage dar.) Dabei beziehen sich die logischen Operationen „für alle x“, „es gibt ein x“ auf die Gegenstände eines gewissen Bereiches B von Dingen, und auch die Eigennamen sollen nur für Dinge aus B genommen werden. Die Dinge aus B heissen „Mengen“. Dieser hypothetisch zugrunde gelegte Bereich B wird nun durch die Axiome charakterisiert; über deren Inhalt will ich nun eine Uebersicht geben. 1) Charakterisierung von Id und E. Ist x und auch y ein Ding von B, so steht sowohl für die Beziehung Id (x, y) wie für E(x, y) eindeutig fest, ob sie erfüllt ist oder nicht. Von Id gelten die bekannten Eigenschaften. Ferner wird über die Beziehung E(x, y) noch folgendes vorausgesetzt: Wenn y, z Dinge aus B sind und wenn zu y gerade dieselben Dinge (aus B) gehören, wie zu z, so ist y mit z identisch. D. h. „eine Menge ist eindeutig durch ihre Elemente bestimmt.“ 2) Das Grundaxiom der Aussonderung: „Alle Elemente einer Menge, auf welche ein Prädikat zutrifft, bilden wieder eine Menge“, d. h.: ist m ein Ding aus B und P ein Prädikat, so gibt es ein Ding n aus B, sodass: (x) E(x, m) + P (x) = E(x, n) (In Worten: Für alle x ist die Aussage: „x gehört zu m, und das Prädikat P trifft auf x zu“ aequivalent mit der Aussage: „x ist ein Element von n“.) Aus 1) folgt, dass es nur ein solches Ding n geben kann. Nun baut sich das System der Mathematik schrittweise durch die folgenden Axiome auf. 3) Es gibt mindestens ein Ding in B. 3 ) Ist m ein Ding aus B, und auch a ein Ding aus B, so kann a „als Element zu m hinzugefügt werden“, d. h. es gibt eine Menge, zu der ein Ding dann und nur dann gehört, wenn es entweder zu m gehört oder identisch mit a ist. (Axiom für das endliche Operieren). Id (y, x); „transitiv“, d. h. aus Id (x, y) und Id (y, z) folgt Id (x, z). In der Bezeichnung des logischen Kalküls drücken sich diese drei Eigenschaften durch die Formeln aus: 9 (x)Id (x, x) (x)(y){Id (x, y) → Id (y, x)} (x)(y)(z){Id (x, y) + Id (y, z) → Id (x, z)}.
24
25
358
26
Chapter 2
Lectures on Logic (1920)
Aus dem Axiom 3) folgt (unter Benutzung der Axiome 1) und 2) ) zunächst die Existenz der „Nullmenge“, d. h. der Menge m0 , zu der kein Ding gehört. In der Tat gibt es nach Axiom 3) in B mindestens ein Ding (eine „Menge“) a. Nach dem Axiom der Aussonderung gibt es ferner eine Menge m0 , zu der alle diejenigen und nur diejenigen Elemente x von a gehören, auf welche das Prädikat Id (x, x) (d. h.: „x ist nicht identisch mit x“) zutrifft. Diese Menge m0 enthält gar kein Element, weil das Prädikat Id (x, x) auf kein Ding zutrifft. Und hierdurch ist, (gemäss der Eigenschaft von E(x, y)), m0 eindeutig charakterisiert. Es gibt also in B eine eindeutig bestimmte Menge, welche kein Element enthält. Nun folgt für jedes a aus B die Existenz einer Menge (a), welche a als einziges Element enthält. In der Tat, nach Axiom 3 ) können wir a „als Element zu m0 hinzufügen“; die so gebildete Menge hat a als einziges Element und ist hierdurch eindeutig bestimmt. Durch wiederholte Anwendung von 3 ) ergibt sich, dass Mengen „durch Aufzählung von Elementen gebildet werden können“, d. h. wenn z. B. a, b, c, d Dinge aus B sind, so gibt es eine Menge, welche gerade diese Dinge als einzige Elemente hat. Insbesondere folgt die Existenz der Mengen: m0 (Nullmenge) m1 , die m0 als einziges Element enthält, m2 , die m0 , m1 als einzige Elemente enthält, m3 , die m0 , m1 , m2 als einzige Elemente enthält, m4 , die m0 , m1 , m2 , m3 als einzige Elemente enthält. Auf Grund der bisher aufgestellten Axiome können wir aber noch keinen Schluss ziehen auf die Existenz einer Menge in B, die alle Mengen m0 , m1 , m2 , m3 , m4 , . . . u. s. w. als Elemente enthält. Dies geschieht erst mittels des folgenden Axioms: 4) Es gibt Mengen in B, zu welchen m0 als Element gehört, und welche zugleich mit jedem Element x auch die (durch Hinzufügung von x als Element zu der Menge x entstehende) Menge x + (x) als Element enthalten. In der Sprache des logischen Calcüls: (Ey) E(m0 , y)+(x) E(x, y) → (Ez) E(z, y)+ (u){E(u, z) = E(u, x) × Id (u, x)} . (Ob es verschiedene solche Mengen gibt, wird offen gelassen). Mit Hilfe der Axiome 1), 2) kann man beweisen, dass es unter den Mengen, welche die in 4) verlangte Eigenschaft besitzen, eine und nur eine, a0 , gibt, welche Teilmenge einer jeden solchen Menge ist. (m heisst Teilmenge von n, wenn jedes Element von m auch Element von n ist). Diese Menge a0 hat die Bedeutung der Menge der ganzen Zahlen. Auf Grund des Axioms 4) lässt sich die Zahlentheorie vollständig und sehr einfach begründen, indem man als ganze Zahl ein Ding erklärt, das Element von a0 ist. Dabei ergibt sich das Prinzip der vollständigen Induktion als eine einfache Konsequenz aus den gemachten Annahmen.
5
10
15
20
25
30
35
40
‘Probleme der mathematischen Logik’
5
10
15
5) Für jede Menge m aus B existiert die Menge ihrer Teilmengen, d. h. eine Menge, welche als Elemente alle und nur diejenigen Dinge aus B enthält, welche Teilmengen von m sind. 6) Für jede Menge m aus B existiert die Menge der Elemente von den Elementen von m, die „Vereinigungsmenge von m“. Mit Hilfe dieser beiden Axiome wird die Einführung der reellen Zahlen und der Beweis des Schnittaxioms, mithin der Aufbau der gesamten Analysis ermöglicht. 7) Ist m eine Menge von Mengen, deren je zwei kein Element gemeinsam haben, und ist m, sowie die Elemente von m, verschieden von der Nullmenge, bedeutet ferner t die Menge aller Teilmengen der Vereinigungsmenge von m, so ist diejenige Teilmenge von t, zu welcher die und nur die Mengen gehören, welche aus jeder zugehörigen Menge gerade ein Element enthalten, verschieden von der Nullmenge; d. h. es gibt dann Mengen, welche mit jeder Menge, die zu m gehört, gerade ein Element gemeinsam haben (Axiom der Auswahl ). Dieses Auswahl-Axiom wurde zuerst von Zermelo ausgesprochen und zum Beweise des Wohlordnungssatzes verwendet. (Auch diese drei letzten Axiome lassen sich vollständig in Begriffsschrift formulieren.)
30
27
§ 6. Der Versuch einer Zurückführung der Mathematik auf die Logik; Stellungnahme von Russell und Weyl. — Unentbehrlichkeit der axiomatischen Methode.
20
25
359
Die von Zermelo benutzte axiomatische Methode ist zwar unanfechtbar und unentbehrlich. Es bleibt aber dabei doch die Frage offen, ob die aufgestellten Axiome nicht etwa einen Widerspruch einschliessen. Ferner erhebt sich die Frage, ob und inwieweit | das Axiomensystem aus der Logik ableiten lässt.C Das alte Problem, die gesamte Mathematik auf Logik zurückzuführen, gewinnt durch das Zermelosche Axiomensystem, in welchem die Grundlagen für die gesamte Analysis so übersichtlich zusammengefasst sind, eine starke Anregung und Belebung. Und der Versuch einer Zurückführung auf die Logik scheint besonders deshalb aussichtsvoll, weil zwischen den Mengen, welche ja die Gegenstände in Zermelos Axiomen bilden, und den Prädikaten der Logik ein enger Zusammenhang besteht. Nämlich die Mengen lassen sich auf Prädikate zurückführen.D Added by Hilbert (pencil) in the upper left-hand corner. The addition is not directed to any particular place, but its positioning, together with the fact that the first three sentences of the section have been enclosed in brackets, and also Hilbert’s pencilled addition ‘von hier!’ after ‘lässt.’, make this positioning plausible. Was heisst das nun, die Axiome inhaltlich auf reine Logik zurückführen? D Added in the left-hand margin of p. 28, and not directed to any particular C
28
360
29
Chapter 2
Lectures on Logic (1920)
Diesen Gedanken haben Frege, Russell und Weyl zum Ausgangspunkt genommen bei ihren Untersuchungen über die Grundlagen der Mathematik. Als sachgemäss erscheint uns folgende Auffassung, welche insbesondere von Russell und ungefähr auch von Weyl vertreten wird: Die Aussagen, in denen von Mengen (Klassen, Gesamtheiten) die Rede ist, sind nur Umformungen von PrädikationenE ; nämlich statt z. B. zu sagen: „die Rose ist rot“ sagt man „die Rose gehört zur Menge der roten Dinge“. Und nun wird mit „Menge der roten Dinge“ formal wie mit einem Gegenstande operiert. So entspricht der Menge r der roten Dinge das Prädikat R: „Rot-sein“, und die beiden obigen Sätze schreiben wir so: R(Rose), E(Rose, r), wo R als Funktion mit einer Leerstelle zu betrachten ist. Die Bevorzugung der Mengen gegenüber den Prädikaten in der Mathematik ist deshalb zweckmässig, weil man sich hierdurch von der Mannigfaltigkeit der sachlich gleichbedeutenden Prädikate befreit. So entspricht z. B. den verschiedenen Prädikaten: „kürzeste Verbindungslinie“, „Linie von der Krümmung 0“, „Linie vollkommener Drehungs-Symmetrie in Bezug auf zwei beliebige ihrer Punkte“ eine und dieselbe Gesamtheit: die Menge aller Geraden. Und allgemein entspricht einer beliebigen Menge w eine ganze Mannigfaltigkeit miteinander äquivalenter Prädikate W , für welche die Aussage W (x) der Aussage E(x, w) äquivalent istF . Anstelle des Enthaltenseins des Elementes x in der Menge w tritt das Zutreffen des Prädikates W auf den Gegenstand x. Man könnte daher beim Aufbau der Mathematik anstelle des Bereiches B der Mengen bei Zermelo den Bereich aller entsprechenden Prädikate zugrunde legen. Das hätte jedoch den Nachteil, dass dieser Ausgangsbereich wesentlich komplizierter und vielgestaltiger wäre als der Bereich B bei Zermelo. place in the text: Dinge die unmittelbar da sind und anschauliche Eigenschaften und Tatsachen, die nicht problematischer Natur sind — bilden jetzt den Bereich, der zu Grunde liegt. nicht ein bestimmter unabänderlicher Bereich B, von dem wir Axiome festsetzen. The last part, ‘nicht . . . festsetzen’, is in notably different handwriting, although still clearly Hilbert’s. There is a second remark written by Hilbert in pencil on the reverse of p. 27, in the inner margin left by the image of the reverse of the text of p. 27: Individuenbereich vgl. meine Vorlesung Grundlagen der Math. W. S. 1921/22 (S. 81–84, S. 97–100) S. 82 Over this remark is a pencilled arrow pointing to the addition given above, thus clearly indicating that the two are connected, though whether it is meant to come before or after is not clear. The lecture course Hilbert refers to is Hilbert 1921/22a* , and can be found in Chapter 3. E In the margin to the left of the beginning of this paragraph, and directed to no particular place in the text, Hilbert (pencil) has added: Die El-Beziehung wird durch Praedikate ersetzt. F In the left-hand margin, Hilbert has added in pencil a characterisation of ‘äqui valent’ for predicates: P äquivalent Q: (x) P (x) Q(x)
5
10
15
20
25
‘Probleme der mathematischen Logik’
5
10
15
20
25
30
361
Nun ist es aber gar nicht nötig, dass man in den zugrunde zu legenden Prädikaten-Bereich alle Prädikate überhaupt aufnimmt, sondern man braucht ja von den gleichbedeutenden Prädikaten immer nur mindestens eines. Das genügt. Und in diesem Sinne verfährt auch Russell. Um die Methode der Zurückführung von Mengen auf Prädikate an einem Beispiel zu betrachten, wollen wir uns ein Prädikat konstruieren, das der Menge aller Teilmengen entspricht, d. h. wir wollen den Begriff der „Menge der Teilmengen“ in die Sprache der Prädikate übertragen. Sind m und n zwei beliebige Mengen, p und q 10 ihnen entsprechende Prädikate, so ist die Aussage: „m ist eine Teilmenge von n“ gleichbedeutend mit der folgenden: „aus p folgt q“, oder ausführlicher: „Für jedes x, auf welches p(x) zutrifft, trifft | q(x) zu“, in logischer Symbolik: (x) p(x) → q(x) . Bei festem q kann diese Aussage als eine Aussage P (p) über das Prädikat p betrachtet werden, die eine bestimmte Eigenschaft von p behauptet, dass nämlich aus der Gültigkeit des Prädikats p die Gültigkeit von q folgt, und diese Eigenschaft eines Prädikates p kann als ein Prädikat höherer Stufe (zweiter Stufe, wenn p von erster Stufe angenommen ist) bezeichnet werden. Der Menge aller Teilmengen entspricht also das Prädikatenprädikat P (p)G , welches dann und nur dann auf p zutrifft, wenn p(x) → q(x) für jedes Individuum x gilt. Durch die Konstruktion dieses Prädikates P haben wir das Axiom 5) der Zermeloschen AxiomatikH vom Standpunkt der Prädikaten-Theorie aufgefasst und uns dadurch logisch plausibel gemacht. Nun wollen wir mit dem anderen Zermeloschen Axiom (6) ), welches von der Vereinigungsmenge handelt, ähnlich vorgehen. Hat man eine Menge von Mengen M , deren Elemente die Mengen m, m , . . . sind, so entspricht dieser ein Prädikat von Prädikaten P (p). D. h. die definierenden Prädikate p, p , . . . von m, m , . . . besitzen eine Eigenschaft (genügen einer Bedingung) P . 11 Welche Dinge gehören nun zur Vereinigungsmenge von M ? — Die Elemente der Elemente von M ; d. h. ein Ding a gehört dazu, wenn es einer Menge aus M (als Element) angehört. In die Prädikatensprache übersetzt lautet diese Bedingung: „a besitzt ein Prädikat, welches die Bedingung P erfüllt“, oder: „es gibt ein Prädikat, welches Added in the left-hand margin by Hilbert (pencil), and not directed to an particular place in the text: Praedikaten-Praedikat (bei festem Q) sonst PraedikatenRelation H ‘der Zermeloschen Axiomatik’ has been crossed out and replaced (interlineated) by Hilbert (pencil) with: d. h. die Existenz der Menge aller Teilmengen G
10 Throughout pp. 29–32, the notation has been systematically changed by crossing out ‘p’, ‘p ’, ‘q’ and ‘M ’ and replacing them with ‘P ’, ‘P ’, ‘Q’ and ‘n’ respectively; the firstorder variable ‘a’ has also been replaced by the variable ‘x’. The hand is not definitely identifiable, but the evidence suggests it is that of Hilbert. 11 Here, ‘P ’ has been replaced by ‘T ’; in subsequent paragraphs, ‘P ’ has first been replaced by ‘M ’ and this ‘M ’ afterwards by ‘S’. As before, the hand is not definitely identifiable, but the evidence suggests it is that of Hilbert.
30
362
Chapter 2
Lectures on Logic (1920)
die Bedingung P erfüllt (d.h. auf welches P zutrifft) und welches auf a zutrifft“. In Zeichen der Begriffsschrift: (Ep) p(a) + P (p) .I 31
32
Dieser logische Ausdruck, welcher eine Eigenschaft von a, also ein Prädikat V (a) darstellt, bildet somit ein definierendes Prädikat für die Vereinigungsmenge, welche zu der durch das Prädikaten-Prädikat P (p) definierten Menge von Mengen gehört. Hiermit könnten wir nun ganz zufrieden sein, wenn wir mit der Prädikaten-Theorie nichts anderes bezweckten als eine andere Darstellung des Zermeloschen Axiomensystems. Tatsächlich soll uns doch aber die Ersetzung der Mengen durch Prädikate die Zurückführung des Axiomensystems auf die reine Logik liefern. Unter diesem Gesichtspunkt stellt sich hier eine Schwierigkeit ein. Wir müssen uns nämlich fragen, was es bedeuten soll: „es gibt ein Prädikat p“. In der axiomatischen Mengentheorie bezieht sich das „es gibt“ immer auf den zugrunde gelegten Bereich B. In der Logik können wir zwar auch die Prädikate zu einem Bereich zusammengefasst denken; aber dieser Bereich der Prädikate kann hier nicht als etwas von vornherein Gegebenes betrachtet werden, sondern die Prädikate müssen durch logische Operationen gebildet werden, und durch die Regeln der logischen Konstruktion bestimmt sich erst nachträglich der Prädikaten-Bereich. Hiernach ist ersichtlich, dass bei den Regeln der logischen Konstruktion von Prädikaten die Bezugnahme auf den Prädikaten-Bereich nicht zugelassen werden kann. Denn sonst ergäbe sich ein circulus vitiosus. Nun findet aber eine Bezugnahme auf den Bereich der Prädikate immer dann statt, wenn wir sagen: „es gibt ein Prädikat“. Wir müssen also Verknüpfungen mit (Ep) („es gibt ein Prädikat p“) bei der logischen Konstruktion von Prädikaten vermeiden, wenn wir uns nicht der gleichen Vermengung des konstruktiven Verfahrens | mit dem axiomatischen schuldig machen wollen, wie wir sie bei einer der mengentheoretischen Paradoxien als fehlerhaft erkannt haben. Es ergibt sich somit, dass wir das aufgestellte Prädikat (Ep)(p(a) + P (p)) zur Definition der Vereinigungsmenge nicht verwenden können. Hier liegt also eine grundsätzliche Schwierigkeit vor, und diese wird auch von Russell und von Weyl bemerkt. Beide sehen sich dadurch zu einer Resignation veranlasst. In der Art dieses Verzichts ist aber ihr Standpunkt entgegengesetzt. Russell geht von dem Gedanken aus, dass es genügt, das zur Definition der Vereinigungsmenge unbrauchbare Prädikat durch ein sachlich gleichbedeutendes zu ersetzen, welches nicht dem gleichen Einwande unterliegt. Allerdings vermag er ein solches Prädikat nicht anzugeben, aber er sieht es als ausgemacht an, dass ein solches existiert. In diesem Sinne stellt er sein „Axiom I Added in the lower directly beneath this formula, probably in margin in pencil
Hilbert’s hand: (EP ) P (x) & S(P )
5
10
15
20
25
30
35
40
‘Probleme der mathematischen Logik’
5
10
15
20
25
30
35
40
45
363
der Reduzierbarkeit“ auf, welches ungefähr folgendes besagt: „Zu jedem Prädikat, welches durch (ein- oder mehrmalige) Bezugnahme auf den PrädikatenBereich gebildet ist, gibt es ein sachlich gleichbedeutendes Prädikat, welches keine solche Bezugnahme aufweist.“ Hiermit kehrt aber Russell von der konstruktiven Logik zu dem axiomatischen Standpunkt zurück. Weyl hingegen lässt sich auf eine Annahme wie die Russellsche nicht ein, und da er keine Möglichkeit sieht, die Ersetzbarkeit jenes zur Definition der Vereinigungsmenge unbrauchbaren Prädikates durch ein hierfür geeignetes Prädikat zu beweisen, so lehnt er das Schlussprinzip, welches durch das Axiom von der | Vereinigungsmenge formuliert wird, überhaupt ab. Das Weylsche Verfahren bleibt also einheitlich bei der konstruktiven Methode, es führt aber auch nicht zu einer Begründung der in der Analysis üblichen Schlussweise; es läuft hinaus auf eine Rückkehr zu der Verbots-Politik Kroneckers. So lässt z. B. Weyl den Satz fallen, dass (im Gebiet der reellen Zahlen) jede beschränkte Zahlenmenge eine obere Grenze hat, ebenso auch den Satz dass jede unendliche Menge eine abzählbare Teilmenge besitzt. Das Ziel, die Mengenlehre und damit die gebräuchlichen Methoden der Analysis auf die Logik zurückzuführen, ist heute nicht erreicht und ist vielleicht überhaupt nicht erreichbar. Jedenfalls müssen wir uns klar werden, dass unabhängig von der Entscheidung der Frage, wie weit sich die mathematischen Axiomensysteme auf reine Logik reduzieren lassen, die Bedeutung der axiomatischen Methode feststeht. Die axiomatische Methode ist durch keine andere ersetzbar. Sie ist und bleibt das unserem Geist angemessene, unentbehrliche Hilfsmittel der exakten Forschung in jedem Gebiete; sie ist fruchtbar und logisch unanfechtbar. Um einen bestimmten Zweig der Wissenschaft zu erforschen, sucht man diesen auf eine möglichst geringe Anzahl von möglichst einfachen und anschaulichen Prinzipien zurückzuführen. Diese Prinzipien heissen Axiome. Nur dadurch gewinnt man eine klare Uebersicht über die ganze Disziplin, wie auch die Möglichkeit ihrer weiteren Entwicklung, dass man ihre Axiome sammelt und als solche aufstellt. Das glänzendste Beispiel einer vollendeten Ausgestaltung der axiomatischen Methode bietet das betrachtete Axiomensystem | von Zermelo. Aber auch bei den einzelnen mathematischen Disziplinen (Zahlentheorie, projektive Geometrie, Gruppentheorie usw.) wie auch in den physikalischen Theorieen (Mechanik, Elektrodynamik, kinetische Gastheorie, Strahlungstheorie) werden wir die Bedeutsamkeit und die Tragweite der axiomatischen Methode gewahr. Das Wesen dieser Methode besteht darin, dass man sich über die Voraussetzungen und die Methoden des Schliessens klar wird, die man in einer Wissenschaft gebraucht. Axiomatisch zu verfahren ist also nichts anderes, als mit Bewusstsein zu denken. Obwohl nun die axiomatische Methode sich überall aufs beste bewährt, so sind doch viele gerade unter den hervorragenden Forschern mit ihr unzufrieden und bevorzugen Methoden, welche ich als Kompromisse bezeichnen möchte. Ich denke insbesondere an Brouwer und Weyl. Diese wollen gewisse Axiome
33
34
364
35
36
Chapter 2
Lectures on Logic (1920)
und Begriffsbildungen ein für allemal ausschliessen; sie verzichten dabei auf wesentliche Probleme, Resultate und Schlussweisen. Von Weyl habe ich dies bereits erwähnt, und Brouwers Standpunkt ist ein ganz ähnlicher. So fällt z. B. für ihn das Kontinuumproblem fort, eines der anregendsten und grosszügigsten Probleme der Mathematik. Was aber diese beiden Forscher in ihren Untersuchungen über die Grundlagen der Mathematik an Positivem und Fruchtbarem leisten, das fügt sich der axiomatischen Methode durchaus ein und ist gerade im Sinne dieser Methode. Denn es wird hier untersucht, wie sich ein Teil der Analysis durch ein gewisses engeres System von Voraussetzungen abgrenzen lässt. Natürlich, die Idee der Axiomatik übertrieben würde zu einer Karikatur der Forschung führen: es wäre fruchtlos, jeden unbe|wiesenen Satz als Axiom zu benutzen. In vielen Fällen ist aber ein derartiges axiomatisches Postulieren von noch unbewiesenen Sätzen durchaus am Platze. Es gibt hierfür mannigfache berühmte Beispiele. Ich nenne die Riemannsche Vermutung über die Nullstellen der ζ-Funktion, auf welche Riemann seine Primzahl-Theorie gründete, das Legendresche Postulat von der Existenz unendlich vieler Primzahlen in einer arithmetischen Reihe, auf Grund dessen er zuerst das Reziprozitätsgesetz für die quadratischen Reste bewiesen hat, und ferner die Ergodenhypothese von Boltzmann. Für das Legendresche Postulat hat später Dirichlet einen Beweis geliefert. Dagegen die Riemannsche Vermutung und die Ergodenhypothese sind bis jetzt gar nicht bewiesen. Aber die Wissenschaft kann sich in ihrem Fortschritte dabei nicht aufhalten. Es ist einstweilen gar kein Gedanke daran, die Ergodenhypothese zu beweisen, obwohl sie ein rein mathematischer Satz ist. Trotzdem ist die ganze statistische Mechanik auf sie gegründet. Wir ersehen aus diesen Beispielen, wie das wissenschaftliche Forschen durch die axiomatische Methode an Bewegungsfreiheit gewinnt. Im Gegensatz zu der Methode des Verbietens schafft der axiomatische Gedanke der Forschung freieste Bahn und damit eine erhöhte Fruchtbarkeit. Was dabei zu wünschen übrig bleibt, ist nur, dass man der Widerspruchslosigkeit nicht sicher ist. Hierfür werden wir uns zunächst auf unsere innere Ueberzeugung berufen. Für verschiedene grosse Gebiete (Geometrie, Thermodynamik, Strahlungstheorie) ist es auch bereits gelungen, einen Beweis der Widerspruchslosigkeit ihrer Axiome in dem Sinne zu erbringen, dass man diese Axiome auf | diejenigen der Analysis zurückgeführt hat. Bei der Analysis selbst und auch in dem engeren Gebiet der Zahlentheorie, bildet die Frage der Widerspruchslosigkeit ihrer Axiome ein bisher ungelöstes Problem. Ich möch-
5
10
15
20
25
30
35
‘Probleme der mathematischen Logik’
365
te Ihnen nun für die Zahlentheorie meinen eigenen Versuch zur Lösung dieses alten Problems vorführen.A § 7. Die Hilbertschen Gedanken zum Beweis der Widerspruchslosigkeit der Zahlentheorie. 5
10
15
20
25
30
Um den Nachweis für die Widerspruchslosigkeit der Arithmetik führen zu können, wollen wir erst ihre Axiome aufstellen. Wir führen zunächst folgende Zeichen ein: a) „Einsetzbare Zeichen“: 1, wie auch alle übrigen „Zahlzeichen“, d. h. diejenigen, die aus 1 durch Anhängen von +1 entstehen, wie 1 + 1, (1 + 1) + 1, ((1+1)+1)+1, u. s. w. (Klammern sollen wie üblich zur Zusammenfassung und Trennung angewandt werden.) Ist ein Zeichen einsetzbar, so ist auch jede Abkürzung für dieses Zeichen einsetzbar. b) „=“. Dieses arithmetische „gleich“ muss rein-formal aufgefasst werden und hat nichts mit der logischen Gleichheit zu tun, d. h. weder mit der logischen Aussagen-Aequivalenz „=“, noch mit der Identität Id (x, y). c) „→“. „A → B“ bedeutet in Worten: „aus A folgt B“ (wo A und B zwei beliebige Aussagen sind). d) Buchstaben a, b, c, . . . , die in den Axiomen auftreten werden und für die etwas eingesetzt wird, und zwar: entweder Zahlzeichen: 1, 1 + 1, (1 + 1) + 1, . . . oder andere Buchstaben, oder zusammengesetzte Zeichen, welche aus Buchstaben und Zahlzeichen nach verabredeten Regeln gebildet sind. Die unter a), b), d) angeführten Zeichen sind völlig inhaltslos. Inhalt kommt diesen Zeichen nur als solchen zu, d. h. nur als Zeichen, die wir wiedererkennen, identifizieren und unterscheiden, oder auch einsetzen können. Bezüglich eines solchen Zeichens, wie z. B. 1, müssen wir die Einstellung haben, dass es dasselbe ist, ob ich es mit Kreide auf die Tafel oder mit Tinte auf Papier schreibe, dass es überhaupt von Ort und Zeit und der besonderen Art der Herstellung ganz unabhängig ist. Added by Hilbert (pencil) in the left-hand margin and in the space left before the beginning of § 7, presumably as an alternative to the preceding sentence which has been enclosed in parentheses. Sollen wir nun definitiv verzichten, die Math. zu begründen? War der alte Ruf, den die Math. genoss, dass ihre Behauptungen sicher sind und feststehen, unberechtigt? Giebt es auch nicht einmal mathematische Wahrheiten? Um nichts Geringeres handelt es sich. Nun wir wollen unsere Wissenschaft nicht preisgeben! Aber wo sollen wir anknüpfen angesichts der Paradoxie in Mengenlehre und Logik? Nun die reine Arithmetik wollen wir einmal hernehmen und zusehen, ob wir dort nicht sichere Wahrheiten finden! Vorlesung Grundlagen der Math. W. S. 1921/2 S. 51–66. 12 A
12 The
lecture course referred to is Hilbert 1921/22a* ; these lectures can be found in Chapter 3.
37
366
Chapter 2
Lectures on Logic (1920)
Wenn ich von „demselben“ Zeichen und von „verschiedenen“ Zeichen spreche, so ist dies rein intuitiv aufzufassen, nicht im Sinne einer formalen Beziehung Id (x, y). Wir stellen nun die folgenden Axiome (Grundformeln) auf: 1=1 (a = b) → (a + 1 = b + 1)
5
(a + 1 = b + 1) → (a = b) (a = b) → (a = c) → (b = c) . Hiermit ist noch nicht die vollständige Grundlage für die Zahlentheorie gegeben; sondern es fehlen noch zwei Axiome, nämlich das Induktionsprinzip, und das Axiom: a + 1 = 1. Ausserdem bedarf es noch einer Anweisung, in welcher Weise die Axiome anzuwenden sind, d. h. wir müssen erst definieren, was unter einem „Beweis“ zu verstehen ist. Zunächst soll ein Schluss definiert werden, und zwar durch das folgende Schema:
10
15
A A→B B.
38
Ein Beweis besteht aus Schlüssen, wobei jedesmal die betreffenden Formeln A und A → B jede entweder direkt durch Einsetzung aus einer Grundformel entsteht (bezw. mit der Formel 1 = 1 überein|stimmt) oder aber mit der Endformel eines vorausgegangenen Schlusses übereinstimmt. Noch eine weitere Forderung soll an die Beweise gestellt werden: Betrachtet man einen Beweis in Hinsicht auf eine bestimmte, konkret aufweisbare Eigenschaft, welche er besitzt, so kann es sein, dass, nach Wegstreichung einiger Formeln in diesem Beweise noch immer ein Beweis (in dem vorhin angegebenen Sinne) übrig bleibt, welcher auch noch jene Eigenschaft besitzt. In diesem Falle wollen wir sagen, dass der Beweis sich inbezug auf die betreffende Eigenschaft kürzen lässt. Wir wollen nun bloss solche Beweise zulassen, die in Bezug auf jede Eigenschaft, bezüglich deren sie sich überhaupt kürzen lassen, dermassen gekürzt werden können, dass der übrig bleibende Beweis nicht weiter inbezug auf die Eigenschaft kürzbar ist. Eine Formel soll „richtig“ heissen, wenn sie: entweder mit 1 = 1 identisch ist, oder durch Einsetzen aus einer Grundformel entsteht, oder sich als Endformel eines Beweises ergibt. Beispiel: 1 + 1 = 1 + 1 ist richtig. Nämlich: 1=1 (1 = 1) → (1 + 1 = 1 + 1) 1+1=1+1
20
25
30
35
40
(Anwendung von (a = b) → (a + 1 = b + 1) )
‘Probleme der mathematischen Logik’
5
10
15
20
25
30
35
40
367
ist ein Beweis dieser Formel. Wir nähern uns nun dem grossen Ziel, das wir ins Auge gefasst haben: die Widerspruchsfreiheit der Arithmetik zu beweisen, um dadurch die Mathematik wieder zu einer strengen Wissenschaft zu machen und ihren alten Ruf als Muster von Klarheit und Sicherheit wiederherzustellen. Die üblichen Axiome der Zahlentheorie sind: 1) die genannten vier Axiome. 2) a + 1 = 1. 3) das Induktionsaxiom. Wir wollen zuerst zeigen, dass die unter 1) zusammengefassten Axiome dem Axiom 2) nicht widersprechen. Ein Widerspruch innerhalb des Systems 1) der ersten vier Axiome kann nie entstehen, schon darum, weil diese gar keine Negation enthalten. Ein Widerspruch zwischen 1) und 2) kann nur dadurch zustande kommen, dass die Formel a+1 = 1 oder eine aus dieser durch Einsetzen entstehende Formel einer aus den Axiomen 1) beweisbaren („richtigen“) Formel widerspricht. Wir haben also diese Möglichkeit zu widerlegen, d. h. wir müssen den Nachweis führen, dass durch die Anwendung der Axiome 1) niemals eine Formel von der Gestalt a + 1 = 1 als Endformel eines Beweises herauskommen kann. Somit sehen wir uns veranlasst, die Beweise als solche zum Gegenstand der Untersuchung zu machen; wir werden zu einer Art von Beweistheorie gedrängt, welche mit den Beweisen selbst als Gegenständen operiert. Für die Denkweise der gewöhnlichen Zahlentheorie sind die Zahlen das gegenständlich-Aufweisbare, und die Beweise der Sätze über die Zahlen fallen schon in das gedankliche Gebiet. Bei unserer Untersuchung ist der Beweis selbst etwas Aufweisbares, und durch das Denken über den Beweis kommen wir zur Lösung unseres Problems. Wie der Physiker seinen Apparat, der Astronom seinen Standort untersucht, wie der Philosoph Vernunft-Kritik übt, so braucht der Mathematiker diese Beweistheorie, um jeden mathema|tischen Satz durch eine Beweis-Kritik sicherstellen zu können. Um nun zu zeigen, dass in der Tat eine Formel von der Form a + 1 = 1 nicht aus den Axiomen 1) erhalten werden kann, beweisen wir folgende Sätze. 1) Eine richtige Formel kann höchstens 2mal das Zeichen → enthalten. Denn eine Formel mit mehr als 2 Zeichen → kommt unter den Grundformeln nicht vor, und es könnte also eine solche Formel nur dann eine richtige Formel sein, wenn sie die Endformel eines Beweises bildet. Es müsste also einen Beweis geben von der Eigenschaft, dass seine Endformel mehr als zweimal das Zeichen → enthält; und gemäss der Anforderung, die wir an die Beweise gestellt haben, müsste es auch in Bezug auf jene Eigenschaft einen nicht kürzbaren Beweis geben. Sei nun B die Endformel eines solchen Beweises, und es werde der Schluss, mit welchem der Beweis endet, dargestellt durch das
39
40
368
Chapter 2
Lectures on Logic (1920)
Schema: A A→B
41
B. Hierin ist A → B eine Formel, welche das Zeichen → mindestens einmal öfter als B, also gewiss mehr als zweimal enthält; diese kann also weder eine Grundformel noch durch Einsetzen daraus erhalten sein, sie muss daher mit der Endformel eines innerhalb des Beweises vorkommenden Schlusses übereinstimmen. Dies würde aber bedeuten, dass der Beweis inbezug auf die betrachtete Eigenschaft kürzbar wäre; wir kämen also auf einen Widerspruch. 2) Eine Formel (A → B) → C kann nicht richtig sein. Denn erstens, eine Grundformel von dieser Art gibt es nicht, und ebensowenig kann aus einer Grundformel durch Einsetzen eine solche Formel entstehen. Aber auch durch einen Beweis kann diese Formel nicht abgeleitet werden. Denn das Ende eines solchen Beweises | wäre ein Schluss von der Form D D → (A → B) → C (A → B) → C, und hierin müsste D → (A → B) → C eine richtige Formel sein. Wir hätten also eine richtige Formel, in welcher das Zeichen → mehr als zweimal vorkommt, im Widerspruch zu dem vorigen Satze. 3) Eine richtige Formel, in der das Zeichen → nicht auftritt, hat die Gestalt: a = a, wo auf beiden Seiten dasselbe einsetzbare Zeichen steht. Denn entweder ist unsere Formel die Grundformel 1 = 1, oder sie ist eine der übrigen Grundformeln, bezw. wird aus einer solchen durch Einsetzen erhalten, oder aber sie ist die Endformel eines Schlusses. Im ersten Falle braucht man nichts zu beweisen. Der zweite Fall kommt nicht in Betracht; denn in der zweiten, dritten und vierten Grundformel kommt das Zeichen → vor, und dies wird auch durch kein Einsetzen beseitigt. Es genügt also zu zeigen, dass eine Formel B, in der das Zeichen → nicht auftritt, und die eine von a = a verschiedene Form hat, nicht durch einen Beweis abgeleitet werden kann. Angenommen, das wäre der Fall. Dann müsste es unter den Beweisen, deren Endformel die Eigenschaften der Formel B besitzt, einen nicht mehr kürzbaren geben. Nehmen wir einen solchen Beweis und nennen seine Endformel wiederum B, so stellt sich das Ende dieses Be-
5
10
15
42
weises dar durch ein Schluss-Schema:
A A→B. B
20
25
30
35
| In A darf nun das „→ Zeichen“
nicht mehr als einmal vorkommen; denn anderenfalls käme es in A → B mindestens dreimal vor, wir hätten also eine richtige Formel mit mehr als zwei Zeichen →, entgegen dem Satz 1). Wäre ferner A von der Form C → D, dann gäbe es eine richtige Formel von der Form (C → D) → B, entgegen dem Satz 2). Also enthält A gar kein Zeichen →. Daraus folgt aber, dass A von der Form u = u sein muss, weil sonst der Beweis inbezug auf die betrachtete Eigenschaft der Endformel kürzbar wäre.
40
‘Probleme der mathematischen Logik’
5
369
Somit ist A → B von der Form (u = u) → B, und dies muss daher eine richtige Formel sein. Wir zeigen nun zunächst, dass diese Formel keine Grundformel sein noch auch durch Einsetzen aus einer solchen entstehen kann. Hierfür käme nämlich nur die zweite oder dritte Grundformel in Betracht (da ja B nicht das Zeichen → enthält), und es müsste sich also (u = u → B) in einer der beiden Formen (a = b) → (a + 1 = b + 1) (a + 1 = b + 1) → (a = b)
10
darstellen; das wäre aber nur möglich, wenn B die Form v = v hätte, was unserer Annahme widerspricht. Es bleibt also nur noch die Möglichkeit, dass die Formel (u = u) → B als Endformel eines Beweises erhalten wird, dessen Ende durch das Schema
15
20
25
30
35
40
A
A → (u = u) → B
(u = u) → B dargestellt wird. Hier kann nun A → (u = u) → B keine Endformel eines Schlusses sein, weil sonst in einer der Prämissen mehr als zwei Zeichen → auftreten würden. Also muss | A → (u = u) → B durch Einsetzen aus einer Grundformel erhalten werden, und zwar kann dies nur die letzte sein, weil keine der andern zwei Zeichen → enthält. Demnach hat die Formel A → (u = u) → B die Gestalt (u = b) → (u = u) → (b = u) . A muss also lauten: u = b, und da der Beweis mit Bezug auf die betrachtete Eigenschaft der Endformel nicht kürzbar sein soll, so muss das Zeichen b mit dem Zeichen u übereinstimmen. Also muss B die Form u = u haben. Unsere Annahme führt uns somit auf einen Widerspruch. Aus dem bewiesenen Satz 3) folgt nun, dass eine Formel von der Gestalt a + 1 = 1 keine richtige Formel sein kann; denn sie enthält ja weder das Zeichen →, noch ist sie von der Form u = u. Es kann somit aus den vier Grundformeln (den Axiomen 1) ) kein Widerspruch gegen das Axiom 2) abgeleitet werden. Nun bleibt noch zu zeigen, dass auch durch das Induktionsprinzip kein Widerspruch zustande kommt, dass also auch bei der Anwendung des Induktionsprinzips keine Formel a + 1 = 1 beweisbar wird. Den Gedankengang dieses Nachweises will ich hier nur andeuten. Wir führen zunächst ein neues Zeichen Z(a) ein, wo anstelle von a irgend ein einsetzbares Zeichen stehen kann, während das Zeichen Z selbst nicht einsetzbar sein soll. Zur Charakterisierung dieses Zeichens dienen die Axiome Z(1) und Z(a) → Z(a + 1), welche zu den Grundformeln hinzuzunehmen sind. Man sieht ohne weiteres, dass durch diese Axiome keine neuen Gleichungen bewiesen werden können.
43
370 44
Chapter 2
Lectures on Logic (1920)
Andrerseits ist ersichtlich, dass für ein | Zahlzeichen n ( — den Buchstaben n brauche ich hier nur zur Mitteilung — ) die Formel Z(n) mit Hülfe der beiden Axiome beweisbar ist, und man kann daher die Formel Z(a) durch die Aussage „a ist ein Zahlzeichen“ interpretieren. Unter Anwendung des neuen Zeichens lässt sich nun das Induktionsprinzip so formulieren: Es sei F (a) eine Formel, in welcher a vorkommt, ferner seien
5
F (1) und F (a) → F (a + 1) richtige Formeln; dann ist Z(a) → F (a) eine richtige Formel. Dieses Axiom leistet in der Tat dasselbe wie das übliche Prinzip der vollständigen Induktion; denn für ein Zahlzeichen n ist Z(n) beweisbar, und man gelangt daher durch die Formel Z(n) → F (n) zu der Formel F (n). Der Nachweis der Widerspruchslosigkeit für das aufgestellte Induktionsaxiom geschieht nun, indem wir zeigen, dass man mit Hülfe dieses Axioms und der beiden Axiome für Z keine Gleichung beweisen kann, die nicht schon aus den vier Grundformeln beweisbar ist. Nämlich die Anwendung des Induktionsaxioms kann nur darin bestehen, dass von zwei Formeln
10
15
F (1) und F (a) → F (a + 1), die als richtig feststehen, zu Z(a) → F (a) übergegangen, dann anstelle von a ein Zeichen u eingesetzt wird, für welches Z(u) bereits erwiesen ist, und nun durch den Schluss
20
Z(u) Z(u) → F (u) F (u) 45
die Formel F (u) abgeleitet wird. Das Induktionsaxiom liefert hier | also den Uebergang von der Formel Z(u) zu F (u). Dieser Uebergang ist aber nicht nötig. Denn da das Zeichen Z durch nichts anderes als die beiden Formeln Z(1),
25
Z(a) → Z(a + 1)
gekennzeichnet ist und genau dieselben Formeln für F als richtig feststehen sollen, so entsteht aus dem Beweis von Z(u), wenn man darin überall das Zeichen Z durch F ersetzt, ein direkter Beweis von F (u). Durch diese Ueberlegung wird nicht nur die Vereinbarkeit des Induktionsaxioms mit den andern Axiomen dargetan, sondern es wird in gewissem Sinne ein Beweis für dieses Axiom erbracht, indem sich zeigt, dass die Anwendung des Axioms auf keine neuen Gleichungen führt, vielmehr nur die Beweise abkürzt. Hiermit sind bereits alle üblichen Axiome der Zahlentheorie eingeführt und in Hinsicht auf die Frage der Widerspruchslosigkeit untersucht. Gleichwohl sind mit dem bisherigen nur die allerersten Schritte zur strengen Begründung der Zahlentheorie getan. Denn nun müssen erst die verschiedenen Rechen-Operationen, vor allem die Addition und Multiplikation, eingeführt werden; an diese schliessen sich die weiteren Begriffsbildungen (die Beziehung a < b, der Begriff des grössten gemeinsamen Teilers usw.), und ferner müs-
30
35
40
‘Probleme der mathematischen Logik’
371
sen die Formen des Schliessens so erweitert werden, dass sie zum Beweise der zahlentheoretischen Sätze ausreichen. Die Einführung der Addition und Multiplikation geschieht durch die Gleichungen 5
a + (b + 1) = (a + b) + 1 a·1 =a a · (b + 1) = a · b + a,
10
15
welche man als Definitions-Gleichungen von „Abkürzungen“ betrachten kann. Durch jede Einführung eines neuen Zeichens oder eines neuen Begriffs werden die Möglichkeiten des Beweisens modifiziert, und es bedarf daher jedesmal einer neuen Nachprüfung der Widerspruchslosigkeit, d. h. man muss jedesmal wieder den Nachweis führen, dass nicht etwa durch die Anwendung des neuen Begriffes (bezw. Zeichens) eine Formel a + 1 = a bewiesen werden kann. Hiermit sind die Richtlinien zu einem vollständigen Beweise für die Widerspruchslosigkeit der Zahlentheorie gegeben, dessen Ausführung freilich noch eine grosse und schwierige Aufgabe darstellt. —
46
372
Chapter 2
Lectures on Logic (1920)
Textual Notes 343.1: 344.3: 344.6: 345.2: 345.4:
345.21–22:
345.29:
345.42:
346.3: 347.7:
347.14: 347.21:
350.3: 352.18: 353.13:
355.24–25: 355.32:
356.8: 356n: 357.1:
Einleitung.] Underlined twice. Richardsche] Richard’sche Die] In the left-hand margin written in pencil alongside the beginning of the paragraph is: m] ‘m’ has been crossed out in pencil and ‘a’ added directly above. m + 1-te] ‘m’ has been crossed out in pencil and ‘a’ added directly above; parentheses have also been added in pencil around ‘m + 1’, which has become ‘a + 1’. sieben und zwanzig . . . bis sieben und zwanzig hoch fünfhundert] Hilbert (pencil) has enclosed both occurrences of ‘sieben und zwanzig’ in parentheses and written (interlineated) ‘hundert’ directly above. All four parentheses and the two instances of ‘hundert’ have subsequently been crossed out in pencil. . . . besteht] In the left-hand margin against the end of this paragraph is an ‘end selection’ sign (a ‘⊥’) written in pencil. There appears to be no corresponding ‘begin selection’ sign. . . . vor. Diese . . . ] Initially there was a paragraph break after ‘vor.’. However, a line carefully drawn in ink runs from ‘vor.’ to ‘Diese’ on the line below indicating that the paragraph is to be continued. Russellschen] Russelschen gehört.] ‘gehört’, interlineated and written in ink block letters to mimic typing, has replaced the original typed ‘(mitgerechnet) zugezählt werden muss’, which has been crossed through in ink with a ruled line. )] ‘W ’ is written in pencil above ‘f (N )’ and the following two f (N ’ in what is possibly Hilbert’s hand. separate ‘N Die . . . ] Originally, there was no paragraph break at ‘Die . . . ’, but a square bracket has been added by hand in ink before ‘Die’, presumably to indicate one. § 3. . . . Fassung.] Enclosed in parentheses, pencil. Die] New paragraph indentation added.. Nun sehen . . . ] In the margin to the left of the start of this paragraph is a sign (like a ‘ ’) indicating the beginning of a selection of text. There appears to be no corresponding ‘end selection’ mark; the next mark on p. 22 begins a selection. Durch . . . verstärkt.] Enclosed in pencilled parentheses. Nach . . . ] In the margin to the left of this new paragraph in pencil there is a ‘begin selection’ mark, like a ‘ ’; the corresponding ‘end selection’ mark appears lower down p. 22. Wir] A left parentheses has been added in pencil before ‘Wir’; the corresponding right parenthesis is missing. . . . ist.] An ‘end selection’ mark (a ‘⊥’) has been added in pencil in the margin to the left of the newly added sentence. E(x, y)] E(x, y) The typescript uses here, in one further instance on this page and four on p. 24, the ordinary capital ‘E’ on the typewriter keyboard for the element relation. However, beginning on p. 25, instead of this, place has been left for the handwritten addition of a
Textual Notes
373
script or Sütterlin ‘E’, no doubt to avoid confusion with the existential quantifier, also written with the typewriter ‘E’. On grounds of consistency, the Editors have begun the replacement here, although instead of script ‘E’, the standard printed form Fraktur ‘E’ (thus ‘E’) is used. 357.14: E] An ‘l’ appears to have been inserted in pencil after the ‘E’, changed here by the Editors to ‘E’. 357.16–17: Von Id gelten die bekannten Eigenschaften.] Enclosed in parentheses by Hilbert (pencil). 357.32: auch a ein Ding] Substituted by Bernays for: a ein beliebiges Element 357n: Id (x,y)+Id (y,z)] The ‘+’ has been enclosed in parentheses and an ‘&’ added below it. 358.2: m0 ] m Id (x, x)] J (x, x) 358.6: Id (x, x)] Id (x, x) 358.7: 358.19: m0 (Nullmenge) . . . ] A mark (like a ‘ ’) to signal the beginning of a selection of text has been placed in the margin to the left of ‘m0 (Nullmenge)’. A corresponding ‘end selection’ mark is found towards the end of p. 27. 358.33: ×Id (u, x)] A ‘∨’ has been interlineated in pencil above the ‘×’. 358.37: (m heisst . . . ] In the text, a new paragraph begins here. 359.19: . . . formulieren.)] An ‘end selection’ mark (like a ⊥) has been added in pencil in the left margin. 359.23–27: Die . . . lässt.] Enclosed in pencilled parentheses. Following the closing parenthesis, Hilbert (pencil) has added: ‘von hier!’. 360.1: Russell] Russel 360.6–12: „die Rose ist . . . ist.] Throughout this passage Hilbert (pencil), has substituted ‘weiss’ for ‘rot’ and the corresponding letters ‘w’, ‘W ’ for ‘r’, ‘R’. He has changed the expression ‘E(Rose, r)’ to ‘El(r, w)’, enclosed the latter in parentheses and crossed out with an undulating line ‘wo . . . betrachten ist.’ All the changes are in pencil. 360.21: äquivalenter] Underlined by Hilbert (pencil). 360.22: E(x, w)] Hilbert (pencil) has changed ‘E’ to ‘El’. 360.24–28: Man . . . Zermelo.] Enclosed in pencilled parentheses. 361.1–4: Nun . . . Russell.] Enlosed in pencilled parentheses. 361.13: P (p)] Above ‘P (p)’, ‘T (P, Q)’ has been added in pencil, probably by Hilbert. 361.14: werden] Above ‘werden’, ‘T (P )’ has been added in pencil, probably by Hilbert. 361.16–17: und . . . werden.] Enclosed in pencilled parentheses. 361.24: Zermeloschen Axiom (6) )] ‘Zermeloschen’ has been crossed out (pencil), and ‘(6) )’ has been enclosed in pencilled parentheses. 363.43–364.10:Obwohl . . . lässt.] Enclosed in parentheses by Hilbert (pencil). 364.31–32: Widerspruchslosigkeit] Hilbert (pencil) has changed ‘Widerspruchslosigkeit’ to ‘Widerspruchsfreiheit’. 364.38: Widerspruchslosigkeit] Hilbert (pencil) has changed ‘Widerspruchslosigkeit’ to ‘Widerspruchsfreiheit’. 365n: unberechtigt?] unberechtigt. 366.20: Grundformel] Replacement by Hilbert (pencil): Axiom
374
Chapter 2
371.14–15:
Lectures on Logic (1920)
Widerspruchslosigkeit] Hilbert (pencil) has changed ‘Widerspruchslosigkeit’ to ‘Widerspruchsfreiheit’.
Description of the Text
375
Description of the Text Collection: Georg-August Universität Göttingen, Mathematisches Institut, Inv. Nr. 16205z. Size: Cover size approximately 22.3 × 28.3 cm; page size approximately 21.8 × 27.5 cm. Cover Annotations: The outside of the cover bears no annotation or inscription. At the top left-hand corner of the inside of the front cover is written ‘91’ in pencil, presumably an older catalogue number. The inside back cover bears ‘16205z’ written in the top right-hand corner in black ink. Composition: 4 signatures, consisting of 10 to 14 pages each. A loose sheet of paper (21.0 × 28.0 cm.), a proof-sheet, has been placed inside the front cover, and this has pasted onto it a smaller piece of paper, the approximate size of which is 13.0 × 20.0 cm. Both pieces of paper bear comments and additions in pencil by Hilbert, described below. Page 23 of the typescript has pasted onto the left-hand margin a handwritten piece of paper containing (in Bernays’s hand) some carefully and neatly written text which is to be set at the beginning of an existing, typed footnote. Pagination: The front end page, title page, and the page with the Inhaltsübersicht are unnumbered. The text itself is numbered continuously from 1 to 46, the numbers being centred in the upper margin, and written as ‘–1–’ etc. Original Title: On the unnumbered title page is typed: ‘PROBLEME DER MATHEMATISCHEN // LOGIK. // Vorlesung // von // Prof. Hilbert. // Ausgearbeitet von N. Schönfinkel // und P. Bernays. // Sommer-Semester 1920’. In the top right-hand corner, as well as in the top right-hand corner of the page inside the cover, is written in pencil in large characters ‘1920’. The hand is the same in both instances. Text: The text is typed on thin pergament paper. Added in hand in black ink are corrections of typographical errors, small alterations and textual additions, many of which involve mathematical symbols and formulas, usually written in spaces left blank for their addition. As with the ‘Logik-Kalkül’ lectures from the truncated Winter Semester of 1920, the textual supplementation is often written in block letters to imitate the typed characters, and here the hand is therefore not identifiable. Where the hand is identifiable, it is that of Bernays. In the Inhaltsübersicht, the page numbers are typed. The text is divided into two parts, with seven sections in all, numbered continuously from 1–7, §§ 1–3 being in Part I, and §§ 4–7 in Part II. The headings for both parts and for the sections in Part I are in the text itself (underlined with a broken line), but not those for the sections in Part II (§§ 4–7). These have been added here. There are also many comments and alterations by Hilbert in pencil; these are mostly written in the margins (pp. 21, 28, where there are three interventions, pp. 29, 30, where there are two, and p. 36). However, comments are written opposite pp. 11 and 28, thus are found on the reverse of the preceding pages, pp. 10 and 27 respectively. There is no evidence to date these additions, but many are clearly from later than 1920; for instance, several refer to page numbers of the Ausarbeitung of Hilbert’s lectures from the Winter Semester of 1921/22. Hilbert also made changes on the text itself, in most cases changes of terminology, notation or formulation, not changes of substance. In addition to this, as was the case with the ‘Logik-Kalkül’ lectures, there are also a few, less carefully executed markings and corrections in pencil, both in the margin and on the text itself. Some of these are changes
376
Chapter 2
Lectures on Logic (1920)
of notation, or striking through of text, but some of them are marginal pencil markings meant to begin and end selections of text, or pencilled parentheses put round text in the main body itself. There are nowhere near as many of these markings as there are for the earlier ‘Logik-Kalkül’ lectures, and, as with those, it is unclear when or by whom these text selections were effected, or what purposes they were meant to serve. Again, it is plausible to assume that Hilbert was responsible for them since (i) the selecting and/or bracketing off of text was a common practice of Hilbert’s, both in Ausarbeitungen and in his own lecture notes, and (ii) in some cases the marginal additions can be read as replacement for text that has been bracketed off or struck out. Nevertheless, it is simply not possible to say with certainty that these marks stem from Hilbert. As with the ‘Logik-Kalkül’ lectures, those handwritten corrections which clearly adjust the text as it was being composed, or shortly after its completion, have for the most part been incorporated silently into the text presented here. Following usual practice, the additions to, or comments on, the text have not been incorporated, but have been noted on the relevant pages. We have identified the author of these only when the identity seems beyond doubt. The appearance of markings intended to select text have been recorded in the Textual Notes. It is not clear whether the typescript is the original or a carbon copy. The sharpness of the typed characters is variable, and the typing has not made severe indentations in the paper. All the sheets of paper used are somewhat thin, though some thinner than others, and some lighter in appearance than others (e. g., the first two pages, and the pages after p. 31). But if other copies did exist, this was clearly the main one, since the careful, inked corrections have been made here, and in addition it carries Bernays’s neat, handwritten addition to the footnote on p. 23 carefully pasted to the margin. The extra sheet of paper mentioned above is a proof-sheet (labeled ‘721 Cauer 36’) for what was eventually published on pp. 124–125 of Cauer 1931 . (See also the ‘Note on the Text’ in the Introduction to the Undated Draft later in this Chapter, below p. 394.) Cauer’s paper was received by the Mathematische Annalen on 16 September 1930, though, according to a note at the beginning, it was shortened from an earlier and longer version received in March 1928. (Cauer was an Assistent in Göttingen from 1927–1930, receiving the venia legendi in 1928. He worked on pure mathematics, mathematical physics and the mathematical and technical problems of electronic calculating machines.) Hilbert has written in pencil on the reverse of this sheet, and also on the smaller piece pasted onto it; this was also apparently taken from a printed page, possibly also a proof-sheet, though it cannot be identified. The loose sheet of paper can thus be dated to between 1928 and 1930, and Hilbert’s remarks must therefore date from this period or later. The page itself carries two large, handwritten headings: one is ‘Anfang’, written in Hilbert’s hand and centred; the other is ‘1920’ written in the top right-hand corner. ‘Anfang’ has been crossed through several times, and the ‘1920’ is in exactly the same hand as the two instances of ‘1920’ written on the inside cover of the bound lecture notes and the title page. The hand could be Hilbert’s, though the date on the loose sheet was certainly written much later; perhaps all three instances of ‘1920’ were added by Hilbert or someone else in the course of a later organization of Hilbert’s manuscripts. Two single numbers are also written on the page in blue pencil, the figure ‘1’ in the top right-hand corner of the full page, and the figure ‘5’ in the top right of the part which has
Description of the Text
377
been pasted on. It is possible that Hilbert had written at least five pages of notes, cut out a section from p. 5, and pasted it onto the first page, after which the ‘1’ was crossed out. However, this is mere conjecture. The remarks divide into two separate sections. The first reads: Die letzten Jahrzehnte stellen eine Blütheperiode der Wissenschaft dar, wie sie in der ganzen Weltgesch.ichte noch nie dagewesen ist. Diese Tatsache lehrt insertion: an einem sehr drastischen selbsterlebten Fall, wie unbedeutend und nebensächlich solche Ereignisse wie Krieg u. Revolution sind, beurteilt nach dem Fortschritt der Menschheit im Wissen und Können.
The insertion (directed to the place shown by an insertion sign) was written under the passage just given; whether there was originally more is hard to say, since the rest of the page is pasted over; however, no further text is visible under the sheet which has been pasted on. Directly beneath the insertion is the word ‘Anfang’, written upside down and underlined. The second section is the text which has been pasted on. It reads: wie es im math. Fach stets üblich war u. bleiben wird. deshalb möge man mich nicht missverstehen. Später will ich auch der Philosophie Rede stehen. Wer an der Erduldung selbstgeschaffener Leiden keine Freude hat. Math. ein here ‘einziges’ has been crossed out Wunderwerk added: einzigster Art, der Stolz des menschlichen Geistes. Daher Interesse u. Bedeutung der Grundlagenforschung. Seit Kronecker schwelt es — und die heutigen Math. sind nicht so widerstandskräftig, so dass ein Brand leicht ausbrechen könnte, der etc.
Hilbert had originally written ‘schwälgt’, but then altered it to ‘schwelt’. The addition noted here was written above the line.
378
Chapter 2
Lectures on Logic (1920)
Introduction to the Undated Draft This manuscript is in Hilbert’s own hand. On eleven large pages Hilbert examines a new technique for proving the consistency of quantifier-free fragments of number theory. He clearly wrote the manuscript between the end of the Summer Semester 1920 and the beginning of the Winter Semester 1921/22. Indeed, there are excellent reasons to think that it was written before talks he gave in Copenhagen (15 and 17 March 1921) and Hamburg (in the early summer of 1921). The publication ‘Neubegründung der Mathematik’ (Hilbert 1922b) was based on these talks, and the results reported here are intermediate between those from the notes for the lectures held in the Summer Semester of 1920 (‘Probleme der mathematischen Logik’, Hilbert 1920* , reproduced in this Chapter) and those from the ‘Neubegründung’. Thus, the manuscript is of systematic importance for understanding the development of proof-theoretic techniques. It is also historically significant, since it shows Hilbert pushing forward the novel investigations of his proof theory in crucial ways.
1. Background. In the lecture notes for ‘Probleme der mathematischen Logik’, Hilbert reproved the consistency result presented to the 1904 International Congress of Mathematicians in Heidelberg; cf. Hilbert 1905b and section 1 of the Introduction to Chapter 3 below. Hilbert considered the Heidelberg proof as the first direct consistency argument. The considerations in the Summer Semester of 1920 take up those investigations for the first time since 1904; they are now (on p. 39) characterized as proof-theoretic. The basic and purely equational system in these lectures has the axioms 1. 1 = 1, 2. a = b → (a + 1 = b + 1), 3. (a + 1 = b + 1) → a = b, 4. a = b → (a = c → b = c), 5. a + 1 = 1. (See pp. 37 and 39 of the lecture notes, pp. 366 and 367 above.) Modus ponens is the sole inference rule, and a substitution rule allows the replacement of variables in axioms.1 For the system of axioms 1.–4. Hilbert shows that any provable equation must be of the form t = t; thus the full system is consistent since a + 1 = 1 is not derivable from 1.–4. A crucial lemma in Hilbert’s proof states that one cannot derive formulas with more than two ‘→’-signs. 1 Hilbert
states explicitly that substitution is allowed in axioms only. However, discussing applications of the induction schema, he later talks about substituting a sign ‘u’ for the variable ‘a’ in theorems of the form Z(a) → F (a); see the lecture notes, pp. 44–45, above p. 370f.
Introduction to the Undated Draft
379
At the very end of the notes, Hilbert indicates a way of strengthening the system and in this way making it more adequate for the formalization of mathematical practice. The system is to be expanded by the introduction of (i ) a predicate letter ‘Z’, indicating the sort ‘Zahlzeichen’, with the accompanying axioms Z(1) and Z(a) → Z(a + 1); (ii ) the induction rule in the form: for any formula F (a), infer the formula Z(a) → F (a) from F (1) and F (a) → F (a+1); and (iii) some additional equations for arithmetic operations. For example, the recursion equations for addition and multiplication are introduced: 6. a + (b + 1) = (a + b) + 1, 7. a · 1 = a, 8. a · (b + 1) = a · b + a.2 As Hilbert points out (notes, p. 46, above p. 371), whenever axioms for a new sign or concept are introduced that modify the possibilities for giving proofs, the consistency of the resulting system has to be checked. Hilbert views the problem of establishing the consistency of these successively stronger formal frameworks as a significant and difficult task. Nevertheless, he points out that the ‘guidelines for a complete proof of the consistency of number theory have thus been given’ (p. 46 of the notes, p. 371 above). Hilbert took on this difficult task during the break following the Summer Semester of 1920 and in the following Winter Semester. Hilbert reported in a postcard to Bernays of 22 October 1920 that his current work in proof theory was progressing quite well.3 Moreover, he gave two talks in Göttingen on 21 and 22 February 1921 under the title ‘Eine neue Grundlegung des Zahlbegriffs’. These considerations he presented, we assume, in two lectures in Copenhagen (entitled ‘Axiomenlehre und Widerspruchsfreiheit’) and then Hamburg, the contents of which form the basis of the paper ‘Neubegründung der Mathematik’ published in 1922. When commenting on Hilbert’s first foundational paper of the 1920s, the Editors of his Gesammelte Abhandlungen describe it as reflecting a transition between two different stages in the development of proof theory.4 The manuscript considered here illuminates this transition in a way that is very significant for proof theory. Hilbert tackles the consistency problem for extensions of the sort described above, but he now includes also four new inference rules, and these new rules make it impossible to employ the 2 The
axioms 1 to 5 just formulate equality principles together with the characteristic properties of 1 and the successor operation, whereas the additional axioms express properties of the arithmetical operations and a form of the induction principle. This significant separation would have been clearer if Hilbert had written the successor operation, not in the form ‘. . . + 1’, but rather (as Dedekind did) as ‘ϕ(. . . )’. Then there would have been a meaningful base equation for addition, namely, a + 1 = ϕ(a). 3 Hilbert says that his Beweistheorie ‘beständig ganz gute Fortschritte macht’; see Sieg 1999 , p. 35. For more on the context of the remark, and for the remainder of the contents of the postcard, see Sieg 1999 , pp. 34–37. 4 See Hilbert 1935 , p. 168, n. 2. It seems plausible to assume that Bernays was responsible for the remark in this note. See p. 19, n. 33 above and also the further references given there.
380
Chapter 2
Lectures on Logic (1920)
proof-theoretic techniques used in the lecture notes for the Summer Semester of 1920, since there is no longer a fixed bound on the length of formulas occurring in proofs. An ingenious way of transforming proofs is introduced, but Hilbert’s novel considerations also contain oversights and mistakes. In the ‘Neubegründung’, the results that go beyond the very basic theory treated in the notes for the Summer Semester of 1920 are stated without proofs. At the end of the paper, Hilbert writes: To conclude this first report, I would like to remark that P. Bernays has been of the greatest assistance to me in working out the ideas presented here; I owe it to his continued support that we now have throughout incontestable proofs. (Hilbert 1922b, 177.)5
In the lectures for the Winter Semester 1921/22, one finds different proofs for a reformulation of the theories. Four of the five inference rules are replaced by axioms, retaining modus ponens as the sole rule. (See Kneser’s Mitschrift of the lectures for the Winter Semester of 1921/22, beginning with the report of the lecture for the 26 January 1922, below pp. 577ff.) In the official Ausarbeitung of the course for that semester, the consistency proof is dramatically refined and extended; for details, see the Introduction to Chapter 3. In the second section we present Hilbert’s considerations for the basic system in detail, bringing to the fore the genuine proof-theoretic insights and pointing out the oversights. The difficulties for overcoming these are discussed at the beginning of the third section of this Introduction; we give an argument for Hilbert’s claims that involves a more complex ordering of proofs, but in contrast to the notes for the lectures in the Winter Semester 1921/22 retains Hilbert’s local transformations of proofs. In the fourth section, the correctness result is used, as is done by Hilbert, to prove the consistency of the basic system and extend it to stronger theories. We end with some methodological and historical remarks.
2. Correctness proof, attempted. The basic system of the manuscript consists of axioms for equality, successor (addition of 1), and the Z-symbol: 1.) 1 = 1, 2.) a = b → (c = b → a = c), 3.) a = b → a + 1 = b + 1, 4.) Z(1), 5.) Z(a) → Z(a + 1), 6.) a = b → (Z(a) → Z(b)). 5 The
original German reads:
Zum Schluß dieser ersten Mitteilung möchte ich noch bemerken, daß mich bei der Durchführung und Ausarbeitung der hier dargelegten Ideen P. Bernays aufs wesentlichste unterstützt hat; seiner fortgesetzten Hilfe verdanke ich es, daß jetzt die einwandfreien Beweise durchweg vorliegen.
The version reprinted in Hilbert’s Gesammelte Abhandlungen omits the second part of the remark. See Hilbert 1935 , also 177.
Introduction to the Undated Draft
381
The system has substitution rules that allow the replacement of individual variables in axioms by arbitrary terms and of propositional variables in inference rules by arbitrary formulas. There are no fewer than five inference rules for →. Though they are not explicitly stated by Hilbert, they can be reconstructed from their use: B (→1) A→B A → (B → C) B → (A → C)
(→4)
A→B B→C (→3) A→C
A A→B (→2) B (→5)
A → (B → C) . (A → B) → (A → C)
Hilbert does not explicitly define ‘proof’; but the definition he intends is clear, both from the discussion in this manuscript and the presentations in the roughly contemporaneous lecture notes for the Summer Semester of 1920, and the ‘Neubegründung’ paper. A proof is a (finite) sequence of inferences such that each premise of an inference is either (an instance of) an axiom or the conclusion of an earlier inference. Hilbert’s basic system includes neither a sign for negation nor negative atomic predicates, thus consistency in the classical sense is a trivial result. Instead, Hilbert proves that an equation k = l can be derived from 1.)–6.) only if k and l are the same sign or refer to the same sign.6 The argument considers a ‘hypothetically given concrete proof’ of k = l, where ‘k’ and ‘l’ refer to different signs. Viewing the latter as a property E of proofs and using a principle of the form ‘if there is a proof with property E, then there is a (relatively) shortest such proof’, Hilbert assumes that the given proof cannot be shortened further.7 This obviously presupposes a measure of ‘length’ for proofs. From Hilbert’s indirect argument, it is clear that the number of occurrences of the conditional sign ‘→’ is taken as that measure. We now give a reconstruction of Hilbert’s argument, and then discuss the problems with it. Theorem. An equation k = l can be proved only if ‘k’ and ‘l’ refer to the same number sign. Proof. To obtain a contradiction, assume that we are given a proof of an equation of the form k = l, where the proof cannot be shortened and where ‘k’ and ‘l’ do not refer to the same sign, i. e., we have a (relatively) shortest proof of a false equation k = l. We distinguish cases as to how k = l has been obtained. 6 Those
signs are not necessarily Zahlzeichen (number signs). ‘Referring to a Zahlzeichen’ means ‘being shorthand for a Zahlzeichen’. For example, ‘2’ is shorthand for the Zahlzeichen ‘1 + 1’ and thus ‘2’ bedeutet (‘refers to’ or ‘means’) 1 + 1. For reasons of economy, we will use ‘refer to’ instead of ‘are or refer to’. 7 For this principle and its motivation, see the lecture notes for the Summer Semester of 1920, p. 38 (above, p. 366), and also Bernays 1922a, 18–19. We use the expression ‘(relatively) shortest proof’ as shorthand for ‘proof that cannot be shortened further’ (with respect to a set of shortening rules, rules which are not explicitly stated by Hilbert).
382
Chapter 2
Lectures on Logic (1920)
First, we note that k = l cannot come from Axiom 1.), as ‘k’ and ‘l’ would then refer to the same sign, contradicting our assumption. Thus, the proof must have length greater than 0, and the equation k = l must be the conclusion of an inference rule. The only possible rule is (→2), modus ponens, since all other rules have at least one →-sign in their conclusion. So the last inference in the given proof must be of the form U U →k=l. (→2) k=l U and U → k = l must have proofs already, and we distinguish now cases as to how U → k = l has been established. 1. U → k = l is (an instance of) an axiom. Only Axiom 3.) is of the right form. Thus U is an equation k = l and k is k + 1, l is l + 1. ‘k ’ and ‘l ’ must refer to different signs; otherwise, ‘k + 1’ and ‘l + 1’ would also refer to the same sign, which was excluded. Thus, the proof of U establishes k = l , ‘k ’ and ‘l ’ refer to different signs, and that proof is shorter than the one given for k = l, contradicting our assumption. 2. U → k = l is the conclusion of (→1). This inference is therefore of the form k=l . (→1) U →k=l Hence, k = l is established already by a proof shorter than the given one; contradiction. 3. U → k = l is the conclusion of (→2): V V → (U → k = l) (→2) U →k=l where V and V → (U → k = l) have already been established. This case is considered further after we have dealt with cases 4. and 5. 4. U → k = l is the conclusion of (→3). In this case, Hilbert transforms the given proof by replacing the inferences U →V U V →k=l U →k=l (→3) (→2) U →k=l k=l with U V U →V V →k=l. (→2) (→2) V k=l He argues that the overall number of ‘→’-signs has thus been reduced by 2, so that the replacement yields a shorter proof of k = l, contradicting the assumption. 5. U → k = l is the conclusion of (→4) or (→5), but this cannot be, as the conclusions of these rules are of a different form. We now continue the analysis of case 3., and distinguish sub-cases as to how the formula V → (U → k = l) could be established.
Introduction to the Undated Draft
383
3.1. V → (U → k = l) is (an instance of) an axiom, in which case only Axiom 2.) comes into question, which means we would have k = m → (l = m → k = l). But now ‘k’ or ‘l’ cannot both refer to the same sign as ‘m’ does, for otherwise (by the transitivity and symmetry of the metatheoretical relation) ‘k’ and ‘l’ would also refer to the same sign. Whichever of ‘k’ and ‘l’ fails to refer to the same sign as ‘m’, in either case, we would have a shorter proof of a false equation, namely the proof of V or of U . This would contradict our assumption. 3.2. V → (U → k = l) is the conclusion of (→1). Then one can obtain a shorter proof of k = l by dropping the central inference in the following three V U U →k=l V → (U → k = l) U → k = l. (→1) (→2) (→2) V → (U → k = l) U →k=l k=l That again contradicts our assumption. 3.3. V → (U → k = l) is the conclusion of (→2). This inference has to have W → (V → (U → k = l)) as a premise. Hilbert argues that one cannot prove such a formula: it has three ‘vorgeschaltete [superposed]’) ‘→’signs8 , but no axiom has more than two and no inference rule except (→1) increases the number of ‘superposed’ ‘→’-signs. Consequently, such a formula can be proved only by an application of (→1) that is superfluous, since it could be ‘cancelled’ by a subsequent application of (→2), thus contradicting our assumption. 3.4. V → (U → k = l) is the conclusion of (→3). Then the proof contains these inferences: V →W V U W → (U → k = l) V → (U → k = l) U →k=l. (→3) (→2) (→2) V → (U → k = l) U →k=l k=l It can be shortened by using the following inferences: V W U V →W W → (U → k = l) U →k=l. (→2) (→2) (→2) W U →k=l k=l That contradicts our assumption. 3.5. V → (U → k = l) is the conclusion of (→4). Then the original proof can be shortened by replacing V U U → (V → k = l) V → (U → k = l) U →k=l (→4) (→2) (→2) V → (U → k = l) U →k=l k=l with U V U → (V → k = l) V →k=l. (→2) (→2) V →k=l k=l Again, we have a contradiction to our assumption. 8 An occurrence → of the ‘→’-sign is called ‘vorgeschaltet’/‘superposed’ to an occurrence 1 →2 if they are found in a context like ‘. . . →1 (. . . →2 . . . )’.
384
Chapter 2
Lectures on Logic (1920)
3.6. V → (U → k = l) is the conclusion of (→5). Then the original proof can be shortened by replacing U → (V1 → k = l) (→5) (U → V1 ) → (U → k = l)
U → V1 (U → V1 ) → (U → k = l) (→2) U →k=l
U U →k=l (→2) k=l
with U U V1 V1 → k = l . U → (V1 → k = l) U → V1 (→2) (→2) (→2) V1 → k = l V1 k=l This again contradicts our assumption. Thus, it seems that all cases have been shown to be impossible, therefore ruling out the existence of a provable equation k = l where ‘k’ and ‘l’ refer to different signs. ‘Q.E.D.’ The proof so presented has three kinds of genuine difficulties: (1) The transformed configuration is not necessarily shorter than the original proof; indeed, in cases 4., 3.4., and 3.6 the transformed proof may in fact be longer. In these cases, V , W , or V1 respectively occur more often in the ‘shortened’ than in the original proof. If these formulas contain a sufficiently large number of ‘→’-signs, the transformed proofs may contain more of these signs than the original ones and, consequently, be longer. (2) In cases 4., 3.4., 3.5., and 3.6, the transformed configuration is not necessarily itself a proof. Consider the case where U is the conclusion of an inference. If it is moved to a position earlier in the proof, its premise(s) may lose their justification. If, on the other hand, the whole proof of U is moved in order to guarantee that the resulting configuration is a proof, the proof which results may be much longer then the original. (3) The iterated (→2)-applications in case 3.3 are not resolved satisfactorily. Prima facie longer chains of (→2)-applications can occur that have, for example, a (→4)-clause at their beginning before coming to a (→1)clause. Therefore, neither the length of those chains can be determined in advance, nor the kind of (→1)-clause which comes first, nor which of the later modus ponens applications could be used to construct the desired contradiction. It seems that another inductive argument is necessary to confirm the claim that formulas with more than two ‘superposed’ ‘→’signs cannot be derived in Hilbert’s calculus. Hilbert must have considered the proof-theoretic transformations as strictly local ones, affecting only the ‘end-piece’ of the derivation. This is not correct, as we have seen, and the problem is addressed in the Winter Semester of 1921/22 in two stages, as discussed in the Introduction to Chapter 3. Here we just mention the second stage as recorded in Bernays’s Ausarbeitung: the linear proofs are transformed first into proof trees (or ‘Beweisfäden’) such that every formula (except the endformula) has exactly one successor. This is reflected in Hilbert’s next foundational paper ‘Die logischen Grundlagen der Mathematik’ (Hilbert 1923a), a paper based on Hilbert’s talk at the 1922 meeting of the Gesellschaft Deutscher Naturforscher und Ärzte in Leipzig and received for publication by the Mathematische Annalen on 29 September 1922.
Introduction to the Undated Draft
385
If one adopts a tree representation of proofs, Hilbert’s basic proof-theoretic idea can be preserved, though not without adding new and interestingly complex considerations. This is carried out in the next section.
3. Correctness proof, repaired. The suggestion of using proof-trees instead of linear proofs seems to make the first problem mentioned above, the danger of transforming proofs into possibly longer ones, even worse. Consider, for example, case 3.6. above. Using the tree representation we have to consider a proof with these final inferences:
U
(→2)
U → (V1 → k = l) (U → V1 ) → (U → k = l) U →k=l . k=l
(→5)
U → V1
(→2)
Hilbert’s transformation turns this configuration into (→2) (→2)
U
U → V1 V1
(→2)
U
U → (V1 → k = l) V1 → k = l
k=l
.
This duplicates the entire proof of U , which might contain all kinds of inferences and formula complexities. The conclusion to be drawn is therefore: The number of ‘→’-signs occurring in a proof is not a suitable measure for the ‘length’ of proofs, and the same holds for every norm which simply counts the complexities of formulas or the numbers of signs used. Consider now case 1. in Hilbert’s proof, when a (→2)-clause has Axiom 3.) as its main premise; i. e., the final inference is of the form: (→2)
k = l
k = l → k = l . k=l
Hilbert’s technique of shortening requires that in this case the subproof of k = l be shorter than the whole proof; i. e., an application of modus ponens must raise the norm. But then, one faces a problem in case 4., when the last modus ponens is preceded by a (→3)-inference:
(→2)
U →V V →k=l U →k=l . k=l
(→3)
U
Here Hilbert’s transformation leads to U
(→2) (→2)
U →V V V →k=l . k=l
If the proof of U has the highest norm among the indicated subproofs, then the ‘shortened’ version is longer than the original one.
386
Chapter 2
Lectures on Logic (1920)
Finally, consider the case of inference (→4) followed by modus ponens (→2), i. e., case 3.5. The proof consisting of all the partial proofs but leaving aside the (→4)-inference must be shorter than the original one. So our norm must count the (→4)-occurrences. We conclude that a norm is required which counts applications of (→2) and (→4), weighs (→3) more heavily than (→2), and is able to deal with the special situation of case 3.6., when a whole subproof is duplicated. We propose now a norm that satisfies these requirements and allows us to ‘repair’ Hilbert’s proof, i. e., to prove the correctness assertion by making use of his proof transformations. Call a part of a proof an (n, 2)-context if it consists of the inference (→ n) and an application of modus ponens whose main premise is (→ n)’s conclusion: . . . (. . . ) A→B . B
(→n)
A
(→2)
A part of a proof is called an (n, 2, 2)-context, if it consists of the inference (→ n) and two applications of modus ponens as follows: A
B
(→2)
(→2)
. . . (. . . ) A → (B → C) B→C . C
(→n)
For a given proof let n5,2,2 denote the number of its (5, 2, 2)-contexts, n3 the number of its (→3)-inferences, n4 the number of its (→4)-inferences, and n2 the number of the (→2)-inferences. We associate with a given proof the pair n5,2,2 , 2n3 + n4 + n2 as its length. A proof d1 is shorter than d2 in case its length is lexicographically before that of d2 . With this notion of length we go back to prove Hilbert’s claim. First, we establish the following lemma via Hilbert’s local operations. Lemma. A proof containing any (1, 2)-, (3, 2)-, (4, 2, 2)-, or (5, 2, 2)-contexts can be shortened. Proof. Consider the following cases: 1. There are (5, 2, 2)-contexts in the proof (i. e., n5,2,2 = 0). Then the proof can be shortened by replacing an uppermost such context A → (B → C) (→5) A→B (A → B) → (A → C) (→2) A A→C (→2) C by A A→B A A → (B → C) (→2) (→2) B B→C . (→2) C
Introduction to the Undated Draft
387
n2 is increased by at least one and the number of inferences stemming from the proof of A is doubled. But the transformed proof is shorter, as we chose an uppermost (5, 2, 2)-context and, consequently, n5,2,2 is lowered by one. 2. There are (1, 2)-contexts in the proof. Consider an arbitrary one: B (→1) A A→B. (→2) B The subproof for the lower B can now be replaced by the subproof for the upper B, reducing n2 by one. Since all other numbers stay the same or are also reduced, we have a shorter proof. 3. There are (3, 2)-contexts in the proof. Consider an arbitrary one: A→C C→B (→3) A A→B . (→2) B By Hilbert’s technique this can be transformed into A A→C (→2) C C→B . (→2) B This transformation increases n2 by one and reduces n3 by one. Since the latter counts twice in the length, and since all other numbers stay the same, we have arrived at a shorter proof. 4. There are (4, 2, 2)-contexts in the proof. Consider an arbitrary one: A → (C → B) (→4) C C → (A → B) (→2) A A→B . (→2) B It can be transformed into A A → (C → B) (→2) C C→B (→2) B which is a shorter proof, since all subproofs occur already in the original proof and the number of (→4)-inferences is reduced by one. Q.E.D. Now, we turn to the proof of Hilbert’s theorem. The lemma allows us to prove Hilbert’s claim, and the proof we give parallels the attempted proof. Theorem. An equation k = l can be proved only if ‘k’ and ‘l’ refer to the same number sign. Proof. We proceed indirectly and assume that we have a proof of an equation k = l, where the proof cannot be shortened and where k = l is a false equation. We distinguish cases as to how the end-formula k = l has been obtained. First, we note again that k = l cannot come from Axiom 1.), since k = l is a false equation. Thus, k = l must be the conclusion of a (→2)-inference: (→2)
U
U →k=l k=l
388
Chapter 2
Lectures on Logic (1920)
and we distinguish subcases as to how U → k = l has been established. 1. U → k = l is an axiom. Only Axiom 3.) is of the right form, and we obtain a shorter proof of a false equation exactly as in case 1. of Hilbert’s proof, contradicting our assumption. 2. U → k = l is the conclusion of a (→1)- or (→3)-inference. Then the proof contains a (1, 2)- or (3, 2)-context and can be shortened according to the Lemma, in contradiction to our assumption. 3. U → k = l can be neither the conclusion a (→4)-inference nor of a (→5)-inference, as those inferences have conclusions of a different form. 4. U → k = l is the conclusion of a (→2)-inference. Then the proof ends in V V → (U → k = l) (→2) U U →k=l . (→2) k=l Now we distinguish subcases as to how V → (U → k = l) has been obtained. 4.1. V → (U → k = l) is an axiom. It can only be Axiom 2.) and, in analogy to the ‘old’ case 3.1., we get a proof that has one or two (→2)applications less than the original one, contradicting our assumption. 4.2. V → (U → k = l) is the conclusion of a (→1)-, (→3)-, (→4)- or (→5)-inference. Then there are (1, 2)-, (3, 2)-, (4, 2, 2)-, or (5, 2, 2)-contexts, and the proof can be shortened according to the Lemma, contradicting our assumption. 4.3. V → (U → k = l) is the conclusion of a (→2)-inference. Then the proof ends in: W W → (V → (U → k = l)) (→2) V V → (U → k = l) (→2) U U →k=l . (→2) k=l Consider the uppermost (→2)-application in the uninterrupted chain of (→2)applications in the proofs of the main premises. Its main premise cannot be an axiom since all the axioms have a different form. And, of course, it cannot be the conclusion of a (→2)-inference, since we chose the uppermost (→2)-inference in the chain. Thus it can only be the conclusion of a (→1)-, (→3)-, (→4)- or (→5)-inference. But then there are (1, 2)-, (3, 2)-, (4, 2, 2)-, or (5, 2, 2)-contexts and the proof can be shortened according to the Lemma, contradicting our assumption. Q.E.D.
4. Consistency proof and extensions. Hilbert extends this result to an axiom system enlarged by two axioms: 1. ) a = a, 3. ) a + 1 = b + 1 → a = b. The considerations for extending the original proof are immediate. For the next step, Hilbert adds the axiom 7.) a + 1 = 1.
Introduction to the Undated Draft
389
Explicit contradictions are now expressible and the correctness proof is extended to a consistency proof proper. Assume the system 1.)–7.) is inconsistent, i. e., proves an equation k = l and the corresponding inequality k = l. Since inequalities can only come from Axiom 7.), they must be of the form t + 1 = 1. The equation is thus of the form t + 1 = 1 and must be provable from 1.)–6.). But that is impossible by the correctness theorem, for the terms ‘t + 1’ and ‘1’ refer to different number signs. Hence, the system 1.)–7.) is consistent. In perfect accord with his general method of proceeding from simple to complex cases, Hilbert extends this consistency result step-by-step to stronger systems. The pattern is this: A proof of an inconsistency in the extended system is shown to be transformable into a proof that does not use the new axioms; since the smaller system is consistent, the extended one must be. Consider Hilbert’s extension of the axiom system given above by 8. ) a = b → a + 1 = b + 1, 8. ) a + 1 = b + 1 → a = b, 9. ) a = b → (a = c → b = c). If the axioms 8.)–9.) are used in a proof of an inequality k = l which contradicts a provable equation k = l, then another inequality k = l must occur earlier in the proof, a fact which follows from the conditional form of the axioms 8.)–9.). Hence the subproof of k = l uses one application of 8.)–9.) fewer than does the original proof. Correspondingly, the proof of k = l has to be extended (by steps in the basic system) in order to prove k = l and thus to reobtain a contradiction.9 This procedure can be carried out until a proof of a contradiction in the system without 8.), 8. ), and 9.) has been obtained; since this was shown to be impossible, the extended system cannot prove a contradiction. The consistency proof for the next axiom considered by Hilbert, Axiom 10.), is of special interest, for Hilbert here introduces a completely new method, namely the systematic substitution of terms. The axiom reads: 10.) 1 + (a + 1) = (1 + a) + 1. This allows for the proof of equations of the form k = l, where ‘k’ and ‘l’ do not refer, prima facie, to the same number sign. Thus, the core of the original 9 If
an application of 8.) has to be eliminated, k is k + 1 and l is l + 1. So one can use an application of Axiom 3. ), that is, k + 1 = l + 1 → k = l , and modus ponens. In case of 8. ), use Axiom 3.), that is, k = l → k + 1 = l + 1, and modus ponens, since k + 1 is k and l + 1 is l . Axiom 9.) is a little more involved. Let an instance of this be m = k → (m = l → k = l), and assume m = k and m = l proved previously. Then the proof of m = l is the natural candidate for the ‘shorter’ proof in the sense of using one application of 8.)–9.) fewer than the original proof of a contradiction. So k is m and l is k. But how then to conclude the contradiction? The proof of m = k could be extended by an application of Axiom 2.): m = k → (l = k → m = l), yielding l = k → m = l. But in order to infer m = l from that, one would need l = k, while in the assumption of the original contradiction one only has k = l. Here Hilbert uses the symmetry of equality, that is, the principle (1) below (p. 391), and therewith Axiom 1. ).
390
Chapter 2
Lectures on Logic (1920)
correctness proof, that k = l can be derived only if ‘k’ and ‘l’ refer to the same number sign, has to be amended. The left-hand side of the equation 10.) involves terms of the form 1 + (t + 1). If one could transform the given proof of a contradiction into a proof which does not contain terms of this form, then 10.) is not applied in this proof. Consequently, the transformed proof would establish a contradiction from 1.)–9.) alone, which was shown to be impossible. How can the terms 1 + (t + 1) be removed from a given proof of a contradiction? Hilbert’s idea is to replace them either by (1 + t) + 1, making 10.) a version of Axiom 1. ), or by an arbitrary smaller term, say, 1. Both replacements preserve the proof as a proof, provided that they are executed carefully. Consider a list of all terms of the form 1 + (t + 1) which occur (maybe as sub-terms) in the proof. Then take a t for which 1 + (t + 1) occurs in the proof, but not 1 + ((t + 1) + 1), and distinguish two cases. First case: 10.) occurs for a : t.10 Then replace in the whole proof all occurrences of 1 + (t + 1) by (1 + t) + 1. Terms of the form 1 + (t + 1) can occur in the proof only in two ways: as (parts of) terms which are substituted for the variables in the axioms, or as the left-hand side of Axiom 10.) when t is substituted for a. Under the replacement of 1 + (t + 1) by (1 + t) + 1, every instance of an axiom remains a (different) instance of the same axiom, except that instances of Axiom 10.) for a : t are transformed into (1+t)+1 = (1+t)+1, i. e., into an instance of 1. ). So, after the replacement, the proof remains a (slightly different) proof of a (possibly different) contradiction. But it contains no terms of the form 1 + (t + 1) anymore. Instead, it contains more terms of the form 1 + t, but this form was already present in the original proof as the right-hand side of the instance of Axiom 10.) for a : t. Second case: 10.) does not occur for a : t. Then simply replace all occurrences of 1 + (t + 1) by 1. The proof remains a proof, but it has one type fewer of 1 + (t + 1)-terms. In each case, one has a new proof of a (possibly new) contradiction which contains one type of 1+(t+1)-terms fewer than the original proof. By iterating this procedure, one eliminates all terms of the form 1 + (t + 1) from the proof and obtains a proof of a contradiction from 1.)–9.) alone, which is impossible according to the earlier consistency result.
5. Historical and methodological remarks. In the introductory remarks, it was emphasized that this manuscript is intermediate between the lectures from the Summer Semester of 1920 (and thus also the ideas from Hilbert 1905b) and the essay ‘Neubegründung der Mathematik’, published in 1922. 10 By
‘a : t’, Hilbert indicates the substitution of the term t for the variable a.
Introduction to the Undated Draft
391
The crucial observation in the 1905/1920 argument is that formulas occurring in derivations have bounded complexity.11 Once that bound is obtained, the argument for correctness proceeds by first assuming that we have a relatively shortest proof of a false equation. Then one distinguishes cases as to how that equation can have been established, so obtaining a contradiction in all cases. The case of longer and longer (→2)-chains is ruled out by the complexity bound. Other cases, in which one can construct a shorter proof from the given one, are ruled out since a relatively shortest proof is being considered. This principle, assuming the existence of a relatively shortest proof, functions as a metatheoretical induction principle, and appears also in the correctness proof given above.12 In ‘Neubegründung’, however, Hilbert abandons it in favour of a more perspicuous principle, a form of the least number principle.13 This principle allowed Hilbert to present in the ‘Neubegründung’ a smoother version of the basic consistency proof from the Summer Semester of 1920. At the end of the 1920 lectures, a programme is sketched for expanding the basic system by adding arithmetical axioms. Hilbert also realizes that ‘one has to expand the forms of inference so that they suffice for proving the arithmetic theorems’ (p. 45 of the notes, above p. 371). Both kinds of expansions are carried out in the manuscript. The procedures for handling arithmetic axioms are intricate and subtle, but they do not raise the fundamental issue raised by the new forms of inference.14 In the manuscript, the rules (→1)–(→5) for the conditional are introduced. Hilbert remarks that he could have restricted the calculus to the rules (→1) and (→2) and that in this way the consistency proof would have been simplified (p. II). The crucial addition to modus ponens is therefore (→1). It is required to bring to bear the new arithmetic axioms in the proof of equations, and it is because of this rule that the complexity of formulas in derivations is no longer bounded. The addition of the other rules is seemingly motivated by the desire to prove longer chains of conditionals of equations, such as (1) a = b → b = a, (2) a = b → (b = c → a = c), 11 See
the Summer Semester lectures, pp. 40–43 (above, pp. 367ff.) this principle, see p. 38 of the notes for the Summer Semester of 1920, above p. 366. 13 See Hilbert 1922b, pp. 171–172. 14 Later Hilbert abandoned rules for propositional logic in favour of axioms. For instance, in Kneser’s Mitschrift of the lectures given in the Winter Semester of 1921/22, he says (p. 20): 12 For
We need inferences other than [modus ponens], for example (→)
γ→ψ ψ→χ. γ→χ
But we only want this [i. e., modus ponens], and we add the others in the form of logical axioms, five in number.
For the original German, see p. 581 below.
392
Chapter 2
Lectures on Logic (1920)
(3) a = b → (b = c → (c = d → a = d)).15 Since the formal system has no general substitution rule and no general equality axiom (schema), these chains may have been intended to make formal proofs more perspicuous. In any case, Hilbert proposed to prove (2) and (3) using the logical theorem: if S → (U → V ) and S → (V → W ) are provable, so is S → (U → W ).16 The proofs of this logical theorem, and then of (2) and (3), make use of all five →-rules. Hence, the above chains of equations may well have motivated Hilbert to introduce the rules; he even mentions that he could have taken the theorems (1)–(3) as axioms instead of adding the rules (→3)–(→5). As was mentioned (above, p. 379), the Editors of Volume 3 of Hilbert’s Gesammelte Abhandlungen assert that the ‘Neubegründung’ reflects a transition from a first to a second stage in the development of proof theory. The first stage, represented on pp. 168–174 of the paper, concerns the treatment of the basic system and was discussed above. The second stage, represented on pp. 174ff., is described by the Editors as dealing with ‘the intended formalism’ of ‘Neubegründung’.17 Hilbert returns here to a formalism with only two inference rules, namely modus ponens and substitution, but with many logical and arithmetical axioms, including an induction schema.18 The logical 15 It is interesting to note that Hilbert explicitly called these sentences, including (1), ‘examples of provable theorems’ (see p. II of the manuscript, p. 399 below). Thus, he obviously considered the reflexivity of equality, necessary for the proof of (1), as an axiom (Axiom 1. ). 16 Here is a proof of the logical theorem: From S → (U → V ) infer by (→4) U → (S → V ), and from S → (V → W ) infer by (→5) (S → V ) → (S → W ). Applying (→3) to the two conclusions gives U → (S → W ); this finally yields S → (U → W ) by (→4). We can now prove (1)–(3) as follows. Proof of (1): b = b → (a = b → b = a) is an instance of Axiom 2.). Modus ponens applied to this and b = b, which is an instance of Axiom 1. ), yields (1). Proof of (2): From (1) b = c → c = b infer by (→1) a = b → (b = c → c = b). Applying the logical theorem to this and to a = b → (c = b → a = c), which is a version of Axiom 2.), leads to (2). Proof of (3): Apply the logical theorem to a = b → (b = c → a = c), which is a version of Axiom 2.), and to a = b → (a = c → (c = d → a = d)), which is a (→1)-weakening of a = c → (c = d → a = d). This gives (3). 17 See the reprinting of Hilbert 1922b in Hilbert 1935 , p. 168, n. 2. 18 In the manuscript there is one passage where Hilbert claims to have proved the principle of complete induction, at least in a special case. (He says: ‘Hier ist zum ersten Mal das Prinzip der vollständigen Induktion wenigstens im besonderen Fall wirklich bewiesen.’) In fact, what he proves is only that the axiom 1 + a = a + 1 is consistent with the other axioms. We are not sure what exactly Hilbert means here, but it seems plausible that ‘having proved’ means something like ‘having proved consistent’. This way of reading what Hilbert says is suggested by a remark in the lectures for the Summer Semester of 1920. There Hilbert presents a procedure for the elimination of instances of the induction rule; he claims that this procedure provides both a relative consistency proof for induction and ‘in a certain sense’ a proof of the induction rule. The latter means, Hilbert explains, that all equations derivable with induction can also be derived without. (For the relevant passage, see p. 45 of the lecture notes, p. 370 above.) Even with this understanding, it remains to be explained how 1 + a = a + 1 can be called ‘induction’ in any sense. We conjecture that
Introduction to the Undated Draft
393
axioms are: 1. A → (B → A), 2. (A → (A → B)) → (A → B), 3. (A → (B → C)) → (B → (A → C)), 4. (B → C) → ((A → B) → (A → C)). 1., 3., and 4. correspond to (→1), (→4), and (→3), whereas the contraction axiom 2. does not strictly correspond to rule (→5) being slightly stronger.19 Hilbert claims that a consistency proof for this formalism has been obtained, but does not sketch such a proof in the paper. The Editors state that the result is correct only when the universal quantifier is removed from the language and induction is formally given by a rule (obviously for quantifier-free formulas). They also remark that the principle of definition by primitive recursion can be added and is actually required to make the system adequate for formalizing mathematical practice.20 Hilbert’s investigations in this manuscript treat for the first time a fragment of arithmetic that incorporates propositional logic as given by the rules for the conditional. It is this ‘inferential expansion’ that requires new techniques. These techniques are not used in the later lectures for the Winter Semester of 1921/22 to prove the consistency result as we have formulated it here. In this sense, the manuscript is transitional. However, there is a deeper sense in which the manuscript and the ‘Neubegründung’ paper are transitional. The object-theory in this manuscript is logically weak (a fragment of intuitionistic logic), and that holds also for the ‘intended formalism’ of ‘Neubegründung’, where the axioms for negation are of a very restricted form, i. e., treat only of arithmetical inequality.21 Indeed, Hilbert emphasizes the significance of this constructive aspect of the formalism. (See Hilbert 1922b, p. 173.) However, in Bernays’s Ausarbeitung of Hilbert’s lecture course for the Winter Semester of 1921/22 the full axioms for negation are used.22 In this Ausarbeitung, proof theory is introduced as ‘Hilbert’s Proof Theory’, and finitist mathematics is pursued for the first time, and the distinction between object- and meta-theory is sharpened to a distinction between an object thehe speaks of induction ‘in gewissem Sinne’ in order to indicate that 1 + a = a + 1 cannot be proved without induction. 19 See Hilbert 1922b, 175. The same axioms are added in the lectures from the Winter Semester of 1921/22; see Bernays’s Ausarbeitung, the second p. 3, where they are called ‘Axiome der Folge’ (below, p. 494, and Kneser’s Mitschrift for these lectures, pp. 20–21; below, p. 582). 20 See the reprint of Hilbert 1922b in Hilbert 1935 , 176, nn. 1,2. 21 In Hilbert 1922b, p. 175, Hilbert uses a = a → A (short for a = a → (a = a → A)) and (a = b → A) → ((a = b → A) → A) as axioms for negation. 22 The Ausarbeitung consists of two parts, the second of which can be seen as a supplement written by Bernays, and in this there are the following two axioms for negation: A → (A → B) and (A → B) → ((A → B) → B). See Bernays’s Ausarbeitung, the second p. 3, p. 494 below. Kneser’s Mitschrift for the 1921/22 lectures (p. 22; below, p. 582) lists for negation just the same arithmetical inequality axioms as are set out in n. 21 above. For further discussion, see the Introduction to Chapter 3, p. 422, especially n. 8, and also Bernays 1935 , 203.
394
Chapter 2
Lectures on Logic (1920)
ory with full classical logic and a meta-theory in which only restricted finitist principles are used. These considerations, both the theoretical reflections and the technical work, are presented in Hilbert’s Leipzig lecture ‘Die logischen Grundlagen der Mathematik’. This paper presents, according to Bernays, the principled basis for proof theory, in which Hilbert’s proof-theoretic programme is fully articulated for the first time: With the formulation of proof theory which we encounter in the Leipzig lecture, the basic form of its structure had been achieved.23
6. Note on the Text. The manuscript is part of a folder in the Hilbert Nachlaß, namely Cod. Ms. D. Hilbert 602. The folder was entitled ‘Über Axiome’ for catalogue purposes, but this is neither Hilbert’s title, nor an appropriate one; it is taken from the heading (‘Axiome’) of a list of axioms with which the first page happens to begin. The folder contains fourteen sheets; only eight of them constitute the document presented here, and this document has no official title. Two of the sheets (numbered 9 and 10 in the folder) are written on the back of galley proofs for papers published in the Mathematische Annalen only in 1931, and thus, if the rough dating of the material in the present manuscript is approximately accurate, clearly stem from over a decade later. The notes Hilbert has written on these sheets concern a sketch of what he calls a ‘Beweis des ε-Axioms’. Sheet 9 is actually written on the back of a proofsheet for the article eventually published as Pietrkowski 1931 , and sheet 10 for the article eventually published as Hamburger 1931 . It is interesting to note that these articles appeared in exactly the same volume of the Annalen as the paper Cauer 1931 , one of the proof-sheets of which was used for the additional remarks inserted in the one copy we have of the Ausarbeitung of the ‘Probleme der mathematischen Logik’ lectures from 1920. (See the Description of the Text for the lectures ‘Probleme der mathematischen Logik’, above, p. 376.) It is hard to resist the conclusion that the same stack of scrap paper was used. As is typical for Hilbert’s manuscripts, the document is littered with deletions (often of whole passages), and additions, often, but not always, as replacement for deleted text. These additions are written in no systematic way, being sometimes interlineated, sometimes written in the margins or any other space available on the page, and frequently with no clear indication of where they belong, if anywhere.24 Nevertheless, an attempt has been made by the Editors to reconstruct the text as a readable document representing the flow 23 Bernays
1935 , 204. In the original German, the passage reads:
Mit der Gestaltung der Beweistheorie, die uns in dem Leipziger Vortrag entgegentritt, war die grundsätzliche Form ihrer Anlage erreicht.
For more details concerning these developments, see the Introduction to Chapter 3. 24 To give a flavour of the appearance of Hilbert’s document, we have included a photographic reproduction of Sheet 1; see p. 415.
Introduction to the Undated Draft
395
of the central ideas, while at the same time presenting all the essential changes for the reader to assimilate and judge. Wilfried Sieg and Christian Tapp
396
Chapter 2
Lectures on Logic (1920)
Consistency Proofs for Fragments of Arithmetic (Undated Draft)
I
1. 2. 3. 4. 5. 6.
Axiome 1=1 a = c → (b = c) → (a = b) 1 a=b → a+1=b+1 Z(1) 2 Z(a) → Z(a + 1) (a = b) → Z(a) → Z(b) 3
Satz. Eine Formel k = l ist nur dann richtig, wenn k und l dasselbe Zeichen sind oder bedeuten. 4 Beweis durch inhaltlichen 5 (aber in koncreto durch Aufweisen kontrollirbare Eigenschaften des Beweises) 5 Beweis am Beweise. Schlussschemata (→) Denn 6 gäbe es einen Beweis für k = l, d. h. mit der Schlussformel k = l, so
1 The
manuscript originally read: a = c & c = b → a = b. See also n. 3 and the deleted part in n. 6 below. 2 Hilbert adds to the right of this axiom: Füge hinzu a + 1 = b + 1 → a = b Statt 6 nimm: a = b → f (a) = f (b) 3 Substituted for: Z(a) & a = b → Z(b) 4 Hilbert adds in the upper righthand corner: Eine Formel ist richtig, wenn sie bewiesen worden ist d. h., wenn ein Beweis aufgewiesen wird, dessen Endformel sie ist. 5–5 Added. 6 The consideration which begins here replaces one which has been deleted and reads as follows: Denn aus den Axiomen her könnte es nur 1 = 1 sein. Durch Schluß nur aus 2. oder 3. Hilbert adds ‘1.)’ and ‘2.)’ just above and to the left of ‘2.’ and ‘3.’ respectively. These are thus the cases considered under 1.) and 2.) in the text directly following. 1.) dann müsste für a k und für b l in 2. eingesetzt worden sein und also vorher k = c & c = l bewiesen sein also sowohl k = c wie c = l. Ist oder bedeutet nun c dasselbe wie k und auch c dasselbe wie l, so würden auch k und l dasselbe Zahlzeichen bedeuten. Sonst aber wäre unser Beweis kürzbar, was wir ablehnen können. 2.) dann müsste für a + 1 l und b + 1 k in 3. eingesetzt worden sein und ausserdem a = b vorher bewiesen worden sein. Bedeuten oder sind nun a, b dieselben Zeichen, so bedeuten oder sind auch a + 1, b + 1 dieselben Zeichen. Sonst aber wäre der Beweis kürzbar, was wir ablehnen können.
5
10
‘Consistency Proofs for Fragments of Arithmetic (Undated Draft)’
397
U , U → (k = l) wo U bereits bewiesen ist. Nehmen wir an U → (k = l) käme nicht aus Axiom her, sondern durch Beweis so
könnte diese nur durch das Schema 2. zu Stande kommen also
U →V V V → U → (k = l) V → (k = l) entweder . oder U → V bereits bewiesen V bereits bewiesen
5
10
U U →V Im zweiten Falle hätten wir also V → (k = l) und U → (k = l) . Statt U → (k = l) k=l V U V → (k = l) wo 2 mal dessen könnten wir aber schliessen U → V und V k=l → weniger angewandt wären. Aber Annahme, geschehen dass diese Kürzung sei. Nehmen wir nun wieder an, dass V → U → (k = l) nicht aus Axiom käme, so wäre eben einzusehen, dass nur die Schlussschemata möglich sind und Schema 3 vgl. II 7 , 8
7 The Roman numeral II refers to the following text, written by Hilbert in some free space on the upper half of the following sheet (i. e., sheet 2): II U, V V → W W → U → (k = l) V → U → (k = l) V V → U → (k = l) U → (k = l)
U U → (k = l) k=l Statt dessen
U U →V V
W W → U → (k = l) U → (k = l)
V U V →W U → (k = l) W k=l wo nur 6 Zeichen →. 8 On the unnumbered sheet 8 (see Description of the Text, below) one finds what appears to be an earlier version of the treatment above concerning the schema for transitivity. That schema is called on this sheet ‘Schema 2’ and modus ponens is Schema 1. (Clearly, the Schema 1 of the main text had not yet been introduced.) The text of sheet 8 reads: Bei Vorliegen des 2ten Schemas würde der Schluss lauten U →T T → (S → (k = l)) U → (S → (k = l))
(bereits bewiesen)
398
Chapter 2
Lectures on Logic (1920)
U → V1 → (k = l) U → V → (k = l) oder 5. 4. V → U → (k = l) (U → V1 ) → U → (k = l) W 9 oder W → (V → U → (k = l))
II
Im ersten Fall 10 kann man den Schluss 4 ganz vermeiden, da man ja, weil U , V bewiesen sind, eben so gut aus U → V → (k = l) auf k = l schliessen kann. Diese Kürzung kann als vorhanden angesehen werden. Im zweiten Fall hat man so geschlossen: U → V1 → (k = l) 11 11 (U → V1 ) → U → (k = l)
5
U→ (d. h. nämlich V ) V1 (U → V1 ) → U → (k = l) U → (k = l) U (U → (k = l) k=l Aber statt dessen kann man mit 5 → Zeichen 12 weniger schliessen: U U → V1 V1 U U → V1 → (k = l) V1 → (k = l) Dann aber wäre das 2te Schema vermeidbar; denn man schliesse statt desssen U U →T T
T T → (S → (k = l)) S → (k = l)
S S → (k = l) k=l
und ebenso vorhin bei Auftreten des 2ten Schema, schliesse man statt dessen allein mit erstem Schema, wie folgt S T S→T T → (k = l) T k=l Wir dürfen annehmen, dass der Beweis, wo er auf diese Weise angeht, stets gekürzt ist betr. Anwendung des 2ten Schemas. 9 Added in the lower margin: Den Buchstaben W vermeide, weil er später Widerspruch bedeuten soll. 10 The consideration which begins here replaces a deleted passage which reads as follows: Im ersten Fall nimm den nächsten Schritt zurück, im zweiten Fall hätte schon unsere zu beweisende Formel 3 → Zeichen. Im dritten Falle wäre eine Formel mit 3 → Zeichen zu beweisen. 11–11 Added. 12 It seems that Hilbert has miscounted here: the difference between the number of occurrences of → in the first and second group of inferences is 6.
10
‘Consistency Proofs for Fragments of Arithmetic (Undated Draft)’
5
399
V1 V1 → (k = l) k=l Diese Kürzung nehmen wir wieder von vornherein an. Aber eine Formel von der Gestalt W → V → U → (k = l)
10
kann weder durch Axiom, wo ja nur höchstens 2 → Zeichen vorkommen noch durch Beweis erhalten werden, es sei denn durch Schlussschema 1, was aber nur eine Rückgängigmachung von dem letzten Schlussschema bedeuten würde. Denn bei keinem Schlussschema ausser 1. wird die Zahl der vor dem letzten Zeichen k = l insgesamt successive einander vorgeschalteten → Zeichen 2 1 vermehrt. 13 Dabei heisst ein Zeichen → vorgeschaltet vor einem Zeichen →, 1 wenn es vor dem ganzen Ausdruck, auf den sich links das Zeichen → bezieht, 13 steht. Also bleibt nur übrig, dass entweder
15
U → (k = l) oder
20
V → U → (k = l)
aus Axiom kämen. U → (k = l) 14 kann nur aus Axiom 3 kommen, dann aber wäre U k −1 = l−1 und also, da k −1 und l−1 auch von einander verschieden sein müssten, Kürzung. Ebenso bei V → U → (k = l) was nur aus Axiom 2 kommen kann. Als Beispiele für Beweise von Sätzen diene
25
1.) (a = b) → (b = a) 2.) (a = b) → (b = c) → (a = c) 3.) (a = b) → (b = c) → (c = d) → (a = d) 15
30
Man hätte statt die Schemata (→) nur die Schemata 1. und 2. von (→) zulassen können, dann wäre der obige Widerspruchsfreiheitsbeweis etwas einfacher geworden. Man könnte dann aber z. B. den Satz 2.) 16 und 3.) 16 nicht direkt beweisen. Wohl aber könnte | man diese Sätze 2.) – 3.) als Axiome hinzufügen und dann wie vorhin die Widerspruchsfreiheit zeigen.
∞—
13–13 Added. 14 Hilbert adds a sign ‘( )’ above this formula, a sign clearly intended to mark the formula, for it is used at several points below exactly as a way of referring back to it , e. g., on pp. VI, VII, and X. 15 Hilbert adds to the right of these three formulas: dies geschieht wohl am einfachsten indem man gleich allgemein zeigt, dass wenn die beiden S → (U → V ) richtig sind, auch stets S → (U → W ) richtig ist. Formeln: S → (V → W ) 16–16 Added.
III
400
Chapter 2
Lectures on Logic (1920)
Man sieht auch, dass mit dem vorigen Widerspruchsfreiheitsbeweis dieser auch zugleich mitgeführt ist, wenn man noch die Axiome hinzufügt 1 .) a = a 3 .) a + 1 = b + 1 → a = b. Man sieht wieder, dass man a = a keinesfalls direkt beweisen kann, obwohl 1 + 1 = 1 + 1, 1 + 1 + 1 = 1 + 1 + 1, etc. Wir führen nun ein neues Individualzeichen = ein und fügen zu unseren bisherigen Axiomen 1 – 6 noch hinzu 7.) a + 1 = 1 Ein Axiomensystem heisst widerspruchsfrei, wenn aus demselben nicht zugleich k = l und k = l bewiesen werden kann, wo k, l Zahlzeichen oder Kurzzeichen sind. (Zahlzeichen sind oder bedeuten) Wir könnten auch das Axiom a = b → (a = b) → W 17 hinzufügen, dann lässt sich (wie oben) einsehen, dass unsere Forderung für die Widerspruchsfreiheit darauf hinausläuft, dass W keine richtige Formel ist. Unsere Axiome 1. – 7. sind widerspruchsfrei. Denn k = l kann nur durch Einsetzen aus Axiom 7 zustande kommen: K + 1 = 1. Dann müsste K + 1 = 1 bewiesen werden können, was aber nach obigem nicht der Fall ist, weil K + 1 und 1 sicher nicht dieselben Zeichen sind und 1 und K + 1 beide keine Kurzzeichen sind. Wir fügen jetzt die Axiome hinzu 8.) a = b → a + 1 = b + 1 8 .) a + 1 = b + 1 → a = b 9.) a = b → (a = c → b = c) Man kann jetzt z. B. beweisen die Richtigkeit der Formel (1 + 1) + 1 = 1 + 1
IIII
5
10
15
20
25
(3 = 2)
Auch die Axiome 1 – 9 sind widerspruchsfrei. Denn eine Formel k = l kann ohne Beweis aus Axiom nur durch 7. entstehen, was aber erledigt ist. Aber U ferner durch Beweis: etc., wo man wieder genau wie oben einU → (k = l) sieht, dass nur die Anwendung der Axiome 8, 8 oder 9 zu k = l führen könnte. Z. B. bei Anwendung von 8 müsste k von der Form k + 1 und l von der Form l + 1 sein und vorher müsste k = l bewiesen sein. Aber nun muss ja auch k + 1 = l + 1 bewiesen werden, und indem ich hierauf Axiom 3 anwende, erhalte ich k = l , also einen neuen | Beweis für W , der aber einmal die Anwendung des Verschiedenheitsaxioms 8. weniger erfordert. Aus unseren allgemeinen Annahmen kann ich aber 18 dadurch d. h. durch wiederholte Anwendung dieses Verfahrens erreichen, 18 dass durch diesen Prozess des Wegnehmens einer Anwendung von 8 (8 oder 9 ) und eventuell Hinzufügung einer 17 Hilbert later adds next to this formula: Statt W lieber ω schreiben. Note that, when describing the emerging Hilbert Programme in 1922, Bernays uses the letter Ω to indicate a contradiction. See Bernays 1922a, p. 17. 18–18 Substituted for: von vorneherein fordern
30
35
‘Consistency Proofs for Fragments of Arithmetic (Undated Draft)’
5
10
15
20
25
30
35
401
Anwendung von 3 die Anwendung der Axiome 8, 8 , 9 19 im Beweise ganz vermieden wird, nämlich immer einmal weniger. 19 Wir fügen jetzt das Axiom 10.) 1 + (a + 1) = (1 + a) + 1 hinzu. ImWiderspruchsbeweise käme 1 + (k + 1), wo k Kurzzeichen ist, nicht aber 1 + (k + 1) + 1 vor. Dann kann der Satz 10. für a: k angewandt sein. Das Zeichen 1 + (k + 1) kann sonst nicht mehr durch 10. sondern nur dann und dadurch hineinkommen, dass man für ein Symbolzeichen in den Axiomen 1 + (k + 1) als Ganzes einsetzt. Wenn man nun also im ganzen Beweise überall statt 1 + (k + 1) 20 überall, wo es vorkommt, 20 (1 + k) + 1 einsetzt, so muss der Beweis ein richtiger Beweis bleiben. Denn die Anwendung der 21 Schemata 21 bleibt richtig, weil doch Symbolzeichen explicite in den Schemas nicht vorkommen. Die aus den Axiomen durch Einsetzen entstehenden Formeln bleiben richtig, weil ja die Axiome das Symbolzeichen 1 + a garnicht enthalten und daher 1 + a überhaupt nur dadurch auftreten kann dass man für a Ausdrücke mit 1 + (k + 1) einsetzt. Die Aenderung läuft also darauf hinaus, dass man in die Axiome statt a 1 + (k + 1) nunmehr a (1 + k) + 1 einsetzt. Nur mit 10. sein, die steht er anders. 22 In 10. können ebenfalls für a Ausdrücke eingesetzt ∗). Aber der Ausdruck 22 1 + (k + 1) kann hier ausser 1 + (k + 1) enthalten durch jenes a 1 + (k + 1) auch noch dadurch, aber nur dadurch entstehen, dass a durch k ersetzt wird. Aber unsere Vorschrift zeigt, dass dann 10. wegen Axiom 1 auch erfüllt ist. Kommt nun 10. wirklich für a: k im Beweis zur Anwendung, so kommt das Symbol 1 + k 23 im Beweis 23 sicher vor. Dann ist die Figur um eines der Symbole von der Gestalt 1+a ärmer geworden nämlich um das Symbol 1 + (k + 1), während kein neues Symbol 1 + a hinzugekommen ist, da ja 1 + k schon vorher vorhanden war. Ist aber 10 für a: k im Beweis nicht angewandt und ist auch sonst im Beweise 1 + k nicht anwesend, so ersetze überall 1 + (k + 1) durch 24 irgend ein 1 + k nicht enthaltendes Symbol z. B. 24 1, dann ist dieselbe Reduktion wie früher 25 . So verschwinden schliesslich alle Symbole 1 + a aus dem Beweise und also auch jede Anwendung von 10. und also müsste der Widerspruch auch ohne 10 eintreten. Nun fügen wir noch die Formel 11.) 1 + a = a + 1 hinzu. käme wieder 1 + (k + 1), aber nicht Im Widerspruchsbeweise 1 + (k + 1) + 1 vor; dann bleibt das frühere Reduktionsverfahren gültig, ausser wenn 11 gerade für a: k + 1 angewandt ist. Dann würde nämlich durch ∗) dann hat man eben dafür (1 + k) + 1 zu setzen! 19–19 Substituted
for: auf die kleinste Anzahl bereits reduzirt ist.
20–20 Added. 21–21 Substituted 22–22 Substituted
for: Axiome for: Der Ausdruck
23–23 Added. 24–24 Added. 25 The
meaning presumably is: ‘dann ist es dieselbe Reduktion wie früher’.
V
402
VI
Chapter 2
Lectures on Logic (1920)
das vorgeschriebene Einsetzen aus 11 wegen (f ) 1 + (k + 1) = (k + 1) + 1 (1 + k) + 1 = (k + 1) + 1 entstehen. Und diese Formel (f ) brauchen wir um unseren Beweis gültig zu machen. Wir können sie aber aus 11 für a: k und aus Axiom 3 beweisen, so dass der Beweis wieder restaurirt ist und auch tatsächlich dieselbe Reduktion wie vorhin erreicht ist, ausser wenn 1 + k im Beweise nirgendwo vorkam (denn 1 + k würde ja dann durch unsere Verfahren neu eingeführt sein!). Wenn aber 1 + k im Beweise nirgends vorkommt, so wird auch 10 sicher nicht für a: k angewandt und es bleibt also unser Beweis gültig, wenn wir 1 + (k + 1) überall durch (k + 1) + 1 ersetzen, weil dann 26 die aus 11 entspringende u. anzuwendende Formel (f ) 26 wegen Axiom 1 richtig ist. Hier ist zum ersten Mal das Prinzip d. vollständigen Induktion wenigstens im besonderen Fall wirklich bewiesen. Poincaré hat es mit Unrecht als Eigenschaft unseres Verstandes und als unbeweisbar angesehen, Dedekind nur auf andere Axiome zurückgeführt. Nun wichtiger Schritt durch Hinzunahme des Logikzeichens ×. 27 Es zeigt sich so recht dabei, wie gut meine Methode einschnappt. Bereichert man nämlich nur die Schemata mit diesem Zeichen, so käme man nie zu Sätzen, bereichert man aber nur die Axiome, so wären alle Sätze mit × richtig 28 oder vielmehr als Axiome zulässig 28 , da man ja nie Widersprüche nachweisen könnte. Nun brauchen wir vor allem den Satz 12.) a = 1 × a = ε(a) + 1 Wir wollen vorläufig zunächst, um noch × zu vermeiden statt 12 nehmen: 12 .) a = 1 → a = ε(a) + 1 29 Wir haben dann – wir vermeiden dabei auch noch W – zu zeigen, dass nicht zugleich k = l und k = l bewiesen werden kann. Wir gehen dazu vor 10. zurück und schalten hinter 9, indem wir vorläufig 3 , 8 ausschliessen, das Axiom 12 . 30 Beweis der Widerspruchsfreiheit der Axiome 1–9 ausser 3 , 8 , 12 lässt sich dann folgendermassen führen. Wir zeigen, dass es [[weder einen Beweis für |VI K = 1 (K nicht dasselbe wie 1) noch für 1 = K (K nicht dasselbe wie 1), noch 1 = 1 geben kann.]]--↑keinen Beweis giebt, der entweder | K = 1 (K nicht dasselbe wie 1) 1 = K (K nicht dasselbe wie 1), oder 1 = 1 beweist.↓ 30 Denn gäbe es einen solchen Beweis, so kürze ihn. Der gekürzte 26–26 Substituted
for: 11 garnicht im Beweise angewandt zu werden braucht, sondern nur (f ), (f ) aber 27 Hilbert certainly used this sign for logical product in his 1920 lectures, along with the ‘+’ sign for logical sum; see, for example, p. 6 of the ‘Logik-Kalkül’ lectures from the Winter Semester of 1920, above p. 300. However, by the time of the 1921/22 lectures, Hilbert was using ‘&’ and ‘∨’. See Bernays’s Ausarbeitung of these lectures, p. 78, below, p. 476. 28–28 Added. 29 The ‘ε’ is later overwritten by ‘δ’, but all the further considerations in this manuscript are carried out using the ‘ε’ sign. Hilbert began using ‘δ’ to stand for the predecessor function in his ‘Neubegründung’ paper; see Hilbert 1922b, 154. 30–30 Substituted for: Der dort auf S. III geführte Beweis der Widerspruchsfreiheit bedarf dann nur | p. VI einer
5
10
15
20
25
30
35
‘Consistency Proofs for Fragments of Arithmetic (Undated Draft)’
403
∞—
Beweis sei 1.) ein Beweis für K = 1. Wie S. I-II zeigt, haben wir dann nur nötig S. II auch noch Axiom 12 zu berücksichtigen. Die Formel U → K = 1 kann aus Axiom 3, 12 nicht kommen. Die Formel V → (U → K = 1) könnte aus 2. kommen a: K, b: 1. Dann wäre aber 1 = K (K nicht dasselbe wie 1) früher zu beweisen, was nicht sein darf. | 2.) ein Beweis für 1 = K. Wenn U → 1 = K aus 12 enspringen soll, so 12 für a: 1 also müsste 1 = 1 vorher bewiesen sein, was nicht geht. 3.) ein Beweis für 1 = 1 durch Axiom nicht möglich. (Ebensowenig 8, Axiom 9 würde vorher den Beweis für 1 = K erfordern (K nicht dasselbe wie 1).) Nun soll k = l, k = l bewiesen werden. k = l kann ohne Beweis nur durch 7 entstehen. Aber k + 1 = 1 zu beweisen ist, wie eben gezeigt, unmöglich. Durch Beweis ist k = l nur möglich auf Grund von Axiom 9, wobei dann aber nötig wird, vorher l = k zu beweisen. Da man auch k = l und k = k beweisen muss, so würde aus 2 auch l = k folgen. Also Kürzung möglich, wobei die Kürzung so zu verstehen ist, dass man Axiom 9 stets, wo es auf diese Weise geht, durch
10
15
Modifikation ↑um für 1–9, 12 zu gelten↓. k = l kann ohne Beweis nur durch 7 entstehen. Es müsste uns also der Beweis für k + 1 = 1 gelingen ↑aus 1–9 ausser 3 ↓ unter Hinzunahme von 12 . ↑Ich nehme nun noch das Axiom a = b → b = a hinzu und nehme an, dass die Kürzungen, die mittelst dieses Axioms (eventuell Vermeidung von 2. c: a siehe unten) ∞—
5
gemacht werden können, gemacht sind.↓ [[Da hätten wir dann an der Stelle S. II auch noch die Formel 12 zu berücksichtigen; aus dieser kann aber immer nur eine Gleichung von der Gestalt a = ε(a) + 1 folgen, wenn ausserdem a = 1 bewiesen ist.]] Statt k + 1 = 1 nehme ich allgemein K = 1. K = 1 ↑K nicht dasselbe wie 1↓ kann nur durch Beweis kommen ↑da 1, 1 nicht dazu führen↓. Also durch U → K = 1, U . Käme auch U → K = 1 durch Beweis, so durch V → (U → K = 1), V . Man zeigt wie auf S. I–II, dass diese nur aus Axiom kommen können. 1.) bei U → K = 1 können aber offenbar Hilbert inserts the following text between the line ending with ‘offen-’ and the next line beginning with ‘bar’: ‘ausser wenn man a = b → b = a anwendet und in 12 a : 1 nimmt. Dann müsste 1 = 1 richtig sein, was extra zu behandeln ist.’ 3 und 12 nicht in Frage kommen also 2.) V → (U → K = 1) kommt nur 2 in Frage d. h. a: K und b: 1. Es müssten also ausserdem K = k und 1 = k bewiesen worden sein. 1 = k ist durch Axiom nur möglich, wenn k dasselbe wie 1 ist, dann aber kürzbar. Soll aber 1 = k durch Beweis gezeigt werden, so kämen wieder 3, 12 nicht in Frage, also nur 2. es müsste dann ↑eingesetzt↓ sein a: 1, b: k und man müsste 1 = k , k = k gezeigt haben. Andererseits muss auch k + 1 = k gezeigt werden, was durch Axiom nur möglich, wenn k dasselbe wie k + 1. Statt 1 = k , k = k hätten wir dann 1 = k , k + 1 = k zu zeigen, also kürzbar. Es müsste also k + 1 = k durch Schluss gezeigt werden. 1.) bei U → k + 1 = k käme 3 in Frage, dann müsste k die Form k + 1 haben und dann hätten wir also 1 = k , k + 1 = k zu zeigen, also reduzirbar k: k . 12 käme ebenfalls in Frage a: k + 1, k : ε(k + 1) + 1 etc. wie vorhin als 3 in Frage kam. 2.) V → (U → k+1 = k ), wo nur 2 in Frage kommt: a: k + 1, b: k . Vorher sind zu beweisen k + 1 = k(4) , k = k(4) . Der Beweis wäre dann folgender: Nach 2 wird k + 1 = k4 → (k = k4 → k + 1 = k ) 1 = k → (k = k → 1 = k ) k + 1 = k → (1 = k → k + 1 = 1) also 1 = k wird dann durch den Schluss 1 = k → (k = k → 1 = k ) gezeigt. Nun aber müsste wieder 1 = k gezeigt werden, k kann nicht dasselbe wie 1 sein.
VII
404
Chapter 2
Lectures on Logic (1920)
5
10
∞—
eine neue eindeutige Anwendung von 2 ersetzt. Man kann wohl auch noch auf diesem Wege den Widerspruchslosigkeitsbeweis führen unter Hinzunahme von 8 , wenn man statt 1 = 1 überall k = k setzt. Aber jetzt wollen wir den Widerspruchslosigkeitsbeweis voll führen für alle Axiome 1–9 incl. 3 , 31 excl. 31 8 und 12 . Zu dem Zwecke zeigen wir, dass es weder einen Beweis für K = 1, noch für 1 = K, noch auch k = l geben kann, es sei denn, dass, wenn wir in 32 den Ausdrücken, die 32 K beziehungsweise k, l 33 bedeuten 33 überall ε(a + 1) durch a ersetzen, das entstehende K0 von der Form K + 1 wird beziehungsweise die entstehenden k0 und l0 dasselbe Zeichen bedeuten. Denn gäbe es einen solchen Beweis, so kürze ihn. Der gekürzte Beweis sei 1.) ein Beweis für K = 1. Wie S. I–II zeigt, haben wir dann nur nötig S. II 34 das Axiom 8 34 zu berücksichtigen, was nicht angeht, ferner 9, wo aber vorher K = L und 1 = L bewiesen sein müsste. Da Kürzung nicht möglich sein soll, so müssen K, L dasselbe Zeichen bedeuten und dann wäre 1 = L d. h. 1 = K vorher zu zeigen gewesen, was der Kürzung widerspricht. 2.) ein Beweis für 1 = K; ebenso, vorher wäre 1 = L und K = L zu beweisen und da L dasselbe bedeuten müsste wie K, so wie vorhin. 3.) ein Beweis für k = l. Dann wie immer, nur dass noch 12 zu berücksichtigen wäre; dazu aber wäre nötig vorher K = 1 zu beweisen, wo K nicht die Form K + 1 hat, da ja sonst die Thesis K = ε(K) + 1 in K + 1 = K + 1 übergeht, und also auch aus 1 folgt. Jetzt ist der Widerspruchslosigkeitsbeweis auf verschiedene Weise leicht möglich, z. B. indem man zeigt, dass die Anwendung von 12 in jedem Beweise vermieden werden kann durch Ersatz ε(K + 1): K. Jetzt können wir aber mittelst einer Modifikation dieser Betrachtung den Widerspruchslosigkeitsbeweis für die Axiome 1–9 incl. 3 , 8 und 12 führen. Die Modifikation besteht darin, dass wir an Stelle von K = 1 setzen K = L und statt der Forderung, K0 solle die Form K + 1 haben, die Forderung setzen K0 d. h. der aus K durch die Substitution ε(a + 1): a entstehende Ausdruck solle aus L0 d. h. dem aus aus L durch die Substitution ε(a + 1): a entstehenden Ausdruck hervorgehen, indem man für ein Zeichen 1, das in L0 vorkommt, einmal K + 1 einsetzt; oder die Forderung L0 solle aus K0 hervorgehen, indem man für ein Zeichen 1, das in K0 vorkommt, einmal L + 1 einsetzt. Nun kann man wie früher die Widerspruchsfreiheit auch noch incl. 10, 11 beweisen, so dass also die Axiome 1–12 definitiv garantirt sind. Wir fügen jetzt das Axiom 13.) a + (b + 1) = (a + b) + 1 hinzu. Im Widerspruchsbeweise käme m + (k + 1), nicht aber m + (k + 1) + 1 vor, wo m nicht das Zeichen 1, sondern irgend ein Kurzzeichen ist, das nicht 1 bedeutet, etc. genau, wie auf S. IIII, wo nur statt 1 + (k + 1) beziehungsweise (1 + k) + 1 stets m + (k + 1) beziehungsweise (m + k) + 1 zu setzen ist. So hat man alle Zeichen m + b beseitigt, ebenso m + b etc. bis alle
VIII
31–31 Added. 32–32 Added. 33–33 Added. 34–34 Substituted
for: auch noch die Axiome 8, 8 , 12
15
20
25
30
35
40
‘Consistency Proofs for Fragments of Arithmetic (Undated Draft)’
5
10
15
20
405
wirklich vorkommenden Symbole a + b beseitigt sind. Nun fügen wir die Formel 14.) a + (b + c) = (a + b) + c hinzu. Um diese als widerspruchsfrei zu erkennen, müssen wir dasselbe erst von den Formeln thun: 15.) a = b → c + a = c + b 15 .) c + a = c + b → a = b 16.) a = b → c + a = c + b 16 .) c + a = c + b → a = b ∗) Wir gehen genau wie mit 3, 3 , 8, 8 vor, indem wir den Beweis der Widerspruchslosigkeit schon vor 10. führen. Ebenso könnten wir gleich hinzufügen a=b → a+c=b+c a+c=b+c → a=b a = b → a + c = b + c a + c = b + c → a = b thun das aber nicht, weil wir diese Sätze hernach 35 auf Grund des commutativen Gesetzes a + b = b + a 35 beweisen können. Wir 36 zeigen nun für alle Axiome 1–16 zugleich die Widerspruchsfreiheit—analog wie bei Axiom 13. Im Widerspruchsfreiheitsbeweise gegen Axiome 1–16 käme l + (k + h), wo l, k, h bestimmte Kurzzeichen sind, vor, nicht aber l + ((k + h) + h ); dann kann 14 gerade noch fuer a : b, b : k, c : h angewandt sein und nun überall im Beweise, wo es vorkommt, l + (k + h) durch (l + k) + h zu ersetzen ist. Nun kann dieser Ausdruck l + (k + h) in 14 nur links entstehen, wie vorhin angegeben, nicht aber rechts weil ja dann a : l, b : k + h, c : h gesetzt sein müsste und dann stände links der verbotene Ausdruck. 36 Vielmehr fügen wir noch ∗) Added in space in the top margin, and written upside down: Uebrigens wären schon früher die Axiome a = b → 1 + a = 1 + b möglich gewesen, wohl als Beispiel, = ← = aber nicht notwendig. 35–35 Added. 36–36 The
text beginning with ‘zeigen’ and ending with ‘verbotene Ausdruck’ was written by Hilbert on a small, separate piece of paper (sheet 5), and was originally pasted to p. VIII. It replaces the following text: Im Widerspruchsbeweise gegen 14 käme (m+l)+(k +1), wo m, l, k bestimmte Kurzzeichen sind, vor, nicht aber (m + l) + ((k + 1) + 1) etc. wie S. V. Es ist also überall (m + l) + (k + 1) durch ((m+l)+k)+1 zu ersetzen. Wenn nun aber 14 gerade für a: m, b: l, c: k + 1 angewandt wird, so würde Einsetzen durch das vorgeschriebene wegen (m+l)+(k+1) = m+ l+(k+1) die Formel (m + l) + k + 1 = m + l + (k + 1) entstehen und diese Formel brauchen wir, um unseren Beweis gültig zu machen. Wir beweisen sie nun aus 14 für c: k und 13.) wie folgt: ↑1.↓ (m + l) + k = m + (l + k) nach 14 ↑2.↓ (m + l) + k + 1 = m + (l + k) + 1 nach 3 ↑3.↓ m + (l + k) + 1 = m + (l + k) + 1 (nach 13) ↑4.↓ (m + l) + k + 1 = m + (l + k) + 1 nach 2 ↑5.↓ l + (k + 1) = (l + k) + 1 (nach 13) → m + l + (k + 1) = m + (l + k) + 1 (nach 15) ↑6.↓ m + l + (k + 1) = m + (l + k) + 1 nach 15 ↑7.↓ (m + l) + k + 1 = m + l + (k + 1) (nach 2) Dieses Stück ist in den Beweis einzuflicken. This remark refers to lines 6. and 7. of a different configuration; see the Textual Note concerning the above proof. Wenn aber (m + l) + k im Beweise nirgends vorkommt, so erreichen wir die Gültigkeit des Beweises, wenn wir überall (m + l) + (k + 1) durch m + (l + k + 1) ersetzen dann kommt 13 nicht vor, 14 aber ist erfüllt.
IX
406
Chapter 2
Lectures on Logic (1920)
17.) a + b = b + a hinzu und zeigen nun für alle Axiome 1–17 zugleich die Widerspruchslosigkeit. Im Widerspruchslosigkeitsbeweise gegen 1–17 betrachten wir alle überhaupt vorkommenden 37 Ausdrücke a+b und in diesen alle Ausdrücke a, b einzeln, die wir (k) nennen wollen. Hierunter sei k ein solcher, der die Form k1 + k2 habe und ausserdem in einer bei Anwendung von Axiom 17 gewonnenen Formel vorkäme; diese Formel heisse also l + (k1 + k2 ) = (k1 + k2 ) + l. Wir wollen nun unseren Beweis so modifiziren, dass diese Formel nicht direkt aus 17 entnommen wird, sondern wie folgt bewiesen wird: (in abgekürzter Form!) 37 l + (k1 + k2 ) = (l + k1 ) + k2 = (k1 + l) + k2
X
= k1 + (l + k2 ) = k1 + (k2 + l) = (k1 + k2 ) + l Indem wir dies Stück in den Widerspruchsbeweis einfügen und eventuell das entsprechende Stück, wenn etwa noch l + (k1 + k2 ) = (k1 + k2 ) + l vorkommt, so erhalten wir einen Widerspruchsbeweis, in dem 17 jedenfalls nicht so angewandt wird, dass dabei für a oder b k1 + k2 genommen wird und in dem die Zeichen a oder b, auf welche 17 angewandt wird, sich sämtlich unter den (k) finden (nämlich l, k1 , k2 ). Diesselbe Verfahren werde nun auf den neuen Beweis fortgesetzt, bis unter den Zeichen a, b, auf die 17 angewandt wird, sich keines mehr befindet, dass noch zerlegbar d. h. von der Form k1 + k2 ist. Nun endlich setze man für diese unzerlegbaren Zeichen überall, wo sie im Beweise vorkommen, dasselbe Zeichen 1 ein. Dann bleibt der Beweis überall gültig, 17 aber wird dann überflüssig, da nur auf 1 und 1 angewandt. Erwähnt sei auch noch ein ganz anderer Weg die Widerspruchsfreiheit von 1–17 zu erkennen. Man lasse zunächst die Axiome 10, 13, 14 weg und zeige die Widerspruchsfreiheit so, dass man überall ε(K + 1) durch K ersetze: dann hat = die Bedeutung dasselbe, wobei aber immer a + b und b + a als derselbe Ausdruck gilt, und = die Bedeutung von verschieden im selben Sinne hat. Alsdann füge man die Axiome 10, 13, 14 hinzu und mache den Widerspruchsfreiheitsbeweis wie oben. Die Axiome 18, 18 (Definition von > !) können keinen Widerspruch hervorrufen; denn mit ihrer Hülfe könnte nur die Gleichung k + l = k + ε(l, k) oder l = ε(l, k) abgeleitet werden; wenn man aber überall im Beweise an Stelle von ε(l, k), wo und wenn etwa genau dies Zeichen im Widerspruchsbeweise auftritt, l einsetzt, so ist diese Folgerung auch ohne 18, 18 erfüllt etc. Satz a = 1 → a > 1. Satz a > b → (b > c) → (a > c) (1) k > l → k = l + ε(k, l) (nach 18 ) (2) l > m → l = m + ε(l, m) " (3) l = m + ε(l, m) → l + ε(k, l) = (m + ε(l, m)) + ε(k, l) k > l → (l > m) → k = m + ε(l, m) + ε(k, l) 37–37 Substituted
for: Ausdrücke a + b und in diesen die Zeichen b. Noch giebt es nach unseren Annahmen über eine Figur beziehungsweise einen Beweis gewiss ↑unter diesen Ausdrücken↓ einen solchen K: k1 + k2 , so dass im Beweise weder ein Ausdruck K + h noch ein Ausdruck l + K mehr vorkommt. Dann kann 14 gerade noch für a: k1 b: k2 , c: h angewandt sein. 14 wird nämlich k1 + (k2 + h) = (k1 + k2 ) + h
5
10
15
20
25
30
35
40
‘Consistency Proofs for Fragments of Arithmetic (Undated Draft)’
10
15
20
25
30
35
40
{ } → k = m + ε(l, m) + ε(k, l) k = m + ε(l, (nach 18) m) + ε(k, l) → k > m k > l → (l > m) → k > m Satz a > 1 → a = 1 k > 1 → k = 1 + ε(k, 1) 1 + ε(k, 1) = 1 (nach 7) etc. Dagegen Axiom 19 ist nicht direkt beweisbar. Man muss zeigen, dass es auf keinen Widerspruch führt und das tut man, indem man es schon vor 17 einschaltet genau wie auf S. VII; wo die Widerspruchsfreiheit für 1–12 excl. 10, 11 bewiesen ist mit Berücksichtigung der Bemerkung auf S. VIII wonach 14, 15 noch mitzunehmen sind. Nur ist auf S. VII unten die folgende Modifikation anzubringen: indem man für ein oder mehrere Zeichen p, die in L0 vorkommen einmal oder mehrere Male p + q einsetzt oder die Forderung L0 solle aus K0 hervorgehen, indem man für ein oder mehrere Zeichen p, die in K0 vorkommen, einmal oder mehrere Male p + q einsetzt. Der Beweis gestaltet sich dann wie folgt. Wir zeigen, dass es weder einen Beweis für K = L noch für k = l giebt – es sei denn, dass wenn ε(a + 1) allemal durch a ersetzt wird, das dadurch aus K entstehende K0 aus dem entstehenden L0 hervorgeht, indem man für ein oder mehrere Zeichen p, die in L0 vorkommen, einmal oder mehrere Male p + q einsetzt oder ebenso L0 aus K0 hervorgehe beziehungsweise die aus k, l entstehenden Zeichen k0 und l0 dieselben Zeichen bedeuten. Denn gäbe es einen solchen Beweis, so kürze ihn. Der gekürzte Beweis sei 1.) ein Beweis für K = L. Wie S. I–II zeigen, haben S. II die Axiome 8, 8 , 16, 16 , 19 und andererseits wir dann nur nötig das Axiom 9 zu berücksichtigen. Man nimmt, wie ähnlich schon oft geschehen ist, alle diese Fälle durch. Bei 19 müsste vorher K0 = M0 + L0 bewiesen sein und wegen der angenommenen Gekürztheit des Beweises müssten K0 und M0 + L0 dieselben Zeichen sein; dann aber wäre K0 ein Zeichen, das aus L0 hervorgeht, indem man darin für L0 : M0 + L0 setzt; also ist unser Beweis nicht der gewünschte. 2.) ein Beweis für k = l. Dann wäre auch 12 zu berücksichtigen. Aber dazu müsste vorher k0 = 1 bewiesen sein, oder müsste wegen der Gekürztheit k0 aus 1 hervorgehen, indem man 1 (denn das ist das einzige p) durch q + 1 ersetzt. Dann aber wäre k0 = ε(k0 ) + 1 d. h. q + 1 = q + 1 eo ipso nach 1 erfüllt. (a > b) → a = b kann direkt aus Axiom 18 , 17, 19 bewiesen werden. 38 Ebenso a > b → (a = b + 1 → a > b + 1) Denn a = c + b = b + c, a = b + 1 → b + c = b + 1 → c = 1 → c = d + 1, a = b + d + 1 = b + 1 + d → a > b + 1. Satz (a = b) → (a ≯ b → b > a) Wenn irgendwo als richtige Formel k = l kommt, so ist entweder k von der Form l + m oder l von der Form k + m. Denn kürze den Beweis, so kann k = l ∞—
5
407
38 Hilbert actually writes ‘17 ’ in place of ‘17’. However, 17 is to be found neither in the text, nor in the list of Axioms. Moreover, Axiom 17, together with 18 and 19, is sufficient to establish the claim (a > b) → a = b.
XI
408
Chapter 2
Lectures on Logic (1920)
nur aus den Formeln . . . kommen. 39 Diskutire alle durch. Also giebt es keinen solchen Beweis. Nunmehr sieht man: Wenn es einen Widerspruch gäbe bei Benutzung der Formel unseres Satzes, so könnte man aus demselben auch einen solchen ohne diese Formel machen. Denn wie S. I–II. Also diese Formel ist dem Sinne nach richtig.
5
The unnumbered sheets 12 and 13 clearly belong to this manuscript; they are reproduced below, labelled ‘A’ and ‘B’ by the Editors. A
Axiome 1. 1 = 1
1 . a = a
2. a = c → (b = c → a = b) 3. a = b → a + 1 = b + 1
3 . a + 1 = b + 1 → a = b
10
4. Z(1) 5. Z(a) → Z(a + 1) 6. a = b → (Z(a) → Z(b)) 7. a + 1 = 1 8. a = b → a + 1 = b + 1
15
8 . a + 1 = b + 1 → a = b
9. a = c → (b = c → a = b)40 10. 1 + (a + 1) = (1 + a) + 141 11. 1 + a = a + 1 12. a = 1 × a = ε(a) + 1 13. a + (b + 1) = (a + b) + 1
20
12 . a = 1 → a = ε(a) + 1
14. a + (b + c) = (a + b) + c42 15. a = b → c + a = c + b 16. a = b → c + a = c + b
15 . c + a = c + b → a = b 16 . c + a = c + b → a = b
17. a + b = b + a 18. (a = b + c) → a > b 19. a = c + b → a = b
39 The
18 . a > b → a = b + ε(a, b)43
elliptical dots here are Hilbert’s. 9 was changed by Hilbert from: a = b → (a = c → b = c) 41 Axioms 10 and 12 are marked by a cross (similar to ‘×’), which precedes the number. 42 Axioms 14, 15, 16, and 17 are grouped together by a bracket which points to a remark added by Hilbert: durch Induktionsaxiom beweisen! 43 The ‘ε’ is overwritten by a ‘δ’; see n. 29 above. 40 Axiom
25
‘Consistency Proofs for Fragments of Arithmetic (Undated Draft)’
409
Def. von > 44 a = b → a > b b>a → a> b a > b → a = b+c 5
10
15
20
Sätze (a = b) → ((a > b) → (a < b)) (a = b) → ((a > b) → (b > a)) oder auch besser, da der drüberstehende Satz daraus folgt: (a < b) → (b > a) Ferner (b > a) → (a < b) a = b → b = a 18 beweisen? a > b → a = b a=b+c → a>b Satz 1. Satz 2. Satz 3.
(a = 1) → a = b + 1 Z(a) & Z(b) → Z(a + b) (a + b) + c = a + (b + c)
Beweis durch vollst. Indukt. " Richtig für b = 1 etc. " Richtig für c = 1
Satz 4.
a+b=b+a
"
Richtig für 1.) b = 1; a = 1 . . . 2.) b = 1 . . . 45
Satz 5. Satz 6.
(a + b = b + c) → a = b (a = 1) → a > 1
"
Richtig für c = 1
(a > b & b > c) → a > c (a > b) → a = b Beweis indirekt. Sei a = b; so folgt aus a = b + c b = b + c, also b = 1, etwa b = d + 1, so d + 1 = d + 1 + c, a = 1 + c. Satz 9. (a > b & a = b + 1) → a > b + 1 Beweis. Aus a = b + c und a = b + 1 folgt c = 1, c = d + 1, a = b + d + 1. 46 Beweis durch vollst. Induktion 46 Satz 10. a = b → a > b × a < b oder a = b × a > b × a < b a = 1. Es sei für a richtig, und beweise für a + 1 d. h. a + 1 = b 1.) a = b dann a + 1 = b + 1 und der Satz ist für a + 1 richtig. 2.) a > b, a = b + c, a + 1 = b + (c + 1) 3.) b > a b = a + 1, also nach Satz 9. a+1
25
30
44 The definition of ‘>’ is written to the right of the following theorems and completely enclosed by a circle. 45 The elliptical dots here and above are Hilbert’s. 46–46 Underlined by Hilbert and marked with an exclamation mark.
B
410
Chapter 2
Lectures on Logic (1920)
Textual Notes 396.10: 396.11: 396.12: 396n: 396n: 396n: 397.2: 399.9: 399.10: 399.18: 399.20: 400.3: 400.4: 400.25: 400.33: 400.36: 400.38: 400.39: 401.6: 401.6: 401.22: 401.23: 401.26: 401.36: 402.4: 402.6: 402.6: 402.9: 402.20: 402.24: 402.26: 402.29: 403.3: 403.4: 403n: 403n: 403n: 403n: 403n:
403n: 403n:
Eine] Substituted for: Die sind oder bedeuten] Substituted for: bedeuten (aber] Substituted for: d. h. in 2.] ↑in 2.)↓ sein ] Deleted: oder wenigstens eine Formel U → a = b kürzbar, last line of n. 6] Deleted: oder es müsste die Formel U → a = b bewiesen worden bereits bewiesen] Substituted for: SchlussFormel eines Beweise ausser 1.] Added. successive einander] Added. U → (k = l) . . . , dann aber] The manuscript originally read: Käme U → (k = l) aus Axiom 3, so müssten,] müssten 1 .)] 1 3 .)] 3 9.)] 9. nun] mun Verschiedenheitsaxioms] Uerschiedenheitsaxioms erreichen,] erreichen eventuell] ev. der] [[die Formel in das Ax]] der a: k] [[a = k + 1]]--↑a: k↓ für a: k im Beweis] [[im Beweis ↑für a = k↓]]--↑für [[a = k]]--↑a: k↓↓ im Beweis] Hilbert inserted the addition before ‘1 + k’; we assume this was an oversight. a: k] [[a = k]]--↑a: k↓ a: k + 1] [[a = k + 1]]--↑a: k + 1↓ a: k] [[a = k]]--↑a: k↓ ist,] ist 1 + k] [[k + 1]]--↑1 + k↓ a: k] [[a = k]]--↑a: k↓ wären] Substituted for: sind 12.)] 12. 12 .)] 12 indem . . . ausschliessen] Added. 12 ] Added. (K . . . 1)] Added. für 1–9] Added following ‘1–9’ and later crossed out: unter Ausschluss von 3 mittelst] mittest eventuell] ev. können,] können Statt k + 1 = 1 nehme ich allgemein K = 1.] ↑Statt k + 1 = 1 nehme ich allgemein K = 1.↓ Accordingly, ‘K’ replaces ‘k + 1’ in the next eight cases as well. These are not noted by the Editors. aber kürzbar] ‘kürzbar’ substituted for: wäre ja K = 1 auch zu beweisen also Kürzung a: 1,] a: 1
Textual Notes 403n: 403n: 403n: 403n: 404.2: 404.6: 404.7: 404.8: 404.8: 404.9: 404.9: 404.11: 404.16: 404.18: 404.27: 404.27: 404.29–30:
404.34: 404.34: 404.37: 404.37–38: 404.38: 404.38:
404.40: 404.40: 405.1: 405.3: 405.6–11:
405.9: 405.21: 405n:
406.1: 406.8: 406.9: 406.12: 406.14:
411
1 = k ,] 1 = k a: k + 1,] a: k + 1 a: k + 1,] a: k + 1 folgender:] folgender auf diesem Wege] Added. dass,] dass beziehungsweise] bez. ersetzen,] ersetzen das entstehende] Added. beziehungsweise] bez. die entstehenden] Added. Beweis] Beis 1 = K; ebenso, vorher] 1 = K ebenso vorher immer,] immer Forderung,] Forderung haben,] haben aus L durch die Substitution ε(a + 1): a entstehenden Ausdruck] In the original, only the ‘L’ is written explicitly; the rest is indicated by repetition marks to be the same as in the preceding line. beweisen] bewiesen definitiv garantirt] Substituted for: gara m + (k + 1)] ‘m’
substituted for: a m + (k + 1) + 1 ] ‘m’ substituted for: a nicht das Zeichen 1, sondern] Added. Kurzzeichen ist] The ‘ist’ following ‘Kurzzeichen’ was added by Hilbert (ink); this renders superfluous a subsequent ‘ist’ before the ‘etc.’ in the same sentence. This was not deleted by Hilbert, but has been omitted by the Editors. beziehungsweise] bez. beziehungsweise] bez. wirklich vorkommenden] Added. a + (b + c) = (a + b) + c] Substituted for: (a + b) + c = a + (b + c) 15.) . . . a = b] The order of the variables in all the sums is the result of a change in the original order, which is clearly indicated by Hilbert (ink). könnten] Substituted for: wollen stände] Alternative, but less likely, reading: stünde Im Widerspruchsbeweise . . . erfüllt.] Hilbert obviously laboured over this argument and listed the lines first in the order 5, 3, 1, 2, 4, 7 and 6. The equations
m + (l + k) + 1 = m + (l + k) + 1 nach 13 m + l + (k + 1) = (l + k) [[13]]--↑3↓ + 1 = l + (k + 1)
nach 15 m + (l + k) + 1 = m + l + (k + 1) were inserted between 4 and 7, and then crossed out. 17.)] 17 modifiziren] modifikiren entnommen] Substituted for: gewonnen eventuell] ev. erhalten] erreichen
412
Chapter 2
406.16: 406.20: 406.21: 406.22: 406.27: 406.28: 406.36: 406n: 407.22: 407.22: 407.23: 407.27–30:
Lectures on Logic (1920)
wird,] wird überall,] überall vorkommen,] vorkommen 1 und 1] Substituted for: 1 = 1 gilt,] gilt. den] die Satz ] Deleted above ‘Satz ’: Einschränkende Voraussetzungen über den Beweis beziehungsweise] bez. beziehungsweise] bez. entstehenden] entsehenden bedeuten] Substituted for: sind K0 = M0 + L0 . . . L0 : M0 + L0 ] In all three cases, Hilbert had originally written ‘L0 + M0 ’, but in each case clearly indicates the change in the ordering of the terms yielding ‘M0 + L0 ’.
Description of the Text
413
Description of the Text Collection: SUB Göttingen, Cod. Ms. D. Hilbert 602. Size: Sheets 1–4, 6–7 and 12–14 are approximately 33.0×21.0 cm; sheets 5, 8, and 11 are of smaller size, cut from larger sheets; sheets 9 and 10 are 21.0 × 28.0 cm, and written on the reverse of galley proofs for Volume 105 (1931) of Mathematische Annalen. Cover Annotations: — Composition: The folder consists of 14 loose sheets. Pagination: For Nachlaß cataloguing, the sheets have been numbered from 1 to 14. The written rectos and versos of the first 7 sheets were numbered from I to XI by Hilbert and written in the top right-hand and left-hand corners. These page numbers are reproduced in the text given above. The other pages were not numbered by Hilbert. Sheet 14 was originally numbered ‘3’ in the top right-hand corner (recto), possibly in Hilbert’s hand, but this number was crossed out in pencil. Original Title: There is no original title. The Verzeichnis of Hilbert’s Nachlaß lists a title for the folder Cod. Ms. D. Hilbert 602 as ‘Über Axiome’. This is presumably because the text on the first sheet (also on Hilbert’s p. I) begins with ‘Axiome’ centered at the top. This heading is then followed by a numbered list of six formulas, and it appears that ‘Axiome’ was intended as the heading only of this list, and is therefore appropriate neither as the title of the document reconstructed above, nor for the whole folder. Text: Only the content of sheets 1–8, and 12–13 is reproduced in this volume. (See section 6 of the Introduction to this text, p. 394 above.) Sheets 1–6 contain continuous text in Hilbert’s hand, on both recto and verso. Sheet 7 recto (p. XI) is only half filled, the verso is blank. The small sheet 5 was originally affixed by small strips of rubberised tape to sheet 4 recto (Hilbert’s p. VII) to cover a crossed-out section of text. All these pages are annotated heavily in blue ink and pencil, and there are frequent additions and crossings-out, often of large portions of text. Sheet 8 (written in black ink) appears to be the truncated bottom part of a page belonging to the reconstructed manuscript; it is reproduced in n. 8 above, p. 397. Sheets 9 and 10 are written in pencil with emendations in blue and black ink. Sheet 9 bears the title ‘Beweis-des-ε-Axioms’ in blue pencil, and has some writing running perpendicular to the title, including a section on the other half of the page with the heading ‘Beweis des-ε-Axiom [sic] aus dem η-Schema’. Sheet 10 contains the sentence ‘Anbei der Beweis-des-ε-Axiom [sic]’, written in black ink and underlined with blue pencil. The upper left-hand corner of the sheet contains a small rectangular box whose interior is coloured with red pencil. Sheets 9 and 10 almost certainly belong together; both are marked by a double cross sign (‘#’) in blue and red pencil; on sheet 10 this cross appears under the remark ‘Anbei der Beweis-des-ε-Axiom’, while on sheet 9 the cross is under the heading ‘Beweis des-ε-Axiom aus dem η-Schema’. The reverse of sheet 9 is a first galley proof with the heading ‘758 Pietrkowski 5’; it is a sheet from proofs for the article Pietrkowski 1931 (marked as received on 24 April 1931), corresponding to pp. 670–671 of the final publication. The verso of sheet 10 is also a galley proof, labelled ‘745 Hamburger 24’. This corresponds to pp. 461–462 of the article Hamburger 1931 (marked as received on 1 February 1931). (See also p. 394 above.) Sheet 11 is cut at the top and bottom, and is written in black ink, with corrections in pencil and with some blue pencil underlining. Sheets 12–14 are
414
Chapter 2
Lectures on Logic (1920)
written only on recto, mainly in black ink. Only Axioms 1 and 13, together with the beginning of Axiom 2 (‘2. a =’) (all on sheet 12) are written in blue ink. All these sheets carry a few corrections in pencil, with occasional underlining in blue pencil.
Photographic reproduction of Sheet 1 of Cod. Ms. D. Hilbert 602, p. I of the undated draft ‘Consistency Proofs for Fragments of Arithmetic’.
Chapter 3 Lectures on Proof Theory
‘Grundlagen der Mathematik’ (WS 1921/22) ‘Logische Grundlagen der Mathematik’ (WS 1922/23) ‘Logische Grundlagen der Mathematik’ (WS 1923/24)
Appendix: Kneser’s Mitschriften
Appendix: Bernays’s Note
W. Ewald and W. Sieg (eds.), David Hilbert’s Lectures on the Foundations of Arithmetic and Logic 1917–1933, DOI 10.1007/978-3-540-69444-1_3, © Springer-Verlag Berlin Heidelberg 2013
417
418
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Introduction The lectures in the Summer Semester of 1920 ended with consistency proofs for extremely weak fragments of arithmetic. The question, made explicit in the Introduction to Chapter 2 (see p. 296) was then this: Can these consistency proofs somehow be extended to establish the consistency of increasingly stronger and thus mathematically more interesting systems? The lectures of 1921/22 and 1922/23 give a resoundingly positive answer. However, the ‘extensions’ require a remarkable mathematical/logical and methodological breakthrough that leads to Hilbert’s proof theory and his finitist consistency programme. The evolution towards that breakthrough is only imperfectly reflected in Hilbert’s first foundational papers of the 1920s, namely the ‘Neubegründung der Mathematik’ of 1922 and the ‘Grundlagen der Mathematik’ of 1923 (Hilbert 1922b and Hilbert 1923a). The 1922 paper is based on lectures Hilbert gave in Copenhagen and Hamburg in the spring and summer of 1921; see n. 20 on p. 12. There he argued against the emerging intuitionism of Weyl and Brouwer and presented some genuinely proof-theoretic investigations. However, as will be pointed out below, it is quite clear that Hilbert’s views on the character of his metamathematical investigations were not yet fully developed. The 1923 paper is based on an address to the Deutsche Naturforscher-Gesellschaft in Leipzig presented on 22 September 1922. This is the first public formulation of the Hilbert Programme; here we find both an appropriate philosophical perspective and a secure sense of proof-theoretic techniques. As already noted above (p. 394), Bernays remarks in his survey of Hilbert’s work in 1935: With the formulation of proof theory which we encounter in the Leipzig lecture, the basic form of its structure had been achieved.1
However, Hilbert’s lectures illuminate and deepen our understanding of his essays of 1922 and 1923 and also allow us to see much more clearly how they relate to each other. Bernays wrote the official notes for the 1921/22 course, which are presented below. He also began an Ausarbeitung for the 1922/23 course, of which some thirty-three pages exist.2 There are handwritten notes by Hilbert for the lectures of 1922/23, and, we assume, for an extension into 1923/24. These are given below. In addition to this, we possess highly detailed Mitschriften by Hellmuth Kneser of all of these lectures from 1921 to 1924. His notes were taken down contemporaneously, and provide a week-by-week record of the lectures presented by Hilbert and (in 1922/23) Bernays, who shared the lecturing with Hilbert. This is extremely fortunate for various reasons. In the first place, Bernays’s Ausarbeitung for the 1922/23 course does not contain any of the proof-theoretic achievements of that semester (though Hilbert’s hand1 Bernays
1935 , 204. For the original German, see above, loc. cit. this was finished is not known; there is no trace of it in either the Hilbert Nachlaß or the Bernays Nachlaß. 2 Whether
Introduction
419
written notes give some detailed indications of proof-theoretic ideas), whereas Kneser’s notes do so in great detail. Secondly, there are important differences between the notes composed by Bernays and the Mitschriften of Kneser for the 1921/22 lectures, and this gives us an insight into the intellectual changes made between the lectures themselves and the time when the material was given its ‘official’ form by Bernays. (The main changes will be pointed out in this Introduction.) Thirdly, the Kneser Mitschriften give us a detailed sessionby-session record of three individual lectures Hilbert held in 1923/24. For all these reasons, Kneser’s Mitschriften are presented as Appendices to the Chapter, together with a fairly brief note in Bernays’s hand on a consistency proof for the simplest case of ‘logical choice axiom’ (i. e., the main axiom governing the ε-operator), and dating probably from 1923 or 1924.3 This Introduction covers both the official notes and Kneser’s Mitschriften, although there are separate Introductions for both these Mitschriften and Bernays’s Note giving some of the textual and editorial background. The Introduction to the Kneser Mitschriften also provides a reasonably detailed comparison of those Mitschriften with the ‘official’ notes, and also with another source of information about this series of lectures, namely a private Ausarbeitung of the lectures from 1922/23 written by Walter Peterhans.4 The correct historical order in which to read the documents in this Chapter is, therefore: Section I of Bernays’s ‘official’ record of the 1921/22 lectures; the part reproduced below of the Kneser Mitschrift for these lectures; the remainder of Bernays’s ‘official’ record; the Hilbert manuscript for 1922/23 and 1923/24; the Kneser Mitschrift for the 1922/23 lectures; what we have of Bernays’s Ausarbeitung for these lectures; the Kneser Mitschrift for the 1923/24 lectures. The purpose of this Introduction is to focus sharply on the proof-theoretic development, i. e., on the evolution of Hilbert’s project of giving syntactic consistency proofs for systems of arithmetic. That project started in Hilbert’s Heidelberg address of 1904, where such a proof was presented for a purely equational system of number theory; it was taken up for a minor reformulation of that system in the logic lectures for the Summer Semester of 1920, and then extended — with completely novel techniques — to a quantifier-free system (essentially primitive recursive arithmetic) in the Winter Semester of 1921/22. There are some first indications of how to treat quantifiers, and in the following Winter Semester these techniques are refined and serve as the basis for Hilbert’s broad vision on how to establish the consistency of analysis. Indeed, Ackermann’s Dissertation (Ackermann 1924a* ) and the resulting publication (Ackermann 1925 ) build directly on the accomplishments presented here. 3 Kneser’s
Mitschriften for 1922/23 and 1923/24 are presented in full, whereas only the second half of that for 1921/22 is given. 4 For more information, see p. 569.
420
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
1. Direct Proofs. The finitist consistency programme which we think of as characteristic of the Hilbert approach emerged only in the lectures given in the Winter Semester of 1921/22. The evolution towards this programme had already begun, however, in the lectures from the Summer Semester of 1920, when Hilbert returned to the syntactic approach advocated in the Heidelberg lecture. Section 7 of the notes from that semester contain a consistency proof for almost exactly the same fragment of arithmetic as that presented at Heidelberg sixteen years earlier. Its formulation is informed by the investigations of 1917/18: the language is more properly described; the basic vocabulary consists of variables a, b, . . . , non-logical constants 1, +, and all the numerals; = and = are relation symbols, and → is the sole logical symbol. The axioms are: 1=1 a=b→a+1=b+1 a+1=b+1→a=b a = b → (a = c → b = c) a + 1 = 1 Modus ponens and substitution are the inference rules, with the latter now applicable only to numerals and no longer to arbitrary sign combinations. The combinatorial argument is different from that given in the Heidelberg paper (Hilbert 1905b), mainly through the introduction (see p. 38) of the notion that a proof can be ‘shortened [ist kürzbar ]’: If one considers a proof with respect to a concretely exhibitable property which it has, then it is quite possible that the removal of some formulas in this proof still leaves us with a proof in the sense specified above which still possesses that particular property. In this case we wish to say that the proof can be shortened with respect to the given property.5
Hilbert establishes three lemmata. The first lemma claims that ‘a theorem can contain at most two occurrences of →’; the second asserts that ‘no statement of the form (A → B) → C can be proved’; and, finally, the third lemma states that ‘a formula a = b is provable only if a and b are the same term’. On the surface, Hilbert does not use an induction principle in the proofs of these lemmata. Playing on the double meaning of ‘kürzbar’, he compares the √ structure of the proof to that for the irrationality of 2. In that classical indirect argument, one starts out by assuming there are p and q, q = 0, √ such that 2 = p/q; without loss of generality p and q are then taken to be relatively prime, i. e., the fraction p/q is not ‘kürzbar’. The presentation of this metamathematical argument is simplified in the ‘Neubegründung’ lectures of 1921 (Hilbert 1922b, but see n. 20 on p. 12 for 5 See
above, p. 366.
Introduction
421
the dating to 1921), and the notion of ‘Kürzbarkeit’ is only implicit in the proof. Hilbert makes explicit, however, the strategic point of the modified argument (and the comparison with the classical proof of the irrationality of √ 2). In doing so, he insists that Poincaré has been refuted: [Poincaré’s] objection, that this principle [of complete induction] can be proved only by using complete induction itself, is unjustified and has been refuted by my theory.6
Is this to be taken in the strong sense that no induction principle is being used? Or is it perhaps that just a special procedure based on the construction and decomposition of numerals is appealed to which is by its very nature different from the full principle? From a mathematical point of view, Hilbert uses the least number principle which is equivalent to induction; it is used in a very elementary form, namely, just for purely existential claims. Hilbert’s main formal system includes rules for universal quantifiers; but since negation is available only for identities, existential quantifiers are not available. There are four kinds of rules for the universal quantifier (described more precisely on pp. 167–168 of the paper): first, any formula can be universally quantified, and the quantifier of a universally quantified formula can be dropped; secondly, bound variables can be renamed; thirdly, adjacent universal quantifiers in a prefix can be permuted; and, finally, if (b)(A → B(b)) is a subformula of some formula C, it can be replaced by (A → (b)B(b)), if b does not occur in A. In the second part of the essay7 , the theory is significantly expanded. The basic system is modified by replacing the axiom 1 = 1 with a = a, by including the axioms 1 + (a + 1) = (1 + a) + 1 and, for the predecessor function δ, a = 1 → a = δ(a) + 1. A schema for identity a = b → (A(a) → A(b)) is also added. (Here and below, upper case Roman letters are viewed as formula variables.) The really crucial expansion is the adjunction of the induction principle and certain logical principles to the basic theory; the logical axioms are intended to reflect the usual inference procedures. The induction principle is given in the form (a)(A(a) → A(a + 1)) → {A(1) → (Z(b) → A(b))}. The logical axioms are divided into two groups; those in the first group govern the conditional ‘→’, and those of the second group govern negation. The 6 The
original German passage (Hilbert 1922b, 161) reads:
[Poincarés] Einwand, dieses Prinzip [der vollständigen Induktion] könnte nicht anders als selbst durch vollständige Induktion bewiesen werden, ist durch meine Theorie widerlegt.
The reprinting in Hilbert 1935 adds the words ‘ist unberechtigt, und wird durch meine Theorie widerlegt’ after ‘bewiesen werden’. See loc. cit., p. 161. 7 The Editors of Hilbert’s Gesammelte Abhandlungen remark in n. 2 on p. 168 (of Hilbert 1935 ) that the consistency arguments stem from an earlier stage of proof theory, and that a new direction is taken in the second part of the paper. As remarked before, the Editors are not named, but it is a reasonable assumption that this remark stems from Bernays. See p. 19, n. 33 above and also the further references given there.
422
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
axioms for the conditional are as follows: A → (B → A) {A → (A → B)} → (A → B) {A → (B → C)} → {B → (A → C)} (B → C) → {(A → B) → (A → C)} . Negation is only available for equations and is thus treated in a restricted way: a = a → A, (a = b → A) → ((a = b → A) → A)). As to the restricted use of negation, Hilbert remarks that the formal system itself is to be kept constructive; thus, at this time, the final metamathematical direction of the programme has not yet been taken.8 8 For
instance, Hilbert emphasizes:
Hitherto, we have introduced no logical sign other than → and the universal quantifier; in particular, we have avoided formalising the logical operation ‘not’. This attitude towards negation is characteristic of our proof theory. There is a formal equivalent for the negation only in the sign =, through whose introduction inequality is expressed and treated just as positively as is equality, which is its counterpart. As far as content is concerned, negation is applied only in demonstrations of consistency, and then, in fact, only in so far as it corresponds to our basic point of view. If this fact is born in mind, then our proof theory at the same time also affords an epistemologically important insight into the meaning and the nature of negation. (Hilbert 1922b, 173.)
In the original German, the passage reads: Wir haben bisher außer dem Zeichen → und dem Allzeichen kein anderes logisches Zeichen eingeführt und insbesondere für die logische Operation „nicht“ die Formalisierung vermieden. Dieses Verhalten gegenüber der Negation ist für unsere Beweistheorie charakteristisch: ein formales Äquivalent für die fehlende Negation liegt lediglich in dem Zeichen =, durch dessen Einführung die Ungleichheit gewissermaßen ebenso positiv ausgedrückt und behandelt wird, wie die Gleichheit, deren Gegenstück sie ist. Inhaltlich kommt die Negation nur im Nachweise der Widerspruchsfreiheit zur Anwendung, und zwar nur, insoweit es unserer Grundeinstellung entspricht. Mit Rücksicht auf diesen Umstand bringt uns, wie ich glaube, unsere Beweistheorie zugleich auch eine erkenntnistheoretische wichtige Einsicht in die Bedeutung und das Wesen der Negation.
(We have quoted from the reprinting in the Gesammelte Abhandlungen (Hilbert 1935 , 173), which adds the words ‘und dem Allzeichen’ in the first line of the passage, and which appear to have been mistakenly omitted in the original.) When pointing out that the existential quantifier can be defined in ‘formal logic’ using the universal quantifier and negation, Hilbert says this: However, since negation ought to have no direct representation in our proof theory, here the formalisation of ‘there is’ is achieved by introducing individual function signs through a form of implicit definition in such a way that, as it were, ‘what there is’ is actually produced by a function. (Hilbert 1922b, 174.)
In the original German, the passage reads: Da aber in unserer Beweistheorie die Negation keine direkte Darstellung haben darf, so wird hier die Formalisierung von „es gibt“ dadurch erreicht, daß man individuelle Funktionszeichen mittels einer Art impliziter Definition einführt, indem gewissermaßen das, „was es gibt“, durch eine Funktion wirklich hergestellt wird.
The predecessor function δ is then discussed as the simplest example. In the 1923 paper, Hilbert acknowledges very briefly with reference to his 1922 ‘Neubegründung’ paper: In the paper cited previously, I avoided this sign. It has emerged that, for the current, somewhat altered way of presenting my theory, the use of the sign for ‘not’ represents no danger. (Hilbert 1923a, 152, n. 3.)
Introduction
423
After having described the axioms, Hilbert claims that they ensure that ‘all formulas and theorems of arithmetic can be obtained in a formal way’9 . When Hilbert 1922b was reprinted in Volume 3 of Hilbert’s Gesammelte Abhandlungen, the Editors commented on the alleged consistency proof. For instance, they remark that ‘a schema for the introduction of functions by recursion equations’ has to be added if Hilbert’s claim to be able to to obtain all the formulas and theorems of arithmetic is to be made good. (See Hilbert 1935 , 176, n. 1.) As to the extent of the consistency result itself, they assert that it holds only if the universal quantifier is excluded and the induction axiom is replaced by the induction rule. (See Hilbert 1935 , 176, n. 2.) Taking into account these modifications, consistency is thus in fact claimed for a theory that includes primitive recursive arithmetic. There is no indication of a proof, but the result can obviously not be obtained by extending the combinatorial argument sketched above for the purely equational fragment.
2. Finitist Proof Theory: Sentential Logic. The developments described in Section 1 continue as follows. In the Winter Semester of 1921/22, Hilbert and Bernays use novel techniques for the proof of the restricted result of the 1922 paper (Hilbert 1922b). The proof is presented in Kneser’s Mitschrift of these lectures for a minor variant of the system, still with the restricted treatment of negation. The proof-theoretic considerations are given in February of 1922, starting on 2 February and ending on 23 February. Thus, at the very beginning of 1922, the restricted consistency claim in Hilbert 1922b had been established.10 Bernays’s official notes for the 1921/22 lectures, however, contain a different kind of argument which applies only to the basic system (and variable-free formulas); this argument was evidently added after the conclusion of the lectures and is later reported in Hilbert 1923a. The Kneser Mitschrift of the 1922/23 lectures gives a third modification; the proof is examined in greater detail below. This work represents quite a new direction for proof-theoretic investigations and requires the partial resolution of both hard technical and deep methodological issues. The first group of issues includes in particular the treatment of quantifiers; this is crucial if consistency is to be established for the kind of formalisms that had been used in the 1917/18 lectures, and more In the original German, the passage reads: In meiner vorhin zitierten Abhandlung hatte ich dieses Zeichen noch vermieden; es hat sich herausgestellt, daß bei der gegenwärtigen, ein wenig veränderten Darstellung meiner Theorie der Gebrauch des Zeichens für „nicht“ ohne Gefahr geschehen kann. 9 The
remark cited comes from the following passage:
. . . so gelingt es lediglich durch Anwendung unserer Regeln, d. h. auf dem formalen Wege, den gesamten Bestand an Formeln und Sätzen der Arithmetik zu gewinnen. (Hilbert 1922b, 176.) 10 In this consistency proof, Hilbert and Bernays use a concept of ‘einsetzungsrichtig’, which corresponds roughly to ‘verifizierbar’ as introduced in the first volume of Grundlagen der Mathematik, i. e., Hilbert and Bernays 1934 .
424
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
generally those which are to represent classical mathematical practice. In Section 3 we describe Hilbert’s method of eliminating quantifiers from proofs of quantifier-free statements. The second group of issues concerns above all the extent of the metamathematical means (is contentual induction to be admitted?) and the character of the formal systems to be investigated (are they to be quasi-constructive?). The latter issue has a very simple technical resolution: it is addressed in the official lecture notes from 1921/22 by modifying the logical calculus, namely, replacing the (in-)equalities in the axioms for negation by (negations of) arbitrary formulas B. The axioms are now given in the form: B → (B → A) (B → A) → ((B → A) → A) With this emendation we have the system that is used in Hilbert 1923a; the first axiom expresses the principle of contradiction and the second the principle of tertium non datur. Though the technical resolution is straightforward, it required a new philosophical perspective, which is first articulated in Bernays 1922a. Bernays wrote his paper during the early autumn of 1921, just at the point at which the consistency programme was being formulated.11 The paper begins with a discussion of Hilbert’s existential axiomatics which always presupposes a system of objects satisfying the structural conditions formulated by the axioms. The assumption of such a system contains, Bernays writes, ‘something so-to-speak transcendental for mathematics, and the question arises which principled position one should take [towards that assumption]’.12 Bernays remarks that it might be perfectly coherent to appeal to an intuitive grasp of the natural number sequence or even of the manifold of the reals. However, that could obviously not be an intuition in any primitive sense, and one should take very seriously the tendency of the exact sciences to use, as far as possible, only restricted means for acquiring knowledge. These considerations lead to a programmatic demand: From this perspective, we are going to attempt to see whether it is possible to give a foundation for these transcendental assumptions in such a way that only primitive intuitive knowledge is used.13
Clearly, contentual mathematics is to be based on primitive intuitive knowledge and — for Bernays — an elementary form of induction. The Kneser Mitschrift for the 1921/22 lectures already illustrates the primary consequence of that attitude: the central metamathematical arguments all proceed by induction on proof figures. The official notes, prepared by Bernays at a somewhat later date, contain (on pp. 52–66; see below, pp. 463ff.) 11 See
Bernays’s letter to Hilbert of 17 October 1921. This letter is extensively cited in Sieg 1999 , 35–37. It contains in particular the ‘disposition’ for the forthcoming lectures of 1921/22; the disposition is to be found in n. 28 in the Introduction to this Volume, pp. 15ff. above. 12 Bernays 1922a, 10. For the original German, see p. 13 above. 13 Bernays 1922a, 11. For the original German, see p. 14 above.
Introduction
425
a substantial development of both finitist arithmetic and finitist logic; and finitist arithmetic involves from the very outset ‘contentual induction [anschauliche Induktion]’ (see pp. 56–57, p. 465 below). That step, although taken in Bernays 1922a, was not a small one for Hilbert. After all, in 1904 he had denounced Kronecker as a dogmatist because of his idea ‘that the integer, and indeed the integer as a general concept (parameter value), is directly and immediately given’14 . In the intervening years he had repeatedly scolded Kronecker for just this reason as not being radical enough.15 Bernays reports that Hilbert viewed this expansion of contentual arithmetic beyond the strict finitism adopted in the Winter Semester lectures of 1920 as a compromise (see above, p. 281), and it is indeed a compromise between a radical philosophical position and the intrinsic demands arising from the metamathematical investigations. But it is also a compromise in that it gives up the direct parallelism with the case of physics, when statements that can be verified by observation are taken to correspond to statements that can be checked by calculation. For the central steps of the consistency argument, we require one preliminary definition: a formula is called numeric if it is built up solely from the signs ‘=’, ‘ =’, the numerals, and the sentential logical connectives. The first step then transforms formal proofs with a numeric end formula into proofs that contain only closed formulas and which do not change the end formula. In the second step, these modified proofs are turned into configurations which, though they might not themselves be proofs, consist only of numeric formulas; this is achieved by ‘reducing’ the (necessarily closed) terms to numerals. Finally, all the formulas in these configurations are brought into conjunctive normal form and recognized syntactically to be ‘true’. Assuming that there is a formal proof of 0 = 0, the last observation would allow us to infer that the end formula of this proof is true. But 0 = 0 is not true; thus, 0 = 0 is not provable. This proof is given with many details in Bernays’s notes for the lectures in the Winter Semester of 1921/22, and it is also sketched in Hilbert’s Leipzig talk (see Hilbert 1923a, 157–158) and given again, in slightly modified form, during the Winter Semester of 1922/23, according to Kneser’s Mitschrift. For that semester, the papers Bernays 1922a, Hilbert 1922b, Bernays 1922b, and Hilbert 1923a were all available, as indicated explicitly by Kneser on p. 16 of his Mitschrift (see below, p. 611). Here we focus on the proof as recorded by Kneser. This proof is of real interest, since it presents the additional considerations for (primitive) recursive functions and (quantifier-free) induction, which are to be found neither in Bernays’s notes nor in Hilbert’s Leipzig lecture. 14 The
phrase is taken from the following passage:
. . . er [Kroneker] bildet sich die Auffassung, daß die ganze Zahl und zwar als Allegemeinbegriff (Parameterwert) direkt und unmittelbar da sei; . . . (Hilbert 1905b, 174.) 15 Hilbert’s most extensive discussion of Kronecker is found in the 1920 lectures ‘Probleme der mathematischen Logik’, reproduced in Chapter 2 of this Volume. See pp.18–21, above 353–355, in particular p. 355.
426
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
The system of Kneser’s Mitschrift uses also an interesting modification of the calculus for sentential logic: the connectives & and ∨ are now both incorporated in order to have a more convenient formal framework for representing informal mathematical arguments. The axioms for these connectives are presented on p. 17, Axioms 5.–10.) as follows: A&B →A A&B →B A → (B → A & B) A→A∨B B →A∨B (A → C) → ((B → C) → (A ∨ B → C)) The axioms correspond directly to the natural deduction rules for these connectives, and one finds here the origin of Gentzen’s natural deduction calculi. In a paper by Bernays from 1927, the methodological advantages of this calculus are discussed (and its semantic completeness is asserted). Bernays writes: The initial formulas can be chosen in very different ways. Here one has made a special effort to get by with the smallest possible number of axioms, and in this respect the limits of what is possible have indeed been reached. However, for the purposes of the logical investigation it is better to separate various groups of axioms from one another, as is done in the axiomatic presentation of geometry, in such a way that each group expresses the role of one logical operation.16
Bernays then lists the three groups of axioms, namely, the axioms for the conditional →, for & and ∨, and for negation . This formal system is also used in Ackermann 1925 , 4. Hilbert formulates it in ‘Über das Unendliche’ (see Hilbert 1926 , 178) and his Hamburg address of 1927 (see below, Appendix B, p. 924), but gives in these latter papers a slightly different formulation of the axioms for negation. The two axioms Hilbert calls the ‘principle of contradiction’ and the ‘principle of double negation’, viz.: A → (B & B) → A A → A. In the 1927 presentation, Hilbert states that the earlier axioms for negations can be derived easily. Returning to the consistency argument for the system of arithmetic as given in Kneser’s Mitschrift for the 1922/23 lectures, this is very concisely presented on pp. 19–22 (see below, pp. 614–616). Its form is very close to that in Hilbert 1923a, and the core idea is used in the first volume of Grundlagen der Mathematik (Hilbert and Bernays 1934 , §6b, 220–230). The first step 16 Bernays 1927 , 374, p. 10 in the republication. In the original German, this passage reads:
Die Wahl der Ausgangsformeln kann auf sehr verschiedene Weise getroffen werden. Man hat sich besonders darum bemüht, mit einer möglichst geringen Zahl von Axiomen auszukommen, und hat hierin in der Tat die Grenze des Möglichen erreicht. Den Zwecken der logischen Untersuchung wird aber besser gedient, wenn wir, entsprechend wie in der Axiomatik der Geometrie, verschiedene Axiomengruppen voneinander sondern, derart, daß jede von ihnen die Rolle einer logischen Operation zum Ausdruck bringt.
Introduction
427
turns the linear proof into a tree, so that any formula occurrence is used at most once as a premise of an inference (‘Auflösung in Beweisfäden’); this is preparation for the second step, namely, the elimination of all (necessarily free) variables (‘Ausschaltung der Variablen’); finally, the numerical value of the closed terms is effected (‘Reduktion der Funktionale’), and the truthvalues of the resulting formulas are determined. The very last step is taken without turning formulas into disjunctive normal form, but rather by truthtable computations. Following this, primitive recursively defined functions are admitted (pp. 25–26) and then also treated in the consistency argument (pp. 29–30). The rule of induction (for quantifier-free formulas) is added, but not incorporated into the argument, as it was in the Kneser Mitschrift for the 1921/22 lectures. Rather, induction is treated here on pp. 32 ff. as an axiom within the ‘transfinite’ extension of the system which is discussed in the following section, and that treatment, of course, is ‘problematic’. (For all the developments mentioned, see below, pp. 614–625.)
3. Finitist Proof Theory: Quantifiers. The considerations discussed above are all preliminary in the sense that they concern a theory that is part of finitist mathematics and thus need not be secured by a consistency proof. Ackermann presents them in Section II of his paper which has the heading ‘The consistency proof before the addition of the transfinite axioms [Der Widerspruchsfreiheitsbeweis vor Hinzunahme der transfiniten Axiome]’. As this title implies, the first, genuine expansion involves the transfinite axiom, which permits the treatment of quantifiers following Hilbert’s ‘Ansatz’. Already in Hilbert 1922b we find a cursory indication of the ‘Ansatz’, and it is significantly elaborated in Kneser’s Mitschrift of the 1921/22 lectures, just after the presentation of the consistency proof for the quantifier-free calculus. (See the lecture for 27 February 1922, beginning on p. 589 below.) Indeed, the treatment of quantifiers is the first of the three steps that have to be taken next; the second concerns general induction for number theory, and the third an expansion of the proof-theoretic considerations to analysis. At the end of 1922b, Hilbert introduces a functional κ which is applied to unary function variables f (from natural numbers to natural numbers). κ(f ) is 0, if f is 1 for all arguments, and otherwise yields the smallest argument for which f is not 1. Then it is claimed: In a similar way, a certain connected pair of functions τ and α can be introduced, which enable the thorough founding of the theory of real numbers, and in particular the demonstration of the existence of the upper bound for an arbitrary set of real numbers.17 17 Hilbert
1922b, 177. In the original German, the passage reads:
In ähnlicher Weise läßt sich ein gewisses Paar zusammengehöriger Funktionenfunktionen τ und α einführen, durch die die vollständige Begründung der Theorie der reellen Zahlen und insbesondere der Nachweis der Existenz der oberen Grenze für jede beliebige Menge reeller Zahlen möglich ist.
428
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
In the Kneser Mitschrift for the Winter Semester 1921/22, in the third ‘Notebook’, pp. 3ff (see p. 590 below), these functions τ (‘tertium non datur ’), and α (‘Auswahlfunktion’) are explicitly defined as follows: τ (f ) is 0, if f is 1 for all arguments; τ (f ) is 1 if it is possible to choose an argument α(f ), such that f (α(f )) = 1. On p. 4 (p. 590 below), Kneser reports Hilbert as asserting that: The theory of the functions τ and α is capable of replacing the operation with bound variables.18
Some use is made of these functions in the 1921/22 lectures; the approach is simplified in the Leipzig address of September 1922. In that talk, Hilbert sketched the proof-theoretic argument presented in the 1921/22 lectures. The genuinely novel aspect of the discussion is the treatment of quantifiers with a new τ -function which is essentially the dual of the later ε-operator. The new logical function τ associates with every predicate A(a) a particular object τa (A(a)) or simply, for short, τ A. It satisfies what Hilbert calls ‘the transfinite axiom’, namely A(τ A) → A(a); according to Hilbert, this axiom says that ‘[i]f a predicate A holds for the object τ A, then it holds for all objects a’.19 With the τ -axiom, it becomes possible to define the quantifiers, as follows20 : (a)A(a) ↔ A(τ A) (Ea)A(a) ↔ A(τ (A)). Hilbert then extends the consistency argument to the ‘first and simplest case’ going beyond the finitist system: this ‘Ansatz’ will evolve into the εsubstitution method. What are the central (meta-)mathematical advances in Hilbert’s Leipzig lecture when compared to the considerations in the lecture course from the Summer Semester of 1920? There are important steps: (i ) a detailed development of finitist number theory that includes ‘anschauliche Induktion’ and definition by recursion; (ii ) the distinction between ‘finite’ and ‘transfinite Logik’; the former includes classical sentential logic with → and , the latter full quantificational logic; (iii) a presentation of consistency proofs that involve transformations of derivations in which no quantifiers occur; (iv ) a method of eliminating quantifiers, and with it the possibility (so it was hoped), of extending the proof-theoretic methods to a logic with quantifiers. Thus, in the Leipzig talk, Hilbert gives proof theory its explicit formulation and provides it with its technical tools. The further development is quick and at the same time frustratingly limited. The ε-symbol replaced the symbol τ definitively in early 1923; this is clear from the Kneser Mitschrift 18 See
19 See
loc. cit. Hilbert 1923a, 156. In the original German, this reads:
Wenn ein Prädikat A auf den Gegenstand τ A zutrifft, so trifft dasselbe für alle Gegenstände a zu. 20 Hilbert credits Bernays with the recognition that the single function τ together with just the above transfinite axiom suffices to define the quantifiers. See Hilbert 1923a, 157, n. 5.
Introduction
429
for the lectures from the Winter Semester of 1922/23. Ackermann continued this proof-theoretic work directly in his dissertation (Ackermann 1924a* ); his paper, based on the dissertation, was submitted to Mathematische Annalen on 30 March 1924 and published in early 1925 (Ackermann 1925 ). The paper starts out with a concise review of Hilbert’s earlier considerations. The ε-calculus as we know it replaces the τ -calculus of 1922. Then, following the route indicated by Hilbert’s way of proceeding in the 1920, 1921/22 and 1922/23 lectures, as well as the 1923a paper, Ackermann proceeds to consider more complex axiom systems which include respectively full induction, introduction of functions by recursive definition, and functionals which make possible the development of the beginnings of analysis. At first, it was believed that Ackermann had established the consistency of arithmetic and full analysis. But a restriction was noted and added in proof (Ackermann 1925 , 9, n.∗ )). This restriction affects the ε-substitutions which can be carried out for function variables. Shortly thereafter, von Neumann clarified the restricted nature of the result in his paper von Neumann 1927 , entitled ‘Zur Hilbertschen Beweistheorie’. Von Neumann’s article was submitted on 29 July 1925, although not published until 1927. It provides a a consistency proof for a system that covers, so von Neumann asserts (p. 46), Russell’s system in Principia without the Axiom of Reducibility, or Weyl’s system of predicative analysis in Das Kontinuum (Weyl 1918 ). In a review of von Neumann’s paper in the Jahrbuch über die Fortschritte der Mathematik, Ackermann notes: In an Appendix, the author compares his results with those of W. Ackermann, who addressed the same problem in his article ‘Begründung des tertium non datur etc.’ [i. e., Ackermann 1925 ]; . . . . The author rightly points out that this article does not give a consistency proof for classical mathematics, but only for a narrower domain. However, he does not emphasize sufficiently that the results of his own work do not even secure the foundations of this narrower domain, since the consistency of complete induction and of the recursive functions is not shown.21
In a letter of 25 June 1925 from Cambridge, Ackermann sent to Bernays a corrected version of his proof, intended as a response to the difficulties revealed by von Neumann.22 This corrected version is discussed in Hilbert 1928a and Bernays 1928 , as well as Bernays’s letter to Weyl from January 1928, all of which are included in Appendix B to this Volume. (Ackermann never published his new proof, but it is presented in Volume 2, pp. 93–130, of Grund21 Ackermann
1927 , 41. In the original German, the passage reads:
In einem Anhang vergleicht der Verf. seine Ergebnisse mit denen von W. Ackermann, der sich in seiner Arbeit „Begründung des tertium non datur u.s.w.“ (Math. Ann. 93 (1924); F. d. M. 50, 23–24) mit demselben Problem befaßt hat. Verf. bemerkt mit Recht, daß in der genannten Arbeit noch kein Widerspruchsfreiheitsbeweis für die klassische Mathematik, sondern nur für einen engeren Bereich gegeben ist; er hebt aber nicht genügend hervor, daß die Ergebnisse seiner Arbeit auch die Widerspruchsfreiheit dieses engeren Bereiches nicht begründen, da die Widerspruchsfreiheit der vollständigen Induktion und der Rekursionsfunktionen nicht gezeigt wird. 22 The
letter can be found in the Bernays Nachlaß of the ETH in Zürich, under Hs 975:96.
430
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
lagen der Mathematik, i. e., Hilbert and Bernays 1939 , along with a detailed examination of the proof given in Ackermann 1925 . Moreover, the English translation of Bernays 1928 given in van Heijenoort 1967 is complemented by an illuminating introduction and an informative historical note; see p. 489, especially n. 3.) After Gentzen proved the consistency of arithmetic by transfinite induction up to the first epsilon number ε0 in his 1936 , Ackermann was able to extend his own proof to cover full number theory using the same transfinite induction principle; that proof was published in Ackermann 1940 and is presented in Supplement V of the second edition of Volume 2 of Grundlagen der Mathematik, i. e., Hilbert and Bernays 1970 . More recently the εsubstitution method has been reinvigorated, in particular, through the work of Mints and Tait; a broad survey is given in Avigad and Zach 2007 . Let us, however, return to the 1920s. The proof-theoretic results of Ackermann and von Neumann were the first to go beyond those obtained by Hilbert and Bernays in 1922. These results had been obtained by 1925: Ackermann’s paper was submitted for publication on 30 March 1924, and von Neumann’s on 29 July 1925. When giving his address ‘Über das Unendliche’ in Münster on 4 June 1925, Hilbert is rather vague about what actually had been achieved in proof theory hitherto, i. e., for which theories a finitist consistency proof had been given. Unfortunately, there are no lecture notes of Hilbert’s from the second half of the decade concerned with foundational issues or proof theory.23 There are, however, four papers of Hilbert’s that shed light on the developments in Göttingen, and these are reprinted below in Appendices B to E. They fall into two distinct groups: Hilbert’s lectures in Hamburg (July 1927) and Bologna (September 1928) constitute the first group, and the papers presented in Hamburg (December 1930) and Göttingen (July 1931) belong to the second group. It will be argued in the general Introduction to the Appendices A–E that the latter two papers can be seen as responses to Gödel’s work as details of this emerged during that period. Thus, in addition to discussing core parts of these papers, we will describe what was known about Gödel’s results to whom and at what time. This provides a nuanced picture of the impact of Gödel’s theorems on Hilbert and members of his School. Wilfried Sieg 23 We know that Hilbert gave full lecture courses on ‘Grundlagen der Mathematik’ in WS 1927/28 and on ‘Mengenlehre’ in SS 1929. Menzler-Trott indicates in his 2007 , n. 8, p. 22, that detailed notes of the set theory course are contained in the Nachlaß of Lothar Collatz, and on pp. 22–23, he gives a rough sketch of the content. Apart from their intrinsic interest, these notes might also be of some importance since Gentzen apparently attended Hilbert’s lectures along with his friend Collatz. In addition, Hilbert conducted a seminar on ‘Grundlagen der Mathematik’ in the Summer Semester of 1931; it would obviously be of special interest to know some facts about the latter. In the Winter Semester 1931/32, he also gave a course entitled ‘Einleitung in die Philosophie auf Grund moderner Naturwissenschaft’; although there are no lecture notes for this course, there does exist a handwritten Einlage for these lectures (SUB 607/1); this however contains only very general reflections. One manuscript which we do possess is that for ‘Über die Grundlagen des Denkens’, which we estimate stems from 1931. This is included in Chapter 4 of this Volume.
431
‘Grundlagen der Mathematik’ (1921/22)
Grundlagen der Mathematik (1921/22)
Inhalts-Übersicht Einleitung: Die axiomatische Methode und das Problem des Nachweises der Widerspruchsfreiheit eines Axiomensystems.
S. 1–5.
5
10
15
20
25
30
I. Bisherige Beweismethoden für Widerspruchsfreiheit. A. Methode der Aufweisung. Axiomatische Behandlung des Aussagen-Kalküls der mathematischen Logik. Einführung der Zeichen, Aufstellung der Grundformeln und Regeln, Beispiele für Ableitungen von Formeln. S. 5–8. Nachweis der Widerspruchsfreiheit, Beispiel eines Unabhängigkeitsbeweises; Zurückführung aller logischen Zeichen auf ein einziges. S. 9–13. B. Methode der Zurückführung. 1) Euklidische Geometrie. Nachweis der Widerspruchsfreiheit der Axiome durch die Methode der analytischen Geometrie; genauere Ausführung betreffend das Vollständigkeitsaxiom; Beweis der Vollständigkeit des Axiomensystems. S. 14–20. Das Parallelenaxiom; Legendresche Sätze über die Winkelsumme im Dreieck; Nicht-Euklidische Geometrie dargestellt in der Halbebene; Bemerkung zur sphärischen und elliptischen Geometrie. S. 20–28. Das Archimedische Axiom: Nicht-Archimedische Geometrie; der Satz von der Zerlegungsgleichheit zweier inhaltsgleicher Polygone, bewiesen mit Hülfe des Archimedischen Axioms; Ungültigkeit des Satzes bei Weglassung dieses Axioms. S. 29–33. 2) Axiomatische Begründung der Thermodynamik. Adiabatische Zustandsänderung; Axiome für thermisches Gleichgewicht; Einführung der Begriffe „Temperatur“; „Entropie“; „Wärmemenge“; Ableitung der fundamentalen Formeln. S. 34–45.
432
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Spezieller Fall des idealen Gases: Zustandsgleichungen, Formel für die spezifischen Wärmen, Bedingung für adiabatische Änderung. 3) Überblick über die mannigfachen axiomatischen Untersuchungen, welche nach der Methode der Zurückführung auf die Arithmetik angestellt sind. II. Das Problem der Widerspruchsfreiheit in der Arithmetik und die bisherigen Versuche zu seiner Lösung. A. Die elementare Zahlenlehre. Einführung der Zeichen; Addition und Multiplikation; „kleiner“ und „grösser“; Rechengesetze, anschauliche Induktion. Teilbarkeit, Division; Existenz von Primzahlen oberhalb jeder gegebenen Schranke; Rekursion. Zahl und Anzahl; Unabhängigkeit der Anzahl von der Reihenfolge der gezählten Gegenstände. Kennzeichnung der finiten Logik: allgemeine Urteile als hypothetische, Existenzsätze als Partialurteile; Ueberschreitung des finiten Standpunktes in den Schlüssen der Analysis. B. Versuche einer Zurückführung der Arithmetik auf die Logik. 1) Die unbeschränkte Handhabung der transfiniten Logik; Paradoxien. 2) Die Russellsche Theorie. Der logische Funktionenkalkül und seine Erweiterung; inhaltliche Präzisierung des Verfahrens, Unterscheidung der Stufen. Anwendung auf die Zahlentheorie: Anzahldefinitionen, Zahlengleichungen; Schwierigkeit beim allgemeinen Anzahlbegriff. Anwendung auf die Analysis: Definition der reellen Zahl, Grössenvergleichung, Addition; Satz von der oberen Grenze, formale Beweisführung, Schwierigkeit auf Grund der Stufenunterscheidung, Axiom der Reduzierbarkeit.
S. 45–47. 5
S. 48–51.
10
S. 52–58. S. 58–63. S. 63–66.
15
S. 66–69. 20
S. 69–75.
S. 76–84. 25
S. 85–88.
S. 88–100.
III. Die Begründung der Arithmetik durch die neue Hilbertsche Beweistheorie. 1) Einleitung: Gegenüberstellung von finiter und transfiniter Logik; Grundgedanke der Beweistheorie: das formalisierte mathematische Schliessen als Gegenstand einer finiten, anschaulichen Betrachtung. S. 1a–9a. 2) Die Anfangsgründe der Arithmetik vom Standpunkt der Beweistheorie. Einführung der Zeichen: Definition von „Funktional“, „Formel“, „Beweis“. S. 1–6.
30
35
40
‘Grundlagen der Mathematik’ (1921/22)
5
10
433
Untersuchung der Fragen der Beweisbarkeit: Rolle des Folgezeichens, Rolle der Negation, Anwendungen der Axiome der Gleichheit, beweisbare numerische Gleichungen und Ungleichungen. S. 6–16. Bemerkungen über die noch unvollständige Formalisierung der Logik. S. 16–18. Nachweis der Widerspruchsfreiheit: Umformung der Behauptung; Zuordnung der motivierenden Formeln, erste Umformung der Beweisfigur; Ausschaltung der Variablen; Reduktion der Funktionale. S. 19–28. Logische Umformung; Definition von „richtig“ und „falsch“; Feststellung der Richtigkeit sämtlicher Formeln in der erhaltenen Figur. S. 28–39.
434 1
2
3
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
In dieser Vorlesung möchte ich handeln von der Mathematik und den mathematischen Wissenschaften, d. h. denjenigen Wissenschaften, die der Mathematik benachbart sind oder in denen die Mathematik zur Anwendung gelangt und eine wesentliche Rolle spielt. Aber wir wollen uns nicht mit dem Inhalt dieser Wissenschaften, mit ihrer Materie als solcher beschäftigen, sondern die allgemeinen Fragen des Aufbaues und der Grundlegung erörtern. Und da ist es von vornherein eine allgemeine Forschungsmethode, die in allen diesen Wissenschaften eine besondere Bedeutung besitzt und heute immer mehr zur Geltung kommt: die axiomatische Methode. Mit dieser axiomatischen Methode hatte es ursprünglich folgende Bewandtnis: Wir finden in der Anschauung oder in der Erfahrung gewisse Arten von Gegenständen vor, und an diesen erkennen wir verschiedene Eigenschaften und Beziehungen. Solche aus der unmittelbaren Anschauung oder aus Beobachtungen entnommene Erkenntnisse bringen wir in Urteilen zum Ausdruck, und durch logisches Schliessen können wir aus den Urteilen weitere Erkenntnisse gewinnen. Indem sich auf solche Weise Erkenntnisse aneinanderreihen, bilden sich grössere Wissensgebiete, und die Urteile, von denen die Erkenntnisse eines solchen Gebietes ihren Ausgang nehmen, heissen Axiome. Eine strenge Wissenschaft ist nach der ursprünglichen Auffassung nur von solchen Gegenständen möglich, über | die man vollkommen sichere Erkenntnisse hat, die man als Axiome zugrundelegen kann, und von denen sich dann die Gewissheit vermittels der logischen Schlussfolgerungen auf die abgeleiteten Lehrsätze überträgt. Als Beispiel einer solchen strengen Wissenschaft ist von altersher die Geometrie berühmt. Die Geometrie als die Lehre von den Eigenschaften der Raumgebilde geht von den anschaulichen Erkenntnissen über Punkte, Geraden und Ebenen aus, die von Euklid zu einem Axiomensystem zusammengestellt sind. Gleichermassen hat auch die Mechanik, die Lehre von den Bewegungen der Masse unter dem Einfluss von Kräften, als Muster einer absolut sicheren Wissenschaft gegolten, und ihre Axiome (Satz von der Erhaltung der Masse, Trägheitsgesetz, Gesetz der Gleichheit von Wirkung und Gegenwirkung) wurden, wenn auch nicht als anschaulich, so doch als völlig gewiss und unumstösslich angesehen. — Die weitere Entwicklung der exakten Wissenschaften brachte eine wesentliche Umgestaltung der axiomatischen Methode mit sich. Einerseits fand man, dass die als Axiome zugrundegelegten Sätze keineswegs alle so über jeden Zweifel erhaben sind, dass keine Meinungsverschiedenheit möglich ist. Insbesondere wurde ja im Gebiete der Geometrie schon frühzeitig die Evidenz des Parallelenaxioms in Frage gezogen. Andererseits ergab es sich beim Fortschreiten der physikalischen Forschung ganz von selbst, dass man bewusstermassen in der Form von Axiomen auch blosse Hypothesen zur Grundlage theoretischer Entwicklungen nahm. Auf diese Weise bildete sich die Einsicht heraus, dass das Wesentliche an der axiomatischen Methode nicht in der Gewinnung einer absoluten Sicherheit besteht, die auf logischem Wege von den Axiomen auf die Lehrsätze übertra-
5
10
15
20
25
30
35
40
45
‘Grundlagen der Mathematik’ (1921/22)
5
10
15
20
25
30
35
40
45
435
gen wird, sondern darin, dass die Untersuchung der logischen Zusammenhänge von der Frage nach der sachlichen Wahrheit abgesondert wird. Unter diesem Gesichtspunkt stellt sich die Methode des axiomatischen Aufbaues einer Theorie dar als ein Verfahren der Abbildung eines Wissensgebietes auf ein Fachwerk von Begriffen, welche so geschieht, dass den Gegenständen des Wissensgebietes die Begriffe und den Aussagen über die Gegenstände die logischen Beziehungen zwischen den Begriffen entsprechen. Durch diese Abbildung wird die Untersuchung von der konkreten Wirklichkeit ganz losgelöst. Die Theorie hat mit den realen Objekten und mit dem anschaulichen Inhalt der Erkenntnis gar nichts mehr zu tun; sie ist ein reines Gedankengebilde, von dem man nicht sagen kann, dass es wahr oder falsch ist. Dennoch hat dieses Fachwerk von Begriffen eine Bedeutung für die Erkenntnis der Wirklichkeit, weil es eine mögliche Form von wirklichen Zusammenhängen darstellt. Die Aufgabe der Mathematik ist es, solche Begriffsfachwerke logisch zu entwickeln, sei es, dass man von der Erfahrung her oder durch systematische Spekulation auf sie geführt wird. Hier erhebt sich nun die Frage, ob denn jedes beliebige Fachwerk ein Abbild wirklicher Zusammenhänge sein | kann. Eine Bedingung ist dafür jedenfalls notwendig: Die Sätze der Theorie dürfen einander nicht widersprechen, das heisst, die Theorie muss in sich möglich sein, somit entsteht das Problem der Widerspruchsfreiheit. Dieses Problem ist das wichtigste und schwierigste bei der Untersuchung von Axiomensystemen. Auch ordnen sich die übrigen axiomatischen Fragen dem Gesichtspunkte der Widerspruchsfreiheit unter. Z. B. die Frage der Vollständigkeit eines Axiomensystems ist folgende: Kann man noch weitere Sätze als Axiome hinzufügen, die keine Folge der vorherigen sind, ohne dass doch ein Widerspruch herbeigeführt wird? Ferner die Frage der Abhängigkeit, welche sich darauf bezieht, ob in einem Axiomensystem ein Axiom weggelassen werden kann, steht auch in engem Zusammenhang mit dem Problem der Widerspruchsfreiheit; denn durch die Erkenntnis, dass ein Axiom überflüssig ist, wird der Nachweis der Widerspruchsfreiheit wesentlich vereinfacht, indem dann nur noch die übrigen Axiome auf ihre Widerspruchsfreiheit geprüft zu werden brauchen. Ich möchte hier gleich zur Erläuterung ein paar Beispiele anführen. 1.) Für die elementare Zahlenrechnung hat man als Axiome die gewöhnlichen Rechengesetze. Diese bilden ein vollständiges Axiomensystem. Denn jede bestimmte Zahlengleichung ist entweder richtig und dann durch die Rechenregeln beweisbar, oder falsch und dann im Widerspruch mit einer beweisbaren Gleichung. 2.) Wenn man in der Theorie der reellen und komplexen Zahlen zu den üblichen Axiomen noch das weitere | Axiom hinzunimmt, dass jede algebraische Gleichung eine Wurzel hat, so ist dieses Axiom von den übrigen abhängig, und in dem Nachweis dieser Abhängigkeit besteht der Beweis des Fundamentalsatzes der Algebra. Nach dem Gesichtspunkt der Widerspruchsfreiheit will ich nun auch die Vorlesung orientieren und einteilen.
4
5
436
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Abschnitt I: Bisherige Beweismethoden für Widerspruchsfreiheit. A. Methode der Aufweisung.
6
7
Zu der einfachsten Methode eines Nachweises für Widerspruchsfreiheit werden wir geführt, wenn wir uns überlegen, warum bei der ursprünglichen Auffassung von der axiomatischen Methode das Problem der Widerspruchslosigkeit gar nicht auftrat. Der Grund ist offenbar der: Es waren ja die Gegenstände gegeben, für welche die Axiome zutrafen. In der Tat, wenn man ein System von Dingen aufweisen kann, auf welches die Axiome einer Theorie zutreffen, so ist deren Widerspruchsfreiheit erwiesen. Ein solcher Fall liegt z.B. vor bei dem Aussagenkalkül der mathematischen Logik. (Hierzu: Vorlesung über „Logik-Kalkül“, Winter 1920, S. 1–4.) 1 Die Gegenstände des Wissensgebietes, dessen Beziehungen der Aussagenkalkül zur Darstellung bringt, sind die Aussagen, welche hier durch Buchstaben X, Y , Z . . . bezeichnet werden. ’ Die Aussagen werden nicht in Satzteile zerlegt, sondern als ungetrenntes Ganzes genommen und in den Satz-Verbindun|gen mit „und“, „oder“, „nicht“, „folgt“ betrachtet. Ferner kommt es bei den Aussagen und ihren Zusammensetzungen immer nur darauf an, ob sie wahr oder falsch sind, ohne weitere Rücksicht auf ihren Inhalt. Die Theorie geht nun darauf aus, alle diejenigen Verknüpfungen von Aussagen, welche immer (d. h. bei beliebiger Wahl der einzelnen Aussagen) richtig sind. Ein Satz der Theorie besteht in der Aussage, dass eine bestimmte Aussagenverknüpfung immer richtig ist. Die axiomatische Form der Theorie wird nun erhalten, indem man unter den Sätzen der Theorie, bzw. unter den immer richtigen Aussagenverknüpfungen, eine Auswahl trifft, und dann Regeln angibt, nach denen sich alle übrigen immer richtigen Aussagenverknüpfungen aus jenen ableiten lassen. Diese Regeln spielen im Logikkalkül die Rolle, welche sonst in den mathematischen und physikalischen Theorien das logische Schliessen hat.1) Ich will nun ein solches Axiomensystem angeben. Hierbei werden nur zwei logische Zeichen als Grundzeichen genommen: „ “ (Zeichen für „nicht“) „∨“ (Zeichen für „oder“). Die Zeichen „&“ (Zeichen für „und“) und „→“ (Zeichen für „folgt“) werden als Abkürzungen eingeführt, nämlich X & Y soll Abkürzung sein für X ∨ Y X → Y soll Abkürzung sein für X ∨ Y . Das System, welches ich aufstelle, hat vier Axiome. Von folgenden vier Aussagenverknüpfungen wird behauptet, dass sie immer richtig sind: 1)
Dass das gewöhnliche logische Schliessen innerhalb des Logikkalküls nicht stattfindet, liegt in der Natur dieser Disziplin begründet, weil ja hier die logischen Beziehungen selbst den Gegenstand bilden. 1 These
lectures are reproduced in Chapter 2 above.
5
10
15
20
25
30
35
40
‘Grundlagen der Mathematik’ (1921/22)
(1) (2) (3) (4) 5
10
15
20
25
X X X X
437
∨ X ∨ X, ∨ (X ∨ Y ), ∨ Y ∨ (Y ∨ X) ∨ Y ∨ Z ∨ X ∨ (Z ∨ Y )
Dass diese Zusammensetzungen in der Tat immer richtige Aussagen ergeben, sieht man am besten, wenn man in die Formeln das Abkürzungszeichen → einführt. Sie lauten dann: (1 ƍ) (2 ƍ) (3 ƍ) (4 ƍ)
X ∨X →X X →X ∨Y X ∨Y →Y ∨X (X → Y ) → (Z ∨ X → Z ∨ Y )
(aus X oder X folgt X) (aus X folgt X oder Y ) (aus X oder Y folgt Y oder X) (wenn aus X folgt Y , dann folgt aus Z oder X auch Z oder Y ).
Das weitere Ableiten von Formeln geschieht nun nach folgenden Regeln: 1.) Für jedes Aussagezeichen X, Y , Z, . . . kann irgend ein anderes solches Zeichen oder irgend eine (mit Hilfe der logischen Zeichen gebildete) Zusammensetzung solcher Zeichen eingesetzt werden. 2.) Wenn X und X ∨ Y immer richtige Aussagen sind, so ist auch Y eine immer richtige Aussage. Mit Hilfe dieser beiden Regeln — so behauptet der Logikkalkül — werden aus den vier vorangestellten Aussagen alle immer richtigen Aussagen, und auch nur diese, erhalten. Wie die Ableitung von immer richtigen Formeln aus den Axiomen geschieht, will ich an ein paar Beispielen zeigen: Setzt man in der Formel (4ƍ ) an Stelle von Z ein Z, so erhält man (X → Y ) → (Z ∨ X → Z ∨ Y ), oder, mit Anwendung des Zeichens → als Abkürzung: (X → Y ) → (Z → X) → (Z → Y ) . Diese Formel drückt die bekannte Schlussregel aus:
30
„Wenn aus X folgt Y und aus Z folgt X, so folgt aus Z auch Y .“ Die einfachste immer richtige Formel ist X ∨ X, bzw. X → X. Zu dieser gelangt man folgendermassen: Man setzt zunächst in der Formel (2) für Y ein X. Dadurch erhält man: X ∨ (X ∨ X).
35
Sodann ersetzt man in der Formel (4) erst X durch X ∨ X, dann Y durch X und Z durch X; dann ergibt sich: X ∨ X ∨ X ∨ X ∨ (X ∨ X) ∨ (X ∨ X) . Da X ∨ X ∨ X mit der immer richtigen Formel (1) übereinstimmt, so erhält man, nach der zweiten Regel:
40
X ∨ (X ∨ X) ∨ (X ∨ X),
8
438
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
und da X ∨ (X ∨ X) als immer richtige Formel abgeleitet ist, so erhalten wir durch nochmalige Anwendung der zweiten Regel: X ∨ X. 9
10
Nun handelt es sich darum, auf diese formale Theorie des elementaren Logikkalküls die Fragestellungen und Betrachtungsweisen, welche der axiomatischen Methode eigentümlich sind, anzuwenden. Da ist die erste und wichtigste Frage die der Widerspruchsfreiheit. Es kommt darauf an, zu zeigen, dass es unmöglich ist, mit Hülfe des Kalküls zwei Formeln von Aussagen abzuleiten, die in der Beziehung des Gegenteils zueinander stehen, die also ein Aussagenpaar X, X bilden. Um dies einzusehen, verfahren wir folgendermassen: Wir fassen die Aussagezeichen X, Y , Z . . . als arithmetische Variable auf, für welche nur die Werte 0, 1 in Betracht kommen. X ∨ Y deuten wir als das arithmetische Produkt, und X erklären wir so, dass 0 bedeutet 1 und 1 bedeutet 0. Hiernach stellen unsere beiden logischen Grundzeichen arithmetische Funktionen dar, nämlich „∨“ eine Funktion zweier, „ “ eine Funktion einer Variablen; und zwar sind diese beiden Funktionen nur der Werte 0 und 1 fähig. Zu beachten ist, dass wir uns bei dieser arithmetischen Interpretation nicht etwa auf die Widerspruchsfreiheit der Zahlentheorie zu berufen brauchen; denn da ja nur zwei Werte für die Variablen zugelassen werden, so haben wir ein endliches, vollkommen überblickbares System von Definitionen vor uns. An Hand der gegebenen Deutung können wir nun eine gemeinsame Eigenschaft aller derjenigen Formeln angeben, welche sich aus unseren Axiomen ableiten lassen. Diese besteht da|rin, dass auf Grund der arithmetischen Definitionen die Formeln für jedes in Betracht kommende Wertsystem der Variabeln den Wert 0 ergeben. Dass diese Eigenschaft zunächst den Formeln (1)–(4) zukommt, machen wir uns folgendermassen klar: Wir stellen durch Probieren fest, dass X ∨X immer den Wert 0 hat. Daraus folgt, dass auch X ∨ X ∨ X (Formel (1)) stets gleich 0 ist, weil X ∨ X immer denselben Wert hat wie X. Ferner hat X ∨ (X ∨ Y ) (Formel (2)) denselben Wert wie (X ∨ X) ∨ Y ist also stets 0, weil 0 ∨ Y stets gleich 0 ist. Da Y ∨ X stets den gleichen Wert hat wie X ∨ Y und X ∨ Y ∨ (X ∨ Y ) als Spezialfall von X ∨ X stets gleich 0 ist, so ergibt Formel (3) stets den Wert 0. Endlich liefert auch Formel (4) immer den Wert 0; nämlich für Z = 0 ist ein Faktor 0, und für Z = 1 hat Z ∨ X denselben Wert wie X, Z ∨ Y denselben Wert wie Y , sodass die ganze Formel denselben Wert ergibt wie X ∨ Y ∨ (X ∨ Y ), was wiederum ein Spezielfall von X ∨ X ist. Die Formeln der vier Axiome haben also in der Tat alle die genannte Eigenschaft. Bei der Anwendung der beiden Regeln bleibt aber diese Eigenschaft immer erhalten. Denn, was die erste Regel betrifft, so ist klar, dass durch Einsetzen eines Ausdrucks an Stelle einer Variablen der Wertevorrat für eine Formel jedenfalls nicht erweitert werden kann. Und wenn wir mit Hülfe der zweiten Regel aus zwei Formeln X und (X ∨ Y ) die Formel Y ableiten, so
5
10
15
20
25
30
35
40
45
‘Grundlagen der Mathematik’ (1921/22)
5
10
15
20
25
30
35
40
439
überträgt sich die Eigenschaft, immer den Wert 0 zu liefern, von jenen beiden Formeln auf die ab|geleitete Formel; denn da die Formel X immer den Wert 0 ergibt, so hat X immer den Wert 1, also hat X ∨ Y denselben Wert wie Y , und hiernach hat Y ebenso wie X ∨ Y immer den Wert 0. Wir sehen somit, dass tatsächlich mit Hülfe unseres Kalküls nur solche Formeln erhalten werden, die bei der arithmetischen Deutung immer den Wert 0 liefern. Indem wir dies feststellen, sind wir aber schon am Ziele unseres Nachweises. Denn offenbar können zwei Formeln X und X nicht beide die Eigenschaft besitzen, immer gleich 0 zu sein; vielmehr wenn X immer den Wert 0 hat, so hat X immer den Wert 1. Es lässt sich nun auch der Nachweis für die Vollständigkeit unseres Axiomensystems erbringen, d.h. man kann zeigen, dass alle immer richtigen Aussagenverknüpfungen, die sich mit den vier eingeführten logischen Zeichen bilden lassen, aus den Axiomen ableitbar sind. Hierauf will ich jedoch nicht eingehen. Dagegen will ich ein Beispiel eines Unabhängigkeitsbeweises geben. Nämlich ich will zeigen, dass die Formel (1) nicht aus den übrigen Axiomen abgeleitet werden kann, und zwar auch dann nicht, wenn man die Formel X ∨ X als Axiom hinzunimmt, sodass also die Formel (1) in dem axiomatischen System nicht durch die einfachere Formel X ∨ X ersetzt werden kann. Der Beweis geschieht wieder mit Hilfe einer arithmetischen Interpretation. Wir nehmen als Werte für die Variablen X, Y , Z, . . . die Restklassen 0, 1, 2 modulo 4. Das Zeichen „∨“ soll wieder die gewöhnliche Multiplikation darstellen, und X erklären wir durch die Festsetzungen: 0 bedeute 1, 1 bedeute 0, 2 bedeute 2. Man kann nun verifizieren, dass die Formeln X ∨ X, (2), (3), (4) bei der gegebenen Deutung für jeden in Betracht kommenden Wert der Variablen die Restklasse 0 ergeben, und diese Eigenschaft überträgt sich bei der Anwendung der beiden Regeln auf alle aus jenen vier Formeln abgeleiteten Formeln, — was man auf gleiche Art wie vorhin beim Beweise der Widerspruchsfreiheit einsieht. Wäre daher die Formel (1) aus (2), (3), (4) und X ∨ X mit Hilfe der Regeln ableitbar, so müsste X ∨ X ∨ X für jeden zulässigen Wert von X die Restklasse Null ergeben. Dies ist aber nicht der Fall. Denn setzen wir für X den Wert 2 ein, dann ergibt sich: 2 ∨ 2 ∨ 2, d. h. 0 ∨ 2, d. h. 1 ∨ 2, also 2 und nicht 0. Nach denselben Methoden kann man auch für jede der Formeln (2), (3), (4) ihre Unabhängigkeit von den übrigen Axiomen beweisen. — Beiläufig möchte ich hier noch bemerken, dass man mit der Zurückführung der logischen Zeichen noch weitergehen kann, als es in dem aufgestellten Axiomensystem geschehen ist. Es gelingt nämlich das „Nicht“ und das „Oder“ auf die eine einzige logische Verknüpfung „weder X noch Y “ zurückzuführen, welche X/Y bezeichnet werden möge. In der Tat ist X gleichbedeutend mit X/X („weder X noch X“) und X ∨ Y gleichbedeutend mit dem Gegenteil von X/Y , also mit X/Y X/Y . Für X &Y was gleichbedeutend ist mit X/Y , („weder X noch Y “) hat man die Darstel lung X/X Y /Y .
11
12
440 13
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
(Man kann auch als Grundverknüpfung das Gegenteil von | X & Y , d. h. die Aussage „X nicht oder Y nicht“ nehmen. Durch diese Verknüpfung lassen sich gleichfalls X, X ∨ Y , X & Y ausdrücken.) Die axiomatische Behandlung des elementaren Logikkalküls sollte uns als Beispiel dienen für die Methode der Aufweisung. Die Beweise für Widerspruchsfreiheit und Unabhängigkeit geschehen hier dadurch, dass man den Kalkül mit Hülfe eines endlichen, überblickbaren Systems von Gegenständen und Verknüpfungen interpretiert. Weit häufiger wird bei der axiomatischen Untersuchung von Theorien ein indirektes Verfahren der Aufweisung angewendet, welches darin besteht, dass man innerhalb einer anderen Disziplin Beziehungen aufweist, welche den in der betrachteten Theorie vorliegenden Beziehungen vollkommen entsprechen. Damit ist dann die Widerspruchsfreiheit der betrachteten Theorie erwiesen unter der Voraussetzung, dass jene andere Disziplin widerspruchsfrei ist. Dies ist die Methode der Zurückführung.
5
10
15
B. Methode der Zurückführung.
14
Als ein erstes Beispiel für diese Methode will ich erwähnen, dass man die Frage der Widerspruchsfreiheit des Systems der komplexen Zahlen in der Weise zurückführt, dass man die komplexen Zahlen (a + ib) als Paare von reellen Zahlen a, b deutet, mit denen auf bestimmte Weise gerechnet wird. Dadurch stellt sich die Theorie der komplexen Zahlen als ein Teilgebiet der Theorie der reellen Zahlen dar. Und wenn man auch für die Theorie der reellen Zahlen den Beweis der Widerspruchsfreiheit noch keineswegs erbracht hat, ist es doch eine wichtige Einsicht, dass mit der Widerspruchsfreiheit | des Systems der reellen Zahlen auch diejenige des Systems der komplexen Zahlen feststeht. Besonders fruchtbare Anwendungen findet die Methode der Zurückführung bei der axiomatischen Untersuchung der Euklidischen Geometrie (Angabe der Axiome vgl. in der Vorlesung über „Prinzipien der Mathematik“, W. S. 1917/18, S. 4–18). 2 Die geometrischen Axiome werden in der üblichen Weise in fünf Axiomengruppen geteilt: I. Axiome der Verknüpfung II. Axiome der Anordnung III. Kongruenzaxiome IV. Parallelenaxiom (Euklidisches Axiom) V. Stetigkeitsaxiome: Axiom des Messens (Archimedisches Axiom) und Vollständigkeitsaxiom. Der Nachweis der Widerspruchsfreiheit geschieht nach der Methode der Zurückführung: indem man ganz ebenso wie in der analytischen Geometrie die geometrischen Objekte durch Gegenstände der Arithmetik (wie Zahlenpaare, Zahlentripel) und die geometrischen Beziehungen durch Gleichungen und Ungleichungen ersetzt, erhält man ein Teilgebiet der Arithmetik, dessen Beziehungen vollkommen die in der Geometrie vorliegenden Beziehungen wieder2 These
lectures are reproduced in Chapter 1 above.
20
25
30
35
40
‘Grundlagen der Mathematik’ (1921/22)
5
10
15
20
25
30
35
40
441
geben. Auf diese Weise ergibt sich die Widerspruchsfreiheit der Euklidischen Geometrie als eine Folge aus der (hier vorausgesetzten) Widerspruchsfreiheit der Arithmetik. (Nähere Ausführung für die Geometrie der Ebene vgl. „Prinzipien der Mathematik“, S. 19–23.) Ein Punkt bedarf hier freilich noch der genaueren Darlegung. Nämlich es muss bewiesen werden, dass in der analytischen Geometrie des Raumes das Vollständigkeitsaxiom der Geometrie erfüllt ist, vorausgesetzt, dass man, wie üblich, als Zahlsystem das System aller reellen Zahlen zugrundelegt. Indem wir den Nachweis für die Gültigkeit der übrigen geometrischen Axiome innerhalb der analytischen Geometrie als bereits erledigt annehmen, können wir folgendermassen argumentieren: Angenommen, es wäre das System der Punkte, Geraden und Ebenen, welches in der analytischen Geometrie des Raumes vorliegt, durch Hinzufügung neuer Punkte, Geraden oder Ebenen erweitert, und zwar so, dass die Axiome I–IV sowie das Axiom des Messens aufrecht erhalten blieben. Dann müsste jedenfalls ein neuer Punkt vorhanden sein. Denn auf einer neuen Gerade können nicht zwei alte Punkte liegen, weil diese ja eindeutig eine alte Gerade bestimmen: und ebensowenig können auf einer neuen Ebene drei alte Punkte liegen. A Wir können nun auch zeigen, dass in mindestens einer alten Ebene ein neuer Punkt liegen müsste. Denn es sei Q ein neuer Punkt, und A, B, C, D seien vier alte Punkte, die nicht in einer Ebene liegen. Dann bestimmen A, B, C, jedenfalls eine alte Ebene α, und A, D, Q bestimmen eine Ebene β. Ist diese eine alte Ebene, so enthält sie den neuen Punkt Q, und unsere Behauptung trifft zu. Ist aber β eine neue Ebene, so folgt zunächst, dass α und β ausser dem Punkt A noch einen weiteren Punkt R gemeinsam haben. Hierbei können A, D, R | nicht auf einer Geraden liegen, weil sonst D in der Ebene α, also A, B, C, D in einer Ebene lägen, entgegen unserer Annahme. Hiernach wird die Ebene β durch A, D, R bestimmt, und da β eine neue Ebene ist, so können nicht A, D, R lauter alte Punkte sein; R ist also ein neuer Punkt, und dieser liegt in der alten Ebene α. In der Tat müsste es also eine alte Ebene mit einem neuen Punkt geben. Wir zeigen nun weiter, dass auch eine alte Gerade mit einem neuen Punkt auf ihr vorhanden sein müsste. Dazu betrachten wir eine alte Ebene mit einem neuen Punkt P . Es seien E, F , G drei alte PunkG te in der Ebene, die nicht auf einer Geraden lief e P gen. (Drei solche Punkte muss es ja jedenfalls S geben.) E und F mögen die Gerade g, E und G E g F die Gerade f , F und G die Gerade e bestimmen; Added vertically, in pencil, across the break between this paragraph and the foregoing, probably in Hilbert’s handwriting: Besser im Buch 3 A
3 The remark probably refers to the paragraph which begins here, since this and the first line of the next are enclosed in parentheses (pencil). See also the editorial n. 5 on p. 443 below.
15
16
442
17
18
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
dann sind e, f , g alte Geraden. Liegt also P auf einer dieser Geraden, so haben wir eine alte Gerade mit einem neuen Punkt. Gehört P keiner von den drei Geraden an, so betrachten wir die sechs Winkelräume, welche durch die Dreieckswinkel F EG, EF G, EGF und deren Scheitelwinkel bestimmt werden. Da diese zusammen die ganze Ebene ausfüllen, so muss mindestens eine der Geraden, welche den Punkt P mit je einer Ecke des Dreiecks EF G verbinden, die gegenüberliegende Seite des Dreiecks schneiden. Die Bezeichnung sei so gewählt, dass die Gerade P E die Seite F G, also die Gerade e im Punkte S schneidet. Ist dann S ein neuer Punkt, so ist e eine alte Gerade, welche einen neuen Punkt enthält. Ist aber S ein al|ter Punkt, so ist die Gerade ES eine alte Gerade, und auf dieser liegt der neue Punkt P . Somit sehen wir, dass es tatsächlich eine alte Gerade mit einem neuen Punkte geben müsste. Sei nun a eine solche alte Gerade und N ein neuer Punkt auf ihr. Gemäss den Axiomen der Anordnung teilt N die Gerade in zwei Hälften. Die alten Punkte auf a zerfallen demnach in zwei Klassen, derart, dass bei der analytischen Parameterdarstellung der Geraden diejenigen Werte des Parameters t, welche den Punkten der einen Klasse entsprechen, sämtlich kleiner sind als diejenigen Werte, welche den Punkten der anderen Klasse entsprechen. Da der Parameter t bei der Darstellung der alten Punkte auf der Geraden a sämtliche reellen Werte durchläuft, so ergibt sich aus der Einteilung der alten Punkte auf a eine entsprechende Einteilung aller reellen Zahlen in zwei Klassen, und aus der Stetigkeitseigenschaft des Systems der reellen Zahlen folgt, dass eine dieser beiden Klassen eine grösste bezw. eine kleinste Zahl enthalten müsste. Dies bedeutet aber geometrisch, dass es auf einem der beiden von N ausgehenden Halbstrahlen der Geraden a unter den alten Punkten einen zu N nächstgelegenen geben müsste. 4 Diese Folgerung steht jedoch im Widerspruch zu dem Archimedischen Axiom. Denn bezeichnet T jenen nächstgelegenen Punkt auf dem einen Halbstrahl und U irgend einen alten Punkt auf dem anderen Halbstrahl (sodass also N zwischen U und T liegt), so müsste nach dem Archimedischen Axiom eine hinreichend vielfache Abtragung der Strecke T N (von T aus in der Richtung nach U ) über den | Punkt U hinausführen. Angenommen, dies geschähe bei k-facher Abtragung, so würde man bei der Teilung der Strecke U T in k gleiche Teile mindestens einen Teilpunkt im Innern der Strecke N T erhalten, und zwar wäre dieser Teilpunkt ein alter Punkt, weil ja U und T alte Punkte sind. Es würde also ein alter Punkt zwischen N und T liegen, d. h. T wäre nicht ein nächstgelegener Punkt zu N . Somit ist es in der Tat unmöglich, das System der Punkte, Geraden und Ebenen der analytischen Geometrie zu erweitern, sofern die Axiome I–IV sowie das Axiom des Messens gültig bleiben sollen: d. h. die analytische Geometrie 4 Hilbert has added the following diagram in the margin and also, somewhat enlarged, on the reverse of the previous page:
A
N
Ba
Following this, in the next paragraph Hilbert has interlineated the letters ‘A’ and ‘B’ above ‘T ’ and ‘U ’ respectively, enclosing the first ‘U ’ and the first ‘T ’ in parentheses.
5
10
15
20
25
30
35
40
‘Grundlagen der Mathematik’ (1921/22)
5
10
15
20
443
des Raumes genügt dem Vollständigkeitsaxiom. Mit dieser Ueberlegung ist der Beweis für die Widerspruchslosigkeit der Euklidischen Geometrie zum Abschluss gebracht. 5 Die hier angewandte Methode der analytischen Geometrie, durch welche die Zurückführung auf die Theorie der reellen Zahlen gelingt, gestattet auch den Nachweis für die Vollständigkeit des Axiomensystems der Geometrie zu erbringen, wiederum unter der Voraussetzung, dass bezüglich der Arithmetik die Vollständigkeit ihres Axiomensystems bereits feststeht. Die Eigenschaft der Vollständigkeit eines Axiomensystems besteht ja darin, dass man keinen von den Axiomen unabhängigen Satz als neues Axiom hinzufügen kann, ohne einen Widerspruch zu erhalten,1) oder anders ausgedrückt, dass für | jede die Theorie betreffende Aussage auf Grund der Axiome bestimmt ist, ob sie richtig ist oder falsch. Dies soll nun für die Geometrie gezeigt werden. Der Gedankengang des Beweises ist folgender: Mit Hülfe der Axiome I–IV lässt sich die Proportionenlehre begründen (wie in den „Grundlagen der Geometrie“ gezeigt ist, vgl. auch „Prinzipien der Mathematik“ S. 41–48). Auf diese Weise erhält man eine rein geometrische Einführung der Cartesischen Koordinaten und gelangt somit zur analytischen Geometrie, wobei jedoch das Zahlensystem zunächst nur insoweit festgelegt ist, dass in diesem die elementaren Rechenoperationen sowie das Quadratwurzelziehen aus einer positiven Zahl ausführbar sind. Wenn nun noch die Axiome der Stetigkeit hinzugenommen werden, so folgt, dass 1) Man beachte den Unterschied zwischen dieser Forderung der Vollständigkeit und derjenigen, welche in dem Vollständigkeitsaxiom ausgesprochen wird. Das Vollständigkeitsaxiom besagt: es können ohne Widerspruch keine neuen Gegenstände hinzugefügt werden: die Forderung der Vollständigkeit des Axiomensystems aber lautet: es können ohne Widerspruch keine neuen Sätze hinzugefügt werden.
5 A comment is in order on the content of the last five paragraphs. The ‘Buch’ mentioned in Hilbert’s marginal remark on p. 15 (see n. 3 above) probably refers to the Grundlagen der Geometrie. But although this seems obvious, given the context, things are not as straightforward as they might seem. There are no considerations like this either in the fourth edition (Hilbert 1913 ), or in the fifth or sixth editions (Hilbert 1922a, Hilbert 1923b). However, arguments somewhat like these are used in the completely revised seventh edition (Hilbert 1930a). Here (p. 30), Hilbert introduces a linear completeness axiom, and then proves (p. 31) completeness for lines and planes from it; he attributes the observation that the linear completeness axiom is sufficient to Bernays (ibid., p. 31). The proof involves considerations similar to those used here, namely, a division into old and new points, lines, planes etc., and it is then shown that the existence of new elements of any kind would stand in contradiction to the axiom of linear completeness. The argument in places is much like that given here, although that of ‘the Buch’ is much more direct and smoother. It is not known when, and in what context, Hilbert moved to the (apparently weaker) axiom of linear completeness, but it seems clear from these lectures that some of the necessary considerations are already present in 1921/22. The weaker axiom does not figure in Hilbert’s lectures on the foundations of geometry in 1927 (i. e., Hilbert 1927* ), but it is reported by Baldus in Baldus 1928 , although it seems clear from what is said here that Bernays and Hilbert were aware of it. For further information on linear completeness, see Hallett’s Introduction to Chapter 5 of Hallett and Majer 2004 , Section 5.
19
444
20
21
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
das Zahlensystem der analytischen Geometrie mit dem System aller reellen Zahlen übereinstimmen muss. Hieraus ersieht man, dass bei der analytischen Behandlung der Geometrie das System der geometrischen Beziehungen keinerlei Beschränkung erfährt, sodass jeder Satz, den die analytische Geometrie beweist, auch direkt aus den Axiomen der Geometrie gefolgert werden kann. Aus dieser Feststellung ergibt sich aber sogleich die Vollständigkeit des geometrischen Axiomensystems. Denn jede geometrische Aussage lässt sich in der Sprache der analytischen Geometrie ausdrücken und stellt sich hier dar als eine arithmetische Aussage, deren Wahrheit oder Falschheit auf Grund der arithmetischen Axiome feststeht (wie wir ja voraussetzen). Somit muss nach dem eben Bemerkten die Wahrheit oder Falschheit der Aussage | auch direkt durch die Axiome der Geometrie bestimmt sein. Wir kommen nun zu der dritten axiomatischen Hauptfrage, welche die Unabhängigkeit der Axiome betrifft. Von den hierher gehörigen Untersuchungen will ich nur einige besonders interessante anführen. Vor allem berühmt ist die Frage nach der Unabhängigkeit des Parallelenaxioms IV von den übrigen Axiomen. Der Beweis für die Unabhängigkeit des Parallelenaxioms ist gleichbedeutend mit dem Nachweis der Widerspruchslosigkeit einer Nichteuklidischen Geometrie, d. h. einer Geometrie, für welche das Euklidische Parallelenaxiom ungültig ist, während alle übrigen Axiome erhalten bleiben. Ehe ich diesen Beweis vorführe, will ich auf eine Vorfrage eingehen, welche den Satz von der Winkelsumme im Dreieck betrifft. Der Satz, dass in jedem Dreieck die Winkelsumme zwei Rechte beträgt, ist eine unmittelbare Folge aus dem Parallelenaxiom. Es fragt sich nun, was wir über die Winkelsumme im Dreieck ausssagen können, wenn wir auf das Parallelenaxiom verzichten. Hierauf hat Legendre die Antwort gegeben, indem er folgende zwei Sätze bewies: 1.) In einem Dreieck kann die Winkelsumme niemals grösser sein als zwei Rechte. 2.) Wenn in einem einzigen Dreieck die Winkelsumme gleich zwei Rechten ist, so ist sie es in jedem Dreieck. Um zunächst den ersten Satz zu beweisen, gehen wir aus von der Betrachtung eines Dreiecks ABC mit den Winkeln α, β, γ, wobei die Benennung so gewählt ist, dass β ≤ γ und daher auch AC ≤ AB. Wir ziehen von A nach der Mitte D | der Seite BC die Verbindungslinie, verlängern diese um sich selbst bis zum Punkt E und verbinden E mit B. In dem entstehenden Dreieck ABE mögen die Winkel an den Ecken A, B, E bezüglich mit α , β , γ bezeichnet werden und CAD heisse α , sodass α = α + α . Aus der Kongruenz der Dreiecke ADC und E EDB folgt γ' AC = BE β = β + γ γ = α .
D
C γ
B β
αα A
5
10
15
20
25
30
35
40
‘Grundlagen der Mathematik’ (1921/22)
445
Daraus ergibt sich einerseits α + β + γ = α + β + γ + α = α + β + γ. Die Winkelsumme ist also im Dreieck ABE die gleiche wie im Dreieck ABC. Da ferner (gemäss unserer Annahme) AC ≤ AB, so ist auch BE ≤ AB,
5
folglich α ≤ γ α ≤ α 2α ≤ α + α , 10
d. h. α . 2 Wir finden somit, dass man zu jedem Dreieck ABC mit dem Winkel α bei A ein anderes Dreieck mit gleicher Winkelsumme konstruieren kann, worin einer der Winkel höchstens gleich α2 ist. Durch Wiederholung der gleichen Konstruktion kann man daher auch ein Dreieck erhalten, welches dieselbe Winkelsumme wie ABC besitzt und worin einer der Winkel höchstens gleich α | (für irgend eine vorgeschriebene ganze Zahl n) ist. Angenommen nun, es 2n gebe ein Dreieck ABC, dessen Winkelsumme grösser 2R + ε ist.B α ≤
15
B
α α ist stets ein spitzer Winkel. 2 < 2
P
O
α 2 α 2
ε ε ε
Q
Rechter. Von einem Punkte P eines α Schenkels des 2 fällen wir auf den anderen Schenkel ein Lot P Q (mache P ∗ O = P O, QOP = QOP ∗ , verbinde P mit P ∗ ). Q muss wirklich auf den andern Schenkel fallen. Denn fiele Q auf die Verlängerung dieses Schenkels, so entstünde ein Dreieck, in dem α Aussenwinkel eines rechtwinklichen 2 Dreiecks wäre.
P∗ Added by Hilbert on the reverse of the previous page.
22
446
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Dann folgt zunächst gemäss dem Archimedischen Axiom, dass eine ganze Zahl n so gewählt werden kann, dass der Winkel 2αn < ε ist.C Nach dem zuvor Bewiesenen lässt sich ferner ein Dreieck mit den Winkeln α, β, γ 6 δ γ∗ ∗ konstruieren, bei welchem die Winkelsumme β gleich der des Dreiecks ABC und der Winkel α ≤ 2αn ist. Bedeutet δ den Nebenwinkel von β, so γ∗ < δ α∗ ist dieser nach dem Satz vom Aussenwinkel grösser als γ. Somit würde sich folgende Winkelbeziehung ergeben: 2R + ε = α + β + γ = α + β + γ α ≤ n + β + γ < ε + β + δ = ε + 2R, 2 also
23
2R + ε < 2R + ε, was unmöglich ist. Es kann hiernach kein Dreieck mit einer grösseren Winkelsumme als 2R geben. Nachdem hiermit der erste von den beiden Legendreschen Sätzen bewiesen ist, gelingt nun leicht der Beweis des zweiten Satzes. Wir zeigen zunächst: Wenn ein Dreieck s3 ganz im Innern eines Vierecks liegt, dessen s4 s2 Winkelsumme gleich 4 Rechten ist, so ist seis1 s5 s8 ne Winkelsumme gleich 2 Rechten. Nämlich s7 das Viereck lässt sich dann in 8 Dreiecke zers6 legen, von denen eines das betrachtete ist. Sei s1 die Winkelsumme dieses | Dreiecks, und s2 . . . , s8 seien bezüglich die Winkelsummen der übrigen Dreiecke; dann ist, wie man unmittelbar aus der Figur ersieht: s1 + . . . + s8 = 4R + 3 · 4R = 16R. Andererseits ist nach dem vorigen Satz: s2 + . . . + s8 ≤ 7 · 2R,
5
10
15
20
25
30
folglich 16R ≤ s1 + 14R, d. h. s1 ≥ 2R, also, da s1 nicht > 2R sein kann, s1 = 2R, wie behauptet. C
α
d. h. m so gross dass mε > 2 wird. Added by Hilbert after the full-stop.
6 The diagram here is in the left-hand margin. Following it, in this and the following paragraph, Hilbert has replaced ‘α’, ‘β’, ‘γ’ by ‘α∗ ’, ‘β ∗ ’, and ‘γ ∗ ’ respectively.
35
‘Grundlagen der Mathematik’ (1921/22)
5
10
15
20
25
30
35
40
447
Es sei nun irgend ein Dreieck 7 von der Winkelsumme 2R vorhanden. Von den drei Höhen dieses Dreiecks fällt mindestens eine ins Innere des Dreiecks. Ziehen wir eine stumpf solche Höhe, so wird dadurch das Dreieck in zwei rechtwinklige Dreiecke zerlegt, deren Winkelsummen zusammen 4R ergeben, sodass jedes der beiden Teildreiecke die Winkelsumme 2R haben muss (weil ja keines eine grössere Winkelsumme haben kann). Somit gibt es ein rechtwinkliges Dreieck von der Winkelsumme 2R. Durch Zusammenlegen zweier kongruenter solcher Dreiecke erhält man ein Rechteck, und durch Aneinandersetzen von kongruenten Rechtecken erhält man Rechtecke von beliebig grosser Ausdehnung, sodass man jede begrenzte Figur mit einem Rechteck umschliessen kann. Haben wir also ein beliebiges Dreieck im Raum, so können wir in der Ebene dieses Dreiecks ein Rechteck kon|struieren, welches das Dreieck ganz in seinem Innern enthält. Und da ja das Rechteck die Winkelsumme 4R hat, so folgt aus dem eben Bewiesenen, dass das vorgelegte Dreieck die Winkelsumme 2R hat. Aus der Existenz eines Dreiecks von der Winkelsume 2R folgt somit, dass jedes Dreieck dieselbe Winkelsumme hat. Die Beweise, welche ich hier nach der Methode von Legendre geführt habe, benutzen beide wesentlich das Archimedische Axiom. Dehn hat (in seiner Dissertation) gezeigt, dass der Beweis des zweiten von den Legendreschen Sätzen auch ohne Anwendung des Archimedischen Axioms, allein auf Grund der Axiome I, II, III geführt werden kann, während für den ersten Satz ein solcher Beweis nicht möglich ist. Ich wende mich nun zu dem Beweis der Unabhängigkeit des Parallelenaxioms. Dieser geschieht in der Weise, dass unter der Voraussetzung der Widerspruchsfreiheit der Euklidischen Geometrie auch eine nicht-Euklidische Geometrie als widerspruchsfrei nachgewiesen wird, nämlich eine Geometrie, in der an Stelle des Axioms IV folgendes dem Parallelenaxiom widerstreitende Axiom gilt: Es sei A ein Punkt ausserhalb einer Geraden a; dann gibt es in der durch A und a bestimmten Ebene mindestens zwei Geraden, deren jede durch A geht und a nicht schneidet. Die Ausführung des Beweises vgl. „Prinzipien der Mathematik“, S. 28–34. Bemerkung zur nicht-Euklidischen Geometrie√ der oberen Halbebene: Auf dx2 +dy2 Grund der Längendefinition durch das Integral ergibt sich für die y Streckenabtragung auf den nicht-Euklidischen Geraden, d. h. auf den zur xAchse senkrechten Halbkreisen und Halbgeraden eine elementargeometrische Konstruktion.
7 The
diagram was drawn by Hilbert in the left-hand margin. Below it there is the following note: ‘es kann aber im nur einen stumpfen Winkel geben’.
24
25
448
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Es zeigt sich nämlich, dass die nichtEuklidische Länge einer durch einen Kreisbogen AB gebildeten Strecke gleich ist dem C Ausdruck D
Q OR OQ : log , O R P RP QP wobei O und P die Schnitte des Kreises mit der x-Achse bedeuten und Q, R zwei Punkte, die man erhält, indem man von A und B S nach irgend einem Punkte S des unteren Halbkreises die Sehnen zieht und diese mit der x-Achse zum Schnitte bringt. Aus dieser Beziehung erhält man ohne weiteres das Verfahren, wie man von einem Punkte C der durch A und B gehenden nicht-Euklidischen Geraden die Strecke AB nach einer vorgeschriebenen Richtung abträgt: Man verbindet C mit Q (bzw. R), verlängert die Verbindungsgerade bis zum Schnitte T mit dem unteren Halbkreis und zieht dann die Gerade, welche T mit R (bzw. Q) verbindet. Der Schnittpunkt D dieser Geraden mit dem oberen Halbkreise ist der Endpunkt der gesuchten Strecke. (Man sieht dabei auch, wie nicht-Euklidisch gleiche Strecken in gewöhnlichem Mass immer kleiner werden, wenn man sich dem Punkt P nähert). Ist nun ein beliebiger anderer zur x-Achse orthogonaler Halbkreis (der oberen Halbebene) gegeben, welcher die x-Achse in O und P treffen möge, und will man auf diesem eine zu AB im nicht-Euklidischen Sinne kongruente Strecke erhalten, so braucht man nur durch O die Parallelen zu OA und OB zu ziehen, und diese mit dem gegebenen Halbkreis zum Schnitte zu bringen. Die beiden Schnitte A und B bilden dann mit O und P ein Viereck, welches dem Viereck OABP ähnlich ist; und hieraus folgert man leicht, dass die Strecken AB und A B (im nicht-Euklidischen Sinne) kongruent sind. Auf einer Halbgeraden (senkrecht zur xH Achse) stellt sich die nicht-Euklidische Längenmesung so dar, dass die Länge einer Strecke EF gleich log( EG ) ist, wobei G den FG K Schnittpunkt der Geraden EF mit der xE Achse bedeutet (siehe Figur). Hiernach geF schieht die Streckenabtragung auf dieser Geraden einfach durch Parallelenziehen (in der G Figur ist EF ≡ HK). Nun fragt sich nur noch, wie man zu einer beliebig gegebenen Strecke auf einem Halbkreise eine mit ihr nicht-Euklidisch kongruente Strecke auf einer gegebenen Halbgeraden erhält. Um dies zu sehen, brauchen wir nur die obige Figur (S. 25) so zu spezialisieren, dass Q in den Kreis-Mittelpunkt fällt; denn dann nimmt der Ausdruck für die Länge der Strecke AB die einfache Form an: log OR , und die RP Bedingung dafür, dass die Strecke EF auf einer in C mündenden Halbgeraden mit AB kongruent ist, stellt sich demnach dar | durch die Proportion B
A
26
27
OR : RP = EG : F G,
5
10
15
20
25
30
35
40
‘Grundlagen der Mathematik’ (1921/22)
5
10
15
20
25
30
35
40
45
449
sodass bei gebebener Strecke AB auf dem Halbkreis die Konstruktion einer kongruenten Strecke EF (auf der Halbgeraden) wiederum durch Parallelenziehen gelingt. — Das einfachste Beispiel einer Geometrie, in welcher für jedes Dreieck die Winkelsumme grösser ist als 2R, bildet die Geometrie auf der Kugel, bei der die grössten Kreise die Rolle der Geraden spielen, und der Winkel zweier von einem Punkt ausgehender Bogen von grössten Kreisen gemessen wird durch den Winkel der zugehörigen Tangenten. Auf Grund des ersten von den beiden bewiesenen Legendreschen Sätzen wissen wir von vornherein, dass in dieser Geometrie die Axiome I, II, III, V nicht alle gelten können. In der Tat sind auch die Axiome der Verknüpfung sowie auch die der Anordnung hier nicht erfüllt. Denn zwei Geraden der Kugelgeometrie haben immer zwei verschiedene Punkte gemeinsam, und durch zwei gegenüberliegende (auf den Enden eines Durchmessers liegende) Punkte der Kugel geht nicht nur eine Gerade, sondern unendlich viele. Ferner wird eine Gerade durch einen auf ihr befindlichen Punkt nicht in zwei getrennte Hälften zerlegt: es gibt also keine Beziehung des Zwischenliegens. Allerdings lässt sich hier die Gültigkeit der Verknüpfungsaxiome wiederherstellen, indem man je zwei gegenüberliegende Punkte der Kugel als einen Punkt der Geometrie betrachtet. Auf diese Weise erhält man eine Geometrie, welche gleichbedeutend ist mit der Geometrie des Strahlenbündels, | wo die gewöhnlichen Geraden durch den Strahlenmittelpunkt als die Punkte und die gewöhnlichen Ebenen durch den Strahlenmittelpunkt als die Geraden gelten, und wo der Winkel zweier Geraden der Geometrie durch den gewöhnlichen Neigungswinkel der Ebenen bestimmt wird. (Eine Strecke dieser Geometrie wird gebildet von den Strahlen, welche innerhalb eines ebenen Winkels und seines Scheitelwinkels (mit dem Strahlenmittelpunkt als Scheitel) verlaufen, und die Länge der Strecke bestimmt sich nach der Grösse des betreffenden Winkels.) In dieser Geometrie sind die Axiome I, III, V sämtlich erfüllt. Dagegen nicht die Axiome II und IV. Eine Gerade der Geometrie wird durch einen Punkt auf ihr nicht in getrennte Hälften zerlegt, und ebensowenig lassen sich von einer Geraden aus zwei Seiten unterscheiden, vielmehr lassen sich zwei Punkte, die ausserhalb einer Geraden liegen, stets ohne Ueberschreitung der Geraden miteinander verbinden. An Stelle des Parallelenaxioms gilt der Satz, dass je zwei Geraden sich stets in einem Punkte schneiden. In dieser Hinsicht ist also die Geometrie des Strahlenbündels wesentlich einfacher als die Euklidische Geometrie. (Weder in der Kugelgeometrie noch in der Geometrie des Strahlenbündels gilt der Satz vom Aussenwinkel. Z.B. gibt es hier Dreiecke mit lauter stumpfen Winkeln, wo also jeder Aussenwinkel ein spitzer Winkel und daher kleiner ist als jeder der Dreieckswinkel.) — Der Beweis für die Unabhängigkeit des Archimedischen Axioms wird mit der Methode der analytischen Geometrie geführt, indem man an Stelle des gewöhnlichen Zahlensystems das System der Potenzreihen an tn + an−1 tn−1 + . . . + a0 + a−1 t−1 + a−2 t−2 + . . .
28
29
450
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
mit endlich vielen positiven, aber unendlich vielen negativen Potenzen und mit reellen Koeffizienten zugrundelegt. Innerhalb dieses Systems sind die elementaren Rechenoperationen ausführbar und ausserdem das Quadratwurzelziehen aus einer Quadratsumme, also die Operation u2 + v 2 (wo u und v Zahlen des Systems bedeuten). Die gewöhnlichen Rechengesetze bleiben dabei erhalten, und es gilt auch der Satz, dass ein Produkt nur dann gleich 0 ist, wenn mindestens ein Faktor gleich 0 ist. (Unter der Null verstehen wir hier die Potenzreihe, deren sämtliche Koeffizienten gleich 0 sind.) Ferner lässt sich für dieses System auch eine transitive Grössenbeziehung u < v definieren, indem man festsetzt, dass für zwei verschiedene Zahlen u, v die Ungleichung u < v, bzw. v > u, gelten soll, wenn in der Potenzreihe v − u der erste von 0 verschiedene Koeffizient positiv ist. In der analytischen Geometrie, welche durch dieses Zahlensystem bestimmt wird, gelten die Axiome I–IV sämtlich. Dagegen wird das Archimedische Axiom verletzt. Denn wir können durch noch so oft wiederholtes Abtragen der Einheitsstrecke niemals die Strecke t ausfüllen, vielmehr ist stets
5
10
15
1 + 1 + . . . + 1 < t, 30
31
weil ja für jede ganze Zahl k die Differenz t − k den positiven ersten Koeffizienten 1 hat. — Auf ganz entsprechende Art können wir auch die Unabhängigkeit des Vollständigkeitsaxioms nachweisen; wir brauchen nur an Stelle des betrachteten Zahlensystems das System derjenigen reellen algebraischen Zahlen zu nehmen, welche aus der Zahl 1 durch Anwendung der elementaren Rechenoperationen sowie des Quadratwurzelziehens aus einer positiven Zahl erhalten werden. (Zu diesen Unabhängigkeitsbeweisen vgl. „Prinzipien der Mathematik“, S. 34–37; ferner „Grundlagen der Geometrie“, S. S. 1902, S. 46–55.) 8 Die Begründung der Proportionslehre und der Lehre vom Flächeninhalt ohne Anwendung der Stetigkeitsaxiome, vgl. „Prinzipien der Mathematik“, S. 37–61. Die Bedeutung des Archimedischen Axioms für die Lehre vom Flächeninhalt geht daraus hervor, dass sich mit Hülfe dieses Axioms der Satz beweisen lässt: Je zwei (ebene) Polygone von gleichem Inhaltsmass sind zerlegungsgleich, während in einer Nicht-Archimedischen Geometrie dieser Satz falsch ist. Der Beweis des Satzes mit Anwendung des Archimedischen Axioms wird folgendermassen geführt: Es genügt, zu zeigen, dass zwei Dreiecke mit gleicher Grundlinie und gleicher Höhe zerlegungsgleich sind. Diesen Satz für Dreiecke können wir auf den entsprechenden Satz für Polygone zurückführen. Nämlich jedes Dreieck ABC ist zerlegungs|gleich mit einem Parallelogramm von gleicher Grundlinie und halber Höhe. Dies ergibt sich aus folgender Konstruktion: 8 The Ausarbeitung for the lecture course ‘Prinzipien der Mathematik’ can be found in Chapter 1 of the present Volume; that for the lecture course ‘Grundlagen der Geometrie’ from 1902 can be found in Hallett and Majer 2004 , Chapter 6.
20
25
30
35
40
‘Grundlagen der Mathematik’ (1921/22)
451
D und E seien die Mitten der Seiten AB und AC. Wir verbinden D mit E und verlängern DE über E hinaus um sich selbst E F bis zum Punkte F , und diesen verbinden D wir mit C. Dann ist BCF D ein Parallelogramm, welches dieselbe Grundlinie BC wie das Dreieck ABC und die halbe Höhe hat; C B und dieses Parallelogramm ist mit dem Dreieck ABC zerlegungsgleich, weil die Dreiecke ADE und CF E einander kongruent sind. Wir brauchen also nur noch zu beweisen, dass zwei Parallelogramme mit gleicher Grundlinie und gleicher Höhe zerlegungsgleich sind; und zwar können wir die Parallelogramme in solcher Lage annehmen, dass ihre Grundlinien zusammenfallen. ABCD und ABEF seien die beiden Parallelogramme. (Figur siehe S. 32.) Die Seite BC des einen Parallelogramms schneide die Seite AF des anderen im Punkte S. Dann trage man die Strecke BS auf die Gerade BC von B aus in der Richtung nach C so oft ab, wie es ohne Ueberschreitung des Punktes C möglich ist. Gemäss dem Archimedischen D C F E 8 7 Axiom tritt dieser Fall nach einer gewis7 8 sen Anzahl von Abtragungen ein. Durch 6 6 5 5 die auf der Strecke BC erhaltenen Teil4 4 punkte ziehe man nun die Parallelen zu 3 S 3 der Geraden AB. Diese teilen dann die 2 2 beiden Parallelogramme in kleinere Par1 allelogramme; und hierbei ist jedes der B A Teilparallelogramme von ABCD demjenigen Teilparalle|logramme von ABEF , welches zwischen denselben Parallelen liegt, zerlegungsgleich, wie man aus der Figur leicht ersieht. (Die Dreiecke 1, 3, 5, 3 , 5 sind alle untereinander kongruent, ebenso die Dreiecke 2, 4, 6, 2 , 4 , 6 ; ferner sind die Dreiecke 8 und 8 einander kongruent und ebenso die Vierecke 7 und 7 .) Somit ist der behauptete Satz bewiesen. Nun bleibt noch zu zeigen, dass in einer nicht-Archimedischen Geometrie zwei Dreiecke von gleicher Grundlinie und Höhe nicht stets zerlegungsgleich sind. Es seien a und b zwei Strecken von der Art, dass jedes Vielfache der Strecke b kleiner ist als a. Die Strecke b denken wir uns als Einheitsstrecke gewählt. Nun betrachten wir ein rechtwinklig gleichschenkliges Dreieck ABC mit dem rechten Winkel bei A und der KathetenC C länge 1. Auf der Geraden AB werde von A aus in der Richtung nach B die Strecke a 1 1 bis D hin abgetragen und in dem Punkt D auf AD die Senkrechte errichtet. Auf dieB 1 ser liege C im Abstande 1 von D. Dann a D A hat das Dreieck ABC die gleiche Grundlinie und gleiche Höhe wie das Dreieck ABC. Diese Dreiecke können aber A
5
10
15
20
25
30
35
40
45
32
452
33
34
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
nicht zerlegungsgleich sein. Denn könnte man die beiden Dreiecke in je k Teildreiecke zerlegen, welche paarweise einander kongruent wären, so müsste auch die Summe der Umfänge der Teildreiecke von ABC die gleiche sein wie | von ABC . Sei s diese Summe, so müsste einerseits s grösser sein als der Umfang von ABC , also jedenfalls grösser als die Seite AC , mithin auch grösser als a. Wir hätten also s > a. Andererseits wäre jede Seite eines Teildreiecks von ABC kleiner als die Strecke 2, also da k Teil-Dreiecke vorhanden sein sollen, die Summe ihrer Umfänge s < 2 · 3 · k. Somit ergäbe sich a < s < 6k, entgegen unserer Annahme, dass a grösser sein soll als jedes Vielfache der Einheitsstrecke. — Hiermit möchte ich meine Ausführungen über die Geometrie abschliessen. Diese Betrachtungen sollten ja als Beispiel dienen für die Anwendung der Methode der Zurückführung. In der Tat haben wir den Beweis für die Widerspruchslosigkeit der Geometrie sowie die verschiedenen Unabhängigkeitsbeweise in dem Sinne geführt, dass wir die Widerspruchsfreiheit der Theorie der reellen Zahlen als feststehend vorausgesetzt haben. Dieses Verfahren der Zurückführung auf die Arithmetik kommt nicht nur in der Geometrie zur Geltung, vielmehr wird es fast überall bei Beweisen für Widerspruchsfreiheit angewendet. Insbesondere überall, wo man in der Physik eine Theorie axiomatisch aufbaut und sie als widerspruchsfrei erweist, da handelt es sich immer um die Zurückführung auf die Arithmetik und Analysis. An Beispielen für solche Zurückführungen gibt es ein reiches Material. Ich möchte hier nur das Beispiel der Thermodynamik behandeln. Diese physikalische Theorie wurde schon von vornherein axiomatisch angelegt, indem man die Unmöglichkeit eines perpetuum mobile erster und zweiter Art als Axiome nahm und daraus die Theorie durch Schlüsse entwickelte. Ich will eine neuere Fassung der Theorie vortragen, und zwar möchte ich die Darstellung in möglichst enger Analogie zur Methode der Geometrie geben. Wir wollen uns beschränken auf die Betrachtung quasistationärer Vorgänge, d. h. solcher Prozesse, bei denen in jedem Augenblick der Zustand als ein Gleichgewichtszustand betrachtet werden kann. Es handelt sich also um das Problem des Gleichgewichts von Gasmengen, und zwar haben wir uns die Gasmengen durch Wände abgeschlossen zu denken, sodass sie zwar miteinander in Berührung kommen, aber sich nicht mischen können. Die Gasmengen bilden die Gegenstände unserer Theorie. Zwei Gasmengen können aus verschiedenem Stoffe sein und verschiedene Masse haben; wir sagen dann, dass sie verschieden sind. Ferner können mehrere Exemplare von gleichen Gasmengen vorhanden sein. Bei jeder einzelnen Gasmenge unterscheiden wir verschiedene Zustände. Für den Zustand einer Gasmenge sind drei Grössen charakteristisch: V (Volumen), p (Druck), E (Energie). Zwischen diesen drei Grössen besteht eine Beziehung E = F (V, p),
5
10
15
20
25
30
35
40
45
‘Grundlagen der Mathematik’ (1921/22)
5
10
15
20
25
30
35
453
wobei also die Funktion F nur von der Gasmenge, aber nicht von ihrem Zustande abhängt. (Setzen wir E = M · ε, V = M · v, wobei M die Masse, ε die spezifische Energie und v das spezifische Volumen der Gasmenge ist, so erhalten wir die Beziehung: 1 · F (M · v, p) = F ∗ (v, p), ε= M und dieser Ausdruck für ε als Funktion von v und p hängt nur noch von dem Stoffe ab, aus welchem die Gasmenge besteht.) V und p sind unabhängig veränderlich. Die möglichen Zustände einer Gasmenge bilden also eine zweidimensionale Mannigfaltigkeit. Unter den Veränderungen des Zustandes einer Gasmenge spielen die rein mechanischen Veränderungen eine ausgezeichnete Rolle. Man nennt diese Zustands-Änderungen adiabatisch. Wir definieren hier rein mathematisch: Eine Zustandsänderung soll adiabatisch heissen, wenn für sie die Differentialgleichung erfüllt ist: dV dE = −p · . (1) dt dt Führen wir hierin V als unabhängige Veränderliche ein, und benutzen den Ausdruck für E als Funktion von V und p, so erhalten wir für p als Funktion von V die gewöhnliche Differentialgleichung: ∂F ∂F dp · + + p = 0. ∂p dV ∂V Die allgemeine Lösung dieser Gleichung hat die Form p = f (V, η), wobei η die Integrationskonstante ist. Es gibt also für eine Gasmenge eine einparametrige Schar von adiabatischen Zustandsänderungen. Lösen wir die Gleichung p = f (V, η) nach η auf, in der Form η = η(V, p), so stellt der Wert dieser Funktion eine für den Zustand des Gases charakteristische Grösse dar, welche bei adiabatischen Zustandsänderungen konstant bleibt. Wir können nun den Zustand eines Gases anstatt durch V und p auch durch V und η festlegen. Es stellt sich dann E dar durch die Funktion: E = F (V, f (V, η)) = E(V, η), welche wiederum durch die Gasmenge eindeutig bestimmt ist. Da bei adiabatischen Zustandsänderungen η konstant ist, so ergibt sich aus (1) die Beziehung: ∂E = −p, p = f (V, η) (2) ∂V Bisher haben wir nur eine einzelne Gasmenge in Betracht gezogen. Nun führen wir den Begriff des Gleichgewichts zwischen zwei Gasmengen1) ein und stellen für diesen folgende Axiome auf: 1)
Was wir hier Gleichgewicht zwischen zwei Gasmengen nennen, bedeutet physikalisch, dass im Falle der Berührung die Gasmengen (nach der gewöhnlichen Wortbedeutung) im Gleichgewicht stehen.
35
36
454
37
38
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
1) Zwei gleiche Gasmengen im gleichen Zustande sind miteinander in Gleichgewicht. 2) Ist eine Gasmenge α (in einem bestimmten Zustande) mit einer Gasmenge β (in einem bestimmten Zustande) und mit einer Gasmenge γ (in bestimmtem Zustande) im Gleichgewicht, so sind auch die Gasmengen β und γ | in den betreffenden Zuständen miteinander im Gleichgewicht. 3) Die notwendige und hinreichende Bedingung für das Bestehen des Gleichgewichts zwischen zwei Gasmengen α und β, deren Zustände bezüglich durch die Werte Vα , ηα , Vβ , ηβ bestimmt sind, drückt sich aus durch eine analytische Gleichung: Gαβ (Vα , ηα , Vβ , ηβ ) = 0, wobei die Funktion Gαβ durch die beiden Gasmengen (unabhängig von deren Zustande) bestimmt ist. Aus diesen Axiomen können wir eine einfachere Form der Gleichgewichtsbedingung ableiten. Nämlich gemäss dem Axiom 3) folgt, dass jede in einem bestimmten Zustande befindliche Gasmenge α mit einer festgewählten Gasmenge (1) im Gleichgewicht ist, sofern für diese Gasmenge die Werte ihrer Zustandsgrössen V1 , η1 geeignet gewählt werden; und zwar kann dabei noch willkürlich der Wert von V1 , etwa gleich 1, vorgeschrieben werden. Es bestimmt sich dann η1 aus der Gleichung: Gα1 (Vα , ηα , 1, η1 ) = 0, welche nach η1 aufgelöst lautet: η1 = τα (Vα , ηα ). Die Axiome 1) und 2) besagen nun, dass die Gasmenge β in einem bestimmten Zustande mit der Gasmenge α in dem betrachteten Zustande dann und nur dann im Gleichgewicht ist, wenn sie mit der Gasmenge (1) bei den Werten V1 = 1 und η1 ihrer Zustandsgrössen im Gleichgewicht ist, wobei η1 denselben Wert wie vordem bedeutet, das heisst, es besteht zwischen α und β | Gleichgewicht dann und nur dann, wenn für denselben Wert η1 Gα1 (Vα , ηα , 1, η1 ) = 0
5
10
15
20
25
30
und Gβ1 (Vβ , ηβ , 1, η1 ) = 0 ist, wenn also η1 = τα (Vα , ηα ) = τβ (Vβ , ηβ ) ist. Die Gleichgewichtsbedingung lautet somit: τα (Vα , ηα ) = τβ (Vβ , ηβ ). Damit haben wir die Funktion Gαβ , die zu einem Paar von Gasmengen α, β gehört, auf eine Funktion τα zurückgeführt, welche einer einzelnen Gasmenge zugeordnet ist. Nun betrachten wir ein System von n Gasmengen, die zu je zweien im Gleichgewicht stehen, dabei aber verschiedene Zustände durchlaufen können. Die Zustandsgrössen der einzelnen Gasmengen seien E1 , p1 , V1 , η1 , . . . , En , pn , Vn , ηn .
35
40
‘Grundlagen der Mathematik’ (1921/22)
5
10
15
20
25
30
455
Jeder zulässigen Wertverteilung dieser Grössen entspricht ein „Zustand des Systems“. Auf Grund der Gleichtgewichtsbedingung sind in jedem Zustand des Systems die Funktionswerte τα (Vα , ηα ) für die n Gasmengen alle einander gleich, das heisst es bestehen die Gleichungen τα (Vα , ηα ) = τ ; α = 1, . . . , n. Wir können daher Vα als Funktion von ηα und τ ausdrücken. η1 , . . . , ηn und τ sind also unabhängig veränderlich, und durch die Werte dieser (n+1) Grössen bestimmen sich die Werte der übrigen Zustandsgrössen. Es entspricht also jeder Wertbestimmung der Grössen η1 , . . . , ηn , τ ein Zustand unseres Systems. Als Energie des Gesamtsystems bezeich|nen wir die Summe der Energien der einzelnen Gasmengen: E12...n = E1 (V1 , η1 ) + . . . + En (Vn , ηn ). Für ein solches System lässt sich nun ganz entsprechend wie für eine einzelne Gasmenge der Begriff der adiabatischen Zustandsänderung definieren. Wir nennen eine Zustandsänderung adiabatisch, wenn (identisch in t) die Differentialgleichung erfüllt ist: dV1 dVn dE12...n = −p1 · − . . . − pn · . (3) dt dt dt Hierin haben wir uns pα (α = 1, . . . , n) durch Vα und ηα , Vα wiederum durch ηα und τ ausgedrückt zu denken, sodass die Gleichung eine Bedingung für η1 , . . . , ηn , τ als Funktion von t darstellt. Dieser Gleichung können wir eine übersichtlichere Form geben, indem für E12...n den Summenausdruck einsetzen und berücksichtigen, dass ∂Eα = −pα ∂Vα ist; wir erhalten zunächst als Identität ∂E1 dη1 ∂En dηn dE12...n dV1 dVn = −p1 + − . . . − pn · + · · dt dt ∂η1 dt dt ∂ηn dt Tragen wir diesen Ausdruck in (3) ein, so heben sich die Glieder dV1 dVn − . . . − pn −p1 dt dt auf beiden Seiten der Gleichung weg, und es ergibt sich: ∂E1 dη1 ∂En dηn + ... + = 0. (4) · · ∂η1 dt ∂ηn dt Ihre besondere Bedeutung erhält nun die adiabatische Zustandsänderung durch folgendes Axiom: (A) In beliebiger Nähe eines jeden Zustandes des Systems gibt es Zustände, die (von dem ersten Zustand aus) adiabatisch nicht erreichbar sind.
35
Diese Forderung ist in trivialer Weise erfüllt, falls es einen Multiplikator μ(τ, η1 , . . . , ηn ) für die Differentialgleichung (4) gibt, sodass identisch in τ , dη dη , dt1 , . . . , dtn eine Gleichung η1 , . . . ηn und den Ableitungen dτ dt ∂E1 dη1 ∂En dηn d μ(τ, η1 , . . . , ηn ) · + ... + · · = χ(τ, η1 , . . . , ηn ) ∂η1 dt ∂ηn dt dt
39
40
456
41
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
besteht. Denn dann bedeutet eine adiabatische Zustandsänderung eine solche, die auf einer Fläche χ(τ, η1 , . . . , ηn ) = const. des (n + 1)-dimensionalen Zustandsraumes der Variablen τ , η1 , . . . , ηn stattfindet. Es lässt sich nun zeigen, dass dieser Fall der Existenz eines Multiplikators für die Gleichung (4) die einzige Möglichkeit der Erfüllung unseres Axioms (A) bildet. Allgemein gilt nämlich folgender von Carathéodory (Math. Annalen, Bd. 67, S. 369–370) bewiesene Satz: Wenn eine Differentialgleichung von der Gestalt: dx1 dxm + . . . + Xm · , X1 · dt dt wo X1 , . . . Xm gegebene, stetig differenzierbare Funktionen von x1 . . . xm sind (welche nirgends alle zugleich den Wert 0 annehmen), die Eigenschaft hat, dass es in beliebiger Nähe einer jeden Stelle Punkte gibt, die durch eine Integralkurve jener Differentialgleichung oder durch endlich viele aneinandergrenzende Stücke solcher Kurven von jener Stelle aus nicht erreichbar sind, | so besitzt sie einen integrierenden Faktor. Die hier vorkommende Voraussetzung, dass X1 , . . . , Xm nicht alle an einer Stelle Null werden, ist bei unserer Differentialgleichung (4) jedenfalls dann erfüllt, wenn wir die — für das folgende ohnehin notwendige — zusätzliche Annahme machen, dass ∂Eα = 0 (α = 1, 2, . . . , n) ∂ηα ist. Aus dem Axiom (A) folgt somit, dass für einen gewissen Multiplikator μ(τ, η1 , . . . , ηn ) und eine Funktion χ(τ, η1 , . . . , ηn ) die Gleichung besteht: ∂E1 dη1 ∂En dηn μ· + ... + · · ∂η1 dt ∂ηn dt ∂χ dη1 ∂χ dηn ∂χ dτ · + + ... + , (5) = · · ∂τ dt ∂η1 dt ∂ηn dt und dass also die Bedingung (4) für die adiabatische Zustandsänderung gleichlautend ist mit χ = const. ∂χ Die Gleichung (5) zeigt nun, dass ∂τ = 0, also χ nur von η1 , . . . , ηn abhängig ist; und ferner ergibt sich daraus die Proportion ∂χ ∂χ ∂χ ∂E1 ∂E2 ∂En : : ... : = : : ... : , ∂η1 ∂η2 ∂ηn ∂η1 ∂η2 ∂ηn ∂χ
5
10
15
20
25
30
∂χ
und da ∂η , . . . , ∂η von τ unabhängig sind, so folgt für jeden festen Wert n 1 τ = τ0 ∂E ∂E ∂E1 ∂En 1 n : ... : = : ... : . ∂η1 ∂ηn ∂η1 τ =τ0 ∂ηn τ =τ0 α Hier ist ∂E (für α = 1, . . . , n) eine Funktion hα (ηα ) von ηα allein. ∂η α
τ =τ0
Denn Eα hängt ja nur von ηα und Vα , Vα wiederum nur von ηα und τ ab,
35
‘Grundlagen der Mathematik’ (1921/22)
457
und für τ ist der Wert τ0 eingesetzt. Wir erhalten also: ∂E1 ∂En : ... : = h1 (η1 ) : . . . : hn (ηn ). ∂η1 ∂ηn
5
α Gemäss unserer zusätzlichen Annahme ∂E = 0 sind ferner die Funktionen ∂ηα ∂Eα hα (ηα ) beständig von 0 verschieden, und ∂η hat stets dasselbe Vorzeichen α wie hα (ηα ). Es ist daher
∂E1 ∂η1
h1 (η1 )
= ... =
∂En ∂ηn
hn (ηn )
42
= ϑ > 0,
∂Eα
10
und da h ∂η(ηα ) nur von ηα und τ abhängt, so folgt aus diesen Gleichungen, α α dass ϑ eine Funktion von τ allein ist. Wir finden also ∂Eα = hα (ηα ) · ϑ(τ ) (α = 1, . . . , n), ∂ηα wobei ϑ(τ ) stets positiv ist. Wird nun ηα hα (ηα )dηα = Hα gesetzt, so ist
15
20
dHα = hα (ηα ) = 0, dηα also die Beziehung zwischen Hα und ηα umkehrbar eindeutig, und es kann daher Eα (Vα , ηα ) auch als Funktion von Vα und Hα ausgedrückt werden: Eα (Vα , ηα ) = Uα (Vα , Hα ). Diese Einführung von Hα an Stelle von ηα bedeutet eine Normierung der Integrationskonstanten in der Lösung der Differentialgleichung dEα = −pα dt welche für die adiabatische Zustandsänderung einer einzelnen Gasmenge gilt. Nunmehr lässt sich auch die Gesamtenergie des Systems der n Gasmengen als Funktion von V1 , . . . , Vn , H1 , . . . , Hn ausdrücken: E12...n = E(V1 , . . . , Vn , η1 , . . . , ηn ) = E1 (V1 , η1 ) + . . . + En (Vn , ηn ) = U1 (V1 , H1 ) + . . . + Un (Vn , Hn ) = U (V1 , . . . , Vn , H1 , . . . , Hn ).
25
Dabei wird ∂U ∂Uα ∂Eα dηα 1 , = = · = hα (ηα ) · ϑ(τ ) · ∂Hα ∂Hα ∂ηα dHα hα (ηα ) also: 30
∂U ∂U = ... = = ϑ, ∂H1 ∂Hn und hieraus geht hervor, dass die Argumente H1 , . . . , Hn in dem Ausdruck U nur in der Verbindung H1 + . . . + Hn auftreten. Es ist also E12...n = U (V1 , . . . , Vn , H); H = H1 + . . . + Hn ,
43
458
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
und ∂U = ϑ. ∂H Ferner ist
∂Uα ∂Eα ∂U = = = −pα (α = 1, . . . , n). ∂Vα ∂Vα ∂Vα Hiernach ist für jede (quasistatische) Zustandsänderung des Systems n dU dH dE12...n dVα = = ϑ· − . pα · dt dt dt dt α=1
44
5
(6)
Aus dieser Gleichung ersehen wir, dass H = const die notwendige und hinreichende Bedingung für eine adiabatische Zustandsänderung darstellt. Man nennt H die Entropie des Systems der Gasmengen, Hα die Entropie der αten Gasmenge, und ϑ heisst die absolute Temperatur. Der Wert des Integrals dH ϑ dt dt, genommen für eine Zustandsänderung, heisst die bei dieser Änderung dem System der Gas|mengen zugeführte Wärmemenge Q, sodass also dH dQ = ϑ· ; (7) dt dt
n α − α=1 pα · dV dt heisst die an dem System bei der Zustandsänderung gedt leistete Arbeit. Für einen Kreisprozess, wo der Zustand am Ende derselbe ist wie am Anfang, also dU dt = 0 dt ist, erhält man aus (6) die Beziehung n dVα dQ = dt, pα dt α=1
10
15
20
welche den ersten Hauptsatz der Wärmelehre (den Äquivalenzsatz Robert Meyers) zur Darstellung bringt. Aus der Formel (7) ergibt sich dH dQ = dt, ϑ dt und da H durch den Zustand des Systems der Gasmengen bestimmt ist, so 25 folgt, dass für jeden Kreisprozess dQ = 0 ist. ϑ Hierauf beruht der zweite Hauptsatz der Wärmelehre. Für dH erhält man aus (6) die Darstellung dt
n dE dH 1 dVα = · + pα · (8) ; (E = E12...n ), dt ϑ dt dt 30 α=1 welche für beliebige (quasistatische) Zustandsänderungen des Systems gültig ist. 9 9 The
addition written by Bernays on the sheets attached to the inside front cover of the Ausarbeitung would fit well here. It is reproduced on p. 520.
‘Grundlagen der Mathematik’ (1921/22)
5
10
459
Hiermit sind wir zu den Grundformeln der Thermody|namik gelangt. In grundsätzlich mathematischer Hinsicht ist noch folgendes zu bemerken: Die Kenntnis einer einzelnen Gasmenge (etwa der α-ten), besteht in der Kenntnis der Funktion Eα = Uα (Vα , Hα ), aus der sich die Zustandsgrössen pα und ϑ (in ihrer Abhängigkeit von Vα und Hα ) vermöge der Beziehungen ∂Uα ∂Uα = −pα , =ϑ ∂Vα ∂Hα ergeben. Die Kenntnis der Funktion Eα = Fα (Vα , pα ) liefert aber zur Bestimmung der Funktion Uα nur eine partielle Differentialgleichung: ∂Uα , U α = Fα V α , − ∂Vα und die vollständige Bestimmung erfolgt erst dadurch, dass noch die Funktion τα (Vα , ηα ) gegeben wird. — Ich will nun noch zeigen, wie sich die Theorie der idealen Gase im Rahmen unseres axiomatischen Aufbaues darstellt. Bei einem idealen Gas kennt man zunächst die „thermische Zustandsgleichung“
45
p · V = A · ϑ, 15
20
25
30
35
wo A eine für die Gasmenge charakteristische Konstante ist. Diese Beziehung liefert eine partielle Differentialgleichung für die Funktion E = U (V, H), nämlich ∂U ∂U + A· = 0. V· ∂V ∂H Die allgemeine Lösung hiervon lautet: E = U (V, H) = W (H − A · log V ), wobei W eine willkürliche Funktion eines Argumentes bedeutet. Diesem Ergebnis können wir noch eine andere Form geben, indem wir ϑ einführen. Es ist ∂U = W (H − A · log V ). ϑ= ∂H Da ϑ veränderlich ist, so lässt sich diese Beziehung umkehren, d. h. (H − A · log V ) lässt sich als Funktion von ϑ ausdrücken. Somit ist E eine Funktion von ϑ allein. Die Form dieser Funktion ergibt sich aus der „kalorischen Zustandsgleichung“, die folgendes besagt: Man bezeichne mit f (V, ϑ) diejenige Funktion, welche man aus der Funktion E = F (V, p) durch Einsetzen von A·ϑ p= V (gemäss der thermischen Zustandsgleichung) erhält. Dann ist ∂f (V, ϑ) = CV , ∂ϑ wobei CV eine für die Gasmenge charakteristische Konstante ist. Da wir bereits wissen, dass E nur von ϑ abhängt, so folgt, dass f von V unabhängig und in ϑ linear ist: E = CV · ϑ + const.
46
460
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
CV heisst die spezifische Wärme bei konstantem Volumen. Allgemein wird nämlich die (zu einer infinitesimalen Zustandsänderung gehörige) „spezifische Wärme“ definiert durch den Ausdruck dE + p · dV dH dQ = ϑ· = dt dϑ dt , dϑ dϑ dt
47
(wo t ein Parameter für die Zustansdsänderung ist). Findet die Änderung bei konstantem Volumen statt, so ist dV = 0, und dt der Ausdruck hat den Wert CV . Bei kon|stantem Druck ist die spezifische Wärme: dV CV · dϑ dt + p · ( dt )p=const Cp = ; dϑ
5
dt
und da (zufolge der thermischen Zustandsgleichung)
dV A dϑ , = · dt p=const. p dt
10
so ergibt sich Cp = CV + A, A = Cp − CV . Für H erhalten wir den Ausdruck dE + p · dV CV dϑ AdV H= = + ϑ ϑ V = CV · log ϑ + A · log V + const.
15
Die Bedingung H = const für adiabatische Veränderung nimmt also die Form an: CV log ϑ + (Cp − CV ) · log V = const C p log(p · V ) + − 1 log V = const CV p·V
48
C ( Cp V
)
20
= const,
während die Bedingung für isotherme Veränderung (Änderung bei konstanter Temperatur) lautet: p · V = const. — Bei diesem axiomatischen Aufbau der Thermodynamik kommt die Methode der Zurückführung auf die Analysis insofern zur Anwendung, als wir erst mit Hülfe der Analysis erkennen, dass die aufgestellten Axiome miteinander verträglich sind. Wir würden gar nicht wissen, ob den gestellten Anforderungen genügt werden kann, wenn wir nicht die Darstellungsweise | durch die Analysis hätten. Was ich hier von der Thermodynamik sage, das gilt überall da, wo man eine Axiomatisierung einer naturwissenschaftlichen Theorie vorgenommen hat. In fast allen diesen Fällen verhält es sich so, dass man in der betrachteten Disziplin einen Satz hat, der im Mittelpunkt steht. Und es kommt darauf an, zu untersuchen, mit wie geringen Annahmen man ausreicht, um diesen Satz zu beweisen.
25
30
35
‘Grundlagen der Mathematik’ (1921/22)
5
10
15
20
25
30
35
40
461
So ist z. B. in der Statik der Hauptsatz, den man auf möglichst schwache Annahmen zurückzuführen sucht, der Satz vom Parallelogramm der Kräfte, d. h. das Gesetz der vektoriellen Addition für die Kräfte (Untersuchung in der Dissertation von Schimmak). In der Theorie der Beobachtungsfehler handelt es sich um den Beweis des Gaussschen Fehlergesetzes aus möglichst einfachen Annahmen. In der elementaren Strahlungstheorie ist der zentrale Satz das Kirchhoffsche Gesetz über die Beziehung zwischen Emission und Absorption, für den ich zuerst eine strenge Ableitung aus den Grundannahmen der Strahlungstheorie gegeben habe. (Physikalische Zeitschrift 1914.) 10 Bei der Begündung der klassischen Mechanik kommt es darauf an, die Lagrangeschen Bewegungsgleichungen zu erhalten. Das geht auf sehr verschiedene Weisen. Es stehen sich die Begründungsarten von Boltzmann und Heinrich Hertz gegenüber. Boltzmann führt alles auf Zentralkräfte zurück und schaltet die Nebenbedingungen aus, | während umgekehrt Hertz den Kraftbegriff gänzlich vermeidet und nur Bedingungen zwischen den Massen annimmt. Eine ganz andere Art, die Bewegungsgleichungen abzuleiten, besteht darin, dass man sich die Bewegungen durch kurz aufeinanderfolgende Stösse hervorgerufen denkt und die Differentialgleichungen der Bewegung durch einen Grenzübergang aus den Stossgesetzen gewinnt. Die Stossgesetze selbst können dabei aus einem Minimal- (bzw. Maximal)-Prinzip erhalten werden. In dieser Weise verfahren Bertrand und Ostwald. Als ein weiteres Beispiel ist die von Einstein gegebene Ableitung der Planckschen Strahlungsformel aus dem Wienschen Verschiebungsgesetz zu erwähnen; ferner auch die Aufstellung der Feldgleichungen in der Einsteinschen Gravitationstheorie, welche von vornherein auf axiomatischem Wege, d. h. an Hand von axiomatischen Forderungen geschah und zwar unter wesentlicher Benutzung der Analysis. Im allgemeinen macht bei diesen axiomatischen Begründungen, welche mit Hülfe der Analysis ausgeführt werden, die Frage der Widerspruchsfreiheit keine Schwierigkeit. Jedoch gibt es einige Fälle, wo der Nachweis der Widerspruchsfreiheit gleichbedeutend ist mit einem schwierigen mathematischen Existenzbeweis. Solche Fälle liegen vor in der Elektrostatik, in der Theorie der stationären elektrischen Ströme sowie in der Theorie der Wärmeleitung bei den Gesetzen des Gleichgewichts. Hier handelt es sich allemal um Gesetze für stationäre Zustände, welche die Physik aufstellt; und man ist vom physikalischen Standpunkt aus geneigt, es als selbstverständlich anzunehmen, dass die in jenen Gesetzen enthaltenen | Forderungen miteinander verträglich sind. Beim näheren Zusehen zeigt sich aber, dass die Behauptung der Verträglichkeit dieser Forderungen auf einen schwierigen mathematischen Satz hinauskommt. Es muss nämlich bewiesen werden, dass die Differentialgleichung Δ(u) = 0 für ein Gebiet von vorgeschriebener Form und unter vorgeschriebenen Randbedingungen lösbar ist. 10 This
is a reference to Hilbert 1914a or Hilbert 1914b.
49
50
462
51
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Auch bei der erwähnten Begründung der elementaren Strahlungstheorie bedarf die Frage der Widerspruchslosigkeit einer näheren Erörterung, weil die hierbei aufgestellten Axiome zu gewissen Folgerungen über die elementare Optik führen, deren Uebereinstimmung mit den wirklichen Gesetzen der elementaren Optik nachgewiesen werden muss. Ein besonders reichhaltiges Anwendungsgebiet für die Methode der axiomatischen Untersuchung mit Hilfe der Analysis bildet die physikalische Statistik, wo noch viele ungelöste grundsätzliche Probleme vorhanden sind. Hiermit möchte ich die Reihe der Beispiele für die Methode der Zurückführung abschliessen. Das gemeinsame Prinzip besteht darin, dass man, um ein System von Axiomen als widerspruchsfrei zu erweisen, innerhalb der Analysis Gegenstände aufweist, zwischen denen die in den Axiomen geforderten Beziehungen bestehen. Die Schlusskraft dieses Beweisverfahrens ruht ganz und gar auf der Voraussetzung der Widerspruchslosigkeit der Analysis, d. h. der Arithmetik im weiteren Sinne (worin auch die Mengenlehre inbegriffen ist). Diese Voraussetzung haben wir nunmehr zu prüfen. Und damit komme ich zu dem | zweiten Abschnitt meiner Vorlesung:
II. Das Problem der Widerspruchsfreiheit in der Arithmetik und die bisherigen Versuche zu seiner Lösung.
52
Beim Herantreten an das Problem der Widerspruchsfreiheit der Arithmetik wird man zunächst stutzig werden. Es scheint zunächst, als ob es eine unnötige Forderung sei, für die Arithmetik die Widerspruchsfreiheit zu beweisen. Denn für die Arithmetik scheint die landläufige Ansicht zuzutreffen, dass ihre Sätze absolut sicher sind, da sie auf Grund von Definitionen durch untrügliche Schlüsse bewiesen werden. Tatsächlich hat sich aber gezeigt, dass auch in der reinen Arithmetik die Schlussweisen nicht untrüglich sind, und bei der heutigen strengen Behandlungsweise der Analysis und der Mengenlehre kommt man auch nicht mit blossen Definitionen aus, sondern man braucht Axiome (ich erinnere an das früher erwähnte Vollständigkeitsaxiom der Arithmetik), und von diesen Axiomen ist nicht ohne weiteres klar, dass sie nicht auf Widersprüche führen können. Dennoch ist an jener landläufigen Meinung etwas Richtiges. Nämlich in den elementaren Gebieten der Arithmetik, insbesondere in der elementaren Zahlenlehre, haben wir jene völlige Sicherheit der Ueberlegungen. Wir kommen hier ohne Axiome aus, und die Schlüsse haben den Charakter des handgreiflichSicheren. Es kommt nun zunächst darauf an, uns klar zu machen, dass dieser Teil der Mathematik sich tatsächlich in endgülti|ger und für die Erkenntnis völlig befriedigender Weise aufbauen lässt. Die Einstellung, welche wir dabei gewinnen, ist auch für unsere späteren Betrachtungen von grundlegender Wichtigkeit.
5
10
15
20
25
30
35
40
‘Grundlagen der Mathematik’ (1921/22)
463
A. Die elementare Zahlenlehre.
5
10
15
20
25
30
35
Das Zählen geschieht mit Hilfe gewisser Zeichen, welche auf mannigfache Art gewählt werden können. Jede Sprache liefert durch ihre Zahlworte ein solches Zeichensystem. Ferner sind ja auch die Ziffernsysteme gebräuchlich. Für die mathematische Erkenntnis empfiehlt es sich, die Zeichen so zu wählen, dass sich an ihnen die Anzahl-Beziehungen gestaltlich darstellen. Auf diese Weise gewinnen wir die Möglichkeit, die Zahlentheorie als eine anschauliche Theorie gewisser einfacher Figuren zu entwickeln, welche wir Zahlzeichen nennen wollen. Der Zusammenhang zwischen diesen Zahlzeichen und den Anzahlen wird sich nachher auf ganz naturgemässe Art ergeben. Unsere Theorie handelt also von anschaulichen Figuren, von denen wir voraussetzen, dass sich ihre Gestalt unabhängig von Ort und Zeit und der besonderen Art ihrer Herstellung immer wiedererkennen lässt. Und zwar sollen unter den Zahlzeichen Figuren von folgender Beschaffenheit verstanden werden: Sie bestehen in einer Aufeinanderfolge der Zeichen „1“ und „+“; sie fangen mit 1 an und endigen mit 1. Auf eine 1, sofern sie nicht am Ende steht, folgt +; und auf + folgt immer eine 1. Unsere Betrachtung der Zahlenzeichen bezieht sich ausschliesslich auf ihre Zusammensetzung aus „1“ und „+“. Wir haben es also nur mit diskreten Bestimmungen zu tun.1) Ausser diesen Zahlzeichen, welche nichts bedeuten, vielmehr nur Objekte der Untersuchung sind, wenden wir in der Theorie auch Zeichen im eigentlichen Sinne, d. h. zur Mitteilung von Gedanken an. So bedeutet das Zeichen =, zwischen zwei Zahlzeichen gesetzt, die Uebereinstimmung der Gestalt dieser Zahlzeichen, = bedeutet die Verschiedenheit ihrer Gestalt. Wenn wir eine Aussage über irgendwelche vorgelegten Zahlzeichen machen, so bezeichnen wir diese umbestimmt gelassenen Zahlzeichen mit deutschen Buchstaben. Ferner benutzen wir die üblichen Ziffern als Abkürzungen für bestimmte Zahlzeichen. So soll 2 eine Abkürzung sein für das Zahlzeichen 1+1, 3 eine Abkürzung für das Zahlzeichen 1 + 1 + 1.D Zu den aufgezählten Arten von Zeichen kommen nun noch die Zeichen für gewisse Zusammensetzungen von Zahlzeichen, d. h. für die Bildung neuer Zahlzeichen aus gegebenen Zahlzeichen. Diese Zeichen dienen also zur Mitteilung gewisser konkreter Handlungen. So bedeutet a+b dasjenige Zahl|zeichen, welches entsteht, wenn man hinter das Zahlzeichen a erst + und dann das Zahlzeichen b setzt. Und a · b bedeutet das Zahlzeichen, welches aus einem Zahlzeichen b dadurch entsteht, dass man überall die 1 durch das Zahlzeichen a ersetzt. (In der Tat führen diese beiden Prozesse, wie man sich leicht klar macht, immer auf Zahlzeichen.) Beispielsweise bedeutet (1+1)+(1+1+1) 1) Noch einfacher wäre es, die Zahlzeichen zu erklären als Aufeinanderfolgen von Punkten. Dass wir hier die Zusammensetzung von 1 und + nehmen, geschieht nur, um uns enger an das Gewohnte anzuschliessen.
From pp. 52–60, Hilbert has crossed out all the ‘+’ signs in ‘Zahlzeichen’ of the form 1 + 1 + . . . , and has added here in the margin: +-Zeichen sollen nicht geschrieben werden! Vielmehr + bedeutet jetzt etwas, nämlich das „Dahintersetzen“. D
53
54
464
55
56
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
das Zahlzeichen, welches entsteht, wenn man hinter 1+1 erst + und dann das Zahlzeichen 1+1+1 setzt, also das Zeichen 1+1+1+1+1; (1+1) · (1+1+1) bedeutet das Zahlzeichen, welches man aus 1 + 1 + 1 erhält, indem man jedesmal die 1 durch das Zahlzeichen 1 + 1 ersetzt, also das Zeichen 1 + 1 + 1 + 1 + 1 + 1. Die Klammern werden übrigens in üblicher Weise angewendet zur Umgrenzung der Zahlzeichen, mit denen die betreffende Zusammensetzung vorgenommen werden soll. Insbesondere behalten wir auch die gewöhnliche Festsetzung bei, dass für die Trennung von Zeichen das „+“ vor dem „·“ den Vorrang hat. Die arithmetischen Sätze werden nun durch anschauliche Ueberlegungen gewonnen. Und zwar entspricht es durchaus unserem Standpunkt, wenn wir bei diesen Ueberlegungen auch das gewöhnliche Zählen von Zeichen zulassen. Zunächst ergibt sich unmittelbar, dass für die Zusammensetzung a + b, die „Addition“, das assoziative Gesetz gilt, dass also für irgend drei gegebene Zahlzeichen a, b, c a + (b + c) = (a + b) + c ist. Ferner erkennt man, dass von zwei Zahlzeichen verschiedener Gestalt das eine mit einem Bestandteil des ande|ren übereinstimmt. Stimmt ein Zahlzeichen a mit einem Bestandteil von b (aber nicht mit b selbst) überein, so sagen wir, a ist kleiner als b, bzw. b ist grösser als a, (sodass also beim Untereinanderschreiben das Zeichen b über a hinausragt). Wir schreiben dafür a < b, bzw. b > a Bei zwei Zahlzeichen a und b besteht also die Alternative, dass entweder a = b oder a < b oder b < a; und zwar schliessen diese Fälle einander aus. Die Beziehung a < b ist offenbar transitiv. Das heisst wenn a < b und b < c, so ist a < c; oder in Worten: wenn a mit einem Bestandteil von b und b mit einem Bestandteil von c übereinstimmt, so stimmt a mit einem Bestandteil von c überein. Man überlegt sich auch leicht, dass im Falle b < a das Zahlzeichen a in die Form b + c gebracht werden kann, wo c wieder ein Zahlzeichen ist, welches durch die Beziehung a = b+c eindeutig bestimmt wird. Ist umgekehrt a = b+c, so ist a > b. Wir wollen dann unter a−b das Zahlzeichen c verstehen. Auf diese Weise wird die Subtraktion eingeführt. Das kommutative Gesetz der Addition, d. h. der Satz, dass für zwei Zahlzeichen a, b stets a + b = b + a ist, wird folgendermassen bewiesen: Wenn a mit b übereinstimmt, so ist die Behauptung selbstverständlich; andernfalls können wir die Bezeichung so wählen, dass a > b ist. Es hat dann a die Form b + c, | wo c wieder ein Zahlzeichen ist, und unsere Behauptung ist also gleichbedeutend mit b + c + b = b + b + c. (Dass die Addition assoziativ ist, wurde ja bereits erwähnt.) Die umgeformte Behauptung ist nun wiederum gleichbedeutend mit c + b = b + c. Die Behauptung a + b = b + a ist also für die Zahlzeichen a, b jedenfalls dann erfüllt, wenn die entsprechende Behauptung für die Zahlzeichen b und c gilt. Diese enthalten aber beide weniger + Zeichen, als a enthält; denn es ist ja a = b + c.
5
10
15
20
25
30
35
40
45
‘Grundlagen der Mathematik’ (1921/22)
5
10
15
20
25
465
Nun stimmen entweder b und c überein; dann ist jedenfalls b + c = c + b, oder wir können das eben angewandte Verfahren wiederholen und die Behauptung b + c = c + b auf eine Behauptung gleicher Form für zwei Zahlzeichen zurückführen, deren jedes weniger + Zeichen enthält als das grössere der Zahlzeichen b, c. Dieses Verfahren muss einmal zum Abschluss kommen; denn wenn wir von dem Zahlzeichen a fortgesetzt Bestandteile wegnehmen, so bleibt schliesslich nichts mehr übrig. Wir müssen also schliesslich einmal zu einer Gleichung gelangen, wo die Zeichen auf beiden Seiten übereinstimmen. Auf eine solche Gleichung, welche ja eine selbstverständliche Behauptung darstellt, lässt sich also die Behauptung a + b = b + a zurückführen, und damit wird sie als richtig erkannt. Bei diesem Beweis wenden wir eine Art von voll|ständiger Induktion an, die aber auch, in der Form, wie sie hier gebraucht wird, ganz dem Standpunkt unserer anschaulichen Betrachtungsweise entspricht. Das Beweisverfahren kommt auf einen Abbau der Zahlzeichen hinaus, d. h. wir benutzen die Tatsache, dass die Zahlzeichen, ebenso wie sie durch Zusammensetzung von 1 und + aufgebaut sind, sich auch umgekehrt durch Wegnahme von 1 und + abbauen lassen müssen. Für die Zusammensetzung a · b, die „Multiplikation“, ergibt sich aus der Definition unmittelbar a · 1 = a, 1 · a = a, ferner das assoziative Gesetz, welches besagt, dass für irgend drei Zahlzeichen a, b, c stets a · (b · c) = (a · b) · c. Ebenso erhält man unmittelbar das eine distributive Gesetz, wonach für irgend drei Zahlzeichen a, b, c stets
57
a · (b + c) = a · b + a · c. Und durch Anwendung der Kommutativität der Addition beweist man auch leicht das andere distributive Gesetz, wonach stets 30
35
(a + b) · c = a · c + b · c. Nun lässt sich auch das kommutative Gesetz der Multiplikation, durch einen ganz entsprechenden Induktionsschluss wie vorhin vorhin für die Addition, beweisen. Seien a, b irgend zwei Zahlzeichen. Es soll gezeigt werden, dass a · b = b · a. Wenn a mit b übereinstimmt, so ist dies selbstverständlich. Andernfalls können wir die Bezeichnung so gewählt denken, dass a > b, sodass a in der Form b + c darstellbar | ist. Die Behauptung ist dann gleichbedeutend mit (b + c) · b = b · (b + c).
40
Gemäss den distributiven Gesetzen stimmt die linke Seite überein mit b · b + c · b, die rechte Seite mit b · b + b · c. Wir haben also zu zeigen, dass b · b + c · b = b · b + b · c, und diese Behauptung ist wiederum gleichbedeutend mit c · b = b · c.
58
466
59
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Die zu beweisende Behauptung a · b = b · a ist somit zurückgeführt auf eine Behauptung von gleicher Form, wo jedoch die beiden multiplikativ zusammengesetzten Zahlzeichen b und c weniger + Zeichen enthalten als das Zeichen a. Die Wiederholung dieses Verfahrens muss also zu einem Abschluss führen, d. h. die Behauptung a · b = b · a muss sich als gleichbedeutend erweisen mit einer Gleichung m · n = n · m, wo m und n übereinstimmen; und damit wird sie als richtig erkannt. Man beweist auch leicht folgenden Satz: Wenn a > b, so ist auch a · c > b · c und umgekehrt. An die Multiplikation knüpfen sich nun die Gesetze der Teilbarkeit und die Division. Um diese einzuführen, schicken wir zunächst folgende Bemerkung voraus: Geht man von einem Zahlzeichen a aus, welches von 1 verschieden ist, so ist a− 1 wieder ein Zahlzeichen, welches durch Wegnehmen des am Ende stehenden „+1“ aus a hervorgeht. Wiederholt man diesen Prozess des | Weglassens von „+1“, so muss man schliesslich zu dem Zahlzeichen 1 gelangen, und indem man die Reihenfolge der auf diese Weise nacheinander erhaltenen Zahlzeichen umkehrt, gewinnt man eine Aufeinanderfolge von Zahlzeichen, deren erstes 1, deren letztes a ist, und wo jedes folgende Zahlzeichen aus dem vorigen durch Anhängen von +1 entsteht. Wir nennen diese zu einem Zahlzeichen a gehörige Aufeinanderfolge von Zahlzeichen die Reihe der Zahlzeichen von 1 bis a. Ist ein Zahlzeichen kleiner als a, so kommt es jedenfalls in dieser Reihe der Zahlzeichen von 1 bis a vor. Seien nun a und b irgend zwei Zahlzeichen. Man betrachte die Folge der Zahlzeichen: 1 · b, (1 + 1) · b, . . . , a · b, wo der Faktor von b die Reihe der Zahlzeichen von 1 bis a durchläuft. Wenn unter diesen Zahlzeichen a vorkommt, so sagen wir: b ist ein Teiler von a, oder: a ist durch b teilbar, oder auch: a ist ein Vielfaches von b. In diesem Fall ist a gleich einem Produkt c · b, wo c wieder ein Zahlzeichen ist. Wenn umgekehrt für ein gewisses vorgelegtes Zahlzeichen c die Gleichung
5
10
15
20
25
30
a = c·b
60
zutrifft, so stimmt im Falle b = 1 das Zahlzeichen c · b mit c überein, und sonst ist c · b > c; es ist also entweder c = a oder c < a, mithin ist jedenfalls c ein Zahlzeichen aus der Reihe von 1 bis a; folglich ist nach unserer Definition b ein Teiler von a. Aus den Gleichungen a = a · 1,
35
a = 1·a
folgt, dass stets 1 ein Teiler von a und a selbst ein Teiler von a ist. Betrachten wir nun den anderen Fall, dass b kein Teiler von a ist, dass also a nicht in der Folge der Zahlzeichen 1 · b, (1 + 1) · b, . . . , a · b vorkommt; dann ist jedenfalls b von 1 verschieden, also a · b > a. Nehmen wir nun ferner an, dass a > b; dann ist 1 · b < a. Das erste Zahlzeichen unserer
40
‘Grundlagen der Mathematik’ (1921/22)
467
Folge ist also kleiner als a, das letzte grösser als a. Es muss also in der Folge jedenfalls einmal hinter einem Zahlzeichen q · b, welches kleiner als a ist, ein Zahlzeichen (q + 1) · b stehen, welches grösser ist als a. Es ist dann also: a > q·b 5
d. h.: a = q · b + r, und a < (q + 1) · b, d. h. q·b + r < q·b + b
10
also: r < b.
15
20
25
Wir erkennen also: Wenn a grösser als b und nicht durch b teilbar ist, so lassen sich zwei Zahlzeichen q, r derart bestimmen, dass r < b und a = q · b + r. Man zeigt auch leicht, dass eine solche Zerlegung von a nur auf eine einzige Art möglich ist. In dieser Weise ergibt sich die Möglichkeit der Division. Von dem Begriff der Teilbarkeit gelangen wir leicht zum Begriff der Primzahl . Ist nämlich b ein Teiler von a, so ist entweder b = a oder b < a, jedenfalls gehört also b zu der Reihe der Zahlzeichen von 1 bis a. Ferner wissen wir, dass sowohl das Anfangsglied 1 wie das Endglied a dieser Reihe Teiler von a ist. Wir nennen nun a eine Primzahl, falls a von 1 verschieden ist und falls in der Reihe der Zahlzeichen von 1 bis a ausser 1 und a kein Teiler von a vorkommt. Eine Methode zum Aufsuchen von Primzahlen ergibt sich aus folgendem Satz: Es sei a irgend ein von 1 verschiedenes Zahlzeichen, man gehe die Reihe der Zahlen von 1 bis a (unter Weglassung von 1) so weit durch, bis man zuerst zu einem Teiler d von a gelangt, was ja spätestens bei a stattfindet. Dann ist d eine Primzahl. Kurz gesagt: wenn a > 1 ist, so ist der kleinste von 1 verschiedene Teiler von a eine Primzahl. Denn da d ein Teiler von a ist, so gilt eine Gleichung:
30
a = k·d
35
Wäre nun d keine Primzahl, dann gäbe es einen Teiler t von d, der von 1 und d verschieden ist; es wäre also: d = q · t, 1 < t < d; a = k · (q · t) = (k · q) · t. Somit wäre t ein Teiler von a, welcher in der Reihe der Zahlzeichen von 1 bis a dem Zahlzeichen d vorangeht (und von 1 verschieden ist). Dies widerspricht aber der Bestimmung von d. Mit Hülfe des bewiesenen Satzes können wir nun auch nach der Methode von Euklid zeigen, dass zu jedem Zahlzeichen a sich eine Primzahl p bestimmen lässt, die grösser als a ist.
40
61
62
468
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Multiplizieren wir alle Zahlzeichen der Reihe von 1 bis a miteinander und addieren 1, so erhalten wir ein Zahlzeichen 1·2·...·a + 1 hiervon nehmen wir den kleinsten von 1 verschiedenen Teiler. Dieser ist, wie wir wissen, eine Primzahl p. Damit haben wir schon eine Primzahl, welche grösser ist als a. Wäre nämlich p = a oder p < a, so käme p unter den Faktoren des Produktes 1 · 2 . . . · a vor. Es wäre also 1 · 2 . . . · a = q · p. Andererseits ist aber, gemäss der Bestimmung von p 1 · 2 · . . . · a + 1 = k · p. Da nun k · p > q · p, so müsste k > q, also k = q + t sein. Demnach wäre (q + t) · p = q · p + 1,
63
t · p = 1, während doch t · p > 1 sein muss, weil p von 1 verschieden ist. Es ergäbe sich also ein Widerspruch. Nun können wir in dieser Weise immer weiter fortschreiten: wir können die Begriffe des grössten gemeinsamen Teilers, des kleinsten gemeinsamen Vielfachen, ferner die Zahlenkongruenzen einführen. Auch die Definition von zahlentheoretischen Funktio|nen mit Hilfe von Rekursionsformeln ist vom Standpunkt unserer anschaulichen Betrachtungsweise zulässig. Es muss nur bei jeder solchen Definition durch Rekursion eigens festgestellt werden, dass tatsächlich für jede Wertbestimmung der Argumente die Anwendung der Rekursionsformel ein Zahlzeichen als Funktionswert liefert. So kann z. B. die Potenz am in üblicher Weise durch die Gleichungen a1 = a an+1 = an · a
5
10
15
20
25
E
64
definiert werden , aus denen man in der Tat durch wiederholte Anwendung für jedes Zahlzeichen m eine Darstellung von am als Produkt von mehreren Faktoren a erhält, sodass für jedes Zahlzeichen a und jedes Zahlzeichen m auch am ein Zahlzeichen darstellt. Der kleine Fermatsche Satz, ferner die Sätze über die quadratischen Reste können nach den üblichen Methoden als anschauliche Sätze über die Zahlzeichen bewiesen werden. Ueberhaupt die ganze elementare Zahlentheorie lässt sich als Lehre von den Zahlzeichen an Hand von konkret anschaulichen Ueberlegungen entwickeln. Auch die Herstellung des Zusammenhanges zwischen der Theorie der Zahlzeichen und dem gewöhnlichen Zählen macht keine Schwierigkeit. Diesen Zusammenhang, auf welchem ja die Bedeutung der Zahlentheorie für die Erkenntnis der Wirklichkeit beruht, will ich hier noch kurz darlegen. Wenn wir irgendwelche Dinge zählen, so geschieht das dadurch, dass wir die Dinge nacheinander vornehmen und mit gewissen Namen belegen, für welche eine bestimmte Aufeinanderfolge ein für allemal festgesetzt ist. Gewöhnlich nehmen wir zu diesem Zweck die Zahlworte „eins“, „zwei“, „drei“ u.s.w. Wir E
Hilbert has added in the left-hand margin: Bernays soll das ausführen!
30
35
40
‘Grundlagen der Mathematik’ (1921/22)
5
10
15
469
können nun aber statt dessen auch unsere Zahlzeichen 1, 1 + 1, 1 + 1 + 1, . . . nehmen, die wir, mit 1 beginnend durch fortgesetztes Anhängen von „+1“ erhalten. Diese Zeichen legen wir der Reihe nach den zu zählenden Dingen, die wir in irgend einer Reihenfolge durchgehen, als Namen bei, bis alle diese Dinge benannt sind. Ist a der Name des zuletzt benannten Dinges, so sagen wir, a ist die Anzahl der gezählten Dinge. Um zu erkennen, dass diese Begriffsbestimmung eindeutig ist, müssen wir uns klarmachen, dass die Anzahl in dem erklärten Sinn, unabhängig ist von der jeweiligen Art des Verfahrens, d. h. von der Reihenfolge, in der die Benennung der Dinge mit Zahlzeichen stattfindet. Dies ist in der Tat der Fall. Denn denken wir uns, dass dieselben Dinge zweimal in verschiedener Weise durchgezählt werden, und seien 1, 1 + 1, . . . , a die Zahlzeichen, welche bei der ersten Zählung als Benennungen angewandt werden. Ist nun n ein Zahlzeichen aus dieser Reihe der Zahlzeichen von 1 bis a, dann bekommt bei der zweiten Zählung dasjenige Ding, welches bei der ersten Zählung mit n benannt wird, wieder ein gewisses Zahlzeichen als Namen; dieses wollen wir mit bn bezeichnen. Dann bedeuten: b1 , b1+1 , . . . , ba
20
25
die Namen, welche die Dinge, aufgezählt in der Reihenfolge der ersten Zählung, bei der zweiten Zählung erhalten. Es kommt darauf an, zu zeigen, dass die Gesamtheit dieser Zahlzeichen mit der Gesamtheit der Zahlzeichen 1, 1 + 1, . . . , a übereinstimmt. Zunächst wissen wir, dass unter den Zeichen b1 , b1+1 , . . . , ba das Zeichen 1 vorkommt. Es ist also entweder b1 = 1 oder bk = 1 für ein von 1 verschiedenes Zahlzeichen k aus der Reihe der Zahlzeichen von 1 bis a. Im letzten Fall können wir, ohne die Gesamtheit der angewandten Zahlzeichen zu verändern, das Zeichen b1 mit bk vertauschen. Daher erhalten wir jedenfalls eine Reihe von Zahlzeichen
65
1, c1+1 , . . . , ca , 30
deren Gesamtheit mit der Gesamtheit der Zeichen b1 , . . . , ba übereinstimmt. Wenn a = 1 ist, so sind wir schon am Ziele des Beweises. Andernfalls muss, gemäss der Bestimmung des Zählverfahrens, unter den Zeichen c1+1 . . . . ca das Zeichen 1 + 1 vorkommen. Nun ist wiederum entweder c1+1 = 1 + 1, oder wir können in der Reihe der Zahlzeichen c1+1 , . . . , ca das Zeichen c1+1 mit 1 + 1 vertauschen, sodass wir jedenfalls zu einer Reihe von Zahlzeichen
35
1, 1 + 1, d1+1+1 , . . . , da
40
gelangen, deren Gesamtheit mit der Gesamtheit der Zeichen b1 , . . . , ba übereinstimmt. Ist nun a = 1 + 1, so ist unsere Behauptung bewiesen. Andernfalls kommt unter den Zeichen d1+1+1 , . . . , da das Zeichen 1 + 1 + 1 vor. — So können wir | unsere Schlussweise fortsetzen, bis wir, durch wiederholte Ausführung des Vertauschungsverfahrens, zu der Reihe der Zahlzeichen 1, 1 + 1, 1 + 1 + 1, . . . , a gelangen, und dadurch feststellen, dass die Gesamtheit dieser Zeichen übereinstimmt mit der Gesamtheit der Zeichen b1 , . . . , ba , was wir ja beweisen wollten.
66
470
67
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Durch diese Ueberlegung, welche der landläufigen Begründung der Arithmetik ganz vertraut ist — (vgl. insbesondere die Darstellung bei Helmholtz in der Abhandlung „Zählen und Messen, erkenntnistheoretisch betrachtet“ 11 — wird der Anschluss der Theorie der Zahlzeichen an den gewöhnlichen Anzahlbegriff erreicht.F Und damit ist die Frage nach der Anwendbarkeit der Zahlentheorie auf die Wirklichkeit in befriedigender Weise beantwortet. Für die elementare Zahlentheorie erweist sich somit in der Tat die landläufige Auffassung von der mathematischen Erkenntnis als berechtigt 12 ; und wir würden in der Begründung der Mathematik aller Schwierigkeiten enthoben sein, wenn wir im Gebiete der Arithmetik und Analysis mit derjenigen Art der anschaulichen Ueberlegung auskämen, wie ich sie Ihnen in der Theorie der Zahlzeichen dargelegt habe. Tatsächlich aber gehen in der höheren Zahlentheorie und in der Analysis die Schlussweisen über den Rahmen jener Betrachtungsweise hinaus. Man stellt sich hier den Inbegriff aller Zahlzeichen als eine abgeschlossene Gesamtheit vor, | und auf Grund dieser Vorstellung wendet man die logischen Formeln des allgemeinen Urteils („allen Zahlen kommt die und die Eigenschaft zu“) und des Existenzialurteils („es gibt Zahlen von der und der Eigenschaft“) in einer freieren Weise an, deren Berechtigung vom anschaulichen Standpunkt nicht gewährleistet ist.G In der anschaulichen Zahlentheorie haben die allgemeinen Sätze rein hypothetischen Sinn. Ein Satz wie a+b=b+a besagt nur: Wenn zwei Zahlzeichen a, b gegeben sind, so liefert die additive Zusammensetzung von a mit b dasselbe Zahlzeichen wie die additive Zusammensetzung von b mit a. Von der Gesamtheit aller Zahlen ist dabei nicht die Rede. Ferner die existenzialen Sätze haben in der anschaulichen Zahlentheorie nur die Bedeutung von Partial-Urteilen, d. h. sie sind Teilaussagen von näher bestimmten Aussagen, deren genauer Inhalt jedoch für viele Anwendungen unwesentlich ist. Z. B. haben wir den Satz bewiesen, dass es zu jedem Zahlzeichen a eine Primzahl p gibt, die grösser ist als a. Dieses „es gibt“ war so zu verstehen, dass wir wirklich ein Verfahren aufzeigten, durch welches man für ein gegebenes Zahlzeichen a eine Primzahl bestimmen kann, die > a ist. Nämlich wir zeigten: Der kleinste von 1 verschiedene Teiler von 1 · 2 . . . · a + 1 ist eine Primzahl, welche > a ist. Dies war der Satz, welchen wir bewiesen. Die Aussage, dass es zu jedem Zahlzeichen a eine Primzahl gibt, die grösser Added in the left-hand margin by Hilbert: (Hölder, Die Arithmetik in strenger Begründung, Leipzig 1914 (Abh. d. philos. Fakultät) Hölder 1914 ) G Added by Hilbert in the left-hand margin, but not directed to a particular place: In unserem typischen Beispiel sind es die Repräsentantenmengen, aus denen wir die Vereinigungsmenge V bildeten. F
11 That
is, von Helmholtz 1887 . ‘berechtigt’, Hilbert has added, and then subsequently crossed out: ‘dass die math. Sätze abs. sicher sind, da sie auf Grund von untrüglichen unmittelbar einleuchtenden Ueberlegungen gefunden und bewiesen werden können’. 12 After
5
10
15
20
25
30
35
‘Grundlagen der Mathematik’ (1921/22)
5
10
15
20
25
471
ist als a, | bringt nur einen Teil des Inhalts von jenem Satz zum Ausdruck, nämlich denjenigen Teil, auf welchen es bei den mathematischen Folgerungen ankommt. Wie in diesem Falle, so gehört allgemein in der anschaulichen Zahlentheorie zu einem existenzialen Urteil ein genauerer Satz, welcher den Inhalt jenes Urteils näher bestimmt. Die Existenzbehauptung hat hier überhaupt nur einen Sinn als ein Hinweis auf ein Verfahren der Auffindung, welches man besitzt, das man aber für gewöhnlich nicht näher anzugeben braucht, weil es im allgemeinen genügt, zu wissen, dass man es besitzt. In der höheren Arithmetik dagegen fasst man die allgemeinen Sätze über Zahlen als kategorische Behauptungen auf, welche eine Eigenschaft angeben, die allen Individuen in der Gesamtheit aller Zahlen zukommt, und die Existenzsätze, welche aussagen, dass es Zahlen von gewissen Eigenschaften gibt, werden hier als Behauptungen über das System aller Zahlen aufgefasst. Z. B. bedeutet von diesem Standpunkt der Satz, dass es zu jeder Zahl eine Primzahl gibt, die grösser ist, nicht die Mitteilung, dass man ein Verfahren zur Bestimmung einer solchen Primzahl hat, sondern er drückt eine Beziehung aus, welche in dem System aller Zahlen, ganz unabhängig von unserem Tun und Wissen, besteht.H Für diesen Standpunkt erscheint es als logische Selbstverständlichkeit, dass bezüglich jeder Aussage über ganze Zahlen nur folgende zwei Möglichkeiten vorhanden sind: Entweder die Aussage trifft für alle Zahlen zu, oder es gibt eine Zahl, für welche sie nicht zutrifft. Diese Alterna|tiveI wird besonders in der Analysis auf Schritt und Tritt angewandt. Z. B. bei der Betrachtung einer unendlichen Reihe ist es eine ganz unentbehrliche und auch ganz unbedenklich angewandte Schlussweise, dass man sagt: entweder sind alle Teilsummen kleiner als 1, oder es gibt eine Teilsumme, die gleich 1 oder grösser ist.A,B Added by Hilbert in the left-hand margin is a reference to Dirichlet’s famous theorem: Z. B. Satz von der arith. Progression! ax + b a, b teilerfremd I Added by Hilbert at the top of p. 69: Transfinites „Tertium non datur“ A Added by Hilbert on the reverse of the previous page: Eine Reihe ist entweder konvergent oder divergent. Eine Folge a1 , a2 , a3 . . . (a > 0) ist entweder beschränkt oder unbeschränkt, d. h. entweder giebt es ein m, so dass alle an < m oder zu jedem m giebt es ein n, so dass an > m. Beweis: Es sei p ein Parameter. Entweder alle an < p, oder es giebt ein an ≥ p. Im ersten Fall ist der Satz erfüllt; im andern Falle giebt es ein an ≥ p. Entweder giebt es ein p, so dass der erste Fall vorliegt, so Beweis fertig oder bei allen p liegt der 2te Fall vor, d. h. bei jedem p giebt es ein an ≥ p und der Satz ist wieder richtig. Dieser Satz drückt nicht eine unmittelbar anschauliche Tatsache aus, sondern er erfordert sogar 2 mal die Anwendung des transfiniten Tertium non datur, d. h. der logischen Alternative, die nicht auf finite Weise begründbar ist (nicht wie “ragt hinaus oder ragt nicht hinaus”). Meine Vorl. S. 8. B Added by Hilbert on the reverse of the previous page: Definition einer Funktion: √ √ Wenn n n rational, so f (n n ) = 0 sonst = 1. Man kann diese Def. auch umformen in einen Satz, nämlich: Es giebt eine Funktion f (n) derart, dass für jedes ganze n √ a f (n) = 0 oder = 1 ist, jenachdem es zwei ganze Zahlen a, b giebt so dass n n = b wird, oder nicht giebt. H
68
69
472
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
B. Versuche einer Zurückführung der Arithmetik auf die Logik.
70
71
Nun brauchte uns diese Ueberschreitung des finiten Standpunktes nicht unbedingt abzuschrecken; vielmehr erscheint es als die sachgemässe Auffassung, dass das logische Denken wegen der ihm zukommenden höchsten Allgemeinheit nicht an die Grenzen der primitiven Anschauung gebunden ist. Von diesem Gedanken geleitet, hat man sich tatsächlich über die Grenzen der finiten Betrachtung hinweggesetzt und versucht, von den allgemeinen Begriffen des Dinges, der Gesamtheit (Menge), der Eigenschaft (Prädikat) ausgehend, eine Grundlegung der Arithmetik zu gewinnen, durch welche einmal die Mathematik als ein Ausfluss der reinen Logik erwiesen und zugleich damit den Begriffsbildungen und Schlussweisen der Arithmetik die umfassendste Allgemeinheit verliehen werden sollte. Dies Unternehmen scheiterte an den berühmten Paradoxien der Mengenlehre, welche zeigten, dass die Begriffsbildungen, die man als selbstverständliche Bestandteile des logischen Denkens angesehen und zum Ausgang der Ueberlegungen genommen hatte, nicht widerspruchfrei sind. Eine solche unstatthafte Begriffsbildung ist z. B. der Begriff der Menge aller Dinge, welche Gegenstand des Denkens sein können. Von diesem Begriff ging Dedekind in seiner Untersuchung über die Grundlagen der Zahlentheorie („Was sind und was sollen die Zahlen?“) aus, um die Existenz unendlicher Mengen nachzuweisen. (Darstellung der Dedekindschen Ueberlegung und des Russellschen Paradoxons in der Vorlesung „Natur und mathematisches Erkennen“, S. S. 1919, S. 50–53.) 13 Ein anderer Versuch, die Zahlentheorie auf reine Logik zu gründen, rührt von Frege her. Nach Frege ist die Anzahl etwas, das einem Begriff (Prädikat) zukommt. Z. B. wenn wir feststellen: es gibt fünf Erdteile, so wird hiermit die Fünfzahligkeit nicht den einzelnen Erdteilen, sondern vielmehr dem Prädikat „Erdteilsein“ zugeschrieben. Die Fünfzahligkeit ist sonach ein Prädikaten-Prädikat; und den Umfang dieses Prädikaten-Prädikats, d. h. den Inbegriff der Prädikate, welche dem Prädikat „Erdteil-sein“ gleichzahlig sind, erklärt Frege als die Anzahl Fünf. Eine Anzahl ist also nach Frege die Gesamtheit aller Prädikate, welche irgend einem bestimmten Prädikate gleichzahlig sind, — wobei Gleichzahligkeit zweier Prädikate bedeutet, dass die Gegenstände, auf welche das eine Prädikat zutrifft, sich denen, auf welche das andere zutrifft, umkehrbar eindeutig zuordnen lassen. Auf diese Weise werden die Anzahlen von Frege als bestimmte Gegenstände der Logik definiert, und auf Grund dieser Definition stellen sich dann die Gesetze des Rechnens mit Zahlen als Sätze der reinen Logik dar. Bei diesem Verfahren liegt die Auffassung zugrunde, dass die Begriffe (Prädikate) an sich bestehende Gegenstände sind und dass bezüglich eines be-
13 Dedekind’s
investigation is Dedekind 1888 ; Hilbert’s lectures from 1919 have been published as Hilbert 1992 .
5
10
15
20
25
30
35
40
‘Grundlagen der Mathematik’ (1921/22)
5
10
15
20
25
30
35
40
45
473
stimmten Dinges und eines bestimmten Prädikates an sich feststeht, ob dem Ding das Prädikat zukommt oder nicht. Diese Voraussetzungen sind für Freges Grundlegung der Zahlentheorie wesentlich; denn ihm kommt es darauf an, die Anzahlen als bestimmte, an sich bestehende Objekte der Logik zu erweisen. Man erkennt aber leicht, dass eine solche Auffassung implicite die Vorstellung einer abgeschlossenen Gesamtheit alles Denkbaren enthält, nur dass diese hier nicht wie bei Dedekind in der Sprache der Mengentheorie, sondern in derjenigen einer Prädikatentheorie zum Ausdruck kommt. Auch in dieser Ausdrucksweise lässt sich das Widerspruchsvolle der Vorstellung durch ein Paradoxon aufzeigen. Um ein solches zu erhalten, brauchen wir nur von dem Begriff der Menge aller sich nicht selbst als Element enthaltenden Mengen das Analogon im Gebiete der Prädikate aufzusuchen. Die Paradoxie, zu welcher wir so gelangen, besteht in folgendem: Ein Begriff (Prädikat) soll prädikabel heissen, wenn die Aussage, welche diesem Begriff als einem Gegenstande des | Denkens denselben Begriff als Prädikat beilegt, richtig ist, andernfalls soll er imprädikabel heissen. Kurz gesagt: ein Begriff heisse prädikabel, wenn er sich selbst als Prädikat zukommt, andernfalls heisse er imprädikabel. Hiernach ist z.B. der Begriff „widerspruchsfrei“ prädikabel, dagegen der Begriff „rotfarbig“ imprädikabel. Betrachten wir nun den Begriff „imprädikabel“. Wäre dieser prädikabel, so müsste er, nach der Definition von „prädikabel“ sich selbst als Prädikat zukommen, das hiesse aber, er wäre imprädikabel, im Widerspruch mit der Annahme. Der Begriff „imprädikabel“ kann aber auch nicht imprädikabel sein; denn das würde besagen, dass er sich selbst als Prädikat zukäme und demnach prädikabel wäre. In jedem Falle erhalten wir also einen Widerspruch. — Aus diesen Paradoxien wird jedenfalls das ersichtlich, dass wir mit den Begriffen „Gegenstand“, „Eigenschaft“, „Menge“ nicht völlig unbeschränkt operieren dürfen. Die erste Vorsichtsmassregel, zu welcher uns die Paradoxien nötigen, besteht in der scharfen Trennung zwischen den Gegenständen und den auf sie bezüglichen Prädikaten, bzw. den aus ihnen gebildeten Mengen. Wenn wir Prädikate selbst als Gegenstände betrachten und von ihnen Eigenschaften aussagen, so müssen wir diese Eigenschaften von den ursprünglichen nun als Gegenständen genommenen Prädikaten unterscheiden, indem wir sie als Prädikate „zweiter Stufe“ jenen gegenüberstellen. Somit werden wir zu dem Gedanken einer Stufentheorie geführt. Wesentlich an der Unterscheidung der Stufen ist, | dass für jedes Prädikat und jede Relation der Umkreis der Gegenstände, auf die sie sich beziehen, in bestimmter Weise abgegrenzt wird. Doch dies ist noch nicht hinreichend, um die Sicherheit des Verfahrens zu garantieren. Es genügt nicht, dass wir jeweils den Umkreis der Gegenstände festlegen, wir müssen auch genauer angeben, was als Prädikat (bzw. Relation) gelten soll. Wollten wir uns damit begnügen, zu sagen, als Prädikat gelte alles, was von einem Gegenstande des betreffenden zugrunde gelegten Bereiches sinnvoll ausgesagt werden kann, so würden wir noch immer nicht vor Widersprüchen gesichert sein. Dies lehrt uns folgendes Paradoxon:
72
73
474
74
75
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Wir betrachten als Gegenstände die Zahlen (Zahlzeichen) von 1 bis 70400 . Diese bilden jedenfalls eine feste Gesamtheit konkreter Objekte. Um eine einzelne dieser Zahlen in deutscher Sprache zu definieren, können wir entweder die üblichen Namen „eins“, „zwei“, . . . „hundert“ u. s. w., eventuell verbunden mit der Bezeichnung arithmetischer Operationen (z. B. „drei hoch sechzehn“), verwenden; oder wir können eine für die Zahl charakteristische Eigenschaft angeben, indem wir z. B. 1 definieren als „die kleinste Zahl“. Unter einer Eigenschaft einer Zahl verstehen wir dabei etwas, das sinvoll von der Zahl ausgesagt werden kann. Eine solche in deutscher Sprache gegebene Definition lässt sich nun aufschreiben entweder in einem Wort oder in einer Wortfolge mit Interpunktionen. Indem wir solche Wortfolgen vom kombinatorischen Standpunkt betrachten, bemerken wir, dass die Anzahl der ver|schiedenen Schriftzeichen, aus denen sie sich zusammensetzen, weniger als 70 beträgt. Denn die grossen und kleinen Buchstaben zusammen sind weniger als 60, und die dazu kommenden Interpunktionen (Punkt, Komma, Semikolon, Bindestrich und die Lücke zwischen zwei Worten) sind weniger als 10. Lassen wir daher nur solche Wortfolgen zu, welche aus weniger als 400 Schriftzeichen bestehen, so ist deren Gesamtzahl kleiner als 70400 ; es können demnach die Zahlen von 1 bis 70400 nicht jede durch eine solche Wortfolge definiert werden. Unter denen, welche sich nicht so definieren lassen, wählen wir die kleinste. Diese Zahl ist hiernach definiert als: „die kleinste unter den Zahlen von Eins bis siebzig hoch vierhundert, welche nicht in deutscher Sprache durch ein Wort oder eine Wortfolge von weniger als vierhundert Schriftzeichen definiert werden kann, wenn als Schriftzeichen die Buchstaben, die Interpunktionen sowie auch die Lücken zwischen je zwei Worten gerechnet werden“. Was wir hier aber aufgeschrieben haben, ist eine Wortfolge von weniger als 400 Schriftzeichen, wie man leicht nachzählt. Somit ist die betreffende Zahl, entgegen ihrer Definition, durch eine Wortfolge von weniger als 400 Schriftzeichen definiert. Wir haben also einen Widerspruch. So sehen wir in der Tat, dass der Allgemeinbegriff einer sinnvollen Aussage, welcher implicite in dem Begriff „definierbar“ vorkommt, zu unpräzise ist, und dass wir daher genauer bestimmen müssen, was wir unter einem Prädikat verstehen wollen. Zugleich zeigt sich uns die Gefahr, welche in der Unschärfe des sprachlichen Ausdrucks liegt; wir erkennen die Notwendigkeit einer Präzisierung der Sprache. Der Gebrauch des Logikkalküls erweist sich also für unseren Zweck als ein Erfordernis. Freilich lehrt uns das Beispiel von Frege, dass die Anwendung des Logikkalküls für sich allein noch keine Gewähr vor Widersprüchen bietet. Denn Frege hat die Forderung einer Kontrolle der Ueberlegungen durch die Darstellung in der Formelsprache eines logischen Kalküls gerade mit Nachdruck erhoben und in seinem Werke mit voller Strenge zur Durchführung gebracht. (Er war ja auch einer der Ersten, die dem Logikkalkül eine solche Ausgestaltung gaben, dass es dadurch möglich wurde, die mathematischen Beweise vollständig in ein Rechnen mit logischen Formeln zu übersetzen.) Und doch wurde Frege durch diese Genauigkeit in der formalen Durchführung der Schlüsse nicht
5
10
15
20
25
30
35
40
45
‘Grundlagen der Mathematik’ (1921/22)
5
10
15
20
25
30
35
40
475
davor bewahrt, seine logische Theorie der Arithmetik auf einer widerspruchsvollen Grundlage zu errichten. Wir müssen mit der formalen Schärfe des Ausdrucks die Sicherheit der inhaltlichen Voraussetzungen verbinden. Indem wir uns nun dieses Erfordernis klarmachen, drängt sich die Frage auf, ob nicht bei Befolgung der notwendigen Vorsichtsmassregeln die logische Begründung der Arithmetik in einwandfreier Weise durchgeführt werden kann. Im Sinne dieser Fragestellung haben Russell und Whitehead den Grundgedanken Freges von neuem aufgenommen, indem sie dabei | allen Anforderungen Rechnung trugen, die an die Präzision des logischen Verfahrens zu stellen sind. Zugleich wendeten sie ihre Methode auch auf die Begründung der Analysis und der Mengenlehre an. Von diesem grosszügigen Unternehmen müssen wir die methodischen Hauptpunkte des Näheren betrachten. Es zeigt sich, dass auch hier das Ziel einer Zurückführung der Arithmetik auf die Logik nicht erreicht wird. Um die methodischen Gedanken von Russell und Whitehead auseinandersetzen zu können, bedarf es zunächst der Darlegung des Logikkalküls, von dem wir bereits einen Teil, den Aussagenkalkül, kennen gelernt haben. Es ist der Logikkalkül ein Instrument wie die Sprache, zur Mitteilung und Fixierung von Gedanken, nur dass der Logikkalkül in seinen Ausdrucksmitteln sich auf dasjenige beschränkt, was für die theoretische Wissenschaft und ihre Darstellung nötig ist. Diese Beschränkung auf das theoretisch Wesentliche ermöglicht es, die Regeln der Grammatik so übersichtlich zu gestalten, dass das logische Schliessen sich ganz automatisch durch Rechnung nach bestimmten einfachen Vorschriften vollziehen lässt. Darstellung der Prädikate und Relationen durch logische Funktionen mit Argumenten in der Vorlesung über „Logik-Kalkül“, W. S. 1920, S. 23–25. 14 Die verschiedenen Argumentstellen bei den logischen Funktionen mit mehreren Argumenten bringen das zum Ausdruck, was in der Sprache teils durch die Casus der Deklination, | teils durch die Präpositionen ausgedrückt wird. Beispiele: „Die Gerade g schneidet den Punkt p“: S(g, p) „Das Dreieck ist mit dem Dreieck ähnlich“: Sim(, ) „Friedrich ist Vorfahre des Wilhelm“: V (Friedrich, Wilhelm) „x ist kleiner als y“: <(x, y) „x ist durch y teilbar“: Tl (x, y). Auch die Form des Passivums lässt sich im Logikkalkül nachahmen. Wird z. B. anstatt des Satzes „die Gerade g schneidet den Punkt p“ die passive Wendung gewählt: „der Punkt p wird von der Geraden g geschnitten“, so können wir dementspechend im Logikkalkül statt S(g, p) die Darstellung S (p, g) wählen, wobei S diejenige logische Funktion ist, für welche S (p, g) mit S(g, p) gleichbedeutend ist. — Einführung des Allzeichens (x) und des Seinszeichens (Ex); Regeln für das Schliessen im Funktionenkalkül; Beispiele für die Anwendung der Regeln; 14 These
lectures, also mentioned below, can be found in Chapter 2.
76
77
476
78
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Einführung der Identität als Beziehung Jd (x, y), Axiome für diese Beziehung vgl. „Logik-Kalkül“, W. S. 1920, S. 25–46. — Für die inhaltliche Einstellung, welche wir dem logischen Funktionenkalkül zugrunde legen, ist wesentlich, dass wir die Prädikate und die Relationen als logische Funktionen scharf von den Gegenständen sondern, welche als Argumentwerte der Funktionen in Betracht kommen. Die Notwendigkeit einer solchen scharfen Trennung war uns durch die Paradoxien deutlich gezeigt worden. Die Gegenstände, welche für die Variablen x, y, z, . . . eingesetzt werden können, denken wir uns als zu einem oder mehreren festen Bereichen von Individuen (Systemen von Dingen) gehörig, welche die Wertbereiche für die Argumente der logischen Funktionen ausmachen. Nun hindert uns aber nichts, die Prädikate und die Relationen selbst als Gegenstände zu betrachten, denen Eigenschaften zukommen und zwischen denen Beziehungen bestehen. Beispiele für Eigenschaften von zweigliedrigen Relationen R(x, y) sind:
5
10
15
Reflexivität, Ref (R) : (x)R(x, x) Symmetrie, Sym(R) : (x)(y) R(x, y) → R(y, x) Transitivität, Trans(R): (x)(y)(z) R(x, y) & R(y, z) → R(x, z) . Setzt man für R eine bestimmte zweigliedrige Relation ein, so erhält man eine bestimmte Aussage, die wahr oder falsch ist. Nimmt man z. B. die Beziehung <(x, y), so sind Ref (<), Sym(<) falsche Aussagen, während Trans(<) eine richtige Aussage ist. Beispiele für Beziehungen zwischen zwei Prädikaten P (x), Q(x) sind: Unverträglichkeit: Unv (P, Q): :(x)P (x) ∨ Q(x) Implikation: Jmp(P, Q): (x) P (x) → Q(x) Aequivalenz: Aeq(P, Q) : (x) P (x) & Q(x) ∨ P (x) & Q(x) .
79
Eine noch weitergehende Ausdehnung des Formalismus, welche als zweckmässig erscheint, besteht darin, dass wir das Allzeichen und das Seinszeichen auch in Verbindung mit Prädika|ten- oder Relations-Variablen anwenden. Dies hat zunächst den Vorteil, dass wir die Allgemeingültigkeit logischer Formeln als Behauptung zum Ausdruck bringen können. Z. B. besagt die Formel: (P )(x) P (x) ∨ P (x) , dass die Aussage (x) P (x) ∨ P (x) für jedes Prädikat P (x) zutrifft. Beispiele derselben Art bilden die Formeln: (P )(x)(y)(P (x) & ≡(x, y) → P (y)) (P )(Q)(Aeq(P, Q) ∼ Jmp(P, Q) & Jmp(Q, P )),
20
25
30
35
40
‘Grundlagen der Mathematik’ (1921/22)
5
10
15
477
von denen die erste die charakteristische Eigenschaft der Identitätsbeziehung ≡(x, y) ausdrückt, und die zweite angibt, wie sich die Aequivalenz-Beziehung zwischen Prädikaten auf die Beziehung der Implikation zurückführen lässt. In diesen Fällen dient das Vorsetzen der Allzeichen (P ) bzw. (P )(Q) nur zur grösseren Deutlichkeit der Formulierung. Es wird aber unentbehrlich, wenn man Behauptungen darstellen will, in denen die Allgemeingültigkeit einer Aussage als Voraussetzung auftritt. Will man z. B. ausdrücken, dass jede Relation R(x, y), welche die eben angegebene charakteristische Eigenschaft der Identität besitzt und überdies reflexiv ist, auch die Eigenschaften der Symmetrie und der Transitivität hat, so muss man dies folgendermassen schreiben: (R){(P )(x)(y) P (x) & R(x, y) → P (y) & Ref (R) → Sym(R) & Trans(R)}, und hier kann das Allzeichen (P ) nicht weggelassen werden, | ohne dass der Sinn der Aussage geändert wird. Als ein einfaches Beispiel für die Anwendung des Seinszeichens mit einer Prädikaten-Variablen kann die Formel
80
(P )(EQ)Unv (P, Q)
20
25
30
35
40
dienen, welche besagt, dass es zu jedem Prädikat P (x) ein mit ihm unverträgliches Prädikat Q(x) gibt (was ja zutrifft, da mit P (x) stets P (x) unverträglich ist. Die angeführten Beispiele lassen bereits erkennen, dass die vorgenommene Erweiterung des Logikkalküls erforderlich ist, damit dieser uns als Sprache zur Formulierung der logischen Zusammenhänge genügen kann. Insbesondere aber haben wir den erweiterten Formalismus nötig für diejenige Anwendung, um derentwillen wir uns überhaupt hier mit dem Logikkalkül befasst haben. Es handelte sich ja darum, die Methode kennen zu lernen, nach der Russell und Whitehead die Arithmetik auf die Logik zurückzuführen suchen. Der grundsätzliche Standpunkt sollte dabei der sein, dass wir zwar einerseits über das konkret-Anschauliche hinausgehen und uns in das Gebiet des allgemein-Logischen begeben, andererseits aber die logischen Operationen mit Vorsicht und mit genauer Berücksichtigung ihrer Bedeutung anwenden wollten. Diese letzte Maxime der Vorsicht müssen wir nun insbesondere bezüglich der Erweiterung des Funktionenkalküls zur Geltung bringen, wenn wir nicht in die alten Fehler verfallen wollen. Das erste, was wir in dieser Richtung zu tun haben, ist, dass wir die Prädikaten-Prädikate und Relationsprädikate von den ursprünglichen Individuenprädikaten und ebenso die Prädikaten-Relationen und Relations-Relationen von den Individuen-Relationen unterscheiden. In engem Zusammenhang hiermit steht die weitere Anforderung, den Sinn der Ausdrücke „für alle Individuen-Prädikate P (x)“, „für alle Relationen R(x, y)“, „es gibt ein Prädikat P (x)“ u. s. w., welche im Kalkül durch die mit Prädikaten- bzw. Relations-Variablen verbundenen All- und Seinszeichen dargestellt werden, genau festzulegen. Dies bedeutet zugleich, dass wir für die
81
478
82
83
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
logischen Funktionen von Prädikaten und Relationen den Wertbereich ihrer Argumente in bestimmter Weise abgrenzen. Wir müssen also erklären, was wir unter einem Individuen-Prädikat, bzw. einer Individuenrelation verstehen wollen. Und wie wir früher gesehen haben, können wir uns hierbei nicht mit der vagen Erklärung begnügen, dass als Individuen-Prädikat alles gelten soll, was von einem Individuum ausgesagt werden kann; wir würden uns sonst wieder in das Gebiet des Unklaren und Unsicheren begeben. Um nun hier zu einer scharfen Bestimmung zu gelangen, machen wir uns klar, dass alle Aussagen über Individuen sich aus gewissen elementaren Aussagen mit Hülfe der logischen Operationen zusammensetzen; diese elementaren Aussagen bestehen darin, dass eine anschauliche Eigenschaft einem Gegenstande zuge|schrieben oder eine anschauliche Beziehung von Gegenständen behauptet wird, oder aber sie betreffen die individuelle Unterscheidung der Gegenstände. Auf Grund dieser Erwägung führen wir die Abgrenzung des Bereiches der Individuen-Prädikate und -Relationen folgendermassen aus: Wir denken uns zunächst gewisse anschauliche Eigenschaften und Beziehungen gegeben, die ebenso wie der Individuenbereich (bzw. die Individuenbereiche) für die logische Betrachtung von vornherein zugrunde liegen. Zu diesen nehmen wir die uneigentliche Beziehung der Identität ≡(x, y) hinzu, mit Hülfe deren wir die individuelle Unterscheidung der Gegenstände formal zum Ausdruck bringen können. Und nun sagen wir, ein Individuen-Prädikat P (x) ist eine logische Funktion des Argumentes x, die sich aus den anschaulichen Eigenschaften und Beziehungen mit Hülfe der logischen Operationen „und“, „oder“, „nicht“, „folgt“, „alle“, „es gibt“ zusammensetzen lässt; entsprechend definieren wir, was eine Relation zwischen zwei oder mehreren Individuen ist. Dabei ist jedoch ein wesentlicher Punkt zu beachten. Wenn wir die Formen des allgemeinen und des existentialen Urteils mit zu den logischen Operationen nehmen, durch welche wir den Umkreis der Individuen-Prädikate und -Relationen abgrenzen, so kann es sich nur um diejenige Allgemeinheit und Existenz handeln, welche sich auf die ursprünglichen Individuen bezieht. Würden wir die Ausdrücke „für alle Prädikate (Relationen)“, „es gibt ein Prädikat (eine Relation)“, bzw. | in der Schreibweise des Kalküls die Zeichen (P ), (R), (EP ), (ER) mit zur Zusammensetzung der Prädikate und Relationen zulassen, so würde die obige Definition eine Zirkeldefinition sein: denn es soll ja gerade erst erklärt werden, was es heisst „alle Prädikate“, „es gibt ein Prädikat“ u. s. w. Auch geht es nicht an, dass wir die Zeichen (P ), (R), (EP ), (ER) rein formal anwenden, ohne ihnen eine Bedeutung zuzuschreiben; denn das hiesse, dass wir von dem inhaltlichen Standpunkt der Logik zu dem der Axiomatik übergehen, und damit unser Ziel der logischen Begründung der Arithmetik preisgeben. Der Logikkalkül sollte uns ja nur als eine Sprache dienen, durch welche die inhaltlichen logischen Operationen sich deutlicher verfolgen und einfacher durchführen lassen. — Andererseits gibt es aber jedenfalls Aussagen über Individuen, in denen Ausdrücke „für alle Prädikate“, „es gibt ein Prädikat“ u.s.w. vorkommen. Z.B.: (EP )P (x): „es gibt ein Prädikat, das auf x zutrifft“,
5
10
15
20
25
30
35
40
45
‘Grundlagen der Mathematik’ (1921/22)
479
womit eine Eigenschaft von x behauptet wird, oder: (P ) P (x) → P (y) : „ jedes Prädikat, das auf x zutrifft, trifft auch auf y zu“,
5
10
15
20
25
30
35
womit eine Beziehung zwischen x und y ausgesagt wird. Wir sehen also, dass wir den Begriff des Individuen-Prädikates sowie den der Individuen-Relation nicht mit einem Schlage in voller Allgemeinheit definieren können, dass vielmehr ein Verfahren der Stufenbildung hier erforderlich ist. Dieses Verfahren bietet sich hier ganz von selbst: Wir definieren zunächst als Prädikate und Relationen „erster | Stufe“ solche Individuen-Prädikate und Individuen-Relationen, die entweder zu den Grundeigenschaften und Grundbeziehungen (die Identitätsbeziehung eingeschlossen) gehören oder aus diesen durch die logischen Operationen gewonnen werden, wobei „alle“ und „es gibt“ sich nur auf die ursprünglichen Gegenstände des zugrundegelegten Individuenbereiches (bzw. der verschiedenen Individuenbereiche) beziehen dürfen. Nachdem auf diese Weise der Bereich der Prädikate und Relationen erster Stufe festgelegt ist, können wir diesen als einen neuen Individuen-Bereich betrachten, den wir dem Bereiche (bzw. den Bereichen) der ursprünglichen Gegenstände hinzufügen. Und indem wir das so erweiterte System von Individuen zugrundelegen, können wir nun einen Bereich von Prädikaten und Relationen „zweiter Stufe“, entsprechend wie vorher den der ersten Stufe, abgrenzen; dabei ist der Unterschied gegen vorher, dass die Argumente der logischen Funktionen sowie die All- und Seinszeichen sich nicht nur auf die ursprünglichen Gegenstände, sondern auch auf Prädikate oder Relationen erster Stufe beziehen können. Ebenso wie der Uebergang von der ersten zur zweiten Stufe lässt sich auch der Uebergang zu einer dritten und weiter zu höheren Stufen vollziehen. Jedoch ist es für das Folgende nicht nötig, hierauf näher einzugehen. Wesentlich für uns ist, dass durch die Stufenunterscheidung der erweiterte Funktionenkalkül inhaltlich präzisiert wird und den gleichen Grad der Sicherheit erhält wie der engere Funktionenkalkül. — Nach diesen Vorbereitungen sind wir nun in der Lage, die Russellsche Methode der logischen Begründung der Arithmetik aufzufassen sowie auch die Schwierigkeiten zu erkennen, die sich dabei einstellen. Was zunächst die Zahlentheorie betrifft, so haben wir hier die Möglichkeit, die Zahlen 0, 1, 2, 3, . . . durch Prädikaten-Prädikate zu definieren. z. B. für 0, 1, 2, nehmen wir die Prädikaten-Prädikate der Nullzahligkeit 0(P ), Einzahligkeit 1(P ), Zweizahligkeit 2(P ), welche ausgeschrieben lauten: 0(P ): (x)P (x) 1(P ): (Ex) P (x) & (y) P (y) → ≡(x, y) 2(P ): (Ex)(Ey) ≡(x, y) & P (x) & P (y) & (z) P (z) → ≡(x, z) ∨ ≡(y, z) .
40
Auch können wir die Gleichzahligkeit zweier Prädikate P , Q als PrädikatenRelation Glz (P, Q) folgendermassen logisch ausdrücken:
84
85
480
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
(ER) (x)(y)(z) R(x, y) & R(x, z) → ≡(y, z) & R(x, z) & R(y, z) → ≡(x, y) & (x) P (x) → (Ey) R(x, y) & Q(y) & (y) Q(y) → (Ex) R(x, y) & P (x) .
86
5
Ferner lässt sich die Addition der Zahlen auf die Disjunktion von Prädikaten zurückführen. Sind nämlich P und Q unverträgliche Prädikate (d. h. solche, die nicht beide zusammen auf einen Gegenstand zutreffen), und kommt dem Prädikate P die Zahl m, und Q die Zahl n zu, so kommt dem Prädikat P ∨ Q die Zahl m + n zu. Auf Grund dieser Auffassung der Addition werden die Zahlengleichungen wie 1 + 1 = 2, 2 + 3 = 5 zu rein logischen, beweisbaren Sätzen. Z. B. stellt sich die Gleichung
10
1+1=2
15
dar durch die logische Formel: (P )(Q) Unv (P, Q) & 1(P ) & 1(Q) → 2(P ∨ Q) , deren rein logischer Charakter ersichtlich wird, wenn man für die Relation Unv sowie für die Prädikate 1(P ), 2(P ) die definierenden Ausdrücke einsetzt. — Anmerkung: Bei den Beweisführungen im erweiterten Funktionenkalkül kommt zu den vorherigen Regeln — die natürlich beim Uebergang zu der „zweiten Stufe“ sinngemäss zu verallgemeinern sind — noch die neue Regel hinzu, dass vor eine allgemeingültige logische Formel des engeren Funktionenkalküls die zu den vorkommenden logischen Funktionszeichen, z. B. P , R gehörigen Allzeichen gesetzt werden können, und dass umgekehrt solche zu Prädikaten- oder Relationsvariablen gehörigen Allzeichen, wenn sie sich auf eine ganze Formel beziehen, weggelassen werden können. — Soweit wäre alles ganz befriedigend. Gehen wir aber nun zu dem allgemeinen Zahlbegriff über, so handelt es sich zunächst darum, diejenigen Prädikaten-Prädikate zu charakterisieren, welche eine Zahl definieren. Dies gelingt ohne Schwierigkeit, indem wir diejenige Eigenschaft eines PrädikatenPrädikates Φ(P ), durch welche dieses als definierendes Prädikat einer Zahl gekennzeichnet wird, folgendermassen formulieren: (P )(Q) Φ(P ) & Φ(Q) → Glz (P, Q) & Φ(P ) & Glz (P, Q) → Φ(Q) , 87
d. h. „wenn Φ auf P und auf Q zutrifft, so ist P mit Q gleichzahlig, und wenn Φ auf P zutrifft, und P mit Q gleichzahlig ist, so trifft Φ auch auf Q zu“. Nun tritt aber eine Schwierigkeit auf, wenn wir uns nach der Bedingung fragen, unter der zwei Prädikaten-Prädikate Φ und Ψ dieselbe Zahl definieren. Diese Bedingung besteht darin, dass die Prädikate, auf welche Φ zutrifft, mit denen, auf welche Ψ zutrifft, gleichzahlig sind, oder — was auf dasselbe hinauskommt — dass Φ(P ) und Ψ(P ) für dieselben Prädikate P wahr und
20
25
30
35
40
‘Grundlagen der Mathematik’ (1921/22)
481
für dieselben Prädikate falsch sind. Hiernach hat man folgende zwei Formulierungen der Bedingung: (P )(Q) Φ(P ) & Ψ(Q) → Glz (P, Q) (P ) Φ(P ) ∼ Ψ(P ) . 5
10
Diese beiden Formulierungen haben aber den Mangel, dass danach alle die Zahlen gleichgesetzt werden, welche die Anzahl der Gegenstände in dem zugrunde gelegten Individuenbereich übertreffen. Denn wenn z. B. der Individuenbereich aus weniger als 1060 Gegenständen besteht, so wird jede der beiden formulierten Bedingungen erfüllt, falls wir für Φ und Ψ bezüglich definierende Prädikate von 1060 und 1061 setzen, da ja dann Φ(P ) sowie Ψ(P ) immer falsch ist. (Man könnte versuchen, diesem Uebelstande dadurch abzuhelfen, dass man die Bedingung in der existentialen Form aufstellt: (EP )(EQ) Φ(P ) & Ψ(Q) & Glz (P, Q) , oder noch einfacher:
15
20
25
30
35
40
(EP ) Φ(P ) & Ψ(P ) . Dann aber würde in dem angenommenen Falle die Bedingung auch nicht für Φ und Φ erfüllt sein, es würde also 1060 nicht mit sich selbst gleichgesetzt.) Diese Schwierigkeit fällt weg, wenn wir den Individuenbereich als unendlich voraussetzen. Damit verzichten wir freilich auf einen logischen Nachweis für die Existenz einer unendlichen Gesamtheit, den ja Dedekind trotz seines transfiniten Standpunktes als notwendig empfand. — Mit diesem Mangel in der Grundlegung der Zahlentheorie könnten wir uns jedoch provisorisch abfinden, sofern für das weitere Ziel der Begründung der Analysis die logische Theorie sich als zulänglich erwiese. Hier handelt es sich zunächst um den Begriff der reellen Zahl . In der Mathematik sind verschiedene Einführungen der reellen Zahl gebräuchlich; man definiert eine reelle Zahl mit Hülfe einer Cantorschen Fundamentalreihe oder durch einen unendlichen Dezimalbruch, bzw. Dualbruch oder durch einen Dedekindschen Schnitt. Für den Anschluss an die Logik empfiehlt sich das Dedekindsche Verfahren, und zwar brauchen wir bei den Einteilungen der rationalen Zahlen, welche einen Schnitt bilden, jeweils nur die Klasse der kleineren zu betrachten, und der Schnitt kann stets so gewählt werden, dass in der Klasse der kleineren rationalen Zahlen keine Zahl die grösste ist. Ferner wollen wir uns bei der Betrachtung auf positive rationale und reelle Zahlen beschränken. Auf diese Weise erhalten wir folgende Definition der reellen Zahl: Eine (positive) reelle Zahl ist | eine Menge von Brüchen, welche die Eigenschaften besitzt, dass 1. mindestens ein Bruch zur Menge gehört, 2. nicht alle Brüche zur Menge gehören, 3. zugleich mit jedem zur Menge gehörigen Bruche auch alle kleineren Brüche der Menge angehören, 4. zu jedem der Menge angehörigen Bruch noch ein grösserer Bruch in der Menge vorkommt.
88
89
482
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Hiernach besteht z. B. die reelle Zahl 1 in der Menge der Brüche x, für welche x < 1 ist; (wobei hier 1 die ganze rationale Zahl bedeutet); diese Menge besitzt offenbar die vier geforderten Eigenschaften. √ Die reelle Zahl 2 ist die Menge der Brüche x, für die x2 < 2 ist. Dass diese Menge die drei ersten von den verlangten Eigenschaften besitzt, erkennt man ohne weiteres; auch die Bedingung 4. ist erfüllt, denn für jeden Bruch x, welcher der Ungleichung x2 < 2 genügt, ist 2x + 2 x< x+2 sowie
2 2x + 2 < 2, x+2 und 2x+2 ist ebenso wie x ein Bruch. x+2 Der Wert der unendlichen Summe ∞ 1 k2 k=1
90
5
10
15
stellt sich dar durch die Menge der Brüche x, für welche es eine ganze Zahl p gibt, sodass p 1 x< k2 k=1
ist. Hier kann man wieder leicht sehen, dass die vier Bedingungen erfüllt sind; die Bedingung 2. ist für diesen Fall gleichbedeutend mit der Konvergenz der unendlichen Summe ∞ 1 . k2
20
k=1
Es kommt nun darauf an, die gegebene Definition der reellen Zahl in die Sprache der Logik zu übersetzen. Wir stellen uns auf den Standpunkt, dass die Theorie der ganzen Zahlen und der Brüche bereits erledigt sei, und nehmen die Gesamtheit der Brüche als Individuenbereich. Für unseren Zweck ist es nicht nötig, das ganze System der Grundprädikate und Grundbeziehungen sowie die auf diese bezüglichen Sätze anzugeben; vielmehr brauchen wir im folgenden nur die Beziehung <(x, y), welche die Eigenschaft der Transitivität hat. Nun müssen wir noch überlegen, wie eine Menge von Brüchen in unserer logischen Bezeichnung darzustellen ist. Eine Menge wird bestimmt durch eine Eigenschaft, welche die zur Menge gehörigen Gegenstände charakterisiert. Wir werden demnach eine reelle Zahl darstellen durch ein Prädikat, welches sich auf Brüche als Gegenstände bezieht. Dabei haben wir zu beachten, dass ein und dieselbe Menge von Brüchen durch verschiedene Prädikate bestimmt werden kann. Nämlich zwei Prädikate P (x) und Q(x) liefern dieselbe Menge, wenn
25
30
35
‘Grundlagen der Mathematik’ (1921/22)
5
10
15
20
25
483
die Gegenstände, auf welche P zutrifft, dieselben sind wie die, auf welche Q zutrifft, d. h. wenn die Prädikate P , Q in der Beziehung Aeq(P, Q) stehen. Demnach müssen wir festsetzen, | dass zwei Prädikate, die in der Beziehung Aeq(P, Q) stehen, dieselbe reelle Zahl bestimmen. Die Beziehung der Aequivalenz spielt also für die Prädikate die gleiche Rolle wie die Identitätsbeziehung für die Individuen. Dies macht sich insbesondere auf folgende Art geltend: wenn wir eine Aussage über eine Menge durch ein Prädikaten-Prädikat Φ(P ) darstellen, so muss dieses der Bedingung genügen: (P )(Q) Φ(P ) & Aeq(P, Q) → Φ(Q) , in Worten, wenn Φ auf P zutrifft, und die Prädikate P und Q äquivalent sind, so trifft Φ auch auf Q zu. Noch ein weiterer Punkt ist zu berücksichtigen. Die reellen Zahlen müssen einen bestimmt umgrenzten Bereich von Gegenständen bilden; denn wir haben in der Analysis fortwährend mit Sätzen über alle reellen Zahlen sowie über Existenz von reellen Zahlen zu tun. Wir müssen daher die Prädikate, die wir zur Definition reeller Zahlen nehmen, auf einen bestimmten Bereich beschränken und werden also nur Prädikate erster Stufe zur Definition reeller Zahlen zulassen. Auf Grund dieser Erwägungen gelangen wir zu folgender Form der Definition: Eine reelle Zahl wird gegeben durch ein Prädikat erster Stufe P (x), welches sich auf Brüche als Gegenstände bezieht und welches folgenden Bedingungen genügt: 1. (Ex)P (x) 2. (Ex)P(x) 3. (x)(y) P (x) & <(y, x) → P (y) 4. (x) P (x) → (Ey) <(x, y) & P (y) . Zwei solche Prädikate P (x) und Q(x) bestimmen dann und nur dann dieselbe reelle Zahl, wenn zwischen ihnen die Beziehung Aeq(P, Q)
30
besteht. So wird z. B. durch das Prädikat <(x2 , 2) √ die reelle Zahl 2 definiert. Durch das Prädikat
y x (y) Jnt(y) → < 1 + ,2 , y
35
40
(worin die vorkommenden arithmetischen Zeichen die übliche Bedeutung haben und Jnt(y) das Prädikat „y ist ganzzahlig“ bezeichnet,) wird die reelle Zahl log 2 bestimmt. Dieselbe reelle Zahl bestimmt sich auch durch das Prädikat
2y 1 (Ey) Jnt(y) & < x, . k k=y+1
91
92
484
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Die Theorie der reellen Zahlen haben wir nunmehr zu entwickeln als eine Theorie derjenigen Prädikate erster Stufe von Brüchen, welche den genannten vier Bedingungen genügen. Diese vier Bedingungen zusammen — wir können sie uns durch & verbunden denken — machen die Schnitteigenschaft eines Prädikats aus, und diese Eigenschaft eines Prädikats (Prädikaten-Prädikat) wollen wir mit Sc(P ) bezeichnen. Zunächst können wir leicht die Grössenbeziehung zwischen den reellen Zahlen einführen. Nämlich für zwei Prädikate P , Q von der Eigenschaft Sc soll
5
10
≤(P, Q) 93
gleichbedeutend sein mit Jmp(P, Q), d. h. es soll gelten:
Sc(P ) & Sc(Q) → Jmp(P, Q) ∼ ≤(P, Q) ;
15
ebenso soll unter der Bedingung Sc(P ) & Sc(Q) die Aussage <(P, Q) äquivalent sein mit
20
Jmp(P, Q) & Jmp(Q, P ). Es lässt sich beweisen, dass diese beiden Beziehungen ≤(P, Q), <(P, Q) transitiv sind; ferner beweist man, dass für zwei Prädikate P , Q von der Eigenschaft Sc die Aussage ≤(P, Q) äquivalent ist mit <(P, Q) ∨ Aeq(P, Q), und es ergibt sich auch die Alternative, dass für irgend zwei der betrachteten Prädikate, P und Q von den drei Aussagen
25
Aeq(P, Q),
94
<(P, Q),
<(Q, P )
stets eine und nur eine zutrifft. Auch können wir, ganz entsprechend, wie es in der Theorie der Dedekindschen Schnitte geschieht, die Addition und Multiplikation der reellen Zahlen auf diejenige der Brüche zurückführen. Sind zum Beispiel P (x), Q(x) zwei Prädikate, welche reelle Zahlen definieren, so wird die Summe der beiden reellen Zahlen definiert durch das Prädi|kat: (Ey)(Ez) P (y) & Q(z) & (x = y + z) . (Die Gleichung x = y + z kann als eine Relation zwischen x, y, z aufgefasst werden.) Nun ist die Frage, ob sich auch die höheren Schlussweisen der Analysis aus unserer logischen Theorie ergeben. Ein typisches Beispiel bildet der Satz
30
35
40
‘Grundlagen der Mathematik’ (1921/22)
5
10
15
20
25
30
35
485
von der oberen Grenze, welcher besagt, dass es zu jeder beschränkten Menge von reellen Zahlen eine obere Grenze gibt, d. h. eine reelle Zahl a von der Eigenschaft, dass jede Zahl der Menge ≤ a ist und dass jede Zahl, die < a ist, von mindestens einer Zahl der Menge übertroffen wird. Sehen wir zu, wie sich diese Verhältnisse im Rahmen unserer PrädikatenTheorie darstellen. Eine Menge von reellen Zahlen wird gegeben durch eine charakterisierende Eigenschaft der zu ihr gehörigen reellen Zahlen, bzw. der sie definierenden Prädikate; sie wird also dargestellt durch ein PrädikatenPrädikat A(P ), welches der Bedingung (P )(Q) A(P ) & Aeq(P, Q) → A(Q) genügt; (vgl. die Bemerkung auf S. 91) und von dem wir auch voraussetzen können, dass es nur auf Prädikate von der Schnitteigenschaft zutrifft, so dass wir die Formel haben (P ) A(P ) → Sc(P ) . Dass die Menge reeller Zahlen beschränkt ist, bedeutet, dass es eine reelle Zahl gibt, die grösser ist als alle Zahlen der Menge; dies wird ausgedrückt durch die Formel: (EP ) Sc(P ) & (Q) A(Q) → <(Q, P ) . Wir wollen auch annehmen, dass die Menge mindestens ein Element enthält, so dass die Formel gilt (EP )A(P ). Die Behauptung des Satzes von der oberen Grenze drückt sich nun dadurch aus, dass es ein Prädikat A(x) gibt, welches eine reelle Zahl definiert und welches überdies den Bedingungen genügt: (P ) A(P ) → ≤(P, A) (1) (Q) Sc(Q) & <(Q, A) → (EP ) A(P ) & <(Q, P ) (2)
95
Der mathematische Existenzbeweis für die obere Grenze, auf seine einfachste Form gebracht, besteht darin, dass man zu der betrachteten Menge reeller Zahlen, welche eine Menge von Mengen von Brüchen ist, die Vereinigungsmenge bildet. Das heisst, in der Prädikaten-Sprache ausgedrückt, man bildet das Prädikat (EP ) P (x) & A(P ) . Dies ist in der Tat ein Prädikat von Brüchen A(x), und für dieses lassen sich die vier in Sc(A) zusammengefassten Formeln sowie die obigen Formeln (1), (2) durch ein rein formales Schliessen ableiten. Z. B. die Formel (1) (P )(A(P ) → ≤(P, A)) wird, nach bereits erfolgter Ableitung von Sc(A), folgendermassen bewiesen. Aus der allgemeinen Aussagenformel U → (V → V & U )
40
erhält man durch Einsetzungen und Einführung der Variablen x (x) A(P ) → P (x) → P (x) & A(P ) .
96
486
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Hier kann das Allzeichen (x) hinter das erste Zeichen → gezogen werden, so dass sich ergibt: A(P ) → (x) P (x) → P (x) & A(P ) . Ferner erhält man aus der logischen Formel F (P ) → (EQ)F (Q)
5
durch Einsetzung und Einführung der Variablen x (x) P (x) & A(P ) → (EQ) Q(x) & A(Q) . Hier kann statt
(EQ) Q(x) & A(Q)
auch
(EP ) P (x) & A(P ) und hierfür wiederum definitionsgemäss A(x) geschrieben werden, so dass wir erhalten: (x) P (x) & A(P ) → A(x) . Diese Formel zusammen mit der vorher gefundenen A(P ) → (x) P (x) → P (x) & A(P )
10
15
liefert (nach den gewöhnlichen Rechenregeln des Funktionenkalküls) A(P ) → (x) P (x) → A(x) , wofür wir kürzer schreiben können A(P ) → Jmp(P, A).
20
Nun hatten wir über A die Annahme gemacht: (P ) A(P ) → Sc(P ) . Hier können wir das Allzeichen weglassen, und die Formel A(P ) → Sc(P ) 97
zusammen mit der eben gefundenen
25
A(P ) → Jmp(P, A) ergibt nach den Regeln des Aussagenkalküls: A(P ) → Sc(P ) & Jmp(P, A). Da ferner die Formel Sc(A) bereits bewiesen sein sollte, so erhalten wir A(P ) → Sc(P ) & Sc(A) & Jmp(P, A).
30
Zufolge der Definition von ≤(P, Q) besteht aber die Formel Sc(P ) & Sc(A) & Jmp(P, A) → ≤(P, A). Wir erhalten demnach: A(P ) → ≤(P, A). Hier können wir nun noch das Allzeichen (P ) vorsetzen, und gelangen damit zu der gewünschten Formel (1). — Somit scheint nun der Beweis des Satzes von der oberen Grenze im Rahmen unserer Theorie vollständig durchführbar zu sein. Tatsächlich aber haben
35
‘Grundlagen der Mathematik’ (1921/22)
5
10
15
20
25
30
35
40
45
487
wir noch einen Punkt ausser Acht gelassen. Es ist nämlich noch gar nicht bewiesen, dass durch das aufgestellte Prädikat A(x) eine reelle Zahl definiert wird. Zur Definition einer reellen Zahl brauchen wir ein Prädikat erster Stufe. Das Prädikat A(x), welches ja (EP ) P (x) & A(P ) lautet, ist aber von der zweiten Stufe, da hier die Prädikaten-Variable P in Verbindung mit dem Seinszeichen vorkommt. Somit sehen wir, dass der übliche mathematische Beweis für die Existenz der oberen Grenze durch die logische Verschärfung, die wir der Theorie der reellen Zahlen gegeben | haben, unzulänglich wird. Zur Vervollständigung des Beweises würde es freilich schon genügen, wenn wir nur wüssten, dass es ein mit A äquivalentes Prädikat erster Stufe gibt, d. h. ein Prädikat erster Stufe, B(x), welches mit A(x) in der Beziehung steht: (x) A(x) ∼ B(x) .
98
Nämlich ein solches Prädikat würde dann ebenso wie A die Eigenschaft Sc haben und die Bedingungen (1), (2) erfüllen, mithin in der Tat eine reelle Zahl von der Eigenschaft der oberen Grenze definieren. Angesichts dieser Sachlage haben Russell und Whitehead den Ausweg gewählt, dass sie das allgemeine Axiom aufstellen: „Zu jedem Individuenprädikat zweiter Stufe gibt es ein mit ihm äquivalentes Prädikat erster Stufe.“ Diese Annahme, welche das „Axiom der Reduzierbarkeit“ genannt wird, hat einen sehr allgemeinen Charakter, und ihre Einführung ist insofern nicht künstlich, als sie nicht nur in diesem speziellen Fall, sondern an mehreren entscheidenden Stellen bei der logischen Begründung der Mathematik zur Ausfüllung einer wesentlichen Lücke dient. Aber durch die Aufstellung des neuen Axioms werden wir genötigt, die Voraussetzungen unserer logischen Theorie grundsätzlich zu verändern. Wir hatten doch den Standpunkt so gewählt, dass wir einen Individuenbereich zugrunde legten und gewisse, auf die Gegenstände dieses Bereiches bezügliche Grundeigenschaften und Grundbeziehungen als gegeben dach|ten, aus denen sich die weiteren Prädikate und Relationen durch die logischen Operationen ableiteten. Nun ist bei beliebiger Wahl der Grundeigenschaften und Grundbeziehungen das Axiom der Reduzierbarkeit im allgemeinen sicher nicht erfüllt. Es würde sich also darum handeln, in jedem vorgelegten Falle das System der Grundeigenschaften so zu ergänzen, dass dadurch der Forderung des Axioms der Reduzierbarkeit entsprochen wird. Wie aber eine solche Ergänzung im Rahmen rein logischer Begriffsbildung, also durch ein logisch-konstruktives Verfahren zu erreichen ist, ersieht man nicht, und es besteht keine Aussicht auf die Entdeckung eines solchen Verfahrens. Somit bleibt nur die Möglichkeit, das System der Prädikate und Relationen erster Stufe als einen an sich bestehenden Inbegriff vorauszusetzen, auf welchen das Axiom der Reduzierbarkeit zutrifft. Hiermit kehren wir aber zu dem axiomatischen Standpunkt zurück, und das Ziel der Begründung von Arithmetik und Analysis durch die Logik wird
99
488
100
1a
2a
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
preisgegeben. Denn eine Zurückführung auf die Logik besteht nun bloss noch dem Namen nach. Das Axiom der Reduzierbarkeit ist nicht in dem Sinne logisch selbstverständlich wie die allgemeinen Regeln des Schliessens, die wir in die Formelsprache des Funktionenkalküls gekleidet haben. Wohl ist es durchaus plausibel, dass dieses Axiom zu keinem Widerspruch führt. Aber eine solche Plausibilität besteht auch schon betreffs der üblichen Axiome der Analysis, und unser Zweck war es ja gerade, über den | Standpunkt der blossen Plausibilität hinauszukommen. Unsere Betrachtung führt somit zu dem Ergebnis, dass die transfinite Logik nicht imstande ist, eine sichere Begründung der Arithmetik zu liefern: entweder nämlich wird sie rein formalistisch gehandhabt, dann ist sie unscharf und bietet keine Gewähr vor Widersprüchen; oder das logische Operieren wird inhaltlich so präzisiert, dass Widersprüche ausgeschlossen sind, dann aber gelangt man nicht zur Begründung der üblichen Schlussweisen der Analysis und Mengenlehre.
5
10
15
III. Die Begründung der Widerspruchsfreiheit der Arithmetik durch die neue Hilbertsche Beweistheorie. So ist nun der Stand der Frage nach den Grundlagen der Mathematik in der bisherigen Literatur. Hiernach wäre also zwar die elementare Zahlenlehre einer einwandfreien Begründung fähig, nicht aber die Analysis und erst recht nicht die Mengenlehre. Somit würde auch die Methode der Zurückführung auf die Analysis eines strengen Fundamentes entbehren. Erinnern wir uns nun daran, worauf die Schwierigkeit bei der Begründung der höheren Arithmetik und der Analysis beruhte. Diese Schwierigkeit wird ja dadurch verursacht, dass in diesen Disziplinen die logischen Formen des allgemeinen und des existentialen Urteils in einer freieren, über die gewöhnliche „finite“ Logik hinausgehenden Form angewandt werden und damit der Standpunkt des handgreiflich Sicheren verlassen wird. Der Unterschied zwischen der finiten Logik und jener freieren, „transfiniten“ Art des Schliessens, kommt zur Geltung, sobald wir es mit unendlich vielen Individuen zu tun haben. Wo nur endlich viele Gegenstände in Betracht kommen, da ist der Sinn des allgemeinen und des existentialen Urteils ohne weiteres klar und eindeutig. Die Behauptung, dass alle Gegenstände einer endlichen Gesamtheit eine gewisse Eigenschaft besitzenC , ist logisch gleichwertig mit einer Zusammenfassung mehrerer Einzel-Aussagen durch „und“ (von denen | jede die betreffende Eigenschaft für einen einzelnen Gegenstand behauptet). Und ebenso ist die Behauptung, dass es in der Gesamtheit einen Added by Hilbert at the foot of the page: z. B. „Alle Bänke in diesem Auditorium sind hölzern.“ C
20
25
30
35
‘Grundlagen der Mathematik’ (1921/22)
489
Gegenstand von jener Eigenschaft gibtD , logisch gleichwertig mit einer Verknüpfung von Einzelaussagen durch „oder“ (im Sinne von „vel“). Auf Grund hiervon ergibt sich auch völlig streng die Gültigkeit der Aequivalenzen: (x)P (x) aeq (Ex)P (x)
5
und (Ex)P (x) aeq (x)P (x).
10
15
20
25
30
35
Diese Aequivalenzen werden nun aber in der Mathematik auch bei unendlich vielen Individuen, als ohne weiteres gültig vorausgesetzt, und so haben wir sie auch im Logikkalkül zugrundegelegt, indem wir ganz allgemein die Regel aufstellten, dass (x)P (x) durch (Ex)P (x) und (Ex)P (x) durch (x)P (x) ersetzbar sei. Hiermit begeben wir uns in das Gebiet der transfiniten Schlussweisen, die nicht mehr den Charakter des handgreiflich Sicheren haben. Denn die Annahme der unbeschränkten Gültigkeit jener Aequivalenzen kommt darauf hinaus, dass wir uns Gesamtheiten von unendlich vielen Individuen als etwas fertig Vorhandenes denken.E Wie sehr sich auch diese Vorstellungsweise in der höheren Mathematik bewährt hat, so ist doch ihre Zulässigkeit keineswegs selbstverständlich, und wo es sich um | die Begründung der Mathematik handelt, darf sie nicht ohne weiteres hingenommen werden. Um also im Bereiche des völlig Sicheren zu bleiben, werden wir uns an die finite Logik zu halten haben, d.h. wir werden überall da, wo unendlich viele Gegenstände in Betracht kommen, die Formen des allgemeinen und des existentialen Urteils nur in jener früher besprochenen engeren Bedeutung anwenden, wonach das allgemeine Urteil rein hypothetisch aufzufassen ist und das existentiale Urteil den Sinn eines blossen Partialurteils hat, welches seinem Wesen nach einer inhaltlichen Ergänzung, durch Aufweisung eines bestimmten Gegenstandes oder eines bestimmten Verfahrens, bedarf. Bei dieser Auffassung besteht nun nicht mehr jene einfache Beziehung zwischen dem allgemeinen und dem existentialen Urteil, wie wir sie im Logikkalkül statuiert haben. Nämlich die Negation eines allgemeinen Urteils „(x)P (x)“ sowie auch die eines existentialen Urteils „(Ex)P (x)“ hat hier zunächst gar keinen präzisen Inhalt. Unter Umständen kann sie allerdings einen bestimmten Sinn erhalten, nämlich wenn aus der Annahme (x)P (x), bzw. aus (Ex)P (x) ein Widerspruch abgeleitet wird, oder auch wenn die Behauptung (x)P (x) durch ein Gegenbeispiel widerlegt wird. Dieser Fall, dass ein Gegenbeispiel für eine Behauptung (x)P (x) vorliegt, ist aber nicht kontradiktorisch entgegengesetzt zu dem Fall der Gültigkeit der Added by Hilbert in the left-hand margin: „Es giebt unter den hier Versammelten jemand mit dunklem Haar.“ besser: „Es giebt unter den Bänken hier eine eiserne.“ E Added by Hilbert in the left-hand margin: Hier ist die Quelle für den Cantorschen Begriff konsistent. D
3a
490
4a
5a
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Behauptung (x)P (x), wo ein allgemeines hypothetisches Gesetz vorliegt; und ebensowenig ist der Fall, dass die Annahme (Ex)P (x) auf einen Widerspruch führt, kontradiktorisch entgegengesetzt zu dem Fall, | wo die Behauptung (Ex)P (x) zu Recht besteht, wo also ein Gegenstand von der Eigenschaft P vorliegt. Wir können daher nicht allgemein schliessen, dass entweder das Gesetz (x)P (x) gilt oder dass ein Gegenstand von der Eigenschaft „P -nicht“ vorhanden ist. Das wäre eine falsche Anwendung des Satzes vom ausgeschlossenen Dritten. Wir sehen also, dass für den Zweck einer strengen Begründung der Mathematik die üblichen Schlussweisen der Analysis in der Tat nicht als logisch selbstverständlich übernommen werden dürfen. Vielmehr ist es gerade erst die Aufgabe für die Begründung, zu erkennen, warum und in wieweit die Anwendung der transfiniten Schlussweisen, sowie sie in der Analysis und in der (axiomatisch begründeten) Mengenlehre geschieht, stets richtige Resultate liefert. Wenn wir nun auf dem Boden der finiten Logik stehen bleiben, so müssen wir, um über die elementare Zahlentheorie hinauszukommen, nach einer anderen Richtung eine Erweiterung vornehmen. Wir müssen den Bereich der betrachteten Gegenstände erweitern, d. h. wir müssen unsere anschaulichen Ueberlegungen auch auf andere Figuren als auf Zahlzeichen anwenden. Wir sehen uns somit veranlasst, von dem früher herrschenden Grundsatz abzugehen, wonach jeder Satz der reinen Mathematik letzten Endes in einer Aussage über ganze Zahlen bestehen sollte. Dieses Prinzip, in welchem man eine grundlegende methodische Erkenntnis erblickt hat, müssen wir jetzt als ein Vorurteil preisgeben. An einer Forderung aber müssen wir festhalten, dass nämlich die Figuren, welche wir als Gegenstände nehmen, vollkommen überblickbar sind, und dass an ihnen nur diskrete Bestimmungen in Betracht kommen. Denn nur unter diesen Bedingungen können unsere Behauptungen und Ueberlegungen die gleiche Sicherheit und Handgreiflichkeit haben wie in der anschaulichen Zahlentheorie. Aus diesem Grunde kommen auch die geometrischen Figuren nicht als Gegenstände für unsere Betrachtung in Frage. Es kommt nun darauf an, den richtigen Gesichtspunkt zu finden für die Art, wie wir die Methode der anschaulichen Ueberlegung, die wir in der elementaren Zahlentheorie angewandt haben, durch Einführung neuer Objekte zu einem Verfahren der Begründung der gesamten reinen Mathematik ausgestalten können. Wir werden zu dem entscheidenden Gedanken geführt, indem wir uns vergegenwärtigen, dass bereits die elementare Mathematik über den Standpunkt der anschaulichen Zahlentheorie hinausgeht. Nämlich die Methode der algebraischen Buchstaben-Rechnung ist in der anschaulichen Zahlentheorie nicht mit inbegriffen. Hier werden die Formeln stets nur zur Mitteilung angewandt; die Buchstaben bedeuten Zahlzeichen, und durch eine Gleichung wird die Uebereinstimmung zweier Zeichen mitgeteilt. Dagegen in der Algebra betrachten
5
10
15
20
25
30
35
40
45
‘Grundlagen der Mathematik’ (1921/22)
5
10
15
20
25
30
35
40
45
491
wir die Buchstaben-Ausdrücke selbst als mathematische Gebilde und die Gleichungen als mathematische Verknüpfungen. Durch dieses Verfahren der Algebra werden die inhaltlichen Sätze der Zahlentheorie formalisiert. An die Stelle der Aussagen über die Zahlzeichen treten Formeln, die ihrerseits nun konkrete Objekte einer anschaulichen Betrachtung sind; und an die Stelle des inhaltlichen zahlentheoretischen Beweises tritt die Ableitung einer Formel aus einer anderen Formel nach gewissen Rechenregeln. Dieser Prozess der Formalisierung, d. h. dieser Uebergang von der naiven zur formalen Behandlung, der sich zum ersten Mal in der Algebra findet, wird in der höheren Mathematik in weitem Umfange fortgesetzt, nämlich überall da, wo man zur Behandlung einer mathematischen Disziplin einen Kalkül ausgebildet hat, mit Hülfe dessen die Axiome der Theorie durch Formeln und die inhaltlichen mathematischen Schlüsse durch ein äusseres Handeln nach bestimmten Regeln ersetzt werden. (Beispiele solcher Kalküle sind der Differentialkalkül, die formale Variationsrechnung, der Liesche Kalkül, die Vektoranalysis, der Invariantenkalkül.) Nun können wir uns, ganz u. gar dem bisherigen Entwickelungsgang folgend, fragen, ob es nicht möglich ist, die gesamte Mathematik dem Prozess der Formalisierung zu unterwerfen. Diese Möglichkeit besteht in der Tat. Wir besitzen ja an dem Logikkalkül eine Zeichensprache, welche fähig ist, mathematische Sätze in Formeln zu fassen und das logische Schliessen durch symbolische Prozesse auszudrücken. Diese Formeln und formalen Prozesse des Logikkalküls haben wir bisher immer nur zur Mitteilung von Gedankeninhalten gebraucht. Wir können jetzt aber, ganz entsprechend wie beim Uebergang | von der inhaltlichen Zahlenlehre zur formalen Algebra, den Standpunkt ändern und die Zeichen und Operationen des Logikkalküls losgelöst von ihrer inhaltlichen Deutung betrachten. An Stelle der inhaltlichen mathematischen Wissenschaft, welche durch die Formelsprache des Logikkalküls mitgeteilt wird, haben wir dann einen Bestand von Formeln mit mathematischen und logischen Zeichen, welche sich nach bestimmten Regeln aneinander reihen. Den mathematischen Axiomen entsprechen gewisse unter den Formeln und dem inhaltlichen Schliessen entsprechen die Regeln, nach denen die Formeln aufeinander folgen. Es wird also damit einerseits für die Axiome selbst, die doch auch ursprünglich naiv gemeint waren, wie für den Logikkalkül der Uebergang von naiver zu formaler Behandlung vollzogen. Diesen Formalismus können wir nun zum Gegenstand einer anschaulichen Betrachtung machen, und damit eröffnet sich uns die Möglichkeit einer strengen Begründung der Mathematik. Denn das Problem der Widerspruchsfreiheit, welches ja die grundsätzlichen Schwierigkeiten bot, erhält durch den neuen Standpunkt eine ganz konkrete Fassung. Es handelt sich nicht mehr darum, ein System von unendlich vielen Dingen mit bestimmten Verknüpfungseigenschaften (eine stetige Mannigfaltigkeit von gewisser Art) als logisch möglich zu erweisen, sondern es kommt nur darauf an einzusehen, dass es unmöglich ist, aus den (in Formeln aufge-
6a
7a
492
8a
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
schriebenen) Axiomen nach den Regeln des logischen Kalküls gewisse Formeln wie z. B. 1 = 1 abzuleiten. Diese Aufgabe liegt grundsätzlich ebenso im Bereich der anschaulichen Betrachtung wie etwa die Aufgabe des Beweises, dass es unmöglich ist, zwei Zahlzeichen a, b zu finden, | welche in der Beziehung a2 = 2 · b2 stehen. Hier soll gezeigt werden, dass sich nicht zwei Zahlzeichen von einer gewissen Beschaffenheit angeben lassen. Entsprechend kommt es für uns darauf an zu zeigen, dass sich nicht ein Beweis von einer gewissen Beschaffenheit angeben lässt. Ein formalisierter Beweis ist aber, ebenso wie ein Zahlzeichen, ein konkreter und überblickbarer Gegenstand. Er ist (wenigstens grundsätzlich) von Anfang bis Ende mitteilbar. Auch die verlangte Beschaffenheit der Endformel, z. B. dass sie „1 = 1“ lautet, ist eine konkret feststellbare Eigenschaft des Beweises. Es lässt sich somit das grundsätzliche Hindernis, welches einer anschaulichen Begründung der höheren Arithmetik und Analysis im Wege steht, dadurch beheben, dass wir nicht die Gegenstände dieser mathematischen Theorien, sondern vielmehr ihre Beweise, in der formalen Uebersetzung, als Objekte unserer inhaltlichen Untersuchung nehmen. „Wir müssen den spezifischen mathematischen Beweis und seine Struktur zum Gegenstand einer Untersuchung machen, wie der Physiker sich um die Theorie seines Apparates kümmern muss und der Philosoph die Vernunft selbst kritisiert.“ (Hilbert „Axiomatisches Denken“.) 15
9a
Wenn wir uns nun daran machen, diesen Plan zur Durchführung zu bringen, so müssen wir zuerst das Verfahren näher präzisieren. In Anbetracht der grossen Mannigfaltigkeit von Verknüpfungen und Zusammenhängen, welche die Arithmetik aufweist, ist es von vornherein ersichtlich, dass wir die Aufgabe des Nachweises der Widerspruchslosigkeit nicht mit einem | Schlage lösen können. Wir werden vielmehr so vorgehen, dass wir zunächst nur die einfachsten Verknüpfungen betrachten und dann schrittweise immer höhere Operationen und Schlussweisen hinzunehmen, wobei dann für jede Erweiterung des Systems der Zeichen und der Uebergangsformeln einzeln der Nachweis zu erbringen ist, dass sie die auf der vorherigen Stufe festgestellte Widerspruchsfreiheit nicht aufheben. 15 The passage in quotation marks is actually a partial rendition of a passage from Hilbert 1918a, 415, the relevant part of which reads:
. . . und zur Eroberung dieses Feldes müssen wir—das ist meine Überzeugung—den Begriff des spezifisch mathematischen Beweises selbst zum Gegenstand einer Untersuchung machen, gerade wie ja auch der Astronom die Bewegung seines Standortes berücksichtigen, der Physiker sich um die Theorie seines Apparates kümmern muß und der Philosoph die Vernunft selbst kritisiert.
In one of his revisions, Hilbert must have recognised that what is given in the Ausarbeitung is not strictly speaking a quote, and has changed it, first by crossing out the quotation marks, then by inserting ‘Denn’ before ‘Wir’, and finally linking the passage to what precedes by inserting a new sentence ‘Das ist auch ganz natürgemäss’, thus making: ‘. . . inhaltlichen Untersuchung nehmen. Das ist auch ganz natürgemäss. Denn wir müssen den spezifisch mathematischen Beweis und seine Struktur zum Gegenstand einer Untersuchung machen, wie der Physiker sich um die Theorie seines Apparates kümmern muss und der Philosoph die Vernunft selbst kritisiert.’
5
10
15
20
25
30
‘Grundlagen der Mathematik’ (1921/22)
5
10
15
20
25
30
35
40
493
Ein weiterer wesentlicher Gesichtspunkt ist, dass wir, gemäss unserem Plan der restlosen Formalisierung der Arithmetik, den eigentlich mathematischen Formalismus im Zusammenhang mit dem Formalismus der logischen Operationen entwickeln müssen, sodass — wie ich es ausgedrückt habe — ein simultaner Aufbau von Mathematik und Logik ausgeführt wird. Bei der Formalisierung der logischen Beziehungen werden wir suchen, mit möglichst wenigen Ausdrucksformeln auszukommen. Es ist für unseren Zweck durchaus nicht nötig, dass wir alle gebräuchlichen logischen Wendungen formal nachbilden, sondern es genügt, den logischen Kalkül soweit auszugestalten, dass wir jedes Resultat der inhaltlichen mathematischen Ueberlegung bzw. sein formales Gegenstück, auch mit Hilfe unseres Formalismus gewinnen können. Ich will damit beginnen, die Anfangsgründe der Arithmetik von unserem neuen Standpunkt zu behandeln. Ich will nun damit beginnen, die Anfangsgründe der Arithmetik von unserem neuen Standpunkt zu entwickeln. Es handelt sich zunächst um die Einführung der Zeichen, welche auf der zunächst zu betrachtenden Anfangsstufe des Formalismus vorkommen. 16 Wir nehmen aus der Arithmetik die Zeichen 0, +1, = sowie die „Grundvariablen“ a, b, c, . . . . Dazu kommt das „Funktionszeichen“ δ, welches hinter sich ein „Argument“ hat. Mit den Zeichen 0, a, b, c, . . . , +1, bilden wir Figuren, die wir „Funktionale“ nennen. Die einfachsten Funktionale sind 0 und die Grundvariablen. Aus diesen entstehen die übrigen Funktionale durch ein- oder mehrmaliges Anhängen von +1 und ein- oder mehrmaliges Vorsetzen von δ, wobei eine auf +1 endigende Figur, wenn davor (zum ersten Mal) das δ gesetzt wird, einzuklammern ist. So erhält man aus a durch Vorsetzen von δ und (nachheriges) Anhängen von +1 das Funktional δa + 1. Durch Anhängen von +1 an a und (nachheriges) Vorsetzen von δ entsteht δ(a + 1), wo a + 1 das Argument von δ ist; durch nochmaliges Vorsetzen von δ entsteht hieraus δδ(a + 1), wo δ(a + 1) das Argument des ersten δ und a + 1 das Argument des zweiten δ ist. Das Zeichen 0 und die daraus durch ein- oder mehrmaliges Anhängen von +1 entstehenden Figuren nennen wir „Zahlzeichen“. (Diese von unserer früheren Bezeichnungsweise abweichende Benennung empfiehlt sich, wenn man die 0 mit in die Zahlentheorie einbeziehen will, was manche Vorteile bietet.) Wird zwischen zwei Funktionale das Zeichen = gesetzt, so heisst die entstehende Figur eine Gleichung. Von den Zeichen des Logikkalküls übernehmen wir das „Folgezeichen“ → und den Negationsstrich. Das Zeichen → hat zur Linken ein „Vorderglied“, 16 Note that the first sentence of the new p. 1 begins with the final sentence of p. 9a. The paragraph at the beginning of p. 1 was subsequently crossed out by an unknown hand, most probably Hilbert’s, thus effecting a smoother transition. It is quite possible that pp. 1a–9a were written after the new 1–38, and designed to end where p. 1 begins; this would explain the ‘a’, ‘b’, ‘c’, etc. after the numbers.
1
2
494
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
zur Rechten ein „Hinterglied“. Kommt in dem Vorderglied wiederum das Zeichen → vor, so muss das Vorderglied in Klammern eingeschlossen werden.F Als „Formel-Variable“ wenden wir grosse lateinische Buchstaben A, B, C, U , V an. Hinter einer Formelvariablen können Funktionale als Argumente angefügt werden. (Dabei sind im Falle mehrerer Argumente diese durch Kommata von einander zu trennen und in Klammern einzuschliessen.) Z. B. schreiben wir Ab, A1 + 1, Aδa, A(a, δb, a + 1). Mit Hilfe der eingeführten Zeichen bilden wir nun „Formeln“. Eine Figur, die nur aus einer Formel-Variablen, mit oder ohne Argumenten, besteht, nennen wir eine „variable Formel“. Gleichungen und variable Formeln sollen gemeinsam „Primformeln“ heissen. Aus den Primformeln setzen sich, mit Hilfe des Folgezeichens, „Folgeformeln“ zusammen. Die Zusammensetzung hat so zu geschehen, dass bei jedem vorkommenden Folgezeichen sowohl das Vorderglied wie das Hinterglied entweder eine Primformel ist oder wiederum ein (oder mehrere) Folgezeichen enthält. Aus den Primformeln und Folgeformeln erhält man die allgemeinsten Formeln durch Hinzunahme des Negationsstriches. Dieser kann einmal oder mehrmals über eine ganze Formel oder auch über ein Vorderglied oder Hinterglied eines Folgezeichens gesetzt werden, sodass Figuren wie A → B → C, 3
5): 6):
I. Logische Axiome. a) Axiome der Folge. A→B→A (A → A → B) → A → B (A → B → C) → B → A → C (B → C) → (A → B) → A → C b) Axiome der Negation. A→A→B (A → B) → (A → B) → B
II. Arithmetische Axiome a) Axiome der Gleichheit. 7): a = a Addition written by Hilbert on note pasted to the front end-page, and clearly marked ‘Zu S. 2’: Hinzunahme der logischen Zeichen & und ∨. Für die Klammersetzung gilt folgende Regel: Bei der Trennung von Formelbestandteilen hat das → Vorrang vor & und ∨ und & Vorrang vor ∨, ferner das spätere & vor dem früheren & und das spätere ∨ vor dem früheren (also ebenso wie [[in der Algebra früher]]--↑auf S. 1↓ Substitution by Hilbert bei + und ·, aber entgegengesetzt wie bei →). F
10
15
20
A→B→C
| entstehen. Bei einer Gleichung wird der Negationsstrich mit dem Zeichen = zu dem Zeichen = verschmolzen, sodass man z. B. anstatt a = b die „Ungleichung“ a = b schreibt. Unter den Formeln zeichnen wir folgende als „Axiome“ aus:
1): 2): 3): 4):
5
25
30
35
‘Grundlagen der Mathematik’ (1921/22)
495
8): a = b → Aa → Ab b) Axiome der Zahl. 9): a + 1 = 0 10): δ(a + 1) = a 5
10
15
20
Wie durch bestimmte Zusammensetzungen von Zeichen die Formeln gebildet werden, so bestehen die „Beweise“ in einer gewissen Art der Aufeinanderfolge von Formeln. Das charakteristische für diese Art der Aufeinanderfolge ist, dass man, von Axiomen ausgehend, durch Einsetzungen und „Schlüsse“ zu anderen Formeln gelangt, welche dann „beweisbar“ heissen. Was eine „erlaubte Einsetzung“ ist, bestimmt sich nach folgenden Regeln: Für eine Grundvariable kann irgend ein Funktional eingesetzt werden. Für eine Formel-Variable ohne Argument kann eine beliebige Formel eingesetzt werden. Für eine Formelvariable mit einem oder mehreren Argumenten kann irgend eine Formel eingesetzt werden, welche die als Argumente stehenden Funktionale enthält. Kommt in der Formel, in welche man einsetzt, dieselbe Formelvariable mehrmals, aber mit anderen Argumenten vor, so hat man darauf zu achten, dass die eingesetzten Formeln sich nur durch die an den Argumentstellen stehenden Funktionale unterscheiden. Setzt man z. B. in die Formel
4
a + 1 = b → Aa + 1 → Ab
25
30
für Ab die Formel a = b ein, so muss man zugleich für Aa + 1 die Formel a = a + 1 einsetzen. Unter einem Schluss soll eine von drei untereinander stehenden Formeln gebildete Figur verstanden werden, worin die drei Formeln sich ihrer Gestalt nach so zu einander verhalten, dass die zweite Formel entsteht, indem man die erste (als Vorderglied) mit der dritten (als Hinterglied) durch das Zeichen → zusammensetzt. Um die Schlüsse als solche durch die Schreibweise hervorzuheben, wollen wir die beiden ersten Formeln („Prämissen“) von der Endformel des Schlusses durch einen Strich trennen, sodass wir z. B. schreiben: 0=0 0=0→A A
35
Auf Grund dieser Erklärungen lassen sich die kennzeich|nenden Eigenschaften des Beweises folgendermassen formulieren: ein Beweis ist eine Figur bestehend aus Formeln, die in solcher Weise auf einander folgen, dass für jede Formel mindestens einer von folgenden Fällen vorliegt: entweder sie stimmt mit einem Axiom überein oder geht aus ihm durch erlaubte Einsetzungen hervor1) , 1) Dass wir hier die gleichzeitige Ausführung mehrerer Einsetzungen zulassen, geschieht lediglich, um an einer späteren Stelle eine unnötige Komplikation zu vermeiden. Der Bereich der beweisbaren Formeln wird dadurch nicht vergrössert. Denn simultane Einsetzungen können stets durch sukzessive Einsetzungen ersetzt werden.
5
496
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
oder sie stimmt mit einer (in der Figur) vorhergehenden Formel überein oder geht aus ihr durch erlaubte Einsetzungen hervor; oder sie ist die Endformel eines Schlusses. Figuren von dieser Beschaffenheit sollen „Beweise“ heissen. Sie sind das formale Abbild inhaltlicher arithmetischer Beweise und bilden die Gegenstände unserer anschaulichen Theorie, durch welche die Arithmetik ihre sichere Grundlage erhalten soll. Ausserhalb des Formalismus der Beweise, welchen unsere anschauliche Ueberlegung zum Objekt hat, stehen die Zeichen, welche wir, so wie in der anschaulichen Zahlentheorie, zur Mitteilung anwenden. Als solche Zeichen nehmen wir wieder deutsche Buchstaben; und zwar gebrauchen wir kleine Buchstaben zur Mitteilung von Funktionalen, grosse zur Mitteilung von Formeln. So können wir z. B. die Figur des Schlusses durch das Schema S S→T
5
10
15
T 6
angeben. Auch gebrauchen wir grosse deutsche Buchstaben mit angefügten Funktionalen zur Mitteilung solcher Formeln, die für | eine Formel-Variable mit den betreffenden Funktionalen als Argumenten eingesetzt werden. Z. B. bedeutet a = b → Aa → Ab eine Formel, die aus dem Axiom
20
a = b → Aa → Ab durch eine Einsetzung für die Formel-Variable A erhalten wird. Unsere Aufgabe geht nun nach zwei Richtungen: einerseits handelt es sich um die Fragen der Beweisbarkeit, andererseits um den Nachweis der Widerspruchsfreiheit.G Bei den Fragen der Beweisbarkeit kommt es darauf an, zu erkennen, dass wirklich durch den beschriebenen Formalismus die inhaltliche Arithmetik in ihren Anfangsgründen, und zwar mit Einbeziehung des logischen Schliessens, nachgebildet wird. Unter diesem Gesichtspunkt wollen wir die aufgestellten Axiome und Regeln durchgehen. Die Rolle des Zeichens → wird durch die Figur des Schlusses und durch die Axiome 1)–4) gekennzeichnet. Einer Formel A → B entspricht die Aussage: „wenn A, so B“; oder „aus A folgt B“. Demgemäss entspricht einer Formel
25
30
35
A→B→C die Aussage: „wenn A, so ist, wenn B ist, C“. Und hiermit ist gleichbedeutend die Aussage: „wenn A und B, so C“. Added by Hilbert in the left-hand margin: Die Beantwortung dieser beiden Fragen oder vielmehr die Berücksichtigung dieser beiden Gesichtspunkte ist zugleich die Entwickelung der Theorie und enthält alles Wesentliche! G
40
‘Grundlagen der Mathematik’ (1921/22)
5
10
15
20
25
30
497
Somit werden durch die Axiome 1)–4) folgende logischen Schlussprinzipe formalisiert: „wenn A und B, so A“; „wenn B aus A und A folgt, so folgt B aus A“; „wenn C aus A und B folgt, so folgt C aus B und A“; „wenn C aus B folgt und B aus A folgt, so folgt C aus A“. Noch deutlicher wird uns die Rolle der Axiome 1)–4), indem wir uns klar machen, dass sich aus ihnen folgende formalen Regeln ergeben: 1. Vor eine beweisbare Formel kann das Zeichen → mit irgend einer Formel als Vorderglied gesetzt werden. 2. In einer beweisbaren Formel A → A → B kann das eine der beiden übereinstimmenden Vorderglieder weggelassen werden. 3. In einer beweisbaren Formel A → B → C kann die Reihenfolge der beiden Vorderglieder gewechselt werden. 4. In einer beweisbaren Formel B → C kann irgend eine Formel A vor B und vor C als Vorderglied vorgesetzt werden, sodass die Formel (A → B) → A → C entsteht. Diese Regeln sind so gemeint, dass die angegebene Operation, angewandt auf eine beweisbare Formel, wieder zu einer beweisbaren Formel führt.H In der Tat trifft dies für die vier genannten Operationen zu. Nehmen wir z. B. die Regel 1. Hier wird behauptet: wenn A eine beweisbare Formel und B irgend eine Formel ist, so ist auch die Formel B → A beweisbar. Dass dies zutrifft, sehen wir so ein: Wir denken uns zu dem Beweise von A die Figur A A→B→A B→A hinzugefügt. Dann hat die entstehende Gesamtfigur wieder den Charakter eines Beweises; denn die Formel A stimmt mit der (unmittelbar vorhergehenden) Endformel des ursprünglichen Beweises überein, die Formel A → B → A The following addition was written by Hilbert on the note pasted to the front end-page, and clearly marked ‘Zu S. 7’: Axiome für & und ∨ A&B →A A&B →B A → {B → A & B} A→A∨B A→B∨A (A → C) → (B → C) → [A ∨ B → C] ↑wenn aus A C folgt und aus B folgt C so C!↓ Added by Hilbert in the righthand margin. Wenn man den Beweis einer Formel hat, welche nicht die Zeichen &, ∨ enthält, so kann man überhaupt diese Zeichen &, ∨ aus dem Beweise entfernen, nämlich man setze überall für A & B A → B ferner für A ∨ B setze man A → B dann gehen diese eben aufgestellten Axiome in Formeln über, die auf Grund von Axiom 1–6 beweisbar sind und diese Formeln schaltet man dann in den Beweis ein wo sie gebraucht werden. H
7
498
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
entsteht aus dem Axiom 1), welches ja A→B→A 8
lautet, indem wir für A die Formel A und für B die Formel B einsetzen; und die Formel B → A ist die Endformel eines Schlusses. Wir erhalten somit aus dem Beweis von A einen Beweis von B → A. Ganz ebenso wird die Richtigkeit der Regeln 2., 3. und 4. erkannt; man braucht nur statt des Axioms 1) bezüglich die Axiome 2), 3), 4) anzuwenden. Aus dem Axiom 4) entnehmen wir ferner noch die Regel 5.: Wenn A → B und B → C beweisbare Formeln sind, so ist auch A → C eine beweisbare Formel. In der Tat erhalten wir einen Beweis von A → C, indem wir die Beweise der Formeln A → B und B → C hinter einander aufschreiben und dann folgende Figur anfügen: B→C (B → C) → (A → B) → A → C
5
10
15
(A → B) → A → C A→B (A → B) → A → C A → C,
9
wovon die zweite Formel aus dem Axiom 4) entsteht, indem man A für A, B für B und C für C einsetzt, und die übrigen Formeln teils Wiederholungen früherer Formeln, teils Endformeln von Schlüssen sind. Methodisch ist über die Regeln zu sagen, dass durch sie nicht etwa der Formalismus der Beweise erweitert wird. Innerhalb der formalen Beweise kommen die Regeln überhaupt nicht zur Anwendung; eine solche Anwendung würde ja nicht zu unserer Definition des Beweises stimmen. Wohl aber können wir die Regeln zur abgekürzten Mitteilung von Beweisen verwenden. Sie sind Sätze unserer inhaltlichen Theorie der Beweise. Und wie wir in | der anschaulichen Zahlentheorie durch inhaltliche Sätze die Ergebnisse formaler Zusammensetzung und des direkten Vergleichens antizipieren, so können wir auch in der Theorie der Beweise die Ergebnisse formaler Handlungen, die in den Beweisen vorkommen, durch inhaltliche Lehrsätze (Regeln) vorwegnehmen. — Um ein Beispiel eines durchgeführten Beweises zu geben, will ich mit Hilfe der Axiome 1), 2), 3) die Formel A → (A → B) → B beweisen, deren inhaltliches Gegenstück das logische Schlussprinzip ist: „wenn A und wenn aus A folgt B, so B.“ Der Beweis jener Formel lässt sich folgendermassen führen:
20
25
30
35
‘Grundlagen der Mathematik’ (1921/22)
499
A→A→A A→A→A →A→A A→A (A → B) → A → B (A → B) → A → B → A → (A → B) → B
5
10
15
20
25
A → (A → B) → B. Hier ist die erste Formel aus dem Axiom 1) gewonnen, indem A für B eingesetzt ist, und die zweite Formel entsteht auf dieselbe Weise aus dem Axiom 2); die dritte Formel ist Endformel eines Schlusses, aus dieser entsteht die folgende Formel, indem A → B für A eingesetzt wird; die nächste Formel ergibt sich aus dem Axiom 3), indem man A → B für A, A für B und B für C einsetzt.1) Der ausgeführte Beweis enthält als Bestandteil den Beweis der Formel A → A. | — Man beachte, dass auf Grund unserer Definition des Beweises jede in einem Beweise vorkommende Formel eine beweisbare Formel ist. — Wenden wir uns nun zu den Axiomen 5) und 6). Durch diese wird die formale Negation implizite charakterisiert. Und zwar ist das Axiom 5) das formale Analogon für den Satz vom Widerspruch, das Axiom 6) für den Satz vom ausgeschlossenen Dritten. Mit Hilfe des Axioms 5) kann aus zwei Formeln A und A jede beliebige Formel B abgeleitet werden, d. h. wenn irgend eine Formel A und zugleich auch A beweisbar ist, so ist überhaupt jede Formel beweisbar. In der Tat braucht man ja, um aus den Beweisen der Formeln A und A einen Beweis für irgend eine Formel B zu erhalten, nur jene Beweise aneinanderzusetzen und folgende Formeln hinzuzufügen: A A→A→B A→B A
30
A→B
35
B, von denen die zweite Formel aus dem Axiom 5) erhalten wird, indem man für A die Formel A und für B die Formel B einsetzt, und die übrigen teils Endformeln von Schlüssen, teils Wiederholungen vorheriger Formeln sind. — Die Anwendung der Axiome 5) und 6) will ich durch einige Beispiele erläutern. Das Axiom 6) lautet: (A → B) → (A → B) → B. 1)
Will man statt dieser simultanen Einsetzung sukzessive Einsetzungen anwenden, so setze man zuerst für A die Variable U , sodann A für B, dann B für C und schliesslich A → B für U ein.
10
500
11
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Durch Vertauschung der Vorderglieder (Regel 3.) erhalten wir hieraus (A → B) → (A → B) → B. Wird hierin A für B eingesetzt, so ergibt sich (A → A) → (A → A) → A. Da A → A aus der beweisbaren Formel A → A durch Einsetzung entsteht, so erhalten wir, indem wir an den Beweis der Formel A → A erst den Beweis der Formel (A → A) → (A → A) → A und dann die Figur A→A
5
10
(A → A) → (A → A) → A (A → A) → A. anfügen, einen Beweis der Formel (A → A) → A. Der Beweis von A → A lautet folgendermassen: A→A→A
15
(A → A → A) → (A → A → A) → A → A (A → A → A) → A → A A→A→A (A → A → A) → A → A A → A.
12
Hier entsteht die erste Formel aus Axiom 1), indem A für B eingesetzt wird, die zweite Formel aus Axiom 6), indem A → A für B eingesetzt wird; die dritte Formel ist Endformel eines Schlusses; die nächste geht aus dem Axiom 5) hervor, indem wir A für A und A für B einsetzen; hierauf folgt die Wiederholung einer vorhergehenden Formel, und die letzte Formel ist Endformel eines Schlusses. — Bei näherem Zusehen zeigt sich, dass mit Hilfe der Axiome 1)–6) alle die Formeln beweisbar sind, welche im Aussagen-Kalkül der mathematischen Logik die immer richtigen Aussagen darstellen, d. h. natürlich soweit sie als logische Zeichen nur das Folgezeichen und den Negationsstrich enthalten. — — Für die Anwendung auf die Arithmetik merken wir uns noch die beiden Formeln an, welche aus 5) und 6) durch Einsetzung der Gleichung a = b für A entstehen: I a = b → a = b → B (a = b → B) → (a = b → B) → B Added by Hilbert at the top of the page: Durch Einsetzung aus den Negationsaxiomen folgt: I
20
25
30
35
‘Grundlagen der Mathematik’ (1921/22)
501
sowie auch die Formel (a = b → c = d) → c = d → a = b, die aus der beweisbaren Formel (A → B) → B → A 5
erhalten wird, indem man erst für A die Gleichung a = b und in der so entstehenden Formel für B die Gleichung c = d einsetzt. — Die Axiome 7) und 8) enthalten die implizite Charakterisierung der formalen Gleichheitsbeziehung. Auf Grund des Axioms 7) ist für jedes Funktional a, insbesondere für jedes Zahlzeichen a die Gleichung a=a
10
beweisbar. Ferner erhalten wir mit Hilfe des Axioms 7) einen Beweis der Formel a = a → B, indem wir in die vorhin erwähnte beweisbare Formel a = b → (a = b → B)
15
für b die Variable a einsetzen und an den Beweis der so entstehenden Formel a = a → a = a → B die Figur a=a a = a → a = a → B
20
a = a → B
25
anfügen. Und für a: 0 erhält man: 0 = 0 → B Der Formel 8) entspricht in der inhaltlichen Arithmetik der Satz: „In jeder Aussage kann Gleiches für Gleiches gesetzt werden“. (Wir bemerken dabei, wie die Unbestimmtheit, die in der Anwendung des Allgemeinbegriffs der Aussage liegt, auf unserem Standpunkt verschwindet.) Setzt man in Axiom 8) für Aa die Gleichung a = c und demgemäss für Ab die Gleichung b = c ein, so ergibt sich
30
a = b → a = c → b = c. Setzt man hierin a für c ein und vertauscht die beiden Vorderglieder (Regel 3), so erhält man a=a→a=b→b=a und durch Anfügung des Schlusses a=a
35
a=a→a=b→b=a a=b→b=a ergibt sich a=b→b=a
13
502
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
als beweisbare Formel. Nimmt man nun noch die vorhin genannte beweisbare Formel (a = b → c = d) → c = d → a = b hinzu, aus welcher durch Einsetzungen (a = b → b = a) → b = a → a = b
5
hervorgeht, so erhält man die Formel b = a → a = b und aus dieser wiederum geht durch Einsetzungen die Formel a = b → b = a 14
hervor. Aus den Formeln
10
a=b→b=a und a=b→a=c→b=c leitet man durch mehrere Einsetzungen sowie durch Anwendung von Axiom 4), im Sinne der Regel 5, die Formel
15
a=b→b=c→a=c ab, welche die Transitivität der Gleichheitsbeziehung ausdrückt. Durch mehrmalige Anwendungder Axiome 3) und 4), im Sinne der Regeln 3 und 5, gelangt man zu der Formel a = c → b = c → a = b, welche das formale Abbild ist für den Satz: „wenn zwei Grössen einer dritten gleich sind, so sind sie einander gleich“. Ein weiteres Beispiel für die Anwendung der Axiome 7) und 8) bildet der Beweis der Formel a = b → a + 1 = b + 1. Man erhält zunächst aus der Formel 8), indem man für Aa die Gleichung c = a + 1 und dementsprechend für Ab die Gleichung c = b + 1 einsetzt, die Formel a = b → c = a + 1 → c = b + 1; setzt man hierin a+1 für c ein und vertauscht darauf die beiden Vorderglieder (Regel 3), so ergibt sich
20
25
30
a + 1 = a + 1 → a = b → a + 1 = b + 1. Da die Gleichung a + 1 = a + 1 durch Einsetzung aus der Formel 7) entsteht, so kann nun die Schlussfigur a+1=a+1 a+1=a+1→a=b→a+1=b+1 a = b → a + 1 = b + 1, 14a
angefügt werden, in welcher die zu beweisende Formel als Endformel steht.
35
‘Grundlagen der Mathematik’ (1921/22)
503
In ganz entsprechender Weise verläuft der Beweis der Formel a = b → δa = δb. Die Axiome 9) und 10) bewirken, dass für irgend zwei Zahlzeichen a, b von verschiedener Gestalt, die Ungleichung a = b
5
beweisbar ist. Nämlich zunächst erhält man für jedes von 0 verschiedene Zahlzeichen a aus Axiom 9) die Ungleichung a = 0; denn jedes von 0 verschiedene Zahlzeichen a hat ja die Form k + 1, sodass die Ungleichung a = 0 aus der Formel a + 1 = 0
10
durch Einsetzung des Funktionals k für a hervorgeht. Ferner können wir mit Hilfe des Axioms 10) die Formel a+1=b+1→a=b folgendermassen beweisen: Aus der beweisbaren Formel 15
a=b→a=c→b=c erhalten wir durch Einsetzungen: δ(a + 1) = a → δ(a + 1) = δ(b + 1) → a = δ(b + 1). An diese Formel fügen wir die Schlussfigur an: δ(a + 1) = a
20
δ(a + 1) = a → δ(a + 1) = δ(b + 1) → a = δ(b + 1) δ(a + 1) = δ(b + 1) → a = δ(b + 1). Aus der beweisbaren Formel a=b→b=c→a=c gewinnen wir durch Einsetzungen die Formel |
25
a = δ(b + 1) → δ(b + 1) = b → a = b, woraus durch Vertauschung der Vorderglieder (Regel 3) die Formel δ(b + 1) = b → a = δ(b + 1) → a = b hervorgeht. Da δ(b + 1) = b aus Axiom 10) durch Einsetzen von b für a entsteht, so gelangen wir durch einen Schluss zu der Formel
30
a = δ(b + 1) → a = b. Diese Formel in Verbindung mit der vorher erhaltenen Formel δ(a + 1) = δ(b + 1) → a = δ(b + 1) liefert, gemäss der Regel 5, die Formel δ(a + 1) = δ(b + 1) → a = b.
35
Andererseits entsteht aus der beweisbaren Formel a = b → δa = δb
15
504
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
durch Einsetzungen die Formel a + 1 = b + 1 → δ(a + 1) = δ(b + 1), und aus dieser in Verbindung mit der erhaltenen Formel δ(a + 1) = δ(b + 1) → a = b ergibt sich, gemäss der Regel 5, die zu beweisende Formel
5
a + 1 = b + 1 → a = b. Von dieser Formel gelangt man weiter, durch Heranziehung der beweisbaren Formel (a = b → c = d) → c = d → a = b, aus welcher durch Einsetzungen
10
(a + 1 = b + 1 → a = b) → a = b → a + 1 = b + 1 entsteht, zu der Formel a = b → a + 1 = b + 1. Um nun z. B. für die zwei verschiedenen Zahlzeichen 0 + 1 + 1 und 0 + 1 + 1 + 1 + 1 + 1 die Ungleichung
15
0 + 1 + 1 + 1 + 1 + 1 = 0 + 1 + 1 zu beweisen, geht man von der Formel 16
0 + 1 + 1 + 1 = 0 aus, welche aus 9) durch Einsetzung entsteht. Durch Anwendung der Formel a = b → a + 1 = b + 1 erhält man hieraus
20
0 + 1 + 1 + 1 + 1 = 0 + 1 und durch nochmalige Anwendung jener Formel ergibt sich 0 + 1 + 1 + 1 + 1 + 1 = 0 + 1 + 1. Will man die Funktionale zu beiden Seiten der Ungleichung miteinander vertauschen, so braucht man nur die beweisbare Formel
25
a = b → b = a anzuwenden. — Hiermit sind nun in der Tat die Anfänge der Zahlenlehre sowie die einfacheren Formen der logischen Schlüsse (die auf dieser Stufe völlig ausreichen) vollständig formalisiert. Was insbesondere die Formalisierung der Logik betrifft, so haben wir zwar kein Zeichen für „alle“ und für „es gibt“ eingeführt; dennoch enthält unser Formalismus bereits ein teilweises Aequivalent für das allgemeine und für das existentiale Urteil. Nämlich auf Grund der Einsetzungsregeln entsprechen die Formeln mit Variablen allgemeinen Behauptungen. z. B. die Formel a=a entspricht der Aussage: „ jedes Funktional ist sich selbst gleich“.
30
35
‘Grundlagen der Mathematik’ (1921/22)
5
10
15
20
25
30
505
Und das existentiale Urteil wird ersetzt durch eine formale Konstruktion: Wir bilden direkt dasjenige, dessen Existenz behauptet werden soll. So tritt z. B. an die Stelle des existentialen Urteils: „zu jeder Zahl gibt es eine folgende“ die Konstruktion des Anhängens von „+1“, wodurch die „folgende Zahl“ herstellt wird. Jedoch sind wir mit dem bisherigen Formalismus nicht in der | Lage, das Gegenteil eines allgemeinen Urteils nachzubilden. Wir können zwar eine Formel mit Variablen formal negieren (überstreichen); dadurch wird aber nicht das Gegenteil der Allgemeinheit, sondern die Allgemeinheit des Gegenteils formal nachgebildet. z. B. die Formel a = b + 117 entspricht der allgemeinen Aussage: „für jedes Funktional a und jedes Funktional b ist a gleich b + 1“. Die gegenteilige Behauptung würde lauten: „nicht für jedes a und jedes b ist a gleich b + 1“. Diese wird aber nicht durch die formale Negation a = b + 1 nachgebildet. Denn diese entspricht der allgemeinen Aussage: „für jedes a und jedes b ist a ungleich b+1“. Ferner können wir bei hypothetischen Sätzen wohl eine existentiale Voraussetzung, aber nicht die Allgemeinheit einer Voraussetzung formal wiedergeben, z. B. der (beweisbaren) Formel a = a → 0 = 0 entspricht die Aussage: „wenn für irgend ein Funktional a die Ungleichheit a = a besteht, so ist 0 ungleich 0“, oder, was dasselbe besagt: „wenn es ein Funktional gibt, das sich selbst ungleich ist, so ist 0 ungleich 0“. Dass dies wirklich das inhaltliche Gegenstück der Formel ist, können wir uns so klar machen: Gesetzt wir hätten für irgend ein Funktional a die Ungleichung a = a bewiesen, so würden wir mit Hilfe jener Formel durch Einsetzung von a für a und Anwendung der Schlussfigur a = a a = a → 0 = 0
17
0 = 0 35
40
einen Beweis von 0 = 0 erhalten. — Hier wird also eine hypothetische Aussage mit existentialem Vordersatz formalisiert. Die zugehörige Aussage mit allgemeinem Vordersatz lautet: „Wenn alle Funktionale sich selbst ungleich sind, so ist 0 ungleich 0.“ Diesen Satz können wir (auf der vorläufigen Stufe unseres Formalismus) nicht formalisieren. Ein anderes Beispiel dieser Art bildet folgender (logisch allgemeingültige) Satz: „Wenn eine Aussage für alle Funktionale zutrifft, so trifft sie für 0 zu.“ Man könnte hier versucht sein, die Formel Aa → A0 17 Hilbert has written ‘a = 2’ next to this equation, which example is used to illustrate the rest of the paragraph, as the changes detailed in the Textual Notes make clear.
18
506
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
als diesem Satz entsprechend anzusehen. Tatsächlich entspricht aber diese Formel einem ganz anderen Satze, nämlich dem (offenbar falschen) Satz: „Wenn eine Aussage für irgend ein Funktional zutrifft (— d. h. wenn es ein Funktional gibt, für welches die Aussage zutrifft —), so trifft sie auch für 0 zu.“ Gleichermassen verhält es sich bei folgendem Satz: „Wenn eine Aussage für jedes Funktional a zutrifft, so trifft sie auch für jedes Funktional a + 1 zu.“ Dieser richtigen Behauptung entspricht weder die Formel
5
Aa → Aa + 1 noch auch die Formel
19
20
Aa → Ab + 1 Vielmehr ist das inhaltliche Gegenstück für die erste Formel der falsche Satz: „wenn eine Aussage für irgend ein Funktional a zutrifft, so trifft sie auch für das Funktional a+1 zu (das aus jenem durch Anhängen von +1 entsteht)“; und für die zweite Formel ist es der (ebenfalls falsche) Satz: „Wenn eine Aussage für irgend ein Funktional a zutrifft, so trifft sie für jedes Funktional b+1 zu.“ — Wir kommen nunmehr zu der Aufgabe, die Widerspruchsfreiheit der aufgestellten Axiome und Regeln nachzuweisen. Genauer gesagt, handelt es sich um den Nachweis, dass im Bereiche der logischen und arithmetischen Beziehungen, die sich durch unseren Formalismus nachbilden lassen, und aufgrund derjenigen Voraussetzungen und Schlüsse, die in unsern Axiomen und Regeln ihr formales Gegenstück haben, nicht zwei einander widersprechende Aussagen gefolgert werden können. Hierzu genügt es, zu zeigen, dass, im Sinne unserer Beweistheorie, keine zwei Formeln A, A (von denen eine die Negation der andern ist) beweisbar sind, mit andern Worten, dass die Negation einer beweisbaren Formel jedenfalls nicht beweisbar ist. Dieser Behauptung der Widerspruchsfreiheit unserer Axiome können wir noch eine engere Fassung geben. Nämlich wie wir bei der Erörterung des Axioms 5) feststellten, kann aus irgend zwei Formeln A und A jede beliebige Formel, also auch jedes andere Paar von Formeln B und B bewiesen werden. Wir brauchen daher nur für ein bestimmtes Paar solcher Formeln den Nachweis zu führen, dass sie nicht beide beweisbar sind. Als solches Paar wählen wir uns die Formeln 0 = 0 und 0 = 0. Hier wissen wir, dass 0 = 0 beweisbar ist. Unsere Behauptung besagt demnach, dass 0 = 0 nicht beweisbar ist. Alles kommt also darauf an, folgende Behauptung zu begründen: Es kann keinen Beweis (in dem definierten Sinne) geben, welcher 0 = 0 als Endformel hat. Der Nachweis hierfür muss natürlich indirekt geführt werden. Wir denken uns, es gäbe einen Beweis mit der Endformel 0 = 0. Aus dieser Annahme wollen wir zunächst die Existenz eines Beweises von speziellerer Art für die Formel 0 = 0 folgern und dann zeigen, | dass ein solcher Beweis nicht vorhanden sein kann. Um zu dem ersten Ziel zu gelangen, müssen wir mit einer allgemeinen Hilfsbetrachtung beginnen, indem wir den Begriff der „motivierenden Formel“ einführen.
10
15
20
25
30
35
40
45
‘Grundlagen der Mathematik’ (1921/22)
5
10
15
20
25
30
35
40
507
Gemäss der Definition des Beweises können bei einer in einem Beweise vorkommenden Formel nur drei Fälle vorliegen: entweder sie ist ein Axiom oder geht aus einem Axiom durch Einsetzungen hervor, oder sie stimmt mit (mindestens) einer vorhergehenden Formel überein oder entsteht aus ihr durch Einsetzung, oder sie ist Endformel eines Schlusses. Besteht für eine Formel der zweite Fall, so ordnen wir ihr eine derjenigen vorhergehenden Formeln, mit welchen sie übereinstimmt oder aus der sie durch Einsetzung entsteht, als „motivierende Formel“ zu. Der Endformel eines Schlusses sollen die beiden Prämissen als „motivierende Formeln“ zugeordnet werden. Mit Bezug auf dieses Verfahren der Zuordnung motivierender Formeln gilt nun folgender Satz : Jeder Beweis kann durch Wiederholen und durch Weglassen von Formeln zu einem solchen Beweise derselben Endformel umgestaltet werden, in welchem, bei passender Zuordnung der motivierenden Formeln, jede Formel, mit Ausnahme der letzten, einer und nur einer Formel als motivierende Formel zugeordnet ist.A Nämlich einerseits können wir durch Wiederholung von Formeln erreichen, dass jede Formel höchstens einer Formel als motivierende Formel zugeordnet ist. Denn denken wir uns in einem vorgelegten Beweise die Zuordnung der motivierenden Formeln irgendwie festgelegt, und sei A die erste unter den Formeln dieses Beweises, welche zwei oder mehreren Formeln, B, C, . . . , U als motivierende Formel zugeordnet | ist, so füge man vor jeder der Formeln C, . . . , U bezw. wenn die Formel zweite Prämisse eines Schlusses ist, vor der ersten Prämisse dieses Schlusses die Wiederholung des Beweisanfanges, bis einschliesslich zur Formel A, ein und ordne die Wiederholungen der Formel A bezüglich den Formeln C, . . . , U als motivierende Formeln zu. Ferner übernehme man bei jeder Wiederholung des Beweisanfanges die Zuordnungen der motivierenden Formeln, soweit sie sich nur auf Formeln des Beweisanfanges selbst beziehen; (d. h. wenn V eine Formel des Beweisanfanges und W die ihr zugeordnete motivierende Formel ist, so soll bei jeder Wiederholung des Beweisanfanges auch diese Zuordnung wiederkehren). Auf diese Weise gelangt man zu einem Beweise, der mit dem ursprünglichen die Endformel gemeinsam hat, und in welchem (auf Grund der festgesetzten Zuordnung der motivierenden Formeln) die Anzahl derjenigen Formeln, welche mehreren Formeln als motivierende Formeln zugeordnet sind, um Eins geringer ist als in dem ursprünglichen Beweis. Durch mehrmalige Anwendung dieses Verfahrens erhält man somit einen Beweis, der dieselbe Endformel hat wie der ursprüngliche Beweis und in welchem die Zuordnung der motivierenden Formeln so bestimmt ist, dass jede Formel höchstens einer Formel zugeordnet ist. Added in the right-hand margin, probably in Bernays’s hand: Jede Formel wird höchstens einmal benutzt. A
21
508
22
23
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Nachdem dies erreicht ist, können wir andererseits durch Weglassen von Formeln bewirken, dass jede Formel mit Ausnahme der Endformel des Beweises mindestens einer Formel als motivierende Formel zugeordnet ist.B Denn wir erhalten aus dem Beweise wieder einen Beweis, wenn wir alle diejenigen Formeln, mit Ausnahme der Endformel, wegstreichen, die keiner Formel als motivierende Formeln zugeordnet sind. Der hiermit bewiesene Satz dient uns als Hilfsmittel, um folgende für unsere Theorie grundlegende Tatsache zu erkennen: Wenn eine Formel, die keine Variable enthält, beweisbar ist, | so gibt es auch einen solchen Beweis dieser Formel, in dem keine Variable vorkommt. Oder anders ausgedrückt: Aus dem Beweise einer von Variablen freien Formel können die Variablen gänzlich ausgeschaltet werden. Das Verfahren, durch welches dies gelingt, besteht in folgendem: Vorgelegt ist ein Beweis, dessen Endformel keine Variable enthält. Diesen können wir, gemäss dem eben bewiesenen Satze so abändern und dann die Zuordnung der motivierenden Formeln so festsetzen, dass jede Formel, mit Ausnahme der Endformel des Beweises, einer und nur einer Formel als motivierende Formel zugeordnet ist. Nachdem dies geschehen ist, gehen wir aus von der Endformel des modifizierten Beweises. Wird diese direkt aus einem Axiom erhalten, so bildet sie für sich schon einen Beweis von der gewünschten Art. Andernfalls ist ihr entweder eine Formel als motivierende Formel zugeordnet, oder sie ist Endformel eines Schlusses (dessen Prämissen ihre motivierenden Formeln sind). Im ersten Fall stimmt entweder die motivierende Formel schon mit der Endformel überein, oder wir setzen an ihre Stelle noch einmal die Endformel. S Im zweiten Falle haben wir eine Schlussfigur S → T, worin T die EndforT mel des Beweises ist. Hier entfernen wir alle in S vorkommenden Grundvariablen, indem wir sie durch das Zeichen 0 ersetzen, und dann auch alle Formel-Variablen, indem wir sie durch die Gleichung 0 = 0 ersetzen. (Im Falle, wo Formel-Variable mit Argumenten vorkommen, ersetzen wir sie durch Formeln, welche die betreffenden Funktionale enthalten, z. B. A(a, b, k, m) durch a = b → k = m.) Auf diese Weise wird erreicht, dass die motivierende Formel der Endformel, bezw. jede der beiden motivierenden Formeln, von Variablen frei ist; und zwar bestehen die Aenderungen, die eventuell | hierzu an dem vorherigen Beweise anzubringen sind, lediglich in der Ausführung von Einsetzungen. In gleicher Art gehen wir nun in unserem Beweise weiter rückwärts und suchen zu jeder Formel A des Beweises, auf die wir bereits gestossen sind und aus der wir bereits die Variablen (falls solche vorkamen) durch gewisse Einsetzungen entfernt haben, die motivierende Formel, bezw. die beiden motivierenden Formeln auf. Added in the right-hand margin, probably in Bernays’s hand: Jede Formel wird mindestens einmal benutzt. B
5
10
15
20
25
30
35
40
‘Grundlagen der Mathematik’ (1921/22)
5
10
15
20
25
30
35
509
B sei die (von Variablen freie) Formel, welche wir an die Stelle von A gesetzt haben. Im Falle von nur einer motivierenden Formel setzen wir an deren Stelle die Formel B, was entweder gar keine Aenderung bedeutet oder durch Einsetzungen bewirkt wird. U Ist A die Endformel eines Schlusses U → A, so fassen wir zunächst die A in A vorkommenden Variablen ins Auge. Jede dieser Variablen ist beim Uebergang von A zu B durch eine von Variablen freie Figur ersetzt; und diese Figur setzen wir nun auch überall da ein, wo diese Variable in den Formeln U und U → A auftritt. Mit den Variablen, die nun noch aus der Formel U übrig bleiben, verfahren wir so, dass wir erst für die Grundvariablen das Zeichen 0 und dann für die Formelvariablen die Gleichung 0 = 0 setzen (wobei wieder im Falle von Formelvariablen mit Argumenten die vorhin angegebene Modifikation anzuwenden ist). Wird die Formel A direkt aus einem Axiom erhalten, so brauchen wir von ihr nicht weiter zurückgehen. Die an ihre Stelle tretende Formel B geht dann aus jenem Axiom durch eine oder mehrere Einsetzungen hervor. (Der Fall, dass die Formel B mit dem Axiom übereinstimmt, ist deshalb ausgeschlossen, weil die Axiome 1)–10) alle mindestens eine Variable enthalten, B dagegen von Variablen frei ist.) Die fortgesetzte Anwendung des angegebenen Ersetzungsverfahrens muss offenbar zu einem Abschluss führen, und zwar muss jede Formel unseres Beweises einmal an die Reihe kommen, weil ja jede Formel ausser der Endformel motivierende Formel einer anderen Formel ist; da andererseits auf Grund unserer Vorkehrungen keine Formel mehr als einer Formel (als motivierende Formel) zugeordnet ist, so tritt auch jede Formel unserer Beweises bei dem Rückgang nur einmal auf, und es können daher auch die geforderten Ersetzungen nicht mit einander in Widerstreit kommen. Wenn das Verfahren bis zu Ende durchgeführt ist, so haben wir anstelle des vorherigen Beweises eine neue Aufeinanderfolge von Formeln gesetzt, in welcher alle Variablen beseitigt sind, wo ferner die letzte Formel mit der Endformel des anfänglichen Beweises übereinstimmt, und worin für jede Formel die Alternative besteht, dass sie entweder aus einem Axiom durch Einsetzung hervorgeht oder mit einer vorhergehenden Formel übereinstimmt oder Endformel eines Schlusses ist.C Diese Figur bildet somit einen von Variablen freien Beweis für die Endformel des ursprünglichen Beweises. Die beschriebene Methode der Ausschaltung der Variablen will ich an einem Beweise der Formel Added by Hilbert in the right-hand margin: Einsetzung in eine frühere Formel kommt nicht mehr vor. C
24
510
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
δ(0 + 1) + 1 = 0 + 1 erläutern. Diese Formel erhält man als Endformel folgenden Beweises: a=b→c=a+1→c=b+1 (a = b → c = a + 1 → c = b + 1) → c = a + 1 → a = b → c = b + 1 ⎞ c=a+1→a=b→c=b+1 ⎠ a+1=a+1 a+1=a+1→a=b→a+1=b+1 ⎞ a=b→a+1=b+1 ⎠ δ(a + 1) = a
5
10
δ(a + 1) = a → δ(a + 1) + 1 = a + 1 δ(a + 1) + 1 = a + 1 δ(0 + 1) + 1 = 0 + 1. 25
Hier sind die Zuordnungen der motivierenden Formeln, soweit sie nicht aus den Schlussfiguren ersichtlich sind, durch die rechts angebrachten Verbindungsbögen kenntlich gemacht. Die Zuordnungen sind übrigens bei diesem Beweis nur auf eine Weise möglich. Führen wir nun nach der gegebenen Vorschrift die Ersetzungen aus, so erhalten wir für die Formel δ(0 + 1) + 1 = 0 + 1 folgenden von Variablen freien Beweis:
15
20
δ(0 + 1) = 0 → δ(0 + 1) + 1 = δ(0 + 1) + 1 → δ(0 + 1) + 1 = 0 + 1 (δ(0 + 1) = 0 → δ(0 + 1) + 1 = δ(0 + 1) + 1 → δ(0 + 1) + 1 = 0 + 1) → δ(0 + 1) + 1 = δ(0 + 1) + 1 → δ(0 + 1) = 0 → δ(0 + 1) + 1 = 0 + 1 δ(0 + 1) + 1 = δ(0 + 1) + 1 → δ(0 + 1) = 0 → δ(0 + 1) + 1 = 0 + 1 δ(0 + 1) + 1 = δ(0 + 1) + 1 δ(0 + 1) + 1 = δ(0 + 1) + 1 → δ(0 + 1) = 0 → δ(0 + 1) + 1 = 0 + 1
25
δ(0 + 1) = 0 → δ(0 + 1) + 1 = 0 + 1 δ(0 + 1) = 0 δ(0 + 1) = 0 → δ(0 + 1) + 1 = 0 + 1 δ(0 + 1) + 1 = 0 + 1
30
δ(0 + 1) + 1 = 0 + 1. An das Verfahren der Ausschaltung aller Variablen schliesst sich als eine weitere Art der Spezialisierung der Beweisfigur die „Reduktion“ der Funktionale, welche immer dann anwendbar ist, wenn die zu beweisende Endformel (von der wir bereits voraussetzen, dass sie von Variablen frei ist) nur Zahlzeichen als Funktionale enthält.
35
‘Grundlagen der Mathematik’ (1921/22)
5
10
511
In diesem Falle können wir erreichen, dass der ganze Beweis nur solche Funktionale enthält, welche die Gestalt eines Zahlzeichens haben.D Da (auf der bisherigen Stufe unseres Formalismus) alle von Variablen freien Funktionale aus dem Zeichen 0 durch die beiden Operationen des Anhängens von +1 und des Vorsetzens von δ erhalten werden, so handelt es sich lediglich darum, aus der Beweisfigur, die wir bereits als frei von Variablen annehmen können, das Zeichen δ zu entfernen. Dies geschieht folgendermassen: Wir nehmen eines derjenigen im Beweise vorkommenden δ, welche in ihrem Argument nicht wieder das Zeichen δ enthalten (also ein „innerstes“ δ). Das Argument dieses δ muss dann ein Zahlzeichen sein; es ist also entweder das Zeichen 0, oder es hat die Form a + 1, wo a ein Zahlzeichen ist. Im ersten Fall ersetzen wir δ0 durch 0, im zweiten Fall ersetzen wir δ(a + 1) durch a, sodass jedenfalls an die Stelle des δ mit seinem Argument ein Zahlzeichen tritt. Auf diese Weise ist die Anzahl der im D The following text is in Bernays’s hand and written on a separate piece of paper attached to the typescript. At the top right at the beginning, Hilbert has written ‘Vor S. 26’: Einschaltung: Berichtigung des Widerspruchsfreiheits-Beweises für die Anfangsstufe: Die Figuren, die man nach Ausführung der Reduktion der Funktionale erhält, sind nicht notwendig Beweise; nämlich eine Formel die durch Einsetzung aus dem Axiom a = b → Aa → Ab
hervorgeht, behält nach der Reduktion der Funktionale nicht immer diese Eigenschaft. So erhält man z. B. aus jener Formel durch Einsetzung die Formel: 0 + 1 + 1 = 0 + 1 → δ(0 + 1 + 1) = 0 + 1 → δ(0 + 1) = 0 + 1 Duch die Reduktion der Funktionale entsteht hieraus: 0 + 1 + 1 = 0 + 1 → 0 + 1 = 0 + 1 → 0 = 0 + 1. Diese Formel geht aber nicht mehr durch Einsetzung aus dem obigen Axiom hervor. Für den Widerspruchsfreiheits-Beweis genügt es jedoch, dass die nach der Reduktion der Funktionale entstehende Aufeinanderfolge von expliziten Formeln folgende Eigenschaft hat: für jede Formel besteht die Alternative, dass sie entweder aus einem der Axiome 1)–9) durch Einsetzung und eventuelle Reduktion hervor oder sie stimmt mit einer vorhergehenden Formel überein oder sie ist Endformel eines Schlusses. Im übrigen bleibt dann die Überlegung ganz unverändert. Denn es ergibt sich genau so wie vordem, dass jede durch Einsetzung und Reduktion aus den Formeln 1)– 9) entstehende Formel richtig ist. [Added in the right-hand margin, probably in Hilbert’s hand: Nämlich bei den Axiomen 1.)–7.) und 9.) bleibt Einsetzung und bei 8.) und 10.) gelten ganz entsprechende Ueberlegungen wie auf S. 36–37 bez. S. 27.] Allerdings gilt nicht der Satz, dass jede (auf der Anfangsstufe) beweisbare explizite Formel auch Endformel eines solchen Beweises ist, der nur aus expliziten Formeln besteht. Z. B. trifft dies nicht für die Formel 0 + 1 + 1 = 0 + 1 zu. Wohl aber besteht der Satz, dass jede richtige explizite Formel auf der Anfangsstufe beweisbar ist.
26
512
27
28
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Beweise vorkommenden δ um Eins verringert, und indem wir das Verfahren fortsetzen, schaffen wir schliesslich alle δ aus dem Beweise heraus. Jetzt muss nur noch gezeigt werden, dass bei diesem Prozess, den wir als „Reduktion der Funktionale“ bezeichnen, die charakteristischen Eigenschaften der Beweisfigur erhalten bleiben. 18 Wir fanden, dass nach Ausschaltung der Variablen jede Formel im Beweise entweder durch Einsetzung aus einem Axiom entsteht oder mit einer vorhergehenden Formel übereinstimmt oder Endformel eines Schlusses ist. Nun wird durch die Reduktion der Funktionale die Uebereinstimmung zwischen zwei Formeln des Beweises jedenfalls nicht aufgehoben, und auch die Schlussfiguren bleiben dabei als solche erhalten. Was ferner die Formeln betrifft, die durch Einsetzung aus einem der Axiome 1)–9) entstehen, so bewirkt bei diesen die Reduktion der Funktionale nichts anderes, als dass an die Stelle gewisser Funktionale, | die für Grundvariable eingesetzt sind, andere Funktionale treten, sodass auch die geänderte Formel aus dem betreffenden Axiom durch Einsetzung hervorgeht. Es bleibt nur noch der Fall einer Formel, die durch Einsetzung aus dem Axiom 10) entsteht. Eine solche Formel hat die Gestalt δ(a + 1) = a, wobei a irgend ein von Variablen freies Funktional ist. Falls dieses Funktional nicht schon ein Zahlzeichen ist, so wird es bei der Reduktion durch ein Zahlzeichen ersetzt, sodass man jedenfalls eine Formel δ(b + 1) = b mit einem Zahlzeichen b erhält. Hierin hat man dann gemäss der Vorschrift für die Reduktion δ(b + 1) durch b zu ersetzen; die so entstehende Formel b=b geht aber aus dem Axiom 7) durch Einsetzung hervor. Somit lässt in der Tat die an einem Beweise ausgeführte Reduktion der Funktionale den Beweischarakter bestehen. Und es ergibt sich daraus, dass jede beweisbare Formel, in der keine Variable vorkommt und in der die Funktionale sämtlich Zahlzeichen sind, auch Endformel eines solchen Beweises ist, der keine Variablen und keine andern Funktionale ausser Zahlzeichen enthält. Nennen wir eine Formel, in der keine Variablen und keine Funktionale ausser Zahlzeichen vorkommen, eine „explizite Formel“, so können wir das gefundene Ergebnis so aussprechen: Jede beweisbare explizite Formel ist Endformel eines Beweises, dessen sämtliche Formeln explizite Formel sind. Dieses müsste insbesondere von der Formel 0 = 0 gelten, wenn sie beweisbar wäre. Der verlangte Nachweis der Widerspruchsfreiheit ist | daher erbracht, wenn wir zeigen, dass es keinen Beweis der Formel geben kann, der aus lauter expliziten Formeln besteht. Um diese Unmöglichkeit einzusehen, genügt es, eine konkret feststellbare Eigenschaft zu finden, die erstens allen den expliziten Formeln zukommt, welche durch Einsetzung aus einem Axiom entstehen, die ferner bei einem Schluss 18 Hilbert
has underlined the phrase ‘die charakteristischen . . . bleiben’ and written in the left-hand margin: ‘nicht richtig, siehe Einschaltung.’.
5
10
15
20
25
30
35
40
‘Grundlagen der Mathematik’ (1921/22)
5
10
15
513
sich von den Prämissen auf die Endformel überträgt, die dagegen nicht auf die Formel 0 = 0 zutrifft. Denn der Mangel dieser Eigenschaft (d. h. die gegenteilige Eigenschaft) bildet ja dann ein Kennzeichen, welches die Formel 0 = 0 von allen beweisbaren expliziten Formeln unterscheidet. Ein solches Kennzeichen gilt es nun ausfindig zu machen. Zu diesem Zweck wenden wir zunächst eine „logische Umformung“ an, bei der wir die Zeichen & und ∨ des Logikkalküls gebrauchen. Die Zusammensetzung durch & soll Konjunktion, die Zusammensetzung durch ∨ soll Disjunktion heissen. Während die Reduktion der Funktionale von innen her ausgeführt wird, indem wir bei den innersten δ beginnen, geschieht die logische Umformung von aussen her . — Das Verfahren ist übrigens nicht auf explizite Formeln beschränkt, sondern es bezieht sich auf beliebige Formeln. — Jede Formel, welche nicht eine Primformel oder die Negation einer Primformel ist, hat eine der drei Formen: A → B,
A → B,
A.
(Man beachte, dass bei einer Formel wie: 20
25
30
35
40
U → V → W,
oder: U → V → W → S
das Hinterglied des ersten hinter U stehenden Folgezeichens bis ans Ende der ganzen Formel reicht, sodass diese zu den Formeln von der Gestalt A → B gehört. Ferner ist zu bemerken, dass die Negation einer Ungleichung, also eine Formel a = b, als Spezialfall einer Formel A anzusehen ist, wobei dann A die Gleichung a = b bedeutet.) Wir ersetzen nun A → B durch
A∨B
A → B durch
A&B
A
durch
A.
Diese Ersetzung wenden wir dann auch auf die Glieder der entstehenden Disjunktion oder Konjunktion oder (nach Ausführung der dritten Ersetzung) auf die ganze entstehende Formel an, und in dieser Weise gehen wir immer weiter, bis keine Folgezeichen und keine doppelten Negationen mehr vorkommen. Das Verfahren führt jedenfalls zu einem Abschluss. Denn solange in einer der durch die Ersetzungen entstehenden Figuren noch ein Folgezeichen vorkommt, so hat entweder die ganze Figur oder ein Konjunktions- oder Disjunktionsglied die Gestalt einer Formel A → B oder einer solchen Formel, die aus einer Formel A → B durch einfache oder mehrfache Negation hervorgeht. Die Weglassung der doppelten Negationsstriche (Ersetzung von A durch A), einmal oder mehrfach angewandt, führt die betreffende Formel in eine der beiden Gestalten A → B, A → B über, und indem hierfür bezüglich A ∨ B
29
514
30
31
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
oder A & B gesetzt wird, hat man ein Folgezeichen entfernt. Auf diese Weise werden nach und nach alle Folgezeichen beseitigt. Wenn dies geschehen ist, so stehen die Negationsstriche nur noch über Primformeln, und die mehrfachen Negationen entfernt man dann wieder durch das Verfahren der Weglassung doppelter Negationsstriche. So gelangt man zu einer Figur, die aus Primformeln und aus | Negationen von Primformeln durch Konjunktionen und Disjunktionen aufgebaut ist. Bei der Ausführung der Ersetzungen sollen die Glieder der entstehenden Konjunktionen und Disjunktionen, sofern sie ihrerseits das Folgezeichen bezw. nach weiterer Ersetzung eines der Zeichen &, ∨ enthalten, durch Klammern zusammengefasst werden. Hiermit ist der erste Teil der logischen Umformung ausgeführt. Die weitere Umformung besteht darin, dass wir mit der Konjunktion und Disjunktion im Sinne des assoziativen und des distributiven Gesetzes verfahren, so wie es in der Algebra für Summe und Produkt gilt. Das heisst, wir lassen zunächst alle Klammern weg bis auf diejenigen, welche ein Disjunktionsglied mit einem darin vorkommenden &-Zeichen einschliessen. Und die übrigbleibenden Klammern beseitigen wir durch distributives Ausmultiplizieren, indem wir die Konjunktion als Summe, die Disjunktion als Produkt behandeln. Dabei wollen wir, um das Verfahren eindeutig zu machen, die Festsetzung treffen, dass im Falle mehrerer mit einander zu multiplizierender Klammern, die erste von ihnen zuerst aufgelöst wird, sodass wir z. B. für (A & B) ∨ (C & E) zuerst A ∨ (C & E) & B ∨ (C & E) und hierauf A∨C&A∨E&B∨C&B∨E setzen. — Die Figuren, die wir auf diese Weise erhalten, haben folgende Beschaffenheit: sie bestehen aus einer Konjunktion von Disjunktionen (Summe von Produkten), wobei die Glieder der Disjunktionen Primformeln oder Negationen von Primformeln sind. (Diese Erklärung ist so zu verstehen, dass auch „eingliedrige“ Konjunktionen und Disjunktionen mit inbegriffen sind. D. h. es kann | einerseits die ganze Figur aus einer einzigen Disjunktion bestehen, und andererseits kann ein Konjunktionsglied aus einer einzigen Primformel oder deren Negation bestehen.) Eine Figur von dieser Art nennen wir eine „Normalform“. Durch den beschriebenen Prozess der logischen Umformung wird jede Formel eindeutig in eine Normalform übergeführt, welche wir die „zu dieser Formel gehörige Normalform“, oder auch kurz „die Normalform dieser Formel“ nennen. Wir wollen uns diesen Prozess an dem Beispiel der Formel (A → B) → (A → C) → B → C deutlich machen. Diese Formel hat die Gestalt A → B, wo für A die Formel A → B und für B die Formel (A → C) → B → C zu setzen ist. Indem wir A → B
5
10
15
20
25
30
35
40
45
‘Grundlagen der Mathematik’ (1921/22)
5
515
durch A ∨ B ersetzen und entsprechend der Festsetzung Klammern einführen, erhalten wir: (A → B) ∨ (A → C) → B → C . Hier ist nun einerseits A → B durch A & B andererseits (A → C) → B → C
durch
(A → C) ∨ (B → C)
zu ersetzen, sodass sich die Figur
(A & B) ∨ (A → C) ∨ B → C
10
ergibt. Hierin haben wir wiederum A→C
durch
B→C
durch B ∨ C
A&C
und
15
20
zu ersetzen; ferner ist B zu ersetzen durch B. Somit erhalten wir die Figur (A & B) ∨ (A & C) ∨ (B ∨ C) . Hieraus entsteht durch Weglassen derjenigen Klammern, welche im Sinne des assoziativen Gesetzes (für Konjunktion und Disjunktion) überflüssig sind, die Figur (A & B) ∨ (A & C) ∨ B ∨ C. Und indem wir nun die noch vorhandenen Klammern ausmultiplizieren — mit der Auflösung der ersten Klammer beginnend —, erhalten wir zunächst: A ∨ (A & C) ∨ B ∨ C & B ∨ (A & C) ∨ B ∨ C und dann A ∨ A ∨ B ∨ C & A ∨ C ∨ B ∨ C & B ∨ A ∨ B ∨ C & B ∨ C ∨ B ∨ C.
25
30
35
Und hiermit sind wir bei der Normalform der vorgelegten Formel angelangt. Man erkennt auch leicht, dass sich für jede Normalform eine Formel angeben lässt, aus der sie durch die logische Umformung entsteht. Um zu einer gegebenen Normalform eine solche Formel zu erhalten, kann man folgendermassen verfahren: Zunächst schliesst man jede zwei- oder mehrgliedrige Disjunktion, hinter der noch das Zeichen & steht, in Klammern ein; sodann überstreicht man in jeder Disjunktion alle Glieder bis auf das letzte und ersetzt überall das Zeichen ∨ durch →. Hiernach überstreicht man das letzte Konjunktionsglied und ersetzt überall das Zeichen & durch →. Endlich überstreicht man dann noch die ganze Figur. Auf diese Weise entsteht eine Formel, aus welcher man durch die logische Umformung die gegebene Normalform zurückerhält. Dass dies sich so verhält, ersieht man daraus, dass durch die logische Umformung aus einer Formel A→B→C
32
516
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
die Figur A∨B∨C und aus einer Formel A→B→C
33
die Figur
5
A&B&C
34
entsteht. Natürlich gehören zu einer vorgelegten Normalform stets mehrere Formeln, aus denen sie durch die logische Umformung hervorgeht. Z. B. haben zwei Formeln A und A immer dieselbe Normalform. — Mit Hilfe des Begriffes der Normalform sind wir nun in der Lage, eine Eigenschaft aufzuweisen, welche die Formel 0 = 0 von den beweisbaren expliziten Formeln unterscheidet. Wir teilen die expliziten Formeln in „richtige“ und „falsche“ ein. Die expliziten Primformeln sind Gleichungen, auf deren beiden Seiten Zahlzeichen stehen. Eine solche Gleichung nennen wir richtig, wenn die beiderseits stehenden Zahlzeichen übereinstimmen; andernfalls nennen wir sie falsch. Eine Ungleichung, auf deren beiden Seiten Zahlzeichen stehen, nennen wir richtig, falls die beiden Zahlzeichen verschieden sind; sonst nennen wir sie falsch. In der Normalform einer beliebigen expliziten Formel haben alle Disjunktionsglieder die Gestalt von Gleichungen oder Ungleichungen, auf deren beiden Seiten Zahlzeichen stehen. Wir nennen nun eine allgemeine explizite Formel richtig, wenn in der zugehörigen Normalform jede als Konjunktionsglied auftretende (bezw. die ganze Normalform ausmachende) Disjunktion eine richtige Gleichung oder eine richtige Ungleichung als Glied enthält. Andernfalls nennen wir die Formel falsch. (Das Kriterium ist so gemeint, dass unter den Disjunktionen die eingliedrigen mit inbegriffen sind. Hieraus ergibt sich insbesondere, dass im Falle einer Gleichung oder Ungleichung die allgemeine | Definition von „richtig“ und „falsch“ mit der vorhergehenden speziellen übereinstimmt.) Nach der gegebenen Definition lässt sich die Frage, ob eine explizite Formel richtig oder falsch ist, in jedem Falle konkret entscheiden. Hier gilt also das „tertium non datur“. — Für andere als explizite Formeln geben wir keine Definition von „richtig“ und „falsch“. Die Eigenschaft der Falschheit (in dem definierten Sinne) ist es nun, durch welche sich die Formel 0 = 0 von den beweisbaren expliziten Formeln unterscheidet. Offenbar ist 0 = 0 eine falsche Formel. Um andererseits nachzuweisen, dass jede beweisbare explizite Formel richtig ist, brauchen wir nach dem früher Auseinandergesetzten nur zweierlei zu zeigen: erstens, dass jede durch Einsetzung aus einem Axiom entstehende explizite Formel richtig ist, zweitens, dass bei einem Schlusse, dessen Prämissen richtige (explizite) Formeln sind, auch die Endformel richtig ist. Die Ueberlegungen, durch welche dies nachgewiesen wird, will ich hier nicht im Einzelnen ausführen, sondern nur den Gedankengang angeben.
10
15
20
25
30
35
40
45
‘Grundlagen der Mathematik’ (1921/22)
517
Man beweist zunächst folgende beiden Sätze:
5
1)) Eine explizite Formel A → B ist dann und nur dann richtig, wenn eine der beiden Formeln A und B richtig ist. 2)) Eine explizite Formel A → B ist dann und nur dann richtig, wenn die Formeln A und B beide richtig sind. Diese Sätze ergeben sich daraus, dass gemäss dem Verfahren der logischen Umformung A → B durch
A∨B
A → B durch
A&B
und 10
zu ersetzen ist. Im Anschluss hieran zeigen wir nun:
35
3)) Eine explizite Formel A ist dann und nur dann richtig, wenn A falsch ist.
15
20
25
30
35
Diesen Satz beweisen wir durch eine anschauliche Induktion. Nämlich die Gültigkeit der Behauptung ist ersichtlich im Falle, wo die Formel kein Folgezeichen enthält (indem man berücksichtigt, dass bei der logischen Umformung doppelte Negationsstriche wegzulassen sind). Sei nun A eine beliebige explizite Formel mit mindestens einem Folgezeichen. Wir nehmen an, der Satz sei bereits für jede von den Formeln bewiesen, die in A als Vorderglied oder als Hinterglied eines Folgezeichens auftreten, und wollen zeigen, dass er dann auch für die ganze Formel A gilt. Da bei der logischen Umformung doppelte Negationen weggelassen werden, so brauchen wir für die Formel A nur die beiden Gestalten U → V und U → V zu betrachten, denen die Gestalten U → V und U → V der Formel A entsprechen, wo wiederum U → V bei der logischem Umformung durch U → V zu ersetzen ist. In beiden Fällen besagt die zu beweisende Behauptung: die Formel U → V ist dann und nur dann richtig, wenn U → V falsch ist. Die Gültigkeit dieser Behauptung ergibt sich nun folgendermassen: Nach dem Satz 2)) ist die Formel U → V dann und nur dann richtig, wenn die Formeln U und V beide richtig sind. Da wir ferner für die Formeln U und V (welche ja in der betrachteten Formel A als Vorderglied und Hinterglied eines Folgezeichens auftreten) die Behauptung des Satzes 3)) bereits als gültig annehmen, so ist U dann und nur dann richtig wenn U falsch ist, und V ist dann und nur dann richtig, wenn V falsch ist. Folglich ist U → V dann und nur dann richtig, wenn U und V beide falsch sind, d. h. wenn keine der beiden Formeln U und V richtig ist. Nach dem | Satz 1)) ist dies aber dann und nur dann der Fall, wenn U → V falsch ist.1) Aus dem hiermit bewiesenen Satz 3)) in Verbindung mit dem Satz 1)) ergibt sich nun, dass die Endformel eines Schlusses, dessen Prämissen richtige explizite Formeln sind, ebenfalls richtig ist. Denn sind S und S → T richtige 1)
Wir benutzen hier fortwährend die Tatsache, dass „richtig“ und „falsch“ nach unserer Definition kontradiktorisch entgegengesetzte Prädikate sind.
36
518
37
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
explizite Formeln, so muss nach Satz 3)) S falsch und andererseits, nach Satz 1)) eine der Formeln S und T richtig sein. Somit ist T eine richtige Formel. — Nun bleibt nur noch nachzuweisen, dass jede durch Einsetzung aus einem Axiom entstehende explizite Formel richtig ist. Für die Axiome 7) und 9), welche ja a = a und a + 1 = 0 lauten, ist diese Behauptung trivial. Das Axiom 10) kommt überhaupt nicht inbetracht, weil aus diesem Axiom, welches ja das Zeichen δ enthält, durch Einsetzung keine explizite Formel entstehen kann. Wir brauchen also die Begründung unserer Behauptung nur noch für die Axiome 1)–6) und 8) auszuführen. Was zunächst das Axiom 8), d. h. die Formel a = b → Aa → Ab betrifft,E so hat man hier bezüglich der Einsetzung zwei Fälle zu unterscheiden: entweder für a und für b werden verschiedene Zahlzeichen a, b eingesetzt, oder für beide Variable wird dasselbe Zahlzeichen eingesetzt. (Es müssen nämlich für a und b jedenfalls Zahlzeichen eingesetzt werden, weil sonst keine explizite Formel entsteht.) Im ersten Fall erhält man eine Formel von der Gestalt a=b→A welche gemäss dem Satz 1)) richtig ist, weil die Negation von a = b, d. h. die Ungleichung a = b eine richtige Formel ist. Im zweiten Falle entsteht aus Aa dieselbe Figur wie aus Ab; man erhält also eine Formel von der Gestalt A→B→B Nach dem Satz 1)) ist diese Formel richtig, sofern B → B eine richtige Formel ist, und B → B ist richtig, sofern eine der Formeln B und B richtig ist. Dies aber ergibt sich unmittelbar aus dem Satz 3)). Für die Axiome 1)–6) gestaltet sich der Nachweis am übersichtlichsten auf folgendem Wege: Man geht aus von folgenden leicht zu beweisenden Sätzen: 4)) Sind A und B die Normalformen zweier expliziten Formeln, von denen mindestens eine richtig ist, so ist jede Formel, deren Normalform aus der Figur A ∨ B durch distributives Ausmultiplizieren entsteht, eine richtige Formel. 5)) Sind A und B die Normalformen zweier richtiger expliziter Formeln, so ist jede Formel, deren Normalform A & B ist, eine richtige Formel. Aufgrund der Tatsache, dass (nach Satz 3)) ) von zwei expliziten Formeln A und A wenigstens eine richtig ist, können wir nun aus den beiden ausgesprochenen Sätzen 4)) und 5)) folgende Konsequenz entnehmen: Hilbert has added in the right-hand margin: Denn alle Reduktion geht von innen! E
5
10
15
20
25
30
35
40
‘Grundlagen der Mathematik’ (1921/22)
5
10
519
6)) Wenn die Normalform einer Formel die Eigenschaft hat, dass in jeder als Konjunktionsglied auftretenden (bezw. die ganze Normalform ausmachenden) Disjunktion zwei Glieder vorkommen, von denen eines die Negation des anderen ist, so ist jede aus der betreffenden Formel durch Einsetzung entstehende explizite Formel eine richtige Formel. Gemäss diesem Satze brauchen wir nur noch zu prüfen, ob die Normalformen der Axiome 1)–6) die in dem Satz 6)) erwähnte Eigen|schaft besitzen. Dies ist in der Tat der Fall; nämlich die Axiome 1)–6) haben bezüglich folgende Normalformen: A ∨ B ∨ A, A ∨ A ∨ B & A ∨ A ∨ B & B ∨ A ∨ B, A ∨ B ∨ A ∨ C & B ∨ B ∨ A ∨ C & C ∨ B ∨ A ∨ C, B ∨ A ∨ A ∨ C & B ∨ B ∨ A ∨ C & C ∨ A ∨ A ∨ C & C ∨ B ∨ A ∨ C, A ∨ A ∨ B,
15
20
A ∨ A ∨ B & A ∨ B ∨ B & B ∨ A ∨ B & B ∨ B ∨ B. — Hiermit ist der Nachweis der Widerspruchsfreiheit für die Axiome 1)–10) zum Abschluss gebracht. Wir haben diesen Beweis so angelegt, dass wir ihn bei den Erweiterungen unseres Formalismus, die wir nunmehr anbringen müssen, seinem Gedankengange nach ungeändert übernehmen und, mit einigen Ergänzungen versehen, zum Nachweis der Widerspruchsfreiheit des erweiterten Axiomensystems verwerten können.
38
520
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Ergänzung 19
1
1): Es ist unmöglich durch einen an einem Gase ausgeführten quasistatischen Kreisprozess Wärme restlos in Arbeit umzusetzen. D. h.: Wenn I und II die Teile des Kreisprozesses bezeichnen, für welche dQ dQ bezüglich dt > 0 und dt ≤ 0 ist, so ist stets I dQ > I+II pdV . In der Tat ist nach dem Energiesatz dH Ende dV ϑ −p dt = dE = E Anfang = 0, dt dt I+II I+II also dH dt = dQ = ϑ pdV. dt I+II I+II I+II Die Behauptung ist also gleichbedeutend mit dQ > dQ, d. h. dQ < 0. I
I+II
5
10
II
Nach dem Entropiesatz ist aber dQ dQ + = 0; ϑ I II ϑ
2
dQ da nach Voraussetzung Wärme zugeführt wird, so ist I ϑ > 0 (nicht = 0), dQ daher ist II ϑ < 0, also auch II dQ < 0 (nicht = 0), wie behauptet. Es gibt keinen quasistatischen Kreisprozess eines Gases, der keine andere Veränderung bewirkt als Gewinnung mechanischer Arbeit (die von seiten des Gases geleistet wird) und Entnahme von Wärme aus einem oder mehreren Reservoiren. Beweis: Es bedeute I den Teil des Kreisprozesses, bei welchem die WärmeEntnahme stattfindet und II den übrigen Teil. Dann ist nach der Annah dQ dQ me: II ϑ = 0, I ϑ > 0, also würde entgegen dem zweiten Hauptsatz dQ > 0 sein. I+II ϑ Wenn bei einem quasistatischen Kreisprozess eines Gases Wärme von einem kälteren in ein wärmeres Reservoir übergeht, sonst aber keine thermische Veränderung stattfindet, so muss bei dem Kreisprozess mechanische Arbeit an dem Gase geleistet werden. Beweis: Der Kreisprozess besteht aus drei Teilen: I: Wärmeaufnahme aus einem Reservoir der Temperatur ϑ1 ; hierbei ist dQ >0 dt II: Wärmeabgabe an ein Reservoir der Temperatur ϑ2 > ϑ1 ; hierbei ist dQ <0 dt dQ III: der übrige Teil des Prozesses. III ϑ = III dQ = 0. 19 The
following text written by Bernays is found on the two sheets attached to the inside front cover; see: Description of the Text. There is no indication to which part of the lecture it should be added, although it fits well with the discussion on p. 44 (see above, p. 458, n. 9).
15
20
25
30
‘Grundlagen der Mathematik’ (1921/22)
521
dQ dQ Nach dem zweiten Hauptsatz ist 20 | I+II+III ϑ = 0, also I+II ϑ = 0, d. h. dQ dQ 1 1 dt + dt = 0. ϑ1 I dt ϑ2 II dt Also (weil auf I: dt > 0 und ϑ1 > ϑ1 ) 1 2 1 dQ dQ 1 dt + dt < 0, ϑ2 I dt ϑ2 II dt dQ
5
folglich, da ϑ1 > 0: 2
dQ < 0, I+II
dQ < 0. I+II+III
Nach dem Energiesatz ist daher pdV < 0, I+II+III 10
d. h. es wird bei dem Kreisprozess Arbeit an dem Gas geleistet. — Bei Kreisprozessen mit mehreren Gasen gelten dieselben Sätze, weil für jedes System von einigen dieser Gase, die bei einem Teil des Prozesses mit einander in Berührung stehen: dHν dQν dH dQ = ϑ· = ϑ· = dt dt dt dt ν ν
15
und
dEν dE = dt dt ν
ist.
20 Bernays
has inserted here: ‘nächstes Blatt’.
3
522
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Textual Notes Hilbert’s additions to the original typescript were mostly made in pencil; those written in ink are explicitly noted as such. 434.7: 435.24: 436.11: 437.28: 438.7: 438.20: 438.45: 439.21: 439.42: 440.28–29: 440.36: 441.5: 441.13: 441.13: 441.14: 441.15: 441.19–20: 441.21–33: 441.27: 441.35: 441.36–39: 441.37: 443.17: 443.20: 444.14: 446.32: 447.19: 447.29:
447.35: 447.35: 447.36: 447.38: 448.1–2: 448.35:
Und] In the left-hand margin, Hilbert has placed:
unter.] In the left-hand margin, Hilbert has placed: ⊥ „Logik-Kalkül“, Winter 1920, S.] „Logikkalkül“ Winter 1920 S. (Z → X) → (Z → Y ) ] (Z → X) → (Z → Y ) Widerspruchsfreiheit] ‘freiheit’ has been substituted by Bernays for ‘losigkeit’ Widerspruchsfreiheit] ‘freih’ has been substituted by Hilbert for ‘losigk’ Y] X die] Die X &Y] X &X „Prinzipien der Mathematik“, W. S. 1917/18, S.] „Prinzipien der Mathematik“ W. S. 1917/18 S. Stetigkeitsaxiome] Stetigkeitsaxiom Mathematik“, S. 19–23.] Below ‘Mathematik“, S. 19–23’ Hilbert has added ‘Vorles. W. S. 1917/18’. Angenommen,] In the left-hand margin, Hilbert has placed: There is no corresponding ⊥. und Ebenen,] Enclosed in parentheses by Hilbert. des Raumes] Enclosed in parentheses by Hilbert. oder Ebenen] Enclosed in parentheses by Hilbert. und . . . liegen.] Enclosed in parentheses by Hilbert. Wir . . . geben.] Enclosed in parentheses by Hilbert. ausser dem] ausserdem eine alte Ebene mit] Enclosed in parentheses by Hilbert. In addition, Hilbert has changed the following ‘einem’ into ‘einen’. neuen . . . E und G] Diagram added by Hilbert in the margin. in der Ebene] Enclosed in parentheses by Hilbert. 41–48] Added by the Editors. Rechenoperationen] Reihenoperationen Hauptfrage] Hauptfragen Andererseits] Anderseits eines] eines nicht-Euklidische] Throughout pp. 24–26, the typescript originally used the adjective ‘Nicht-Euklidisch’ with capital ‘N’. Bernays has changed this to ‘nicht-Euklidisch’ in all but three cases. These have likewise been changed by the Editors, and are noted below. „Prinzipien der] Above ‘„Prinzipien der’, Hilbert has interlineated: Vorles. W. S. 1917/18 Mathematik“, S.] Mathematik“ S. nicht-Euklidischen] Nicht-Euklidischen nicht-Euklidischen] Nicht-Euklidischen nicht-Euklidische] Nicht-Euklidische in] In
Textual Notes
523
vgl. „Prinzipien] Above ‘vgl. „Prinzipien’, Hilbert has interlineated: Vorles. W. S. 1917/18 450.29–30: Mathematik“, S.] Mathematik“ S. 450.41: halber] gleicher 453.29: festlegen] Substituted by Bernays for: ausdrücken 455.25: zunächst als Identität] Substituted by Bernays for: dann 455.33: (A)] Space was left here for a sign designating the axiom. The Editors have inserted ‘(A)’, since this is subsequently used to refer to this axiom. 457.3: zusätzlichen] Substituted by Bernays for: speziellen 458.9: Entropie] Entopie 458.9: Entropie] Entopie const] const The whole equation is underscored with a typed line. 460.21: 461.10: .)] ). 461.25: aus dem Wienschen Verschiebungsgesetz] Deleted by an unknown hand. 462.27: Tatsächlich] In the left-hand margin, Hilbert has placed:
462.30: Axiome (ich] Axiome. (Ich 462.33: Meinung] Meinung↑, dass die Sätze der Arithmetik absolut sicher sind, da sie auf Grund von Definitionen durch untrügliche Schlüsse bewiesen werden,↓ This sentence was moved here by Hilbert from the first paragraph of this chapter. 462.41: Wichtigkeit.] In the left-hand margin, Hilbert has placed: ⊥ S. 65– 66 463.7: die Zahlentheorie] Hilbert has placed ‘ ’ in the left-hand margin and inserted ‘Wir wollen’ before ‘die Zahlentheorie’. 463.9–10: Der . . . ergeben.] Enclosed in parentheses by Hilbert. 463.15: der Zeichen „1“ und „+“] [[der Zeichen „1“ und „+“]]--↑des Zeichens „1“ ↓ From here to p. 60, Hilbert replaces figures of the form 1+· · ·+1 by 1 . . . 1 463.16: eine] ↑eine↓ Added by Hilbert. 463.26: deutschen] [[gotischen]]--↑deutschen↓ Substituted by Hilbert. 464.5: übrigens] [[hierbei]]--↑übrigens↓ Substituted by Hilbert. 464.19: dafür] Added by Hilbert in the left-hand margin: also wenn b über a hinausragt! 465.33–466.7: Seien . . . erkannt.] Enclosed in parentheses by Hilbert. 466.24–29: Seien . . . von b.] Added by Hilbert in the left-hand margin: ohne „es giebt“! 466.37–467.16:Aus . . . Division.] Enclosed in parentheses by Hilbert and encapsulated in the following sentence, written at top of the page: Auf Grund dieser Betrachtung folgt die Möglichkeit der Division mit Rest. 468.35: Auch] Hilbert has placed ‘ ’ in the left-hand margin, and written ‘S. 66’ below this. 468.35–470.6: Auch . . . beantwortet.] Enclosed in parentheses by Hilbert. 469.6–10: Um . . . stattfindet.] Hilbert has drawn a vertical line in the margin. 470.8: und] In the left-hand margin, Hilbert has placed:
471.11: zukommt] zukommen 471.23: angewandt.] Added by Hilbert in the left-hand margin: Vgl. Vorles. Grundlagen der Math. II W. S. 1922/23. S. 30 471.26: ist.] Hilbert has written in the left-hand margin: bis hierher. ⊥ 450.26:
524
Chapter 3
471n: 471n: 471n: 471n: 471n: 471n: 472.1: 472.22: 476.29: 478.34: 481.17: 484.15: 487.14: 488n: 490.12: 490.36: 490.40–41: 491.4: 491.4: 491.8–9: 491.10: 491.17–18: 491.19: 491.33–36:
491.41: 492.22: 493.21: 493.22: 493.22–23: 493.29: 493.34: 493.34–37: 494.8: 494.8: 494.21:
Lectures on Proof Theory (1921/22 – 1923/24)
a1 , a2 , a3 . . . (a > 0)] ↑a1 , a2 , a3 . . . (a > 0)↓ Added by Hilbert. d. h.] [[Beweis:]]--↑d. h.↓ Substituted by Hilbert. giebt es ein m, so dass alle an < m oder] ↑giebt es ein m, so dass alle an < m oder↓ Added by Hilbert. an > m.] an > m oder Satz] [[Tertium non datur]]--↑Satz↓ Substituted by Hilbert. transfiniten] ↑transfiniten↓ Added by Hilbert. B. Versuche . . . Logik.] Added by Bernays in the left-hand margin. Russellschen] Russelschen Jmp] Imp (EP ), (ER)] ( P ), ( R) gleichgesetzt.)] gleichgesetzt.
≤(P, Q) ] ≤(P, Q) B(x) ] B(x) Auditorium] Aud. und in wieweit] ↑und in wieweit↓ Added by Hilbert. Zahlentheorie] Zahlengeometrie Mathematik . . . Zahlentheorie] Next to these lines, Hilbert has placed in the left-hand margin:
die] Added by the Editors. Aussagen] Aussage d. h. . . . Behandlung] ↑d. h. dieser Uebergang von der naiven zur formalen Behandlung↓ Added by Hilbert. fortgesetzt] [[angewandt]]--↑fortgesetzt↓ Substituted by Hilbert. , ganz . . . folgend,] ↑, ganz u. gar dem bisherigen Entwickelungsgang folgend,↓ Added by Hilbert. in der Tat] [[eben, wie ich schon sagte]]--↑in der Tat↓ Substituted by Hilbert. Es . . . vollzogen.] ↑Es wird also damit einerseits für die Axiome selbst, die doch auch ursprünglich naiv gemeint waren, wie für den Logikkalkül der Uebergang von naiver zu formaler Behandlung vollzogen.↓ Added by Hilbert. konkrete] Written in unknown hand above ‘korrekte’, which appears in the original; such a substitution would certainly be appropriate. (Hilbert „Axiomatisches Denken“.)] In the left-hand margin, and repeated after the word ‘kritisiert’, Hilbert has placed: ⊥ hat.] S. 3 Axiome 1–10 Added by Hilbert in the right-hand margin. +1] ↑besser ↓ Interlineated by Hilbert above +1. „Funktionale“] [[„Funktionale“]]--↑Terme↓ Substituted by Hilbert. das Funktional] [[das Funktional]]--↑den Term↓ Substituted by Hilbert. Zahlzeichen] [[Zahlzeichen]]--↑Ziffern↓ Substituted by Hilbert. Diese . . . bietet.] Crossed out, presumably by Hilbert. 1 + 1] ↑0 ↓ Interlineated by Hilbert above ‘1 + 1’. a + 1] ↑a ↓ Interlineated by Hilbert above ‘a + 1’. A → B → C] Hilbert has added in the right-hand margin: Allgemeine Regel dass, wenn Strich darüber steht, die Klammern stets weggelassen wird sic.
Textual Notes
525
zur . . . Funktionalen] ↑für Terme↓ Interlineated by Hilbert above ‘zur Mitteilung’. 496.21: Aa → Ab] Here, as with many of the subsequent formulas, Hilbert has added parentheses that are strictly superfluous. The original text is presented here. 496.26: Beweisbarkeit] Hilbert has written above ‘Beweisbarkeit’: bis S. 18 incl. 496.27: Widerspruchsfreiheit.] Hilbert has written above ‘Widerspruchsfreiheit’: S. 19–Ende 497.0: „wenn . . . C“.] Hilbert has underlined this twice and has added three exclamation marks to the right. 498.33–499.16:Um . . . ist. —] Enclosed in parentheses by Hilbert. 499.13: als] (als 501.5–6: indem . . . die] Changed by Hilbert to: indem man für A die Gleichung a = b und für B die 501.7: Axiome 7) und 8)] On this and the following page, Hilbert has replaced the numbers ‘7’ and ‘8’ in axioms 7) and 8) by ‘13’ and ‘14’, respectively. This renumbering results from the addition of the axioms for & and ∨ to the axioms of the system considered originally. 501.7: implizite] Enclosed in parentheses by Hilbert. 501.22–23: Und . . . B] Added by Hilbert. 501.28–29: Setzt . . . ein,] ↑a = b → (A(a) → A(b)) A(d): d = c↓ Added by Hilbert in the right-hand margin. 504.36: Variablen] Variabeln 505.13: b + 1] [[b + 1]]--↑2↓ Substituted by Hilbert (ink). 505.13–14: „nicht . . . b + 1“] Hilbert has replaced this by: „nicht jedes a ist gleich 2“ 505.16: b + 1] [[b + 1]]--↑2↓ Substituted by Hilbert. 505.17–18: „für . . . ungleich b+1.“] Hilbert has enclosed this phrase in parentheses and written in the right-hand margin: Für jedes a ist a = 2 nicht gültig 506.44: der „motivierenden Formel “] Hilbert has added in the margin: des Kömmlings 507.4–7: oder . . . Schlusses.] Hilbert has changed the order of the modified clauses to obtain the following characterization of ‘Formel in einem Beweis’: entweder sie ist ein Axiom oder geht aus einem Axiom durch Einsetzungen hervor, oder sie ist Endformel eines Schlusses, oder sie stimmt mit (mindestens) einer Endformel eines vorhergehenden Schlusses überein oder entsteht aus ihr durch Einsetzungen. 507.10: „motivierende Formel“] Hilbert has interlineated above ‘motivierende’: Kömmling 509.37: Beweises.] In the right-hand margin, Hilbert has placed: ⊥ 510.3: folgenden] folgendes 511.2: Funktionale] [[Funktionale]]--↑Terme↓ Substituted by Hilbert. 511.2: eines Zahlzeichens] [[eines Zahlzeichens]]--↑einer Ziffer↓ Substituted by Hilbert. 511.3: Da] In the right-hand margin, Hilbert has placed:
511n: Widerspruchsfreiheits] Wf. 511n: der] d. 511n: hervor.] hervor.) 496.12:
526
Chapter 3
511n: 511n: 511n: 511n: 511n: 512.2: 512.12: 512.12–16: 512.34: 512.35: 515.30: 518.4: 518.9: 518.27–28: 518.37: 518.37: 520.2: 521.11–17:
Lectures on Proof Theory (1921/22 – 1923/24)
Widerspruchsfreiheits] Wf. der] d. der] d. 9] [[9]]--↑15↓ Substituted by Hilbert. Wohl . . . ist.] Bernays has shifted these lines to the right and put a vertical line in the left-hand margin. heraus.] In the right-hand margin, Hilbert has placed: ⊥ 9] [[9]]--↑15↓ Substituted by Hilbert. so . . . hervorgeht.] Hilbert has underlined this phrase and written in the left-hand margin: nicht richtig and Ein-schaltung explizite] Above ‘explizite’, Hilbert has interlineated: numerische explizite] Above ‘explizite’, Hilbert has interlineated: numerische &] Added by the Editors. Nun] In the right-hand margin, Hilbert has placed:
δ] Added by the Editors. Formel ist . . . B und B] In the right-hand margin, Hilbert has placed: ⊥ A] Added by the Editors. B] Added by the Editors. quasistatischen] Deleted by Hilbert. Bei . . . ist.] Enclosed in parentheses by Hilbert.
Description of the Text
527
Description of the Text Collection: Georg-August Universität Göttingen, Mathematisches Institut, Inv. Nr. 16205j. Size: Cover size 21.8 × 27.6 cm; page size 21.5 × 27.0 cm. Cover Annotations: The notation ‘Gruudlage // der // Mathe- // matik // W.S. // 1921–22’ is in gold lettering across (not down) the spine. The second ‘u’ is clearly the binder’s mistake; the ‘e’ at the end of ‘Gruudlage’ is half obscured, which suggests that the missing ‘n’ might well have been cut off in the binding process. In the left-hand top corner of the inside front cover is written ‘96’ in pencil. The inside back cover has the number 16205j written in the top right-hand corner in black ink. Composition: 11 signatures, consisting of 15 to 20 pages each. Two sheets (14.0 × 22.0 cm) are pasted to the inside front cover showing four writing sides, of which three (numbered from 1 to 3) have been used. Another sheet of paper (16.5 × 21.0 cm) is pasted to the front end-page. Pagination: The front end-page and the title page are unnumbered. The Inhaltsverzeichnis comprises four pages, numbered from I to IV in the top right-hand corner. The text itself consists of three parts, which are numbered respectively 1– 100, 1a–9a, and 1–14, 14a (the ‘a’ is added in black ink), 15–38. One unnumbered page (15.7 × 20.8 cm) was inserted between pp. 25 and 26. Original Title: On the unnumbered title page is typed: ‘Grundlagen der Mathematik // Vorlesung // von // Prof. Hilbert. // W.S. 1921/22 // Ausgearbeitet von P. Bernays. // Figuren von W. Rosemann.’ Text: The main text is a hectographic reproduction in purple ink, while the third numbered part appears to be a carbon copy in black ink. Formulas are filled in using black ink, which is also used for many of the corrections in Hilbert’s hand. Further remarks and corrections are made in pencil, also in Hilbert’s hand. The fact that some parts of the marginal comments (usually just a letter or two, occasionally a whole word) have been cut off suggests that Hilbert made these comments and additions before the document was bound in its present form. Figures were drawn in black ink on separate paper and pasted into the text. There is some additional pencilled labelling of the figures in Hilbert’s hand. On some occasions, extensive comments have been written in pencil on the reverse of the previous page (e. g., remarks to pp. 22 and 69 are written on the reverse of pp. 21 and 68 respectively). The comments on p. 68 include a reference to the lecture course ‘Grundlagen der Math. II W.S. 1922/23’. Three of the four writing sides attached to the inside front cover are in Bernays’s hand in black ink; they discuss the validity of the Second Law of Thermodynamics in the limited case of certain kinds of cyclical processes, here involving so-called heat pumps. Presumably they were meant to be added to the lecture text, but there is no indication of the intended location. For this reason, the notes have been reproduced at the end of the main text on p. 520. However, the addition would fit well with the discussion on p. 44 of the manuscript (p. 458 above). The paper pasted onto the front end-page carries text in Hilbert’s hand in black ink. This has been placed in author’s footnotes to pp. 2, 7 of the third part of the text, pp. 494 and 497 respectively; they are specifically directed by Hilbert to these places. The unnumbered sheet in Bernays’s hand found between pp. 25 and 26 of the manuscript is marked in Hilbert’s hand ‘Vor S. 26’. The text is found in an author’s footnote to p. 25 of the manuscript; see p. 511.
528
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Logische Grundlagen der Mathematik (1922/23)
1
2
I. Abschnitt. Problemstellung und Vorbereitungen. Die Mathematik erfreut sich in dem weiteren Kreise des Publikums im allgemeinen keiner Beliebtheit und es gibt viele Widersacher, die ihr am Zeuge flicken. Aber diesen stehen einerseits doch andere gegenüber, die die Mathematik in den Himmel erheben, und dann sind diese Widersacher meist ohne tieferes Verständnis und ohne Sachkunde, sodass sie nicht ernst zu nehmen sind. Wir wollen uns mit diesen hier nicht beschäftigen. Aber es gibt auch Widersacher unter den Mathematikern selbst: zwar behaupten diese nicht, die Mathematik als solche anzugreifen, aber sie rütteln an ihren Methoden und Grundlagen und verfehmen so wichtige und fundamentale Begriffe, dass, wenn diese Angriffe siegreich sein würden, doch die Mathematik zerstückelt und verstümmelt würde und ein Teil ihrer wertvollsten Schätze und ihrer fruchbarsten Methoden veloren ginge. Hier heisst es nun, die Mathematik zu verteidigen, ihre Grundlagen so zu befestigen, dass ihr alter Ruf der Zuverlässigkeit wiederhergestellt und über allen Zweifel gesetzt wird, nicht nur zu ihrem eigenen Heile, sondern auch, damit sie aller Wissenschaft überhaupt als Vorbild und der Philosophie und allen erkenntnistheoretischen Untersuchungen als Anfang und Grundlage diene. Die Methode zu einer solchen sicheren Begründung der Mathematik Ihnen vorzuführen, soll der Zweck dieser Vorlesung sein. Wir müssen zunächst darauf aufmerksam werden und in der Tat einsehen, dass gewisse Einwendungen gegen manche Schlussweisen in der Mathematik berechtigt sein können. Schon von der früheren Jugend her erinnern wir uns eines gewissen Gefühls des Staunens und der Ueberraschung, als wir von den negativen und imaginären Zahlen erfuhren und mit ihnen so ganz dreist rechnen durften. Diese Zahlen schienen uns mit einem gewissen Zauber umkleidet, und wir waren erfreut, dass alles so gut stimmte. Nun, etwaige Zweifel bez. des Gebrauchs dieser negativen und imaginären Zahlen sind längst völlig und auf leichte Weise beseitigt. Kronecker, einer der heftigsten Angreifer unter den grossen Mathematikern, hat hier selbst das Verfahren angegeben, das alle Bedenken beseitigt. Dieses besteht darin, dass man eine Variable einführt und anstelle
5
10
15
20
25
30
35
‘Logische Grundlagen der Mathematik’ (1922/23)
5
10
15
20
25
30
35
40
529
der Zahlen nur ganze rationale Funktionen dieser Variablen mit ganzzahligen Koeffizienten nimmt, ferner anstelle der Zahlengleichheit die Kongruenz der Funktionen nach dem Modul x + 1 (im Falle der negativen Zahlen), bezw. x2 + 1 (im Falle der imaginären Zahlen) betrachtet. Indem Kronecker dieses Verfahren auf beliebige andre Moduln ausdehnte, entstand die sehr schöne und weittragende Modultheorie. Von den Fragen, die zu Bedenken Anlass boten, blieben so schliesslich nur noch die über das Unendliche übrig. Da sind erstens die Schwierigkeiten, welche die Begründung der Infinitesimalrechnung verursachte. Die Freude an dem Rechnen mit unendlich kleinen Grössen führte zu unvorsichtiger und fehlerhafter Handhabung des Kalküls, sodass sich falsche einander widerstreitende Resultate ergaben. Hier hat die kritische Periode, vor allem durch die Untersuchungen von Bolzano, Cauchy und Weierstrass, Abhilfe geschaffen, und zwar in einer Weise, dass heute jedermann die innere Bedeutung des Rechnens mit Differentialen einsehen und demgemäss den Kalkül sicher handhaben kann. Anders verhält es sich mit den weiteren Schwierigkeiten, die sich in der Theorie der Irrationalzahlen und der Mengenlehre finden. Hier liegen in der Tat Paradoxien vor, und wenn auch die axiomatische Methode wohl einen Weg angibt, um diese zu vermeiden, so sind doch die prinzipiellen Fragen nicht in demselben Sinne wie bei der Infinitesimalrechnung innerlich klargestellt. Es ist hier überhaupt die Art, wie man die Logik anwendet, bedenklich, und es scheint die Schwierigkeit garnicht einmal von rein und spezifisch mathematischer Natur. Die Angreifer, allen voran Kronecker, scheinen nun hier mit Erfolg die Grundfesten der Wissenschaften zu erschüttern. Sie machen einen Einbruch in den Besitzstand der Wissenschaft, amputieren die bisher am meisten gebrauchten Gliedmassen und ersetzen sie durch künstliche. Ich möchte, dass wieder die alten, natürlichen Gliedmassen funktionieren. Daher gilt es, jene Angriffe zu parieren. Welches sind nun die Paradoxien, auf die sich die Angriffe stützen? Es gibt deren eine ganze Anzahl, die jedoch alle auf zwei typische Formen des Widerspruches hinauskommen. Von jedem der beiden Typen will ich ein Beispiel angeben. I. Es ist die fundamentale Einsicht der Mengenlehre, dass der gewöhnliche Anzahlbegriff sich auf unendliche Gesamtheiten (Mengen) ausdehnen lässt, indem man zwei Megen dieselbe Cardinalzahl zuschreibt, wenn sich die Elemente der einen Menge denen der andern Menge umkehrbar eindeutig zuordnen lassen. Wir nennen zwei solchen Mengen M , N gleichzahlig und schreiben symbolisch M ∼ N . Ferner sagen wir, dass die Cardinalzahl von M kleiner ist als die von N , wenn M mit ei|ner Teilmenge von N , aber nicht mit N selbst gleichzahlig ist. Symbolisch schreiben wir dafür M < N . Aus dieser Definition von M < N geht unmittelbar hervor, dass die Beziehungen M ∼N
und
M
3
4
530
5
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
nicht zusammen bestehen können. Man beweist ferner, dass auch die Beziehungen M < N und N < M mit einander unverträglich sind. Ausserdem gilt der Satz, dass es zu jeder Menge M eine Menge N von grösserer Cardinalzahl gibt, sodass also M < N ist. (Unter Mengen brauchen wir hier nur Gesamtheiten von mathematischen Dingen zu verstehen, und ebenso ist nur von den Cardinalzahlen solcher Mengen die Rede.) Denken wir uns nun jeder Cardinalzahl eine von den Mengen, welchen diese Cardinalzahl zukommt, als Repräsentant zugeordnet und vereingen wir alle diese Repräsentanten-Mengen zu einer Menge V , die also aus den Dingen besteht, welche mindestens einer der Repräsentanten-Mengen angehören. Dann muss die Cardinalzahl, welche der Menge V zukommt mit der Cardinalzahl einer von den Repräsentanten-Mengen, die R heisse, übereinstimmen, d. h. es ist V ∼ R. Nun gibt es nach dem erwähnten Satze zu R eine Menge von grösserer Cardinalzahl und somit auch unter den Repräsentanten-Mengen eine solche Menge S, deren Cardinalzahl grösser ist als die von R, sodass R < S ist. Da anderseits die Menge S eine Repräsentanten-Menge und daher eine Teilmenge von V ist, so muss sie wegen der Gleichzahligkeit von V und R einer Teilmenge von R gleich|zahlig sein, d. h. es ist entweder S ∼ R oder S < R. Beides steht aber im Widerspruch mit R < S, was doch direkt aus der Bestimmung von S folgte. Diesen Widerspruch können wir dadurch lösen, dass wir die Vorstellung der abgeschlossen vorliegenden Gesamtheiten aller Cardinalzahlen als fehlerhaft ablehnen. Damit wird uns aber auch die Auffassung der Zahlenreihe als eines fertig bestehenden mathematischen Gebildes problematisch. Und jedenfalls werden wir nach der unangenehmen Ueberraschung, die der entdeckte Widerspruch uns gebracht hat, die Sicherung des mathematischen Denkens nicht auf dem Wege suchen, dass wir von den höchsten Allgemeinheiten ausgehen; vielmehr wird uns an diesem Beispiel klar, dass wir eine Gewähr für die Sicherheit des Schliessens nur gewinnen können, wenn wir uns an das konkret Vorstellbare halten. Die Ueberlegungen, durch welche die Grundlegung der Mathematik geschehen soll, müssen sich im Rahmen der „finiten Logik“ vollziehen, d. h. die logischen Denkformen dürfen nur auf fassbare und überblickbare Gegenstände angewandt werden, so wie wir sie ja auch im gewöhnlichen Denken nur gebrauchen. Wir kommen nun zu der zweiten typischen Form der Paradoxie. II. Wir betrachten die unendlichen Zahlenfolgen, welche allein aus der Zahlen 0 und 1 gebildet und durch ein mathematisches Gesetz definiert sind. Ein solches Gesetz muss sich in deutscher Sprache mitteilen und daher auch aufschreiben lassen. Nun können wir die Schriftsätze, die sich überhaupt aus den Zeichen der deutschen Schrift zusammensetzen lassen, numerieren.
5
10
15
20
25
30
35
40
45
‘Logische Grundlagen der Mathematik’ (1922/23)
5
10
15
20
25
30
35
40
45
531
Dies geschieht so: Wir ordnen zunächst die Schriftzeichen folgendermassen: zuerst kommen die kleinen Buchstaben in alpha|betischer Reihenfolge, danach die grossen Buchstaben, ebenfalls alphabetisch geordnet und zuletzt die Interpunktionen: Punkt, Komma, Semikolon, Doppelpunkt, Bindestrich und noch ein Zeichen zur Trennung der Wörter. Dies sind im ganzen jedenfalls weniger als hundert Zeichen. Hierauf ordnen wir die aus diesen Zeichen bestehenden Schriftsätze zunächst nach der Anzahl der in ihnen vorkommenden Zeichen, wobei wir wiederholt auftretende Zeichen mehrfach zählen; und die Schriftsätze mit einer und derselben Anzahl von Zeichen ordnen wir lexikographisch, unter Zugrundelegung der angegebenen Reihenfolge der Zeichen. Aus der so erhaltenen Numerierung der Schriftsätze können wir ferner eine Numerierung der betrachteten Zahlenfolgen gewinnen. Nämlich wir ordnen jeder der Zahlfolgen (die ja jede durch ein in deutscher Sprache mitteilbares Gesetz definierbar sein soll) eine bestimmte Definition zu, für deren Schreibweise auch eine bestimmte Orthographie und Interpunktion festgesetzt sei. Zu jeder der Zahlenfolgen gehört dann ein ganz bestimmter Schriftsatz, und die Nummer dieses Schriftsatzes können wir nun der Zahlenfolge beilegen. Auf diese Weise sind zwar die Zahlenfolgen noch nicht im üblichen Sinne numeriert, weil nicht jede Zahl als Nummer einer Zahlfolge auftritt. Aber wir gelangen sofort zu einer gewöhnlichen Numerierung, indem wir für eine jede der Zahlenfolgen als neue Nummer die um eins vermehrte Anzahl derjenigen Zahlenfolgen nehmen, welche bei der vorläufigen Numerierung eine kleinere Nummer haben als die betreffende Zahlenfolge. Die so gewonnene Numerierung der Zahlenfolgen ist nach einem mitteilbaren mathematischen Gesetz erfolgt, und wir können das Gesetz dieser Numerierung nun wiederum zur Definition von Zahlenfolgen verwenden. Eine Definition dieser Art ist insbesondere die folgende: Die n-te Zahl der Zahlenfolge sei 0 oder 1, je nachdem in der Zahlenfolge mit der Nummer n die n-te Zahl 1 oder 0 ist. Diese Definition führt nun aber sofort auf einen Widerspruch. Denn einerseits müsste die so bestimmte Zahlenfolge, da sie ja durch ein mitteilbares mathematisches Gesetz definiert ist, also zu den betrachteten Zahlenfolge gehört, in der Reihe der numerierten Zahlenfolgen vorkommen; andererseits besagt aber die Definition, dass die Zahlenfolge sich von jeder der numerierten Zahlenfolgen um wenigstens eine Zahl unterscheidet. — Wenn wir nach der Auflösung dieses Widerspruches suchen, so werden wir vor allem gewahr, dass der Begriff eines in deutscher Sprache mitteilbaren mathematischen Gesetzes sehr vage ist. Wir sehen uns also zu der Aufgabe gedrängt, die Ausdrucksmittel der Sprache zu verschärfen. — So weisen uns die beiden Paradoxien zwei Richtungen, nach denen wir das Problem der strengen Begründung der Mathematik in Angriff zu nehmen haben: Einhaltung des Standpunktes der finiten Logik und Präzisierung der Sprache. Was nun zunächst die finite Logik betrifft, so kommt es zuerst darauf an, uns diese begrenzte Art des Schliessens und die zugehörige primitiv-
6
7
532
8
9
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
anschauliche Einstellung an demjenigen Teile der Mathematik klar zu machen, der sich direkt und ohne wesentliche Aenderung der üblichen Darstellung nach dieser Methode behandeln lässt, nämlich an der elementaren Zahlentheorie. Anschauliche Behandlung der Zahlentheorie sowie die genauere Darlegung des Unterschiedes zwischen der finiten Logik und der transfiniten Schlussweise siehe in der Vorlesung „Grundlagen der Mathematik“, W.S. 1921/22, S. 52– 69. Die transfiniten Schlussweisen werden in der Analysis fortwährend und zwar wesentlich benutzt. Der Versuch, die transfiniten Schlüsse aus der Analysis zu entfernen, wie er insbesondere von Kronecker und neuerdings von Brouwer und Weyl unternommen worden ist, führt zu einer Verstümmelung der Mathematik. In der Verfolgung unserer Absicht der sicheren Begründung der Mathematik kommen wir also hier an eine Barriere. Da heisst es zunächst Halt machen, und ehe wir uns fragen, ob und wie sich diese fatale Situation überwinden lässt, wollen wir uns erst dem zweiten Gesichtspunkt zuwenden, auf den wir von den Paradoxien her geführt wurden, und zusehen, ob dieser uns nicht auf den richtigen Weg hilft. Dieser zweite Gesichtspunkt bestand in dem Hinweis auf das Problem der Präzisierung der Sprache. Diese Aufgabe ist seit langem und mit Erfolg in Angriff genommen durch den Logikkalkül, in welchem diejenigen Bestandteile der Sprache, welche für die Mitteilung mathematischer Gedanken in Betracht kommen, einer strengen Formalisierung von der Art des mathematischen Formalismus unterzogen werden. Der Logikkalkül ist von den Mathematikern viel missachtet worden, und er erscheint auch zunächst als eine unfruchtbare Spielerei. In der neueren Entwicklung tritt er aber immer mehr in die Rolle eines wichtigen Hülfsmittels für die Untersuchung der Prinzipien der Mathematik; und vor allem schon der Umstand, dass wir von der Betrachtung jener zweiten typischen Paradoxie geradewegs auf den Logikkalkül hingewiesen werden, gibt zu der Vermutung Anlass, dass dieser Kalkül zu einem wesentlichen Dienst bei der strengen Begründung der Mathematik berufen ist und dann also hier einer jener Fälle von prästabilierter Harmonie vorliegt, wo eine bloss | um ihrer selbst willen ausgebildete Disziplin sich für einen grösseren Erkenntniszweck als fruchtbar erweist. Den ersten, unentbehrlichen Bestandteil des Logikkalküls bildet der Aussagenkalkül. Darstellung des Aussagenkalküls siehe in der Vorlesung über „Logikkalkül“, W–S. 1920, S. 1–20. Durch den bisherigen Logikkalkül wird von den logischen Elementen der Sprache derjenige Teil, welcher zum Ausdruck der Beziehungen zwischen Sätzen als Ganzen dient, präzisiert und formalisiert. Wenn wir nun die traditionelle, d. h. die Aristotelische Logik ins Auge fassen, so ist zu deren Beherrschung zwar dieser bisherige Aussagen-Kalkül nicht ausreichend, jedoch bedarf es hierzu nur einer geringen Erweiterung des Formalismus und einer Umdeutung der Symbolik, welche darin besteht, dass
5
10
15
20
25
30
35
40
45
‘Logische Grundlagen der Mathematik’ (1922/23)
5
10
15
20
25
30
35
40
45
533
man die Buchstaben nicht als Zeichen für Aussagen, sondern für Prädikate nimmt. Nach der Meinung der früheren Logiker, die auch Kant teilte, wäre mit der Aristotelischen Schlusslehre die Logik überhaupt erledigt. Kant sagt (in der Vorrede zur zweiten Ausgabe der Kritik der reinen Vernunft): „Merkwürdig ist noch an ihr“ (der Logik) „dass sie auch bis jetzt“ (seit Aristoteles) „keinen Schritt vorwärts hat tun können und also allem Ansehen nach geschlossen und vollendet zu sein scheint.“ Nun erweist sich aber der Aristotelische Formalismus tatsächlich schon bei ganz einfachen logischen Zussamenhängen als unzulänglich, nämlich sobald es sich um Beziehungen zwischen mehreren Gegenständen handelt. Z. B. sind wir mit diesem Formalismus nicht imstande, den Satz auszudrücken: „Die Vorfahren von den Vorfahren eines Menschen sind auch Vorfahren dieses Menschen.“ Wollen wir das logisch Wesentliche an diesem Satz zur Darstellung bringen, so kommen wir nicht mit einem Prädikat „Vorfahre-sein“ aus, sondern wir brauchen die Bezeichnung eines Gegenstandes, der sowohl als Vorfahre wie als Nachkomme auftritt. Das Ausdrucksmittel, dessen wir hier und bei allen solchen Beziehungen zwischen mehreren Gegenständen bedürfen und welches sich gleichsam von selbst bietet, ist dem Mathematiker geläufig: es besteht in der Anwendung von Variablen. Wir fassen die Prädikate und Relationen als logische Funktionen auf, deren Werte bestimmte Aussagen sind und deren Argumente die Gegenstände bilden, welche als Subjekt oder als Glieder der Relation stehen. — Die Aristotelische Schlusslehre bezieht sich auf die logischen Funktionen mit einem Argument. Aber gerade die schwierigen Probleme der Logik, welche auch grösstenteils noch heute nicht gelöst sind, entstehen erst bei den Relationen, also den Funktionen mit mehreren Argumenten. Freilich die obersten Grundsätze des Schliessen enthalten in ihrer symbolischen Formulierung nur eine Variable, und die Schlüsse für mehrere Variable ergeben sich aus jenen einfach dadurch, dass man jeweils alle Variablen bis auf eine als blosse Parameter behandelt, (d. h. sie durch irgendwelche bestimmten Gegenstände ersetzt denkt). Aber auch die Aristotelische Logik begnügt sich ja nicht mit der Aufstellung jener obersten Grundsätze, vielmehr handelt sie ja auch bereits von den Schlussfiguren, die sich aus der kombinierten Anwendung der Grundsätze ergeben. In der Art der Abgrenzung dieser Untersuchung liegt eine Willkür, und man kann sagen, dass die für die Wissesnschaft fruchtbaren Fragestellungen erst da beginnen, wo die traditionelle Logik aufhört. — In welcher Weise geschieht nun die Anwendung der Variablen? Zunächst führen wir ein, dass nach Belieben ein oder mehrere in einer Aussage vorkommende Gegenstände in der symbolischen Darstellung der Aussage angegeben werden können. Z. B. kann A3 stehen für die Aussage „3 ist eine Primzahl“, B(6, 3) für die Aussage „6 ist durch 3 teilbar.“ An die Stelle der Gegenstandsbezeichnungen können nun Variable treten. Und wie man in der Algebra Buchstaben-Formeln schreibt, welche besagen, dass für beliebigen Zahlenwerte, die man anstelle der Variablen einsetzt, die
10
11
534
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
entstehende Zahlengleichung richtig ist, so tun wir es auch hier im Logikkalkül. Z. B. können wir hiernach den vorhin genannten Satz, dass die Vorfahren von den Vorfahren eines Menschen auch Vorfahren dieses Menschen sind, durch die Formel darstellen: A(x, y) & A(y, z) → A(x, z),
12
wo A(x, y) die Beziehung „x ist Vorfahre von y“ ausdrückt. Diese Bezeichnungsweise hat insbesondere den Vorteil, dass wir ebenso wie wir aus A und A → B auf B schliessen, jetzt auch aus Ax und Ax → Bx auf Bx schliessen können. Denn setzen wir in den Prämissen für x irgendeinen bestimmten Gegenstand ein, so gehen diese in richtige Aussagen über; wir gelangen daher nach dem früheren Schluss zu derjenigen Aussage, die aus Bx durch die betreffende Einsetzung entsteht. Somit wird aus Bx bei jeder Einsetzung für die Variable x eine richtige Aussage. Wir haben nun bereits eine Darstellung für allgemeine Urteile. Um aber die Allgemeinheit in Verbindung mit der Negation und den logichen Verknüpfungen &, ∨, → anwenden zu können, brauchen wir ein besonderes „Allzeichen“. Ausserdem brauchen wir ein „Seinszeichen“ zur Darstellung partikulärer | Urteile. (x)Ax soll bedeuten: „für alle x gilt Ax“. (Ex)Ax " : „es gibt ein x, für welches Ax gilt“. " Die zu einem Allzeichen oder Seinszeichen gehörige Variable nennen wir „gebundene Variable“; sie spielt eine analoge Rolle wie die Integrationsvariable in der Mathematik; insbesondere kann sie auch durch irgendeine andere Variable ersetzt werden. Zum Unterschied von den gebundenen Variablen nennen wir die anderen „freie Variablen“. — Bezüglich der Schreibweise ist zu bemerken, dass die Formel, vor der ein Allzeichen oder ein Seinszeichen steht, in Klammern zu setzen ist, falls sie eines der Zeichen &, ∨, → enthält und nicht schon durch einen Negationsstrich zusammengefasst ist. Ferner treffen wir der Uebersichtlichkeit halber folgende Festsetzungen: Statt Ax soll Ax geschrieben werden (x)Ax " (x)Ax " " " (Ex)Ax " (Ex)Ax " " . " Wir stellen inhaltlich folgende Beziehungen der Wahrheitsgleichheit (Aequivalenz) fest: (x)Ax aeq (Ex)Ax (Beispiel: Ax bedeute „x ist gerade“. —In diesem und den nächsten Beispielen sollen Gegenstände, auf welche sich die Aussagen beziehen, immer ganze Zahlen sein.) (Ex)Ax aeq (x)Ax (Beispiel: Ax bedeute x = x + 1.) (x) Ax (Ex) Ax
aeq (Ex)Ax aeq (x)Ax
5
10
15
20
25
30
35
40
‘Logische Grundlagen der Mathematik’ (1922/23)
5
535
(Die beiden letzten Aequivalenzen erhält man aus den vorigen, indem man A durch A ersetzt und berücksichtigt, dass A aeq A). Diese Aequivalenzen beziehen sich auf die Verbindung des All|zeichens und des Seinszeichens mit der Negation. Für die Verbindung dieser Zeichen mit &, ∨, → gelten zunächst folgende Aequivalenzen. Es komme in A die Variable x nicht vor, dann ist
13
A & (x)Bx aeq (x)(A & Bx) A ∨ (x)Bx aeq (x)(A ∨ Bx)
10
Aus diesen Aequivalenzen gewinnt man die zu ihnen „dualen“, indem man beiderseits die Negation bildet, ferner A, B bezüglich durch A, B ersetzt, und unter Benutzung der bereits bekannten Aequivalenzen die Negationen entfernt. Man erhält so: A ∨ (Ex)Bx aeq A & (Ex)Bx aeq
15
(Ex)(A ∨ Bx) (Ex)(A & Bx)
Aus der zweiten der beiden obigen Aequivalenzen findet man ferner, indem man A durch A ersetzt und das Zeichen → einführt: A → (x)(Bx)
(x)(A → Bx).
aeq
Dagegen ist nicht etwa (x)Bx → A stets wahrheitsgleich mit (x)(Bx → A). Vielmehr ergibt sich auf Grund der früheren Aequivalenzen, dass 20
25
(x)(Bx → A)
aeq
(Ex)Bx → A
(Ex)(Bx → A)
aeq
(x)Bx → A
Bei all diesen Aequivalenzen ist vorausgesetzt, dass A die Variable x nicht enthält. Für die Verknüpfung zweier Funktionen Ax und Bx gilt folgende wichtige Aequivalenz: (x)(Ax & Bx) aeq (x)Ax & (x)Bx sowie die zu ihr „duale“: (Ex)(Ax ∨ Bx) aeq
30
35
40
(Ex)Ax ∨ (Ex)Bx.
In diesen beiden Aequivalenzen darf nicht das & mit dem ∨ vertauscht werden; es ist also nicht etwa (x)(Ax ∨ Bx) | stets wahrheitsgleich mit (x)Ax ∨ (x)Bx. Wenn z. B. Ax bedeutet „x ist gerade„ und Bx bedeutet „x ist ungerade“, so stellt (x)(Ax ∨ Bx) den richtigen Satz dar: „ jede (ganze) Zahl ist entweder gerade oder ungerade“, während (x)Ax ∨ (x)Bx den falschen Satz darstellt: „entweder sind alle Zahlen gerade, oder alle Zahlen sind ungerade“. Bisher haben wir die Allzeichen und Seinszeichen nur in Verbindung mit Prädikaten betrachtet. Zu wesentlich neuen logischen Gebilden werden wir geführt, wenn wir jetzt auch die Relationen in Betracht ziehen. Bei diesen können die All- und Seinszeichen kombiniert auftreten. Z. B. bei einer zweigliedrigen Relation A(x, y) haben wir folgende Formen der Zusammensetzung: (x)(y)A(x, y); (Ex)(Ey)A(x, y);
(x)(Ey)A(x, y) (Ex)(y)A(x, y)
14
536
15
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
(x)(y)A(x, y) ist im Sinne von (x)((y)A(x, y)) aufzufassen; wir lassen die Klammer um (y)A(x, y) weg, da kein Missverständnis möglich ist. Das entsprechende gilt für die übrigen Formeln. Bei (x)(y)A(x, y) ist die Reihenfolge der Allzeichen, bei (Ex)(Ey)A(x, y) die der Seinszeichen vertauschbar im Sinne der Wahrheitsgleichheit. Dagegen besteht bei der Form (x)(Ey)A(x, y) keine Vertauschbarkeit der Zeichen (x) und (Ey). Setzen wir z. B. für A(x, y) die Beziehung x < y, so ist (x)(Ey)(x < y) die richtige Aussage: „Zu jeder Zahl gibt es eine grössere.“ (Ey)(x)(x < y) die falsche Aussage: „Es gibt eine Zahl, die grösser ist als jede Zahl.“ Ein wesentliches Mittel zur Auffindung von Aequivalenzen besteht darin, dass man in eine bekannte Aequivalenz eine oder mehrere neue freie Variable als Parameter einführt. Auf diese Weise erhält man z. B. aus der festgestellten Aequi|valenz (x)(A ∨ Bx) aeq A ∨ (x)(Bx) die für jedes y gültige Aequivalenz (x)(Ay ∨ Bx) aeq
5
10
15
Ay ∨ (x)Bx
und hieraus weiter: (y)(x)(Ay ∨ Bx) aeq (y)(Ay ∨ (x)Bx). Hier können nun links die beiden Allzeichen vertauscht werden, und zur Umformung der rechts stehenden Formel kann man die Aequivalenz (y)(Ay ∨ C)
aeq
(y)Ay ∨ C
(x)(A ∨ Bx) aeq
A ∨ (x)Bx
20
benutzen (welche aus der früheren: durch Umbenennungen und Vertauschung der Disjunktionsglieder gewonnen wird); diese, auf (x)Bx anstelle von C angewandt, ergibt:
25
(y)(Ay ∨ (x)Bx) aeq (y)Ay ∨ (x)Bx aeq (x)Ax ∨ (x)Bx Somit gelangt man zu dem Ergebnis: (x)Ax ∨ (x)Bx
16
aeq (x)(y)(Ay ∨ Bx).
Durch Umformungen dieser Art lässt sich jede unserer logischen Formeln als aequivalent, d. h. bei beliebigen Einsetzungen von speziellen Aussagen, Prädikaten und Relationen für die Aussage- und Funktionszeichen als wahrheitsgleich erweisen mit einer solchen, bei der die All- und Seinszeichen sämtlich voranstehen und sich auf den ganzen nachfolgenden Ausdruck beziehen. Dieser auf die All- und Seinszeichen folgende Ausdruck kann nun noch gemäss den Aequivalenzen des Aussagenkalküls, in eine Konjunktion von Disjunktionen umgeformt werden, wo jedes Disjunktionsglied entweder ein Aussagezeichen ist oder ein Funktionszeichen mit einem oder mehreren Argumenten oder aber eines die| ser Zeichen mit darüber stehendem Negationstrich. Somit haben wir auch in dem erweiterten Kalkül eine Normalform für die Darstellung der Aussagen.
30
35
40
‘Logische Grundlagen der Mathematik’ (1922/23)
5
10
15
20
25
537
Zur Ausführung von Schlüssen dienen insbesondere folgende Regeln, deren Gültigkeit aus der Bedeutung der Zeichen hervorgeht. 1. Vor eine Formel, die eine freie Variable enthält, kann das zugehörige Allzeichen gesetzt werden, und umgekehrt kann ein Allzeichen, welches in einer Formel voraussteht, weggelassen werden. (Diese Regel bezieht sich aber nur auf Formeln, die für sich stehen, dagegen nicht auf solche, die als Bestandteile innerhalb einer grösseren Formel auftreten.) 2. Für eine freie Variable kann irgendein Gegenstand oder eine andere Variable eingesetzt werden. 3. Für ein inhaltlich unbestimmtes Aussagezeichen oder ein Funktionszeichen mit Argumenten kann irgendeine Formel eingesetzt werden, unter der Bedingung, dass im Falle der Einsetzung für ein Funktionszeichen, die Argumente als freie Variable in der Formel vorkommen. (Es sei besonders bemerkt, dass in der einzusetzenden Formel auch neue freie Variable auftreten dürfen, welche dann die Rolle von Parametern spielen.) 4. Die Schlüsse des Aussagenkalküls sind auch anwendbar auf Formeln mit freien Variablen. (Dies ergibt sich durch eine ganz entsprechende Ueberlegung, wie wir sie in dem Spezialfall des Schlusses von Ax und Ax → Bx auf Bx angestellt haben.) 5. Jede Formel kann durch eine ihr aequivalente ersetzt werden. Diese Regeln können wir insbesondere zur Ableitung allgemeingültiger logischer Formeln verwenden, d. h. solcher Formeln, die bei Ersetzung der unbestimmten Aussage- und Funktionszei|chen durch bestimmte Aussagen, bezw. Prädikate oder Relationen stets richtige Aussagen darstellen. Es sollen ein paar Beispiele für die Ableitung solcher allgemeingültiger Formeln gegeben werden. In die immer richtige Formel des Aussagenkalküls A→A werde für A die Formel (x)Ax eingesetzt:
30
(x)Ax → (x)Ax und dann die Variable des zweiten Allzeichens in y umbenannt. (x)Ax → (y)Ay. Hier kann nun auf Grund der Aequivalenz C → (y)Ay
35
aeq
(y)(C → Ay)
das Allzeichen (y) vorgezogen werden, und in der entstehenden Formel (y)((x)Ax → Ay)
40
kann (gemäss der Regel 1) das Allzeichen (y) weggelassen werden. So erhalten wir die Formel 1) (x)Ax → Ay, welche den Schluss von Allgemeinen aufs Besondere, das Grundprinzip der Aristotelischen Schlusslehre, wiedergibt. Wenden wir auf die erhaltene Formel die Aussagen-Aequivalenz A→B
aeq B → A
17
538
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
an, so bekommen wir zunächst die Umformung Ay → (x)Ax. Nun werde für das Funktionszeichen A eingesetzt A: A → (x) Ax; nach Weglassung der doppelten Negation und Ersetzung von (x) Ax durch die aequivalente Formel (Ex)Ax ergibt sich:
5
2) Ay → (Ex)Ax 18
Aus den Formeln 1) und 2) erhalten wir, indem wir den Schluss von A → B und B → C auf A → C gemäss dem Aussagenkalkül | ausführen, die Formel (x)Ax → (Ey)Ax
10
In dieser Formel bekommt die unserem Kalkül stillschweigend zugrunde gelegte Voraussetzung zum Ausdruck, dass es mindestens einen Gegenstand gibt, der für eine Variable eingesetzt werden kann. Diese Voraussetzung ist übrigens auch für die Gültigkeit der Aequivalenz (Ex)(A ∨ Bx) aeq
A ∨ (Ex)Bx
15
wesentlich.) Als Beispiel eines Schlusses soll der Uebergang von einer Formel Ax → Bx zu (x)Ax → (x)Bx ausgeführt werden. Zunächst werde in
20
Ax → Bx für x die Variable y eingesetzt: Ay → By; Aus dieser Formel und der Formel 1):
25
(x)Ax → Ay erhält man (gemäss dem Aussagenkalkül) (x)Ax → By. Hier kann, gemäss Regel 1) das Allzeichen (y) vorgesetzt und dann, auf Grund der Aequivalenz (y)(C → By) aeq C → (y)By, hinter das Zeichen → gezogen werden:
30
(x)Ax → (y)By. 19
Durch Umbenennung der Variablen y des zweiten Allzeichens in x erhält man hieraus die gewünschte Formel | (x)Ax → (x)Bx. Man kann auch aus Ax → Bx
35
‘Logische Grundlagen der Mathematik’ (1922/23)
539
die Formel (Ex)Ax → (Ex)Bx ableiten. Zunächst erhält man auf Grund der Aequivalenz A→B 5
aeq
B→A
die Formel Bx → Ax. Aus dieser leitet man, wie eben gezeigt, die Formel (x)Bx → (x)Ax ab. Und durch nochmalige Benutzung von A→B
10
aeq
B→A
erhält man (x) Ax → (x) Bx, woraus die gewünschte Formel auf Grund der Aequivalenzen (x) Ax 15
aeq
(Ex)Ax,
(x) Bx
aeq
(Ex)Bx
hervorgeht. Schliesslich wollen wir noch die Formel (Ey)(x)A(x, y) → (x)(Ey)A(x, y) ableiten, welche zeigt, dass man von (Ey)(x)A(x, y)
20
auf
25
(x)(Ey)A(x, y) schliessen kann, während der umgekehrte Schluss, wie wir an einem Beispiel gesehen haben, unzulässig ist. In der Formel 2): Ay → (Ex)Ax setzen wir für y die Variable z ein und benennen die Variable x des Seinszeichens in y um: Az → (Ey)Ay. Nun führen wir die Variable x als Parameter ein:
30
A(x, z) → (Ey)A(x, y). Gemäss dem vorhin ausgeführten Schluss können wir hier beiderseits des Zeichens → das Allzeichen (x) vorsetzen: (x)A(x, z) → (x)(Ey)A(x, y),
35
und vor die ganze Formel kann, nach Regel 1), das Allzeichen (z) vorgesetzt werden. (z)((x)A(x, z) → (x)(Ey)A(x, y)). Diese Formel kann auf Grund der Aequivalenz (z)(Az → B)
aeq
(Ez)Az → B
20
540
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
umgeformt werden in (Ez)(x)A(x, z) → (x)(Ey)A(x, y) und indem wir nun noch die gebundene Variable z in y umbenennen, gelangen wir zu der gewünschten Formel (Ey)(x)A(x, y) → (x)(Ey)A(x, y) .
5
Von dieser Formel wollen wir nun eine mathematische Anwendung machen. Dazu leiten wir aus ihr zunächst eine weitere Formel ab, indem wir die Variable u als Parameter einführen: (Ey)(x)A(x, y, u) → (x)(Ey)A(x, y, u) und nun, gemäss dem vorhin schon angewandten Schluss, beiderseits des Zeichens → das Allzeichen (u) vorsetzen:
10
(u)(Ey)(x)A(x, y, u) → (u)(x)(Ey)A(x, y, u). Diese Formel wenden wir nun in der Weise an, dass wir als die Gegenstände, auf welche sich die Variablen beziehen, die positiven reellen Zahlen nehmen und für A(x, y, u) die Beziehung
(z)(y + 1 < z → | y
15
einsetzen, worin f (x, n) eine arithmetische Funktion der positiven reellen Variablen x und der positiv-ganzzahligen Variablen n bedeutet und welche besagt: „für jedes z, das grösser als Pages 21 and 22 are missing. 1 23
20
Wir teilen die Gegenstände, auf welche sich die vorgelegte falsche Aussage (mit den Prädikaten A0 , B0 , . . . . , K0 ) bezieht, in Klassen ein, indem wir zwei Gegenstände a, b zur selben Klasse rechnen, wenn die Aussagen A0 (a), B0 (a), . . . . , K0 (a) bezüglich wahrheitsgleich sind mit A0 (b), B0 (b), . . . , K0 (b), d. h.
A0 (a) B0 (a) .. . K0 (a)
wahrheitsgleich mit " " "
"
25
A0 (b) B0 (b) .. . K0 (b).
30
k
Auf diese Weise erhalten wir höchstens 2 Klassen. Nämlich für einen Gegenstand a kann A0 (a) wahr oder falsch sein, ebenso ist B0 (a) entweder wahr oder falsch u.s.w.: im ganzen gibt es also nur 2k Möglichkeiten für die Verteilung von Wahrheit und Falschheit auf die Aussagen A0 (a), . . . . , K0 (a), 1 The
content of these pages can be reconstructed from pp. 12–13 of Hellmuth Kneser’s Mitschrift for the 1922/23 lectures; see pp. 607–608 below.
35
‘Logische Grundlagen der Mathematik’ (1922/23)
541
und wenn für zwei Gegenstände dieselbe Verteilung vorliegt, so gehören sie zur selben Klasse. (Natürlich brauchen nicht alle möglichen Verteilungen vorzukommen.) Seien α1 . . . . . αn die verschiedenen Klassen, die wir erhalten, wobei also 5
n ≤ 2k ist. Wir definieren nun mit Hilfe der Prädikate A0 , . . . . , K0
10
15
20
25
30
35
40
die neuen Prädikate A1 , . . . . , K1 , welche sich auf die Klassen α1 , . . . . αn beziehen, in der Weise, dass A1 auf die Klasse αp (p = 1, . . . . n) dann und nur dann zutrifft, wenn A0 auf die zu αp gehörigen Gegenstände zutrifft, dass | ebenso B1 auf αp dann und nur dann zutrifft, wenn B0 auf die zu αp gehörigen Gegenstände zutrifft, u.s.w. Gemäss dieser Definition geht jede aus den Prädikaten A0 , . . . , K0 mit den logischen Zeichen gebildete Aussage in eine ihr wahrheitsgleiche über, wenn man darin A0 durch A1 , B0 durch B1 , . . . , K0 durch K1 ersetzt, ferner als Werte der Variablen anstatt der anfänglichen Gegenstände die Klassen α1 , . . . . . , αn betrachtet, und für jeden gegebenenfalls in der Aussage vorkommenden bestimmten Gegenstand die Klasse setzt, zu der er gehört. Diese Behauptung ist trivial für den Fall, dass die betreffende Aussage kein Allzeichen und kein Seinszeichen enthält. Man beweist sie allgemein, indem man die Aussage in Normalform geschrieben denkt und von der Gültigkeit für m voranstehende All- und Seinszeichen auf die Gültigkeit für m + 1 solche Zeichen schliesst. Aus diesem Satze folgt nun insbesondere, dass jene falsche Aussage, die gemäss unserer Annahme aus der vorgelegten Formel nach Ersetzung der Funktionszeichen A, B, . . . , K durch die Prädikate A0 , B0 , . . . , K0 entsteht, wiederum in eine falsche Aussage übergeht, wenn wir die Prädikate A0 , B0 , . . . . , K0 bezüglich durch A1 , B1 , . . . . , K1 ersetzen und als Werte für die Variablen die Klassen α1 , . . . , αn nehmen. (Hierbei kommt zur Geltung, dass die zu betrachtende Formel eine rein logische Formel sein, als Namen von bestimmten Gegenständen enthalten soll.) Wir erhalten somit in der Tat eine falsche Aussage, die sich aus der betrachteten Formel durch Spezialisierung ergibt und die sich auf eine System von n, also von höchstens 2k Gegenständen bezieht. Demnach brauchen wir die Entscheidung nur für den Fall | auszuführen, dass es sich um höchstens 2k Gegenstände handelt. Bei dieser Beschränkung lässt sich aber die Entscheidung durch ein endliches Probieren erzwingen. Nämlich seien (l ≤ 2k ) a1 , . . . . . , al die Gegenstände, welche als Werte der Variablen in Betracht kommen, so ist jedes „alle“ gleichbedeutend mit einer Konjunktion, jedes „es gibt“ gleichbedeutend mit einer Disjunktion, und zwar erstreckt über diese Gegenstände a1 , . . . . , al . Wir können also die All- und Seinszeichen in der betrachteten Formel sämtlich entfernen und erhalten eine Formel, welche aus den Funkti-
24
25
542
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
onswerten A(aν ), B(aν ), . . . . . , K(aν ) (ν = 1, . . . . , l) lediglich mit den logischen Zeichen des Aussagenkalküls gebildet ist. Es bestehen aber nur endlich viele, nämlich 2k·l Möglichkeiten, wie sich bei bestimmten Prädikaten Wahrheit und Falschheit auf die k . l Funktionswerte
5
A(a1 ), A(a2 ), . . . . , B(a1 ), B(a2 ), . . . , K(al )
26
verteilen können. Diese Möglichkeiten können wir alle durchgehen und für jede direkt feststellen, ob unsere erhaltene Formel eine richtige oder eine falsche Aussage ergibt. So erkennen wir in der Tat die Möglichkeit der Entscheidung über die Allgemeingültigkeit einer logischen Formel, welche als logische Funktionen nur Prädikate enthält. Wie bereits gesagt, ist für den allgemeineren Fall, dass die logischen Funktionszeichen auch zwei oder mehrere Argumente haben können, die Entscheidungsmöglichkeit bisher nicht erwiesen. Die Lösung des Entscheidungsproblems ist für die Fragen der Axiomatik von grundsätzlicher Wichtigkeit. Ich will dies an Hand eines bestimmten Beispiels zeigen. In der Untersuchung der logischen Abhängigkeitsverhältnisse zwischen den verschieden Axiomgruppen der Geometrie ist es ein besonders interessantes und wichtiges Ergebnis, dass der spezielle Pascalsche Satz, welcher bei der Begründung der Proportionenlehre ohne Anwendung der Stetigkeitsaxiome eine wesentliche Rolle spielt, aus den Axiomen der Verknüpfung, der Anordnung und dem Parallelenaxiom nicht bewiesen werden kann. Wir wollen uns klar machen, dass mit der Lösung des Entscheidungsproblems ein Verfahren gegeben wäre, durch das jene Unbeweisbarkeit sich wenigstens grundsätzlich feststellen lassen müsste, (wenn auch vielleicht die Umständlichkeit des Verfahrens die praktische Durchführung illusorisch machen könnte.) Die erste wesentliche Bemerkung hierzu ist, dass wir die in Betracht kommenden Axiome sowie den speziellen Pascalschen Satz durch unseren logischen Kalkül ausdrücken können. Zunächst können die Axiome so umgeformt werden, dass nur von einer Art von Dingen, nämlich Punkten die Rede ist. Wir brauchen dazu nur anstatt der Grundbeziehung zwischen Punkten und Geraden („der Punkt x liegt auf der Geraden g“ oder: „die Punkte x, y bestimmen die Gerade g“) eine Beziehung zwischen drei Punkten Ger(x, y, z),
10
15
20
25
30
35
(„x, y und z liegen auf einer Geraden“)
und ebenso statt der Grundbeziehung zwischen Punkten und Ebenen eine Beziehung zwischen vier Punkten Eb(x, y, z, u)
(„x, z, y und u liegen in einer Ebene“)
einzuführen. Zu diesen beiden Relationen müssen wir noch die Identitätsbeziehung ≡(x, y) und die Zwischen-Beziehung Zw(x, y, z)
(„x liegt zwischen y und z“)
40
‘Logische Grundlagen der Mathematik’ (1922/23)
5
543
hinzunehmen. Mit Hilfe der vier eingeführten Beziehungen lassen sich nun alle bei unserem Problem vorkommenden Axiome, sowie auch der | Pascalsche Satz, durch logische Formeln darstellen. Z. B. das Axiom „durch zwei Punkte geht nur eine einzige Gerade“ wird ausgedrückt durch die Formel —
27
—
(x)(y)(u)(v){Ger(x, y, u) & Ger(x, y, v) & ≡(x, y) & ≡(u, v) → Ger(x, u, v)};
10
das Axiom „wenn zwei Ebenen einen Punkt gemeinsam haben, so haben sie noch mindestens einen andern Punkt gemeinsam“, drückt sich aus durch die Formel (x)(y)(z)(u)(v)(w)(p){Eb(x, y, z, p) & Eb(u, v, w, p) —
→ (Eq)(≡(p, q) & Eb(x, y, z, q) & Eb(u, v, w, q)};
15
das für die Anordnung in der Ebene wesentliche Axiom „wenn eine Gerade, die in der Ebene eines Dreiecks liegt, eine Seite dieses Dreiecks schneidet, so schneidet sie noch eine andere Seite dieses Dreiecks“, stellt sich durch folgende Formel dar (x)(y)(z)(u)(v){Eb(x, y, z, u) & Ger(x, y, z) & Zw(v, x, y) → (Ew)(Ger(u, v, w) & (Zw(w, x, z) ∨ Zw(w, y, z)))}.
20
Zu beachten ist bei der Einführung der Beziehungen „Ger“ und „Eb“, dass für diese die Symmetrie-Eigenschaften als Axiome formuliert werden müssen: so hat man die Formel (x)(y)(z){Ger(x, y, z) → Ger(x, z, y) & Ger(y, x, z)} und die entsprechende für Eb aufzustellen. Die Eigenschaften der Identitätsbeziehung sind ebenfalls als Axiome zu formulieren:
25
(x)(≡(x, x)) (x)(y)(z){≡(x, y) & ≡(x, z) → ≡(y, z)} (x)(y)(z)(u){≡(x, u) & Ger(x, y, z) → Ger(u, y, z)} (x)(y)(z)(u)(v){≡(x, v) & Eb(x, y, z, u) → Eb(v, y, z, u)}.
30
35
(Die drei letzten Formeln bringen zum Ausdruck, dass in jeder vorkommenden Beziehung Identisches für einander gesetzt werden kann.) Denken wir uns nun alle in Formeln geschriebenen Axiome durch &-Zeichen zu einer einzigen Formel | verbunden. Diese stellt die Gesamtbedingung dar, welcher die Beziehungen „≡“, „Ger“, „Zw“, „Eb“ unterworfen werden sollen. Zur Abkürzung für diese Formel möge A(≡, Ger, Zw, Eb) geschrieben werden. Ferner sei P (≡, Ger) die Abkürzung für die Formel des Pascalschen Satzes, welcher in der gewöhnlichen Ausdrucksweise folgendermassen lautet: Es seien A, B, C und A , B , C
28
544
29
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
je drei Punkte auf zwei sich schneidenden Geraden, die vom Schnittpunkte der beiden Geraden verschieden sind; ist dann BC parallel zu CB und CA parallel zu AC , so ist auch AB parallel zu BA . (Dieser Satz lässt sich in der Tat wieder durch eine logische Formel darstellen, wobei von den Relationszeichen nur „≡“ und „Ger“ auftreten.) Die in Rede stehende Behauptung besagt nun, dass aus A(≡, Ger, Zw, Eb) nicht P (≡, Ger) bewiesen werden kann. In dieser Behauptung kommt die sachlich-geometrische Bedeutung der Relationen ≡, Ger, Zw, Eb garnicht mehr vor. Denn entsprechend dem axiomatischen Standpunkt darf ja beim Beweise eines Satzes aus den geometrischen Axiomen nichts anderes von den eingeführten Grundbeziehungen benutzt werden, als was in den Axiomen ausdrücklich formuliert ist. Wir können daher die Relationen ≡, Ger, Zw, Eb ganz eliminieren und an ihre Stelle vier unbestimmte Relationen — natürlich mit der entsprechenden Zahl von Argumenten — setzen: F (x, y), G(x, y, z), H(x, y, z), K(x, y, z, u). Die Beweisbarkeit des Pascalschen Satzes würde bedeuten, dass für irgend vier solche Relationen F , G, H, K, für welche A(F, G, H, K) wahr ist, auch stets P (F, G) wahr ist, dass also A(F, G, H, K) → P (F, G) die Formel eines allgemeingültigen Satzes ist. Und es handelt sich darum, zu erkennen, dass dies nicht der Fall ist. Diese Aufgabe ist aber gerade eine von der Art, wie sie, im Falle der Bekanntheit eines allgemeinen Entscheidungsverfahrens für die Gültigkeit logischer Formeln, auf einem vorgeschriebenen Wege zu lösen sein würde. Auch Fragen der Widerspruchslosigkeit würden sich an Hand des allgemeinen Entscheidungsverfahrens lösen lassen. Zum Beispiel die Frage, ob die in der Formel A(≡, Ger, Zw, Eb) zusammengefassten geometrischen Axiome mit einander logisch in Einklang stehen, ist gleichbedeutend mit der, ob die Bedingung A(F, G, H, K) durch Relationen F (x, y), G(x, y, z), H(x, y, z), K(x, y, z, u) erfüllbar ist oder, anders ausgedrückt, ob die Formel A(F, G, H, K)
5
10
15
20
25
30
35
40
‘Logische Grundlagen der Mathematik’ (1922/23)
5
10
15
20
25
30
35
40
45
545
keine allgemeingültige logische Formel ist. — Kehren wir nach dieser Abschweifung zu unserem leitenden Gedankengang zurück. In der Verfolgung des Zieles, das Gesamtgebäude der Mathematik zu sichern, wurden wir auf zwei Geschichtspunkte geführt: Der eine betraf die finite Einstellung, welche im Bereiche der elementaren Zahlenlehre auch ausreichend ist, während für die Analysis die transfiniten Schlussweisen wesentlich und unentbehrlich sind. Der andere Gesichtspunkt bestand in der Präzisierung der Sprache, soweit sie zur Darstellung mathematischer Tatsachen und logischer Zusammenhänge in Betracht kommt. Die Präzisierung geschieht durch den Formalismus des logischen Kalküls, in welchem sich alle logischen Schlüsse, auch die transfiniten Schlussweisen, formal darstellen lassen. Wenn wir nun diese beiden Gesichtpunkte neben einander halten, so kann uns dies darauf bringen, sie in einer neuen Weise zu verknüpfen. Nämlich die Zeichen und Formeln des logischen Kalküls sind ja durchweg finite Objekte, wenngleich durch sie auch die transfiniten Schlüsse zur Darstellung kommen. Wir haben also die Möglichkeit, diese Formeln selbst zum Gegenstande inhaltlicher finiter Ueberlegungen zu machen, ganz entsprechend wie es in der elementaren Zahlenlehre mit den Zahlzeichen geschieht. Natürlich ist der Formalismus, mit dem wir es dann zu tun haben, viel mannigfaltiger und komplizierter als derjenige der Zahlzeichen; umfasst er doch alle (in Formeln ausgedrückten) mathematischen Beziehungen. Dafür trägt er aber auch weiter, und wir können erwarten, mit Hilfe dieser weitergehenden Formalisierung die Gesamtmathematik in den Bereich der finiten Betrachtung zu ziehen. Um uns das Wesen der hier erforderlichen Formalisierung klar zu machen, wird es nützlich sein, die Beziehung und die methodische Analogie zwischen dem logischen Kalkül und der Axiomatik zu betrachten. Der Logikkalkül bildet eine naturgemässe Ergänzung zu der Axiomatik. Nämlich, wenn wir zunächst die Axiomatik in ihrer ursprünglichen Bedeutung nehmen, so liegt ja ihr Sinn darin, dass man sich über die Voraussetzungen einer Theorie genaue Rechenschaft ablegt. Mit der Anwendung des Logikkalküls geht man noch einen Schritt weiter, indem man auch die Schlussweisen bis ins Einzelne verfolgt. Nun hat aber die Entwicklung der Axiomatik von der ursprünglichen naiven Auffassung zu einer wesentlich anderen geführt, da man erkannte, dass man sich von der inhaltlichen Bedeutung der Voraussetzungen und der Lehrsätze emanzipieren kann und nur die formal-logischen Abhängigkeitsverhältnisse zu berücksichtigen braucht. Jetzt wird es uns nahegelegt, in analoger Weise die Auffassung von dem Logikkalkül zu ändern. Bisher haben wir den Logikkalkül in naiver Weise inhaltlich verstanden; die Formeln dienten nur dazu, um die Gedanken scharf zu fixieren. Ein wenig gingen wir freilich schon über diesen Standpunkt hinaus. Denn es ergab sich von selbst bei der Ableitung von Formeln, dass wir uns gewisse Aequivalenzen und Schlussweisen ein für alle Mal anmerkten und in
30
31
546
32
33
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Regeln fassten, mit denen wir dann ohne inhaltliche Ueberlegung ganz äusserlich operierten. Dieses bisher ganz unsystematisch angewandte Verfahren machen wir nun zum Prinzip: durchweg soll das inhaltlich logische Schliessen ersetzt werden durch ein formales Handeln nach bestimmten Regeln, und erst von den Ergebnissen wollen wir auf die inhaltliche Bedeutung zurückkommen. An die Stelle des eigentlich mathematischen Beweises tritt somit eine formale Uebersetzung des Beweises, und zwar besteht diese in Folgendem: die erforderlichen mathematischen Axiome sowie die anzuwendenden logischen Grundsätze werden mit|tels der Symbolik des Logikkalküls als Formeln aufgeschrieben und aus diesen nach festgesetzten Regeln neue Formeln abgeleitet, deren inhaltliche Deutung die gewünschten mathematischen Sätze liefert. Was nützt uns nun diese Methode der Formalisierung und die Einsicht, dass die formalisierten Beweise finite Objekte sind, für unser Problem der Begründung der Analysis? Um dies zu erkennen, müssen wir uns noch einmal ganz klar machen, worum es sich bei diesem Problem handelt. Dies Problem entsteht dadurch, dass wir uns in der Analysis bezüglich der Schlussmethoden auf einen wesentlich anderen Standpunkt stellen, als wir ihn bei der anschaulichen Zahlenlehre angenommen haben. Dort liegen die Gegenstände konkret vor, und ihre Beziehungen werden als Tatsächlichkeiten festgestellt. Die Sicherkeit, welche dieses Verfahren mit sich bringt, haben wir in der Analysis nicht; denn hier brauchen wir wesentlich die transfiniten Schlussweisen, und diese wollen und dürfen wir doch gemäss unserer finiten Einstellung nicht gelten lassen. Somit haben wir uns des Erkenntnis-Mittels begeben, durch welches wir die Sätze der Analysis als Wahrheiten erweisen können. Aber wir brauchen auch das Problem der Begründung nicht so direkt und positiv zu fassen. Hier weist uns wiederum die Axiomatik, wie wir sie aufgrund der Loslösung vom naiven Standpunkt auffassen, den Weg. Nach dieser Auffassung drücken ja die Axiome und Sätze des axiomatischen Gebäudes nicht Wahrheiten, sondern nur mögliche Beziehungen aus, und die Tatsächlichkeiten, die durch die Axiomatik festgestellt werden, bestehen in Abhängigkeiten zwischen diesen Beziehungen. Ebenso können wir nun bei der Begründung der Analysis | von dem Wahrheitsgehalt der Axiome und Sätze absehen, wenn wir uns nur die Gewähr verschaffen können, dass alle Ergebnisse, zu denen die Prinzipien und die Schlussmethoden der Analysis führen, im Einklange mit einander stehen, sodass wir nicht, wie bisher immer, nur auf guten Glauben die Widerspruchsfreiheit annehmen und der Möglichkeit ausgesetzt sind, eines Tages durch ein Paradoxon überrascht zu werden, wie es z. B. Frege in so dramatischer Weise geschah. Wenn wir uns nun auf diesen Standpunkt stellen und also die Aufgabe der Begründung ausschliesslich darin sehen, zu zeigen, dass die üblichen transfiniten Schlüsse und Prinzipien der Analysis (und Mengenlehre) nicht auf Wider-
5
10
15
20
25
30
35
40
45
‘Logische Grundlagen der Mathematik’ (1922/23)
5
10
15
547
sprüche führen können, so wird für einen solchen Nachweis in der Tat durch unseren vorigen Gedanken eine grundsätzliche Möglichkeit eröffnet. Denn das Problem der Widerspruchsfreiheit gewinnt nunmehr eine ganz bestimmte, greifbare Form: es handelt sich nicht mehr darum, ein System von unendlich vielen Dingen mit gegebenen Verknüpfungs-Eigenschaften als logisch möglich zu erweisen, sondern es kommt nur darauf an, einzusehen, dass es unmöglich ist, aus den in Formeln vorliegenden Axiomen nach den Regeln des logischen Kalküls ein Paar von Formeln wie A und A abzuleiten. Hier kommt es zur Geltung, dass die Beweise, wenn sie auch inhaltlich sich im Transfiniten bewegen, doch, als Gegenstände genommen und formalisiert, von finiter Struktur sind. Aus diesem Grunde ist die Behauptung, dass aus bestimmten formalisierten Axiomen nicht zwei Formeln A, A bewiesen werden können, methodisch gleichzustellen mit inhaltlichen Behauptungen der anschaulichen Zahlentheorie, wie z. B. der, dass man nicht zwei Zahlzeichen a, b finden kann, für welche a2 = 2b2
548
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Textual Notes 544.5: 544.36:
„Ger“] Deleted: ) mit einander] nicht mit einander
Description of the Text
549
Description of the Text Collection: SUB Göttingen, Cod. Ms. D. Hilbert 567 (typescript). This folder also contains a second manuscript, in Hilbert’s hand. For a description of this, see below, p. 564. Size: 21.0 × 33.2 cm. Cover Annotations: — Composition: The text consists of 33 loose pages, typed on carbon copy paper. Pagination: The pages are numbered consecutively in the top right-hand corner. On the first page there is a remark in very light pencil, possibly in Hilbert’s hand, ‘fehlt noch S. 21’, but in fact both pages 21 and 22 are missing. Thus, it seems to follow that p. 22 went missing after p. 21. Original Title: The first page begins with the title ‘Logische Grundlagen d. Math. // 2tes Exemplar // 1922/23 (Donnerstag-Vorles.)’, written in rather faint pencil in what seems to be Hilbert’s hand. Text: On the typescript, the insertion of missing formulas, and some underlining and corrections, are executed in black ink; only the title and the remark about the missing page are written in pencil. There is no trace in the various Göttingen archives of the ‘first’ copy.
550
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Logische Grundlagen der Mathematik (1923/24)
0
Vorlesungsergänzung Wintersemester 1922/23 S. 1–26. 1 Disposition Stufe III Nun elementare Zahlentheorie — Stufe II war elementares Rechnen, Axiome 1–16. Schema für Definition von Funktionen durch Rekursion und Schlussschema. — indem wir zu unserem Schlussschema noch das Induktionsschema hinzunehmen. Wenn auch inhaltlich dies wesentlich mit den Ergebnissen der anschaulich gewonnenen Zahlentheorie übereinstimmt, so doch jetzt Formeln, z. B. a + b = b + a.
5
10
Transfinite Schlussweise und teilweise Analysis Stufe IIII Höhere Variablen-Gattungen und Mengenlehre, Auswahlaxiom Stufe V Zahlen der 2ten Zahlenklasse Stufe VI Continuumsproblem Stufe VIIA A
On the lower left-hand side of the page, enclosed in a circle, and with a question mark, Hilbert has added: VIII ? // Formalisierung der Wohlordnung
1 This
refers presumably to pp. 1–26 of the notes for the lectures given in the Winter Semester 1922/23; those notes are reprinted above on pp. 528–547. The handwritten document that underlies the present text was evidently written rapidly and contains a large number of deletions, substitutions and interlineations made by Hilbert in the course of composition. As a result, it is frequently not possible to reconstruct the original text, or even to decide what it was. Accordingly, we have here given a clean version of what we think is Hilbert’s final text, without attempting to record all the changes. The Textual Notes list the editorial emendations which led to this final, clean text.
15
20
‘Logische Grundlagen der Mathematik’ (1923/24)
551
B
5
10
15
20
25
Was fehlt uns? 1.) in logischer Hinsicht: Wir haben nur gehabt den Aussagenkalkül mit der Erweiterung auf freie Variablen, d. h. solche 3 , für die beliebige Funktionale eingesetzt werden konnten. Es fehlt das Operieren mit „alle“ und „es giebt“. 2.) Wir haben das Induktionsschema hinzugefügt, ohne Widerspruchsfreiheitsbeweis und auch nur provisorisch, also in der Absicht, es wegzuschaffen. 3.) Bisher nur die arithmetischen Axiome genommen, die sich auf ganze Zahlen beziehen. Und die obigen Mängel verhindern uns ja natürlich, die Analysis aufzubauen (Grenzbegriff, Irrationalzahl). Diese 3 Punkte liefern schon Disposition und Ziele für das Folgende. Wir wenden uns zu 1.). Es ist ja an sich klar, dass eine Logik ohne „alle“ und „es giebt“ Stückwerk wäre; ich erinnere wie gerade in der Anwendung dieser Begriffe, nach den sogenannten transfiniten Schlussweisen, die Hauptschwierigkeiten entstanden. Die Frage der Anwendbarkeit dieser Begriffe auf ∞ Gesamtheit haben wir noch nicht behandelt. Nun könnten wir so verfahren, wie wir es beim Aussagen-Kalkül gemacht haben: einige, möglichst einfache Aussagen auszusuchen und als Axiome zu formalisieren, aus denen dann alle übrigen folgen. Dann müsste der Widerspruchsfreiheitsbeweis geführt werden — unserem allgemeinen Programm gemäss: mit unserer Einstellung, dass ein Beweis eine vorliegende Figur ist. Für den Widerspruchsfreiheitsbeweis grosse Schwierigkeiten wegen der gebundenen Variablen. Die tiefere Untersuchung zeigt aber, dass der eigentliche Kern der Schwierigkeit an einer anderen Stelle liegt, auf die man gewöhnlich erst später Acht giebt und die auch in der Literatur erst später wahrgenommen worden ist. Auswahlaxiom. Wenn ich eine Menge von Mengen habe — alle elementenfremd und keine leere — so gibt es eine Repräsentantenmenge. S. (152) 24 B
Written at the beginning of the page, and then stricken through by Hilbert: 1) Was haben wir bisher erreicht? 2) " " " " nicht erreicht und müssen erreichen? Damit Stufe III erledigt. 2 2 Several
comments are in order. (1) It must be stressed that the words whose reading is marked as unsafe are indeed very hard to read; the pencil marks are clear, but what words those marks are to represent is not. What is given here is an educated guess, but a guess nonetheless. (2) Although the whole remark noted here is deleted, the sentence ‘Damit . . . erledigt.’ has been crossed out by horizontal lines, whereas the rest is crossed out with diagonal, undulating lines, carefully avoiding ‘Damit . . . ’. It seems likely that the page originally began with ‘Damit . . . ’ as a new paragraph; this was then deleted, the rest being written above it and to the left, and then itself subsequently crossed out. (3) The fact that the sentence ‘Damit . . . ’ appeared here suggests that this page (marked as ‘1’ by Hilbert) was to follow a more or less explicit account of Stufe III, and not (or not just) the preceding page (marked ‘0’ by the Editors). (4) Lastly, the three points elaborated following ‘Was fehlt uns?’ correspond to the three points marked on p. 30 of Kneser’s Mitschrift of the 1922/23 lectures. See p. 623 below. 3 Interlineated below ‘solche’: für welche 4 This is a reference to Hilbert 1923a, 152, where one finds the following remarks on
1
2
3
552
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Ich generalisiere, dass jeder Aussage überhaupt wird ein Ding zugeordnet, für welches sie im Allgemeinen nicht stimmt, ausser wenn sie für alle stimmt (Gegenbeispiel). S. (156) 6–7 statt τ : schreibe ε 5 ε(A) ist eine 6 Aussagenfunktion 6 , d. h. eine individuelle spezielle bestimmte (transfinite) Funktion, deren Argument eine Aussage A(a) mit einer Variablen a ist und deren Wert eben ein Gegenstand (Funktional) ist. Genau müssten wir schreiben, wenn A mehrere Variablen enthält, welche gemeint ist. εA oder ε(A(a)), εa (A(a, b)) ist eine Funktion von b. 7 4
(a)Aa → A(εA) AεA → Aa (a)Aa → Aa
2tes Definitionsaxiom 8 Transfinites Axiom Aristotelisches Prinzip
5
10
Wenn alle Menschen sterblich, so Cajus ist sterblich. AεA → Aa
Transfinites Axiom
oder Aa → AεA AεA → (Ea)Aa Aa → (Ea)Aa (a)Aa → AεA
15
3tes Definitionsaxiom Existential-Prinzip aus dem ersten Definitionsaxiom
(a)Aa → (a) Aa (a) Aa → AεA
20
aus dem ersten Definitionsaxiom
Zermelo’s choice principle: . . . und auch heute wird wohl meist die Auffassung vertreten, daß die Zulässigkeit des Auswahlprinzips zweifelhaft sei, während die sonstigen Schlußweisen, wie sie in der Mengenlehre im allgemeinen und in dem Zermeloschen Beweise im besonderen zur Anwendung kommen, der Beanstandung nicht in gleicher Weise ausgesetzt sind. Diese Auffassung halte ich für irrig; vielmehr stellt sich in der logischen Analyse, wie sie sich in meiner Beweistheorie vollzieht, heraus, daß der wesentliche dem Auswahlprinzip zugrunde liegende Gedanke ein allgemein logisches Prinzip ist, das schon für die ersten Anfangsgründe des mathematischen Schließens notwendig und unentbehrlich ist. Wenn wir diese Anfangsgründe sichern, gewinnen wir zugleich den Boden für das Auswahlprinzip: beides geschieht durch meine Beweistheorie.
See n. 23 below as to the significance of the ‘2’ here. 5 The eleventh axiom in Hilbert 1923a (p. 156) is the transfinite axiom, formulated with the τ operator: A(τ A) → A(a). See n. 23 below as to the significance of ‘6–7’. 6–6 Substituted for: Prädikatenfunktion 7 Beneath ‘ε (A(a, b))’ Hilbert has written ‘wie im Integral +∞ e−x dx’, with lines from a −∞ this remark drawn to both occurrences of a. 8 In Hilbert 1923a, 157, the ‘Definitionsaxiome des All- und des Sein-Zeichens’ are given as follows: A(τ A) → (a)A(a), (a)A(a) → A(τ A), A(τ A) → (Ea)A(a), (Ea)A(a) → A(τ A).
‘Logische Grundlagen der Mathematik’ (1923/24)
553
umgekehrt und auf A angewandt AεA → (Ea)Aa
(3tes Definitionsaxiom auf A angewandt)
(a)Aa → (Ea)Aa 5
Früher hatten wir die Regel, dass wir vor eine Formel, die eine freie Variable a enthält, (a) vorsetzen dürfen. Ich beweise, wie folgt: Aa AεA AεA → (a)Aa (a)Aa
10
5
(Definitionsaxiom) (Das transfinite Axiom ist eine implizite Definition)
(a)(A → Ba) A möge a nicht enthalten, dann kann (a) hineingezogen werden.
15
20
A → Bε(Ba) BεBa → (a)Ba A → (a)Ba
nach Aristoteles erstes Definitionsaxiom
Damit 1 Punkt erledigt ausser Widerspruchsfreiheitsbeweis. Wir haben es dabei nur mit dem besonderen Fall zu tun, dass die Variable ganzahlig ist. Denn für die Untersuchungen über die vollständige Induktion kommt ja nur dies allein in Frage. Nun wollen wir erstens eine Formel, die wir früher mit Induktionsschema bewiesen, jetzt als Axiom hinzufügen:
6
a = 0 → a = δa + 1 (Zu jeder Zahl ausser 0 giebt es eine vorhergehende.) Ferner legen wir unserem ε noch eine weitere Bedingung auf d. h. wir nehmen folgende simultane Axiome, die ε enthalten 25
30
35
AεA → Aa (Auswahlaxiom) εA = 0 → AδεA (Inhaltliche Bedeutung: In dem ε haben wir ein Ding, d. h. Zahl, die eventuelle Ausnahme; nun fügen wir hinzu: wenn es eine dieser unmittelbar vorausgehende giebt, so ist diese Zahl keine Ausnahme.) Natürlich muss der Widerspruchsfreiheitsbeweis für diese 3 Axiome geführt werden. Aber spätere Sorge. | Die Verschärfung ist aber nur auf ganze Zahlen anwendbar. Diese Axiome ersetzen nun das Induktionsschema. Nämlich, wir beweisen die Formel: A0 → (a)(Aa → Aa + 1) → Aa A0 Aa → Aa + 1 Aa
40
Der Beweis lässt sich streng formal genau entsprechend unseren Vorschriften führen. Es wird aber hier für den Vortrag Ihnen und mir angenehmer sein,
7
554
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
wenn ich nicht alles buchstäblich aufschreibe, sondern nur schildere. Sie können ihn sich aus dieser Schilderung dann sofort zusammenstellen. Formel 12 lautet: 9 (A → B) → [(A → B) → B] (Satz vom ausgeschlossenen Dritten)
5
Wir wenden diese an, so dass für A : εA = 0 genommen wird und für B unsere zu beweisende Grundformel. Es kommt also alles darauf an zu zeigen 1.)
εA = 0 → B
2.)
εA = 0 → B
und zwar wollen wir statt 1.) sogar ∗
1. )
10
εA = 0 → {A0 → Aa}
beweisen; daraus folgt 1.) wegen der erlaubten Versetzung ((1) (3) (4)) 10 Andererseits wollen wir statt 2.) sogar 2.∗ ) 8
εA = 0 → {(a)(Aa → Aa + 1) → Aa}.
∗
1 ) ist so beweisbar:
15
(0 = εA) → A0 → AεA (Axiom 14 der Gleichheit) Ferner AεA → Aa. Um 2∗ ) zu beweisen, schreiben wir zuerst hin:
20
(a)(Aa → Aa + 1) → AδεA → A(δεA + 1) (Aristotelisches Axiom) Wir würden also 2∗ ) bewiesen haben, wenn wir {AδεA → A(δεA + 1)} → εA = 0 → Aa zeigen könnten. Es ist also nur nötig diese Formel zu beweisen und das geschieht so:
9 ‘Formel 12’ refers to the twelfth axiom of the system recorded in Kneser’s Mitschrift of the lectures from the Winter Semester 1922/23, p. 17; see below, p. 612. Above the second ‘→’ in this formula, Hilbert has written an ‘&’, which presumably signifies the rewriting of the formula by gathering the conditions into a conjunction rather than by using iterated →s. ‘&’ signs are written above several (but by no means all) of the formulas which follow. Only in one case (the formula {AδεA → A(δεA + 1)} → εA = 0 → Aa on p. 8) does Hilbert rewrite a formula explicitly using this procedure. (This rewriting is not recorded here, neither are the scattered ‘&’s.) Hilbert’s logical system of 1921/22 (see above, p. 494) originally used only → and negation as propositional connectives, but additions by Hilbert to the Ausarbeitung for the 1921/22 lectures (see above, pp. 494 and 497) give further axioms for both ∨ and & and their combination with → and negation. The axiom system recorded by Kneser (and mentioned above) presumably reflects this. 10 These are references to axioms 1, 3 and 4 in the system mentioned in the previous note (below, loc. cit.); they are required to prove 1.) from 1.∗ ).
25
‘Logische Grundlagen der Mathematik’ (1923/24)
555
Zunächst Voraussetzungen umstellen I.) εA = 0 → (AδεA → A(δεA + 1)) → Aa11 Nun Auswahlaxiom εA = 0 → AδεA 5
10
15
20
25
30
35
9
AδεA → {(AδεA → A(δεA + 1)) → A(δεA + 1)} εA = 0 → {(AδεA → A(δεA + 1)) → A(δεA + 1)} Es ist also jetzt nur noch nötig zu zeigen: εA = 0 → {A(δεA + 1) → Aa} Wir haben das Axiom a = 0 → a = δa + 1 also εA = 0 → εA = δεA + 1 Nach dem Axiom 14 der Gleichheit δεA + 1 = εA → A(δεA + 1) → AεA Also εA = 0 → A(δεA + 1) → AεA. Nach Auswahlaxiom AεA → Aa. q. e. d. Aus dem Induktionsaxiom, das wir als 17 numerieren, und dem transfiniten Grundaxiom (16) und den früheren, also aus den Axiomen 1–17, kann man auf ziemlich umständlichen Wege (∗) A(a) → (Ec){A(c) & (d)(d < c → A(d))}, d. h. wenn a eine Zahl ist, für die A(a) gilt, so giebt es eine überhaupt kleinste Zahl c, für die A(c) zutrifft, beweisen. 12 Nun Definition der kleinsten Zahl, die A genügt, bzw. 0. κa A(a) = εc {A(c) & (d)(d < c → A(d))} Dieses κ hat nun folgende Eigenschaften, die aus (*) folgen: A(a) → A(κA), (1∗ ) und (2∗ ) (a < κA) → A(a), κA = a → A(a) (3∗ ) κ macht etwas mehr als ε. (1∗ ) und (2∗ ) bedeuten die charakteristischen Eigenschaften der kleinsten Zahl κ. (3∗ ) ist eine Folgerung aus (2∗ ). Schon aus (1∗ ) und (3∗ ) lässt sich dass Induktionsaxiom 17 und das transfinite Axiom 16 für ε beweisen — vorausgesetzt, dass man als Axiom hinzunimmt: (4∗ ) a = 0 → (δa) = a (d. h. jede von 0 = Zahl hat eine vorhergehende) 11 ‘I.)’ was used to refer to this formula in a portion of the text Hilbert has subsequently crossed out. 12 As to the numbering of axioms, see also Kneser’s notes for the lecture on 21.2.1924, p. 636 below. The text beginning here with (∗), and ending below with ‘vorhergehende’ has been pasted onto the page. Note that in this (new) text, ε-terms have their (new) role, and provide examples, not counterexamples.
16
556 17
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Beweis von 17 aus 1–15, 1∗ , 3∗ , 4∗ : Wir wollen aber auch, damit nicht Missverständnis entsteht, statt κ ε schreiben: Es wird eben der transfiniten Grundfunktion ε 1∗ = 16
A(a) → A(εA)
(1∗ )
noch die weitere Bedingung
5
∗
∗
εA = a → A(a)
3
(3 )
auferlegt. Ferner haben wir noch 4∗
a = 0 → (δa) = a
(4∗ )
In Axiom 12
A → B → [(A → B) → B] setzen wir für A : εA = 0 und für B unser Axiom 16, das wir doch beweisen wollen. Es genügt zu zeigen: 1.)
εA = 0 → B
2.)
εA = 0 → B
Statt 1.) wollen wir sogar zeigen
10
15
εA = 0 → {A0 → Aa}
(10)
Statt 2.) wollen wir sogar zeigen εA = 0 → {(a)(Aa → A(a )) → A(a)}
(11) 18
(10) ist so beweisbar: 0 = εA → (A0 → AεA)
aus Axiom der Gleichheit.
20
Ferner AεA → (a)Aa (a)Aa → Aa ∗∗∗
Def. von „alle“
AεA → Aa13
Um (11) zu beweisen, setzen wir in 4∗ für a : εA εA = 0 → εA = (δ(εA)
25
∗
Aus 3 (Blatt κ) wenn A : A und a : δ(εA): 14 εA = (δ(εA)) → A(δ(εA)),
also
εA = 0 → Aδ(εA) Andererseits
13 This
(a)(A(a) → A(a ) → A(δεA) → A(δεA) Aristotelisches Prinzip!
line is referred to on p. 19 below by way of the mark ‘∗ ∗ ∗’. here presumably refers to the sheet where κ was introduced, i. e., 16. The (3∗ ) there is just reformulated with ε used for κ, and with the substitutions indicated. 14 Hilbert
30
‘Logische Grundlagen der Mathematik’ (1923/24)
557
A → C15 B→D A → (B → C & D) 5
Aus A & B folgt C & D Aus C & D folgt A(δεA) Aus A folgt ausserdem nach 4∗ ∗∗
19
εA = (δ(εA))
ferner wegen des Gleichheitsaxioms 14: εA = (δ(εA)) → {A(δεA) → A(εA)} 10
Aus A und B folgt A(δεA) . Aus A folgt wegen ∗∗ A(δεA) → A(εA) Aus A und B folgt also A(εA). Ferner hatten wir ∗ ∗ ∗ auf Blatt 18
15
A(εA) → Aa; also folgt aus A und B auch Aa und das ist (11).
q. e. d.
Später zum Widerspruchsfreiheitsbeweis für 1–17 wird es also genügen den Widerspruchsfreiheitsbeweis für 1–15 und (1∗ ), (3∗ ), (4∗ ) zu führen.
20
25
Nun Beweisbarkeit auf Stufe IIII, trägt Bernays vor. Dann Widerspruchsfreiheit auf Stufe IIII. 1–15 16 A(a) → AεA 17 A0 → {(a)(Aa → Aa ) → Aa} Stufe IIII (a)Aa → (πA = 0)16 (a)Aa → (πA = 1) natürlich auch direkt mit ε! Beispiele für Definition von Funktionen durch π: Wenn (a)(b)(c){an + bn = cn → a = 0 ∨ b = 0} so soll ϕ(n) = 0, sonst = 1:
30
ϕ(n) = πabc {an + bn = cn → a = 0 ∨ b = 0} Ferner: Eine Menge von ganzen Zahlen kann dargestellt werden durch eine Funktion f(a), die 0 oder 1 ist, jenachdem die Zahl a der Menge zugehört oder nicht. 15 Hilbert clearly labels the foregoing with Gothic letters, so that A is εA = 0, B is the antecedent of the Aristotelian principle, D its consequent, and C is A(δεA). Hence, we indeed have the conditionals indicated. 16 See Kneser’s notes for the lecture of 21.2.1924 (below, pp. 636–638), where the discussion of the following examples begins with precisely these formulas; these matters are also treated on pp. 33f. of the Kneser Mitschrift for Winter Semester 1922/23, below, pp. 625f.
20
558
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Eine reelle Zahl r (0 < r 1) wird durch einen Dualbruch dargestellt und dieser wieder durch eine Funktion f(a); a Stellenanzeige. 0, f(0)f(1)f(2) . . . Periode 0 wird ausgeschlossen, damit Eindeutigkeit, in Formel (a)(fa = 0 ∨ fa = 1) & (a)(Eb)f(a + b) = 1 f < g etc. kann man alles ausdrücken. 21
Eine Folge von reellen Zahlen ist f(a, n), n Nummer der Zahl in der Folge. Durch simultane Rekursion, in der das π verwendet wird, kann man die obere Grenze einer Zahlenfolge erhalten, d. h., eine Zahl aufschreiben, von der dann die Eigenschaften der oberen Grenze beweisbar sind. 17
5
10
Widerspruchsfreiheitsbeweis der Stufe IIII. Hilbert indicates that the three pages numbered 20a, 20b and 20c should be inserted at this point. 18 20a
Angelegenheit der Beweisbarkeit erledigt. Die Möglichkeit der üblichen Analysis dargetan. Nun tritt die wichtigste Aufgabe an uns heran: der Widerspruchsfreiheitsbeweis. Wir haben zu 1–15 hinzugefügt: (16) (4∗ ) a = 0 → a = (δa) ausserdem das logische Auswahlaxiom (1∗ ) Aa → AεA (17) AεA → Aa (ε is eventuell eine Ausnahme) (3∗ ) εA = a → A(a) (18) εA = 0 → AδεA (eventuell ist die vorhergehende Zahl keine Ausnahme) AεA (Ea)A(a) AεA (a)A(a) (Definition für All- und Seinszeichen) 19 Ausserdem hatten wir noch die transfinite Funktion πA (a)A(a) → πa (Aa) = 0
15
20
25
(a)A(a) → πa (Aa) = 1 20b
12 Logische Axiome 17 This
discussion is also found in Hilbert 1923a, 163–164. insertion clearly represents somewhat older material which presents the transfinite axiom in the form (17). Hilbert adds (4*), (1*), and (3*) with their respective formulas. (The formula for (4*) is unchanged.) Further modifications are indicated in the two following notes. 19 The original definitions (i. e., AεA (a)A(a) and AεA (Ea)A(a)) were written down here, and then the current formulas obtained by inserting the letter ‘E’ in the first (before the ‘a’ in ‘(a)’) and crossing out the occurrence of ‘E’ in the second. 18 The
30
‘Logische Grundlagen der Mathematik’ (1923/24)
559
2 Gleichheitsaxiome a = 0 (16) a = 0 → a = (δa) 20 5
10
15
20
25
30
35
Bisher zum Widerspruchsfreiheitsbeweis folgende Schritte: Auflösung in Fäden; Ausschaltung der Variablen aus dem Beweise; Wegschaffung der Funktions- und Definitions-Zeichen; Unterscheidung zwischen richtig und falsch (richtig bei Gleichungen, wenn dasselbe Zahlzeichen auf beiden Seiten, sonst falsch. Wenn , &, ∨, → vorkommt, dem logischen Sinn entsprechend festgesetzt.) Entscheidender Schluss: Jede mathematische Formel entsteht entweder durch Einsetzung und Reduktion aus einem Axiom oder ist Endformel eines Schlusses oder stimmt mit einer vorhergehenden Endformel überein. 1) Wenn S richtig und S → T richtig, so ist auch T richtig. 2) Jede durch Einsetzung und Reduktion aus den Axiomen entstehende Formel ist richtig. 0 = 0 ist aber falsch. Nun überzeugen wir uns erst, dass bei Hinzunahme von (16) 21 der Beweis ebenso gilt a = 0 → a = (δa) entweder steht nach der Reduktion (Reduktion = Reduktion von Zahlzeichen) 0 = 0, dann richtig, oder a hat nach der Reduktion die Form z . Für δ(z ) ist nach Verabredung z zu setzen etc. Also auch richtig. Die expliziten Definitionen machen ja nie Schwierigkeit. Man setze an Stelle von (a)Aa überall AεA und an Stelle von (Ea)Aa überall AεA. Damit sind die All- und Seinszeichen aus dem Beweis beseitigt. Allerdings die a beim εa müssen stehen bleiben. 22 Die wesentlich neue Schwierigkeit ist dann die Frage der Reduktion der Funktionsschemata, denn es treten eben f (und π) auf in den Funktionalen von transfinitem Charakter. Bestimmte Aussagen können als Argumente von ε vorkommen, aber kein lateinisches A, keine Formel-Variablen, da solche durch Einsetzung fortgeschafft sind. S. 8 Correcturen. 23 Nun können die ε ja in sehr komplizierter Form auftreten. Wir machen da nun die vereinfachende und erleichternde Annahme, dass im Argument von ε immer nur ein einziges gewisses Prädikat A vorkommt und also darin gewiss kein weiteres ε. 20 The
text originally had ‘(1)’ here, but Hilbert alters this to ‘(16)’. text has ‘(1)’ here, but we have altered this to ‘(16)’ in line with the change marked in the preceding note. 22 Hilbert does not indicate the modifications required here. 23 We conjecture that this is a reference to the eighth page of the proofs for Hilbert 1923a, corresponding to p. 158 of the published version; there the argument for eliminating εsymbols is given for the simplified case described next. (This seems to apply also to the additional numerals on p. 3 of the present manuscript, p. 551 above.) 21 The
20c
560
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
This ends the insertion; the text continues with the remainder of p. 21.
21 ctd.
22
π kann man leicht in den Widerspruchsfreiheitsbeweis hineinnehmen. Circulus vitiosus von Weyl. Ideale Elemente! Was fehlt uns noch auf der Stufe IIII? 1.) Wir hatten die unbegrenzt vielen Definitionen durch Rekursion, wo wir nur das Schema angeben konnten und das Schema war auch zu eng. 2.) Wir haben noch keine Mengen von reellen Zahlen, insbesondere haben wir noch nicht den vollen Satz über die obere Grenze. Aber notwendig soll auch das Auswahlaxiom herauskommen. 24 Wir brauchen also, um Analysis und Mengenlehre zu begründen, notwendig höhere Variablen-Gattungen. Wir wollen den vollen Formalismus nicht entwickeln, aber das Prinzip desto deutlicher uns klar machen: ϕa (f (a)) Funktionsfunktion a (gebundene Variable) ist nur hingeschrieben, um den Character von f ersichtlich zu machen ϕ(f (a)) würde nur Funktion eines Funktionswertes bedeuten Auch: ϕa (f (a), b) Nun diese selbst als Argument. ψf (ga (f a)) ψf,b (ga (f (a), b)) Diese Schreibweise ist auch in der Aussage anwendbar: A(f ), A(f, a) A(g) Auch Indices zur Deutlichkeit. Here the manuscript appears to move directly from p. 22 to p. 25. 25
25 ctd.
1–15 16
Aa → Aεa A(a)
24 In Hilbert 1923a, 164–165, the principle of choice is proved for sets of sets of real numbers. 25 The page numbered 25 begins with ‘Mengenlehre und Analysis von Bernays’, perhaps to indicate that such a discussion is to be carried on at this point. On a new line, there is then some text ‘Wf-Beweis Circulus vitiosus’ (with some space between them), and ‘Stufe VI’ begins on yet a new line; both new lines have been crossed out. (The developments here, especially the move to the ‘6. Stufe’ are indicated in Kneser’s notes for the lecture of 25.2.1924, pp. 638–639 below.) Hilbert then appears to continue the discussion from p. 22 by beginning the list of axioms.
5
10
15
20
25
‘Logische Grundlagen der Mathematik’ (1923/24)
5
10
15
20
25
30
35
40
561
16∗ Af → Aεf A(f )C 17 A0 → {(a)(Aa → Aa ) → Aa} 18 a,b (f (a, b), k, n) 18∗ . . . Zur Erleichterung und Vereinfachung soll nur εf und auch nur mit einem A(f ) dahinter: εf A(f ). Man ersetzt nun probeweise εf A(f ) durch δ(a). Falsch werden kann nur eine Formel, die durch Einsetzung aus jenem kritischen Axiom 16∗ entsteht Aϕ → Aδ Aϕ müsste nun richtig sein. ϕ ist eine bekannte Funktion, die durch Einsetzung (und Rekursion) entstanden ist. Wenn ich nun diese Funktion ϕ an Stelle von δ nehme, so kann ich die Reduktion der Funktionale überall durchführen und die kritischen Formeln werden alle richtig; denn sie erhalten die Form: Aψ → Aϕ und hier ist Aϕ richtig. Mit dieser Andeutung muss ich mich begnügen. 26 Wir wollen uns klar machen, wie denn durch meine Beweistheorie die früher auftretenden und z. B. letztens von Weyl gerügten Lücken vermieden werden! Mit Hilfe des ε haben wir dort „alle“ und „es giebt“ gewonnen. Was heisst „alle“ f ? Da muss ich wissen, auf welchen Bereich bezieht sich f ? Nun das ist der Bereich derjenigen Funktionen, die ich für f einsetzen darf (die erlaubten Einsetzungen). Aber bei diesen Einsetzungen kann wieder εf A(f ) vorkommen. Also kann man in der Tat inhaltlich von einem circulus sprechen, aber dieser ist nicht vitiosus, sondern harmlos. Denn, wie unser Widerspruchsfreiheitsbeweis zeigt, würden sie auf einen Widerspruch stossen, dann müsste dieser sich auch ohne die Benutzung des ε herausstellen. Russell: Axiom der Reduzierbarkeit. Also es wird nicht das Reduzierbarkeitsaxiom allgemein bewiesen. Nur im Falle eines vorliegenden Widerspruchsbeweises müsste man in der Tat die Reduktion ausführen können. Wie man auf der Stufe V die reellen Zahlen durch Funktionen von gewisser Eigenschaft definiert und demgemäss — als Kurzzeichen — mit R bezeichnet hat, so kann man auch schon auf Stufe V die Zahlen der 2ten Zahlklasse als Funktionen 2er Grundvariablen mit gewissen Eigenschaften definieren und etwa mit H bezeichnen. Man könnte sogar den Kontinuumssatz formulieren. Man kann sogar wie sich Herr Bernays überlegt hat, den Satz, dass das Kontinuum wohlgeordnet werden kann, auf Stufe V beweisen. Man muss allerdings einen anderen Beweis für den Wohlordnungssatz dazu heranziehen, als ich vorgetragen habe. Trotzdem fehlt uns auf Stufe V noch viel. Wenn wir nun aber in der Weise wie die bekannte Theorie der transfiniten Zahlen es verlangt, über das ∞ hinüberzählen C
Hilbert has added to the right: εf (A(f )) ist jetzt natürlich selbst eine Funktion.
26 One
finds this discussion in Kneser’s Mitschrift for the Winter Semester 1922/23, pp. 38–39, below, pp.628f.
26
27
562
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
The text breaks off here. Hilbert adds the following in a much smaller hand, squeezed into the bottom margin of p. 27: — und wir wollen doch die ganze Mathematik inhaltlich-methodisch aufrechterhalten ohne Verbotsvorschriften und ohne Umgehungsmanöver — The next page is numbered 31. 31
32
Die Pointe ist eben, dass in jedem vorliegenden Beweis nur eine bestimmte Anzahl von λ vorkommt. Wegen des Vorkommens der ε kommen allerdings noch Schwierigkeiten, die aber kein Hinderniss abgeben, sondern nur von der Art der Schwierigkeiten auf Stufe V. Hier ist also die Stelle, wo der NichtArchimedische Gedanke seine Geltung hat — nur dass er hier nicht ins Unendlichkleine, sondern nun in einer Richtung auf das Unendlichgrosse geht — natürlich, man zählt doch nur über das Unendliche hinüber. f (a, b) O(f (a, b)) → N (v(f (a, b))) ganz mühsam, aber Andeutung. Abschnitt, ähnlich, ≺ v(f + 1) = v(f ) + 1 v(λf ) = λv(f ) Die Zahlen der 2ten Klasse sind ebenso unwiderleglich da, wie alle übrigen, ebenso sicher und ebensolche Realitäten und keine Gehirngespinste ebenso wenig wie die anderen Zahlen. Za & Zb → Zf ab f (a, b) . . . ? . . . N a → N f (a) 27
27 The fuller discussion in Kneser’s Mitschrift for the Winter Semester 1922/23, pp. 39–41, is particularly helpful here for rounding out Hilbert’s notes. See pp. 629ff. below. Kneser’s notes for the lecture on 28.2.1924 (pp. 641ff. below) present additional details.
5
10
15
20
Textual Notes
563
Textual Notes 550.3: 550.5: 550.8: 550.8: 550.8: 550.11: 550.13: 550.15: 551.5–6: 551.17: 551.18: 551.19: 551.20: 551.27: 552.2: 552.9: 552.12: 552.18: 553.16: 553.19: 553.28: 553.31: 554.1: 554.7: 554.12: 556.19: 556.25: 557.14: 557.16: 557.17: 557.18: 557.20: 557.27: 559.32: 561.25: 561.26: 561.28: 561.32:
Vorlesungsergänzung Wintersemester 1922/23] Vorl.-Ergänz 22/23 Disposition] Underlined twice. Definition] Def. Funktionen] Funktion und] u. Zahlentheorie] Zahlenth. und teilweise] u. teilw. und] u. Widerspruchsfreiheitsbeweis] W-f Beweis denen] denen [sich] Widerspruchsfreiheitsbeweis] W-f Beweis allgemeinen] allgem. Widerspruchsfreiheitsbeweis] W-f Beweis Repräsentantenmenge] Representanten Menge Allgemeinen] Allgem. εa (A(a, b))] εa (A(a, b) Aristotelisches Prinzip] Existential-Prinzip] Widerspruchsfreiheitsbeweis] W-f Beweis erstens] 1.) die eventuelle] d. ev. Widerspruchsfreiheitsbeweis] W-f Beweis alles] Alles alles] Alles 1.∗ )] 1.) (10)] 10 (11)] 11. 18] κ (11)] 11 Widerspruchsfreiheitsbeweis] W-f Beweis Widerspruchsfreiheitsbeweis] W-f Beweis Widerspruchsfreiheit] W-f Definition] Def. S. 8 Correcturen.] Preceded by an insertion sign: F Widerspruchsfreiheitsbeweis] W-f Beweis Russell] Russel Widerspruchsbeweises] W Beweises Zahlklasse] Zahlkl.
564
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Description of the Text Collection: SUB Göttingen, Cod. Ms. D. Hilbert 567 (manuscript). Size: 19.0 × 29.5 cm. Cover Annotations: — Composition: The text consists of 25 loose pages, handwritten on the back of galley proofs. Pagination: The numbering of the pages is as follows: one unnumbered page, 1–9, 16–20, 20a–c (also numbered 1–3 in pencil), 21–22, 25–27, 31–32. Original Title: The first page is entitled: ‘Vorl.-Ergänz W.S. 21/22 has been changed from: S.S. 22/23 // S. 1–26’. This is written at the top, but an an arrow positions it after the first line of ‘Stufe III’. The word ‘Disposition’ is also written at the top of the page and is underlined twice. Text: The text is written entirely in pencil. On the first page, the headings ‘Stufe II’ to ‘VIII’ are in blue pencil. No other markings in blue pencil are on the document. After the first paragraph of p. 7, an extra piece of paper has been pasted on. Page 16 has two small pieces of paper pasted onto it, the second of which is written in faint black ink and corrected with pencil (the back of paper shows writings in pencil). Pages 20a–20c have some corrections in dark blue ink; there are also corrections to the page numbers, which were originally 1–3. Pages 25–27 have corrections and additions in black ink. All pages of the second series are written on the back of galley proofs: pp. 1–5 (in Hilbert’s numbering) on proofs for Mohrmann 1923 (received at the Mathematische Annalen on 14 October 1922); pp. 6 and 9 on proofs for Walsh 1923 (received at the Annalen on 28 October 1922); pp. 8 and 9 on proofs for Pöschl 1923 (received at the Annalen on 5 October 1922; the back of p. 8 also bears a stamp from the printer with the date 6 January 1923); and pp. 20a–c on proofs for Study 1923 (received at the Annalen on 10 July 1921). The remaining pages are written on the back of galley proofs for Courant and Hilbert 1924 , with the page numbers 30, 35, 38–40, 56, 96, 151, 152, 306, 314, 315, and 317. Galley proofs for pp. 304–305 of this work are found in Kneser’s Mitschrift for the lectures in 1924 (reproduced as part of the Appendix to this Chapter, and beginning on p. 636 below); to judge from this, it seems likely that the same stack of scrap paper was drawn upon for both Hilbert’s notes and Kneser’s. The page 305 used by Kneser bears the stamp ‘Springer, Berlin. Courant-Hilbert, Mathem. Physik. // 1. Korrektur, 23.10.23’.
Appendix: Kneser’s Mitschriften
565
Appendix: Hellmuth Kneser’s Mitschriften of Hilbert’s lectures from 1921/22, 1922/23 and 1924
Introduction to Appendix
1. The Mitschriften. This Appendix presents additional notes on Hilbert’s lectures on the foundations of mathematics prepared in the years 1921–1924 by the mathematician Hellmuth Kneser. (These are Hilbert 1921/22b* , Hilbert 1922/23a* and Hilbert 1924* in the Bibliography.) The purpose of presenting these here is to provide more information about Hilbert’s lectures documented in this Chapter, above all those of 1922/23, and to obtain more context for Hilbert’s handwritten notes with which the Chapter finishes. Hellmuth Kneser was the son of the mathematician Adolf Kneser, and first attended (from 1916) the older Kneser’s university in Breslau. From Breslau, Kneser went to Göttingen, and did his doctoral work, directed by Hilbert, on the mathematics of quantum theory. After the award of the doctorate in 1921, Kneser remained in Göttingen, and was appointed to a teaching post in 1922. In 1925, he succeeded to a Chair at the University of Greifswald. Kneser was a very wide-ranging mathematician, doing important work in many areas, among them quantum mechanics, topology, analysis, geometry and group theory. Complete notes in Kneser’s hand survive for Hilbert’s lecture courses held in 1921/22 and in 1922/23. In addition, there are notes for lectures given by Hilbert in February 1924. All the notes are carefully and systematically prepared, written in a legible hand in largely complete sentences with relatively few corrections, even though it is likely they were taken down in the lectures
566
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
themselves. The dates of the actual lectures are carefully noted, and it is safe to assume that the Kneser notes provide a record of what was actually said at the lectures. It is not known whether Hilbert commissioned the notes, was ever shown them, or even knew of their existence. The notes were in the possession of the Göttingen mathematician, Martin Kneser, Hellmuth Kneser’s son, who kindly gave his permission for them to be used here. They are now found among the papers of Hellmuth Kneser in the Handschriftenabteilung of the Niedersächsischen Staats- und Universitätsbibliothek in Göttingen (Cod. Ms. H. Kneser). Kneser’s notes for Hilbert’s 1921/22 course (announced as ‘Grundlegung der Mathematik’) are written in three bound exercise books. The first lecture recorded is that for 31 October 1921, and the last for 3 March 1922. We present here roughly two-fifths of these notes, namely from halfway down page p. 12 of the second notebook to the end of the third notebook, i. e., some thirtytwo (out of seventy-six) pages. The point from where we begin to reproduce the notes marks the beginning of a new section starting halfway through the lecture from 26 January 1922; the extract then runs continuously to the end of the last lecture recorded. Kneser’s notes for Hilbert’s 1922/23 course (announced as ‘Grundlagen der Arithmetik’) are not written in notebooks, but rather on eleven large sheets of paper which have been folded in half and assembled to mimic signatures in a bound volume. The sheets are kept together in an envelope bearing the legend ‘Hilbert/Grundl. der Math./W. S. 22/23’. The lectures were delivered by Hilbert and Bernays: both presented at each meeting, and Kneser carefully identifies the speaker by marking ‘(H)’ or ‘(B)’ respectively at the beginning of the section where the relevant speaker starts or takes over. (For the sake of readability, our publication replaces these markings by ‘(Hilbert )’ and ‘(Bernays)’.) The notes for the 1922/23 course are reproduced below in their entirety. The notes for Hilbert’s lectures on 21, 25 and 28 February 1924 are also reproduced in their entirety. Whether they correspond to special or supplementary lectures, or whether they are isolated notes for part of a course which is otherwise not documented (perhaps the course noted as ‘Logische Grundlagen der Mathematik’ in Hilbert’s own Vorlesungsverzeichnis, but not listed in the official list of lectures) is not known. Kneser’s notes are found in the same envelope as those for the 1922/23 course, which somewhat loosely suggests that they represent supplementary lectures to this course. There are thirteen pages of text in all, separately paginated for the three sessions. The last half-page (the end of the notes for the lecture on 28 February) is marked ‘Andeutung über das Kontinuumproblem’, and begins the considerations which are later found in Hilbert’s Münster lecture (Hilbert 1926 ), which took place over a year later. As will be made clear, there is some correspondence between the content of Kneser’s notes and Hilbert’s handwritten notes reproduced above, and it should be noted that the first page of Hilbert’s notes begins with the declaration ‘Vorlesungsergänzung Wintersemester 1922/23’. Moreover, for reasons given in the Text Descriptions (that for Hilbert’s hand-
Introduction to Appendix
567
written text, p. 564, above, and that for this text, below, p. 645), it seems not unlikely that Hilbert’s notes and Kneser’s Mitschrift for the 1924 lectures were written within a short time of each other.
2. The Contents of the Mitschriften. The main purpose of including Kneser’s Mitschriften here is to elucidate Hilbert’s lectures of this crucial period. The 1921/22 lectures are represented in this Chapter by Bernays’s extensive Ausarbeitung. If we take Kneser’s notes as a record of the lectures as they were actually given, the Ausarbeitung corresponds to Kneser’s scheme almost exactly. As stated above, we give only the contents of the final third of Kneser’s notes. The part omitted corresponds to pp. 1–100 of the Ausarbeitung of Hilbert’s lectures, and adds nothing substantially new. The portion reproduced here takes up the lectures at the point where the Ausarbeitung begins to use new pagination, i. e., p. 1a (see above, p. 488), and then continues to the end. Indeed, this part of the Ausarbeitung begins with the summary statement ‘So ist nun der Stand der Frage nach den Grundlagen der Mathematik in der bisherigen Literatur’ (p. 1a, above, p. 488). The long excerpt from the Kneser notes begins: ‘Das ist der Stand der Frage nach den Grundlagen der Mathematik in der vorliegenden Literatur’ (p. 12 of the second notebook, below, p. 577). The content of the Kneser notes corresponds fairly well to that of the Ausarbeitung, although the presentation is not so expansive, a remark which applies both to the parts excluded and those included. The one notable exception to this correspondence is the presentation of the calculus for propositional logic. In Kneser’s notes (see pp. 21–22 of the second notebook, pp. 581ff. below), this is a system which uses only one connective, the conditional, and which therefore has no propositional axioms for negation; negation is only introduced in a restricted way, namely as the negation of identity between arithmetical terms via the primitive relation ‘ =’. The Ausarbeitung, however, gives two explicit axioms for full propositional negation, allowing for the negation of any formula. (See ibid., pp. 2–3 [second], above, pp. 493ff.) In other words, the formal propositional calculus given in the Kneser notes (and thus, one assumes, in Hilbert’s actual lectures) corresponds to that in Hilbert 1922b, the published version of lectures held in the spring and summer of 1921, whereas that in Bernays’s Ausarbeitung corresponds to the calculus given in Hilbert 1923a, the published version of a talk given in September 1922 in Leipzig. The move to full formula negation is important, for it is this which opens the way to the use of the classical quantification axioms. In fact, though, the actual lectures as recorded by Kneser represent something of an intermediate position between that of Hilbert 1922b and that of Hilbert 1923a; after the introduction of the calculus with restricted negation, Kneser several times writes down the formal negation A of a formula A; see in particular, pp. 25–27 (below, pp. 584ff.). This indicates, perhaps, that by this time (February 1922) Hilbert had already made the step to generalised nega-
568
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
tion, having defended restricted negation in Hilbert 1922b (op. cit., p. 173). (For discussion, see pp. 421–424 above.) The second item in this Appendix is the collection of Kneser’s notes for Hilbert’s course in the Winter Semester of 1922/23. In the main body of Chapter 3 above, we give Bernays’s Ausarbeitung for the first part of this course; that Ausarbeitung (which breaks off abruptly on p. 33; see p. 547 above) corresponds well to the first sixteen and a half pages of the Kneser notes, as is the case for Kneser’s notes for the 1921/22 course. It should be noted that on p. 7 of the Ausarbeitung, the reader is referred to pp. 52–69 of the Ausarbeitung for the 1921/22 course, a section which corresponds to all of ‘A. Die elementare Zahlenlehre’. This material is re-presented in Kneser’s notes, which tells us that this material was worked over again in the lectures. The subject then turns to the logical calculus. The Ausarbeitung refers the reader to pp. 1–20 of the Ausarbeitung for the lecture course ‘Logik-Kakül’ from the Winter Semester of 1920, reproduced here as the first part of Chapter 2. Again, the Kneser notes go briefly over this material. Both the Ausarbeitung and the Kneser notes then present the basic material of the predicate calculus and show how this can be used to express fundamental propositions in geometry. As for the part in Kneser’s notes which is not contained in Bernays’s Ausarbeitung, this tells us in detail what we otherwise would not know about Hilbert’s lectures for 1922/23. There is an axiomatisation for the propositional calculus (pp. 17–18, below, p. 612), which includes primitives for conjunction and disjunction, as well as the conditional; negation is also a primitive, and there are the same two negation axioms as there are in the system of Hilbert 1923a, though that system has only the conditional and negation as primitives. Then begins a careful exposition of systems of increasing strength extending basic arithmetic (similar to what today would be called primitive recursive arithmetic), eventually embracing the beginnings of analysis and set theory. The consistency proof for basic arithmetic is outlined in the main Introduction to this Chapter, pp. 425–427 above, and it was thought that this method could be extended to the more inclusive systems, the main technical device appealed to being the ε-operator for both individual and function variables. The notes for lectures in February of 1924 begin by going over some of the same ground as the 1922/23 lectures. The lecture for 21 February begins with the transfinite axiom 16, although this is stated (p. 636 below) as A(a) → A(εA) rather than A(εA) → A(a) as it is stated in February 1923. (See p. 31 of the Kneser notes, p. 623 below; cf. also the discussion in section 3 of the main Introduction to this Chapter, pp. 427ff.) In the 1924 notes, Hilbert appears to call the level of extension achieved by the 1923 presentation the ‘fourth and fifth levels’. In the lecture of 25 February 1924, Hilbert adds much more explicit axioms for generalised recursion, and also for extending the ε-axiom to cover function symbols (allowing the treatment of sets of real numbers), a procedure which had also been discussed in the 1923 lectures (see pp. 34ff. of the Kneser notes). Hilbert then moves to what he calls the ‘6te Stufe’, which now includes axioms for numbers of the second-number class, in particular
Introduction to Appendix
569
induction axioms. (See the notes for the lectures of 25 February 1924 (II and III), and 28 February 1924, below p. 640.) Finally, he moves to the seventh level, which he claims is sufficient to incorporate uncountability, though it is not entirely clear what axioms are to be added at this stage.
3. The Editorial Treatment of the Mitschriften. The editorial treatment of these texts follows the general guidelines set out at the beginning of the Volume. The notes are very well organised, and are written in an extremely legible hand, with rather few marginal remarks. Occasionally, we have altered Kneser’s layout in the interest of readability, and expanded almost all of his rather frequently employed abbreviations. These are sometimes hard to decipher, especially when they are forced into a cramped space, and this has occasionally required some intelligent guesswork. (An example is ‘rF’, squeezed into a very small space at the edge of a margin. The context suggests that this is indeed ‘rF’, an abbreviation for ‘richtige Formel’.) Kneser’s division into paragraphs is also sometimes hard to discern, especially after a line which ends close to the right-hand margin, and again we have occasionally had to make intelligent guesses. Kneser frequently uses Sütterlin script to represent certain concrete terms and formulas; we have rendered these systematically by Fraktur letters, this being the conventional printed equivalent. Punctuation has been added, almost always silently. In addition, we have added commas and (less uniformly) brackets to Kneser’s formulas. Kneser often writes both ‘A(a, b)’ and ‘A(ab)’ or ‘f n’, ‘f (n0)’ and ‘f (n, a + 1)’ all in the same breath, which suggests that the omissions here were effected simply to increase the speed of writing. We have attempted to introduce a measure of uniformity. There are different forms of emphasis employed (for example, underlining, double underlining, underlining with undulating lines); it is not clear whether these correspond to important distinctions, and they are all rendered here by italics, though sometimes the form of emphasis is noted. The dates of the lectures are always given by Kneser, sometimes as headings, though more often they are set in the margins. Since this Edition uses the margins to give both the page numbers of the texts and line numbers for the Volume page, the dates of the lectures have been given uniformly as headings. As well as the month and the day of the month, Kneser often, but not always, indicates the year, sometimes fully, but usually in the form ‘22’, as in ‘9.1.22’. We have uniformly given the years fully, expanding, for example, ‘9.1’ to ‘9.1.1922’, ‘9.1.22’ to ‘9.1.1922’.
4. The Nachschrift of Walter Peterhans. In addition to Kneser’s Mitschriften, we also possess a Nachschrift of Hilbert’s lectures in the period 1922–1924, prepared by Walter Peterhans. Peterhans was a student of mathematics and philosophy in Göttingen between 1921 and 1924, later becoming a prominent photographer. Frau Brigitte Peterhans
570
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
of Chicago kindly made the document available to the Editors; it is now in the possession of the Fotografische Sammlung of the Folkwang Museum in Essen, which granted permission to quote the passages set out in the following section. A brief description of it is given here. The title of Peterhans’s document reads: ‘DAVID HILBERT/Die Grundlagen der Arithmetik und Analysis/Nach der Vorlesung im Wintersemester 1922/23, bearbeitet von Walter Peterhans’; it consists of 157 pages. The first 97 pages of the manuscript are typewritten, using an italic typeface. Place has been left for formulas and symbols to be written in, and they have been carefully added. The final 59 pages present a handwritten compendium, which repeats the axioms of propositional and ‘transfinite’ logic and some of the most important theorems, together with careful derivations. There follows the formal derivation of some basic arithmetical propositions. The presentation, and the working out of the formal details, is meticulous throughout. The basic structure of Peterhans’s manuscript corresponds in large part with that of Kneser’s notes for the 1922/23 lectures. However, as one might expect in a Nachschrift, the presentation is more careful and less hurried, and the derivations when given are fully and carefully worked out. One example where this shows is the presentation of the main idea of the consistency proofs, where not only are the three different stages in the reduction of a ‘Beweisfigur’ to ‘richtige Formeln’ set out clearly, the procedure is carefully illustrated with a worked example, with explicit diagrams indicating the links (pp. 40–44). However, there are several respects in which the works differ. In the first place, it seems likely that Peterhans’s script was worked up much later than the lecture course it represents. Not only is this indicated by the very polished nature of the theoretical presentation (and the very extensive nature of the philosophical remarks: see the extracts below), but there is also clear textual evidence. This is shown, for instance, after Peterhans’s treatment of the consistency of the ‘transfinite case’, i. e., for the system where the ‘transfinite axioms’ are first introduced using the ε-axiom. (This corresponds to pp. 30ff. in the Kneser notes.) The proof, says Peterhans, is to be carried out in the ‘simplest case [einfachster Fall]’, when the ε-operator is applied to a single predicate A which itself contains no instance of an ε-term. Kneser in fact also treats just this ‘simplest case’ (see p. 36), and this is the case treated in Hilbert 1923a. After carrying out the proof, Peterhans goes on to say: The general proof of the consistency of the axiom system under consideration is set out by Herr Ackermann in his Dissertation, Göttingen, 1924.1
Ackermann registered for the doctoral examination on 5 February 1924, and in all probability his Dissertation (Ackermann 1924a* ) was handed in at this time. (The Promotionsurkunde was issued on 4 August 1924.) The Dissertation was published as Ackermann 1925 ; this was marked as received by Mathematische Annalen on the 30 March 1924. The dates of the lectures in which ‘the simplest case’ is treated are given by Kneser as 15 and 22 February 1923, 1 In
the original German, the passage reads:
Der allgemeine Beweis der Widerspruchsfreiheit des betrachteten Axiomensystems ist von Herrn Ackermann, in seiner Dissertation, Göttingen 1924, erbracht worden.
Introduction to Appendix
571
thus a year earlier than the date when Ackermann’s Dissertation was ready. (The date of receipt of Hilbert 1923a is 29 September 1922.) In other words, it seems that Peterhans’s Nachschrift was written very much in the light of Ackermann’s work. This may well explain the polished nature of Peterhans’s presentation. The second thing which distinguishes Peterhans’s manuscript is that it begins in a different way from the other descriptions we have of the 1922/23 lectures. Unlike the Kneser Mitschrift or the Bernays Ausarbeitung, the Peterhans Nachschrift opens with a section called ‘Kritik eines Versuchs zur Begründung der Analysis’, which begins with an account of the Peano axiom system, a system which is said to form an ‘implicit definition’ of the basic concepts, ‘zero’, ‘whole number’ and ‘succession’. The consistency problem is then raised for this system (p. 2): Before a definition through postulates can be accepted, it is clearly necessary that it [this definition] contains no contradiction. Is that the case for our system? We do not wish to discuss the invention of the axioms, and we wish to forget their intuitive meaning. Rather, we wish to attempt to demonstrate the logical consistency of the axioms.2
The third major difference is that there are occasional passages which complement other statements of the philosophical aims of Hilbert’s programme. In the following subsection, we give a series of extracts from the manuscript reproducing the most interesting philosophical passages found in Peterhans’s Nachschrift.
5. Extracts from Peterhans’s Nachschrift. Extract 1. Immediately after the consistency question for the Peano axioms for arithmetic has been explicitly raised, we find the following (p. 2): Ausdrücklich machen wir darauf aufmerksam, dass wir für System und Kritik der durch unsere Axiome bestimmten Arithmetik und Analysis die reine Logik vollständig voraussetzen, also insbesondere die Begriffe der konjunktiven Verknüpfung („und“), der disjunktiven Verknüpfung („oder“), der hypothetischen Verknüpfung („wenn-so“), der Negation, der Gleichheit. Wir versuchen, irgendwelche wohlbestimmten Dinge aufzuweisen, die wir miteinander in solcher Weise in Beziehung stehend denken, dass sich eine umkehrbar-eindeutige Zuordnung dieser Dinge und ihrer Beziehungen zu den in den Axiomen vorkommenden Subjektsbegriffen und ihren Beziehungen 2 In
the original German, the passage reads:
Damit eine Definition durch Postulate angenommen werden kann ist es offenbar notwendig, dass sie keinen Widerspruch enthält. Ist das für unser System der Fall? Wir wollen nicht die Erfindung der Axiome diskutieren, und wir wollen ihre anschauliche Bedeutung vergessen. Wir wollen die logische Widerspruchsfreiheit der Axiome nachzuweisen versuchen.
572
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
herstellen lässt. Dabei setzen wir die Beziehungen, die wir für die gegebenen Dinge annehmen, als widerspruchsfrei voraus. Wir bemerken nun, dass wir als solche Dinge jedenfalls keine endliche Menge ganzer Zahlen auswählen können um zu zeigen, dass sie den Postulaten genügen, und damit den Widerspruchsfreiheitsbeweis für das Axiomensystem zu führen, also für Beziehungen in einem unendlichen Bereich.
On p. 3, the passage continues: Es ist also unmöglich, die Axiome durch eine Zuordnung als widerspruchsfrei zu erweisen, die dadurch charakterisiert ist, dass das gegebene System der Gegenstände und ihrer Beziehungen abgeschlossen vorgelegt ist, und also einer Kontrolle fähig ist, welche uns volle Sicherheit gibt sowohl in bezug auf das vorgelegte wie auf das ihm zugeordnete System. Der Versuch, die Widerspruchsfreiheit des Axiomensystems der Arithmetik und Analysis durch ein uns aus der Kritik der Geometrie wohlbekanntes Verfahren kategorisch zu erweisen, indem wir die blosse Verschiebung des Problems durch die Zuordnung einer abgeschlossenen Theorie wieder aufzuheben versuchten, ist nicht geglückt.
Extract 2. In the section ‘Begründung der elementaren Zahlentheorie’, after the introduction of the number signs, there is the following passage (pp. 4–5): Die hiermit eingeführten Ziffern sind in der Kritik der Mathematik die Objekte der Theorie; wir abstrahieren von der inhaltlichen Bedeutung, die ihnen im System der Mathematik zukommt, insofern sie Objektszeichen sind. Der Gedanke, konkrete Gegenstände mit sinnlich erfahrbaren Eigenschaften mit einander zu vergleichen und eine empirische Untersuchung an die Stelle der logischen Analyse eines Begriffsfachwerks zu setzen (wie sie in der kritischen Geometrie ausgeführt wird), ist von entscheidender Bedeutung für die Kritik der Arithmetik und Analysis. Für die Kritik der elementaren Zahlentheorie genügt es, die Ziffern als konkrete Objekte der Theorie einzuführen. Wenn wir bei unseren kritischen Untersuchungen häufig von „Zahlen“ schlechthin sprechen, so meinen wir damit stets die Ziffern. Um unsere Zahlfiguren und ihre Handhabung bequem konstruieren und beschreiben zu können sind wir an die Reihenform ihrer Zusammensetzung gebunden. Aber hierin liegt nicht die Erschleichung einer Bedeutung für die Zahlfiguren der Kritik; denn die anschaulich-inhaltlichen Momente, welche in der Beschreibung und Konstruktion einer Figur auftreten, brauchen der Figur nicht als Bedeutung beigelegt zu werden.
Extract 3. On p. 6, we find the remark that the basic arithmetical judgements concern the ordering of the number-signs, i. e., a = b, a < b, a > b. There is then the following comment: Diese arithmetischen Urteile haben zwar einen räumlichen Sinn, aber keine metrische Bedeutung. Sie beruhen auf den anschaulich zu erfassenden Tatsachen, welche die Gestalt zweier Ziffern betreffen, aber nicht auf den
Introduction to Appendix
573
denkend zu erfassenden Verhältnissen zweier Grössen zur Einheit; sie teilen nicht Vorstellungen über Zahlen mit, sondern Tatsachen über Dinge.
Extract 4. On pp. 7–10, certain basic laws concerning the number-signs are justified, for instance, the commutative law of addition: a + b = b + a. Directly following this (pp. 10–11), one finds this remark: Zur Begründung der Axiome bemerken wir, dass es sich in allen Fällen nicht um reine Demonstrationen handelt; sonst wären z.B. die Zwischenglieder in den Begründungen überflüssig. Die Begründungen bestehen vielmehr in Demonstrationen und Beweisen, die abwechselnd aufeinander folgen. Für das kommutative Gesetz a + b = b + a z. B. geht die Begründung so vor sich, dass zunächst das assoziative Gesetz (a + b) + c = a + (b + c) zuhilfe genommen wird; sodann wird auf beiden Seiten des Gleichheitszeichens das Zahlzeichen a, das in a + (a + c) = a + (c + a) links und rechts an erster Stelle steht, weggelassen, und das hypothetischer Urteil: „Wenn a + (a + c) = a + (c + a), so ist a + c = c + a“ durch Demonstration begründet; u. s. f. Wir haben es also bei der Begründung der Axiome mit einer Verbindung von Demonstration und Beweis zu tun, mit Schlüssen aus Beobachtungstatsachen. Das ist der Erfolg unserer Einstellung, die Ziffern als konkrete Objekte in die Kritik der Mathematik einzuführen. Das Gleiche gilt im Gebiet dieser elementaren Zahlentheorie auch für die Begründung der Lehrsätze. Die Axiome sind nur im dem Mass, wie die Begründung zugleich Beweis ist, Obersätze der Begründung. Aber auch sie sind, wie wir gesehen haben, beweisbar, wesentlich mit Hilfe synthetischer demonstrierbarer Sätze. Ihre Einfachheit veranlasst uns, sie als Axiome auszuzeichnen.
Extract 5. On p. 15, a section entitled ‘Die Grenzen der Methode’ begins as follows: In der Analysis kommen wir mit der bisherigen Art der Betrachtung sinnlich gegebener Zahlzeichen nicht aus, welche bisher allein unsere mathematischen Urteile begründete. Zwar haben wir allgemeine Gesetze aufgestellt, wie z. B. das Gesetz a + b = b + a. Das ist aber nur die symbolische Formulierung des hypothetischen Urteils: „Wenn a und b gegebene Zahlzeichen sind, so ist das aus ihnen zusammengesetzte Zahlzeichen a + b dasselbe hinsichtlich seiner Gestalt, wie das aus ihnen zusammengesetzte Zahlzeichen b + a“. Dieses Urteil ist also wohl ein allgemeines Gesetz. Denn die beurteilten Gegenstände sind begrifflich bestimmt, nämlich als Zahlzeichen. Aber das Urteil handelt keineswegs von einer Klasse von Zahlen oder von einer Menge von Zahlen. Die ihm genügenden Objekte lassen sich wohl in eine Klasse zusammenfassen, aber diese Klasse ist nicht selbst Gegenstand des Urteils.
Further down p. 16, the passage continues: In der Analysis bedeutet dieser Existentialsatz aber etwas anderes; er sagt weder, welche Zahl jene Primzahl ist, noch dass man ein Verfahren zu ihrer Konstruktion besitzt. Er spricht eine Beziehung aus, welche im System
574
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
aller Zahlen besteht, unabhängig von unserer Erfahrung und von unserem Handeln. Die Mengen aller Zahlen von bestimmten Eigenschaften sind als abgeschlossene Gesamtheiten in der Analysis Gegenstände mathematischer Urteile. Wir wenden darauf die logischen Schlussformen an, insbesondere gebrauchen wir das tertium non datur, den Satz vom ausgeschlossenen Dritten, in transfiniter Weise, nämlich in der äquivalenten Form: „Die Eigenschaft A trifft entweder für alle Zahlen zu, oder es gibt wenigstens eine Zahl für die sie nicht zutrifft“. Dieses Urteil mag zwar logisch gesichert scheinen, aber der Gehalt seiner beiden Partialaussagen ist uns nur begrifflich und nicht anschaulich klar; denn auch der existentielle Teil des fraglichen Urteils ist, wie es in der Analysis gebraucht wird, nur eine Umschreibung der Aussage: Entweder e1 oder e2 oder e3 oder . . . (u. s. f. für die Elemente einer unendlichen Menge) besitzt nicht die Eigenschaft A. Dieses Urteil mag wahr sein, aber seine Partialaussagen enthalten keine Erfahrungswahrheit; sie entbehren der Evidenz, und diese Evidenzlosigkeit der Partialaussagen kann in ihrer disjunktiven Verknüpfung, welche mit dem Anspruch auf Vollständigkeit auftritt, höchstens vermehrt werden. Das finite tertium non datur: „Die Eigenschaft A trifft entweder für alle vorgelegten Ziffern zu, oder es gibt wenigstens eine unter den vorgelegten Ziffern für die sie nicht zutrifft“ verbindet mögliche finite Erfahrungsurteile über konkrete Objekte, sodass der von uns zugelassene finite Gebrauch der Logik die Rechtfertigung ihrer vollständigen disjunktiven Verknüpfung impliziert.
Extract 6. On p. 18, there begins a section called ‘Begründung der Arithmetik und der Analysis’, and the first subsection of this is called ‘Die Methode’ (pp. 18–22); we reproduce the whole of this subsection here: Es zeigt sich, dass wir die finite Einstellung beibehalten können, auch für die Beurteilung transfiniter Aussagen, so paradox das zuerst erscheint. Das ermöglicht die Methode des Logikkalküls. Wir werden die Prädikate, die wir hier den Gegenständen unserer Theorie beilegen, als Funktionen von Variabeln auffassen und entsprechend bezeichnen; derart, dass die verschiedenen konkreten Gegenstände die verschiedenen konstanten Werte der Variabeln darstellen; und derart, dass die von den beurteilten Gegenständen abhängige Richtigkeit oder Falschheit eines Urteils die einzigen beiden Werte der Funktion bilden. Z. B. sind „Primzahl sein“ und „Implizieren“ Prädikate, die wir als Funktionen mit einer beziehungsweise mit zwei Leerstellen ansehen und entsprechend bezeichnen können: P(.) beziehungsweise I(. , .). Das Urteil „9 ist eine Primzahl“ ist ein falsches mathematisches Urteil, das Urteil „9 ist eine Primzahl impliziert 9 ist eine Primzahl“ ist ein richtiges logisches Urteil, und dementsprechend ist die Falschheit der Wert von P(9) und die Richtigkeit der Wert von I(P(9), P(9)). Offenbar bezeichnen P(9) und I(P(9), P(9)) finite Aussagen, und diese Bezeichnungen selbst sind finite konkrete Objekte. Ferner gestattet uns diese Symbolik, geradeso wie die Sprache, die finite Darstellung von Urteilen, die eine transfinite Erkenntnis enthalten, indem wir z. B. das transfinite Urteil: „Für alle x gilt A(x)“ so darstellen: (x)A(x).
Introduction to Appendix
575
Wir können von der finiten oder transfiniten Bedeutung der Zeichen A(x), (x)B(x), C(y, z) u. s. f. abstrahieren und diese Zeichen selbst als die sinnesanschaulichen3 Objekte unserer Theorie betrachten. Alsdann handelt es sich darum, Operationsregeln für die Verknüpfung und für die Zerspaltung dieser Objekte aufzustellen, insbesondere um die Aufstellung von Regeln für das Operieren mit dem Allzeichen (x) und mit dem Seinszeichen (Ex), um das System der Mathematik zu erhalten; und darum, uns von der Widerspruchsfreiheit dieses Operierens zu überzeugen, um die Kritik der Mathematik abzuschliessen. Gewisse Figuren sind also die Gegenstände unserer Theorie. Als solche haben sie keine inhaltliche Bedeutung, wie in den Wissenschaften, deren Gehalt sie dadurch vermitteln, dass sie Begriffszeichen sind. Indessen besteht eine umkehrbar-eindeutige Zuordnung zwischen den Gegenständen unserer Theorie und gewissen Begriffen der Logik und Mathematik, und deshalb lassen sich unsere Figurationen auch inhaltlich deuten. Tun wir dies, so verlassen wir das engere Gebiet unserer Theorie; sei es, um uns davon zu überzeugen, dass sie uns ein exakteres Abbild begrifflicher Beziehungen liefert als die Sprache, und dass sie die Fehlerlquellen vermeidet, die diese dem Denken darbietet; sei es, um uns an dem bereits gesichert erscheinenden Gehalt unserer Erkenntnis darüber zu orientieren, nach welcher Richtung hin eine Erweiterung unserer Theorie notwendig oder erfolgversprechend sein mag, wenn dieser Ausbau selbst auch nach dem methodischen Prinzip der Theorie zu geschehen hat, und wenn wir die kritische Entwicklung unserer Theorie auch nicht auf die Bedeutung ihrer Gegenstände gründen. Wir zeichnen in unserer Theorie gewisse Kombinationen von Komponenten vor anderen aus, auf Grund von Axiomen, in denen die Komponenten in bestimmter Weise miteinander verknüpft sind, und von denen wir ausgehen, um nach bestimmten Regeln neue Kombinationen der Komponenten herzustellen. Die Logik heisst uns die Forderung der Widerspruchsfreiheit unserer Theorie aufzustellen. Wir bleiben aber nicht stehen bei der Forderung der begrifflichen Widerspruchsfreiheit; diese hat innerhalb unserer Theorie gar keinen Sinn, denn sie handelt nicht von Begriffen sondern von Figuren. Wir fordern, dass die Aussagen A und A nicht beide zugleich aus dem System der Grundformeln und Regeln erzeugbar sind, und erst die begriffliche Deutung dieser durch Schlüsse aus Beobachtungstatsachen erfahrbaren Eigenschaften unserer Figuren ergibt, dass wir damit zugleich die begriffliche Widerspruchsfreiheit der ihnen zugeordneten Gedanken gefordert haben. Was die Methode unseres Widerspruchsfreiheitsbeweises betrifft, so besteht sie in logischen Schlüssen aus Beobachtungsurteilen. Wir werden uns auf die Logik und auf die Erfahrung berufen, zum Nachweis der Widerspruchsfreiheit des Kalküls. Dabei wird die Ausbildung dieser Methode mit unserer Absicht in Übereinstimmung bleiben, die Widerspruchsfreiheit unserer Theorie nicht auf Grund einer begrifflichen Deutung ihrer Gegenstände zu zeigen. Wir versuchen nicht, unsere logischen und mathematischen Prinzipien einem Beweis zu unterziehen. Was unsere Kritik beweisst sind Er3 Above ‘sinnesanschaulichen’ is written by hand ‘(d. h. endlich überblickbaren)’. We have no reason to assume that the hand is not that of Peterhans.
576
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
fahrungssätze, die die Prinzipien zum Gegenstand haben, und von gewissen Eigenschaften dieser Prinzipien handeln. Mag man nun zugeben, dass wir nicht den logischen Zirkel begehen, die Logik also Beweisprinzip vorauszusetzen, um die die Logik und die Mathematik zu begründen, so kann es doch scheinen, unser Kalkül sei überflüssig, da er doch zu einem Gegenstand der empirisch-logischen Kritik gemacht werden muss, um seine Widerspruchsfreiheit einzusehen. Hierzu ist zu sagen, dass wir die inhaltliche Logik, wo wir sie kritisch gebrauchen, zugleich auch nur finit zur Anwendung bringen. Ihre Gegenstände sind uns nämlich sinnlich in unseren Figurationen gegeben, und wo wir die Begriffe „Alle“ und „Es gibt“ inhaltlich anwenden sind sie auf in endlicher Anzahl vorgelegte Gegenstände bezogen. Diese Tatsache gewinnt dann ihre rechte Bedeutung, wenn wir unter unsere Gegenstände Komponenten einführen, denen bei inhaltlicher Deutung transfiniter Charakter zukommt, während sie als Gegenstände der Kritik nur den finiten Gebrauch der Logik erfordern. So wird die Dunkelheit der transfinit gebrauchten Begriffe „Alle“ und „Es gibt“ vermieden und doch über die Grenzen ihres Gebrauchs Klarheit verbreitet. Indem wir nur die finite Logik anwenden, überzeugen wir uns davon, dass die systematische Entwicklung der materialen begrifflichen Erkenntnis der Mathematik nach den Gesetzen der formalen transfiniten Logik frei ist von Widersprüchen.
These extracts complement, in a most informative way, the earlier discussion in Bernays 1922a concerning the connection between existential axiomatics (and its transcendental assumptions) and the formal, axiomatic approach that is a crucial tool for Hilbert’s finitist consistency programme. Michael Hallett and Wilfried Sieg
Kneser Mitschrift: The lectures from 1921/22
577
Kneser Mitschrift: The lectures from 1921/22
Diarium II 26.1.1922 1
5
10
15
20
25
Das ist der Stand der Frage nach den Grundlagen der Mathematik in der vorliegenden Literatur. Danach ist nur die elementare Zahlenlehre einer einwandfreien Begründung fähig. (Damit fallen Analysis, Geometrie und angewandte Mathesis aus.) Und zwar — Logik braucht man überall — mit Hilfe der finiten Logik. Die transfinite Logik kam zunächst durch unbeschränkte An|wendung der Negation heran und des oder. (Es gibt ∞ Primzahlen oder alle Zahlen von einer gewissen an sind zerlegbar.) Natürlich bei (x) und (Ex) bei unendlichvielen x. Die finite Logik muß unter allen Umständen beibehalten und angewandt werden. Und nur diese. Wie soll man damit bei den ∞ vielen ganzen Zahlen auskommen, da wir doch die ganze Mathematik aufbauen wollen? Da werden wir die finite 2 Logik auf andere Figuren als die Zahlzeichen anwenden, (Der Grundsatz, alles auf Zahlenlehre zurückzuführen, hat geschichtlich seine Bedeutung: Weierstraß?) indem wir den Kreis der Zeichen, die nichts bedeuten, erweitern. Diese sollen den Begriffen, Axiomen, Formeln und Beweisen entsprechen. Dazu muß alles das streng formalisiert werden. Die inhaltlichen Überlegungen, das eigentliche Denken, üben wir nur an diesen Beweisen u. s. w., d. h. auf einer höheren Stufe, aus. Wir brauchen mehr Zeichen, z. B. 1) a = a 2) 1 + (a + 1) = (1 + a) + 1 (Axiome) und Regeln, daß wir z. B. aus a = a , 1 + 1 = 1 + 1 machen. So bekommen wir aber nicht einmal die Formel 2 + 3 = 3 + 2 (hier nicht inhaltlich, wie früher wo es 1 + 1 . . . war). Wir kommen mit mathematischen Zeichen allein nicht aus: 3) a = b → a + 1 = b + 1. 1 The notes for the lecture of 26.1.1922 begin on p. 11 of Kneser’s Mitschrift. They concern reflections surrounding Russell’s Axiom of Reducibility that are discussed more fully in Bernays’s Ausarbeitung, above pp. 486ff. The upper half of page 12 of the manuscript is not reproduced here. What follows is the text which begins below a loosely undulating dividing line drawn across the page. 2 The ‘f.’ (for ‘finite’) has probably been added.
12
13
14
578
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
30.1.1922
15
16
Die transfinite Logik kommt besonders durch „alle“ und „es gibt“ hinein. Wenn wir in der elementaren Zahlenlehre „alle“ sagten (alle Zahlen, die in diesem Beweise vorkommen), so war das nur Abkürzung für · · · + · · · + · · · ; „es gibt“ für · · · ∨ · · · ∨ · · · . Bei unendlich vielen Gegenständen können wir nicht sagen, daß sie alle da sind. Wir können sagen, wenn a eine Zahl ist, n so ist es auch a + 1 ; oder: es gibt eine Primzahl 22 + 1 > 1000 (nämlich 16 3 65337 = 2 + 1), das ist also eine Teilaussage. In der transfiniten Logik galt: 1. (Ex) P (x) ersetzbar durch (x) P (x) (tertium non datur) 2. (x) P (x) ersetzbar durch (Ex) P (x) Wie wird das jetzt? (Ex) P (x) heißt ja ich habe ein solches x daß P (x) gilt, will nur nicht sagen welches x. | Negiert heißt es, ich habe kein solches x. Damit weiß ich aber noch nicht (x) P (x). Da wir nur finite Logik anwenden, gelten 1. und 2. nicht bei unendlichem Bereich. Wir können 1. und 2. zur Definition von (x) und (Ex) einführen; dann gilt nicht das tertium non datur. Wir müssen (siehe oben) die finite Logik auf einen erweiterten Bereich anwenden. Man könnte denken, sie auf geometrische Figuren anzuwenden, um so zur Geometrie zu gelangen. Diese sind aber der elementaren Anschauung keineswegs gegeben. Es müssen also (siehe oben) Formeln sein: 1. a = a 2. 1 + (a + 1) = (1 + a) + 1 a kann durch Zahlzeichen ersetzt werden.A 3. a = b → a + 1 = b + 1 4. a + 1 = b + 1 → a = b4 5. a = c → (b = c → a = b) Schlußschema S: S S→T T Eine Formel, die herauskommt, heißt beweisbarB , d. h. wenn sie aus einem Axiom durch Einsetzen folgt oder nach 5. herauskommt, wo S und S → T wieder herauskommen. Der Beweis muß als Figur dastehen. Aus 1. (a : 1) 1 = 1 2 = 2 3 = 3C Aus 3. 1+2=2+1 1+2=3 nach 5. 3 = 3 → (1 + 2 = 3 → 3 = 1 + 2) Added to the right of the present line: 1 + (1 + 1) = (1 + 1) + 1 Added above ‘herauskommt . . . beweisbar’, and to the right of the ‘Schlußschema’: z. B. Beweis der Formel 3 = 1 + 2 C Added in the upper margin above this line and to the right: 2 Kurzzeichen für 1 + 1, 3 Kurzzeichen für 2 + 1 A
B
3 With respect to ‘Teilaussage’, see, for example, the Ausarbeitung of Hilbert’s lectures for 1921/22, p. 68 (above p. 470), and p. 3a (above, p. 489). It should be noted that 216 is actually 65536. 4 The fourth axiom was added by Kneser, with the first ‘4’ being altered to read ‘5’.
5
10
15
20
25
30
Kneser Mitschrift: The lectures from 1921/22
5
10
15
S : 3=3 also T : 1 + 2 = 3 → 3 = 1 + 2 S : 1 + 2 = 3 – – 3 = 1 + 2 ist also beweisbar. Wir werden dazu gedrängt, den Logikkalkül aufzunehmen, aber in ganz anderer Bedeutung. Anstelle eines Beweisgedankens, der durch die logischen Formeln inhaltlich fixiert und mitgeteilt wird, tritt ein Aufbau von Formeln, die nach bestimmten Regeln auseinander abgeleitet werden, selbst aber nichts bedeuten. (Erst nach Vollendung des ganzen Aufbaus können sie gedeutet werden.) Dieser Gedanke ist in den verschiedenen Kalkülen der Mathematik vorhanden. Diese 5 Axiome sind nur der allererste Anfang. Dazu muß eine vollständige Tafel der Regeln kommen. Wie steht es mit der Widerspruchsfreiheit? Das erscheint vollkommen sinnlos; es kommen | eben lauter beweisbare Formeln, die nichts bedeuten. Damit wir am Schluß aber die Sache deuten können, müssen wir das neue Zeichen = einführen. Wir sagen, ein Axiomensystem sei widerspruchsfrei, wenn a = b und a = b niemals beide beweisbar sein können. = wird definiert durch 6.
20
25
579
17
a + 1 = 1.
Wir beweisen die Widerspruchsfreiheit von 1, 3, 4, 5, 6. 5 (Das Denken dient nur dem Nachweis der Widerspruchsfreiheit.) Das ist in gewisser Hinsicht noch kein Fortschritt, denn die Zahlenlehre hatten wir schon. Doch ist es methodisch und auch sachlich etwas Neues, weil wir hier mit Formeln arbeiten, uns also der höheren Zahlenlehre und Algebra nähern. Hilfsatz. Eine beweisbare Formel enthält höchstens 2 →. Sei im Gegensatz ein Beweis mit einer Schlußformel mit mehr als 2 → da. Wir brechen den Beweis da ab, wo zuerst > 2 → in einer Formel stehen. Diese muß entweder aus einem Axiom durch Einsetzen — das geht nicht, da für die Variablen a, b, c darf nichts mit → gesetzt werden — oder als Endformel T eines Schlusses — dann hätte S → T erst recht > 2 →zeichen.
30
2.2.1922
35
Hilfsatz. Eine Formel a = b ist nur dann beweisbar, wenn a und b dasselbe Zeichen sind. 1. Durch Einsetzen aus Axiom 1. Klar. 2. Endformel eines Beweises. Es sei nicht an früherer Stelle eine solche Formel. T wäre a = b, Prämisse wäre S → a = b. 1) Entsteht diese Prämisse durch Einsetzen? Aus 3? a + 1 = b + 1. S : a = b ; a und b dürfen auch nicht dasselbe sein. S steht aber vor T, entgegen der Annahme. Ebenso aus 4. S : a + 1 = b + 1.
5 ‘1,
3, 4, 5, 6’ (the commas have been added) is underlined, as is the sixth axiom added on the line before this.
18
580
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
2) S → a = b sei Endformel eines Schlusses.
U U → (S → a = b) S→a=b
U→(
):
1) durch Einsetzen aus Axiom 5: S : b = c, U : a = c. Wäre c dasselbe wie b, so wäre U : a = b schon früher. Sonst wäre S schon früher von der Art. 6 2) U → (S → a = b) Endformel eines Beweises? V V → (U → (S → a = b)) 3 →zeichen, nicht beweisbar. U → (S → a = b)7
19
Wir kommen zum Beweise der Widerspruchsfreiheit. Wenn a = b beweisbar ist, ist b dasselbe wie a. Wir haben also zu zeigen, daß a = a nicht beweisbar ist.D | Durch Einsetzen höchstens aus 6. Aber a + 1 ist von 1 sicher verschieden. Also Schlußformel:
5
10
15
S S → a = a a = a S → a = a kommt nicht durch Einsetzen. Also U U → (S → a = a) S → a = a
20
2. Prämisse nicht aus Axiomen. Also V V → (U → (S → a = a)) U → (S → a = a)8
3 →zeichen! Geht also nicht!
25
Wir wollen die Axiome im Sinne des Integritätsbereiches erweitern, so daß wir die Zahlenlehre ohne vollständige Induktion haben. a + (b + 1) = a + b + 1 (a + 1) − 1 = a a − (b + 1) = (a − b) − 1 D
a·1 = a a · (b + 1) = a · b + a
Added in the lower margin: a = a → (a = b → a = b)
6 There is a thin line going from ‘Art’ directly up to the modus ponens figure just above, or possibly to the ‘U’. The import of this line is not clear. 7 This concluding formula has been added by the Editors. 8 This concluding formula has been added by the Editors.
30
Kneser Mitschrift: The lectures from 1921/22
5
Bei der logischen Begründung hatten wir ein Prädikat „Zahl sein“. Das brauchen wir auch hier. Natürlich nur ein Zeichen ohne Bedeutung Z (a). Auch das „es gibt“ wird nötig. Wir brauchen es nur so, daß wir das betreffende wirklich herstellen. Das „alle“ wird durch das Einsetzen für die Variablen ersetzt; „nicht“ durch =. Mit Z haben wir 3 Axiome. Z1
10
15
20
25
581
Za → Z(a + 1)
Za → (a = 1 → Z(a − 1))
Es gibt eine folgende Zahl
(Es gibt eine vorhergehende Zahl)
Statt 6. kommt Z(a) → a + 1 = 1. 20 Benutzung der Buchstaben: 1) 9 Individualzeichen 1, +, −, · , und griechische Buchstaben ϕ (∗, ∗) (Funktionen von Grundvariablen oder auch Funktionen), =, =, Z, →, (x)(alle). 2) Variable: lateinische Buchstaben: Grundvariablen, a, b, c ; variable Funktionen f ( ), Funktionenfunktionen. Große lateinische Buchstaben für variable Formeln. Für Variablen wird eingesetzt. 3) Zeichen zur Mitteilung (Metamathematik): deutsche Buchstaben a, b, . . . ; S für Formeln. Im Kalkül kommen nur 1) und 2) vor. Hiernach ersetzen wir Axiome 3 und 5 durch a = b → A(a) → A(b) (wo A eine Formel ist). Wir brauchen noch zwei Axiome der Ungleichheit: a = a → A, (a = b → A) → {(a = b → A) → A} Die vorigen Schlüsse (höchstens 2→) werden durch die variablen Formeln S S→T gestürzt. Wir brauchen andre Schlußweisen als S → T , z. B. T → U . T S→U Wir wollen aber nur dies 10 und nehmen die anderen als logische Axiome hinzu, fünf an der Zahl 11 : A → (B → A), {A → (A → B)} → (A → B) {A → (B → C)} → {B → (A → C)} (B → C) → {(A → B) → (A → C)} 6.2.1922
30
Was ist eine Formel?
35
Ein Zeichen, zusammengesetzt aus individuellen und variablen Zahl- und Funktionszeichen ohne =, =, →, in dem alle Leerstellen ausgefüllt sind, heiße Funktional. Ein Funktional kann in jede Leerstelle eingesetzt werden. Sind a und b Funktionale, so sind a = b und a = b und Z(a) 9 The
‘1)’ (but only this) is underlined in the text. the text, an arrow points from the ‘dies’ to the modus ponens figure. 11 Only the following four logical axioms appear, as in the table on the following page. 10 In
21
582
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Primformeln. Setzen wir Prim- oder variable Formeln beiderseits eines →, so entsteht eine Folgeformel. Allgemein: Sind A und B Formeln (variabel oder schon vorher aufgestellt), so ist auch A → B eine. Gewisse Formeln, die als Grundsteine dienen sollen, heißen Axiome.
Tafel der Axiome 12
5
I. 4 logische Axiome 1. A → (B → A) 2. {A → (A → B)} → (A → B) 3. {A → (B → C)} → {B → (A → C)} 4. (B → C) → {(A → B) → (A → C)} Wir beweisen die Formel des Kettenschlusses: 4.
(B → C) → {(A → B) → (A → C)}
10
13
In 3 für A, B → C; für B, A → B; für C, A → C: [(B → C) → {(A → B) → (A → C)}] → [(A → B) → {(B → C) → (A → C)}] Schlußschema! T : (A → B) → {(B → C) → (A → C)}. w. z. b. w. Wir können hieraus mit Hilfe der einzigen Schlußregel andre Hilfsregeln aufbauen.
15
II. 2 Axiome der mathematischen Gleichheit
22
2. a = b → {A(a) → A(b)}
1. a = a
III. 2 Axiome der mathematischen Ungleichheit 1. a = a → A
20
2. (a = b → A) → {(a = b → A) → A} IV. 3 Axiome 14 über Z
1. Z(1) 3. Z(a) → {a = 1 → Z(a − 1)}
2. Z(a) → Z(a + 1) 4. Z(a) → a + 1 = 1
V. 4 Axiome der Rechnung 1. (a + 1) − 1 = a 3. a + (b + 1) = (a + b) + 1
2. (a − 1) + 1 = a 4. a − (b + 1) = (a − b) − 1
Damit können wir z. B. a = b → a + 1 = b + 1 beweisen. In II 2, für A, c + 1 = a + 1: a = b → (c + 1 = a + 1 → c + 1 = b + 1) hier für c, a a = b → (a + 1 = a + 1 → a + 1 = b + 1) A → (B → C) In I 3: {A → (B → C)} → {B → (A → C)} B → (A → C) 12 The
axioms here, as in Groups II–IV below, are framed by a rectangle. is clearly meant as the first premise in the following modus ponens schema. 14 In fact, four axioms; the fourth was apparently added later. 13 This
25
30
Kneser Mitschrift: The lectures from 1921/22
583
In II 1, a + 1 für a: B B → (A → C) A→C
w. z. b. w.
Ebenso ist a = c → (b = c → a = b) überflüssig geworden. In II 2 für A(a), a = c: a = b → (a = c → b = c) a = b → (a = a → b = a) für c, a nach I 3 wie vorher: a=b→b=a II 2: c = a → (b = c → b = a) Wir brauchen die Hilfsregel: V→W I4 (V → W) → {(U → V) → (U → W)} (Metamathematik) (U → V) → (U → W)
5
10
23
Habe ich auch U → V, so kann ich auch U → W beweisen u. s. w. 15
20
25
Auch a + 1 = b + 1 → a = b können wir beweisen: II 2 a + 1 = b + 1 → ((a + 1) − 1 = (b + 1) − 1)E u. s. w. Multiplikation brauchen wir noch nicht. Die vollständige Induktion lassen wir wegen der Schwierigkeit beiseite. So wollen wir die Widerspruchsfreiheit von I–V beweisen. (+ und − sind individuelle Funktionen: a + b : σ (a, b); a − b : δ (a, b).) Wir müssen die Funktionale auf eine Normalform bringen. Wir schreiben für + und −, σ und δ und nehmen ein innerstes σ oder δ, d.h. in dessen Leerstellen weder σ noch δ steht, also nur 1+1 oder 1−1. Das sind normierte Zeichen. Normierte Zeichen sind (((1 + 1) + 1) + 1) und 1 − 1, (1 − 1) − 1, . . . , die ersteren Zahlzeichen. Nehmen wir ein innerstes; das ist σ oder δ mit normierten Zeichen. 15 1.) ist das zweite Argument 15 1 d. h. σ δ (n, 1) , so setzen wir n + 1 bez. n − 1 und normieren, d. h. +1 − 1 oder −1 + 1 wird weggelassen, ebenso unnötige Klammern.
30
2.) σ δ (m, n). Ist n n + 1, so wird σ(m, n ) + 1 und setze das Verfahren fort.
Hilfsatz der Metamathematik. Wenn ein Funktional a das keine Variablen enthält in ein normiertes Zeichen n umgeformt wird, so ist a = n eine beweisbare Formel. Interlineated below this line is added a reminder of Axiom II 2, and directed to this point with an insertion line: a = b → f (a) = f (b) E
15–15 The
text appears to have ‘1σ δ(n, 1)’; the expression has been modified by the Editors to accord with the notation in 2.).
24
584
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
9.2.1922
25
Zum Beweise dienen a = b → f a = f b, a + (b − 1) = (a + b) − 1, a − (b − 1) = (a − b) + 1 und die Axiome V. Wenn in der Primformel Z(a) das Funktional a keine Grundvariable enthält und das aus a durch Normierung entstehende normierte Zeichen ein Zahlzeichen z (((1 + 1) + 1 . . . ) + 1) ist, so heißt die Primformel richtig, ist das normierte Zeichen (1 − 1) − . . . , so heißt sie falsch. Wenn in der Primformel a = = b a und b keine Grundvariable enthalten, so dieselben sind, sonst falsch. heißt sie richtig, wenn die normierten Zeichen verschieden Logische Normierung von außen her. Haben wir eine Formel (mit Variablen und →) A → B, so setzen wir (rein formal) A∨B und setzen dies fort, wobei an Stelle von A → B A & B tritt. So wird das → beseitigt. | Die Verknüpfungen & und ∨ werden formal ausmultipliziert wie im Logikkalkül. So erhalten wir eine logische Summe von logischen Produkten aus überstrichenen oder nicht überstrichenen Primformeln. Dies heißt die Normalform. Wenn ich für die Variablen und variablen Formeln einsetze, so daß alle Variablen fortfallen, so könnte es sein, daß in jedem Summanden mindestens ein Faktor eine richtige oder überstrichene falsche Formel ist. Dann heißt die ursprüngliche (nicht normierte) Formel einsetzungsrichtig. Hierzu wird kein Gegenteil gebildet. Im folgenden soll die Widerspruchsfreiheit der Axiome I–V (S. 21–22) bewiesen werden, d. h. daß nicht zwei Primformeln a = b und a = b zugleich beweisbare Formeln sein können. Einfacher ausgedrückt: daß 1 = 1 nicht beweisbar ist. Das ist dasselbe:
5
10
15
20
1) 1 = 1, 1 = 1 ist a = b, a = b; 2) wären a = b und a = b beweisbar, so folgt aus II 2 mit c = a für A(a) und b für c: 16 a = b → (b = a → b = b)
Einsetzen b, a
b = a → (a = b → a = a)
a=b b=a
(a = b → a = a),
also
S S→T T
a = b
a = a in III 2 für a, b : a; für A: 1 = 1 da wird 1 = 1 beweisbar. 17 16 Kneser
clearly means that A(a) should be b = a. proof that 1 = 1 is provable in case a = b and a = b are both provable can be reconstructed as follows. By the replacement indicated, one obtains (from II 2) b = a → (a = b → a = a). a = b is assumed to be provable and thus we also have b = a. With the modus ponens inference indicated, one obtains a = b → a = a. However, a = b is also assumed to be provable, thus a second use of modus ponens yields a = a. Now using III 1 with the replacements indicated, 1 = 1 can be inferred. 17 The
25
30
Kneser Mitschrift: The lectures from 1921/22
5
585
1 = 1 ist eine Primformel. Sie ist sicher nicht einsetzungsrichtig. Wenn wir zeigen könnten, daß jede beweisbare Formel einsetzungsrichtig ist, so wüßten wir, daß die (falsche) Formel 1 = 1 nicht herauskommen kann. Das wollen wir tun. Wir zeigen: 18
26
1) Alle Axiome sind einsetzungsrichtig. 2) Eine erlaubte Einsetzung macht aus einer einsetzungsrichtigen Formel wieder eine einsetzungsrichtige Formel. 10
15
20
25
3) Ist S eine einsetzungsrichtige Formel, S → T ebenfalls, so ist auch T eine einsetzungsrichtige Formel. 2) ist selbstverständlich. Für 1) 19 nehmen wir erst die Axiome ohne variable Formeln. II 1 ist. Denn 20 man setze für a ein Funktional a ohne Variablen. Man normiert; es entsteht eine richtige Formel. IV 1 21 ist eine richtige Primformel. IV 2: Z(a) ∨ Z(a + 1) einsetzen für a (1 + 1) + · · · + 1 oder (1 − 1) − 1 . . . ; im ersten Fall ist a + 1 ein Zahlzeichen, Z(a + 1) ist richtig, sonst ist Z(a) falsch. Also ist IV 2 einsetzungsrichtig. IV 3: Z(a) ∨ a = 1 ∨ Z(a − 1). Einsetzungen: a: 1 + 1 + . . . 1, Z(a − 1) ist richtig. a: 1, a = 1 ist falsch. a: 1 − 1 . . . , Z(a) ist falsch. IV 4: Z(a) ∨ a + 1 = 1 ebenfalls. Die 22 Axiome V folgen aus der Normierung sofort als richtige also einsetzungsrichtige Formeln. In den übrigen Axiomen können beliebige, auch Folgeformeln eingesetzt werden. Dazu Vorbereitungen! Was wird aus einer Formel durch überstreiund ??? 23 vertauscht.F chen? Es werden & und ∨, A ∨ A ist immer einsetzungsrichtig. F
Added in the left-hand margin: (A ∨ B) → (C & D & E)
18 In the left-hand margin, there is a vertical undulating line spanning the 1)–3) listed below; its significance is not clear. Proof sketches for 1) and 2) follow immediately; a sketch for 3) is on p. 28 of the Mitschrift. 19 In the left-hand margin next to ‘2)’ appears a ‘2’, and next to the line beginning ‘Für 1) . . . ’ there appears a ‘1’. These numbers were presumably added as notes indicating that the first and second cases of the three have been dealt with. 20 In the margin to the left of ‘Denn’ is written ‘II 1’. 21 ‘IV 1’ appears at the beginning of a line. To the left of it in the margin is written ‘IV’. ‘IV 1’ appears to be underlined, as is ‘IV 2’ below. However, ‘IV 3’, ‘IV 4’ and ‘V’ below are not underlined. It is unclear what distinction the underlining serves. 22 To the left of this in the margin is written ‘V’. 23 What has been marked here by ‘???’ (thus, indecipherable word) appears to be a loosely drawn circle. Roughly the same ‘symbol’ also stands under the ‘ ’. It could therefore be that the ‘circle’ is a form of placeholder to help show that what appears as overlined (negated) is to be exchanged for the same thing not overlined (unnegated). The reader should compare the detailed discussion in the official notes, pp. 28ff., pp. 513ff., above.
27
586
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
20.2.1922 z. B. setzen wir A ∨ B & C ∨ D ∨ E mit Primformeln A . . . für A, so kommt (A ∨ B & C ∨ D ∨ E) ∨ ((A & B) ∨ (C & D & E)). In jedem der 12 Glieder (nach Ausmultiplizieren) steht A ∨ A oder B ∨ B, . . . . A, B, . . . sind als Primformeln richtig oder falsch. Also einsetzungsrichtig. Setzt man vor eine einsetzungsrichtige Formel einen beliebigen logischen Faktor, so bleibt sie einsetzungsrichtig. Die logische Summe einsetzungsrichtiger Formeln ist einsetzungsrichtig. I 1: A ∨ B ∨ A usw.
A → (A → B) ∨ A → B
(A & A → B) ∨ A ∨ B , III 1: 2:
5
(A & A & B) ∨ A ∨ B
10
a = a ∨ A a = a ist falsch; also einsetzungsrichtig. a = b → A ∨ a = b → A ∨ A; (a = b & A) ∨ (a = b & A) ∨ A; entweder a = b oder a = b werden richtig.
28
II 2:
a = b ∨ A (a) ∨ A (b) für a und b normierte Zeichen m, n.
15
1) m ist dasselbe Zeichen wie n, A ∨ A; 2) m = n ist richtig. Auch Anwendung des Schlußschemas liefert einsetzungsrichtige Formel. Sei also S (und S → T) einsetzungsrichtig in der Normalform S:
P ∨ Q ∨ R & P∗ ∨ Q∗ ∨ R∗ & . . . ∗
S → T: (P & Q & R ) ∨ (P &
Q∗
& R ) ∨ ... ∨ T
bei irgend einer Einsetzung ist in S in jedem Glied mindestens eine richtige Primformel unüberstrichen oder mindestens eine falsche Primformel überstrichen, also in S in jeder Klammer mindestens eine richtige Primformel überstrichen oder eine falsche Primformel unüberstrichen. Suchen wir aus jeder Klammer ein solchesG , so gibt das einen Summanden der normierten Formel S → T: . . . & U ∨ V ∨ . . . ∨ T1 , wo U, V . . . richtige Formeln überstrichen oder falsche Formeln unüberstrichen sind. Da S → T einsetzungsrichtig ist, muß das einzig übrige T1 einsetzungsrichtig, also ganz T einsetzungsrichtig sein. 1 = 1 ist nicht einsetzungsrichtig. Damit haben wir die Widerspruchsfreiheit von I–V. 24 Bisher hatten wir nur Addition und Subtraktion. Für Multiplikation genügen: G
Added in the left-hand margin: und ein Glied T1 von T
24 Kneser
has enclosed this line in a box.
20
∗
25
30
Kneser Mitschrift: The lectures from 1921/22
a·1 = a
5
10
15
20
25
a · (b + 1) = a · b + a
587
a · (b − 1) = a · b − a
Nun ist wieder Widerspruchsfreiheit zu beweisen. Wir müssen | ein Funktional ohne Variable auf eindeutige Weise normieren. Ich fange von innen an, achte nur auf Punkte, und kann beim ersten μ annehmenH , daß es normierte Argumente hat. In m · n setze ich für jede 1 in n das Zeichen m und normiere usw. Die 3 Multiplikationsaxiome sind einsetzungsrichtig. Hilfsatz dazu: Sind m und n normierte Zeichen, so sind (n + m) − m = n und (n − m) + m = n richtige Formeln. Wir wollen zu weiteren endlich definierten zahlentheoretischen Funktionen aufsteigen. 1) Durch Einsetzen erhalten wir ganze rationale Funktionen. 2) Durch Rekursion. Sei g0 ein bekanntes Funktional: f0 (1) = g0 Z(a) → f0 (a + 1) = g1 (a, f0 (a)) mit einem bekannten Funktional g1 f1 (a, 1) = h0 (a) Z(b) → f1 (a, b + 1) = h1 (a, b, f1 (a, b)) Fügt man dies ein, so ist wieder Widerspruchsfreiheit zu beweisen. Hier zeigt es sich, daß es nicht genügt die Axiome zu behandeln, sondern daß die Begriffsbildungen neue Beweismöglichkeiten eröffnen. Z. B. k(a, b) die kleinere von a, b; k(a1 , . . . , an ), wo n auch Variable ist; auch z. B. f (a) = 1 für Primzahl a, sonst 0; oder a/b Axiome: b · ab = a, ma a 25 mb = b ; >: Z(a) → a · b > b; Z(a) → (Z(b) → (a > b → Z(a − b))). Wir sagen von einer beliebigen Formel ohne Variablen sie sei richtig oder falsch, je nach dem 26 nach Normierung in jedem Glied u. s. w. (einsetzen gibts nicht). Eine Primformel soll von jetzt an nur richtig oder falsch heißen, wenn nur normierte Funktionale vorkommen. 23.2.1922
30
Zu unseren Axiomen I–V haben wir alle die Axiome für die besonderen Funktionen hinzugenommen, die wir anwenden. Der Beweis der Widerspruchsfreiheit gelingt mit den bisherigen Mitteln. Daher soll er nur skizziert werden. Da die Funktionen der Reihe nach eingeführt werden, soll nur die Einführung einer behandelt werden. H There is vertical line in the left-hand margin immediately to the left of the first three lines, running from ‘ein Funktional’ to ‘μ annehmen’. To the left of this in the margin is added: a + b σ (a, b) a·b μ (a, b) 25 The examples of functions, from ‘auch z. B. f (a) = 1 . . . ’ to this point, are all squeezed into the bottom margin; there is a short vertical line separating off the treatment of ‘>’ from the rest. The date of the next lecture (‘23.2’) is written alongside the last line proper of p. 29 of the notebook page (a line which begins ‘Z. B. k(a, b) . . . ’), but is crossed out. 26 Here, ‘sie einsr. oder nicht’ has been crossed out.
29
30
588
31
32
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Eine Primformel soll von jetzt an nur richtig oder falsch heißen, wenn nur normierte Funktionale vorkommen. 27 Zugleich wird der vorige Beweis einfacher, da wir den Begriff richtig erweitert haben. Wir beweisen dann, daß in unserer jetzigen Sprache die Axiome, wenn wir durch Einsetzen die Variablen entfernen, richtig werden. Es soll Einsetzen und Schlußschema abwechseln und immer nur eines eingesetzt werden und zugleich immer vollkommen neue Variable eingeführt werden. Ich fange den Beweis von hinten an. Da steht 1 = 1. | Wo werden die letzten Variablen beseitigt? Vorangehen muß ein Schlußschema. 28 Man kann alle Variablen herausschaffen, so daß man nur in die Axiome (verschiedene) Konstante einsetzt. Da wir aber wissen, daß die Axiome einsetzungsrichtig sind, kann so keine falsche Formel herauskommen.I Jetzt braucht man nur so, wie es bei den besonderen auch durch Rekursion definierten Funktionen −, · geschehen ist, eine allgemeine Funktion zu normieren, z. B. (1 + 1) · f0 (f0 (1)). Wir nehmen das innerste f0 . Dies hat ein normierbares Argument. Ist es ein Zahlzeichen, so wenden wir die Rekursion an und setzen für f0 (1) g0 . Ist es kein Zahlzeichen, so setzen wir für f0 (1 − 1) 1. (Denn durch Rekursion wird f0 nur für Zahlenargumente definiert.) Mit dieser Normierung sind auch die hinzugefügten Axiome einsetzungsrichtig. Uns fehlt noch ganz das Axiom der vollständigen Induktion. Man könnte meinen, es wäre {Z(a) → (A(a) → A(a + 1))} → {A(1) → (Z(b) → A(b))} Das ist es nicht; denn man setze a = 1. Die Voraussetzung 29 muß für alle a gelten. Wir haben aber noch gar kein Mittel, das alle in die Voraussetzung zu bringen. Unser Formalismus reicht noch nicht hin, das Induktionsaxiom aufzuschreiben. Aber als Schema können wir es: Wir erweitern unsere Beweismethoden durch das nebenstehende Schema. Jetzt ist es vernünftig, zu fragen, ob das K(1) Schema zum Widerspruch führen kann. II K(a) → K(a + 1) Es stehe am Schluß 1 = 1. Wir normieZ(a) → K(a) ren von hinten und beseitigen die Added in the left-hand margin: (Das gilt nur für den Beweis einer Formel ohne Variablen.) I
27 This sentence is repeated from the end of the notes for the lecture on 20 February, which finish just before this on the same page of the notebook; Kneser singles it out and directs it here by means of an arrow. It seems likely that it was not meant to be repeated, but rather just moved. It is also quite possible that the sentence is emphasized (underlined) only because it was being singled out for transposition. 28 There follows a three line space in Kneser’s manuscript. 29 An arrow in the manuscript points here to the antecedent in the alleged statement of the principle of complete induction.
5
10
15
20
25
30
Kneser Mitschrift: The lectures from 1921/22
589
Variablen, bis wir an ein Schema II kommen. Ich setze für die Variablen a, a , b , . . . 1. Wenn dann a ein Zahlzeichen z ist, so kann ich K (z) durch sukzessive Anwendung von K (a) → K (a + 1) beweisen.
Diarium III
5
23.2.1922 Fortsetzung
10
15
Also ist auch Z(z) → K(z) beweisbar. Wenn aber a kein Zahlzeichen wird, so ist a fortiori Z( ) → K( ) richtig, da Z( ) falsch ist. An dieser letzten Stelle hätte ich daher das Schema II vermeiden können u. s. w. Man könnte also 1 = 1 auch ohne Schema II beweisen, was nicht der Fall ist. Es ist unschön, daß wir ein zweites Schema eingeführt haben. Wie werden wir unsere Ausdrucksmittel erweitern? „All“zeichen 30 . (a) {A(a) → A(a + 1)} → {A(1) → (Z(b) → A(b))} Wir hatten bisher nur „freie“ Variable; d. h., Allzeichen (die wir daher nicht zu schreiben brauchten), deren Wirkungsbereich die ganze Formel ist. Vertauschbarkeit der Allzeichen mit demselben Wirkungsbereich wie früher. Ferner: für (a)(B → A(a)) (B enthalte a nicht) schreiben wir B → (a)A(a)). Jetzt kann ich nicht mehr die Variablen wegschaffen. Nur freie Variable kann man wegschaffen. 27.2.1922
20
25
30
35
1
Nicht endlich (durch Rekursion) definiert ist z. B., ϕ (a) = 0 wenn es ein b gibt, so daß a5 + ab3 + 7 Primzahl ist. sonst = 1 Aber erst bei solchen Zahlen und Funktionen beginnt das eigentliche mathematische Interesse, weil dort die Lösbarkeit in endlich vielen Schritten nicht vorauszusehen ist. Wir haben die Überzeugung, daß solche Fragen wie nach dem Wert ϕ(a) lösbar, d. h. daß ϕ(a) doch endlich definierbar ist. Darauf können wir aber nicht warten; wir müssen solche Definitionen zulassen; sonst würden wir den freien Betrieb der Wissenschaft einschränken. Auch den Begriff der Funktionenfunktion brauchen wir. Diese Begriffsbildungen führen zur Analysis hinüber. Z. B., 31 das kleinste Argument κ(f ), für das f (a) = 1 ist. (Brouwer und Weyl, die das Verstümmeln und Zerstückeln der Mathematik so eifrig betreiben, lassen so etwas nicht zu; auch bei Kronecker ginge es nicht.) Axiomatische Definition von κ(f ): κ(f ) = 0 → {Z(a) → f (a) = 1} 0 Abkürzung für 1 − 1 30 This
is written as one word. the manuscript, there is a full-stop after ‘hinüber’, and then a new paragraph begins with ‘z. B.’, but written thus, with a small ‘z’. Thus, it is not really clear that a new paragraph does begin here. 31 In
2
590
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
κ(f ) = 0 → Z(κ(f )) κ(f ) = 0 → f (κ(f )) = 1 Z(a) → {Z(κ(f ) − a) → f (κ(f ) − a) = 1} 3
Wie beweist man hier Widerspruchsfreiheit? Wir nehmen gleich τ (f ) und α(f ) (Tertium non datur und Auswahlprinzip): τ (f ) = 0 wenn f für alle Argumente 1 ist, = 1 wenn man ein Argument α(f ) auswählen kann, so daß f (α(f )) = 1. Axiome: 1. τ (f ) = 0 → (Z(a) → f (a) = 1), 2. τ (f ) = 0 → Z(α(f )), 3. τ (f ) = 0 → f (α(f )) = 1, 4. τ (f ) = 0 → τ (f ) = 1.
5
10
Wir können auch f durch eine Formel K(a) definieren: K(a) → f(a) = 1, f(a) = 1 → K(a), f(a) = 1 → f(a) = 0
4
5
Als erstes zeigt man, daß man alle Variablen fortschaffen kann, weil auch hier nur freie Variablen vorkommen. Wir suchen die innersten τ und α. Unter diesen stehen nur endlich definierte Funktionen ϕ, ϕ , . . . . Unter diesen können einige im Laufe des Beweises für f in die Axiome eingesetzt sein. 1. τ (ϕ) = 0 → (Z(a) → ϕ(a) = 1), wo a ein Funktional ist. Wenn dies nicht benutzt wird, setze ich alle α(ϕ) und τ (ϕ) gleich null. Sonst reduziere ich a und ϕ(a) und sehe, ob Z(a) → ϕ(a) = 1 in allen Ausdrücken 32 wo sie vorkommt, richtig ist. Ist sie richtig, so setze ich τ = 0, α = 0. | Ist sie falsch, d. h. ist a = z, ϕ(z) = 1, so setzen wir τ (ϕ) = 1, α(ϕ) = z. Dabei bleibt der Beweis Beweis. Die an Stelle der Axiome gesetzten Formeln sind richtig. (Der Gedanke ist: wenn ein Beweis vorliegt, so kann ich aus ihm ein Argument finden für das ϕ = 1 ist.) So beseitigt man schrittweise die τ und α und Anwendungen für 1, 2, 3, 4 und erhält einen Beweis von 1 = 1 aus I–V und richtigen Formeln, d. h. aus I–V. Dasselbe mit f (a, b) τ (f, b) = 0 → {Z(a) → f (a, b) = 1}33 einem Parameter τ (f, b) = 0 → Z(α(f, b))34 b mehr τ (f, b) = 0 → f (α(f, b), b) = 1 τ (f, b) = 0 → τ (f, b) = 1. Die Theorie der Funktionen τ und α ist fähig, das Operieren mit gebundenen Variablen zu ersetzen. Wie brauchen zwei Regeln und zwei Axiome: 1) Für (a){ a } kann man (b){ b } schreiben. 2) Ist A → B → C(a), wo a in A, B nicht auftritt, so ist A → B → (a)C(a). Axiom 1) (a)A(a) → A(b) (Aristotelische Axiom)
32 In
the text there is a space; the Editors have added ‘Ausdrücken’. this line, the ‘τ (f, b)’ is underlined. 34 Here Kneser commits a small error, writing ‘Z(f (α, b))’. 33 In
15
20
25
30
35
Kneser Mitschrift: The lectures from 1921/22
2)
5
10
15
20
591
(a)(b)A(a, b) → (b)(a)A(a, b)35
Wie vorher definieren wir: K(a, b) → f(a, b) = 1 f(a, b) = 1 → f (a, b) = 0 f(a, b) = 1 → K(a, b) τ (f ) = 1 → f (a) = 1 Für Funktionale: τ (f ) = 1 → τ (f ) = 0 τ (f ) = 1 → f (α(f )) = 1 τ (f ) = 1 ist äquivalent mit (a)K(a) u. s. w., so ersetzen wir Allzeichen durch bestimmte τ , und müssen die Regeln und Axiome beweisen: z. B. 1. Re1 gel ist selbstverständlich. 2. Regel zu C(a) die Funktion γ(a) = = 0 jenachdem. Man beweist aus A → B → γ(a) = 1 A → B → τ (γ) = 1 Axiom 1. Im Beweis A. ϕ die Funktion dazu. Behauptung τ (ϕ) = 1 → ϕ(a) = 1 das ist Axiom. Axiom 2. ϕ(a, b) zu A(a, b), ϕ(b, a) = ψ(a, b) τ (ϕ, b) = δ(b) τ (ψ, b) = η(b) τ (ϕ, b) = 1 heißt (a)A(a, b) τ (ψ, b) (a) A(b, a) 2.3.1922 Das zweite Axiom ist entbehrlich, man kann es beweisen: (a)(b)A(a, b) → A(a, b) nochmal (1): (a)(b)A(a, b) → (b)A(a, b) (a)(b)A(a, b) → A(a, b) nach der Regel 2: (a)(b)A(a, b) → (b)(a)A(a, b) Jetzt können wir das Induktionsaxiom (a) A(a) → A(a + 1) → A(1) → Z(a) → A(a)
25
30
mit Hilfe des Induktionsschemas beweisen. Da wir von diesem die Widerspruchsfreiheit kennen (auch mit τ und α!), haben wir die Widerspruchsfreiheit des Induktionsaxioms. A(a) bedeute (b) A(b) → A(b + 1) → A(1) → A(a): A(1) ist beweisbar. A(a) → A(a + 1) ? ∗ (a ) A(a∗ ) → A(a∗ + 1) → A(1) → A(a) → (a∗ ) A(a∗ ) → A(a∗ + 1) → A(1) → A(a + 1) aus Axiom 1: (a∗ )A(a∗ ) → A(a∗ + 1) → A(a) → A(a +1) ∗ ∗ ∗ ) A(a ) → A(a + 1) → A(1) → A(a) → A(1) → A(a + 1) 36 (a A(1) → A(a) → (a∗ ) A(a∗ ) → A(a∗ + 1) → A(1) → A(a + 1) 37 35 Axiom 2) has been crossed out. In a parenthetical remark, Kneser writes ‘als überflüssig gestrichen’, adds the date ‘2.3’, and begins his report of the next lecture (held on 2 March) with the remark: ‘Das zweite Axiom ist entbehrlich, . . . ’. 36 By axiom I 4. 37 By axiom I 3. Here, Kneser omits the first antecedent in the second formula in the list in favour of an undulating line; the antecedent has been added explicitly here. Kneser
6
592
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
(a∗ ) A(a∗ ) → A(a∗ + 1) → A(1) → A(a) → (a∗ ) A(a∗ ) → A(a∗ + 1) → dito → A(1) → A(a + 1) 38 ! " A&A
7
8
Das ist was wir wollten. Nach dem Induktionsschema | schreiben wir Z(a) → A(a), d. h. das Induktionsaxiom. Unsere Funktionenfunktion τ (f ) war der erste Steg hinüber zur Analysis. Schon zur Begründung der Lehre von den reellen Zahlen reichen wir damit nicht mehr aus. Wie kommt man zu den reellen Zahlen? Z. B. durch einen Dualbruch 0,101101 . . . , der nie 000 . . . endigen soll. Das ist eine Funktion f(a). Obere Grenze? Gegeben eine Menge μ von Dualbrüchen μ(f ) Funktionenfunktion, μ(f) = 1 wenn f zur Menge gehört. Am einfachsten, wenn μ die Schnitteigenschaft hat, d. h. jeder kleinere Dualbruch dazu gehört. Dann braucht man nicht einmal das τ .A, 39
Hat μ nicht die Schnitteigenschaft, ist aber „abzählbar“, f1 (a), f2 (a), . . . , fn (a), . . . so kann ich mit τ die obere Grenze bestimmen. Wenn bis fn (1) immer 0 ist, so ist die erste Stelle 0, sonst 1 (τ (1 − fn (1)) 40 u. s. w. Im allgemeinen Falle brauchen wir ein τ , dessen Argument eine Funktionenfunktion ist. τ (m) = 0 wenn mf = 0 für alle f ;B τ (m) = 1 wenn mf = 1 für ein f . m(f ) = 1 heißt f gehört zur Menge m; m muß eine Funktionenfunktion sein die nur die Werte 0 und 1 annimmt. A In the bottom margin is found the remark, not clearly associated with any particular place in the text:
(bei Russell wird das Reduzierbarkeitsaxiom nicht wie früher gesagt, beim Schnitt, wohl aber bei der oberen Grenze gebraucht.) B
In the left-hand margin is written: τ (m)
gives some explanation, via lines and the interlineated word ‘vertauschen’, of how the third formula arises from the second, namely that the first and second antecedents are to be transposed. 38 Kneser seems to have made a mistake here: he has the induction step (a∗ )(A(a∗ ) → A(a∗ + 1)) three times in this formula, but it should occur just twice. Then by I 2 one gets A(a) → A(a + 1). 39 Page 7 of the notebook ends here, leaving three text lines free; Kneser begins again on p. 8. In the space created, and placed towards the left-hand margin, there is the beginnings of a drawing, consisting of three columns, each surrounded by a line (closed and rounded at the top, but open at the bottom), and each apparently beginning with 0 (or possibly ‘o’), with the tops of the second and third columns successively lower than the one to its left. This drawing is sketched above the remark about Russell’s Reducibility Axiom, and might have been intended, when complete, to illustrate some point about this axiom. As it is, its import is not clear. 40 The ‘n’ in ‘(1 − f (1))’ is underlined twice, undoubtedly to indicate that τ is applied to n the function g, given by g(n) = 1 − fn (1).
5
10
15
20
Kneser Mitschrift: The lectures from 1921/22
τ (m) = 0 τ (m) = 0 ... ... ... ... 5
10
15
→ → → →
Δf → mf = 0C Δ (α(m)) m (α(m)) = 1 τ (m) = 1.
593
⎫ ⎪ ⎪ ⎬ ⎪ ⎪ ⎭
So wie es hier mit der Arithmetik und den Anfangsgründen der Analysis geschehen ist, so wäre die gesamte Mathematik einer strengen Formalisierung zu unterwerfen, mit deren Hilfe wir die mathematischen Schlußweisen zum Gegenstand der Untersuchung machen können. Diese zeigt dann, daß das übliche transfinite Schließen der Mathematik nicht zum Widerspruch führen kann. Wir brauchen nicht an das Vorhandensein unendlicher Mengen zu glauben; wir wissen, daß wir so schließen dürfen, als wenn sie da wären, ohne auf Widersprüche zu kommen. So verstehen wir, was auf dem Kronecker-BrouwerWeyl-schen 41 Standpunkte als Wunder erscheint, daß nämlich in der Analysis alles klappt, eine solche Harmonie zu Tage tritt. 42 Durch endliche Logik, d. h. anschauliches Handeln und Operieren mit anschaulichen | Gegenständen, eben den Formeln und Beweisen, sehen wir, daß 43
9
10
Der methodische Grundgedanke ist durchaus nicht auf Arithmetik beschränkt. Besonders in der Mengenlehre könnte man direkt die Axiome formalisieren und Widerspruchsfreiheit beweisen. 44 20
25
30
z. B. der erste Hilbertsche 45 Beweis für Endlichkeit der Invarianten benutzte das τ . Der zweite brachte die „angebbare“ obere Grenze. Was hieß aber angebbar?D Einfach durch Rekursion, ohne τ . 46 Oder zu sagen x27 + 5x23 + 201x + 1 ist reduzibel oder irreduzibel, fordert das τ . √ √ √ ][4 4 ][ ] . . . ein Dualbruch? Oder: ist 0,[2 2 ][3 3 rational ist. Jetzt ist das natürlich (mit τ ) eine wohl- | ob[x] = 01 wenn x irrational gleich nicht endlich-definierte reelle Zahl. Früher sagte man: man muß die Mathematik arithmetisieren. Jetzt: Nicht das, aber die Sicherheit ist genau dieselbe wie in der Zahlenlehre. Geht man an die Mengenlehre, so sagen wir: Die Wohlordnung z. B. des Kontinuums ist jetzt gewährleistet, da das Auswahlaxiom widerspruchsfrei ist. To the left of this line, in the margin, is written: Δ : Dualbruch sein In the left-hand margin is written: Operationen Zählen ist verboten, führt zu Paradoxien. C
D
41 The
text has here: ‘Kron-Br.W.’. manuscript shows a break of one line at this point. 43 The text breaks off here, and there is a gap of two text lines at this point. 44 The manuscript shows a break of one line at this point. 45 The text has here: ‘H. sche’. 46 This and the previous occurrence of ‘τ ’ is underlined twice. 42 The
11
594
12
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Das Kontinuumsproblem ist damit noch nicht gelöst; aber es ist ein vernünftiges Problem, vor dem man sich nicht drücken soll (Weyl, Brouwer, Kronecker 47 öffnen dieser Drückebergerei Tor und Tür), sondern das man mit allen Mitteln angreifen soll. Die Frage aber, ob man jede Irrationalzahl durch Rekursion definieren kann, ist offen. Das hieße ja, daß man jedes arithmetische Problem entscheiden kann. Dabei haben wir doch (merkwürdig!) die Über|zeugung, daß jedes Problem lösbar ist, d. h. daß das τ nur psychologisch bedingt ist.
47 The
text has here: ‘W.Br.Kr.’.
5
Textual Notes
595
Textual Notes 577.9: 577.10: 577.10: 577.14: 577.14: 577.15: 577.17: 578.8: 578.8: 578.9: 578.10: 578.16: 578.19: 578.19: 578.28: 578n: 578n: 579.3: 579.4: 579.13: 579.15: 579.15: 579.18: 579.19: 579.20: 579.24: 579.25: 579.26: 580.5: 580.5: 580.8: 580.12: 580.13: 580.15: 580.23: 580.23: 580.28: 581.3: 581.7: 581.7: 581.12:
Primzahlen] Primz. Zahlen] Z. gewissen] gew. ,] ? ?] . finite] f. :] )] transfiniten] trans. ersetzbar durch] ers. d. ersetzbar durch] ers. d. (siehe oben)] (s. o.) (siehe oben)] (s. o.) :] ,] Kurzzeichen] Kurzz Kurzzeichen] Kurzz Logikkalkül] Logikkalkul logischen] log. beweisbare] beweisba. Axiomensystem] Axsyst widerspruchsfrei] wfr. Widerspruchsfreiheit] Wfr. Widerspruchsfreiheit] Wfr. gewisser] gew. beweisbare Formel] bewb. F. Schlußformel] Schlußf. Formel] F. Axiom] Ax. dasselbe] dass. Beweises] Bew Widerspruchsfreiheit] Wfr. dasselbe] dass. :] 2. Prämisse] 2 Präm. Axiomen] Ax. vollständige Induktion] vollst. Ind. betreffende] betr. folgende Zahl] folg. Z. vorhergehende] vorherg. Buchstaben] Buchst.
581.12: 581.12–13: 581.13: 581.13: 581.14: 581.15: 581.17: 581.31: 581.31: 581.33: 582.16: 582.18: 582.20: 583.17: 583.18: 583.24: 583.25–26: 583.29: 583.31: 583.31: 584.3: 584.5: 584.7: 584.8: 584.8: 584.8: 584.9: 584.9: 584.10: 584.14: 584.14: 584.14: 584.15: 584.16: 584.16: 584.18:
Grundvariablen] Grundvar. variable Funktionen] Var. Funkt. Funktionenfunktionen] Funkt-Funkt. lateinische Buchstaben] lat. B. Variablen] Var. Buchstaben] Buchst. Axiome] Ax individuellen] ind. variablen] var Funktional] F ] , mathematischen] math. mathematischen] math. vollständige Induktion] vollst. Ind. Widerspruchsfreiheit] Wfr. Normierte Zeichen] N. Z. normierten Zeichen.] n. Z. unnötige Klammern] unnöt. Kl. Metamathematik] Metamath. Variablen] Var. Axiome] Ax normierte Zeichen] n. Z. normierte Zeichen] n. Z. Primformel] Primf. Grundvariable] Grv. enthalten] enth normierten Zeichen] n. Z. verschieden] versch. Variablen] Var. logische] log. logischen] log. überstrichenen] überstr. überstrichenen] üb. variablen] var. Variablen] Var. überstrichene] überstr.
596
Chapter 3
584.18: 584.20: 584.21: 585.6: 585.7: 585.8: 585.9: 585.10: 585.12: 585.12: 585.13: 585.14:
585.16: 585.16: 585.17: 585.18: 585.19: 585.21: 585.21–22: 585.23: 585.26: 586.4: 586.5: 586.5: 586.6: 586.6: 586.7: 586.7: 586.7–8: 586.8: 586.11: 586.13: 586.15: 586.16: 586.17: 586.18: 586.19:
Lectures on Proof Theory (1921/22 – 1923/24)
ursprüngliche] urspr Widerspruchsfreiheit] Wfr. Primformeln] Primf. einsetzungsrichtig] einsr. einsetzungsrichtigen Formel] einsr. F. einsetzungsrichtige Formel] einsr. F. einsetzungsrichtige Formel] einsr. F. einsetzungsrichtige Formel] einsr. F. Axiome] Ax. variable Formeln] var. F. Variablen] Var. eine richtige Primformel] n. richt. Primf. Zahlzeichen] Zahlz. richtig] richt. einsetzungsrichtig] einsr. Einsetzungen] Eins. richtig] richt. Axiome] Ax. einsetzungsrichtige Formeln] einsr. F. Axiomen] Ax. einsetzungsrichtig] einsr. Ausmultiplizieren] Ausmult Primformeln] Primf. einsetzungsrichtig] einsr. einsetzungsrichtige Formel] einsr F. logischen] log. einsetzungsrichtig] einsr. logische] log. einsetzungsrichtiger Formeln] einsr. F. einsetzungsrichtig] einsr einsetzungsrichtig] einsr. entweder] entw normierte Zeichen] norm Z. Zeichen] Z richtig] r einsetzungsrichtige Formel] einsr. F. einsetzungsrichtig] einsr.
586.22: 586.22: 586.23:
586.23: 586.23–24:
586.24: 586.24–25:
586.25:
586.27: 586.28:
586.28–29:
586.29: 586.30: 586.30: 586.31: 586.32: 587.2: 587.3: 587.5: 587.7: 587.7: 587.8: 587.8: 587.9: 587.12: 587.15: 587.17: 587.20: 587.21: 587.23: 587.23:
Einsetzung] Eins. mindestens] mind. richtige Primformel unüberstrichen] r. Prf. unüberstr. mindestens] mind. falsche Primformel überstrichen] f. Prf. überstr. mindestens] mind. richtige Primformel überstrichen] r. Prf. überstr. falsche Primformel unüberstrichen] f. Prf. unüberstr. Formel] F. richtige Formeln überstrichen] r. F. überstr. falsche Formeln unüberstrichen] f. F. unüberstr. einsetzungsrichtig] einsr. einsetzungsrichtig] einsr einsetzungsrichtig] einsr. einsetzungsrichtig] einsr. Widerspruchsfreiheit] Wfr Widerspruchsfreiheit] Wfr. eindeutige] eind. Zeichen] Z. Multiplikationsaxiome] Mult.axiome einsetzungsrichtig] einsr. Hilfsatz] Hilfs. normierte Zeichen] norm. Z richtige Formeln] rF rationale Funktionen] rat. F. bekannten Funktional] bek. Funkt. Widerspruchsfreiheit] Wfr. Variable] Var. Axiome] Ax ohne Variablen] o. Var. richtig] r.
Textual Notes 587.25: 587.25: 587.25: 587.26: 587.26: 587.28: 587.29–30: 588.1: 588.1: 588.1: 588.2: 588.2: 588.3: 588.5: 588.9: 588.10: 588.10: 588.11: 588.11–12: 588.17: 588.18: 588.18: 588.19:
588.20: 588.25: 588.30: 588n: 589.1: 589.2: 589.2: 589.3: 589.16: 589.16: 589.16: 589.21:
Primformel] Primf richtig] r falsch] f Funktionale] F.ale vorkommen] vork Axiome] Ax. Widerspruchsfreiheit] Wfr. Primformel] Primf richtig] r falsch] f Funktionale] F.ale vorkommen] vork beweisen] bewiesen Variablen] Var. Variablen] Var. Variablen] Var. Axiome] Ax. Axiome] Ax. einsetzungsrichtig] einsr. Zahlzeichen] Zahlz. Rekursion] Rek. Zahlenargumente definiert] Zahlenarg. def. Axiome einsetzungsrichtig] Ax. einsr Axiom der vollständigen] Ax der vollst. Induktionsaxiom] Ind.ax. Widerspruch] Wspruch ohne Variablen] o. V. Variablen] Var. Variablen] Var Zahlzeichen] Zahlz sukzessive] sukz. Allzeichen] Allz. demselben] dems. Wirkungsbereich] Wirkbereich Rekursion] Rek.
589.22: 589.24–25: 589.34: 589.36: 590.4: 590.6: 590.8: 590.15: 590.16: 590.17: 590.38: 591.5: 591.7: 591.10: 591.10: 591.11: 591.11: 591.12: 591.23–24: 591.24: 591.25: 591.30: 592.3: 592.4: 592.20: 592n: 593.7: 593.9: 593.19: 593.28: 593.31: 594.5: 594.6:
597
Primzahl] Primz. mathematische] math. .)] ). für] f Widerspruchsfreiheit] Wfr. Argumente] Arg Axiome:] Ax: Variablen] Var. Funktionen] Funkt. Axiome] Ax. Axiom] Ax äquivalent] äq. Funktion] Fkt. Axiom] Ax. Funktion] Fkt. Behauptung] Beh. Axiom] Ax. Axiom] Ax. Widerspruchsfreiheit] Wfr. Widerspruchsfreiheit] Wfr. Induktionsaxioms] Indax. Axiom] Ax. Induktionsschema] Ind.schema Induktionsaxiom] Ind.axiom Funktionenfunktion] Funktf oberen] ob. mathematischen] math. Mathematik] Math. Widerspruchsfreiheit] Wfr. Mathematik] Math. widerspruchsfrei] wfr. Irrationalzahl] Irrat.zahl arithmetische] arithm.
598
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Description of the Text Collection: SUB Göttingen, in Cod. Ms. H. Kneser B8. Size: 3 separate Notebooks with thick blue paper covers which are approximately the same size as the pages, namely 21 × 16.5 cm. Cover Annotations: The three Notebooks each carry the same label, pasted to the upper half of the front cover. The labels are in approximately the same position on each of the covers, but whether they were sold with or without labels is not clear. The labels (approximately 9.5 × 6.2 cm) are manufactured ones, rectangular, with the corners cut off, and surrounded by a set of black, printed straight lines; each bears the printed word ‘Diarium’ in the upper middle; there is then a white area left on which one can write. The label of the first Diarium bears the handwritten title in pencil: ‘Hilbert, Grundl. d. Math. // I // WS 1921/22’. The second and third labels are identical, except with ‘II.’ and ‘III.’ respectively instead of ‘I’. Composition: The first Notebook consists of 8 sheets laid together, folded in the middle, and stapled, together with the front, blue cover, thus giving 32 sides on which to write. The sheets have lines printed in blue lengthways, yielding lined sides; the distance between the lines is 0.85 cm, and there are 20 lines to the page. The pages have been continuously numbered from 1–32 by Kneser (thus ‘–1–’, ‘–2–’) at the top and centred; all the pages have been written on in pencil; p. 19 is half-empty, and p. 30 has only two lines. Kneser has left a large margin at the left, varying from between 2 and 3.5 cm. This has been used to note the dates of the lectures, but is also used for the occasional additional remark, or to emphasize something about the content. Kneser’s text is written in clear handwriting in Roman script, although with frequent use of abbreviations; the formulas standardly use both Roman and Sütterlin letters. Exactly the same holds for the second Notebook, except it contains no empty or half-empty pages. The third Notebook contains just the left-hand halves of six of the original sheets, yielding 12 writing pages; these have been numbered 1–12 in the same way as before. They have all been written on in pencil in the same way as described for the other Notebooks and have been placed loose back in the blue cover; the original staples still go thorough the cover, but have been prised apart. The lectures noted are I: ‘31.10.’, ‘3.11.’, ‘7.11.’, ‘10.11.’, ‘14.11.’, ‘17.11.’, ‘21.11.’, ‘24.11’, ‘1.12.’, ‘5.12.’, ‘8.12.’, ‘12.12.’; II: ‘9.1.22’, ‘12.1.’, ‘16.1.’, ‘19.1.’, ‘26.1.’, ‘30.1.’, ‘2.2.’, ‘6.2.’, ‘9.2.’, ‘20.2.’, ‘23.2.’. III: ‘23.2. Forts’, ‘27.2.’, ‘2.3.’. Pagination: Described under Composition. Original Title: No overall title. Text: As described above, there are 32 + 32 + 12 pages, amounting to a complete Mitschrift of Hilbert’s lecture course for 1921/1922 on the foundations of mathematics. They are clearly written and flow with very few annotations, additions or deletions. We have reproduced here only (roughly) the second half of this Mitschrift, beginning halfway down page p. 12 of the second notebook and running to the end of the third notebook, i. e., p. 12. This excerpt corresponds to a new section beginning halfway through the lecture from 26 January 1922, and runs to the end of the last lecture recorded, for the 2 March.
Kneser Mitschrift: The lectures from 1922/23
599
Kneser Mitschrift: The lectures from 1922/23
(Es sprechen abwechselnd Hilbert und Bernays. Die betreffenden Abschnitte sind durch (Hilbert) bezw. (Bernays) bezeichnet.) 1
1
2.11.1922 5
10
15
20
25
30
(Hilbert) Die Mathematik wird angefeindet von Unsachkundigen. Aber auch Mathematiker wollen so stark an ihren Methoden rütteln, daß sie dadurch zerstückelt und verstummelt würde. Wir wollen sie verteidigen und sicher stellen, andren Wissenschaften zum Vorbild machen. Gewisse Einwände sind berechtigt. Schon wenn man von negativen und imaginären Zahlen hört, staunt man, daß damit alles so gut klappt. Hier hat nun Kronecker, sonst einer der heftigsten Angreifer, durch Einführung des Moduls x + 1 (x = −1) bezw. x2 + 1 (x = i) jeden Zweifel behoben und zugleich die Theorie allgemeinerer Moduln und der Ideale ausgebildet. Weitere Einwände beziehen sich auf das Unendliche. Die Fortschritte der Infinitesimalrechnung waren so rasch, daß die Freude am Rechnen zu falschen Ergebnissen führte. Bolzano, Cauchy und Weierstraß (neben anderen) beseitigten die Schwierigkeiten so durchgreifend, daß jederman mit Einsicht und richtig den Kalkül handhaben kann. In den Fragen der Irrationalzahlen und der Mengenlehre dagegen erheben sich grosse Paradoxien. Kronecker und andere brechen in den Besitzstand der Wissenschaft ein und wollen die meist gebrauchten Glieder durch künstliche ersetzen. Ich will diese Glieder wieder in Funktion sehen. Beispiele der Paradoxien. 1. Jeder Menge von mathematischen Dingen kommt eine Kardinalzahl zu, z. B. endlich, abzählbar, Kontinuum, Menge aller Funktionen. Für jede Kardinalzahl denken wir einen Repräsentanten ausgewählt. Wir bilden die Vereinigung V aller dieser Mengen. Die ist sicher von größerer | Mächtigkeit als jede der vorigen. Denn zu jeder Menge R findet man eine S von größerer Mächtigkeit. S > R, V S, V > R. Andrerseits ist V eine Menge mathematischer Dinge, muß also einen Repräsentanten R haben, d. h. V > V : das ist ein Widerspruch. Der kann nur davon herrühren, daß man das „alle“ unvorsichtig gebraucht hat. Dann kann man aber auch an der Menge „aller ganzen Zahlen“ zweifeln. Daß alle Zahlen auf einmal da sind, ist eine Fiktion, die Zweifel erregen muß. Wir werden daher eine „finite Logik“ ausbilden. Den Begriff „alle 1 These
two lines were added in pencil above the text.
2
600
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Zahlen“ hat Frege scharf kritisiert. Man (z. B. Thomae) schreibt „a1 , a2 , . . . “ „u. s. w.“, „man kann immer neue Zahlen nach Vorschrift hinschreiben“. Beispiel der Häuserreihe. 2. Die Menge aller Folgen von Nullen und Einsen 0,011011101011 . . .
3
die durch ein mathematisches Gesetz definiert sind. Dies Gesetz läßt sich (in deutscher Sprache) deutlich mitteilen. Die Sprache setzt sich aus höchstens 100 Zeichen zusammen. Wir schreiben alle Figuren hin, die nur aus einem Zeichen bestehen, dann die aus zwei u. s. w. und ordnen jede Reihe lexikographisch. Also ist die Menge aller dieser Folgen abzählbar. Aus diesem Schema bilden wir . . . (Diagonalverfahren) eine Folge, die nicht darin enthalten ist, und doch durch ein Gesetz definiert ist. Hieraus sieht man, daß der Begriff der Sprache präzisiert werden muß. Ein Teil der Mathematik z. B. die elementare Zahlenlehre läßt sich ohne das „alle“ d. h. mit finiter Logik begründen. Wir kommen ohne Axiome also auch ohne die Frage der Widerspruchsfreiheit aus, die Schlüsse haben den Charakter des handgreiflichen, sicheren. Das Zählen geschieht mit gewissen Zeichen, den Zahlzeichen. Wir wählen sie so, daß sie anschaulich die Anzahl liefern. Die Zahlenlehre wird so eine anschauliche Behandlung der Figuren, die aus 1 und + bestehen. 1 am Anfang | und Ende, abwechselnd 1 und +. Die Zahlzeichen bedeuten nichts, sind vielmehr der Gegenstand der Untersuchng. Andre Zeichen (=, =) bedeuten etwas, = die Übereinstimmung der Zahlzeichen, zwischen denen es steht, = die Verschiedenheit. In einer Aussage über Zahlzeichen sollen deutsche Buchstaben unbestimmte Zahlzeichen bedeuten. Außerdem brauchen wir die üblichen Abkürzungen, 2 für 1 + 1, 3 für 1 + 1 + 1 u. s. w. Andre Zeichen dienen zur Mitteilung konkreter Handlungen. a + b bedeutet das Zahlzeichen, das entsteht, wenn man hinter a zuerst + und dann b schreibt; a · b das, das man erhält, wenn man in b jede 1 durch a ersetzt. Diese Prozesse führen wieder zu Zahlzeichen. Die arithmetischen Sätze werden durch anschauliche Überlegung gewonnen, wobei wir auch das gewöhnliche Zählen benutzen, z. B. (a + b) + c = a + (b + c). Von zwei verschiedenen Zahlzeichen stimmt das eine mit einem Teil des anderen überein. Je nachdem a > b, b < a oder a < b, b > a. Wenn a < b, b < c, so ist a < c. Wenn b < a, so ist a = b + c; c = a − b (Definition von −). (Bernays) Als Probe für einen Beweis diene a + b = b + a. Ist a = b, so ist es klar. Es sei a > b, a = b+c. Also b+c+b und b+b+c. Der Anfang stimmt überein, wir müssen nur zeigen, daß c + b mit b + c übereinstimmt. Dasselbe wie vorher, aber weniger + Zeichen. Wenn wir nicht auf b = c kommen, so bauen wir weiter ab, und wir kommen auf (1 + 1) + 1 = 1 + (1 + 1). Bei der Multiplikation ist trivial a · (b · c) = (a · b) · c und a(b + c) = a · b + a · c. Man beweist vermöge a + b = b + a das andere distributive und kommutative Gesetz.
5
10
15
20
25
30
35
40
Kneser Mitschrift: The lectures from 1922/23
5
601
Bei der Division kommt es darauf an, das „Es gibt“ zu vermeiden. (Es gibt c, so daß a = b · c.) Sei a > b. 1 · b, (1 + 1)b, . . . , a · b. Ist darunter a, so heißt a durch b teilbar, und es ist a = c · b. Ist b = 1, so ist a = c · 1 = c. Jedenfalls sonst ist c < a. Ist b < a, a nicht durch b teilbar. b = 1. a · b > a, 1 · b < a. q · b < a, q sei das letzte Zahlzeichen dieser Art; (q + 1) > a, a = q · b+r < q · b+b, r < b. Diese Zerlegung ist eindeutig. Ist q · b+r = q · b+r und q = q, so ist r = r. Ist etwa q = q + q. q · b + r = r > b, Widerspruch. 2 Begriff der Primzahl: Eine Zahl a > 1, die unter den Zahlen von 1 bis a keinen anderen Teiler hat als 1 und a. 3
4
9.11.1922
10
(Bernays) Euklids Satz: Habe ich ein Zahlzeichen a, so finde ich eine Primzahl h > a. 1 · 2 · · · a+1
= q·h
Behauptung: h > a. Wäre h ≤ a, so wäre k · h + 1 = q · h = k · h + t · h,
15
20
25
30
35
1 = t · h unmöglich weil h > 1.
Man nimmt häufig Anstoß an der Einführung der Zahl als Zeichen. Das Zeichen ist nicht die Anzahl. Wenn ich aber eine Reihe Menschen abzähle, so ordne ich doch jedem ein Klangzeichen zu (eins, zwei . . . ), wofür ich ebenso gut diese Schriftzeichen nehmen kann. Habe ich eine Menge, d. h. Individuen, bei denen ich weiß, was Individuum ist und was zur Menge gehört. Man belegt die Individuen mit Zahlzeichen 1, 1 + 1. . . . . Das größte a ist die Anzahl. Behauptung: das ist von der Belegungsart unabhängig. Beweis durch Umstellung: 1 an erste Stelle, 1 + 1 . . . . Dirichlets Schachtelprinzip: Wenn ich die Zahlzeichen 1 . . . a mit Zahlzeichen von 1 bis a belege, so daß keins mehrmals vorkommt, so kommt jedes vor. Anwendung: ri = rk zwischen 1 und a − 1 1 · b = q1 a + r1 ··· ·· ··· Also kommt 1 vor 1 = tb − qa (a − 1) · b = qa−1 a + ra−1 (Hilbert) Diese Darstellung ist zuerst von Helmholtz (Zählen und Messen) dann von Hölder (Die Arithmetik in . . . ) etwa so gegeben worden. 4 Auch die Frage der Anwendbarkeit der Zahlenlehre auf die Wirklichkeit ist befriedigend beantwortet. Wir wären aller Schwierigkeiten überhoben, wenn wir (z. B. in der Analysis, Mengenlehre, höheren Zahlentheorie) mit diesen Schlußweisen auskämen. Das ist nicht der Fall. Vielmehr stellen wir uns den Inbegriff aller Zahlzeichen als eine abgeschlossene Gesamtheit vor, | und wenden die Begriffe „alle“, 2 This
final ‘r > b’ is underlined. the arguments sketched here and below, see the detailed presentation in Bernays’s Ausarbeitung of the 1921/1922 lectures, pp. 59–66, this Volume, pp. 466–470. 4 These works are von Helmholtz 1887 and Hölder 1914 . 3 For
5
602
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
„Es gibt“ in einer freien Weise an, die bei unserer bisherigen Einstellung der Grundlage entbehrt. Auch bisher hatten wir allgemeine Sätze a + b = b + a, aber diese haben der Charakter hypothetischer Urteile: wenn mir a und b gegeben sind . . . . Und die Existenz urteile (es gibt h > a) sind Teilaussagen von ganz genauen anschaulichen Angaben (der kleinste Teiler > 1 von 1 · · · a + 1 ist h > a), die für viele Fälle genügen, so daß man sich nicht mit der genaueren Angabe zu beschweren braucht. Ganz anders wird es in den genannten Gebieten. Die allgemeinen und Existenzsätze werden als Aussagen über die Gesamtheit aufgefaßt. Wenden wir dann die logischen Formen an, so ist klar, daß z. B. eine Aussage über ganze Zahlen entweder für alle Zahlen gilt, oder es eine gibt, für die sie nicht gilt. Man kann z. B. für die Reihe der ganzen Zahlen diese Auffassung zulassen. Das tun Brouwer und Weyl 5 und sehen wie weit man kommt. Aber auch so ist keine Sicherheit zu erreichen, und man bekommt auch nur ein Stück, ein Zerrbild der Mathematik. Die Paradoxien rufen uns Halt zu. Die zweite (Richard) soll uns einen Fingerzeig geben, wie wir weiterzukommen versuchen werden. Wir müssen die Sprache formalisieren und präzisieren, mit Hilfe des von Mathematikern und der Mathematik fernstehenden Philosophen vielfach mißachteten Logikkalküls. Es ist zuzugeben, daß der Logikkalkül bisher keine tieferen Probleme aufgerollt hat; aber er behandelt doch vorliegende Fragen, und es kommt häufig vor, daß eine unfruchtbar scheinende Disziplin unerwartete Anwendungen zuläßt (z. B. kombinatorische Schule–Galois–Veronese–H. 6 ). Wir werden zuerst den Ausagenkalkül entwickeln, Variable hinzufügen, und auch „alle“, „Es gibt“ in freiester Weise benutzen. Die zu bietende Darstellung scheint bedeutende Vorzüge zu bieten, so daß das Gebiet für uns seine Schrecken verlieren wird und auch die ältere Literatur nicht herangezogen zu werden braucht. 6
(Bernays). Wir behandeln Beziehungen zwischen ganzen Sätzen. Unsere Formelsprache ist Kompromiß und Ergänzung andrer | unter Vermeidung der mathematischen Zeichen. & (und)
∨ (oder, vel )
→ (Folge)
5
10
15
20
25
30
(∼)
A & B ist richtig, wenn A ∨ B ··· ··· A → B ··· ···
A richtig und B richtig ist. A richtig oder B richtig oder beide. B richtig oder A falsch ist · · · (nicht im Sinne des logischen Folgens). Das erscheint künstlich, wird aber sich bei Variablen als zweckmäßig erweisen. 7 Wenn 2 · 2 = 4 ist, ist der Schnee weiß richtig Wenn 2 · 2 = 4 ist, schwarz falsch Wenn 2 · 2 = 5 ist, weiß richtig 5 Kneser had originally written ‘Weyl und Brouwer’, but permutes the names by means of a transposition symbol. 6 The ‘H.’ most probably stands for ‘Hilbert’. 7 This remark appears in the margin, but is clearly intended to be added here.
35
40
603
Kneser Mitschrift: The lectures from 1922/23
Wenn 2 · 2 = 5 ist,
5
10
15
schwarz
richtig
A ∼ B (A ist wahrheitsgleich mit B, wenn beide richtig oder beide falsch sind.) A Negation: ist richtig, wenn A falsch ist. Wir behandeln 1. Frage der Ersetzbarkeit. 2. Frage der Richtigkeit. 3. Das Schließen, d. h. Ableiten neuer Aussagen. Dabei betrachten wir die Aussagen nur bezüglich ihrer Richtigkeit, nie des Inhalts. Für & und ∨ gilt das kommutative und assoziative Gesetz. Um Klammern zu sparen, verabreden wir, daß → bei der Trennung den Vorrang vor & und ∨, & vor ∨ hat. Ferner bedeute A → B → C : A → (B → C) (verschieden von (A → B) → C); das ist dasselbe wie A & B → C. Boole fand das distributive Gesetz: X & (Y ∨ Z) aeq. (X & Y ) ∨ (X & Z) X ∨ (Y & Z) aeq. (X ∨ Y ) & (X ∨ Z) X aeq. X, X → Y aeq. X ∨ Y X & Y aeq. X ∨ Y , X ∨Y aeq. X & Y . Dies führt die Negation einer zusammengesetzten Aussage auf die der Einzelaussagen zurück. Daraus folgt (X statt X) Ferner
20
X ∨Y
aeq.
X∼Y
25
30
35
X &Y, aeq.
X &Y
aeq.
(X → Y ) & (Y → X)
X ∨Y, aeq.
X→Y
aeq.
X &Y
(X & Y ) ∨ (X & Y ).
Man kann Zeichen sparen, z. B. alles durch &, oder ∨, , auch →, ausdrücken. Die Bezeichnung mit → ist dem mathematischen Schließen angepaßt, wurde von Frege gewählt, & und vom inhaltlich logischen Standpunkt, ∨ und formal einfach (Russell).A Sheffer bemerkte neuerdings, daß man alle Zeichen durch eines für X & Y oder für X ∨ Y ersetzen kann. Wir bringen einen beliebigen Ausdruck auf eine Normalform, eine Konjunktion von Disjunktionen, deren Glieder teils einfach teils negiert einfach sind 9 (mit ∨). Die Fragen 1. und 2. führen aufeinander zurück. Jede Ersetzbarkeit ist eine Richtigkeit mit ∼, jede Richtigkeit eine Ersetzbarkeit durch X ∨ X. Zuerst beseitigen wir die →, dann die Negation über mehrfachen Ausdrücken. A
Next to this sentence in the left-hand margin is written: Brentano (Hillebrand) 8
8 This latter name is presumably a reference to the Austrian philosopher and experimental psychologist Franz Hillebrand, who studied under Brentano, amongst others. It is not clear why he is singled out for mention here. 9 This last clause was added in the left-hand margin, with an insertion sign at this point.
7
604
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
16.11.1922 (Bernays) A&A A∨A
A&B∨B A ∨ (B & B)
aeq. A
aeq. A.
Frage der Richtigkeit. 1. A ∨ A ist immer richtig.
5
2. Wenn A richtig, so ist A ∨ B richtig. 3. Wenn A richtig und B richtig, so A & B richtig. 4. Wenn A aeq. B und A richtig, so B richtig. Haben wir A ∨ B ∨ C ∨ . . . ∨ B ∨ . . . , so ist dies richtig. (Ist ein Faktor null, so ist das Produkt null.) Soll eine logische Summe von logischen Produkten immer richtig sein, unabhängig von der Richtigkeit der Einzelaussagen, so muß in jedem Summanden ein B ∨B vorkommen. Treten nämlich nur verschiedene auf (B ∨B aeq. B), so setzen wir für die unüberstrichenen eine richtige, für die überstrichenen eine falsche Aussage; dann ist das ganze falsch. Logische Normalform ist A ∨ B ∨ C ∨ . . . ∨ F & . . . & . . . . z. B. A & (A → B) → B
8
15
A ∨ (A & B) ∨ B
A&A∨B∨B
A∨A∨B&A∨B∨B
A∨A∨B∨B
Normalform, immer richtig.
Wir können auch die Normalform benutzen um die Äquivalenz von Ausdrücken festzustellen. z. B. A → B → C A∨B∨C
10
20
A&B →C A&B∨C A∨B∨C
(A → B) → B A→B∨B (A & B) ∨ B A∨B&B∨B A∨B Man kann die Normalform noch genauer spezialisieren. 3. Das Schließen. Wenn A richtig und A → B richtig, so ist B richtig.
25
30
A A → B Schema des hypothetischen Schließens. B Denn: A ∨ B & A ∨ B,
(A & A) ∨ B aeq. B.
35
Kneser Mitschrift: The lectures from 1922/23
5
605
z. B. Wenn jede reelle Zahl algebraisch ist, so ist die Menge der reellen Zahlen abzählbar. Nun ist die Menge der reellen Zahlen nicht abzählbar; also gibt es transzendente Zahlen. A bedeute Jede reelle Zahl ist algebraisch. B ··· Die Menge der reellen Zahlen ist abzählbar. A → B, B sind richtig. B A ∨ B, A ∨ B, B → A, A
10
15
20
25
30
35
40
B→A A z. B. Wenn das Additionsgesetz der Geschwindigkeiten gilt, und sich das Licht im Fixsternhimmel nach allen Richtungen fortpflanzt, so tut es das auf der Erde nicht. A Additionsgesetz der Geschwindigkeit. B Gleichmässige Lichtgeschwindigkeit im Fixsternhimmel. C Gleichmässige Lichtgeschwindigkeit auf der Erde. A & B → C, C, B. Wie schließt man daraus A? A ∨ B ∨ C, B & C → A, B&C B&C →A A (Hilbert) Bisher ist die Sprache präzisiert und formalisiert, soweit die Sätze als Ganzes betrachtet werden. Um die traditionelle d. h. Aristotelische Logik zu erhalten, ist nur eine kleine Änderung nötig. Nach früherer Ansicht (z. B. Kant in der Vorrede zur Kritik der reinen Vernunft) war damit das letzte Wort gesprochen. Dem können wir nicht beipflichten. Wir beherrschen mit dem so erweiterten Kalkül (Prädikatenkalkül) schon ganz einfache Aussagen nicht, können z. B. nicht einmal den Satz ausdrücken: Die Vorfahren der Vorfahren eines Menschen sind seine Vorfahren. Das Hilfsmittel hierzu ist dem Mathematiker sehr geläufig: es sind Variable und Funktionen. Für solche Aussagen braucht man logische Funktionen von mehreren Variablen. Das ist durchaus keine triviale Erweiterung, noch eher könnte man die Aristotelische Logik als trivial bezeichnen, deren Mechanismus wir in der Tat beherrschen werden. Z. B. bedeute A das Prädikat Primzahl sein: Ax bedeute x ist eine Primzahl. So ist A3 richtig. (x)Ax bedeute Ax gelte für alle x (eines bestimmen Bereiches). (Ex)Ax: es gibt ein x, für das Ax zutrifft. Für (x)Ax schreiben wir (x)Ax (nicht für alle x gilt Ax) · · · (x)Ax ······ (x)Ax ······ (Ex)Ax · · · (Ex)Ax · · · (Ex)Ax ······ (Ex)Ax Wenn das Allzeichen unnegiert vor einer Aussage steht, so lassen wir es weg: Für (x)Ax schreiben wir Ax. (x)Ax ······ Ax. Ax bedeute x ist Primzahl, Bx bedeute x > 2, Cx x ist ungerade.
9
606
Chapter 3
Oder
Lectures on Proof Theory (1921/22 – 1923/24)
(x)(Ax & Bx → Cx) (Bereich von x: ganze Zahlen). Ax & Bx → Cx weil (x) vor der ganzen Formel steht. (x)Ax Ax (x)(Ax → Bx) Ax → Bx Bx (x)Bx
5
Wir stellen durch inhaltliche Betrachtung einige Beziehungen fest.
10
(x)Ax aeq. (Ex)Ax z. B. Ax: x ist gerade. (Ex)Ax aeq. (x)Ax (x) Ax aeq. (Ex)Ax (Ex)Ax aeq. (x)Ax
10
A enthalte x nicht; dann ist (x)(A → Bx) aeq. A → (x)Bx Dagegen ist (x)(Bx → A) nicht aeq. (x)Bx → A, z. B. bedeute B x ist gerade, A: 7 ist gerade. (x)Bx → A ist richtig, (x)(Bx → A) ist falsch für x = 6. Ferner (x)(Ax & Bx) aeq. (x)Ax & (x)Bx A: x ist gerade (x)(Ax ∨ Bx) nicht aeq. (x)Ax ∨ (x)Bx z. B. B: x ist ungerade. Diese All- und Seinszeichen, mit mehreren Variablen kombiniert, geben ganz neue Formelbildungen. A(x, y) z. B. x ist Vorfahr von y. (x)(y)A(x, y) (falsch) (x)(Ey)A(x, y) falsch. (Ex)(y)A(x, y) richtig (?) 10 (Ex)(Ey)A(x, y) ist richtig. (y)(Ex)A(x, y) (x)(y)A(x, y) aeq. (y)(x)A(x, y) (Ex)(Ey)A(x, y) aeq. (Ey)(Ex)A(x, y) Allzeichen (und Seinszeichen) mit demselben Wirkungsbereich können untereinander vertauscht werden, nicht aber All- mit Seinszeichen. 11 (x)(Ey)(x < y) ist richtig, (Ey)(x)(x < y) falsch. Der Vorfahrensatz: (x)(y)(z){A(x, y) & A(y, z) → A(x, z)} Eine Variable, die im Allzeichen vor der ganzen Formel steht, nennen wir frei. Für freie Variable darf man alles einsetzen, nicht für andre, gebundene. Dagegen darf man diese anders bezeichnen.
15
20
25
30
23.11.1922 (Bernays) (x)(A → Bx) aeq. (x)(A ∨ Bx) · · · 10 The
A → (x)Bx A ∨ (x)Bx
(Ex)(A&Bx) aeq. A & (Ex)Bx
question mark is Kneser’s. first part of this sentence (‘Allzeichen . . . mit’) was written to the right of the preceding list of formulas. 11 The
35
Kneser Mitschrift: The lectures from 1922/23
5
10
607
(x)(A & Bx) · · · A & (x)Bx (Ex)(A ∨ Bx) · · · A ∨ (Ex)Bx12 sogar (x)(Ax & Bx) · · · (x)Ax & (x)Bx (x)Bx → A13 aeq. (Ex)(Bx → A) Dabei ist vorausgesetzt, daß es überhaupt ein x gibt, von der Art, daß wir es einsetzen können. | Nämlich: (Ex)Bx ∨ A, (Ex)(Bx ∨ A), (Ex)(Bx → A). 11 Kann man in (x)Ax ∨ (x)Bx die All- und Seinszeichen hervorziehen? (x)Ax ∨ (y)By, C ∨ (y)By, (y)(C ∨ By), (y) ((x)Ax ∨ By) (y) ((x) (Ax ∨ By)), (y)(x) (Ax ∨ By). Auf diese Weise bringen wir jede Aussage dahin, daß vorne eine Reihe von All- und Seinszeichen steht und dann eine aus Aussagen mit Variablen durch & und ∨ zusammengesetzt ist, z. B. (x)(Ey)(z)(Eu) · · · {Ax ∨ Au ∨ Az ∨ Bz ∨ C ∨ D(x y) . . . & . . . & . . . }
15
Ax wird durch Einsetzen jedes Ausdrucks A Ax → Bx zu dem bekannten Schema A→B. Bx B A & (A → B) → B gibt ebenso z. B. (x)A(x, y) & ((x)A(x, y) → (Ez)B(y, z)) → (Ez)B(y, z)
20
25
30
35
Einige Anwendungen. 1. Gegeben sei Ax → Bx. Wir brauchen (1) (x)Ax → Ay (Aristotelisches Axiom). In A → A setzen wir für A (x)Ax, (x)Ax → (x)Ax, (x)Ax → (y)Ay, (y) ((x)Ax → Ay) Darauf angewandt A → B, B → A. Ay → (x)Ax A für A, (2) Ay → (Ex)Ax Daher (x)Ax → (Ex)Ax. Ax → Bx Ay → By Bx → Ax 2. (y) ((x)Ax → By) (x)Bx → (x)Ax (x) Ax → (x) Bx (x)Ax → (y)By (x)Ax → (x)Bx (Ex)Ax → (Ex)Bx 3. (Ey)(x)A(x, y) → (x)(Ey)A(x, y) (nicht umgekehrt). In (2) Ay → (Eu)Au A(x, y) für Ay A(x, y) → (Eu)A(x, u) (y){(x)A(x, y) → (x)(Eu)A(x, u)} (nach 2.) By (x)A(x, y) (y)(By → C) aeq. (Ey)By → C C (x)(Eu)A(x, u) (Ey)(x)A(x, y) → (x)(Ey)A(x, y) w. z. b. w. 12 The two equivalences for the existential quantifier were originally added in the margin to the left of those for the universal quantifier. 13 This formula was originally written ‘(x)(Bx → A)’.
12
608
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
y+k y+k (Ey)(x)(k) | n=y f (x, n)| < δ → (x)(Ey)(k) | n=y f (x, n)| < δ B (δ)(Ey)(x)(k)
→ (δ)(x)(Ey)(k)
14
d. h. aus gleichmäßiger Konvergenz folgt Konvergenz überhaupt. Reicht unser Kalkül aus, um das alles zu beweisen, was wir brauchen? Zunächst der kleine Kalkül. Wenn ich von X auf Y schließen will, muß X → Y immer richtig sein. Wenn ich aus Ax auf B kommen will, so muß (x)Ax → B richtig sein. Nicht umgekehrt; denn das „kommen“ geht beim kleinen Aussagenkalkül, weil wir dort die Immerrichtigkeit an der Normalform ablesen können. Dies auch beim „großen“ Kalkül zu leisten, ist das Entscheidungsproblem. Wenn ich aus Ax, B(x, y), C(x, y, z) auf K(x, y, z) schließen will, muß
5
10
(x)Ax & (x)(y)B(x, y) & (x)(y)(z)C(x, y, z) → K(x, y, z).
13
Die Bedeutung dieses Problems für die Wissenschaft werde an dem Beispiel der Geometrie erläutert. Zwei Grundbereiche P , g (Punkte und Geraden). | Beziehung L(P, g) (P liegt auf g). Ferner Identität x ≡ y. x ≡ x, x ≡ y & Ax → Ay. Daraus folgt x ≡ y & x ≡ z → y ≡ z.
15
(P )(Q)(Eg) (L(P, g) & L(Q, g)) Zwei Punkte werden von einer Geraden verbunden. (P )(Q){P ≡ Q → (g)(h) (L(P, g) & L(Q, g) & L(P, h) & L(Q, h) → g ≡ h)} Zwei verschiedene Punkte werden von nur einer Geraden verbunden.
20
30.11.1922 (Hilbert) Der Logikkalkül sollte zunächst dazu dienen, die Sprache zu präzisieren. Kann er etwa auch prinzipielle Fragen lösen? Die Frage des tertium non datur natürlich nicht; denn sie haben wir durch die Äquivalenz (x)Ax aeq. (Ex)Ax in den Kalkül hinein gesteckt. Wohl aber ist das Entscheidungsproblem von dieser Art: kann man durch ein endliches Verfahren entscheiden, ob eine vorgelegte Formel (mit Relationsaussagen) richtig ist? Das ist ein Problem mathematischen Charakters. Beschränken wir uns auf Prädikate mit einem Argument. (Ex)(Ey)(z) . . . Ax ∨ Au ∨ Bz ∨ Ay ∨ . . . & Ax ∨ Au ∨ . . . & . . . B
Added in the left-hand margin next to this formula: A(x, y) enth. δ. (k){· · · < δ}
14 In
both formulas the ‘(k)’ was written directly after the ‘(δ)’, but then directed to its proper position by a transposition sign.
25
30
Kneser Mitschrift: The lectures from 1922/23
5
10
15
20
25
609
k Prädikate sollen vorkommen. Für x, y, z sei ein Grundbereich zulässig. Ich nehme an, es gebe nur 2k Dinge dieses Bereichs. Dann gibt es sicher nur endlich viele logische Funktionen von verschiedenem Wahrheitswert. Aus diesen kann man nur auf endlich viele Weisen k herauswählen. Die All- und Seinszeichen werden durch & und ∨ aufgelöst und die Richtigkeit der herauskommenden Formel nach der Regel des kleinen Kalküls festgestellt. Jetzt müssen wir noch beweisen: Wenn eine Formel mit k Prädikaten für jedes System von Prädikaten und für jedes System von 2k Gegenständen richtig ist, so ist sie für jedes System von Prädikaten und jedes System von beliebig vielen Gegenständen richtig. Angenommen nämlich, es gäbe ein bestimmtes System von Aussagen A0 , B0 , . . . für das die Formel falsch ist 15 , so fasse ich alle die Dinge zu einem, s1 , zusammen für die A0 . . . denselben Wahrheitswert haben. Das gibt 2k Klassen s1 , . . . , s2k . Haben wir in diesem Bereich die Richtigkeit festgestellt, so gilt die Formel allgemein. Um aber weiter zu kommen, brauchen wir mindestens eine Relation, die der Indentität ≡ (x, y). Auch mit dieser ist das Entscheidungsproblem zu lösen. Herr Behmann hat es auch noch etwas weiter getrieben. Die allgemeine Lösung, auch bei nur zwei 16 Relationen mit zwei Argumenten, stellt ein äußerst schwieriges mathematisches Problem vor. Nehmen wir einmal an, es sei gelöst für beliebig viele Argumente. Dann kann man tiefere Probleme in Angriff nehmen. Ein Beispiel aus den Grundlagen der Geometrie. Aus den Axiomen der Verknüpfung, der Anordnung, und dem Parallelenaxiom folgt der spezielle Pascalsche Schnittpunktsatz nicht. Das zeigt man mit Hilfe eines Nicht-Archimedischen Zahlensystems, in dem das kommutative Gesetz der Multiplikation nicht gilt. Auf Grund des Entscheidungsproblems ließe sich dies auch zeigen. r r I. Axiome der Verknüpfung: r r r L(x, ξ) heiße: der Punkt x liegt auf der Geraden ξ.
30
35
II. Axiome der Anordnung: Z(x, y; z) heiße z liegt zwischen x und y. III. Parallelenaxiom. L(x, ξ) → (Eη){L(x, η) & (Ey) (L(y, ξ) & L(y, η))} (Es gibt eine nicht schneidendeGerade.) (x)(ξ)(η)(ζ) L(x, ξ) & L(x, η) & L(x, ζ) & (Ey)(L(y, ξ) & L(y, η)) & (Ey)(L(y, ξ) & L(y, ζ) →≡ (η, ζ)
15 The clause ‘für das die Formel falsch ist’ is written in the left-hand margin at about this point. It is clearly meant to apply to ‘Aussagen’. 16 The word ‘zwei’ has been crossed out. We assume the sentence should be: ‘. . . auch bei Relationen mit nur zwei Argumenten, . . . ’.
14
610
15
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Der Pascalsche Satz: · · · C In den Grundlagen der Geometrie ist bewiesen: Auf grund der Axiome I–III ist der Pascalsche Satz nicht zu beweisen. Wie kann bei diesen individuellen Aussagen das Entscheidungsproblem eingreifen, das doch logische Identitäten zwischen unbestimmten Aussagen feststellt? Natürlich, wir brauchen nur die Axiome mit & zu verknüpfen und als Vordersatz vor ein → zu schreiben, auf das dann der Pascalsche Satz folgt. Dazu brauchen wir noch die Axiome der Identität, ≡ (x, x) und ≡ (x, y) → Ax → Ay. In diesem zweiten Axiom haben wir eine unbestimmte Aussage A, die in der Voraussetzung stehen müßte: (A) (≡ (x, y) → Ax → Ay). Das haben wir noch nicht gehabt. Aber hier brauchen wir das Axiom nicht so allgemein, sondern nur: ≡ (x, y) & L(x, ξ) → L(y, ξ), ≡ (ξ, η) & L(x, ξ) → L(x, η) und entsprechend für Z(x, y; z).D Dann können wir in der Tat durch Lösung des Entscheidungsproblems feststellen, daß . . . . 17 Andre Fragen (z. B. der Primzahltheorie) führen durch das Prinzip der vollständigen Induktion auf solche Fragen wo unbestimmte Aussagen in der Voraussetzung stehen, wo also unser Entscheidungsproblem in dieser Form versagt. Die Widerspruchslosigkeit drückt sich dadurch aus, daß & & ··· → A falsch ist, wo in den Klammern alle Axiome stehen. (Denn aus B und B folgt jedes A.) Also auch Entscheidungsproblem. Die Vollständigkeit eines Axiomensystems besteht darin, daß bei Zufügung eines nicht aus den Axiomen folgenden neuen Axioms ein Widerspruch auftritt. Diese Frage entzieht sich dem Entscheidungsproblem, enthält dieses aber auch nicht.
5
10
15
20
25
7.12.192218 (Hilbert) Unsere beiden leitenden Gesichtspunkte waren bisher die Beschränkung auf finite Schlußweise und die Präzisierung der Sprache durch die Formeln des Logikkalküls. Wir können jetzt diesen Formalismus zum Gegenstand inhaltlicher Überlegungen machen, wie wir es vorher mit den Zahlzeichen taten. Dieser Formalismus ist nun unvergleichlich mannigfaltiger. C
Added in the margin to the left of this:
D
Added in the left-hand margin: und L
17 The 18 The
ellipsis is Kneser’s. manuscript has ‘7.11’ here, which is clearly a mistake.
30
Kneser Mitschrift: The lectures from 1922/23
5
10
15
20
25
30
35
611
Der Sinn der axiomatischen Methode bestand bisher darin, daß wir uns über die Voraussetzungen Klarheit verschafften. Jetzt wollen wir die Schlußweisen derselben Prüfung unterziehen. Auch dort war die ursprüngliche Einstellung die, daß wir die Axiome als evident wahr ansahen. Ebenso haben wir hier die Schlußweisen einfach übernommen. So wie wir uns von der inhaltichen Bedeutung frei machten und nur auf logische Beziehung untersuchten, werden | wir auch hier die Schlüsse als formale Regeln betrachten — wie wir es auch schon taten, wenn wir uns einige zusammengesetzte Regeln formelmäßig merkten. Wir erheben diese Idee zum Prinzip. Das Schließen wird zu einem formalen Operieren nach bestimmten Regeln. Die Axiome und logischen Gesetze werden aufgeschrieben und aus ihnen nach den Regeln Formeln abgeleitet. Was nützt uns das bei der Begründung der Gesamtwissenschaft, z. B. der Analysis? In der elementaren Zahlenlehre gab uns das handgreifliche Erfassen der Schlüsse die Gewißheit ihrer Geltung. Das fehlt uns in der Analysis: die transfiniten Schlüsse haben nicht diese Evidenz. Wir brauchen das Problem der Grundlegung nicht so direkt anzugreifen. Die Axiomatik behandelt die Abhängigkeit verschiedener Beziehungen voneinander. Wir werden daher auch diese verdächtigen Schlußweisen anwenden können, wenn wir nur die Gewähr haben, daß ihre Ergebnisse alle im Einklang stehen. Wir haben zu zeigen, daß die üblichen transfiniten Schlüsse zu keinem Widerspruch führen, daß es nicht möglich ist, aus gewissen Grundformeln nach den Regeln des Kalküls etwa A & A zu erhalten. Methodisch verfährt diese Überlegung genau so, wie wenn man in der anschaulichen Zahlenlehre die Unmöglichkeit von a2 = 2b2 beweist. 19 Dies zu beweisen hat man lange erstrebt, dann geradezu (z. B. Poincaré) die Möglichkeit grundsätzlich abgelehnt. Warum diese Ablehnung nicht standhält, werden wir später sehen. Literatur: Bernays, Jena 1921 (J. D. M. V.) Hilbert, Abh. a. d. Math Sem. d. Un. Hbg 1922. Bernays, Hilbertheft d. Naturwissenschaften. Hilbert, Math. Ann. . . . 20 Alles was bisher die Mathematik ausmacht, wird streng formalisiert und zu einem Bestand an Formeln, die außer den mathematischen Zeichen auch logische vorkommen. 21 Gewisse von diesen Formeln dienen als Bausteine und heißen Axiome. Ein Beweis ist eine anschaulich vorliegende Figur. Er besteht S aus Schlüssen nach dem Schema S→T T
19 Bernays’s Ausarbeitung for the 1922/23 lectures (or at least, what we possess of it) appears to end at just this point; see this Volume, p. 547 above. 20 The works referred to are, respectively: Bernays 1922a, Hilbert 1922b, Bernays 1922b and Hilbert 1923a. 21 To render this sentence grammatically correct, ‘vorkommen’ should read ‘enthalten’.
16
612 17
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
wo die beiden oberen Formeln 22
Zu dieser formalisierten „Mathematik im engeren Sinne“ kommt die „Metamathematik“, die zur Sicherung jener dient, und in der das inhaltliche Schließen angewandt wird, jedoch nur zum Nachweis der Widerspruchsfreiheit (Wfr.). Der Aufbau der Mathematik schreitet also fort durch Hinzunahme neuer Axiome und dem Nachweis ihrer Wfr. Die beweisbaren Formeln sind Abbilder der Gedanken in der bisherigen Mathematik. Als die eigentlichen Wahrheiten werden wir jetzt nur die Einsichten betrachten, die wir über Wfr. und Tragweite der Schlußweisen erlangen. (Bernays) Die Formalisierung und die Möglichkeit und Methode eines Widerspruchsbeweises soll an einem einfachen Falle, dem kleinen Logikkalkül, gezeigt werden. Eben dadurch, daß Arithmetik und Logik gleichzeitig formalisiert werden, ergibt sich jene Möglichkeit, was Poincaré übersah. Wir wollen möglichst wenig Regeln haben, viel in die Axiome stecken. Hauptregel (dient zur Definition des Beweises), ist das Schlußschema A (deutsche Buchstaben dienen zur Mitteilung: A→B B „irgend eine Formel A“) Formeln werden bezeichnet durch A, B, C, . . . . Wir haben die Zeichen , → , &, ∨. Einsetzung heißt: für A (oder B) eine Formel des kleinen Kalküls setzen. Als Axiome nehmen wir (in dem formalistischen Sinne): 1. A → B → A 5. A & B → A 6. A & B → B 7. A → B → A & B 2. (A → A → B) → A → B E 3. (A → B → C) → (B → A → C) 8. A → A ∨ B 9. B → A ∨ B 10. (A → C) → (B → C) → 4. (B → C) → (A → B) → A → C A∨B →C 11. A → A → B Satz vom Widerspruch. 12. (A → B) → (A → B) → B Satz vom ausgeschlossenen Dritten. 18
Ein Beweis ist eine Figur, die aus Formeln des kleinen Kalküls besteht. Jede Formel ist Axiom oder entsteht durch erlaubte Einsetzung oder ist Endformel eines vorhergehenden Schlusses oder entsteht aus einem solchen durch Einsetzung. Behauptung: Jede immer richtige Formel des kleinen Kalküls ist aus diesen Axiomen beweisbar. Beweis dafür soll nicht gegeben werden, nur Beispiele. E
Added in the left-hand margin next to 2. is: A → B → C heißt A → (B → C)
22 The
text breaks off here, with a two-line gap. The treatment of ‘Beweis’ is taken up again in the next part of the lecture, which is presented by Bernays.
5
10
15
20
25
30
35
Kneser Mitschrift: The lectures from 1922/23
613
1. A ∨ A ist beweisbar. 2. Wenn A, so A ∨ B. 3. Wenn A und B, so A & B.
5
10
15
20
4. Die Überführung in die Normalform oder das umgekehrte läßt sich durch Beweis nachmachen. 1. A → A ∨ A (A → A ∨ A) → (A → A ∨ A) → A ∨ A (A → A ∨ A) → A ∨ A A→A∨A (A → A ∨ A) → A ∨ A A∨A 2. · · · · · · ······ Beweis für A. ······ A A→A∨B A∨B
3. Entsprechend. ······ ······ A A→B→A&B B→A&B 4. z. B.
25
(Einsetzung in A → A ∨ B)
······ ······ B B→A&B A&B
A aequivalent A, A → A, A → A
A→A→A (A → A → A) → (A → A → A) → A → A (A → A → A) → A → A A→A→A (A → A → A) → A → A
30
(ausgeschlossenes 3.) (Satz von Widerspruch)
A→A 14.12.1922
35
(Bernays) Beispiel für einen Satz der Beweistheorie: (A → B) → A → A ist nicht ohne die Negationsaxiome beweisbar. Wir nehmen jetzt einen möglichst kleinen Teil der arithmetischen Axiome hinzu, der der Zahlzeichenlehre entspricht. Anders als dort fangen wir mit Null an. 0, 0 + 1, 0 + 1 + 1 sind Zahlzeichen.
19
614
20
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Subtraktion δ0, δ(0 + 1), · · · , δδ(0 + 1 + 1 + 1).F Auch vom Logikkalkül nehmen wir etwas hinzu: die freien Variablen a, b, c. a + 1, δa werden auch eingführt. Alles das bedeutet gar nichts. Wir nennen die so entstehenden Ausdrücke Funktionale und bezeichnen sie mit kleinen Buchstaben, Formeln mit großen. a = b (die deutschen Buchstaben dienen zur Mitteilung, bedeuten Funktionale) heißt Gleichung. Statt a = b schreiben wir a = b. Unsere Formeln entstehen aus denen des Aussagenkalküls, indem wir die großen lateinischen Buchstaben durch Gleichungen ersetzen. Erlaubte Einsetzung ist das eben gesagte und das Ersetzen einer freien Variable durch ein Funktional. Axiome außer den logischen: 13. a = a 14. a = b → Aa → Ab Aa bedeutet eine Formel in der 15. a + 1 = 0 (negierte Aussage!) a vorkommt (aber nicht b) 16. δ(a + 1) = a Ab dasselbe mit b.G Die freien Variablen geben einen gewissen Ersatz für das Allzeichen, die Konstruktion mit +1 und δ für das Seinzeichen. Allzeichen in der Voraussetzung können wir noch nicht ausdrücken. Wir können beweisen, daß zwei Zahlzeichen dann und nur dann gleich sind, wenn sie gleiche Gestalt haben. A sei c = a + 1. a=b→c=a+1→c=b+1 Log. Ax. (a = b → →)→c=a+1→a=b→c=b+1 c = a + 1 → a = b23 → c = b + 1 a+1=a+1 a+1=a+1→a=b→a+1=b+1 a=b→a+1=b+1 Ac sei δa = δc. a = b → δa = δa → δa = δb (a = b → → ) → δa = δa → a = b → δa = δb δa = δa → a = b → δa = δb δa = δa δa = δa → a = b → δa = δb24 a = b → δa = δb Einsetzung: a + 1 = b + 1 → δ(a + 1) = δ(b + 1) Durch zweimalige Benutzung des Gleichheitsaxioms kriegt man a+1=b+1→a=b A → B → (B → A) ist eine beweisbare logische Formel. Added in the margin to the left: δ0 + 1 und δ(0 + 1) verschieden. Added in the left-hand margin: Axiome 1–15 werden wir immer beibehalten, 16 später durch andere ersetzen. F
G
23 The formula written here is not clearly identifiable, but it is obvious from the context that it is meant to be a = b. 24 The manuscript has no formula on this line, just dashes. However, there is an arrow leading from the line but one above, indicating that it is to be repeated here.
5
10
15
20
25
30
35
Kneser Mitschrift: The lectures from 1922/23
5
10
15
20
25
615
a+1=b+1→a=b (a + 1 = b + 1 → a = b) → a = b → a + 1 = b + 1 a = b → a + 1 = b + 1 Ac sei c = a. a=b→a=a→b=a ··· ··· ··· a=a→a=b→b=a a=a a = a → a = b → b = a25 a=b→b=a a = b → b = a So erhält man 0 = 0 + 1, 0 = 0 + 1 + 1, 0 + 1 = 0 + 1 + 1 u. s. w. Jetzt wollen wir die Widerspruchsfreiheit beweisen, nämlich daß nicht eine Formel und ihre Negation herauskommt. Daraus würde alles folgen, z. B. 0 = 0. Daraus und aus 0 = 0 folgt wieder alles. 0 = 0 hat besondere Eigenschaften. 1. enthält sie keine Variable; 2. kein δ. Eine solche Formel nennen wir numerische Formel. Einen Beweis mit einer numerischen Endformel unterwerfen wir einer Gesamtreduktion, die im allgemeinen auf keinen Beweis führt, aber auf eine Formelkette von besonderer Art. 1. Auflösung des Beweises. Wenn die Endformel eines Schlusses noch nicht die Endformel ist, so dient sie (zum Einsetzen und) als Prämisse | weiterer Schlüsse. Vor jedem Schluß schreiben wir die vollständige Herleitung der Prämissen. Dann wird jede Formel nur einmal zur Einsetzung verwandt, in einer andren Formel, die wir ihren „Kömmling“ nennen. Eine Formel, die gar nicht weiter benutzt wird, können wir überhaupt weglassen. Beim Schluß heiße B Kömmling von A sowohl wie von A → B. Graphisches Bild 14
3
13 16
E
2. Ausschaltung der Variablen. Eine Formel ohne Variable entsteht 1. durch Einsetzen in eine vorhergehende, diese ersetzen wir durch ihren 30
35
Kömmling; 2. durch Schluß
A A → B. B
In den Prämissen werden die Variablen,
die in B durch Zahlzeichen ersetzt sind, ebenso ersetzt. Für kleine Variablen außerdem wird 0, für große, hinter denen nichts steht, wird 0 = 0 gesetzt. Bisher haben wir einen Beweis erhalten, in dem jede Formel aus einem Axiom durch Einsetzung folgt oder mit einer früheren übereinstimmt. 3. Reduktion der Funktionale. Wenn δ vorkommen, so betrachten wir die innersten der eingeschachtelten δ. Dahinter steht a + 1. Für δ(a + 1) setzen 25 This
line is empty. However, as before, there is an arrow leading from the line but one above, indicating that it is to be repeated here.
21
616
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
wir a, für δ0 setzen wir 0. So schaffen wir alle δ weg. Das ist im allgemeinen kein Beweis mehr. Aber die Eigenschaften dieser Figur fassen wir durch die Begriffe richtig und falsch. Wenn in einer numerischen Gleichung beiderseits dasselbe Zahlzeichen steht, richtig, sonst falsch.
22
R & R R & F · · · R ∨ R R ∨ F · · · R → F R F F R R F ··· R R ··· F26 Wenn wir auch keinen Beweis mehr haben, so haben wir jetzt lauter richtige Formeln. Z. B. 0 + 1 = 0 + 1 + 1 → δ(0 + 1) = 0 → δ(0 + 1 + 1) = 0 dafür kommt 0 + 1 = 0 + 1 + 1 → 0=0 → 0 + 1 = 0. Beim Schluß kommt aus richtigem A und richtigem A → B und falschem B, A → B, R → F ist aber falsch. 27 Bei den Axiomen kommt immer richtiges heraus. Zunächst bei den logischen Axiomen (langweilig). a + 1 = 0 is richtig, denn ein Zahlzeichen das mit +1 aufhört, ist nicht dasselbe wie 0. δ(a + 1) = a; a ist ein Zahlzeichen a. δ(a + 1) = a, dafür also a = a, ist richtig. a = b → Aa → Ab, für a: a, b: b. Wenn für beide dasselbe Zahlzeichen, so A → B → B ist richtig. Sonst F → ( ) ist richtig Also kann die Endformel nicht 0 = 0 sein, denn diese ist falsch und hat sich bei der Reduktion nicht geändert.
5
10
15
20
11.1.1923 (Bernays) Ausführliches Beispiel. Zuerst Beweis der logischen Formel (A → B) → B → AH 1. Wenn A richtig, so ist die ganze Formel richtig. 2. Wenn A, so 1. A→A→A (A → A → A) → A → A A→A (A → B) → A → B 3 (A → B) → A → B → A → (A → B) → B A → (A → B) → B 11 B→B→A (B → B → A) → (C → B) → C → B → A H
Added in the left-hand margin: Endziel ist (!) 0 + 1 + 1 = 0 + 1 + 1 + 1
26 Next to the lower right ‘F’, Kneser has written what appears to be ‘var’, almost like a superscript. 27 These considerations do not seem to fit the context; but see Bernays’s ‘Einschaltung’, included here as a note to p. 25 of the last part of the Ausarbeitung of the 1921/22 lectures, p. 511 of this Volume.
25
30
35
Kneser Mitschrift: The lectures from 1922/23
617
(C →B) → C → B → A (C → B) → C → B → A → (A → C → B) → A → C → B → A
5
(A → C → B) → A → C → B → A für C setze ein A → B A → (A → B) → B (A → (A → B) → B) → A → (A → B) → B → A A → (A → B) → B → A Das ist die erste Hälfte des Beweises.
10
23
A → (A → B) → B → A A → (A → B) → B → A → A → (A → B) · · · → (A → B) → B → A (A → B) → B → A Wir haben nun zu beweisen (1.)
15
A → (A → B) → B → A A→B→A (A → B → A) → (A → B) → A → B → A (A → B) → A → B → A (A → B) → A · · · → A → (A → B) → · · · A → (A → B) → B → A (A → · · · ) → (A → B) → B → A (A → B) → B → A.
20
Jetzt beweisen wir
25
30
(C)
a + 1 = b + 1 → a = b.
a = b → δa = δa → δa = δb (a = b → δa = δa) → δa = δa → a = b → δa = δb δa = δa → a = b → δa = δb δa = δa δa = δa → · · · a = b → δa = δb δ(a + 1) = a δ(a + 1) = a → (a + 1 = b → δ(a + 1) = δb) → a + 1 = b → a = δbI (a + 1 = b → δ(a + 1) = δb) → a + 1 = b → a = δb a + 1 = b → δ(a + 1) = δb (a + 1 = b → δ(a + 1) = δb) → a + 1 = b → a = δb28 a + 1 = b → a = δb I To the left is written: Ac: a + 1 = b → c = δb This is the formula for the instance of the equality axiom used on this line.
28 This
line consists just of dashes, but an arrow from the line but one above indicates that it is to be repeated here.
618
24
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
δ(b + 1) = b (δ(b + 1) = b) → (a + 1 = b + 1 → a = δ(b + 1)) → a + 1 = b + 1 → a = bA (a + 1 = b + 1 → a = δ(b + 1)) → a + 1 = b + 1 → a = b a + 1 = b + 1 → a = δ(b + 1) (B) ··· ··· a+1=b+1→a=b (a + 1 = b + 1 → a = b) → a = b → a + 1 = b + 1 a = b → a + 1 = b + 1 (A)
5
Wir brauchen a = b → b = a a=b→a=a→b=a →)→a=a→a=b→b=a a=a→a=b→b=a a=a a = a → a = b → b = a29 a=b→b=a (a = b → · · · ) → b = a → a = b b = a → a = b a + 1 = 0 a + 1 = 0 → 0 = a + 1 0 = a + 1 0 = 0 + 1 0 = 0 + 1 → 0 + 1 = 0 + 1 + 1 0 + 1 = 0 + 1 + 1 0 + 1 = 0 + 1 + 1 → 0 + 1 + 1 = 0 + 1 + 1 + 1 0 + 1 + 1 = 0 + 1 + 1 + 1
10
(a = b →
15
20
E
25
Graphische Darstellung: Mehrfach angewandt wird A und C. 14
3 14
13
3
1
C
2 11
13 16
15
4
3
14
4
C B A
C B
16
14
1
1 3
12
A
E
B
C
A To the left is written: Ac: a + 1 = b + 1 → a = c This is the formula for the instance of the equality axiom used on this line.
29 This
line is empty, but an arrow from the line but one above indicates that it is to be repeated here.
Kneser Mitschrift: The lectures from 1922/23
619
1–4 und 11–16 sind benutzt. Wie werden nun die Variablen fortgeschafft? Wir verfolgen einen „Faden“. 30 25
5
10
Das bisherige ermöglicht das einfachste Zahlenrechnen. Zunächst führen wir die üblichen Ziffern durch Axiome ein: 1 = 0 + 1, 2 = 0 + 1 + 1, . . . , soweit wir sie gerade brauchen. Ferner Funktionszeichen, kleine griechische Buchstaben. Bei einem Argument lassen wir die Klammern weg. Gewisse Funktionen schreiben wir anders: + und ·. (· · · ) + a. Z. B. 1 + 1 + 2 heißt (1 + 1) + 2. (a + b) · c, wie gewöhnlich a · b · c heißt (a · b) · c. < Weiter . δ(a, b)(= a − b wenn 0 sonst = 0) > wird durch Rekursion definiert. δ(a, b) = 0 → a b δ(a, b) = 0 → a > b δ(b, a) = 0 → a b δ(b, a) = 0 → a < b
25.1.1922
15
20
25
(Bernays) Formeln sollen jetzt auch ≷ mit Funktionalen beiderseits sein. Explizite Definition der Ziffern: 1 = 0 + 1, 2 = 0 + 1 + 1, · · · (soviel wir gerade brauchen). Wir brauchen eine Funktion, die entscheidet, ob eine Beziehung stattfindet oder nicht. Hier haben wir nur Gleichheitsbeziehungen, also ι(a, b): ι(a, a) = 0, a = b → ι(a, b) = 1 für + : a + 0 = a, a + (b + 1) = a + b + 1 für · : a · 0 = 0, a · (b + 1) = a · b + a Nun lassen wir das Axiom δ(a + 1) = a weg und setzen statt dessen: δ0 = 0 δ(a + 1) = a δ(a, 0) = a δ(a, b + 1) = δδ(a, b) Subtraktion ist also so definiert, daß 0 herauskommt, wenn sie nicht geht. ≷,
30
≶ · · · definiert durch a b → δ(a, b) = 0 a > b → δ(a, b) = 0 a b → δ(b, a) = 0 a < b → δ(b, a) = 0
werden definiert wie auf der vorigen Seite. Sie sind Abkürzungen für
jene Gleichungen und Ungleichungen. Ähnlich werden wir die Definition neuer Funktionen zulassen. Durch Rekursion: ϕ0 = a, ϕ(a + 1) = b(a, ϕa)
30 In the left-hand margin there is sketched a downward path from a ‘C’ to a ‘E’, which then has a downward path to another ‘C’. This is presumably a graphical representation of a ‘Faden’. At this point, there is a gap of about five lines in the text.
26
620
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
wo b(a, c) ein schon definiertes Funktional ist. 31 Jede Einsetzung ist ein Spezialfall hiervon, z. B. 31 χa = ϕ(a + ψa) χ(a + 1) = ϕ(a + 1 + ψ(a + 1)) b(a, c) enthält c nicht. Rekursion auch bei mehr Argumenten. ϕ(a, 0) = a(a), ϕ(a, b + 1) = b(a, b, ϕ(a, b)), wo b(a, b, c) mit den schon definierten Funktionen gebildet ist. Hiervon sind die Definitionen von δ, +, · Sonderfälle. Wenn wir die Rekursion verwerten wollen, so müssen wir den Schluß von n auf n + 1 ausführen können. Wir machen dies provisorisch durch Erweiterung A0 des Schlußschemas: Aa → A(a + 1), AaB die wir später durch neue Axiome wieder entbehrlich machen werden. Bevor wir uns zur Widerspruchsfreiheit wenden, behandeln wir einige Beispiele. Wie definiert man den kleinsten von 1 verschiedenen Teiler einer Zahl? λ(a, b) = δ(1, ι(a, b)) (Einsetzung) (= 1 − ι(a, b)) μ(a, 0) = 0, μ(a, b + 1) = a · λ (a, μ(a, b)) + (b + 1) · ι (a, μ(a, b)) (Minimum von a und b)
5
10
15
20
ϕ(m, k, 0) = 0 ϕ(m, k, n+1) = ϕ(m, k, n) + k · λ(m, (n + 1) · k) · λ(0, ϕ(m, k, n))
27
(Wenn n > 0 und m gleich einer der Zahlen 1 · k, 2 · k, . . . , n · k, so ist ϕ = k, sonst = 0.) ψ(m, k) = ϕ(m, k, m) + m · λ (0, ϕ(m, k, m)) (= ??? χ(m, 0) = m χ(m, a + 1) = μ (χ(m, a), ψ(m, a + 2)) (Wenn m > 1 und eine der Zahlen 2, . . . , a + 1 Teiler von m, so ist χ die kleinste darunter, sonst = m.) νm = χ(m, δm) ist für m 2 unser kleinster Teiler > 1. Wie zeigt man die Rechengesetze? Addition a + (b + c) = a + b + c 0+a = a 1+a = a+1 a+b = b+a Multiplikation B
(a + b) · c = a · c + b · c
Induktion nach c ··· ··· · · · nach a oder b Induktion nach c
Written in the margin to the left: Das ergibt A1 Aa → A(a + 1) a = 0 → Aa
31–31 This
sentence had been crossed out by Kneser, but dots beneath the whole line seem to indicate that it should stand.
25
30
35
Kneser Mitschrift: The lectures from 1922/23
0·a 1·a a·b a · (b + c) a · (b · c)
5
= = = = =
0 a b·a a·b + a·c a·b·c
621
··· ··· ··· Ohne Induktion Induktion nach c
Subtraktion a = 0 → δ(a) + 1 = a Für a = 0 gilt es. Für a + 1: a + 1 = 0 → δ(a + 1) + 1 = a + 1 (Diese Formel ist sonst immer grundlegendes Axiom.) a+b = 0→a=0 a+c = b+c→a=b Induktion nach c (Eindeutige Umkehrung der Addition.) δ(0, c) = 0 Induktion nach c δ(a, b) = 0 → a = b + δ(a, b) Induktion nach b δ(a + 1, b + 1) = δ(a, b) δ(a + c, b + c) = δ(a, b) Induktion nach c. δ(a + b, b) = a Ohne Induktion δ(a, a) = 0 ··· aber mit Fallunterscheidung δ(δ(a, b), c) = δ(a, b + c) ··· δ(a, b) = 0 → δ(a + 1, b) = 0 δ(a + 1, b) = 0 → δ(a + 1, b) = δ(a, b) + 1 δ(a, b) = 0 → δ(b, a) = 0 δ(a, b) = 0 → δ(b, a) = 0 → a = b Induktion
10
15
}
20
a>b → b>c → a>c a = 0 → b = 0 → a · b = 0 (a = δa + 1, b = δb + 1, a · b = · · · + 1 = 0) a = 0 → a · b = a · c → b = c (Umkehrbarkeit der Multiplikation)
25
Division C ( ab )32
(0, b) = 0, κ(0, b) = 0,
(a + 1, b) = ((a, b) + 1) ι (b, (a, b) + 1)) κ(a + 1, b) = κ(a, b) + λ (b, (a, b) + 1)
a = b · κ(a, b) + (a, b) b = 0 → (a, b) < b
30
(Induktion).
1.2.1923
35
(Bernays) Wir wenden uns zur Widerspruchsfreiheit. Was für Axiome hatten wir? 1–12 logische Axiome. 13. a=a Alle weiteren sind Definitionsaxiome, 14. a = b → Aa → Ab die entweder durch Rekursion eine 15. a + 1 = 0 Funktion definieren oder nur eine Abkürzung einführen. C
Added in the left-hand margin: Rest von a nach b
32 This
is written in the left-hand margin.
28
622
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
1=0+1 ι(a, a) = 0 2=0+1+1 a = b → ι(a, b) = 1 ··· Definitionsaxiome von der Gestalt: ϕ0=a z. B. δ0 = 0 ϕ(a + 1) = b(a, ϕa) δ(a + 1) = a 29
δ(a, 0) = a δ(a, b + 1) = δδ(a, b)
Was ist jetzt ein Beweis? 1. haben wir mehr Axiome. 2. Für Variable werden Funktionale eingesetzt. Der Begriff des Funktionals ist wesentlich erweitert. 3. Formel: Funktionale = = Funktionale oder >, <, , . Diese werden durch δ(a, b) ersetzt. Was wird aber beim Einsetzen? δ(a, b) = 0 → a b wird A → A. Auch z. B. 2 = 0 + 1 + 1. Schreiben wir 0 + 1 + 1 für 2, so kommt a = a.D Wie wird es bei Rekursionen? ϕ(z) komme vor. Entweder ist z gleich 0, dann setzen wir a dafür. Oder ϕ(z + 1) : b(z, ϕz). Behauptung: Dies Einsetzen kommt zu einem Abschluß, wenn wir zu innerst anfangen. Nehmen wir an, wir hätten von innen an alle rekursiv definierten Funktionen herausgeschafft, bis zu einem ϕ, dessen Argumente also Zahlzeichen sind. ϕ sei etwa definiert durch ϕ(c, 0) = a(c) ϕ(c, a + 1) = b(c, a, ϕ(c, a)) Da ersetzen wir ϕ(c, z + 1) durch b (c, z, ϕ(c, z)) u. s. w. Wie steht es mit der Richtigkeit? Beim Schluß entsteht aus Richtigem Richtiges. Aber Axiom 14. und die rekursiven Definitionsaxiome
5
10
15
20
a = b → Aa → Ab Reduktion der Funktionale. Wenn am Ende für a und b dasselbe herauskommt, so ist Aa → Ab richtig, wenn nicht, so ist a = b falsch. ϕ(c, 0) = a(c) für ϕ(c, 0) ist a(c) zu setzen ϕ(c, z + 1) = · · · · · · ··· ··· Die reduzierte Formel ist richtig. Entsprechend verfahren wir bei ι(z, z). Etwas Schwierigkeit macht die Vieldeutigkeit des +. Deshalb ersetzen wir + durch σ(a, 0) =a σ(a, b + 1) = σ(a, b) + 1
30
σ(a, b) = a+b 1 = 0+1 Wie reduzieren wir jetzt? a+b wird durch σ(a, b) ersetzt, außer wenn b gleich 1 ist. 1 wird durch 0 + 1 ersetzt, außer wenn es hinter + steht. Aus σ(a, 1) = a + 1 kommt σ(a, 0 + 1) σ(a, 0) + 1 D Added in the left-hand margin: Zunächst beseitigt man wie vorher alle Variablen.
25
30
35
40
Kneser Mitschrift: The lectures from 1922/23
a+1 = a+1
623
richtig.
Axiom 14? a = b → Aa → Ab
5
z. B. 1 = 0 + 1 → A(f + 1) → A (f + (0 + 1)) Aσ (f, 0 + 1) A (σ(f, 0) + 1) A (f + 1) richtig. (Hilbert) Drei Mängel sind noch zu beseitigen. 1. In logischer Hinsicht haben wir nur den Aussagenkalkül mit freien Variablen; es fehlt „alle“ und „es gibt“.
10
2. Wir haben das Induktionsschema hinzugefügt, und noch nicht seine Widerspruchsfreiheit bewiesen. 3.
15
20
25
30
35
33
Diese Mängel hindern uns aber auch beim Aufbau der Analysis, z. B. der Irrationalzahlen. 1. Wir hätten einfache Formeln auszusuchen, aus denen alles nötige folgt. Der Widerspruchsfreiheitsbeweis macht dann aber außerordentliche Schwierigkeiten, wegen der gebundenen Variablen. Der Kern der Schwierigkeit liegt aber an einer andren Stelle, auf die man gewöhnlich erst später aufmerksam wird: beim Auswahlaxiom von Zermelo. Haben wir eine Menge von Mengen, M1 , M2 , . . . , seien einige davon, die alle elementenfremd sind und je mindestens ein Element enthalten, so gibt es eine Repräsentantenmenge R1 , R2 , . . . , so daß aus jedem M genau ein R da ist und jedes R aus (genau) einem M stammt. Die Einwände richten sich vorzüglich gegen das Auswahlprinzip. Sie müßten sich aber ebenso gegen „alle“ und „es gibt“ richten, wobei ja derselbe Grundgedanke zugrunde liegt. Wir wollen das Auswahlaxiom erweitern. Jeder Aussage mit einer Variablen A(a) ordnen wir ein Ding zu, | für das die Aussage nur dann gilt, wenn sie allgemein gilt. Also ein Gegenbeispiel, wenn es existiert. ε(A), eine individuelle logische Funktion. Wenn A(a, b), so εa (A (a, b)) ist ein ϕb. ε genüge dem transfiniten Axiom: 16. A(εA) → Aa. Z. B. Aa heiße: a ist bestechlich. εA ist Aristides. Damit können wir die Allund Seinszeichen durch die folgenden Axiome definieren: A(εA) (a)Aa, A(εA) (Ea)Aa Damit beweisen wir das Aristotelische Prinzip: (a)Aa → Aa 33 Nothing
appears under point 3. But this is remedied on p. 33, when this point is taken up: ‘Wir wollen nicht nur Arithmetik, sondern die Analysis begründen.’
31
624
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
(a)Aa → A(εA) A(εA) → Aa (a)Aa → Aa Existentialprinzip: Aa → (Ea)Aa. A(εA) → Aa Aa → A(εA) A(εA) → (Ea)Aa ········· Aa → (Ea)Aa Weiter
(a)Aa → (Ea)Aa,
daraus beweisbar
5
(Ea)Aa → (a)Aa
10
(Ea)Aa (a)Aa 8.2.1923 (Bernays) Die oben benutzte Formel (a)Aa → (a)Aa. Allgemein sei 34 Aa → Ba. (a)Aa → Aa, (a)Aa → Ba für das a rechts setzen wir εB: (a)Aa → B(εB), (a)Aa → (a)Ba
32
15
Überhaupt: vor eine Aussage mit einer freien Variable Aa setzen wir das betreffende Allzeichen, in dem wir für sie εA setzen. Ebenso: A → Ba, A → B(εB), A → (a)Ba. Oder A → B(ε (A → Ba)), (a)(A → Ba). Auch aus A → (a)Ba folgen die andren. (a)Ba → B(ε (A → B(a))) A → B(ε (A → Ba)) (a)Ba → A, B(εB) → A (Ba → A) → (Ea)(Ba → A) εB35 (Ea)(Ba → A) d. h. BεBa → A → A (a)Ba → Ba → BεBa → A (a)Ba →A Auch die Vertauschung zweier Allzeichen ist zu beweisen.
30
(Hilbert) 2. Wir hatten das Induktionsschema hinzugefügt. Das ist eine alte Fragestellung. Das Axiom a = 0 → a = δa + 1 behalten wir bei. Das Auswahlaxiom AεA → Aa verschärfen wir durch εA = 0 → Aδ(εA). (Die dem Gegenbeispiel vorangehende Zahl soll kein Gegenbeispiel sein.)
35
34 This
appears to be ‘ist’ overwritten by ‘sei’. is a small arrow leading from this ‘εB’ to the ‘a’ directly above it.
35 There
20
25
Kneser Mitschrift: The lectures from 1922/23
625
Das Induktionsschema
5
10
15
20
25
30
A0 wollen wir nunmehr beweisen, Aa → A(a + 1) Aa d. h. wir beweisen die Formel : A0 → (a) Aa → A(a + 1) → Aa. Haben wir nämlich sie, so setzen wir für A A ein, schreiben A0 drüber und haben (a) Aa → A(a + 1) → Aa. Vor Aa → A(a + 1) setzen wir (a) vor (siehe oben), schreiben sie darüber und haben Aa. Der Beweis ist recht lang und soll nur geschildert werden. Axiom 12: (A →B) → (A → B)→ B Für A: εA = 0, für B A0 → Aa → A(a + 1) → Aa (B). Wir müssen zeigen: 1. εA = 0 → B 2. εA = 0 → B Statt 1. zeigen wir sogar 1*. εA = 0 → A0 → Aa Statt 2. · · · · · · · · · · · · · · · 2*. εA = 0 → (a) Aa → A(a + 1) → Aa 0 = εA → A0 → AεA AεA → Aa daraus 1*. (a) Aa → A(a + 1) → AδεA → A(δεA + 1) (Aristotelisches Axiom) 2* ist beweisbar, wenn εA = 0 & AδεA → A(δεA + 1 → Aa Aus dem Axiom εA = 0 → AδεA ergibt sich, daß wir nur AδεA & A(δεA + 1) → Aa εA = 0 & A(δεA + 1) → Aa Axiom a = 0 → a = δa + 1 für a : εA εA = 0 → εA = δεA + 1 δεA + 1 = εA → A(δεA + 1) → AεA AεA → Aa w. z. b. w. 36 3. Wir wollen nicht nur Arithmetik, sondern die Analysis begründen. Eine reelle Zahl wird durch eine ganzzahlige Funktion αn = ϕn, als Dualbruch 0,α1 α2 α3 . . . dargestellt. Wir machen es eindeutig, indem wir den Schluß . . . 000. . . ausschließen: (a)(ϕa = 0 ∨ ϕa = 1) & (a)(Eb)(ϕa + b = 1) Wir haben
√
35
33
√
√
rational z. B. 0,[2 2 ][3 3 ][4 4 ] . . . wo [a] = 10 wenn a irrational . Damit können wir das Rechnen mit reellen Zahlen begründen. Auch ≷: ϕ < ϕ (Ea) (b)(b < a → ϕb = ϕ b) & ϕa = 0 & ϕ b = 1 Wir gehen gleich zu dem fundamentalen Satz von der Existenz der oberen Grenze einer beschränkten Folge reeller Zahlen ζ1 , ζ2 , ζ3 , . . . ζn = 0,ϕ(1, n)ϕ(2, n) . . . ϕ(a, n) 36 In the manuscript, there are two arrowed lines incorporated into this proof and designed to highlight its conclusion. One runs vertically down from ‘εA = 0’ three lines above ‘w. z. b. w.’, then turns at right-angles and runs horizontally over this expression, ending at the right-hand side and pointing at ‘Aa’. The second is much the same, but this time starting at ‘A(δεA + 1)’ above ‘w. z. b. w.’, running vertically down to join the first line, and thus also pointing at ‘Aa’; ‘εA = 0’ and ‘A(δεA + 1)’ are indeed the two premises leading to ‘Aa’.
34
626
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Eine transfinite Funktion π sei definiert durch explizite Definition durch (n)An → πn An = 0 (n)An → πn An = 1 εA, das im Allzeichen steckt ψ wird durch simultane Rekursion definiert zugleich mit χ(0, n) = 0 ψ(a + 1) = πn (χ(a, n) = 0 → ϕ(a + 1, n) = 0) χ(a + 1, n) = χ(a n) + ι (ψ(a + 1), ϕ(a + 1, n))
}
ψ genügt den Bedingungen und stellt die obere Grenze dar. Sodann sei eine beliebige Menge reeller Zahlen gegeben. Was heißt das? f n eine Funktionsvariable. Die Aussage Mf (individuell!) definiert eine Menge von Funktionen, d. h. von reellen Zahlen, wenn für f die diese darstellenden Funktionen gesetzt werden; und zwar die Menge derjenigen, für die Mf gilt. Wir müssen das Auswahlaxiom auch dafür ansetzen: Aεf A → Af , (f )Af → πf Af = 0 (f )Af → πf Af = 1. εf A ist eine individuelle Funktion, π eine Zahl.
5
10
15
15.2.1923 35
(Bernays) Der Widerspruchsfreiheitbeweis für die bisher benutzten Axiomentypen wäre unbequem. Daher hatten wir aus a = 0 → a = δa + 1, εA = 0 → AδεA die Induktionsformel bewiesen. (Ea)Aa → (Ea){Aa & (b)(b < a → Ab)} d. h. es gibt ein kleinstes a, für das Aa ist, kann man beweisen. Aa & (b)(b < a → Ab) : Ba. Dann liefert εa Ba das gefordete. Die Funktionsvariablen f . . . unterscheiden sich von den bisherigen darin, daß für sie eine individuelle Funktion von ebensoviel Argumenten eingesetzt wird. Eine Menge reeller Zahlen wird definiert durch eine Aussage Af , die nur für solche Funktionen zutrifft, die reelle Zahlen definieren. Zur Menge gehören alle ϕ für die Aϕ gilt. (Af → Rf ) Die obere Grenze wird gegeben durch ψ0 χ(0, f ) ψ(a + 1) χ(a + 1, f )
37 There
= = = =
0 0 πf (Af & χ(a, f ) = 0 → f (a + 1) = 0) χ(a, f ) + ι (ψ(a + 1), f (a + 1)) wo für ψ(a + 1)37 das eben definierte zu setzen ist.
is an arrow leading upwards from this occurrence of ‘ψ(a + 1)’ to the ‘ψ(a + 1)’ in ‘ι (ψ(a + 1), f (a + 1))’ in the line just above.
20
25
30
35
Kneser Mitschrift: The lectures from 1922/23
5
10
15
20
Als Probe für die Anwendung dieser Hilfsmittel nehmen wir das Zermelosche Auswahlpostulat in seiner ursprünglichen, naiven und umfassendsten Gestalt. Es genügt vollkommen, Mengen ganzer Zahlen zu nehmen. (Ea)Aa → Aεa A (Ea)(f a = 1) → f εa (f a = 1) = 1 Eine Menge ist gegeben durch eine Funktion ϕ = 01 . Da haben wir schon die Auswahl getroffen, für alle Mengen | auf einmal. 38
30
35
36
(Hilbert) Nachdem wir uns davon überzeugt haben, daß wir mit unseren Axiomen die Mathematik in befriedigendem Umfange aufbauen können, kommen wir zum Beweise der Widerspruchsfreiheit. Unsere Axiome waren: 12 logische Axiome, 2 Gleichheitsaxiome, 15. a+1 = 0, 16. a = 0 → a = δ a + 1. Bis hierhin haben wir die Widerspruchsfreiheit bewiesen, in drei Schritten: 1. Auflösung in Fäden. 2. Ausschaltung der Variablen. 3. Wegschaffen der Funktions- und Definitionszeichen. Dabei blieb der Beweis ein Beweis und enthielt nur noch numerische Formeln. An diesen führten wir die Unterscheidung zwischen „richtig“ und „falsch“ durch. Jede Formel entsteht entweder durch Einsetzung und Reduktion aus einem Axiom, oder ist Endformel eines Schlusses. Jede so entstehende Formel ist richtig. Das ging bei den finiten Axiomen, geht auch bei Hinzunahme des Axioms 16. Nun kommen aber 17. Aεa Aa → Aa
25
627
18. εa Aa = 0 → A(δεa Aa). 39
Liege also ein Beweis vor mit der Schlußformel 0 = 0. Die durch ε definierten All- und Seinszeichen werden wieder durch ε ersetzt.E Die Variablen können wir beseitigen bis auf solche wie εa (Aa)! Variable Aussagen A kommen nicht mehr vor. Die Pointe des Beweises soll hier angegeben werden. Der einfachste Fall ist der, daß im Argument von ε nur ein Prädikat A vorkommt, in dem selbst also kein ε mehr steht. (Vorkommen heißt auch vorkommen bei der rekursiven Definition einer im Beweise auftretenden Funktion ϕ.) Wir wollen sehen, daß beim Einsetzen in Axiome nur richtige Formeln zuwege kommen. In 17 40 ist für A nur A einzusetzen: AεA → Aa, εA = 0 → A(δεA). Durch die Reduktion wie früher wird a ein Zahlzeichen z. | Nun setze ich im Beweise überrall für εA: 0 ein. An den Anfängen steht also A0 → Az bezw. 0 = 0 → · · · (dies ist immer richtig). Ist A0 → Az richtig? Wenn ja, gut. Wenn aber in einer der vorkommenden z Az∗ falsch ist, und A0 richtig. Dann E Added in the margin to the left of the line beginning ‘ε ersetzt’: 1. geht wie vorher. 38 An arrow leads from the sentence ‘Da haben wir . . . ’ to the second of the two formulas given just above. 39 In the antecedent to 18, Kneser has ‘ε Aa = 0’, which is clearly wrong. ε 40 Kneser clearly means 17 and 18.
37
628
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
schaffen wir das εA auf eine andre Weise dadurch fort, daß wir z∗∗ dafür setzen, d. h. das kleinste Zahlzeichen 0, 0 + 1, . . . , z∗ für das Az falsch ist. z∗∗ = 0 → Aδz∗∗ Dann ist in 17. Az∗∗ falsch, Az∗∗ → · · · ist richtig; in 18: richt.
richt.
ebenfalls. Die obersten Formeln sind richtig, jede folgende auch, also kann die falche Formel 0 = 0 nicht am Schluß stehen. Wenn wir einen Widerspruch haben, so muß, da unser Denken ein finiter Prozeß ist, ein (endlicher) Beweis dafür vorliegen. Wird in diesem Beweise die Auswahl benutzt, so muß uns der Beweis selbst die Auswahl liefern. Es wird nicht behauptet, daß man stets die Auswahl treffen kann; wohl aber kann man, ohne einen Widerspruch zu riskieren, tun als sei sie getroffen. Die ausgewählten Elemente spielen dieselbe Rolle wie z. B. die idealen Elemente (∞ fern, imaginär).
5
10
22.2.1923 (Bernays) Beweis der Widerspruchsfreiheit von ε und π zugleich. 17. 18. (a)Aa → πa Aa = 0
38
(a)Aa → πa Aa = 1 Den Beweis formten wir so um, daß jede Formel numerisch ist und entweder direkt richtig ist oder aus einem Axiom durch Einsetzen und Reduktion der Funktionale entsteht. Die Schwierigkeit besteht hier in der Reduktion der Funktionale. (a)Aa wird durch Aεa Aa ersetzt. Was geschieht, wenn z. B. 3 + εa (ϕ a = 0) dasteht? | In dem behandelten einfachsten Falle setzten wir für jedes ε, 0. ε und π mögen nur in Verbindung mit A vorkommen. Wenn A0 nach Reduktion richtig ist, setzen wir für πA, 0, sonst 0 + 1; für εA, 0. Aεa A → πa Aa = 0 wird A0 → πa Aa =0 richtig, ob A0 richtig oder falsch ist. Aεa A → πa Aa = 1 Etwas Falsches kann nur durch A0 → Az kommen. Dann ist z = · · · + 1. 0, 0 + 1, . . . , z. z + 1 sei das erste für das Az falsch ist. Jetzt setze ich für εA, z + 1; für πA, 0 + 1. Dann haben wir A(z + 1) → πa Aa = 041 richtig falsch richtig A(z + 1) → 0 + 1 = 1 ist richtig A(z + 1) → Aa z + 1 = 0 → Az richtig Wenn wir eine Funktionsvariable haben: Aεf Af → Af 41 Kneser
has πa Aa = 0, whereas it should be πa Aa = 1.
15
20
25
30
35
Kneser Mitschrift: The lectures from 1922/23
5
10
15
629
(π fällt fort)? ε komme nur mit A vor (z. B. f 0 = 0, f f 0 = 0). Wie werden wir die Funktionsvariablen ausschalten? Statt f c setzen wir einfach c. Auf die gebundenen trifft das nicht zu. Für diese nehmen wir probeweise eine bestimmte Funktion z. B. δa und führen damit die Reduktion durch. Dann steht z. B. Aδ → Aϕ. Diese, reduziert ist richtig oder falsch. Im letzten Falle ist Aϕ falsch. Dann setzen wir überall ϕ für εf Af . Dann steht | Aϕ → Aψ. Das ist sicher richtig da Aϕ falsch ist. Inhaltlich betrachtet liegt hier scheinbar ein Zirkel vor. Die für Funktionsvariable einsetzbaren Funktionen sind die durch Rekursion definierten, wobei in der Rekursion wieder ε vorkommen darf (Weyls circulus vitiosus). Daß er nicht vitiosus ist, lehrt dieser Beweis. Wenn dadurch ein Widerspruch hervorkäme, so würde er auch ohne den Zirkel da sein (vgl. Russells axiom of reducibility). Wir haben gezeigt, an einem Beweis von 0 = 0 können wir die Reduktion wirklich ausführen. Die Rekursion war: ϕ0 = a, ϕ(a + 1) = c(a, ϕa) ϕ(0, b) = a(b), ϕ(a + 1, b) = c(a, b, ϕ(a, b)) simultan ϕ0 = a ψ0 = b ϕ(a + 1) = c(ϕa, ψa, a), ψ(a + 1) = d(ϕa, ψa, a)
39
In dieser Form kann die Analysis noch nicht fertig sein: 20
1. Wir bekommen nur abzählbar viele Funktionen. 2. Auch sonst sind diese Definitionsmöglichkeiten zu eng.
25
30
35
40
Zu 1. Wir ordnen die Funktionen nach der Zahl der zur Definition benötigten, vorher definierten Funktionen. Wir nehmen abzählbar viele Variable. Durch „+1“ kommt abzählbar heraus; ( ). U. s. w. Aber schon die zahlentheoretischen Funktionen mit der Werten 0, 1 sind überabzählbar. Unser Formalismus ist abgeschlossen bezüglich des Dedekindschen Schnittes, aber nicht vollständig, nicht absolut abgeschlossen. Das muß er aber sein, wenn man von der Analysis verlangt, daß sie eine Formalisierung aller Größenbeziehungen geben soll, die dem Archimedischen Axiom genügen, d. h. sich durch Zahlenbeziehungen wiedergeben lassen. Zu 2. z. B. ι(a, b) ließe sich auch durch Rekursion definieren 1) ι0 = 0, ι(a + 1) = 1 2) ι(a, 0) = ιa, ι(a, b + 1) = ι(δa, b) · ιa + δ(1, ιa) Das ordnet sich unserem Schema nicht ein! Wir haben ι(a, b+1) durch ι(δa, b), nicht nur ι(a, b) definiert. Oder ϕ(a, 0) = a(a) ϕ(0, b) = b(b) ϕ(a + 1, b + 1) = ϕ(ϕ(a, b + 1), b) Überhaupt ist die simultane Rekursion für ϕ und ψ zu ersetzen durch χ(u, v, a) = uϕa + vψa
40
630
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
χ(u, v, 0) = u · a + v · b42 χ(u, v, a + 1)= u · c (χ(1, 0, a), χ(0, 1, a), a) +v · d (χ(1, 0, a), χ(0, 1, a), a) = e (χ(1, 0, a), χ(0, 1, a), a, u, v) Eine allgemeinere Form ist: ϕ(0, u) = nu ϕ(a + 1, u) = k (ϕ (a, β(a, u)) , a, u) β braucht nicht selbst bekannt zu sein, sondern nur durch ϕ(a, u) für alle u. Oder ϕ(0, b) = ab ψ(0, a, b) =b ψ(n + 1, a, b) = ϕ (a, ψ(n, a, b)) ϕ(a + 1, b) = ϕ (a, ψ(ca, a, b)) (ca ist die ψa-fache Iteration von ϕ nach b). So kann man noch mehr einführen; in jedem Falle wäre dann die Reduktion der Funktionale durchzuführen. Hier bekommen wir mehr als abzählbar; das klärt uns zugleich das Richardsche Paradoxon auf. Wir werden nämlich die Zahlen der 2. Zahlklasse als Funktionale durch Reduktion einführen. Za genügt den Axiomen Z0, Za → Z(a + 1) A0 → (a) (Aa → A(a + 1)) → (Za → Aa) < muß als Grundbeziehung auftreten a < b → b < c → a < c, a < a + 1, a < b → a = b. „Zahl der 2. Klasse“ N 0, N a → N (a + 1), Limesbildung: (a)(Za → N f a) → N (λa f a) Za → ϕa < λb ϕb (a)(Za → ϕa < b) → λa ϕa = b ∨ λa ϕa < b Wie bauen sich die ersten Zahlen der zweiten Klasse auf? λa a : ω λb (λa a + b) : ω + ω ϕ0 = 0, ϕ(n + 1) = λa (ϕn + a), λn ϕn : ω⎫· ω ϕ(n, 0) = ϕn ⎬ ϕ(0, k + 1) = λa ϕ(a, k) λm ϕ(0, m) : ω · ω · ω. ⎭ ϕ(b + 1, k + 1) = λa (ϕ(b, k + 1) + a)43
5
10
15
„Zahl sein“
41
(Hilbert) Diese Beispiele zeigen jedenfalls, daß die bisher ausgeführten Methoden auch die Aussicht eröffnen, die klassischen Schwierigkeiten der Mengenlehre in Angriff zu nehmen.
42 This line was originally written in the left-hand margin to the left of the lines second and third after this one. 43 The final bracket was omitted in Kneser’s manuscript.
20
25
30
35
Textual Notes
631
Textual Notes 599.2: 599.8: 599.19: 600.21: 600.23: 600.24: 600.24: 600.25: 600.26: 600.27: 600.29: 600.33: 600.33: 601.5: 601.7: 601.11: 601.14: 601.20: 601.21: 601.21: 601.22: 601.24: 601.24: 601.27: 601.35: 602.19: 602.32: 602.32: 602.33: 602.33: 602.34: 603.4: 603.33: 603.33: 604.6: 604.6: 604.7: 604.7: 604.7: 604.8: 604.8: 604.9: 604.11: 604.11: 604.11:
betreffenden] betr. Wissenschaften] Wissensch. grosse] gr Zahlzeichen] Zz. Zahlzeichen] Zz. Zahlzeichen] Zz. Zahlzeichen] Zz. ,] u. s. w.] usw. Zahlzeichen] Zz. Zahlzeichen] Zz. verschiedenen] versch. Zahlzeichen] Zz. Zahlzeichen] Zz. Widerspruch] Widerspr. Zahlzeichen] Zz. Behauptung] Beh. Individuum] Ind. Individuen] Ind. Zahlzeichen] Zahlz. Behauptung:] Beh. Zahlzeichen] Zz. Zahlzeichen] Zz zwischen] zw. Zahlentheorie] Zahlenth. Logikkalkül] Lk. richtig] r. richtig] r. richtig] r. richtig] r. richtig] r. :] ) Richtigkeit] R. Ersetzbarkeit] Ers. richtig] r. richtig] r. richtig] r. richtig] r. richtig] r. richtig] r. richtig] r. richtig] r. logische] log. logischen Produkten] log. Prod. richtig] r.
604.14: 604.14: 604.19: 604.31: 604.31: 604.31: 605.4: 605.4: 605.5: 605.5: 605.13: 605.13: 605.14: 605.14: 605.15: 605.15: 605.21: 605.23: 605.27: 605.30: 606.21: 606.22: 606.27: 606.27: 606.29: 607.6: 607.24:
607.29: 608.5: 608.18: 608.18: 608.20: 608.20: 609.7: 609.9: 609.9: 609.9: 609.10:
richtige] r. überstrichenen] überstr. richtig] r. richtig] r. richtig] r. richtig] r. reelle Zahl] r. Z. algebraisch] alg. reellen Zahlen] r. Z. abzählbar] abz. Additionsgesetz] Add. Geschwindigkeit.] Geschw. Gleichmässige] Gleichm. Lichtgeschwindigkeit] Lichtgeschw. Gleichmässige] . . . Lichtgeschwindigkeit] ... werden] wird Kritik der reinen Vernunft] Kr. d. r. V. Vorfahren] Vorf. Aristotelische Logik] Ar. L. (Ex)] E(x) richtig] r. richtig] r. falsch] f. Allzeichen] Allz. All- und Seinszeichen] A u Seinsz. Daher] Illegible in manuscript; editorial conjecture. umgekehrt] umgek. ,] Punkte] P. Geraden] Ger. verschiedene Punkte] versch. P Geraden] Ger. Prädikaten] Präd. System] Syst. Prädikaten] Präd. System] Syst System] Syst.
632
Chapter 3
609.33: 610.2:
610.3: 610.15: 610.23: 610.25: 610.26: 611.32: 611.33: 612.2: 612.2–3: 612.5: 612.6: 612.7: 612.10–11: 612.31: 612.32: 612.33: 612.35: 612.36: 612.36: 612.37: 613.16: 613.24: 613.26: 613.28: 613.36: 614.3: 614.9:
614.10: 614.16: 614.17: 614.19: 614.35: 614n: 615.12: 615.17:
Lectures on Proof Theory (1921/22 – 1923/24)
Gerade.)] Grundlagen der Geometrie] Grul. d. Geom. Pascalsche Satz] P. S. Entscheidungsproblems] Entsch,pr. Entscheidungsproblem] Entsch,pr. Axiomen] Ax. Entscheidungsproblem] Entsch,pr. Mathematik] Math. mathematischen] math. Mathematik] Math. Metamathematik] Metamath. Mathematik] Math. Axiome] Ax. Mathematik] Math. Widerspruchsbeweises] Wfr.beweises. ausgeschlossenen] ausgeschl. kleinen Kalküls] kl. Kalk. Axiom] Ax. Einsetzung] Einsetz. Behauptung:] Beh: kleinen] kl. Axiomen] Ax. Einsetzung] Eins. aequivalent] äq. ausgeschlossenes] ausg. Satz von Widerspruch] S. v. Wspr. Zahlzeichen] Zz. Alles] Alle großen lateinischen Buchstaben] gr. lat. Buchst freien Variable] fr. Var. freien Variablen] fr. Var. Seinzeichen] Seinz. Zahlzeichen] Zz. Einsetzung] Eins Axiome] Ax. Widerspruchsfreiheit] Wfr. im allgemeinen] i. a.
615.31: 615.31: 615.34: 616.1: 616.3: 616.4: 616.4: 616.4: 616.11: 616.11: 616.11: 616.12: 616.13–14: 616.15: 616.15: 616.17: 616.18: 616.20: 616.20: 616.21: 616.22: 616.25: 616.27: 616.27: 616.27: 618.26: 619.10: 620.15: 620.28: 620.32: 620.32: 620.36: 620.36: 621.4: 621.5: 621.6: 621.10: 621.11: 621.12: 621.13: 621.15: 621.16: 621.18: 621.22: 621.27:
Zahlzeichen] Zz. Variablen] Var. Einsetzung] Eins. im allgemeinen] i. a. numerischen Gleichung] num. Gl. Zahlzeichen] Zz. richtig] r. falsch] f. richtigem] r. richtigem] r. falschem] f. falsch] f. logischen Axiomen] log. Ax. richtig] r. Zahlzeichen] Zz. Zahlzeichen] Zz. richtig] r. Zahlzeichen] Zz. richtig] r. richtig] r. Endformel] Endf. logischen] log. richtig] r. Formel] F. richtig] r. Graphische Darstellung] Graph. Darst definiert] def. Widerspruchsfreiheit] Wfr. Zahlen] Z. Addition] Add. Induktion] Ind. Multiplikation] Mult. Induktion] Ind. Induktion] Ind. Induktion] Ind Subtraktion] Subtr. Induktion] Ind. Eindeutige] Eind. Induktion] Ind. Induktion] Ind. Induktion nach] Ind. n. Induktion] Ind. Fallunterscheidung] Fallunterscheig. Induktion] Ind. Multiplikation] Mult.
Textual Notes 621.33: 621.34: 621.35: 622.4: 622.9: 622.9: 622.13: 622.22: 622.22: 622.28: 622.37: 623.2: 623.11: 623.16:
624.5: 624.6: 624.7: 624.17: 624.18: 625.4–5: 625.7: 625.15: 625.17: 625.20: 626.13: 626.18:
627.10:
Widerspruchsfreiheit] Wfr. logische Axiome] log. Ax. axiome] ax. axiome] ax. Funktionale] Funkt Funktionale] Funkt Behauptung] Beh Axiom] Ax. Definitionsaxiome] Defs.axiome reduzierte] reduz. ersetzt] ers. Axiom] Ax. Widerspruchsfreiheit] Wfr.
627.11: 627.12: 627.17: 627.17: 627.19: 628.2: 628.6: 628.10: 628.14:
628.20: 628.22: 628.23: 628.23: 628.24: Widerspruchsfreiheitsbeweis] 628.27: Wfr.beweis A(εA)] AεA 628.28: A(εA)] AεA 628.30–31: A(εA)] AεA 628.31: Variable] Var. 628.32: betreffende] betr 628.33: siehe oben] s. o. 628.34: Axiom] Ax 628.35: 628.35: (Aristotelisches Axiom)] 628.36: (Arist. Ax.) 629.5: Axiom] Ax. Axiom] Ax 629.7: Auswahlaxiom] 629.7: Auswahlax. 629.11: Widerspruchsfreiheitbeweis] 629.12: 629.24: Wfr.beweis 629.28: Widerspruchsfreiheit] 629.36: Wfr. 630.13:
633
Gleichheitsaxiome] Gleichheitsax. Widerspruchsfreiheit] Wfr. Einsetzung und Reduktion] Eins. u. Red. Axiom] Ax. Axioms] Ax. Zahlzeichen] Zalhz. Widerspruch] Wspr. Widerspruch] Wspr. Widerspruchsfreiheit] Wfr. Funktionale] F. ε, 0] ε 0 Reduktion] Red. πA, 0] πA 0 εA, 0] εA 0 richtig oder falsch] r. od. f. A] A εA, z + 1;] εA z + 1, πA, 0 + 1] πA 0 + 1 richtig] r. falsch] f richtig] r. A(z + 1)] Az + 1 richtig] r. richtig] r. richtig oder falsch] r. oder f richtig] r. falsch] f. Widerspruch] Wspr. axiom] ax. abzählbar] abz. Das] Daß definiert.] definiert Reduktion] Red.
634
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Description of the Text Collection: SUB Göttingen, in Cod. Ms. H. Kneser B9. Size: Cover size approximately 24.6 × 50.0 cm. Sheet size: approximately 33.5 × 21.0 cm. Cover Annotations: Written in pencil: ‘Hilbert // Grundl. d. Math. // W.S. 22/23’; the handwriting is almost certainly Kneser’s. Composition: 11 originally blank sheets of paper in all, all roughly of the same size, which have been folded in half lengthways and assembled to mimic signatures in a notebook, with writing sides of approximately 16.7 cm breadth and 21.0 cm length. These ‘signatures’ are left loose, and folded, not bound, together. (The ‘signatures’ are standardly composed of two sheets folded together.) There are 44 possible writing sides, most of which are numbered by Kneser. The first two are left deliberately blank, and the last is also blank; the numbering thus begins on side three (with ‘–1–’, centred above) and goes continuously to side forty-three (marked ‘–41–’). The first sheet acts as a cover for all the other folded sheets, and contains just Kneser’s ‘–41–’ on its third writing side; the second sheet is Kneser’s pp. 1–4; the third sheet, pp. 5–6, 15–16; the fourth sheet, pp. 7–8, 13–14; the fifth, pp. 9–12; the sixth, pp. 17–18, 23–24; the seventh, pp. 19-22; the eighth, pp. 25–26, 31–32; the ninth, Kneser’s pp. 27–30; the tenth, pp. 33–34, 39–40; and the eleventh has Kneser’s pp. 35–38. Kneser has used black ink throughout the text, and has written on the sides so as to leave a wide margin of approximately 4 cm at the left, the writing then stretching to the far right-hand side of the page. Kneser has used this left-hand margin to write in the dates of the lectures; these are given as ‘2.11.22.’, ‘9.11.22.’, ‘16.11.’, ‘23.11.’, ‘30.11.’, ‘7.11.’ (which should presumably be ‘7.12.’), ‘14.12.’, ‘11.1.23.’, ‘25.1.’, ‘1.2.’, 8.2.’, ‘15.2.’, ‘22.2.’. The margins are also used for the occasional supplementary remark or addition or diagram. The text is written in clear handwriting in Roman script, although with frequent use of abbreviations; the formulas standardly use both Roman and Sütterlin letters. The folded sheets were enclosed in a cover. This was made from an envelope sent to Kneser in Göttingen from Friedrich Vieweg Verlag in Braunschweig. The envelope was made of flexible cardboard, greyish in tone, and folded in thirds, each of approximate size 16.8 × 24.6 cm, 17.8 × 24.6 cm (middle) and 15.5 × 24.6 cm, with an address label (approximately 10.4 × 15 cm) covering half the middle third, the writing being in the direction of the longer side when folded. (The details of the publishing firm are printed on the label, as also is ‘Drucksache’, but the address itself is written in hand in ink. It reads: ‘Herrn // Dr. H. Kneser // Göttingen // Baurat Gerberstraße 18’. The address label carries a stamp and a postmark, though this latter is largely illegible. Since Kneser is addressed as ‘Dr.’, it was most probably sent before Kneser became a Professor.) The envelope was certainly used to send printed material to Kneser, perhaps a smallish book or offprints. There is no sign (e. g., no traces of glue or paste) that the envelope was originally fully closed, and cut open later; rather it was probably folded and closed with string. This envelope, folded in three, was used as a cover for the folded sheets of the 1922/23 Mitschrift, as well as those for Kneser’s Mitschrift of the 1924 lectures (see p. 645 below). Although the envelope was folded along the same folds, it was folded the opposite way, i. e., with the address label on the inside leaving all the outer surfaces clear. The title for the 1922/1923 lectures is written in pencil in Kneser’s handwriting on what forms the front cover (thus one of the outer thirds).
Description of the Text
635
Pagination: Described under Composition. Original Title: No overall title. Text: There are 41 pages of written text in all, a Mitschrift for Hilbert’s lectures for the 1922/1923 semester. They are clearly and fluently written in ink with very few annotations, additions or deletions, though with many abbreviations and inconsistent punctuation, both in the text and in formulas. The dates of the lectures are recorded in the margins, and noted above. The lectures were delivered by both Hilbert and Bernays, and Kneser carefully notes who the speaker was. In pencil, and across the first page (‘–1–’) before the text begins, Kneser has written (almost like a heading) ‘(Es sprechen abwechselnd Hilbert und Bernays. Die betr. Abschnitte sind durch (H) bezw. (B) bezeichnet.)’, the ‘(H)’ or ‘(B)’ being set at the start of the section where Hilbert (respectively Bernays) took over. These bracketed letters are sometimes written in line with the text, sometimes with, somethimes without, small indentation, and sometimes they intrude into the margin itself. For ease of readability, the ‘(H)’ and ‘(B)’ have been replaced here by ‘(Hilbert)’ and ‘(Bernays)’ at the beginning of a line, without indentation, but with a small vertical space separating the section from the line above. The Mitschrift is reproduced in full here.
636
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Kneser Mitschrift: The lectures from 1923/24
1
21.2.1924 (a)A(a) → π(A) = 0 (a)A(a) → π(A) = 1 z. B. ϕ(n) = πa πb πc (an + bn = cn → a = 0 ∨ b = 0) = 0 = 0
5
0 1,
2
Eine Menge ganzer Zahlen wird dargestellt durch eine Funktion f(a) = die für Zahlen der Menge = 1, sonst = 0 ist. Eine reelle Zahl 0 < r 1 wird durch ihren Dualbruch 0, f(0)f(1)f(2) . . . dargestellt. Zwecks Eindeutigkeit schließt man das Ende 000 . . . aus. (a) f(a) = 0 ∨ f(a) = 1 & (a)(Eb) f(a + b) = 1 Dann kann man f < g ausdrücken; die Theorie der reellen Zahlen wird aufgebaut. Widerspruchsfreiheitsbeweis! πA macht keine Schwierigkeiten. Die Axiome 16. A(a) → AεA, 17. A(0) → (a) A(a) → A(a ) → A(a) sind zu beweisen aus 1∗ . A(a) → AεA, 3∗ . εA = a → A(a), 4∗ . a = 0 → a = (δa) .1 Der frühere Widerspruchsfreiheitsbeweis: 1. Auflösung in Fäden. 2. Beseitigung der Variablen. 3. Die Definitions- und Funktionszeichen. Einsetzen in die neuen Axiome 1∗ , 3∗ , 4∗ . 4∗ : z = 0 → z = (δz) ist immer richtig. All- und Seinszeichen ersetzen wir durch ε. Die Reduktion der Funktionale? die Formelvariablen beseitigen wir auch. 2 Erleichternde Annahme: als Argument von ε trete nur eine bestimmte Aussage auf: εA. 3 Zunächst setzen wir „vorläufig und versuchsweise“ überall für εA das Zahlzeichen 0 ein. So erhalten wir eine Reihe von Formeln, die sicher richtig sind, mit Ausnahme der aus 1∗ und 3∗ gefolgerten. 1 The labels ‘3∗ ’ and ‘4∗ ’ here were originally ‘2∗ ’ and ‘3∗ ’ respectively, the numbers ‘2’ and ‘3’ being overwritten. 2 This rather odd sentence is indeed Kneser’s. 3 The first occurrence of ‘ε’ in this sentence is underlined twice.
10
15
20
25
Kneser Mitschrift: The lectures from 1923/24
Aa → AεA εA = a → Aa
637
Nach Beseitigung der Formel-Variablen
Aa → AεA εA = b → Ab
0 = z∗ → Ab 4 ! "
5
richtig
Az → A0 ist nur falsch, wenn Az richtig und A0 falsch. Dann haben wir ein z, für das Az richtig ist! Also setzen wir „endgültig“ für εA das erste unter den Zahlzeichen 0 , 0 , . . . , z für das Az∗ richtig ist. Az → Az∗
10
richtig
z∗ = t → At richtig
Also lauter richtige Formeln; 0 = 0 kann nicht am Ende stehen. f(a, n) stellt (· · · ) eine Folge rn reeller Zahlen dar. Die obere Grenze läßt sich konstruieren.
15
Was fehlt uns noch auf dieser vierten Stufe? Wir hatten noch beliebig viele Definitionen durch Rekursion f(0) = a f(a ) = b(f(a), a), die zudem noch an dies enge Schema gebunden sind. 2) Wir haben noch keine Mengen reeller Zahlen; der allgemeine Satz von der oberen Grenze!
1)
5. Stufe
20
25
30
Um also Analysis und Mengenlehre (Auswahlaxiom!) zu erhalten, führen wir höhere Variablengattungen ein. ϕ(f(a)) ; Funktionenfunktion; genauer ϕa (f(a)) (d.h. ϕ hängt nicht von a ab).A Jetzt können wir wieder eine variable Funktionenfunktion als Argument einführen: ga (f (a)). ψf (ga (f (a))), wo ψ von f nicht abhängt. ψf,b (ga (f (a)), f∗ (b), c) hat die Argumente ga , f∗ , c. Ebenso werden in die Aussagen variable Funktionen, Funktionenfunktionen u. s. w. eingeführt. Zu dieser Erweiterung des Zeichensystems tritt eine Erweiterung des Axiomensystems. A(f ) → A(εf A(f )) εf A(f ) ist eine Funktion All- und Seinszeichen für Funktionen wie früher. A
Added in the left-hand margin: ϕa (f (a))
4 The
manuscript appears to indicate that Kneser originally wrote ‘b ’ in the antecedent, but crossed it out, writing z∗ above it. The formula would indeed be better as 0 = b → Ab.
3
638
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Hiermit braucht man keine Rekursionsschemata mehr, sondern nur ein allgemeines Rekursionsaxiom. ab (f (a, b), k, n) ist eine individuelle Funktionenfunktion mit den Argumenten f, k, n. Axiome: 18. ab (f (a, b), k, 0) = k
5
19. ab (f (a, b), k, n ) = f (ab (f (a, b), k, n), n)
1
25.2.1924 Rekursionsaxiom (f, k, 0) = k, Für höhere Typen:
5
ab (f (a, b), k, n) (f, k, n ) = f ((f, k, n), n).
10
abc (f (a, b, c)k, m, n),
(
0) = k,
abc (f (a, b, c), k, m, n ) = f (abc (f (a, b, c), k, m, n), m, n).6 Für simultane Rekursionen:
15
f bc (ga (f (a), b, c), k, m, 0) = k, f bc (g, k, m, n ) = gd ((g, k, d, n), m, n).7 Um zu zeigen, daß wir alle Funktionen durch erlaubte Einsetzungen bekommen, brauchen wir die individuelle Funktion α(a, b) mit dem Axiom α(a, b) = a
2
z. B. α(0, α(a, b))8 ist eine Funktion, die immer null ist. ι(a) = cd (β(c, d), 0, a) β(a, b) = α(0 , α(a, b)) a + b = cd ((α(c, d)) , a, b) δa = bc (α(b, c), 0, a) a·b = cde (α(c + d, e), 0, a, b) Wieweit kommen wir damit in der Analysis und Mengenlehre? Eine Menge wird gegeben durch eine Funktion f (a) = 0 ∨ f (a) = 1. Menge von Mengen: 5 Kneser has set the value here as 0, although it should be k, as formulated at the end of the last lecture. 6 Instead of the second ‘ abc ’ in this formula, Kneser has mistakenly written ‘(a b c)’. 7 Note that the second recursion equation is given only in this incomplete form. 8 Kneser had originally written ‘α(0, α(a, b)) = 0’, but the ‘= 0’ has been crossed out.
20
25
Kneser Mitschrift: The lectures from 1923/24
A(f )
πf A(f )
=0 wenn (f )A(f ) =1 sonst (f )A(f )
,
639
πf∗ A(f ) = δ(1, πf A(f ))9 .
Vereinigungsmenge wird gegeben durch die Funktion πf∗ (A(f ) & f (a) = 0); Durchschnitt: πf (A(f ) → f (a) = 0). Auswahl? Menge von Mengen: 5
10
15
A(f ) → (a) (f (a) = 0 ∨ f (a) = 1) & (Ea)(f (a) = 1) Das Element als Funktion der Menge: εa (f (a) = 0). Dann ist A(f ) → f (εa (f (a) = 0)) = 0 Reelle Zahlen R(f ) bedeute: (a) (f (a) = 0 ∨ f (a) = 1) & (Eb)(f (a + b) = 1) Gleich = (f, g) R(f ) & R(g) & (a)(f(a) = g(a)) < (f, g) R(f ) & R(g) & (Ea) (b)(b < a → f (b) = g(b)) & f (a) = 0 & g(a) = 1 Satz von der oberen Grenze: für beliebige Zahlenmengen definiert durch A(f ) (f )(A(f ) → R(f )) & (Ef )A(f ) → (Eg) (f ) A(f ) → (f, g) & (k)(Ef ) A(f ) & (a)(a < k → f (a) = g(a)) 10 Konstruktion der oberen Grenze! Zugleich definieren wir χb (a, f (b)) und ϕ(a).
20
25.2.1924. II Widerspruchsfreiheitsbeweis auf der fünften Stufe? Wir haben Axiom 16: Aa → AεA auf höhere Typen angewandt: Axiom 16∗ : A(f ) → Aεf A(f ). Axiom 17: A(0) → (a)(A(a) → A(a )) → A(a). (Vollständige Induktion)
25
30
Axiom 18: ab (f, k, 0) = k,11
ab (f, k, n ) = f (ab (f, k, n), n).
Beim Widerspruchsfreiheitsbeweis machen wir wieder die vereinfachende Annahme, daß εf nur auf eine Aussage A angewandt wird. Es liege ein Beweis vor, der 0 = 0 am Ende hat: für εf setzen wir probeweise δ(a) ein, reduzieren die Funktionale. So erhalten wir eine Reihe von Formeln. Falsch kann nur eine Formel werden, die durch Einsetzen aus Axiom 16∗ herauskommt. A(ϕ) → A(δa) wann falsch? 9 In these formulas, ‘A(f )’ appears to have been overwritten with ‘A(f )’. The ‘A(f )’ which follow are not the result of corrections. 10 Kneser adds a closing right bracket following ‘a < k’; this is clearly a mistake and has been omitted. A closing bracket has been added after ‘g(a)’ instead. 11 Again, the value should be k and not 0, as Kneser has it.
3
640
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Nur wenn A(ϕ) richtig. Nun setzen wir endgültig ϕ für εA.
4
Wie kommt es denn, daß hier die oft empfundenen und hervorgehobenen Schwierigkeiten überwunden werden konnten? „Alle“, „Es gibt“ ist alles eingeführt. Was heißt aber dies „alle“? Alle, die man einsetzen darf. Ähnlich wie die reellen, so könnte man die Zahlen der zweiten Klasse definieren. N 12 : Man könnte sogar den Kontinuumssatz formulieren und beweisen, daß das Kontinuum wohlgeordnet werden kann. Will man über das Unendliche hinauszählen, so braucht man neue Axiome, die der
5
10
6. Stufe Ein Mißstand sind noch die erlaubten Einsetzungen. Individuelle Aussagen 13 , mit deren Hilfe wir die Einsetzung für Grundvariablen ersetzen: (Zahlzeichen sein:) Z(0), Z(a) → Z(a ). Für (17) kommt A(0) & (a)(A(a) → A(a )) → Z(a) → A(a) Axiom 17∗ : (Zahl der 2. Klasse sein:) N(0) ; N(a) → N(a ) ; (n) Z(n) → N(f (n)) → N(λn f (n)) (Für f darf ein Funktional eingesetzt werden —) Transfinites Induktionsaxiom (für die 2. Klasse): 17∗∗ : A(0)&(a)(A(a) → A(a ))&(f ) (n)(Z(n) → A(f (n))) → A(λn f (n)) → (N(a) → A(a)) 14 Größer, kleiner? a < b → a = b a < b b > a15
a
5
25.2.1924. III (n)(Z(n) → N(f (n)) & f (n) < c) → λa f (a) c 12 There appears to have been a subscript here, but it has been crossed out, and is no longer decipherable. 13 The three word sequence across the full-stop (thus ‘Einsetzungen. Individuelle Aussagen’) is underscored with a broken line, the import of which is not clear. 14 The quantification ‘(n)(Z(n) → . . . ’ was originally written ‘((n)Z(n) → . . . ’. 15 ‘>’ is written over ‘<’, thus correcting it. 16 Again, the quantification ‘(n)(Z(n) → . . . ’ was originally written ‘((n)Z(n) → . . . ’.
15
20
25
Kneser Mitschrift: The lectures from 1923/24
641
Wie definiert man nun die Zahlen der 2. Klasse definieren? 17
a + b?
a + 0 = a,
a + b = (a + b) ,
(a + λn f (n)) = λn (a + f (n))
Man beweist N(a) → N(b) → N(a + b). a · 0 = 0, a · b = a · b + a, a · λn f (n) = λn (a · f (n)). a0 = 0 ,
5
α(a, b) :
α(a, 0) = a,
ab = ab · a,
aλn f (n) = λn (af (n) ).
α(a, b ) = aα(a,b) ,
α(a, λn f (n)) = λn (α(a, f (n))).
Hilbert 28.2.19 24
1
Auf der 6. Stufe hatten wir Axiome 1–15 A(a) → A(εA) 16∗ . A(f ) → A(εf (A(f ))) 17∗ . A(0) → (a)(A(a) → A(a )) → (Z(a) → A(a))
16. 10
15
20
25
Axiome der individuellen Aussage Z (Zahl sein): Z(0), Z(a) → Z(a ). 18. Axiome der Rekursionsfunktion ab (f (a, b), k, n). Axiome der individuellen Aussage N (Zahl der 2. Zahlklasse sein) und der transfiniten Induktion: 17∗ . N(0), N(a) → N(a ), (n)(Z(n) → N(f (n))) → N(λn f (n)), A(0) → (a)(A(a) → A(a )) → (f ) (n)(Z(n) → A(f (n))) → A(λn f (n)) → (N(a) → A(a)) .18 Ungleichheitsaxiome für λ: λn f (n) ist die kleinste Zahl, die größer ist als alle f (n) (n) Z(n) → N(f (n)) → Z(k) → f (k) < λn f (n) (n) Z(n) → N(f (n)) & f (n) < c → λa f (a) c Wie ist der Widerspruchsfreiheitsbeweis? Wenn nur ein λn vorkommt, so erhält man ω + z. Man wird das ω wie eine neue Variable x behandeln. Eine Formel in x heiße richtig, wenn sie für einen Wert und alle größeren gilt (Idee des Nicht-Archimedischen Zahlensystems). Bei mehreren λ nimmt man das letzte | und nimmt an, daß für die früheren alles geleistet sei. Weiter: M(0), 17 There
M(a) → M(a ),
is a gap of two lines in the text at this point. This gap, the odd sentence which precedes it, and the fact that the text resumes with continued consideration of the ordinal operations, suggest that the direct definition of the numbers of the second number-class was discussed, but not recorded by Kneser. 18 The label ‘17∗ ’ should almost certainly be ‘17∗∗ ’, thus putting it in the sequence from 17∗ above to 17∗∗∗ on the next page.
2
642
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
(n) Z(n) → M(f (n)) → M(λn f (n)), (a) N(a) → M(f (a)) → M(μa f (a)) (höhere Limesbildung) 17∗∗∗ .
A(0) & (a)(A(a) → A(a )) & (f )((n)(Z(n) → A(f (n))) → A(λn f (n))) & (f )((a)(N(a) → A(f (a))) → A(μa f (a))) → (M(a) → A(a))19
und Ungleichheitsaxiome für μa f (a).
3
Damit können wir Cantors ganze Theorie einwurfsfrei aufbauen. Eine WohlordnungB der Zahlen 0, 1, 2, 3, 4 . . . wird gegeben durch f (a, b) = 01 wenn ab , wobei f gewisse Eigenschaften haben muß, die wir in Oab (f (a, b)) zusammengefaßt denken. vab f (a, b) sei die zugehörige Ordinalzahl. Oab (f (a, b)) → N(vab f (a, b)) muß eine beweisbare Formel sein. Dazu brauchen wir Definition von v durch das Axiom (wo f ∗ den Wohlordnungstypus v(f ∗ ) = v(f ) +1 bestimmt) vab (λn f (a, b, n)) = λn vab (f (a, b, n)) wo λn f (a, b, n) die Funktion bezeichnet, die den Limes der Wohlordnungstypen f (a, b, n) bestimmt v(λδ(b, a)) = 0
5
10
15
20
So läßt sich der Widerspruchsfreiheitsbeweis bequemer führen. Aber noch wichtiger ist es, daß die Zahlen der zweiten Klasse dastehen und ebenso unwiderleglich sind wie die ganze übrige Mathematik, und daß man nicht mit Poincaré von Cantorismus sprechen darf. Auf der sechsten Stufe hatten wir die Axiome 18 der Rekursion. 20 Man kann damit vieles machen; weiß aber nicht, ob man nicht durch die Entwicklung gezwungen wird, höhere Funktionstypen, Rekursionstypen heranzuziehen. Diese Unsicherheit soll die
25
Siebente Stufe beseitigen (jedenfalls zum Teil) Z(a) → Z(f a) Φ(f ); B Added in the margin just to the left of the beginning of this sentence: Andere Möglichkeit: 19 The quantifier in ‘(a)((A(a) → A(a ))’ has been added by the Editors, in conformity with 17∗ and 17∗∗ on p. 640 above. 20 Axiom 18 belongs to the fifth level, not the sixth.
30
Kneser Mitschrift: The lectures from 1923/24
5
643
Φ ist eine individuelle Aussage: „zahlentheoretische Funktion sein“. Dann (nämlich wenn man diesen Gedanken ausführt) braucht man nicht mehr verschiedene Sorten von Variablen. Man darf „alles“ einsetzen. Dadurch soll das Richardsche Paradoxon aufgeklärt werden. Nichtabzählbarkeit der Funktionen ist formuliert
4
(f )(Eg)(n)(Ea)(f (a, n) = g(a)).
10
15
Die Figuren sind in der Tat abzählbar. Aber Abzählbarkeit der Funktionen g(a) ist ja was ganz anderes: es wird ein f (a, n) widerspruchsfrei existierend 21 verlangt, das jedes g für ein geeignetes n liefert. Man könnte sagen: Nun nehme ich aber jede Figur, sehe zu ob sie eine Funktion darstellt. Eine solche und formalisierbare, von vornherein und allgemein gültige Regel kann es aber, wegen der großen Mannigfaltigkeit der Figuren nicht geben; darin liegt die Nichtabzählbarkeit. Andeutung über das Kontinuumsproblem
20
Auf der 6ten Stufe 22 hat man bestimmte Typen der Rekursionen durch Einsetzen in die Axiome eingeführt. Gruppiert man diese so erhaltenenen Funktionen nach der Zahl der Einsetzungen, so erhält man abzählbar viele Funktionen. Wenn es aber mehr gibt, so kann es nur daran liegen, daß man immer neue Typen braucht. Behauptung: die Typen haben gerade die Mächtigkeit der Zahlen der zweiten Zahlklasse. Wie kommt man denn zum höheren Typus? 1) f (a),
25
f (a, b),
2) ga (f (a, b)),
f3 (c)
g(f ),
h(g(f ))
entspricht a
3) f (f, f f, f f f, . . . ) ω · 2 entspricht λa (a) Z(a) → Z(f (a)) Φ1 (f ) (a) Φn (a) → Z(f (a)) Φn (f ) (a) (n) Φh(n) a(n) → Z(f (a(n))) Φλn h(n) (f ) 23 30
The text ends here. 21 The words ‘widerspruchsfrei existierend’ are written in the left-hand margin, but directed to this place by an insertion sign. 22 Note again that it is a matter of the fifth level here. 23 Kneser actually formulated this formula as ‘(a) (n)Φ h(n) a(n) → Zf (n) Φλn h(n) (f )’, but the universal quantifier ‘(n)’ is odd in this; the reconstruction given in the text here assumes that the quantifier is meant to span the whole conditional. In addition, it seemed that the ‘n’ in ‘f (n)’ should be replaced by ‘a(n)’, indicating an object of the appropriate type to which f can be applied.
5
644
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Textual Notes 636.13: 636.14: 636.18: 637.8: 637.8–9: 637.18: 637.21: 637.26: 638.3: 638.16: 638.19: 638.25: 639.4: 639.6: 639.16: 639.21: 639.22: 639.23: 639.24: 639.24: 639.25: 639.25: 639.26: 639.30: 640.3: 640.3: 640.8: 640.14: 640.17: 640.21: 640.21: 641.8: 641.14: 641.14: 641.23: 642.13: 642.14: 642.16: 642.18: 642.21: 642.22: 643.1: 643.10: 643.21:
Widerspruchsfreiheitsbeweis!] Wfbeweis! (a) A(a) . . . ] a A(a) . . . Widerspruchsfreiheitsbeweis] Wfbeweis Zahlzeichen] Zz. 0 , 0 , . . . , z] 0 , 0 , . . . z∗ Wir haben] haben wir Auswahlaxiom!] Auswahlax! Argumente] Arg ab (f (a, b), k, n)] a,b (f (a, b), k, n) f bc (ga (f (a), b, c), k, m, 0) = k,] f bc (g(f (a), a, b), k, m, 0) = k Axiom] Ax α(b, c)] α(cb) (f )A(f )] Af (f (a) = 0 ∨ f (a) = 1)] f (a) = 0 ∨ f (a) = 1 definiert durch] Def. d. Widerspruchsfreiheitsbeweis] W.f.beweis Axiom] Ax. Axiom] Ax. Axiom] Ax. Vollständige Induktion] Vollst. Ind. Axiom] Ax. ab (f, k, 0) = k,] ab (f, k, 0) = 0 Widerspruchsfreiheitsbeweis] W.f.beweis Axiom] Ax. „Alle“] Alle „Es gibt“] Es gibt Kontinuum] Kont. Zahlzeichen] Zahlz. Axiom] Ax. Transfinites Induktionsaxiom] Transf. Ind.ax Klasse] Kl. Axiome] Ax. individuellen] ind. Zahlklasse] Zahlkl. Widerspruchsfreiheitsbeweis] WFbeweis Axiom] Ax Wohlordnungstypus] Wohlord. Funktion] Funkt. Wohlordnungstypen] Wohlordtypen Widerspruchsfreiheitsbeweis] WFbeweis zweiten Klasse] Z-Klasse zahlentheoretische Funktion] zahlenth. Fkt. widerspruchsfrei] wfr. Behauptung] Beh.
Description of the Text
645
Description of the Text Collection: SUB Göttingen, in Cod. Ms. H. Kneser B9. Size: Cover size approximately 24.6 × 50.0 cm, folded into three. Sheet size: (1) approximately 33.2 × 21.0 cm; (2) 32.5 × 20.1 cm; (3) approximately 29.8 × 19.8 cm; (4) approximately 29.8 × 20.0 cm; (5) and (6) approximately 33.1 × 21.0 cm. Cover Annotations: No separate cover annotation; see p. 634. Composition: 6 sheets of paper in all. Sheet 1 is folded in two lengthways to make four writing sides, with the ‘spine’ to the left. Three of these sides are written on in black ink, and the fourth is completely blank; the first is headed ‘21.2.24’, and the second and third are numbered ‘–2–’ and ‘–3–’, both numbers being centred. Sheet 2 is apparently part of a typed catalogue (or bibliography) listing journals in physics and mathematics. (It is clearly from a longer list, since it bears the typed number ‘–3–’ at the top, centred.) It is again folded lengthways with the ‘spine’ to the right to make four writing sides, but this time only two of the sides are used; both are written on in black ink, and are full, the first headed ‘25.2.24’, and the second unnumbered. Sheet 3 is a proof-sheet for the Courant and Hilbert book (apparently for p. 305) on methods of mathematical physics, published in 1924 (Courant and Hilbert 1924 ); it bears the inscription ‘1. Korrektur. 23.10.23’ and the details of the publisher and the printing firm. The sheet is again folded in half lengthways this time to make two writing pages (‘spine’ to the right); the first is headed ‘25.2.24. II’, and the second is unnumbered. Both are inscribed in black ink and are full. Sheet 4 is likewise a proof-sheet for the CourantHilbert volume, this time unmarked except for the page number, ‘304’. It is also folded in half lengthways to make two writing sides, ‘spine’ to the right; the first is headed ‘25.2.24. III’; the writing in black ink covers only half of this first page, and the second is completely blank. Sheets 5 and 6 are loose sheets of blank paper, placed together and folded in half lengthways to make eight writing pages, with the ‘spine’ to the left. The sequence is thus: pp. 1–2 on sheet 5, pp. 3–6 on sheet 6, and pp. 7–8 again on sheet 5. The first page is headed ‘Hilbert 28.2.24’, and underlined; the second to fifth pages are numbered ‘2’, ‘3’, ‘–4–’ and ‘–5–’, and the rest are blank and unnumbered. All the writing on these pages is in pencil, not ink. The whole of Kneser’s text is written in clear handwriting in Roman script, although with frequent use of abbreviations; the formulas standardly use Roman, Greek and Sütterlin letters. The folded sheets were enclosed in the cover described in the Description of Text for Kneser’s Mitschrift for the 1922/1923 lectures; see p. 634 above. Pagination: Described under Composition. Original Title: No overall title. Text: 13 pages in all; 8 written in ink and the rest in pencil. These together represent a Mitschrift for lectures by Hilbert on 21, 25 and 28 February 1924. They are clearly and fluently written with very few annotations, additions or deletions. It is not known whether they correspond to lectures given in an impromptu or an official lecture course. The Mitschrift is reproduced in full here.
646
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Appendix: Bernays’s Note (c. 1923/24)
Introduction to Appendix
This Note in Bernays’s hand (see Description of the Text) bears his own heading ‘Wf-Beweis für das logische Auswahlaxiom Ab → AεAa im einfachsten Fall ’. It also bears another heading in pencil, namely ‘Einlage zu WS 1920’ in a different hand, possibly Hilbert’s; accordingly, it has been deliberately attached inside the front cover of Hilbert’s ‘Logik-Kalkül’ lectures from the Winter Semester of 1920. Nevertheless, however it came to be inserted inside these lectures, and on whose instructions, it clearly does not belong there. For one thing, it deals with the ε-operator, an operator not introduced by Hilbert until 1922 or 1923; for another, as is made clear in n. 3 (below, p. 648), Bernays’s manuscript clearly calls on the numbering of the axioms for propositional logic given in the Kneser Mitschrift of Hilbert’s lectures for 1922/23, an enumeration which is different from the one used in Hilbert’s 1921/22 lectures. Michael Hallett
Bernays’s Note: ‘Wf-Beweis für das logische Auswahlaxiom’
647
Bernays’s Note: ‘Widerspruchsfreiheits-Beweis für das logische Auswahlaxiom Ab → AεAa im einfachsten Fall ’
5
Einlage zu WS 1920 1 Widerspruchsfreiheit-Beweis für das logische Auswahlaxiom Ab → AεAa im einfachsten Fall
10
15
20
25
Das Prädikat Aa, zu welchem ein vorkommendes ε gehört, möge kein weiteres ε enthalten. (Das hindert nicht, dass für die Variable a Funktionale eingesetzt werden, welche ε enthalten.) Hülfssatz. Aus U → S and U → (S → T) ist U → T beweisbar. Nämlich aus U → (S → T) erhält man, aufgrund von Axiom 3., S → (U → T); hieraus, nach Axiom 4. (U → S) → U → (U → T) Axiom 2. liefert: U → (U → T) → (U → T), demnach erhält man, nach Axiom 3. und 4., (U → S) → (U → T); und diese Formel in Verbindung mit U → S liefert U → T. — Angenommen, es läge ein Beweise der Formel 0 = 0 vor, in welchem die transfinite Funktion εa Aa vorkommt, jedoch mit der anfangs genannten Beschränkung. | Aus diesem Beweis könnten wir zunächst die freien Variablen ausschalten, unbeschadet des Beweischarakters der Gesamtfigur. Die nunmehr in Verbindung mit ε auftretenden Prädikate seien Aa, Ba, . . . , Pa Es soll nun gezeigt werden, dass man aus der vorliegenden Beweisfigur eine solche geänderte Beweisfigur, ebenfalls mit der Endformel 0 = 0 gewinnen könnte, bei welcher ε nicht mehr in Verbindung mit A, sondern nur noch mit Ba, . . . , Pa auftritt. Damit ist dann durch Wiederholung des Verfahrens bewiesen, dass 0 = 0 auch Endformel eines Beweises sein müsste, der gar kein ε enthält, — was wir bereits als unmöglich erkannt haben.— 1 This
is written above Bernays’s heading and underlined in pencil. The hand is not readily identifiable, but is possibly Hilbert’s.
1
2
648
3
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Wir nennen eine Formel, die aus dem Auswahlaxiom durch Einsetzung von A für A (und durch Einsetzung für b) erhalten wird eine „zu A gehörige kritische Formel“. Enthält der vorliegende Beweis keine zu A gehörige kritische Formel, so erreichen wir unser Ziel, indem wir überall εa Aa durch 0 ersetzen. Andernfalls seien Aa → Aεa Aa Ab → Aεa Aa .. . Ak → Aεa Aa
5
10
2
4
die verschiedenen vorkommenden, zu A gehörigen kritischen Formeln. Wir ändern nun den Beweis in der Weise ab, dass wir in jeder Formel voraussetzen „Aa →“. Dabei wird der Beweischarakter dadurch aufrecht erhalten, dass bei jedem S Schluss S → T der im Hülfssatz angegebene Prozess angewandt wird, der T von Aa → S und Aa → (S → T) zu Aa → T führt, und ferner bei jeder durch Einsetzung aus einem Axiom erhaltenen Formel F der Schluss angewandt wird: F F → (Aa → F) (aus Axiom 1.)
15
20
Aa → F jedoch soll letzteres nicht geschehen im Falle der Formel Aa → Aεa Aa (welche ja durch Einsetzung aus dem Auswahlaxiom erhalten ist). Vielmehr soll hier die Formel
25
Aa → (Aa → Aεa Aa) folgendermassen abgeleitet werden:
Aa → (Aa → AεaAa) (aus Axiom 11. durch Einsetzung) 3 Aa → (Aa → Aεa Aa) → Aa → (Aa → Aεa Aa) (nach Axiom 3.) Aa → (Aa → Aεa Aa)
Auf diese Weis erhalten wir einen Beweis mit der Endformel Aa → 0 = 0, wobei jetzt als kritische zu A gehörige Formeln die vorherigen mit Ausnahme der ersten auftreten. 2 The ‘verschiedenen’ was added beneath the line, and directed to this point with an insertion sign. 3 Bernays is appealing to the enumeration of the axioms for propositional logic as given in the Kneser Mitschrift of Hilbert’s lectures for 1922/23; see p. 612 above. The other axioms he refers to by number also correspond to this enumeration. Note that, according to Kneser’s Mitschrift, Bernays was responsible for presenting this enumeration, which is different from the one used in Hilbert’s 1921/22 lectures (see p. 494 above).
30
Bernays’s Note: ‘Wf-Beweis für das logische Auswahlaxiom’
5
10
649
Nun nehmen wir ausserdem mit dem vorherigen Beweis der Formel 0 = 0 eine zweite Änderung vor. Wir setzen bei jeder | Formel voran Aa → . Ferner ersetzen wir überall εa Aa durch a. Bei den Schlüssen wenden wir wieder das Verfahren des Hülfssatzes an, und bei den Formel F, die durch Einsetzung aus Axiomen entstanden sind, mit Ausnahme der zu A gehörigen kritischen Formeln wenden wir den Schluss an: F F → (Aa → F) Aa → F Anstelle der zu A gehörigen kritischen Formeln treten aber jetzt die Formeln
5
Aa → (Aa → Aa) Aa → (Ab → Aa) .. . 15
20
25
Aa → (Ak → Aa) und diese gehen alle aus Axiom 1. durch Einsetzung hervor. Somit haben wir einen Beweis mit der Endformel Aa → 0 = 0, in welchem gar keine zu A gehörigen kritischen Formeln auftreten. Setzen wir nun die beiden erhaltenen Beweise mit den Endformeln Aa → 0 = 0 und Aa → 0 = 0 | hintereinander und fügen daran noch die Figur Aa → 0 = 0 (Aa → 0 = 0) → (Aa → 0 = 0) → 0 = 0 (aus Axiom 12 durch Einsetzung) (Aa → 0 = 0) → 0 = 0 (Wiederholung der bewiesenen Formel) Aa → 0 = 0 (Aa → 0 = 0) → 0 = 0 0 = 0 so haben wir damit einen Beweis von 0 = 0, in welchem als kritische zu A gehörige Formel nur noch
30
Ab → Aεa Aa .. . Ak → Aεa Aa
35
40
aber nicht mehr Aa → Aεa Aa vorkommt. Nach dieser Methode können wir der Reihe nach alle zu A gehörigen kritischen Formeln aus dem Beweis entfernen, und nachdem dies geschehen ist, können wir εa Aa ganz beseitigen, indem wir es überall durch 0 ersetzen. Somit lässt sich in der Tat erreichen, dass ε nicht mehr in Verbindung mit A vorkommt. The following two formulas constitute the only text appearing on the unnumbered seventh page. They are in an unidentifiable hand, possibly Bernays’s, and appear not quite centred and close to the top, one written over the other,
6
650
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
the whole figure being underlined in pencil three times. The ‘0’ given in the first formula could possibly be a ‘σ’. 7
U(0, a) U(ε-, a) The last and eighth page, unnumbered, contains nine lines in ink in Bernays’s hand, written ‘upside down’ compared to the rest of the text. These lines appear to be a draft for the continuation of the text after p. 4, and are crossed out.
8
Formel voraus Aa → , und den Beweischarakter der Gesamtfigur halten wir [[genau so wie vorhin aufrecht]], indem wir bei den Schlüssen und bei den aus Axiomen durch Einsetzung entstandenen Formeln gerade so wie beim vorigen Mal verfahren; eine gesonderte Behandlung erfährt wieder die Formel Aa → The text breaks off here.
5
10
Textual Notes
Textual Notes 647.6: 647.27: 649.20:
Widerspruchsfreiheit] Wf durch Wiederholung des Verfahrens] hintereinander] hinter einander
auch
651
652
Chapter 3
Lectures on Proof Theory (1921/22 – 1923/24)
Description of the Text Collection: Insertion found in the document Inv. Nr. 16206j (Hilbert’s lectures ‘Logik-Kalkül’ for the Winter Semester of 1920) in the Mathematisches Institut of the Georg-August Universität Göttingen. Size: The insertion consists of two sheets of graph paper (i. e., paper with horizontal and vertical printed lines making small coordinate squares), approximately 22.5 × 28.8 cm. Cover Annotations: — Composition: The sheets of graph paper have been folded in half lengthways along the longer edge to make a ‘signature’ with eight pages (14.4 × 22.5 cm). The first six of these contain notes in ink in Bernays’s hand, and are numbered in the top right- and left-hand corners respectively. The top of p. 1 carries a heading in ink in Bernays’s hand, ‘Wf.-Beweis für das logische Auswahl-Axiom Ab → AεAa im einfachsten Fall’, and over this has been written in pencil ‘Einlage zu WS 1920’ (the ‘zu’ might be read as ‘in’) in what appears to be (but cannot be identified certainly as) Hilbert’s hand. The seventh page is unnumbered and empty, save for two formulas written in pencil. They are ‘U(0, a)’ (the ‘0’ could perhaps be read as a ‘σ’) and ‘U(ε-, a)’; these are placed near the top of the page, not quite centred (they are shifted a little to the left), the second being written directly aligned under the first, the whole figure being then underlined in pencil three times. The eighth page has eight and a half lines written on it in ink in Bernays’s hand, upside down and from the bottom up compared to the first six pages. As with the other insertion in the ‘Logik-Kalkül’ lectures (see the ‘Description of the Text’ for that document, above, p. 339) the whole signature is attached inside the front cover of the volume of lecture notes, with its ‘spine’ taped into the central indentation where the spine of the volume begins, as if to make eight, new (but smaller) pages. Whether the sheets of graph paper were themselves loose or taken from a graph-paper notebook is impossible to say. Pagination: Described under Composition. Original Title: See under Composition. Text: The text is written in black ink, with the two formulas added at the end in pencil. The last page, which, as noted above, is written ‘upside down’, contains what seems to be a draft of the first paragraph of p. 5; it is crossed out. Although the document was inserted into the 1920 ‘Logik-Kalkül’ notes, the evidence suggests that it was composed somewhat later than 1920, perhaps around 1923. For one thing, the note discusses Hilbert’s ‘logical choice axiom’ in a form using the ε operator, and this operator was not introduced until 1923; for another the enumeration of the propositional axioms Bernays calls on was almost certainly adopted later, since it appears in Kneser’s Mitschrift of Hilbert’s 1922/23 lectures (in a section presented by Bernays), and is not in the lecture manuscript for Hilbert’s lectures in 1921/22. The use of German capital letters in proof schemata also seems a later modification.
The provenance of this photograph is unknown. The two women standing behind Hilbert are said to be the family housekeepers; his wife is to the left.
Chapter 4 Lectures on the Infinite
‘Über das Unendliche’ (WS 1924/25) ‘Ueber die Grundlagen des Denkens’ (c. 1931) ‘Über das Unendliche’ (23.5.1933)
W. Ewald and W. Sieg (eds.), David Hilbert’s Lectures on the Foundations of Arithmetic and Logic 1917–1933, DOI 10.1007/978-3-540-69444-1_4, © Springer-Verlag Berlin Heidelberg 2013
655
656
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
Introduction The following set of lectures from the Winter Semester of 1924/25 (Hilbert 1924/25* ) has a different character from the other lecture notes published in this Volume. Hilbert’s logic lectures from the fall of 1917 to the spring of 1924, addressed to advanced students of mathematics, are a remarkable technical achievement. They commence by recapitulating his earlier work on the axiomatic method, but then they rapidly begin to break new mathematical ground. They present a highly original re-thinking of mathematical logic, culminating in the creation of proof theory and the formulation of the mature consistency programme. Those lectures frequently delve into mathematical details (although it is striking how often Hilbert merely sketches the main outline of a proof, leaving it to his students to work out the specifics for themselves). The present lectures, in contrast, were advertised as being ‘allgemeinverständlich’, i. e., intelligible to the general public. Hilbert was by this point at the peak of his fame, and he would occasionally deliver lectures intended to draw a large audience. From the length of the typescript and from internal remarks, it appears that Hilbert delivered his material in about fourteen or fifteen lectures, most likely lecturing once a week over the course of the Winter Semester. He used the occasion to set forth, in the broadest terms, the motivation and the intellectual context for his own recent research into logic and the foundations of mathematics. The lectures begin with a sweeping overview of the whole of mathematics, from the Greeks to the present day; then describe the epochal achievements of Weierstrass, Dedekind, and (especially) Cantor; and finally state his own view of the place occupied by logic and proof theory within the overall edifice of mathematics. Both in their form and in their matter the lectures show signs of careful preparation. They are thoughtfully structured, and the examples chosen with care. Although these are ‘popular’ lectures, and although they prove no new theorems, it is evident that Hilbert regarded them as important, and indeed they provide the fullest statement of his mature views about the foundations of mathematics. Shortly before these lectures commenced, Ackermann had completed his dissertation (Ackermann 1924a* ). At the time, it seemed that the consistency not only of number theory, but even of analysis, had been established; and Hilbert himself believed that he now saw the route to a proof of the continuum hypothesis. These beliefs may explain something of the triumphal tone of the lectures. Hilbert had from his earliest days been a champion of the ideas of Cantor, and had resisted the finitist strictures of Kronecker. A long tradition in philosophy and in mathematics (including Aristotle and Gauß) had viewed the infinite with distrust; and Hilbert’s own clashes with Brouwer and Weyl had made clear the extent to which the problem of the infinite lay at the heart of the epistemological debates about the foundations of mathematics. Hilbert here offers a sweeping view of the development of mathematics since antiquity, and depicts its greatest accomplishments as revolving around the
Introduction
657
idea of the infinite—an idea which is not to be shunned, but, on the contrary, placed at the very heart of the subject. Hilbert begins by observing that there exists a profound connection between logic, on the one hand, and the concept of the infinite, on the other. The concept of the infinite, he says, is indispensable in mathematics: it is fruitful, and in common use; yet every object of our daily experience, every object of scientific inquiry, is finite. Somehow the infinite must be understood as arising as the negation of the finite; but there is a fundamental disanalogy between negation in the finite case and in the infinite, and exactly how we are entitled to speak of something we have never encountered in our experience needs to be explained. ‘No other path,’ he writes in the margin, ‘leads so rapidly and deeply into philosophy’. Characteristically, Hilbert does not begin with a direct assault on the problem of the infinite, but instead gathers his materials, making a survey of the role played by the infinite in the exact sciences. Only after this data has been assembled will he be ready to address the deeper logical and philosophical issues. The lecture notes are divided into five parts: pure mathematics, physics, probability theory, set theory, and logic. He begins the discussion of pure mathematics with a lecture on elementary number theory. He gives a simple proof by complete induction of the formula 12 + 22 + . . . + n2 = (n/6)(n + 1)(2n + 1). He then observes that this formula entails infinitely many specific instances. Each of the specific instances can be established by a straightforward calculation for each particular value of n. But the general, infinitary formula cannot be established in that way, ‘and precisely this fact makes necessary the application of a proof-idea. . . . Only when the formula contains infinitely many specific propositions does a mathematical problem arise, whose solution requires a mathematical thought’ (p. 3).1 From here, Hilbert turns to Euclid’s proof that there exist infinitely many prime numbers, and thence to a discussion of unique prime factorization, both in real arithmetic and in Gaussian complex arithmetic. In the second lecture (p. 11 ff.), Hilbert turns his attention to elementary geometry. Here, too, he distinguishes results that can be achieved by ‘mere calculation’ — results that ‘require no new idea at all’ (p. 13) — from deep conjectures like the four-colour problem. It is precisely because the four-colour problem makes a claim about maps having an arbitrary number of regions that it cannot be settled by simple, mechanical calculation, but demands new mathematical thought. He then discusses some applications of arithmetic to geometry: the construction of regular polygons by ruler and compass; the impossibility of squaring the circle and of doubling the cube. But besides these examples, geometry also offers an essentially new way of looking at the infi1 The page numbers here, and (unless otherwise noted) in the remainder of this Introduction, refer to pages of the Ausarbeitung of Hilbert’s lectures which immediately follows this Introduction, and where the original German can be consulted.
658
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
nite: the example of ideal elements, and specifically the ‘points at infinity’ in projective geometry. Hilbert stresses, first, through the example of Pascal’s Theorem, that the introduction of ideal points not only simplifies the presentation of geometry, but also makes possible the fruitful discovery of new theorems, and, secondly (p. 24), that the ‘points at infinity’ are not located at some vague place extremely far away, but are rather just as completed (‘vollendet’) and legitimate as the points of the Euclidean plane: that they are, like the finite points, essentially characterized by the Euclidean axioms. From these observations about geometry, Hilbert returns to Gaussian complex arithmetic, explaining how Kummer, in order to restore the uniqueness of prime factorization, had introduced ideal elements into algebraic number theory. Having shown the uses of the infinite in arithmetic and geometry, Hilbert next (p. 27 ff.) turns to an examination of its dangers, of the fallacies and paradoxes that can arise when reasoning that is valid in the finite case is uncritically transposed to the infinite. He discusses Steiner’s fallacious proof that, among all closed curves of the same length, the circle encloses the maximal area; fallacies arising in the summation of infinite series; and Zeno’s paradoxes of motion. This discussion leads naturally into a discussion of the irrational numbers and of Dedekind cuts, which he treats (p. 34) as a further example of the use of ideal elements in mathematics. He discusses Euclid’s formulation of the theory of proportions in elementary geometry, and the necessity of supplementing the Euclidean axioms with the Axiom of Archimedes. Hilbert summarizes the first part of his lectures as follows: Let us once again review our train of thought. In the very beginning, the infinite appeared to us as an infinite number, and we saw: a formula contains infinitely many propositions. A fundamentally different point of view was that of ideal elements, a simple example being the so-called infinitely distant points and the infinitely distant line of the Euclidean plane. But the most important and far-reaching application of the method of ideal elements is the creation of the concept of irrational number. And finally we investigated the meaning that attaches to the concept of irrational number in geometry . . . . But the introduction of irrational numbers is only the first step, the threshold to the extensive and fruitful use made by analysis of the infinite. The entire infinitesimal calculus can be viewed as an indication of the proper use of the infinite. We have the powerful disciplines of analysis: in particular, the theory of functions, differential equations, the calculus of variations, in which the use of the infinite has been brought to its highest perfection and has at the same time achieved the most dazzling triumphs. There one is constantly heaping up infinite processes, piling them one on top of another, interweaving infinite operations with one another and playing them off against each other; and it is precisely modern analysis that gives us complete mastery over all the rules for doing this. So it is very remarkable that analysis is driven from outside to ever more refined forms of working with concepts of infinity. Indeed, precisely the pure mathematical disciplines, from which one would not expect it, push analysis ever further, namely, arithmetic and geometry. For pure number theory at first is con-
Introduction
659
cerned only with the discrete, finite integers; but it has turned out that even the obvious prime number problem — the problem of determining the distribution of prime numbers — requires the assistance of function-theoretic techniques of the most subtle kind. Likewise with geometry, which at first is concerned only with finite, pure intuitive objects. And then finally modern theoretical physics — in particular, mechanics and electrodynamics — make such demands on the analysis of the infinite that mathematicians can scarcely keep up, and today are very far from a complete understanding and mastery of the material supplied to them by physics (pp. 40–41).
The second part of Hilbert’s lectures is devoted to the infinite in physics. ‘One might almost say,’ he remarks, ‘that the precise moment at which scientific physics first arose occurs with the introduction of the concept of infinity. For only after the most basic concepts, such as speed and acceleration, had been sharply defined by the infinitesimal calculus, could such a subject begin to develop’ (p. 41). The lectures on physics Hilbert divides into two portions: first, a discussion of ‘the world in the small’, then a discussion of ‘the world in the large’. He begins with the divisibility of matter, the theory of the atom, the development of electrodynamics and thermodynamics, and the new quantum theory. He praises Boltzmann in particular for his defense of the atomic theory, and for his rejection of the infinite divisibility of matter. Hilbert devotes the greater part of a lecture to a discussion and dismissal of phenomenalist reductionism in physics: The development of thermodynamics by Clausius, Helmholtz, Gibbs, and Planck on the one hand, and the development of electrodynamics by Maxwell and Hertz on the other, gave physics an ever more phenomenological stamp. One saw the task of natural science to be no longer explanation, but rather the simple description of the processes of nature, as e. g. Kirchhoff expressed it with great clarity in the preface to his Mechanics [Kirchhoff 1877 ]. The exaggeration of this principle led to a philosophy of positivism (as it calls itself) whose chief representatives are Mach and Ostwald, who combated the atomistic theory in the sharpest way, and from whose ranks come today the last opponents of atomism (p. 46).
This attitude towards the atomic theory Hilbert emphatically rejects: If one wishes to declare that atoms lack reality, then one must do the same for the rest of the external world, and thus for the interior of the earth and for the sun. Atoms certainly exist in exactly the same sense as every other object of the external world — like this table here, or our fellow human beings. If one wishes to deny the reality of atoms, then one must also deny the reality of the external world. And in fact Mach in the end granted actuality only to sensations. Sensations and things are for him one and the same. But if one carries out this thought consistently, one is left with only a sterile solipsism that to be sure cannot be refuted, but also possesses absolutely no cognitive value (p. 48).2 2 The passage is striking because Hilbert has often been interpreted as following a reductionist mathematical programme similar to Mach’s: just as Mach would reduce physics to sensations, so Hilbert sought to reduce mathematics to formal ‘marks on paper’. The
660
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
From here, Hilbert next turns to a discussion of ‘the world in the large’, surveying the geometric structure of space, Euclidean geometry, and Einstein’s theory of relativity. The upshot of his entire treatment of physics is that, neither in the small, nor in the large, do we meet with anything infinite. ‘The infinite divisibility of a continuum is an operation that exists only in thought; it is only an idea, and it is refuted by our observations of nature and the experience of physics and chemistry’ (p. 56). However: Although it turns out that nowhere in nature can we find anything infinite, the dimensions that we encounter in physics and astronomy are nevertheless either so small or so gigantically large that they entirely exceed the frame of ordinary relationships. For that reason it is also explicable that people long believed in the infinite, and only lately recognized the finiteness of nature (p. 64).
Having discussed the place of the infinite in pure mathematics and physics, Hilbert in his third section turns to the theory of probability. He stresses that the mathematical concept of the infinite is important not just in scientific investigations of the very large and the very small, but also in the science of ordinary, middle-sized things. Indeed, most of the laws encountered in the natural sciences are asymptotic, in which, as the number of occurrences increases, a limit is gradually approached. Hilbert here presents illustrations from roulette, from the molecular behaviour of gases, and from the biological genetics of the fruit fly. For Hilbert: The concept of asymptotic laws forms the bridge between the finiteness of reality and the infinite in our thought, as it is made precise and its relationships mastered by mathematical analysis. The reason for the applicability and the serviceability of this concept is to be found in the fact mentioned earlier, that nature, although it does not contain the infinite, nevertheless contains gigantic differences of scale and gigantic numbers. The utility of asymptotic laws rests on the fact that when we pass through the limit to the infinite, usually we obtain a fundamental simplification. The best-known and most persuasive proof for this is the differential and integral calculus, together with the other disciplines of analysis — but above all the concept of irrational number, without which we today could not take the smallest step without falling hopelessly into the briar patch of mathematical formalism. Nevertheless, as I mentioned earlier, in analysis by itself we do not reach the deepest insight into the essence of the infinite. This is rather given to us by discipline which lies closer to the general philosophical way of thinking and that aims at the resolution of the entire problem, namely, set theory (pp. 90–91).
The final two sections of the lecture notes are devoted to the foundations of mathematics, stricto sensu: reductionist interpretation of Hilbert’s philosophy of mathematics is examined and rejected in Hallett 1990 . A discussion of Hilbert’s views on the relationship between atomistic and phenomenalist theories in physics is provided in Majer 2001 .
Introduction
661
Before we make the transition [to the study of the actual infinite], let us cast a backwards glance over our previous reflections. The programme of these lectures was from the beginning to assemble material for the study of the infinite, and, to this end, to explore all the disciplines in which the infinite plays a role. In this sense I have already spoken about arithmetic, geometry, analysis, the physics of matter, cosmology, and the calculus of probability (including its various applications, such as biology). Now we come to the discipline which is called upon to study the infinite at the deepest level, i. e., set theory. I shall devote two hours to this noteworthy discipline, which, because of its originality, occupies a singular position in the round dance of the sciences; and I shall reserve the three final hours for logic (pp. 91–92).
Hilbert rapidly sketches the main elements of Cantorian set theory: the idea of an infinite collection as one that can be put into a one-to-one correspondence with a proper subset (illustrated by an example that has come to be known as ‘Hilbert’s Hotel’, which, although full, always has room for one more guest); the proof that the real unit interval (0, 1) possesses the same power as the entire real line, or the unit square, or the real plane, or the unit cube; the diagonal argument showing that, although the rationals are countable, the continuum is uncountable; and then the more general theorem that the power set of any given set is always of a greater size than the set itself. Hilbert introduces the ideas of infinite ordinals, well-orderings, and the continuum hypothesis before turning back to history and to a discussion of Dedekind’s attempt at a ‘purely logical grounding’ of number theory: Dedekind, [like Cantor], also proceeded from the knowledge that, for infinite sets, the part does not need to be smaller than the whole. And he placed this proposition at the pinnacle of his theory, taking it as the definition of an infinite set. In this way he had the idea of making the infinite set absolutely primary, simple, the simplest thing — the starting point of the entire theory. I cannot here describe how he sought to carry out his grand plan; let me just say that the number 1, and then the finite numbers 2, 3. . . , are logically deduced by Dedekind out of the infinite. The theorem that we derive from experience, that we take from our intuition — namely, that the counting number [Anzahl], i. e. the result of counting certain actual, given objects, is independent of the sequence in which we have counted them — this theorem becomes in Dedekind a theorem provable purely by logic. Dedekind’s fundamental idea and his ultimate intent are extremely enticing: number theory would become a science with absolutely no presuppositions whatsoever! He also found considerable support, e. g., in the philosopher Frege, who had undertaken a similar project even earlier than Dedekind. In this way, through the collaboration of Frege, Dedekind, and Cantor, the infinite was elevated onto the throne, and in those days enjoyed its highest triumph. It was supposed to constitute the ultimate source of the most far-reaching mathematics, and thereby of science in general. But it could not maintain its position on these heights, standing by itself, without the support of intuition and without any empirical assistance. There followed a sudden downfall (p. 107).
Hilbert then discusses the paradoxes of set theory, the effect that they had upon Frege, Cantor, and Dedekind, and the more recent efforts of eminent
662
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
(but unnamed) mathematicians ‘to transform the Cantorian paradise into a desert’ (p. 112). To deal with the problem posed by the paradoxes, he finally turns to logic in the last segment of his lectures. ‘It is obvious,’ he says, . . . that in our moment of need caused by the paradoxes we should turn to the axiomatic method, which was already applied by Euclid, and which since then has been developed in the most various ways. It is applicable everywhere, and logically incontestable. For to proceed axiomatically means at bottom nothing other than to think with consciousness. While without the axiomatic method it happened that one believed naïvely in certain connections as though they were a dogma, the theory of axioms removes this naïveté, while allowing us nevertheless the advantages of faith. The essence of the axiomatic method can be characterized as follows. In order to investigate a special domain of knowledge, one bases it upon the smallest possible number of principles that are as simple, intuitive, and comprehensible as possible; one takes these principles as axioms at the beginning of the investigation, and unifies them into a system. Out of this system one derives all the theorems of that domain of knowledge by purely logical means (p. 113).
Hilbert makes it clear that, in his opinion, Zermelo’s axiomatization of set theory fully resolved the problem of the paradoxes, ‘thereby furnishing the imperial ruler Cantor with the necessary pieces of ministerial clothing’. But there nevertheless exist ‘insurrectionaries’ who are not content with this solution, and are unwilling to accept the foundations of infinitesimal analysis: Formerly (and, strikingly, even today) there were insurrectionaries who were unsatisfied with the Cantor-Zermelo empire, who wish to shut down its most important industries, and to destroy its most admirable edifices. I myself reject these tendencies absolutely and a limine. Here let me just make the following brief remarks. There is probably no other domain inside or outside of mathematical science that has been more thoroughly investigated than the analysis of real quantities. The modes of inference that rest on the concepts of irrational number, of limit, of sets of whole numbers etc. have been driven to the furthest possible extent, and not the shadow of a discrepancy has appeared anywhere. The fact that the concept of set in the most general sense is not permissible does not at all show that the concept of sets of integers, of their subsets etc., is not entirely correct. Indeed, in the realm of analysis — that is, in what I have called the Cantor-Zermelo empire — despite the boldest and most varied combinations of the subtlest means of heaping up limits and interweaving them and piling them on top of one another, there exists complete security of inference, and the most evident unanimity about all the results. To reject the axioms on which this certainty and unanimity rests, or even seriously to doubt them, is a grotesque undertaking. And it serves these insurrectionaries right if they must then content themselves with the most wretched substitutes, and, nursing their self-inflicted wounds, are entirely occupied in laboriously hobbling about on crutches outside the mathematical paradise (p. 115).
Most of Hilbert’s pronouncements on these topics are concerned to defend the use of infinitary concepts in pure mathematics, to resist expulsion from ‘Cantor’s paradise’. But here, in keeping with the broad theme of his lectures, he emphasizes another aspect:
Introduction
663
And what would become of all those theories in neighbouring subjects, where mathematics is applied? How could the physicist get started if not even the irrational number or the general concept of function were secure on the side of mathematics? No: whatever happens elsewhere, here axiomatics — and in particular the axiomatic development of this concept — is appropriate.3 Wherever there is even the slightest prospect of success, one must carefully investigate fruitful concept-formations and modes of inference, cultivate them and support them and make them ready for use, but not eliminate the ones that have been tested and shown themselves the most reliable (p. 115).
The task, then, is to provide a consistency proof for real arithmetic; and (in contrast to his earlier proofs of the consistency of various systems of geometry) such a consistency proof must be direct (p. 116). From this point forward, Hilbert’s discussion of proof theory recapitulates ideas that he had explored in his earlier lecture courses, and that he had first publicly presented in his Hamburg lecture of 1921 (Hilbert 1922b). As one might expect, there is considerable overlap between Hilbert’s published papers on proof theory and the treatment of proof theory in the present lectures, which, in broad outline, present this material as follows. The ultimate foundation for the securing of mathematics, Hilbert says, is to be found in the finite Einstellung, the finitist point of view: As we saw from the paradoxes, the abstract operation with general extensions of concepts turned out to be inadequate. But since we cannot do without thinking — since we can never dispense with logically contentual inference — we have obviously falsely applied contentual inference, we have not kept to the necessary preconditions for the application of logical inference. As a precondition for the application of logical inferences and for the activation of logical operations there must certainly already be something given in representation [Vorstellung]: certain extra-logical concrete objects that are there intuitively as an immediate experience before all thought. If logical inference is to be secure, these objects must be completely surveyable in all their parts, and their exhibition, their differentiation, their following one after another, is, like the objects, immediately and intuitively there for us [für uns da], as something that cannot be reduced yet further to anything else. In taking this standpoint — and in exact contrast to Frege and Dedekind — the objects of number theory are for me the signs themselves, whose form can be generally and certainly recognized by us, independently of time and place and of the particular conditions under which the signs are produced, as well as of minor differences in the execution. Herein lies the solid philosophical point of view that I hold to be necessary for the founding 3 The
original reads: ‘Nein, wenn irgendwo sonst, so ist hier die Axiomatik, speziell die axiomatische Forderung dieses Begriffes angebracht’. ‘Axiomatische Forderung dieses Begriffes’ is an unusual choice of words. A Forderung is a demand or a claim; so Hilbert’s sense might be rendered as ‘an axiomatic specification or fixing of this concept’. Or perhaps ‘Forderung’ is a typographical slip for ‘Förderung’ (promotion, advancement), which would yield a sense closer to ‘an axiomatic development of this concept’. The latter is probably closer to Hilbert’s meaning; but the phrase is awkward, and neither translation is entirely satisfactory.
664
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
of pure mathematics — and indeed for all scientific thought, understanding, and communication: In the beginning (so one says here) is the sign (p. 117).
Hilbert rejects as incompatible with the finite Einstellung unbounded numbertheoretic existential quantification or the unrestricted application of the law of excluded middle to infinite collections. However: I believe that this path, which Brouwer has attempted, has no prospect of bringing us to a satisfactory conception. And indeed: we remain further than ever from the solution of the fundamental problem. The fundamental problem was, to preserve all those concept-formations and modes of inference regarding the infinite that we are used to and that we constantly apply with the greatest success, while completely maintaining the finitist point of view (p. 123).
This can only occur by grounding mathematics on concrete and ‘unproblematic’ propositions — that is, propositions that, from the finititist point of view, are true or false, are capable of being negated, and satisfy both the law of contradiction and the tertium non datur. With the limitation to the strictly finite one can go rather far in pure arithmetic. But, as I already mentioned, precisely the most beautiful, important, successful and simple concept-formations and modes of inference are thereby excluded; and the question is, what to do then. For a mathematician it is natural to turn to the method of ideal elements. Since we constantly and with the greatest success apply such statements and modes of inference that do not correspond to the finitist point of view, we can already see that we make use of this method, which amounts to the following: we set up as ideal a state of affairs [Sachverhalt] that cannot be concretely represented, in order thereby to make certain simple propositions valid without exception (pp. 124–125).
But the method of ideal elements requires a consistency proof; and Hilbert concludes his lectures with an account of his own recent work in proof theory. He describes the need to formalize, not just the equations of arithmetic, but also mathematical proof itself (p. 127); the proper vehicle for this task is the logical calculus, and he describes the bifurcation of mathematics into its formalized part, and a new ‘meta-mathematics’ whose contentual and finitist reasonings are to be employed to secure the consistency of formalized mathematics (pp. 128–131). He describes the idea of a finitist consistency proof (pp. 131–132), and briefly sketches a consistency proof for a simple transfinite axiom system (pp. 132–134). The interest of these concluding discussions is not so much in the details (which largely recapitulate material in his earlier lecture courses as well as in the published versions of his Hamburg and Leipzig talks, 1922b and 1923a) as in the way in which he seeks to embed logic and proof theory within the history of the entire development of mathematics, both pure and applied, from the Greeks onwards. He concludes his lectures as follows: Our cumulative result is: the infinite finds itself realized nowhere; it does not occur in nature, nor is it admissible as a foundation in our thought — a remarkable harmony between Being and Thought. In contrast to the ear-
Introduction
665
lier efforts of Frege and Dedekind, we come to the conviction that, as a precondition for the possibility of scientific knowledge, certain intuitive representations and insights are indispensable, and that the operation with the infinite can only be secured through the finite. The role that remains to the infinite is rather only that of an idea — if one with Kant understands by idea a necessary concept of reason that goes beyond all experience and through which the concrete is completed in the sense of totality. But the theory sketched here is not only capable of securing the foundations of mathematical science. I believe it also opens a way of handling questions of a fundamental sort that fall generally within the mathematical realm of thought, and which previously one was not able to approach. Mathematics as it were expands itself into a court of arbitration in order to bring questions of principle to resolution — on a concrete basis, on which all can agree, and by which every assertion can be checked. As an example let me mention the thesis that every mathematical problem is capable of a solution. We are all convinced of this. Indeed, it forms precisely one of the chief enticements when one is occupied with a mathematical problem, in that we hear within ourselves the constant call: There is the problem, seek the solution, you can find it by pure thought, for in mathematics there is no ignorabimus. Now indeed, theory cannot in general indicate a path by which every mathematical problem can be solved, and such a path moreover does not exist; but the proof that the assumption of the solvability of every particular mathematical problem is consistent falls entirely within the realm of our theory. I believe that this proof can be given. As I now see matters, one thereby also makes the most important step towards the solution of the continuum problem, and indeed in the affirmative sense, i. e., that the points of a line segment can already be fully counted by the number of the second class, i. e., by mere counting beyond the denumerably infinite (pp. 134–136).
Hilbert’s course of lectures concluded at the end of the Winter Semester, in late January or early February of 1925. A few months later, on June 4, he gave his famous address ‘Über das Unendliche’ in Münster (Hilbert 1926 ). The occasion was a session organized by the Westphalian Mathematical Society to celebrate the mathematical work of Weierstrass. Hilbert on that occasion drew extensively from his lecture course, extracting from it arguments and examples and many of the linguistic formulations. He condensed large portions, and, to suit the occasion, added remarks about Weierstrass and the foundations of the calculus. Most significantly, because he was now speaking to a professional audience, he added technical detail, notably his attempted solution of the continuum hypothesis, alluded to in the last paragraph of the lecture notes.4 The argument failed to persuade, and, according to Paul Lévy, ‘Zermelo told me in 1928 that even in Germany nobody understood what Hilbert meant’ (van Heijenoort 1967 , 368). Both Fraenkel (1928 ) and Luzin (1928 ) discussed and rejected the proof. For an analysis of this portion of Hilbert’s Münster address and its relationship to the Gödel consistency proof, 4 Note also the last section of Kneser’s Mitschrift of Hilbert’s lecture from 28 February 1924, above, p. 643.
666
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
see Moore 1990 , Solovay 1995 and Kanamori and Dreben 1996 . Gödel comments on the relationship in letters to Jean van Heijenoort (8 July 1965) and to Constance Reid (25 June 1969); both letters are reprinted in Volume V of his Collected Works (Gödel 2003b), pp. 324 and 188 respectively. The area of overlap between the published talk and the unpublished lecture notes is only partial. Hilbert omitted from the Münster talk many of his examples, and drastically compressed others. The importance that Hilbert nevertheless attached to the lecture notes can be inferred from the following circumstances. It is already unusual that the lecture notes survive in two different physical versions. Both are carbon copies, and to that extent identical; the original top copy appears to have disappeared. Version A is of better quality than Version B, which was probably a fourth or a fifth carbon. Both versions were bound and are now in the possession of the Mathematisches Institut in Göttingen. Most likely Version B was deposited in the library soon after the lectures were delivered, whereas Version A seems to have come into the collection after Hilbert’s death, possibly from his private Nachlaß. Both versions contain extensive marginal remarks in Hilbert’s handwriting, as well as occasional notations in an unknown hand. Moreover, in the discussion of mathematical genetics on pp. 81–82 of Version B, Hilbert added marginal references to two books by the biologists Günther Just and Richard Goldschmidt. This fact permits at least an approximate dating of the marginalia. The first edition of the monograph by Just appeared in 1927. As for the book by Goldschmidt, Hilbert cites specific pages, with the references being most likely to the fifth edition of 1928. (Thus, the works cited are Just 1927 and Goldschmidt 1928 .) This means that Hilbert continued to work on these lecture notes well after the Münster address had appeared in print. We are aware of no occasion after that address when Hilbert again lectured on the topics treated here; so, apart from scattered brief remarks in later documents, these lecture notes are Hilbert’s final sustained discussion of the philosophical underpinnings of his foundational research. It is known from the tape-recorded interviews Bernays gave near the end of his life (Bernays 1977* ) that Hilbert had Assistenten for physics as well as for mathematics, and that each sort of assistant was encouraged to attend and participate in Hilbert’s discussions with the other. In keeping with this general approach, the writing up of these broadly mathematical protocols was assigned, not to Bernays or Ackermann, but to Lothar Nordheim, a physicist; no doubt Hilbert in part was trying to encourage Nordheim to take a broad view of his education.5 In the following text we have noted all of Hilbert’s interventions, both in Version A and in Version B; those in Version B are all in pencil. The typist occasionally uses Sperrschrift for emphasis; as usual, the Sperrschrift has here 5 Nordheim (1899–1985) worked with von Neumann on mathematical physics before being forced to leave Germany in 1934. He taught at Purdue before joining the physics faculty at Duke; he also worked during and after the war at Oak Ridge and Los Alamos. He ultimately received honorary doctorates from Karlsruhe and from Purdue.
Introduction
667
been rendered in italics. At numerous points in the typescript, the typist has left considerable space at the end of a line, indicating the end of a paragraph, but has not then indented the start of the next line to mark (as usual) the beginning of the new paragraph; these indentations have been supplied here without further comment. William Ewald
668
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
Über das Unendliche (1924/25)
Vorlesung von Geheimrat Prof. D. Hilbert W.S. 1924/25.
5
Ausgearbeitet von Lothar Nordheim.
Inhaltsverzeichnis.
Einleitung: Das Unendliche als Negation des Endlichen I. Das Unendliche in der Mathematik Das Unendliche in der Zahlentheorie Vollständige Induktion Unendliche Anzahl der Primzahlen Primzahlklassen Geometrie Problem der Nachbargebiete Vierfarbenproblem Reguläre Vielecke Unmöglichkeitsbeweise Ideale Elemente Pascalscher und Brianchonscher Satz Ideale Teiler in der Zahlentheorie Gefahren des Unendlichen Steiners Beweis für die Maximaleigenschaft des Kreises Summation unendlicher Reihen Analysis Irrationalzahlen Euklids Begründung der Proportionenlehre
Seite 1 2–10 2–10 3 4 8
10
15
12 14 18 19 21 22 24 27 30 34 36
20
25
‘Über das Unendliche’ (1924/25)
5
10
15
20
25
30
35
II. Das Unendliche in der Natur Die Welt im Kleinen Atomistik Einwände gegen die Atomistik Atomistik der Elektrizität Atomistik der Wirkung, Quantentheorie Die Welt im Grossen Frage nach der Endlichkeit der Welt Relativitätstheorie Weltbild der Astronomie Lichtgeschwindigkeit Grosse und kleine Dimensionen III. Wahrscheinlichkeitstheorie Mischungsprobleme Addition der Helligkeiten Schwankungen Irreversibilität Goldbachscher Satz Biologie Verteilungskurven Atomistik der Vererbung Asymptotische Gesetze IV. Mengenlehre Endliche und unendliche Mengen Gleichzahligkeit unendlicher Mengen Nichtabzählbarkeit des Kontinuums Transfinite Ordinalzahlen Dedekinds Begründung der Mathematik Paradoxieen V. Logik Die Axiomatische Methode Die finite Einstellung Zulässige und unzulässige Aussagen, Brouwers Einschränkungen Beweistheorie Logikkalkül Widerspruchsfreiheit Die Axiome Schluss: Das Unendliche ist nur eine Idee
1 Version
B: The ‘a’ has been added to the page number.
669
42 45 50 51 56 61 64 64 65 67 70 73 74 75 79 80 89 91 91 98 102a 1 106 108 113 117 120 125 127 131 132 135
670 1
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
Ueber das Unendliche. Einleitung: Das Unendliche als Negation des Endlichen
2
Das Unendliche hat wie keine andere Frage von jeher so tief das Gemüt der Menschen bewegt; das Unendliche hat wie kaum eine andere Idee auf den Verstand so anregend und fruchtbar gewirkt; das Unendliche ist aber wie kein anderer Begriff so der Aufklärung bedürftig und auch fähig. 2 Das Wort „unendlich“ wird oft und mannigfaltig und in sehr verschiedenem Sinne im täglichen Leben sowie in den Schriften der Literaturen von Laien wie von Gelehrten gebraucht, und es erfreut sich dieses Wort wie kaum ein anderes grösster Popularität; aber man soll nicht glauben, dass der damit bezeichnete Begriff etwas leicht Verständliches, direkt Klares und unmittelbar Einleuchtendes sei. 3 Das kann auch nicht der Fall sein, wie wir erkennen, sobald wir auch nur den ersten Versuch machen, über die Bedeutung des Wortes „unendlich“ nachzudenken. Schon folgende vorläufige flüchtige Ueberlegung 4 macht uns bedenklich 4 : 3 Alles, was uns im täglichen Leben begegnet, was Gegenstand unserer Erfahrung ist, sei es, dass wir es wissenschaftlich experimentell untersuchen oder beobachten, hat stets und überall 5 den Charakter des Endlichen an sich. Das Unendliche wäre die Negation des Endlichen. Aber wie kommt 6 für uns 6 überhaupt eine Negation zustande? „Auf diesem Pult liegt ein Stück Kreide“ ist eine Aussage, 7 sogar eine zutreffende. Ich kann jetzt die Kreide wegnehmen und komme so zu der wieder zutreffenden Aussage: „Auf diesem Pult liegt nicht ein Stück Kreide“, womit die vorige Aussage negiert wird. Also Aufhebung oder Rückgängigmachen eines Zustandes, der vorher da war oder den ich vorher herbeigeführt hatte: das ist Negation. Nun handelt es sich darum, das Endliche zu negieren. Aber wie soll ich den Zustand des Endlichen, den ich doch 8 eben 8 allein überall antreffe und beobachte rückgängig machen oder aufheben? Trotz der Popularität des Begriffes unendlich, seiner häufigen Anwendung 9 und offenbaren Unentbehrlichkeit 9 bemerken wir diese Schwierigkeit, diese Diskrepanz ! Diese kurze vorläufige Ueberlegung zeigt zugleich, dass der Begriff „unendlich“ ein Tor ist, durch welches wir leicht und rasch zu tiefen und wichtigen
2 Version B: Hilbert has added in the left-hand margin the symbol ‘’ and added an insertion sign ‘V’ before ‘Das Wort’. 3–3 Version B: Enclosed in parentheses by Hilbert; in the left margin he has added the symbols ‘’ and ‘2’. 4–4 Version A: Replaced by unknown writer (pencil) with: lehrt uns dies 5 Version B: Added by Hilbert: , wie wir gesehen haben, 6–6 Version A: Replaced by unknown writer (pencil) with: nun 7 Both versions: Added by unknown writer (pencil): die einen klaren Sinn hat, ja. Version B has an additional ‘eine,’ before the addition. 8–8 Version A: Replaced by unknown writer (pencil) with: wie ich eben sagte, 9–9 Version B: Enclosed in parentheses by Hilbert.
5
10
15
20
25
30
‘Über das Unendliche’ (1924/25)
671
allgemeinen Fragen geführt werden. 10 Aber wir müssen auch ein richtiges Auge haben für alle die Dinge, die uns dieses Tor erschliessen sollen. 11 Und um dies zu gewinnen, wollen wir der Reihe nach die exakten Wissenschaften durchgehen und dabei überhaupt erst Material für unser Thema sammeln. 5
I. Das Unendliche in der Mathematik Das Unendliche in der Zahlentheorie
10
15
Denken wir zunächst an das reinste und echteste Kind des menschlichen Geistes, das ursprünglichste und naivste: das ist die reine Zahlentheorie. In ihr finden wir gleich zu Anfang eine reiche Mannigfaltigkeit von Formeln, z. B. wenn wir die ersten Quadratzahlen 12 , 22 , 32 , 42 , . . . bis zu einer Stelle hin aufschreiben und addieren, so gilt für das | Ergebnis die Formel: 1 12 + 22 + 32 + · · · + n2 = n · (n + 1) · (2n + 1), 6 wo wir für n irgend eine ganze Zahl setzen dürfen. z. B. 5: 1 1 + 4 + 9 + 16 + 25 = · 5 · 6 · 11 = 55. 6 Vollständige Induktion
20
25
30
Der Beweis ist nicht schwierig; aber immerhin bedarf es dazu eines mathematischen Gedankens, nämlich des Schlusses von n auf n + 1. Nehme ich die Formel, die offenbar für n = 1 richtig ist, und addiere auf beiden Seiten (n + 1)2 , so erhalte ich, da 1 1 n · (n + 1)(2n + 1) + (n + 1)2 = (n + 1)(n + 2)(2n + 3) 6 6 ist, die Gleichung 1 12 + 22 + 32 + · · · + (n + 1)2 = (n + 1)(n + 2)(2n + 3) 6 welche aus der gegebenen Formel durch Ersetzung von n durch (n + 1) hervorgeht. Hieraus ersehe ich, dass, wenn die Formel für irgend einen Zahlwert von n richtig ist, sie auch für die nächste Zahl richtig ist. Nun ist sie für n = 1 richtig; also gilt sie allgemein. — Diese Formel enthält unendlich viele Aussagen; also der Begriff „unendlich“ spielt schon hinein, und zwar offenbar ist gerade dies das Wesentliche; gerade dies macht auch die Anwendung eines Beweisgedankens nötig. Wenn es nur 10 Version B: Added by Hilbert in the margin: Es gibt keinen Weg sonst, der uns so rasch und tief in die Philosophie führt. 11 Version B: Added by Hilbert in the margin: ‘Wo finden wir das ∞ in der Wirklichkeit? im Kleinen, im Grossen: Weiter S. 163’ It is unclear to what document this remark refers, since the last page of these lecture notes has number 136.
3
672
4
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
darauf ankäme, die ersten Fälle der Gleichung, z. B. 1 12 + 22 = · 2 · (2 + 1)(4 + 1) 6 1 12 + 22 + 32 = · 3 · (3 + 1)(6 + 1) 6 1 12 + 22 + 32 + 42 = · 4 · (4 + 1)(8 + 1) 6 zu konstatieren, so könnte dies durch blosse Rechnung erzwungen werden — ein Erzwingen, das allgemein nicht möglich ist. Erst dadurch, dass die Formel unendlich viele Aussagen enthält, entsteht ein mathematisches Problem, zu dessen Lösung ein | mathematischer Gedanke nötig ist.
5
Unendliche Anzahl der Primzahlen Wir wollen noch ein anderes Beispiel aus der Zahlentheorie betrachten. Der ursprüngliche, naive Charakter der Zahlentheorie soll nach dem Ausspruch eines alten Mathematikers es mit sich bringen, dass man die Sätze derselben jedem Mann auf der Strasse sofort klar und verständlich machen kann. Nun, wenn dies auch zu weit geht, so ist doch richtig, dass zu wesentlichem Teil gerade die weitreichendsten Begriffe und tiefliegendsten Wahrheiten der Arithmetik in gewissem Grade fast ohne alle Vorbereitung aufgefasst werden können. Es ist gleich der Begriff der Primzahl, der uns tief in das Wesen der Arithmetik hineinzieht: Jede Zahl hat 1 und sich selbst zum Teiler. Zahlen, die keine anderen Teiler ausser diesen trivialen haben, heissen Primzahlen. Es gibt 25 Primzahlen unter 100:
10
15
20
2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97. Ein Beispiel einer grossen Primzahl ist die 16-ziffrige Zahl 2 918 000 731 816 531 (2 918 Billionen, 731 Millionen, 816 Tausend und 531). Die grösste bisher bekannte Primzahl hat 39 Ziffern und lautet
25
170 141 183 460 469 231 731 687 303 715 884 105 727;
5
sie ist also grösser als 170 Sextillionen (d. h. 170 mal der sechsten Potenz von einer Million). 12 Die Primzahlen erscheinen dem Arithmetiker wie Individuen, wie einzelne Persönlichkeiten, deren jede er mit besonderer Liebe betrachtet. Ein einfacher Gesichtspunkt der Betrachtung besteht darin, dass man die Primzahlen mit Ausnahme der einzigen geraden Primzahl 2, in zwei Klassen teilt, indem man zur | ersten Klasse die Primzahlen rechnet, welche bei der Division durch 4 den Rest 1 geben, zur zweiten diejenige, welche den Rest 3 geben. Ein arithmetischer Satz, der schon weit tiefer liegt als das Heer von Identitäten, deren eine ich erwähnte, ist dieser: 12 Version
B: Hilbert has added in the left-hand margin: ⊥
30
35
‘Über das Unendliche’ (1924/25)
5
10
15
20
25
30
35
40
673
Jede Primzahl der ersten Klasse ist gleich einer Summe von 2 Quadratzahlen, und zwar ist diese Summendarstellung nur auf eine einzige Art möglich. z. B. 5 = 1 + 4, 13 = 4 + 9, 17 = 1 + 16, 29 = 4 + 25. Erinnern wir uns des prinzipiellen Gesichtspunktes, den wir schon aus dem ersten Problem gewonnen haben, so müssen wir fragen, ob wir es hier überhaupt mit einem eigentlichen Problem zu tun haben. Würden nämlich in der ersten Klasse nur endlich viele Primzahlen vorkommen, sodass es vielleicht oberhalb von 1 Billion keine mehr gäbe, so liesse sich ja der Satz durch Ausrechnen erzwingen und er enthielte nicht unendlich viele Aussagen. Wir wissen ja noch nicht einmal, dass in beiden Klassen zusammen unendlich viele Primzahlen enthalten sind. Es könnte ja jene angegebene Primzahl die letzte sein. Nun gilt aber tatsächlich der Satz, dass es unendlich viele Primzahlen gibt. Der Beweis hierfür rührt von Euklid her. Man schliesst indirekt: Angenommen, es gäbe nur endlich viele Primzahlen, so schreibe ich sie hin: 2, 3, 5, . . . , p. Die Zahl z = 2·3·5 ... ·p + 1 ergibt, wenn sie durch eine der Zahlen 2, 3, 5, . . . , p dividiert wird, jedesmal den Rest 1 und ist somit weder durch 2, noch 3, . . . , noch p teilbar. Nun ist z entweder Primzahl oder nicht. Im ersten | Fall liegt eine grössere Primzahl als p, also eine neue vor; im zweiten Falle muss z zerlegbar sein und also gewiss eine Primzahl q enthalten. Diese muss ebenfalls von 2, 3, . . . , p verschieden also wiederum eine neue Primzahl sein. In jedem Falle führt somit unsere Annahme zu einem Widerspruch. Aus dem bewiesenen Satz von Euklid folgt, dass es in mindestens einer der beiden Klassen unendlich viele Primzahlen gibt. Schwieriger ist es zu beweisen, dass die erste Klasse unendlich viele Primzahlen enthält. Ich möchte aber doch den Beweis wenigstens andeuten, weil wir daran auch für später viel erkennen können. In der Theorie der gewöhnlichen Zahlen ist der wichtigste und folgenreichste Satz der von der eindeutigen Zerlegung in Primfaktoren: Jede Zahl m, die = 1 13 ist, kann dargestellt werden als ein Produkt von Primzahlen; z. B. 60 = 2 · 2 · 3 · 5, und zwar ist diese Darstellung eindeutig, d. h. abgesehen von der Reihenfolge der Faktoren, nur auf eine einzige Art möglich. Bei Hinzunahme der negativen Zahlen ist die Behauptung so zu modifizieren, dass man auch Einheiten (1 oder −1) als Faktoren zulässt und dass die Eindeutigkeit der Darstellung auch nur abgesehen von den Einheiten besteht, d. h. man betrachtet z. B. die Zerlegung 60 = 1 · (−1) · (−2) · 2 · 3 · 5 nicht als verschieden von der obigen, noch auch von der Zerlegung 60 = (−1) · (−1) · (−2) · 2 · (−3) · 5. 13 The
sign used by the typist is not ‘=’, but more like ‘=’ with two slashes through it. We have replaced this with the standard sign.
6
674
7
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
Alles Zahlenrechnen ruht auf diesem Fundament. Nun ist das Merkwürdige, dass dieser Satz der weitestgehenden Verallgemeinerung fähig ist, ja diese ist so ergiebig, dass man sagen kann: die ganze Arithmetik bestehe in dem Studium dieser Erweiterung und den daraus enspringenden Folgerungen. Den ersten und ausschlaggebenden Schritt | tat Gauss durch seine berühmte Erweiterung des Feldes der Arithmetik, wie er selbst sie nannte. Statt der gewöhnlichen Zahlen betrachtet er Zahlen von der Form u + vi, z. B. −2 + 3i,
−10i,
√
5
−306 + 1530i;
d. h. er nimmt die imaginäre Zahl i = −1 (von der Eigenschaft i · i = i2 = −1) hinzu. Zur Untersuchung dieses erweiterten Zahlbereichs wird man zunächst nach den Einheiten, d. h. den Zahlen fragen, die in 1 aufgehen. Man findet, dass ±1, ±i, diese und nur diese vier Zahlen in 1 und somit in jeder Zahl aufgehen. Demnach hat jede Zahl α (des erweiterten Bereiches) acht Teiler: ±1, ±i, ±α, ±αi.
15
Eine Zahl, die ausser diesen 8 trivialen Teilern keinen anderen hat, heisst Primzahl. Um Primzahlen aufzusuchen, hat man zuzusehen, ob die gewöhnlichen Primzahlen einer (nicht trivialen) Zerlegung fähig sind. Die Zahl 2 gestattet die Zerlegung 2 = (1 + i)(1 − i) = −i(1 + i)
10
20
2
sie ist also, abgesehen von einer Einheit, gleich dem Quadrat von 1+i. 1+i ist eine Primzahl, denn bei einer Zerlegung 1 + i = (a + bi)(c + di) muss
2 = (a2 + b2 )(c2 + d2 ) sein, und daraus folgt, dass entweder a + bi oder c + di in 1 aufgeht. 3 ist eine Primzahl. Nämlich für eine Zerlegung
25
3 = (a + bi)(c + di) ergibt sich 8
9 = (a2 + b2 )(c2 d2 ) und da 3 nicht Summe zweier Quadratzahlen sein kann, so muss entweder a2 + b2 = 1 oder c2 + d2 = 1, d. h. a + bi oder c + di muss ein Teiler von 1 sein. 5 ist zerlegbar, dies folgt aus der Darstellung von 5 als Summe zweier Quadratzahlen: 5 = 1 + 4 = 12 + 22 = (1 + 2i)(1 − 2i). 1 + 2i ist eine Primzahl; denn bei einer Zerlegung
30
35
1 + 2i = (a + bi)(c + di) ist
5 = (a2 + b2 )(c2 + d2 ) und da einer der Faktoren rechts gleich 1 ist, so ist a+bi oder c+di eine Einheit. Ebenso folgt, dass 1 − 2i eine Primzahl ist, und zwar, wie man leicht erkennt,
40
‘Über das Unendliche’ (1924/25)
675
eine von 1 + 2i verschiedene Primzahl. Allgemein zeigt man nach derselben Methode, dass jede gewöhnliche Primzahl der ersten Klasse das Produkt zweier (verschiedener) Primzahlen ist, während die gewöhnlichen Primzahlen der zweiten Klasse Primzahlen bleiben. 5
10
Primzahlklassen Die wesentliche Entdeckung von Gauss besteht nun darin, dass auch für den erweiterten Bereich der Satz von der eindeutigen Zerlegung der Zahlen in Primfaktoren gültig ist, wobei wieder die Eindeutigkeit abgesehen von der Reihenfolge und von Einheitsfaktoren zu verstehen ist. Als Beispiel einer Zerlegung in Primfaktoren nehmen wir die der Zahl (−306 + 1530i): −306 + 1530i = 306 · (−1 + 5i) = 2 · 3 · 3 · 17(1 + i)(2 + 3i) = −i(1 + i)2 · 3 · 3(1 + 4i)(1 − 4i)(1 + i)(2 + 3i) = −i(1 + i)2 32 (2 + 3i)(1 + 4i)(1 − 4i).
15
20
Wir können nun genau nach der Euklidischen Methode das Vorhandensein unendlich vieler komplexer Primzahlen (a + bi, b = 0) nach|weisen. Daraus ergibt sich dann unmittelbar die Existenz unendlich vieler gewöhnlicher Primzahlen der ersten Klasse; denn, ist a + bi eine komplexe Primzahl, so muss a2 + b2 , nach dem Satz von der eindeutigen Zerlegung, eine gewöhnliche Primzahl sein, und zwar wenn sie > 2 ist, eine aus der ersten Klasse. Angenommen, es gäbe nur endlich viele komplexe Primzahlen, und seien 2, 5, 13, 17, . . . , p
25
30
35
die gewöhnlichen Primzahlen, die jene Primzahlen zu Teilern haben, so bilde man die Zahl 2 · 5 · 13 · 17 . . . · p + i; diese könnte nur gewöhnliche Primzahlen der zweiten Klasse als Primfaktoren enthalten; sie müsste also eine gewöhnliche Zahl oder gleich i-mal einer gewöhnlichen Zahl sein, was beides nicht angeht. — Somit enthält der Satz von der Darstellung jeder Primzahl der ersten Klasse als Summe zweier Quadrate wirklich unendlich viele Aussagen; er kann also nicht durch blosses Rechnen bewiesen werden. Die Theorie der Gaussschen Zahlen ist überreich an Anwendungen. Eine sehr spezielle ist die auf den besonderen Fall des grossen Fermatschen Satz, der die Unlösbarkeit der Gleichung x4 + y 4 = z 4 durch positive ganze Zahlen besagt. Es ergibt sich, dass sogar die Gleichung x4 + y 4 = z 2 in diesem Sinne unlösbar ist. Auch dieser Satz kann nicht durch blosses Rechnen bewiesen werden, weil er unendlich viele Aussagen von der Form
40
a4 + b4 = c4
9
676 10
11
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
enthält. So kommen wir dazu „Unmöglichkeitssätze“ als aequivalent mit unendlich vielen Aussagen anzusehen. 2. Vorlesung. 14 In der reinen Zahlentheorie tritt uns das Unendliche in der reinsten Gestalt entgegen, nämlich als Formel, die unendlich viele numerische Tatsachen enthält, oder als Lehrsatz, der unendlich viele Beispiele als Bestätigung in sich schliesst. In beiden Fällen handelt es sich um unendlich viele Aussagen, die dennoch in einem einzigen Satze ihren Ausdruck finden. Zur Erläuterung hatte ich die Formel für die Summe der ersten n Quadratzahlen n 12 + 22 + 32 + · · · + n2 = (2n + 1)(n + 1) 6 und den Lehrsatz gewählt, dass jede Primzahl ≡ 1 15 mod 15 (4) einer Summe von vier Quadratzahlen ist. Gerade die Tatsache, dass es sich um unendlich viele Aussagen handelt, charakterisiert diese Sätze erst als Lösungen von eigentlichen mathematischen Problemen, und sogar der Nachweis, dass es sich um unendlich viele Aussagen handelt, ist in unserem zweiten Beispiel für sich ein neues wichtiges Problem. Seine Lösung, nämlich der Nachweis der unendlichen Anzahl der Primzahlen, lässt sich auch in Form einer Unmöglichkeitsbehauptung aussprechen, nämlich in dem Satz: „Es ist unmöglich, eine letzte Primzahl zu finden“. Hier sehen wir wieder deutlich, wie in ein ganz harmloses endliches Zahlenproblem das Unendliche hineinspielt.
5
10
15
20
Geometrie
12
Dieses fortdauernde Auftreten des Unendlichen in scheinbar ganz endliche Fragestellungen wollen wir uns noch eindringlicher an einem bekannten Problem der anschaulichen Geometrie klarmachen. Wir verlassen damit die elementare Zahlentheorie und kommen jetzt zur elementaren Geometrie. Dort lernten wir das Unendliche in der einfachsten und primitivsten Art kennen: es war weiter Nichts als die beliebige Fortsetzbarkeit des Zählprozesses. Verlassen wir die reine Zahlentheorie, so ist es das Nächstlie|gende, den Zählprozess auf geometrische Objekte anzuwenden. Die einfachsten typischen Beispiele dafür bietet die „Topologie“.
25
30
Problem der Nachbargebiete Eine bekannte Aufgabe ist hier die Bestimmung der Höchstzahl der Gebiete in der Ebene, die die Eigenschaft besitzen, dass jedes Gebiet an jedes andere längs einer ganzen Grenzlinie anstösst. Wir können leicht 4 solche Gebiete finden, wie in der Figur angezeichnet, und es ist auch nicht schwer einzusehen, 14 In this simple way, the typescript marks the beginning of the second lecture. There are no further marks to indicate the start of subsequent lectures. 15–15 Version B: Inserted by hand (missing in Version A).
35
‘Über das Unendliche’ (1924/25)
5
10
15
20
25
30
35
677
dass 4 die Höchstzahl ist. 4 Zum Beweise gehen wir zu dem aequiva1 2 lenten Problem der benachbarten Punkte über. Dieses besteht in Folgendem. Nehmen wir in je3 dem der 4 Nachbargebiete einen Punkt an, so haben wir offenbar 4 Punkte in der Ebene, deren jeder mit jedem anderen durch einen Weg so verbunden werden kann, dass keiner dieser Wege einen anderen Weg kreuzt. Gäbe es nun 5 Nachbargebiete, so würden wir auch 5 solcher Nachbarpunkte haben. Das ist aber unmöglich. Um dies einzusehen, nehmen wir zunächst 3 Punkte und verbinden diese durch Wege. Wir erhalten so ein krummlinig begrenztes Dreieck. Wir zeigen nun, dass sich keine zwei weiteren Punk2 te mit der verlangten Eigenschaft finden lassen. Läge nämlich der eine innerhalb und der andere ausserhalb, so müsste ihre Verbindungslinie eine Dreiecksseite schneiden. Das ist aber gegen 3 1 die Voraussetzung, und so können also nur beide innerhalb oder beide ausserhalb liegen. Im ersteren Falle verbinden wir den Punkt 4 2 mit 1, 2, 3. Dann liegt 5 in | einem der Teildreiecke 142, 143, 342 und 5 kann daher mit einem der Punkte 1, 2, 3 nicht verbunden werden. Liegen endlich 4 und 5 beide ausserhalb 123, so 4 1 3 verbinden wir wieder 4 mit 1, 2 und 3. 5 kann dann weder ausserhalb 234, noch innerhalb 134 2 oder 124 liegen, da es dann nicht bezw. mit 1 resp. 2 resp. 3 verbunden werden könnte. Wir haben aber auf keinen Fall einen Platz für unse1 4 3 ren Punkt 5, womit unsere Behauptung bewiesen ist. Unsere eben bewiesene Aussage ist im wesentlichen eine Einzelaussage, dass es nämlich nicht möglich ist, 5 Punkte in der verlangten Art zu verbinden. Der Unmöglichkeitsbeweis konnte daher durch direktes Ausprobieren erbracht werden, nämlich durch Aufzählen aller Möglichkeiten. Ich möchte daher den Satz prinzipiell mit der Behauptung einer bestimmten numerischen Formel wie etwa 1 + 4 + 9 + 16 = 30
40
gleichstellen. Der Beweis erforderte daher auch keinerlei neuen Gedanken, sondern nur die Anwendung einer topologischen Betrachtungsweise, ebenso wie zur Kontrolle der obigen Formel die Anwendung der Rechnungsregeln nötig ist.
13
678
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
Vierfarbenproblem
14
Mit dem Problem der Nachbargebiete steht ein anderes in engem Zusammenhang, das ihm sehr ähnlich scheint, aber sich gerade in der uns hier interessierenden Hinsicht völlig anders verhält. Es ist das sogenannte Farbenproblem, das sich in das Gewand eines Problems der praktischen Kartographie kleiden lässt. Es sei in der Ebene eine Anzahl von Gebieten eingezeichnet. Jedes dieser Gebiete soll mit einer bestimmten Farbe ausgefüllt werden, aber zwei Gebiete, die längs einer Kurve an einander grenzen, | nie mit derselben Farbe. Es ist nun die Minimalzahl der Farben zu bestimmen, mit der wir bei jeder Gebietseinteilung auskommen. Aus dem Problem der Nachbargebiete, nämlich aus der Tatsache, dass es 4 Nachbargebiete gibt, entnehmen wir für das Farbenproblem die Kenntnis, dass jedenfalls mindestens 4 Farben nötig sind, und durch Probieren gewinnt man die Ueberzeugung, dass 4 Farben auch ausreichen. Diese Vermutung scheint in der Tat richtig zu sein, wie sich durch ausgedehnte Versuche ergeben hat. Der strenge Nachweis ist aber bis jetzt noch nicht erbracht worden. Es ist ja auch durchaus möglich, dass wir bei dem Ausfärben einer grösseren Anzahl von Gebieten mit der Zahl 4 nicht auskommen. Die Schwierigkeit des Problems und den Unterschied zu dem Problem der Nachbargebiete machen wir uns am Besten an einem Beispiel klar. Es sei folgende Gebietseinteilung vorgelegt. Wir versuchen nun, sie in der angegebenen Weise mit den 4 Farben weiss, gelb, blau und rot auszufärben. 1 2 Dazu färben wir zunächst 1, 2, 3 mit weiss, bzw. 6 4 5 3 gelb, bezw. blau. Es scheint dann am Sparsamsten, für 4 weiss zu nehmen. Aber dann haben wir für 5 keine Farbe mehr zur Verfügung, da
5
10
15
20
25
weiss gelb rot blau
15
weiss
weiss ?
weiss gelb rot
rot blau
rot notwendig für 6 zu reservieren ist, da es an 1, 2 und 3 stösst. Wir müssen also rot nehmen und kommen dann aus, wie die Figur zeigt. | Aber auch das ist nicht immer richtig wie aus den nächsten Figuren hervorgeht. Die 4 ersten Gebiete haben genau dieselbe Lage, trotzdem ist jetzt 4 weiss anstelle von rot zu färben. 16
16 Version
A: In the diagram to the right below, the entry ‘rot’ was placed in the wrong quadrant and subsequently stricken through.
30
‘Über das Unendliche’ (1924/25)
weiss gelb
weiss gelb rot
5
10
15
20
25
30
blau
weiss
rot
?
blau
679
rot
Aus diesen Beispielen ergibt sich, dass die Färbung in den ersten 4 Gebieten durch die Anordnung der weiteren Gebiete mitbestimmt wird; wir müssen also, wenn ein neues Gebiet hinzukommt, unter Umständen die bereits gefärbten Gebiete noch einmal umfärben, und hieraus ergibt sich die Schwierigkeit des Problems. Unsere Beispiele zeigen andererseits, wie man in solchen Fällen trotz anfänglicher Schwierigkeiten doch durch geeignetes Umfärben mit 4 Farben auskommen kann. Wie gesagt, so weit man versucht hat, reichen 4 Farben aus; aber es kommt doch gerade darauf an, einzusehen, dass man immer bei jeder vorgelegten Gebietseinteilung damit ausreichen kann. Obgleich seit Mitte des vorigen Jahrhunderts sich die scharfsinnigsten Mathematiker mit der Lösung dieses Problems beschäftigt haben, und eine ganze Literatur über diesen Gegenstand existiert, ist es bisher nur gelungen, zu zeigen, dass 5 Farben unter allen Umständen ausreichen. Sie erkennen jetzt leicht, den prinzipiell verschiedenen Charakter dieses Problems im Vergleich zu dem Problem der Nachbargebiete. Hier kam es nur darauf an, zu zeigen, dass 5 Nachbargebiete nicht möglich sind, wonach die Unmöglichkeit von 6, 7 oder | noch mehr trivial ist. Es handelte sich also im Wesentlichen nur um eine Einzelaussage. Dagegen verlangt das Farbenproblem den Nachweis der unendlich vielen Aussagen, dass man irgend 5, 6, 7 . . . Gebietsschemata jedesmal mit schon 4 Farben ausfüllen kann, und diese unendlich vielen Aussagen stehen nicht in einem trivialen offensichtlichen Zusammenhange. Darin liegt und erklärt sich die soviel grössere Schwierigkeit des Farbenproblems. Es gilt, neue Gedanken zu finden, was bisher noch nicht gelungen ist. Und das ist um so merkwürdiger, als ein Problem, das man zunächst mit Recht für schwieriger halten müsste, seine volle Lösung gefunden hat, nämlich das entsprechende Problem auf der Ringoberfläche. Die Rolle der Zahl 4 übernimmt hier die 7. Man kann auf einem Ring stets 7 Punkte durch Wege ohne Ueberkreuzung verbinden und dementsprechend auch 7 Nachbargebiete konstruieren, wie man auf einem Modell leicht zeigen kann. Ebenso lassen sich auch die Zusammenhangsverhältnisse der Ringoberfläche in der Ebene durch Zeichnung veranschaulichen. Wir denken uns hierzu den Ring aus elastischem dehnbaren Material hergestellt.
16
680
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933) A∗ A∗ B∗
B
A 17
18
A
Nun schneiden wir den Ring längs des gezeichneten Querschnittes auf und deformieren ihn zu einem Zylinder. Offenbar erleiden durch | diese Verzerrung die Zusammenhangsverhältnisse keine Aenderung. Wir müssen nur jetzt folgendes beachten: Zwei Punkte A und A∗ , die am oberen und unteren Rand genau übereinanderliegen, dürfen wir nicht als verschiedene Punkte ansehen, sondern müssen sie als identisch betrachten. AA∗ ist also eine geschlossene Linie. Den Zylindermantel schneiden wir nun der Länge nach auf und breiten ihn in die Ebene zu einem Rechteck aus. Nur müssen wir jetzt die linke und rechte Seite als völlig identisch betrachten, so dass also die Punkte B identisch sind, ebenso natürlich wie vorhin A und A∗ . Nun ist es leicht, in dem Rechtecke 7 Gebiete zu zeichnen, so dass jedes an jedes andere stösst. Hier haben Sie das Gewünschte. Wie das zu verstehen ist, dürfte nach dem Vorhergehenden klar sein. Wollen wir z. B. den Rand des Gebietes 1 1 1 4 A umlaufen, so fangen wir bei A an, gehen dann in der Richtung des Pfeiles bis zur oberen Seite, 6 2 dann auf der unteren Seite weiter bis zur linken 3 7 Seite, dann auf der rechten Seite weiter u. s. f., bis man auf der rechten Seite schliesslich wieder 5 1 1 im Punkte A angekommen ist. Die Wegkarte für 7 Nachbarpunkte ist eben5 4 1 1 falls nebenstehend angegeben. 17 Für 8 Punkte ist ein solches Wegsystem nicht mehr möglich, 2 2 und daher gibt es auch nicht 8 Nachbargebiete. 7 6 Das Farbenproblem ist wieder prinzipiell weit schwieriger, weil es eine Antwort auf unendlich 3 3 viele Aussa|gen verlangt. Es sind besondere neue Gedanken nötig, die aber in diesem Falle gefun1 1 5 4 den worden sind. Es hat sich herausgestellt, dass in der Tat bei jeder Gebietseinteilung 7 Farben ausreichen. Reguläre Vielecke Ich will endlich noch kurz eines Problems der elementaren Geometrie gedenken, das ein Beispiel dafür bietet, dass es unter Umständen leichter sein kann, ein Problem zu lösen als festzustellen, ob man es dabei mit endlich 17 Version
B: The numerals are missing in the diagram.
5
10
15
20
25
30
‘Über das Unendliche’ (1924/25)
5
681
oder unendlich vielen Aussagen zu tun hat. Es handelt sich um die Frage, welche regulären Polygone mit Lineal und Zirkel in der Ebene konstruierbar sind. Wir interessieren uns dabei nur für Primzahlecke. Reguläre Dreiecke zu konstruieren, ist kein Kunststück. Das 5-Eck war auch schon im Altertum bekannt. Man erhält bekanntlich seine Seite, indem man den Radius des umschriebenen Kreises, den wir gleich 1 annehmen, nach dem goldenen Schnitt teilt, d. h. wir setzen 18 1 1−x:x = x:1
10
1−x x Dann ist x gleich der Seite des regulären Zehnecks. n Gauss hat nun allgemein für p = 2 + 1 die Konstruierbarkeit gezeigt und damit das Problem gelöst. Denn wenn eine Primzahl vorgelegt wird, so lässt sich natürlich leicht durch Rechnung entscheiden, ob sie von der Form 2n + 1 ist, und damit auch, ob das p-Eck konstruierbar ist oder nicht.
2+1=3 22 + 1 = 5
15
24 + 1 = 17 28 + 1 = 257 216 + 1 = 65537 20
25
30
35
sind Primzahlen, die diese Bedingung erfüllen; aber weitere sind | noch nicht gefunden worden. Fermat, derselbe, der uns in seinem grossen Satz ein so fruchtbares Problem hinterliess, war an dieser Stelle weniger glücklich, indem er eine recht leichtsinnige Prophezeiung machte. Nach dem obigen Schema n stellte er nämlich die Vermutung auf, dass alle Zahlen von der Form 22 + 1 Primzahlen seien. Aber das ist nicht viel anders, als wie, nach einem scherzhaften Ausspruch Kummers, manchmal in den Naturwissenschaften geschlossen wird, nämlich: 120 ist durch 2, 3, 4, 5 und 6 teilbar, folglich auch durch 7! In 5 der Tat ist schon die Nächste dieser Zahlen, nämlich 22 + 1 = 232 + 1 zerlegbar, nämlich gleich 641 · 6700417. Ebenso haben sich alle weiteren bisher 6 12 23 36 untersuchten Zahlen von der Form, nämlich 22 + 1, 22 + 1, 22 , 22 + 1 als zerlegbar herausgestellt. Die letzte Zahl hat mehr als 21 Milliarden Ziffern im Dezimalsystem; sie ist teilbar durch 2748779069441, eine dreizehnziffrige 8 Zahl. Ueber 22 + 1 ist nichts Näheres bekannt, und die Frage, ob es unendlich n viele Primzahlen von der Form 22 + 1 gibt, ist noch ganz offen und gehört zu den Problemen, die 1) tatsächlich bisher nicht gelöst, 2) gegenwärtig mathematisch unangreifbar sind, und für die 3) auch keinerlei berechtigte Vermutung möglich ist, in welchem Sinne die Lösung ausfallen wird.
18 Version
B: The drawing is missing.
19
682
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
Unmöglichkeitsbeweise
20
Als Gegenstück möchte ich Ihnen folgendes arithmetisches Problem nennen: √ 2 2 ist eine reelle Zahl, die auch leicht als Grenzwert von Wurzeln aus 2 dargestellt und in einen Dezimalbruch entwickelt werden kann. Das Problem √ ist, ob 2 2 rational oder irrational ist. Die Punkte 1) und 2) gelten so wie vorhin; aber jeder, der sich | etwas in arithmetischer Atmosphäre bewegt hat, √ 2 wird seine Hand dafür ins Feuer legen, dass 2 irrational ist. Diese Behauptung ist wieder zugleich eine solche, die unendlich viele Aussagen einschliesst, nämlich √ a 2 2 = , b was auch a und b für ganze Zahlen sein mögen. Aus der elementaren Geometrie sind noch eine Reihe weiterer Unmöglichkeitsbeweise berühmt geworden. Ich will nur noch zwei davon nennen, nämlich 1) die Unmöglichkeit der Würfelverdoppelung, und 2) die Unmöglichkeit der Quadratur des Kreises. Beidemale handelt es sich um die Behauptung, dass man eine gewisse Zahl, eine Verhältniszahl, nicht mittels Lineal und Zirkel konstruieren kann. Beidemale gelingt die Zurückführung auf ein arithmetisches Problem. Eine Zahl ist nämlich mit Hilfe von Lineal und Zirkel konstruierbar oder nicht, je nachdem sie formal durch Quadratwurzeln allein ausdrückbar ist oder nicht. Das Problem der Würfelverdoppelung, also der Konstruktion der Seite x eines Würfels mit dem Inhalt 2, ist demnach aequivalent mit der Frage, ob der nur Quadratwurzeln die Gleichung x3 = 2 durch irgendeinen Ausdruck, √ enthält, lösbar ist, also etwa von der Form 11 − 3, √1 √ oder ähnlich 3−
5− 2
5
10
15
20
25
ist.
21
Dies ist aber nicht möglich, und damit ist unsere Frage im verneinenden Sinne entschieden. Wieder sehen wir aber ganz deutlich, dass unser Unmöglichkeitssatz unendlich viele Aussagen enthält. Das Verhältnis von Umfang und Durchmesser von Kreisen ist ebensowenig konstruierbar, aber der Nachweis erfordert höhere Mittel der Analysis. Erinnern wir uns nun, wie wir zu allen diesen Problemen kamen! | Wir wollten doch der Rolle, die das Unendliche spielt in der elementaren Geometrie, nachspüren. Was wir nun in der Geometrie berührt haben, war ja gewiss stofflich und methodisch von Interesse, aber vom Standpunkt des Unendlichen aus haben wir bisher eigentlich Nichts wesentlich Neues gefunden, das über das in der Arithmetik Gebrachte hinausgeht. Es war bisher nur eine andere Einkleidung des Früheren, indem wir den arithmetischen Zählprozess auf geometrische Objekte und Operationen anwandten. Aber gerade die ersten Elemente der Geometrie führen uns auf eine ganz anders geartete Deutung und prinzipielle Erfassung des Unendlichkeitsbegriffes. Beschränken wir uns auf die Euklidische Geometrie der Ebene, so haben wir ursprünglich die Punkte und die Geraden als die Elemente. Dies sind dann allein die realen wirklich existierenden Gegenstände. Für diese gilt unter anderem das Axiom der Ver-
30
35
40
‘Über das Unendliche’ (1924/25)
683
knüpfung: durch zwei Punkte geht immer eine und nur eine Gerade. Hieraus ergibt sich als Folgerung, dass zwei Gerade sich höchstens in einem Punkt schneiden. Es gilt jedoch nicht der Satz, dass sich zwei Gerade immer in einem Punkte schneiden. Ideale Elemente
5
10
15
20
Wir können nun aber durch Einführung idealer Schnittpunkte und Geraden erreichen, dass sich dieser Satz in allgemeiner Form aufstellen lässt. Das Verfahren der Erweiterung gestaltet sich hierbei besonders einfach, weil wir in der Euklidischen Geometrie die einfachen Sätze über die Parallelen haben, wonach zu einer gegebenen Geraden durch einen nicht auf ihr gelegenen Punkt eine und nur eine gerade hindurchgeht, die die erste Gerade nicht schneidet. Aufgrund hiervon genügt es, folgende 19 Voraussetzungen 19 zu treffen, um die ge|wünschte Vereinfachung zu erhalten: 1) Jede Gerade enthält einen idealen Punkt. 2) Je zwei Parallelen haben denselben idealen Punkt. 3) Zwei sich schneidende Geraden haben verschiedene ideale Punkte. 4) Alle idealen Punkte liegen auf einer idealen Geraden, die also die einzige ideale Gerade ist. Diese Festsetzungen sind notwendig und hinreichend, damit nach Einbeziehung der idealen Elemente die Schnittpunktssätze allgemein ohne Ausnahme gelten. Pascalscher und Brianchonscher Satz
25
30
Ich möchte zunächst ein Beispiel dafür angeben, wie diese Einführung idealer Elemente nicht bloss der Vereinfachung dient, sondern darüber hinaus sich als fruchtbar erweist. Unsere Sätze über Punkte und Geraden haben jetzt nämlich die Eigenschaft erhalten, dass sie in sich übergehen, wenn man in ihrer Formulierung die Worte Punkt und Gerade vertauscht. Auf diesen Umstand gründet sich das „Dualitätsprinzip“, welches besagt, dass man aus jedem Satz der ebenen Geometrie wieder einen richtigen Satz erhält, wenn man Punkt und Gerade ihre Rolle vertauschen lässt. So hat man z. B. einen berühmten Spezialfall des Pascalschen Satzes, der lautet: Wenn die Ecken eines überschlagenen Sechseckes abwechselnd auf zwei Geraden liegen, so liegen auch die Schnittpunkte der gegenüberliegenden Seiten auf einer Geraden.
19–19 Version
A: Replaced by unknown writer (ink) with: Festsetzungen
22
684
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933) F B
D
2
6 5
1 4
3
A E C 23
Gemäss dem Prinzip der Dualität folgt aus diesem Satz der zu ihm duale: Wenn die Seiten eines Sechsseits abwechselnd durch zwei Punkte gehen, so schneiden sich die Verbindungslinien der gegenüberliegenden Ecken in einem Punkt. Diesen Satz können wir für die gewöhnliche Euklidische Geometrie auch so spezialisieren, dass wir die zwei Punkte als ideale Punkte wählen. Er nimmt dann folgende Form an: wenn in einem Sechseck die geradzahligen sowie die ungeradzahligen Seiten einander parallel sind, so schneiden sich die Verbindungslinien der gegenüberliegenden Ecken in einem Punkte
5
5
2 6 1
4 3
also ohne einen Beweis haben wir zwangläufig einen vollkommen anderen neuen Satz gefunden: den Brianchonschen Satz. Was uns aber hieran eigentlich für unser Thema angeht und interessiert, das ist die ursprüngliche Bedeutung und Herkunft dieser idealen Elemente. Diese wurden nämlich ursprünglich und werden auch heute noch unendlich ferne Elemente genannt: Unendlich ferne Punkte und die unendlich ferne Gerade, wie ja auch anschaulich aus dem Prinzip der Stetigkeit sich ergibt:
10
15
‘Über das Unendliche’ (1924/25)
I1
5
10
15
20
I2
685
I3
indem man Schnittpunkt I ins Unendliche wandern lässt. Trotzdem ist | der unendlich ferne Punkt als ideales Element durchaus etwas Vollendetes und dem gewöhnlichen euklidischen Punkte Gleichberechtigtes. Dieses Unendliche ist etwas ganz anderes als die durch den Prozess des Zählens hervorgehende Zahlenreihe. Die Eigenschaften der idealen Elemente sind wesentlich durch die Eigenschaften der endlichen Elemente, hier also durch die Euklidischen Axiome bedingt. Sobald wir aus dieser Euklidischen Geometrie heraustreten, ist auch eine ganz andere Auffassung des Unendlichen der Ebene möglich. Und das ist für andere Zwecke sogar notwendig. Nämlich, wie ich hier nur erwähnen will, wird in einer sehr ausgedehnten rein mathematischen Disziplin, der Theorie der komplexen Funktionen das Unendliche der Ebene nicht als Gerade, sondern als Punkt aufgefasst und konsequent behandelt, weil sich dort eben in der komplexen Ebene das Unendliche wie ein Punkt verhält, sodass es dort nur nötig ist, einen einzigen idealen Punkt zu adjungieren. Wir werden darauf zurückkommen, wenn wir das Unendliche in der Natur besprechen. Die Methode der idealen Elemente findet in der Mathematik sehr ausgedehnte Anwendung. Ich möchte Ihnen ein besonders schönes und tiefgreifendes Beispiel aus der Arithmetik anführen, wo ja im Grunde auch schon die negativen Zahlen und die von mir gebrauchten imaginären Zahlen u + iv Beispiele sind.
24
Ideale Teiler in der Zahlentheorie
25
30
35
Die am tiefsten greifende Anwendung des Prinzips der idealen Elemente ist aber die Theorie der idealen Teiler, und an diesem Beispiel tritt auch wieder der Einschlag in Erscheinung, den so oft das mathematische Ideal zum Unendlichen aufweist. Wir haben bei den gewöhnlichen Zahlen den Satz von der eindeutigen Zerlegbarkeit in | Primzahlen, den ich als Fundamentalsatz bezeichnete und auf die komplexen Zahlen u + iv übertrug. In der Tat bildet er einen roten Faden, der sich durch die ganze Arithmetik zieht, aber diese Rolle spielt er nur vermöge der Methode der idealen Elemente. Diese Uebertragung des Zerlegungssatzes auf andere Bereiche gelingt nämlich nicht immer so einfach. Betrachten wir z. B. die Zahlen von der Form √ a + b −5, wo √wieder a und b ganze rationale Zahlen sein sollen, und die Rolle von i durch −5 gespielt wird. Unter diesen Zahlen haben nur 1 und −1 die Eigenschaften der Einheiten.
25
686
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
Definiert man in diesem Bereich nun wieder die unzerlegbaren Zahlen als Primzahlen, so ist die Zerlegung in Primfaktoren zunächst nicht eindeutig, z. B. gibt es für die Zahl 6 schon zwei verschiedene Zerlegungen, nämlich: 6 = 2·3 und √ √ 6 = (1 + −5)(1 − −5). √ √ (Dass die Zahlen 2, 3, 1+ −5, 1− −5 unzerlegbar sind, ist leicht zu beweisen. Gäbe es z. B. für 2 eine Zerlegung √ √ 2 = (a + b −5)(c + d −5) so würde folgen √ √ 2 = (a − b −5)(c − d −5) 2
26
2
2
1296 = 64 = 16 · 81, wo 6, 16, 56, 21, 81 im Gebiete der als bekannt angenommenen Zahlen unzerlegbar sind. Um hier nun die Eindeutigkeit der Zerlegung zu erhalten, müsste man 20 ideale 20 Zahlen 21 einführen, die den gewöhnlichen Teilern 2, 3, . . . entsprechen — worauf jedoch nicht näher eingegangen werden soll. 21 Gefahren des Unendlichen Wir haben das Unendliche bisher nur von der guten Seite kennen gelernt. Es bot uns nämlich 1. die erfreuliche Möglichkeit, unendlich viele Aussagen durch eine einzige Formel mit Unbestimmten ausdrücken zu können 20–20 Both 21–21 Both
10
2
4 = (a + 5b )(c + 5d ), und diese Gleichung√könnte nur bestehen, wenn eine der Zahlen b oder d gleich √ Null ist, d. h. a + b −5, oder c + d −5 gleich ±1 wäre.) Nun könnte man sich mit der Feststellung dieser Tatsache begnügen und auf die Eindeutigkeit der Zerlegung in Primfaktoren verzichten. Dadurch würde aber bei den höheren zahlentheoretischen | Untersuchungen, z. B. in der Theorie der Kreisteilung, alles sehr unübersichtlich werden. Es war daher eine sehr wichtige Entdeckung, als Kummer bemerkte, dass die Eindeutigkeit der Primfaktoren-Zerlegung für die (endlichen) algebraischen Zahlkörper sich durch die Einführung idealer Primteiler aufrecht erhalten lässt. Um die Möglichkeit dieser Einführung verständlich zu machen, wollen wir eine analoge Betrachtung in dem Gebiet der ganzen rationalen Zahlen anführen. Angenommen, es wären uns aus irgendeinem Grunde nur diejenigen Zahlen bekannt, die im Dezimalsystem geschrieben, auf 1 oder 6 endigen, also 1, 6, 11, 16, 21, 26 . . . während alle anderen Zahlen für uns nicht existierten. Dann würde die Zerlegung der Zahlen in unzerlegbare Faktoren nicht eindeutig sein, wie folgende Beispiele beweisen: 336 = 6 · 56 = 16 · 21
27
5
versions: Changed by Hilbert (pencil) from: andere versions: Added by Hilbert (pencil).
15
20
25
30
35
‘Über das Unendliche’ (1924/25)
5
10
687
und 2. durch Einführung idealer Elemente die Struktur mathematischer Sätze zu vereinfachen und ihre Bedeutung zu vertiefen. Wir wollen nun auch die Kehrseite beim Gebrauch des Unendlichen kennen lernen und zwar zuerst noch an einem sehr harmlosen geometrischen Beispiel, dem sogenannten isoperimetrischen Problem in der Ebene. Dasselbe lautet: man soll unter allen möglichen geschlossenen Kurven von gegebenem Umfang diejenige finden, die den grössten Flächeninhalt einschliesst. Man nennt es auch das Problem der Dido; denn diese hatte zur Realisierung ihrer Gründungspläne die Aufgabe, mit einem Kuhhautriemen von gegebener Länge ein möglichst grosses Stück Land zu umschliessen. Die Lösung ist, wie zu vermuten, der Kreis und es handelt sich darum, dies zu beweisen. Steiners Beweis für die Maximaleigenschaft des Kreises
15
20
25
30
35
40
Der berühmte Geometer Steiner gab seinerzeit einen Beweis, der als besonderes Geniestück 22 gilt 22 . Er beruht auf folgender Ueberlegung: Angenommen, wir hätten die Kurve mit dem grössten Inhalt von dem gegebenen Umfang 1 vor uns. Auf derselben nehmen wir dann einen Punkt A, halbieren alsdann den Umfang in B, sodass die beiden Bögen AB einander gleich sind. Wäre nun eines der Flächenstücke auf der C einen Seite des Durchmessers grösser als auf der andern, so brauchte man dasselbe nur an | dem B Durchmesser zu spiegeln, um ein grösseres FläA chenstück mit dem gleichen Umfang zu erhalten. Es müssen also beide Teile einander flächengleich sein. Nun behaupte ich, unsere Kurve ist notwendig ein Kreis. Denn sonst müsste irgendein einbeschriebenes Dreieck z. B. ABC über dem Durchmesser AB vorhanden sein, dessen Winkel ACB an der Spitze von einem Rechten verschieden ist. Dann trage ich aber die beiden Segmente über AC und CB an einem rechten Winkel ab, spiegele die ganze Figur an der Hypothenuse des so entstehenden Dreiecks und habe dann, da das rechtwinklige Dreieck von allen Dreiecken, deren Seiten ebenso lang wie die Katheten sind, den grössten Inhalt hat, eine Figur mit dem gleichen Umfang 1, aber grösserem Inhalt. Ich kann also zu jedem Flächenstück, das kein Kreis ist, ein grösseres mit gleichem Umfang finden. Aber trotzdem ist das isoperimetrische Problem damit noch keineswegs gelöst, denn es ist noch nicht bewiesen, dass der Kreis nun wirklich diese Maximaleigenschaft besitzt. Vielmehr enthält dieser geniale Steinersche Beweis einen Fehlschluss, der nur deshalb lange Zeit nicht bemerkt wurde, weil die Aussage des zu beweisenden Satzes richtig ist und uns sehr plausibel erscheint. Was in diesem Beweise falsch ist, erkennen wir sofort auf folgende drastische Weise: Wir wollen durch dieselbe Schlussweise zeigen, dass 1 die grösste ganze Zahl ist. Wir geben ein Verfahren an, das zu jeder ganzen Zahl eine grössere zu konstruieren gestattet, nämlich die Bildung der Quadratzahl, z. B. 5 · 5 = 25 22–22 Version
B: Changed in ink by unknown hand to: galt
28
688
29
30
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
ist grösser als 5. Das Verfahren versagt einzig bei der Zahl 1. Also ist 1 die grösste ganze Zahl. Der Beweis wäre in beiden Fällen völlig korrekt, wenn es ein Ding wie eine Figur von grösstem Inhalt bei gegebenem Umfang und grösste ganze Zahl gäbe, d. h. die Steinersche Schluss|weise ist richtig, sobald der Existenzbeweis geführt ist. Unter unendlich vielen Zahlen braucht es eben keine grösste oder kleinste zu geben, wie z. B. in der Zahlenfolge 1 1 1 1, , , , . . . 2 3 4 Der Fehlschluss ist so einschneidend, dass der Steinersche Beweis irreparabel geblieben ist, und man ganz andere Wege hat aufsuchen müssen, um die Maximaleigenschaft des Kreises nachzuweisen. Und so einfach und offenbar die Tatsache ist, dass unter unendlich vielen Zahlen keine die kleinste oder die grösste zu sein braucht, so ist doch dieser Schluss von den bedeutendsten Mathematikern gemacht worden (Cauchys Wurzelexistenzbeweis und Riemanns Abelsche Funktionen). Um das Vorkommen dieses Fehlschlusses und seine späte Entdeckung durch Weierstrass zu verstehen, müssen wir bedenken, dass es damals noch die Zeit der reichsten Auswirkung der Erfindung der Infinitesimalrechnung war. Die Erfolge der Infinitesimalrechnung waren so überreich und mannigfach; die Kühnheit der Schlussweisen bewährte sich so sehr und die gegenseitige Uebereinstimmung der Resultate war so schlagend, dass man zunächst weniger Wert auf scharfe Kontrolle oder Kritik legte. Die durch die Infinitesimalrechnung erzielten Resultate beruhten nun zum grossen Teil auf dem Operieren mit mathematischen Gebilden von unendlich vielen Elementen und es war sehr naheliegend, dass man zunächst unendlich mit grosser Zahl identifizierte und somit die Eigenschaften und Regeln für das Endliche einfach auf das Unendliche übertrug. Dazu gehört aber zu allererst die Existenz des Maximums und Minimums. Unter einer noch so umfassenden Gruppe von Menschen z. B. wird es immer einen oder mehrere älteste und jüngste geben. Ein geometrisches Gegenbei 23 |spiel dagegen ist die Gesamtheit der Kurven, die 2 Punkte einer Geraden verbinden, und in den Punkten selber auf der Geraden senkrecht stehen. Unter diesen gibt es offenbar keine kleinster Bogenlänge, da die Gerade selbst nicht mit zu der Gesamtheit gehört. Also eine für eine endliche Anzahl von Elementen gültige Ueberlegung oder Schlussweise darf nicht ohne weiteres auf das Unendliche übertragen werden. Darauf beruht der Fehlschluss des Eleaten Zenon, der die Unmöglichkeit der Bewegung eines fliegenden Pfeiles durch den Hinweis dartun wollte, dass er in jedem Augenblick ruht. Dieser Schluss wäre aber nur dann zutreffend, wenn es in der Zeit nur eine endliche Anzahl von Zeitelementen gäbe.
23 Version A: Added by Hilbert (pencil) at the bottom of the page (the last word is truncated): Die Vertauschung der Reihenfolge der Summanden bez. Faktoren nicht erlaubt! Teil < Ganze nicht garantiert
5
10
15
20
25
30
35
‘Über das Unendliche’ (1924/25)
689
Summation unendlicher Reihen
5
10
15
20
25
30
Ein anderes Beispiel, das zeigt, wie vorsichtig man bei der Behandlung des Unendlichen zu verfahren hat, bietet die Summation von Reihen. Eine Summe von unendlich vielen Gliedern braucht nicht endlich zu sein, wie es bei den endlichen Summen stets der Fall ist. Beispielsweise divergieren die Summen 1 + 1 + 1... 1 1 1 1 1 1 1 1 + + + + + + + + ... 2 3 4 5 6 7 8 Die Divergenz der letzten Reihe sieht man sofort durch Vergleichung mit folgender Reihe, deren jedes Glied kleiner oder gleich unserer obigen ist; 1 1 1 1 1 1 1 1 1 1 0 + + { + } + { + + + } + ... = + + + ... 2 4 4 8 8 8 8 2 2 2 und die divergent ist. Aber auch schon die Summe der reziproken Primzahlen 1 1 1 1 1 1 + + + + + + ... 2 3 5 7 11 13 divergiert. Dieser Satz geht weit über unseren früheren Satz von der unendlichen Anzahl der Primzahlen hinaus, denn es kann auch | sehr wohl die Summation von unendlich vielen Gliedern eine endliche Zahl ergeben. Das sehen wir schon an dem einfachen Beispiel der fortgesetzten Halbierung des Ganzen 24 1 1 1 1 1 + + + + + ... 2 4 8 16 32 Vom Rest bleibt noch immer die Hälfte übrig, und jene Summe nähert sich daher dem Ganzen 1. Es ist also bei dem Paradoxon von dem Achilles, der die Schildkröte nicht einholen kann, weil er immer erst die Hälfte der Entfernung zurücklegen muss, einerseits zwar die Möglichkeit der fortgesetzten Halbierung ein richtiger Gedanke, aber der Fehlschluss beruht in der Annahme, dass die Summe der Strecken, weil ihrer unendlich viele sind, auch unendlich sein müsste, was nicht der Fall ist. Ein weiteres Beispiel einer endlichen Summe von unendlich vielen Gliedern ist: 1 1 1 1 1 S = 1 − + − + − + ... 2 3 4 5 6 Fassen wir nämlich auf zwei verschiedenen Weisen die Glieder zusammen: 1 1 1 1 1 S = (1 − ) + ( − ) + ( − ) + . . . 2 3 4 5 6 1 1 1 1 1 1 S = 1 − ( − ) − ( − ) − ( − ) − ... 2 3 4 5 6 7 so sehen wir, dass einmal immer etwas zu der Zahl 12 hinzugefügt und das andere mal immer etwas von 1 abgezogen wird. Die Summe muss daher endlich sein und zwischen 12 und 1 liegen. Unsere Reihe lässt sich auch schreiben: 1 1 1 S= + + + ... 1·2 3·4 5·6 24 Version
B: Added in ink: 1
31
690
32
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
Daher muss auch die Summe: 1 1 1 1 + 2 + 2 + 2 + ... 2 2 4 6 8 und also auch die Summe der reziproken Quadrate endlich sein: 1 1 1 1 + 2 + 2 + 2 + ... 2 3 4 Die Primzahlen liegen also viel dichter als die Quadratzahlen. Mit Hilfe dieser Reihe können wir leicht an einem Beispiel erkennen, dass ein ebenes Flächenstück einen endlichen Inhalt haben kann, obwohl es sich ins Unendliche
5
y
y=
1 x2
1 0
1 4
1
1 9
2
1 16
x
4
3
erstreckt. Nehmen wir z. B. das schraffierte Flächenstück in nebenstehender Zeichnung. Es ist sicher kleiner als das durch die punktierte Treppenkurve und die x-Achse begrenzte, das den endlichen Inhalt: 1 1 1 + ... 1+ + + 4 9 16 besitzt. Ein weiterer sehr wichtiger Punkt, in dem sich endliche und unendliche Summen unterscheiden, ist ihr Verhalten gegenüber einer Vertauschung der Reihenfolge der Summanden. Bei unendlichen Summen hängt nämlich häufig das Resultat wesentlich von dieser Reihenfolge ab. Nehmen wir z. B. unsere vorige Summe 1 1 1 1 1 S = 1 − + − + − + ... 2 3 4 5 6 und ordnen sie wie folgt um: 1 1 1 1 1 1 1 1 S 25 = (1 + − ) + ( + − ) + ( + − ) + ... 3 2 5 7 4 9 11 6 und vergleichen damit 1 1 1 1 1 1 1 1 1 1 1 + − ) + ... S = (1 − + − ) + ( − + − ) + ( − 2 3 4 5 6 7 8 9 10 11 12 so erhalten wir 1 1 1 1 1 1 1 S − S = ( − ) + ( − ) + ( − ) + . . . 26 = S 2 4 6 8 10 12 2 3 S = S, 2 25 Version
A: Additional line: = 1 +
1 3
−
1 2
+
1 5
+
1 7
−
1 4
+
1 9
+
1 11
−
1 6
+ ...
10
15
20
25
‘Über das Unendliche’ (1924/25)
5
691
also etwas Verschiedenes. Neben unendlichen Summen werden auch vielfach andere Darstellungsarten mit unendlich vielen Gliedern angewandt, z. B. unendliche Produkte wie 2·2·4·4·6·6·8·8... π = 2 1 · 1 · 3 · 3 · 5 · 5 · 7 ·( 7... ' ' ) ) 2 1 1 1 1 *1 1 1 1 1 = + · + + ... π 2 2 2 2 2 2 2 2 2 oder auch unendliche Kettenbrüche wie √ 1 5−1 =1+ 2 1 + 1+ 1 1 1+
√ 2=1+ π = 4 1+
1 1+...
1 2+
1 2+
2+
1 1 2+ 1 ...
1 1 2+
2+
π =1+ 2 1+ 10
33
9 25 49 2+81
2+
1 1·2
27
2·3 1+ 1+ 3·4 1+ 4·5 ...
Aber nicht nur für Zahlen, sondern auch für Funktionen gibt es solche Darstellungen, wie z. B. den Kettenbruch tang ϑ 28 = 1− ϑ ϑ 3−
5−
ϑ ϑ 7− ϑ ...
mit dessen Hilfe man z. B. die Irrationalität von π beweisen kann. Analysis
15
Nach der Geometrie und Arithmetik haben wir uns jetzt der Analysis zuzuwenden, was umso nötiger ist, als wir ohne sie auch gewisse einfache und prinzipiell sehr wichtige Einsichten in das Vorkommen des Unendlichen auf arithmetischem und auf geometrischem Gebiete garnicht gewinnen können. Irrationalzahlen
20
Nun, der wichtigste Begriff der Analysis ist der der beliebigen reellen Zahl. Wie kommen wir zu ihm? Er ist nichts anderes als die Anwendung der Methode der idealen Elemente! Wenn wir eine bestimmte rationale Zahl, z. B. 32 ins A: Added in ink: = 12 {1 − 12 + 13 − 14 + . . . } A: The order of the formulas is different from that in Version B; there, the √ formula for 2 occurs last. 28 Version A: Added: = sin ș cos ș 26 Version 27 Version
34
692
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
Auge fassen, so werden alle übrigen rationalen Zahlen in 2 Bereiche getrennt, den der kleineren k und den der grösseren g. Natürlich ist jedes k < als jedes g. Die rationale Zahl bewirkt und vermittelt diese Teilung. Wir fragen: Ist es möglich, eine Teilung in 2 Bereiche dieser Beschaffenheit k < g auch auf andere Weise herzustellen, sodass nicht eine rationale Zahl ρ vorhanden ist mit k < ρ, g > ρ. Die Antwort lautet: Ja, das ist auch möglich, z. B. für: k 2 < 2, g 2 > 2. Jedesmal, wenn ein solcher Schnitt vorliegt, so fingieren wir als dessen Träger ein neues ideales Element: eine Irrationalzahl α. Eine Irrationalzahl α heisst kleiner als eine Zahl β, wenn eine rationale Zahl ρ existiert, so dass α < ρ und ρ < β ist etc.
5
10
Euklids Begründung der Proportionenlehre
35
36
Die reelle Zahl ist der wichtigste Baustein für die heutige Analysis, die ohne sie garnicht möglich wäre. Die älteste Anwendung ist aber, wenn auch nicht mit vollem Bewusstsein, in der elementaren Geometrie von Euklid gemacht worden. Wegen der sehr merkwürdigen und erst in neuerer Zeit aufgeklärten Verhältnisse müssen wir hierauf näher eingehen. Die Sachlage ist einfach, aber selbst in sol|chen Kreisen nicht genügend bekannt, die der Mathematik näherstehen: Der Gebrauch, den Euklid von der Irrationalzahl macht, besteht in der Begründung der Proportionenlehre, d. h. wesentlich des Satzes: Wenn in einem Dreieck eine Parallele zur Grundlinie gezogen ist, so sind die betr. Abschnitte der beiden Seiten zu einander proportional. 29 Wenn das Verhälta c nis a : b rational z. B. = 2 : 1 ist, a:b=c:d so ist die Richtigkeit offenbar. Wir T S brauchen nur die punktierten Paralb d lelen zu ziehen und können sie mit Hilfe kongruenter Dreiecke dann ohne weiteres verifizieren. Ist das Verhältnis a : b aber irrational, so beruht die Schlussweise Euklids darauf, dass das Verhältnis a : b eine irrationale Zahl darstellt und dann c : d, weil es dieselbe Teilung unter den rationalen Zahlen hervorruft, dieser Irrationalzahl gleich sein muss. Aber Euklid hat dabei übersehen, dass der Punkt S zwar eine Teilung der rationalen Verhältnisse in kleinere k und grössere g vornimmt, dass aber dieser Schnitt nicht notwendig umgekehrt den Punkt S eindeutig zu bestimmen brauchte, — denn wir dürfen nur die Reihenfolge, das Zwischeneinanderliegen unmittelbar der Anschauung entnehmen — dass an sich vielmehr noch andere Punkte S , S dieselbe Teilung in einen kleineren und einen grösseren Bereich bewirken könnte: daher ist durch das irrationale Verhältnis, zumal ja für S die andere Seite des Dreiecks das Gleiche gilt, TT S T die Gerade ST garnicht eindeutig bestimmt. Ein S | von S verschiedener Punkt S ist offenbar dann 29 Version
B: Diagram labels are missing.
15
20
25
30
35
40
‘Über das Unendliche’ (1924/25)
5
10
15
20
693
und nur dann möglich, wenn zwischen S und S kein Punkt mit rationalem Verhältnis zu liegen kommt. Die Euklidische Schluss- und Anschauungsweise wird also dann gültig, wenn man diese Möglichkeit ausschliesst, was uns zwar ganz plausibel scheint, aber hier, wo Euklid die logischen Grundlagen erstrebt, ein besonderes Axiom erfordert — und dies Axiom war schon im Altertum bekannt und ist dasjenige, das heute den Namen „Archimedisches Axiom“ trägt. Obwohl dasselbe gewöhnlich anders formuliert wird, läuft es auf die Forderung hinaus: einem irrationalen 30 Verhältnis a : b auf einer Strecke soll höchstens ein Punkt S entsprechen. Diese Formulierung ist dann ganz analog dem berühmten Parallelenaxiom, dessen Unentbehrlichkeit Euklid so scharfsinnig erkannt hat und welches lautet: Durch einen Punkt ausserhalb einer Geraden gibt es höchstens eine Gerade in der nämlichen Ebene, die die gegebene Gerade nicht schneidet. Ein Flecken in der Sonne Euklids ist es, dass er unterliess, jenes Axiom zu nennen. Wenn aber auch die Euklidische Begründung der Proportionenlehre nicht Stich hält, so könnte doch eine andere Begründung möglich sein, ohne Hinzunahme eines solchen neuen Axiomes wie es das Archimedische ist. Und Euklid hatte in der Tat zur Begründung seiner Geometrie das Archimedische Axiom nicht nötig. Er hat sogar zu einer solchen anderen Begründungsmöglichkeit selbst den Weg bereitet, nämlich durch seine Lehre von den ebenen Flächeninhalten. Durch letztere liesse sich in der Tat die Proportionenlehre begründen, indem man a : b = c : d festsetzt, wenn je 2 Paar Dreiecke auf a, b einerseits mit derselben Spitze und c, d andererseits errichtet werden können, sodass a mit c und b mit d flächengleich sind. 37
a a a 25
30
35
b b
c
b c
c
d d
d
Flächengleich sind bei Euklid ebene Figuren, wenn sie bez. aus kongruenten Teilen bestehen oder durch Hinzufügung solcher zu solchen ergänzt werden können. Man sieht sofort, dass hiernach die Seiten eines Dreiecks durch eine Parallele zur Grundlinie in der Tat stets proportional geschnitten werden. Alles wäre in bester Ordnung; nur müssen wir zusehen, wie es mit der Begründung der Lehre von den Flächeninhalten bei Euklid bestellt ist. Zwar ist der bekannte Euklidische Beweis, dass 2 Dreiecke auf derselben Basis und von gleicher Höhe inhaltsgleich sind, einwandfrei. Ebenso notwendig wird aber auch seine Umkehrung gebraucht, die Euklid in richtiger Erkenntnis auch ausführlich zu beweisen sucht, dass nämlich bei Dreiecken gleichen Inhalts und gleicher Basis auch die Höhen gleich sein müssen. Der Euklidische Beweis ist ein
30 Version
B: Added by Hilbert: d. h. durch die Dedekindsche Schnitt-methode gegebenen
694
Chapter 4
indirekter. 31 Nehmen wir zunächst an, die Höhen seien verschieden, so ziehen wir D D C durch die Spitze des Dreiecks mit kleinerer Höhe die Parallele zur Grundlinie und finden nun ein Dreieck ADB, A A B B das einen Teil des ursprünglichen Dreiecks ABC darstellt und nach Voraussetzung mit ihm flächengleich sein soll. Das sei aber, so schliesst Euklid, unmöglich. Dieser Schluss ist aber zunächst nicht zwingend. Der Begriff der Flächengleichheit ist ja schon festgelegt. Jede neue Aussage über ihn müsste also bewiesen werden; das wäre hier der Fall, wenn der Satz gelte: Eine Figur, z. B. ein Quadrat kann niemals so in Teilstücke zerlegt werden, dass diese in anderer Lagerung bloss einen | Teil des Quadrates ausfüllen, sodass ein Flächenteil des Quadrats leer bleibt. Euklid sagt ja zwar, — als schlüge doch sein wissenschaftliches Gewissen — das könne nicht sein, weil der Teil stets kleiner als das Ganze sein müsse. Aber abgesehen davon, dass dies, wie wir später erkennen werden, garnicht immer der Fall ist, vielmehr dieser Satz gerade zu denen gehört, die nicht vom Endlichen auf das Unendliche übertragbar sind, wäre seine Anwendung hier in unserer Lage nur eine hinwegtäuschende irreführende Redensart. Dieser offenkundige Verstoss gegen die Logik ist durch die Jahrtausende hindurch, während denen Euklid das gelesenste mathematische Buch war, nicht bemerkt worden! Nun könnte man sich wieder damit helfen, jene Behauptung von der Unmöglichkeit einer solchen Zerlegung eines Quadrats als Axiom zu erklären. Dies hat man in der Tat gemacht; aber das ist zunächst auch verkehrt; denn zuvor muss doch untersucht werden, ob jene Behauptung nicht bewiesen werden kann. Dieser Beweis, wenn er möglich ist, kann sicher nicht ganz leicht und einfach sein; denn er ist ja eine Unmöglichkeitsbehauptung, die also unendlich viele Aussagen enthält. Dennoch gelingt der Beweis in der Tat und zwar ganz im Sinne von Euklid und mit dessen elementargeometrischen Hilfsmitteln (Kongruenzsätzen); nur würde ihn anzuführen, hier zu weitläufig sein. Damit ist Flächenlehre und Proportionslehre ohne irgendein neues geometrisches Axiom, insbesondere ohne das Archimedische Axiom im Sinne Euklids begründet. Das Archimedische Axiom selbst zwar ist nicht beweisbar, sondern ein echtes Axiom. Es gibt eine Nicht-Archimedische Geome|trie, wie es eine Nicht-Euklidische Geometrie gibt, und wie die letztere beweist, dass das Euklidische Axiom von den anderen unabhängig ist, so beweist die erstere dasselbe für das Archimedische Axiom. C
38
39
Lectures on the Infinite (1924/25, 1931, 1933)
31 Version
C
B: The diagram to the right is missing.
5
10
15
20
25
30
35
40
‘Über das Unendliche’ (1924/25)
5
10
15
20
25
30
35
40
45
695
Fassen wir noch einmal unseren Gedankengang zusammen: Zuerst im Ursprung trat uns das Unendliche als unendliche Anzahl entgegen: wir sahen: eine Formel enthielt unendlich viele Aussagen. Ein wesentlich anderer Gesichtspunkt war der der idealen Elemente; ein einfaches Beispiel die sogenannten unendlich fernen Punkte und die unendlich ferne Gerade der Euklidischen Ebene. Die wichtigste weitreichendste Anwendung aber für die Methode der idealen Elemente ist die Schaffung des Begriffes der Irrationalzahl. Und zuletzt hatten wir die Bedeutung untersucht, die dem Begriff der Irrationalzahl in der Geometrie zukommt. Diese Untersuchungen sind nicht ganz leicht verständlich. Ihre Pointe kann ich auch so formulieren: Wenn ich eine Strecke AB halbiere in B , und AB wiederum in B , und so fort, so folgt aus den Euklidischen Voraussetzungen allein auf rein logische Art nicht, dass hinter A keine Lücke bleibt. Es wäB A B B B re ohne Verletzung der Axiome der Anordnung und Kongruenz möglich, dass die Punkte B , B . . . in ein hinter A liegendes Intervall niemals eintreten. Freilich unserer gewohnten anschaulichen geometrischen Vorstellungen gemäss ist eine solche Lücke nicht vorhanden. Um diese auszufüllen, ist also ein logisches Aequivalent nötig: das Archimedische Axiom. Letzteres ist aber nicht nötig zur Begründung der Proportionenlehre und der Flächenlehre von Euklid. Die Einführung der Irrationalzahl ist aber nur der erste Schritt, die Einleitung zu dem umfangreichen und ergiebigen Gebrauch, den die Analysis von dem Unendlichen macht. Die gesamte Infinitesimalrechnung kann als eine Anweisung zum richtigen Gebrauch des Unendlichen angesehen werden. Es sind die gewaltigen Disziplinen der Analysis: insbesondere Funktionentheorie, Differentialgleichungen, Variationsrechnung, in denen sich das Operieren mit dem Unendlichen zu höchster Vollendung entwickelt und zugleich die glänzendsten Triumphe feiert. Es handelt sich da ununterbrochen um ein Nebenund Uebereinandertürmen unendlicher Prozesse, um ein Gegen- und Durcheinandergreifen unendlicher Operationen, und die moderne Analysis ist es eben, die uns die volle Herrschaft über alle dazu nötigen Regeln liefert. Dabei ist es nun sehr merkwürdig, dass die Analysis gerade von aussen her zu immer feineren und raffinierteren Ausgestaltung des Arbeitens mit Unendlichkeitsbegriffen gedrängt wird. Ja gerade solche rein mathematischen Disziplinen, von denen man es ursprünglich nicht erwarten sollte, drängen die Analysis immer weiter, nämlich Arithmetik und Geometrie. Die reine Zahlentheorie hat es doch zunächst nur mit den diskreten endlichen ganzen Zahlen zu tun; es hat sich aber herausgestellt, dass schon das naheliegende Primzahlproblem, die Verteilung der Primzahlen zu bestimmen, die allersubtilsten funktionentheoretischen Hilfsmittel erfordert. Ebenso die Geometrie, die doch ursprünglich nur mit den endlichen rein anschaulichen Gegenständen zu tun hat. Dann aber endlich stellt die moderne theoretische Physik, insbesondere Mechanik und Elektrodynamik solche Anforderungen an die Analysis des Unendlichen, dass die Mathematiker kaum folgen können und je|denfalls heute von einer völligen Verarbeitung und Beherrschung des ihnen von der Physik gebotenen Stoffes auch noch weit entfernt sind.
40
41
696
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
Trotzdem gelangen wir durch die Analysis allein noch nicht zu der tiefsten Einsicht in das Wesen des Unendlichen. Diese wird uns erst durch eine Disziplin vermittelt, die der allgemeinen philosophischen Betrachtungsweise näher steht und die überhaupt die Auflösung des ganzen Problems bezweckt, nämlich die Mengenlehre. Bevor wir zu dieser übergehen, ist es jedoch nötig, uns mit dem Unendlichen in der Natur näher zu beschäftigen.
5
II. Das Unendliche in der Natur Schon die eben gemachten Ausführungen lassen erkennen, dass ebenso wie in der Mathematik das Unendliche auch in der Physik und überhaupt in der ganzen Naturwissenschaft eine ausserordentliche Rolle spielt. Die fundamentalsten Begriffe bedürfen zu ihrer Erklärung und Erfassung der Hinzuziehung des Unendlichen. Ja, man kann beinahe sagen, dass der Zeitpunkt der Entstehung der wissenschaftlichen Physik eben durch die Einführung des Unendlichkeitsbegriffes gekennzeichnet ist. Denn erst, nachdem die ersten und einfachsten Grundbegriffe, wie Geschwindigkeit und Beschleunigung vermittels der Infinitesimalrechnung scharf definiert waren, konnte sich eine solche entwickeln. Aber dieses Auftreten des Unendlichen in der Physik ist doch nur formaler Art, indem die Infinitesimalrechnung ein notwendiges Instrument für alle Naturwissenschaft abgibt. Wir wollen nun aber feststellen, 32 welche inhaltliche Bedeutung dem Unendlichen in der Wirklichkeit zukommt und was wir aus der Physik hierüber erfahren.
10
15
20
Die Welt im Kleinen
42
Der erste naive Eindruck von dem Naturgeschehen und der Materie ist der des Kontinuierlichen, des Stetigen. Haben wir ein |33 Stück Metall oder ein abgegrenztes Volumen eines Gases, so sehen diese völlig homogen aus. Es drängt sich uns die Vorstellung auf, dass sie unbegrenzt teilbar seien, dass ein noch so kleines Stück von ihnen immer wieder dieselben Eigenschaften habe. Dies ist die Grundvorstellung der Kontinuumsphysik und als solche von der grössten Bedeutung gewesen. Aber das Experiment führte gerade zu dem überraschenden und völlig unvorhergesehenen gegenteiligen Resultat, nämlich schliesslich zu einer völligen Ablehnung jener Kontinuitätsvorstellung. Ueberall, wo man die Methoden der Forschung in der Physik der Materie genügend verfeinerte, stiess man auf Grenzen für die Teilbarkeit, die nicht an der Unzulänglichkeit der Hilfsmittel, sondern an der Natur der Sache liegen, sodass man geradezu 34 die Tendenz der modernen Wissenschaft als eine →
32 Version
B: Hilbert has added in the left-hand margin: A: Added by Hilbert (pencil): Wir wollen uns in Kürze vergegenwärtigen, welche inhaltliche Bedeutung dem ∞-en in der Wirklichkeit zukommt und da sehen wir zunächst, was wir aus der Physik hierüber erfahren. Der erste naive Eindruck von dem Naturgeschehen u. der Materie ist der des Stetigen, des Kontinuirlichen 34–34 Version B: Enclosed by Hilbert in parentheses. 33 Version
25
30
35
‘Über das Unendliche’ (1924/25)
5
697
Emanzipation von dem Unendlichen auffassen könnte und dass man 34 jetzt anstelle des alten Leitsatzes: „natura non facit saltus“ beinahe mit Sicherheit das Gegenteil „die Natur macht Sprünge“ behaupten kann. Auf diese für unsere Fragestellung offenbar ausserordentlich wichtigen Ergebnisse müssen wir etwas näher eingehen. Atomistik
15
20
25
30
35
35–35 Version
B: Enclosed by Hilbert in parentheses. Version B, Hilbert has altered this to: Diese Zahl ist zwar sehr klein, aber immer noch eine endliche, fest definierte Grösse. 37 Version B: Hilbert has added in the left-hand margin: 38 Version B: Added by Hilbert and then deleted: Von hier an nur undulating line 39–39 Version B: Enclosed by Hilbert in parentheses. 40–40 Version B: Underlined by Hilbert with an undulating line. 41–41 Version B: Underlined by Hilbert with an undulating line. 36–36 In
→
10
Wie Chemie und Physik gelehrt haben, ist alle Materie aus kleinen Bausteinen, den Atomen zusammengesetzt, von denen es nur eine kleine Zahl verschiedenartiger gibt, durch deren Kombination und Verbindung die ganze Mannigfaltigkeit der makroskopischen Stoffe entsteht. Wie diese zusammengesetzt sind, ist in den einzelnen Aggregatszuständen verschieden: im Gas, in Flüssigkeit, im Krystall-Gitter. Die Atome selbst sind jedoch unveränderlich. Die grobe Vortäuschung der Homogenität der Materie, d. h. eben des Kontinuums, | entsteht nur durch die ausserordentliche Kleinheit der Atome: 35 Ein Wasserstoffatom hat z. B. ein Gewicht von m = 1, 65 · 10−24 g, also in 1 einem Gramm sind m = 0, 6 · 1024 Atome enthalten. 35 Der Durchmesser des Wasserstoffatoms ist 0, 5 · 10−8 cm. 36 Diese Zahlen sind zwar sehr klein, aber immer noch endliche, fest definierte Grössen. 36 Entsprechend dieser schon 100 Jahre alten Anschauung der Chemiker ist also die Homogenität der Materie preiszugeben: ein Quantum Wasser z. B. kann nicht unbegrenzt geteilt werden, sodass jede Hälfte Wasser bleibt: es gibt nicht eine kleinere Quantität Wasser als etwa 10−23 ccm, wie ungefähr das Volumen eines Wasser-Moleküls beträgt. 37, 38 Doch um unsere Behauptung von der Realität der Atome zu begründen, müssen wir die Erfahrungstatsachen, die zu ihr führen, herausziehen. Hier steht an oberster Stelle 39 die Chemie mit dem Gesetz der konstanten Proportionen, dass bei chemischen Verbindungen die einzelnen Bestandteile nicht in beliebigen, sondern in bestimmten Verhältnissen zusammentreten. Besonders augenfällig und überzeugend ist ferner 39 die sogenannte 40 Brownsche Bewegung 40 ; es ist dies die unter dem Mikroskop sichtbare Bewegung kleiner Teilchen, die man absichtlich zu dem Zweck, z. B. in einer Flüssigkeit verteilt hat. Diese wahrgenommene Bewegung der eingestreuten Teilchen lässt dann augenscheinlich die Bewegung der Moleküle der Flüssigkeit erkennen; denn sie rührt davon her, dass die Moleküle der Flüssigkeit beständig und unregelmässig auf die fremden eingestreuten Teilchen stossen. Die Brownsche Bewegung ist nur 41 ein Beispiel für die „Schwankungserscheinungen“ 41 , deren wir so vie-
43
698
44
45
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
le um uns herum und auch besonders in der neueren physikalischen Forschung begegnen. Die Dich|42 teschwankungen in der Luft, wie sie durch die Bewegung der Moleküle der Luft bedingt sind, sind der Grund für das Leuchten der Atmosphäre und das Blau des Himmels. Bei kontinuierlicher Beschaffenheit der Luft 43 oder bei gleichmässiger Verteilung ihrer Moleküle 43 würde die Atmosphäre sich wie ein durchsichtiger Stoff verhalten; der Himmel würde dann schwarz erscheinen. 42 Dass die Farbe Blau auftritt liegt daran, dass kurzwelliges Licht stärker zerstreut wird als langwelliges. Beim durchgehenden Licht überwiegt umgekehrt das langwellige und hieraus erklärt sich, dass Sonne und Mond am Horizont rötlich leuchten. Diese Zusammenhänge lassen sich auch rechnerisch verfolgen. Die Dichteschwankungen ergeben sich als proportional mit der Quadratwurzel aus der mittleren Dichte der Atmosphäre. Andererseits hat man das Gesetz, nach welchem die Grösse der Zerstreuung von den Schwankungen abhängt. Man kann daher die Dichte der Atmosphäre aus der Intensität des Himmelsblau berechnen. Und die Resultate, die man auf diesem Wege erhält, stimmen auch wirklich mit der Erfahrung überein. Wie gesagt, 44 die neuere Physik ist voll von den mannigfachsten Versuchen, die die Atomistik bestätigen 44 , und es sind im Ganzen eine grosse Zahl von verschiedenen, von einander völlig unabhängigen Methoden zur Messung der Atomkonstanten, ihrer Dimensionen und Entfernungen gefunden worden, die immer wieder dieselben Ergebnisse geliefert haben. Hierin liegt ein so überzeugender Beweis, dass es keines weiteren bedürfte; aber man kann heute sogar schon in einzelnen Fällen 45 die Wirkung eines einzelnen Atoms feststellen 45 . So hat z. B. Wilson, ein amerikanischer Physiker, eine Methode ersonnen, die Bahnen der von radioaktiven Substanzen ausgeschleuderten | Teilchen, die nichts anderes sind wie mit grosser Geschwindigkeit ausgestossene, elektrisch geladene Heliumatome, sichtbar zu machen, und ferner erzeugt das Auftreffen eines solchen Teilchens auf einem geeigneten Schirm einen Lichtblitz, der für sich allein beobachtbar ist. Einwände gegen die Atomistik
5
10
15
20
25
30
46
Trotz dieser überzeugenden und durchschlagenden Beweisführungen waren noch bis in neuere Zeit hinein, ja noch bis heute Leugner und Gegner der Atomistik vorhanden. Ohnehin gehört ja die Geschichte der Atomistik zu den interessantesten Gebieten der menschlichen Entwicklung, da sie zeigt, wie eine Frage, die lange Zeit als eine rein metaphysische galt, und die die scharfsinnigsten Denker ohne wesentlichen Erfolg beschäftigte, durch die Erfahrungswissenschaft endgültig entschieden werden konnte. 46 Es ist daher hier am 42–42 Version
B: Underlined by Hilbert with an undulating line. B: Enclosed by Hilbert in parentheses and stricken through. 44–44 Version B: Underlined by Hilbert with an undulating line and marked off with a line in the left-hand margin. 45–45 Version B: Underlined by Hilbert with an undulating line. 46–46 Version B: Marked off by Hilbert in left-hand margin by an undulating line. 43–43 Version
35
‘Über das Unendliche’ (1924/25)
5
10
15
20
25
30
35
40
45
699
Platze, auf die geschichtliche und philosophische Entwicklung der Atomistik etwas näher einzugehen. Obwohl schon im Altertum der Grundgedanke der Atomistik bekannt war, obwohl schon Demokrit lehrte, dass die letzten Elemente des Wirklichen kleine, unsichtbare, unteilbare und unveränderliche Körperchen, die Atome (d. h. die Unteilbaren) seien: verschieden nach Grösse und Gestalt, aber ohne innere qualitative Verschiedenheit, ferner, dass diese bei allen Vorgängen in der Natur ungeändert bleiben, und dass nur in ihrer Vereinigung und Trennung das Naturgeschehen besteht; dass in ihrer Bewegung alle Prozesse bestehen und diese völlig kausal durch die Gesetze von Druck und Stoss bestimmt sind. Trotzdem und so erstaunlich modern uns auch dieses Demokritische Weltbild anmutet, so ist doch die heutige wissenschaftliche Form der Atomistik und ihr Beweis durch das Expe|riment durchaus eine Errungenschaft der letzten Jahrzehnte. Gerade kurz vorher gegen Ende des vorigen Jahrhunderts war noch merkwürdigerweise die Hauptrichtung eine der Atomistik entgegengesetzte und feindliche. Die Ausbildung der Thermodynamik durch Clausius, Helmholtz, Gibbs und Planck einerseits und die Entwicklung der Elektrodynamik durch Maxwell, und Hertz andererseits verliehen der Physik ein immer mehr phänomenologisches Gepräge. Man sah die Aufgabe der Naturwissenschaft nicht mehr in der Erklärung, sondern in der einfachen Beschreibung der Naturvorgänge, wie es z. B. Kirchhoff in der Vorrede zu seiner Mechanik mit grosser Deutlichkeit aussprach. In Uebertreibung des hierin liegenden Prinzips entstand eine Philosophie des Positivismus, wie sie sich nennt, deren Hauptvertreter Mach und Ostwald sind, die die Atomistik aufs Schärfste bekämpften, und aus deren Reihen noch die letzten heutigen Gegner des Atomismus kommen. Als den gegenwärtig einzig noch in Betracht kommenden Gegnern des Atomismus haben wir uns mit ihnen noch etwas genauer auseinanderzusetzen. 47 Wie sehr damals die der Atomistik feindliche Strömung Oberhand hatte, steht mir persönlich noch in lebhafter Erinnerung: der glänzendste und erfolgreichste Vertreter der Atomistik damals war Boltzmann. Dieser, eine empfindliche und leicht erregbare Natur, war tiefunglücklich über die Gegnerschaft, die ihm in namhaften und massgeblichen Kreisen erwachsen war, und wenn er wohl auf Versammlungen in privaten Gesprächen uns Jüngeren seinen Missmut ausdrückte, weiss ich, dass wir ihm unsere Zuversicht auf den endlichen Sieg der Atomistik aussprachen. 47 Ich meinerseits wunderte mich | wirklich, dass er den Widerspruch so ernst nahm, ich habe niemals begriffen, wie Gelehrte vom Schlage Ostwalds und Machs die Atomenlehre verleugnen konnten. Uebrigens hat, wie bekannt, ein tragisches Schicksal Boltzmann nicht gestattet, zu erleben, wie gerade seine Lebensarbeit es wesentlich gewesen ist, die der Atomistik zum Triumph verholfen hat. Welches sind nun die Argumente und Gedankengänge bei den Gegnern der Atomtheorie? Auf den Erfolgen der Thermodynamik und Elektrodynamik fussend sind sie ausschliesslich in der phänomenologischen Behandlungsweise der Naturerscheinungen befangen. Sie sehen die einzige Aufgabe der Wissenschaft 47–47 Version
B: Marked off by Hilbert in the left-hand margin with an undulating line.
46
47
700
48
49
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
in der Beschreibung der Naturvorgänge; was nicht unmittelbar gesehen und gemessen werden kann, gilt ihnen nicht als real. Dementsprechend wird auch die Existenz der Atome als eine „Hypothese“ abgeleht mit der Begründung, dass die Atome nicht einzeln messbar seien. Ja sogar, wenn solche Messungen gemacht werden könnten, so sagen sie, würde das nichts beweisen. Nehmen wir z. B. an, wir hätten eine diskontinuierliche Verteilung der Materie in unseren Experimenten gefunden, so würden dieselben Experimente auch mit der Annahme vereinbar sein, dass die Verteilung der Materie stetig wäre und der scheinbar diskontinuierlichen Verteilung nur ausserordentlich nahe käme. Mit experimentellen Mitteln sei also die Atomistik nie zu beweisen. J. B. Stallo, ein seinerseits bekannter Gegner der Atomistik, der auch ein verbreitetes Buch gegen die Atomistik geschrieben hatte, verstieg sich sogar zu der Behauptung, „dass die Annahme von Atomen keine Eigenschaft eines Körpers zu erklären vermag, welche nicht vorher den Atomen selbst beigelegt war“ — eine Behauptung, die auch | der grosse Schachweltmeister Emanuel Lasker in seiner „Philosophie des Unvollendbar“ 48 unter Heranziehung physikalischer Autoritäten zu bekräftigen sucht. Der offensichtliche Sachverhalt kann wohl nicht schlimmer auf den Kopf gestellt werden als durch diese Behauptung Stallos; unvorsichtigere Worte gegen die Atomistik konnten garnicht gefunden werden: denken wir nur an die Eigenschaften der verschiedenen Aggregatzustände eines Stoffes, ob derselbe fest, flüssig oder luftförmig ist, wo die Moleküle genau dieselben bleiben und nur ihre Zusammenwirkung eine Verschiedenheit der Konsistenz des Stoffes bedingt, oder auch an die chemischen Verbindungen, wo ganz verschiedene Eigenschaften der Stoffe nur durch die verschiedene Anordnung der Atome bedingt sind. Wie ich schon erwähnte, hat die moderne Naturwissenschaft eine solche Fülle übereinstimmender Tatsachen hinsichtlich der Struktur der Materie geliefert, dass wir über sie weit besser orientiert sind als über das Erdinnere z. B. oder die Vorgänge auf der Sonne. 49 Will man den Atomen die Realität absprechen, so muss man das gleiche für die übrige Aussenwelt, also für das Erdinnere und die Sonne tun. Die Atome existieren sicher genau in demselben Sinne, wie jeder Gegenstand der Aussenwelt, wie dieser Tisch hier, wie unsere Mitmenschen. Leugnet man die Realität der Atome, so muss man auch die Realität der Aussenwelt leugnen. In der Tat erkennt Mach schliesslich nur den Empfindungen Wirklichkeit zu. Die Empfindungen und die Dinge sind für ihn dann ein und dasselbe. 49, 50 Führt man aber diesen Gedanken konsequent durch, so bleibt allein ein steriler Solipsismus übrig, der sich zwar auf keine Weise widerlegen lässt, aber auch keinerlei Erkenntniswert besitzt. Und was den erwähnten Einwand der prinzipiellen Ununterscheidbarkeit von diskon|tinuierlichen und kontinuierlichen Zuständen betrifft, so ist doch immer zu berücksichtigen, was das Wesentliche ausmacht, und in der ganzen gewaltigen Gruppe von Erscheinungen ist eben das Diskontinuierliche in der Materie, die Absolutheit der vorkommenden Grössen und das überall sicht48 Lasker
1919 . B: Marked off by Hilbert in the left-hand margin with an undulating line. 50 Version B: Added by Hilbert: weiter S. 50 unhaltbar
49–49 Version
5
10
15
20
25
30
35
40
‘Über das Unendliche’ (1924/25)
5
10
701
bare Auftreten kleiner ganzer Zahlen das Wesentliche und Charakteristische. Wollte man die Realität dieser Diskontinuitäten anzweifeln, so müsste man mit jedem Naturgesetz das Gleiche tun, da wir diese in der Erfahrung auch niemals exakt bestätigen können. Die Hypothese der Atomistik besitzt also auch denselben Wahrheitsgehalt wie die Hypothese der Existenz von Naturgesetzen, die besagt, dass mit unserer fortschreitenden Erkenntnis wirklich unsere Erfahrungen gegen bestimmte Gesetze konvergieren, und sie nicht immer wieder bei feinerer Beobachtung zerstört werden. Es kann uns wieder niemand widerlegen, wenn wir dies leugnen, aber wir müssen dann aufhören, überhaupt Wissenschaft zu treiben. Atomistik der Elektrizität
15
20
25
30
35
40
Bei der Atomistik der Materie blieb aber die neuere Physik nicht stehen. War diese Atomistik der Materie durch die chemischen Grundtatsachen schon lange für vorurteilsfreie Forscher sicher gestellt, so trat neben sie gegen Ende des vorigen Jahrhunderts die zunächst viel fremdartiger wirkende Atomistik der Elektrizität. Seit der Entdeckung der elektrischen Erscheinungen und besonders nach ihrer genaueren Durchforschung durch Faraday, galt die Elektrizität als das Vorbild eines kontinuierliche wirkenden Agens, wie schon deutlich aus der ihr beigelegten Bezeichnung „Fluidum“ hervorgeht. Es gibt auch kaum Erscheinungen, die derart den Eindruck einer stetigen Wirkung hervorrufen, wie der elektrische Strom und die elektrostatischen Ladungen. Dennoch ist auch dieser Eindruck 51 falsch. Auch die elektrische Ladung ist aufgebaut aus „Elektrizitätsato|men“, den Elektronen, die nicht nur eine ganz bestimmte Ladung, sondern auch eine feste Masse besitzen. Zuerst war es Helmholtz, der aus den Tatsachen der Elektrolyse folgerte, dass die Annahme der „Elektrizitätsatome“ ebenso notwendig wie die der chemischen Atome sei. Deren Grundgesetz besagt nämlich, dass dieselbe Elektrizitätsmenge stets in allen Elektrolyten chemisch aequivalente Mengen, d. h. dieselbe Atomzahl der Zersetzungsprodukte ausscheidet. Wie die atomistische Struktur der Materie ein unmittelbarer Ausfluss der chemischen, so ist die atomistische Struktur der Elektrizität ein Ausfluss der elektrochemischen Grundtatsachen. Wir haben dabei zwei verschiedene Arten, 52 die positive und die negative Elektrizität, zu unterscheiden. 52 Die positiven Elektronen sind, wie später zu besprechen, mit den Kernen der 53 Atome, in denen im Wesentlichen ihre Masse enthalten ist, identisch, 53 während die negativen Elektronen eine selbstständige Existenz besitzen und z. B. in den Kathodenstrahlen für sich allein zu beobachten sind. So erscheint uns heute überhaupt die Materie als ein elektrisches Gebilde und nur dem Umstand, dass sich die positiven und negativen Ladungen 51 Version
A: Added by Hilbert (pencil): bekanntlich B: Underlined by Hilbert with an undulating line. 53–53 Version B: Underlined by Hilbert with an undulating line. 52–52 Version
50
702
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
gewöhnlich gegenseitig in ihrer Wirkung aufheben, ist es zuzuschreiben, dass wir so spät zu dieser Erkenntnis gelangt sind. Also eine unendlich fortgesetzte Teilung ist nicht nur für die Materie, sondern auch für die Elektrizität unmöglich: 54 man kann nicht beliebig kleine Ladungen herstellen. Die kleinste Ladung ist die des Elektrons: 54 1, 6 · 10−20 51
5
elektrostatische Einheiten.
1 elektrostatische Einheit ist diejenige Ladung, die auf eine glei|che Ladung in der Entfernung 1 cm eine Kraft von 1 Dyn ausübt. 1 Dyn ist die Kraft, die cm erteilt. 1 ruhenden gr in 1 sec die Geschwindigkeit 1 sec 55 Ein homogenes Kontinuum oder Fluidum mit unendlich fortsetzbarer Teilbarkeit finden wir also in der Natur nirgends vor: vielmehr, was wir erfahren und beobachten, ist stets Diskretes. Die unendliche Teilbarkeit bleibt eine blosse Idee, von der Wirklichkeit Lügen gestraft. 55
10
Atomistik der Wirkung, Quantentheorie
52
Ausser Materie und Elektrizität gibt es in der Physik noch einen andern Begriff, für den ebenfalls das 56 Gesetz der Erhaltung 56 gilt, nämlich 57 die Energie 57 Ja, dieser Satz von der Erhaltung der Energie hat lange Jahrzehnte hindurch den Entwicklungsgang der Physik beherrscht: es kam darauf an, die Energie in ihren verschiedendsten Formen zu erkennen, zu messen und die Gültigkeit des Erhaltungssatzes zu prüfen, wobei immer neue Früchte der Forschung in den Schoss fielen. 58, 59 Da war es vom Standpunkt der Gegnerschaft 59 zur Atomistik ein geschickter Gedanke von Ostwald, im Gegensatz zur Atomistik eine Kontinuitätstheorie der Energie zu begründen, in der die Energie als das fundamentalste Agens der physikalischen Welt auftritt. Diese, seine sogenannte Energetik, propagierte Ostwald in umfassendster Weise und mit unermüdlichem Eifer; sie erschien ihm zugleich der festeste Boden für seinen Kampf gegen die Atomistik. Was geschah nun? Sicher etwas, das Ostwald nicht erwartet hatte, auch nur ahnen konnte, was aber auch die optimistischst gestimmten Vertreter der Atomistik nicht erwartet hatten: auch die Energie erwies sich selbst als etwas, das die unendliche Zerteilung nicht schlechthin 60 zulässt. 58 Planck entdeckte die Ener|giequanten. Für die gewohnte Anschauungsweise war diese Entdeckung zunächst eine ungeheuer2 liche Zumutung. Denn da die kinetische Energie z. B. durch m 2 v gegeben ist, so schien fast die Geschwindigkeit selbst in ihrer Eigenschaft als eine stetig veränderliche Grösse bedroht. 54–54 Version 55–55 Version
B: Underlined by Hilbert with an undulating line. B: Paragraph marked by Hilbert with an undulating line in the left-hand mar-
gin. 56–56 Version
B: B: 58–58 Version B: 59–59 Version B: 60 Version A: 57–57 Version
Underlined by Hilbert with an undulating line. Underlined by Hilbert with an undulating line. Marked by Hilbert with an undulating line in the left-hand margin. Underlined by Hilbert with an undulating line. Added by Hilbert (pencil): und uneingeschränkt
15
20
25
30
35
‘Über das Unendliche’ (1924/25)
703
61
5
10
15
Die Aufklärung, die die weitere Untersuchung brachte, war beinahe noch merkwürdiger, indem sich nämlich zeigte, dass das neue Diskrete, das neue nur in Quanten auftretende Etwas keineswegs die Energie selbst, überhaupt nicht etwas bloss räumlich Ausgedehntes, sondern vielmehr von raum-zeitlicher Art ist. — Es ist, als ob Boltzmann 62 selbst da, wo er garnicht ernsthafte Behauptungen im Rahmen der Atomtheorie aufstellte, sondern sich lediglich dem Spiel seiner Phantasie überlies, als er nämlich von Zeitatomen sprach, in gewissem Sinne Recht bekommen sollte. Ostwald aber wurde der Boden unter den Füssen weggezogen. 61, 63 Mit dieser neuen Art von Diskontinuität hat es folgende Bewandtnis: 64 Unsere Darstellung der Atomistik war noch etwas zu eng. Nach den Ergebnissen der heutigen Forschung hat die alte Atomistik der Chemiker einem neuen Gebäude Platz machen müssen, das jedoch den Gedanken der Einheitlichkeit und der Diskretheit der Materie in noch viel schönerer Form enthält. 64 65 Wie wir sahen sind die letzten Bausteine der Materie der 65 positiv geladene Kern des Wasserstoffatoms und das negativ geladene Elektron von den Dimensionen mKern = 1, 65 · 10−24 g eK = 1, 59 · 10−20 elektrostatische66 Einheiten mElektron = 0, 899 · 10−27 g
20
25
30
eE = −1, 59 · 10−20 el. Einh. Durchmesser beider < 10−12 cm 67 K 2000 Massenverhältnis m mE = Diese H-Kerne und Elektronen treten nun in gewissen Anzahlen | zu engeren Verbänden zusammen, die sehr stabil sind und die Kerne der anderen Atome bilden. Die Ladung der Kerne ist somit stets ein ganzes Vielfaches der Elementarladung, und da die Masse der Elektronen wenig ausmacht, ebenfalls sehr angenähert auch ihre Masse ein Vielfaches der des H-Kernes. Um diese Atomkerne, die immer sehr kleine Ausdehnung haben, etwa 10−12 cm, kreisen wie Planeten um die Sonne soviel negative Elektronen, wie die Kernladungszahl angibt. Im einfachsten Fall, bei dem Wasserstoffatom selbst, ist nur ein einziges Elektron vorhanden, das um den Kern umläuft, aber diese Bewegung des Elektronen-Planeten ist nicht ganz beliebig, sondern anders wie bei den 61–61 Version
B: Marked by Hilbert with an undulating line in the left-hand margin. A: Added by Hilbert (pencil): dieser genialste Verfechter der Atomistik 63 Version B: Added by Hilbert in the the left-hand margin: Weiter S. 55 64–64 This text was added in both versions (ink). In Version B it was written neatly on the verso of the opposite page, while in Version A it was added in the margin. 65–65 In Version B, , this was changed in ink (probably by the same writer who added the formulas and corrections) to: Nach dieser neuen Atomistik gibt es nunmehr zwei letzte Bausteine der Materie, nämlich den . . . . In Version A, the original text given here was changed to: Nach ihm sind die letzten Bausteine der Materie der . . . 66 Version A (probably by the same writer who added the formulas and corrections in ink): elektrost. 67 Version B (probably by the same writer who added the formulas and corrections in ink), added: ca. 62 Version
53
704
54
55
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
wirklichen Planeten gewissen Einschränkungen unterworfen, die sich durch bestimmte ganzzahlige Beziehungen der Bestimmungsstücke der Bahnen ausdrücken. Die Quantentheorie ist es, die uns diese ganzzahligen Beziehungen liefert, und zwar muss, damit die Quantentheorie eingreifen kann, wie hier ein periodischer Vorgang vorliegen. Diejenige Grösse, die bei der Quantentheorie die Hauptrolle spielt und nur diskreter Werte fähig ist, ist nun, wie ich schon sagte, nicht die Energie selbst, sondern eine raum-zeitliche Grösse, die sogenannte Wirkung, die gleich Energie mal Zeit, nämlich gleich der doppelten mittleren kinetischen Energie mal der Dauer einer Periode ist. Um uns diesen etwas ungewohnten Begriff der Wirkungsgrösse und damit den Inhalt der Quantentheorie anschaulich zu machen, betrachten wir nun den Umlauf jenes einzelnen Elektrons um seinen H-Kern in einer Kreisbahn. Da bei dieser Bewegung die kinetische Energie des Elektrons konstant bleibt, so ist für diesen Fall die Wirkung gleich der doppelten kinetischen Energie selbst | multipliziert mit der Zeitdauer eines Umlaufes. Um zu den ausgezeichneten Bahnen zu kommen, ist nun die Forderung der Quantentheorie zu berücksichtigen, dass eben jene Wirkungsgrösse ein ganzes Vielfaches eines elementaren Wirkungsquantums sein muss. Die Dauer der Periode ist nun, wenn r die Zahl der Umläufe in einer Sekunde bedeutet, T = 1r so dass, wenn wir das Quantum mit h bezeichnen, nur solche Bahnen möglich sind, für die die Quantenbedingung 2Ekin = n·h (n = 1, 2, . . . ) 2Ekin · T = r 68 erfüllt ist. Dies liefert die Auswahl der allein möglichen diskreten Bahnen, zwischen denen nur sprunghaft Uebergänge möglich sind. h hat dabei den Wert 6, 55 · 10−27 erg. sec, wobei 1 erg diejenige Energiemenge ist, die erfor1 derlich ist, um 1000 Gramm 1 cm hoch zu heben, oder genauer die kinetische Energie, die einer Masse von 2 g innewohnt, wenn sie sich mit einer Gecm also etwa 10mal so rasch wie der Sekundenzeiger einer schwindigkeit von 1 sec Taschenuhr bewegt. Für das H-Atom ergeben sich dann die nebenstehend gezeichneten diskreten Bahnen. Ihre Radien verhalten sich wie: 12 : 22 : 32 : 42 : . . . n2 Die Umlaufszeiten wie 4 1 13 : 23 : 33 : 43 : . . . n3 9 Die Geschwindigkeiten wie 1 1 1 1 1 : : : : .. 16 1 2 3 4 n Daher ist: 2Ekin mv 2 n3 = proportional = n. r r n·n −8 Der Radius des ersten Kreises ist = 0, 53 · 10 cm. 68 The
‘h’ here is meant to signify Planck’s constant .
5
10
15
20
25
30
35
40
‘Über das Unendliche’ (1924/25)
5
10
15
20
705
Die Geschwindigkeit des Elektrons 69 in 69 ihm km 1 = 22000 = Lichtgeschwindigkeit. sec 14 Das H-Atom ist also nur in diesen diskreten Zuständen stabil, und kann immer nur von einem solchen Zustand sprunghaft in einen anderen übergehen. Dieses sprunghafte Uebergehen tritt besonders bei der Wechselwirkung mit dem Licht in Erscheinung. Es können nur ganz bestimmte Lichtmengen „Lichtquanten“ ausgestrahlt oder absorbiert werden, die in genauer Beziehung zu den diskreten Atomzuständen stehen. Und auch die Farbe des ausgestrahlten oder absorbierten Lichtes wird nun nicht, wie die klassische Theorie annahm, durch die Schwingungen des Elektronen, sondern lediglich durch die Energiemengen bedingt, die bei jenen Sprüngen von einem zu einem andern Zustande frei resp. verschluckt werden. Die wichtigste Folgeerscheinung dieser Vorgänge sind die berühmten Spektrallinien der Balmerserie beim Wasserstoff, deren Gesetzmässigkeit schon lange Zeit vorher, nämlich 1885 entdeckt und genau geprüft waren, ehe erst Niels Bohr 1913 also, beinahe ein Menschenalter später ihre Ursache erkannte, dass sie Nichts anderes als ein sichtbares Anzeichen für diese neue Art von Atomistik sind, die die Quantentheorie ausmacht. 70 Das Fazit unserer Betrachtungen ist jedenfalls, dass ein homogenes Kontinuum, das die fortgesetzte Teilbarkeit zuliesse und somit das UnendlichKleine realisieren würde, in der Wirklichkeit |71 nirgends angetroffen wird. Die unendliche Teilbarkeit eines Kontinuums ist nur eine in Gedanken vorhandene Operation, nur eine Idee, die durch unsere Beobachtungen der Natur und die Erfahrungen der Physik und Chemie widerlegt 72 sind 72 . 70, 73 Die Welt im Grossen
25
Frage nach der Endlichkeit der Welt
30
Die zweite Stelle, an der uns in der Natur die Frage nach der Unendlichkeit entgegentritt, treffen wir bei der Betrachtung der Welt als Ganzes. Hier haben wir die Ausdehnung der Welt zu untersuchen, ob es in ihr ein unendlichGrosses gibt. Auch diese Frage ist genau ebenso wie die nach der fortgesetzten Teilbarkeit der Materie eine alte. Im Altertum war man allerdings in groben Täuschungen hierüber befangen, da man den Himmel als eine feste kristallene aber endliche Sphäre betrachtete, und nur wenige besonders weitsichtige 69–69 Version
B: Changed in ink to: auf B: Paragraph marked by Hilbert by an undulating line in the left-hand margin. 71 Version A: Added by Hilbert (pencil): ??ie allen Gegnern der Atomistik wurde der Boden unter den Füssen weggezogen. Und das Fazit ist jedenfalls, dass ein homogenes Kontinuum, welches die fortgesetzte Teilbarkeit zuliesse und somit das ∞-Kleine realisieren würde in der Wirklichkeit . . . 72–72 Version A: Replaced by Hilbert (pencil) with: wird 73 Version B: Added by Hilbert in the margin: ‘Nun Beiblatt b Vererbung’. There is no additional page contained in the manuscript to which this remark refers. 70–70 Version
56
706
57
58
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
Geister, wie Archimedes, versuchten, sich eine Vorstellung von ihrer grossen Ausdehnung zu verschaffen. Erst mit der Anerkennung des Copernikanischen Weltsystems, das die Erde ihrer Ausnahmestellung entkleidete, konnte man sich ernstlich mit dieser Frage beschäftigen und so hatte bereits einer seiner ersten Verfechter, Giordano Bruno, der in der zweiten Hälfte des 16. Jahrhunderts lebte, 74 die Lehre von der Unendlichkeit der Welt 74 ausgesprochen. Diese Meinung blieb wohl lange Zeit die herrschende. Die Philosophen beschäftigten sich mit den daraus entspringenden Schwierigkeiten. Bis 75 Kant und weiterhin 75 hegte man an der Unendlichkeit des Raumes keinen Zweifel: „Der Raum wird als eine unendliche gegebene Grösse vorgestellt“ sind die Worte Kants, und Kant sucht sich klar zu machen, wie die Welt darin zu denken sei. Hier ist es nun wieder die moderne Wissenschaft, 76 die Physik und 76 Astronomie, die diese Frage von neuem aufrollt und nun nicht | durch das 77 hier 77 unzulängliche Hilfsmittel metaphysischer Spekulationen, sondern durch Gründe, die sich auf die Erfahrung stützen, durch Beobachtungen und Anwendung von Naturgesetzen zu entscheiden sucht. Wir haben hierin ein weiteres Beispiel für die Kraft der modernen Wissenschaft, die früher für unlösbar gehalten Fragen erfolgreich anzugreifen vermag, und damit die Grenzen unseres Naturerkennens immer weiter hinausrückt. Wir haben also heute keinen Grund mehr zu einem „ignorabimus“, sondern, wenn wir auch augenblicklich noch ein ignoramus aussprechen müssen, so ist doch auch die Beantwortung einer Frage wie diese in den Bereich zuversichtlicher Erwartung gerückt. Wenn wir heute auf die Frage nach der Ausdehnung der Welt 78 noch nicht so wie in der Atomistik, eine bestimmte und ausreichende Auskunft geben können, so sind doch schon eine ganze Reihe von Gründen vorhanden, die für eine endliche Ausdehnung sprechen. Auch hier ist jedenfalls die Tendenz nach einer Ausschaltung des Unendlichen unverkennbar. Es bestehen nämlich schwerwiegende Einwände gegen die Unendlichkeit. Wäre die Welt nämlich unendlich, so sind zunächst zwei Möglichkeiten vorhanden. Entweder ist auch die Menge der vorhandenen Materie selbst unendlich oder endlich. Im ersteren Fall bei der plausibeln Annahme gleicher mittlerer Dichte würde sich die merkwürdige Konsequenz ergeben, dass der ganze Himmel in unendlicher Helligkeit strahlen müsste, da zwar das von den einzelnen Sternen herrührende Licht um so schwächer ist, je weiter sie entfernt sind, aber ihre Anzahl unendlich wäre, was die Abnahme der Helligkeiten bei wachsender Entfernung mehr als kompensiert. Dies kommt folgendermassen zustande. Die Helligkeit, die von einem Stern herrührt, ist | proportional mit R12 , wenn R seine Entfernung bis zum Beobachtungsort ist. Die Helligkeit nun, die von den Sternen in einer Kugelschale im Mittelpunkt erzeugt wird, ist nun bei Annahme gleichmässiger Verteilung einmal proportional dem In74–74 Version
A: Changed by Hilbert (pencil) to: hat die Lehre von der Unendlichkeit der Welt wohl zuerst bewusst 75–75 Version A: Changed by Hilbert (pencil) to: zu Kant und auch weiterhin noch 76–76 Version A: Replaced by Hilbert (pencil) with: insbesondere die 77–77 Version B: Crossed out, probably by Hilbert. 78 Version A: Added by Hilbert (pencil): oder des Raumes
5
10
15
20
25
30
35
40
‘Über das Unendliche’ (1924/25)
5
10
15
20
25
30
35
707
halt dieser Schale, also 4πR2 · Dicke, andererseits wieder umgekeht proportional R2 (R = Radius). Infolgedessen hebt sich R ganz heraus, und es ist also die von einer Kugelschale bestimmter Dicke herrührende Helligkeit unabhängig von R, also eine Konstante. Wenn wir nun den Raum in lauter gleich dicke Kugelschalen zerlegen, so erkennen wir, dass die erzeugte Helligkeit unendlich sein müsste. Ebenso würden diese vielen fernen Sternensysteme ebenfalls eine derartige Kraftwirkung auf die Planeten ausüben, dass eine gesetzmässige Planetenbewegung, wie wir sie doch haben, nicht möglich wäre, da das Gravitationsfeld unbestimmt wird. Wäre andererseits nur eine endliche Menge Materie in einem unendlichen Weltall, so würde sich diese im Laufe der Zeit immer mehr zerstreuen müssen. Andauernd wird ja Licht, und damit Energie in den Raum hinausgestrahlt, und ebenfalls würden auch fortdauernd einzelne Sterne sich absondern, und in die Unendlichkeit hinausfliegen. Das Sternsystem verhielte sich also wie ein Gas, das in keinen festen Raum eingeschlossen ist, und sich immer mehr ausdehnt. Die Welt in unserer Umgebung müsste also immer mehr veröden, und ein stationärer Zustand wäre nicht möglich. Wir sehen also, dass die Annahme einer unendlichen Welt zu sehr grossen Schwierigkeiten Anlass gibt. Andererseits ist es zunächst für uns nicht vorstellbar, dass die Welt begrenzt sein sollte. Von derartigen Grenzen ist auch keine Spur zu merken, sodass hier ein unlösbarer Widerspruch vorzuliegen scheint. Hier greift nun | die moderne mathematische Forschung mit ihren seit Kant erzielten Fortschritten ein. Bis dahin war die Unendlichkeit des Raumes eine Selbstverständlichkeit: In der Tat ist sie eine Konsequenz der Euklidischen Geometrie und diese war die einzige ohne Anfechtung herrschende Meinung und Lehre über den Raum. Nun ist zwar die Euklidische Geometrie ein in sich widerspruchsfreies Gebäude und Begriffssystem; darum aber ist es noch nicht notwendig, dass sie in der Wirklichkeit Gültigkeit besitzt. Ob dies der Fall ist, kann allein die Beobachtung und Erfahrung entscheiden. Bei dem Versuche, die Unendlichkeit des Raumes spekulativ zu erweisen, liefen auch wirklich Irrtümer unter. Aus der Tatsache, dass ausserhalb eines Raumstückes immer wieder noch Raum vorhanden ist, folgt nur die Unbegrenztheit des Raumes, keineswegs aber die Unendlichkeit. Unbegrenztheit und Endlichkeit aber schliessen einander nicht aus. 79 80 In 2 Dimensionen haben wir dafür sehr anschauliche Beispiele: Die Oberfläche der Kugel oder die eines Ringes. Wenn wir nun nach andern Begriffssystemen suchen, die vielleicht besser auf die Wirklichkeit passen als die Euklidische Geometrie, so werden wir so verfahren, dass wir einzelne Bestimmungsstücke der Euklidischen Geometrie — einzelne ihrer Axiome — weglassen, modifizieren oder durch andere ersetzen. Wenn wir das Parallelenaxiom aufgeben, so erhalten wir die Möglichkeit der sogenannten 79 Version
B: Added by Hilbert in margin: ⊥ A: Enclosed in parentheses and stricken through by Hilbert (pencil). In the margin Hilbert (pencil) has added the following text, which is partly obscured by the binding: Die math. Rechnung liefert in der genannten elliptischen Geometrie das natürliche Modell der wirklichen Welt. In dieser Geometrie ist jede Gerade in sich rücklaufend und von bestimmter konstanter Länge, der eben der Durchmesser der Welt ist. Das Aufgeben der Euklidischen Geometrie ist aber heute nicht mehr bloss eine rein math. oder philosophische Angelegenheit.
80–80 Version
59
708
60
61
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
hyperbolischen Geometrie, wo die Winkelsumme im Dreieck < 2 Rechte ausfällt. Legendre hat ohne Parallelenaxiom den Nachweis geführt, dass in der Tat dann die Winkelsumme nicht > 2 Rechte sein kann. In dieser Geometrie hat die Gerade aber ebenfalls wie bei Euklid eine unendliche Länge. Wollen wir die Endlichkeit der Geraden haben, so müssen wir die Axiome der Anordnung der 80 | Punkte auf der Geraden modifizieren, insbesondere das Axiom über „Zwischen“: dass von 3 Punkten immer einer ausgezeichnet ist, indem er zwischen den andern liegt. In der Tat, wenn die Gerade eine endliche Länge haben soll, so muss sie, da sie doch unbegrenzt ist, geschlossen sein. Auf einem geschlossenen ein-dimensionalen geometrischen Gebilde aber trennen sich erst 2 Punktepaare:
Nach dieser Modifikation gelingt der Nachweis, dass die Winkelsumme nicht > 2R sein kann nicht mehr. Es wird dann auf Grund der Forderung der Endlichkeit der Geraden eine neue Geometrie möglich, die sogenannte elliptische, in der die Winkelsumme stets > 2R ausfällt. Alle Geraden haben darin die gleiche endliche Länge, die wir den Durchmesser dieses Raumes nennen wollen. Wenn wir uns auf 2 Dimensionen beschränken, so können wir uns diese elliptische Geometrie sehr gut durch die Punkte einer Halbkugel interpretieren, wo 2 gegenüberliegende Punkte des begrenzenden Aequators immer als ein und der nämliche Punkt gelten sollen, und die Fläche durch die Zusammenordnung ihrer Randpunkte zu einer unbegrenzten wird. Die Geraden sind die grössten Halbkreise. Wollen wir die Endlichkeit der Welt darstellen, so ist diese elliptische Geometrie das natürliche und gegebene Modell unseres 3-dimensionalen Raumes. Damit ist jedenfalls die theoretische Möglichkeit der Annahme einer endlichen Welt gezeigt. In dieser Geometrie ist die Winkelsumme im Dreieck > 2R, und auch die Summe zweier Winkel eines Dreiecks kann bereits > 2R sein. In der Astrono|mie heisst der Ueberschuss von 2 Rechten über die Summe der beiden Basiswinkel Parallaxe.
5
10
15
20
25
Stern β α
Parallaxe = 2 Rechte −(α + β)
Erdbahn
Es müssten also bei der Gültigkeit dieser Geometrie auch negative Parallaxen bei Sternen beobachtbar sein. Darin liegt ein Mittel durch Beobachtung die Gültigkeit dieser Geometrie festzustellen. Bisher ist darüber noch keine
30
‘Über das Unendliche’ (1924/25)
5
10
709
Entscheidung herbeigeführt worden, offenbar weil der Durchmesser der Welt sehr gross ist. Wäre er aber nicht sehr gross, sondern hinreichend klein, so würde es ja niemals in Betracht gekommen sein, die Euklidische Geometrie auf Astronomie anzuwenden. Eine andere Konsequenz ist die, dass wir in entgegengesetzter Richtung auch die Rückseite des Sterns sehen müssten. Eine solche Beobachtung haben wir allerdings bisher nicht gemacht, was aber auch keineswegs gegen das Zutreffen des elliptischen Raumes spricht. Denn erstens würde uns das Licht ja nur das Bild des Sternes aus einer früheren Zeit zutragen und diese Zeit kann mehr als Millionen Jahre betragen. Während dieser Zeit haben sich der Standort und die Konstitution des Sternes geändert. Dazu kommt noch die Zerstreuung des Lichtes durch Gravitation und Absorption, die sein Gegenbild sehr schwächen wird. Relativitätstheorie
15
20
25
Soll die Welt endlich sein, so muss die Euklidische Geometrie aufgegeben werden. Aber das Aufgeben der Euklidischen Geometrie wird uns heute nicht 81 mehr 81 als eine rein theoretische Spekulation nahe gelegt, sondern auch von einer andern Seite, die garnichts |82 mit der Endlichkeit der Welt zu schaffen hatte. Einstein hat die Notwendigkeit gezeigt, von der Euklidischen Geometrie abzugehen. Die Voraussagen auf Grund seiner Gravitationstheorie sind durch die Beobachtung bestätigt worden. Auf Grund seiner Gravitationstheorie nimmt er auch 83 kosmologische Fragen in Angriff und zeigt die Möglichkeit einer endlichen Welt, die sich durch manche Eigenschaften empfiehlt. Seine Theorie liefert dabei auch eine Formel für den 84 Durchmesser der Welt 85 86 nämlich κ D = √ 87 ρ wo κ eine bekannte nur von den gewählten Einheiten abhängige Dimensionskonstante und ρ die mittlere Dichte der Masse im Weltraum bedeutet. Weltbild der Astronomie
30
Nach dem heutigen Stande unseres Wissens haben wir also die Annahme eines elliptischen Raumes zu machen. Allerdings ist es bisher nicht gelungen, Abschätzungen für D zu machen. Alle bisherigen Versuche haben sich als nicht 81–81 Version
B: Changed by Hilbert (pencil) to: nur A: Added by Hilbert (pencil): willkürliche Spekulation, sondern wir sind auch von anderer Seite dazu gelangt, die ursprünglich gar nichts 83 Version A: Added by Hilbert (pencil): diese 84 Version A: Added by Hilbert (pencil): endlichen 85 Version A: Added by Hilbert (pencil): ausgedrückt durch die mittlere Dichte der Materie 86–86 Version A: Enclosed in parentheses and stricken through by Hilbert (pencil). 87 Version B: Added by Hilbert: Experimentell ist festgestellt, dass man Durchmesser mit 5000 Millionen Lichtjahre annimmt. 82 Version
62
710
Lectures on the Infinite (1924/25, 1931, 1933)
5
10
stichhaltig herausgestellt. Andererseits sind 86 88 alle von den Astronomen bisher gefundenen Resultate 88 mit der Annahme der elliptischen Welt durchaus verträglich. Das, was die Astronomie auf Grund ihrer Beobachtungen festgestellt hat, bietet das Bild einer zwar sehr grossen aber endlichen Weltinsel, ausserhalb derer trotz der Verfeinerung der Hilfsmittel und Methoden nichts mehr festgestellt werden konnte. Und zwar ist dieses Bild etwa folgendes: Alles, was bisher bemerkbar geworden ist, liegt innerhalb eines Rotationsellipsoids, dessen Hauptachse etwa 300000 Lichtjahre beträgt, während seine Ausdehnung senkrecht dazu etwa halb so gross ist. Eine durch die Rotationsaxe gehende Ebene — die Tafelebene — | ist ausgezeichnet. In dieser Ebene und seitlich davon liegt die 1 Lichtjahr = 1013 km überwiegende Menge aller Sterne überhaupt, nämlich unsere Milchstrasse. Die ist 150 000 Lichtjahre also eine platte elliptische Scheibe. Ausserhalb dieser 300 000 Lichtjahre platten Scheibe, aber noch innerhalb jenes Rotationsellipsoids liegen die Kugelhaufen und Spiralnebel, die daher auch noch zu diesem Milchstrassensystem zu rechnen sind. 89
15
63
Chapter 4
20
Lichtgeschwindigkeit Die Endlichkeit des Wirklichen haben wir nun in 2 Richtungen untersucht, nach dem Unendlichkleinen und dem Unendlichgrossen. Beides sind schon früher Postulate resp. Probleme der Philosophie gewesen. Denken wir z. B. an Demokrit und andererseits die Antinomien von Kant. Diese Endlichkeitsbehauptungen sind jedenfalls nicht etwas völlig Neues und Unerwartetes gewesen. Nun hat uns aber die Physik eine neue, ganz andere Endlichkeit gelehrt und als gültig erwiesen, die ganz überraschend war, auf die kein Philosoph gekommen war, die uns zuerst ganz absurd angemutet hat. Die Relativitätstheorie von Einstein nämlich enthält die Behauptung, dass sich ein Körper nur mit einer Geschwindigkeit kleiner als die Lichtgeschwindigkeit bewegen kann. Diese Endlichkeit erscheint als Konsequenz einer in sich abgerundeten und experimentell völlig sicher gestellten Theorie. Und alle scheinbaren Widersprüche und Schwierigkeiten bezüglich des Kausalitätsgesetzes und wegen
88–88 Version
A: Changed by Hilbert (pencil) to: Alle von den Astronomen bisher gefundenen Resultate sind 89 Both versions: The diagram above has been stricken through (conspicuously in Version A, but only with faint strokes in Version B).
25
30
35
‘Über das Unendliche’ (1924/25)
5
711
des Prinzips der Addition der Geschwindigkeiten klären sich auf. 90 Es 91 | gibt also eine Geschwindigkeitsgrenze für die Bewegung der Körper. Trotzdem sich nun also nirgends in der Natur etwas Unendliches finden lässt, so sind die Dimensionen, die wir in Physik und Astronomie antreffen doch derart, dass sie ganz aus dem Rahmen der gewohnten Verhältnisse herausfallen wegen ihrer Kleinheit oder riesenmässigen Grösse. Daher ist es auch erklärlich, dass man lange an das Unendliche glaubte und so spät ihre Endlichkeit erkannte.
64
Grosse und kleine Dimensionen 10
15
20
25
30
35
Ich will Ihnen nicht alle in Betracht kommenden Zahlen nennen, zumal ich schon die wichtigsten Angaben über die Dimensionen der Atome gemacht habe. Ich will nur ein paar neue Beispiele hinzufügen. Was die Dichte der Materie betrifft, so erkennen wir, dass dieselbe ausserordentlich gering ist. Man kann zunächst bei der irdischen Materie von einer gähnenden Leere sprechen, wenn man berechnet, wie wenig Raum von den Kernen der Atome wirklich ausgefüllt wird, den Kernen, die doch wesentlich allein die Materie ausmachen. Denken wir uns für einen Kristall die Atomkerne als Stecknadelköpfe vergrössert, so kommt im Kristall auf je 1 km ein Stecknadelkopf. Andererseits ist in der Umgebung unserer Sonne die Dichte der Sterne so gering, dass, wenn wir uns die Sterne als Stecknadelköpfe verkleinert denken, sogar erst alle 100 km ein Stecknadelkopf kommt. Der Himmel weist also eine noch 100 mal gähnendere Leere auf. Nun einige Daten über vorkommende Zeiten. Sehr kleine Zeiten kommen als Lebensdauern radioaktiver Substanzen vor und ebenso als Umlaufsdauer der Elektronen um ihren Kern. Sehr grosse Zeiten kommen jedenfalls in Betracht, wenn es sich um die Geschichte der Sterne, ihr Entstehen und Vergehen handelt. Das Alter der Erde hat | man nach verschiedenen Methoden abschätzen können, die ungefähr zu übereinstimmenden Resultaten führten. Das Ergebnis ist, dass das Alter der Erde mehrere Milliarden Jahre betragen muss. Diese Zahl ist auch zugleich eine untere Grenze für das Alter der Sterne, denn unsere Sonne muss doch mindestens so alt sein wie die Erde. Andererseits können wir auch eine obere Grenze für das Alter der Sterne angeben, indem wir berechnen, wie lange es dauert bis ein Stern, der so gross wie die Sonne ist und so wie diese strahlt, seine Masse durch den relativistischen Massenverlust bei Abgabe der Strahlungsenergie verliert und demnach verschwindet. Man erhält etwa 1013 = 10 Billionen Jahre. 92 In den Märchen gibt es einen Diamantfelsen 100 Meilen lang, breit und hoch. Alle 100 Jahre kommt einmal ein Vogel und wetzt seinen Schnabel. Nehmen wir an, dass bei dieser Operation jedesmal ein Diamantatom abhandenkommt, so reicht der 90 Version
B: Added by Hilbert in the left-hand margin: ⊥ A: Added by Hilbert (pencil) in the left-hand and bottom margins: Eine Endlichkeit über die man eigentlich aus dem Staunen garnicht herauskäme, wenn man sie nicht schon so lange gewöhnt wäre. 92 Version B: Hilbert has added in the right-hand margin: 91 Version
65
712
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
Felsen doch 1048 Jahre. Die Ewigkeit des Märchens 93 dauert also in der Tat noch erheblich länger als jene astronomischen Zeiten. 93, 94 Die Frage, ob nun auch die Zeit selbst endlich ist, müssen wir bis jetzt offen lassen, ebenso wie die, ob sie selbst atomistischer Natur ist, und ob Fragen solcher Art überhaupt Sinn haben.
5
III. Wahrscheinlichkeitstheorie
66
67
Wenn wir die Rolle, die das Unendliche in der Wirklichkeit spielt, vollständig ergründen wollen, dürfen wir es bei den bisherigen physikalischen und astronomischen Betrachtungen nicht bewenden lassen. Sehr wichtige und häufige, alltäglich uns begegnende Erscheinungen haben wir bisher nicht berücksichtigt. Wenn wir am Spieltisch den Lauf der Kugel in rouge et noir beobachten, erwarten wir in einer längeren Reihe von Spielen, dass ungefähr gleich oft rouge wie noir eintritt; andernfalls wir ein gefälschtes | Spiel annehmen würden. Wir sprechen von einem oder mehreren Menschenaltern in einer Erzählung, obwohl wir wissen, dass der eine Mensch gleich nach seiner Geburt stirbt, der andere vielleicht fast ein Jahrhundert lang lebt. Wir sprechen von der Dichte eines Stoffes, obwohl wir wissen, dass in den Zwischenräumen zwischen den Molekülen überhaupt nichts ist, also die Dichte Null herrscht. In allen diesen Fällen bezeichnet unsere Ausdrucksweise eine Wahrscheinlichkeit oder einen Mittelwert, und dies sind Begriffe von der allergrössten Bedeutung — einer Bedeutung, die der Nichtfachmann garnicht ahnt, die sich aber in der wissenschaftlichen Erforschung immerzu steigert. Im Bereiche der Naturwissenschaften gibt es kein Gebiet, in welchem die Lehre von der Wahrscheinlichkeit nicht wesentlich eingreift und vermutlich ist die Rolle, die ihr in der Natur zukommt, noch bedeutend grösser als wir heute schon wissen. Wenn wir bei dem Spiele rouge et noir die Wahrscheinlichkeit rouge mit 12 bezeichnen, so meinen wir nicht, dass unter 10 Spielen genau 5 mal rouge von der Kugel getroffen wird, sondern, dass wenn wir 10, 100, 1000 mal spielen, das Verhältnis der rouge-Spiele zur Anzahl aller immer näher an 12 kommt. Die Wahrscheinlichkeit ist also der Grenzwert für unendlich viele Versuche. Nun haben wir dem Unendlichen nachgespürt zuerst in den Mathematischen Fächern. Das wesentlichste Ergebnis war damals: die für endliche Grössen gültigen Rechnungsregeln dürfen nicht ohne weiteres auf unendliche Gebilde übertragen werden. Sodann fragten wir nach dem Unendlichen in der Natur und fanden, dass das Unendliche in der Wirklichkeit nirgends anzutreffen ist. Nun ist, wie eben gesagt, die Wahrscheinlichkeit ein Grenzbegriff, und erst bei dem | Uebergang zum Unendlichen fest definiert. Wir sind also zunächst unseren Ergebnissen zufolge aus 2-fachem Grunde in seiner Anwendung auf die Natur behindert: 1. wegen der Verschiedenheit der Rechnungsregeln mit grossen und unendlichen Zahlen. 2. wegen des Nichtvorkommens des Unendlichen in der Natur. Beide Hindernisse vermögen nicht die Wahrscheinlichkeitslehre 93–93 Version
B: Replaced by Hilbert with: führt uns also noch zu erheblich grösseren Zahlen als jene auf die uns das Schachspiel führte. 94 Version B: Hilbert has added in the right-hand margin: ⊥
10
15
20
25
30
35
40
‘Über das Unendliche’ (1924/25)
5
713
zu beeinträchtigen. Es gibt ein Prinzip, das über diese Einwände hinwegzugehen erlaubt, und sich etwa in folgendem Leitsatz aussprechen lässt: Was nach den Voraussetzungen und Naturgesetzen fast immer eintreten sollte, wird in Wirklichkeit stets allein beobachtet. Die Unbestimmtheit, die in dem „fast“ liegt, kommt praktisch nicht in Betracht, wie die Beispiele zeigen werden, die ich jetzt vorführen will. Mischungsprobleme
10
15
20
25
30
35
Eine der allereinfachsten, bekanntesten und häufigst beobachteten Tatsachen ist diese: wenn ich einen Liter weissen Sand mit einem Liter schwarzen Sand mische und dann aus der Mischung eine Handvoll herausgreife, so fasse ich ungefähr ebenso viel weissen wie schwarzen Sand, oder wenn ich zu einer halben Tasse schwarzen Kaffees noch eine halbe Tasse Milch zugiesse, so genügt ein wenig Umrühren mit dem Teelöffel, um zu erreichen, dass, wenn ich nunmehr aus der Tasse einen Teelöffel der Mischung heraushebe, sich in demselben ungefähr ebensoviel Milch wie Kaffee befindet, was an der gleichmässigen Färbung des Gemisches ersichtlich ist. Zur Erklärung machen wir folgende mathematischen Ansätze: Die weissen und die schwarzen Sandkörner bez. die Kaffee- und die Milchmoleküle seien in gleicher Anzahl vorhanden. a bedeute das Verhältnis der Anzahl sämtlicher zur Anzahl der herausgegriffenen Sandkörner (bez. Moleküle), also ungenau ausgedrückt das Volumenverhältnis von 2 Litern zur Handvoll bez. Tasseneinheit zum Teelöffel. Um die | Gedanken zu fixieren, nehmen wir etwa a = 50 an. Ist 2m die Anzahl der herausgegriffenen Sandkörner, so 2n = a · 2m oder n = a · m. Man kann eine bestimmte Verteilung bei den herausgegriffenen Körnern auf sehr verschiedene Weise herstellen, da uns ja nur die Zahl der Körner, nicht die einzelnen Individuen interessiert. Die Anzahl aller Arten, wie man aus 2n Körnern 2m herausgreifen kann, ist 2n! . N= 2m!(2n − 2m)! Die Anzahl der Arten, wie m + k weisse und m − k schwarze Körner herausgegriffen werden können, ist n! n! NK = · . (m + k)!(n − m − k)! (m − k)!(n − m + k)! Die Wahrscheinlichkeit dafür also NK . N Wir könnten nun fragen, für welches k bei gegebenem m, n diese am grössten ist, und würden dann in der Tat das Resultat k = 0 erhalten. Aber dies
68
714
69
70
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
Resultat ist für uns ohne Bedeutung. Denn auch dieser grösste Wert N0 N fällt stets << 1 aus und nähert sich sogar der Null für ins Unendliche wachsende Werte n. Von Bedeutung für uns ist aber nur eine der Gewissheit 1 sich nähernde Wahrscheinlichkeit: denn: was fast immer eintreten sollte, wird in Wirklichkeit stets allein beobachtet. Nun stellt unsere Beobachtung aber auch nicht die genaue Gleichheit der Zahl der weissen und schwarzen Körner in der Hand fest, sondern nur die angenäherte. Nun ist die Zahl der Fälle, wo die Anzahl der herausgegriffenen weissen Körner um p oder weniger, also um höchstens p von m abweicht N0 + 2N1 + 2N2 + . . . + 2Np (denn dieselbe Zahl von Möglichkeiten NK besteht auch für das Herausgreifen von m − k weissen und m + k schwarzen Körnern). Setzt man hierin für n den Wert a · m ein, so hängt der entstehende Ausdruck und mithin auch die entsprechende Wahrscheinlichkeit N0 + 2N1 + . . . + 2Np N ausser von a nur von m und p ab. Für unsere Fragestellung haben wir nun anstelle von p einen Wert zu setzen, der klein gegen m ist. Dabei ist a = 50 festzuhalten, dagegen werden m (und n) enorm gross! Wir wollen p gleich der 3 p < 12 bleibt. Jene Wahrscheingrössten ganzen Zahl < m 5 nehmen, sodass m m5 lichkeit hängt dann nur ausser von a noch von m ab und es lässt sich mathematisch durch Ausführung einer Abschätzungsrechnung, die aber höhere und schwierigere Hilfsmittel erfordert, zeigen, dass sie für m = ∞ unabhängig von a dem Grenzwert 1 zustrebt. Es ist demnach die Wahrscheinlichkeit min3 destens m−m 5 und höchstens m+m 35 weisse Körner bez. Moleküle herauszuheben nahezu 1. Bemerken wir, dass ein Teelöffel vielleicht 2 · 1020 Kaffee- und Milchmoleküle enthält, und nehmen also m = 1020 , so wird das Verhältnis p 1 1 < 2 also < 8 . m 10 5 m 1 Teil von Die Milchmenge im Teelöffel wird also um weniger als den 100000000 1 dem wahrscheinlichsten Wert 2 abweichen. Eine solche Abweichung können wir aber nicht mehr feststellen, wie wir z.B. Kaffee mit 1018 Teilen Milch immer noch als reinen Kaffee bezeichnen würden. Man kann also schliessen: der herausgehobene Teelöffel wird tatsächlich in allen beobachteten Fällen gleich viel Kaffee und Milch enthalten. Es ist in der Tat bisher in der Ueberlieferung nicht bekannt, dass jemand nach dem Umrühren aus einem Gemisch eine | Handvoll reinen weissen Sandes oder einen Löffel reinen Kaffees erwischt hätte. Unsere Phänomen ist also völlig erklärt. Aber unabhängig von dieser Erklärung erscheint uns die in Rede stehende und hier so ausführlich behandelte Tatsache selbstverständlich, unmittelbar einleuchtend, sie ist nur notwendig und allgemeingültig und dennoch gewiss keine apriorische Weisheit, sondern offenbar ausschliesslich aus reiner Erfahrung entsprungen. Denn die mathematische Ableitung spielt als Motiv für unsere Ueberzeugung, dass es eintritt,
5
10
15
20
25
30
35
40
‘Über das Unendliche’ (1924/25)
715
garnicht mit; sie ist zu sehr verborgen und kompliziert. Besondere mechanische oder physikalische Gesetze kommen tatsächlich garnicht zur Geltung. Unser Milchkaffeeproblem ist also zugleich ein gutes Beispiel für die psychologische Bewertung von Motiven unserer Ueberzeugungen in gewissen Fällen. 5
10
15
Addition der Helligkeiten Es gibt auch einfache und oft beobachtete Tatsachen, deren Erklärung leicht erschient, aber nur deshalb, weil sie auf einer ganz fehlerhaften Auffassung der Naturgesetze beruhen. Ein Beispiel ist das Phänomen, dass 2 Kerzen gleicher Helligkeit auch doppelte Helligkeit erzeugen. Zwar ist es vom Standpunkt der blossen Addition der Helligkeiten sehr plausibel, aber mit Rücksicht darauf, dass das Licht ein Schwingungsvorgang ist, zunächst unverständlich. Man sollte vielmehr erwarten, dass Dunkelheit mit 4-facher Helligkeit abwechselte, da ja die Intensität dem Quadrate der Amplitude proportional ist. Dies wird in der Tat auch bei den Interferenzerscheinungen, wo das Licht der beiden Strahlungsquellen doch von ein und derselben dritten Quelle herrührt, beobachtet. Zur Erklärung der gewöhnlichen einfachen Verdoppelung bedarf es jedoch wiederum der Wahrscheinlichkeitsrechnung. Betrachten wir einen Strahl streng monochromatischen, linear polarisierten, etwa gelben Lichtes, so wird | die Schwingung durch die Sinus-Linie dargestellt: x
t x = a cos vt 20
Hat man nun einen zweiten Strahl ebensolchen gelben Lichtes, so ist dessen Gleichung nur durch die Phase ϕ unterschieden, d. h. x = a cos(vt + ϕ). Die Zusammensetzung beider liefert also den Strahl 25
30
x = a cos vt + a cos(vt + ϕ) ϕ ϕ = 2a cos cos(vt + ) 2 2 ϕ = a cos(vt + ) 2 wo der neue Schwingungsausschlag ϕ a = 2a cos 2 also = 0 (für ϕ = π: Dunkelheit) bis = 2a (für ϕ = 0: 4-fache Helligkeit) sein kann. Diese sogenannte Interferenzerscheinung wird nun tatsächlich bei 2 verschiedenen Lichtquellen niemals beobachtet, vielmehr tritt diese Erschei-
71
716
72
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
nung nur ein, wenn man 2 Strahlen aus der nämlichen Lichtquelle etwa von 2 verschiedenen Spiegelbildern nimmt. Daraus schliessen wir, dass der Lichtstrahl nicht genau so andauernd regelmässige Wellenzüge aufweist, sondern zugleich ein Produkt des Zufalls ist, indem nämlich ein natürlicher Lichtsstrahl eine Folge von einander ausschliessenden Wellenzügen mit willkür|lich wechselnder Phase ist. Nun ist die Phase durch irgendeine Grösse
5
0 ϕ 2π dargestellt; es gibt also unendlich viele, ja kontinuierlich viele Phasen. Zur Anwendung der Wahrscheinlichkeitsrechnung ist aber eine Diskontinuität notwendig, die wir uns künstlich herstellen müssen. Dazu teilen wir die Skala der ϕ in r gleiche Intervalle innerhalb derer wir die ϕ ϕ1 ϕ 2 ϕn als nicht verschieden und gleich irgendeinem hineinfallenden Wert ϕn betrachten. Damit haben wir dann die 2π 0 erforderliche Diskontinuität und können die Rechnung durchführen. Im lim r = ∞ verschwindet dabei jede Willkür, und es wird die wahrscheinliche Helligkeit gleich 2π ϕ 2 (2a)2 π 1 (2a cos ) dϕ = 95 cos2 ψdψ 2π 0 2 π 0 (2a)2 π · = 2a2 . π 2 Also die eintretende doppelte Helligkeit ist lediglich eine Folge des Zufalls. Wenn nun auch, wie diese beiden Beispiele zeigen, die Wahrscheinlichkeitstheorie mit Massenerscheinungen und Mittelwerten rechnet, so darf man doch nicht glauben, dass deshalb nicht auch die feinsten Vorgänge durch sie erklärt werden. Z. B. könnte man bei unserem Sandhaufenproblem oder der Kaffee-Milch-Mischung sehr wohl genauer nach der wahrscheinlichen Abweichung fragen, die die Verteilung des schwarzen und weissen Sandes von der normalen gleichen Dichte beider Körnersorten an den verschiedenen Stellen des Sandhaufens aufweist. Von solchen Dichteschwankungen in der Atmosphäre habe ich hier sogar schon einmal gesprochen. Die Tatsache, dass die atmosphä|rische Luft bei zerstreutem Licht im himmlischen Blau bei durchgehendem rötlich erscheint, beruhte auf den Dichteschwankungen in der Luft und der dort benutzte Satz, dass diese sich proportional mit der Quadratwurzel aus der mittleren Dichte ergeben, ist eben ein Resultat der Wahrscheinlichkeit.
10
15
=
73
20
25
30
Schwankungen Wir wollen dies noch genauer ausführen. Für die Schwankungen der Molekülzahlen — mit diesen sind ja die Dichteschwankungen proportional — gilt folgende Formel: Nehmen wir ein kleines ausgezeichnetes Volumen in einem grossen Gasraum. Die mittlere Zahl der Moleküle in dem Beobachtungsvolumen sei n und die tatsächliche Anzahl bei einer Beobachtung a. Dann ist für 95 Version
A: The π in the denominator is missing.
35
‘Über das Unendliche’ (1924/25)
5
10
717
eine hinreichend grosse Zahl von Beobachtungen √ |a − n| = n also der Mittelwert der Abweichungen, d. h. die mittlere Abweichung proportional der Quadratwurzel aus dem Mittelwert selbst. Die mittlere Abweichung stellt zugleich die wahrscheinliche Abweichung dar, d. h. die bei einem Versuch zu erwartende. Bei grossem n wird zwar a − n sehr gross sein können |a−n| = √1n geht aber trotzdem gegen Null. n Dieser Satz ist wiederum nur eine spezielle Einzelheit aus der kinetischen Theorie der Materie, die überhaupt das weiteste und fruchtbarste Anwendungsgebiet der Wahrscheinlichkeitsrechnung ist. Irreversibilität
15
20
25
30
35
40
Wenn man noch innerhalb dieser den wichtigsten Punkt oder den hervorstechendsten Erfolg bezeichnen soll, so besteht derselbe darin, dass die Wahrscheinlichkeit die volle Aufklärung der Irreversibilität gebracht hat, eine Aufklärung, die durch die Naturgesetze an sich niemals hätte gewonnen werden können. Denn diese sind allemal | letzten Endes durch Differentialgleichungen formulierbar, die bezüglich der Transformation von t in −t invarianten Charakter haben, sodass auch alle aus ihnen ableitbaren Folgerungen keinerlei Bevorzugung einer Zeitrichtung erkennen lassen dürfen. Irreversibel heissen die in der Natur so häufig vorkommenden Vorgänge, bei denen doch eine solche Auszeichnung der Zeitrichtung vorhanden zu sein scheint, die also stets in derselben Richtung verlaufen. Haben wir z. B. in einem Gefäss durch eine Scheidewand getrennt zwei Gase, und nehmen die Trennungswand fort, so wird nach kurzer Zeit an jeder Stelle ein gleichmässiges Gemisch der beiden Gase vorhanden sein, während der umgekehrte Vorgang, die selbsttätige Entmischung nie beobachtet wird. Dabei ist sie nach den Gesetzen der reinen Mechanik genau so gut möglich. Die Lösung dieses Paradoxons gibt nun die Wahrscheinlichkeitstheorie, indem sie zeigt, dass die Entmischung ausserordentlich unwahrscheinlich ist und daher nach unserem Leitsatz: „das was sehr unwahrscheinlich ist, kommt auch nicht vor“ auch nicht beobachtet wird. Wie wichtig auch für rein mathematische Untersuchungen die Wahrscheinlichkeitsrechnung sein kann, möge folgendes Beispiel lehren: Wir können häufig mathematische, z. B. arithmetische Sätze an Beispielen erläutern. Dabei kommen wir, wenn wir den Beweis noch nicht haben und also seine Richtigkeit nicht kennen, doch leicht zu der Ueberzeugung von seiner Gültigkeit. Z. B. werden wir nach Auffindung zahlreicher Kongruenzen der Form: a4 ≡ 1 (5), a6 ≡ 1 (7) a2 ≡ 1 (3), den allgemeinen Satz wo a eine beliebige Zahl ≡ 0 (p) ap−1 ≡ 1 (p) und p eine beliebige Primzahl ist, vermuten. Doch muss man bisweilen vorsichtig in solchen Vermutungen sein, wie folgendes Beispiel zeigt.
74
75
718
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
Goldbachscher Satz Der bis jetzt noch unbewiesene Goldbachsche Satz besagt, dass jede gerade Zahl auf mindestens eine Weise als Summe zweier Primzahlen darstellbar ist, und in der Tat ist er durch Ausprobieren für alle Zahlen unter 4000 bestätigt. Können wir nun daraus etwas über seine Richtigkeit schliessen? Um dieses zu entscheiden, betrachten wir ihn vom Standpunkt der Wahrscheinlichkeit. Damit eine gerade Zahl 2n, — n sei eine gegebene feste Zahl —, ein Gegenbeispiel bildet, würde erforderlich sein, dass für sie eine Zerlegung
5
2n = p + q, wo p und q Primzahlen sind, nicht existiert. Eine der Zahlen p, q muss nun offenbar n sein, z. B. p. Greifen wir nun unter den ungeraden Zahlen n die Primzahlen heraus — deren Zahl sei π(n) — (bekanntlich ist näherungsweise π(n) = logn n ) —, so müsste für jede von diesen die Differenz
10
l = 2n − p zerlegbar sein. Wir haben also gewissermassen π(n) Ziehungen einer Zahl l. Als gleich mögliche Werte für l kommen die ungeraden Zahlen von n bis 2n in Betracht, deren Anzahl n2 (n sei gerade) ist, als günstige Werte die zerlegbaren Zahlen. Die Anzahl der Primzahlen von n bis 2n ist nun π(2n) − π(n), also die der zerlegbaren ungeraden n − [π(2n) − π(n)]. 2 Somit ist die Wahrscheinlichkeit Wn , dass 2n ein Gegenbeispiel gegen den Goldbachschen Satz bildet: π(2n) − π(n) π(n) Wn = (1 − ) . n+1
15
20
2
76
Für grosse n ist
π(n)· lg n n
nahezu gleich 1; wir erhalten daher näherungsweise:
Wn ∼ (1 −
2n lg 2n
−
n lg n
n 2
n
) lg n
2 ) <e lg n Die Wahrscheinlichkeit, dass eine der Zahlen Wn ∼ (1 −
n lg n
− lg2n 2n
25
.
2n, 2n + 2, 2n + 4, 2n + 6, . . . ein Gegenbeispiel bildet, ist < Wn + Wn+1 + Wn+2 + . . . Für die Wahrscheinlichkeit, dass für eine Zahl 2n der Goldbachsche Satz falsch ist, erhalten wir also angenähert den Ausdruck 2n
2(n+1)
e− lg 2n + e− lg 2(n+1) + . . . ∞
< n
2x
n
e− lg 2x dx96 < e lg 2n
für grosse n.
30
‘Über das Unendliche’ (1924/25)
5
10
15
20
719
Für n = 4000, also für die Wahrscheinlichkeit, dass ein Gegenbeispiel > 4000 existiert, findet man, dass sie < 2−100 , also ganz verschwindend ist. Man darf also nicht erwarten, durch weiteres Probieren die Entscheidung (d. h. also ein Gegenbeispiel) zu finden. Trotzdem darf man aber nicht schliessen, dass der Satz wahrscheinlich richtig sei, ebenso wenig wie man etwa aus der Tatsache, dass die irrationalen Zahlen in ungeheuer viel grösserer Menge als die rationalen vorhanden sind, schliessen darf, dass eine vorgegebene Zahl irrational sei. Wenn wir wieder zu den physikalischen Anwendungen der Wahrscheinlichkeitsrechnung zurückkehren und die dort erlangten Resultate überblicken, so nehmen wir ihren engen Zusammenhang mit der Atomistik und Molekulartheorie wahr. Ja, wir könnten behaupten, | dass erst durch die Wahrscheinlichkeitstheorie die Atomistik streng und unmittelbar erwiesen worden sei. Denken wir z. B. an die Brownsche Bewegung. Aber auch ausserhalb des Rahmens der Physik bewährt sich die Wahrscheinlichkeit in dem Sinne, dass sie die Diskontinuität, die Unteilbarkeit und damit in gewissem Sinne die Endlichkeit in der Natur erkennen lehrt. Und ein Beipiel für eine solche Anwendung, wo wir zu ganz unerwarteten Resultaten kommen, bietet die Biologie, wo die Wahrscheinlichkeitslehre geradezu das Tor ist, durch das strenge mathematische Beweisführung Eintritt erlangt.
77
Biologie
25
30
35
40
Hier in der Biologie sind statistische Methoden ein sehr wichtiges, bisweilen das einzige Hilfsmittel der Forschung. Denn sahen wir schon, dass der Lichtstrahl, selbst der monochromatische linear polarisierte, ein Produkt des Zufalls ist, so dürfen wir erst recht behaupten, dass das einzelne lebende Wesen ein Produkt des Zufalls ist. D. h. es haben bei seiner Entstehung und Entwicklung ausserordentlich viele und im einzelnen nicht übersehbare Umstände mitgewirkt, sodass wir die einzelnen Ursachkomplexe nicht isolieren können. Wir sind daher zur Feststellung von Gesetzmässigkeiten auf die Untersuchung sehr vieler Fälle angewiesen, bei denen sich dann die unregelmässigen Einzelfaktoren ausgleichen. Gerade für solche Untersuchungen ist die Wahrscheinlichkeitsrechnung das rechte Werkzeug, schon bei elementaren Fragen. Nehmen wir z. B. die Untersuchung eines einfachen Merkmals, z. B. die Wirkung einzelner Faktoren auf die Grösse eines Individuums. Hier wirken sicher ausserordentlich viele Teilursachen mit, wie die mannigfach verschiedenen Lebensbedingungen, Erbanlagen, u. s. w., so|dass, wenn wir zahlreiche Individuen derselben Art betrachten, alle diese etwas verschieden an Grösse sind. Wir bekommen, wenn wir sie in verschiedene Klassen nach der Grösse einteilen, eine Verteilung, die meist ein bestimmtes typisches Verhältnis zeigt. Die Werte gruppieren sich um einen häufigsten mittleren Wert, wobei grössere Abweichungen immer seltener vorkommen. Wir erhalten so eine typische Fehlerkurve, die, wie sich mathematisch zeigen lässt, stets das 96 Version
A: The ‘x’s have been overwritten by ‘n’s.
78
720
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
Ergebnis zahlreicher sich kombinierender teils die Grösse fördernder, teils sie hemmender Einflüsse ist. Ein sehr einfaches und anschauliches Beispiel für das Zustandekommen einer solchen Verteilung bildet das sogenannte Galtonsche Brett. Dies ist ein Brett, das in der Weise mit Nägeln beschlagen ist, dass sie Reihen mit gleichen Abständen bilden und dabei die Nägel einer Reihe immer in der Mitte zwischen je zwei Nägeln der darüberliegenden Reihe liegen:
Es werden nun genau über einem Nagel der obersten Reihe Kugeln fallen gelassen. Diesen bietet sich dann 2 gleichberechtigte Möglichkeiten. Sie können entweder rechts oder links herabfallen, bis sie wieder durch einen Nagel aufgehalten werden, und sich dann dieses Spiel von Neuem wiederholt. Unter der untersten Nagelreihe sind nun Kästen angebracht, in denen die Kugeln liegen bleiben, deren Verteilung auf die einzelnen Intervalle dann unmittelbar ersichtlich ist. Man bekommt dann stets angenähert eine sogenannte Fehlerkurve, die durch die Formel 2
y = Ce−cx , 79
C > 0, c > 0
5
10
15
dargestellt wird. Sie enthält noch 2 Parameter C und c, von denen | jedoch nur einer wesentlich ist und von den Versuchs-Bedingungen abhängt.
Verteilungskurven Ganz ebensolche Verteilungskurven erhalten wir in der Biologie. Wollen wir z. B. die Längen einer bestimmten Art, z. B. der vorkommenden Hirschkäfer bestimmen, so werden wir auf der Abszisse die Längen und als Ordinate jedesmal die Anzahl der Käfer dieser Länge auftragen. Erhalten wir dabei etwa folgendes Bild:
20
Anzahl
Grösse
so wissen wir, dass die Umstände tatsächlich gleich verteilt waren, und können danach die mittlere Grösse bestimmen. Es ist dann keine systematische Ursache zur Erklärung der Abweichungen nötig. Wenn aber nur z. B. eine
25
‘Über das Unendliche’ (1924/25)
5
721
Unsymmetrie vorhanden ist, so müssen wir auf ein besonderes biologisches Gesetz schliessen, z. B. dass das Zusammenwirken der dem Wachstum günstigen Umstände sich nicht voll auswirken kann, indem ihr einseitig eine Grenze gesetzt ist, die nicht überschritten werden kann. Um eine weitere Möglichkeit anzuführen, so werden wir aus einer Zweigipfligkeit der Verteilungskurve auf das Vorwiegen zweier bestimmter Umstände zu schliessen haben, wie z. B. die Verschiedenheit der Geschlechter oder ähnliches, wobei sich dann zwei einfache Ver|teilungskurven überlagern. 97
80
Verteilungskurve f.d. Weibchen Verteilungskurve f.d. Männchen Verteilungskurve f.d. Gesamtheit
10
Dies sind noch sehr elementare Beispiele. Um aber die Fruchtbarkeit der Methode recht deutlich zu zeigen, wollen wir ihre Auswirkung bei der modernen Vererbungsforschung besprechen, die selbst einen äusserst wichtigen Beitrag zu unserem Unendlichkeitsproblem bietet. Atomistik der Vererbung
15
20
25
30
Dazu müssen wir zunächst die wichtigsten Ergebnisse der Vererbungsforschung angeben. Hier steht nun an der Spitze das fundamentale Resultat, dass die Erbanlage, die ein Lebewesen von seinen Eltern mitbekommt, 98 sein sogenannter Genotypus, 98 nicht etwas kontinuierlich Veränderliches ist, sondern aus einer Zahl 99 diskreter 99 Erbanlagen, den sogenannten Genen oder Erbfaktoren aufgebaut ist. Diese Gene sind gewissermassen Atome der Vererbung. 100 An die Stelle eines solchen kann nur ein anderes treten, zu dem es keinen kontinuierlichen Uebergang gibt. Bei der Befruchtung wird dem Nachkommen von jedem seiner beiden Eltern die Hälfte ihrer Erbfaktoren weiter gegeben. Dies ist das Resultat der Mendelschen Kreuzungsexperimente, die wir gleich an Hand der Genvorstellung erläutern wollen. 100 Wir nehmen zunächst den einfachsten Fall an, dass die Eltern nur in einem Merkmal verschieden seien. Z. B. gibt es bei der Wunderblume (mirabilis jalapa) eine rot und eine weissblühende Sorte, die sonst ganz gleich sind. Bezeichnen wir den Erbfaktor, der das Merkmal rot bestimmt, mit A und den, der das gegensätzliche Merkmal weiss bestimmt mit a, so müssen wir die Veranlagung der beiden Elternrassen, die für sich rein sind, mit AA bezw. aa, | also mit doppelten Buchstaben
97 Version B: The order of the labels in the diagram below is: Männchen, Weibchen, Gesammtheit sic 98–98 Version B: Enclosed by Hilbert in parentheses. 99–99 Version B: Underlined by Hilbert. In the margin Hilbert has written: Also wie bei dem ersten Eindruck auch Materie, Elektrizität kontinuierlich erscheint und hernach ganz im Gegenteil atomistische Struktur! 100–100 Version B: Enclosed by Hilbert in parentheses.
81
722
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
bezeichnen. Der Bastard, der nun durch Vereinigung der beiden verschiedenen reinen Rassen entsteht, hat dann die Formel Aa. Alle Abkömmlinge in erster Generation sind dabei gleich, da sie ja dieselbe Formel haben, und stehen in unserem Falle zwischen den Eltern, sind also rosa. Die behauptete Diskontinuität der Vererbung, ihr atomistischer Charakter, zeigt sich nun bei dem weiteren Erbgang in der nächsten Generation. Hier trennen sich nämlich diese beiden Anlagen wieder, indem von einem Aa Individuum seinen Nachkommen zur einen Hälfte der Faktor A und zur anderen Hälfte der Faktor a vererbt wird. Im ganzen erhalten wir folgendes Schema: 101 Eltern 1. Generation 2. Generation
82
× aa ! " Aa mit Aa ! " AA Aa aA aa
AA
Die erste Generation ist also gleichförmig, während die zweite sich in die drei Gruppen AA, Aa und aa aufspaltet, und zwar im Verhältnis 1 : 2 : 1. Genau dies wird auch durch das Experiment geliefert. Unter 4 Blumen 1 rote, 1 weisse, 2 rosa — in demselben Sinne gemeint, wie wenn man sagt, dass unter 6 Würfeln 1 mal 1, 1 mal 2 u. s. w. gewürfelt wird. 102 In ähnlicher Weise lassen sich auch kompliziertere Verhältnisse wie das Verhalten der Nachkommen, wenn die Eltern in mehr als einem Merkmal von einander abweichen, auflösen. 102, 103 Diese Gesetze sind schon allein durch die Beobachtung von Kreuzungen hergeleitet worden. 104 Wir sind aber heute erheblich weitergekommen, denn wir kennen schon den Mechanismus, auf dem sie beruhen, und die materiellen Träger, in denen die Erbfaktoren lokalisiert sind. Als diese sind nämlich heute mit Sicherheit die sogenannten | Chromosomen erkannt. Dies sind bestimmte Fäden, d. h. linienförmige (eindimensionale) Gebilde in den Kernen der Zelle, 105 die bei deren Teilung ein besonders eigenartiges Verhalten zeigen. 105, 106 Diese Chromosomen treten nun in den Zellen immer paarweise auf, d. h. es ist immer eine doppelte Garnitur von Chromosomen vorhanden, im All-
101 Version B: Next to the three lines below, Hilbert has added ‘Wunderblume Just S. 12’ and, in ink, ‘und wenn wir von 2 rassereinen Eltern ausgehen; dies Kolleg S. 83’. A single set of parentheses encloses both remarks. The reference in the first remark is to Just 1927 . 102–102 Version B: Enclosed by Hilbert in parentheses. 103 Version B: Added by Hilbert: Aber auch bei 3ter , 4ter . . . Generation kommt etwa rötlich-weiss oder weisslich-rot zu Stande! 104 Version B: On the opposite page, Hilbert has written the following and directed it to this place by an arrow: Ihre Geschichte ist sehr merkwürdig: Mendel im Klostergarten zu Brün an Erbsen, die er sähte und bestäubte. Noch 20 Jahre lebte er, ohne dass ihn jemand verstand. Erst 35 Jahre später um 1900 3 Gelehrte, unter ihnen der Berliner Biologe Correns. Denkmal, Mendelismus. Merwürdigkeit: Just 28, 29 (gelbe Mäuse). Hier dies Kolleg 24/25 S. 88 105–105 Version B: Enclosed by Hilbert in parentheses. 106 Version B: Added by Hilbert: ‘∗ siehe links’. On the opposite page he has written: Heute Jedermann bekannt, dass der Körper aller Lebewesen aus Zellen besteht: Hautzellen, Drüsenzelle, Muskelzellen, Nervenzellen etc. Milliarden solcher Zellen. Wachstum = gewöhnliche Teilung: Goldschmidt S. 44
5
10
15
20
25
‘Über das Unendliche’ (1924/25)
|1
|1
::
|1
::
::
|1
|1 |1
::
|1
::
Gewöhnliche Zelle mit 2 Garnituren Keimzelle mit nur einer Garnitur
::
15
::
10
gemeinen n Paare von Chromosomen, also 2n Chromosomen in jeder Zelle. Dabei sind die Chromosomen eines Paares einander gleich, die verschiedenen Paare sind aber 107 meistens deutlich 107 verschieden. Wir haben also zwei sich gleichwertige Garnituren von je n Chromosomen. 108 Diese sind in allen Körperzellen vorhanden, mit Ausnahme der Keimzellen, in denen nur jeweilig eine einfache Garnitur vorhanden ist. Diese Keimzellen werden bei dem Reifevorgang aus normalen Zellen durch Teilung gebildet, und zwar ist hierbei ein derartiger Mechanismus tätig, dass es völlig dem Zufall überlassen bleibt, aus welcher der beiden Garnituren der 109 Mutterzelle 109 jedes Chromosom der Keimzelle stammt, wenn eben nur eine volle Garnitur zustande kommt.110 111 Bei einer genügend grossen Zahl gebildeter Keimzellen werden dann auch alle Kombinationen vorkommen. 111 Der Wiederaufbau der vollen Chromosomenzahl erfolgt nun bei der Befruchtung, indem die Chromosomen beider elterlichen Zellen vereinigt werden. 112 Wir gewinnen so, bildlich veranschaulicht, folgendes Schema 112 ::
5
723
|1
Damit ergibt sich die Erklärung der Mendelschen Kreuzungsexperimente durch 83 folgendes Schema (wir zeichnen nur ein Chromosom) 113
107–107 Version
B: Enclosed by Hilbert in parentheses. B: Added by Hilbert on the opposite page and directed to this place by an insertion sign: ‘Goldschmidt S. 42, n oder 2n ist Invariante der Art. Woher kommt das? Nun weil jedes Lebewesen aus einer Zelle nach obigem Vorgang durch fortgesetzte Teilung entsteht. Goldschmidt S 42. Dominant, recessiv; Just S. 46, 47. Nun Geschlechtschromosome Anlage zum Männlichsein, Bluterkrankheit.’ The rest of the remark is crossed out: Gelbe Mäuse, Just S. 28. Nun hier dies Kolleg 24/25 S. 88. 109–109 Version B: Corrected by Hilbert to: normalen Zelle 110 Version B: Added by Hilbert on the opposite page and directed to this place by an insertion sign: ‘Das Mittel ist die Reifeteilung, ein ganz anderes Teilungsverfahren als die gewöhnliche Teilung: Goldschmidt S 60 The previous reference is crossed out. vgl. meine Zeichung’; an arrow points to the diagram on p. 82, which has been crossed out, but this is qualified by the remark ‘soll zum Vortrag gelten!’ 111–111 Version B: Enclosed by Hilbert in parentheses. 112–112 Version B: This sentence and the following diagram have been crossed out, but a remark added in the margin reads: soll zum Vortrag gelten! 113 Version B: In the diagram below, the labels ‘A: rot’, ‘a: weiss’, ‘Aa: rosa’ are missing and the connecting lines on the bottom are drawn incorrectly. 108 Version
724
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933) A A
a a
A
a
A: rot a: weiss Aa: rosa
A a
A a
84
A
a
A
a
A A
A a
a A
a a
So erklärt sich, dass, obwohl beide Eltern Bastarde sind, von jeder Sorte rassenreine Nachkommen zustande kommen, und zwar in dem angegebenen Verhältnis 1 : 2 : 1. Dabei sind diese und die noch zu besprechenden Gesetze von der allgemeinsten Gültigkeit in der lebenden Natur: Sie gelten ebenso für die Wunderblume, für das Meerschweinchen, für den Pferdespulwurm wie für den Menschen. In derselben Weise lassen sich diese Vorstellungen auf kompli|ziertere Fälle ausdehnen, bei denen sie sich auch stets bewährt haben, doch sind noch einige bedeutsame Erweiterungen der Theorie hinzugekommen, die wir jetzt besprechen müssen und die für uns die interessantesten sind. 114 Nehmen wir z. B. Kreuzung zweier Rassen, die sich in mehr als einem Merkmal unterscheiden. Diese Merkmale mendeln, wie man sagt, vollständig unabhängig, sofern die betreffenden Gene in verschiedenen Chromosomen lokalisiert sind. Nun kann es aber auch vorkommen, dass sie 115 in demselben Chromosom lokalisiert sind, und dann sind sie offenbar durch einfache Kreuzung nicht zu trennen. 115 Diese Koppelungen und überhaupt die ganzen Vererbungsgesetze sind am genauesten bei einer Fliegenart, der Drosophila, untersucht worden. Hier zeigte sich eine Koppelung einer ganzen Reihe von Merkmalen. Diese Fliege ist nämlich gewöhnlich A grau B rotäugig C einfarbig D glattflüglich E langflüglich. 116 Es kommen nun aber auch Fliegen mit abweichenden vererblichen Merkmalen vor. Statt grau sind diese Fliegen gelb, statt rotäugig weissäugig u. s. w. Bezeichnen wir diese 117 gegensätzlichen 117 Merkmale mit den entsprechenden kleinen Buchstaben. 114 Version
B: B: 116 Version B: 117–117 Version B: 115–115 Version
Added by Hilbert: Nun 30/31 Underlined by Hilbert with undulating line. Added by Hilbert: hat circa 5000 Gene! Replaced by Hilbert with: neuen
5
10
15
20
25
‘Über das Unendliche’ (1924/25)
5
10
15
20
25
725
a gelb b weissäugig c dunkelfleckig d spaltflüglich e klumpflüglich. Normalerweise sind diese 5 Merkmale miteinander gekoppelt, d. h. wenn eine Fliege gelb ist, dann ist sie auch weissäugig, dunkelfleckig u. s. w. Dies gilt aber nicht ausnahmslos, und hier setzt nun die feinere Theorie ein. Wie so oft, so auch hier ist ein Versagen der alten Regeln, also hier die Durchbrechung der Koppelung, der Ausgangspunkt für neue Entdeckungen. Kreuzen wir nämlich diese beiden verschiedenen Arten, wird man erwarten, dass die Nachkommen mit der Anlage A auch die Anlagen B, C, D, E mitbekommen u. s. w. Tatsächlich kommen aber auch unerwartete Kombinationen vor und zwar in einem ganz bestimmten Prozentverhältnis zu den normalen. Diese prozentualen Abweichungen für irgend zwei Merkmale A, B bezeichnen wir als die Austauschzahl p. Sie bedeutet die Zahl derjenigen Nachkommen unter 100, bei denen die unnormalen Kombinationen Ab und aB auftreten. Dieser zunächst sehr merkwürdig anmutende Bruch der Koppelung findet seine zwanglose Erklärung in der Hypothese des Austausches von Chromosomenabschnitten, wie er bei einigen anderen Tiergattungen anatomisch nachgewiesen ist. Für gewöhnlich wird bei dem Reifevorgang, d. h. bei der Bildung der Keimzellen wie wir schon ausführten aus der doppelten Garnitur der Chromosomen eine wahllos herausgegriffen. Jetzt dagegen kommt noch die Möglichkeit hinzu, dass nur ein Stück eines Chromosoms einer Garnitur herausgenommen wird, und dazu das komplementäre Stück des entsprechenden Chromosoms der anderen Garnitur. Bezeichnen wir die Chromosomen 118 ein 118 Paares mit C1 und C2 , so wird bei der einfachen Mendelschen Vererbung entweder C1 oder C2 übernommen, bei dem Bruch der Koppelung aber ein Stück | des einen und das entgegengesetzte des anderen. C1 C2
30
35
Der Mechanismus dieses Vorgangs ist in der obigen Figur veranschaulicht. Die Chromosomen legen sich nebeneinander, überkreuzen sich, und es wird dann der entstehende Knoten in verkehrtem Sinne abgeschnürt. Damit nun dieser Vorgang eine Erklärung für den Bruch der Koppelung ergibt, so muss das eine Gen in dem einen Stück, und das andere Gen in dem andern Stück lokalisiert sein. Da nun eine ganze Reihe gekoppelter Gene vorhanden sind, so muss ein jedes an einer ganz bestimmten Stelle des Chromosoms lokalisiert sein. Wir kommen so dazu, die Gene in bestimmter Weise im Chromosom anzuordnen, also gewissermassen Chromosomenkarten zu entwerfen:
118–118 Version
B: Corrected by Hilbert to: eines
85
86
726
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
A
87
B
C
D
E
Nehmen wir nun zunächst drei Gene A, B, C an. Wenn unsere Vorstellung richtig ist, so muss offenbar das Zerbrechen auf der Gesamtstrecke AC genau so häufig sein, wie auf AB und BC zusammen genommen, denn wenn das Chromosom zwischen AB bricht, so ist dies auch ein Bruch zwischen AC, und ebenso ist ein Bruch zwischen BC ein solcher zwischen AC. Nach unserer Definition der Austauschzahlen, die direkt die relativen Häufigkeiten der Brüche zwischen den verschiedenen Genen angeben, muss dann also die Relation pAC = pAB + pBC gelten, und zwar muss eine solche lineare Beziehung für je 3 belie|big herausgegriffene Gene aus den 5 bekannten gekoppelten erfüllt sein. Die Gene müssen sich also in eine Reihe ordnen lassen, so dass sich die 119 Austauschzahlen wie die Entfernungen verhalten. 119 Also muss z. B. die Summe der Austauschzahlen einer Reihe aufeinanderfolgender Gene gleich der Austauschzahl des ersten und letzten Genes der Reihe sein. Diese Beziehungen bestätigen sich nun glänzend für die vorhin angegebenen Eigenschaften der Drosophila, 120 wie aus der folgenden Zusammenstellung ersichtlich A
pAB = 2
pBC = 3 121
pCD = 3
pAC = 3
pBD = 4
pCE = 11, 7
pAD = 6
pBE = 12, 7
pDE = 8, 7
B C
5
10
15
2 1 3
D 14,7 8,7
pAE = 14, 7 E
In Wirklichkeit hatte man natürlich zuerst diese Zahlenbeziehungen entdeckt und daraus dann auf die Anordnung der Gene geschlossen. In allen diesen Untersuchungen spielt die Wahrscheinlichkeitstheorie die Hauptrolle. Alle Resultate aus den Kreuzungen sind ja nur Mittelwerte aus einer grossen Zahl von Versuchen gewonnen. Der Natur der Sache nach können wir ja auch die hier betrachteten Vorgänge im einzelnen nicht verfolgen. Stets bewährt sich aber der einfache Wahrscheinlichkeitsansatz der gleichmöglichen Fälle, sodass wir hier in der Biologie wiederum ein Beispiel für seine weitreichende Bedeutung haben. Zum Schluss möchte ich noch hervorheben, eine wie weitgehende Analogie zwischen Biologie und der Entwicklung der physikalischen Atomistik besteht. Wie zuerst die Atomistik auf Grund der chemischen Tatsachen als eine Hypothese eingeführt wurde, bis man endlich durch ein erdrückendes Material auf den verschiedensten Gebieten zu einem Beweise für ihre Realität kam, 119–119 Version
B: Underlined by Hilbert. B: Added by Hilbert in the left-hand margin: ‘Nun die Blätter Bernays.’ It is not clear to what this refers. 121 Version B: p BC = 3 been been corrected by Hilbert to: pBC = 1 120 Version
20
25
30
‘Über das Unendliche’ (1924/25)
5
10
15
20
25
727
und die Eigenschaften | der Atome 122 im einzelnen studieren konnte, so finden wir denselben Gang in der Vererbungslehre wieder. Zuerst wurden die Gene oder Erbfaktoren begrifflich als reine ideale Elemente zur Erklärung der Vererbungsexperimente eingeführt, ähnlich wie es mit den Grundtatsachen der Chemie war. Später folgte dann die, 123 man kann beinahe sagen 123 physikalische Erkenntnis der wirklichen Realität der Vorgänge in den Chromosomen. Hier sind auch zahlreiche andere Methoden, in denen die direkte Beeinflussung der Keimzellen die Hauptrolle spielt, hinzugetreten und die dem Existenzbeweis die Kraft eines Beweises der exakten Naturwissenschaften geben. Auf diese hochwichtigen und interessanten Untersuchungen können wir hier natürlich nicht eingehen. Trotzdem wird aber wohl die überraschende Parallelität in folgendem Schema deutlich: Atomhypothese auf Grund der chemischen Grundtatsachen. (Gesetz der multiplen Proportionen)
Einführung der Gene als ideale Elemente auf Grund der Kreuzungsexperimente. (Mendelsche Gesetze)
Beweis der Realität der Atome durch direkte Beobachtung.
Beweis der Realität der Gene durch direkte Untersuchung der Keimzellen. (Anatomische Präparate und Beobachtung der Entwicklung künstlich beeinflusster Keimzellen)
(Brownsche Bewegung, Elektronenstoss u. s. w.)
Diese Uebereinstimmung deutet darauf hin, dass 124 wir die Diskretheit der letzten Elemente allen Naturgeschehens 124 in der belebten und der 125 | unbelebten Natur gleichmässig antreffen. Auch die zunächst kontinuierlich erscheinenden und in allen Graden möglich zu denkenden Eigenschaften stellen sich eben in Wahrheit als diskret heraus, und dieses durchgängige Ergebnis der heutigen Wissenschaft redet der Endlichkeit alles Wirklichen das Wort. Asymptotische Gesetze
30
Die Sätze der Wahrscheinlichkeitsrechnung sind asymptotische Gesetze, und dies war für uns der massgebende Gesichtspunkt für ihre genauere Behandlung. Die Form der asymptotischen Gesetzlichkeit ist aber auch über den Bereich der Wahrscheinlichkeit hinaus von grosser theoretischer wie praktischer Bedeutung. Die Ersetzung von etwas Endlichem durch etwas Unend122 Version
B: Hilbert has written across the top of the page: ‘Analogie zwischen Biologie und phys. Atomistik.’ He has marked this paragraph in the left-hand margin down to ‘Chromosomen’, and enclosed the following sentence ‘Hier . . . eingehen.’ in parentheses. 123–123 Version B: Stricken through: man kann beinahe sagen 124–124 Version B: Underlined by Hilbert. 125 Version B: At the bottom of the page, the sentence is finished in Hilbert’s handwriting with the same words that appear at the beginning of the next page (‘unbelebten Natur gleichmässig antreffen.’).
88
89
728
90
91
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
liches zum Zweck einer vereinfachten näherungsweisen Darstellung ist eine besonders in der Physik mit dauerndem Erfolge angewandte Methode. Ja, wenn wir mit der uns durch die Erfahrung nahegelegte Auffassung, dass in der Welt der konkreten Dinge nichts Unendliches vorkommt, Ernst machen, dann müssen wir sagen, dass die Gesetze der Physik soweit sie Differentialgesetze sind, und also auf dem Rechnen mit dem Unendlichen beruhen, alle den Charakter von asymptotischen Gesetzen haben, die tatsächlich nur angenähert verwirklicht sind. So sind insbesondere die Gesetze der Mechanik der Kontinua, d. h. die Gesetze der Flüssigkeits-Bewegungen und der Elastizität nicht anders aufzufassen als im Sinne von asymptotischen Gesetzen, welche durch die näherungsweise Ersetzung der diskreten Raumerfüllung durch eine stetige Erfüllung zustandekommen. Auch die Gesetze der Strahlung, welche eine Folge der Maxwellschen Gleichungen sind, werden auf Grund der Quantentheorie jetzt | nur noch als asymptotische Gesetze aufgefasst, welche erhalten werden durch den Grenzübergang von einer sehr grossen Zahl diskreter Ausstrahlungsprozesse zu einer kontinuierlichen Ausstrahlung. Dieser Charakter der Gesetze kommt hier besonders scharf zum Ausdruck durch das in der Quantentheorie angewandte „Korrespondenzprinzip“. Dieses Gesetz besteht ja gerade darin, dass man aus den bekannten asymptotischen Gesetzen der Strahlung in bestimmter Weise Schlüsse zieht auf die Gesetze im Diskreten. Der Begriff des asymptotischen Gesetzes bildet die Brücke zwischen der Endlichkeit in der Wirklichkeit und der Unendlichkeit in unseren Gedanken, wie sie durch die mathematische Analysis präzisiert und in ihren Beziehungen beherrscht wird. Der Grund für die Anwendbarkeit und Dienlichkeit dieses Begriffes liegt in der früher erwähnten Tatsache, dass die Natur, wenn auch nicht das Unendliche, so doch ungeheure Grössenunterschiede und ungeheure Anzahlen enthält. Der Nutzen der asymptotischen Gesetze beruht darauf, dass durch den Grenzübergang zum Unendlichen meist eine wesentliche Vereinfachung erzielt wird. Die bekanntesten und überzeugendsten Belege dafür sind die Differentialund Integralrechnung und die übrigen Disziplinen der Analysis selber, aber vor allem auch schon der Begriff der Irrationalzahl, ohne den wir heute nicht den kleinsten Schritt machen könnten, ohne rettungslos im Gestrüpp des mathematischen Formalismus unterzugehen. Trotzdem gelangen wir, wie ich schon an früherer Stelle einmal | sagte, durch die Analysis allein noch nicht zu der tiefsten Einsicht in das Wesen des Unendlichen. Diese wird uns vielmehr erst durch eine Disziplin vermittelt, die der allgemeinen philosophischen Betrachtungsweise nähersteht und die überhaupt die Auflösung des ganzen Problems bezweckt, nämlich die Mengenlehre.
5
10
15
20
25
30
35
40
‘Über das Unendliche’ (1924/25)
729
IV. Mengenlehre
5
10
15
20
25
30
35
40
Wie wir nämlich sahen, besteht die Betrachtungsweise des Unendlichen in der Analysis in der Anwendung des Limesbegriffes wie er in den Summen unendlicher Reihen oder dem Integral als Grenze einer endlichen Summe auftritt. Wir haben es da nur zu tun mit dem potentiell Unendlichen, wie man es nennt, also mit dem Unendlichkleinen und Unendlichgrossen, aber es fehlt noch, um es populär auszudrücken, das Unendlichviele. Dieses haben wir z. B., wenn wir die Gesamtheit der Zahlen 1, 2, 3, 4, . . . selbst als eine fertige Einheit betrachten, oder die Punkte einer Strecke als eine Gesamtheit von Dingen. Diese Art des Unendlichen wird als das aktual Unendliche bezeichnet. Die erste Frage, die hier auftritt, ist die: wie unterscheiden sich solche unendliche Gesamtheiten von den endlichen? Bevor wir hierzu übergehen, wollen wir noch einmal einen kurzen Rückblick auf unsere bisherigen Betrachtungen werfen. Das Programm der Vorlesung war von Anfang an, zum Studium des Unendlichen Material zu sammeln, und zu diesem Zweck alle Disziplinen durchzugehen, in denen das Unendliche eine Rolle spielt. In diesem Sinne brachte ich bereits die Arithmetik, die Geometrie, die Analysis, die Physik der Materie, die Kosmologie und die Wahrscheinlichkeitsrechnung einschliesslich ihrer verschiedenartigen Anwendungen, sowie die Biologie zur Sprache. Zuletzt kamen wir nun zu der Disziplin, die berufen ist, das Unendliche im Tiefsten zu erfassen, zur Men|genlehre. Dieser merkwürdigen und an Originalität im Reigen der Wissenschaften einzig dastehende Disziplin will ich 2 Stunden widmen und dann die 3 letzten Stunden für die Logik übrig behalten. Endliche und unendliche Mengen Ich hatte bereits die Betrachtungen zur Mengenlehre eingeleitet durch die Bemerkung, dass es sich jetzt nicht mehr wie früher darum handelt, bloss das Unendliche wie in der Analysis entstehen zu lassen, z. B. indem man an eine Zahl die nächste anreiht, sondern die Gesamtheit aller ganzen Zahlen als fertige neue Einheit anzusehen. Von diesem Gesichtpunkt aus, wollen wir also die unterscheidenden Merkmale zwischen endlichen und unendlichen Gesamtheiten auffinden. Wir untersuchen zunächst den Begriff der Gleichheit. Bei endlichen Mengen tritt gar keine Schwierigkeit auf. Wir werden z. B. in einer Gesellschaft von Damen und Herren auffordern, jeder Herr solle eine Dame engagieren, und wenn dann niemand übrig bleibt, so sagen wir, die Mengen der Damen und Herren seien gleichzahlig. Aber, wenn wir es dabei bewenden liessen, würden wir einen Verstoss gegen die Logik machen: wir haben offenbar noch nötig, die Hauptsache nachzuholen, nämlich den Nachweis, dass das Resultat des Aufgehens von der Wahl der Zuordnung unabhängig ist. Wir müssen also die Herren bitten, sich beliebig anders zu engagieren und dann werden wir uns schliesslich überzeugen, dass jedesmal dasselbe Ergebnis sich erweist, dass niemand übrig bleibt. Z. B. ist die
92
730
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
Menge (1) ∼ (gleichzahlig) mit Menge (a) und
93
94
(1, 2) ∼ (a, b)
Eine Anwendung dieser Tatsache wird der Hotelwirt machen, der ein Hotel mit einer endlichen Zahl von Zimmern hat. Alle diese Zimmer seien mit je einem Gaste belegt. Wenn nun die Gäste ihre Zimmer ir|gendwie vertauschen, sodass wieder in jedem Zimmer nicht mehr als ein Gast wohnt, so wird dadurch kein Zimmer frei, und der Hotelwirt kann auf diese Weise für einen neu ankommenden Gast keinen Platz schaffen. Wir können auch sagen: Ein Teil einer endlichen Menge ist niemals zahlengleich dem Ganzen. Wenn eine Menge N gleich einer Teilmenge von M , aber nicht N gleich M ist, so heisse N < M . Bei endlichen Mengen ist also ein Teil immer < als das Ganze. Charakteristisch für endliche Mengen ist auch, dass es nur endlich viele verschiedene Anordnungen der Elemente einer Menge gibt, mag die Zahl der Elemente auch noch so gross sein. Zur Veranschaulichung diene folgendes Beispiel: Denken wir uns, dass kein Buch mehr als 10000 Worte, kein Wort mehr als 20 Buchstaben, endlich, dass keine Bibliothek mehr als 100000 Bände besitzt. So muss, falls es unendlich viele Bibliotheken gibt, auch unendlich viele untereinander vollkommen gleiche Bibliotheken geben, da nur endlich viele Möglichkeiten zur Anordnung der Buchstaben vorhanden sind.
5
10
15
Gleichzahligkeit unendlicher Mengen
20
Wie verhält es sich nun mit den unendlichen Mengen? Nehmen wir als einfachstes Beispiel die Menge der ganzen Zahlen. Hier gilt nun schon der Satz: „Der Teil ist kleiner als das Ganze“ nicht mehr. Diese wichtige Tatsache können wir leicht an unserem Beispiel von dem besetzten Hotel deutlich machen. Wir nehmen jetzt an, dass das Hotel unendlich viele numerierte Zimmer 1, 2, 3, 4, 5 . . . haben soll, in denen je ein Gast wohnt. Sobald nun ein neuer Gast hinzukommt, braucht der Wirt nur zu veranlassen, dass jeder der alten Gäste das Zimmer mit der um 1 höheren Nummer bezieht, und es wird für den Neuangekommenen das Zimmer 1 frei.
25
1 1
2 2
3 3
4 4
5 5
6 6
7 7
8 8
9 9
... ...
Natürlich kann für jede endliche Anzahl von neuen Gästen auf die angegebene Weise Platz geschaffen werden, und in einer Welt mit unendlich vielen Häusern und Bewohnern gäbe es also keine Wohnungsnot. Ebenso könnte auch in einer unendlichen Tanzgesellschaft, wenn, nachdem schon alle Herren engagiert haben, eine neue Dame eintrifft, der Tanzordner es leicht arrangieren, dass sie nicht ohne Partner bleibt. Ja sogar für unendlich viele neue Gäste bzw. Damen ist es möglich, Platz zu schaffen. Es muss z. B. nur jeder der alten Gäste, der ursprünglich das Zimmer mit der Nummer n innehatte, nun dasjenige mit der Nummer 2n beziehen, worauf die unendlich vielen Zimmer mit ungeraden Nummern für die neuen Gäste frei werden.
30
35
‘Über das Unendliche’ (1924/25)
5
10
15
20
1
2
3
4
5
6
7
8
9
...
1
2
3
4
5
6
7
8
9
...
731
Also hier gilt nicht mehr der Satz, dass der Teil kleiner als das Ganze ist. Wir erinnern uns, dass wir diesem Satz schon gelegentlich der Behandlung der Geometrie begegnet sind. Die Euklidische Begründung der Lehre von den Flächeninhalten beruht wesentlich auf dem Satze, dass 2 Dreiecke mit gleicher Basis und verschiedener Höhe nicht flächengleich sein können, und dieser Satz wurde von Euklid bewiesen unter Berufung auf den allgemeinen Satz der Grössenlehre, dass der Teil stets kleiner als das Ganze ist. Diese Berufung wäre aber nur bei endlichen Mengen berechtigt. Die Zerlegung von Dreiecken in Teilstücke ist aber unbegrenzt. Daher erkannten wir mit vollem Recht dort eine Lücke bei Euklid, deren Ausfüllung | freilich gelang. Dieses Merkmal spielt, wie wir später sehen werden, in der Entwicklungsgeschichte des Unendlichen die hervorragendste, die entscheidende Rolle. Aber noch mehr und noch Ueberraschenderes enthüllt sich uns: Der Standpunkt, von dem aus wir unsere endlichen und unendlichen Mengen betrachteten, kann als der reine Standpunkt der Vielheit bezeichnet werden, indem wir als leitendes Prinzip die umkehrbare eindeutige Bezugnahme anwandten wie bei den Tanzpaaren und Hotelgästen. Hier waren auch die ganzen Mengen auf die Teilmengen beziehbar, also gleich, „gleichmächtig“ wie der technische Ausdruck ist. Eine Teilmenge erhalten wir ja jedesmal, wenn wir einige Elemente der Menge fortnehmen, wie z. B. die 1 oder die ungeraden Zahlen von der ganzen Zahlenreihe. Andere Beispiele unendlicher Mengen sind die Punkte einer Strecke oder eines Quadrats: 1
y 0
x
1
oder auch reelle Zahlen 0x1
25
0
x
1
Paare reeller Zahlen 0x1 0y1
Diese Systeme unterscheiden sich offensichtlich geometrisch durch ihre Dimensionszahl. Dennoch sind sie überraschender Weise von unserem Standpunkt aus gleich oder „gleichmächtig“. Der Grundgedanke des Beweises ist so durchsichtig und überzeugend, dass er sich auch von jemand, der nicht fachlich gebildet ist, verstehen lässt:
95
732 96
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
Nehmen wir eine beliebige Zahl x zwischen 0 und 1, (0 x 1) | und entwickeln sie in einen Dezimalbruch: z. B. sei x = 0, 34010075091000113307 . . . Es kommt nun darauf an, ein Verfahren zu finden, um aus dieser einen Zahl ein Zahlenpaar zu machen. Nun rascher Entschluss ist keine Hexerei. Wir nehmen einfach abwechselnd die Ziffern und stellen sie zu 2 Dezimalbrüchen zusammen.
5
x = 0, 3007010130 . . . y = 0, 4105900137 . . . Umgekehrt lässt sich auch stets aus irgend 2 Dezimalbruchentwicklungen eine einzige wieder entsprechend zusammenstellen, in der das Paar wiederzuerkennen ist und daher auch rückwärts entnommen werden kann. Obwohl dies der entscheidende Grundgedanke ist, wäre allerdings dieser Beweis mathematisch noch nicht völlig korrekt — wegen der doppelten Möglichkeit mit Nennern 10, 100, 1000 . . . zu entwickeln. Es ist ja z. B.
10
15
0, 17000 . . . = 0, 16999 . . . Man hilft dem ab, indem man die mit 0000 . . . endigenden Brüche ausschliesst und statt der Ziffern Gruppen von Ziffern benutzt, die vorne ev. Nullen haben vor einer von 0 verschiedenen Ziffer. x = 0, (3)(4)(01)(007)(5)(09)(1)(0001)(1)(3)(3)(07) . . . x = 0, (3)(01)(5)(1)(1)(3)
20
y = 0, (4)(007)(09)(0001)(3)(07) Ferner ist — was viel weniger merkwürdig — die Strecke 0 − 1 mit der ganzen Geraden als Punktmenge gleichmächtig. Beweis: 0
97
1
Biege die | Strecke 0−1 zum Halbkreis, ziehe zum Durchmesser des Halbkreises die parallele Tangente und projiziere vom Zentrum aus. Andererseits ist die Strecke 0 − 1 auch mit jedem noch so kurzen Linienstück gleichmächtig, wie sofort aus der Projektion in einem Dreieck ersichtlich.
0
25
1
Ebenso ein Quadrat mit der ganzen Ebene. Aber eine Linie ist nicht nur mit dem Quadrat sondern auch mit dem Würfel gleichmächtig, die Zahlen also mit allen Zahlentripeln: 0 x, y, z 1.
30
‘Über das Unendliche’ (1924/25)
5
10
15
20
25
Ja noch viel mehr: selbst die Menge aller stetigen Kurven in der Ebene und aller stetigen Kurven und Flächen im Raume ist nicht von höherer Mächtigkeit. Alle diese Gebilde haben auf einem kleinsten Linienstück Platz. Von diesem hohen Mächtigkeitsstandpunkte aus verschwinden die Unterschiede der Dimensionen und geometrischen Gebilde, und was früher anschaulich und begrifflich unüberbrückbar erschien, fällt in eine Einheit zusammen. Man könnte nun wirklich auf den Gedanken verfallen, dass jede Gesamtheit mathematischer Grössen oder Gebilde stets dieselbe Mächtigkeit hätte und auf dem Linienstück Platz hätte. Unser Prinzip würde dann sehr an Bedeutung verlieren; es erwiese sich eben als zu grob zu irgendwelchen Unterscheidungen. Dieses Bedenken wird noch weiter gesteigert, wenn wir jetzt die Entdeckung Cantors, die eine der ersten | und grundlegendsten der Mengenlehre war, hinzunehmen, dass nämlich auch auf dem Gebiete der Zahlen in anderer Weise ein solches Verschwinden der Unterschiede vor dem Standpunkt der Mächtigkeiten statt hat. Cantor zeigte nämlich, dass auch alle rationalen Zahlen sich zählen, d. h. numerieren lassen, dass man also jede rationale Zahl mit einer Nummer versehen kann, in der Weise, dass verschiedene rationale Zahlen auch immer verschiedene Nummern haben, und man auch zu jeder Nummer die entsprechende rationale Zahl angeben kann. Dies erscheint auf den ersten Blick geradezu unbegreiflich, da ja die rationalen Zahlen innerhalb des Kontinuums der reellen Zahlen überall dicht liegen. Es kann ja jeder reelle Punkt beliebig durch rationale Punkte eingeschlossen werden. Es beruht ja schon die gewöhnliche Dezimalbruchentwicklung der reellen Zahlen darauf, dass sie schon durch die speziellen rationalen Zahlen mit den Nennern 10, 100, 1000. . . beliebig gut angenähert werden können. Dass trotzdem die Abzählung möglich ist, kann man auf folgende Weise einsehen. Man legt ein quadratisches Schema an, das nach rechts und nach unten offen ist: 1 2 1 2 3 4 5 6 7
30
35
733
1 1 2 1 3 1 4 1 5 1 6 1 7 1
1 2 2 2 3 2 4 2 5 2 6 2
3
4
5
6
7
1 3 2 3 3 3 4 3 5 3
1 4 2 4 3 4 4 4
1 5 2 5 3 5
1 6 2 6
1 7
Hierin weist man dem Bruch m/n dasjenige Feld zu, welches in der m-ten Zeile und in der n-ten Spalte liegt. Auf diese Weise werden al|le rationalen Brüche in das Schema eingeordnet. Nun kann man, wie in der Figur angedeutet ist, eine Linie ziehen, welche durch alle Felder des Schemas nacheinander hindurchgeht. Diese Linie verfolge man und schreibe die Brüche in der Reihenfolge auf, in der die zugehörigen Felder von der Linie getroffen werden. Lässt man nun noch alle diejenigen Brüche weg, die mit einem vorhergehenden dem Werte nach
98
99
734
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
übereinstimmen, dann hat man die rationalen Zahlen in eine Reihe geordnet: 1/1, 1/2, 2/1, 3/1, 1/4, 2/3, 3/2, 4/1, 5/1, . . . und indem man jeder rationalen Zahl ihre Stellenzahl in dieser Reihe als Nummer zuweist, ist die Numerierung der rationalen Zahlen vollzogen. Aber noch viel ausgedehntere Systeme von Zahlen kann man angeben, denen die Eigenschaft der Abzählbarkeit zukommt. Ein Beispiel ist das System aller durch Quadratwurzeln darstellbaren Zahlen, sodass alle mit Lineal und Zirkel konstruierbaren Punkte in der Zeichenebene abzählbar sind. Aber auch das System aller mit Kubik- und beliebigen Wurzeln darstellbaren Zahlen besitzt die gleiche Eigenschaft, ein Resultat, das wohl einen jeden, der davon zum ersten Mal hört, und dessen Gefühl noch naiv und unabgestumpft ist, in Erstaunen setzen muss. Aber wenn er sich von diesem Erstaunen erholt hat, wird er wohl leicht wiederum auf die Frage kommen, ob die Abzählbarkeit nicht doch eine Eigenschaft aller Zahlsysteme wäre: Dann würde ja wohl die Entdeckung sehr von ihrem Zauber und Reiz verlieren.
5
10
15
Nichtabzählbarkeit des Kontinuums 100
Dies ist nun aber nicht der Fall. Wie die zweite grosse Entdec|kung Cantors zeigte, behält der Vielheitsstandpunkt in der Lehre von den unendlichen Mengen seinen Wert. Cantor bewies nämlich, dass die zweite von uns betrachtete besonders wichtige Menge, die Menge der Punkte auf einer Strecke, also die Menge aller reellen Zahlen, nicht abzählbar ist, sondern einen grösseren Vorrat von Punkten, eine höhere Mächtigkeit, wie man sagt, besitzt. Der Beweis hiervon wird indirekt geführt. Angenommen die Menge aller reellen Zahlen wäre abzählbar, so müsste dasselbe auch für jede Teilmenge gelten. Denn durch eine Numerierung aller reellen Zahlen würden ja auch die Zahlen der Teilmenge in eine bestimmte Reihenfolge gebracht. Insbesondere müsste es also auch eine Abzählung aller derjenigen reellen Zahlen im Intervall 0 bis 1 geben, in deren Dezimalbruchentwicklung nur die Ziffern 0 und 1 auftreten. Da diese Dezimalbruchentwicklungen den durch sie dargestellten reellen Zahlen umkehrbar eindeutig entsprechen, so müssten auch sie numeriert werden können, d. h. es müssten alle diese Dezimalbrüche in eine Reihe
20
25
30
d1 , d2 , d3 , d4 , d5 , . . . geordnet werden können, in der alle diese Dezimalbrüche auch vorkommen. Dies ist aber nicht möglich. Sei etwa diese Reihe: d1 = 0, 010111010011
35
d2 = 0, 01001011100001 d3 = 0, 100001111100101 d4 = 0, 0111101010001 d5 = 0, 10001011001100 101
Nun bilden wir den Dezimalbruch, der an erster Stelle hinter dem Komma eine andere Ziffer als d1 hat, an zweiter Stelle eine andere | als d2 , u. s. w. an
40
‘Über das Unendliche’ (1924/25)
5
10
15
20
25
30
35
735
der nten Stelle eine andere Ziffer als dn . Er wäre also hier gleich 0, 10100 . . . Diese Zahl kommt nun, da sie sich von allen Zahlen der Reihe d1 , d2 , . . . in mindestens einer Stelle unterscheidet, in dieser Reihe sicher nicht vor, und darin liegt der Widerspruch mit unserer Annahme. Wegen der Wichtigkeit dieser Einsicht möchte ich Ihnen noch eine andere Begründung dafür geben, die uns zugleich mehr als das liefert und weitere Perspektiven eröffnet. Ich möchte Ihnen nämlich ein allgemeines Verfahren angeben, das allemal gestattet, wenn irgendeine Menge vorgelegt ist, eine grössere zu finden. Die vorgelegte Menge sei: M = (a, b, c . . . ) a, b, c ihre Elemente. Nun betrachten wir die Unter- oder Teilmengen von M , z. B. (a), (b), . . . (a, b) . . . (a, b, c)126 . . . M selbst wollen wir auch mit zurechnen, und nun sei T = ((a), (b), . . . (a, b) . . . , M ) die Gesamtheit aller dieser Mengen, als eine Menge, deren Elemente selbst eben jene Teilmengen sind. Ich behaupte: T > M. Denn erstens ist ein Teil von T offenbar mit M gleichmächtig, nämlich die Gesamtheit der aus nur je einem Elemente bestehenden Mengen. Andererseits ist T = M . Denn sonst müssten sich T und M elementweise auf einander beziehen lassen: (a , a ) a b (b ) c (c, c , c , c ). Wir wollen uns diese Zuordnung recht deutlich veranschaulichen, um uns dann klar darüber zu werden, dass sie unmöglich ist. Stellen Sie sich unter M die Menge aller Menschen vor. Diese sollen nun in allen Weisen zu je 1, 2, u. s. w. Vereine bilden. T ist die Gesamtheit aller möglichen Vereine. Die Zuordung machen wir nun so klar, dass wir jeden Verein ein Ehrenmitglied wählen lassen aus ihm selbst oder aus anderen Vereinen mit der einzigen Einschränkung, dass 2 verschiedene Vereine nicht dasselbe Ehrenmitglied haben dürfen. Nun gibt es gewiss Ehrenmitglieder, die nicht gewöhnliche Mitglieder Ihres Vereins sind. Denn sonst wären ja z.B. in den Vereinen (a) bzw. (b) a bzw. b Ehrenmitglieder und demnach müsste schon (a, b) ein Nichtmitglied zum Ehrenmitglied haben. Wir fassen nun diese besonderen Ehrenmitglieder, die nicht Mitglieder ihres Vereins sind, zusammen ins Auge: (e , e , e , . . . ) 126 The
typescript here reads ‘(ab, c)’. We have corrected this here to ‘(a, b, c)’. Missing commas in set enumerations, which are frequent on pp. 101–102, have been corrected silently. From the paragraph beginning ‘Gehen wir nun von der Menge (1, 2, 3, . . . ) aus, . . . ’ at the bottom of p. 102, these mistypings seem not to occur.
102
736
102a127
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
diese bilden einen Verein, dessen Ehrenmitglied e sei. (e , e , e , . . . ) e Nun überlegen wir uns die beiden möglichen Fälle: 1. e käme nicht in (e , e , e , e , . . . ) vor, dann wäre e selbst eines jener besonderen Ehrenmitglieder, wäre also unter den (e , e , e , . . . ) enthalten, käme also doch im Verein (e , e , e , . . . ) vor. 2. e käme in (e , e , e , . . . ) vor, dann würde e ein solches besonderes Ehrenmitglied nicht sein, wäre also unter den (e , e , e , . . . ) nicht enthalten, käme also nicht im Verein (e , e , e , . . . ) vor. In beiden Fällen ist der Widerspruch offenbar. Gehen wir nun von der Menge (1, 2, 3, . . . ) aus, die offenbar das kleinste Unendliche darstellt, so würden wir also in der Menge | alle Teilmengen dieser Menge gewiss eine höhere Mächtigkeit vor uns haben. Diese Menge aber ist nichts anderes als die Punktstrecke. Das ist zwar sehr einfach einzusehen, aber der Kürze wegen gehen wir darüber hinweg. Der nächste Schritt führt zu der Gesamtheit der Teilmengen von Punkten der Strecke 1, und erweist in dieser also die Tatsache, dass es noch eine höhere Mächtigkeit gibt; ein Beispiel ist die Menge aller Kurven und Flächen überhaupt nicht bloss der stetigen. Auf die Gedankenreihe, die hier einsetzt, kommen wir bei einer späteren Gelegenheit noch zurück.
5
10
15
20
Transfinite Ordinalzahlen
103
Wir sehen, welche Fülle von Einsichten sich uns hier erschlossen hat, wie konsequent und harmonisch das Unendliche seine Herrschaft ausübt. Und diese ganze eigenartige Gedankenbildung hatte, wie wir uns erinnern, darin ihren Ursprung, dass wir nach einem unterscheidenden Merkmal für endliche und unendliche Gesamtheiten suchten und dabei auf den reinen Vielheitsstandpunkt geführt wurden, auf dem wir allein bisher stehen blieben. Aber dies ist schon bei endlichen Mengen wohl der primitivste Gesichtspunkt. Mindestens ebenso wichtig ist doch der der Ordnung. Schon die endliche Zahl ist nicht bloss Kardinalzahl — dieser Begriff deckt sich völlig mit dem der Mächtigkeit — sondern auch Ordinalzahl. Dies zeigt sich schon, wenn wir z. B. die 5 Dinge einer Menge zählen und als erstes, zweites, drittes, viertes, fünftes bezeichnen. Eine Menge heisst allgemein „geordnet“, wenn für jedes Element bestimmt ist, welche Elemente die späteren sein sollen; damit sind selbstverständlich auch die früheren bestimmt. Z. B. die Punkte einer Strecke durch ihre Lage. Nun können wir zwar die 5 Dinge einer Menge auf | verschiedene Weise ordnen, aber die Art und Weise oder technisch ausgedrückt der Typ der Ordnung ist doch immer der gleiche: wenn wir z. B. die 5 Personen Anton, Carl, Fritz, Otto, Paul in dieser Weise geordnet haben und machen nun eine Umstellung, so würde durch blosses Umtaufen wieder dieselbe Ordnung der Namen bewirkt werden können. Nehmen wir nun eine unendliche Menge und 127 Version
B: An ‘a’ has been added to the page number. In Version A both this and the previous page are numbered 102.
25
30
35
40
‘Über das Unendliche’ (1924/25)
737
zwar zunächst eine vom kleinsten Unendlichkeitsgrad 1, 2, 3, 4, . . . Diese natürliche Reihenfolge ist offenbar eine Ordnung. Aber auch 2, 3, 4, 5, . . . , 1 5
10
ist eine Ordnung und zwar eine solche, die durch blosse Umtaufung oder Umnumerierung niemals in die erstere zurückgeführt werden kann. Also während die endliche Menge ebenso wie eine Kardinalzahl auch nur eine Ordinalzahl repraesentiert, ist selbst das kleinste Unendlich viel reicher! Denn auch ferner
3 4 5 ... 1 2 4 5 6 ... 1 2 3
ferner
1 3 5 7 ... 2 4 6 8 ...
sind neue, unter sich verschiedene Ordinalzahlen. Es ist auch nicht schwer, für sie geeignete Bezeichnungen einzuführen und Rechnungsregeln aufzustellen, etwa so: 15
1, 2, 3, 4 . . . n, . . . m . . . (endliche Zahlen) 1, 2, 3, 4 . . . ad inf. = ω. Mit diesem Baustein stellen wir dann die weiteren Ordnungstypen auf:
20
25
30
35
ω, ω + 1, . . . ω + n, . . . ω + ω = ω · 2, ω · 2 + 1, . . . ω · 2 + n . . . ω·2 + ω = ω·3... ω · m, ω · m + 1, ω · m + n . . . ω · ω = ω2 , ω2 + 1 . . . ω2 + ω . . . ω2 + ω2 = ω2 · 2 . . . ω2 · 2 + ω . . . ω2 · 2 + ω2 = ω2 · 3 . . . ω2 · m . . . ω3 . . . ωω . . . ... Um wenigstens ein Beispiel für einen höheren Ordnungstypus zu haben, wollen wir eine Menge von dem Ordnungstypus ω 2 aufstellen. Um aus der Menge der ganzen Zahlen eine solche Menge zu bilden, benutzen wir die Tatsache, dass jede ganze Zahl eine eindeutige Zerlegung in Primfaktoren zulässt. Wir ordnen nämlich alle positiven ganzen Zahlen nach folgender Regel: Hat von zwei Zahlen a und b die Zahl a mehr Primfaktoren als die Zahl b, so stehe a hinter b; haben a und b gleich viele Primfaktoren, so entscheide die natürliche Reihenfolge. Dann ergibt sich folgendes Schema:
104
738
105
106
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
1 2 3 5 7 11 13 17 19 23 . . . 4 6 9 10 14 15 21 22 25 . . . 8 12 18 20 27 28 30 . . . 16 24 36 40 . . . Hierin besteht die erste Reihe aus allen Primzahlen in ihrer natürlichen Reihenfolge. Darauf folgen in der zweiten Reihe die Zahlen mit zwei Primfaktoren, allgemein enthält die kte Reihe des Schemas alle Zahlen mit k Primfaktoren. Jede Reihe stellt als geordnete unendliche Teilmenge der ganzen Zahlen die Ordinalzahl ω dar, | daher ist die ganze Menge ω + ω + ω . . . = ω · ω = ω2 . Um keine irrtümlichen Vorstellungen aufkommen zu lassen, wollen wir noch die Bemerkung hinzufügen, dass es auch Ordnungen gibt, die gewissermassen nach vorne hin offen sind, wie z. B. (. . . 3, 2, 1) oder (. . . 6, 4, 2 . . . 7, 5, 3, 1). Diese wollen wir ausschliessen und nur Ordnungen der ersten Art betrachten, bei denen ein erstes Element existiert, und zu jedem Abschnitt der Menge ein nächstfolgendes Element. Eine solche Ordnung wird als Wohlordnung bezeichnet. Wir gaben vorhin eine Tabelle der transfiniten Ordinalzahlen. Ihre Aufstellung kann man auffassen einfach als ein Hinüberzählen über das Unendliche, 128 oder 128 als eine ganz naturgemässe und eindeutig bestimmte, konsequente Fortsetzung des gewöhnlichen Zählens im Endlichen. Wie wir das 1te, 2te, . . . nte Ding einer Menge haben, so haben wir jetzt auch das ωte, ω + 1te, . . . ω ω te Ding einer unendlichen Menge. Bei dieser Sachlage entsteht offenbar die nächstliegende Frage: kann man mit diesen neuen transfiniten Ordinalzahlen, also durch dieses transfinite Zählen nun auch wirklich Mengen auszählen, die im gewöhnlichen Sinne nicht abzählbar sind. Als solche käme in erster Linie die Punktstrecke in Betracht. Kann man durch unsere neuen Ordinalzahlen die Punkte der Strecke 0 − 1 auszählen? Eine notwendige Bedingung dafür ist offenbar, dass die Menge, deren Elemente diese Ordinalzahlen selbst sind Ω = (ω, ω + 1 . . . ω · 2 . . . ω 2 . . . ω 3 . . . ω ω . . . ) nicht im gewöhnlichen Sinne abzählbar ist. Es lässt sich ohne Mühe zeigen, dass Ω diese Bedingung erfüllt, und wir haben also in Ω ein neues Beipiel einer überabzählbaren Menge Ω > (1, 2, 3 . . . ). Aber, wenn wir Ω vom Standpunkt der Vielheit, also als Kardinalzahl im Sinne der Mächtigkeit betrachten, weist Ω noch eine andere fundamentale Eigenschaft auf. Ω erweist sich als eine Menge von der genau nächst höheren Mächtigkeit, ist also unter den überabzählbaren Mengen das kleinste Unendlich. Dies war eines der schönsten und wichtigsten Resultate von Georg Cantor! Unsere obige Frage aber ist das berühmte bisher ungelöste Problem, ob Ω=0 1 ist. Der gegenwärtige Stand unserer Erkenntnis ist dieser. Hinter den von mir definierten transfiniten Zahlen, d. h. die in Ω vorkommen, den sogenannten
128–128 Version
B: Replaced by an unknown hand (ink) with: also
5
10
15
20
25
30
35
40
‘Über das Unendliche’ (1924/25)
5
739
Zahlen der zweiten Zahlenklasse, gibt es noch weitere: man kann über das Ω wieder hinüberzählen wie über das ω. So gelangte schon Cantor zu den Zahlen der höheren Zahlenklassen und diese stellen meines Erachtens im Lande der reinen mathematischen Abstraktionen das Aeusserste dar, was Menschengeist geschaffen hat. Mittels dieser höheren Cantorschen Zahlen kann in der Tat die Strecke 0 − 1 und überhaupt jede mathematische Menge ausgezählt werden, wie sich heute beweisen lässt. Dedekinds Begründung der Mathematik
10
15
20
25
30
35
Zur selben Zeit wie Cantor behandelte ein anderer sehr scharfsinniger Mathematiker das aktual Unendliche, aber in anderer mehr philosophischer Art und in einer andern Absicht, nämlich um zu einer rein logischen Begründung der Zahlentheorie und damit der Mathematik überhaupt zu kommen. Dies war Dedekind mit seiner Schrift | „Was sind und was sollen die Zahlen“. Dedekind geht ebenfalls von der Erkenntnis aus, dass für unendliche Mengen der Teil nicht kleiner als das Ganze zu sein braucht. Und diesen Satz stellt er an die Spitze seiner Theorie, nimmt er als Definition einer unendlichen Menge. Damit kommt ihm der Gedanke, die unendliche Menge überhaupt als das Primäre, Einfache, Einfachste, als Ausgangspunkt der ganzen Theorie zu machen. Ich kann nicht näher darlegen, wie er seinen grossangelegten Plan auszuführen sucht, nur soviel sei gesagt, dass auch die Zahl 1, sodann die endlichen Zahlen 2, 3 . . . von Dedekind aus dem Unendlichen logisch deduziert werden. Der Satz, den wir aus der Erfahrung schöpften, unserer Anschauung entnehmen: dass die Anzahl, d. h. das Resultat der Abzählung gewisser wirklicher vorliegender Objekte von der Aufeinanderfolge, in der wir gezählt haben, unabhängig ist, dieser Satz z. B. wird nach Dedekind zu einem rein logisch beweisbaren Satze. Dedekinds Grundgedanke und seine Endabsicht haben viel Bestechendes: es stände die Zahlentheorie als absolut voraussetzungslose Wissenschaft da! Er fand auch starke Stützen z. B. in dem Philosophen Frege, der seinerseits sogar früher als Dedekind ähnliche Bestrebungen betätigt hatte. So wurde durch die Zusammenarbeit von Frege, Dedekind, Cantor das Unendliche auf den Thron erhoben und genoss damals seinen höchsten Triumph. Es sollte der Urquell der so weitreichenden Mathematik und damit der Wissenschaft überhaupt bilden. Aber es konnte sich auf dieser Höhe, in dieser selbständigen Stellung ohne die Stütze der Anschauung ohne jede empirische Hilfe nicht halten. Es erfolgte ein jäher Sturz. Ich muss Ihnen die Hauptdaten und -anlässe dieser Entwicklung in Kürze vorführen. Paradoxieen
40
Wir knüpfen an die vorhin verlassene Gedankenreihe an, die von der Menge der ganzen Zahlen (1, 2, 3, . . . ) ausgehend, zu höheren Mächtigkeiten führte. Wir wenden auf die Menge der ganzen Zahlen (1, 2, 3, . . . ) die 2 Prozesse an: 1. Prozess Pt (Bildung der Menge aller Teilmengen).
107
108
740
109
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
2. Prozess Pv (Bildung der Vereinigungsmenge, indem man alle Elemente irgend welcher schon vorhandener Mengen zu einer neuen Menge zusammenfasst). Die Elemente dieser Mengen sind also selbst immer Mengen! Was man so erhält, sind alles wiederum Mengen, die man ihrerseits wieder vermöge der beiden Prozesse Pt , Pv zur Bildung neuer Mengen verwertet. Nun endlich betrachten wir die Menge aller Elemente der so entstehenden Mengen: sie entsteht, wenn ich auf alle durch Pt , Pv gebildeten Menge eben Pv 129 mit 129 einmal anwende, und heisse M . Auf diese wende ich Pt an: Pt M . Nun ist, wie wir früher gezeigt haben, die Menge aller Teilmengen einer Menge stets grösser als die Menge selbst, also Pt M > M. Pt M ist aber andererseits eine durch blosse Anwendung von Pt , Pv entstehende Menge, und also bei der Bildung der Vereinigungsmenge M mitbenutzt, also ist gewiss M Pt M. Dies aber ist ein Widerspruch mit der ersteren Ungleichung (nach dem Bernsteinschen Satze). Man muss diesen Widerspruch, diese Paradoxie, sehr ernst nehmen, denn er stellte sich heraus, indem wir lediglich zwei mathematische Prozesse anwandten, die man doch sonst als ebenso zulässig ansieht, | wie etwa die beiden Prozesse, durch die wir die transfiniten Zahlen erzeugten: 1) das um 1 weiterzählen; 2) das über Unendlich hinüberzählen. Es taucht also ernstlich die Frage auf, ob nicht auch schon hier die beliebige Anwendung zweier Prozesse zu Widersprüchen führen kann. Bis jetzt scheint noch alles in Ordnung zu sein, aber vielleicht haben wir den Widerspruch nur noch nicht entdeckt. Ueberdies ist dies nicht die einzige Paradoxie, der wir begegnen. Zunächst lässt sich aus unserer obigen Paradoxie ein rein logisches Extrakt bereiten, das bequem serviert und genossen werden kann. Es ist dies das RussellZermelosche Paradoxon, das in Folgendem besteht. Man kann die Mengen danach einteilen, ob unter ihren Elementen die Menge selbst vorkommt oder nicht. Hierbei kann es dahingestellt bleiben, ob es überhaupt möglich ist, dass eine Menge unter ihren eigenen Elementen vorkommt. Jedenfalls aber gibt es solche Mengen, die sich selbst nicht als Element enthalten. Z. B. kann die Menge aller Menschen sich nicht selbst enthalten, da diese Menge doch nicht selbst ein Mensch ist. Es sei nun N die Menge aller Mengen, die sich nicht als Element enthalten. Dann sind für N selber nur zwei Fälle zu unterscheiden: entweder gehört N zu den Mengen, die sich selbst nicht enthalten, oder N gehört zu den Mengen, die sich selbst enthalten. Beide Annahmen führen jedoch auf einen Widerspruch. Denn im ersten Fall müsste gemäss Definition von N die Menge N unter ihren Elementen vorkommen, während die Annahme dies ausschliesst. Im zweiten dagegen würde die Menge N als Element eine Menge (nämlich sich selber) enthalten, die sich selbst enthält, entgegen der Definition von N .
129–129 Version
B: Corrected by unknown writer (ink) to: noch
5
10
15
20
25
30
35
40
‘Über das Unendliche’ (1924/25)
5
10
15
20
25
30
35
40
741
Was sagen wir nun zu diesen Paradoxien? Nun, welche Stellung nahmen denn jene Klassiker des aktual Unendlichen (Cantor, Frege, Dedekind) ein? Das Bekanntwerden der Paradoxien wirkte katastrophal. Cantor, wohl derjenige, der das Vorhandensein solcher Paradoxien zuerst selbst erkannt hatte, fasste sich am ehesten: durch Gewaltspruch verbannte er solche Mengen, wie wir sie dort gebraucht haben, aus seinem Paradiese: die Formel seines Bannfluches lautete: jenes sind inkonsistente Mengen, d. h. Mengen, deren Elemente niemals zusammengedacht werden dürfen; er traute sich die Fähigkeit zu, den Mengen ins Herz zu schauen und die Engel von den Teufeln zu unterscheiden. Dedekind und Frege dagegen gaben tatsächlich den Kampf für ihren Standpunkt auf und erklärten sich als des Irrtums überführt. Dedekind 130 verhinderte 130 , dass von seinem epochemachenden Werk „Was sind und was sollen die Zahlen“, das er für so wichtig gehalten hatte, dass er bei den einzelnen Sätzen die Tagesdaten ihrer Auffindung angab, eine zweite Auflage gedruckt wurde. In der Tat war ja seine Theorie offenbar auf einem Irrtum aufgebaut. Wie schon erwähnt, nimmt Dedekind als Ausgang das Unendliche und er braucht dazu als notwendige Grundlage den Satz, dass es unendliche Mengen gibt. Dedekind sucht nun diesen Satz auf folgende Weise zu beweisen. Er gibt zunächst die Definition der unendlichen Menge: Eine Menge heisst unendlich, wenn es möglich ist, die ganze Menge einem echten Teil umkehrbar eindeutig zuzuordnen. Dass dies die charakteristische Eigenschaft unendlicher Mengen ist, haben wir ja schon früher gesehen. Nun betrachtet Dedekind die Menge A aller Dinge, welche Gegenstände des Denkens sein können. Um | von dieser zu zeigen, dass auf sie die Definition der unendlichen Mengen zutrifft, ordnet er jedem Element a von A, also jedem möglichen Gegenstande des Denkens, den Gedanken a an diesen Gegenstand zu. Da jeder solche Gedanke wiederum Gegenstand des Denkens sein kann, so bilden die Dinge a eine Teilmenge A von A, denn in der Menge A kommen ja nur Gedanken vor, und es gibt jedenfalls Gegenstände des Denkens, welche selbst keine Gedanken sind, z. B. das eigene Ich. Es wird also durch die Beziehung zwischen a und a die Menge A auf eine echte Teilmenge A abgebildet. Und diese Abbildung ist auch umkehrbar eindeutig; denn durch den Gegenstand a ist der Gedanke a und umgekehrt auch durch diesen Gedanken auch der Gegenstand a eindeutig bestimmt. Die Menge A ist demnach im Sinne der Definition eine unendliche Menge, und die Existenz solcher Mengen scheint somit erwiesen. Dieser Schluss ist aber durchaus unzulässig. „Die Menge alles Denkbaren“, das ist eben ein typisches Beispiel für solche Mengen wie sie Cantor als inkonsistent mit Recht verfehmt hat. Und wir dürfen uns ihrer unter keinen Umständen bedienen, wenn wir nicht in Widersprüche geraten wollen. Auch Frege hat ehrlicherweise die Tendenz seines Buches „Grundgesetze der Arithmetik“ als verfehlt erkennen müssen. In einem Nachwort schreibt er wörtlich: „Einem wissenschaftlichen Schriftsteller kann kaum etwas Unerwünschteres begegnen als dass ihm nach Vollendung einer Arbeit eine der Grundlagen seines Baues erschüttert wird. In diese Lage wurde ich durch
130–130 Version
A: Replaced with: trug Bedenken
110
111
742
112
113
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
einen Brief des Herrn Bertrand Russell versetzt, als der Druck dieses Buches sich seinem Ende näherte . . . “ Den Standpunkt Cantors nannte ich bereits. Nun, dem Schöpfer und ersten Begründer einer Theorie ist alles erlaubt. Wissenschaftlicher Takt und Gefühl wird ihn zuweilen allein richtig leiten müssen, wenn er überhaupt die neuen Höhen gewinnen will. Aber der definitive Bau muss auf sicherer Grundlage ruhen, und ganz besonders gilt das für eine Theorie wie die Cantorsche. Diese war von Anfang an starkem Misstrauen ausgesetzt. In meiner Privatdozentenzeit war es verpönt, an Cantor zu glauben. Namentlich Kronecker, der damals massgebenden Einfluss hatte, bekämpfte Cantor aufs rücksichtsloseste. Wie schwer es auch weiterblickenden Mathematikern war, sich in Cantors Gedankenreihen, die uns heute so geläufig sind, hineinzufühlen, sehen wir an Poincaré, der selbst zweifellos der glänzendste und vielseitigste, gedankenreichste mathematische Erfinder innerhalb seiner Generation war, der aber kein inneres Verhältnis zu Cantors Ideen zu gewinnen vermochte und sie daher grösstenteils ablehnte und gerade in ihrem entscheidendsten Punkte die Cantorsche Theorie bekämpfte. Obwohl nun heute überall an entscheidenden Stellen und von der überwiegenden Mehrzahl der Mathematiker die Cantorsche Theorie anerkannt wird, haben sich auch in neuester Zeit hervorragende Mathematiker gefunden, die 131 Cantors Bannfluch 131 aufnehmen, aber damit nicht nur die Teufel, sondern auch alle Engel aus dem Paradiese vertreiben, und damit tatsächlich das Cantorsche Paradies in eine Einöde verwandeln wollen. Es ist nicht daran zu denken, dass ihnen — es sind Weyl und Brouwer — dieses Unternehmen glücken sollte. Denn abgesehen von der beständig steigenden Festigung, die die Mengentheorie tatsächlich als Mittel- und Selbstzweck in der Wissen|schaft erfahren hat, und ihrer Bewährtheit und unermesslichen Fruchtbarkeit in allen Teilen der Mathematik, würden wir unsere gesamte Wissenschaft zerstückeln und verstümmeln, wenn wir jenen Bannfluch ernstnehmen, da ja der allgemeine Begriff der Irrationalzahl und der Funktion, welche auch für alle Anwendungen der Mathematik die unentbehrlichsten Werkzeuge sind, unzulässig und vom Gebrauch auszuschliessen wären. Wir werden uns später überzeugen, dass jede Besorgnis unnötig ist. Aber es entsteht jetzt in der Tat die ernste Frage, welche Stellung wir den Gefahr bringenden Paradoxien gegenüber einnehmen sollen.
5
10
15
20
25
30
35
V. Logik Die Axiomatische Methode Es ist naheliegend, dass wir uns in unserer Not der Paradoxien an die axiomatische Methode wenden, die schon von Euklid angewandt wurde und seither so vielseitig ausgebildet worden ist. Sie ist überall anwendbar und logisch unanfechtbar. Denn axiomatisch verfahren, heisst im Grunde nichts anderes als mit Bewusstsein denken: während es ohne die axiomatische Methode 131–131 Version
B: Replaced by Hilbert with: Bannfluch gegen Cantor
40
‘Über das Unendliche’ (1924/25)
5
10
15
20
25
30
35
40
45
743
naiv geschah, dass man an gewisse Zusammenhänge wie an Dogma glaubte, so hebt die Axiomenlehre diese Naivität auf, lässt uns jedoch die Vorteile des Glaubens. Das Wesen der axiomatischen Methode lässt sich folgendermassen charakterisieren: Um ein spezielles Wissensgebiet zu erforschen, basiert man es auf eine möglichst geringe Anzahl von möglichst einfachen, anschaulichen und fasslichen Prinzipien, die man als Axiome an den Anfang der Untersuchung stellt und zu einem System vereinigt. Aus diesem leitet man alle Sätze jenes Wissensgebietes auf rein logischem Wege ab. So hat es insbesondere Zermelo mit der Mengenlehre getan und | auch der Weg, den Bertrand Russell einschlug, kommt auf eine Axiomatik hinaus. Der axiomatische Weg hat nun auch wirklich, wie zu erwarten, zu vollem Erfolge geführt, insofern als es insbesondere Zermelo gelang, aus seinen Axiomen die gesamte Analysis, Funktionentheorie und Mengenlehre abzuleiten, ohne dass eine der Paradoxien herausgebracht werden kann. Dies beruht darauf, dass Zermelo durch seine Axiome nur gewisse Verfahrungsarten für Bildung von Mengen zulässt, z. B. die Bildung der Menge aller Teilmengen und die der Vereinigungsmengen nur, wenn die zu vereinigenden Mengen Elemente einer bereits bekannten Menge sind. So laufen Zermelos axiomatische Forderungen darauf hinaus, zu präzisieren, was Cantor unter konsistenter Menge gedacht wissen wollte. Unsere Paradoxie bleibt ausgeschlossen, und es nimmt uns auch nicht wunder, dass alle vernünftige Mathematik vollständig und richtig ableitbar wird. So hat Zermelos Axiomatik dem Gewaltherrscher Cantor die ministeriellen Bekleidungsstücke geliefert. Es gab früher und auffallender Weise auch heute noch Umstürzler die mit dem Cantor-Zermeloschen Reiche unzufrieden sind, die wichtigsten Betriebe in diesem Reiche stillegen, die bewundernswertesten Bauten zerstören wollen. Ich meinesteils lehne diese Tendenzen von Grund aus und a limine ab. Hier möchte ich darüber nur kurz dieses sagen: Es gibt wohl kaum irgendein Gebiet innerhalb oder ausserhalb der mathematischen Wissenschaft, das gründlicher erforscht worden ist als die Analysis der reellen Grössen. Die Verfolgung der Schlussweisen, die auf den Begriffen der Irrationalzahl, des Limes, der Mengen von ganzen Zahlen etc. beruhen, hat man bis | zum äussersten getrieben, und nicht der Schatten einer Unstimmigkeit hat sich irgendwo ergeben. Der Umstand, dass der Begriff der Menge im allgemeinsten Sinne nicht zulässig ist, schliesst keineswegs aus, dass der Begriff der Menge ganzer Zahlen, deren Teilmengen etc. völlig korrekt ist. In der Tat herrscht in der Analysis, d. h. im Reiche Cantor-Zermelos, wie ich es charakterisiert habe, trotz der kühnsten und mannigfaltigsten Kombinationen unter Anwendung der raffiniertesten Mittel bei Ueber-, Neben- und Durcheinander- Häufung der Limites eine vollkommenste Sicherheit des Schliessens und offenkundigste Einhelligkeit aller Ergebnisse. Jene Axiome, auf Grund deren diese Sicherheit und Einhelligkeit da ist, zu verwerfen oder auch nur ernsthaft anzuzweifeln, ist ein groteskes Unternehmen. Und es geschieht diesen Umstürzlern ganz recht, wenn sie dann sich mit dem kümmerlichsten Ersatz begnügen müssen und mit der Pflege ihrer selbstgeschaffenen Leiden voll beschäftigt auf mühsamen Krücken ausserhalb des mathematischen Paradieses umherhumpeln müssen.
114
115
744
116
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
Und was würde aus all den Theorien in den Nachbargebieten werden, wo die Mathematik angewandt wird? Was würde der Physiker anfangen, wenn er nicht einmal der Irrationalzahl oder des allgemeinen Begriffes der Funktion von mathematischer Seite her sicher wäre? Nein, wenn irgendwo sonst, so ist hier die Axiomatik, speziell die axiomatische Forderung dieses Begriffes angebracht. Fruchtbaren 132 Begriffen 132 und Schlussweisen soll man, wo immer nur die geringste Aussicht sich bietet, sorgfältig nachspüren, sie pflegen und stützen und gebrauchsfähig machen, nicht aber die bewährtesten unter ihnen eliminieren. Nun freilich hat es mit der Anwendung der axiomatischen Metho|de auf die Analysis eine eigene Bewandtnis aus folgendem Grunde. Wenn man für irgendein Wissensgebiet ein Axiomensystem aufgestellt hat, so ist es eine Forderung, dass dieselben keinen Widerspruch einschliessen. Der Nachweis dafür, dass also nicht 2 gegensätzliche Behauptungen aus ihnen logisch geschlossen werden können, ist in den meisten Fällen durch Zurückführung zu erbringen — auf Geometrie oder Arithmetik oder Grössenlehre, z. B. die Euklidischen Axiome durch Zurückführung auf die Grössenlehre nach den Prinzipien der analytischen Geometrie. Dabei wird die Widerspruchsfreiheit der Arithmetik oder Grössenlehre stets und mit Recht vorausgesetzt. Wie nun aber, wenn es sich um die Axiome der Arithmetik oder Grössenlehre selbst handelt, wie in unserem Fall? Nun, da entsteht das Problem, die Widerspruchsfreiheit der arithmetischen Axiome nachzuweisen, und dies ist ein altes Problem, mit dem sich schon mehr als eine Mathematiker-Generation beschäftigt hat. Zur Lösung dieses Problems ist meiner Meinung nach eine Neubegründung der Mathematik nötig, und ich glaube, dass eine solche Begründung möglich ist, die die allgemeinen Zweifel an der Sicherheit des mathematischen Schliessens definitiv beseitigt, die zugleich zeigt, dass es in der Mathematik nicht Wahrheiten von prinzipiell verschiedener Art gibt, dass die Behauptungen über Irrationalzahlen und Mengen im selben Sinne und genau so zuverlässig richtig sind wie die arithmetische Behauptung 2 + 3 = 5. Es stellt sich dabei heraus, dass der eingeschlagene Weg auch zu neuen mathematischen Wahrheiten führt. Auch glaube ich, dass die neue Begründung erkenntnistheoretisch von Interesse ist, und jedenfalls werden wir erst durch sie befriedigende Aufklärung über das Wesen des Unendlichen erhalten. Die finite Einstellung
117
Wie wir aus den Paradoxien sahen, hat sich das abstrakte Operieren mit allgemeinen Begriffsumfängen und Inhalten als unzulänglich herausgestellt. Da uns das Denken nicht erspart bleiben darf, wir das logische inhaltliche Schliessen niemals entbehren können, so haben wir offenbar das inhaltliche Schliessen falsch ausgeführt, wir haben notwendige Vorbedingungen für die Anwendung logischen Schliessens nicht innegehalten. Als Vorbedingung für die Anwendung logischer Schlüsse und die Betätigung logischer Operationen 132–132 Version
A: Corrected by Hilbert to: Begriffsbildungen
5
10
15
20
25
30
35
40
‘Über das Unendliche’ (1924/25)
5
10
15
20
25
745
muss sicherlich schon etwas in der Vorstellung gegeben sein: gewisse ausserlogische konkrete Objekte, die anschaulich als unmittelbares Erlebnis vor allem Denken da sind. Soll das logische Schliessen sicher sein, so müssen sich diese Objekte vollkommen in allen Teilen überblicken lassen, und ihre Aufweisung, ihre Unterscheidung, ihr Aufeinanderfolgen ist mit den Objekten zugleich unmittelbar anschaulich für uns da, als etwas das sich nicht noch auf etwas anderes reduzieren lässt. Indem ich diesen Standpunkt einnehme, sind mir — im genauen Gegensatz zu Frege und Dedekind — die Gegenstände der Zahlentheorie die Zeichen selbst, deren Gestalt unabhängig von Ort und Zeit und von den besonderen Bedingungen der Herstellung des Zeichens sowie von geringfügigen Unterschieden in der Ausführung sich von uns allgemein und sicher wiedererkennen lässt. Hierin liegt die feste philosophische Einstellung, die ich zur Begründung der reinen Mathematik — wie überhaupt zu allem wissenschaftlichen Denken, Verstehen, und Mitteilen — für erforderlich halte: Am Anfang, so heisst es hier, ist das Zeichen. Wenn wir nun die reinsten mathematischen Wahrheiten haben wollen und Beispiele für sicheres Schliessen uns vor Augen halten wollen, so werden wir uns der gewöhnlichen Zahlenlehre, der niederen | Arithmetik zuwenden. Und wir werden uns vor allem überlegen, ob und wieweit wir mit der eben geschilderten philosophischen Einstellung, also auf dieser rein anschaulichen Basis der konkreten Zeichen die Wissenschaft der Zahlentheorie begründen können. Wir beginnen dann etwa mit den folgenden Erklärungen: Das Zeichen 1 ist eine Zahl. Ein Zeichen, das mit 1 beginnt und mit 1 endigt, sodass dazwischen auf 1 immer 1 folgt, ist ebenfalls eine Zahl, z. B. die Zeichen 11 111 11111
30
35
40
Diese Zahlzeichen, die Zahlen sind und die Zahlen vollständig ausmachen, sind selbst Gegenstand unserer Betrachtung, haben aber sonst an sich keinerlei Bedeutung. Ausser diesen Zeichen wenden wir noch andere Zeichen an, die etwas bedeuten und zur Mitteilung dienen, z. B. das Zeichen 2 zur Abkürzung für das Zahlzeichen 11 oder das Zeichen 3 zur Abkürzung für das Zahlzeichen 111; ferner wenden wir die Zeichen =, +, > an, die zur Mitteilung von Behauptungen dienen. So soll denn 2 + 3 = 3 + 2 zur Mitteilung der Tatsache dienen, dass 2 + 3 und 3 + 2 mit Rücksicht auf die benutzten Abkürzungen dasselbe Zahlzeichen, nämlich das Zahlzeichen 11111 sind. Ebenso dient alsdann 3 > 2 zur Mitteilung der Tatsache, dass das Zeichen 3, d. h. 111, über das Zeichen 2, d. h. 11, hinausragt oder dass das letztere Zeichen ein Teilstück des ersteren ist.
118
746 119
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
133
Wir verwenden zur Mitteilung auch Buchstaben für | Zahlzeichen. Dann ist auch b > a die Mitteilung, dass das Zahlzeichen b über das Zahlzeichen a hinausragt. Und ebenso wäre vom gegenwärtigen Standpunkte aus a+b = b+a nur die Mitteilung der Tatsache, dass das Zahlzeichen a + b dasselbe ist wie b + a. 133 Und dabei kann das inhaltliche Zutreffen dieser Mitteilung auch durch inhaltliches Schliessen bewiesen werden, wie ich aber hier der Kürze wegen nicht ausführen will. Wir können mit dieser anschaulichen inhaltlichen Art der Behandlung sehr weit auskommen, z.B. können wir ohne Schwierigkeit den Euklidischen Satz, dass wenn y eine Primzahl ist, zwischen y + 1 und y! + 1 immer eine neue Primzahl liegt, beweisen. Ebenso lassen sich schon weitgehende Theorien der niederen und höheren Arithmetik entwickeln. Wenn diese Behandlungsweise auch bisweilen recht mühsam wird, im Vergleich zur gewöhnlichen, wo wir eigentliche Formeln haben, z. B. in
5
10
a+b=b+a
120
die für alle a, b gilt, also eigentlich unendlich viele Sätze in sich schliesst, wo wir uns gewisser Kalküle bedienen und mit eigentlichen Variablen frei schalten, so liegt doch kein Zwang vor, von unserer Behandlungsweise abzugehen. Doch wollen wir sogleich ein erstes einfachstes Beispiel aufweisen und antreffen, wo die eben geschilderte unmittelbar anschauliche Methode wirklich versagt. Ich habe vorhin den Euklidischen Satz genannt: es gibt eine Primzahl unter den Zahlen p + 1, p + 2, p + 3 . . . p! + 1, wo für p irgendeine als Zahlzeichen vorgelegte Primzahl p = 111 . . . genommen werden kann. Wir können auch sagen, es gibt eine Primzahl, die 134 und zugleich 134 1. > p 2. p! + 1 ist, und hierdurch kommen wir darauf, einen Satz zu formulieren, der nur einen Teil der Euklidischen Behauptung 135 berücksichtigt 135 , nämlich: es gibt eine Primzahl, die > p ist. Obwohl dies inhaltlich nur eine weit geringere Behauptung ist, nur eine Teilaussage der Euklidischen und so harmlos der Uebergang erscheint, so ist es doch ein Sprung ins Transfinite, ein erster Fall, wo ein solcher Sprung stattfindet, der bei unserer gegenwärtigen Einstellung unerlaubt, ja sinnlos ist.
15
20
25
30
Zulässige und unzulässige Aussagen, Brouwersche Einschränkungen Wie kann das sein? Wir haben 136 eine Existentialaussage „es gibt“! Aber diese hatten wir auch schon in dem Euklidischen Satz. Gewiss, aber dort war
133–133 Both
versions: The variables have been changed from a, b, c to a, b, c. In the sentence next but one to this, the three occurrences of ‘y’ have been replaced by German (Sütterlin) ‘y’s (so ‘y’) here. 134–134 Version A: Added by Hilbert 135–135 Version A: Replaced by Hilbert with: ausdrückt 136 Version A: Added by Hilbert: hier
35
‘Über das Unendliche’ (1924/25)
das „es gibt“
137
nur eine andere kürzere Ausdrucksweise für entweder ist
p + 1 oder
5
15
p + 2 oder
p+3
...
oder
p! + 1
eine Primzahl, gerade wie statt zu sagen dieses Kreidestück ist rot, oder jenes Kreidestück ist rot, oder . . . , oder das Kreidestück dort ist rot, ich kürzer sage: es gibt unter diesen Kreidestücken ein rotes. Solch eine Behauptung, dass es in einer endlichen Gesamtheit einen Gegenstand mit einer Eigenschaft „gibt“ entspricht völlig unserer finiten Einstellung. Die Alternative dagegen: entweder ist p + 1 oder
10
747
p + 2 oder
p + 3 oder
...
138
ist gleichsam ein unendliches logisches Produkt und ein solcher Uebergang zum Unendlichen ist ohne besondere Erörterung und eventuell gewisse Vorsichtsmassregeln ebenso wenig erlaubt wie in der Analysis der Uebergang vom endlichen zum unendlichen Produkt es ist 139 . Ein zweites Beispiel ist folgendes. In der elementaren Geometrie haben diejenigen Primzahlen p, für die p − 1 eine Potenz von 2 ist, ein besonderes Interesse, weil man die entsprechenden regulären p-Ecke mit Lineal und Zirkel konstruieren kann. Solche Primzahlen sind
121
5 = (22 + 1), 17 = (24 + 1), 257 = (28 + 1), 65537 = (216 + 1). 20
25
30
35
Weitere hat man trotz vielen Suchens bisher nicht gefunden. Wir kommen so dazu, die Behauptung zu formulieren: Es gibt eine Primzahl p > 65537 von der Art, dass p − 1 eine Potenz von 2 ist, oder keine Primzahl > 65537 ist von dieser Art. Es gibt p > 65537 sodass p − 1 = Potenz von 2 oder 140 Es gibt nicht p > 65537 sodass p − 1 = Potenz von 2. 140 Auch eine solche einfache Wahrheit existiert nicht auf unserem strengen finiten Standpunkt. Für endliche Gesamtheiten gültige Schlussweisen dürfen nicht ohne weiteres auf unendliche Gesamtheiten angewandt werden, gerade wie in der Analysis für endliche Reihen gültige Sätze nicht ohne weiteres auf unendliche Reihen übertragen werden dürfen. Bei der axiomatischen Begründung der Mengentheorie ist jener Satz natürlich ohne weiteres richtig; denn die ganzen Zahlen bilden eine zugelassene Menge. Die Radikalen früherer und moderner Zeit aber lehnen tatsächlich jene einfache Schlussweise ab und damit auch die darin enthaltene wichtige Wahrheit des obigen Beispiels. Ebenso werden sie etwa die Behauptung ablehnen: √ 2√2 ist entweder rational, oder 2 2 ist irrational, d. h. = von ab . Das allein schon genügt, dass wir mit Recht solchen Bestrebun|gen den Rücken kehren — würden doch gerade die tiefsinnigsten und das mathematische Herz am meisten erfreuenden Beweise wegfallen, und wenn man die 137 Version
A: A: 139 Version A: 140–140 Version B: 138 Version
Added by Hilbert: wie ich schon sagte Added by Hilbert: in inf. Added by Hilbert: und überhaupt zunächst sinnlos In the typescript the rest of the line after ‘nicht’ consists of ditto marks.
122
748
123
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
mathematische Literatur durchgeht, findet man dies bereits für die reine Algebra bestätigt, z. B. in dem invariantentheoretischen Fundamentalsatz für Endlichkeit des vollen Formensystems. 141 Kehren wir nochmals zu der Aussage über die Primzahlen > 65537 zurück, so bemerken wir, dass die zweite Alternative: keine Primzahl > 65537 ist von jener Art, auch von unserem finiten Standpunkt zulässig ist. Sie besagt nämlich, wenn eine Primzahl p > 65537 vorgelegt ist, so enthält p − 1 stets einen von 2 verschiedenen Primteiler. In dieser Aussage hätten wir zugleich ein Beispiel einer „nicht negationsfähigen“ Aussage. Denn ihre Negation wäre eben die erstere Alternative und diese ist von unserer finiten Einstellung aus nicht zulässig, d.h. nicht bedingungslos zulässig; denn wenn ich heute abend in einem Briefe eine Primzahl > 65537 von der verlangten Art mitgeteilt erhalte, so ist die Aussage nicht nur zulässig, sondern auch richtig. So kommen wir dazu, die Zulässigkeit einer Aussage vom Stande unseres Wissens abhängen zu lassen, was ganz gewiss unzulässig ist, da es dem wissenschaftlichen Prinzip √ 2 der Objektivität widerstreitet. Es wäre dann z. B. die Aussage, 2 ist = ab , √ d. h. irrational, zulässig, dagegen 2 2 = rationaler Zahl unzulässig. Wohl aber √ wäre 2 2 = 3 eine „zulässige“ Aussage, die natürlich wie hier falsch sein kann. Andererseits haben wir auch umgekehrt Aussagen, die erlaubt sind, deren Negation aber unzulässig ist, z. B. in der Formel a + b = b + a. Für jedes vorgelegte Paar a, b können wir sie ja in finiter Weise auf ihre Richtigkeit prüfen. Unzulässig dagegen ist | die Behauptung: a + b = b + a142 Ich glaube, dass es auf diesem Wege, wie es Brouwer versucht hat, aussichtslos ist, zu einer befriedigenden Auffassung zu kommen. Und wenn schon: der Lösung des Fundamentalproblems bleiben wir ferner als je. Das Fundamentalproblem war doch, alle jene das Unendliche betreffenden Begriffsbildungen und Schlussweisen, wie wir sie gewohnt sind und immerzu mit bestem Erfolge anwenden, bestehen zu lassen — unter voller Wahrung der finiten Einstellung. Wie kann das nun geschehen? Nun, wir haben doch in der Mathematik jeden falls eine reiche Auswahl von ganz unproblematischen Aussagen — wir wollen sie elementare nennen — z. B. 3 > 2, 2 + 3 = 5, 2 · 3 = 7, 2 = 3, 1 = 1143 die von unserem finiten Standpunkt aus bei der Einstellung auf Konkrete als unmittelbar anschaulich ohne weiteres verständlich sind. Unproblematisch soll heissen, sie sind negationsfähig, richtig oder falsch, man kann frei und 141 Version B: Added by Hilbert in the left-hand margin: ‘Vgl. Separat Bode Math. Annalen 36’ It is not clear what this reference is intended to designate. Volume 36 of Math. Annalen contains no article by Bode, and we have been unable to find any trace of a mathematician called Bode active at the period in question. Volume 36 does contain an article by Hilbert (on the theory of algebraic forms, pp. 473–534) and by Rogel, ‘Bestimmung der Anzahl von Primzahlen unter gegebenen Grenzen’ (pp. 304–315). It is possible that Hilbert meant to refer to this offprint by Rogel, and mis-remembered the name of the author. 142 Version B: Has (mistakenly): a + b = b + a 143 Version A: The rightmost statement reads: 1 = 1
5
10
15
20
25
30
35
‘Über das Unendliche’ (1924/25)
5
10
749
unbedenklich logisch schalten und walten; der Satz vom Widerspruch gilt, d. h. eine dieser Aussagen und ihre Negation können nicht beide richtig sein. Das tertium non datur gilt: diese Aussage ist richtig oder ihre Negation ist richtig, d. h. eine von beiden, die Aussage selbst oder ihre Negation ist richtig. Wenn ich sage: eine Aussage ist falsch, so ist das gleichbedeutend mit: die Negation der Aussage ist richtig. Für die Zahlzeichen, die in diesen unproblematischen Aussagen auftreten, wollen wir zur Abkürzung stets deutsche Buchstaben a, b benutzen, die also stets ein ganz bestimmtes Zahlzeichen wie z. B. 3, 7, darstellen sollen. Ausser den elementaren Aussagen haben wir aber in der Mathema|tik noch andere, die unseren obigen Bedingungen nicht genügen, und für die wir bereits vorhin Beispiele angegeben haben. Darunter sind solche, wie die Aussage
124
a + b = b + a144 15
20
25
30
(diese Aussage ist jetzt so zu verstehen, dass sie für irgend zwei Zahlzeichen erfüllt sein soll; die a und b sind also Variable, die wir zum Unterschiede zu den bestimmten festgehaltenen Zahlzeichen mit lateinischen Buchstaben bezeichnen), die zwar von unserem finiten Standpunkt aus zulässig ist, aber doch, da nicht negationsfähig, problematischen Charakter hat. Ferner gibt es dann noch die durchaus problematischen Aussagen, die von dem finiten Standpunkt überhaupt unzulässig sind, wie vor allem solche Schlussweisen, die auf der Alternative beruhen, dass eine Aussage für alle in Betracht kommenden Argumente gilt, oder, dass es ein Gegenbeispiel gibt, wie z. B. oberhalb 65537 gibt es eine Primzahl, oder es gibt keine solche. Mit der Beschränkung auf das streng Finite kommt man zwar in der reinen Arithmetik schon recht weit, aber, wie schon gesagt, gerade die schönsten, wichtigsten und 145 erfolgreichsten 146 Begriffsbildungen und Schlussweisen werden dabei ausgeschaltet, und die Frage ist, wie wir uns da helfen. Dem Mathematiker liegt es nahe, sich der Methode der idealen Elemente zu bedienen. Indem wir solche Aussagen und Schlussweisen, die der finiten Einstellung nicht entsprechen, fortdauernd und mit dem grössten Erfolge anwenden, konstatieren wir bereits, dass wir von dieser Methode Gebrauch machen, die ja darauf hinausläuft, einen Sachverhalt, der sich nicht konkret | darstellen lässt, als ideal hinzustellen, und dadurch gewisse einfache Sätze ausnahmslos gültig zu machen.
35
Beweistheorie
40
Diese Methode erfordert jedoch stets den Nachweis der Widerspruchsfreiheit, d. h. die Erweiterung durch Zufügen von Idealen ist nur statthaft, wenn dadurch im alten engeren Bereiche keine Widersprüche entstehen, d. h. wenn die Beziehungen, die sich bei Elimination der idealen Gebilde für die alten Gebilde herausstellen, stets im alten Bereiche gültig sind. 144 Version
A: a and b have been (mistakenly) changed to a and b A: Added: einfachsten 146 Version B: Added by Hilbert: und zugleich einfachsten 145 Version
125
750
126
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
Erinnern wir uns an das einfachste mathematische Beispiel, nämlich die Theorie der unendlich fernen Punkte und der unendlich fernen Geraden in der Ebene, so geschieht hier jener Nachweis der Widerspruchsfreiheit durch Reduktion auf die finite Geometrie des Strahlenbündels, wo jedem Punkt der Ebene ein Strahl und jeder Geraden eine Ebene entspricht. Es ist hier in des Wortes eigentlicher Bedeutung das Ganze von einem Zentrum ausserhalb betrachtet. In dieser Strahlengeometrie sind alO le Punkte und Geraden, die alten und die idealen gleichberechtigt: dabei werden auch die alten in veränderter Weise, nämlich durch Strahlen repraesentiert. Aehnlich liegt die Sache bei der Einführung komplexer Zahlen, wo man diese durch ein Paar reeller Zahlen repraesentiert, die alten reellen Zahlen aber als spezielle solcher Paare auffasst und den Kalkül so gestaltet, dass ein Widerspruch nicht eintreten kann. Mit dieser Analogie vor Augen müssen wir also auch in unserem Falle die idealen Sachverhalte ins Finite projizieren. Dazu wird aber eine Erweiterung des Bereiches der finiten Objekte nötig sein. | Bisher waren dies nur die Zahlzeichen, d. h. die Zahlfiguren, wie 1, 11, 111, . . . . Sie allein waren die Objekte inhaltlicher Betrachtung. Nun gehen wir aber schon in der üblichen Behandlung, in der mathematischen Praxis darüber hinaus, indem wir keineswegs bloss Mitteilungen machen, sondern eigentliche Formeln in weitgehendstem Masse benutzen und mit ihnen operieren. Ja auch wenn eine Aussage noch vom finiten Standpunkt zulässig ist, wie z. B.
5
10
15
20
a+b=b+a
25
so wählen wir doch nicht diese Form der Mitteilung, sondern schreiben vielmehr die Formel a+b = b+a und begeben uns schon damit auf problematisches Terrain. Was ist nun das Verhältnis dieser Formel zu den alten unproblematischen Aussagen
30
2+3=3+2 5 + 7 = 7 + 5?
127
Nun wir erhalten diese erst durch Einsetzen von Zahlzeichen für a, b, d. h. durch ein Beweisverfahren, wenn auch ein sehr einfaches. Also die Mitteilungen oder Aussagen werden erst formalisiert, und aus einer so entstehenden Formel werden die alten elementaren Aussagen abgeleitet. Diese so entstandenen Formeln wie a+b=b+a bedeuten an sich nichts, so wenig wie die Zahlzeichen, sie sind nur Abbilder unserer Gedanken; wohl aber können aus ihnen Aussagen abgeleitet werden, wie 2+3=3+2 und wir kommen so dazu, diese elementaren Aussagen auch als Formeln aufzufassen und zu bezeichnen; es sind das dann Formeln, die | jene elementaren
35
40
‘Über das Unendliche’ (1924/25)
5
751
unproblematischen Aussagen bedeuten. Diese Formeln, die etwas bedeuten, sind die alten Gebilde, nur in neuer Auffassung; alle die hinzugefügten Formeln hingegen, die an sich nichts bedeuten, sind die idealen Gebilde unserer Theorie. Offenbar ist es dann aber eine Hauptangelegenheit festzustellen, was beweisen heisst; dazu ist es nötig, dass der mathematische Beweis selbst formalisiert wird. Dazu kommen wir natürlich nicht mit den üblichen rein mathematischen Zeichen aus. Denn es ist nunmehr auch eine Umsetzung der logischen Beziehungen in Formeln nötig. Logikkalkül
10
15
20
25
30
35
40
Auch dabei treffen wir erfreulicherweise auf fortgeschrittene Vorarbeit, nämlich den Logikkalkül. Freilich sind die Zeichen im Logikkalkül bisher ursprünglich auch nur zur Mitteilung eingeführt worden; aber es ist nur konsequent, dass wir jetzt auch den logischen Zeichen, ebenso wie den mathematischen alle Bedeutung an sich absprechen und erklären, dass auch die Formeln des Logikkalküls 147 nur Abbilder unserer Gedanken sind. 147 Ist die Formalisierung des Beweises durchgeführt, so haben wir freie Hand, beliebige Formeln zuzulassen, mit der alleinigen Einschränkung, dass durch Beweise keine Widersprüche in den alten Formeln, die ja etwas bedeuten, entstehen dürfen. Auf diese Weise kommt als Grundgedanke der ganzen Theorie folgendes zustande: Alles, was im bisherigen Sinne die Mathematik ausmacht, wird streng formalisiert, sodass die eigentliche Mathematik oder die Mathematik im engeren Sinne zu einem Bestande an Formeln wird. Diese unterscheiden sich von den gewöhnlichen Formeln der Mathematik nur dadurch, dass ausser gewöhnlichen Zeichen noch die logischen Zeichen, insbesondere die für „folgt“ (→) und für „nicht“ ( ) | darin vorkommen. Gewisse Formeln, die als Bausteine des formalen Gebäudes der Mathematik dienen, werden Axiome genannt. Ein Beweis ist eine Figur, die uns als solche anschaulich vorliegen muss; er besteht aus Schlüssen vermöge des Schlussschemas S S→T T wo jedesmal die Praemissen, d. h. die betreffenden Formeln S und S → T jede entweder ein Axiom ist, bzw. direkt durch Einsetzung aus einem Axiom entsteht oder mit der Endformel T eines Schlusses übereinstimmt, der vorher im Beweise vorkommt, bzw. durch Einsetzung aus einer solchen Endformel entsteht. Eine Formel soll beweisbar heissen, wenn sie die Endformel eines Beweises ist. Zu der eigentlichen so formalisierten Mathematik kommt gewissermassen eine neue Mathematik, eine Metamathematik, die zur Sicherung jener notwendig ist, in der — im Gegensatz zu den rein formalen Schlussweisen der eigentlichen Mathematik — das inhaltliche Schliessen zur Anwendung kommt, aber
147–147 Version
A: Replaced with: an sich nichts bedeuten.
128
752
129
130
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
lediglich zum Nachweis der Widerspruchsfreiheit der Axiome. In dieser Metamathematik wird mit den Beweisen der eigentlichen Mathematik operiert, und diese letzteren bilden selbst den Gegenstand der inhaltlichen Untersuchung, die durchaus unserer finiten Einstellung entspricht. Auf diese Weise vollzieht sich die Entwicklung der mathematischen Gesamtwissenschaft in beständigem Wechsel auf zweierlei Art: durch Gewinnung neuer beweisbarer Formeln aus den Axiomen mittels formalen Schliessens und andererseits durch Hinzufügung neuer Axiome nebst dem Nachweis der Widerspruchsfreiheit mittels inhaltlichen Schliessens. | Damit ist in Kürze der Weg bezeichnet, auf dem allein, wie ich glaube, ein sicheres Fundament für die mathematische Wissenschaft zu gewinnen ist. Indem wir diesen Weg einschlagen, tun wir nichts anderes, als dass wir in naturgemässer und konsequenter Weise die Entwicklung, die die Lehre von den Grundlagen der Mathematik bereits genommen hat, fortsetzen 148 . In der Tat, vergegenwärtigen wir uns nochmals, dass bereits die elementare Mathematik über den Standpunkt der anschaulichen Zahlentheorie hinausgeht. Nämlich die Methode der algebraischen Buchstaben-Rechnung ist in der anschaulichen Zahlentheorie nicht mit inbegriffen. Hier 149 werden die Formeln stets nur zur Mitteilung angewandt; die Buchstaben bedeuten Zahlzeichen, und durch eine Gleichung wird die Uebereinstimmung zweier Zeichen mitgeteilt. Dagegen in der Algebra betrachten wir die BuchstabenAusdrücke 150 selbst als mathematische 150 Gebilde und die Gleichungen als mathematische Verknüpfungen. Durch dieses Verfahren der Algebra werden die inhaltlichen Sätze der Zahlentheorie formalisiert. Anstelle der Aussagen über die Zahlzeichen treten Formeln, die ihrerseits nun konkrete Objekte einer anschaulichen Betrachtung sind; und anstelle des inhaltlichen zahlentheoretischen Beweises tritt die Ableitung einer Formel aus einer andern Formel nach gewissen Regeln. Dieser Prozess der Formalisierung, d. h. dieser Uebergang von der naiven zur formalen Behandlung, der sich zum ersten Mal in der Algebra findet, wird in der höheren Mathematik in weitem Umfange fortgesetzt, nämlich überall da, wo man zur Behandlung einer mathematischen Disziplin einen Kalkül ausgebildet hat, mit Hilfe dessen | die Axiome der Theorie durch Formeln und die inhaltlichen mathematischen Schlüsse durch ein äusseres Handeln nach bestimmten Regeln ersetzt werden. (Beispiele solcher Kalküle sind der Differentialkalkül, die formale Variationsrechnung, der Liesche Kalkül, die Vektoranalysis, der Invariantenkalkül.) Nun können wir uns ganz und gar dem bisherigen Entwicklungsgang folgend, fragen, ob es nicht möglich ist, die gesamte Mathematik dem Prozess der Formalisierung zu unterwerfen. Diese Möglichkeit besteht eben, wie ich schon sagte. Wir besitzen ja in dem Logikkalkül eine Zeichensprache, welche fähig ist, mathematische Sätze in Formeln zu fassen und das logische Schliessen durch symbolische Prozesse auszudrücken. Diese Formeln und formalen Prozesse des Logikkalküls haben wir bisher immer nur zur Mitteilung von 148 Version
B: Replaced with: fortzusetzen B: Added: , d. h. in letzterer, 150–150 Version A: Replaced with: an sich als selbständige 149 Version
5
10
15
20
25
30
35
40
‘Über das Unendliche’ (1924/25)
5
10
15
753
Gedankeninhalten gebraucht. Wir können jetzt aber, ganz entsprechend wie beim Uebergang von der inhaltlichen Zahlenlehre zur formalen Algebra, den Standpunkt ändern und die Zeichen und Operationen des Logikkalküls losgelöst von ihrer inhaltlichen Deutung betrachten. Anstelle der inhaltlichen mathematischen Wissenschaft, welche durch die Formelsprache des Logikkalküls mitgeteilt wird, haben wir dann einen Bestand von Formeln mit mathematischen und logischen Zeichen, welche sich nach bestimmten Regeln aneinander reihen. Den mathematischen Axiomen entsprechen gewisse unter den Formeln und dem inhaltlichen Schliessen entsprechen die Regeln, nach denen die Formeln auf einanderfolgen. Es wird also damit einerseits für die Axiome selbst, die doch auch ursprünglich naiv gemeint waren, wie für den Logikkalkül der Uebergang von naiver zu formaler Behandlung | vollzogen. Diesen Formalismus können wir nun zum Gegenstand einer anschaulichen Betrachtung machen, und damit eröffnet sich uns die Möglichkeit einer strengen Begründung der Mathematik.
131
Widerspruchsfreiheit
20
25
30
35
40
Denn das Problem der Widerspruchsfreiheit, welches ja die grundsätzlichen Schwierigkeiten bot, erhält durch den neuen Standpunkt eine ganz 151 korrekte 151 Fassung. Es handelt sich nicht mehr darum, ein System von unendlich vielen Dingen mit bestimmten Verknüpfungseigenschaften (eine stetige Mannigfaltigkeit von gewisser Art) als logisch möglich zu erweisen, sondern es kommt nur darauf an, einzusehen, dass es unmöglich ist, aus den (in Formeln aufgeschriebenen) Axiomen nach den Regeln des logischen Kalküls gewisse Formeln, wie z. B. 1 = 1 abzuleiten. Diese Aufgabe liegt grundsätzlich ebenso im Bereich der anschaulichen Betrachtung wie etwa die Aufgabe, des Beweises 152 , dass es unmöglich ist, zwei Zahlzeichen a, b zu finden, welche in der Beziehung a2 = 2b2 stehen. Hier soll gezeigt werden, dass sich nicht zwei Zahlzeichen von einer gewissen Beschaffenheit angeben lassen. Entsprechend kommt es für uns darauf an, zu zeigen, dass sich nicht ein Beweis von einer gewissen Beschaffenheit angeben lässt. Ein formalisierter Beweis ist aber, ebenso wie ein Zahlzeichen ein konkreter und überblickbarer Gegenstand. Er ist (wenigstens grundsätzlich) von Anfang bis Ende mitteilbar. Auch die verlangte Beschaffenheit der Endformel, z. B. dass sie „1 = 1“ lautet, ist eine konkret feststellbare Eigenschaft des Beweises. Es lässt sich somit das grundsätzliche Hindernis, welches einer anschaulichen Begründung der höheren Arithmetik und Analysis im Wege steht, dadurch beheben, dass wir nicht die Gegenstände dieser mathematischen Theorien, sondern vielmehr ihre Beweise in der formalen Uebersetzung, als Objekte unserer inhaltlichen Untersuchung nehmen. Das ist auch ganz naturgemäss.
151–151 Version 152 Version
B: Replaced by Hilbert with: konkrete √ A: Added by Hilbert (pencil): der Irrationalität von 2
132
754
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
Denn wir müssen den spezifisch mathematischen Beweis und seine Struktur zum Gegenstand einer Untersuchung machen, wie der Physiker sich um die Theorie seines Apparates kümmern muss und der Philosoph die Vernunft selbst kritisiert. Die Axiome
5
Durch dieses Programm ist die Wahl der Axiome für unsere Beweistheorie schon vorgezeichnet. Trotz mancher Willkür in der Auswahl der Axiome unterscheiden sich doch analog wie in der Geometrie qualitativ folgende getrennte Gruppen, aus denen wir einige Beispiele anführen: I.
Axiome der Folge A → (B → A) (Zufügen einer Voraussetzung) (B → C) → {(A → B) → (A → C)} (Elimination einer Aussage)
II. Axiome der Negation {A → (B & B)} → A (Satz vom Widerspruch)
10
15
A→A (Satz von der doppelten Verneinung) 133
III. Die transfiniten Axiome z. B. (a)Aa → Ab (Schluss vom Allgemeinen aufs Besondere, Aristotelisches Axiom)
20
(a)A(a) → (Ea)Aa (Wenn ein Prädikat nicht für alle gilt, so gibt es ein Gegenbeispiel) (Ea)Aa → (a)Aa (Wenn es kein Beispiel für eine Aussage gibt, so ist die Aussage für alle a falsch.) Dabei stellt sich noch ein sehr merkwürdiger Umstand heraus, nämlich, dass diese transfiniten Axiome sämtlich aus einem einzigen ableitbar sind und das ist 153 im wesentlichen gerade dasjenige, welches 153 bisher in der mathematischen Literatur am meisten 154 angefochten worden ist, nämlich das Auswahlprinzip. 154 Dann kämen die speziell mathematischen Axiome: IV.
Axiome der Gleichheit a=a a = b → (Aa → Ab) und endlich
153–153 Version 154–154 Version
A: Replaced with: ein solches, welches zugleich ??? → A(εA) den Kern des A: Replaced with: angefochtenen sogenannten Auswahlaxioms enthält.
25
30
35
‘Über das Unendliche’ (1924/25)
V.
5
10
15
20
25
755
Axiome der Zahl a + 1 = 0 (Induktionsaxiom)
Ich möchte gern wenigstens andeuten und Ihnen plausibel machen, wie der Nachweis der Widerspruchsfreiheit einer transfiniten Schlussweise, also z. B. der transfiniten oder problematischen Al|ternative: „für alle gültig oder es gibt Gegenbeispiele“ nunmehr gelingt. Es genügt zu zeigen, dass 1 = 1 als Endformel eines Beweises nicht herauskommen kann. Dies ist aber eine numerische d. h. konstante Formel. Man kann, von ihr rückwärts den Beweis durchgehend, alle Variable aus dem Beweis eliminieren. Kommen wir nun im Beweis an eine Stelle, wo die transfinite Alternative angewandt worden ist, so kann es sich auch hier wegen der Entfernung von allen Variablen nur um ein bestimmtes Gegenbeispiel und dessen Verwendung handeln. 155 Dann aber brauchen wir nur die anschauliche Alternative und das transfinite Axiom ist damit vermieden worden. Man kann die Lösung des Problems der Widerspruchslosigkeit, wie sie meine Beweistheorie gibt, sich so begreiflich machen. Unser Denken ist finit; indem wir denken, geschieht ein finiter Prozess. Diese sich von selbst bestätigende Wahrheit wird in meiner Beweistheorie gewissermassen mit benutzt in der Weise, dass, wenn irgend wo sich ein Widerspruch herausstellen würde, mit der Erkenntnis dieses Widerspruchs auch zugleich die betreffende Auswahl aus den unendlich vielen Dingen verwirklicht sein müsste. In meiner Beweistheorie wird demnach nicht behauptet, dass die Auffindung eines Gegenstandes unter den unendlich vielen Dingen stets bewirkt werden kann, wohl aber, dass man ohne Risiko eines Irrtums stets so tun kann, als wäre die Auswahl getroffen.
134
Schluss: Das Unendliche ist nur eine Idee
30
35
Ziehen wir jetzt zum Schluss das Facit aus allen unseren Ueberlegungen. Unser 156 Gesamtergebnis ist: Das Unendliche findet sich nirgends realisiert; es ist weder in der Natur vorhanden, noch als Grundlage in unserem Denken zulässig — eine bemerkenswerte Harmonie zwischen Sein und Denken. Im Gegensatz zu den früheren Bestrebungen | von Frege und Dedekind erlangen wir die Ueberzeugung, dass als Vorbedingung für die Möglichkeit wissenschaftlicher Erkenntnis gewisse anschauliche Vorstellungen und Einsichten unentbehrlich sind, und dass das Operieren mit dem Unendlichen nur durch das Endliche gesichert werden kann. Die Rolle, die dem Unendlichen bleibt, ist vielmehr nur die einer Idee — wenn man mit Kant unter einer Idee einen notwendigen Vernunftbegriff versteht, der alle Erfahrung übersteigt und durch den das Konkrete im Sinne der Totalität ergänzt wird.
155 Version A: Added by Hilbert on the opposite page: Der Begriff wf ist ein absoluter, nämlich. . . 156 Version B: Hilbert has added in the left-hand margin:
135
756
136
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
Aber 157 die hier skizzierte Theorie 157 ist nicht nur imstande, die Grundlagen der mathematischen Wissenschaft zu sichern, sondern ich glaube, dass sie auch einen Weg eröffnet, um überhaupt allgemeine in den mathematischen Denkbereich fallende Fragen grundsätzlicher Art zu behandeln, an die man sich früher nicht heranmachen konnte. Die Mathematik erweitert sich gewissermassen zu einem Schiedsgericht 158 , um prinzipielle Fragen zum Austrag zu bringen — auf einer konkreten Basis, auf der sich alle 159 einigen können und jede Behauptung kontrolliert werden kann. Als Beispiel möchte ich die These wählen, dass jedes mathematische Problem einer Lösung fähig ist. Wir sind alle davon überzeugt. Es bildet ja gerade einen Hauptreiz bei der Beschäftigung mit einem mathematischen Problem, dass wir in uns den steten Zuruf hören: Da ist das Problem, suche die Lösung; du kannst sie durch reines Denken finden; denn in der Mathematik gibt es kein ignorabimus. Nun kann zwar die Theorie nicht allgemein einen Weg angeben, auf dem jedes mathematische Problem sich lösen lässt, einen solchen gibt es auch nicht; aber der Nach|weis, dass die Annahme der Lösbarkeit eines jeden mathematischen Problems widerspruchsfrei ist, fällt durchaus in den Bereich unserer Theorie. Ich glaube, dass dieser Nachweis erbracht werden kann. Soviel ich jetzt sehe, ist damit auch der wichtigste Schritt zur Lösung des Kontinuumproblems gemacht und zwar im bejahenden Sinne, d. h. dass die Punkte einer Strecke bereits durch die Zahl der zweiten Klasse, d. h. durch blosses Hinüberzählen über das abzählbare Unendlich ausgezählt werden können.
157–157 Version 158 Version
A: Replaced with: unsere hiere skizzierte Beweistheorie A: Added: einem Schiedsgericht höchster Instanz repeating two words from the
typescript 159 Version A: Added: müssen
5
10
15
20
Textual Notes
757
Textual Notes 671.30: 672.10: 673.15: 673.42: 674.36: 675.12: 676.22: 680.11: 684.11: 685.33–34: 686.4: 686.13: 687.18–24: 690.22: 690.23: 693.24: 695.5: 695.32: 696.24: 699.27: 699.41: 700.14: 702.25: 702.25: 703.27: 704.40: 704.41: 705.2: 708.31: 711.23: 711.37: 712.38: 713.10: 713.26: 713.31: 713.34: 713.36: 714.28: 714.37: 715.9: 715.10: 715.23: 716.29:
hinein,] Both versions: Comma added in an unknown hand (ink). noch] Both versions: The typist has typed ‘auch’ over ‘noch’ (or vice versa). .] .] .] .] endliche] Both versions: Corrected in an unknown hand (ink) from: ernstliche A∗ ] A den] Both versions: Added in an unknown hand (ink). Rolle von i] Both versions: Changed in an unknown hand from: Rolle, die .] wäre.)] wäre). Wäre . . . sein.] The labels B and C in the diagram have been interchanged by the Editors. + . . . ] Ellipsis supplied by the Editors. wir] Both versions: Deleted: für d ] c Punkte] Elemente Punkte zu] Both versions: Inserted in an unknown hand. Der] Version B: Corrected in pencil from: der einzig] Both versions: Added by an unknown hand (ink). hat] Both versions: Changed by Hilbert from: haben war“] war.“ Diese,] Both versions: Comma added in an unknown hand. Energetik,] Both versions: Comma added in an unknown hand. Elementarladung,] Both versions: Comma added in an unknown hand. .] .] .] beobachtbar] Both versions: Substituted in an unknown hand (ink) for: beobachtet Nun] Non Diamantfelsen] Both versions, typographical error: Demantfelsen 2-fachem] 2 fachem Handvoll] Hand voll .] .] .] .] .] Unsere] Both versions: Changed by an unknown hand from: Unser ist es] Both versions: Added in an unknown hand (ink). sehr plausibel] Both versions: Added in an unknown hand (ink). .] hier] Both versions: Substituted by Hilbert (uncertain) for: Ihnen
758
Chapter 4
718.12: 718.20: 718.23: 718.25: 722.2: 722n: 724.24: 725.4: 727.14: 727.18: 728.31: 729.12: 732.8: 732.18: 732.25: 732.27: 732.32: 733.25: 735.11: 735.19: 735.24: 738.10: 738.34: 739.1: 739.13: 739.41: 740.3: 740.12: 740.16: 740.29–30: 741.12–13: 741.19: 744.4: 746.15: 747.6: 747.18: 747.23: 747.24: 747.36: 748.30: 749.15: 750.31:
Lectures on the Infinite (1924/25, 1931, 1933)
bekanntlich] Bekanntlich .] .] .] reinen] Both versions, inserted by an unknown hand: weisslich] weissl. .] .] .] .] Der] Both versions: Changed from: Und der endlichen?] endlichen. . . . ] Ellipsis supplied by editors. ev.] ev 0 − 1] 01 0 − 1] 01 .] 1000] Both versions: Incorrectly: 100 .] .] .] .] .] Zahlenklasse,] Zahlenklasse „Was sind und was sollen die Zahlen“] The typescript omits the question mark at the end of the title. Teilmengen).] Teilmengen) zusammenfasst).] zusammenfasst.) .] .] Russell-Zermelosche] Russel-Zermelosche „Was sind und was sollen die Zahlen“] The typescript omits the question mark at the end of the title. Eine] eine wäre?] wäre. unendlich] Both versions: Added by Hilbert. endlichen] endli.] oder] Both versions: Added by Hilbert. .] .] Einstellung,] Both versions: Einstellung. soll; die] soll. Die ?] Question mark added by editors.
Description of the Text
759
Description of the Text There exist two versions of this typescript, which we designate as Version A and Version B. Both are carbon copies; the whereabouts of the top copy are unknown. The quality of the two carbon copies differs. Version A appears to be a first or second carbon; Version B, which is blurrier, is probably a fourth or fifth carbon. Version B is bound similarly to most of the other lecture notes in the possession of the Mathematisches Institut i. e. in black pasteboard, with gold lettering on the spine. Version A, in contrast, is cut to a smaller size; the inventory number is written in ball-point pen, and has been adjusted with the aid of correcting fluid. Since these office supplies were not available until the 1960s, Version A likely came into the possession of the Mathematisches Institut later than Version B — possibly from Hilbert’s personal Nachlaß, though we have not been able to determine either the chain of custody or the date of accession. A description of the two texts follows.
Version A Collection: Georg-August Universität Göttingen, Mathematisches Institut, Inv. Nr. 16206c. Size: Cover size 21.0 × 27.8 cm; page size 20.7 × 27.8 cm. Cover Annotations: Two red plastic labels are pasted on the spine with ‘ÜB. D. UNENDLICHE’ and ‘HILBERT’ in white letters. The front cover has imprinted ‘Eigentum des Mathemat. Instituts der Univ. Göttingen’. The inventory number is written on top right-hand corner of the inside back cover. Composition: The pages are glued together, not bound. Pagination: The front end page, title page, and the three pages with the Table of Contents are unnumbered. The text itself consists of 137 pages numbered in the upper right-hand corner 1–102 and 102–136 (i. e., two consecutive pages have the page number 102). Original Title: On the unnumbered title page is typed: ‘Ueber das Unendliche // Vorlesung // von // Geheimrat Prof. D. Hilbert // W.S. 1924/25. // Ausgearbeitet von Lothar Nordheim.’ Text: The text is a carbon copy. Formulas, corrections, and labels of diagrams (drawn in pencil or ink) are in black ink. Further corrections, additions, and remarks have been added by Hilbert in pencil, some of which have been cut in the binding process (e. g., pp. 42 and 56). Occasional underlinings appear clustered (i. e., often more than once on a single page) in blue pencil. Sometimes remarks written in pencil are underlined in blue pencil (e. g., p. 42). The first page of text has written ‘3×’ in pencil in the upper left-hand corner. Some page numbers seem to have been crossed out in pencil and replaced by others, but these changes have been erased afterwards. In general, but not exclusively, it is on these pages that the most extensive remarks and emendations have been made both in pencil and blue pencil.
760
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
Version B Collection: Georg-August Universität Göttingen, Mathematisches Institut, GeorgAugust Universität Göttingen, Mathematisches Institut, Inv. Nr. 16206c (new number: 85). Size: Cover size 23.3 × 28.8 cm; page size 20.7 × 27.8 cm. Cover Annotations: Version B is bound, like most of the other Hilbert lecture notes, in a black pasteboard cover with gold lettering on the spine: ‘Hilbert//Über das Unendliche//WS//1924–25.’ Composition: 4 signatures, consisting of 15 to 20 pages each that are sewn together. The cover page and table of contents (4 sheets in total) are pasted in, as are the last two sheets (pages 133–136). Pagination: The Table of Contents is unnumbered, the pages of the text itself are numbered consecutively from 1 to 136. Original Title: The interior title page is identical with that of Version A. Text: The text is a carbon copy. Formulas, corrections, and labels of diagrams (drawn in pencil or ink) are in black ink. Further corrections, additions, and remarks have been added by Hilbert in pencil. Occasional underlinings are in pencil. Sometimes also remarks written in pencil are underlined.
Introduction to ‘Ueber die Grundlagen des Denkens’
761
Introduction to ‘Ueber die Grundlagen des Denkens’ In interviews given shortly before his death in 1977, Bernays emphasized that, when the Gödel incompleteness results became known, Hilbert did not react merely negatively, but instead experimented with modifications to his underlying system of proof theory. (Bernays’s full remarks on this topic are quoted above, p. 24.) He explicitly mentions two published articles by Hilbert, the third Hamburg lecture of December 1930, and the paper, ‘Proof of the Tertium non datur ’, which was presented to the Göttingen Gesellschaft der Wissenschaften on 17 July 1931; these two papers (Hilbert 1931a, Hilbert 1931b) are reprinted as Appendices D and E below. The present document is a variant of the latter paper, and should be read in conjunction with it. As is explained elsewhere in this Volume, the papers of December 1930 and July 1931 are quite different from each other, and each represents a striking shift in Hilbert’s approach.1 The strategy in December was to modify the formal system of number theory by adjoining a novel rule of inference (the ‘Hilbert rule’) permitting the introduction of new axioms: If it is shown that, for any given numeral z, the formula A(z) is always a correct numeric formula, then the formula (x)A(x) can be used as a starting formula.2
This new rule employs the intuitive notion of a numerical formula’s being ‘correct’, and also the notion of a (tacitly finitistic) proof of correctness: neither notion is syntactically formalized. So already there is a departure from the earlier strict practice of proof theory, and the present system is only quasiformal. Hilbert went on to sketch an argument (which explicitly assumes the correctness of the consistency proofs provided by Ackermann and von Neumann) that the system is syntactically complete ‘for certain simple cases’; the evident hope was that these results could be extended to more complex classes of formulas. But in July the emphases change. The focus now is on consistency and on the tertium non datur rather than on syntactic completeness; and the argument is thoroughly semantic. Distinctions between use and mention are routinely elided, and there is hardly a trace left of Hilbert the rigid ‘formalist’. It should be remembered that, in his statement of the Second Problem in the Paris Address of 1900, Hilbert had said: I am convinced that it must be possible to find a direct proof for the consistency of the arithmetical [real number] axioms by means of a careful study and suitable modification of the known methods of reasoning in the theory of irrational numbers.3 1 See §5 of the Introduction, pp. 25–27 above, the Introduction to the Appendices below, passim (pp. 788–805 below), as well as the Introductions to Appendices D and E. 2 Hilbert 1931a, p. 491; see p. 980 below. 3 Hilbert 1900b, 265, 1104 of the English translation. The German text is quoted above, p. 4.
762
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
What exactly Hilbert meant by those ‘known methods of reasoning’ is uncertain: most probably he was pointing towards the work of such nineteenthcentury analysts as Weierstraß, Dedekind, and Cantor. Precisely how their methods were to be ‘modified’ was left unstated: but none of these mathematicians took a syntactic approach to issues of arithmetic consistency, and so that cannot be what Hilbert had in mind. Hilbert had of course himself routinely used model-theoretic techniques to establish the consistency of various systems of elementary geometry. Strictly syntactical arguments were his own subsequent innovation, first haltingly broached in the 1904 Heidelberg address, and reaching their full maturity in the proof-theoretic work of the 1920s. But now, in 1931, it seems that, at least as an experiment, Hilbert wished to set aside this approach and to see what could be achieved in response to Gödel by returning to a more semantical style of argument. The present, undated document (Hilbert ?1931* ) was found in Hilbert’s Nachlaß. It is a typescript of eleven pages, with extensive handwritten interventions both by Hilbert and by Bernays. Its principal argument is closely related to the argument in the Göttingen lecture from July 1931 on the tertium non datur (Appendix E below). For that reason, we conjecture that it was written at approximately the same time; whether it was written prior to the published lecture, or was a later attempt to deal with the same issues, is difficult to say with certainty. In some respects the present typescript is more perspicuous (e. g., in the treatment of negation); in other respects, the published paper is clearly superior. For example, the latter (like the Hamburg lecture of December 1930) provides an explicit list of axioms and presents the ‘Hilbert Rule’ as an inference schema; the typescript, in contrast, is vague about the axioms, and the Hilbert Rule, instead of being explicitly stated, is in effect treated as part of the definition of the universal quantifier (see below). In any case, both the typescript and the published paper of 1931 present large difficulties of interpretation. They should be read in tandem, since each sheds light on the arguments contained in the other; however, they do not present a rigorous mathematical argument, but rather some broad and still somewhat uncrystallized ideas for how to deal with the Gödel results (which are nowhere explicitly mentioned). The core idea of the argument runs, apparently, as follows. First, on p. 2, a language is specified, consisting of numerals (here taken to be strings of 1s); variables x, y, . . . ; and equations of the form a = b, x = y, x = a (where a and b are numerals). These equations can then be preceded by universal and existential quantifiers. Hilbert next (p. 3) defines the concept of correctness for these formulas. An unquantified equation is correct when the same number of 1s stand on either side of the equality sign. The correctness of a universally quantified equation is specified (p. 3) as follows: The statement (x)A(x) is said to be correct, if A(z) is correct whenever z designates a numeral. Conversely, if (x)A(x) is correct, then A(z) is correct whenever z is an arbitrary numeral; in this way the concept of ‘all’ is defined.
Introduction to ‘Ueber die Grundlagen des Denkens’
763
As noted above, in this typescript Hilbert does not explicitly present his system with axioms and rules of inference; nevertheless, this account of correctness corresponds to the ‘Hilbert Rule’ of the Hamburg and Göttingen lectures. Observe, however, that in the two published papers A(x) is an arbitrary formula of first-order arithmetic, whereas here A(x) is an elementary equation: at this stage, the propositional connectives have not yet been introduced. So if Hilbert’s formulation is taken literally, the definition of the universal quantifier here applies to a narrower class of formulas than does the Hilbert Rule in the other papers. It may be that Hilbert intended the broader formulation and that his exposition here is deficient; or it may be that he intended instead to return to a variant of the extremely finitistic equational calculus he had discussed on pp. 49–61 of his ‘Logik-Kalkül’ lectures of 1920 (see above, pp. 326–334). Both interpretations are problematical; and if the second, narrow interpretation was intended, it is not clear how Hilbert expected to overcome the difficulties in constructing number theory he had already noticed in 1920. In any case, Hilbert next (p. 4) introduces the propositional connectives →, & and ∨; the correctness of a compound formula is determined in the usual way from the correctness of its subformulas. An inference is now defined (p. 4) as a process that takes us from correct formulas to other correct formulas; in particular modus ponens and universal instantiation can be seen to be legitimate modes of inference. Hilbert next introduces the sign for negation, lays down the usual conversion rules for the universal and existential quantifiers, and argues that these rules cannot lead to a contradiction for numerical formulas. Hilbert now outlines an argument (pp. 7–8) that the (correct) formulas and rules introduced so far are consistent. Given a proof of 1 = 1, we first eliminate all occurrences of → from the proof and then all occurrences of ∨: The resulting proof contains neither the sign → nor the sign ∨, but only the rules of calculation [Rechnungsregeln]; it cannot therefore end in 1 = 1. Thus our assumption is refuted (p. 8).
This argument is extremely sketchy, and not easy to reconstruct. The language Hilbert has officially described is essentially that of first-order logic, supplemented with signs for equality and the numerals. He clearly intends more than this, but explicit arithmetical axioms are not given, and since there is no sign even for +, it is not clear what ‘rules of calculation’ refers to. Hilbert remarks in a marginal handwritten comment on p. 7: We do not need to introduce further modes of inference explicitly, and in particular the possibility and application of the procedure of recursion, since they can be derived immediately from the modes of inference already mentioned.
Hilbert plainly (at least when he added this remark) intended his consistency argument to apply to formulas of arithmetic generally, but the details are far from clear. In any case, Hilbert observes, so far we have been dealing with a subsystem in which only direct proofs of mathematical propositions are permitted; the
764
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
only rules of inference are modus ponens and universal instantiation . But direct proofs are not sufficient for the full development of mathematics. Already in the construction of elementary number theory we require the tertium non datur, which Hilbert states in the following form: If A(x) is a statement with one variable x, then either A(z) is consistent for all z, or the assumption that z possesses the character of a numeral and that A(z) holds leads to W [i. e., to a contradiction].
To establish this result, Hilbert argues (p. 10) that, if particular instances of tertium non datur are added to the system, they do not lead to contradiction. Since by a previous lemma (p. 9) it had been established that a consistent statement is also always correct [richtig], the general tertium non datur is held to follow. Once again, the various steps in this argument are far from clear. Most tellingly, the typescript on p. 10 contains a heavily re-written paragraph. This paragraph is the heart of Hilbert’s attempted proof of the tertium non datur, and the physical text shows his struggles. We have first the typescript version, which Hilbert corrected in pencil. He then crossed out the entire passage, and wrote a fresh version of the argument (in ink) on the facing page. He then reworked that argument (a fourth time) in pencil. It should be remembered that this text was never published; it clearly represents a sketch of a possible line of argument rather than a result with which Hilbert was finally satisfied. The document is primarily of interest as showing (as Bernays indicated) something of Hilbert’s attempt to respond positively to the Gödel results. The typescript ends (p. 11) with the bald assertion that his argument not only establishes the consistency of the axioms of number theory, but can be extended ‘in exactly the same way’ to analysis; this claim is unsupported. William Ewald
‘Ueber die Grundlagen des Denkens’ (c. 1931)
765
Ueber die Grundlagen des Denkens (c. 1931)
Ueber die Grundlagen des Denkens. Von David Hilbert. 5
10
15
20
25
Erfahrung und reines Denken sind die Quellen unserer Erkenntnis. Um diese auszuschöpfen, bedienen wir uns einer gewissen Fähigkeit unseres Geistes, durch die wir schon im voraus a priori in der Vorstellung konkrete Objekte unmittelbar erleben, sodass dieselben für uns vollkommen in allen Teilen überblickbar sind und ihre Aufweisung, ihre Unterscheidung, ihre Aufeinanderfolge oder ihr Nebeneinandergereihtsein im Endlichen anschaulich da ist als etwas, das sich weder auf etwas anderes reduzieren lässt noch einer solchen Reduktion bedarf. Diese Fähigkeit unseres Geistes verhilft uns unmittelbar zu einer geistigen Einstellung, die ich zu allem wissenschaftlichen Denken, Verstehen und Mitteilen für erforderlich halte und ohne die eine geistige Betätigung garnicht möglich ist: sie heisse die finite Grundeinstellung. Dieselbe liefert uns auch die Prinzipien der Kantschen Lehre vom Apriori. Doch werden wir im einzelnen Kant nicht überall folgen können. Es gibt Sätze, die Kant als Apriori angesehen hat und die wir der Erfahrung zuweisen, z. B. die gesamten Grundtatsachen der Geometrie, sowie die elementaren Eigenschaften von Raum und Materie; aber es gibt andererseits auch Sätze, die wohl meist für Apriori gehalten worden sind, die aber nicht unmittelbar aus unserer finiten Einstellung gewonnen werden können, z. B. das Prinzip des Tertium non datur. 1 Die Grundlage der mathematischen Wissenschaft ist die Zahlentheorie. 1 Die Zahlentheorie ist ein feingegliedertes, himmelhoch errichtetes Gebäude, das alle anderen Geistesprodukte der Menschheit an Schönheit und Vollkommenheit überragt, in ihr werden auf | Schritt und Tritt 2 die Axiome der mathematischen Wissenschaft 2 angewandt und zwar in der mannigfaltigsten und kühnsten Weise, und niemals hat sich dabei die geringste Unstimmigkeit gezeigt. An der 3 Widerspruchsfreiheit der Axiome der mathematischen Wissenschaft 3 kann schon dieser Tatsache wegen nicht gezweifelt werden;
1–1 This typed insertion replaces: Wir werden diesen Umstand im Bereich der Zahlentheorie erörtern. Hilbert has added a question mark in the left margin querying the change. 2–2 Substituted by Bernays for: das Tertium non datur 3–3 Substituted by Bernays for: Berechtigung der Anwendbarkeit des Tertium non datur
1
2
766
3
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
aber es ist 4 trotzdem 4 strenge Begründung 5 dieser Widerspruchsfreiheit 5 notwendig 6 ; sie wird im Folgenden durchgeführt werden. 6 7 Die wesentliche Schwierigkeit hierbei rührt von 7 dem Begriff „Unendlich“ 8 her 8 . Wir stellen über das Unendliche Folgendes fest. Das Unendliche hat wie kaum eine andere Idee auf den Verstand so anregend und fruchtbar gewirkt; das Unendliche ist aber auch wie kein anderer Begriff so der Aufklärung bedürftig. Das Wort „unendlich“ wird oft und mannigfaltig im täglichen Leben sowie in den Schriften der Literatur von Laien wie von Gelehrten gebraucht; aber der damit bezeichnete Begriff ist keineswegs leicht verständlich und unmittelbar einleuchtend, vielmehr bedürfen wir einer Reihe von Definitionen und Betrachtungen. Ich möchte 9 diese 9 hier kurz und leicht fasslich zusammenstellen; zugleich glaube ich damit Einwendungen gegen gewisse Behauptungen meiner Theorie von vorneherein vorzubeugen. 10 Wir müssen die mathematische Wissenschaft von Grund aus neu aufbauen. 10 Definition der „Ziffer“. Wenn man an eine vorliegende Figur, die aus Einsen besteht, eine Eins anhängt, so entsteht wiederum eine Figur, die aus Einsen besteht. Eine jede durch wiederholte Anwendung solcher Anhängeprozesse aus 1 entstehende Figur heisst Ziffer. Man erkennt folgende Eigenschaften einer Ziffer: eine Ziffer ist eine Figur, die mit 1 anfängt und mit 1 endet und worin auf jede 1 eine 1 folgt und auch jeder 1 eine 1 vorangeht. Definition der „Aussage“. 11 Figuren von der Gestalt a = b bezeichnen wir als Formeln. 11 Aus diesen Formeln machen wir Aussagen, indem wir unter a, b Ziffern 12 verstehen. 12 13 Wir führen ferner freie Variable x, y und die Zeichen (x) und [x] ein; auf diese Weise werden x, y . . . durch Anwendung der Prozesse ( ), [ ] zu gebundenen Variablen. 13 Definition von „richtig“. Eine Aussage ohne Klammerzeichen heisst richtig, wenn zu beiden Seiten von = dieselbe Ziffer steht, d. h. wenn sie numerisch richtig ist. Die Aussage (x)A(x) heisst richtig, wenn A(z) richtig ist, sobald z eine Ziffer bezeichnet. Umgekehrt wenn (x)A(x) richtig ist, so ist A(a) richtig, 4–4 Substituted
by Bernays for: auch eine by Bernays for: des Tertium non datur möglich ↑und↓ added by Bernays 6–6 Added by Bernays. 7–7 Substituted by Bernays for: Da die Anwendbarkeit des Tertium non datur bei endlich vielen Aussagen eine Selbstverständlichkeit ist, so wendet sich unsere ganze Aufmerksamkeit sofort. Hilbert has added an exclamation point in the left margin next to the insertion. 8–8 Substituted by Bernays for: zu 9–9 Substituted by Bernays for: sie 10–10 Added by Bernays. 11–11 Bernays has altered this sentence from: Die Figuren x = a, x = y bezeichnen wir als Formeln. 12–12 Substituted for: und unter x, y freie Variable verstehen. 13–13 The sentence originally read: Wir führen ferner die Zeichen (x) und [x] folgendermassen ein. (x)A(x) bedeutet: Wenn x eine Ziffer bezeichnet, so gilt A(x). [x]A(x) bedeutet: A(η), wo η eine bestimmte Ziffer bezeichnet, ist widerspruchsfrei. Wir machen auf diese Weise x, y . . . durch Anwendung der Prozesse ( ), [ ] zu gebundenen Variablen. The changes are by Bernays. 5–5 Substituted
5
10
15
20
25
‘Ueber die Grundlagen des Denkens’ (c. 1931)
5
10
15
20
25
30
35
767
sobald a irgend eine Ziffer ist 14 ; hierdurch ist der Begriff „alle“ definiert. 14 Ferner: wenn A(η) richtig ist, wo η eine 15 feste, 15 bestimmte Ziffer bezeichnet, so heisst [x]A(x) richtig, und umgekehrt: „Die Aussage [x]A(x) ist richtig“ bedeutet, dass die Formel A(η) richtig ist, wo η eine bestimmte Ziffer bezeichnet. Es ist zwar keine Rede davon, dass wir 16 allgemein 16 feststellen können, welchen Wert η hat 17 . Da η eine bestimmte Ziffer bedeutet, so bedeuten die mit η gebildeteten Formeln numerische Formeln. Diese Einführung des η ist keineswegs ad hoc gemacht, sondern sie entspricht dem in der Mathematik stets geübten Brauche und ist unentbehrlich. In der üblichen und von unseren Klassikern der Mathematik geschaffenen Mathematik wird so verfahren, dass man Zeichen für Zahlen oder Funktionen einführt, von denen man nicht weiss und auch nicht entscheiden kann, welchen Wert sie haben. Dieses Verfahren ist | dasjenige, welches durch die Einführung von η in eine feste Form gebracht wird und zur Begründung der Mathematik unentbehrlich, aber auch durchaus zulässigen finiten Charakters ist. Damit ist der Begriff „es gibt“ definiert: 18 wir sagen: es giebt eine Ziffer η, so dass A(η) richtig ist. 18 In der Logik scheint mir die wesentliche Aufgabe nicht darin zu bestehen, einzelne Begriffe oder Schlussweisen als entbehrlich zu erweisen, sondern vielmehr kommt es darauf an, die üblichen Begriffe und Schlussweisen in vollständiger und einfacher Weise als zulässig und erlaubt zu erkennen. Die Formel A→B bedeutet: wenn A richtig ist, so ist auch B richtig. Eine Aussage, die aus mehreren durch & oder ∨ verbundenen Aussagen besteht, ist dann und nur dann richtig, wenn jede, bezüglich wenigstens eine dieser Aussagen richtig ist; also A ∨ B ist richtig, heisst: A ist richtig oder B ist richtig und A & B ist richtig heisst A ist richtig und B ist richtig. Definition des „Schlusses“. Aus einer richtigen Aussage kann man durch gewisse Prozesse andere richtige Aussagen machen; dies nennt man Schliessen. Das Schliessen erfolgt insbesondere, indem man ein Allzeichen durch einen besonderen Ausdruck ersetzt, also durch Einsetzen und ferner durch Anwendung des Schlussverfahrens der Elimination: „Wenn A und A → B richtig sind, so ist auch B richtig“. Tatsächlich wird, wie man leicht erkennnt, durch diese beiden Verfahrungsarten aus jeder richtigen Aussage wieder eine richtige. Definition der Negation. Die Negation einer Aussage A wird durch einen wagerechten Strich darüber, also durch A dargestellt, wobei im Falle einer All- oder Seinsaussage der Strich über dem All- oder Seinszeichen genügt.
14–14 Interlineated
by Bernays. by Bernays. 16–16 Interlineated by Bernays. 17 Bernays first inserted then deleted: ; wir sagen: es gibt eine Ziffer η, sodass A(η) richtig ist. 18–18 Interlineated by Bernays. 15–15 Interlineated
4
5
768
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
Wir setzen ferner fest (x)A(x) → [x]A(x), und [x]A(x) → (x)A(x). Die Bedeutung der Negation findet allgemein in den Formeln (A → W) → A, A → (A → W) ihren Ausdruck, wo W den Widerspruch 1 = 1 bedeutet. Für numerische Aussagen stimmen die getroffenen Festsetzungen mit den üblichen Tatsachen überein. Wir wollen allgemein zeigen, dass die genannten Formeln widerspruchsfrei sind. Der Einfachheit halber nehmen wir dabei an, dass die Aussage A(x) ausser der Variablen x nur numerische Grössen enthält. Soll nun (x)A(x) auf einen Widerspruch führen, so kann das nur dadurch geschehen, dass für eine gewisse Konstante a die Aussage A(a) nicht zutrifft; dann aber sind die obigen Formeln gerechtfertigt. Ebenso könnte [x]A(x) nur dann auf einen Widerspruch führen, wenn für alle Werte von x die Aussage A(x) falsch wäre und damit sind wiederum unsere Formeln im Einklang. Ferner gelten folgende Definitionen A ∨ B A & B, 6
A & B A ∨ B. Aus unseren Definitionen der Negation folgern wir unmittelbar durch Rechnung:
5
10
15
20
A→A A→A und ferner noch die Formeln A&A→W
25
A → (A → W) (A → W) → A. Der Prozess der Negation ist eindeutig, d. h. wenn zwei Sätze die Negation desselben Satzes darstellen, so stimmen die beiden Sätze inhaltlich überein. Die Negation ist ein notwendiges theoretisches Forschungsmittel; seine unbedingte Anwendung ermöglicht erst die Vollständigkeit und Abgeschlossenheit der Logik. Definition der „Widerspruchsfreiheit“. Die Aussage A heisst widerspruchsfrei, wenn es nicht möglich ist, mit ihrer Verwendung den Widerspruch W zu beweisen. Diese Definition ist identisch mit der folgenden: wie auch A in einem Beweise beim Schliessen benutzt wird, so ist die Endformel des Beweises niemals 1 = 1. „Widerspruchsfrei“ — ebenso wie „Richtig„ — ist ein absoluter Begriff; 19 denn wir setzen ausdrücklich fest, dass beim Beweisen als zulässige Begriffs- und Schlussmethoden jedesmal nur diejenigen anzusehen sind, die das Verständnis der Aussage A nötig macht, so dass hinsichtlich 19 Hilbert
has here placed a question mark in the left margin.
30
35
40
‘Ueber die Grundlagen des Denkens’ (c. 1931)
5
10
15
20
25
30
35
769
der Bedeutung unserer Definitionen von „widerspruchsfrei“ und „richtig“ keine Unbestimmtheit eintritt. Die bisher aufgestellten Regeln und Festsetzungen haben trotz mannigfaltigster und wiederholter Anwendung noch nie zu einem Widerspruch geführt und daher ist die Widerspruchsfreiheit derselben sehr wahrscheinlich; dennoch bedarf es des strengen Nachweises dafür, zumal wir zum weiteren Aufbau der mathematischen Wissenschaft jener Regeln und Formeln bedürfen. Im folgenden werde ich den Beweis für diese Widerspruchsfreiheit skizzieren. Wir nehmen im Gegensatz zu unserer Behauptung an, es sei ein Beweis für W vorgelegt. Unter Beweis verstehen wir dabei eine Kette von Schlüssen, die aus Zahlen und Begriffen von folgender Art zusammengesetzt sind. Wenn A → B und B → C, so ist auch A → C. Wenn a = b, so ist auch A(a) → A(b), wo A irgend eine a enthaltende Aussage ist.A 20 Weitere Schlussweisen insbesondere die Möglichkeit und Anwendung des Rekursionsverfahrens, brauchen wir nicht besonders aufzuführen, da sie sich aus den genannten Schlüssen unmittelbar ableiten lassen. Absatz! 20 Aus diesem Beweise für W schaffen wir zunächst das Zeichen → weg, indem wir allemal anstatt A → B die Formel A ∨ B einsetzen. Wenn ferner im Beweise das erste Mal A ∨ B steht, so kann diese Aussage nur aus der Formel A → (A ∨ B) erschlossen sein. Man setze dann statt A ∨ B vielmehr allein A ein und löse aus dem nachfolgenden Beweise denjenigen Teil heraus, der nur die erste Behauptung A benutzt. Derselbe enthält das Zeichen ∨ (oder) wenigstens einmal weniger und führt dennoch zu demselben Endziel W, wie der ursprüngliche | Beweis. Durch wiederholte Anwendung dieses Verfahrens erhalten wir einen Beweis, der überhaupt kein Zeichen ∨ mehr enthält. Denn die Formeln (A ∨ B) → (B ∨ A) (A ∨ B) & C (A & C) ∨ (B & C) können nirgends angewandt sein, da dieselben stets eine Voraussetzung haben müssen, in der das Zeichen ∨ schon vorkommt. Der so entstandene Beweis enthielte weder das Zeichen → noch das Zeichen ∨, sondern nur die Rechnungsregeln; er könnte daher nicht auf W endigen. Damit ist unsere Annahme widerlegt. 21 Zum Aufbau der mathematischen Wissenschaft haben wir bisher A
recursiv Def.? Comment by Hilbert in the left margin (deleted).
20–20 This
paragraph has been added by Hilbert in the left margin and again corrected. After ‘Weitere Schlussweisen’ he has crossed out ‘lassen sich aus diesen Schlussweisen ableiten’. The word ‘aufzuführen’ was substituted for ‘zu berücksichtigen’. He also deleted the beginning of the following paragraph in the typescript, which ran: Z(a) heisst a ist eine Ziffer. Z(a), ihr Gegenteil heisst: a ist eine Figur, die aus Einsen zusammengesetzt ist, bei der aber eine der zur Ziffer nötige Eigenschaft nicht zutrifft. 21 At this point in the typescript Hilbert has indicated a paragraph break and added in the left margin: Absatz!
7
8
770
9
10
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
stets die direkte Schlussweise angewandt. Durch diese allein ist aber der vollständige Aufbau nicht möglich. Eine der wichtigsten und bereits zum Aufbau der elementaren Zahlentheorie nötigen Sätze ist der Satz vom Tertium non datur. Derselbe lautet: Wenn A(x) eine beliebige Aussage mit einer Variablen x ist, so ist entweder A(z) für alle z widerspruchsfrei, oder die Annahme, dass z die Eigenschaft der Ziffer besitzt und dabei A(z) gilt, führt auf W, d.h. in kürzerer Ausdrucksweise die Annahme, es gäbe eine Ziffer z, so dass A(z) gilt, führt auf W. Zum Beweise dieses 22 Satzes vom 22 Tertium non datur bedarf es eines indirekten Schlussverfahrens; dasselbe besteht 23 allgemein 23 in folgendem: Wir fügen zu den schon bewiesenen Formeln eine weitere Formel hinzu und beweisen dann, dass dieselbe mit jenen zusammen widerspruchsfrei ist. Bei diesem Verfahren ist also der vorhin definierte Begriff widerspruchsfrei wesentlich. Wir beweisen zunächst den Fundamentalsatz: Eine widerspruchsfreie Aussage ist stets auch richtig. Zum Beweise mache ich die Annahme, die Aussage A sei widerspruchsfrei. Ich nehme zunächst an, dass in A kein Folgtzeichen vorkommt und führe dann in A statt der All- und Seinszeichen die Zeichen z und η ein. Dadurch entsteht aus A eine numerische Aussage, und diese ist für alle Ziffern z richtig, weil sie widerspruchsfrei ist. Sodann mache ich die Annahme, der Fundamentalsatz sei bereits bewiesen für den Fall, dass die darin vorkommenden Formeln höchstens n Folgtzeichen enthalten. Dabei soll „oder“ (∨) durch „folgt“ (→) und „nicht“ ( ) ausgedrückt sein, indem wir anstelle A ∨ B jetzt A → B setzen. Nun sei im Beweise ein Folgtzeichen mehr vorhanden. Wir zeigen dann: wenn die Formel B → C widerspruchsfrei ist, so ist sie auch richtig, d. h. wenn B richtig ist, dann ist auch C richtig. In der Tat, wenn die beiden Annahmen: B ist richtig und B → C ist widerspruchsfrei zutreffen, so folgt, dass aus den beiden Formeln B und B → C nicht W abgeleitet werden kann. Durch das Schlussschema entsteht aber aus B und B → C die Formel C, Also kann auch die Hinzunahme von C nicht auf W führen und C ist somit richtig, da wegen unserer Voraussetzung C nur n Folgtzeichen enthält. Damit ist der Fundamentalsatz bewiesen. 24 Nunmehr sind wir in der Lage, unseren vor|hin aufgestellten Satz von Tertium non datur zu beweisen. Zu dem Zwecke machen wir die Annahme, es liege auf Grund des Tertium non datur ein Beweis für W vor. Das Tertium non datur sei darin angewandt auf 25 die Aussagen 25 A(x), B(x), . . . .
22–22 Interlineated
by typist. by Bernays. 24 At this point in the typescript Hilbert has indicated a paragraph break and added in the left margin: Absatz! 25–25 Added by Bernays. 23–23 Interlineated
5
10
15
20
25
30
35
‘Ueber die Grundlagen des Denkens’ (c. 1931)
771
Insertion begins here 26
5
10
15
20
Wir untersuchen zunächst die erstere Möglichkeit (x)A(x). Die Allzeichen müssen schliesslich aus dem Beweise verschwinden: es sei dies hier durch die Spezialisierungen (x)A(x) → A(a1 ), . . . , (x)A(x) → A(an ), (x)B(x) → B(b1 ), . . . , (x)B(x) → B(bm ), ............... geschehen, wo A(a1 ), . . . A(an ), B(b1 ), . . . , B(bm ), . . . im Beweise weiter benutzt werden. Setzen wir nunmehr von vorneherein im ursprünglichen Text des Beweises überall statt (x)A(x) den endlichen Ausdruck A(a1 ) & . . . & A(an ), statt (x)B(x) den endlichen Ausdruck B(b1 ) & . . . & B(bm ), so vermeiden wir dadurch die Benutzung des Tertium non datur für unendliche Aussagen und es gelten daher obige Schlüsse ohne die strittige Anwendung des Tertium non datur. Da ich annehmen darf, dass ohne 27 Anwendung des Tertium non datur kein Widerspruch herauskommen kann, so kann nach dem eben Ausgeführten auch mittels des Tertium non datur kein Widerspruch herauskommen; 28 dann wäre aber für ein geeignetes η, jedenfalls A(η) richtig und demnach ein Widerspruch w wiederum nicht ableitbar. Ein Widerspruch ist also überhaupt nicht möglich und diese letztere Aussage ist gleichbedeutend mit der Gültigkeit des Tertium non datur. Insertion ends here
25
30
Durch diesen, wie ich glaube, einwandfreien Beweis des Tertium non datur sind auch alle übrigen von mir bisher an anderen Orten aufgeführten Entwicklungen und Ergebnisse zur | Grundlagentheorie gesichert, z. B. folgt aus dem Tertium non datur „A ∨ A ist richtig“, wenn A irgend eine beliebige 29 Aussage ist, mit Benutzung der Formeln A & A → W leicht der Satz: Eine jede Aussage ist entweder richtig oder falsch. Durch diesen Aufbau ist 30 die Widerspruchsfreiheit der Axiome der Zahlentheorie gesichert, 31 Die soeben von mir befolgte Methode ist aber genau 26 The following passage went through several versions; the final version is given here. For more detail, and the original version, see p. 773, below. 27 Added at the bottom of the page in Hilbert’s hand, but in a different pen: Wenn eine Formel mit ∨ wf ist, und nehmen wir etwa an A sei wf, dann ist, da A ein ∨-Zeichen weniger enthält, A auch r und daher auch A ∨ B. Entsprechend verfahren wenn → vorkommt A → B wf ist, so auch B wf und daher r. Also ist wf = r allgem. The last line is crossed out and illegible. 28 Added in margin: Unsere Annahme ist damit widerlegt. Es bleibt nur die zweite Möglichkeit ??? dass [x]A(x) gilt und diese Form auf W führt 29 Hilbert has added in the right margin: n 30 Deleted: zugleich 31–31 Substituted for: und ebenso werden im weiteren Verfolg dieser Methode auch die Axiome der Analysis einschliesslich der Funktionentheorie als widerspruchsfrei erkannt, wobei wir uns noch der folgenden Definition bedienen:
11
772
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
in gleicher Weise auf Analysis einschliesslich Funktionentheorie anwendbar und dadurch werden auch deren Axiome als wf erkannt. Zur Definition der Funktionen 32 verfahren 32 wir 33 dabei etwa 34 folgendermassen: 31 Definition der Funktion. Es sei f (a) ein Zeichen derart, dass wenn a 35 eine bestimmte Ziffer bezeichnet, auch f (a36 ) eine bestimmte Ziffer bezeichnet. Das Zeichen f (a) heisst eine Funktion. Das vorhin definierte „alle“ und „es gibt“ wird nun auch auf Funktionen u. s. w. anwendbar, also allemal wenn A eine Aussage über f ist und wenn A(f ) gilt, sobald f eine Funktion ist, so schreiben wir (f )A(f ); das Gegenteil hiervon ist durch [f ]A(f ) definiert, wo [f ] inhaltlich „es gibt“ bedeutet, d. h. es ist f eine gewisse bestimmte Funktion, für die A(f ) gilt. 37
32–32 Substituted
for: bedienen uns 34 Deleted: der 35 Substituted for: a 36 Substituted for: a 37 On the back of page 11, the following lines have been added with a thin pencil. They possibly belong to the notes on the back of page 9: oder d. h. 1.) 2.) 2.) → w aber unmöglich, da ja unter Verwendung von Formel A kein w vorkommen kann. 1.) aber hat die Form (x)A(a) → da . . . vgl. nun Beiblatt zu S. 10 und dann wie oben ausführlich dargelegt. 33 Deleted:
5
10
‘Ueber die Grundlagen des Denkens’ (c. 1931)
773
Original of the text on p. 10 of the typescript
5
10
15
The passage on p. 10 of the typescript, between ‘Insertion begins here’ and ‘hInsertion ends herei’ (p. 771, above) went through several versions. The first version is the typescript. Hilbert heavily corrected the remainder of the typed paragraph in pencil. He later (in ink) crossed out most of the paragraph, and on an accompanying page handwrote (in ink) a revised version; he then revised that handwritten page in pencil. That page has in the upper left-hand corner the remark, ‘∗) (Einschieben S. 10 die Aussagen’, indicating that the passage was to be inserted at this point in the text. (Photographic reproductions of both the original typewritten page, and of the page to be inserted, can be found below, following the Description of the Text.) In the main text above we have reproduced the final version, recording in the footnotes the pencilled changes Hilbert made to the inserted page. The first, typed version of the remainder of the present paragraph read as follows:
Andererseits seien im Beweise [x]A(x), [x]B(x), . . . als richtig erkannt und sodann vermöge des Tertium non datur die Folgerungen gezogen und hieraus endlich die Formeln (x)A(x) → A(a1 ), . . . , (x)A(x) → A(an ),
20
25
30
(x)B(x) → B(b1 ), . . . , (x)B(x) → B(bm ) ............... gewonnen. Setzen wir dann statt (x)A(x) überall im Beweise A(a1 ) & . . . & A(an ), statt (x)B(x) überall im Beweise B(b1 ) & . . . & B(bm ), . . . . , so gelten jene Folgerungen ohne Benutzung des Tertium non datur. Ich darf annehmen, dass ohne Anwendung des Tertium non datur kein Widerspruch herauskommen kann. Also kann nach dem eben Ausgeführten auch mittels des Tertium non datur kein Widerspruch herauskommen. Freilich muss noch der Fall berücksichtigt werden, dass Widerspruch auch dadurch kommen könnte, dass neben (x)A(x) auch [x]A(x) aus den Formeln beweisbar ist; dann wäre aber für ein geeignetes η, jedenfalls A(η) richtig und demnach der Widerspruch W auch ohne Benutzung des Tertium non datur erkennbar; die letztere Aussage ist gleichbedeutend mit der Gültigkeit des Tertium non datur.
774
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
Textual Notes 765.13: 765.25: 766.4: 766.11: 766.14–15: 767.1: 767.2: 767.4: 767.23: 767.26–27:
770.21: 771.2: 771.4:
halte] Bernays has deleted a semicolon after ‘halte’. werden] Changed by Bernays from: wird Unendliche second occurrence] Bernays has changed this from: Unendlich hier] Bernays has changed this from: hier zunächst aufbauen.] aufbauen irgend] Inserted by Bernays. η] Bernays has twice replaced a with η. eine] Bernays has changed from: eine gewisse, ist auch] istauch also . . . richtig.] Bernays has changed this from: also A∨B bezüglich A & B ist richtig, heisst: A ist richtig oder B ist richtig bezüglich, wenn A ist richtig und B ist richtig Annahme] Bernays has changed from: Ausnahme (x)A(x). Die] (x)A(x) die Spezialisierungen] Spezialisirungen
Description of the Text
775
Description of the Text Collection: SUB Göttingen, Cod. Ms. D. Hilbert 604. Size: The pages numbered from 1 to 11 are of size 21.0 × 29.8 cm. A single page (22.5 × 28.0 cm) is inserted between pages 9 and 10, which is jagged on top, as if torn from a writing pad. Cover Annotations: — Composition: The text consists of 12 loose pages. The pages have a small hole at the upper left-hand corner, as if they were once held together by a pin. Pagination: Pages 1–3 are numbered at the top centre of the page with a typewriter, while the remaining typed pages are numbered 4–11 in black ink on the upper right-hand corner. The inserted page is not numbered. Original Title: ‘Ueber die Grundlagen des Denkens. // Von David Hilbert.’ Text: The text (except for the insertion) is a typescript. The text on pages 1–3 appears bolder than on the remaining pages. Formulæ and Greek letters have been inserted in black ink in spaces left by the typist. Corrections and annotations were made in black ink both in Hilbert’s handwriting and in a different, unidentified hand. In addition, underlinings, remarks in the margins, and further corrections and annotations were made in pencil by Hilbert. Additions in pencil can also be found on the back of pages 9 and 11. The handwritten insertion, which begins with ‘∗ ) (Einschieben S. 10’, is intended to replace the part of page 10 which has been crossed out. It is written in black ink in Hilbert’s hand, and it itself is corrected and annotated in pencil. The order of the various layers on page 10 appears thus to be: typescript; formulas added in black ink; corrections in pencil and crossings-out in black ink; the insertion page handwritten in black ink; corrections, emendations and deletions to this latter in pencil.
Photographic reproduction of the original p. 10 of the typescript ‘Ueber die Grundlagen des Denkens’ (c. 1931).
Photographic reproduction of the handwritten insertion to p. 10 of the typescript ‘Ueber die Grundlagen des Denkens’ (c. 1931).
778
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
Introduction to ‘Über das Unendliche’ of May 1933 The following brief text (Hilbert 1933b* ) is a typescript, annotated in Hilbert’s hand, for a lecture; it bears the date ‘D[ienstag] 23.5.1933’. We have been unable to establish either the location or the circumstances of the lecture: it was clearly intended for a general audience, presumably in Göttingen. The lecture adds little new. It covers ground that had been explored in much greater depth in the ‘Über das Unendliche’ lecture course of 1924/25 as well as in the Münster address, Hilbert 1926 . We reprint the typescript for whatever light it sheds on the continuity of Hilbert’s views at this late stage in his career, and because, apart from Hilbert and Bernays 1934 and Hilbert and Bernays 1939 (which were mostly written up by Bernays), it appears to be Hilbert’s last polished statement on the foundations of mathematics. The typescript has no title, which has been supplied by the Editors. William Ewald
‘Über das Unendliche’ (23.5.1933)
779
Über das Unendliche (23.5.1933)
Meine Damen und Herren,
5
10
15
20
25
30
35
Dienstag, 23. 5. 1933.
Das Unendliche hat wie keine andere Frage von jeher so tief das Gemüt der Menschen bewegt; das Unendliche hat wie kaum eine andere Idee auf den Verstand so anregend und fruchtbar gewirkt; das Unendliche ist aber auch wie kein anderer Begriff so der Aufklärung bedürftig. ↑und zwar besonders aus folgendem Grunde:↓ Alles was uns im täglichen Leben begegnet, was Gegenstand unserer Erfahrung ist, was wir wissenschaftlich experimentell untersuchen oder beobachten, hat stets und überall den Charakter des Endlichen an sich. ↑Gegenständliches nach Raum-Zeit, wie Begriffliches, wie Leben . . . 1 ↓ Das Unendliche wäre die Negation des Endlichen. Aber ist da überhaupt eine Negation möglich? Wir müssen uns vor Allem vergegenwärtigen, welch inhaltliche Bedeutung dem Unendlichen in der Wirklichkeit zukommt. Der erste naive Eindruck von dem Naturgeschehen und der Materie ist der des Stetigen, des Kontinuirlichen. Haben wir ein Stück Metall oder ein Flüssigkeitsvolumen, so drängt sich uns die Vorstellung auf, dass sie unbegrenzt teilbar | seien, dass ein noch so kleines Stück von ihnen immer wieder dieselben Eigenschaften habe. Aber tatsächlich stossen wir überall auf Grenzen für die Teilbarkeit, die nicht an der Unzulänglichkeit unserer Versuche, sondern in der Natur der Sache liegen, so dass man geradezu die Tendenz der neueren Wissenschaft als eine Emanzipation von dem Unendlichkleinen auffassen könnte; denn die Physik blieb bei der Atomistik der Materie nicht stehn, sondern lehrte zuletzt ↑sogar↓ die Atomistik der Elektrizität. Und das Fazit ist jedenfalls, dass ein homogenes Kontinuum, welches die fortgesetzte Teilbarkeit zuliesse und somit das Unendliche im Kleinen realisiren würde, in der Wirklichkeit nirgends angetroffen wird. ↑Und dies ist zugleich die wichtigste und fruchtbarste Erkenntnis und bedeutet einen Hauptfortschritt!↓ Die zweite Stelle, an der uns in der Natur die Frage nach der Unendlichkeit entgegentritt, treffen wir bei der Betrachtung der Welt als Ganzes. Hier haben wir die Ausdehnung der Welt zu untersuchen, ob es in ihr ein Unendlichgrosses giebt. Bis zu Kant und auch weiterhin hegte man an der Unendlichkeit des Raumes keinen Zweifel. Aber diese Auffassung beruhte auf einem Denkfehler. Aus der Tatsache, dass ausserhalb eines Raumstückes immer wieder Raum vorhanden ist, folgt nur | die Unbegrenztheit des Raumes, keineswegs aber seine Unendlichkeit. Unbegrenztheit und Endlichkeit aber schliessen einander 1 The
elliptical dots are Hilbert’s.
1
2
3
780
4
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
nicht aus. ↑wie eine 2 dimensionale Kugeloberfläche lehrt.↓ Die Endlichkeit können wir zwar gegenwärtig experimentell noch nicht beweisen; ↑dazu wäre nötig, die Anzahl der Kilometer anzugeben von Höhe, Tiefe, Breite des Raumes↓ ich halte sie aber für äusserst wahrscheinlich, zumal sich gegen die Unendlichkeit schwerwiegende Einwände herausgestellt haben. 2 Die Misslichkeiten entstehen, wenn wir an die Materie im Raume denken. Soll sie endlich oder unendlich sein? Nehmen wir sie an, wie hier, verteilt, so zeigt sich unendliche Helligkeit und Wirkung. Nehmen wir sie aber als endlich an, so wäre der weitere Raum leer und warum sollen wir ihn dann annehmen? 2 ↑Also im Realen ist das Unendliche nicht zu finden!↓ Ist nun doch vielleicht in unserem Denken das Unendliche möglich? Giebt es nicht unendlich viele Zahlen? Aber, wenn wir dies sagen, bedienen wir uns nur einer façon de parler ! In Wahrheit haben wir z. B. die Gesamtheit der Zahlen 1, 2, 3, . . . als Einheit nicht vor uns. Wir konstatiren nur, dass wir, wenn eine beliebige Menge von Strichen vorliegt, noch immer ein weiterer Strich zugefügt werden kann. ↑ebenso wie die Zeit, die abgeschlossen nicht zu denken ist↓ Es sei A(x) eine beliebige Aussage; wenn dieselbe für alle ganzen Zahlen richtig sein soll, schreiben wir für alle x A(x). Das Gegenteil, d. h. die Negation, bezeichnen wir mit nicht A(x) 3 . Damit kommen wir auf die frühere Frage nach der Bedeutung der Negation zurück. Handelt es sich um eine einzelne Aussage 2 = 3, 2 = 3 oder um endlich viele, so finden wir noch keinerlei Schwierigkeit. Aber was bedeutet überhaupt nicht A(x)? Meines Wissens ist diese Frage bisher ernstlich noch gar nicht ↑aufgeworfen und↓ behandelt worden — eine Gedankenlosigkeit, die sich in der Wissenschaft, insbesondere Logik und Philosophie | zu einer vollständigen Katastrophe entwickelte.A Also eine sorgfältigere Begründung der Logik ist nöthig; was aber zu weit führt. Nur 2 Punkte zähle ich auf, die schon berührt. 4 1. Die finite Grundeinstellung d. i. die Fähigkeit unseres Geistes, durch die wir a priori in der Vorstellung konkrete Objekte unmittelbar erleben als etwas, das sich weder auf etwas anderes reduzieren lässt, noch einer solchen Reduktion bedarf. Diese finite Grundeinstellung ist bei allem wissenschaftlichen Denken erforderlich: Kants Apriori. 2. Die Definition der Negation. Die Negation einer Aussage A, also Nicht A, heisst eine Aussage, die mit A die Kennzeichen der Negation, nämlich das Principium contradictionis und das Tertium non datur erfüllt. Z. B. [x] A(x) „es giebt“ muss genau geprüft werden, nicht selbstverständlich, weil Anschauung fehlt. ↑Hier Beweis der Eindeutigkeit der Negation↓ Die AusserachtlasAt the top of the page Hilbert has added: sehr merkwürdig, da man sonst Nebensächliches mit Breite und Umständlichkeit erörtert! A
2–2 Hilbert has added ‘Die Miss’ after ‘haben.’ and then continued the rest of the insertion at the base of the page, commencing with ‘lichkeiten’. 3 Hilbert, and also three lines below, Hilbert clearly means ‘nicht für alle x A(x)’. See the Textual Notes for these lines. 4 Hilbert modified the end of this sentence, which originally concluded: ist nöthig, deren Hauptpunkte zähle ich auf.
5
10
15
20
25
30
35
‘Über das Unendliche’ (23.5.1933)
5
10
15
20
25
30
781
sung der Vorsicht hat tatsächlich zu den sogenannten Paradoxien geführt.B Wenn Sie ein philosophisches Buch aufschlagen, treffen Sie sicher auf Sätze mit Nicht oder auch mit Ewig, Unerforschlich, Unbekannt etc. ↑andere Nichtworte sind: ignorabimus, unmöglich, sinnlos↓ Erst durch die Kontrolle ↑d. h. meine Definition von nicht↓ erhalten diese Sätze Sinn und Wahrheitswert. ↑Ich meine geistiger Schutt von 20 Jahrhunderten verschwindet.↓ Der frühere leichtfertige Umgang mit dem Unendlich ist gekommen, weil wir allenthalben auf sehr grosse Zahlen stossen und diese dann mit Unendlich identifiren. | ↑z. B., wenn wir uns zuerst an das naivste Kind menschlichen Geistes, die Zahlentheorie wenden: die grösste bisher bekannte Primzahl ist: 170141183460469231731687303715884105727 sie ist 39-ziffrig, also von der Größenordnung 1039 .↓ Ferner in der Astronomie sehr grosse Entfernungen viele 1000 Lichtjahre betragen die Entfernungen der Sterne von uns. Auch das Alter der Sterne ist sehr hoch. Unsere Sonne, bis sie durch Strahlung all ihre Energie verliert, lebt noch 1013 = 10 Billionen Jahre. In dem Märchen giebt es einen Diamantfelsen 100 Meilen lang, breit und hoch. Alle 100 Jahre kommt ein Vogel und wetzt seinen Schnabel. Nehmen wir an, dass bei dieser Operation jedes mal ein Diamantatom abhanden kommt, so reicht der Felsen doch 1048 Jahre. Die Ewigkeit des Märchens führt also zu erheblich grösseren Zahlen. ↑Aber trotzdem im Prinzip keine Spur von Unendlich!↓ Betreffs Paradoxien giebt es sehr viele und mannigfaltige. Ich nenne nur folgende beispielsweise: In einem Dorf lebt ein Frisör, der ein sehr logischer und gewissenhafter Mensch ist, insbesondere von einem einmal als richtig erkannten Princip nie abgeht. Ein solches Princip ist, dass er alle und nur die rasirt, die sich nicht selbst rasiren. Er befindet sich nun selbst in grösster Verlegenheit; denn . . . 5 Die Paradoxien zeigen, dass also auch in unserem Denken das Unendliche nicht 6 gelitten werden kann, wenigstens nicht 6 als existirender Gegenstand. 7 Als façon de parler erfüllt es seinen Zweck besonders in der Mathematik und trifft dort meist den Kernpunkt einer Ueberlegung z. B. Ein interessantes und schwieriges Problem ist das 4-Farbenproblem. 8 Ein schwieriges Problem lösen heisst das in ihm liegende Unendlich zu überwinden und darin liegt der Triumph des Verstandes und unsere Genugtuung. 8 Added by Hilbert in the bottom margin, and assigned to this position in the text by a correction mark: Wenn Behauptung und ihr Gegenteil denselben Wahrheitswert haben, so verliert die Behauptung jeden Sinn. Erst als dieser schlimmste Fall eintrat, merkte man auf. B
5 The
elliptical dots are Hilbert’s. for: da ist, vielmehr durch sie definitiv 7 Hilbert has deleted the final words ‘beseitigt ist’ here when making the substitution earlier in the sentence. The sentence originally read: ‘nicht da ist, vielmehr durch definitiv als existirender Gegenstand, beseitigt ist’. 8–8 This observation was written by Hilbert across the top of the page. 6–6 Substituted
5
6
782
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
Problem der Nachbargebiete: Höchstzahl der Gebiete in der Ebene, so dass jedes Gebiet an jedes andere längst einer ganzen Grenzlinie anstösst. Diese Höchstzahl ist 4. In der Tat ein 5tes lässt 4 sich nicht mehr finden, da 2 ganz eingeschlos1 2 sen liegt. Mit diesem Problem steht in engem Zu3 sammenhang das Farbenproblem. Trotzdem sich seit Mitte des vorigen Jahrhunderts die scharfsinnigsten Mathematiker bemüht haben, ist es bisher nur gelungen zu zeigen, dass 5 Farben ausreichen, während in allen speziellen Fällen schon 4 Farben genügen. Merkwürdigerweise ist das scheinbar viel schwierigere Problem auf dem Ringe völlig gelöst. ↑Also die Saturnbewohner kommen auf ihren Landkarten mit 7 Farben aus. ↓ 9 Die Rolle der Zahl 4 übernimmt hier die 7.
5
10
A∗ 1
1 B
B
4
∗
3 1
6
2
7 5
1
A
Bestätigung des am Anfang über das Unendlich Gesagte: Nirgends real, aber reizvoll und anregend. Eigenschaften, wie sie jedem Ideal zukommen, und weshalb uns die Ideale so lieb sind.
9 This insertion is directed by an arrow to this point in the text, but clearly should come after the following sentence.
15
Textual Notes
783
Textual Notes 779.2: 779.2: 779.11: 779.16: 779.24: 780.1: 780.1: 780.1: 780.3: 780.3–4: 780.10: 780.12: 780.13: 780.18:
780.19:
780.22:
780.23: 780.35: 780.35: 780n: 780n: 781.3: 781.4: 781.5: 781.9: 781.9: 781.10: 781.12: 781.15: 781.19: 781.21: 781.21: 781.25: 781.25: 781.26: 781.28: 781.29: 781.32: 781.32:
Meine Damen und Herren,] M D u. H. Dienstag,] D. Begriffliches,] Begriffl. Kontinuirlichen] This spelling is Hilbert’s. stehn] This spelling is Hilbert’s. eine] ein dimensionale] Dimensio Kugeloberfläche] Kugelob. Kilometer] Kilom. Höhe, Tiefe, Breite des Raumes] Höhe Tiefe Breite d. Raumes nicht] Underlined twice. sagen,] sagen façon de parler ] facon de parler für alle x A(x)] Originally this read ‘(x) A(x)’. In ink above this, Hilbert has added ‘für alle x’, and then, in pencil, has crossed out the ‘(x)’. nicht A(x)] Originally this read ‘(x) A(x)’. Hilbert has added above it in ink ‘Nicht’, and then, in pencil, has crossed out the overlining above the formula as well as the ‘(x)’, resulting in an incorrect formulation. nicht A(x)] Originally this read ‘(x) A(x)’. Hilbert added above it in ink ‘Nicht’, and then apparently has crossed out the overlining above the formula in light pencil as well as the ‘(x)’, resulting in an incorrect formulation. und] u Principium] Prinpipium Z. B.] z. B. und] u. erörtert] erörter Ewig, Unerforschlich, Unbekannt] The upper case letters with which these adjectives begin are Hilbert’s. Kontrolle] Underlined twice. Definition] Def. identifiren] This spelling is Hilbert’s. z. B.] Z. B. bisher] bishe Ferner] Hilbert has altered this from: Z. B. verliert,] verliert Ewigkeit] Ewiskeit Paradoxien] Paradoxieen und] u. rasirt] This spelling is Hilbert’s. rasiren] This spelling is Hilbert’s. Paradoxien] Paradoxieen façon de parler ] Facon de parler Ein] Hilbert has altered this from: ein Triumph] Triumpf und] u.
784 782.7: 782.12: 782.14:
Chapter 4
Lectures on the Infinite (1924/25, 1931, 1933)
Trotzdem] Hilbert has altered this from: Trotz Also] also Gesagte:] Hilbert has altered this from: gesagte
Description of the Text
785
Description of the Text Collection: SUB Göttingen, Cod. Ms. D. Hilbert 595 Size: Page size 22.2 × 28.3 cm. Cover Annotations: — Composition: The text consists of 6 loose pages. Pagination: The pages are numbered consecutively from 1 to 6 on the upper righthand corner. Original Title: No specific title is given; the title given to the document here has been supplied by the Editors. The date ‘Dienstag. 23.5.1933’ appears centered on the first line of text. Text: Pages 1 to 6 contain continuous text in Hilbert’s hand (with a few drawings on the last page) in black ink. Hilbert corrected, annotated, and underlined the text in both black ink and pencil.
Appendices A. ‘Grundzüge der theoretischen Logik’ (1928)
B. ‘Die Grundlagen der Mathematik’ (1927)
C. ‘Probleme der Grundlegung der Mathematik’ (1928)
D. ‘Die Grundlegung der elementaren Zahlenlehre’ (1931)
E. ‘Beweis des Tertium non datur’ (1931)
W. Ewald and W. Sieg (eds.), David Hilbert’s Lectures on the Foundations of Arithmetic and Logic 1917–1933, DOI 10.1007/978-3-540-69444-1, © Springer-Verlag Berlin Heidelberg 2013
787
788
Appendices
Introduction to the Appendices 1. General. The series of appendices presented here contains the central publications of Hilbert during the period 1927–1931 (together with some additional material from Weyl and Bernays). There is, first of all, the textbook Grundzüge der theoretischen Logik, co-authored officially with Ackermann; that book and its background are discussed in the Introduction to this Volume (p. 23) and in the Introduction to Appendix A below. Only one brief additional remark should be made here, namely, that the book does not contain any proof-theoretic investigations. The latter were to be presented, as Hilbert emphasizes in the Vorwort (see p. 809 below), through a separate book to be written with Bernays and to be published ‘very soon [demnächst]’. We do not know of any lecture notes from the second half of the 1920s and the very early 1930s that would give a sense of the mathematical development of proof theory during this period. However, Hilbert’s papers Hilbert 1928a, Hilbert 1929 , Hilbert 1931a and Hilbert 1931b do give such a sense; they are republished here as Appendices B–E, respectively. The first two papers build straightforwardly on the work that had been accomplished in pursuit of Hilbert’s finitist consistency programme; see the Introduction to Chapter 3, section 3 (beginning on p. 427 above). The last two papers present considerations which are more difficult to understand: Hilbert 1931a brings in a new technique to address syntactic completeness questions for arithmetic, whereas Hilbert 1931b formulates quite novel, but also somewhat obscure, directions for further proof-theoretic work. It is clear that they react to what Hilbert and others in his School knew at the time of Gödel’s Incompleteness Theorems, and are important at the very least on that account. The last paper is also significant since it influenced Gentzen’s early attempt, starting in late 1931, to establish the consistency of full elementary number theory. This Introduction tries to describe aspects of this crucial and transitional period for proof theory; it also constitutes an open invitation for further historical and proof-theoretic investigations.1
2. Consistency and Syntactic Completeness. The arguments in Ackermann’s thesis did not establish the consistency of analysis, neither did the corrected arguments establish the consistency of elementary arithmetic. The latter fact was recognized only in 1931 after Gödel’s second incompleteness theorem had pointed to fundamental limitations of consistency proofs for arithmetic. In his Hamburg talk of July 1927, Hilbert describes first the general status of proof-theoretic work much as he had done 1 This
Introduction was completed in October of 2009. A fuller, expanded account, in particular of the development of Gentzen’s work between 1932 and 1936, is given in my ‘In the shadow of incompleteness: Hilbert and Gentzen’ (Sieg 2012a).
Introduction to the Appendices
789
in ‘Über das Unendliche’ (see his 1926 , 179, and 1928a, 74–75, pp. 930–932 below), but then discusses the ‘considerable progress in the proof of consistency’ made by Ackermann and presents the crucial steps of the ε-substitution method (pp. 82–84, below 938–940). The basic idea, which stems from his 1923 ‘Ansatz’ described above in Section 3 of the Introduction to Chapter 3, is sketched at the beginning of the discussion of Ackermann’s proof: For a proof of consistency for the ε-function, the central point is to show that the ε-function can be eliminated from a given proof of 0 = 0, in the sense that the arrays formed by its means can be replaced by numerals in such a way that the formulas resulting from the logical choice axiom by substitution, the ‘critical formulas’, go over into ‘true’ formulas by virtue of those replacements.2 (Hilbert 1928a, 82, below p. 938.)
Bernays gives additional details in his ‘Zusatz zu Hilberts Vortrag’, and also in his letter to Weyl of 5 January 1928.3 It seemed clear, as both Hilbert and Bernays assert, that these considerations establish the consistency of elementary arithmetic.4 Hilbert, optimistic as ever, believed that the method of Ackermann could be extended further: For the foundations of ordinary analysis his [Ackermann’s] approach has been developed so far that the only task which remains is that of carrying out a purely mathematical proof of finiteness. (Hilbert 1928a, 84–85, below pp. 940–941.)
More than a year later, Hilbert gave an address to the International Congress of Mathematicians in Bologna. The report he gives there on the status of proof-theoretic research is essentially unchanged: the consistency of elementary number theory has been secured by the work of Ackermann and (the only real addition) by that of von Neumann; as for analysis, the consistency proof for that has been carried out by Ackermann with just one remaining task, ‘the proof of a purely arithmetic elementary finiteness theorem’.5 Hilbert gives a wonderfully clear presentation of the broad methodological issues, and articulates directly a number of important open problems. 2 Hilbert
continues:
Diese Ersetzungen werden nach erfolgter Elimination der freien Variablen durch schrittweises Probieren gefunden, und es muß gezeigt werden, daß dieser Prozeß jedenfalls zu einem Abschluß führt.
That is, of course, the reason for requiring ‘a purely mathematical finiteness proof’. 3 Both the ‘Zusatz’ and the letter to Weyl are reprinted in Appendix B below. 4 Bernays writes in his letter of 20 April 1931 to Gödel: That proof [of Ackermann], on which Hilbert reports in his lecture on ‘The foundations of mathematics’ [Hilbert 1928a], with the addendum appended by me, I have repeatedly considered and adjudged correct.
This letter is found in Gödel 2003a, 98–103; the passage quoted is from p. 102. The original German reads: Diesen Beweis, — über den Hilbert in seinem Hamburger Vortrag über “Die Grundlagen der Mathematik” (Abh. aus d. Hamburger Math. Seminar 1928 Band IV Heft 1/2), mit dem von mir hinzugefügten Zusatz referiert hat — habe ich mir wiederholt überlegt und für richtig befunden. 5 Cf.
below, pp. 959–961; this last remark cited is found on p. 961. Bernays in 1930 gives the same description of the status of proof theory:
790
Appendices
Here the focus will be on the problem of the syntactic completeness of elementary number theory (and analysis), since that plays a central role in the further developments. The issue is formulated as Problem IV of the Bologna address and also, in the slightly different form of Post-Completeness, as Problem V. Hilbert asserts that completeness is generally claimed and thinks, it is natural to assume, that such claims are founded on the categoricity of the theories concerned. In the course of stating Problem IV, Hilbert says: But the usual way by which one shows that any two interpretations of number theory, respectively of analysis, must be isomorphic does not meet the demands of finitist rigour.6
As a next step, he suggests transforming the usual categoricity proof for number theory into a finitist argument that would establish the following assertion: If for some statement S the consistency with the axioms of number theory can be established, then it is impossible also to prove the consistency with those axioms of S (the contradictory of S), and most directly connected with this: If a statement is consistent, then it is also provable. (Ibid.; see below, p. 963.)
This problem is the central issue in Hilbert’s third Hamburg lecture on the foundations of mathematics, given in December 1930 to the Hamburg Philosophical Society, and reported in Hilbert 1931a. Hilbert there describes briefly the philosophical and mathematical background for proof theory, and formulates a significant goal for his foundational work as follows: Indeed, I would like to eliminate once and for all the questions concerning the foundations of mathematics as such, by turning every mathematical statement into a formula that can be concretely exhibited and strictly derived, thus recasting mathematical concept formations and inferences in such a way that they are not only irrefutable but also nevertheless provide an adequate image of the whole science. (Hilbert 1931a, 489, below p. 977.)
Having sketched the formal system for elementary number theory, Hilbert asserts again that Ackermann and von Neumann have proved its consistency and thus have validated as admissible the transfinite inferences, in particular, the principle of tertium non datur. Referring back to the Bologna lecture, he formulates then as ‘our most important further task’ the problem of establishing: Durch die von Ackermann und v. Neumann geführten Beweise ist die Widerspruchsfreiheit für das erste Postulat der Arithmetik, d. h. die Anwendbarkeit des existentialen Schließens auf die ganzen Zahlen sichergestellt. Für das weitere Problem der Widerspruchsfreiheit des Allgemeinbegriffs der Zahlenmenge (bzw. der Zahlenfunktion) einschließlich des zugehörigen Auswahlprinzips liegt ein weitgeführter Ansatz von Ackermann vor. (Bernays 1930 , 365, p. 58 of the reprinting in Bernays 1976a.) 6 Hilbert 1929 , 139; see below, p. 962. At the time, there was no recognition that the difference between first- and second-order logic is crucial. The underlying idea for such a completeness ‘argument’ is made quite explicit in the Introduction to Gödel’s doctoral dissertation 1929 , pp. 60–63.
Introduction to the Appendices
791
1. If a statement can be shown to be consistent, then it is also provable; and furthermore, 2. If for some statement S the consistency with the axioms of number theory can be established, then it is impossible also to prove the consistency with those axioms of S. (Hilbert 1931a, 491, below p. 980.)
Hilbert asserts that he has succeeded in proving these theorems for ‘certain simple cases’. This is made possible, Hilbert goes on, by the addition of a new inference rule to elementary arithmetic. This rule is viewed as finitist and allows the introduction of the universally quantified formula (x)A(x) as an initial formula, if the numeric formula A(z) has been established finitistically as correct for any numeral z. Hilbert’s Rule (HR) is obviously not an inference rule in the standard sense, according to which a rule legitimates the step from one or more premises to a conclusion within a formal theory, i. e., allows the extension of a formal proof. HR introduces additional universal claims as axioms, given an appropriate finitist justification of all their numerical instances. For the extended theory, Hilbert proves the above claims 1 and 2 when these are restricted to purely universal formulas; as to existential formulas, he proves claim 2 and warns that claim 1 is not a consequence. In any event, Hilbert has shown that the extended theory is indeed complete for purely universal statements. Hilbert’s arguments are direct and supplement the inductive structure of Ackermann’s considerations by treating HR. For the full result, it is taken for granted that Ackermann’s part of the inductive argument does establish the consistency of elementary number theory. As it happened, Gödel wrote a brief review of Hilbert 1931a for the Zentralblatt. His 1931c is a careful, matter-of-fact report. The lecture, Gödel writes, provides ‘a substantial supplement to the formal steps taken thus far toward laying a foundation for number theory [bringt . . . eine wesentliche Ergänzung der bisherigen formalen Ansätze zur Begründung der Zahlentheorie]’. This ‘Ergänzung’ is obtained by extending the formal system through the ‘following rule of inference, which, structurally, is of an entirely new kind [ihrer Struktur nach ganz neuartige Schlußregel]’; Gödel then describes HR as above and formulates the consistency and partial completeness results without further comment. In a letter to Heyting of 15 November 1932, he is less circumspect and writes that Hilbert resolves the completeness problem (despite the new axiom) for only ‘a small subquestion’ and that the extended system still has undecidable statements, as he had already pointed out to Bernays in a letter of 2 April 1931.7 (For a discussion clarifying the relation between HR and the so-called ω-rule, see Feferman’s Introductory Note to Gödel’s review, Feferman 1986 .) 7 For the remark to Heyting, see Gödel 2003b, 60; for the letter to Bernays, see Gödel 2003a, 92–94. The original German of the remark to Heyting reads:
Hilbert [behandelt] die Vollst.-Frage nur für die Zahlentheorie u. hat auch hier (trotz dem neuen Axiom) nur eine Teilfrage gelöst. (Ich habe auch übrigens in einem Brief an Bernays gezeigt, daß es auch in dem erweiterten System unentscheidbare Sätze gibt.)
792
Appendices
The central historical question here is why Hilbert addressed this particular issue of syntactic completeness with such prominence. In his Bologna lecture, he considered proving syntactic completeness to be an important open problem, and so did Bernays in his 1930 8 ; thus, in one sense, it is natural that Hilbert moves to tackle it. However, both he and Bernays had conjectured that elementary number theory is complete. Why did Hilbert now suspect, not only that there are elementary, formally undecidable sentences, but in addition that elementary number theory must be expanded to overcome that incompleteness, expanded by the addition of an inference rule which is, as Gödel put it, ‘of an entirely new kind’ ? Feferman remarks in his Introduction to the correspondence between Gödel and Bernays: Since Hilbert had previously conjectured the completeness of Z, he would have had to have a reason to propose such an extension, and the only obvious one is the incompleteness of Z.9
A key to answering the question, which also underlies Feferman’s remark, may be Hilbert’s assertion in his discussion of the second of the objections to proof theory set out in the last third of his 1931a. Hilbert ‘naturally’ views the objections as unjustified. Here is the formulation of the second one: It has been said, in criticism of my theory, that the theorems are indeed consistent, but that they are not thereby proved. Certainly they are provable, as I have shown here in simple cases. It turns out also in general (as I was convinced from the outset) that securing consistency is the essential thing in proof theory, and that the question of provability is then settled at the same time, possibly with an appropriate extension of the requirements in such a way as to preserve their finitist character. (Hilbert 1931a, 492, below p. 981.)
Is the first sentence not an allusion to Gödel’s first incompleteness theorem? But how could Hilbert have known about it? Did he also know about the second theorem and von Neumann’s related conjecture? If he did, how could he take for granted without any hesitation that the consistency of elementary number theory had been established?
3. Königsberg and Incompleteness. In order to obtain tentative answers to these questions let us examine, to begin with, what Gödel had actually announced at the roundtable discussion on 7 September 1930; the stenographic transcript was published in 8 Bernays
remarks:
Von der Zahlentheorie, wie sie durch die Peanoschen Axiome, mit Hinzunahme der rekursiven Definition, abgegrenzt wird, glauben wir, daß sie in diesem Sinne deduktiv abgeschlossen ist [i. e., is syntactically complete]; die Aufgabe eines wirklichen Nachweises hierfür ist aber noch völlig ungelöst. Noch schwieriger wird die Frage, wenn wir, über den Bereich der Zahlentheorie hinaus, zu der Analysis und den weiteren mengentheoretischen Begriffsbildungen aufsteigen.
See Bernays 1930 , 366, p. 59 of the republication in Bernays 1976a. 9 Feferman 2003 , n. 1 on p. 44. ‘Z’ stands for classical arithmetic.
Introduction to the Appendices
793
Volume 2 of Erkenntnis for 1931, together with a ‘Postscript’ in which, at the invitation of the Editors, Gödel summarized the results of his incompleteness paper. (See Hahn et al. 1931 .) The Königsberg remarks do not formulate yet the syntactic incompleteness of elementary number theory; rather, in the September discussion itself, Gödel states the following theorem, under the assumption that classical mathematics is consistent: One can give examples of statements (and in fact statements of the type of Goldbach’s or Fermat’s) that are in fact contentually true, but are unprovable in the formal system of classical mathematics. Therefore, if one adjoins the negation of such a proposition to the axioms of classical mathematics, one obtains a consistent system in which a contentually false proposition is provable.10
One of the participants at the roundtable discussion in Königsberg was von Neumann, and, as is well-known, he talked to Gödel immediately after the session. Gödel’s recollection of this conversation and his perspective on subsequent developments are reported in Wang 1981 . Wang writes (loc. cit., 651): Von Neumann was very enthusiastic about the result and had a private discussion with Gödel. In this discussion, von Neumann asked whether numbertheoretical undecidable propositions could also be constructed in view of the fact that the combinatorial objects can be mapped onto the integers and expressed the belief that it could be done.
At the time of the Königsberg meeting, so it is recalled in Wang 1981 , syntax had not yet been arithmetized, but symbols were directly represented in the formal theory by numerals, sentences by sequences of numerals, and proofs by sequences of sequences of numerals. All the syntactic notions and the substitution function are expressible in weak, finitistically meaningful subsystems of type theory or set theory and, consequently, so is the undecidable statement. In reply to von Neumann’s query, Gödel replied (according to Wang): “Of course undecidable propositions about integers could be so constructed, but they would contain concepts quite different from those occurring in number theory like addition and multiplication”. Shortly afterward Gödel, to his own astonishment, succeeded in turning the undecidable proposition into a polynomial form preceded by quantifiers (over natural numbers). At the same time but independently of this result, Gödel also discovered his second theorem to the effect that no consistency proof of a reasonably rich system can be formalized in the system itself.11 10 Hahn et al. 1931 , 148. The original German can be found in n. 47, p. 25 above. The background is described in detail in Dawson’s ‘Introductory Note’ (Dawson 1986 ), and also in Dawson 1997 , 68–79. 11 Ibid., 654–655. Parsons’s ‘Introductory Note’ to Gödel’s correspondence with Wang describes the interaction between the two on which Wang’s paper was based. (See Parsons 2003 , §3.2.) There seem to be some tensions between Wang’s account and other, related accounts. (i) In the published transcript of the roundtable discussion (see Hahn et al. 1931 , 147–148), Gödel seems to claim parenthetically that the undecidable statement is of a restricted number-theoretic form. That would be in striking conflict with his own
794
Appendices
Thus, it is perfectly clear that Gödel announced one result at the Königsberg meeting, namely, as quoted above from the record of the roundtable discussion, a version of his first incompleteness theorem; he had not yet obtained the second theorem. Let us return to the question of what Hilbert may have known about Gödel’s result(s) before giving his lecture in Hamburg or before submitting the paper to Mathematische Annalen on 21 December 1930. Von Neumann learned about the precise formulation of both incompleteness theorems around 25 November 1930; up to that point, he only knew Gödel’s result as it had been presented in Königsberg; he got to know the details of the arguments at the beginning of 1931. It is also important to recall that Hilbert delivered his lecture ‘Naturerkennen und Logik’ (published as Hilbert 1930b) on 8 September, the very day after the roundtable discussion. This was the opening address of a meeting that also took place in Königsberg, namely, the meeting of the Gesellschaft Deutscher Naturforscher und Ärzte (Society of German Scientists and Physicians).12 Is it implausible that von Neumann or other colleagues (for example, Emmy Noether who attended the roundtable discussion) informed Hilbert about Gödel’s result as formulated above? It seems not. On the contrary, it seems rather implausible to think that he was not informed about a result which was sufficiently important to have elicited von Neumann’s deep and immediate response. We also know that Hilbert’s and Gödel’s stays in Königsberg overlapped (see n. 12). In sum, then, if one assumes that Hilbert knew just the result announced by Gödel, then it becomes clear that the metamathematical considerations in his third Hamburg lecture (Hilbert 1931a) address the incompleteness issue for statements of exactly the form of Gödel’s undecidable sentence (universal statement with a finitist matrix).13 emphatic account given in Wang’s paper; however, in the transcript it is only claimed that the statement is universal with a finitist matrix. Indeed, in the ‘Nachtrag’ Gödel specifies, fully in accord with the statement Wang reports, the purely arithmetical character of the undecidable sentences. (ii) Carnap reports the following of an August 1930 meeting with Gödel: ‘Gödel’s discovery: incompleteness of the system of Principia Mathematica; difficulty of the consistency proof’. This latter remark has been taken as an indication that Gödel had a version of his second theorem before the Königsberg meeting. However, this conclusion is in direct conflict with the Gödel-Wang account. (Carnap’s report is in the Carnap papers at the University of Pittsburgh, document 023-73-04. It is described in Dawson 1997 , 68, and we have quoted from the account there.) 12 Öystein Ore attended the meeting of the Society and reports: I remember that there was a feeling of excitement and interest both in Hilbert’s lecture and in the lecture of von Neumann on the foundations of set theory — a feeling that one now finally was coming to grips with both the axiomatic foundation of mathematics and with the reasons for the applications of mathematics in the natural sciences. (Quoted in Reid 1970 , 195.)
It is clear from this that von Neumann’s and Hilbert’s stays in Königsberg overlapped. Dawson reports (Dawson 1997 , 7) that Gödel left Königsberg on 9 September, and speculates that ‘it is very likely that he [Gödel] was in the audience’ when Hilbert presented his lecture. 13 This appears to be in conflict with the statement of Bernays (Bernays 1935 , 215):
Introduction to the Appendices
795
Although Hilbert had formulated the syntactic completeness question for arithmetic and analysis in his Bologna lecture, and conjectured a positive answer, there was also speculation at the time of the Bologna Congress itself that some formal systems might be incomplete. Two sources support this assertion. Firstly, in the first republication of the Bologna lecture, submitted to Mathematische Annalen on 25 March 1929, Hilbert adds the following remark: In higher domains, we might conceivably have a situation in which both S and S are consistent: then the adoption as an axiom of one of the two statements S, S would have to be justified by systematic preferences (the principle of the permanence of laws, the possibility of further development, etc.). (Hilbert 1930c, 6, below p. 963, n. 36.)
Secondly, in a letter of 9 April 1947 to Heinrich Scholz, Bernays writes: The possibility of the underivability of the components of a derivable disjunction of the form (A) (A) (X)(φ(X) → γ(X)) ∨ (X)(φ(X) → ¬γ(X)) was moreover already contemplated a considerable time before the appearance of the Gödel theorem. I discussed such matters at the time with Tarski at the Congress in Bologna.14
The proof of (A) is presumably based on the considerations motivating the ‘usual claim’ of completeness for arithmetic and analysis discussed by Hilbert in Bologna (and described at the very beginning of this section). It would be of interest to have a clear sense of how much was known, or taken into account, of Skolem’s results. Already in 1922 (see Skolem 1923 , 140, n. 2, or the English translation in van Heijenoort 1967 , 299, n. 9), Skolem speculated that the continuum problem might be undecided by his first-order formulaNoch ehe dieses Gödelsche Resultat bekannt war, hatte Hilbert die ursprüngliche Form seines Vollständigkeitsproblems bereits aufgegeben. In seinem Vortrag „Die Grundlegung der elementaren Zahlenlehre“ [Hilbert 1931a] behandelte er dieses Problem für den Spezialfall von Formeln der Gestalt (x)A(x), welche außer x keine gebundene Variable enthalten. Dabei modifizierte er jedoch die Aufgabestellung durch die Hinzufügung einer [neuen] Schlußregel . . .
The key question this raises, of course, is what reason could Hilbert have had for abandoning ‘the original form of the problem’, and with it the original completeness conjecture, other than a knowledge of Gödel’s result? In a letter to Gödel from 18 January 1931, Bernays shows a peculiar and uncharacteristic lack of familiarity with Hilbert’s Hamburg lecture. For example, he attributes the insight that the ‘Widerspruchsfreiheit der neuen Regel folgt aus der Methode des Ackermannschen (oder auch des v. Neumannschen) Nachweises für die Widerspruchsfreiheit von Z’ to an observation of A. Schmidt, when this is explicitly stated in Hilbert’s paper. (See Gödel 2003a, 84.) 14 The letter is in the Bernays Nachlaß, Wissenschaftshistorisches Archiv of the ETH in Zürich, Hs 975: 4123. In the original German, the passage reads: Die Möglichkeit der Unableitbarkeit der Glieder einer ableitbaren Alternative von der Form (A) (A) (X)(φ(X) → γ(X)) ∨ (X)(φ(X) → ¬γ(X)) wurde übrigens schon etliche Zeit vor dem Erscheinen des Gödelschen Theorems erwogen. Ich sprach über derartiges seinerzeit mit Herrn Tarski auf dem Kongress in Bologna.
See also Mancosu 1999b, 33. Like Mancosu, I would like to thank Bernd Buldt for pointing out this letter.
796
Appendices
tion of Zermelo’s axioms because of the non-categoricity of the axioms. Thus, however surprising Gödel’s Königsberg announcement was, it was not a complete shock to everyone, and syntactic completeness was not taken as a sine qua non for proof theory or, indeed, for the axiomatic presentation of parts of mathematics. Let us now turn to Gödel’s second incompleteness theorem and the question of how members of the wider Hilbert circle learned about it.
4. Finitist Unprovability of Consistency? On 23 October 1930, Hahn presented Gödel’s abstract of his work on incompleteness to the Vienna Academy of Sciences; this abstract (Gödel 1930b) contains the classical formulation of both incompleteness theorems. The full text of Gödel’s 1931 paper was submitted to the Monatshefte on 17 November 1930. Three days later, von Neumann wrote to Gödel and sketched his argument for the claim that ‘the consistency of mathematics is unprovable [die Widerspruchsfreiheit der Mathematik ist unbeweisbar ]’, i. e., a version of Gödel’s second theorem at which he had arrived independently. At the end of his letter, von Neumann called Gödel’s Königsberg result ‘the greatest logical discovery in a long time [die grösste logische Entdeckung seit langer Zeit]’. Gödel responded almost immediately, informing von Neumann of his new results, and he probably also sent him a copy of the abstract Gödel 1930b. In his next letter of 29 November, von Neumann assured Gödel that he would not publish on the subject ‘as you have established the theorem on the unprovability of consistency as a natural continuation and deepening of your earlier results’.15 However, a disagreement emerged between Gödel and von 15 In
the original German, von Neumann’s remark is:
Da Sie den Satz über die Unbeweisbarkeit der Widerspruchsfreiheit als naturgemässe Fortführung und Vertiefung Ihrer früheren Resultate bewiesen haben, werde ich natürlich über diesen Gegendstand nicht publizieren.
Von Neumann’s two letters to Gödel can be found, with translations, in Gödel 2003b, 336– 341. It seems that Gödel’s first two letters to von Neumann have not been preserved, though their core content can be inferred both from von Neumann’s responses and from Gödel’s discussion of von Neumann’s perspective at the meeting of the Vienna Circle of 15 January 1931. Minutes of this meeting can be found in the Carnap Papers in Pittsburgh; see Dawson 1997 , 73, 282. Dawson 1997 also reports (p. 70) Hempel’s recollection of a course he took with von Neumann in Berlin in the Winter Semester 1930/31 on Hilbert’s programme of proving the consistency of classical mathematics by finitist means: . . . in the middle of the course von Neumann came in one day and announced that he had just received a paper from a young mathematician in Vienna . . . who showed that the objectives which Hilbert had in mind . . . could not be achieved at all.
And in a letter from Berlin of 3 December 1930 to his friend Claude Chevalley, Herbrand writes about the same period: The mathematicians are a very strange bunch; during the last two weeks, whenever I have seen von Neumann, we have talked about a paper by a certain Gödel, who has produced very curious functions; and all of this destroys some solidly anchored ideas.
(For details of this letter, see Sieg 2005 , 175.) In the original French (quoted in Sieg 1994 , 103), the passage reads:
Introduction to the Appendices
797
Neumann on how this theorem affects Hilbert’s finitist programme, a disagreement which started immediately after von Neumann had received the proof-sheets of Gödel 1931a. After thanking Gödel for the galleys, von Neumann writes on 12 January 1931 that ‘I absolutely disagree with your view on the formalizability of intuitionism’. That is, von Neumann thought that intuitionist or, synonymously, as he and others thought, finitist arguments can be ‘translated’ into formal arguments in number theory or, if not there, certainly in analysis or set theory. So much for von Neumann’s first acquaintance with Gödel’s results. Bernays wrote to Gödel on 24 December 1930 from Berlin, where he was spending the Christmas break with his family. Gödel had earlier sent Bernays a reprint of his 1930 completeness paper, i. e., of Gödel 1930a. After commenting on the completeness proof, Bernays asked for the galleys of the paper in which Gödel was to present his new investigations. He writes: From Prof. Courant and Prof. Schur I have heard that recently you have achieved significant and surprising results in the area of foundational problems, and that you intend to publish these shortly.16
Gödel answered on 31 December 1930, and apparently sent Bernays an offprint (presumably of the abstract Gödel 1930b); the galleys of the incompleteness paper Gödel 1931a quickly followed. Bernays received these on 14 January 1931, studied them and wrote a long detailed letter to Gödel on 18 January. He remarks: For me that was very interesting and very instructive reading. What you have done is really an important step forward in the investigation of the foundational problems.17
The fact that Bernays asked Gödel to send him the galleys of the paper with ‘significant and surprising results’ is obviously not incompatible with an assumption that Bernays knew already about the restricted Königsberg result. Only slowly did it become clear to Bernays that Ackermann’s and von Neumann’s proofs established the consistency of arithmetic only when the induction principle is restricted to quantifier-free formulas. This restriction is stated explicitly for the first time in Bernays’s 1932 , 342, an abstract for the International Congress of Mathematicians in Zürich. In a letter to Gödel of 3 May 1931, Bernays clearly still views Ackermann’s considerations as proving the consistency of full arithmetic, and, to accord with the second incomLes mathématiciens sont une bizarre chose; voici une quinzaine de jours que chaque fois que je vois [von] Neumann nous causons d’un travail d’un certain Gödel, qui a fabriqué de bien curieuses fonctions; et tout cela détruit quelques notions solidement ancrées. 16 Bernays
to Gödel, 24 December 1930, Gödel 2003a, 80. Schur was a professor in Berlin, Courant in Göttingen. The original German reads: Von Prof. Courant und Prof. Schur hörte ich, dass Sie neuerdings zu bedeutsamen und überraschenden Ergebnissen im Gebiete der Grundlagen-Probleme gelangt sind und dass Sie diese demnächst publizieren wollen. 17 Gödel
2003a, 82. In the original German, the passage reads:
Diese Lektüre war für mich sehr interessant und lehrreich. Das ist wirklich ein erheblicher Schritt vorwärts in der Erforschung der Grundlagenprobleme, den Sie da getan haben.
798
Appendices
pleteness theorem, he tries to pinpoint the reason why the proof cannot be formalized in arithmetic. He sees ‘the explanation of the matter’ in the fact that nested recursions are not formalizable in elementary arithmetic.18 This is incorrect. It is not known whether Gödel pointed this out to Bernays, but it is stated clearly in Hilbert and Bernays 1934 , 422, that nested recursions are formalizable in arithmetic, and that Gödel and von Neumann discovered this fact.19 Finally, let us consider Herbrand, who was also working intensively in the proof theory of elementary arithmetic at that time. Herbrand was well aware of the incompleteness results through his contact with both von Neumann and Bernays during his long stay in Berlin, from late November 1930 to the middle of May 1931. The central consistency result in Herbrand’s 1931 (dated ‘Göttingen, den 14. Juli 1931’) is concerned with arithmetic that uses only quantifier-free induction, but includes Hilbert’s rule HR and an open characterization of finitist functions. In the last part of his paper, Herbrand discusses Gödel’s results. He articulates in almost identical words what he had claimed on 7 April 1931 in a letter to Gödel, namely, that, contrary to Gödel’s opinion, all finitist (or intuitionist) arguments can be formalized in analysis and possibly in elementary number theory. ‘If this were so,’ he concludes, ‘the consistency of ordinary arithmetic would already be unprovable’.20 Even in his last paper, ‘Beweis des Tertium non datur ’, Hilbert does not mention Gödel by name, but the proof-theoretic considerations clearly react to the second incompleteness theorem and, as Bernays put it in his 1977 interview, attempt to deal with Gödel’s results positively. (See pp. 24–25, above, and the remarks by Bernays quoted there.) The approach in this paper is dramatically different from that presented in the third Hamburg lecture. Then, in December 1930, Hilbert had concentrated on syntactic completeness, assuming that consistency had been secured. In July 1931, there is now a focus on consistency and tertium non datur, in line with earlier considerations.21 However, there is a radical strategic shift: instead of trying to prove the consistency of arithmetic by directly and finitistically treating the classical theory (for example, by the ε-substitution method), Hilbert formulates a constructive (he claims, finitist) theory, argues for its consistency by a meaning analysis of the logical connectives, and then tries to show that the addition of instances of tertium non datur does not lead to contradictions. Existential quantifiers 18 See
Bernays’s letter to Gödel, 3 May 1931, in Gödel 2003a, 104. his letter of 18 January 1931, Bernays acknowledges Gödel’s reply to his letter of 24 December 1930, but this reply is not extant. Neither is any reply extant to Bernays’s letter of 3 May 1931. 20 See Herbrand 1931 , 8. In the original French, the remark is: ‘S’il en était ainsi, la noncontradiction de l’Arithmétique ordinaire serait déjà indémontrable’. Herbrand’s letter to Gödel from 7 April can be found in Gödel 2003b, and the specific remark about intuitionist arguments can be found on p. 18. 21 See, for example, Hilbert’s second Hamburg lecture (Hilbert 1928a), p. 84 for consistency, and pp. 73 and 80 for the tertium non datur (below, pp. 940, 930 and 936 respectively). 19 In
Introduction to the Appendices
799
are analyzed essentially by the natural deduction rules for introducing and eliminating them; the introduction of universal quantifiers is given via the full HR rule HR* and their elimination via the axiom (x)A(x) → A(t). The subsequent arguments are barely sketched and some are deeply problematic.22 Hilbert appeals, for example, to the principle of tertium non datur in the metamathematical argument. That appeal is clearly acknowledged and is, of course, in conflict with the finitist position; is this to be viewed as parallel to the use (and later removal) of tertium non datur in the proofs of Hilbert’s early mathematical career in solving Gordan’s problem?23 In a letter to Hans Reichenbach, undated, but definitely written in the summer of 1931, and plausibly before 7 June (see n. 24, below), von Neumann discusses the publication of his contribution to the symposium at the Königsberg Congress (i. e. von Neumann 1931 ). In a way, he summarizes very neatly the broader state of affairs: Incidentally, I have decided not to mention Gödel, since the opinion that there still exists a certain hope for proof theory has found champions — inter alia, Bernays and Gödel himself. To be sure, in my opinion this view is erroneous; but a discussion of this question would stray outside the existing boundaries, and so I would rather treat it on another occasion.24 22 The full rule HR* is an extension of HR to all formulas of the language whose instances have been recognized finitistically as correct. For more detail, see the Introduction to Hilbert 1931b, below, p 983. Gödel made a remark about Hilbert’s paper in a letter to Heyting of 15 November 1932:
Ich glaube überhaupt, Sie beurteilen Hilberts letzte Arbeiten etwas zu günstig. z. B. ist doch in der Göttinger Nachr. 1931 [Hilbert 1931b] kaum irgend etwas bewiesen. (Gödel 2003b, 60.)
Bernays introduced an extension of HR in his letter of 18 January 1931 to Gödel (see Gödel 2003a, 86 ff.), and Gödel discussed it extensively in his response of 2 April 1931 (ibid., 90–98). Cf. the Introduction to Hilbert 1931a, below, p. 969 ff. 23 It is interesting to note that the paper Hilbert 1931b was not reprinted in Hilbert’s Gesammelte Abhandlungen, and is not even mentioned in Bernays’s summary there of Hilbert’s foundational work (Bernays 1935 ); this does include, however, a brief discussion of Hilbert’s penultimate paper on foundational matters, Hilbert 1931a. Bernays writes: Das Verfahren, durch welches hier Hilbert die positive Lösung des Vollständigkeitsproblems (für den von ihm betrachtetetn Spezialfall) sozusagen erzwingt, bedeutet ein Abgehen von dem vorherigen Programm der Beweistheorie. In der Tat wird ja durch die Einführung der zusätzlichen Schlußregel die Forderung einer restlosen Formalisierung der Schlüsse fallen gelassen. (Loc. cit., 215–216.)
In his contribution to the Encyclopedia of Philosophy, Bernays mentions both papers, and after a brief discussion of Gentzen’s consistency proof remarks: [Gentzen’s] broadened methods also permitted a loosening of the requirements of formalizing. One step in this direction, made by Hilbert himself, was to replace the schema of complete induction by the stronger rule later called infinite induction . . . (Bernays 1967 , 502.) 24 Mancosu
1999b, 42, and n. 14. The German text of von Neumann’s remark is:
Übrigens habe ich mich entschlossen, Gödel nicht zu erwähnen, da die Ansicht, dass noch eine gewisse Hoffnung für die Beweistheorie existiert, Vertreter gefunden hat: u.a. Bernays und Gödel selbst. Zwar ist m. E. diese Ansicht irrig, aber eine Diskussion dieser Frage würde aus dem vorliegenden Ra[h]men hinausführen, ich möchte daher bei einer anderen Gelegenheit darüber sprechen.
In a letter to Carnap of 7 June 1931, von Neumann mentions that, against his original inclination, he had agreed in correspondence with Reichenbach to publish his Königs-
800
Appendices
Thus, it is not too surprising that Hilbert himself did not give up the prooftheoretic programme. To overcome the impossibility result defended by von Neumann, one had to ‘to exploit more sharply’ the finitist standpoint, as Hilbert put it in his short preface (‘Zur Einführung’) of March 1934 to the first volume of Grundlagen der Mathematik.25 Precisely what Hilbert had in mind, we do not know. The very end of §2 of the first volume of Grundlagen der Mathematik may provide a hint; here Hilbert and Bernays discuss the methodological standpoint of Brouwer’s intuitionism as ‘a certain extension of the finitist outlook ’. Such an extension of the finitist outlook (which epistemologically amounts to adjoining to the intuitive insights also reflections of a general logical character) shows itself to be necessary if one wants to get beyond a certain elementary domain by means of finitist considerations. In an advanced stage of our investigations, we shall be led to this requirement.26
The intuitionist extension of the finitist standpoint is seen in allowing transfinite statements as well as conditionals to occur in the antecedents of conditionals. At this point in 1934, Hilbert may have hoped that such a proper extension is avoidable by ‘exploiting more sharply’ the finitist standpoint.
5. Extending the Finitist Standpoint? There had already been a discussion of transcending the finitist position by means different from the intuitionist ones related to Hilbert’s final paper on the tertium non datur (Hilbert 1931b); indeed, such a discussion took place long before it had been recognized that intuitionism provided a genuine strengthening of the finitist position. In a letter sent from Berlin on 11 October 1931, Bernays reports to Hilbert on progress with the ‘Grundlagenbuch’: he had just finished the presentation of Behmann’s decision procedure for berg lecture; that decision obviously precedes the more specific discussion in the note to Reichenbach quoted above. Thus, we can plausibly claim that it was written before the letter to Carnap, i. e., before 7 June 1931. The letter to Carnap can be found in Mancosu 1999b, 39–41, (German and English translation), and Rédei 2005 , 85–86, translation only. 25 Hilbert’s comment in full was as follows: Im Hinblick auf dieses Ziel [Widerspruchsfreiheit] möchte ich hervorheben, daß die zeitweilig aufgekommene Meinung, aus gewissen neueren Ergebnissen von Gödel folge die Undurchführbarkeit meiner Beweistheorie, als irrtümlich erwiesen ist. Jenes Ergebnis zeigt in der Tat auch nur, daß man für die weitergehenden Widerspruchsfreiheitsbeweise den finiten Standpunkt in einer schärferen Weise ausnutzen muß, als dieses bei der Betrachtung der elementaren Formalismen erforderlich ist. (Hilbert and Bernays 1934 , V.) 26 Hilbert
and Bernays 1934 , 43. The original German is as follows:
Eine derartige weitere Fassung des finiten Standpunktes, welche erkenntnistheoretisch darauf hinauskommt, daß man zu den anschaulichen Einsichten noch Überlegungen allgemein logischen Charakters hinzunimmt, erweist sich als erforderlich, wenn man mittels der finiten Betrachtungen über einen gewissen elementaren Bereich hinaus gelangen will. Wir werden in einem vorgerückten Stadium unserer Betrachtungen auf dieses Erfordernis hingeführt werden.
In addition to these reflections on the extended finitist standpoint, one finds also a sketch of ‘finitist semantics’; see loc. cit., pp. 32 ff.
Introduction to the Appendices
801
monadic predicate logic with identity and was about to start work on replacing the consistency proof ‘for universal and existential quantifiers that is not correct’ by another proof. Then he continues with these remarks about Hilbert’s ‘tertium’ paper: As for the relationship to your last article, it can be said in the Preface that the arguments in the book are carried out entirely within the framework of the finitist standpoint (i. e., other considerations are deployed at most in a heuristic sense), so that your last article, which employs a different methodological standpoint, does not come within the scope of these considerations.27
The phrasing of this remark suggests that Hilbert and Bernays had discussed the issue and agreed that the methods of ‘Beweis des Tertium non datur ’ go beyond the finitist standpoint. After all, as mentioned already, in the metamathematical considerations Hilbert self-consciously uses an instance of tertium non datur. This letter also makes it clear that, as a matter of historical fact, Bernays was beginning to work intensively on the consistency of arithmetic in mid-November of 1931.28 Gentzen returned to Göttingen for the Summer Semester of 1931, having spent the Summer Semester of 1930 in Munich, and the Winter Semester 1930/31 in Berlin.29 On Bernays’s recommendation he worked during the summer of 1931 on the ‘sequent systems’ that had been introduced by Paul 27 See
Cod. Ms. D. Hilbert 21, 5 in the Hilbert Nachlaß. The German text is:
Was die Beziehung zu Ihrer letzten Note betrifft, so kann ja im Vorwort gesagt werden, dass die Ausführungen des Buches sich ausschliesslich im Rahmen des finiten Standpunktes bewegen (d. h. anderweitige Betrachtungen werden höchstens im heuristischen Sinne angestellt), dass daher Ihre letzte Note, die einen anderen methodischen Standpunkt zugrundelege, nicht in den Bereich dieser Betrachtungen falle.
Bernays continues: Auch im Rahmen des finiten Standpunktes wird ja einiges noch ausserhalb bleiben, dessen Behandlung in einem ‘2. Teil’ ja am Schluss des Textes angekündigt, bezw. in Aussicht genommen werden kann; nämlich, 1. die Formalisierung der ‘zweiten Stufe’ (εf ), 2. die Formalisierung der Metamathematik (Resultate von Gödel). 28 There
are some additional manuscripts from around that time which provide interesting information. For example, the Nachlaß folder Cod. Ms. D. Hilbert 603 contains two copies of Hilbert’s 1931 paper on the tertium (Hilbert 1931b); there are no remarks that are helpful for understanding the details of the paper, but there are some insightful general ones. For example, Hilbert writes: Natürlich ist die Widerspruchsfreiheit ein relativer Begriff; das ist kein Einwand gegen meine Theorie, sondern vielmehr eine Notwendigkeit.
Hilbert drew an arrow to ‘relativer’ and wrote at the end of the arrow ‘Neu!’. This is obviously in deep conflict with the earlier characterizations of the finitist standpoint, for example, in the Hamburg lecture of 1927 on pp. 84–85, below p. 940. Indeed, in ‘Über die Grundlagen des Denkens’ (Cod. Ms. D. Hilbert 604, reproduced in Chapter 4 below), Hilbert explicitly asserted that the concept ‘widerspruchsfrei’ is ‘absolute’ (on p. 6 of the original manuscript, above p. 768). 29 Gentzen studied mathematics at the University of Greifswald in the academic year 1928/1929 under the tutelage of Hilbert’s student Hellmuth Kneser. On the latter’s advice, Gentzen and his friend Collatz transferred to Göttingen for the year 1929/1930. In the Summer Semester of 1929, they attended Hilbert’s lectures on set theory. For details, see Sieg 2013, section 6.
802
Appendices
Hertz. This resulted in Gentzen’s first publication, Gentzen 1933b; the paper was submitted to Mathematische Annalen on 6 February 1932. At about this time, Gentzen began to work on his dissertation. In a letter of 13 December 1932 to Hellmuth Kneser, Gentzen mentions that he had set himself ‘as my specific task to find a proof of the consistency of logical deduction in arithmetic’, that he had been working on this ‘for almost a year’, and that he hopes ‘to finish soon’.30 How did Gentzen conceive of the task of finding a consistency proof for arithmetic? It seems that the overall structure of Hilbert’s considerations influenced Gentzen in his reflections for the outline and first draft of his thesis, which was discovered recently by von Plato in the Bernays Nachlaß at the Eidgenössiche Techniche Hochschule in Zürich.31 On pp. 11–12 of this manuscript, Gentzen gives an ‘overview of my further results’; this is to be taken prospectively, since not all of the ‘results’ in the numbered list had yet been established. Be that as it may, element V of this list addresses consistency: (V) The consistency of arithmetic is proved; in the process, the concept of an infinite sequence of natural numbers is used, furthermore, in one place, the principle of the excluded middle. The proof is thus not intuitionistic. Perhaps the tertium non datur can be eliminated.32
Does not this point exactly to the central features of Hilbert’s considerations, i. e., the use of the HR* -rule and the tertium non datur ? What did Gentzen try to do? What had he established by this time? Towards the end of 1932, Gentzen discovered the consistency proof for classical arithmetic relative to intuitionist arithmetic and sent it to Heyting in January or early February 1933. He submitted a paper on this to Mathematische Annalen on 15 March 1933, where it was accepted, but Gentzen withdrew the paper in galleys when he learned of Gödel’s publication Gödel 1933 .33 30 von
Plato 2009 , p. 670. The letter can be found in Menzler-Trott 2007 , 35. manuscript can be found in the Bernays Nachlaß under the signature Hs. 974:271. One important part of this draft is Gentzen’s ‘normalization proof’; an English translation of this can be found in von Plato 2008 , 245–257. For more general discussion, see von Plato 2009 , in particular §5 (‘A newly discovered proof of normalization by Gentzen’). 32 The German reads as follows: 31 The
Die Widerspruchsfreiheit der Arithmetik wird bewiesen; dabei wird der Begriff der unendlichen Folge von natürlichen Zahlen benutzt, ferner an einer Stelle der Satz vom ausgeschlossenen Dritten. Der Beweis ist also nicht intuitionistisch. Vielleicht lässt sich das tertium non datur wegschaffen. 33 The
paper is Gentzen 1933a* . In Gentzen 1936 , 532, the fundamental result is attributed to Gödel, and then in n. 17 Gentzen states: Das im Text genannte Ergebnis wurde etwas später, unabhängig von Gödel, auch von P. Bernays und mir gefunden.
It is not clear with respect to which event ‘etwas später’ is to be understood. Bernays’s contribution is explained very clearly by Gentzen in n. 2 of Gentzen 1933a* ; see p. 119 of Gentzen 1974b, the eventual publication of the German original. Gödel presented his results to Menger’s Colloquium on 28 June 1932. In a letter to Heyting of 16 May 1933, Gödel explicitly claims that his result should have been known in Göttingen shortly after his presentation, on the grounds that Veblen was present at the session and had travelled to Göttingen shortly thereafter. The proof of the result is also given in Hilbert and Ber-
Introduction to the Appendices
803
Through this argument, the principle of tertium non datur had not just been eliminated, but had actually been proved in its interpreted form within intuitionist arithmetic. In a letter to Heyting written on 25 February 1933, Gentzen suggests investigating the consistency of intuitionist arithmetic. After all, a consistency proof for classical arithmetic had not been given so far by finitist means, ‘so that this original aim of Hilbert has not been achieved’. He goes on: If, on the other hand, one admits the intuitionistic position as a secure basis in itself, i. e., as a consistent one, the consistency of classical arithmetic is secured by my result. If one wished to satisfy Hilbert’s requirements, the task would still remain of showing intuitionistic arithmetic consistent. This, however, is not possible by even the formal apparatus of classical arithmetic, on the basis of Gödel’s result in combination with my proof. Even so, I am inclined to believe that a consistency proof for intuitionistic arithmetic, from an even more evident position, is possible and desirable.34
In the same letter, Gentzen expresses the hope of investigating the consistency of intuitionist arithmetic ‘next year’. The hope of completing the consistency proof ‘soon’, as expressed in the letter to Kneser quoted above, had been given up. Gentzen must then have turned his attention to writing the thesis published as ‘Untersuchungen über das logische Schließen’ (Gentzen 1935 ); the thesis was defended on 12 July 1933 and submitted for publication in Mathematische Zeitschrift on 21 July 1933. The above formulation of ‘result V’ (see above, 802) reflects central aspects of Hilbert’s 1931 ‘tertium’ paper (Hilbert 1931b). Gentzen must have realized at the beginning of 1933 that, although tertium non datur could be easily removed relative to intuitionist arithmetic, the semantic considerations for obtaining a consistency proof for Hilbert’s base theory were methodologically not satisfactory. In §§10 and 11 of his 1936 , Gentzen seems to re-examine and extend Hilbert’s considerations in great detail when discussing the ‘finitist interpretation’ for some of the connectives in transfinite statements, namely, universal and existential quantifiers, as well as conjunction and disjunction. Before turning in §11 to the discussion of the problematic connectives (conditional and negation) together with the intuitionist ‘Grenzziehung’, he concludes §10 by asserting: One could then, proceeding from these considerations, develop a purely formal consistency proof for this part of number theory. But such a proof would have little value, for in the proof itself one would have to use transfinite statements and the accompanying modes of inference that one wants to ‘ground ’ by the proof. So the proof would not be a proper reduction, but rather a confirmation of the finitist character of the formalized rules of inference. But one must already be clear in advance what counts as finitist nays 1939 , §5.3. b), presented under the heading ‘Eliminierbarkeit des „tertium non datur“ für die Untersuchung der Widerspruchsfreiheit des Systems (Z)’. 34 The passage is cited from von Plato 2009 , 672.
804
Appendices (in order then to be able to carry out the consistency proof itself with finitist means of proof).35
This long remark outlines a consistency proof using an appropriate truthdefinition or the contentual concept of ‘Richtigkeit’. A few pages later (p. 536), Gentzen gives a formal substitute for this concept, namely that of ‘statability of a reduction procedure [Angebbarkeit einer Reduziervorschrift]’. This latter concept, together with the translation into intuitionist logic, provides Gentzen with ‘a particular finitist interpretation of the statements [of classical arithmetic], which replaces their interpretation via the an-sich-Auffassung’.36 It should be noted that, according to Gentzen’s letter of 5 December 1934 to Kneser (for which see Menzler-Trott 2007 , p. 55), he had finished his consistency proof by that date, and was preparing it for publication in Mathematische Annalen; the paper was finally submitted on 11 August 1935. However, after correspondence with Bernays, sections 14.1–16.11 were withdrawn in galleys and new sections were added in their stead; this replacement was carried out in February of 1936.37 Let us finally return to Hilbert’s last foundational paper. This paper contains an important passage which occurs directly after the discussion of the concept of ‘Richtigkeit’, which is also, of course, the central one in Gentzen’s considerations: Finally, the important (and, for our investigation, decisive) fact has to be emphasized, namely, that all the axioms and Inference Schema VI, which I have called ‘transfinite’, have a strictly finitist character: the prescriptions they contain can be executed in the finite. (Hilbert 1931b, 121; see p. 986 below.)
It would be stretching matters to see more than a germ for Gentzen’s reflections in Hilbert’s considerations; but the latter did present, it seems, novel directions and concrete problems that needed to be resolved. The problems 35 Gentzen
1936 , 529. The German text is:
Man könnte dann, von diesen Überlegungen ausgehend, einen rein formalen Widerspruchsfreiheitsbeweis für diesen Teil der Zahlentheorie entwickeln. Ein solcher hätte aber nicht viel Wert, denn man müßte in dem Beweis selbst transfinite Aussagen und dieselben zugehörigen Schlußweisen benutzen, die man durch ihn ‘begründen’ will. Der Beweis würde also keine eigentliche Zurückführung bedeuten, wohl aber eine Bestätigung des finiten Charakters der formalisierten Schlußregeln. Was aber finit ist, darüber müßte man sich zuvor im klaren sein (um dann den Widerspruchsfreiheitsbeweis selbst mit finiten Beweismitteln führen zu können). 36 For
further elucidation, see Gentzen’s own summary on pp. 564–565 of Gentzen 1936 , and the related discussion in Sieg and Parsons 1995 , 83–85. The ‘an-sich-Auffassung’ is similar to a Platonistic conception of mathematics. 37 Parts IV and V of the original were published as Gentzen 1974a, which includes all the sections which were replaced. In an Appendix to the translation of Gentzen 1936 , the English edition of Gentzen’s papers (Gentzen 1969 ) gives the original sections from the galleys. On p. 202, the Editor, Manfred Szabo, also gives a brief concordance of the old and new passages, since the new sections are not always numerically identical with those they replace.
Introduction to the Appendices
805
were resolved in perhaps surprising ways, but fully in the spirit of Hilbert’s view that true contentual thinking consists in operations on proofs. Wilfried Sieg
806
Appendices
Appendix A: First Edition of Hilbert-Ackermann (1928)
Introduction
This Appendix reproduces the first edition of the book Grundzüge der theoretischen Logik by Hilbert and Ackermann (Hilbert and Ackermann 1928 ). We have made a small number of editorial interventions, mainly in order to render the presentation more uniform and easier to read. Some indentations and spacings between formulas have been changed, as have the size of some parentheses within formulas; formatting of the headings has also been made consistent (in large part) with the remainder of this Volume. As usual, we have replaced ‘Sperrschrift’ with italics throughout. We have retained the original marking of footnotes. In the original, there are two kinds of footnote symbol, numerals (whose enumeration begins afresh on each new page of the book) and asterisks. (The latter are used only twice, in both cases in order to record notes to a formula, presumably to avoid a superscripted numeral being misread as a power symbol.) In addition, the book carries its own rather extensive Literaturverzeichnis of two and a half pages, which lists ‘only some of the most important of writings which make positive contributions to mathematical logic’ (p. 116). We have added references to the volume bibliography for all works mentioned. In his Vorwort to the book, dated 16 January 1928, Hilbert makes clear that its contents derive in large part from lectures held by him some seven to ten years earlier.1 And indeed the bulk of Hilbert/Ackermann is taken from two courses Hilbert mentions, the 1917/18 lectures ‘Prinzipien der Mathematik’, and the lectures ‘Logik-Kalkül’ from 1920. These lecture courses can be found in Chapters 1 and 2 of this Volume respectively. Hilbert also mentions 1 An English translation of this Foreword can be found in the Introduction to Chapter 1, p. 50.
Introduction
807
his 1921/22 lectures ‘Grundlagen der Mathematik’ (to be found in Chapter 3 of the present Volume); but the influence of that third set of lectures is considerably less extensive. The book is reproduced here largely for purposes of detailed comparison with these earlier courses. As is to be expected, it exhibits many minor stylistic changes and transpositions of text, and some passages from the lecture notes are more faithfully preserved than others. In addition, the chapters of the book are divided into sub-sections (though the titles are often taken verbatim from the tables of contents of the lecture notes), whereas the lecture notes themselves appear as continuous text, apart from the division into Parts A and B of the 1917/18 lectures. That said, the level of dependence is noteworthy, for it shows quite clearly that, rather than summarising post hoc a decade of work in the fundamentals of logic, Hilbert/Ackermann rather faithfully records the initiation and early establishment of that work. It should also be noted that, despite the listing of Ackermann as a full co-author, the original lecture notes, which contain the bulk of the book, were recorded by Bernays; the alterations and additions made by Ackermann are relatively brief. To facilitate comparison, there follows a rough concordance relating the book of 1928 to the lectures ‘Prinzipien der Mathematik’ (PM ) from 1917/18 and to the 1920 lectures ‘Logik-Kalkül’ (LK ). This concordance is based on an abbreviated translation of the book’s Inhaltsverzeichnis, to which has been added in brackets the corresponding page references to the two sets of lecture notes. Further remarks comparing Hilbert/Ackermann with the lecture notes can be found in § 6.2 of the Introduction to Chapter 1. William Ewald and Wilfried Sieg
A Rough Concordance Chapter I: The Propositional Calculus §1. Logical Connectives [LK, 1–4] §2. Equivalences [LK, 4–7] §3. Conjunctive Normal Form [LK, 8] §4. Characterization of Valid Propositional Formulas [LK, 9–11] §5. Duality [LK, 16–17] §6. Disjunctive Normal Form §7. Propositional Consequences of Given Formulas [LK, 17–20] §8. Further Remarks on Validity and Satisfiability §9. Consequences of Given Axioms [LK, 11–16] §10. Axioms of the Propositional Calculus [PM, 133–135] §11. Derivations of Formulas [PM, 140–150]
808
Appendices
§12. Consistency [PM, 150–152] §13. Independence and Completeness [PM, 152–153] Chapter II: The Predicate and Class Calculi §1. Reinterpretation of the Propositional Calculus [PM, 81] §2. Union of Predicate Calculus and Propositional Calculus [PM, 108– 109] §3. Aristotelian Syllogistic [PM, 98–106] Chapter III: The Restricted Function Calculus §1. Insufficiency of Previous Calculus [PM, 110–111] §2. Basic Methodological Ideas [PM, 112–118, 124] §3. Preliminary Orientation [PM, 118–129] §4. Definition of Symbols [PM, 129–132] §5. Axioms [PM, 133–135] §6. System of Logical Formulas [PM, 156–171] §7. Rule of Substitution [also PM, 156–171] §8. Extended Duality and Normal Form [PM, 171–178] §9. Consistency and Completeness [PM, 154-156] §10. Examples of Formal Proofs [PM, 179–186] §11. The Entscheidungsproblem §12. Solutions of the Entscheidungsproblem for Special Cases Chapter IV: The Extended Function Calculus §1. Necessity of an Extension [PM, 188–192] §2. Logical Concept of Number [PM, 192–193] §3. Set Theory [PM, 194–200] §4. Logical Paradoxes [PM, 208–218] §5. Type Theory [PM, 219–226] §6. Shortcomings of Type Theory [PM, 226–231] §7. The Axiom of Reducibility [PM, 231–234] §8. Applications of the Axiom of Reducibility [PM, 234–246] §9. Concluding Remarks on Type Theory
Grundzüge der theoretischen Logik
809
Grundzüge der theoretischen Logik von
D. Hilbert 5
Geheimer Regierungsrat Professor an der Universität Göttingen und
W. Ackermann Göttingen
Vorwort. 10
15
20
25
30
VI
Das vorliegende Buch behandelt die theoretische Logik (auch mathematische Logik, Logikkalkül oder Algebra der Logik genannt) in einer Form, wie ich sie in meinen Universitätsvorlesungen über die Prinzipienfragen in der Mathematik (Prinzipien der Mathematik, Wintersemester 1917/18; Logikkalkül, Wintersemester 1920; Grundlagen der Mathematik, Wintersemester 1921/22) entwickelt und verwendet habe. Bei der Vorbereitung der genannten Vorlesungen bin ich von meinem Kollegen P. Bernays wesentlich unterstützt und beraten worden; derselbe hat diese Vorlesungen auch aufs sorgfältigste ausgearbeitet. — Unter Benutzung und Ergänzung des so entstandenen Materials hat W. Ackermann, ein Schüler von mir, der sich inzwischen durch selbständige, bedeutende Arbeiten auf dem Gebiete der Grundlagen der Mathematik hervorgetan hat, die vorliegende Gliederung und definitive Darstellung des Gesamtstoffes durchgeführt. Das Buch soll zugleich zur Vorbereitung und Erleichterung des Verständnisses für ein weiteres Buch dienen, das P. Bernays und ich demnächst herausgeben wollen und das die Grundlagen der Mathematik nach derjenigen Methode behandelt, wie ich sie ebenfalls unter tätigster Mitwirkung von P. Bernays in einer Reihe von Abhandlungen (Neubegründung der Mathematik, Abhandlungen des mathematischen Seminars der Hamburgischen Universität, Bd. 1, S. 157. 1922; Die logischen Grundlagen der Mathematik, Math. Ann. Bd. 88, S. 151. 1922; Über das Unendliche, Math. Ann. Bd. 95, S. 161. 1925) dargestellt habe. Göttingen, den 16. Januar 1928. Hilbert.
810
Appendices
Inhaltsverzeichnis.
VII
Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
Erstes Kapitel. Der Aussagenkalkül § § § § § § §
1. 2. 3. 4. 5. 6. 7.
§ 8. § 9. § § § §
10. 11. 12. 13.
Einführung der logischen Grundverknüpfungen . . . . . . . . . . . . . . . . . . Äquivalenzen; Entbehrlichkeit von Grundverknüpfungen . . . . . . . . . Normalform für die logischen Ausdrücke . . . . . . . . . . . . . . . . . . . . . . . . . Charakterisierung der immer richtigen Aussagenverbindungen. . . . Das Prinzip der Dualität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die disjunktive Normalform für logische Ausdrücke . . . . . . . . . . . . . . Mannigfaltigkeit der Aussagenverbindungen, die aus gegebenen Grundaussagen gebildet werden können . . . . . . . . . . . . . . . . . . . . . . . . . . Ergänzende Bemerkungen zum Problem der Allgemeingültigkeit und Erfüllbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Systematische Übersicht über alle Folgerungen aus gegebenen Axiomen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Axiome des Aussagenkalküls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Beispiele für die Ableitung von Formeln aus den Axiomen . . . . . . . Die Widerspruchsfreiheit des Axiomensystems . . . . . . . . . . . . . . . . . . . Die Unabhängigkeit und Vollständigkeit des Systems . . . . . . . . . . . .
3 5 9 11 12 13
5
10
14 17 15
18 22 23 29 31
20
Zweites Kapitel. Der Prädikaten- und Klassenkalkül § 1. Inhaltliche Umdeutung der Symbolik des Aussagenkalküls im Sinne des Prädikatenkalküls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 § 2. Vereinigung des Prädikatenkalküls mit dem Aussagenkalkül . . . . . . 36 § 3. Systematische Ableitung der traditionellen Aristotelischen Schlüsse 37
25
Drittes Kapitel. Der engere Funktionenkalkül § § § § § § § § § §
1. 2. 3. 4. 5. 6. 7. 8. 9. 10.
Unzulänglichkeit des bisherigen Kalküls. . . . . . . . . . . . . . . . . . . . . . . . . . Methodische Grundgedanken des Funktionenkalküls . . . . . . . . . . . . . Vorläufige Orientierung über den Gebrauch des Funktionenkalküls Genaue Festlegung der Bezeichnungen im Funktionenkalkül . . . . . . Die Axiome des Funktionenkalküls. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Das System der logischen Formeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Ersetzungsregel; Bildung des Gegenteils eines Ausdrucks . . . . . Das erweiterte Dualitätsprinzip; Normalform für logische Formeln Die Widerspruchsfreiheit und Vollständigkeit des Axiomensystems Beispiele für die Anwendung des Funktionenkalküls zu formalen Beweisführungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . § 11. Das Entscheidungsproblem im Funktionenkalkül und seine Bedeutung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . § 12. Lösungen des Entscheidungsproblems für besondere Spezialfälle . .
43 44 48 51 53 54 60 62 65
30
35
68 40
72 77
Grundzüge der theoretischen Logik
811
Viertes Kapitel. Der erweiterte Funktionenkalkül
5
10
15
§ 1. Notwendigkeit einer Erweiterung des Kalküls . . . . . . . . . . . . . . . . . . . . § 2. Anwendung des erweiterten Kalküls zur logischen Behandlung des Anzahlbegriffs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . § 3. Darstellung der Grundbegriffe der Mengenlehre im erweiterten Kalkül . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . § 4. Die logischen Paradoxien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . § 5. Die Methode des Stufenkalküls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . § 6. Mängel des Stufenkalküls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . § 7. Das Axiom der Reduzierbarkeit. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . § 8. Anwendungen des Axioms der Reduzierbarkeit. . . . . . . . . . . . . . . . . . . § 9. Schlußbemerkungen zum Stufenkalkül. . . . . . . . . . . . . . . . . . . . . . . . . . . .
VIII
82 86 88 92 98 103 106 108 114
Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 Namen- und Sachverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
Einleitung.
20
25
30
35
40
Die theoretische Logik, auch mathematische oder symbolische Logik genannt, ist eine Anwendung der formalen Methode der Mathematik auf das Gebiet der Logik. Sie wendet für die Logik eine ähnliche Formelsprache an, wie sie zum Ausdruck mathematischer Beziehungen schon seit langem gebräuchlich ist. In der Mathematik würde es heute als eine Utopie gelten, wollte man beim Aufbau einer mathematischen Disziplin sich nur der gewöhnlichen Sprache bedienen. Die großen Fortschritte, die in der Mathematik, z. B. in der Algebra, seit der Antike gemacht worden sind, sind zum wesentlichen Teil mit dadurch bedingt, daß es gelang, einen brauchbaren und leistungsfähigen Formalismus zu finden. — Was durch die Formelsprache in der Mathematik erreicht wird, das soll auch in der theoretischen Logik durch diese erzielt werden, nämlich eine exakte, wissenschaftliche Behandlung ihres Gegenstandes. Die logischen Sachverhalte, die zwischen Urteilen, Begriffen usw. bestehen, finden ihre Darstellung durch Formeln, deren Interpretation frei ist von den Unklarheiten, die beim sprachlichen Ausdruck leicht auftreten können. Der Übergang zu logischen Folgerungen, wie er durch das Schließen geschieht, wird in seine letzten Elemente zerlegt und erscheint als formale Umgestaltung der Ausgangsformeln nach gewissen Regeln, die den Rechenregeln in der Algebra analog sind; das logische Denken findet sein Abbild in einem Logikkalkül. Dieser Kalkül macht die erfolgreiche Inangriffnahme von Problemen möglich, bei denen das rein inhaltliche, logische Denken prinzipiell versagt. Zu diesen gehört z. B. die Frage, wie man die Sätze charakterisieren kann, die aus gegebenen Voraussetzungen überhaupt gefolgert werden können. — Eine besondere Bedeutung hat der Logikkalkül in den letzten Jahrzehnten noch bekommen, indem er sich zu einem unentbehrlichen Hilfsmittel der mathematischen Grundlagenforschung entwickelt hat.
1
812
2
3
Appendices
Die Idee einer mathematischen Logik wurde zuerst von Leibniz in klarer Form gefaßt. Die ersten Ergebnisse erzielten A. de Morgan (1806–1876) und G. Boole (1815–1864). Auf Boole geht die gesamte spätere Entwicklung zurück. Unter seinen Nachfolgern bereicherten W. S. Jevons (1835–1882) und vor allem C. S. Peirce (1839–1914) die junge Wissenschaft. Die verschiedenen Resultate seiner Vorgänger | wurden systematisch ausgebaut und vervollständigt von Ernst Schröder in seinen „Vorlesungen über die Algebra der Logik“ (1890–1895), die einen gewissen Abschluß der von Boole ausgehenden Entwicklungsreihe darstellen. Teilweise unabhängig von der Entwicklung der Boole-Schröderschen Algebra erfuhr die logische Symbolik neue Anregung durch die Bedürfnisse der Mathematik nach exakter Grundlegung und strenger axiomatischer Behandlung. G. Frege veröffentlichte seine „Begriffsschrift“(1879) und seine „Grundgesetze der Arithmetik“(1893 bis 1903). G. Peano und seine Mitarbeiter begannen 1894 mit der Herausgabe des „Formulaire de Mathématiques“, in dem alle mathematischen Disziplinen im Logikkalkül dargestellt werden sollten. Das Erscheinen der „Principia mathematica“ (1910–1913) von A. N. Whitehead und B. Russell bildet einen Höhepunkt dieser Entwicklung. — In jüngster Zeit hat Hilbert in einer Reihe von Abhandlungen und Universitätsvorlesungen den Logikkalkül dazu verwendet, um auf einem neuen Wege zu einem Aufbau der Mathematik zu gelangen, der die Widerspruchsfreiheit der zugrunde gelegten Annahmen erkennen läßt.
5
10
15
20
Erstes Kapitel.
Der Aussagenkalkül. Einen ersten, unentbehrlichen Bestandteil der mathematischen Logik bildet der sogenannte Aussagenkalkül. Unter einer Aussage ist jeder Satz zu verstehen, von dem es sinnvoll ist, zu behaupten, daß sein Inhalt richtig oder falsch ist. Aussagen sind z. B.: „Die Mathematik ist eine Wissenschaft“, „der Schnee ist schwarz“, „9 ist eine Primzahl“. In dem Aussagenkalkül wird auf die feinere logische Struktur der Aussagen, die etwa in der Beziehung zwischen Prädikat und Subjekt zum Ausdruck kommt, nicht eingegangen, sondern die Aussagen werden als Ganzes in ihrer logischen Verknüpfung mit anderen Aussagen betrachtet.
25
30
§ 1. Einführung der logischen Grundverknüpfungen. Aussagen können in bestimmter Weise zu neuen Aussagen verknüpft werden. Z. B. kann man aus den beiden Aussagen „2 ist kleiner als 3“, „der Schnee ist schwarz“ die neuen Aussagen bilden: „2 ist kleiner als 3 und der Schnee ist schwarz“, „2 ist kleiner als 3 oder der Schnee ist schwarz“, „wenn 2 kleiner als 3 ist, so ist der Schnee schwarz“. Endlich kann man aus „2 ist kleiner als 3“ die neue Aussage bilden „2 ist nicht kleiner als 3“, die das logische Gegenteil der ersten Aussage ausdrückt.
35
40
Grundzüge der theoretischen Logik
5
10
15
20
25
30
35
40
813
Diese Verknüpfungen von Aussagen sind sprachlich durch die Worte „und “, „oder “, „nicht“, „wenn — so“ gegeben. Wir wollen nun diese Grundverknüpfungen von Aussagen durch eine geeignete Symbolik darstellen. Als Bezeichnungen für Aussagen verwenden wir große lateinische Buchstaben: X, Y , Z, U , . . . Zur Wiedergabe der logischen Verknüpfung der Aussagen führen wir die folgenden 5 Zeichen ein: 1. X (lies „X nicht“) bezeichnet das kontradiktorische Gegenteil von X. X bedeutet die Aussage, die richtig ist, wenn X falsch ist, und die falsch ist, wenn X richtig ist. 2. X & Y (lies „X und Y “) bezeichnet die Aussage, die dann und nur dann richtig ist, wenn sowohl X als Y richtig ist. 3. X ∨ Y (lies „X oder Y “) bezeichnet die Aussage, die dann und nur dann richtig ist, wenn mindestens eine der beiden Aussagen X, Y richtig ist. 4. X → Y (lies „wenn X, so Y “) bezeichnet die Aussage, die dann und nur dann falsch ist, wenn X richtig und Y falsch ist. 5. X ∼ Y (lies „X gleichwertig Y “), auch wohl X Y oder X ↔ Y geschrieben, bezeichnet die Aussage, die dann und nur dann richtig ist, wenn X und Y beide richtig oder X und Y beide falsch sind. X ∼ Y bedeutet also, daß X und Y beide denselben Wahrheitswert haben. Zu 3. bemerken wir, daß die Verknüpfung „X oder Y “ nicht mit dem ausschließenden oder, im Sinne des lateinischen aut — aut, verwechselt werden darf. Dieses „oder“ hat vielmehr die Bedeutung von „oder auch“ im Sinne des lateinischen vel, d. h. die Möglichkeit des Zusammenbestehens von X und Y wird mit zugelassen1 . Die Beziehung „wenn X, so Y “ ist nicht so aufzufassen, als ob damit ein Verhältnis von Grund und Folge gesagt werden soll. Vielmehr ist die Aussage X → Y immer schon dann richtig, wenn X eine falsche oder auch, wenn Y eine richtige Aussage ist. So haben z. B. folgende Aussagen als richtig zu gelten: Wenn „2 mal 2 gleich 4“, so „ist der Schnee weiß“. Wenn „2 mal 2 gleich 5“, so „ist der Schnee weiß“. Wenn „2 mal 2 gleich 5“, so „ist der Schnee schwarz“. Falsch wäre dagegen die Aussage: Wenn „2 mal 2 gleich 4“, so „ist der Schnee schwarz“. Immerhin hat die Beziehung X → Y mit der Beziehung von Grund und Folge das gemeinsam, daß im Falle der Richtigkeit von X → Y aus dem Bestehen von X das Bestehen von Y entnommen werden kann. Die Beziehung X ∼ Y hat nicht etwa den Sinn, daß X mit Y gleichbedeutend ist, sie besteht vielmehr zwischen irgend zwei richtigen und auch zwischen irgend zwei falschen Aussagen. Z. B. sind die Aussagen (2 und 2 gleich 4) ∼ (der Schnee ist weiß) (2 > 3) ∼ (der Schnee ist schwarz) richtig. 1
Das ausschließende „entweder — oder“ kann natürlich auch durch eine Kombination der Grundzeichen ausgedrückt werden. „Entweder X oder Y “ ist die Negation von X ∼ Y und wird dargestellt durch X ∼ Y .
4
814
5
Appendices
Besonders wichtig ist noch die allgemeine Bemerkung, daß nach unserer Definition der logischen Grundverknüpfungen die Richtigkeit oder Falschheit einer Aussagenverknüpfung nur von der Richtigkeit und Falschheit der verknüpften Aussagen, nicht aber von ihrem Inhalt abhängig ist. Bezeichnen wir zur Abkürzung eine richtige Aussage mit R und eine falsche Aussage mit F, so ist z. B. die Verknüpfung → dadurch gekennzeichnet, daß die Aussagen R → R, F → R und F → F richtig sind, R → F aber falsch ist. Für die Verknüpfung & ist R & R richtig, R & F, F & R, F & F sämtlich falsch. Entsprechendes gilt für die übrigen Verknüpfungen. Zur formalen Kennzeichnung der eingeführten Operationen ist zu bemerken, daß die Negation X allein eingliedrig ist, während die übrigen Operationen alle zweigliedrig sind.
5
10
§ 2. Äquivalenzen; Entbehrlichkeit von Grundverknüpfungen. Aus gegebenen Aussagen lassen sich durch ein- oder mehrmalige Anwendung der Grundverknüpfungen in mannigfacher Weise zusammengesetzte Aussagen bilden. Z. B. entsteht aus den Grundaussagen X, Y , Z die zusammengesetzte Aussage (X → Y ) & (Y → Z) & (X ∨ Z). Es ist nun bemerkenswert, daß verschiedene dieser Aussagenverknüpfungen gleichbedeutend sind. So ist X gleichbedeutend mit X; die doppelte Verneinung ist dasselbe wie eine Bejahung. Solche gleichbedeutende Aussagenverknüpfungen wollen wir im folgenden „äquivalent“ nennen. Zur Abkürzung schreiben wir (1)
20
X äq X.∗
Wir wollen im folgenden eine Reihe weiterer Äquivalenzen zusammenstellen. Zunächst zeigt sich in der Wirkungsweise der Zeichen & und ∨ eine Analogie mit den Zeichen + und · in der Algebra. Es bestehen nämlich die folgenden Äquivalenzen: (2)
X & Y äq Y & X,
(3) (4)
X & (Y & Z) äq (X & Y ) & Z, X ∨ Y äq Y ∨ X,
(5) (6)
X ∨ (Y ∨ Z) äq (X ∨ Y ) ∨ Z, X ∨ (Y & Z) äq (X ∨ Y ) & (X ∨ Z).
Von der Richtigkeit dieser Äquivalenzen, ebenso wie aller folgenden, kann man sich auf folgende Weise überzeugen: Zwei Aussagenverknüpfungen etwa der Grundaussagen X, Y , Z sind offenbar dann und nur dann äquivalent, wenn bei jeder gleichen Einsetzung von richtigen oder falschen Aussagen für X, Y , Z die beiden Aussagenverknüpfungen auch den gleichen Wahrheitswert ergeben. Ich nehme z. B. bei der Äquivalenz (6) für X, Y , Z die Aussagen R, ∗
15
Es sei hervorgehoben, daß die hier gebrauchte Schriftabkürzung äq nicht zu unseren logischen Symbolen gehört.
25
30
35
Grundzüge der theoretischen Logik
815
F, F. Ist die Äquivalenz (6) richtig, so muß sein R ∨ (F & F) ∼ (R ∨ F) & (R ∨ F).
5
10
15
20
Nun ist (nach Definition der Verknüpfung &) F & F gleichwertig mit F, R ∨ F ∼ R, also R ∨ (F & F) ∼ R. Auf der rechten Seite | hat man R ∨ F ∼ R, R & R ∼ R. Für die Kombination R, F, F stellen also beide Seiten der Äquivalenz richtige Aussagen dar. Ebenso kann man sich überzeugen, daß für alle übrigen Einsetzungen von richtigen bzw. falschen Aussagen für X, Y , Z die beiden Seiten der Äquivalenz (6) jedesmal den gleichen Wahrheitswert ergeben. In derselben Weise kann man die Äquivalenzen (2) – (5) nachprüfen. Diese Nachprüfung sei dem Leser überlassen. Die Äquivalenzen sind ja auch ohne weiteres evident. Aus den Äquivalenzen (2) bis (6) ergibt sich ein kommutatives, assoziatives und distributives Gesetz. Wegen dieser Analogie zur Algebra wollen wir X &Y auch als die logische Summe und X ∨ Y als das logische Produkt bezeichnen. Aus den angegebenen Gesetzen folgt, daß man bei logischen Ausdrücken in ähnlicher Weise wie in der Algebra „ausmultiplizieren“ bzw. einen gemeinsamen Faktor ausklammern kann. — Ebensogut hätten wir übrigens X & Y als logisches Produkt und X ∨ Y als logische Summe bezeichnen können, und diese Bezeichnung ist sogar in der Logik gebräuchlicher. Es gilt nämlich, im Unterschied zur Algebra, noch ein zweites distributives Gesetz: (7)
25
30
40
X & (Y ∨ Z) äq (X & Y ) ∨ (X & Z).
Ein Beispiel zur Erläuterung des zweiten distributiven Gesetzes ist folgendes: Es werde die Wetterprophezeiung ausgesprochen: „Es regnet heute, und morgen oder übermorgen scheint die Sonne“. Dieselbe Behauptung läßt sich auch so ausdrücken: „Es regnet heute, und morgen scheint die Sonne, oder es regnet heute und übermorgen scheint die Sonne“. — Wegen des kommutativen und assoziativen Gesetzes können mehrgliedrige Summen und Produkte ohne Klammern geschrieben werden. Ferner setzen wir zur weiteren Ersparung von Klammern fest, daß ∨ enger bindet als & und & wieder enger als → und ∼. Das Zeichen ∨ kann auch ebenso wie in der Algebra das Zeichen · fortgelassen werden. Bei der Verbindung der Negation mit & und ∨ ist die folgende Beziehung wesentlich: (8)
35
6
X & Y äq X ∨ Y .
Es bedeute z. B. X die Behauptung: „Das Dreieck ist rechtwinklig“, Y bedeute: „Das Dreieck ist gleichschenklig“. Der Verbindung X&Y entspricht dann die Aussage: „Das Dreieck ist rechtwinklig und gleichschenklig“. Das kontradiktorische Gegenteil hiervon ist die Aussage: „Das Dreieck ist nicht rechtwinklig oder nicht gleichschenklig“, und diese Aussage wird durch X ∨ Y dargestellt. Ebenso gilt: (9)
X ∨ Y äq X & Y .
Z. B. werde bei einer Prüfung in Mathematik verlangt, daß der Kandidat mindestens in einem der Gebiete Arithmetik und Geometrie beschlagen sei.
7
816
Appendices
X bedeute die Aussage: „Der Kandidat kann Arithmetik“, Y bedeute: „Der Kandidat kann Geometrie.“ Die Anforderung des Examens wird von dem Kandidaten erfüllt, wenn X ∨Y richtig ist. Fällt nun der Kandidat bei der Prüfung durch, liegt also das Gegenteil von X ∨ Y vor, so bedeutet dies: „Der Kandidat kann nicht Arithmetik und er kann nicht Geometrie,“ was durch X & Y dargestellt wird. Weitere Äquivalenzen ergeben sich, wenn wir die Zeichen → und ∼ heranziehen. Da die Aussage X → Y bedeutet, daß nicht gleichzeitig X richtig und Y falsch ist, so hat man (10)
5
10
X → Y äq X & Y .
Unter Benutzung von (8) kann man für X & Y auch X ∨ Y , und nach (1) auch X ∨ Y schreiben. Es gilt also auch (11)
X → Y äq X ∨ Y.
Nimmt man in dieser Äquivalenz X statt X und benutzt man, daß X äq X, so erhält man die neue Beziehung (12)
15
X ∨ Y äq X → Y.
Nach (10) hat man Y → X äq Y & X. Nach (1) kann man dafür Y & X, nach (2) X & Y und nach (10) X → Y setzen. Es ergibt sich also: X → Y äq Y → X.
20
Bestehen ferner die beiden Aussagen X → Y und Y → X zu Recht, so heißt das, daß nicht gleichzeitig X richtig und Y falsch, und auch nicht gleichzeitig Y richtig und X falsch ist. Die Aussage (X → Y ) & (Y → X) bedeutet also, daß X und Y beide den gleichen Wahrheitswert haben. Mit anderen Worten, es besteht die Äquivalenz
25
(13)
(14)
X ∼ Y äq (X → Y ) & (Y → X).
Aus der Bedeutung der Verknüpfung ∼ ergibt sich unmittelbar, daß (15)
X ∼ Y äq Y ∼ X
(16)
X ∼ Y äq X ∼ Y .
Weiter erhält man aus (9) und (8), indem man von beiden Seiten der Äquivalenz das Gegenteil nimmt und benutzt, daß die doppelte Verneinung nach (1) fortgelassen werden kann:
8
(17)
X ∨ Y äq X & Y ,
(18)
X & Y äq X ∨ Y .
An diesen Äquivalenzen zeigt sich eine Vielfachheit in der Darstellung von Aussagenverknüpfungen durch die eingeführten Zeichen. Es wird so die Frage nahegelegt, ob nicht einige von den logischen Grundverknüpfungen entbehrlich sind. Das ist tatsächlich der Fall. Aus (14) ergibt sich zunächst, daß man das Zeichen ∼ entbehren kann, da sich die Verknüpfung X ∼ Y durch →
30
35
Grundzüge der theoretischen Logik
5
10
15
und & wiedergeben läßt. Aus (10) und (17) folgt weiter, daß auch → und ∨ entbehrlich sind, daß man also mit & und auskommen kann. Ebenso ergibt genügen. Desgleichen sind → und sich aus (11) und (18), daß auch ∨ und ausreichend; denn nach (17) läßt sich zunächst & durch ∨ und , und nach ausdrücken. (12) ∨ durch → und Die Darstellung mit → und hat Frege, die mit ∨ und Russell zugrunde gelegt (d. h. unter Benutzung anderer Symbole). Am natürlichsten ist es auszugehen, wie es in Brentanos wohl, von der Darstellung durch & und Urteilslehre geschieht. Besonders zweckmäßig ist der Gebrauch der drei Zeichen &, ∨, , da sich infolge der Äquivalenzen (2) bis (6) dann eine besonders einfache rechnerische Behandlung der logischen Ausdrücke ergibt. können nicht alle Verknüpfungen dargestellt werden. So ist Mit ∼ und schon X & Y nicht mit diesen Zeichen darstellbar. Zum Beweis wollen wir zunächst annehmen, daß nur die Grundaussagen X und Y gebraucht werden. Wir betrachten dann die 8 Aussagen: X;
20
25
30
35
817
Y;
X;
Y;
X ∼ X;
X ∼ X;
X ∼Y;
X∼Y
Negiert man eine dieser Aussagen, oder setzt man zwei dieser Aussagen durch ∼ zusammen, so erhält man wieder Aussagen, die einer der 8 Aussagen äquivalent sind. Z. B. ist (X ∼ Y ) ∼ Y äq Y ; (X ∼ Y ) ∼ (X ∼ Y ) äq X ∼ X usw. Da die Grundaussagen X und Y unter den 8 Aussagen selbst vorkommen, so ergibt sich, daß jede Aussage, die aus X und Y nur durch Anwendung von ∼ und gebildet wird, einer dieser 8 Aussagen äquivalent ist. X & Y ist aber keiner dieser Aussagen äquivalent. — Gäbe es eine mit X &Y äquivalente gebildete Aussagenverknüpfung, die noch die Grundund nur mit ∼ und aussagen Z, U , . . . T enthält, so müßte die Äquivalenz auch bestehen, falls man Z, U , . . . T alle durch X ersetzt. Damit kommen wir auf den vorigen Fall zurück. Die Negation ist bei der Darstellung der Aussagenverknüpfungen unentbehrlich. Z. B. läßt sich X ohne Anwendung der Negation nicht darstellen. Alle mit dem unbestimmten Zeichen X durch Anwendung von &, ∨, →, ∼ gebildeten Ausdrücke stellen nämlich nur solche Aussagen dar, welche richtig sind, sofern X richtig ist, während X den entgegengesetzten Wahrheitswert hat wie X. Bemerkenswert ist, daß die Verknüpfung ∨ durch → allein, ohne Anwendung der Negation ausgedrückt werden kann. Es gilt nämlich X ∨ Y äq (X → Y ) → Y.
40
Für X & Y ist eine derartige Darstellung nicht möglich. Als Kuriosität sei erwähnt, daß man auch mit einem einzigen logischen Zeichen auskommt, wie es Sheffer gezeigt hat. Dieser benutzt als einzige Grundverknüpfung X/Y , in Worten: „X und Y bestehen nicht beide.“ X/X ist dann gleichbedeutend mit X. X/X / Y /Y ist äquivalent mit X/Y , d. h. X ∨ Y . Da man ∨ und durch den Shefferschen Strich ausdrücken kann, so gilt das auch für die übrigen Grundverknüpfungen.
9
818
Appendices
Als wichtig für die Darstellung der Gleichwertigkeitsbeziehung seien noch folgende Äquivalenzen erwähnt: (19)
X ∼ Y äq X ∨ Y & Y ∨ X,
(20)
X ∼ Y äq (X & Y )(X & Y ).
(19) geht aus (14) hervor, indem man nach (11) die Verknüpfung → durch ∨ und ersetzt. (20) ergibt sich unmittelbar aus der Bedeutung von ∼.
5
§ 3. Normalform für die logischen Ausdrücke. Wir haben bisher gesehen, wie man aus bestimmten Grundaussagen, die wir mit X, Y , Z . . . bezeichnen, durch ein- oder mehrmalige Anwendung der Verknüpfungen &, ∨, →, neue Aussagen bilden kann. Die im vorigen Paragraphen aufgestellten Äquivalenzen lehren uns, daß es für inhaltlich gleichbedeutende Verbindungen von Grundaussagen eine Vielfachheit der Darstellung gibt, bei denen man von einer zur anderen nach Belieben übergehen kann. Es ist nun bemerkenswert, daß jede Aussagenverbindung durch äquivalente Umformung auf eine gewisse Normalform gebracht werden kann; und zwar besteht diese Normalform aus einer Summe von Produkten, in denen jeder Faktor entweder eine Grundaussage oder die Negation einer solchen ist. Wir bilden uns auf Grund der aufgestellten Äquivalenzen folgende Regeln für die Umformung von Ausdrücken: a1) Mit den Zeichen & und ∨ kann, wie in der Algebra, assoziativ, kommutativ und distributiv gerechnet werden.
10
a2) X kann ersetzt werden durch X. a3) Für X & Y kann man X ∨ Y , für X ∨ Y kann man X & Y schreiben. a4) X → Y kann durch X ∨Y , X ∼ Y durch XY &Y X ∗ ersetzt werden. Es ist hier immer die gegenseitige Ersetzbarkeit gemeint. Die Umformung geschieht nun in der folgenden Weise: Zunächst kann jeder Ausdruck unter Benutzung der Regel a4) durch einen äqui|valenten ersetzt werden, der nicht mehr die Zeichen → und ∼ enthält. Der so entstehende auf. Ausdruck baut sich dann durch Anwendung der drei Zeichen &, ∨, Durch sukzessive Anwendung der Regel a3) kann man dann erreichen, daß die Negationsstriche immer weiter nach innen rücken und schließlich nur über den Grundaussagen stehen. Z. B. wird aus
10
15
20
25
30
(XY & Y ) ∨ (Z & Y ) zunächst (XY & Y ) & (Z & Y ), dann durch nochmalige Anwendung von a3): XY ∨ Y & Z ∨ Y ∗
Wir gebrauchen hier und im folgenden häufig die schon erwähnte bequeme Schreibweise, bei der das Zeichen ∨ fortgelassen wird.
35
Grundzüge der theoretischen Logik
819
und schließlich
5
10
(X & Y )Y & Z Y . Der so entstehende Ausdruck setzt sich dann aus negierten und unnegierten Grundaussagen durch & und ∨ zusammen. Nach Regel a1) kann man nun ebenso wie in der Algebra „ausmultiplizieren“. Bei unserem Beispiel erhält man so: XY &Y Y &ZY. Ersetzen wir nun schließlich nach a2) X durch X, X durch X usw., so ist der Ausdruck auf die Normalform gebracht. Als ein zweites Beispiel betrachten wir den Ausdruck (X → Y ) ∼ (Y → X). Schafft man hier zunächst nach a4) das Zeichen → fort, so erhält man: XY ∼ Y X. Y wird durch Y ersetzt:
15
XY ∼ Y X. Durch abermalige Anwendung von a4) erhält man (XY )Y X & (Y X)XY, (X & Y )Y X & (Y & X)XY
(nach a3)
X wird durch X ersetzt: 20
(X & Y )Y X & (Y & X)XY. Durch Ausmultiplizieren erhält man dann XY X & Y Y X & Y XY & XXY.
25
Das ist eine Normaldarstellung von (X → Y ) ∼ (Y → X). Es sei übrigens bemerkt, daß die zu einer Aussagenverbindung gehörige Normaldarstellung nich eindeutig ist. Z. B. gehört zu X ∼ Y einmal nach (19) die Normaldarstellung XY & Y X. Andererseits erhält man durch Ausmultiplizieren der rechten Seite von (20): XX & XY & Y X & Y Y .
§ 4. Charakterisierung der immer richtigen Aussagenverbindungen. 30
35
Ob eine Aussagenverbindung, die sich aus den Grundaussagen X1 , X2 , . . . Xn in bestimmter Weise mit Hilfe der logischen Zeichen &, ∨, →, ∼, aufbaut, richtig oder falsch ist, hängt nur davon ab, wie sich Richtigkeit und Falschheit auf die Grundaussagen verteilt. Der Wahrheitswert einer Aussagenverbindung bleibt ungeändert, falls eine Teilaussage durch eine gleichwertige ersetzt wird. Daraus ergibt sich übrigens, daß das Zeichen ∼ in unserem Kalkül eine ähnliche Rolle spielt wie das Zeichen = in der Algebra.
11
820
Appendices
Die erste Aufgabe für die Logik ist es nun, diejenigen Verbindungen von Aussagen zu finden, welche stets, d. h. unabhängig davon, ob die Grundaussagen richtige oder falsche Behauptungen darstellen, richtig sind. Da wir zu jedem logischen Ausdruck einen äquivalenten in der Normalform angeben können, so kommt es zur Beantwortung dieser Frage nur darauf an, zu entscheiden, wann ein Ausdruck in der Normalform eine immer richtige Aussagenverbindung darstellt. Diese Feststellung geschieht mit Hilfe der folgenden, leicht zu verifizierenden Regeln: b1) XX ist immer richtig. b2) Wenn X richtig ist und Y eine beliebige Aussage bedeutet, so ist auch XY richtig. b3) Wenn X richtig und Y richtig ist, dann ist auch X & Y richtig.
12
Diese Regeln sind so aufzufassen, daß für X und Y irgendwelche Aussagen und Aussagenverbindungen eingesetzt werden dürfen. Gemäß den Regeln b1), b2), b3) und a1) werden alle Ausdrücke in der Normalform als richtig statuiert, die dadurch charakterisiert sind, daß in jedem Produkt mindestens eine der Grundaussagen zugleich mit ihrer Negation als Faktor auftritt. Daß ein derartiger Ausdruck bei beliebigem Inhalt der Grundaussagen eine richtige Aussage darstellt, geht auch unmittelbar aus der Bedeutung der Negation sowie der Verknüpfungen „und“ und „oder“ hervor. Dies sind aber auch die einzigen Ausdrücke, die stets richtig sind. Denn wenn bei einem Summengliede einer Normalform, das ja die Form eines Produktes hat, jede Grundaussage entweder nur unverneint oder nur verneint als Faktor auftritt, so kann dieses Produkt zu einer falschen Aussage gemacht werden, indem für die unverneinten Aussagezeichen falsche und für | die verneinten richtige Aussagen eingesetzt werden. Es stellt dann ein Summenglied der Normalform eine falsche Aussage dar, und daher muß auch der ganze Ausdruck eine falsche Aussage darstellen, unabhängig davon, was man für die noch unbestimmten Aussagezeichen einsetzt. Wir wollen an einigen Beispielen zeigen, wie man nach der angegebenen Methode Aussagen als immer richtig nachweist.
5
10
15
20
25
30
1. X ∼ X. Die Umformung nach Regel a4) ergibt: XX & XX. Der letzte Ausdruck in der Normalform enthält in jedem Summengliede eine Grundaussage und ihr Gegenteil, er ist also richtig. 2. X & Y → X. Die Umformung ergibt: X & Y ∨ X (nach a4), XYX (nach a3). Das letzte Produkt enthält X und X, ist also richtig. 3. (X & (X → Y )) → Y . Man erhält X & XY ∨ Y [durch zweimalige Anwendung von a4)],
35
40
Grundzüge der theoretischen Logik
X(X & Y )Y
5
821
[nach a3)],
X XY &X Y Y [nach a1)], XXY & X Y Y [nach a2)]. Das erste Produkt enthält X und X, das zweite Y und Y als Faktor. (X & (X → Y )) → Y ist also eine immer richtige Aussagenverbindung. § 5. Das Prinzip der Dualität.
10
15
20
25
30
35
Eine wichtige Bemerkung zur Charakterisierung unseres Kalküls schließt sich an die Regel a3) an. Aus dieser läßt sich entnehmen, daß von einem Ausdruck, welcher aus den Grundaussagen und ihren Negationen allein durch Addition und Multiplikation gebildet ist, das Gegenteil dadurch erhalten wird, daß man die Zeichen & und ∨ miteinander vertauscht und die Grundaussagen gegen ihre Negationen auswechselt. Hiervon können wir folgende Anwendung machen. Es sei ein Ausdruck von der Form A ∼ B, oder wie wir auch sagen, eine logische Gleichung als immer richtig erwiesen. (Wir gebrauchen deutsche Buchstaben zur Bezeichnung von Aussagenverbindungen, deren genaue formale Gestalt unbestimmt gelassen wird, mitunter auch zur Ab|kürzung.) Da A ∼ B gleichbedeutend ist mit A ∼ B, so erhalten wir wieder einen richtigen Ausdruck, indem wir von beiden Seiten der Gleichung das Gegenteil bilden. Sind nun die beiden Seiten der Gleichung aus den Grundaussagen und ihren Negationen nur durch Addition und Multiplikation gebildet, so können wir die eben genannte Regel anwenden. Wir erhalten demnach eine Formel, die aus der anfänglichen Gleichung A ∼ B dadurch entsteht, daß Summe mit Produkt und jede Grundaussage mit ihrem Gegenteil vertauscht wird. Da diese Gleichung immer richtig ist, so können wir sie anwenden, indem wir für eine jede Grundaussage das Gegenteil einsetzen. Dadurch heben wir aber die Vertauschung der Grundaussagen mit ihren Negationen auf. Somit ergibt sich folgendes Dualitätsprinzip: Aus einer Formel A ∼ B, die auf Grund unserer Regeln stets richtig ist, und deren beide Seiten aus Grundaussagen und deren Negationen nur durch Addition und Multiplikation gebildet sind, erhält man wieder eine richtige Gleichung, indem man Summe und Produkt miteinander vertauscht. So ist z. B. X(Y & Z) ∼ XY & XZ immer richtig. Es ist die Formel des ersten distributiven Gesetzes. Aus dieser gewinnt man gemäß dem Dualitätsprinzip die Formel: X & Y Z ∼ (X & Y )(X & Z), welche gleichfalls richtig ist und das zweite distributive Gesetzt darstellt. Ebenso ist der richtigen Formel
40
(X & X)Y ∼ Y nach dem Dualitätsprinzip die ebenfalls richtige Formel
13
822
Appendices
XX & Y ∼ Y zugeordnet. § 6. Die disjunktive Normalform für logische Ausdrücke.
14
Von der Regel zur Bildung des Gegenteils läßt sich eine wichtige Anwendung machen. Wir hatten gesehen, daß jeder logische Ausdruck auf eine Normalform gebracht werden kann. Diese Normalform besteht aus einer Summe von Produkten, wo jedes Produktglied eine negierte oder unnegierte Grundaussage ist. Die Umformung eines Ausdrucks zur Normalform geschieht mit Hilfe der Regeln a1)–a4). — Daneben gibt es noch eine zweite Normalform, die aus einem Produkt von Summen besteht. Jeder Summand ist eine negierte oder unnegierte Grundaussage. Wir bezeichnen diese Normalform als „disjunktive“ und die frühere zur Unterscheidung als „konjunktive“. Die Umformung eines Ausdrucks zur disjunktiven Normalform kann man in der folgenden Weise vornehmen: Man negiert den ur|sprünglichen Ausdruck, bringt ihn dann auf die konjunktive Normalform und bildet dann wieder das Gegenteil gemäß unserer Regel. Man kann auch den Umstand benutzen, daß in bezug auf die Regeln a1) bis a4) sich Summe und Produkt vollkommen dual verhalten. Wie man aus der konjunktiven Normalform ablesen kann, ob ein Ausdruck immer richtig ist oder nicht, so kann man mit Hilfe der disjunktiven entscheiden, ob er immer falsch ist. Dies ist dann und nur dann der Fall, wenn jeder Faktor mit einer Grundaussage zugleich ihr Gegenteil als Summand enthält. Der Beweis dafür ergibt sich sofort, wenn man berücksichtigt, daß das Gegenteil einer disjunktiven Normalform durch eine konjunktive Normalform dargestellt wird, und daß eine Formel dann und nur dann immer falsch ist, wenn das Gegenteil immer richtig ist. Als Beispiel für die Anwendung der disjunktiven Normalform betrachten wir die Aussagenverbindung:
5
10
15
20
25
XY & Y Z & X & Z. Durch die duale Operation zum „Ausmultiplizieren“, d. h. durch Anwendung des zweiten distributiven Gesetzes, erhält man die Normalform:
30
(X & Y & X & Z) ∨ (X & Z & X & Z) ∨ (Y & Y & X & Z) ∨ (Y & Z & X & Z). Hier enthält jeder Faktor eine Grundaussage und ihre Negation als Summand, die ersten beiden X und X, der dritte Y und Y , der vierte Z und Z. XY & Y Z & X & Z stellt also eine Aussage dar, die immer falsch ist. Die disjunktive Normalform hat den Vorzug einer besonderen Übersichtlichkeit. Die einzelnen Faktoren geben die verschiedenen Möglichkeiten, unter denen die gegebene Aussagenverbindung zu Recht besteht. So lautet z. B. die zu X ∼ Y gehörige disjunktive Normalform (X & Y )(X & Y ), und diese läßt erkennen, daß X und Y entweder beide bestehen oder beide nicht bestehen müssen, falls X ∼ Y richtig sein soll.
35
40
Grundzüge der theoretischen Logik
823
§ 7. Mannigfaltigkeit der Aussagenverbindungen, die aus gegebenen Grundaussagen gebildet werden können.
5
10
15
Eine weitere wichtige Bemerkung über den Kalkül bezieht sich auf die Mannigfaltigkeit der Aussagen, die durch Kombination von endlich vielen Grundaussagen X1 , X2 , . . . Xn gebildet werden können. Wir wollen dabei nur diejenigen Aussagen als verschieden betrachten, die nicht logisch äquivalent sind. Unter dieser Voraussetzung besteht die Mannigfaltigkeit nur aus endlich vielen Aussagen. Wie wir früher erwähnten, ist eine aus X1 , X2 , . . . Xn gebildete Aussage mit einer anderen derartigen Aussage dann und nur dann | äquivalent, wenn beide Aussagen für beliebige Werte der X1 , . . . Xn den gleichen Wahrheitswert haben. Es kommen zunächst für die Richtigkeit oder Falschheit der Grundaussagen 2n Möglichkeiten in Betracht, da ja jede einzelne der Aussagen X1 , X2 , . . . Xn richtig oder falsch sein kann. Eine aus X1 , X2 , . . . Xn zusammengesetzte Aussage ist nun dadurch bestimmt, daß für jeden der 2n Fälle ausgemacht wird, ob sie dabei richtig oder falsch ist. Es gibt demnach genau n 2(2 ) verschiedene Aussagen, die sich aus X1 , X2 , . . . Xn zusammensetzen. Die 4 verschiedenen, mit X allein gebildeten Aussagen sind X;
20
X;
X ∨ X;
X & X.
Die 16 verschiedenen Aussagen, welche sich aus X und Y bilden lassen, sind X;
Y;
X &Y;
X ∨Y;
X →Y;
Y → X;
X &Y;
X &Y;
Y & X;
X ∼Y;
X ∨X
und deren Negationen: X;
Y;
X ∨Y;
X ∼Y;
X & X.
(2n )
25
30
Aussagen haben zwei eine Sonderstellung, nämlich die Unter den 2 immer richtige Aussage, welche z. B. durch X1 ∨ X1 (oder auch X1 ∼ X1 ) darstellbar ist, und die immer falsche, die man durch X1 & X1 darstellen kann. Einen formalen Überblick über die verschiedenen, aus X1 , X2 , . . . Xn zu bildenden Aussagen gewinnt man durch den folgenden Satz: Jeder mit den Grundaussagen X1 , X2 , . . . Xn gebildete Ausdruck ist einer Teilsumme des ausmultiplizierten Ausdrucks: (X1 & X1 ) ∨ (X2 & X2 ) ∨ . . . ∨ (Xn & Xn )
35
40
äquivalent. Eine Ausnahme bilden dabei nur die immer richtigen Ausdrücke. Man kann aber auch die uneigentliche Teilsumme, die entsteht, wenn man alle Glieder fortläßt, als einen immer richtigen Ausdruck ansehen. Die Summanden des obigen, entwickelten Ausdrucks bezeichnet Schröder als die Konstituenten von X1 , X2 , . . . Xn . Der Beweis für diese Behauptung ergibt sich folgendermaßen: Man bringe den mit X1 , . . . Xn gebildeten Ausdruck zunächst auf die konjunktive Normalform. Da der Wahrheitswert eines Ausdrucks ungeändert bleibt, wenn man einen richtigen Summanden fortläßt, so brauchen wir die Summenglieder nicht aufzuschreiben, die zu einem X ein X enthalten. Benutzt man ferner die Regel, daß man statt X ∨ X nur X zu schreiben braucht, so ist jedes der noch
15
824
16
Appendices
übrigbleibenden Summenglieder ein Produkt von lauter verschiedenen Faktoren aus der Reihe X1 , . . . Xn , X1 , . . . Xn . Fehlt in einem Summand sowohl Xi als Xi , so können wir zu diesem Summanden den immer falschen Faktor Xi &Xi hinzufügen und wieder ausmultiplizieren, ohne daß der Wahrheitswert der ganzen Aussage geändert wird. Schließlich enthält | jeder Summand für jedes i entweder Xi oder Xi . Wir brauchen dann von den Summanden, die bis auf die Anordnung der Faktoren identisch sind, nur je einen zu schreiben. Damit hat dann der Ausdruck die verlangte Form bekommen. Wir erhalten so für jede aus X1 , X2 , . . . Xn gebildete Aussage eine Darstellung durch eine „ausgezeichnete“ konjunktive Normalform. Diese Normalform ist (abgesehen von der Reihenfolge der Summen- und Produktglieder) eindeutig in dem Sinne, daß zwei äquivalente Aussagenverbindungen durch dieselbe Normalform dargestellt werden. Es gibt nämlich n zu X1 , . . . Xn genau 2(2 ) verschiedene Ausdrücke in der Normalform, also ebensoviel, wie sich verschiedene Aussagen aus X1 , X2 , . . . Xn bilden lassen. Die angegebene ausgezeichnete Normalform gestattet die verschiedensten Anwendungen. Sie kann zunächst dazu dienen, unter Umständen eine einfachere Darstellung für eine gegebene Aussagenverbindung zu finden. Man bringt zu diesem Zweck den Ausdruck auf die ausgezeichnete Normalform und vereinfacht ihn dann eventuell unter Anwendung der folgenden soeben benutzten Eliminationsregel: XA & XA,
d. h.
5
10
15
20
(X & X) ∨ A
ist äquivalent mit A. Als Beispiel betrachten wir die Aussagenverbindung A & AB. Um die Entwicklung nach A und B zu bekommen, fügen wir zu A den Faktor (B & B) hinzu und multiplizieren aus. Nach Fortlassung des doppelt auftretenden Gliedes AB erhält man als ausgezeichnete Normalform:
25
AB & AB.
17
Klammert man hier den gemeinsamen Faktor A aus, so erhält man A(B & B) und nach dem angegebenen Eliminationssatz A. A ist also die einfachste Darstellung für A & AB. Ein anderes Beispiel liefert uns der Ausdruck A & AB. Hier erhält man als Normalform: AB & AB & AB. Hier lassen sich das erste und zweite und das erste und dritte Glied zusammenfassen. Um beide Eliminationen ausführen zu können, schreiben wir das erste Glied doppelt: (AB & AB) & (AB & AB). Die Elimination ergibt A & B. Es sei ferner bemerkt, daß man aus der benutzten ausgezeichneten Normalform ersehen kann, ob eine Aussage, welche aus den Grundaussagen X1 , X2 , . . . Xn zusammengesetzt ist, ohne Anwendung des Negationszeichens dargestellt werden kann. Das ist dann und nur dann der Fall, wenn in der ausgezeichneten Normalform der betrachteten | Aussage der Summand
30
35
40
Grundzüge der theoretischen Logik
5
10
825
X1 ∨ X2 ∨ . . . ∨ Xn nicht vorkommt. Hat man nämlich eine Aussage, die sich aus X1 , X2 , . . . Xn ohne Negation aufbaut, so ist diese Aussage immer richtig, falls für X1 , X2 , . . . Xn richtige Aussagen eingesetzt werden. Eine Aussage, die X1 ∨ X2 ∨ . . . ∨ Xn als Summand enthält, hat aber nicht diese Eigenschaft. Die genannte Bedingung ist also notwendig. Andererseits ist sie auch hinreichend, denn man kann jedes Glied der ausgezeichneten Normalform, das nicht gleich X1 ∨ X2 ∨ . . . ∨ Xn ist, ohne Negation ausdrücken. Z. B. schreibt man X1 X2 X3 . . . Xn als (X2 & X3 & . . . & Xn ) → X1 X1 X2 X3 X4 X5 X6 . . . als (X2 & X4 & X6 & . . . ) → X1 ∨ X3 ∨ X5 ∨ . . . usw. n Es sind demnach gerade die Hälfte der 2(2 ) Aussagen, die aus X1 , X2 , . . . Xn gebildet werden können, ohne die Negation ausdrückbar. § 8. Ergänzende Bemerkungen zum Problem der Allgemeingültigkeit und Erfüllbarkeit.
15
20
25
30
35
40
Die im vorigen angegebene ausgezeichnete Normalform für einen Ausdruck, der sich aus den Grundaussagen X1 , X2 , . . . Xn zusammensetzt, wollen wir auch kurz als Entwicklung des Ausdrucks nach X1 , X2 , . . . Xn bezeichnen. Es sei uns nun eine Aussagenverbindung gegeben, in der außer X1 , X2 , . . . Xn noch die Grundaussagen Y1 , Y2 , . . . Ym vorkommen. Auch bei einem derartigen Ausdruck können wir in gewissem Sinne von einer Entwicklung nach X1 , . . . Xn sprechen. Es läßt sich nämlich der Ausdruck darstellen als eine Summe, bei der jeder Summand aus dem Produkt eines Ausdrucks, der nur von Y1 , Y2 , . . . Ym abhängt, mit einer der Konstituenten von X1 , X2 , . . . Xn besteht. Der Beweis ist sehr einfach. Wir brauchen den Ausdruck nur nach sämtlichen vorkommenden Grundaussagen, also nach X1 , . . . Xn , Y1 , . . . Ym zu entwickeln und die Glieder, die die gleichen Konstituenten in bezug auf X1 , X2 , . . . Xn enthalten, zusammenfassen. Diese Entwicklung eines Ausdrucks nach X1 , X2 , . . . Xn bietet uns gewisse Vorteile. Wir hatten gesehen, daß die Entscheidung über die Allgemeingültigkeit eines Ausdrucks, d. h. die Aufgabe, bei einem vorgelegten logischen Ausdruck durch ein bestimmtes, endliches Verfahren zu entscheiden, ob er immer richtig ist oder nicht, im Aussagenkalkül vollständig gelöst ist. Die Beantwortung dieser Frage geschieht durch die Umformung auf die konjunktive Normalform. Dual zu dem Problem der Allgemeingültigkeit ist das Problem der Erfüllbarkeit, d. h. das Problem, zu entscheiden, ob ein vorgelegter logischer Ausdruck immer falsch ist oder ob es Aussagen gibt, die ihn erfüllen, d. h. für die er richtig ist. Die Lösung dieses Problems kann durch Umformen | zur disjunktiven Normalform geschehen, oder man kann auch den negierten 18 Ausdruck auf die konjunktive Normalform bringen. An diese Probleme der Allgemeingültigkeit bzw. Erfüllbarkeit schließen sich nun noch weitere ähnliche Fragestellungen an. Man habe einen Ausdruck, in dem die Grundaussagen X1 , . . . Xn , Y1 , . . . Ym vorkommen. Y1 , . . . Ym mögen hier bestimmte, feste Aussagen bedeuten. Wir
826
Appendices
fragen nun, welcher Bedingung müssen die Y1 , Y2 , . . . Ym genügen, damit der Ausdruck bei beliebiger Wahl der X richtig ist? Ferner: unter welchen Bedingungen für Y1 , Y2 , . . . Ym ist der Ausdruck immer falsch? Wir wollen bei der Beantwortung dieser Fragen, der Einfachheit halber, n gleich 2 annehmen. Für beliebiges n ist die Lösung genau analog. Es laute die Entwicklung des Ausdrucks nach X1 und X2 (A)
5
Φ1 (Y1 , . . . Ym )X1 X2 & Φ2 (Y1 , . . . Ym )X1 X2 & Φ3 (Y1 , . . . Ym )X1 X2 & Φ4 (Y1 , . . . Ym )X1 X2 .
Wir dürfen hier annehmen, daß alle 4 Glieder wirklich vorkommen. Sollte z. B. das Glied mit X1 X2 fehlen, so kann man einen Ausdruck Φ2 (Y1 , . . . Ym )X1 X2 hinzufügen, in dem Φ2 (Y1 , . . . Ym ) eine immer richtige Aussagenverbindung ist. Wir behaupten nun: Notwendig und hinreichend dafür, daß die Formel (A) für beliebige X1 und X2 richtig ist, ist die Richtigkeit der Aussage: Φ1 (Y1 , . . . Ym ) & Φ2 (Y1 , . . . Ym ) & Φ3 (Y1 , . . . Ym ) & Φ4 (Y1 , . . . Ym ). Daß die Bedingung hinreichend ist, ist klar. Sie ist aber auch notwendig, denn wäre z. B. Φ3 (Y1 , Y2 , . . . Ym ) nicht richtig, so ersetzen wir X1 durch eine richtige und X2 durch eine falsche Aussage. (A) ist dann äquivalent mit Φ3 (Y1 , . . . Ym ), also nicht richtig. Entsprechend ergibt sich die Lösung des dualen Problems. Der Ausdruck (A) ist in den X1 , . . . Xn dann und nur dann erfüllbar, wenn die Y1 , . . . Ym so beschaffen sind, daß
10
15
20
Φ1 (Y1 , . . . Ym ) ∨ Φ2 (Y1 , . . . Ym ) ∨ Φ3 (Y1 , . . . Ym ) ∨ Φ4 (Y1 , . . . Ym ) zutrifft. § 9. Systematische Übersicht über alle Folgerungen aus gegebenen Axiomen.
19
25
Wir hatten in § 4 eine Methode erhalten, die es uns ermöglichte, alle Verbindungen von Aussagen zu finden, die aus rein logischen Gründen richtig sind, und bei einer gegebenen Aussagenverbindung zu entscheiden, ob sie von dieser Art ist oder nicht. Es entsteht nun die weitere Aufgabe, aus gegebenen Voraussetzungen (Axiomen) alle Folge|rungen abzuleiten, insoweit das möglich 30 ist, falls wir die Aussagen nur als ungetrenntes Ganzes betrachten. Denken wir uns eine bestimmte endliche Anzahl von Axiomen, A1 , A2 , . . . An 1 , gegeben. Die Frage, ob dann eine bestimmte andere Aussagenverbindung C eine logische Folgerung dieser Axiome darstellt, läßt sich mit den bisherigen Mitteln durchaus beantworten. Dies ist dann und nur dann der Fall, wenn 35 (A1 & A2 & . . . An ) → C eine allgemeingültige logische Formel ist. Z. B. entspricht dem Schluß von A und A → B auf B die Allgemeingültigkeit der Formel (A & (A → B)) → B. 1
Über den Gebrauch der deutschen Buchstaben, vgl. § 5.
Grundzüge der theoretischen Logik
5
10
15
20
25
30
827
Wir haben aber noch keinen systematischen Überblick über alle möglichen Folgerungen, die man ziehen kann. Zu einem solchen verhilft uns erst die ausgezeichnete konjunktive Normalform. Es mögen in unseren Axiomen die Grundaussagen X1 , . . . Xn vorkommen. Wir denken uns dann sämtliche Axiome durch & verbunden und die so entstehende Aussagenverbindung nach X1 , . . . Xn entwickelt. Nehmen wir nun irgendeinen Konstituenten von X1 , X2 , . . . Xn , der in der entstandenen ausgezeichneten Normalform nicht als konjunktives Glied vorkommt. Durch geeignete Einsetzung von richtigen bzw. falschen Aussagen für die X1 , . . . Xn kann man diesen Konstituenten in ein Produkt von lauter falschen Aussagen, also in eine falsche Aussage verwandeln. Andererseits geht durch diese Einsetzung unsere ausgezeichnete Normalform in eine richtige Aussage über; denn jedes ihrer Konjunktionsglieder unterscheidet sich von dem betrachteten Konstituenten dadurch, daß mindestens an einer Stelle ein Faktor durch sein Gegenteil ersetzt ist. Der betrachtete Konstituent ist also keine logische Folgerung aus den Axiomen. Daraus ergibt sich, daß für jede Folgerung aus den Axiomen die ausgezeichnete Normalform nur solche Konstituenten enthält, die auch schon in der Entwicklung der Voraussetzung vorkamen. Unter Anwendung dieser Bemerkung ergibt sich für die Ableitung der Folgerungen aus einem System von Axiomen das folgende allgemeine Verfahren: Man verbinde sämtliche Axiome durch & und bilde für den so entstehenden Ausdruck die ausgezeichnete konjunktive Normalform. Von den Konjunktionsgliedern kann man nun irgendwelche auswählen und durch & verbinden, und erhält so alle Konsequenzen der Axiome in der ausgezeichneten Normalform. Mit Hilfe der S. 16 erwähnten Eliminationsregel läßt sich dann unter Umständen noch eine einfachere Schreibweise für die Folgerung gewinnen. In dem erwähnten Fall, wo A und A → B als Axiome genommen werden, sieht das Verfahren folgendermaßen aus: A & (A → B) wird zunächst nach A und B entwickelt. A & (A → B) äq A & AB, A & AB äq A(B & B) & AB, A(B & B) & AB äq AB & AB & AB.
35
40
AB & AB & AB stellt die ausgezeichnete Normalform für die Axiome dar. AB & AB äq (A & A)B äq B ist also eine Folgerung aus den Axiomen. Die anderen Folgerungen, die man noch aus A und A → B gewinnen kann, sind AB; AB; AB; AB &AB äq A(B &B) äq A; AB &AB äq A ∼ B und natürlich AB & AB & AB äq A & B. Will man auch die Folgerungen erhalten, in denen noch eine andere nicht in den Axiomen vorkommende Aussage C vorkommt, so muß man die Voraussetzung statt nach A und B, nach A, B, C entwickeln. Ein anderes Beispiel ist das folgende: Man habe zwei Axiome A ∼ B, B ∼ C. Ich schreibe zunächst die Axiome in der Normalform: AB & BA;
BC & CB.
20
828
Appendices
Entwickelt man die Voraussetzung nach A, B und C, so erhält man: ABC & ABC & AB C & ABC & ABC & A BC. Eine Konsequenz ist hier z. B.: ABC & AB C & ABC & A BC. Durch Zusammenfassen ergibt sich: AC(B & B) & AC(B & B) oder
AC & AC,
d. h.
5
A ∼ C.
Es sollen noch zwei Beispiele für die Anwendung solcher Schlüsse angeführt werden: Es bedeute A die Aussage „jede reelle Zahl ist algebraisch“, B bedeute „die Menge der reellen Zahlen ist abzählbar“. In der Mathematik wird gezeigt: erstens: A → B, d. h. „wenn jede reelle Zahl algebraisch ist, so ist die Menge der reellen Zahlen abzählbar“; zweitens: B, d. h. „die Menge der reellen Zahlen ist nicht abzählbar“. Die Voraussetzung ist hier AB & B oder in entwickelter Form:
10
15
AB & AB & A B.
21
Eine Konsequenz ist hier AB & A B äq A(B & B) äq A. D. h. man findet: „Nicht jede reelle Zahl ist algebraisch.“ Dies ist der Schluß auf die Existenz transzendenter Zahlen. Als ein zweites Beispiel mögen die Aussagen A, B, C folgendes bedeuten: A : „Der Additionssatz der Geschwindigkeiten ist gültig.“ B : „Das Licht pflanzt sich im Fixsternsystem nach allen Richtungen mit gleicher Geschwindigkeit fort.“ C : „Das Licht pflanzt sich auf der Erde nach allen Richtungen mit gleicher Geschwindigkeit fort.“ Dann besteht zunächst der mathematische Satz: (A&B) → C, d. h. „Wenn der Additionssatz der Geschwindigkeiten gültig ist und das Licht sich im Fixsternsystem nach allen Richtungen mit gleicher Geschwindigkeit fortpflanzt, dann ist auf der Erde die Fortpflanzungsgeschwindigkeit nicht nach allen Richtungen die gleiche.“ Ferner entnehmen wir der physikalischen Erfahrung, daß B und C richtig sind. Wir haben also die Axiome (A & B) → C;
B;
C.
20
25
30
35
In der konjunktiven Normalform lautet die Voraussetzung: ABC & B & C und entwickelt: A B C & BAC & BAC & BAC & BA C & CAB & CA B. Als Folgerung ergibt sich hier A B C & BA C & BAC & B AC.
40
Grundzüge der theoretischen Logik
829
Durch Zusammenfassen erhält man weiter:
5
10
15
20
(B & B)A C & (B & B)AC A C & AC (C & C)A A. Es ergibt sich also die Folgerung, daß der Additionssatz der Geschwindigkeiten nicht gültig ist. — Aus irgend zwei einander widersprechenden Axiomen kann jeder beliebige Satz bewiesen werden. Hat man nämlich A und A als Axiome und ist B irgendeine andere Aussage, so ergibt die Entwicklung der Voraussetzung A&A nach A und B: AB & AB & AB & A B. Daraus folgt: AB & AB, also B. Das angegebene Verfahren ermöglicht uns, sämtliche Folgerungen aus gegebenen Axiomen zu ziehen, oder mit anderen Worten, sämtliche | Aussagenverbindungen zu finden, die schwächer sind als eine vorgelegte. Man kann nun umgekehrt fragen, welche Aussagenverbindungen stärker sind als die vorgelegte, d. h. aus welchen Voraussetzungen sie sich als Folgerung ergibt. Die Lösung dieses Problems geschieht in ähnlicher Weise wie vorher: Die Folgerung wird zunächst nach sämtlichen Grundaussagen entwickelt, also auf die ausgezeichnete Normalform gebracht. Man wählt nun von den nicht vorkommenden Konstituenten irgendwelche aus, fügt sie mit & zu der Folgerung hinzu und erhält so alle möglichen Voraussetzungen. § 10. Die Axiome des Aussagenkalküls.
25
30
35
40
Die axiomatische Form für die Theorie des Aussagenkalküls wird dadurch erhalten, daß man unter den immer richtigen Aussagenverbindungen eine Auswahl trifft und dann formale Regeln angibt, nach denen sich alle übrigen immer richtigen Formeln aus jenen ableiten lassen. Diese Regeln spielen im Logikkalkül dieselbe Rolle, welche sonst in den mathematischen und physikalischen Theorien das logische Schließen hat. Daß das logische Schließen hier nicht in der gewöhnlichen inhaltlichen Weise benutzt werden darf, liegt daran, daß ja die logischen Schlußweisen den Gegenstand unserer Untersuchung bilden. Wir unterscheiden zwischen formalen Axiomen (logischen Grundformeln) und inhaltlichen Axiomen (Grundregeln zur Ableitung richtiger Formeln). Als formale Axiome wollen wir die folgenden vier einführen: a) b) c)
X ∨ X → X. X →X ∨Y. X ∨ Y → Y ∨ X.
d)
(X → Y ) → [Z ∨ X → Z ∨ Y ].
22
830
23
Appendices
Das erste Axiom bedeutet, daß eine Aussage richtig ist, wenn das Produkt der Aussage mit sich selbst richtig ist. Das zweite Axiom ist nichts anderes als die auf S. 11 erwähnte Regel b2), das dritte postuliert die Kommutativität des Produktes und das vierte sagt, daß bei einer richtigen Folgebeziehung X → Y beide Seiten mit einer beliebigen Aussage Z multipliziert werden dürfen. Das Zeichen → wollen wir übrigens nur als Abkürzung gebrauchen. X → Y soll eine bequemere Schreibweise sein für X ∨ Y . Das Axiom a) z. B. heißt also ohne Abkürzungen geschrieben: X ∨ X ∨ X. Auf diese zugrunde gelegten Ausgangsformeln wenden wir nun die folgenden Regeln an: α) Einsetzungsregel. Für eine Aussagenvariable (d.h. für einen großen lateinischen Buchstaben) darf überall, wo sie vorkommt, ein und dieselbe Aussagenverbindung eingesetzt werden. β) Schlußschema. Aus zwei Formeln A und A → B gewinnt man die neue Formel B. Beispiele dafür, wie man aus den angegebenen Axiomen neue Formeln ableitet, werden wir im folgenden Paragraphen kennenlernen. Hier sei nur folgendes bemerkt: Es sind bei der Aufstellung des Axiomensystems nur die angewandt worden. Ebensogut kann man Axiome Verknüpfungen ∨ und zugrunde legen, in denen nur & und oder → und vorkommt. Letzteres geschieht z. B. von Hilbert bei seiner „Neubegründug der Arithmetik“ 1 . Natürlich kann man auch alle Verknüpfungen nebeneinander gebrauchen. — Das hier angegebene System ist im wesentlichen dasselbe wie das von Whitehead und Russell benutzte2 . Whitehead und Russell haben außer unseren vier Axiomen noch ein weiteres, nämlich
5
10
15
20
25
X ∨ (Y ∨ Z) → Y ∨ (X ∨ Z). Es ist aber von P. Bernays gezeigt worden, daß dieses Axiom entbehrlich ist, indem es sich aus den übrigen beweisen läßt3 . Der Beweis ist unter den Ableitungen des nächsten Paragraphen enthalten. Obwohl wir nur die Verknüpfungen ∨ und dem Kalkül zugrunde gelegt haben, werden wir der Bequemlichkeit halber die Zeichen →, &, ∼ ebenfalls gebrauchen. Es ist dann X → Y als eine Abkürzung für X ∨ Y , X & Y als Abkürzung für X ∨ Y und X ∼ Y als Abkürzung für (X → Y ) & (Y → X), oder genauer XY ∨ Y ∨ X, zu betrachten. Sämtliche Axiome und Regeln sind in Übereinstimmung mit der inhaltlichen Interpretation des Kalküls gebildet. Es müssen also auch alle Formeln, 1 D. Hilbert: Die logischen Grundlagen der Mathematik. Math. Ann. Bd. 88, S. 153. Hilbert 1923a 2 A. N. Whitehead und B. Russell: Principia mathematica. Whitehead and Russell 1910 ; Whitehead and Russell 1912 ; Whitehead and Russell 1913 3 P. Bernays: Axiomatische Untersuchung des Aussagenkalküls der Principia mathematica. Math. Zeitschr. 25 (1926). Bernays 1926
30
35
Grundzüge der theoretischen Logik
831
die wir in dem Kalkül ableiten können, bei der inhaltlichen Deutung richtige Urteile darstellen. § 11. Beispiele für die Ableitung von Formeln aus den Axiomen.
5
10
15
20
25
30
35
40
Es sollen jetzt eine Reihe von Beispielen für die streng formale Ableitung von Formeln aus den Axiomen gegeben werden. Wir wollen | uns etwas länger dabei aufhalten, da erfahrungsgemäß dem Anfänger die Wahrung des rein formalen Standpunktes besondere Schwierigkeiten zu machen pflegt. Bei der Ableitung der Formeln empfiehlt es sich, gewisse sehr häufig wiederkehrende Operationen in Form von abgeleiteten Regeln zusammenzufassen. Durch eine solche Regel wird ein für allemal das Ergebnis des betreffenden formalen Übergangs vorweggenommen, und der Beweis für die Regel besteht darin, daß allgemein das Verfahren angegeben wird, durch welches in jedem einzelnen Fall jener Übergang gemäß den Grundregeln zu vollziehen ist. Regel I: Ist A ∨ A eine beweisbare Formel, so gilt dasselbe für A. Der Beweis ergibt sich unmittelbar aus Axiom a). Durch Einsetzung in a) erhält man: A ∨ A → A. Da ferner A ∨ A beweisbar ist, so liefert das Schlußschema die Formel A. Regel II: Ist A eine beweisbare Formel und B eine beliebige andere, so ist auch A ∨ B eine beweisbare Formel. Diese Regel ergibt sich in derselben Weise aus dem Axiom b) wie Regel I aus a). Ebenso entsprechen den Axiomen c), d) die Regeln III und IV, wie überhaupt zu jeder Formel, die eine Folgebeziehung ausdrückt, auch eine entsprechende Regel gehört: Regel III: Ist A ∨ B eine beweisbare Formel, so gilt dasselbe für B ∨ A. Regel IV: Ist A → B eine beweisbare Formel und C eine beliebige andere Formel, so ist auch CA → CB eine beweisbare Formel. Formel (1 ): (X → Y ) → [(Z → X) → (Z → Y )]. Beweis: (X → Y ) → [ZX → ZY ] entsteht durch Einsetzung von Z für Z aus Axiom d). Das ist aber schon die Formel (1), wenn wir die Abkürzung → durch ihre Bedeutung ersetzen. Regel V: Sind A → B und B → C beweisbare Formeln, so ist auch A → C eine beweisbare Formel. Diese Regel entspricht der Formel (1). Man beweist sie, indem man in (1) für X, Y , Z bezüglich B, C, A einsetzt und dann zweimal das Schlußschema anwendet. Formel (2 ): X ∨ X. Beweis: X → X ∨ X [durch Einsetzung von X für Y in b)], X ∨ X → X [nach a)],
24
832
25
Appendices
X → X [nach Regel V]. Die letzte Formel ist eine abgekürzte Schreibweise für X ∨ X. Formel (3 ): X ∨ X. Diese Formel ergibt sich aus (2) durch Anwendung der Regel III. X → X.
Formel (4 ):
5
Beweis: (4) ist eine Abkürzung für X X, und diese Formel geht aus (3) hervor, indem man X für X einsetzt. X → X.
Formel (5 ): Beweis:
X→X
[durch Einsetzung in (4)],
XX → XX
[nach Regel IV],
XX
[wegen (3) und Regel β)],
10
XX [nach Regel III]. Das letzte ist die Formel (5). Formel (6 ): (X → Y ) → (Y → X). Beweis:
26
Y →Y
[Formel (4)],
XY → X Y
[Regel IV],
XY →Y X
[Einsetzung in c)],
XY → Y X [Regel V]. Das ist die gesuchte Formel. Regel VI: Tritt ein Ausdruck A als Bestandteil in einer Aussagenverbindung auf, die in diesem Sinne mit Φ(A) bezeichnet werden möge, und sind A → B und B → A beweisbare Formeln, so sind auch Φ(A) → Φ(B) und Φ(B) → Φ(A) beweisbare Formeln. — Durch die Form von A und durch den Gesamtausdruck ist übrigens noch nicht eindeutig bestimmt, was Φ(A) bedeuten soll. Der Ausdruck X → XY kann z. B. in dreierlei Sinne als Φ(X) bezeichnet werden, da für Φ(A) jeder der drei Ausdrücke A → XY , X → AY , A → AY genommen werden kann. Die Regel VI trifft für jede mögliche Definition von Φ(A) zu. Diese Regel läßt sich auch so aussprechen: Zwei Ausdrücke, die in gegenseitiger Folgebeziehung stehen, dürfen in einer beweisbaren Formel für einander eingesetzt werden. Beweis: Es genügt, die Regel für den Fall zu beweisen, daß A nur einmal in Φ(A) vorkommt, und daß Φ(A) eine der Formen A, CA, AC hat. Die allgemeine Regel läßt sich durch mehrfache Anwendung dieser einfachen Regel gewinnen, indem man Φ von innen heraus aufbaut. Für jeden Teilausdruck Φ von Φ erhält man nämlich sukzessive Φ (B) → Φ (A) und Φ (A) → Φ (B). Es seien also A → B und B → A schon bewiesen. Wir beweisen dann: α) A → B und B → A. Man erhält diese beiden Formeln, indem man zunächst durch Einsetzung in Formel (6)
15
20
25
30
35
40
Grundzüge der theoretischen Logik
833
(A → B) → (B → A), (B → A) → (A → B)
und
5
10
beweist, und benutzt, daß A → B und B → A schon bewiesen sind. β) CA → CB; CB → CA. Beide Formeln erhält man aus A → B bzw. B → A durch Anwendung der Regel IV. γ) AC → BC; BC → AC. Dieser Fall läßt sich auf β) zurückführen, indem man mehrmals das Axiom c) und die Regel V anwendet. Als Anwendung von Regel VI und Axiom c) ergibt sich die Kommutativität des Produktes. Da man nämlich durch Einsetzung in c) erhält A∨B→ B∨A
15
20
25
30
35
und
B ∨ A → A ∨ B,
so darf in jeder Aussagenverbindung für ein Produkt A ∨ B immer B ∨ A eingesetzt werden. Desgleichen ergibt sich aus Formel (4) und (5) und der Regel VI, daß man A durch A ersetzen darf und umgekehrt. Formel (7 ): X & Y → X ∨ Y . Beweis: X & Y ist eine Abkürzung für X Y . Die Formel X Y → X Y entsteht durch Einsetzung aus X → X. Ebenso gewinnt man aus X → X die folgende Formel: Formel (8 ): X ∨ Y → X & Y . Formel (9 ): X ∨ Y → X & Y . Formel (10 ): X & Y → X ∨ Y . Beweis: Die beiden formeln (9) und (10) schreiben sich ohne Abkürzung X ∨Y →X ∨Y
und
X ∨Y →X ∨Y.
Sie entstehen aus X ∨ Y → X ∨ Y , indem nach Regel VI auf der rechten bzw. linken Seite X durch X und Y durch Y ersetzt wird. Die Formeln (7), (8) und (9), (10) liefern uns in Verbindung mit Regel VI die früher inhaltlich abgeleitete Regel a3), S. 9. Eine weitere Anwendung der Regel VI ist die folgende: Da nach Axiom a) X ∨ X → X gilt, und da man aus Axiom b) durch Einsetzung | X → X ∨ X erhält, so darf ein Ausdruck von der Form A∨A immer durch A ersetzt werden und umgekehrt. Formel (11 ): X & Y → Y & X. Beweis: X Y → Y X entsteht aus X Y → X Y , indem man die Regel von der Kommutativität des Produktes anwendet. Formel (12 ): X & Y → X. X → XY [nach Axiom b], Beweis: XY → X
[nach Formel (6)],
27
834
Appendices
X & Y → X, X & Y → X. Formel (13 ): X & Y → Y . Der Beweis ergibt sich aus (11) und (12). Formel (14 ): X(Y Z) → Y (XZ). Beweis: Z → XZ Y Z → Y (XZ) X(Y Z) → X(Y (XZ)) X(Y Z) → (Y (XZ))X ∗ X → ZX XZ → Y (XZ)
∗
und
∗∗
5
[aus Axiom b) durch Vertauschung der Faktoren], [Regel IV], [Regel IV], [Kommutativität des Produktes], [aus Axiom b) durch Vertauschung der Faktoren], [Einsetzung in die vorige Formel], [Regel V], [Regel IV],
X → Y (XZ) (Y (XZ))X → (Y (XZ))(Y (XZ)) (Y (XZ))X → Y (XZ)∗∗ . (Ersetzung von A ∨ A durch A.) ergeben nach Regel V:
10
15
20
X(Y Z) → Y (XZ).
28
Formel (15 ): X(Y Z) → (XY )Z. Beweis: X(Y Z) → X(ZY ) [kommutatives Gesetz], X(ZY ) → Z(XY ) [Formel (14)], X(Y Z) → Z(XY ) [Regel V]. Daraus entsteht Formel (15) durch Anwendung des kommutativen Gesetzes. Formel (16 ): (XY )Z → X(Y Z). Beweis: Z(Y X) → (ZY )X [Einsetzung in (15)]. Unter Anwendung des kommutativen Gesetzes kann Z(Y X) durch (XY )Z und (ZY )X durch X(Y Z) ersetzt werden. Aus Formel (15) und (16) und Regel VI ergibt sich, daß nicht nur die Reihenfolge, sondern auch die Zusammenfassung der Faktoren gleichgültig ist. Wir haben also auch das assoziative Gesetz für das Produkt abgeleitet. Formel (17 ): X & (Y & Z) → (X & Y ) & Z, (X & Y ) & Z → X & (Y & Z). Beweis:
30
35
X & (Y & Z) ist eine Abkürzung für X Y Z, (X & Y ) & Z eine
solche für X Y Z. Beide Ausdrücke sind aber nach unseren bisherigen Regeln äquivalent und dürfen beliebig füreinander eingesetzt werden. Formel (18 ): X → (Y → X & Y ). Beweis:
25
(X Y )X Y
[Einsetzung in (3)].
40
Grundzüge der theoretischen Logik
5
10
15
20
25
30
35
40
835
X(Y X Y ) entsteht daraus durch anderes Zusammenfassen der Faktoren. Dies ist die gesuchte Formel. Regel VII: A → (B → C) ist durch B → (A → C) und (A & B) → C ersetzbar. Der Beweis ergibt sich sofort aus unseren Regeln, falls man die Abkürzungen → und & durch ihre Bedeutung ersetzt. Regel VIII: A → (A → B) kann durch A → B ersetzt werden. Beweis: A(AB) kann durch (A A)B oder durch AB ersetzt werden. Formel (19 ): X(Y & Z) → XY & XZ. Beweis: Y &Z → Y [Formel (12)], X(Y & Z) → XY [nach Regel IV]. Ebenso erhält man aus Formel (13): X(Y & Z) → XZ, XY → (XZ → XY & XZ) [Formel (18)], X(Y & Z) → (XZ → XY & XZ) [nach Regel V], XZ → (X(Y & Z) → XY & XZ) [nach Regel VII], X(Y & Z) → (X(Y & Z) → XY & XZ) [nach Regel V], X(Y & Z) → XY & XZ [Regel VIII]. Formel (20 ): XY & XZ → X(Y & Z). Beweis: Y → (Z → Y & Z) (Z → Y & Z) → (XZ → X(Y & Z)) Y → (XZ → X(Y & Z)) XZ → (Y → X(Y & Z)) (Y → X(Y & Z)) → [XY → X(X(Y & Z))]
[Formel (18)], [Axiom d)], [Regel V], [Regel VII], [Einsetzung in Axiom d)], XZ → [XY → X(X(Y & Z))] [Regel V], X(X(Y &Z)) kann durch (XX)(Y &Z) und weiter durch X(Y &Z) ersetzt werden. XZ → (XY → X(Y & Z)). Daraus ergibt sich die obige Formel nach Regel VII. Aus Formel (19) und (20) zusammen mit Regel VI erhält man die Ableitung des Distributivgesetzes. Ein weiteres Ableiten von Formeln und Regeln erweist sich als unnötig. Es zeigte sich nämlich, daß die Regeln a1)–a4), b1)–b3), die wir früher aufgestellt hatten, sich aus den Axiomen als abgeleitete Regeln gewinnen lassen. Daraus folgt, daß alle die Bemerkungen, die wir früher im Anschluß an diese Regeln machten, z. B. die, die das Prinzip der Dualität und die Normalform betrafen, sich auch axiomatisch wiedergewinnen lassen. Demnach braucht man, um die Beweisbarkeit einer Formel zu zeigen, nicht jedesmal bis auf die Axiome zurückzugehen. Denn eine Aussagenformel ist dann und nur dann aus den Axiomen beweisbar, wenn in der zugehörigen konjunktiven Normalform jeder Summand zwei Faktoren enthält, von denen der eine das Gegenteil des anderen ist.
29
836
Appendices
§ 12. Die Widerspruchsfreiheit des Axiomensystems.
30
Die axiomatische Einführung des Aussagenkalküls macht es uns möglich, auf den Aussagenkalkül die Fragestellungen und Betrachtungen, die der axiomatischen Methode eigentümlich sind, anzuwenden. Die wichtigsten der entstehenden Fragen sind die nach der Widerspruchsfreiheit, Unabhängigkeit und Vollständigkeit des Axiomensystems. Wir wollen uns zunächst mit der Widerspruchsfreiheit der Axiome befassen. Die Frage nach der Widerspruchsfreiheit kann hier in einem übertragenen Sinne gestellt werden. Wir wollen die Axiome widerspruchsfrei nennen, wenn es unmöglich ist, mit Hilfe des Kalküls zwei Aussagenverbindungen abzuleiten, die in der Beziehung des Gegenteils zueinander stehen, die man also aus dem Aussagenpaar X, X erhält, wenn man X beide Male in gleicher Weise ersetzt. Die angegebene Definition der Widerspruchsfreiheit macht eine Erläuterung notwendig. Es wird hier scheinbar ein bestimmtes logisches Prinzip, nämlich der Satz vom Widerspruch, vor den anderen Prinzipien ausgezeichnet. In Wirklichkeit ist es aber so, daß das Auftreten eines formalen Widerspruchs, d. h. die Beweisbarkeit zweier Formeln A, A den ganzen Kalkül zur Bedeutungslosigkeit verurteilen würde; denn wir hatten schon früher bemerkt, daß, wenn zwei Aussagen von der Form A und A beweisbar sind, für jede beliebige andere Aussage dasselbe gelten würde. Die Widerspruchsfreiheit des Kalküls im Sinne der Definition ist also gleichbedeutend damit, daß nicht jede beliebige Formel beweisbar ist. Um die Widerspruchsfreiheit des Kalküls einzusehen, verfahren wir in folgender Weise: Wir fassen die Aussagezeichen X, Y , Z, . . . als arithmetische Variable auf, für welche nur die Werte 0, 1 in Betracht kommen. X ∨ Y deuten wir als das arithmetische Produkt, und X erklären wir so, daß 0 gleich 1 und 1 gleich 0 ist. Auf Grund dieser Interpretation stellt jede Aussagenverbindung eine arithmetische Funktion der Grundaussagen dar, welche nur die Werte 0 oder 1 haben kann. Ist diese Funktion identisch gleich 0, so wollen wir der Kürze halber auch von dem symbolischen Ausdruck sagen, daß er identisch gleich 0 ist. An Hand der gegebenen Deutung können wir nun eine gemeinsame Eigenschaft aller derjenigen Formeln angeben, die sich aus unseren Axiomen ableiten lassen. Diese besteht darin, daß auf Grund der arithmetischen Interpretation die Formeln für jedes in Betracht kommende Wertsystem der Variablen den Wert 0 ergeben, daß sie also identisch gleich 0 sind. Daß diese Eigenschaft zunächst den Axiomen a)–d) zukommt, machen wir uns folgendermaßen klar: Wir stellen durch Probieren fest, daß X ∨X immer den Wert 0 hat. Daraus folgt, daß auch X ∨ X ∨ X [Axiom a)] stets gleich 0 ist, weil X ∨ X immer denselben Wert hat wie X. — Ferner hat X(XY ) [Axiom b)] denselben Wert wie (X ∨ X)Y wegen der Assoziativität des arithmetischen Produktes. Es ist also stets 0, weil 0 ∨ Y stets gleich 0 ist. Da Y ∨ X stets den gleichen Wert hat wie X ∨ Y , so ist X ∨ Y ∨ (Y ∨ X) als Spezialfall von XX stets gleich 0.
5
10
15
20
25
30
35
40
45
Grundzüge der theoretischen Logik
5
10
15
20
837
Formel c) ergibt also stets den Wert 0. Endlich gilt dasselbe für die Formel d): Für Z = 0 ist nämlich ein Faktor 0 und für Z = 1 hat Z ∨ X denselben Wert wie X, Z ∨ Y denselben Wert wie Y , so daß die ganze Formel denselben Wert ergibt wie XY XY , was wieder ein Spezialfall von XX ist. Die Formeln der vier Axiome haben also in der Tat alle die genannte Eigenschaft. Bei der Anwendung der beiden in Betracht kommenden Regeln für die Ableitung neuer Formeln, nämlich der Einsetzungsregel und des Schlußschemas bleibt aber diese Eigenschaft immer erhalten. | Denn was die erste Regel betrifft, so ist klar, daß durch Einsetzen eines Ausdrucks an Stelle einer Variablen der Wertevorrat für die Variablen jedenfalls nicht erweitert werden kann. Und wenn wir mit Hilfe der zweiten Regel aus zwei Formeln A und AB die Formel B ableiten, so überträgt sich die Eigenschaft, immer den Wert 0 zu liefern, von jenen beiden Formeln auf die abgeleitete Formel; denn da die Formel A immer den Wert 0 ergibt, so hat A immer den Wert 1, also hat AB denselben Wert wie B, und hiernach hat B ebenso wie AB immer den Wert 0. Wir sehen somit, daß tatsächlich mit Hilfe unseres Kalküls nur solche Formeln erhalten werden, die bei der arithmetischen Deutung immer den Wert 0 liefern. Indem wir dies feststellen, sind wir aber schon am Ende unseres Nachweises. Denn offenbar können zwei Formeln, die dadurch aus X und X hervorgehen, daß man für X beide Male dieselbe Aussagenverknüpfung einsetzt, nicht beide die Eigenschaft besitzen, immer gleich 0 zu sein; vielmehr wenn die eine immer den Wert 0 besitzt, so hat die andere immer den Wert 1. § 13. Die Unabhängigkeit und Vollständigkeit des Systems.
25
30
35
An die Frage der Widerspruchsfreiheit, die wir für das Axiomensystem bejahend beantworten konnten, schließt sich die weitere Frage an, ob die Axiome alle unabhängig voneinander sind oder ob man nicht das eine oder das andere dieser Axiome entbehren kann1 . Die Antwort lautet, daß das Axiomensystem tatsächlich der Forderung der Unabhängigkeit genügt. Wir zeigen zunächst, daß die Formel a) X ∨ X ∨ X nicht aus den übrigen Axiomen abgeleitet werden kann, und zwar auch dann nicht, wenn man die Formel X ∨ X (oder auch X ∨ X) als Axiome hinzunimmt, so daß also die Formel a) in dem axiomatischen System nicht durch die einfachere XX ersetzt werden kann. Der Beweis geschieht wieder mit Hilfe einer arithmetischen Interpretation. Wir nehmen als Werte für die Variablen X, Y , Z, . . . die Restklassen 0, 1, 2 modulo 4. Das Zeichen „∨“ soll wieder die gewöhnliche Multiplikation darstel1 Diese Frage der Unabhängigkeit des Axiomensystems ist ebenfalls in der S. 23 zitierten Arbeit von P. Bernays, Axiomatische Untersuchung Bernays 1926 usw. gelöst worden.
31
838
32
Appendices
len, und X erklären wir durch die Festsetzungen: 0 bedeutet 1, 1 bedeutet 0, 2 bedeutet 2. Man kann nun verifizieren, daß die Formeln X ∨ X, b), c), d) bei der gegebenen Deutung der Variablen immer die Restklasse 0 ergeben, und diese Eigenschaft überträgt sich bei der Anwendung der beiden Regeln auf alle aus jenen 4 Formeln abgeleiteten Formeln, was man auf gleiche Weise wie vorher beim Beweise der Widerspruchsfreiheit | einsieht. Wäre daher die Formel a) aus b), c), d) und X ∨ X mit Hilfe der Regeln ableitbar, so müßte XX ∨ X für jeden zulässigen Wert von X die Restklasse 0 ergeben. Dies ist aber nicht der Fall. Denn setzen wir für X den Wert 2 ein, dann ergibt sich:
5
10
2 ∨ 2 ∨ 2 = 0 ∨ 2 = 1 ∨ 2 = 2, also nicht der Wert 0. Die Unabhängigkeit des Axioms b) X ∨ (X ∨ Y ) von den übrigen Axiomen zeigen wir auf folgende Weise. Es werden wieder X, Y , Z als Variable betrachtet, die die Werte 0, 1, 2 annehmen können. Wir definieren aber jetzt die Verknüpfung ∨ für diese Variablen durch: 0 ∨ 0 = 0;
0 ∨ 1 = 0;
0 ∨ 2 = 0;
1 ∨ 1 = 1;
1 ∨ 2 = 1;
15
2 ∨ 2 = 1,
und durch die Festsetzung, daß das kommutative Gesetz gelten soll. Ferner versteht man unter 0, 1, 2 bezüglich 1, 0, 2. Welche Werte man dann für die Variablen auch wählt, so ergeben die Formeln a), c), d) immer den Wert 0. Diese Eigenschaft bleibt für alle Formeln bestehen, die man mit Hilfe der beiden Regeln aus a), c), d) ableitet. Dagegen hat X(XY ) den Wert 1, falls man X = 2 und Y = 2 nimmt. Entsprechend zeigt man die Unabhängigkeit des Axioms c): XY (Y X). Man erklärt 0 durch 1, 1 durch 2, 2 durch 0. Ferner sei 0 ∨ 0 = 0 ∨ 1 = 0 ∨ 2 = 1 ∨ 0 = 2 ∨ 0 = 2 ∨ 1 = 0, und 1 ∨ 1 = 1, 1 ∨ 2 = 1, 2 ∨ 2 = 2. Man erkennt dann leicht, daß die Formeln a), b), d) bei beliebigen Ersetzungen der großen lateinischen Buchstaben durch die Zahlen 0, 1, 2 den Wert 0 ergeben, und daß diese Eigenschaft bei Ableitung neuer Formeln erhalten bleibt. Dagegen erhält c) den Wert 1, falls man X durch 2 und Y durch 1 ersetzt. Dieser Unabhängigkeitsbeweis liefert uns noch mehr. Er zeigt, daß das assoziative Gesetz X(Y Z)((XY )Z) nicht ohne Benutzung des Axioms c) bewiesen werden kann. Ersetzt man nämlich in dieser Formel X durch 1, Y durch 2, Z durch 1, so wird
20
25
30
35
1 ∨ (2 ∨ 1) ∨ ((1 ∨ 2) ∨ 1) = 0 ∨ 1 = 1 ∨ 1 = 1. Das assoziative Gesetz ist also ebenfalls von den Axiomen a), c) und d) unabhängig. Es bleibt noch übrig, die Unabhängigkeit des Axioms d) von den übrigen Axiomen zu zeigen. Dies gelingt durch das folgende System von Definitionen: Die Variablen X, Y , Z mögen die Werte 0, 1, 2, 3 annehmen können. Es sei
40
Grundzüge der theoretischen Logik
0 = 1,
5
10
15
20
25
30
1 = 0,
2 = 3,
839
3 = 0.
0∨0 = 0∨1 = 1∨0 = 0∨2 = 2∨0 = 0∨3 = 3∨0 = 2∨3 = 3∨2 = 0. 1 ∨ 1 = 1, 1 ∨ 2 = 2 ∨ 1 = 2, 1 ∨ 3 = 3 ∨ 1 = 3. 2 ∨ 2 = 2, 3 ∨ 3 = 3. Dann ergeben die Formeln a), b), c) immer den Wert 0 und ebenso alle daraus abgeleiteten Formeln. Dagegen erhält d) den Wert 2, wenn man X = 3, Y = 1 und Z = 2 nimmt. Wir haben damit die Unabhängigkeit der Axiome a)–d) gezeigt. Stellen wir nun die Frage nach der Vollständigkeit. Die Vollständigkeit eines Axiomensystems läßt sich in zweierlei Weise definieren. Einmal kann man darunter verstehen, daß sich aus dem Axiomensystem alle richtigen Formeln eines gewissen, inhaltlich zu charakterisierenden Gebietes gewinnen lassen. Man kann aber auch den Begriff der Vollständigkeit schärfer fassen, so daß ein Axiomensystem nur dann vollständig heißt, wenn durch die Hinzufügung einer bisher nicht ableitbaren Formel zu dem System der Grundformeln stets ein Widerspruch entsteht. Die Vollständigkeit im ersten Sinne würde hier besagen, daß man aus den Axiomen a)–d) alle immer richtigen Aussageformeln ableiten kann. Sie ist, wie wir schon sahen, erfüllt. Es besteht aber auch die Vollständigkeit in dem schärferen Sinne. Wir können uns davon auf die folgende Weise überzeugen: Sei A irgendeine aus den Axiomen nicht beweisbare Formel. B sei der zu A gehörige Ausdruck in der konjunktiven Normalform. Da B ebensowenig wie A beweisbar sein kann, so muß unter den Summanden von B ein einfaches Produkt C vorkommen, bei dem keine zwei Glieder einander entgegengesetzt sind. Setzt man in C für jedes unverneinte Aussagezeichen X, für jedes verneinte Aussagezeichen X ein, so erhält man ein Produkt der Form X ∨ X ∨ X ∨ . . . ∨ X, das nach den Regeln des Aussagenkalküls mit X äquivalent ist. Würde nun A als richtige Formel postuliert, so würde sich auch B und C und schließlich X als richtige Formel ergeben. Dann dürfte aber auch X für X eingesetzt werden, und wir erhielten einen Widerspruch. Es stellt sich also das System der betrachteten Axiome als vollständig heraus.
33
Zweites Kapitel.
34
Der Prädikaten- und Klassenkalkül. 35
40
Die bisherige Form des logischen Kalküls ist zur präzisen Darstellung derjenigen logischen Zusammenhänge ausreichend, bei denen die Aussagen als ungetrenntes Ganzes auftreten. Jedoch ist keine Rede davon, daß wir mit dem Aussagenkalkül für die Zwecke der Logik überhaupt auskommen. Nicht einmal jene einfachen Arten von Schlüssen, welche in der traditionellen Logik mit den Stichworten „barbara“, „celarent“, „darii“ usw. bezeichnet zu werden pflegen, lassen sich wiedergeben. Z. B. sucht man vergebens nach einer formalen Darstellung der logischen Beziehung, die in den drei Sätzen: „Alle Menschen sind sterblich;
840
Appendices
Cajus ist ein Mensch; folglich ist Cajus sterblich.“ zum Ausdruck kommt. Der Grund hierfür ist, daß es bei Schlüssen dieser Art nicht nur auf die Aussagen als Ganzes ankommt, sondern daß die innere logische Struktur der Aussagen, die sich sprachlich durch die Beziehung zwischen Subjekt und Prädikat ausdrückt, eine wesentliche Rolle spielt. Durch diese Erwägungen werden wir dazu veranlaßt, den Kalkül oder wenigstens seine inhaltliche Bedeutung zu ändern und den sogenannten Prädikatenkalkül einzuführen. § 1. Inhaltliche Umdeutung der Symbolik des Aussagenkalküls im Sinne des Prädikatenkalküls.
35
Wir gebrauchen im Prädikatenkalkül die gleichen logischen Zeichen wie im Aussagenkalkül. Unter X, Y , Z . . . sollen aber jetzt nicht mehr ganze Aussagen verstanden werden, sondern Prädikate. Z. B. kann X eine Bezeichnung sein für das Prädikat „ist sterblich“ oder „ist teilbar“ oder „hat eine Ursache“. Ist X irgendein Prädikat, z. B. „ist schön“, so soll unter X das gegenteilige Prädikat „ist nicht schön“ verstanden werden. Stellen X, Y bezüglich die Prädikate „ist vergänglich“, „besitzt Erkenntnis“ dar, so ist X & Y das Symbol für das Prädikat „ist vergänglich und besitzt Erkenntnis“, X ∨ Y das Symbol für „ist vergänglich oder besitzt Erkenntnis“. Die anderen logischen Zeichen können wir wieder als Abkürzungen benutzen. Prädikate sind nun, für sich genommen, weder wahr noch falsch. Behauptet man also von einer Formel X bzw. X ∨ Y , daß sie richtig ist, so muß das einen anderen Sinn haben als bisher. Wir wollen jetzt darunter verstehen, daß das Prädikat X bzw. X ∨ Y auf alle Gegenstände zutrifft. Damit sind die Bedeutungen für alle Zeichen im Prädikatenkalkül festgelegt. Sämtliche Formeln erhalten den Sinn von allgemeinen Urteilen. Um die gewöhnlichen allgemeinen Urteile, wie etwa „Alle Menschen sind sterblich“, zur Darstellung zu bringen, kann man zunächst ein solches Urteil in der Form aussprechen: „Alle Gegenstände sind nicht Menschen oder sterblich“. Führt man dann für das Prädikat „ist ein Mensch“ das Zeichen X, für „ist sterblich“ das Zeichen Y ein, so ergibt sich die symbolische Darstellung des Urteils durch: X ∨ Y . Entsprechend wird ein negatives allgemeines Urteil wie „Kein Mensch ist vollkommen“ durch die Formel: X ∨ Y dargestellt, worin X, Y bezüglich die Prädikate „ist ein Mensch“, „ist vollkommen“ bedeuten. Die genaue Interpretation der Formel X ∨ Y lautet: Alle Gegenstände sind nicht Menschen oder nicht vollkommen. Wir können nun wieder nach den immer richtigen Formeln fragen, d. h. nach denjenigen Formeln, die bei Einsetzung beliebiger Prädikate für die Variablen X, Y , . . . ein auf alle Gegenstände zutreffendes Prädikat ergeben. Es ist dann leicht einzusehen, daß bei der neuen Interpretation des Kalküls das System der immer richtigen Formeln genau dasselbe ist wie beim Aussagenkalkül.
5
10
15
20
25
30
35
40
Grundzüge der theoretischen Logik
5
10
15
20
25
30
35
841
Es gelten nämlich zunächst wieder die Äquivalenzen a1)–a4), die die Umformung der Ausdrücke zur konjunktiven Normalform ermöglichen. Ferner überzeugt man sich leicht, daß eine auf die Normalform gebrachte Formel dann und nur dann immer richtig ist, wenn jedes Konjunktionsglied einen Faktor X ∨ X enthält. Es kann also der Formalismus des Aussagenkalküls vollständig beibehalten werden; wir brauchen nur den Formeln eine andere Deutung zu geben. Neben der ursprünglichen Deutung und der Deutung im Sinne des Prädikatenkalküls gibt es für die Formeln des Aussagenkalküls noch eine dritte Interpretation. Es handelt sich hier aber gegenüber dem Prädikatenkalkül nicht wieder um die Einführung neuer logischer Beziehungen, sondern es wird nur den im Prädikatenkalkül ausdrückbaren Tatsachen eine veränderte Darstellung gegeben, welche für die Zwecke der Veranschaulichung Vorteile bietet. Diese Änderung der Darstellung besteht darin, daß wir die Prädikate, statt sie nach ihrem Inhalt zu bestimmen, durch ihren Umfang charakterisieren. Jedem Prädikat entspricht eine bestimmte „Klasse“ 1 von Gegenständen, indem man zu der Klasse alle Gegenstände rechnet, denen das Prädikat zu|kommt. Natürlich ist dabei der Fall nicht ausgeschlossen, daß eine Klasse keinen Gegenstand enthält. Die Klassen sollen jetzt als Objekte des Kalküls genommen werden, welchen wir dann in dieser Interpretation als „Klassenkalkül“ bezeichnen. Unter X ist die Klasse zu verstehen, die aus allen Gegenständen besteht, die nicht zur Klasse X gehören. X &Y bezeichnet den Durchschnitt der beiden Klassen X und Y , X ∨ Y die Vereinigungsklasse. X → Y und X ∼ Y können, wie früher, als Abkürzungen für X ∨ Y bzw. X ∨ Y & Y ∨ X aufgefaßt werden. Sagt man, eine Formel X ist richtig, so soll das heißen, daß X die Klasse ist, die aus allen Gegenständen besteht. Sämtliche Regeln des Prädikatenkalküls gelten dann bei diesen Festsetzungen auch unverändert für den Klassenkalkül. Die Richtigkeit von X → Y bedeutet nach dieser Interpretation, daß die X entsprechende Klasse eine Teilklasse der durch Y bestimmten Klasse ist; die Formel X ∼ Y ist dann und nur dann richtig, wenn die Klassen X und Y identisch sind. Das allgemeine Urteil „Alle Menschen sind sterblich“ läßt sich im Klassenkalkül so formulieren: „Die Vereinigungsklasse, gebildet aus der Klasse der Nicht-Menschen und der Sterblichen, umfaßt alle Gegenstände.“ Es hat dieselbe formale Darstellung wie beim Prädikatenkalkül. § 2. Vereinigung des Prädikatenkalküls mit dem Aussagenkalkül.
40
Die Schlüsse der traditionellen Logik lassen sich in dem Prädikatenkalkül noch nicht alle formalisieren, weil uns eine Darstellung der partikulären Urteile fehlt. Diese Darstellung wird erst erreicht durch die Verbindung des 1
In der Mathematik wendet man an Stelle der Ausdrücke „Klasse“ gewöhnlich das Wort „Menge“ an.
36
842
37
Appendices
Aussagenkalküls mit dem Prädikaten- oder Klassenkalkül. Wir gelangen zu dieser Vereinigung auf Grund der Erwägung, daß die Beziehungen des Prädikatenkalküls ja Aussagen darstellen, welche den Regeln des Aussagenkalküls unterworfen werden können. Dieser Gedanke führt zur Aufstellung eines kombinierten Kalküls, in dem die logischen Zeichen &, ∨, teils zur Verknüpfung von Aussagen und teils zur Verknüpfung von Prädikaten gebraucht werden. Es wäre dann aber zunächst zweifelhaft, ob eine Aussage X bedeutet, das Prädikat X trifft auf kein Ding zu, oder aber, es ist nicht richtig, daß X auf alle Dinge zutrifft. Bezeichnet z. B. X das Prädikat „schön sein“, so wäre X nach der einen Deutung zu lesen: Alle Dinge sind nicht-schön, und nach der anderen: Nicht alle Dinge sind schön. Wir können diese Schwierigkeit dadurch vermeiden, daß wir die Prädikate durch zwei senkrechte Striche abschließen. | X ∨ Y | würde dann bedeuten: das Prädikat X ∨ Y trifft auf alle Dinge zu, | X | ∨ | Y | dagegen: das Prädikat X trifft auf alle Dinge zu oder das Prädikat Y | trifft auf alle Dinge zu. Die beiden Aussagen, die eben zur Verwechslung Anlaß gaben, sind dann durch | X | und | X | unterschieden. Mit Hilfe des kombinierten Kalküls können dann die partikulären Aussagen dargestellt werden. Z. B. kann die Aussage „Einige Zahlen sind ungerade“ folgendermaßen umgeformt werden: „Es ist nicht wahr, daß alle Zahlen gerade sind.“ — Bezeichnet man das Prädikat „Zahl sein“ mit X, das Prädikat „gerade sein“ mit Y , so schreibt sich zunächst die Aussage „Alle Zahlen sind gerade“ symbolisch | X ∨ Y |. Das Gegenteil dieser Aussage wird also dargestellt durch | X ∨ Y |. Allgemein bezeichnet | X ∨ Y | die Aussage: es gibt Dinge, für die gleichzeitig X und Y zutrifft. In dem kombinierten Kalkül kommen eine Reihe von neuen immer richtigen Formeln zu den bisherigen hinzu. Derartige Formeln sind z. B.
5
10
15
20
25
{| X → Y | & | Y → Z |} → | X → Z | | X | & | Y | ∼ | X & Y |. Eine systematische Aufstellung und Untersuchung dieser Formeln soll, aus den am Schluß des nächsten Paragraphen angeführten Gründen, nicht gegeben werden.
30
§ 3. Systematische Ableitung der traditionellen Aristotelischen Schlüsse. Nachdem unser Kalkül die erforderliche Ergänzung erfahren hat, wollen wir jetzt zur Anwendung des Kalküls auf die Lehre von den logischen Schlüssen eingehen. Es handelt sich darum, zu erkennen, wie sich die klassischen Aristotelischen Schlußfiguren in unseren kombinierten Kalkül einordnen und wie sie sich vom Standpunkte dieses Kalküls systematisieren und begründen lassen. Die charakteristischen Eigenschaften der zu betrachtenden Schlüsse sind folgende: Sie bestehen aus drei Sätzen, von denen der dritte (der Schlußsatz) eine logische Folge der beiden ersten (der Prämissen) bildet. Jeder der drei Sätze hat eine der vier Formen:
35
40
Grundzüge der theoretischen Logik
5
10
„Alle A sind B“ (allgemein bejahendes Urteil). „Einige A sind B“ (partikulär bejahendes Urteil). „Kein A ist B“ (allgemein verneinendes Urteil). „Einige A sind nicht B“ (partikulär verneinendes Urteil). Zur abgekürzten Bezeichnung dieser vier Formen pflegt man die Vokale a, i, e, o (in der angegebenen Reihenfolge) zu verwenden. Als gemeinsames Zeichen für die vier Urteilsarten möge das Symbol AB dienen. In den drei Sätzen treten im ganzen drei Begriffe auf, der Subjektsbegriff (S), der Prädikatsbegriff (P ) und der Mittelbegriff (M ); und zwar hat der Schlußsatz die Form SP , und von den Prämissen enthält | die erste die Begriffe M und P , die zweite enthält M und S. Demnach ergeben sich folgende vier „Figuren“ von Schlüssen1 :
15
20
25
MP SM
PM SM
MP MS
PM MS
SP
SP
SP
SP
Da bei jeder der vier Schlußfiguren für einen jeden der drei Sätze des Schlusses je nach seiner Zugehörigkeit zu einer der vier Urteilsformen a, i, e, o vier Möglichkeiten bestehen, so wären, rein kombinatorisch betrachtet, 256 verschiedene Arten von Schlüssen denkbar. Jedoch wird durch die Forderung, daß der Schlußsatz aus den Prämissen folgen soll, die Anzahl der Möglichkeiten wesentlich beschränkt. Die Aristotelische Logik lehrt, daß 19 verschiedene Schlußarten zulässig sind. Man hat für diese Schlußarten dreisilbige Merkworte eingeführt, in denen die Vokale der Reihe nach die Urteilsformen angeben, zu welchen die drei Sätze des Schlusses gehören. Bei dieser Benennung erhalten wir folgende Übersicht: 1. Figur barbara celarent darii ferio
30
35
843
2. Figur cesare camestres festino baroco
3. Figur datisi feriso disamis bocardo darapti felapton
4. Figur calemes fresison dimatis bamalip fesapo
Diese Zusammenstellung von Schlüssen wollen wir nun an Hand des Prädikatenkalküls daraufhin prüfen, ob sie wirklich alle in Betracht kommenden Schlußarten enthält und ob alle darin aufgezählten Schlußweisen der Anforderung der logischen Bündigkeit genügen. Hierzu stellen wir nun zunächst die vier Formen a, i, e, o eines Urteils AB symbolisch dar. Bezeichnen X, Y die 1
Man beachte, daß die Festlegung der Reihenfolge von S und P im Schlußsatz keine Beschränkung der Allgemeinheit darstellt, da ja eine Schlußfigur mit P S als Schlußsatz stets aus einer der vier genannten Figuren durch bloße Änderung der Bezeichnung und Umstellung der Prämissen hervorgeht.
38
844
Appendices
Prädikate „ist A“, „ist B“, so lauten die symbolischen Bezeichnungen
39
| X ∨ Y |; | X ∨ Y |; | X ∨ Y |; | X ∨ Y |. Aus dieser Schreibweise ergeben sich ohne weiteres die auf die betrachteten Urteilsformen bezüglichen traditionellen Regeln über die Entgegensetzung (Opposition) und die Umkehrung. Von den vier Urteilen ist nämlich das letzte als das Gegenteil des ersten, das zweite als das Gegenteil des dritten ausgedrückt. Ferner sind die beiden mittleren Formeln in bezug auf X und Y symmetrisch, so daß sich das Urteil | „Einige A sind B“ als gleichbedeutend erweist mit „Einige B sind A“ und ebenso das Urteil „Kein A ist B“ als gleichbedeutend mit „Kein B ist A“. Dagegen ist bei den Formen a und o keine solche Umkehrung möglich. Wir wenden jetzt diese Darstellungsweise der vier Urteilsformen bei den Schlüssen an, indem wir für die Prädikate „ist S“, „ist M “, „ist P “ die Zeichen X, Y , Z einführen. Jeder Schluß besteht dann aus drei Formeln. Die erste Prämisse wird dargestellt durch eine der vier Formen: | Y ∨ Z |; | Y ∨ Z |; | Z ∨ Y |; | Z ∨ Y | bzw. durch deren logisches Gegenteil. Bei der zweiten Prämisse hat man entsprechend eine der Formen: | Y ∨ X |; | Y ∨ X |; | X ∨ Y |; | X ∨ Y | oder deren Gegenteil. Beim Schlußsatz hat man, negiert oder unnegiert, eine der beiden Formen: | X ∨ Z |; | X ∨ Z |. (Man beachte, daß X, Y und Z unnegiert nur als zweites Glied eines Produktes auftreten können.) Zu diesen formalen Bedingungen tritt nun noch die Forderung, daß die dritte Formel eine Folge der beiden ersten sein soll, in dem Sinne, daß beim Einsetzen bestimmter Prädikate für X, Y , Z die beiden ersten Formeln nicht erfüllt sein können, ohne daß auch die dritte gültig ist. Es kommt jetzt darauf an, zu untersuchen, wie durch diese Forderung die Mannigfaltigkeit der zulässigen Formelkombinationen beschränkt wird. Für diese Diskussion ist die Bemerkung nützlich, daß wir, ohne an der Richtigkeit einer Formel etwas zu ändern, zwei Glieder eines Produktes miteinander vertauschen können. Ferner ist die Reihenfolge der Prämissen unwesentlich, und wegen der Allgemeinheit, mit der die Schlußfolgerung gelten soll, macht es nichts aus, ob ein Prädikat mit U oder U bezeichnet wird. Auf Grund dieser Tatsachen können wir jedes Paar von Prämissen auf eine von den folgenden sechs Normalformen zurückführen: I. | U ∨ V |
III. | U ∨ V |
V. | U ∨ V |
|V ∨ W |
|V ∨ W |
|V ∨ W |
II. | U ∨ V |
IV. | U ∨ V |
VI. | U ∨ V |
|V ∨ W |
|V ∨ W |
|V ∨ W |
Das im Schlußsatz stehende Produkt nimmt eine von den Formen | U ∨ W |; | U ∨ W |; | U ∨ W |; | U ∨ W |
5
10
15
20
25
30
35
40
Grundzüge der theoretischen Logik
5
10
15
20
25
30
an (negiert oder unnegiert). Von der neuen Schreibweise gelangt man zu der früheren dadurch zurück, daß man für V entweder Y oder Y substituiert, ferner U , W oder aber W , U einem der Paare X, Z; X, Z; X, Z; X, Z gleichsetzt und dann alle möglichen Vertauschungen von Produktgliedern in Betracht zieht, welche (bei geeigneter Reihenfolge der Prämissen) auf eines der formal zulässigen Dreiformelsysteme führen. Prüfen wir nun jene sechs Paare von Prämissen I–VI daraufhin, was aus ihnen gefolgert werden kann, so finden wir zunächst, daß sich aus I., IV., V. kein Schluß der verlangten Art ergibt. I. ist nämlich bei ganz beliebigem U , W erfüllt, falls das Prädikat V auf kein Ding zutrifft. IV. ist erfüllt, falls V auf alle Dinge zutrifft, sofern nur U überhaupt für ein Ding zutrifft, und V. ist für beliebige U und W , die überhaupt für ein Ding zutreffen, erfüllt, falls V für alle Dinge zutrifft. Auch die Prämissen VI. liefern keinen der in Betracht kommenden Schlußsätze. Denn damit sie, durch geeignete Wahl von V , befriedigt werden können, genügt es, daß U und W für je ein Ding zutreffen. Die genannten Bedingungen sind jedoch mit der Falschheit eines jeden der in Frage stehenden Schlußsätze vereinbar. Demnach kommen für unsere Schlüsse einzig die Fälle II. und III. in Betracht. Die beiden Prämissen von II. | U ∨ V | und | V ∨ W | liefern, wenn man die Abkürzung → einführt, und die erste der auf S. 37 angegebenen Formeln benutzt, unmittelbar die Beziehung | U ∨ W |. Ferner ist auch | U ∨ W | die stärkste Folgerung, die aus den beiden Prämissen gezogen werden kann, da bei Gültigkeit dieser Beziehung die beiden Prämissen befriedigt werden, falls man V gleich W setzt. Bei III. bedeutet die erste Prämisse | U ∨ V |, daß es Dinge gibt (d. h. wenigstens ein Ding), auf die gleichzeitig U und V zutrifft. Die zweite Prämisse, | V ∨ W |, bedeutet, daß jedes Ding, das die Eigenschaft V hat, auch die Eigenschaft W besitzt. Daraus folgt, daß es Dinge gibt, für die gleichzeitig U und W zutrifft, oder daß | U ∨ W | eine richtige Formel ist. Ist umgekehrt die Formel | U W | richtig, so werden die Prämissen III. befriedigt, indem man V gleich W setzt. Somit ergibt sich, daß die von uns betrachteten Schlüsse sich alle auf zwei Hauptformen zurückführen lassen, nämlich:
35
(A)
|U ∨ V | |V ∨ W | |U ∨ W |
40
845
(B)
40
|U ∨ V | |V ∨ W | |U ∨ W |
Es handelt sich nun noch darum, von diesen beiden Hauptformen vermittels der verschiedenen zulässigen Transformationen wieder zu den | früheren Darstellungen überzugehen, an Hand derer wir die verschiedenen Aristotelischen Schlußarten unterscheiden können. Dabei müssen wir die formalen Beschränkungen der Schlüsse berücksichtigen, gemäß denen die unverneinten Prädikate X, Y , Z nur an zweiter Stelle in einem Produkt auftreten und Y
41
846
Appendices
niemals im Schlußsatz vorkommt. Ferner ist zu beachten, daß bei der Hauptform (A) die Vertauschung von U mit W keine neuen Schlußarten liefert. Demnach erhalten wir alle aus der Hauptform (A) entspringenden Schlußweisen durch die Substitutionen: U = X, U = X, U = X,
V =Y, V =Y, V =Y,
W = Z; W = Z; W = Z.
5
Von diesen führt (bei geeignet gewählter Reihenfolge der Prämissen sowie der Produktglieder) die erste auf die Schlüsse camestres und calemes, die zweite auf celarent und cesare, die dritte auf barbara. Für die Hauptform (B) erhalten wir die verschiedenen Schlußarten aus den Substitutionen: 1) U = X, 3) U = X, 5) U = Z,
42
V =Y, V =Y, V =Y,
W = Z; W = Z; W = X.
2) U = X, 4) U = Z,
V =Y, V =Y,
10
W = Z; W = X;
Die erste Substitution ergibt die Schlüsse ferio, festino, feriso, fresison, die zweite darii und datisi, die dritte baroco, die vierte disamis und dimatis, die fünfte bocardo. Die angestellte Überlegung zeigt uns, daß es von Schlüssen der verlangten Art 15 verschiedene Formen gibt. Diese gehören alle zu den Aristotelischen Schlüssen, so daß die klassische Zusammenstellung der Schlußformen alle möglichen Fälle erschöpft. Jedoch haben wir nicht sämtliche der Aristotelischen Schlußweisen bei unserem Verfahren wiedergefunden. Vielmehr fehlen in der erhaltenen Übersicht die vier Schlußarten: darapti, bamalip, felapton, fesapo. Diese Diskrepanz rührt davon her, daß die seit Aristoteles traditionell gewordene Deutung der positiven allgemeinen Sätze („Alle A sind B“) mit unserer Interpretation der Formeln | X ∨ Y | nicht vollkommen in Einklang steht. Nach Aristoteles gilt nämlich eine Aussage „Alle A sind B“ nur dann als richtig, wenn es Gegenstände gibt, welche A sind. Unsere Abweichung von Aristoteles in diesem Punkte wird durch die Rücksicht auf die mathematischen Anwendungen der Logik gerechtfertigt, bei denen die Zugrundelegung der Aristotelischen Auffassung unzweckmäßig wäre. Wir schließen damit die Bemerkungen über den Prädikaten- und Klassenkalkül ab. Es lassen sich zwar eine Anzahl interessanter Fragestellungen angeben; z. B. kann man fragen, welche Formeln des kom|binierten Kalküls immer richtige Aussagen darstellen. Ein näheres Eingehen auf diese Probleme wollen wir uns aber versagen, da diese sich besser in dem im folgenden zu besprechenden Funktionenkalkül formulieren und behandeln lassen. Wir verzichten auch auf eine axiomatische Behandlung des Prädikatenkalküls. Der Prädikaten- und Klassenkalkül bildet überhaupt nur eine Vorbereitung für den Funktionenkalkül und wird durch dessen Einführung überflüssig, so daß wir später auf die in diesem Abschnitt angestellten Überlegungen nicht mehr zurückzukommen
15
20
25
30
35
40
Grundzüge der theoretischen Logik
847
brauchen. Dagegen bleibt der Aussagenkalkül als unentbehrliche Grundlage aller weiteren Untersuchungen bestehen. Drittes Kapitel.
43
Der engere Funktionenkalkül. § 1. Unzulänglichkeit des bisherigen Kalküls.
5
10
15
20
25
30
35
40
Der kombinierte Kalkül ermöglichte eine systematischere Behandlung der logischen Fragen als die inhaltliche traditionelle Logik. Andererseits kann man aber sagen, daß in Hinsicht auf die Möglichkeit der logischen Folgerungen sich beide wesentlich gleich verhalten. Die komplizierteren Schlüsse, die im kombinierten Kalkül möglich sind, lassen sich auch durch mehrfache Anwendung der aristotelischen Schlußfiguren gewinnen. Nach der Meinung der früheren Logiker, die auch Kant teilte, war nun mit der aristotelischen Schlußlehre die Logik überhaupt erschöpft. Kant sagt1 : „Merkwürdig ist noch an ihr (der Logik), daß sie auch bis jetzt (seit Aristoteles) keinen Schritt vorwärts hat tun können und also allem Anschein nach geschlossen und vollendet zu sein scheint.“ In Wirklichkeit ist es so, daß sich der aristotelische Formalismus schon bei ganz einfachen logischen Zusammenhängen als unzulänglich erweist. Insbesondere ist er prinzipiell unzureichend zur Behandlung der logischen Grundlagen der Mathematik. Er versagt nämlich überall da, wo es darauf ankommt, eine Beziehung zwischen mehreren Gegenständen zur symbolischen Darstellung zu bringen. Wir wollen das an einem einfachen Beispiel erläutern. Betrachten wir den Satz: „Wenn B zwischen A und C liegt, so liegt B auch zwischen C und A.“ Diesen können wir zwar im gewöhnlichen Aussagenkalkül in der Form X → Y aufschreiben; und dieselbe Darstellung erhält der Satz auch im Prädikatenkalkül. Im letzteren läßt er sich ja in folgender Weise formulieren: „Wenn ein geordnetes Punktetripel die Eigenschaft hat, daß der zweite Punkt zwischen dem ersten und dritten liegt, so besitzt es auch die Eigenschaft, daß der zweite Punkt zwischen dem dritten und ersten liegt.“ Jedoch kommt bei dieser Darstellung das logisch Wesentliche der Behauptung, nämlich die Symmetrie der Beziehung „Zwischen“ in bezug auf A und C gar nicht zum Ausdruck. Daher läßt sich diese Darstellung auch nicht dazu verwenden, um aus dem betrachteten Satze die sich aus ihm ergebenden mathematischen | Folgerungen abzuleiten. Hieran ändert sich auch nichts, wenn wir die Darstellungsweise des kombinierten Kalküls benutzen. Zur Verdeutlichung des hier vorliegenden Sachverhalts möge noch ein weiteres, übrigens nicht der Mathematik angehöriges Beispiel angeführt werden. Es ist gewiß eine logisch selbstverständliche Behauptung: „Wenn es einen Sohn gibt, so gibt es einen Vater“, und von einem logischen Kalkül, der uns befriedigt, können wir verlangen, daß er diese Selbstverständlichkeit in Evidenz 1
In der Vorrede zur 2. Ausgabe der „Kritik der reinen Vernunft“ Kant 1956 .
44
848
Appendices
setzt, in dem Sinne, daß der behauptete Zusammenhang vermittels der symbolischen Darstellung als Folge von einfachen, logischen Prinzipien kenntlich wird. Davon ist aber bei unserem bisherigen Kalkül keine Rede. Wir können hier zwar (unter Anwendung des kombinierten Kalküls) die betrachtete Behauptung symbolisch ausdrücken durch die Formel: | X | → | Y |, worin X, Y bezüglich die Prädikate „ist ein Sohn“, „ist ein Vater“ bedeuten. Doch vermag uns diese Formel gewiß nicht zur Einsicht in die Richtigkeit der Behauptung zu verhelfen, da sie ja bei anderer Einsetzung für X und Y auch falsche Sätze ausdrücken kann. Es kommt in der Formel nicht dasjenige zur Darstellung, worauf der logische Zusammenhang zwischen Vordersatz und Nachsatz beruht, daß nämlich die Prädikate des Sohn-Seins und des Vater-Seins eine Beziehung eines Gegenstandes zu einem anderen enthalten. Die entsprechende Sachlage findet sich bei fast allen komplizierteren Urteilen.
5
10
§ 2. Methodische Grundgedanken des Funktionenkalküls.
45
Da sich unser bisheriger Kalkül als ungenügend herausgestellt hat, so sind wir genötigt, nach einer neuen Art der logischen Symbolik zu suchen. Dazu kehren wir noch einmal zu dem Punkt unserer Betrachtungen zurück, an welchem wir zuerst über den Aussagenkalkül hinausgingen. Den entscheidenden Schritt bildete hier die Spaltung der Aussagen in Subjekt und Prädikat. Diese Zerlegung haben wir jedoch nicht vollkommen ausgenutzt, indem wir bei der Darstellung der Aussagen nur die Prädikate, nicht aber die Subjekte explizit bezeichneten. Der Grund für diese Beschränkung der Symbolik lag darin, daß wir bestrebt waren, hinsichtlich des Formalismus uns an den Aussagenkalkül anzuschließen. Lassen wir nun diesen Gesichtspunkt der Anlehnung an den Aussagenkalkül fallen, so bietet sich als naturgemäß das Verfahren dar, daß man in der Darstellung der Aussage die Gegenstände (Individuen) von den über sie ausgesagten Eigenschaften (Prädikaten) trennt und beide ausdrücklich bezeichnet. Das tun wir in der Weise, daß wir zur symbolischen Darstellung der Prädikate Funktionszeichen mit Leerstellen verwenden, wo dann in die Leerstellen die Bezeichnungen der Gegenstände einzusetzen sind. Z. B. kann das Funktionszeichen P ( ) das Prädikat „ist eine | Primzahl“ bezeichnen. P (5) ist dann die Darstellung der Aussage: „5 ist eine Primzahl“. Ist M ( ) die Bezeichnung für das Prädikat „Mensch sein“, so bedeutet M (Cajus): „Cajus ist ein Mensch.“ Wird ferner die Beziehung des kleineren zum größeren durch das Funktionszeichen mit zwei Leerstellen <( , ) ausgedrückt, so ist < (2, 3) die symbolische Darstellung der Aussage: „2 ist kleiner als 3.“ Ebenso wird die Aussage „B liegt zwischen A und C“ durch Z(A, B, C) dargestellt. Alle mathematischen Formeln stellen derartige Beziehungen zwischen zwei und mehr Größen dar. Z. B. entspricht der Formel: x + y = z ein dreigliedriges
15
20
25
30
35
40
Grundzüge der theoretischen Logik
5
10
15
20
25
30
35
40
849
Prädikat S(x, y, z). Die Richtigkeit von S(x, y, z) besagt, daß x, y, z durch die Beziehung x + y = z verbunden sind1 . Auf die in der neuen Weise dargestellten Aussagen lassen sich die Verknüpfungen des Aussagenkalküls anwenden. Z. B. wird das Gegenteil der Aussage P (5) durch P (5) ausgedrückt. Die Formel <(2, 3) & <(3, 7) → <(2, 7) stellt die Aussage dar: „Wenn 2 kleiner ist als 3 und 3 kleiner als 7, so ist 2 kleiner als 7.“ Es fehlt uns noch ein symbolischer Ausdruck für die Allgemeinheit von Aussagen. Um einen solchen zu gewinnen, führen wir nach dem Vorbilde der Mathematik neben den Zeichen für bestimmte Gegenstände (den Eigennamen) noch Variable x, y, z, . . . ein, mit denen wir die Leerstellen der Funktionszeichen ebenfalls ausfüllen können. Eine bestimmte Ausfüllung einer Leerstelle heißt ein Wert der betreffenden Variablen. Die Werte einer Variablen sind im allgemeinen auf bestimmte Gattungen von Gegenständen beschränkt, die durch die Bedeutung der Funktionszeichen bestimmt werden. Z. B. stellt sich die Grundbeziehung der elementaren Geometrie der Ebene: „der Punkt x liegt auf der Geraden y“, durch ein Funktionszeichen mit zwei Argumenten L(x, y) dar. Hier kommen als Werte für x nur Punkte, für y nur Geraden in Betracht. Setzt man in die Leerstellen der logischen Funktionen bestimmte Argumentwerte (d. h. Eigennamen von Individuen) ein, so ergeben sich bestimmte Aussagen, die richtig oder falsch sein können. Sind dagegen die Leerstellen von Funktionszeichen mit Variablen ausgefüllt, so wird dadurch zunächst kein bestimmtes Urteil dargestellt, sondern wir haben nur einen symbolischen Ausdruck, der von der betreffenden | Variablen abhängt. Wie man nun in der Algebra Buchstabenformeln schreibt, welche besagen, daß für beliebige Zahlenwerte, die man an Stelle der Variablen einsetzt, die entstehende Zahlengleichung richtig ist, so können wir auch im Logikkalkül verfahren. Eine Formel <(x, y) & <(y, z) → <(x, z) bedeutet dann, daß für ein beliebiges Zahlentripel x, y, z, für das die Beziehungen <(x, y) und <(y, z) bestehen, auch <(x, z) gültig ist. Wir haben damit bereits eine Darstellung für die allgemeinen Urteile gewonnen. Um aber die Allgemeinheit in Verbindung mit der Negation und den logischen Verknüpfungen &, ∨, → anwenden zu können, brauchen wir ein besonderes „Allzeichen“. Man würde sonst nicht wissen, ob P (x) bedeutet: „Für alle x ist P (x) der Fall“, oder: „Es ist nicht richtig, daß für alle x die Aussage P (x) gilt.“ Diese Darstellung der allgemeinen Urteile soll in der Weise geschehen, daß wir die zu der betreffenden logischen Funktion gehörige Variable in Klammern vor das Funktionszeichen setzen. 1 Es war bisher in der Logik üblich, nur die Funktionen mit einer Leerstelle als Prädikate, dagegen Funktionen mit mehreren Leerstellen als Relationen zu bezeichnen. Die Unterscheidung von Prädikaten- und Funktionskalkül beruht auf diesem Gebrauch. Wir gebrauchen hier das Wort Prädikat in ganz allgemeinem Sinne.
46
850
Appendices
(x)A(x) bedeutet also: Für alle x gilt A(x). Die beiden eben zur Verwechslung Anlaß gebenden Urteile sind dann durch (x)P (x) und (x)P (x) unterschieden. Aus Symmetriegründen führen wir gleichzeitig zur Darstellung der partikulären Urteile ein besonderes „Seinszeichen“ ein. (Ex)A(x) stellt das Urteil dar: „Es gibt ein x, für das A(x) gilt.“ Für All- und Seinszeichen gebrauchen wir auch den gemeinsamen Namen „Klammerzeichen“. Die zu einem Allzeichen oder Seinszeichen gehörige Variable nennen wir „gebundene Variable“. Sie spielt eine analoge Rolle wie die Integrationsvariable in der Mathematik; insbesondere ist die Benennung dieser Variablen gleichgültig. Zum Unterschied von den gebundenen Variablen nennen wir die anderen „freie Variable“. Bezüglich der Schreibweise ist zu bemerken, daß eine Formel, vor der ein Allzeichen oder Seinszeichen steht, in Klammern zu setzen ist, falls sie eines der Zeichen &, ∨, → enthält und nicht schon durch einen Negationsstrich zusammengefaßt ist. Ferner treffen wir der Übersichtlichkeit halber folgende Festsetzungen: Statt A(x) schreiben wir einfacher A(x), statt (x)A(x) schreiben wir einfacher (x)A(x), und statt (Ex)A(x) schreiben wir einfacher (Ex)A(x). Aus der Bedeutung des All- und des Seinszeichens ergeben sich die folgenden Äquivalenzen: (Ex)A(x) äq (x) A(x),
5
10
15
20
(Ex)A(x) äq (x)A(x), (Ex)A(x) äq (x)A(x), 47
(Ex) A(x) äq (x)A(x). Auf Grund dieser inhaltlichen Beziehung läßt sich das Seinszeichen durch das Allzeichen ersetzen und umgekehrt. Bei der Symbolik des Funktionenkalküls könnten wir also mit drei Verknüpfungen auskommen. Notwendig ist nur das Negationszeichen, ferner eines der drei Symbole &, ∨, →, und dann noch eines von den beiden Zeichen (x), (Ex). Bisher haben wir nur einzeln auftretende All- und Seinszeichen betrachtet. Zu wesentlich neuen logischen Gebilden werden wir geführt, wenn wir jetzt berücksichtigen, daß die All- und Seinszeichen kombiniert auftreten können. Diese Kombination ist schon möglich, falls wir nur Prädikate mit einer Leerstelle in Betracht ziehen; eine besondere Rolle spielt sie bei den mehrgliedrigen Prädikaten. Bei einem zweigliedrigen Prädikate A(x, y) z. B. haben wir die folgenden einfachsten Formen der Zusammensetzung:
25
30
35
(x)(y)A(x, y) „für alle x und für alle y besteht die Beziehung A(x, y)“; (Ex)(Ey)A(x, y) „es gibt ein x und ein y, für welche A(x, y) besteht“; (x)(Ey)A(x, y)
40
Grundzüge der theoretischen Logik
851
„zu jedem x gibt es ein y, so daß A(x, y) besteht“; (Ex)(y)A(x, y)
5
10
15
20
25
30
„es gibt ein x, welches zu jedem y in der Beziehung A(x, y) steht“. Um den Sinn der Zusammensetzung deutlicher zu machen, könnte man hier jedesmal noch eine Klammer einfügen, also z. B. schreiben: (x)[(y)A(x, y)] und (x)[(Ey)A(x, y)]. Da aber auch ohnedies kein Anlaß zu einem Mißverständnis vorliegt, pflegt man die Klammer fortzulassen. — Läßt man Kombinationen von drei und mehr Klammerzeichen zu, so hat man entsprechend eine größere Mannigfaltigkeit für die Zusammensetzung der All- und Seinszeichen. Aus der Bedeutung des Allzeichens geht hervor, daß in einem Ausdruck (x)(y)A(x, y) die beiden Allzeichen ohne Änderung des Sinns der Aussage vertauscht werden können. Dasselbe gilt von den beiden Seinszeichen in einem Ausdruck (Ex)(Ey)A(x, y). Dagegen ist bei (x)(Ey)A(x, y) die Reihenfolge der Zeichen (x), (Ey) wesentlich. Z. B. stellt der Ausdruck (x)(Ey) <(x, y) (wenn die Variablen x, y sich auf die reellen Zahlen als Definitionsbereich beziehen) einen richtigen Satz dar, nämlich: „Zu jeder Zahl x gibt es eine Zahl y derart, daß x kleiner ist als y“, d. h. „zu jeder Zahl gibt es eine größere“. Vertauscht man aber hier die Stellung der Zeichen (x) und (Ey), so entsteht (Ey)(x) <(x, y), und das ist der Ausdruck eines falschen Satzes, nämlich: „Es gibt eine Zahl y, welche größer ist als jede Zahl x.“ Durch die Vertauschung von (x) und (Ey) kommt also eine ganz andere Aussage zustande. Das logische Verhältnis hierbei ist so, daß auf Grund der (später abzuleitenden) Formel: (Ey)(x)A(x, y) → (x)(Ey)A(x, y) aus einem richtigen Satz von der Form (Ey)(x)A(x, y) auf (x)(Ey)A(x, y) geschlossen werden kann, aber nicht umgekehrt. § 3. Vorläufige Orientierung über den Gebrauch des Funktionenkalküls.
35
40
Ehe wir daran gehen, eine systematische Darstellung der Regeln zu geben, die zur Handhabung des Kalküls notwendig sind, soll die Behandlung einiger Beispiele dazu dienen, uns mit der Symbolik vertrauter zu machen. Zunächst zeigen wir, wie die Axiome, durch welche die Grundeigenschaften der natürlichen Zahlenreihe formuliert werden, sich im Funktionenkalkül symbolisch ausdrücken lassen. Diese Axiome lauten: 1. Zu jeder Zahl gibt es eine und nur eine nächstfolgende. 2. Es gibt keine Zahl, auf welche 1 unmittelbar folgt.
48
852
Appendices
3. Zu jeder von 1 verschiedenen Zahl gibt es eine und nur eine unmittelbar vorangehende. In diesen Sätzen kommen als individuelle Prädikate die Beziehungen der unmittelbaren Aufeinanderfolge und die der Verschiedenheit von Zahlen vor. Die Beziehung der Verschiedenheit tritt nicht nur in der Verbindung „von 1 verschieden“, sondern auch implizite in dem Ausdruck „nur eine Zahl“ auf; denn daß es „nur eine“ Zahl von einer gewissen Beschaffenheit gibt, bedeutet, daß es nicht zwei verschiedene solche Zahlen gibt. Die Verschiedenheit ist das Gegenteil der arithmetischen Gleichheit. Wir führen daher die Funktionen: =(x, y) und
49
F (x, y)
5
10
(„x ist gleich y“)
(„y folgt unmittelbar auf x“)
ein und können mit diesen Bezeichnungen die genannten Axiome folgendermaßen darstellen: 1. (x)(Ey){F (x, y) & (z) F (x, z) → =(y, z) }, d. h. „zu jedem x gibt es ein y, das auf x unmittelbar folgt, und das einem jeden z, welches auf x unmittelbar folgt, gleich ist“. 2. (Ex)F (x, 1), d. h. „es gibt kein x, auf welches 1 unmittelbar folgt“. 3. (x){=(x, 1) → (Ey)[F (y, x) & (z) F (z, x) → =(y, z) ]}, d. h. „zu jedem x, das von 1 verschieden ist, gibt es ein y, auf welches x unmittelbar folgt und welches einem jeden z, auf das x unmittelbar folgt, gleich ist“. Wir wollen uns ferner über die Methode der Beweisführungen im Funktionenkalkül an einigen einfachen Beispielen orientieren. Wir beginnen mit jenem Satze, dessen Unbeweisbarkeit im Prädikatenkalkül eine von den Tatsachen bildete, an denen wir uns die Unzulänglichkeit jenes Kalküls klargemacht haben. Der Satz lautete: „Wenn es einen Sohn gibt, so gibt es einen Vater.“ Der symbolische Ausdruck dieser Behauptung im Funktionenkalkül lautet zunächst: (Ex)S(x) → (Ex)V (x). Dabei bedeutet S(x): „x ist ein Sohn“, und V (x): „x ist ein Vater.“ Ein Beweis dieses Satzes ist nur möglich, wenn wir die vorkommenden Prädikate begrifflich zerlegen. Im begriff des Sohnes ist einerseits das Prädikat „männlich“ und andrerseits die Beziehung des Kindes zu den Eltern enthalten; im Begriff des Vaters die Beziehung zu Frau und Kind. Führen wir demgemäß für „x ist männlich“ das Zeichen M (x) ein und stellen wir die Beziehung „x und y sind die Eltern von z“ (oder genauer: „x und y als Mann und Frau haben z zum Kinde“) durch das Symbol K(x, y, z) dar, so können wir S(x) definieren durch: M (x) & (Eu)(Ev)K(u, v, x). („x ist ein Sohn“ bedeutet: „x ist männlich, und es gibt ein u und v derart, daß u als Mann und v als Frau die Eltern von x sind.“)
15
20
25
30
35
40
Grundzüge der theoretischen Logik
853
Ebenso wird V (x) definiert durch: (Ey)(Ez)K(x, y, z).
5
(„x ist ein Vater“ bedeutet: „Es gibt ein y und ein z derart, daß x und y als Mann und Frau die Eltern von z sind.“) Setzen wir die erhaltenen Ausdrücke für S(x) und V (x) ein, so nimmt die betrachtete Behauptung die Form an: (Ex)[M (x) & (Eu)(Ev)K(u, v, x)] → (Ex)(Ey)(Ez)K(x, y, z).
10
15
Diese Formel stellt eine Folgebeziehung zwischen zwei Aussagen dar, und für den Beweis, den wir suchen, kommt es darauf an, von | der ersten dieser Aussagen zu der zweiten durch eine Reihe von Folgebeziehungen zu gelangen, deren jede durch den Kalkül begründet ist. Dabei wenden wir das uns vom Aussagenkalkül her geläufige und natürlich auch im Funktionenkalkül gültige Prinzip an, daß aus zwei Aussagenbeziehungen A → B und B → C stets auf A → C geschlossen werden kann. Nun gilt zunächst im Funktionenkalkül, entsprechend der Aussagenformel X & Y → Y , für beliebige F und G die Beziehung: (Ex) F (x) & G(x) → (Ex)G(x). Setzen wir für den Ausdruck (Eu)(Ev)K(u, v, x), der eine Funktion von x darstellt, zur Abkürzung N (x), so erhalten wir
20
S(x) äq M (x) & N (x). Die obige Schlußweise ergibt dann: (Ex)S(x) → (Ex)N (x), oder beim Einsetzen des Ausdrucks für N (x): (Ex)S(x) → (Ex)(Eu)(Ev)K(u, v, x).
25
Nun gibt es einen allgemeinen Satz des Kalküls, nach dem lückenlos aufeinanderfolgende Seinszeichen ihre Reihenfolge vertauschen dürfen. Für zwei Seinszeichen hatten wir diesen Satz bereits erwähnt; der allgemeine Satz ergibt sich daraus durch wiederholte Anwendung. Führen wir diese Vertauschung aus, so erhalten wir statt der letzten Formel:
30
(Ex)S(x) → (Eu)(Ev)(Ex)K(u, v, x).
35
Das ist aber unsere Behauptung, nur daß die Variablen hinter dem Zeichen → anders benannt sind. Ein weiteres Beispiel bildet der Satz: „Wenn es eine Wirkung gibt, gibt es eine Ursache.“ Wir stellen zunächst die Behauptung in der Form dar: (Ex)W (x) → (Ex)U (x).
40
W (x) bedeutet: „x ist eine Wirkung“, und U (x): „x ist eine Ursache.“ Nun zerlegen wir wieder die Prädikate U und W durch die Einführung der Beziehung „x bringt y hervor“, für die wir das Zeichen K(x, y) wählen. Dabei ergeben sich für U (x) und W (x) die definierenden Ausdrücke:
50
854
51
Appendices
U (x) äq (Ey)K(x, y) und W (x) äq (Ey)K(y, x). Durch Einsetzung dieser Ausdrücke bringen wir die Behauptung auf die Form: (Ex)(Ey)K(y, x) → (Ex)(Ey)K(x, y) oder bei teilweiser Umbenennung der Variablen: (Ey)(Ex)K(x, y) → (Ex)(Ey)K(x, y). Diese Formel ist eine unmittelbare Konsequenz des Satzes von der Vertauschbarkeit der Seinszeichen. Die früher erwähnte Verschiedenheit von (Ex)(y)A(x, y) und (y)(Ex) A(x, y) läßt sich auch an dem Beispiel der gleichmäßigen und gewöhnlichen Konvergenz illustrieren. Es handle sich um eine bestimmte Folge eindeutiger arithmetischer Funktionen f1 (x), f2 (x), . . . , die (wie wir der Einfachheit halber annehmen wollen) für alle reellen Werte x definiert sind. Die Aussage, daß diese Funktionenfolge für jeden Wert von x gegen 0 konvergiert, läßt sich in unserer Symbolik so formulieren: (x)(z){<(0, z) → (Ey)(n)[<(y, n) → < | fn (x) |, z ]} („für beliebiges x gibt es zu jedem z, das größer als 0 ist, ein y, so daß für alle n, welche größer als y sind, die Ungleichung | fn (x) | < z erfüllt ist“). Dabei beziehen sich die Variablen y und n auf die ganzen Zahlen als Gegenstandsgattung, während x, z auf die Gattung der reellen Zahlen bezogen sind. Für die Behauptung, daß die Funktionenfolge gleichmäßig für alle Werte von x gegen 0 konvergiert, lautet der symbolische Ausdruck: (z){<(0, z) → (Ey)(x)(n)[<(y, n) → <(| fn (x) |, z)]} („für jedes z, das größer ist als 0, gibt es ein y, so daß für alle x und für alle n, welche größer als y sind, die Ungleichung | fn (x) | < z erfüllt ist“). Der Unterschied der beiden Behauptungen findet seinen Ausdruck in der verschiedenen Stellung des Allzeichens (x).
5
10
15
20
25
§ 4. Genaue Festlegung der Bezeichnungen im Funktionenkalkül.
52
Als Vorbereitung zu einer systematischen Behandlung des Funktionenkalküls geben wir zunächst eine genaue Übersicht über die benutzten Bezeichnungen. Die in dem Funktionenkalkül auftretenden Zeichen sind teils Zeichen für Variable, teils Individualzeichen. Die Zeichen für Variable sind immer große oder kleine lateinische Buchstaben. Wir unterscheiden: 1. Aussagenvariable: X, Y, Z, . . . 2. Gegenstandsvariable (Individuenvariable): x, y, z, . . . 3. Funktionsvariable: F ( ), G( ), . . . Entsprechend haben wir an Individualzeichen: a) solche für bestimmte Aussagen (etwa eine Bezeichnung für den pythagoreischen Lehrsatz oder auch für eine singuläre Behauptung wie „Sokrates war ein Philosoph“);
30
35
40
Grundzüge der theoretischen Logik
b)
5
10
855
Zeichen für bestimmte Individuen (Eigennamen);
c) für bestimmte Funktionen (z. B. <( , )). Jede (auf sinnvolle Weise gebildete) Kombination der logischen Zeichen heißt ein Ausdruck. Genauer definieren wir den Terminus „Ausdruck“ in der folgenden Weise: 1. Jedes Aussagezeichen ist ein Ausdruck. 2. Ein Funktionszeichen, bei dem jede Leerstelle entweder durch eine Variable oder durch den Eigennamen eines Gegenstandes ausgefüllt ist, heißt ein Ausdruck. 3. Ist A ein Ausdruck, so sind auch A und, falls in A die freie Variable x vorkommt, auch (x)A und (Ex)A Ausdrücke. 4. Sind A und B Ausdrücke, so sind auch A ∨ B, A & B, A → B, A ∼ B Ausdrücke.
15
20
25
30
35
40
Jedoch erfährt die Bildung von Ausdrücken gemäß 1–4 noch eine Einschränkung. Bezeichnen wir für einen Augenblick alle Zeichenkombinationen, die man nach 1–4 bilden kann, als „Formeln“, so gehört zu jedem in einer Formel vorkommenden All- oder Existentialzeichen ein bestimmter Bestandteil der Formel, auf den es sich bezieht. Diesen wollen wir den „Wirkungsbereich“ des betreffenden Zeichens nennen. So erstreckt sich z. B. in einer Formel vom Typus (x)[F (x) → (Ey)G(x, y)] der Wirkungsbereich des Zeichens (x) bis an das Ende der Formel, während bei (x) F (x) → (Ey)G(y) der Wirkungsbereich des Zeichens (x) nur bis vor das Zeichen → geht. Die letzte Bedingung lautet nun: 5. Bei einem Ausdruck sollen niemals zwei Wirkungsbereiche von Alloder Seinszeichen, die zu gleichbezeichneten Variablen gehören, übereinan dergreifen. So ist z. B. (x) F (x) → (Ex)G(x) ein Ausdruck, nicht aber (x)(y)[F (x) → (Ex)G(x, y)]. Für die Ausfüllung jeder Leerstelle eines Funktionszeichens kommen nur Individuen aus einem bestimmten Definitionsbereich in Betracht (vgl. S. 45). Unstatthaft ist es, daß zwei Leerstellen, welche sich auf verschiedene Definitionsbereiche beziehen, mit denselben Variablen ausgefüllt werden. Ein Ausdruck heißt von einer Variablen x abhängig, wenn x in dem Ausdruck vorkommt, ohne daß jedoch zu x ein Klammerzeichen (x) oder (Ex) gehört. Zur Ersparung von Klammern treffen wir noch die folgenden Festsetzungen: Bei der Trennung von Ausdrücken sollen die Zeichen →, ∨, | &, ∼ vor den All- und Seinszeichen den Vorrang haben. Wenn mehrere Klammerzeichen unmittelbar aufeinanderfolgen, ohne durch eine Klammer getrennt zu sein, so ist das stets so aufzufassen, daß sich ihre Wirkungsbereiche bis zu der gleichen Stelle erstrecken.
53
856
Appendices
§ 5. Die Axiome des Funktionenkalküls. Wir gehen jetzt dazu über, für den Funktionenkalkül ähnlich wie früher für den Aussagenkalkül ein System von Axiomen aufzustellen, aus dem sich die übrigen richtigen Beziehungen nach gewissen Regeln ableiten lassen. Wir unterscheiden wie früher zwischen den eigentlichen Axiomen, den logischen Grundformeln, und den Grundregeln zur Ableitung neuer Formeln aus den schon bewiesenen. Als logische Grundformeln treten zunächst wieder die Axiome des Aussagenkalküls auf, die wir in derselben Form wie früher geben: a) b) c)
X ∨ X → X. X → X ∨Y. X ∨ Y → Y ∨ X.
d) (X → Y ) → [Z ∨ X → Z ∨ Y ]. Dazu kommen jetzt als zweite Gruppe zwei formale Axiome für „alle“, und „es gibt“ hinzu: e) (x)F (x) → F (y).
54
f) F (y) → (Ex)F (x). Das erste dieser Axiome bedeutet: „Wenn ein Prädikat F auf alle x zutrifft, so trifft es auch auf ein beliebiges y zu.“ Die zweite Formel liest sich so: „Wenn das Prädikat F auf irgendein y zutrifft, so gibt es ein x, auf das F zutrifft.“ Die logischen Grundformeln a)–f) werden als richtige Formeln angenommen. Ferner können wir noch andere Formeln als richtig voraussetzen, welche entweder die Axiome einer Theorie oder sonstige als gültig angenommene Aussagen symbolisch darstellen. Auf diese zugrunde gelegten Ausgangsformeln wenden wir nun die folgenden Regeln an: α) Einsetzungsregel: Für eine Aussagenvariable darf überall, wo sie vorkommt, ein und derselbe logische Ausdruck eingesetzt werden, für eine Funktionsvariable mit den Argumenten x, y, . . . u ein von den Variablen x, y, . . . u (und eventuell noch weiteren Variablen) abhängiger Ausdruck. Eine Individuenvariable kann durch eine anders benannte Variable derselben Art oder durch einen Eigennamen aus dem Bereiche der Variablen ersetzt werden. Alle Einsetzungsregeln gelten nur für freie Variablen und sind mit der Einschränkung zu verstehen, daß für eine Variable, die im Wirkungsbereich eines Klammerzeichens steht, kein Ausdruck eingesetzt wird, der die zu dem Klammerzeichen gehörige Variable enthält. Eine freie Individuenvariable, die im Wirkungsbereich eines Klammerzeichens vorkommt, darf nach der Einsetzung nicht mit der Klammervariablen identisch werden. β) Schlußschema: Sind A und A → B richtige Formeln, so ist auch B eine richtige Formel.
5
10
15
20
25
30
35
40
Grundzüge der theoretischen Logik
5
10
15
20
857
γ) Schema für „alle“ und „es gibt“: Sei B(x) ein beliebiger logischer Ausdruck, der von x abhängt, A ein solcher, der von x unabhängig ist. Ist dann A → B(x) eine richtige Formel, so gilt dasselbe für A → (x)B(x). Ebenso gewinnt man aus einer richtigen Formel B(x) → A die neue (Ex)B(x) → A. Die Ableitung von Formeln aus den Axiomen hat streng formal zu geschehen, derart, daß wir uns um den Sinn der durch die Formeln dargestellten Aussagen gar nicht zu kümmern brauchen, sondern lediglich die in den Regeln enthaltenen Vorschriften zu beachten haben. Nur bei der symbolischen Darstellung der Prämissen sowie bei der Interpretation der durch die formalen Operationen erhaltenen Ergebnisse müssen wir die Bedeutung der Zeichen unseres Kalküls berücksichtigen. Diese Deutung geschieht in der bisherigen Weise. Das Auftreten von Aussagen-, Funktions- und (freien) Gegenstandsvariablen in einer Formel ist so zu verstehen, daß bei jeder beliebigen Einsetzung von bestimmten Aussagen, Gegenständen und Funktionen die aus der Formel entstehende Behauptung richtig ist. Selbstverständlich dürfen dabei die bestimmten Gegenstände und Funktionen nur aus dem Definitionsbereich der zugehörigen Variablen genommen werden. Das hier benutzte besonders einfache Axiomensystem für „alle“ und „es gibt“, das in den Formeln e) und f) sowie der Regel γ) zum Ausdruck kommt, ist von P. Bernays angegeben worden. § 6. Das System der logischen Formeln.
25
30
35
40
Unter den Formeln, die sich mit Hilfe des Funktionenkalküls beweisen lassen, nehmen diejenigen eine ausgezeichnete Stellung ein, die keine individuellen Zeichen enthalten, und bei deren Ableitung außer den logischen Grundformeln keine weiteren Formeln als Voraussetzung zugrunde gelegt werden. Diese Formeln wollen wir kurz als „logische Formeln“ bezeichnen. Mit einem Teilsystem der logischen Formeln sind wir schon bekannt, nämlich demjenigen, in dem nur Aussagenvariable vorkommen. Wir hatten für dieses Teilsystem früher die Formeln (1) bis (20) und die Regeln I–VIII abgeleitet. Wir bezeichnen dieses Teilsystem als das System der logischen Aussagenformeln. Wir wollen nun sehen, wie sich auf der Grundlage der logischen Aussagenformeln das Gesamtsystem der logischen Formeln aufbaut. Die Methode, nach welcher man bei der Ableitung von Formeln und Regeln zu verfahren hat, möge zunächst an einigen Beispielen dargelegt werden. Regel γ : Man habe eine Formel A(x) bewiesen, die die freie Variable x enthält. Dann ist auch (x)A(x) beweisbar. Beweis: Aus A(x) erhält man durch Anwendung von Regel II und III X ∨ X ∨ A(x), X ∨ X ∨ (x)A(x)
[nach Regel γ)],
55
858
Appendices
X ∨X (x)A(x) Formel (21 ):
[Formel (3)], (Schlußschema).
(x)(F (x) ∨ F (x)).
X ∨X [Formel (3)], F (x) ∨ F (x) (durch Einsetzung), (x) F (x) ∨ F (x) (nach Regel γ ). Formel (22 ): (x)F (x) → (Ex)F (x). Beweis: (x)F (x) → F (y) [Axiom e)], F (y) → (Ex)F (x) [Axiom f)], (x)F (x) → (Ex)F (x) (Regel V). Formel (23 ): (x) A ∨ F (x) → A ∨ (x)F (x). Beweis: (x) A ∨ F (x) → A ∨ F (x) [Einsetzung in Axiom e)], (Ersetzung von A durch A). (x) A ∨ F (x) → A ∨ F (x) Unter Benutzung der Abkürzung → kann man auch schreiben: (x) A ∨ F (x) → A → F (x) , [(x) A ∨ F (x) & A] → F (x) (nach Regel VII), [(x) A ∨ F (x) & A] → (x)F (x) [Regel γ)]. Diesen Ausdruck verwandelt man mit Hilfe von Regel VII zurück in (x) A ∨ F (x) → A ∨ (x)F (x). Formel (24 ): (x) A → F (x) → A → (x)F (x) . Beweis:
Beweis: einsetzt.
56
5
10
15
20
Diese Formel entsteht aus der vorigen, indem man A für A
Regel IX: Ist A → B → C(x) beweisbar, so gilt dasselbe für A → B → (x)C(x) . Dies ist eine Erweiterung der Regel γ). Statt 2 Voraussetzungen kann man
25
auch eine beliebige andere endliche Anzahl von Voraussetzungen nehmen. Der Beweis ist dann ganz entsprechend wie im vorliegenden Fall. Beweis: A → B→ C(x) , A → (x) B → C(x) [Regel γ)]. Daraus ergibt sich die gesuchte Formel durch Anwendung von (24) und Regel V. Formel (25 ): A → (x) A ∨ F (x) . A→A∨B [Axiom (b)], A → A ∨ F (x) (durch Einsetzung), A → (x) A ∨ F (x) [nach Regel γ)]. Formel (26 ): (x) A ∨ F (x) ∼ A ∨ (x)F (x). Beweis: Da (23) bewiesen ist, so genügt es, die Richtigkeit der Umkeh rung: A ∨ (x)F (x) → (x) A ∨ F (x) zu zeigen. (x)F (x) → F (x)
30
Beweis:
35
Grundzüge der theoretischen Logik
5
10
15
20
A ∨ (x)F (x) → A ∨ F (x) (nach Regel IV), A ∨ (x)F (x) → (x) A ∨ F (x) [nach Regel γ)]. Formel (27 ): (x) A → F (x) ∼ A → (x)F (x) . Beweis: Diese Formel geht in derselben Weise aus (26) hervor, wie (24) aus (23). Formel (28 ): (x) A & F (x) ∼ A & (x)F (x). Beweis: Wir beweisen zunächst: I. (x) A & F (x) → A & (x)F (x). (x) A & F (x) → A & F (x), A & F (x) → F (x) [Formel (13)], (x) A & F (x) → F (x) (Regel V), (x) A & F (x) → (x)F (x) [Regel γ)], A & F (x) → A, (x) A & F (x) → A [Regel V]. Durch Benutzung der Aussagenformel (X → Y ) → (X → Z) → (X → Y & Z) und zweimalige Anwendung des Schlußschemas erhält man dann aus der letzten und vorvorletzten Formel die Formel I. II. A & (x)F (x) → (x) A & F (x) . (x)F (x) → F (x); daraus erhält man nach dem Aussagenkalkül A & (x)F (x) → A & F (x), A & (x)F (x) → (x) A & F (x)
25
30
35
40
859
[Regel γ)].
Aus den Formeln I und II ergibt sich die gesuchte Formel. Formel (29 ): (x)(y)F (x, y) ∼ (y)(x)F (x, y). Beweis: (x)(y)F (x, y) → (y)F (x, y) [Einsetzung in Axiom e)], (y)F (x, y) → F (x, y) [Einsetzung in Axiom e)], (x)(y)F (x, y) → F (x, y) (nach Regel V), (x)(y)F (x, y) → (x)F (x, y) [Regel γ)], (x)(y)F (x, y) → (y)(x)F (x, y) [Regel γ)]. Ebenso ergibt sich (y)(x)F (x, y) → (x)(y)F (x, y) und daher auch (29). Formel (30 ): (x) F (x) & G(x) ∼ (x)F (x) & (x)G(x). Beweis: Man zeigt zunächst: a) (x) F (x) & G(x) → (x)F (x) & (x)G(x). (x) F (x) & G(x) → F (x) & G(x), F (x) & G(x) → F (x), F (x) & G(x) → G(x), (x) F (x) & G(x) → F (x) (nach Regel V), (x) F (x) & G(x) → G(x) (nach Regel V). Nach Regel γ) kann man beide Formeln verändern zu
57
860
Appendices
(x) F (x) & G(x) → (x)F (x), (x) F (x) & G(x) → (x)G(x). Aus beiden zusammen gewinnt man dann (x) F (x) & G(x) → (x)F (x) & (x)G(x). b) Beweis von (x)F (x) & (x)G(x) → (x) F (x) & G(x) . (x)F (x) → F (x), (x)G(x) → G(x), (x)F (x) & (x)G(x) → F (x) & G(x), (x)F (x) & (x)G(x) → (x) F (x) & G(x) 58
5
[Regel γ)].
Aus a) und b) ergibt sich die gesuchte Formel. Formel (31 ): (x) F (x) → G(x) → (x)F (x) → (x)G(x) . Beweis: (x) F (x) → G(x) → F (x) → G(x) , F (x) → (x) F (x) → G(x) → G(x) (nach Regel VII), (x)F (x) → F (x) [Axiom e)], (x)F (x) → (x) F (x) → G(x) → G(x) (Regel V), (x)F (x) & (x) F (x) → G(x) → G(x) (Regel VII), (x)F (x) & (x) F (x) → G(x) → (x)G(x) [Regel γ)], (x) F (x) → G(x) → (x)F (x) → (x)G(x) (Regel VII). Formel (32 ): (x) F (x) ∼ G(x) → (x)F (x) ∼ (x)G(x) . Beweis: (x) F (x) ∼ G(x) ist eine Abkürzung für (x)[ F (x) → G(x) & G(x) → F (x) ].
10
15
20
Durch Einsetzung in Formel (30) erhält man (x)[ F (x) → G(x) & G(x) → F (x) ] ∼ (x) F (x) → G(x) &(x) G(x) → F (x) . Nach Formel (31) ist (x) F (x) → G(x) → (x)F (x) → (x)G(x) , (x) G(x) → F (x) → (x)G(x) → (x)F (x) .
25
Wir haben also drei Formeln von der Form: A ∼ B & C, B → (D → E), C → (E → D). Daraus läßt sich A → (D ∼ E) ableiten. Das ist aber unsere Behauptung, wenn wir für A, D, E ihre Bedeutungen einsetzen. Formel (33 ): a) (Ex)F (x) ∼ (x) F (x). b) (Ex)F (x) ∼ (x) F (x). c) (Ex) F (x) ∼ (x)F (x). d) (Ex) F (x) ∼ (x)F (x). Beweis von (33a):
30
35
Grundzüge der theoretischen Logik
861
(x)F (x) → F (x), F (x) → (x) F (x)
5
F (x) → (x) F (x) (Ex)F (x) → (x) F (x) Das ist die Formel (33a) zur Hälfte. F (x) → (Ex)F (x) (Ex)F (x) → F (x) (Ex)F (x) → (x)F (x)
10
[nach Formel (6)], [Ersetzung von F (x) durch F (x)], [nach Regel γ)]. [Einsetzung in Axiom f)], [nach Formel (6)], [Regel γ)],
(x) F (x) → (Ex)F (x)
[nach Formel (6)],
(x) F (x) → (Ex)F (x)
[Ersetzung von (Ex)F (x) durch (Ex)F (x)].
Das ist die andere Hälfte von (33a).
15
Beweis von (33b): A ∼ A, (durch Einsetzung), F (x) ∼ F (x) [Regel γ )]. (x) F (x) ∼ F (x) Unter Benutzung von Formel (32) erhält man daraus: (x)F (x) ∼ (x)F (x), (x)F (x) ∼ (x) F (x)
20
25
Durch Einsetzung in (33a) ergibt sich (Ex)F (x) ∼ (x) F (x), (x)F (x) ∼ (Ex)F (x). also Das ist die Formel (33b). Aus (33a) und (33b) erhält man auch die Formeln (33d) und (33c), da aus A ∼ B sich A ∼ B beweisen läßt. Formel (34 ): (x) F (x) → G(x) → (Ex)F (x) → (Ex)G(x) . Beweis:
30
35
[unter Benutzung von (X ∼ Y ) → (X ∼ Y ), vgl. Formel (16), S. 7].
Aus der Aussagenformel (A → B) → (B → A)
erhält man durch Einsetzung F (x) → G(x) → G(x) → F (x) , (x){ F (x) → G(x) → G(x) → F (x) } [nach Regel γ )]. Aus der letzten Formel erhält man unter Benutzung der Formel (31) (x){F (x) → G(x)} → (x){G(x) → F (x)}. Unter abermaliger Benutzung der Formel (31) und der Regel V erhält man daraus: (x) F (x) → G(x) → (x)G(x) → (x)F (x) .
59
862 60
Appendices
In dieser Formel kann (x)G(x) → (x)F (x) unter Benutzung von For|mel (6) in (x) F (x) → (x) G(x) verwandelt werden. Da (x) F (x) ∼ (Ex)F (x), (x) G(x) ∼ (Ex)G(x), so folgt dann die gesuchte Formel. Der Formel (34) entspricht die folgende Regel: Ist A(x) → B(x) beweisbar, so kann man auch (Ex)A(x) → (Ex)B(x) ableiten. — Man erhält nämlich aus A(x) → B(x) nach Regel γ (x) A(x) → B(x) , und unter Benutzung von (34): (Ex)A(x) → (Ex)B(x). Ganz ebenso wie aus (31) die Formel (32) abgeleitet wird, erhält man aus (34) die Formel (34 ) (x) F (x) ∼ G(x) → (Ex)F (x) ∼ (Ex)G(x) . Formel (35 ): (x) F (x) → A ∼ (Ex)F (x) → A . Beweis: (x) F (x) → A ist eine Abkürzung für (x) F (x) ∨ A . Es gilt nun die Formel (x) F (x) ∨ A ∼ (x)F (x) ∨ A, die man ähnlich wie die Formel (26) beweist. (x)F (x) ∼ (Ex)F (x), (x)F (x) ∨ A ∼ (Ex)F (x) ∨ A. Schreibt man nun wieder die Abkürzung →, so ergibt sich (35). Formel (36 ): (Ex)(y)F (x, y) → (y)(Ex)F (x, y). Das ist die schon früher erwähnte Vertauschungsformel, von der auch bereits hervorgehoben wurde, daß sie nur als einseitige Folgebeziehung gilt. Beweis: F (x, y) → (Ex)F (x, y) [Einsetzung in Axiom f)], (y) F (x, y) → (Ex)F (x, y) [Regel γ )]. Unter Benutzung von Formel (31) ergibt sich (y)F (x, y) → (y)(Ex)F (x, y), (Ex)(y)F (x, y) → (y)(Ex)F (x, y) [nach Regel γ)].
5
10
15
20
25
§ 7. Die Ersetzungsregel; Bildung des Gegenteils eines Ausdrucks.
61
Nachdem wir eine Reihe von logischen Formeln abgeleitet haben, sollen nun einige allgemeine Regeln besprochen werden, die zur Gewinnung eines Überblicks über das Gesamtsystem der logischen Formeln besonders wichtig sind. Diese Regeln beziehen sich übrigens auf ganz beliebige Ausdrücke unseres Kalküls. Sie gelten also auch für solche Formeln, in denen individuelle Zeichen auftreten. Als erste Regel haben wir eine Erweiterung der Regel VI. Diese besagte, daß Aussagen, die in gegenseitiger Folgebeziehung stehen, die also äquivalent sind, füreinander eingesetzt werden dürfen. Wir erweitern diese Ersetzungsregel in der folgenden Weise: Regel X: Es möge A(x, y, . . . u) irgendeinen logischen Ausdruck bedeuten, der von den Variablen x, y, . . . u abhängt. A(x, y, . . . u) ∼ B(x, y, . . . u) sei
30
35
40
Grundzüge der theoretischen Logik
5
10
15
20
25
30
35
40
863
eine beweisbare Formel. Es kann dann A(x, y, . . . u) in einer logischen Formel durch B(x, y, . . . u) ersetzt werden, auch wenn die Variablen x, y, . . . u innerhalb dieser Formel gebunden sind. Da wir die Regel VI schon haben, so genügt es, zu zeigen, daß man auf beiden Seiten der Äquivalenz A(x, y, . . . u) ∼ B(x, y, . . . u) vor A(x, y, . . . u) und B(x, y, . . . u) die gleichen Klammerzeichen vorsetzen darf, daß man z. B. schreiben darf (Ex)(y)A(x, y, . . . u) ∼ (Ex)(y)B(x, y, . . . u). Es genügt, dies für ein Klammerzeichen zu zeigen. Wir zeigen also, daß (x)A(x, y, . . . u) ∼ (x)B(x, y, . . . u) und (Ex)A(x, y, . . . u) ∼ (Ex)B(x, y, . . . u) beweisbar sind. Aus A(x, y, . . . u) ∼ B(x, y, . . . u) erhält man nach der Regel γ : (x) A(x, y, . . . u) ∼ B(x, y, . . . u) . Unter Benutzung von Formel (32) ergibt sich dann (x)A(x, y, . . . u) ∼ (x)B(x, y, . . . u), und ebenso auf Grund der Formel (34 ): (Ex)A(x, . . . u) ∼ (Ex)B(x, . . . u). Als weiteres Ergebnis schließt sich hieran eine Regel über die Bildung des Gegenteils eines Ausdrucks. Regel XI: Von einem Ausdruck, in welchem die Abkürzungen → und ∼ nicht vorkommen, bildet man das Gegenteil, indem man erstens die Allzeichen durch Existentialzeichen ersetzt und umgekehrt, zweitens die Zeichen & und ∨ miteinander vertauscht und drittens die Aussage- und Funktionszeichen gegen ihre Verneinungen austauscht. Der Beweis dieses Satzes verläuft folgendermaßen: Falls der betreffende Ausdruck keine All- und Seinszeichen enthält, so hatten wir den Satz bereits früher im Aussagenkalkül bewiesen. Indem wir nun von diesem Satz Gebrauch machen und die Kombination von Allzeichen und ihrem Wirkungsbereich als ungetrenntes Ganzes auffassen, können wir stets erreichen, daß die Negation von dem Gesamtausdruck auf die äußersten Klammerzeichen verlegt | wird. Stand der Gesamtausdruck unter einem Klammerzeichen, so ist das von vornherein der Fall. Ist nun A(x) ein von x abhängiger Ausdruck, so ergibt sich aus den Formeln (33), daß (x) A (x) ∼ (Ex) A(x), (Ex) A (x) ∼ (x) A (x). Unter Benutzung dieser Äquivalenzen können wir die Negation von den Klammerzeichen auf ihre Wirkungsbereiche verschieben. Mit diesen Wirkungsbereichen verfährt man dann auf dieselbe Weise wie mit dem Gesamtausdruck, bis man schließlich überall bei den Aussage- oder Funktionszeichen anlangt. Die beschriebene Methode der Umformung möge an einem Beispiel erläutert werden: Es handle sich darum, für (x)(Ey) F (x, y) ∨ (Ez)G(x, y, z)
62
864
Appendices
die dem Satz entsprechende Darstellung abzuleiten. Aus den Formeln (33) folgt zunächst, daß (x)(Ey) F (x, y) ∨ (Ez)G(x, y, z) ∼ (Ex)(Ey) F (x, y) ∨ (Ez)G(x, y, z) , und weiter ergibt sich als äquivalenter Ausdruck (Ex)(y)F (x, y) ∨ (Ez)G(x, y, z).
5
Unter Anwendung des Spezialfalls unseres Satzes für den Aussagenkalkül und Regel X erhält man: (Ex)(y) F (x, y) & (Ez)G(x, y, z) und endlich:
(Ex)(y) F (x, y) & (z)G(x, y, z) . Das letzte ist genau die unserer Regel entsprechende Darstellung.
10
§ 8. Das erweiterte Dualitätsprinzip; Normalform für logische Formeln.
63
Aus der Regel XI des vorigen Paragraphen läßt sich ein Dualitätsprinzip ableiten, das wir als eine Erweiterung des früher für den Aussagenkalkül abgeleiteten Dualitätsprinzips auffassen können. Dieses lautet folgendermaßen: Aus einer logischen Formel, die die Form einer Folgebeziehung oder einer Gleichung hat, in deren Gliedern die Zeichen → und ∼ nicht vorkommen, entsteht wieder eine logische Formel, wenn man überall die Allzeichen durch gleichnamige Seinszeichen ersetzt und umgekehrt und außerdem die Zeichen & und ∨ gegeneinander auswechselt. Im Falle der Folgebeziehung hat man außerdem noch die Reihenfolge der beiden Glieder zu vertauschen. Beweis: Ist A → B eine richtige Formel, so ist auch B → A eine richtige Formel, und mit A ∼ B ist auch A ∼ B eine richtige Formel. Man formt nun A und B nach dem Satz 2 des vorigen Paragraphen um. Man wechselt also die Allgemeinheits- und Existentialzeichen sowie die Zeichen & und ∨ gegeneinander um und ersetzt die Aussagen- und Funktionszeichen durch ihre Negationen. Da es sich aber um eine logische Formel handelt, in der keine individuellen Zeichen vorkommen, so kann die letzte Ersetzung wieder rückgängig gemacht werden, indem man gemäß der Ersetzungsregel sämtliche Aussagen- und Funktionsvariablen durch ihr Gegenteil ersetzt. Das erweiterte Dualitätsprinzip liefert uns mit einem Schlage eine große Anzahl von logischen Formeln durch die duale Umformung von früher abgeleiteten Formeln. Die wichtigsten seien hier hervorgehoben1 . Formel (26 ): (Ex) A & F (x) ∼ A & (Ex)F (x). Formel (28 ): (Ex) A ∨ F (x) ∼ A ∨ (Ex)F (x).
Formel (29 ): 1
(Ex)(Ey)F (x, y) ∼ (Ey)(Ex)F (x, y).
Durch die Bezeichnung der Formeln soll kenntlich gemacht werden, aus welcher der schon bewiesenen logischen Formeln die betreffende Formel gemäß dem Dualitätsprinzip hervorgeht.
15
20
25
30
35
Grundzüge der theoretischen Logik
Formel (30 ):
5
10
15
20
25
30
35
865
(Ex) F (x) ∨ G(x) ∼ (Ex)F (x) ∨ (Ex)G(x).
Die Formeln (29) und (29 ) liefern uns in Verbindung mit der Regel X eine weitere Regel. Regel XII: Ein logischer Ausdruck geht in einen äquivalenten über, wenn darin zwei oder mehrere unmittelbar aufeinanderfolgende Allzeichen, die denselben Wirkungsbereich haben, beliebig umgeordnet werden. Die entsprechende Regel gilt für die Seinszeichen. Bei der Behandlung des Aussagenkalküls zeigte es sich, daß es möglich ist, alle Aussagenverbindungen auf eine gemeinsame Normalform zu bringen. Wir konnten die Aussagenverbindungen entweder als Summe von einfachen Produkten oder als Produkt von elementaren Summen darstellen. Eine gewisse Normalform gibt es nun auch im Funktionskalkül. Es kann nämlich jeder Ausdruck durch einen solchen ersetzt werden, in welchem alle vorkommenden Klammerzeichen unverneint am Anfang stehen, und zwar ohne durch Klammern getrennt zu sein, so daß sich ihre Wirkungsbereiche alle bis zum Ende der Formel erstrecken 2 . Der Vorteil dieser Normaldarstellung beruht darauf, daß der hinter den Klammerzeichen stehende Ausdruck ganz wie eine Aussagenverbindung behandelt werden kann. Die Umformung zur Normalform geschieht in der folgenden Weise: Wir ersetzen zunächst in dem zu betrachtenden Ausdruck die Abkürzungen → und ∼ durch ihre Bedeutung. Durch mehrfache Anwendung der Regel XI des vorigen Paragraphen kann man dann leicht erreichen, daß die Negationsstriche nur über den Aussagen- und Funktionsvariablen zu stehen kommen. Wir ändern nun die Bezeichnung der Variablen so ab, daß alle Klammerzeichen zu verschiedenen Variablen gehören, und keine freie Variable mit einer gebundenen Variablen gleichbenannt ist1 . Statt (x)F (x) & F (x) schreibt man also (x)F (x) & F (y); statt (x)F (x) ∨ (x)G(x): (x)F (x) ∨ (y)G(y) usw. Aus dem so entstehenden logischen Ausdruck erhält man nun die Normalform, indem man sämtliche Klammerzeichen in der Reihenfolge, wie sie auftreten, an den Anfang der Formel stellt und im übrigen alles ungeändert läßt. Die Wirkungsbereiche sämtlicher Klammerzeichen sollen sich dann bis zum Ende der Formel erstrecken. 2 Diese Art der Darstellung ist ebenso wie beim Aussagenkalkül keineswegs eindeutig. 1 Daß die Umbenennung der Variablen gestattet ist, kann ebenfalls streng formal gezeigt werden. Z. B. leitet man aus (x)A(x) die Formel (y)A(y) in folgender Weise ab: (x)A(x) → A(y); daraus nach Regel β A(y) und nach Regel γ (y)A(y).
64
866
Appendices
Daß die letzte Umformung wirklich zulässig ist, ergibt sich auf folgende Weise. Es sei die Richtigkeit der Umformung schon gezeigt, falls der betrachtete Ausdruck weniger Klammerzeichen enthält. Wenn kein Klammerzeichen vorkommt, so sagt die Behauptung nichts Besonderes aus. Steht nun der ganze Ausdruck unter einem Klammerzeichen, so ist die Behauptung klar. Wir brauchen dann nur für den Wirkungsbereich dieses Klammerzeichens, der selbst weniger Klammerzeichen enthält, die Umformung zu machen. Andernfalls nehmen wir das erste Klammerzeichen unseres Ausdrucks. Dieses steht selbst nicht wieder im Wirkungsbereich eines anderen Klammerzeichens. Unter Anwendung der abgeleiteten Formeln: A ∨ (x)F (x) ∼ (x) A ∨ F (x) , (x)F (x) ∨ A ∼ (x) F (x) ∨ A , A & (x)F (x) ∼ (x) A & F (x) , (x)F (x) & A ∼ (x) F (x) & A 65
5
10
bzw. der entsprechenden Formeln für das Seinszeichen kann nun erreicht werden, daß dieses Klammerzeichen an den Anfang der Formel | verschoben wird und sich sein Wirkungsbereich über die ganze Formel erstreckt. Damit kommen wir auf den vorigen Fall zurück, und die Richtigkeit der Umformung ist damit allgemein bewiesen.
15
§ 9. Die Widerspruchsfreiheit und Vollständigkeit des Axiomensystems.
20
Die Methode der arithmetischen Interpretation, mit Hilfe derer sich früher für die Axiome a) bis d) die Widerspruchsfreiheit und Unabhängigkeit einsehen ließ, ermöglicht es uns auch, das Gesamtsystem der Axiome des Funktionskalküls als widerspruchsfrei, in dem früher erklärten Sinne, zu erkennen. Hierzu müssen wir die arithmetische Interpretation, welche damals nur für die Aussagenvariablen bestand, auf die bisher noch nicht gedeuteten Zeichen ausdehnen. Dies geschieht in der folgenden Weise: Wir behandeln die Funktionszeichen in gleicher Weise wie die Aussagezeichen. Wir fassen beide als arithmetische Variable auf, welche der Werte 0 und 1 und keiner anderen fähig sind. Wie bei den Funktionszeichen die Leerstellen ausgefüllt sind, wird dabei nicht berücksichtigt. Die Zeichen für Individuen, auch die zugehörigen Klammerzeichen werden nicht mitgelesen. Die Verknüpfung ∨ wird wieder als arithmetisches Produkt aufgefaßt, und unter 0 wollen wir 1 und unter 1 0 verstehen. Bei diesen Festsetzungen gilt zunächst wieder, daß alle Axiome einschließlich e) und f) bei der arithmetischen Deutung immer den Wert 0 ergeben. Haben ferner eine oder mehrere Formeln immer den Wert 0, so überzeugt man sich leicht, daß jede weitere nach unseren Regeln daraus abgeleitete Formel ebenfalls immer den Wert 0 ergibt. Da nun andererseits zwei Ausdrücke, von denen der eine die Negation des anderen ist, nicht beide 0 ergeben können, so folgt, daß unter den Formeln, die sich aus unseren Axiomen ableiten, keine
25
30
35
40
Grundzüge der theoretischen Logik
5
10
15
20
25
zwei einander entgegengesetzt sein können. Die Bedingung der Widerspruchsfreiheit ist also erfüllt. Man darf das Ergebnis dieses Beweises für die Widerspruchsfreiheit unserer Axiome übrigens in seiner Bedeutung nicht überschätzen. Der angegebene Beweis der Widerspruchsfreiheit kommt nämlich inhaltlich darauf hinaus, daß man annimmt, der zugrunde gelegte Individuenbereich bestehe nur aus einem einzigen Element, sei also endlich. Wir haben damit durchaus keine Gewähr, daß bei der symbolischen Einführung von inhaltlich einwandfreien Voraussetzungen das System der beweisbaren Formeln widerspruchsfrei bleibt. Z. B. bleibt die Frage unbeantwortet, ob nicht bei Hinzufügung der mathematischen Axiome in unserem Kalkül jede beliebige Formel beweisbar wird. Dieses Problem, dessen Lösung eine zentrale Bedeutung für die Mathematik besitzt, läßt sich in bezug auf | Schwierigkeit mit der von uns behandelten Frage gar nicht vergleichen. Die mathematischen Axiome setzen gerade einen unendlichen Individuenbereich voraus, und mit dem Begriff des Unendlichen sind die Schwierigkeiten und Paradoxien verknüpft, die bei der Diskussion über die Grundlagen der Mathematik eine Rolle spielen. Um das letztgenannte Problem mit Erfolg angreifen zu können, hat D. Hilbert sich veranlaßt gesehen, eine besondere Theorie aufzustellen. Ein Eingehen auf diese Theorie, die natürlich die Ergebnisse der mathematischen Logik benutzt, ist im Rahmen dieses Buches nicht möglich. Auf die Anregungen, die die Symbolik der Logik dadurch erfahren hat, ist an einigen Stellen kurz eingegangen. Kehren wir nun zurück zu unserem Axiomensystem. Der Gedankengang des Beweises der Widerspruchsfreiheit führt uns auch zur Entscheidung über die Frage, ob das Axiomensystem die Vollständigkeit in dem schärferen Sinne besitzt. Diese Vollständigkeit ist nicht vorhanden. Um die Unvollständigkeit des Axiomensystems festzustellen, brauchen wir nur eine Formel zu finden, welche gemäß der obigen arithmetischen Deutung identisch gleich 0, aber nicht eine Konsequenz der Axiome ist. Eine solche Formel ist (Ex)F (x) → (x)F (x).
30
35
40
867
Daß diese Formel nicht aus den Axiomen folgt, kann man sich schon dadurch plausibel machen, daß die Behauptung, welche sie darstellt: „Wenn es ein x gibt, für das F (x) besteht, so gilt F (x) für alle x“, gewiß nicht allgemein richtig ist. Der streng formale Beweis für die Unmöglichkeit, die Formel aus den Axiomen abzuleiten, geschieht in folgender Weise1 : Wir geben zunächst ein Verfahren an, durch das wir die logischen Formeln in solche umwandeln, die nur Aussagenvariable enthalten. Zuerst schaffen wir die in einer Formel auftretenden freien Variablen fort, indem wir die zu den freien Variablen gehörigen Allgemeinheitszeichen vor die Formel setzen. Dann schaffen wir die Klammerzeichen fort, indem wir, etwa von außen anfangend, 1
Der Beweis ist von W. Ackermann gegeben worden.
66
868
Appendices
immer (x)A(x)
durch
A(1) & A(2),
(Ex)A(x)
durch
A(1) ∨ A(2)
2
67
ersetzen . In unseren Formeln kommen nun neben Aussagenvariablen Aussagen von der Form F (1), F (2), G(1, 2), . . . vor. Alle diese verschiedenen Aussagen ersetzen wir dann noch durch (verschiedene) Aussagenvariable. Wir behaupten nun, jede aus den Axiomen ableitbare Formel geht nach dieser Umformung in eine immer richtige Aussagenverbindung über. Wir zeigen das zunächst für die Axiome. Für die Axiome a) bis d) ist es klar, da diese von der Umformung unberührt bleiben. Das Axiom (x)F (x) → F (y) wird in folgender Weise umgeformt: (y) (x)F (x) → F (y) , (x)F (x) → F (1) & (x)F (x) → F (2) , F (1) & F (2) → F (1) & F (1) & F (2) → F (2) , (A & B → A) & (A & B → B). Das letzte ist tatsächlich eine richtige Aussagenverbindung. Analog hat man für das Axiom F (y) → (Ex)F (x)
5
10
15
20
die Umformungen:
(y) F (y) → (Ex)F (x) , F (1) → (Ex)F (x) & F (2) → (Ex)F (x) , F (1) → F (1) ∨ F (2) & F (2) → F (1) ∨ F (2) , (A → A ∨ B) & (B → A ∨ B), die ebenfalls zu einer immer richtigen Formel führen. Wir brauchen nun nur noch zu zeigen, daß die Anwendung der Regeln α, β, γ diese Eigenschaft ungeändert läßt. Für die Regel α) folgt das aus der Gültigkeit der Einsetzung im Aussagenkalkül. Für β) ergibt sich die Richtigkeit daraus, daß das Schlußschema im Aussagenkalkül richtige Formeln liefert. Enthielt das Schlußschema noch freie Gegenstandsvariablen, so kann es allerdings nach Vorsetzen der Allzeichen seine Form verlieren. Z. B. wird aus A(x) A(x) → B(x) B(x) das neue Schema (x)A(x) 2
1 und 2 sind hier Eigennamen von Gegenständen. Unsere Auflösung der Klammerzeichen kommt also inhaltlich darauf hinaus, daß wir annehmen, der Individuenbereich enthalte nur die beiden Elemente 1 und 2.
25
30
35
Grundzüge der theoretischen Logik
869
(x) A(x) → B(x) .
5
10
15
20
25
30
35
(x)B(x) Bei der Auflösung der Allzeichen erhält man dann A(1) & A(2) A(1) → B(1) & A(2) → B(2) . B(1) & B(2) Aber auch dieses Schema entspricht den Regeln des Aussagenkalküls. Entsprechend ist es, falls mehrere freie Gegenstandsvariable auftreten. Endlich kommen wir zu γ). Ein Ausdruck A → B(x) geht (falls A keine freie Variable enthält) durch unsere Umformung über in (x) A → B(x) , A → B(1) & A → B(2) usw. A → (x)B(x) verwandelt sich in: A → B(1) & B(2). Beide Formeln sind aber nach den Regeln des Aussagenkalküls äquivalent. Ebenso ist es, falls A noch freie Variablen enthält. Entsprechendes gilt für die Regel γ), soweit sie das Hinzufügen eines Existentialzeichens betrifft. Wir haben damit tatsächlich gezeigt, daß jede aus den Axiomen ableitbare Formel durch unsere Umformung in eine immer richtige Aussagenverbindung übergeht. (Ex)F (x) → (x)F (x) hat nun diese Eigenschaft nicht, denn die Umformung dafür lautet: F (1) ∨ F (2) → F (1) & F (2), A ∨ B → A & B, und dies ist keine immer richtige Aussagenformel. Wir haben damit die Unvollständigkeit unseres Axiomensystems gezeigt. Ob das Axiomensystem wenigstens in dem Sinne vollständig ist, daß wirklich alle logischen Formeln, die für jeden Individuenbereich richtig sind, daraus abgeleitet werden können, ist eine noch ungelöste Frage. Es läßt sich nur rein empirisch sagen, daß bei allen Anwendungen dieses Axiomensystem immer ausgereicht hat. Die Unabhängigkeit der einzelnen Axiome ist noch nicht untersucht worden. § 10. Beispiele für die Anwendung des Funktionenkalküls zu formalen Beweisführungen. Wir haben den Funktionenkalkül bisher nur benutzt, um logische Formeln, in dem in § 6 erklärten Sinne, abzuleiten. Die Prämissen unserer Schlüsse, die Grundformeln a) bis f) waren dabei selbst wieder rein logischer Natur. Wir wollen nun die allgemeine Methode der formalen Ausführung logischer
68
870
69
70
Appendices
Schlüsse im Funktionenkalkül, die wir vor der Aufstellung der Axiome nur andeutungsweise beschreiben konnten, an ein paar Beispielen darlegen. Das allgemeine hierbei anzuwendende Verfahren besteht darin, daß die Prämissen der Schlüsse symbolisch | aufgeschrieben und als richtige Formeln zu den logischen Grundformeln a) bis f) hinzugefügt werden, mit denen zusammen sie die Ausgangsformeln für die gemäß den Grundregeln α), β), γ) zu vollziehenden formalen Operationen bilden. Ehe man an die symbolische Formulierung der Voraussetzungen geht, müssen zuerst die individuellen Zeichen eingeführt werden, und bei den bestimmten Funktionen sind die Gegenstandsgattungen anzugeben, auf welche sich ihre Leerstellen beziehen. Der Beweis ist geliefert, wenn die symbolische Darstellung der zu beweisenden Behauptung sich als richtige Formel ergibt. Als erstes Beispiel möge ein Schluß dienen, in welchem ein singuläres Urteil als Prämisse auftritt. Ein Schluß dieser Art liegt vor bei dem bekannten Schulbeispiel: „Alle Menschen sind sterblich, Cajus ist ein Mensch, also ist Cajus sterblich.“ In diesem Satz kommen drei individuelle Bezeichnungen vor. Den Worten „Mensch“ und „sterblich“ entsprechen zwei Prädikate M s(x) und St(x)1 , für welche als gemeinsame zugehörige Gegenstandsgattung die der Lebewesen betrachtet werden kann. Das dritte individuelle Zeichen ist der Eigenname „Cajus“. Die beiden Prämissen lauten als Formeln geschrieben: (x) M s(x) → St(x) , M s(Cajus). Durch Einsetzung in die Formel (x)F (x) → F (y) erhält man: (x) M s(x) → St(x) → M s(y) → St(y) und weiter: (x) M s(x) → St(x) → M s(Cajus) → St(Cajus) , M s(Cajus) → St(Cajus) [Regel β)], St(Cajus) [Regel β)]. Die letzte Formel ist aber die symbolische Darstellung unseres Schlußsatzes „Cajus ist sterblich“. Es sollen noch zwei Beispiele von mathematischen Schlußfolgerungen gegeben werden. Zunächst behandeln wir den folgenden geometrischen Schluß: Voraussetzung: „Durch zwei verschiedene Punkte geht höchstens eine Gerade.“ Behauptung: „Zwei verschiedene Geraden haben nicht mehr als einen Punkt gemeinsam.“ Die hierin auftretenden Funktionen sind folgende: Zunächst die Relation Λ(x, y): „x liegt auf y.“ Hier bezieht sich die erste Leerstelle auf die Gattung 1
Wir wählen hier als Bezeichnung für die individuellen Funktionen zwei Buchstaben zur deutlichen Unterscheidung von den Funktions-Variablen.
5
10
15
20
25
30
35
40
Grundzüge der theoretischen Logik
5
871
der Punkte, die zweite auf die der Geraden. Ferner kommt vor das Prädikat der Verschiedenheit, also das Gegenteil des Prädikates der Identität ≡ (x, y). Die Leerstellen dieses Prädikates können sich sowohl auf Punkte als auf Geraden beziehen; natürlich ist die Behauptung der Identität eines Punktes mit einer Geraden stets als falsch zu betrachten. Der Deutlichkeit halber wollen wir die Argumente, welche sich auf die Gattung der Punkte beziehen, mit kleinen, diejenigen, welche sich auf Geraden beziehen, mit großen lateinischen Buchstaben bezeichnen1 . Eigennamen von Individuen kommen nicht vor. Der symbolische Ausdruck für die Voraussetzung ist: (x)(y){ ≡ (x, y) → (EG)(EH)[ ≡ (G, H) & Λ(x, G) & Λ(x, H)
10
& Λ(y, G) & Λ(y, H)]}. Die Behauptung schreibt sich: (G)(H){ ≡ (G, H) → (Ex)(Ey)[ ≡ (x, y) & Λ(x, G) & Λ(x, H) & Λ(y, G) & Λ(y, H)]}. 15
20
25
30
35
Schreiben wir zur Abkürzung für: Λ(x, G) & Λ(y, G) & Λ(x, H) & Λ(y, H) : A(x, y, G, H), und machen wir von der Definition des Zeichens → Gebrauch, so erhalten wir als Darstellung für die Voraussetzung und Behauptung: (x)(y){≡ (x, y) ∨ (EG)(EH)[ ≡ (G, H) & A(x, y, G, H)]} bzw. (G)(H){≡ (G, H) ∨ (Ex)(Ey)[ ≡ (x, y) & A(x, y, G, H)]}. Nach der in § 8 gegebenen Regel über die Bildung des Gegenteils eines Ausdrucks kann man die beiden Ausdrücke umformen zu (x)(y){≡ (x, y) ∨ (G)(H)[≡ (G, H) ∨ A(x, y, G, H)]}, (G)(H){≡ (G, H) ∨ (x)(y)[≡ (x, y) ∨ A(x, y, G, H)]}. Beide Ausdrücke bringen wir nun auf die Normalform und erhalten: (x)(y)(G)(H){≡ (x, y) ∨ ≡ (G, H) ∨ A(x, y, G, H) }, (G)(H)(x)(y){≡ (G, H) ∨ ≡ (x, y) ∨ A(x, y, G, H) }. Aus diesen Darstellungen ersieht man ohne weiteres, daß die Behauptung sich aus der Voraussetzung ableiten läßt. Die Formel für die Voraussetzung geht nämlich in die Formel für die Behauptung über, wenn man auf die Produkte das assoziative und das kommutative Gesetz, und auf die Allzeichen die Vertauschungsregel anwendet. Zu|gleich erkennen wir, daß auch umgekehrt von der Gültigkeit der Behauptung auf die der Voraussetzung geschlossen werden kann. Das zweite Beispiel für einen mathematischen Schluß soll darin bestehen, daß wir den Satz von der Transitivität der Beziehung des Kleineren zum Größeren beweisen. Dieser Satz, dessen Darstellung durch die Formel <(x, y) & <(y, z) → <(x, z) 1
Eine Verwechslung mit Aussagevariablen kann hier nicht entstehen.
71
872
72
Appendices
uns bereits bekannt ist, wollen wir hier im Sinne der Größenlehre auffassen. Wir denken uns die Leerstellen der Funktion <(x, y) auf eine bestimmte Größenart (z. B. Streckenlängen oder positive Maßzahlen) bezogen, und betrachten ferner die Relation <(x, y) als abgeleitet aus der Addition der Größen. Wir führen das Zeichen Φ(x, y, z) für das dreigliedrige Prädikat „x um y vermehrt gibt z“ (oder arithmetisch geschrieben: „x+y = z“) ein. Mit Hilfe dieses Prädikats läßt sich <(x, y) definieren durch (Eu)Φ(x, u, y). („Es gibt ein u, welches zu x hinzugefügt y ergibt.“) Setzen wir diese Definition in unsere Behauptung ein, so nimmt diese folgende Gestalt an: [(Eu)Φ(x, u, y) & (Eu)Φ(y, u, z)] → (Eu)Φ(x, u, z). In dieser Form läßt sich der betrachtete Satz beweisen, sofern für die Addition der Größen folgende zwei Voraussetzungen zugrunde gelegt werden: 1. „Zwei Größen lassen sich stets addieren,“ d. h. (Ez)Φ(x, y, z). 2. „Für die Größenaddition gilt das assoziative Gesetz x + (y + z) = (x + y) + z, “ d. h. [Φ(x, y, u) & Φ(y, z, v) & Φ(u, z, w)] → Φ(x, v, w). Die beiden Voraussetzungen sind in der Normalform mit Anwendung von freien Variablen dargestellt. Bringen wir auch die Behauptung auf die Normalform, so nimmt sie die folgende Gestalt an: (u)(v)(Ew) Φ(x, u, y) ∨ Φ(y, v, z) ∨ Φ(x, w, z) . Hierfür kann man auch schreiben: (u)(v)(Ew) Φ(x, u, y) & Φ(y, v, z) → Φ(x, w, z) . Diese Formel läßt sich nun auf Grund unserer Voraussetzungen folgendermaßen ableiten: Durch Umbenennung der Variablen erhält man aus den beiden Voraussetzungen: 1. (Ew)Φ(u, v, w). 2. Φ(x, u, y) & Φ(u, v, w) & Φ(y, v, z) → Φ(x, w, z). Wendet man auf die zweite Voraussetzung die Regel VII, S. 28 an, so kann man sie umformen zu: Φ(u, v, w) → [ Φ(x, u, y) & Φ(y, v, z) → Φ(x, w, z)]. Unter Benutzung der zu Formel (34) gehörigen Regel kann man daraus ableiten: (Ew)Φ(u, v, w) → (Ew)[ Φ(x, u, y) & Φ(y, v, z) → Φ(x, w, z)]. Da nun (Ew)Φ(u, v, w) als richtig angenommen wurde, so ergibt sich weiter (Ew) Φ(x, u, y) & Φ(y, v, z) → Φ(x, w, z) . Daraus ergibt sich die Behauptung, indem man nach Regel γ die Allzeichen (u) und (v) vorsetzt.
5
10
15
20
25
30
35
40
Grundzüge der theoretischen Logik
873
§ 11. Das Entscheidungsproblem im Funktionenkalkül und seine Bedeutung.
5
10
15
20
25
30
35
Nach der durch die letzten Beispiele gekennzeichneten Methode kann man den Funktionenkalkül insbesondere zur axiomatischen Behandlung von Theorien verwenden. Für diesen Zweck ist der Kalkül sehr geeignet. Infolge der streng formalen Behandlungsweise wird nämlich verhütet, daß bei der Ableitung aus den Axiomen versteckte Voraussetzungen mitbenutzt werden. Die mathematische Logik leistet aber noch mehr als eine Verschärfung der Sprache durch die symbolische Darstellung der Schlußweisen. Nachdem einmal der logische Formalismus feststeht, kann man erwarten, daß eine systematische, sozusagen rechnerische Behandlung der logischen Formeln möglich ist, die etwa der Theorie der Gleichungen in der Algebra entsprechen würde. Eine ausgebildete „Algebra der Logik“ begegnete uns im Aussagenkalkül (man vgl. insbesondere § 4–9 des I. Kapitels). Die wichtigsten der dort erwähnten und gelösten Probleme waren das der Allgemeingültigkeit und der Erfüllbarkeit eines logischen Ausdrucks. Beide Probleme zusammen pflegt man auch kurz als das Entscheidungsproblem zu bezeichnen. Bei dem Problem der Allgemeingültigkeit handelt es sich um die folgende Frage: Wie kann man bei einem beliebigen vorgelegten logischen Ausdruck, der keine individuellen Zeichen enthält, feststellen, ob der Aus|druck bei beliebigen Einsetzungen für die vorkommenden Variablen eine richtige Behauptung darstellt oder nicht? Bei dem Problem der Erfüllbarkeit handelt es sich um die Frage, ob es überhaupt eine Einsetzung für die Variablen gibt, so daß durch den betreffenden Ausdruck eine richtige Behauptung dargestellt wird. Beide Probleme sind zueinander dual. Ist ein Ausdruck nicht allgemeingültig, so ist das Gegenteil erfüllbar und umgekehrt. Das Entscheidungsproblem läßt sich nun auch für den Funktionenkalkül aufwerfen. Zu den Aussagenvariablen treten hier die Funktionsvariablen hinzu. Die Individuenvariablen wollen wir uns hier immer durch vorgesetzte Klammerzeichen gebunden denken. Man kann sich übrigens auf den Fall beschränken, daß die Aussagenvariablen fehlen. Diese lassen sich nämlich nach den in § 8 des I. Kapitels gemachten Bemerkungen immer eliminieren. Ein Beispiel für eine allgemeingültige Formel des Funktionenkalküls ist die folgende Formel: (x) F (x) ∨ F (x) . Diese ist richtig, welches Prädikat auch für F eingesetzt wird. Die Formel (Ex)F (x)
40
ist zwar nicht allgemeingültig, aber erfüllbar. Wir brauchen hier ja nur das Prädikat „mit sich selber identisch sein“ zu nehmen. Dieses trifft nicht nur auf einen, sondern sogar auf alle Gegenstände zu. Daraus ergibt sich, daß auch (x)F (x) einen erfüllbaren Ausdruck darstellt. Weitere Beispiele für allgemeingültige Formeln sind
73
874
Appendices
(x)(Ey) R(x, x) ∨ R(x, y) , (Ex)(y) R1 (x, x) ∨ R1 (y, y) ∨ R2 (x, y) sowie alle Formeln, die sich aus den logischen Axiomen ableiten lassen, z. B. unsere früheren Formeln (21)–(36). Nicht allgemeingültig ist dagegen (x)F (x, x),
5
nicht erfüllbar
74
(Ex)(y) F (x, x) & F (x, y) . Das Entscheidungsproblem ist gelöst, wenn man ein Verfahren kennt, das bei einem vorgelegten logischen Ausdruck durch endlich viele Operationen die Entscheidung über die Allgemeingültigkeit bzw. Erfüllbarkeit erlaubt. Die Lösung des Entscheidungsproblems ist für die Theorie aller Gebiete, deren Sätze überhaupt einer logischen Entwickelbarkeit aus endlich | vielen Axiomen fähig sind, von grundsätzlicher Wichtigkeit. Es soll dies an Hand eines bestimmten Beispiels gezeigt werden. In der Untersuchung der logischen Abhängigkeitsverhältnisse zwischen den verschiedenen Axiomgruppen der Geometrie ist es ein besonders wichtiges und interessantes Ergebnis, daß der spezielle Pascalsche Satz, welcher bei der Begründung der Proportionenlehre ohne Anwendung der Stetigkeitsaxiome eine wesentliche Rolle spielt, aus den Axiomen der Verknüpfung, der Anordnung und dem Parallelenaxiom allein nicht bewiesen werden kann. Wir wollen uns klar machen, daß mit der Lösung des Entscheidungsproblems ein Verfahren gegeben wäre, durch das jene Unbeweisbarkeit sich wenigstens grundsätzlich feststellen lassen müßte, wenn auch vielleicht die Umständlichkeit des Verfahrens die praktische Durchführung illusorisch machen könnte. Die erste wesentliche Bemerkung hierzu ist, daß wir die in Betracht kommenden Axiome sowie den speziellen Pascalschen Satz durch unseren logischen Kalkül ausdrücken können. Zunächst können die Axiome so umgeformt werden, daß nur von einer Art von Dingen, nämlich von Punkten die Rede ist. Wir brauchen dazu nur anstatt der Grundbeziehung zwischen Punkten und Geraden („der Punkt x liegt auf der Geraden y“ oder „die Punkte x, y bestimmen die Gerade z“) eine Beziehung zwischen drei Punkten Ger(x, y, z) („x, y und z liegen auf einer Geraden“) einzuführen. Ebenso nehmen wir statt der Grundbeziehungen zwischen Punkten und Ebenen eine Beziehung zwischen vier Punkten Eb(x, y, z, u) („x, y, z, u liegen in einer Ebene“). Zu diesen beiden Prädikaten müssen wir noch die Identitätsbeziehung ≡ (x, y) sowie die Zwischenbeziehung Zw(x, y, z) („x liegt zwischen y und z“) hinzunehmen. Mit Hilfe der vier eingeführten Beziehungen lassen sich nun alle bei unserem Problem vorkommenden Axiome sowie auch der Pascalsche Satz durch logische Formeln darstellen. Z. B. wird das Axiom: „durch zwei Punkte geht nur eine einzige Gerade“ ausgedrückt durch die Formel (x)(y)(u)(v){[Ger (x, y, u)&Ger (x, y, v)& ≡ (x, y)& ≡ (u, v)] → Ger (x, u, v)},
10
15
20
25
30
35
40
Grundzüge der theoretischen Logik
5
10
15
20
25
30
35
40
875
in Worten: „Wenn x, y und u auf einer Geraden und x, y, v auf einer Geraden liegen und wenn ferner x von y und u von v verschieden ist, dann liegen auch x, u, v auf einer Geraden.“ Das Axiom: „Wenn zwei Ebenen einen Punkt gemeinsam haben, so haben sie mindestens noch einen anderen Punkt gemeinsam“, drückt sich aus durch die Formel (x)(y)(z)(u)(v)(w)(p){[Eb(x, y, z, p) & Eb(u, v, w, p)] → (Eq) ≡ (p, q) &Eb(x, y, z, q) & Eb(u, v, w, q) }. Dem für die Anordnung in der Ebene wesentlichen Axiom, „wenn eine | Gerade, die in der Ebene eines Dreiecks liegt, eine Seite dieses Dreiecks schneidet, so schneidet sie auch eine andere Seite dieses Dreiecks“, entspricht die folgende Formel: (x)(y)(z)(u)(v){[Eb(x, y, z, u) & Ger(x, y, z) & Zw(v, x, y) & Ger(x, y, u) & Ger(z, u, v)] → (Ew)[Ger(u, v, w) & Zw(w, x, z) ∨ Zw(w, y, z) ]}. Zu beachten ist bei der Einführung der Beziehungen „Ger “ und „Eb“, daß für diese die Symmetrieeigenschaften als Axiome formuliert werden müssen. So hat man die Formel (x)(y)(z){Ger(x, y, z) → Ger(x, z, y) & Ger(y, x, z) } und die entsprechende für Eb aufzustellen. Die Eigenschaften der Identitätsbeziehung sind ebenfalls als Axiome zu formulieren: (x) ≡ (x, x), (x)(y)(z){≡ (x, z)& ≡ (y, z) →≡ (x, y)}, (x)(y)(z)(u){ ≡ (x, u) & Ger(x, y, z) → Ger(u, y, z)}, (x)(y)(z)(u)(v){ ≡ (x, v) & Eb(x, y, z, u) → Eb(v, y, z, u)}. (x)(y)(u)(z){ ≡ (x, y) & Zw(x, u, z) → Zw(y, u, z)}. (x)(y)(u)(z){ ≡ (x, y) & Zw(u, x, z) → Zw(u, y, z)}. Die vier letzten Formeln bringen zum Ausdruck, daß in jeder vorkommenden Beziehung Identisches füreinander gesetzt werden kann. Denken wir nun uns alle in Formeln geschriebenen Axiome durch &-Zeichen zu einer einzigen Formel verbunden. Diese stellt die Gesamtbedingung dar, welcher die Prädikate „≡“, „Ger “, „Zw “, „Eb“ unterworfen sind oder, wie man sich in der Axiomatik auch ausdrückt, sie enthält die implizite Definition dieser Prädikate. Zur Abkürzung für diese Formel möge A(≡, Ger, Zw, Eb) geschrieben werden. Der spezielle Pascalsche Satz lautet in der gewöhnlichen Ausdrucksweise folgendermaßen: Es seien ABC und A B C je drei Punkte auf zwei sich schneidenden Geraden. Alle genannten Punkte seien vom Schnittpunkt der beiden Geraden verschieden. Ist dann BC parallel zu CB und CA parallel zu AC , so ist auch AB parallel zu BA . — Dieser Satz läßt sich wieder durch eine logische Formel darstellen, wobei von den Prädikaten nur ≡ und „Ger “ auftreten. Wir wollen diese Formel mit P(≡, Ger) bezeichnen.
75
876 76
Appendices
Die in Rede stehende Behauptung besagt nun, daß aus nicht
A(≡, Ger, Zw, Eb) P(≡, Ger)
bewiesen werden kann. In dieser Behauptung kommt die sachlich-geometrische Bedeutung von ≡, Ger, Zw, Eb nicht mehr vor. Denn entsprechend dem axiomatischen Standpunkt darf ja beim Beweise eines Satzes aus den geometrischen Axiomen nichts anderes von den eingeführten Grundbeziehungen benutzt werden, als was in den Axiomen ausdrücklich formuliert ist. Wir können daher diese Prädikate ganz eliminieren und an ihre Stelle vier variable Prädikate — natürlich mit der entsprechenden Zahl von Argumenten — setzen:
5
10
F (x, y); G(x, y, z); H(x, y, z); K(x, y, z, u). Die Beweisbarkeit des Pascalschen Satzes würde bedeuten, daß für irgend vier solche Prädikate F , G, H, K, für welche A(F, G, H, K) wahr ist, auch stets P(F, G) wahr ist, daß also A(F, G, H, K) → P(F, G) eine allgemeingültige logische Formel ist. Es handelt sich also darum, zu erkennen, daß dies nicht der Fall ist. Im Falle der Bekanntheit eines allgemeinen Entscheidungsverfahrens für die Gültigkeit logischer Formeln wäre nun diese Aufgabe auf einem vorgeschriebenen Wege zu lösen, so daß man sich das Suchen nach einem besonderen Unabhängigkeitsbeweise für den Pascalschen Satz ersparen könnte. Auf dieselbe Weise ließe sich für jeden anderen geometrischen Satz feststellen, ob er eine logische Folge der Axiome ist oder nicht. Auch Fragen der Widerspruchsfreiheit würden sich an Hand des Entscheidungsverfahrens lösen lassen. Z. B. ist die Frage, ob die in der Formel A(≡, Ger, Zw, Eb) zusammengefaßten geometrischen Axiome miteinander logisch verträglich sind, gleichbedeutend mit der anderen, ob die Bedingung A(F, G, H, K)
15
20
25
30
durch Prädikate F (x, y); G(x, y, z); H(x, y, z); K(x, y, z, u) überhaupt erfüllbar ist oder, anders ausgedrückt, ob die Formel 77
A(F, G, H, K) keine allgemeingültige logische Formel ist. Ähnliche Überlegungen gelten natürlich für jedes beliebige Axiomensystem. Die fundamentale Bedeutung, die das Entscheidungsproblem besitzt, dürfte damit genügend illustriert sein; das Entscheidungsproblem muß als das Hauptproblem der mathematischen Logik bezeichnet werden.
35
40
Grundzüge der theoretischen Logik
877
§ 12. Lösungen des Entscheidungsproblems für besondere Spezialfälle.
5
10
15
20
25
30
35
Während im Aussagenkalkül das Entscheidungsproblem unschwer zu lösen war, bildet im Funktionenkalkül die Auffindung eines allgemeinen Entscheidungsverfahrens ein noch ungelöstes schwieriges Problem. Für gewisse einfache Fälle ist es jedoch gelungen, ein derartiges Verfahren anzugeben. Der einfachste Fall, der sich hier darbietet, ist der folgende: Es sollen in den logischen Ausdrücken nur Funktionsvariable mit einem Argument, also Prädikate im engeren Sinne, vorkommen; die mehrgliedrigen Prädikate werden also ausgeschlossen. Die grundsätzliche Möglichkeit der Entscheidung in diesem Bereich ist zuerst von L. Löwenheim erkannt worden1 . Ein übersichtliches Entscheidungsverfahren ist von H. Behmann gegeben worden2 . Löwenheim und Behmann nehmen übrigens zu den variablen Prädikaten noch die Identität als individuelle Relation hinzu. Der Bereich der zugelassenen Formeln entspricht dem Bereiche, der durch Kombination des Aussagen- und Klassenkalküls entsteht, also dem Bereiche der Kantisch-Aristotelischen Logik. Wir können uns auf elementarem Wege von der Entscheidbarkeit in dem angegebenen Bereiche überzeugen. Es liege eine Formel aus diesem Bereich vor. Es sei k die Anzahl der verschiedenen in der betrachteten Formel vorkommenden Funktionszeichen A, B, . . . K. Wir behaupten nun: Wenn die Formel in allen Fällen, wo der Individuenbereich aus höchstens 2k Gegenständen besteht, immer richtige Aussagen (durch Einsetzung bestimmter Prädikate an Stelle von A, B, . . . K) liefert, so liefert sie überhaupt immer richtige Aussagen. Zum Beweise nehmen wir an, daß die betrachtete Formel für ein gewisses System von mehr als 2k Individuen bei Ersetzung der Funktionszeichen A, B, . . . K durch die bestimmten Prädikate A0 , B0 , . . . K0 eine falsche Aussage ergäbe. Wir wollen dann aus dieser Aussage eine andere falsche Aussage ableiten, die ebenfalls durch | Spezialisierung der betrachteten Formel entsteht und die sich auf ein System von höchstens 2k Individuen bezieht. Wir teilen die Gegenstände, auf welche sich die vorgelegte falsche Aussage (mit den Prädikaten A0 , B0 , . . . K0 bezieht, in Klassen ein, indem wir zwei Gegenstände a, b zur selben Klasse rechnen, wenn die Aussagen A0 (a), B0 (a), . . . K0 (a) bezüglich wahrheitsgleich sind mit A0 (b), B0 (b), . . . K0 (b) also A0 (a) wahrheitsgleich mit A0 (b), „ „ B0 (b), B0 (a) ................................... 1
L. Löwenheim: Über Möglichkeiten im Relativkalkül. Math. Ann. Bd. 76. Löwenheim 1915 2 H. Behmann: Beiträge zur Algebra der Logik und zum Entscheidungsproblem. Math. Ann. Bd. 86. Behmann 1922
78
878
Appendices
K0 (a) wahrheitsgleich mit K0 (b). Auf diese Weise erhalten wir höchstens 2k Klassen. Nämlich für einen Gegenstand a kann A0 (a) nur richtig oder falsch sein, dasselbe gilt für B0 (a) usw. Im ganzen gibt es also nur 2k Möglichkeiten für die Verteilung von Richtigkeit und Falschheit auf die Aussagen A0 (a), B0 (a), . . . K0 (a),
79
und wenn für zwei Gegenstände dieselbe Verteilung vorliegt, so gehören sie zur selben Klasse. Es seien α1 , α2 , . . . αn die verschiedenen Klassen, die wir so erhalten, wobei also n 2k ist. Wir nehmen nun die Gesamtheit der Klassen α1 , α2 , . . . αn als ein neues System von Gegenständen. In bezug auf diese Gegenstände definieren wir k Prädikate A1 , B1 , . . . K1 in folgender Weise: A1 trifft für die Klasse αp (p = 1, . . . n) dann und nur dann zu, wenn A0 auf die zu αp gehörigen ursprünglichen Gegenstände zutrifft. Entsprechend ist die Definition von B1 , . . . K1 . Ersetzt man nun in einer beliebigen aus den Prädikaten A0 , B0 , . . . K0 mit Hilfe der logischen Zeichen gebildeten Aussage A0 durch A1 , B0 durch B1 , . . . , K0 durch K1 , und nimmt man als Werte der Variablen anstatt der anfänglichen Gegenstände die Klassen α1 , α2 , . . . αn , und ersetzt jeden gegebenenfalls in der Aussage vorkommenden bestimmten Gegenstand durch die Klasse, zu der er gehört, so geht die Aussage in eine ihr wahrheitsgleiche über. Die Richtigkeit dieser Behauptung ist sofort ersichtlich, falls die betreffende Aussage keine Allzeichen und Seinszeichen enthält. Man beweist sie allgemein, indem man die Aussage in Normalform geschrieben denkt, und von der Gültigkeit für m voranstehende Klammerzeichen auf die Gültigkeit für m + 1 Zeichen schließt. Aus diesem Satz folgt nun insbesondere, daß jene falsche Aussage, die gemäß unserer Annahme aus der vorgelegten Formel nach Er|setzung der Funktionszeichen A, B, . . . K durch die Prädikate A0 , B0 , . . . K0 entsteht, wiederum in eine falsche Aussage übergeht, wenn wir die Prädikate A0 , B0 , . . . K0 durch A1 , B1 , . . . K1 ersetzen und als Werte für die Variablen die Klassen α1 , α2 , . . . αn nehmen. Demnach brauchen wir die Entscheidung nur für den Fall auszuführen, daß es sich um höchstens 2k , also um endlich viele Gegenstände handelt. Für diesen Fall läßt sich aber die Entscheidung durch ein endliches Verfahren erzwingen. Es seien a1 , a2 , . . . al (l 2k ) die Gegenstände, aus denen der Individuenbereich besteht. Ein Ausdruck (x)F (x) ist dann gleichbedeutend mit der endlichen logischen Summe: F (a1 ) & F (a2 ) & . . . & F (al ). Ebenso ist (Ex)F (x) gleichwertig mit F (a1 ) ∨ F (a2 ) ∨ . . . ∨ F (al ). Wir können also die All- und Seinszeichen in der betrachteten Formel sämtlich entfernen und erhalten eine Formel, welche aus den Grundaussagen
5
10
15
20
25
30
35
40
Grundzüge der theoretischen Logik
5
10
15
20
25
30
35
40
45
879
A(ar ), B(ar ), . . . K(ar ) (r = 1, . . . l) lediglich mit den logischen Zeichen des Aussagenkalküls gebildet ist. Setzen wir in der zuletzt gewonnenen Formel für jeden verschiedenen Grundbestandteil A(ar ), . . . K(ar ) eine besondere Aussagenvariable, so entsteht eine bestimmte Formel des Aussagenkalküls. Dann und nur dann, wenn diese letzte Aussagenformel immer richtig ist, ist auch die logische Formel, von der wir ausgingen, richtig. Mit der Entscheidung in dem angegebenen einfachen Bereich, in dem die Prädikate mit mehr als einer Leerstelle fehlen, ist natürlich noch nicht viel gewonnen. Gerade die Beziehungen, d. h. die mehrgliedrigen Prädikate, spielen ja z. B. bei der axiomatischen Grundlegung von mathematischen Disziplinen die Hauptrolle. Stellt man nun ganz allgemein für den Funktionenkalkül die Frage nach einem Entscheidungsverfahren, so muß man den folgenden Umstand besonders berücksichtigen: Die Allgemeingültigkeit bzw. Erfüllbarkeit eines logischen Ausdrucks kann davon abhängen, wie groß die Anzahl der Gegenstände im Individuenbereich ist. Z. B. ist (Ex)(Ey) F (x, x) & F (x, y) dann und nur dann erfüllbar, wenn es mindestens zwei Individuen gibt. Ebenso ist (x)(y) F (x, x) ∨ F (x, y) allgemeingültig, falls es genau einen Gegenstand im Individuenbereich gibt, sonst aber nicht. Diese Erscheinung tritt natürlich auch schon | in dem enge- 80 ren Bereich auf, in dem die mehrgliedrigen Prädikate fehlen. Wir brauchen ja nur an die früher erwähnte Formel (Ex)F (x) → (x)F (x) zu denken, die nur für den einzahligen Individuenbereich allgemeingültig ist. Abgesehen von den Ausdrücken, die für jeden Individuenbereich allgemeingültig (bzw. erfüllbar) sind, und abgesehen von denjenigen, die für keinen Bereich diese Eigenschaft haben, ist demnach die Postulierung der Allgemeingültigkeit bzw. Erfüllbarkeit eines logischen Ausdruckes äquivalent mit einer Aussage über die Anzahl der Individuen. Im weitgehendsten Sinne kann man das Entscheidungsproblem als gelöst bezeichnen, wenn man ein Verfahren hat, das bei jedem vorgelegten logischen Ausdruck die Entscheidung darüber gestattet, für welche Individuenbereiche er allgemeingültig bzw. erfüllbar ist und für welche nicht. Man kann aber auch zunächst die einfachere Frage stellen, wann ein vorgelegter Ausdruck für alle Individuenbereiche allgemeingültig ist und wann nicht. Um mit Hilfe des Entscheidungsverfahrens die Frage beantworten zu können, ob ein bestimmter Satz eines axiomatisch fundierten Gebietes aus diesen Axiomen beweisbar ist, würde die Lösung des Problems in dieser zweiten Fassung genügen. Für den Prädikatenkalkül fanden wir den Satz, daß ein Ausdruck dann und nur dann für jeden Individuenbereich allgemeingültig ist, falls er für ganz bestimmte endliche Individuenbereiche allgemeingültig ist. Im allgemeinen läßt sich im Funktionenkalkül ein Entscheidungsverfahren nicht auf diese Weise gewinnen. Es lassen sich nämlich Formeln aufstellen, die für
880
Appendices
jeden endlichen Individuenbereich allgemeingültig sind, nicht aber für einen unendlichen. Eine derartige Formel ist z. B. (Ex)(Ey)(Ez)(u) F (x, x) ∨ F (x, y) & F (y, z) & F (x, z) ∨ F (x, u) .
81
Jedoch gibt es ein bemerkenswertes Analogon zu dem obigen Satz für den Prädikatenkalkül, das von L. Löwenheim bewiesen ist. Löwenheim hat gezeigt, daß jeder Ausdruck, der für den abzählbaren Individuenbereich allgemeingültig ist, dieselbe Eigenschaft für jeden anderen Bereich hat 1 . Bei Löwenheim erscheint der Satz übrigens in der dualen Fassung: Jede Formel des Funktionenkalküls ist entweder widerspruchsvoll oder schon innerhalb eines abzählbar unendlichen Denkbereichs erfüllbar. Beispiele für Formeln, die für jeden Individuenbereich allgemeingültig sind, sind sämtliche Formeln, die man aus den von uns aufgestellten Axiomen des Funktionenkalküls beweisen kann. Da zu vermuten ist, daß das angegebene Axiomensystem alle derartigen Formeln | liefert, so würde man auch mit einer Charakterisierung der in diesem System beweisbaren Formeln der Lösung des Entscheidungsproblems näherrücken. Eine allgemeine Lösung des Entscheidungsproblems, mag man nun die erste oder die zweite Fassung nehmen, liegt bis jetzt noch nicht vor. Besondere Fälle des Entscheidungsproblems für mehrgliedrige Prädikate sind von P. Bernays und M. Schönfinkel1 , sowie von W. Ackermann2 behandelt und erledigt worden. Von Löwenheim stammt ein weiterer bemerkenswerter Satz3 . Er hat gezeigt, daß man sich bei der Behandlung der logischen Formeln auf solche beschränken kann, in denen nur Funktionszeichen mit höchstens zwei Leerstellen vorkommen, oder in der Schröderschen Ausdrucksweise: Der allgemeine Relativkalkül läßt sich auf den binären zurückführen.
5
10
15
20
25
Viertes Kapitel.
82
Der erweiterte Funktionenkalkül. § 1. Notwendigkeit einer Erweiterung des Kalküls. Für die inhaltliche Einstellung, welche wir bisher dem logischen Funktionenkalkül zugrunde legten, war wesentlich, daß wir die Aussagen und logischen Funktionen scharf von den Gegenständen sonderten, welche als Argument1
L. Löwenheim, l. c. Löwenheim 1915 Für diesen Satz von Löwenheim hat Th. Skolem einen einfacheren Beweis gegeben, s. Th. Skolem, Logisch-kombinatorische Untersuchungen über die Erfüllbarkeit oder Beweisbarkeit mathematischer Sätze. Viderskapselskapets Skrifter, I Math.-naturw. Kl. 1920, Nr. 4. Kristiania 1920. Skolem 1920 1 P. Bernays und M. Schönfinkel, Zum Entscheidungsproblem der mathematischen Logik, Math. Ann. Bd. 99. 1928. Bernays and Schönfinkel 1928 2 W. Ackermann, Über die Erfüllbarkeit gewisser Zählausdrücke (erscheint in den Math. Ann.). Ackermann 1928b 3 L. Löwenheim, l. c. Löwenheim 1915
30
Grundzüge der theoretischen Logik
5
10
15
20
25
30
35
40
881
werte der Funktionen in Betracht kommen. Nun hindert uns aber nichts, die Prädikate und Aussagen selbst als Gegenstände zu betrachten, denen Eigenschaften zukommen und zwischen denen Beziehungen bestehen. Betrachten wir z.B. einen logischen Ausdruck von der Form (x) A → F (x) . Dieser kann als eine Beziehung P (A, F ) zwischen einer Aussage und einem Prädikat aufgefaßt werden. Eine falsche Aussage A steht mit jedem F in der Beziehung P (A, F ); eine richtige Aussage A nur mit solchen F , für die (x)F (x) gilt. Weitere Beispiele liefern die Eigenschaften der Reflexivität, der Symmetrie und Transitivität von zweigliedrigen Relationen. Diesen entsprechen 3 Funktionen: Ref(R), Sym(R) und Tr(R), deren Argument R ein Funktionszeichen mit zwei Leerstellen ist. Symbolisch drücken sich diese drei Eigenschaften folgendermaßen aus: Ref(R): (x)R(x, x), Sym(R): (x)(y) R(x, y) → R(y, x) Tr(R): (x)(y)(z)[ R(x, y) & R(y, z) → R(x, z) ]. Alle drei Eigenschaften sind bei dem Prädikat ≡ (x, y) (x ist identisch mit y) erfüllt, bei dem Prädikat <(x, y) hingegen nur die der Transitivität. Es stellen also die Formeln Ref(≡), Sym(≡), Tr(≡), Tr(<) richtige Aussagen dar, während Ref(<) und Sym(<) falsche Aussagen sind. Eine Relation zwischen zwei Prädikaten ist die Beziehung der „Äquivalenz “, Aeq(F, G), welche durch den Ausdruck (x) F (x) ∼ G(x) definiert wird, und die darin besteht, daß die Prädikate F und G für dieselben Argumentwerte zutreffen bzw. nicht zutreffen. Weitere Be|ziehungen zwischen zwei Prädikaten sind Unverträglichkeit, Unv(F, G), und Implikation, Imp(F, G), die symbolisch definiert sind durch: (x) F (x) ∨ G(x) , (x) F (x) → G(x) . Eine noch weitergehende Ausdehnung des Formalismus besteht darin, daß wir das Allzeichen und das Seinszeichen in Verbindung mit Aussagen- und Funktionsvariablen anwenden; z. B. besagt die Formel (P )(x) P (x) ∨ P (x) , daß das Prädikatenprädikat (x) P (x) ∨ P (x) für jedes Prädikat P zutrifft. Die Formel (A)(F ) (x) A → F (x) ∼ A → (x)F (x) drückt aus, daß die durch (x) A → F (x) ∼ A → (x)F (x) definierte Beziehung zwischen Aussagen und Prädikaten für beliebige Aussagen und Prädikate zutrifft. Ein Fall der gleichen Art liegt vor bei der symbolischen Formulierung des Prinzips der vollständigen Induktion. Der Inhalt dieses Prinzips läßt sich folgendermaßen aussprechen:
83
882
Appendices
„Wenn ein Prädikat von der Zahl 1 gilt, und wenn es, falls es von irgendeiner Zahl gilt, auch von der nächstfolgenden gilt, so gilt das Prädikat von jeder Zahl.“ Führen wir das Zeichen Seq(x, y) für die Beziehung einer Zahl zur nächstfolgenden ein, so können wir das Prinzip so ausdrücken, daß wir {P (1) & (x)(y)[P (x) & Seq(x, y) → P (y)]} → (x)P (x) als eine richtige Formel postulieren. Will man nun noch durch die Schreibweise explizit zum Ausdruck bringen, daß die Formel für alle Prädikate P zutreffen soll, so kann man das Allgemeinheitszeichen (P ) vor die Formel setzen. Einen weiteren charakteristischen Fall bildet die Definition der Identität. Die Beziehung der Identität läßt sich definitorisch auf die logischen Grundbeziehungen zurückführen, indem man x als identisch mit y erklärt, sofern jedes Prädikat, das für x zutrifft, auch für y zutrifft, und umgekehrt. Im Sinne dieser Erklärung können wir das Funktionszeichen der Identität, ≡ (x, y), als eine Abkürzung auffassen für den Ausdruck (F ) F (x) ∼ F (y) . 84
In den angeführten Fällen ist der Gebrauch des Allgemeinheitszeichens, wenn auch sehr naheliegend, so doch nicht unerläßlich. Es | gibt jedoch Fälle, in denen der Gebrauch des Allzeichens notwendig ist, wenn man nicht auf wichtige Ausdrucksmöglichkeiten verzichten will. Ein solcher Fall tritt z. B. ein, wenn man Behauptungen darstellen will, in denen die Allgemeingültigkeit einer Aussage als Voraussetzung auftrifft. Will man z. B. ausdrücken, daß jede Relation R(x, y), welche mit der Identität äquivalent ist, auch die Eigenschaft der Symmetrie besitzt, so muß man dies folgendermaßen schreiben: (R){(x)(y)[R(x, y) ∼ (F ) F (x) ∼ F (y) ] → Sym(R)}. Hier kann das Allzeichen (F ) nicht fortgelassen werden, ohne daß der Sinn der Aussage geändert wird. Ebenso ist das Allzeichen unentbehrlich, falls von einem bestimmten Ausdruck gesagt werden soll, daß er nicht für alle Werte der darin vorkommenden Funktionsvariablen eine richtige Formel ist. Um etwa auszudrücken, daß (x)(y)F (x, y) keine allgemeingültige Formel ist, können wir die Formel (F )(x)(y)F (x, y) oder auch die gleichbedeutende (EF )(Ex)(Ey)F (x, y) anwenden. Ebenso verhält es sich bei vielen Sätzen der Logik, die allgemein von Aussagen, Prädikaten und Relationen handeln; z. B. gilt das bei dem Satz, daß es zu jeder Aussage X eine Aussage Y derart gibt, daß von den beiden Aussagen mindestens eine und nur eine richtig ist (d. h. also bei dem Satze von der Existenz des Gegenteils einer Aussage). Hierfür ergibt sich bei der erweiterten Symbolik die Darstellung (X)(EY )(X ∨ Y & X & Y ).
5
10
15
20
25
30
35
40
Grundzüge der theoretischen Logik
5
10
15
883
Mit der bisherigen Symbolik würde sich dagegen dieser Satz nicht wiedergeben lassen. Durch die Erweiterung der Symbolik sind wir auch instand gesetzt, Probleme und deren Lösungen symbolisch zu formulieren, bei denen wir uns bisher mit einer umständlichen inhaltlichen Beschreibung behelfen mußten. Ich erinnere z. B. an die Überlegungen, die wir in § 8 des I. Abschnittes anstellten. Die dort gefundenen Resultate lassen sich durch die folgenden Formeln wiedergeben: (X)(A1 X & A2 X) ∼ A1 & A2 , (EX)(A1 X & A2 X) ∼ A1 ∨ A2 . Diese Formeln geben eine Regel an, wie man einen Ausdruck, der Klammerzeichen für Aussagenvariable enthält, durch einen äquivalenten ersetzt, in dem diese Klammerzeichen nicht mehr vorkommen. Man entwickelt nämlich den Ausdruck jeweilig nach den zu den innersten Klammerzeichen gehörigen Variablen und schafft dann diese nach der | in den Formeln ausgedrückten Eliminationsregel fort. Z. B. erhält man aus (X1 )(X2 )(A1 X1 X2 & A2 X1 X 2 & A3 X 1 X2 & A4 X 1 X 2 ) zunächst durch Fortschaffung des Klammerzeichens (X2 ) (X1 ) (A1 & A2 )X1 & (A3 & A4 )X 1
20
und weiter A1 & A2 & A3 & A4 .
25
Diese jetzt symbolisch formulierbare Eliminationsregel erlaubt uns, die Richtigkeit bzw. Falschheit der Formeln zu erkennen, in denen nur Aussagenvariable und die zugehörigen Klammerzeichen vorkommen. Bei der obenerwähnten Formel (X)(EY )(XY & X & Y ) z. B. entwickeln wir zunächst XY & X & Y nach Y . Man erhält (X)(EY )(XY & X Y ). Die Elimination der innersten Klammerzeichen liefert
30
35
40
(X)(XX). XX ist aber ein allgemeingültiger Ausdruck, (X)(EY )(XY & X & Y ) demnach eine richtige Formel. Wir haben hier einen Spezialfall des Entscheidungsproblems für den erweiterten Funktionenkalkül. Das Entscheidungsproblem war vorher formuliert als das Problem der Allgemeingültigkeit bzw. Erfüllbarkeit für Ausdrücke, die von Aussagen und Funktionsvariablen abhängen. In dem erweiterten Kalkül sind auch Formeln möglich, die von keiner Variablen abhängen, die also bestimmte Aussagen darstellen. Für diese handelt es sich darum, über ihre Richtigkeit bzw. Falschheit zu entscheiden. Da wir jetzt für die Allgemeingültigkeit bzw. Erfüllbarkeit einen symbolischen Ausdruck haben, so kann man das Entscheidungsproblem immer in der zweiten Fassung betrachten. Der Allgemeingültigkeit bzw. Erfüllbarkeit z. B. einer Formel
85
884
Appendices
(Ex)(y) F (x, x) ∨ F (y, y) ∨ G(x, y) entspricht in dem erweiterten Kalkül die Richtigkeit der Formel (F )(G)(Ex)(y) F (x, x) ∨ F (y, y) ∨ G(x, y) bzw. (EF )(EG)(Ex)(y) F (x, x) ∨ F (y, y) ∨ G(x, y) .
86
Nun brauchen wir uns nicht auf die Formeln zu beschränken, in denen die zu den Funktionsvariablen gehörigen Klammerzeichen entweder alle Allzeichen oder alle Existenzialzeichen sind, sondern wir können ganz beliebige Kombinationen von All- und Existenzialzeichen zulassen, und können nach einem Kriterium für die Richtigkeit von derartigen | Formeln fragen. Die Lösung dieses allgemeinen Entscheidungsproblems würde uns nicht nur die Frage nach der Beweisbarkeit einfacher geometrischer Sätze zu beantworten gestatten, sondern uns auch die Entscheidung über die Beweisbarkeit bzw. Unbeweisbarkeit eines beliebigen mathematischen Satzes wenigstens prinzipiell ermöglichen. § 2. Anwendung des erweiterten Kalküls zur logischen Behandlung des Anzahlbegriffs. Der engere Funktionenkalkül war ausreichend, falls man nichts anderes mit ihm bezweckte als die Formalisierung des logischen Schließens, falls es sich nur darum handelte, einzelne Theorien für sich von ihren Prinzipien aus rein formal zu entwickeln. Sobald man aber die Grundlagen der Theorien, insbesondere der mathematischen Theorien, selbst zum Gegenstand der Untersuchung macht, sobald man sie daraufhin prüfen will, in welcher Beziehung sie zu der Logik stehen und inwieweit sie aus rein logischen Operationen und Begriffsbildungen gewonnen werden können, wird der erweiterte Kalkül unentbehrlich. Die erste wichtige Anwendung des erweiterten Kalküls ergibt sich bei der logischen Untersuchung des Anzahlbegriffs. Eine Anzahl ist kein Gegenstand im eigentlichen Sinne, sondern eine Eigenschaft. Die Individuen, denen eine Anzahl als Eigenschaft zukommt, können die gezählten Dinge nicht selbst sein, da jedes von den Dingen nur eines ist, so daß eine von Eins verschiedene Anzahl danach gar nicht vorkommen könnte. Dagegen läßt sich die Zahl als eine Eigenschaft desjenigen Begriffes auffassen, unter welchem die gewählten Individuen vereinigt werden. So kann z. B. die Tatsache, daß die Anzahl der Erdteile fünf ist, zwar nicht so ausgedrückt werden, daß jedem Erdteil die Anzahl fünf zukommt; wohl aber ist es eine Eigenschaft des Prädikates „Erdteil sein“, daß es auf genau fünf Individuen zutrifft. Die Zahlen erscheinen hiernach als Eigenschaften von Prädikaten, und für unseren Kalkül stellt sich eine bestimmte Zahl als individuelle Prädikatenfunktion dar. Die Wichtigkeit dieser Darstellung der Zahlen beruht darauf, daß die Prädikatenfunktionen, welche die Zahlen bilden, sich vollständig mit Hilfe der logischen Symbole ausdrücken lassen. Dadurch wird es möglich, die Zahlenlehre in die Logik einzubeziehen. Für die Zahlen 0, 1, 2, d. h. für die Funktionen 0(F ), 1(F ), 2(F ) sollen hier die Ausdrücke angegeben werden:
5
10
15
20
25
30
35
40
Grundzüge der theoretischen Logik
5
10
15
20
25
30
35
40
885
0(F ) : (Ex)F (x). („Es gibt kein x, für das F zutrifft.“) 1(F ) : (Ex)[F (x) & (y) F (y) →≡ (x, y) ]. („Es gibt ein x, für das F (x) besteht, und jedes y, für das F (y) besteht, ist mit diesem x identisch.“) 2(F ) : (Ex)(Ey){ ≡ (x, y) & F (x) & F (y) & (z)[F (z) →≡ (x, z)∨ ≡ (y, z)]}. („Es gibt zwei verschiedene x und y, auf die F zutrifft, und jedes z, für das F (z) besteht, ist mit x oder mit y identisch.“) Die Gleichzahligkeit zweier Prädikate F und G kann man als ein individuelles Prädikatenprädikat Glz(F, G) auffassen. Da die Gleichzahligkeit von F und G nichts anderes bedeutet, als daß man die Gegenstände, auf die F , und die Gegenstände, auf die G zutrifft, umkehrbar eindeutig aufeinander beziehen kann, so läßt sich Glz(F, G) durch den folgenden Ausdruck definieren: (ER){(x)[F (x) → (Ey) R(x, y) & G(y) ] & (y)[G(y) → → (Ex) R(x, y) & F (x) ] & (x)(y)(z)[ R(x, y) & R(x, z) → → ≡ (y, z) & R(x, z) & R(y, z) → ≡ (x, y) ]}. Die Addition der Zahlen läßt sich auf die Disjunktion von Prädikaten zurückführen. Sind nämlich F und G unverträgliche Prädikate, und kommt dem Prädikate F die Zahl m und dem Prädikate G die Zahl n zu, so entspricht dem Prädikate F ∨ G die Zahl m + n. Auf Grund dieser Auffassung der Addition werden Zahlengleichungen wie 1 + 1 = 2, 2 + 3 = 5 zu rein logischen, beweisbaren Sätzen. Z. B. stellt sich die Gleichung 1 + 1 = 2 dar durch die logische Formel: (F )(G) [Unv(F, G) & 1(F ) & 1(G)] → 2(F ∨ G) , deren rein logischer Charakter ersichtlich ist, wenn man für die Relation Unv sowie für die Prädikate 1, 2 die definierenden Ausdrücke einsetzt. Auch der allgemeine Zahlbegriff läßt sich mit den logischen Hilfsmitteln aufstellen. Soll ein Prädikatenprädikat Φ(F ) eine Zahl darstellen, so muß Φ den folgenden Bedingungen genügen: Bei zwei gleichzahligen Prädikaten F und G muß Φ für beide zutreffen oder für beide nicht zutreffen. Sind ferner zwei Prädikate F und G nicht gleichzahlig, so darf Φ höchstens für eins der beiden Prädikate F und G zutreffen. Formal stellt sich diese Bedingung für Φ folgendermaßen dar: (F )(G){ Φ(F ) & Φ(G) → Glz(F, G) & [Φ(F ) & Glz(F, G) → Φ(G)]}. Der ganze Ausdruck stellt eine Eigenschaft von Φ dar. Bezeichnen wir diese zur Abkürzung mit Z(Φ), so können wir also sagen: Eine Zahl ist ein Prädikatenprädikat Φ, das die Eigenschaft Z(Φ) besitzt. Eine Schwierigkeit tritt allerdings auf, wenn wir nach der Bedingung fragen, unter der zwei Prädikatenprädikate Φ und Ψ mit den Eigenschaften Z(Φ) und Z(Ψ) dieselbe Zahl definieren. Diese Bedingung besteht darin, daß Φ(P ) und Ψ(P ) für dieselben Prädikate P wahr und für dieselben Prädikate falsch sind, daß also die Beziehung besteht:
87
88
886
Appendices
(P ) Φ(P ) ∼ Ψ(P ) . Nehmen wir nun an, der zugrunde gelegte Individuenbereich bestände aus einer endlichen Anzahl von Gegenständen. Es tritt dann der Übelstand auf, daß alle Zahlen gleichgesetzt werden, welche größer sind als die Anzahl der Gegenstände im Individuenbereich. Denn ist diese Anzahl etwa kleiner als 1060 , und nehmen wir für Φ und Ψ die Prädikate, die die Zahlen 1060 und 1060 + 1 definieren, so trifft sowohl Ψ wie Φ auf kein Prädikat P zu. Die Relation (P ) Φ(P ) ∼ Ψ(P ) ist also für Φ und Ψ erfüllt, d. h. Φ und Ψ würden dieselbe Zahl darstellen. Um dieser Schwierigkeit zu entgehen, muß man den Individuenbereich als unendlich voraussetzen. Auf einen logischen Nachweis für die Existenz einer unendlichen Gesamtheit wird dabei freilich verzichtet. Von besonderem Interesse ist auch, wie unter Zugrundelegung der logischen Einführung des Anzahlbegriffs und allerdings wesentlicher Benutzung des genannten Axioms der Unendlichkeit die zahlentheoretischen Axiome zu logischen, beweisbaren Sätzen werden. Wir können hier aber nicht näher darauf eingehen. Die gemachten Bemerkungen sollten uns nur die Anwendungsfähigkeit des erweiterten Kalküls ins rechte Licht setzen1 . § 3. Darstellung der Grundbegriffe der Mengenlehre im erweiterten Kalkül.
89
Daß zwischen der Mengenlehre und der mathematischen Logik ein enger Zusammenhang besteht, ergab sich schon früher bei Vergleichung des Prädikaten- und des Klassenkalküls. Es konnten dieselben logischen Formeln nach Belieben als Beziehungen zwischen Klassen oder zwischen Prädikaten aufgefaßt werden, ohne daß es sich bei den beiden Deutungen um verschiedene logische Zusammenhänge handelte. Eine ähnliche Bemerkung gilt nun für den Funktionenkalkül. | Auch hier wird es möglich sein, die im Funktionenkalkül ausdrückbaren logischen Zusammenhänge als mengentheoretische Beziehungen aufzufassen. Um diesen Zusammenhang näher zu erkennen, wollen wir zunächst die Beziehung der Mengen zu den Prädikaten im engeren Sinne, d. h. den Prädikaten mit einer Leerstelle, genauer ins Auge fassen. — Eine Menge wird entweder durch Aufzählung ihrer Elemente gegeben, oder sie wird als das System derjenigen Dinge erklärt, für die ein bestimmtes Prädikat gültig ist. Die erste Art der Bestimmung einer Menge, welche nur bei endlichen Mengen möglich ist, brauchen wir nicht eigens in Betracht zu ziehen. Es läßt sich nämlich jede Menge, die man durch Aufzählung ihrer Elemente erhält, auch mit Hilfe eines Prädikats definieren. Z. B. kann eine Menge, die aus drei Individuen, a, b, 1 Für eine ausführliche und allgemeinverständliche Behandlung dieser Fragen vgl. man B. Russell, Einführung in die mathematische Philosophie. München 1923. Russell 1923
5
10
15
20
25
30
35
Grundzüge der theoretischen Logik
887
c, besteht, als die Menge derjenigen Dinge x erklärt werden, für welche das Prädikat ≡ (x, a) ∨ ≡ (x, b) ∨ ≡ (x, c) 5
10
15
20
25
30
35
40
zutrifft. Wir denken uns also jede Menge durch ein Prädikat definiert. Wir müssen dabei beachten, daß zwar jedes Prädikat die zu ihm gehörige Menge, d. h. die Menge der Gegenstände, welchen es zukommt, in eindeutiger Weise bestimmt, daß aber zu einer bestimmten Menge nicht nur ein definierendes Prädikat gehört, sondern daß vielmehr eine Menge auf verschiedene Arten durch Prädikate definiert werden kann. So ist die Menge der gleichseitigen Dreiecke dieselbe wie die Menge der gleichwinkligen Dreiecke oder, als außermathematisches Beispiel: die Menge der jetzt lebenden Wiederkäuer stimmt überein mit der Menge der jetzt lebenden Zweihufer. Die notwendige und hinreichende Bedingung dafür, daß zwei Prädikate P und Q dieselbe Menge bestimmen, besteht darin, daß die beiden Prädikate äquivalent sind, daß sie also die Beziehung Aeq(P, Q), d. h. (x) P (x) ∼ Q(x) erfüllen. Im Sinne der Mengenlehre ist also die Beziehung Aeq(P, Q) nichts anderes als die Identität von P und Q. Ebenso wie man die Prädikate als Mengen auffaßt, kann man eine Prädikatenfunktion F (P ) als Eigenschaft von Mengen deuten. Damit diese Deutung möglich ist, ist es notwendig, daß das Zutreffen oder Nichtzutreffen von F für ein Prädikat P eindeutig durch die zu P gehörige Menge bestimmt ist, und nach dem oben Bemerkten besteht die hierfür entscheidende Bedingung darin, daß die Aussagen, welche äquivalenten Prädikaten durch die Funktion F zugeordnet werden, gleichzeitig richtig oder gleichzeitig falsch sind. Es muß also für die Funktion F die symbolische Beziehung (P )(Q){Aeq(P, Q) → F (P ) → F (Q) } bestehen, die wir zur Abkürzung mit M(F ) bezeichnen. Diese Bedingung ist z. B. erfüllt für Prädikatenfunktionen, die Zahlen darstellen. Auf dieser Eigenschaft der Zahlen beruht es, daß sie auch als Prädikate von Mengen betrachtet werden können. Die Darstellung der Zahlen als Eigenschaften von Mengen hat gegenüber ihrer Darstellung als Eigenschaften von Prädikaten den Vorzug, daß die Invarianz der Anzahl bei Ersetzung eines Prädikates durch ein äquivalentes hier selbstverständlich ist. Aus der Beziehung zwischen Mengen und Prädikaten ergibt sich weiter ein Zusammenhang zwischen den Mengen von Mengen und Prädikatenprädikaten. Jede Menge von Mengen ist definiert durch eine Eigenschaft, welche den ihr angehörigen Mengen zukommt. Nehmen wir nun zwei Mengenprädikate, d. h. zwei Prädikatenfunktionen F (P ) und G(P ), die der Bedingung M(F ) und M(G) genügen. Diesen beiden Mengenprädikaten F und G entspricht dieselbe Menge von Mengen, wenn F und G für dieselben Mengen zutreffen bzw. nicht zutreffen. Die Beziehung (P ) F (P ) ∼ G(P ) bedeutet also, daß die F und G entsprechenden Mengen von Mengen identisch sind.
90
888
Appendices
Die mengentheoretische Interpretation des erweiterten Funktionenkalküls läßt sich auch auf die Prädikate mit mehreren Leerstellen ausdehnen. Jedes Prädikat R(x, y) wählt aus der Menge aller möglichen Paare (x, y) eine bestimmte Menge von geordneten Paaren heraus, nämlich die Menge derjenigen Paare (x, y), für die R(x, y) besteht. Die zugehörigen Mengen sind bei zwei Prädikaten R1 und R2 identisch, wenn die Beziehung Aeq(R1 , R2 ), d. h. (x)(y) R1 (x, y) ∼ R2 (x, y) besteht. Soll eine Prädikatenfunktion F (R) als Funktion der zu den Relationen gehörigen Mengen gedeutet werden können, so muß sie der Beziehung (R1 )(R2 ){Aeq(R1 , R2 ) → F (R1 ) → F (R2 ) } Genüge leisten. Das Entsprechende gilt für Prädikate mit drei und mehr Leerstellen. Wir sehen daraus, daß der erweiterte Funktionenkalkül ebensogut eine mengentheoretische wie eine rein logische Interpretation zuläßt. Die Zahlenlehre läßt sich ganz im Sinne der mengentheoretischen Auffassung behandeln. Wir sahen schon, daß man die die Zahlen definierenden Prädikatenprädikate ebensogut als Mengenprädikate auffassen kann. Ferner wurde früher gesagt, daß zwei Prädikatenprädikaten Φ(P ) und Ψ(P ), die Zahlen darstellen, dann dieselbe Zahl entspricht, wenn zwischen Φ und Ψ die Beziehung (P ) Φ(P ) ∼ Ψ(P )
91
besteht. Daraus ergibt sich aber, daß man die Zahlen auch als Mengen von Mengen auffassen kann. Bei der logischen Erklärung war eine | Zahl ein Prädikatenprädikat, das für alle gleichzahligen Prädikate und nur für solche zutrifft. Der Gleichzahligkeit von Prädikaten entspricht die Äquivalenz von Mengen (Äquivalenz hier in dem üblichen mengentheoretischen Sinne verstanden). Von dem logischen Anzahlbegriff gelangt man so zu einem mengentheoretischen; nach diesem ist eine Zahl nichts anderes als die Menge aller mit einer bestimmten Menge äquivalenten Mengen. Wir wollen nun sehen, wie die üblichen Bildungen der Mengenlehre im Kalkül ihren symbolischen Ausdruck finden. Sind P1 (x) und P2 (x) definierende Prädikate zweier Mengen, so wird deren Vereinigungsmenge durch das Prädikat P1 (x) ∨ P2 (x) gegeben. P1 (x) & P2 (x) stellt den Durchschnitt von P1 und P2 dar. Die Menge P1 ist in P2 enthalten oder P1 ist eine Teilmenge von P2 , wenn (x) P1 (x) → P2 (x) eine richtige Behauptung ist. Zwei Mengen P1 und P2 sind äquivalent, wenn die Elemente beider Mengen umkehrbar eindeutig aufeinander bezogen werden können. Der symbolische Ausdruck dafür ist derselbe wie für die Gleichzahligkeit von Prädikaten. Der Ausdruck (x)(y)(z) [R(x, y) & R(x, z) → ≡ (y, z)] & [R(x, z) & R(y, z) → ≡ (x, y)] oder abgekürzt Eind(R) bedeutet, daß die Beziehung R(x, y), falls sie besteht, beiderseits eindeutig ist. Der symbolische Ausdruck für die (mengentheoretische) Äquivalenz von P1 und P2 ist dann:
5
10
15
20
25
30
35
40
Grundzüge der theoretischen Logik
5
10
15
20
25
30
889
(ER){(x)[P1 (x)→ (Ey) R(x, y)& P2 (y) ] & (y)[P2 (y) → (Ex) R(x, y) & P1 (x) ] & Eind(R)}. Die Menge aller Teilmengen einer gegebenen durch D definierten Menge wird durch eine gewisse Funktionenfunktion Te(P ) [oder besser Te(P, D)] dargestellt. Jedes Prädikat P , für das Te(P ) zutrifft, muß die Eigenschaft haben, daß alle ihre Elemente auch Elemente von D sind. Umgekehrt muß auch für jedes Prädikat P mit dieser Eigenschaft Te(P ) zutreffen. Demnach ist Te(P ) definiert durch den Ausdruck: (x) P (x) → D(x) . Es möge ferner F (P ) irgendeine Menge von Mengen darstellen. Die Elemente x der Vereinigungsmenge dieser Menge von Mengen lassen sich dadurch charakterisieren, daß sie Element wenigstens einer zu P gehörigen Menge sind, für die F (P ) besteht. Demnach erhält man als definierenden Ausdruck für die Vereinigungsmenge (EP ) F (P ) & P (x) . Die Elemente des Durchschnitts der Menge von Mengen sind dadurch | gekennzeichnet, daß sie Element jeder Menge P sind, für die F (P ) gültig ist. Demnach stellt sich der Durchschnitt dar durch: (P ) F (P ) → P (x) . Eine Menge P heißt geordnet, wenn eine logische Funktion R von zwei Variablen für die Elemente von P definiert ist, die nicht reflexiv, wohl aber transitiv ist, und die für beliebige voneinander verschiedene x und y entweder auf das Paar (x, y) oder auf das Paar (y, x) zutrifft. „Die Menge P ist durch das Prädikat R geordnet“, stellt sich danach symbolisch dar durch: (x)(y)(z){[P (x) & P (y) & P (z)] → [R(x, x) & ≡ (x, y) ∨ R(x, y) ∨R(y, x) & R(x, y) & R(y, z) → R(x, z) ]}. Wir bezeichnen diese Beziehung zwischen P und R zur Abkürzung mit O(P, R). Die Menge P heißt durch das Prädikat R wohlgeordnet, wenn O(P, R) & (Q){(x) Q(x) → P (x) → (Ey)[Q(y) & (z) Q(z) → ≡ (y, z) ∨ R(y, z) ]} eine richtige Aussage ist. In entsprechender Weise finden alle übrigen in der Mengenlehre gebräuchlichen Begriffsbildungen im Kalkül ihre symbolische Darstellung. § 4. Die logischen Paradoxien.
35
Nachdem wir uns mit der Symbolik des Kalküls vertraut gemacht haben, käme es nun darauf an, ein System von präzisen Regeln kennenzulernen, das uns die Handhabung des Kalküls bei formalen Beweisführungen ermöglicht. Insbesondere muß genau festgelegt werden, was man unter „Gegenstand“, „Eigenschaft“ und „Relation“ zu verstehen hat. Die erste Möglichkeit wäre
92
890
93
Appendices
die, daß man mit diesen Begriffen völlig uneingeschränkt operiert. Als Gegenstände wären zu betrachten alle Individuen, alle Aussagen, Funktionen, Funktionenfunktionen usw. Prädikate wären alle Eigenschaften, die Gegenständen zukommen können, und entsprechend allgemein wäre der Begriff der Funktionenfunktionen1 . Ebenso allgemein wären die Einsetzungsregeln zu formulieren. Man könnte dann etwa dieselben Axiome wie beim engeren Funktionenkalkül und die zugehörigen Regeln α), β), γ) benutzen. Die Einsetzungsregel wäre nur entsprechend zu erweitern. Ein derartiges Vorgehen wäre jedenfalls durch den unpräzisen Sprachgebrauch nahegelegt, erweist sich aber als nicht durchführbar. | Es zeigt sich nämlich, daß ein derartiges logisches System nicht einmal dem Postulate der Widerspruchsfreiheit genügt. Den auftretenden Widersprüchen, den sog. Paradoxien, auf welche man übrigens auch unabhängig vom Gebrauch der logischen Symbolik geführt wird, kann man entsprechend der doppelten Deutung des Funktionenkalküls eine mehr eigentlich logische oder aber eine mengentheoretische Deutung geben. Von diesen Widersprüchen sollen hier einige dargelegt werden. Es sei P (F ) ein Prädikatenprädikat. Da P selbst ein Prädikat ist, so stellt der Ausdruck P (P ) eine Aussage dar, welche richtig oder falsch sein kann. Ein Beispiel eines Prädikatenprädikats, für welches P (P ) eine richtige Aussage darstellt, bildet die Negation des Prädikates 0(F ) („F trifft auf keinen Gegenstand zu“), d. h. die Funktion 0(F ), welche durch den Ausdruck (Ex)F (x) definiert ist. 0(0) ist eine Abkürzung für (EF )0(F ), wofür wiederum (EF )(Ex)F (x) geschrieben werden kann. Die letzte Formel bringt in der Tat ein richtiges Urteil zur Darstellung, nämlich den Satz: „Es gibt ein Prädikat F und einen Gegenstand x derart, daß F (x) besteht.“ Dagegen ist 0(0) eine falsche Aussage. Gemäß der Definition von 0 ergibt sich nämlich 0(0) ∼ (EF ) 0(F ) ∼ (EF )(Ex)F (x) ∼ (F )(Ex)F (x). Der letzte Ausdruck stellt die falsche Aussage dar, daß jedes Prädikat für mindestens einen Gegenstand zutrifft. Wir können nun den Ausdruck P (P ) als Funktion von P auffassen. Diese Funktion drückt die Eigenschaft eines Prädikates aus, sich selber zuzukommen. Die Leerstelle dieser Funktion bezieht sich auf alle Prädikatenprädikate. Wir wollen dieses Prädikatenprädikat mit P d(P ) bezeichnen (zu lesen: „P ist prädikabel“). Da P d, also auch P d selbst ein Prädikatenprädikat ist, so haben auch die Ausdrücke P d(P d) und P d(P d) einen Sinn. Entweder ist nun P d(P d) richtig. D. h. das Prädikatenprädikat P d trifft auf sich selber zu, also P d(P d) ist richtig. Oder aber P d(P d) ist nicht der Fall. Dann trifft das Prädikatenprädikat P d nicht auf sich selber zu, d. h. aber P d(P d) ist der Fall. Es folgt also, daß 1
Bei der mengentheoretischen Deutung des Kalküls entspricht diese Auffassung dem Standpunkt der naiven Mengenlehre.
5
10
15
20
25
30
35
40
Grundzüge der theoretischen Logik
5
10
15
20
25
30
35
40
891
P d(P d) ∼ P d(P d). Das ist aber ein Widerspruch, denn ein logischer Ausdruck kann nie seinem Gegenteil äquivalent sein. Diese Paradoxie ist zuerst von Russell entdeckt worden. Man kann sie auch in der Ausdrucksweise der Mengenlehre darstellen. Hier enspricht der Prädikatenfunktion P d die Menge aller derjenigen Mengen, die sich nicht selbst als Element enthalten. Diese Menge ist ihrem Begriff nach widerspruchsvoll, denn gemäß ihrer Definition | gehört sie dann und nur dann zu ihren eigenen Elementen, wenn sie nicht zu diesen gehört. Die zweite der zu besprechenden Paradoxien war bereits in der griechischen Philosophie bekannt. Ihre einfachste Fassung ist die folgende: Es sage jemand „ich lüge,“ oder ausführlicher, „ich spreche jetzt einen falschen Satz aus“; dann ist diese Aussage richtig, sofern sie falsch ist, und sie ist falsch, sofern sie richtig ist. Um zu erkennen, daß dieser Widerspruch sich aus unserem logischen Kalkül ergibt, brauchen wir an der Formulierung der Paradoxie nur eine geringe Verschärfung vorzunehmen. Es werde mit P eine bestimmte Person benannt, und t sei die abgekürzte Bezeichnung eines bestimmten Zeitintervalls. Innerhalb dieses Zeitraums t spreche P den Satz aus: „Alles was P in dem Zeitraum t behauptet, ist falsch“; und weiter sage P während der Zeit t nichts. Diese Annahme ist jedenfalls nicht widerspruchsvoll, da man ja ihre Verwirklichung absichtlich herbeiführen kann. Um sie in der logischen Symbolik zum Ausdruck zu bringen, bezeichnen wir die angeführte Aussage von P mit A und wenden das Funktionszeichen Bh(X) an in der Bedeutung, „X wird von P im Zeitraum t behauptet“, wobei als Wert des Arguments X jede Aussage in Betracht kommt. Mit Hilfe dieses Zeichens können wir zunächst die Aussage A durch die Formel (X) Bh(X) → X wiedergeben; und unsere Voraussetzung, daß P innerhalb der Zeit t den Satz A und sonst nichts ausspricht, stellt sich dar durch die beiden Formeln Bh(A); (X) Bh(X) → ≡ (A, X) . Nun kommt auf folgende Weise ein Widerspruch zustande. In der richtigen Formel A → A werde im zweiten Gliede für A der Ausdruck (X) Bh(x) → X , welcher ja die symbolische Darstellung der Aussage A bildet, eingesetzt. Dann ergibt sich A → (X) Bh(X) → X . Das Allzeichen (X) kann hier nach den Regeln des Kalküls fortgelassen werden. A → Bh(X) → X . Durch Einsetzung gewinnt man hieraus A → Bh(A) → A . Diese Formel ist, da die Voraussetzungen vertauscht werden dürfen, ersetzbar durch
94
892
Appendices
Bh(A) → (A → A). 95
Da Bh(A) eine richtige Formel ist, so erhält man A → A. Andererseits läßt sich auch A → A beweisen. Denn zunächst gilt A → (X) Bh(X) → X , also A → (EX) Bh(X) & X .
5
Ferner folgt aus der als richtig vorausgesetzten Formel (X) Bh(X) → ≡ (A, X) (X) Bh(X) & X → ≡ (A, X) & X und hieraus
10
(EX) Bh(X) & X → (EX) ≡ (A, X) & X , so daß man
A → (EX) ≡ (A, X) & X
erhält. Nun ist wegen der Bedeutung der Identität ≡ (A, X)&X → A eine richtige Formel. Nach der Regel γ) gewinnt man daraus: (EX) ≡ (A, X) & X → A. Diese Formel in Verbindung mit der eben erhaltenen liefert: A → A.
96
Aus den bewiesenen Formeln A → A und A → A folgt aber, daß sowohl A wie A eine richtige Formel ist, so daß wir in der Tat auf einen Widerspruch geführt werden. Wir wollen nun noch eine dritte Paradoxie vorführen, von welcher es mannigfache verschiedene Wendungen gibt. Eine einfache Form der Darstellung ist die folgende: Jedes Bezeichnen einer Zahl, geschehe es durch Mitteilung eines konventionellen Zeichens oder durch Angabe einer definierenden Eigenschaft, erfordert ein gewisses Mindestmaß an Zeit. Daher können innerhalb einer endlichen Zeit von endlich vielen Menschen auch nur endlich viele Zahlen bezeichnet werden. Andererseits gibt es unendlich viele Zahlen. Somit werden im 20. Jahrhundert von den auf Erden lebenden Menschen sicher nicht alle Zahlen bezeichnet. Unter den im 20. Jahrhundert nicht bezeichneten Zahlen ist eine die kleinste. Nun ist diese Zahl aber doch im 20. Jahrhundert bezeichnet; denn ich habe sie ja durch die Eigenschaft bestimmt, die kleinste im 20. Jahrhundert nicht bezeichnete Zahl zu sein. Es ergibt sich also die Existenz einer Zahl, die sowohl bezeichnet als nicht bezeichnet ist. Um diese Argumentation für den Zweck der Darstellung in unserem Kalkül etwas zu präzisieren, ersetzen wir den Begriff der Bezeichnung durch einen engeren Begriff. Wir ziehen nur solche Bezeichnungen | einer Zahl in Betracht, welche im Sinne unserer logischen Symbolik durch das Aufschreiben eines Ausdrucks für ein die Zahl definierendes Prädikat stattfinden. Dabei verstehen wir unter einem die Zahl x definierenden Prädikat ein solches, das auf die Zahl
15
20
25
30
35
40
Grundzüge der theoretischen Logik
5
10
15
20
25
30
35
893
x, sonst aber auf nichts zutrifft1 . Auf diese Weise gelangen wir zu folgender Fassung der Paradoxie: Es bedeute Scr(P ) die Eigenschaft eines Prädikates P , daß unter den im 20. Jahrhundert aufgeschriebenen Ausdrücken der logischen Symbolik mindestens einer ein Ausdruck für P ist. Das Zeichen <(x, y) werde wie bisher für das Prädikat „x ist kleiner als y“ angewendet; und zwar sollen die Leerstellen dieser Relation auf die Gattung der positiven ganzen Zahlen bezogen werden. Ferner möge für den Ausdruck P (x) & (y) P (y) → ≡ (x, y) , welcher besagt, daß x durch das Prädikat P definiert wird, zur Abkürzung Df(P, x) geschrieben werden. Als Abkürzung für (EP ) Df(P, x) & Scr(P ) werde das Symbol Dsc(x) angewendet. Dsc(x) bedeutet also: „Unter den im 20. Jahrhundert aufgeschriebenen symbolischen Ausdrücken stellt mindestens einer ein Prädikat dar, welches x definiert“, oder kurz ausgesprochen: „x ist im 20. Jahrhundert mindestens einmal symbolisch definiert.“ Schließlich werde als Abkürzung für den Ausdruck Dsc(x) & (y) <(y, x) → Dsc(y) das Zeichen Mds(x) genommen, so daß also Mds(x) bedeutet: „x hat die Eigenschaft, kleinste, im 20. Jahrhundert nicht symbolisch definierte Zahl zu sein.“ Als Axiome führe man nun folgende Formeln ein: zunächst die Ausdrücke für die Grundeigenschaften der Relation <(x, y): (x)<(x, x) (x)(y)(z) <(x, y) & <(y, z) → <(x, z) , (x)(y) ≡ (x, y) ∨ <(x, y) ∨ <(y, x) , (Ex)P (x) → (Ex)[P (x) & (y) <(y, x) → P (y) ]. Von diesen 4 Axiomen bedeuten die ersten drei, daß die Beziehung <(x, y) die ganzen Zahlen ordnet, und die letzte, daß sie sie wohlordnet. Sodann haben wir als Axiome den symbolischen Ausdruck für die Tat|sache, daß nicht alle Zahlen im 20. Jahrhundert symbolisch definiert werden können, (Ex)Dsc(x), und endlich die Formel Scr(Mds), welche besagt, daß ein Ausdruck für Mds(x) im 20. Jahrhundert aufgeschrieben ist, und die also eine richtige Behauptung darstellt, da wir vorhin den Ausdruck für Mds(x) aufgeschrieben haben. Jetzt kann man die folgende formale Schlußweise ausführen. In der Formel (Ex)P (x) → (Ex)[P (x) & (y) <(y, x) → P (y) ] setze man für P Dsc ein: (Ex)Dsc(x) → (Ex)[Dsc(x) & (y) <(y, x) → Dsc(y) ]. 1
Daß die Zahlen sich als Prädikatenfunktionen deuten lassen, braucht für die vorliegende Argumentation nicht berücksichtigt zu werden.
97
894
98
Appendices
Da (Ex)Dsc(x) richtig ist, so ergibt sich (Ex)[Dsc(x) & (y) <(y, x) → Dsc(y) ], also bei Anwendung der Abkürzung Mds(x): (Ex)Mds(x). Zufolge der Definition von Mds besteht die Beziehung Mds(x) → Dsc(x). Ferner läßt sich mit Hilfe der aufgestellten Axiome die Formel Mds(x) → Mds(x) & (y) Mds(y) → ≡ (x, y) , d. h. Mds(x) → Df(Mds, x) ableiten. Aus der letzten und vorvorletzten Formel zusammen ergibt sich: Mds(x) → Dsc(x) & Df(Mds, x). Nach der zu Formel (34) gehörigen Regel erhält man weiter: (Ex)Mds(x) → (Ex) Dsc(x) & Df(Mds, x) . Da (Ex)Mds(x) bewiesen ist, so liefert das Schlußschema: (Ex) Dsc(x) & Df(Mds, x) . Nimmt man hierzu die als Axiom aufgestellte Formel Scr(Mds), so folgt: (Ex){Dsc(x) & Df(Mds, x) & Scr(Mds)}. Nun gilt nach Axiom f) die Formel F (Q) → (EP )F (P ). Wird hier Q durch Mds und F (P ) durch (Ex){Dsc(x) & Df(P, x) & Scr(P )} ersetzt, so ergibt sich: (Ex){Dsc(x) & Df(Mds, x) & Scr(Mds)} → (EP )(Ex){Dsc(x) & Df(P, x) & Scr(P )}, also, da das Vorderglied eine bewiesene Formel ist: (EP )(Ex){Dsc(x) & Df(P, x) & Scr(P )}. Da sich die Stellung der Klammerzeichen vertauschen läßt, und da (EP ) A & F (P ) ∼ A & (EP )F (P ), erhält man: (Ex){Dsc(x) & (EP ) Df(P, x) & Scr(P ) }. Durch Anwendung der Abkürzung Dsc geht dieser Ausdruck über in (Ex) Dsc(x) & Dsc(x) . Andererseits kann auch die Formel (x) Dsc(x) ∨ Dsc(x) abgeleitet werden; denn diese Formel entsteht aus (21) durch Einsetzung. Nach dem Dualitätsprinzip sind aber die letzten beiden Formeln einander entgegengesetzt. Wir haben somit einen Widerspruch. Mit diesen verschiedenen Widersprüchen können wir uns auch nicht etwa in der Weise abfinden, daß wir die Beweisbarkeit gewisser einander entgegengesetzter Aussagen als eine Tatsache hinnehmen. Sobald wir nämlich irgend
5
10
15
20
25
30
35
Grundzüge der theoretischen Logik
895
zwei einander entgegengesetzte Ausdrücke A und A als richtige Formeln zulassen, so wird, wie schon früher bemerkt, der ganze Kalkül bedeutungslos. § 5. Die Methode des Stufenkalküls.
5
10
15
20
25
30
35
40
Aus den Widersprüchen, die wir fanden, müssen wir schließen, daß unsere Methode des formalen Operierens fehlerhaft ist. Dieser Fehler kann nur darauf beruhen, daß wir bei der Erweiterung des ursprünglich für den (engeren) Funktionenkalkül aufgestellten Axiomensystems nicht vorsichtig genug verfahren sind. Um für die erforderliche Korrektur des Verfahrens den richtigen Gesichtspunkt zu gewinnen, wollen wir uns noch einmal das Grundsätzliche an der vorgenommenen Erweiterung des Kalküls vergegenwärtigen. Wir folgen hier den Überlegungen von Whitehead und Russell. Bei der anfänglichen Methode des Funktionenkalküls hatten wir ein System oder mehrere Systeme von Individuen als von vorn|herein gegeben angenommen, und durch die Beziehung auf solche Gesamtheiten von Individuen erhielt das Operieren mit den Variablen (insbesondere mit den Klammerzeichen) seine logische Bedeutung. Die Erweiterung des Kalküls bestand nun darin, daß wir auch die Aussagen und Prädikate als Individuen betrachteten und demnach symbolische Ausdrücke zuließen, deren logische Deutung eine Bezugnahme auf die Gesamtheit der Aussagen bzw. der Funktionen erforderte. Dies Vorgehen ist nun in der Tat bedenklich, insofern dabei nämlich jene Ausdrücke, welche erst durch die Bezugnahme auf die Gesamtheit der Aussagen bzw. Funktionen ihren Inhalt gewinnen, ihrerseits wieder zu den Aussagen oder Funktionen hinzugerechnet werden, während wir doch andererseits, um uns auf die Gesamtheit der Aussagen und Funktionen beziehen zu können, diese als von vornherein bestimmt ansehen müssen. Hier liegt also eine Art von logischem Zirkel vor, und wir haben Grund zu der Annahme, daß dieser Zirkel die Ursache der Paradoxien ist. Somit entsteht für uns, wenn wir auf die Möglichkeit, die Aussagen und Funktionen als Werte von Argumenten logischer Funktionen zu nehmen, nicht verzichten wollen, die Aufgabe, das formale Operieren mit den Aussage- und Funktionsvariablen so zu gestalten, daß jene anfechtbaren Bildungen von Aussagen- und Funktionsgesamtheiten vermieden werden. In Verfolgung dieses Gedankens werden wir auf die sogenannte Typentheorie oder den Stufenkalkül von Whitehead und Russell geführt. Wir können bei dieser Theorie zwei verschiedene Gesichtspunkte unterscheiden. Das erste ist, daß alles, was als Argument in die Leerstelle einer Funktion eingesetzt werden kann, von ganz anderem Charakter ist als die Funktion selbst. Zur Charakterisierung einer Funktion ist nun die Angabe ihres Definitionsbereichs notwendig. Nach unserem Prinzip darf dann zum Definitionsbereiche nichts gehören, was von der Funktion selbst abhängt. — So gelangen wir zu einer Begriffsbeziehung, die Russell eine Hierarchie der Typen nennt. Zum ersten Typ gehören die Individuen der ursprünglich gege-
99
896
100
Appendices
benen Systeme. Zum zweiten Typ gehören die Individuenprädikate. Allgemein gehören zum (n+1)ten Typ solche logische Funktionen, bei denen alle Argumente einen Typ n haben und wenigstens eins den Typ n. In jede Leerstelle einer Funktion dürfen nur solche Gegenstände eingesetzt werden, die den Typ des betreffenden Argumentes haben. Entsprechend bezieht sich der Gebrauch der Klammerzeichen auch nur auf eine Gesamtheit, die von demselben Typ ist. Außer diesem Gedanken benutzen Whitehead und Russell noch einen weitergehenden. Auch gegen den allgemeinen Gebrauch von Ausdrücken wie „für alle Individuenprädikate“, „es gibt ein Individuen|prädikat“, „für alle Aussagen“ kann man nämlich Bedenken haben. Es ist möglich, daß in der Definition eines Individuenprädikates ein Klammerzeichen vorkommt, zu dem eine Variable für Individuenprädikate gehört, daß also das Individuenprädikat durch Bezugnahme auf die Gesamtheit aller Individuenprädikate definiert wird. Oder betrachten wir einen anderen Fall. Der Satz: „Alle Aussagen sind richtig oder falsch“, ist selbst eine Aussage. Andererseits wird diese Aussage aber erst definiert durch Bezugnahme auf die Gesamtheit aller Aussagen. Um auch hier den Zirkel zu vermeiden, wird der folgende Weg eingeschlagen: Wir denken uns zunächst einen festen Individuenbereich gegeben und darin gewisse Grundprädikate. Man kann sich diese Grundfunktionen etwa als anschaulicher Natur vorstellen. Auf diesen ursprünglichen Bereich werden wir nun den engeren Funktionenkalkül an und erhalten so eine Theorie der „ersten Stufe“. Ein Prädikat auf dieser ersten Stufe ist eine logische Funktion eines Arguments oder von mehreren Argumenten, die sich aus den Grundprädikaten mit Hilfe der logischen Operationen „und“, „oder“, „nicht“, „wenn–so“, „alle“ und „es gibt“ zusammensetzen läßt. Die Operationen „alle“ und „es gibt“ beziehen sich hier selbstverständlich nur auf den ursprünglichen Individuenbereich. Durch Ausfüllung der Leerstellen der Funktionen der ersten Stufe und eventuell durch Vorsetzen von Klammerzeichen erhält man die Aussagen der ersten Stufe. Nun bilden wir eine Theorie der zweiten Stufe. Wir betrachten die Funktionen und Aussagen der ersten Stufe als einen neuen Individuenbereich, den wir als einen weiteren Bereich dem Bereiche der ursprünglichen Individuen hinzufügen. Indem wir das so erweiterte System von Individuen zugrunde legen, können wir dann einen Bereich von Funktionen und Aussagen der „zweiten Stufe“ abgrenzen. Dabei ist der Unterschied gegen vorher, daß die Argumente der logischen Funktionen sowie der All- und Seinszeichen sich nicht nur auf die ursprünglichen Individuen, sondern auch auf Prädikate und Aussagen der ersten Stufe beziehen können. Ebenso wie der Übergang von der ersten zur zweiten Stufe läßt sich auch der Übergang zu einer dritten und weiter zu höheren Stufen vollziehen. Durch dieses Verfahren des Stufenkalküls erhalten wir einerseits die Möglichkeit, jede vorkommende Aussage, Eigenschaft oder Beziehung zum Gegenstande des Urteilens zu machen; andererseits bleiben wir vor einem fehlerhaften Operieren mit Gesamtheiten von allen Aussagen oder Funktionen deshalb gesichert, weil ja nur solche Ausdrücke zugelassen werden, die durch sukzes-
5
10
15
20
25
30
35
40
45
Grundzüge der theoretischen Logik
5
10
15
20
25
30
35
40
45
897
sive Stufenbildung erreichbar sind, und weil für die Theorie einer bestimmten Stufe die Gesamtheit der Gegenstände, auf welche sie sich bezieht, abgegrenzt ist. Um die Stufenunterscheidung in unserer Symbolik zur Geltung zu bringen, wollen wir die Aussage- und Funktionszeichen mit Zahlenindizes versehen. Diese Bezeichnung ist so zu verstehen, daß der Wertbereich eines Aussagezeichens Xn bzw. eines Funktionszeichens Fn auf solche Aussagen bzw. Funktionen eingeschränkt ist, welche in der Theorie der nten Stufe enthalten sind. Von jedem Ausdruck, welcher eine Aussage oder eine bestimmte Funktion darstellen soll, verlangen wir jetzt, daß jedem darin vorkommenden Aussage- oder Funktionszeichen ein Index beigefügt ist. Ein Funktionszeichen bekommt immer einen größeren Index als jedes seiner Argumente. Ein Funktionszeichen mit dem Index 1 hat als Argumente immer die Gegenstände des ursprünglichen Individuenbereichs. Unsere Axiome sind die gleichen wie beim engeren Funktionskalkül. Nur hat man bei Anwendung der Axiome die Aussagen- und Funktionsvariablen mit Indizes zu versehen. An Stelle des Axioms (e): (x)F (x) → F (y) hat man eine Axiomenregel: Jede Formel von der Form: (x)Fn (x) → Fn (y), (An )Fm (An ) → Fm (Bn )
(m > n)
101
(Gn )Fm (Gn ) → Fm (Hn ) darf als Axiom genommen werden. Dabei sind An und Bn Aussagen- und Gn und Hn Funktionsvariable. Das Entsprechende gilt für das Axiom f) und die Regel γ). Bei der Einsetzung ist zu beachten, daß für Aussagen- und Funktionsvariable nur solche Aussagen- und Funktionsausdrücke eingesetzt werden, die von derselben oder kleinerer Stufe sind. Dabei ist der Index eines Ausdrucks folgendermaßen zu definieren: Ist n der höchste in dem Ausdruck vorkommende Index, so ist der Index des ganzen Ausdrucks gleich n+1, falls ein Klammerzeichen vorkommt, das zu einer Variablen vom Index n gehört und sonst gleich n. Bei den Funktionsausdrücken hängt die Definition des Index außerdem noch davon ab, was man als Argumente des betreffenden Ausdrucks ansieht. Es muß hier der Index eventuell so weit erhöht werden, daß er größer ist als der Index aller Argumente. Z. B. ist der Funktionsausdruck F1 (x) ∼ G1 (x) ein Individuenprädikat der ersten Stufe, aber eine Funktionenfunktion der zweiten Stufe. Bei der Feststellung des Index eines Ausdrucks sind als vorkommende Indizes auch alle diejenigen mitzurechnen, welche eventuell in der Definition eines zur Abkürzung gebrauchten Zeichens auftreten. Auf diese Art wird eine neue Form des Kalküls, der Stufenkalkül, begründet, welcher eine Erweiterung des ursprünglichen Funktionenkalküls darstellt, da dieser ja als Theorie der ersten Stufe in ihm enthalten ist, der aber im Vergleich mit unserer vorherigen Erweiterung | des Funktionenkalküls eine wesentliche Einschränkung der formalen Operationsweise bedeutet. Es kommt nun vor allem darauf an, sich zu überzeugen, daß durch den Stufenkalkül die in den Paradoxien hervortretenden Widersprüche vermieden
102
898
103
Appendices
werden. Betrachten wir daraufhin die drei besprochenen Paradoxien, so zeigt sich folgendes: Bei der ersten Paradoxie fällt die Möglichkeit fort, eine auf alle Prädikate P anwendbare Funktion P d(P ) zu definieren. Nehmen wir statt dessen eine Funktion P d(Pn ) mit einem bestimmten Zahlenwert von n, so gehört diese nicht mehr der Theorie der nten Stufe an, und dasselbe gilt von P d(Pn ). Demnach kommt P d nicht als Wert des Argumentes Pn von P d in Betracht. Der Ausdruck P d(P d) kann also überhaupt nicht gebildet werden. In der zweiten Paradoxie enthält der Ausdruck (X) Bh(X) → X eine Allgemeinheit, welche sich auf die Gesamtheit aller Aussagen bezieht. Beschränken wir nun gemäß der Forderung des Stufenkalküls die Variabilität von X auf eine gewisse Höchststufe, indem wir dem Zeichen X einen Index n beilegen, so wird dadurch die gesamte Aussage als ein Ausdruck (n + 1)ter Stufe bestimmt. Infolgedessen kann in der Formel (Xn ){A → Bh(Xn ) → X n } der Ausdruck A nicht als spezieller Wert für Xn genommen werden, so daß wir nicht zu der Formel A → A gelangen. D. h. inhaltlich ausgedrückt: Wenn wir, um uns nicht auf die Gesamtheit aller Aussagen zu beziehen, dem Ausspruch von P den geänderten Wortlaut geben: „Jede Behauptung erster Stufe, welche P im Zeitraum t aufstellt, ist falsch“, so kann dieser Satz ohne Widersinn als richtig angenommen werden, weil er ja eine Behauptung zweiter Stufe bildet. Entsprechend verhält es sich, wenn in der Formulierung des Ausspruchs von P statt „Behauptung erster Stufe“ gesagt wird „Behauptung von höchstens zweiter Stufe“ oder „Behauptung von höchstens dritter Stufe“ usw. Bei der dritten Paradoxie kommt im Begriff einer symbolisch definierten Zahl eine Beziehung auf die Gesamtheit aller Prädikate vor, was sich in dem Ausdruck für das Prädikat Dsc(x) durch das Auftreten des Existentialzeichens (EP ) geltend macht. Nehmen wir hier im Sinne des Stufenkalküls eine Verschärfung der Begriffsbildung vor, indem wir, statt schlechthin von einer symbolisch definierten Zahl zu sprehen, genauer angeben, von welcher Höchststufe der definierende Ausdruck sein soll, so kommt kein Widerspruch zustande; denn die kleinste der Zahlen, welche im 20. Jahrhundert niemals durch einen Ausdruck von höchstens nter Stufe definiert ist, wird zwar durch diese | ihre Eigenschaft definiert; jedoch ist dabei der definierende Ausdruck von der (n + 1)ten Stufe.
5
10
15
20
25
30
35
§ 6. Mängel des Stufenkalküls. Wir sehen, daß durch die Abgrenzung der Stufen unser erweiterter Kalkül von den Widersprüchen, welche ihm bei der unbeschränkten Operationsweise anhaften, befreit wird. Jetzt fragt es sich aber, ob auf diese Weise nicht der Kalkül zu sehr eingeengt wird. Wir müssen z. B. von dem Kalkül verlangen, daß er uns alle diejenigen Schlußweisen liefert, welche für die Grundlegung der Mathematik eine wesentliche Rolle spielen.
40
Grundzüge der theoretischen Logik
5
10
15
20
25
30
35
899
In dieser Hinsicht kann uns schon der Umstand argwöhnisch machen, daß wir mit unserer Definition der Identität auf eine Schwierigkeit stoßen. Da nämlich in dem Definitionsausdruck (F ) F (x) ∼ F (y) dem Funktionszeichen F ein Index beigefügt werden muß, so erhalten wir statt der einen Identitätsbeziehung je nach der Wahl des Index verschiedene Prädikate: ≡1 (x, y), ≡2 (x, y) usw. Dies ist freilich deshalb nicht so bedenklich, weil die verschiedenen Prädikate alle für dieselben Wertepaare x, y zutreffen bzw. nicht zutreffen. Man kann sich das auf die folgende Weise überlegen: Zunächst ist klar, daß für jedes n aus der Beziehung (Fn+1 ) Fn+1 (x) ∼ Fn+1 (y) die Beziehung (Fn ) Fn (x) ∼ Fn (y) folgt, weil ja der Wertbereich von Fn in demjenigen von Fn+1 enthalten ist. Es läßt sich also beweisen: ≡n+1 (x, y) → ≡n (x, y). Es fragt sich nun, ob auch die Umkehrung: ≡n (x, y) → ≡n+1 (x, y) gilt. Ohne wesentliche Spezialisierung können wir uns auf den Fall n = 1 beschränken. Wir können dann die Gültigkeit des Satzes auf inhaltliche Weise so einsehen: Ein Prädikat, das sich auf Gegenstände bezieht, kann nur dadurch ein Ausdruck zweiter Stufe sein, daß darin Klammerzeichen vorkommen, welche zu Aussage- und Funktionsvariablen gehören. Die Darstellung eines solchen Prädikates kann so gewählt werden, daß jene Klammerzeichen sowie solche, die zu Individuenvariablen gehören, am Anfang stehen und darauf ein Ausdruck folgt, welcher außer dem Argument des darzustellenden Prädikats als Argumente nur die zu den vorausstehenden Klammer|zeichen gehörigen Aussage- und Funktionszeichen und Individuenvariablen enthält. — Es sei etwa dieses Prädikat in der Form (Ez)(F1 )(EG1 )Φ(F1 , G1 , z, x) darstellbar. Nach unserer Annahme über Φ ist das Prädikat Φ(F1 , G1 , z, x) von der ersten Stufe, da es sich aus derartigen Prädikaten mit Hilfe der Operationen &, ∨, , → zusammensetzt. Aus ≡1 (x, y) würde dann folgen: Φ(F1 , G1 , z, x) ∼ Φ(F1 , G1 , z, y). Da dies für jedes Prädikat F1 und G1 der ersten Stufe und für jedes z gilt, so erhält man: (Ez)(F1 )(EG1 )Φ(F1 , G1 , z, x) ∼ (Ez)(F1 )(EG1 )Φ(F1 , G1 , z, y). Dieselbe Überlegung läßt sich für jedes spezielle Prädikat der zweiten Stufe anstellen. Es gilt also allgemein (F2 ) F2 (x) ∼ F2 (y) ,
40
d. h. ≡1 (x, y) → ≡2 (x, y) ist bewiesen. Diese Betrachtung hat insofern etwas Unbefriedigendes, als sie uns nicht zu einer formalen Ableitung der Formel
104
900
Appendices
≡1 (x, y) → ≡2 (x, y)
105
aus den Axiomen verhilft. Aber jedenfalls zeigt sie doch, daß in der Sonderung der Relationen ≡n (x, y) kein prinzipieller Übelstand vorliegt. Nun finden sich aber Schwierigkeiten von erheblicher Art, wenn wir daran gehen, die Schlußweisen der Mengenlehre und der Analysis in unserem Kalkül darzustellen. Bereits bei dem Versuche, den Cantorschen Beweis für die Existenz überabzählbarer Mengen in die Ausdrucksweise unseres Kalküls zu übertragen, stoßen wir auf ein solches Hindernis. Hier wird man statt der Menge aller Mengen von ganzen Zahlen, welche ja das einfachste Beispiel einer überabzählbaren Menge bildet, die Menge aller der Prädikate betrachten, welche sich auf ganze Zahlen als Gegenstände beziehen. Dabei muß man die Gesamtheit dieser Prädikate insofern einschränken, als man im Sinne des Stufenkalküls nicht schlechthin von der Menge aller Zahlenprädikate reden kann. Es muß vielmehr für die Prädikate, welche die Elemente der zu betrachtenden Menge bilden sollen, eine Höchststufe festgelegt werden. Ist nun n die gewählte Stufenzahl, so haben wir es mit der Menge aller Zahlenprädikate von höchstens nter Stufe zu tun, und es kommt darauf an, diese Menge als überzählbar zu erweisen, d. h. zu zeigen, daß, wenn auf irgendeine Art jeder ganzen Zahl eindeutig ein Prädikat aus der Menge zugeordnet wird, dann unter den zugeordneten Prädikaten jedenfalls nicht alle Prädikate aus der Menge vorkommen. Um nach dem Vorbilde des Cantorschen Beweises zu verfahren, gehen wir aus von der Annahme, es sei irgendeine Zuordnung der verlangten Art gegeben, d. h. eine Aussage R(x, Pn ), welche für eine feste Zahl x genau durch ein Prädikat Pn erfüllt wird. Wir betrachten dasjenige Prädikat P c(x), welches für eine Zahl x dann und nur dann zutrifft, wenn das ihr zugeordnete Prädikat nicht auf sie zutrifft. Es ist P c(x) also definiert durch (Pn ) R(x, Pn ) → P n (x) . Von diesem Prädikat können wir auf Grund seiner Definition beweisen, daß es mit keinem der den Zahlen zugeordneten Prädikate übereinstimmt. Wäre nämlich P c der Zahl m zugeordnet, so müßte einerseits R(m, P c) gelten. Andererseits müßte zufolge der Definition von P c(x) und wegen der Eindeutigkeit der Zuordnung P c(m) ∼ R(m, P c) → P c(m) sein. Aus diesen beiden Beziehungen würde sich P c(m) ∼ P c(m), also ein Widerspruch, ergeben. Mit dieser Feststellung müßten wir nun, gemäß der Analogie zum Cantorschen Beweise, schon am Ziele sein. Tatsächlich haben wir jedoch nur die Existenz eines Zahlenprädikates erkannt, welches von allen durch das Prädikat R den ganzen Zahlen zugeordneten Prädikaten verschieden ist, ohne aber nachzuweisen, daß dieses Prädikat P c zu unserer Menge gehört; und diese Forderung ist tatsächlich auch nicht erfüllt. Denn die Menge enthält ja nur Prädikate nter Stufe, während der definierende Ausdruck für P c(x):
5
10
15
20
25
30
35
40
Grundzüge der theoretischen Logik
901
(Pn ) R(x, Pn ) → P n (x) ,
5
10
15
20
25
30
35
40
von der (n+1)ten Stufe ist. Es kommt also zufolge der Stufenunterscheidung der gewünschte Beweis gar nicht zustande. Ganz ähnlich wie bei diesem Beispiel tritt an mehreren anderen entscheidenden Stellen der Fall ein, daß wir durch die Sonderung der Stufen daran verhindert werden, gewisse mathematische Schlußweisen durch den logischen Kalkül nachzubilden. Insbesondere gilt das für die Begründung der Theorie der reellen Zahlen. In der Mathematik sind verschiedene Einführungen der reellen Zahlen gebräuchlich; man definiert eine reelle Zahl mit Hilfe einer Cantorschen Fundamentalreihe oder durch einen unendlichen Dezimalbruch bzw. Dualbruch oder durch einen Dedekindschen Schnitt. Für den Anschluß an die Logik empfiehlt sich das Dedekindsche Verfahren, und zwar brauchen wir bei den Einteilungen der rationalen Zahlen, welche einen Schnitt bilden, jeweils nur die Klasse der kleineren zu betrachten. Eine Klasse oder eine Menge von Rationalzahlen ist gegeben durch ein definierendes Prä|dikat. Wir werden also eine reelle Zahl erklären als ein Prädikat mit einer bestimmten Eigenschaft, der sog. „Schnitteigenschaft“ Sc(P ), wobei wir darauf zu achten haben, daß äquivalente Prädikate dieselbe reelle Zahl darstellen. Die reellen Zahlen müssen ferner einen bestimmt umgrenzten Bereich von Gegenständen bilden; denn wir haben in der Analysis fortwährend mit Sätzen über alle reellen Zahlen sowie über Existenz von reellen Zahlen zu tun. Wir müssen daher die Prädikate, die wir zur Definition reeller Zahlen nehmen, auf einen bestimmten Bereich beschränken, und werden also z. B. nur Prädikate erster Stufe zur Definition reeller Zahlen zulassen. Eine reelle Zahl ist also hiernach ein Prädikat erster Stufe P1 , das einer gewissen Bedingung Sc(P1 ) genügt. Die Summe und das Produkt zweier reeller Zahlen läßt sich dann entsprechend definieren und auch tatsächlich wieder durch ein Prädikat der ersten Stufe darstellen. Eine andere Frage ist es aber, ob auch die höheren Schlußweisen der Analysis sich aus unserer logischen Theorie ergeben. Als besonders wichtig ist dort zu nennen der Satz von der oberen Grenze, welcher besagt, daß es zu jeder beschränkten Menge von reellen Zahlen eine obere Grenze gibt, d. h. eine reelle Zahl a von der Eigenschaft, daß jede Zahl der Menge a ist, und daß jede reelle Zahl, die < a ist, von mindestens einer Zahl der Menge übertroffen wird. — Ohne uns auf eine genaue formale Behandlung einzulassen — dies soll in § 8 ausführlich geschehen —, können wir uns leicht inhaltlich klarmachen, daß in der Definition des Prädikats, das die obere Grenze darstellt, das All- und Seinszeichen für Prädikate der ersten Stufe vorkommen müßte; d. h. aber, dieses Prädikat würde selbst von der zweiten Stufe sein und also gar keine reelle Zahl darstellen. Wir sind also mit unserem Kalkül gar nicht imstande, den Beweis für die Existenz der oberen Grenze zu führen. § 7. Das Axiom der Reduzierbarkeit. An den vorhergehenden Beispielen zeigte sich, daß die Methode des Stufenkalküls die Möglichkeiten des Schließens über das zulässige Maß hinaus
106
902
107
Appendices
beschränkt, und wir werden daher suchen, eine Modifikation anzubringen, durch die unser Kalkül eine größere Bewegungsfreiheit erhält. Betrachten wir nun noch einmal den Beweis für die Existenz der oberen Grenze. Die Unmöglichkeit, den Beweis im Stufenkalkül durchzuführen, beruht darauf, daß das Prädikat, das die obere Grenze definieren sollte, von höherer als der ersten Stufe war. Zur Vervollständigung des Beweises würde es genügen, daß es zu einem derartigen Prädikat ein äquivalentes der ersten Stufe gibt, da dieses Prädikat wirklich eine reelle Zahl darstellen würde. Entsprechend verhält es sich bei dem Cantorschen Beweis für die Existenz überabzählbarer Mengen. Angesichts dieser Sachlage haben Whitehead und Russell den Ausweg gewählt, daß sie ein besonderes Postulat, das „Axiom der Reduzierbarkeit“ („axiom of reducibility“) dem Stufenkalkül hinzugefügt haben. Zum Zweck der allgemeinen Formulierung dieses Postulats erweitern wir den bisher nur für Prädikate definierten Begriff der Äquivalenz, indem wir allgemein zwei Funktionen mit Argumenten von derselben Art als äquivalent erklären, wenn sie für genau dieselben Wertsysteme der Argumente zutreffen. Ferner führen wir als neue Bezeichnung ein, daß ein Funktionsausdruck „prädikativ “ heiße, wenn er die niedrigste mit der Art seiner Argumente vereinbare Stufe besitzt, d. h. diejenige Stufe, welche einem Ausdruck zukommt, der die Argumente des betrachteten Ausdrucks als einzige unbestimmte Zeichen enthält. Bei der Anwendung dieser Terminologie lautet unser Axiom folgendermaßen: „Zu jedem im Stufenkalkül vorkommenden Funktionsausdruck gibt es einen äquivalenten prädikativen Ausdruck.“ Als Spezialfall ist hierin die Annahme enthalten, daß zu jedem Prädikat Pn (x) (mit beliebigem Index n), dessen Argument sich auf die ursprünglichen Gegenstände des Kalküls bezieht, ein äquivalentes Prädikat der ersten Stufe existiert; d. h. in der Ausdrucksweise des Kalküls: Für jeden Index n ist (Pn )(EP1 )(x) Pn (x) ∼ P1 (x) eine richtige Formel. Man könnte nun meinen, daß infolge der Annahme des Axioms der Reduzierbarkeit die eben erst vermiedenen Widersprüche sich wieder einstellen. Daß dies aber nicht der Fall ist, läßt sich an den behandelten Paradoxien leicht erkennen. Was zunächst die ersten beiden Paradoxien anbetrifft, so findet auf diese unser Postulat gar keine Anwendung; auf die erste deshalb nicht, weil hier die Funktion P d(Pn ) gemäß ihrer Definition bereits prädikativ ist, und auf die zweite nicht, weil unser Axiom nur die Funktionsausdrücke, nicht aber die Darstellungen von Aussagen betrifft. Bei der dritten Paradoxie liegt allerdings eine Anwendungsmöglichkeit für unser Postulat vor. Hier beruht die durch den Stufenkalkül bewirkte Aufhebung des Widerspruchs darauf, daß die Stufe der Funktion Mds(x) um eins höher ist als der Index des in ihrer Definition implizite auftretenden Funktionszeichens P . Dies ist nun eine Gelegenheit, unsere neue Annahme zur Geltung zu bringen. Wir können jetzt die Existenz eines zu
5
10
15
20
25
30
35
40
45
Grundzüge der theoretischen Logik
5
903
Mds(x) äquivalenten Prädikates erster Stufe behaupten. Dadurch wird aber nicht etwa die Wiederkehr des früheren Widerspruchs herbeigeführt. Denn mit der Behauptung | der Existenz eines zu Mds(x) äquivalenten Prädikates haben wir ja noch nicht einen symbolischen Ausdruck für ein solches Prädikat aufgeschrieben und können daher nicht voraussetzen, daß die Funktion Scr auf dieses Prädikat zutrifft, so daß eine wesentliche Bedingung für das Zustandekommen des Widerspruchs fortfällt.
108
§ 8. Anwendungen des Axioms der Reduzierbarkeit.
10
15
20
25
30
Nachdem gezeigt ist, daß auch bei Zulassung des Axioms der Reduzierbarkeit die angeführten Paradoxien ausgeschaltet bleiben, soll an einigen Beispielen erläutert werden, wie die Hindernisse, welche zunächst einer fruchtbaren Anwendung des Stufenkalküls entgegenstehen, durch die Einführung dieses Axioms beseitigt werden. Als ein bemerkenswerter Vorteil, den uns die Annahme des Axioms verschafft, ist erstlich zu erwähnen, daß sie es uns ermöglicht, die Beziehung ≡1 (x, y) ∼ =n (x, y) streng formal (für jeden Wert von n) abzuleiten. Dies gelingt in der folgenden Weise. Wir zeigen zunächst folgendes: Es sei Φ(Pn ) ein Funktionsausdruck, der von Pn abhängt, und es sei für diesen A) (x) Pn (x) ∼ P1 (x) → Φ(P1 ) → Φ(Pn ) eine im Kalkül beweisbare Formel. Wir behaupten dann, es läßt sich auch beweisen: B) (Pn )Φ(Pn ) ∼ (P1 )Φ(P1 ). Beweis: Man erhält aus A), indem man das Allzeichen (P1 ) vorsetzt, und nach Formel (34): (EP1 )(x) Pn (x) ∼ P1 (x) → (EP1 ) Φ(P1 ) → Φ(Pn ) . (EP1 ) Φ(P1 ) → Φ(Pn ) kann durch den äquivalenten Ausdruck (P1 )Φ(P1 ) → Φ(Pn ) ersetzt werden: (EP1 )(x) Pn (x) ∼ P1 (x) → (P1 )Φ(P1 ) → Φ(Pn ) .
35
Setzt man hier das Allzeichen (Pn ) vor, und benutzt Formel (31), so erhält man (Pn )(EP1 )(x) Pn (x) ∼ P1 (x) → (Pn ) (P1 )Φ(P1 ) → Φn (Pn ) . Da die Formel links vom →-Zeichen mit derjenigen des Reduzierbarkeitsaxioms 109 übereinstimmt, so ergibt sich: (Pn ) (P1 )Φ(P1 ) → Φ(Pn ) und daraus
904 C)
Appendices
(P1 )Φ(P1 ) → (Pn )Φ(Pn ).
Andererseits gilt (Pn )Φ(Pn ) → Φ(P1 ) (Anwendung von Axiom e)). D) (Pn )Φ(Pn ) → (P1 )Φ(P1 ) (nach Regel γ ). Aus C) und D) ergibt sich dann B). Nun ist Pn (x) ∼ Pn (y) ein Ausdruck Φ(Pn ), für welchen die Formel A) beweisbar ist; denn aus (x) Pn (x) ∼ P1 (x) → Pn (x) ∼ P1 (x) , (x) Pn (x) ∼ P1 (x) → Pn (y) ∼ P1 (y) erhält man (x) Pn (x) ∼ P1 (x) → [ P1 (x) ∼ P1 (y) → Pn (x) ∼ Pn (y) ].
5
10
Es gilt also auch für dieses Φ(P ) die Beziehung B), d. h. (Pn ) Pn (x) ∼ Pn (y) ∼ (P1 ) P1 (x) ∼ P1 (y) oder anders geschrieben ≡n (x, y) ∼ ≡1 (x, y),
q · e · d.
Noch charakteristischer und bedeutsamer zeigt sich die Rolle des Axioms der Reduzierbarkeit bei der Grundlegung der Theorie der reellen Zahlen. Wir hatten die Darstellung der Dedekindschen Theorie im Logikkalkül schon früher kurz angedeutet. Nach Dedekind definieren wir eine reelle Zahl als einen „Schnitt“, d. h. als eine Einteilung der rationalen Zahlen in zwei Klassen mit den folgenden „Schnitteigenschaften“: 1. Jede der beiden Klassen enthält mindestens eine rationale Zahl. 2. In der ersten Klasse gibt es keine größte rationale Zahl. 3. Gehört eine Rationalzahl zur ersten Klasse, so gehören auch alle kleineren Rationalzahlen zur ersten Klasse.
110
Wir brauchen nun, wie wir auch vorher schon erwähnt hatten, bei einer Einteilung der beschriebenen Art immer nur die erste der beiden Klassen zu betrachten, und haben es dann mit einer Menge von Rationalzahlen zu tun, welche sich mit Hilfe eines sie definierenden Prädikates darstellen läßt. Wir gehen demnach folgendermaßen vor: Wir nehmen die rationalen Zahlen mit ihren arithmetischen Grundbeziehungen als das System der Gegenstände des Individuenbereiches. Unter einer reellen Zahl verstehen wir dann eine Menge von rationalen Zahlen, für welche es ein definierendes Prädikat P gibt, das den folgenden drei Bedingungen genügt: 1. (Ex)P (x) & (Ex)P (x).
15
20
25
30
35
(„Die durch P (x) und durch P (x) bestimmten Klassen sind beide nicht leer.“) 2. (x){P (x) → (Ey) <(x, y) & P (y) }. („Zu jeder rationalen Zahl, welche die Eigenschaft P besitzt, gibt es eine größere, die gleichfalls die Eigenschaft P hat.“)
40
Grundzüge der theoretischen Logik
3.
5
10
15
20
25
30
35
40
905
(x){P (x) → (y) <(y, x) → P (y) }.
(„Hat x die Eigenschaft P , so haben auch alle kleineren Rationalzahlen y die Eigenschaft P .“) Diese drei Bedingungen zusammen — wir können sie durch das Zeichen & vereinigt denken — machen die „Schnitteigenschaft“ eines Prädikates aus. Diese Eigenschaft eines Prädikates wollen wir mit Sc(P ) bezeichnen. Zwei Prädikate P und Q mit den Eigenschaften Sc(P ) und Sc(Q) stellen dann und nur dann dieselbe reelle Zahl dar, wenn die zu P und Q gehörigen Mengen gleich sind, d. h. wenn Aeq(P, Q) zutrifft. Um der Forderung des Stufenkalküls Rechnung zu tragen, müssen wir noch für die definierenden Prädikate reeller Zahlen eine Höchststufe festsetzen. Um möglichst einfach zu verfahren, wollen wir nur Prädikate erster Stufe zur Definition reeller Zahlen zulassen. Jetzt können wir zunächst die Größenbeziehung zwischen reellen Zahlen einführen. Für zwei Prädikate P1 , Q1 mit der Eigenschaft Sc soll (P1 , Q1 ) gleichbedeutend sein mit Imp(P1 , Q1 ), d. h. mit (x) P1 (x) → Q1 (x) . Oder in Formeln: Sc(P1 ) & Sc(Q1 ) → Imp(P1 , Q1 ) ∼ (P1 , Q1 ) . Die Aussage <(P1 , Q1 ) wird dann zu definieren sein durch Sc(P1 ) & Sc(Q1 ) → <(P1 , Q1 ) ∼ Imp(P1 , Q1 ) & Aeq(P1 , Q1 ) . Es läßt sich dann im Kalkül beweisen, daß die beiden Beziehungen (P1 , Q1 ) und <(P1 , Q1 ) transitiv sind. Ebenso lassen sich alle übrigen Eigenschaften ableiten, die für eine Ordnungsbeziehung charakteristisch sind. Die Addition und Multiplikation reeller Zahlen läßt sich auf die der rationalen Zahlen zurückführen. Das Prädikat (Ey)(Ez) P1 (y) & Q1 (z) & (x = y + z) stellt die Summe, (Ey)(Ez) P1 (y) & Q1 (z) & (x = y · z) das Produkt der durch P und Q definierten reellen Zahlen dar. (x = y + z und x = y · z sind hier dreigliedrige Grundprädikate im Bereiche der Rationalzahlen.) Wir sind jetzt imstande, die Begriffe der Beschränktheit und der oberen Grenze einer Menge von reellen Zahlen in der üblichen Weise einzuführen. Eine Menge von reellen Zahlen wird dargestellt durch ein Prädikatenprädikat A(P1 ), das der Bedingung genügt: (P1 ) A(P1 ) → Sc(P1 ) & (P1 )(Q1 ) (A(P1 ) & Aeq(P1 , Q1 )) → A(Q1 ) . Daß eine Menge A(P1 ) von reellen Zahlen nach oben beschränkt ist, bedeutet, daß es eine reelle Zahl gibt, die größer oder gleich jeder Zahl der Menge ist; in Formeln: (EP1 ){Sc(P1 ) & (Q1 ) A(Q1 ) → (Q1 , P1 ) }, wofür wir zur Abkürzung auch (EP1 )Sch(P1 , A) schreiben, in Worten, es gibt eine Zahl P1 , die eine obere Schranke der Menge A darstellt.
111
906
112
Appendices
Wir wollen auch annehmen, daß A(P1 ) mindestens ein Element enthält, daß also die Formel gilt: (EP1 )A(P1 ). Als Argumentwerte von A kommen nur Prädikate erster Stufe in Betracht. Was die Bestimmung der Höchststufe für die Funktion A selbst betrifft, so muß diese mindestens gleich 2 gewählt werden, da ja A(P ) als Prädikatenfunktion nicht der ersten Stufe angehören kann. Im übrigen ist sie aber ganz beliebig, und wir nehmen irgendein festes n als Index von A. Den Satz von der oberen Grenze kann man nun so formulieren: Wenn eine Menge von reellen Zahlen eine obere Schranke hat, so hat sie auch eine kleinste obere Schranke. Der mathematische Existenzbeweis für die obere Grenze, auf seine einfachste Form gebracht, besteht darin, daß man zu der betrachteten Menge reeller Zahlen, welche eine Menge von Mengen erster Stufe ist, die Vereinigungsmenge bildet. Nach den Bemerkungen von § 3 dieses Kapitels drückt sich die zu An (P1 ) gehörige Vereinigungsmenge aus durch das Prädikat: (EP1 )(P1 (x) & An (P1 )). Wir wollen dieses Prädikat zur Abkürzung mit Vg(x, An ) bezeichnen. Von dem Prädikat Vg(x, An ) soll also gezeigt werden, daß es eine reelle Zahl darstellt, welche die obere Grenze der Menge An darstellt. Wir müssen zuerst die durch Vg(x, An ) bestimmte Menge überhaupt als reelle Zahl erkennen. Zunächst läßt sich leicht zeigen, daß die drei in Sc vereinigten Eigenschaften für Vg gelten. Wir geben die Ableitung für die erste Eigenschaft. Aus (EP1 )An (P1 ), (P1 ) An (P1 ) → Sc(P1 ) schließt man (EP1 ) Sc(P1 ) & An (P1 ) . Da Sc(P1 ) → (Ex)P1 (x) gilt, so hat man (EP1 ) (Ex)P1 (x) & An (P1 ) . Die letzte Formel kann man umformen zu (Ex)(EP1 ) P1 (x) & An (P1 ) , d. h. (Ex)Vg(x, An ). Desgleichen läßt sich zeigen: (Ex)Vg(x, An ), d. h. (Ex)(EP 1 ) P1 (x) & An (P1 ) . Diese Formel läßt sich zunächst umformen zu (Ex)(P1 ) An (P1 ) → P 1 (x) . Man hat nun, gemäß der Voraussetzung der Beschränktheit der Menge An , (EP1 ){Sc(P1 ) & (Q1 ) An (Q1 ) → (Q1 , P1 ) }. Ferner gilt also
Sc(P1 ) → (Ex)P 1 (x),
5
10
15
20
25
30
35
40
Grundzüge der theoretischen Logik
5
10
15
20
25
30
35
40
907
(EP1 ){(Ex)P 1 (x) & Sc(P1 ) & (Q1 ) An (Q1 ) → (Q1 , P1 ) }. Aus der Definition von (Q1 , P1 ) ergibt sich leicht (Q1 , P1 ) & Sc(Q1 ) & Sc(P1 ) → (x) P 1 (x) → Q1 (x) . (Q1 ) An (Q1 ) → (Q1 , P1 ) darf also in der vorletzten Formel durch (Q1 )[An (Q1 ) → (x) P 1 (x) → Q1 (x) ] oder auch durch (x) P 1 (x) → (Q1 ) An (Q1 ) → Q1 (x) ersetzt werden. Aus der Formel (EP1 ){(Ex)P 1 (x) & Sc(P1 ) & (x)[P 1 (x) → (Q1 ) An (Q1 ) → Q1 (x) ]} gewinnt man dann (Ex)(Q1 ) An (Q1 ) → Q1 (x) d. h. (Ex)Vg(x, An ). Damit ist für Vg(x, An ) die erste Schnitteigenschaft bewiesen. In analoger Weise beweist man für Vg(x, An ) die Eigenschaften 2. und 3. (auf S. 110), so daß also Sc(Vg) gilt. Es ist aber damit noch nicht gesagt, daß Vg(x, An ) eine reelle Zahl darstellt. Hierzu müßte man wissen, daß die zu dem Prädikat Vg(x, An ) gehörige Menge durch ein Prädikat der ersten Stufe definierbar ist. Vg(x, An ) ist aber selbst sicher nicht von der ersten Stufe, weil darin ein Klammerzeichen (EP1 ) vorkommt. Hier ist nun die Stelle, wo das Axiom der Reduzierbarkeit eingreift. Nach diesem Axiom gilt (EP1 )(x) P1 (x) ∼ Vg(x, An ) . Vg(x, An ) definiert also eine reelle Zahl. Wir zeigen nun (P1 ) An (P1 ) → P1 , Vg(x, An ) , d. h. die Vg(x, An ) entsprechende reelle Zahl ist eine obere Schranke für die durch An (P1 ) bestimmte Menge. Setzen wir für Vg und den definierenden Ausdruck ein, so verwandelt sich diese Formel in (P1 ) An (P1 ) → (x)[P1 (x) → (EQ1 ) Q1 (x) & An (Q1 ) ] und durch Umformung in (P1 )(x) An (P1 ) & P1 (x) → (EQ1 ) An (Q1 ) & Q1 (x) . Die letzte Form läßt die Formel als eine Anwendung des Axioms f) erkennen. Es bleibt noch zu zeigen, daß Vg(x, An ) die kleinste obere Schranke darstellt, oder in Formeln: (P1 ){[Sc(P1 ) & (Q1 ) An (Q1 ) → (Q1 , P1 ) ] → (Vg, P1 )}. Ersetzen wir hier wieder alle Abkürzungen durch ihre Definition, so erhält man: (P1 ){[Sc(P1 ) & (Q1 ) An (Q1 ) → (x) Q1 (x) → P1 (x) ]
113
908
Appendices
→ (y)[(EP1 ) P1 (y) & An (P1 ) → P1 (y)]}. Man kann hier das Allzeichen (x) nach vorn bringen, erhält also: (P1 ){[Sc(P1 ) & (x)(Q1 ) An (Q1 ) & Q1 (x) → P1 (x) ] → (y)(EP1 ) P1 (y) & An (P1 ) → P1 (y) }. Diese Formel können wir mit Hilfe von Formel (22) ableiten. Die angegebenen Beispiele mögen genügen, um zu zeigen, daß die Einführung des Axioms der Reduzierbarkeit das geeignete Mittel ist, um den Stufenkalkül zu einem System zu gestalten, mit Hilfe dessen die Schlußweisen der höheren Mathematik gewonnen werden können. Ein vollständiger Aufbau der Grundlagen der Mathematik mit Hilfe des Stufenkalküls ist von Whitehead und Russell gegeben worden1 .
5
10
§ 9. Schlußbemerkungen zum Stufenkalkül.
114
In der zuletzt angenommenen Gestalt stellt die Russellsche Stufenlogik ein logisches Instrument dar, das auch bei der Darstellung komplizierter logischer Zusammenhänge, wie sie in der Theorie der reellen Zahlen vorliegen, nicht versagt. Wir wollen aber noch einmal auf die prinzipielle Seite dieser Logik eingehen. Die Schwierigkeit, die zur Aufstellung der Stufenlogik nötigte, bestand darin, daß die Begriffe „alle Eigenschaften“, „alle Aussagen“, falls sie in unbeschränkter Allgemeinheit gebraucht werden, einen Zirkel enthalten. Der Gedanke der Stufenlogik war dann der folgende: Wir legten einen bestimmten Individuenbereich zugrunde und dachten uns gewisse auf die Gegenstände dieses Bereiches bezüglichen Grundeigenschaften und Grundbeziehungen als gegeben. Aus diesen leiteten sich die weiteren Prädikate durch die logischen Operationen her. Je nach der Art ihrer Definition erhielten die Funktionen eine gewisse Stufe. Da sich dann bei den Anwendungen der Kalkül als unzureichend herausstellte, halfen wir uns durch die Einführung des Axioms der Reduzierbarkeit. Was ist nun die inhaltliche Bedeutung dieses Axioms? Es ist durchaus nicht evident, wie die übrigen Regeln des Schließens, die wir in die Formelsprache des Funktionenkalküls gekleidet hatten. Wir können zu Ungunsten des Reduzierbarkeitsaxioms noch mehr sagen. Bei beliebiger Wahl der Grundeigenschaften und Grundbeziehungen ist das Axiom der Reduzierbarkeit im allgemeinen sicher nicht erfüllt. Es würde sich also darum handeln, in jedem vorgelegten Falle das System der Grundfunktionen so zu ergänzen, daß dadurch der Forderung des Axioms entsprochen wird. Durch ein konstruktives Verfahren ist eine derartige Ergänzung nicht zu erreichen, da die erste Stufe definitionsgemäß durch die Operationen &, ∨, →, , (x), (Ex) abgeschlossen ist. Somit bleibt nur die Möglichkeit, das System der Grundprädikate 1
A. N. Whitehead and B. Russell, Principia mathematica. Whitehead and Russell 1910 ; Whitehead and Russell 1912 ; Whitehead and Russell 1913
15
20
25
30
35
Grundzüge der theoretischen Logik
5
10
15
20
25
30
35
40
45
909
erster Stufe als einen an sich bestehenden Inbegriff vorauszusetzen, so daß ihre Mannigfaltigkeit weder von den tatsächlich gegebenen Definitionen, noch auch überhaupt von unseren Möglichkeiten des Definierens abhängt. Dieser Bereich der Funktionen der ersten Stufe muß so weit sein, daß das Axiom der Reduzierbarkeit zutrifft. Betrachtet man nun die Prädikate nur insofern als verschieden, als die ihnen zugehörigen Mengen verschieden sind, nimmt man also eine mengentheoretische Deutung des Kalküls vor, so besagt die Forderung des Axioms der Reduzierbarkeit: der Inbegriff der Funktionen der ersten Stufe müßte so weit sein, daß er schon alle Funktionen enthält. Es wäre dann aber der Gedanke eines Stufenkalküls eine unnötige Komplikation und man kann gleich das System aller Funktionen von demselben Typ als einen in sich bestehenden Inbegriff voraussetzen. Es würde demnach von | den Russellschen Ideen nur die erste bestehen bleiben, daß man scharf unterscheidet zwischen Individuenfunktionen, Funktionen von Individuenfunktionen usw. Die eigentliche Stufenunterscheidung würde aber fortfallen. Setzt man das System aller Individuenprädikate als feste Gesamtheit voraus, und definiert man ein neues Individuenprädikat durch Bezugnahme auf alle Individuenprädikate, so braucht das in dieser Auffassung keinen logischen Zirkel darzustellen. Es wird ja kein neues Individuenprädikat eingeführt, sondern nur ein bestimmtes Individuenprädikat durch die Bezugnahme auf alle Individuenprädikate näher bezeichnet. Wenigstens liegt hier der Fall nicht wesentlich anders als bei der Russellschen Stufenlogik mit Hinzufügung des Reduzibilitätsaxioms. Auch hier können Prädikate erster Stufe definiert werden, indem man zunächst ein Prädikat der zweiten Stufe definiert und dann ein äquivalentes Prädikat der ersten Stufe nimmt. Es fragt sich aber, wie es bei einer derartigen Auffassung mit den Paradoxien steht. Das Zustandekommen der ersten Paradoxie beruht darauf, daß ein Prädikat als sein eigenes Argument gebraucht wird. Eine derartige Einsetzung in die Leerstelle einer Funktion ist jetzt nicht möglich, da eine Funktion immer einen höheren Typ hat als jedes ihrer Argumente. Die beiden anderen Paradoxien haben einen von der ersten wesentlich verschiedenen Charakter. Während die erste Paradoxie einen Widerspruch des Funktionenkalküls in der allgemeinen Form, wie er damals formuliert war, in sich selbst ergab, so zeigen die beiden anderen für den Kalkül nur die Unverträglichkeit gewisser Behauptungen. Im ersten Fall waren das Bh[(X) Bh(X) → X ] und (X)[Bh(X) → ≡ X, (Y ) Bh(Y ) → Y ], im zweiten Falle (Ex)Dsc(x), Scr(Mds) und (P ){(Ex)P (x) → (Ex)[P (x) & (y) <(y, x) → P (y) ]}. Keine von diesen Behauptungen stellt eine logische Identität dar. Die Paradoxien treffen also gar nicht unseren Kalkül. Wir wollen daher auf sie nicht weiter eingehen. In der allgemeinsten Fassung ist der Kalkül, den wir so erhalten, allerdings ohne genauere Untersuchung noch problematisch. Einen fest umrissenen und
115
910
Appendices
in sich abgeschlossenen Bereich von Formeln erhält man, wenn man nur die zu Individuenprädikaten gehörigen Variablen und die zugehörigen Klammerzeichen zuläßt. Für diesen Bereich läßt sich auch das Entscheidungsproblem aufstellen. Einen allgemeinen Aufbau der Logik, frei von den Schwierigkeiten des Reduzierbarkeitsaxioms, findet man in den Untersuchungen von D. Hilbert über die Grundlagen der Mathematik, von denen demnächst eine zusammenhängende Darstellung erscheinen wird. 116
5
Literaturverzeichnis. In dem folgenden Literaturverzeichnis sind nur einige der wichtigsten Schriften, die positive Beiträge zur mathematischen Logik enthalten, angeführt. Abhandlungen rein philosophischen oder mengentheoretischen Inhalts sind nicht berücksichtigt. Ausführlichere Angaben über ältere Literatur findet man in dem unten zitierten Buch von C. I. Lewis. An zusammenfassenden Werken, die für eine Weiterbildung zunächst in Frage kommen, nennen wir:
10
15
Couturat, L., L’algèbre de la logique. Paris 1905. (Eine kurzgefaßte Einführung in den Schröderschen Ideenkreis unter Ausschluß der Relationslogik.) Couturat 1905 Lewis, C. I., A survey of symbolic logic. Univ. of Calif. Press, Berkeley 1918. Lewis 1918
20
Russell, B., Einführung in die mathematische Philosophie. München 1922. Russell 1923 Schröder, E., Vorlesungen über die Algebra der Logik, 3 Bde., I. Bd. 1890, II. Bd., 1. Abt., 1891, III. Bd. 1895, II. Bd., 2. Abt., hrsg. v. E. Müller, 1905. Schröder 1890 ; Schröder 1891 ; Schröder 1895
25
Whitehead, A. N., and Russell, B., Principia mathematica. Vol. I, 1910; vol. II, 1913, vol. III, 1913. Camb. Univ. Press. Whitehead and Russell 1910 ; Whitehead and Russell 1912 ; Whitehead and Russell 1913 Weitere Literatur.
30
Ackermann, W., Begründung des „tertium non datur“ mittels der Hilbertschen Theorie der Widerspruchsfreiheit. Math. Ann. 93 (1924). Ackermann 1925 —, Die Widerspruchsfreiheit des Auswahlaxioms. Nachr. d. Ges. d. Wiss. z. Göttingen 1924. Ackermann 1924b —, Zum Hilbertschen Aufbau der reellen Zahlen. Math. Ann. 99 (1928). Ackermann 1928a —, Über die Erfüllbarkeit gewisser Zählausdrücke. (Erscheint in den Math. Ann.) Ackermann 1928b
35
Grundzüge der theoretischen Logik
911
Behmann, H., Beiträge zur Algebra der Logik und zum Entscheidungsproblem. Math. Ann. 86 (1922). Behmann 1922 —, Mathematik und Logik. Math.-Phys. Bibl., Leipzig 1927. Behmann 1927 5
Bernays, P., Axiomatische Untersuchung des Aussagenkalküls der Principia Mathematica. Math. Zeitschr. 25 (1926). Bernays 1926 — und M. Schönfinkel, Zum Entscheidungsproblem der mathematischen Logik. Math. Ann. 99 (1928). Bernays and Schönfinkel 1928 —, Probleme der theoretischen Logik. Unterrichtsbl. f. Math. u. Naturwissenschaften 1927. Bernays 1927
10
Bernstein, B., A set of four independent postulates for Boolean algebras. Trans. Amer. Math. Soc. 17 (1916). Bernstein 1916 Boole, G., The mathematical analysis of logic. Cambridge 1847. Boole 1847 —, The calculus of logic. Camb. and Dublin Math. Journ. 3 (1848). Boole 1848
15
—, An investigation of the laws of thought. London 1854. Boole 1854a —, On a general method in the theory of probabilities. Phil. Mag. ser 4, 7 (1854). Boole 1854b Burali-Forti, C., Logica matematica. Mailand 1894. Burali-Forti 1894
20
Chwistek, L., The theory of constructive types. Krakau 1923/25. Chwistek 1924–25 De Morgan, A., Formal logic; or, The calculus of inference, necessary and probable. London 1847. De Morgan 1847 —, Series of five papers, „On the syllogism“ etc. Trans. Camb. Phil. Soc. 1846–63. De Morgan 1846–63
25
Dines, L. L., Complete existential theory of Sheffer’s postulates for Boolean algebras. Am. Math. Soc. Bull. 21 (1915). Dines 1915 Frege, G., Begriffsschrift, eine der arithmetischen nachgebildete Formelsprache des reinen Denkens. Halle 1879. Frege 1879
30
—, Die Grundlagen der Arithmetik, eine logisch-mathematische Untersuchung über den Begriff der Zahl. Breslau 1884. Frege 1884 —, Über formale Theorien der Arithmetik. Sitz. d. Jena. Ges. f. Med. u. Naturw. 1885. Frege 1885 —, Grundgesetze der Arithmetik, begriffsschriftlich abgeleitet, 2 Bde. Jena 1893–1903. Frege 1893
35
Hahn, O., Über die Koeffizienten einer logischen Gleichung und ihre Beziehungen zur Lehre von den Schlüssen. Arch. f. sys. Phil. 15 (1909). HahnNeurath 1910 — und Neurath, O. Zum Dualismus in der Logik. Arch. f. sys. Phil. 15 (1909). Hahn-Neurath and Neurath 1909
117
912
Appendices
Hamilton, W., Lectures on logic. Edinburgh 1860. Hamilton 1860 Hilbert, D., Neubegründung der Mathematik. Abhdl. a. d. Math. Sem. d. Hamburg. Univ. 1922. Hilbert 1922b —, Die logischen Grundlagen der Mathematik. Math. Ann. 88 (1922). Hilbert 1923a
5
—, Über das Unendliche. Math. Ann. 96 (1926). Hilbert 1926 —, Die Grundlagen der Mathematik. Abhandl. a. d. Math. Sem. d. Hamb. Universität 1928. Hilbert 1928a Huntington, E. V., Sets of independent postulates for the algebra of logic. Trans. Amer. Math. Soc. 5 (1904). Huntington 1904
10
Jevons, W. S., Pure logic or the logic of quality apart from quantity. London 1864. Jevons 1864 —, Studies in deductive logic. London 1880. Jevons 1880 Johnson, W. E., The logical calculus. Mind, n. s. 1 (1892). Johnson 1892 —, Sur la théorie des équations logiques. In Bibl. Cong. int. de Phil. Paris 1900. Johnson 1900
15
Keynes, J. M., A treatise on probability. London 1921. Keynes 1921 Ladd-Franklin, C., On the algebra of Logic. In „Studies in logic by John Hopkin’s University“. Ladd-Franklin 1883 Löwenheim, L., Auflösung von Gleichungen im logischen Gebietekalkül. Math. Ann. 68 (1910). Löwenheim 1910
20
—, Über Transformationen im Gebietekalkül. Math. Ann. 73 (1913). Löwenheim 1913 —, Über Möglichkeiten im Relativkalkül. Math. Ann. 76 (1915). Löwenheim 1915
25
MacColl, H., The calculus of equivalent statements (8. Abhandl.). Proc. London Math. Soc. 1877–1898. MacColl 1877–1898 —, Symbolical reasoning (8. Abhandl.). Mind 1880–1906. MacColl 1880 – 1906 —, Symbolical logic and its applications. London 1906. MacColl 1906
30
Neumann, J. v., Zur Hilbertschen Beweistheorie. Math. Zeitschr. 26 (1927). von Neumann 1927 Peano, G., Notations de logique mathématiques; introduction au Formulaire de Mathématiques. Turin 1894. Peano 1894 —, Formulaire de Mathématiques. Tome I, 1895; II, 1897; III, 1901; IV, 1902; V, 1908. Peano 1895–1908 Peirce, C. S., On an improvement in Boole’s calculus of logic. Proc. Amer. Acad. Arts and Sci. 7 (1867). Peirce 1867
35
Grundzüge der theoretischen Logik
913
—, Description of a notation for the logic of relations. Mem. Amer. Acad. Arts and Sci. 9 (1870). Peirce 1870 —, On the algebra of logic. Amer. J. of Math. 3 (1880). Peirce 1880 5
—, The logic of relatives. In „Studies in Logic by John Hopkin’s University“. Peirce 1883a —, On the algebra of logic; a contribution to the philosophy of notation. Amer. J. of Math. 7 (1885). Peirce 1885 Poretzky, P., Sept lois fondamentales de la théorie des égalités logiques. Bull. Phys.-Math. Soc. Kasan, 1898. Poretzky 1898
10
—, Théorie conjointe des égalités et des non-égalités logiques, ibid., 1908. Poretzky 1908 Ramsey, F. P., The foundations of mathematics. Proc. London Math. Soc. 25 (1926). Ramsey 1926
15
Russell, B., The theory of implication. Amer. J. of Math. 28 (1906). Russell 1906 —, Principles of mathematics. Camb. Univ. Press, 1903. Russell 1903 —, Mathematical logic as based on the theory of types. Amer. J. of Math. 30 (1908). Russell 1908
20
—, La théorie des types logiques. Rev. de Mét. et de Mor. 18 (1910). Russell 1910 Schröder, E., Der Operationskreis des Logikkalküls. Leipzig 1877. Schröder 1877 —, Abriß der Algebra der Logik, hrsg. v. E. Müller, 1909/1910. Schröder 1909–10
25
30
Sheffer, H. M., A set of five independent postulates for Boolean algebras, with application to logical constants. Trans. Amer. Math. Soc. 14 (1913). Sheffer 1913 Skolem, Th., Logisch-kombinatorische Untersuchungen über die Erfüllbarkeit oder Beweisbarkeit mathematischer Sätze. Vidersk. Skriften. Mat. Naturw. Klasse 1920, Nr. 4. Kristiania 1920. Skolem 1920 Venn, J., Symbolic logic. 2. Aufl. London 1894. Venn 1894 Whitehead, A. N., A treatise of universal algebra. Camb. Univ. Press, 1898. Whitehead 1898
35
—, Memoir on the algebra of symbolic logic. Amer. J. of Math. 23 (1901). Whitehead 1901 —, The logic of relations, logical substitution groups and cardinal numbers, ibid., 25 (1903). Whitehead 1903
118
914
Appendices
Namen- und Sachverzeichnis
119
(Die Zahlen geben die Seiten an.) Ableitung von Regeln und Formeln im Aussagenkalkül 23 ff., im Funktionenkalkül 55 ff. — aller Folgerungen aus gegebenenen Axiomen im Aussagenkalkül 18 ff. Ackermann, W. 66, 81. Allgemeine Urteile 35, 46. Allgemeingültigkeit, Problem der 17, 72. Allzeichen 46, 83. Anzahlbegriff, logische Einführung des 86 ff. Äquivalenzen des Aussagenkalküls 5 ff. Aristotelische Logik 37. Assoziatives Gesetz für logische Summe und logisches Produkt 6. Ausdruck, logischer 52. Aussagenformel, logische 54. Aussagenkalkül 3. Aussagenvariable 51. Axiome des Aussagenkalküls 22. — des Funktionenkalküls 53. Behmann, H. 77. Beispiele für den Gebrauch des Funktionenkalküls 68 ff. Bernays, P. 23, 54, 81. Beziehungen 45. Boole, G. 1. Brentano 8.
Einsetzungsregel 23, 53. Eliminationsregel 16, 85. Entbehrlichkeit von logischen Grundverknüpfungen 8. Entscheidungsproblem 17, 72 ff., 77 ff., 85. Entweder-Oder 4. Erfüllbarkeit, Problem der 17, 73. Ersetzungsregel 60. Existenzialzeichen s. Seinszeichen. Formulaire de Mathématiques 2. Frege, G. 2. Funktionen, logische 44. Funktionenkalkül 43. Funktionsvariable 51. Gegenteil, Bildung des, im Aussagenkalkül 12; im Funktionenkalkül 61. Grundverknüpfungen, logische 3. Hilbert, D. 2, 23, 66. Identität, Definition der 83, 103. Immer richtige Aussagenverbindungen 11. Individuelle Zeichen 51. Individuenvariable 51. Induktion, vollständige 83.
De Morgan 1. Distributives Gesetz für logische Summe und logisches Produkt 6. Dualitätsprinzip 12 f., 62.
Kant, I. 43. Klammerzeichen 46. Klassenkalkül 36. Kombinierter Kalkül 36. Kommutatives Gesetz für logische Summe und logisches Produkt 6. Konstituenten 15. Konvergenz, gewöhnliche und gleichmäßige 51.
Eigennamen 45, 52.
Leibniz 1.
Cantor scher Beweis für die Existenz überabzählbarer Mengen 104.
5
10
15
20
25
30
35
40
Grundzüge der theoretischen Logik
Logische Formeln 54. Löwenheim, L. 77, 80, 81.
5
10
15
20
25
30
35
Mannigfaltigkeit der Aussagenverbindungen 14 f. Mengenlehre 88. Normalform, konjunktive des Aussagenkalküls 13. — , ausgezeichnete konjunktive 16. — , disjunktive des Aussagenkalküls 13. — im Funktionenkalkül 63. Obere Grenze, Satz von der 106, 111. Ordnung einer Menge 92. Paradoxien, logische 92. Partikuläre Urteile 37, 46. Peano, G. 2. Peirce, C. S. 1. Prädikatenkalkül 34. Prädikativer Funktionsaussdruck 107. Principia mathematica s. Russell. Produkt, logisches 6. Reduzierbarkeit, Axiom der 106 ff. Reelle Zahlen, Begründung der Theorie der 105, 109 ff. Reflexivität 82. Russell, B. 2, 8, 23, 98 f., 113. Schema für „alle“ und „es gibt“ 54. Schlußfiguren 37. Schlußschema 23, 54. Schönfinkel, M. 81. Schröder, E. 2, 15.
915
Seinszeichen 46, 83. Sheffer 9. Skolem, Th. 80. Stufenkalkül 98 ff. Summe, logische 6. Symbolische Logik 1. Symmetrie 82. Traditionelle Logik 37, 43. Transitivität 82. Typentheorie 99. Umformung von Aussagenverbindungen 9. Unabhängigkeit von Axiomen 31. Variable, logische 45, 51, 54. — , gebundene und freie 46. Vereinfachung von Aussagenverbindungen 16. Vertauschungsregel für die Klammerzeichen 47, 63. Vollständigkeit der Axiome im Aussagenkalkül 31, im Funktionenkalkül 66 ff. Whitehead, A. N. 2, 23, 98 f., 113. Widerspruchsfreiheit, Problem der 29, 65. Wirkungsbereich eines Klammerzeichens 52. Wohlordnung 92. Zahlbegriff, logische Behandlung des 86. Zahlenreihe, Grundeigenschaften der 48.
916
Appendices
Textual Notes 812.17: 821.11: 822.9: 835.8: 838.18: 844.24: 845.11: 851.23: 858.13: 860.18: 861.20: 862.23: 869.13: 872.17: 872.15: 870.39: 875.39: 875.19–20: 877.21: 878.31: 879.19: 880.3: 885.16: 886.fn: 888.7: 888.7: 904.37: 907.3: 907.33: 908.32: 909.40: 910.14: 910.20: 910.22: 910.27: 910.32: 911.4: 911.16: 911.38: 912.27: 913.10: 913.15–16: 913.28–29:
Principia] Prinzipia & und ∨] & und v a1)–a4)] a1)—a4) werden.] werden soll.] soll, können.)] können. IV. ] IV .] ). A durch A] A durch A (Regel VII).] (Regel VII) vgl.] [vgl. [Einsetzung in Axiom f)]
in Axiom f)]] (Einsetzung A → B(1) & A → B(2) ] A → B(1) & (A → B(2) Gesetz] Gesetz“ , “] “, Geraden] Gerade Geraden] Gerade Identitätsbeziehung] Indentitätsbeziehung A, B, . . . K.] A, B . . . K. A0 , B0 , . . . K0 ] A0 , B0 , . . . K0 (Ex)(Ey) F (x, x) & F (x, y) ] (Ex)(Ey)(F (x, x) & F (x, y)
(Ex)(Ey)(Ez)(u) F (x, x) ∨ F (x, y) & F (y, z) & F (x, z) ∨ F (x, u) .]
(Ex)(Ey)(Ez)(u) F (x, x) ∨ F (x, y & F (y, z) & F (x, z) ∨ F (x, u) .] 1923] 1922 besteht]
gesteht (x)(y) R1 (x, y) ∼ R2 (x, y) ] (x)(y)(R1 (x, y) ∼ (R2 (x, y)) .] ,
(Q1 , P1 ) & Sc(Q1 ) & Sc(P1 ) → (x) P 1 (x) → Q1 (x) .] (Q1 , P1 ) &
& Sc(P1 ) → (x) P 1 (x) → Q 1 (x) . Sc(Q1 )
(P1 )(x) An (P1 )& (P1 )(x) An (P1 )&P1 (x) → (EQ
1 ) An (Q1 )&Q1 (x) .] P1 (x) → (EQ1 ) An (Q1 ) & Q1 (x) . des] der
(P ){(Ex)P (x) → (Ex)[P (x)&(y) <(y, x) → P (y) ]}.] (P ){(Ex)P (x) → (Ex)[P (x) & (y) <(y, x) → P (y)]}. C. I. Lewis] C. J. Lewis Lewis, C. I.] Lewis, C. J. 1923] 1922 Principia] Prinzipia Ann.] Ann Principia] Prinzipia Mag.] Mag, ] , ] . Théorie] Theorie Russell, B.] — Logisch-kombinatorische Untersuchungen über die Erfüllbarkeit oder Beweisbarkeit mathematischer Sätze] Logisch-kombinatorische Untersuchungen über Erfüllbarkeit und Beweisbarkeit mathematischer Sätze
Appendix B: Hilbert’s Second Hamburg Lecture (1927)
917
Appendix B: Hilbert’s Second Hamburg Lecture (1927)
Introduction
This Appendix reprints Hilbert’s paper ‘Die Grundlagen der Mathematik’ (Hilbert 1928a), the published version of some lectures which Hilbert gave in July of 1927 to the Mathematisches Seminar at the University of Hamburg.1 Whether by accident or design, Hamburg seems to have been the preeminent venue (Göttingen apart) for Hilbert’s presentation of foundational material. The lectures in the summer of 1927 form Hilbert’s second important public discussion there of material on the foundations of mathematics, the first of which, in the summer of 1921, resulted in Hilbert 1922b.2 The paper ‘Die Grundlegung der elementaren Zahlenlehre’ (Hilbert 1931a: see Appendix D, below) also originated as a lecture in Hamburg. And in late July of 1923 Hilbert also held in Hamburg an important series of three lectures on fundamental questions of physics.3 The paper reprinted in this Appendix was, like the one resulting from the 1921 lecture, published in the Abhandlungen aus dem mathematischen Seminar der Hamburgischen Universität. Hilbert’s paper was succeeded in print by two further papers, some ‘Diskussionsbemerkungen’ by Hermann Weyl, and 1 An
English translation of this paper can be found in van Heijenoort 1967 , 464–479. 1921 Hamburg lectures had already been given in the spring of 1921 in Copenhagen; for details, see the Introduction to the Volume, n. 20, p. 12 above, and then the Introduction to Chapter 3, especially p. 418. 3 See Hilbert 1923d* , Hilbert 1923c* and Hilbert 1923e* . (The third of these lectures was presented in Zürich a few months after this.) These lectures are published for the first time in Volume 5 of this Edition. 2 The
918
Appendices
a ‘Zusatz’ by Paul Bernays.4 Hilbert’s paper was republished, together with Weyl’s remarks and Bernays’s ‘Zusatz’, in an ‘Einzelschrift’ of the Hamburg Mathematisches Seminar. (See Hilbert 1928b.) All three papers are direct reprints, the only difference being new pagination. All three are also reproduced here in their original form, together with a letter from Bernays to Weyl from January 1928, which, among other things, elaborates the central idea expounded in his ‘Zusatz’.5 Hilbert’s paper was also republished (Hilbert 1930d ) as the penultimate Appendix (Appendix IX) to the Seventh Edition of the Grundlagen der Geometrie (see Hilbert 1930a, 289–312). The subtitle of this republication declares it to be an abbreviated version of the original, but what is not mentioned is that it has also been lightly revised. In what follows, the original paper and its edited reprinting are standardly referred to as ‘the original’ and ‘the republication’ respectively. The official Vorlesungsverzeichnis der Hamburger Universität for 1927 announces on p. 10 under ‘XIII Mathematik’ three lectures by Hilbert: . . . öffentliche Vorlesungen Prof. Hilbert (Universität Göttingen) Grundfragen der Mathematik. Drei Gastvorlesungen, Ende Juli.
Fully in accord with this, Bernays’s letter to Weyl of the 5 January 1928 repeatedly refers to Hilbert’s lectures in Hamburg in 1927.6 However, the journal’s running head of the original publication of Hilbert’s paper reads ‘Die Grundlagen der Mathematik. II’, although the ‘II’ does not appear in the title proper; and Weyl’s paper which follows is entitled ‘Diskussionsbemerkungen zu dem zweiten Hilbertschen Vortrag über die Grundlagen der Mathematik’ (emphasis added). Since Hilbert clearly held two or three lectures, it is possible that the ‘II’ and Weyl’s ‘second’ refer just to the second of Hilbert’s lectures, i. e., that the published paper represents just Lecture II of Hilbert’s series. But this seems highly unlikely. For one thing, Hilbert’s published paper seems quite self-contained, even repeating material already presented in the Münster lecture (Hilbert 1926 ) and earlier; for another, at over twenty published pages, it certainly contains more than could have been presented in a single lecture. (It is, of course, entirely possible that material was subsequently added or greatly expanded in preparation for the publication.) On the other hand, the published version of the lecture delivered by Hilbert in Hamburg in 1921 bears the subtitle ‘Erste Mitteilung’, with ‘I’ in its running head. It is therefore natural to suppose that the ‘II’ refers indirectly to the report of Hilbert’s second discussion of the foundations of mathematics 4 The
two papers are respectively Bernays 1928 and Weyl 1928 . English translations of these are also to be found in van Heijenoort 1967 , 482–484, 485–489 respectively, thus following that of Hilbert’s paper. According to Reid, Weyl’s actual ‘Diskussionsbemerkungen’ had immediately followed Hilbert’s lectures in Hamburg: see Reid 1970 , p. 186. 5 The letter is to be found in the Weyl Nachlaß held in the Wissenschaftshistorische Sammlung of the library of the ETH in Zürich: see Hs. 91 : 10a. 6 See, for instance, p. 950, below.
Introduction
919
in Hamburg, Hilbert 1922b being the first, especially since both papers appear in the same journal. If this is right, then Weyl’s reference to the ‘zweiten Hilbertschen Vortrag über die Grundlagen der Mathematik’ is a little misleading, since Hilbert had given several important public lectures on the foundations of mathematics between his first Hamburg lecture in 1921 and the ones in Hamburg in 1927. In the period before his visit to Hamburg, Hilbert had been unwell. He had been suffering from what was diagnosed in the autumn of 1925 as pernicious anæmia, a very serious, and at that time untreatable, disease. In her biography of Hilbert, Reid remarks that ‘[b]y 1927 Hilbert was well enough to go again to Hamburg . . . ’, referring to the Hamburg lectures represented here. (See Reid 1970 , 185.) She also states that Hilbert’s condition improved dramatically after taking a medicine based on large amounts of raw liver, a treatment discovered in the United States only in 1926. (See Reid 1970 , 179– 180.) The indirect implication is that Hilbert started the treatment with this new medicine almost immediately. However, this seems not to be correct. In the letter to Weyl from January 1928 reproduced below, Bernays writes that: Hilbert’s condition has improved substantially since the occasion of his Hamburg lectures. As I daresay you know, since the beginning of October [1927] he has been taking an American medicine (a liver preparation), and this is clearly the cause of the improvement. (See pages 1–2 of the letter, p. 950 below.)
As mentioned above, Hilbert’s paper was followed in print by the papers of Weyl and Bernays. Weyl’s contribution consists of some philosophical reflections on the programme as presented in Hilbert’s paper. These for the most part are concerned with ways in which Hilbert’s standpoint can be reconciled with, and still differs from, the intuitionistic standpoint, a standpoint which Weyl endorsed in the early 1920s, and which he criticises now, although he is still concerned to defend it to a certain degree. Referring to the Beweistheorie as ‘the crowning achievement of Hilbert’s axiomatic life’s work’, Weyl goes on to make the famous remark: Even when one assesses the newly created situation from the epistemological point of view, nothing, as I take great pleasure in affirming, separates me from Hilbert. (Op. cit., p. 87; see p. 944 below.)
To judge from Bernays’s letter, Weyl’s remarks certainly made an impression, since Bernays writes to Weyl: In the course of proofreading, I have repeatedly gone through your remarks supplementing Hilbert’s lectures. They are very much in accord with my way of thinking. (See p. 9 of the letter, p. 953 below.)
Bernays’s own paper consists of further detail on Ackermann’s approach to consistency proofs for systems involving the ε-operator and the elimination of ε-terms, work sketched by Hilbert in his paper (p. 82). In his 1935 essay on Hilbert’s work on the foundations of arithmetic (Bernays 1935 ), Bernays refers to Ackermann’s work and its mention in Hilbert’s paper, and also to his own ‘Zusatz’. Bernays denotes by F 2 a restricted system of first-order
920
Appendices
arithmetic with ε-terms (and the ε-Axiom), but which admits induction only for formulas without bound variables. He then says this: The consistency of F2 is shown: 1. by a proof due to W. Ackermann which builds on an idea of Hilbert’s set out in the Leipzig lecture. ‘Die logischen Grundlagen der Mathematik’ [Hilbert 1923a] . . . (p. 213).
Bernays then continues in a footnote on the same page: In Ackermann’s Dissertation „Begründung des ‚tertium non datur‘ mittels der Hilbertschen Theorie der Widerspruchsfreiheit“ [Math. Ann. Bd. 93 (1924 sic)], the proof at the end is not executed quite precisely. Subsequently, however, Ackermann furnished a complete and at the same time simplified method of proof. Hitherto there is no published version of this definitive version of Ackermann’s proof, only the report of Hilbert’s in his second Hamburg lecture „Die Grundlagen der Mathematik“ already mentioned, as well as the somewhat more detailed „Zusatz“ of P. Bernays, which appeared with Hilbert’s lecture in the Abh. math. Semin. Hamburg Univ. Bd. 6 (1928). (The concluding remark, which concerns the extension of the consistency proof to a system with complete induction, should be ignored.)7
Much of the detail of Bernays’s ‘Zusatz’ is contained in his letter to Weyl reproduced below. Referring to Ackermann’s method, Bernays remarks: To come now to your inquiry, the Ackermann proof referred to is hitherto unpublished. The published version of the Hilbert lectures still contains only a weak outline. (See p. 2 of the letter, p. 950 below.)
After setting out the details, Bernays goes on: As for the question of publication, I would like first to know Hilbert’s view — (at the moment, I am with my relatives in Berlin) —; in any case, a precise presentation of Ackermann’s proof is envisaged for the book which Hilbert and I have in view, — although for this book there exists hitherto only one § in draft. (See p. 9 of the letter, p. 953 below.)
The unpublished Ackermann proof was indeed expounded in the book Bernays and Hilbert had ‘in view’; see Hilbert and Bernays 1939 , 121, n. 1. 7 In
the original German, the passage is:
Die Widerspruchsfreiheit von F2 wird erwiesen: 1. durch einen Beweis von W. Ackermann, welcher von dem in Hilberts Leipziger Vortrag „Die logischen Grundlagen der Mathematik [Hilbert 1923a]“ dargelegten Hilbertschen Ansatz ausgeht; . . . (p. 213)
And the footnote in question reads: In der Ackermannschen Dissertation „Begründung des ‚tertium non datur‘ mittels der Hilbertschen Theorie der Widerspruchsfreiheit“ [Math. Ann. Bd. 93 (1924 sic)] ist der Beweis in seinem Schlußteil noch nicht genau ausgeführt. Ackermann hat hernach aber eine vollständige und zugleich vereinfachte Beweisführung geliefert. Von dieser definitiven Fassung des Ackermannschen Beweises liegt bisher keine Veröffentlichung vor, sondern nur der bereits erwähnte Bericht Hilberts in seinem zweiten Hamburger Vortrag „Die Grundlagen der Mathematik“ sowie der etwas ausführlichere „Zusatz“ von P. Bernays, der zugleich mit dem Vortrag in den Abh. math. Semin. Hamburg Univ. Bd. 6 (1928) erschienen ist. (Die hierin am Schluß stehende Bemerkung betreffend die Einbeziehung der vollständigen Induktion muß fallen gelassen werden.)
Ackermann’s Dissertation is Ackermann 1924a* , and its published version is Ackermann 1925 , which explains Bernays’s addition in brackets.
Introduction
921
It is worth remarking that the ‘concluding remark’ referred to by Bernays in the passage from his 1935 essay quoted above is to be found, not just in his ‘Zusatz’ (see Bernays 1928 , 92), but also on p. 312 of the republication of Hilbert’s Hamburg paper, where it appears without remark as part of Hilbert’s text. (It can be found here, quoted below in n. 38 on p. 940.) The incorporation of Bernays’s exposition is fully in accord with Hilbert’s statement in concluding the Hamburg paper: . . . [Bernays] has not only offered me continual support through his counsel, but has also contributed his own thoughts and new points of view, so much so, that I would like to designate this work as a common one. It is our intention to publish soon a detailed presentation of the theory.8
The items reproduced in this Appendix have been only lightly edited from the originals: the very few orthographic errors (e. g., mistakes in bracketing) have been silently or quietly corrected, and explicit references in the style of this Volume have been supplied. The substantive changes in the reprints of Hilbert’s paper are indicated in editorial footnotes; minor changes, e. g., in orthography or layout, are left unremarked. Michael Hallett
8 The
German original can be found on p. 941 below. See also Hilbert’s Vorwort to the Hilbert/Ackermann book published in 1928. The book is reproduced in Appendix A above, and the Vorwort can be found on p. 809. The passage in question is quoted in English in the Introduction to Chapter 1, p. 50.
922
Appendices
Die Grundlagen der Mathematik1)
Vortrag, gehalten auf Einladung des Mathematischen Seminars im Juli 1927 in Hamburg 65
66
Es ist für mich eine hohe Ehre und zugleich ein Bedürfnis, meine Gedanken über die Grundlagen der Mathematik, die ich seinerzeit vor fünf Jahren hier entwickelt habe, und die mich seitdem dauernd aufs lebhafteste beschäftigt haben, zu ergänzen und weiterzuführen. Mit dieser Neubegründung der Mathematik, die man füglich als eine Beweistheorie bezeichnen kann, verfolge ich ein bedeutsames Ziel: ich möchte nämlich die Grundlagenfragen in der Mathematik als solche endgültig aus der Welt schaffen, indem ich jede mathematische Aussage zu einer konkret aufweisbaren und streng ableitbaren Formel mache und dadurch die mathematischen Begriffsbildungen und Schlüsse in eine solche Fassung bringe, daß sie unwiderleglich sind und doch ein Bild der gesamten Wissenschaft liefern. Ich glaube dieses Ziel mit meiner Beweistheorie völlig erreichen zu können, wenn auch bis zu ihrer völligen Fertigstellung noch sehr viele Arbeit nötig sein wird. Die Mathematik wie jede andere Wissenschaft kann nie durch Logik allein begründet werden; vielmehr ist als Vorbedingung für die Anwendung logischer Schlüsse und für die Betätigung logischer Operationen uns schon etwas in der Vorstellung gegeben: gewisse außerlogische konkrete Objekte, die anschaulich als unmittelbares Erlebnis vor allem Denken da sind. Soll das logische Schließen sicher sein, so müssen sich diese Objekte vollkommen in allen Teilen überblicken lassen und ihre Aufweisung, ihre Unterscheidung, ihr Aufeinanderfolgen oder Nebeneinandergereihtsein ist mit den Objekten zugleich unmittelbar anschaulich gegeben als etwas, das sich nicht noch auf etwas anderes reduzieren läßt oder einer Reduktion bedarf. Dies ist die philosophische Grundeinstellung, die ich für die Mathematik wie überhaupt zu allem wissenschaftlichen Denken, Verstehen und Mitteilen als erforderlich | erachte. Und insbesondere in der Mathematik sind Gegenstand unserer Betrachtung die konkreten Zeichen selbst, deren Gestalt unserer Einstellung zufolge unmittelbar deutlich und wiedererkennbar ist. Dies ist das geringste Maß von 1)
Vgl. meine bisherigen Veröffentlichungen über diesen Gegenstand: Neubegründung der Mathematik, diese Abhandlungen Bd. 1, S. 157 (1922) [Hilbert 1922b]; Die logischen Grundlagen der Mathematik, Math. Ann. Bd. 88, S. 151 (1922) [Hilbert 1923a]; Über das Unendliche, Math. Ann. Bd. 95, S. 161 (1925) [Hilbert 1926 ].
5
10
15
20
25
30
‘Die Grundlagen der Mathematik’
5
Voraussetzung, das kein wissenschaftlicher Denker entbehren kann und daher jedermann, sei es bewußt oder unbewußt, innehalten muß. Der Grundgedanke meiner Beweistheorie ist folgender: Alle Aussagen, die die Mathematik ausmachen, werden in Formeln umgesetzt, sodaß die eigentliche Mathematik zu einem Bestande an Formeln wird. Diese unterscheiden sich von den gewöhnlichen Formeln der Mathematik nur dadurch, daß in ihnen außer den gewöhnlichen Zeichen noch die logischen Zeichen → , (folgt)
10
15
20
25
& , (und)
∨ , (oder)
, (nicht)
(x), (alle)
(Ex) (es gibt)
vorkommen. Gewisse Formeln, die als Bausteine des formalen Gebäudes der Mathematik dienen, werden Axiome genannt. Ein Beweis ist eine Figur, die uns als solche anschaulich vorliegen muß; er besteht aus Schlüssen vermöge des Schlußschemas S S→T T wo jedesmal die Prämissen, d. h. die betreffenden Formeln S, S → T, jede entweder ein Axiom ist bzw. direkt durch Einsetzung aus einem Axiom entsteht oder mit der Endformel eines Schlusses übereinstimmt, der vorher im Beweise vorkommt bzw. aus ihr durch Einsetzung entsteht. 1 Eine Formel soll beweisbar heißen, wenn sie entweder ein Axiom oder die Endformel eines Beweises ist. Die Axiome und 2 beweisbaren Sätze, d. h. die Formeln, die durch dieses Verfahren entstehen, sind die Abbilder der Gedanken, die die übliche bisherige Mathematik ausmachen. Durch das bezeichnete Programm ist die Wahl der Axiome für unsere Beweistheorie schon vorgezeichnet; wir ordnen sie folgendermaßen an: I. 1. A → (B → A)
30
923
1.—4. Axiome der Folge.
(Zufügen einer Voraussetzung).
2. (A → (A → B)) → (A → B)
(Weglassen einer Voraussetzung).
3. (A → (B → C)) → (B → (A → C)) gen).
(Vertauschen der Voraussetzun-
4. (B → C) → ((A → B) → (A → C))
(Elimination einer Aussage).
1 In the republication (pp. 290–291), the part of the sentence after the displayed modus ponens figure is altered to:
. . . wo jedesmal jede der Prämissen, d. h. der betreffenden Formeln S und S → T, entweder ein Axiom ist bzw. direkt durch Einsetzung aus einem Axiom entsteht oder Endformel eines Schlusses ist oder mit einer vorher im Beweise vorkommenden Formel übereinstimmt bzw. aus einer solchen durch Einsetzung entsteht. 2 The
words ‘Axiome und’ are omitted in the republication, p. 291.
924
Appendices
5.—10. Axiome über & und ∨.
II.
67
5. A & B → A. 6. A & B → B. 7. A → (B → A & B) 8. A → (A ∨ B)
5
9. B → (A ∨ B) 10. ((A → C) & (B → C)) → ((A ∨ B) → C) 3 III. 11. (A → B & B) → A 12. A → A
11.–12. Axiome der Negation. (Satz vom Widerspruch).
(Satz von der doppelten Verneinung).
10
Diese Axiome der Gruppen I, II, III sind keine anderen als die Axiome des Aussagenkalküls. Aus 11 und 12 folgt insbesondere die Formel A&A→B und ferner das logische Prinzip des Tertium non datur 4 (A → B) & (A → B) → B. IV.
15
13. Das logische ε-Axiom.
13. A(a) → A(εA). Hierin bezeichnet ε(A) ein Ding, für das die Aussage A(a) sicher zutrifft, wenn sie überhaupt für ein Ding zutrifft; ε heiße die logische ε-Funktion. 5 Zur Erläuterung der Rolle der logischen ε-Funktion sei folgendes bemerkt. Die ε-Funktion kommt im Formalismus in dreifacher Weise zur Anwendung.
20
1. Es läßt sich mit Hilfe des ε das „alle“ und „es gibt“ definieren, nämlich folgendermaßen: (a)A(a) A(ε(A)), 3 In
the republication (p. 291), the consequent of Axiom 10. is written ‘((A ∨ B → C))’. words ‘des Tertium non datur’ are omitted in the republication (p. 291). 5 In the republication (p. 292), this sentence has been replaced by: 4 The
Hierin vertritt der Ausdruck ε(A) ein Ding, für das die Aussage A(a) sicher zutrifft, wenn sie überhaupt für ein Ding zutrifft; ε heiße die logische ε-Funktion. Die genaue Schreibweise für ε(A), welche auch erst die Einsetzung einer bestimmten Formel für A(a) ermöglicht, ist εx A(x) bzw. εy A(y), · · · .
The raised dots are in the republication, and have not been added here.
25
‘Die Grundlagen der Mathematik’
925
(Ea)A(a) A(ε(A)). 6 Der Doppelpfeil steht hier zur Zusammenfassung zweier Folgtformeln; statt desselben wollen wir späterhin auch das Zeichen der „Äquivalenz“ ∼ anwenden. Auf Grund dieser Definition liefert das ε-Axiom IV 13 die für das All- und das Seinszeichen gültigen logischen Beziehungen, wie
5
(a)A(a) → Ab (Aristotelisches Axiom), (a)A(a) → (Ea)A(a)
(Tertium non datur). 7
2. Trifft eine Aussage A auf ein und nur ein Ding zu, so ist ε(A) dasjenige Ding, für welches Aa gilt Die ε-Funktion ermöglicht es also, eine solche Aussage Aa, die nur auf ein Ding zutrifft, in der Form
10
a = ε(A) aufzulösen.
15
3. Darüber hinaus hat das ε die Rolle der Auswahlfunktion, d. h. im Falle, wo Aa auf mehrere Dinge zutreffen kann, ist εA irgendeines von den Dingen a, auf welche Aa zutrifft. Zu diesen rein logischen Axiomen kommen die folgenden speziell mathematischen Axiome : V.
20
14.–15. Axiome der Gleichheit.
14.
a = a
15.
(a = b) → (A (a) → A(b)) VI.
a = 0
16.
25
30
16.–17. Axiome der Zahl.
17. (A(0) & (a) (A(a) → A(a ))) → A(b). 8 duktion.)
(Prinzip der vollständigen In-
Hiernach bedeutet also a die auf a folgende Zahl und die ganzen Zahlen 1, 2, 3, . . . schreiben sich in der Gestalt 0 , 0 , 0 , . . . . Für die Zahlen der 2ten Zahlklasse und der höheren Cantorschen Zahlklassen müssen die entsprechenden Induktionsaxiome hinzugefügt werden, die aber gemäß Cantors Theorie zu einem Schema zu vereinigen wären. 6 In
the republication (p. 292), the variable of quantification is ‘x’. in the republication (p. 292), the variable of quantification for these two formulas
7 Again
is ‘x’. 8 In the republication (p. 293), the variable of quantification is ‘x’, and the final consequent is ‘A(a)’.
68
926
69
Appendices
Endlich bedürfen wir noch der expliziten Definitionen, die den Begriffsbildungen der Mathematik entsprechen und den Charakter von Axiomen haben, sowie gewisser Rekursionsaxiome, die aus einem allgemeinen Rekursionsschema hervorgehen. Bevor wir die Formulierung dieser Axiome erörtern, müssen wir erst die Regeln aufstellen, nach denen überhaupt die Axiome verwendet werden sollen. Denn in meiner Theorie wird das inhaltliche Schließen durch ein äußeres Handeln nach Regeln ersetzt; damit erreicht die axiomatische Methode diejenige Sicherheit und Vollendung, deren sie fähig ist und deren sie auch bedarf, wenn sie zum Grundmittel aller theoretischen Forschung werden soll. Zunächst gelten folgende Festsetzungen. Für mathematische Variable werden stets kleine lateinische Buchstaben, für individuelle mathematische Gebilde (spezielle Funktionen) dagegen kleine griechische Buchstaben benutzt. Für variable Aussagen (allgemeine Formeln) werden stets große lateinische Buchstaben, für individuelle Aussagen dagegen große griechische Buchstaben benutzt, z. B. Z(a), N(a). 9 Was das Verfahren der Einsetzung betrifft, so gelten dabei folgende allgemeine Verabredungen. Für Aussagenvariable dürfen nur Formeln eingesetzt werden, d. h. solche Figuren, die mit Hilfe der logischen Zeichen , (x), (Ex), →, &, ∨, aus Elementarformeln zusammengesetzt sind. Die Elementarformeln werden gebildet durch Formelvariablen, eventuell mit angefügten Argumenten, oder durch Zeichen für individuelle Aussagen, wie Z, N, =, <, mit Ausfüllung der zugehörigen Argumentstellen. Für eine mathematische Variable darf eine jede Figur eingesetzt werden; jedoch muß, wenn eine mathematische Variable in einer Formel auftritt, stets die ihre Art charakterisierende Individualaussage nebst dem Folgtzeichen voranstehen, z. B.
5
10
15
20
25
30
Z(a) → a + 1 = 1 + a, N(a) → N(a ). Diese Verabredung bewirkt, daß doch nur solche Einsetzungen in Betracht kommen, die gewöhnliche Zahlen bzw. Zahlen der zweiten Zahlklasse sind. 10 In den Axiomen V, VI sind der Kürze halber die voranzustellenden Aussagen Za, Zb weggelassen worden. Deutsche große wie kleine Buchstaben bedeuten Hinweise und werden nur zu Mitteilungen verwandt. 9 In the republication (p. 293), these predicates appear on separate lines, and are followed respectively by ‘a ist eine Zahl’ and ‘a ist eine Zahl der zweiten Zahlklasse’. 10 In the republication (p. 294), ‘in Betracht kommen’ stands at the end of the sentence.
35
40
‘Die Grundlagen der Mathematik’
5
10
15
20
25
30
35
40
927
Die mathematischen Variablen sind von zweierlei Art 1. die Grundvariablen, 2. die Variablengattungen. 1. Während man in der gesamten Arithmetik und Analysis mit der gewöhnlichen ganzen Zahl als einziger Grundvariablen auskommt, gehört jetzt einer jeden Cantorschen transfiniten Zahlklasse eine Grundvariable zu, die eben die Ordinalzahlen dieser Klasse anzunehmen fähig ist. Einer jeden Grundvariablen entspricht demgemäß eine Aussage, | die sie als solche charakterisiert; diese ist implizite durch Axiome charakterisiert. Zu jeder Grundvariablen gehört eine Art von Rekursion, mit deren Hilfe man Funktionen definiert, deren Argument eine solche Grundvariable ist. Die zu der Zahlenvariablen gehörige Rekursion ist die „gewöhnliche Rekursion“, gemäß welcher eine Funktion einer Zahlenvariablen n definiert wird, indem man angibt, welchen Wert sie für n = 0 hat und wie man den Wert für n aus dem für n erhält. Die Verallgemeinerung der gewöhnlichen Rekursion ist die transfinite Rekursion, deren allgemeines Prinzip darin besteht, den Wert der Funktion für einen Wert der Variablen durch die vorhergehenden Funktionswerte zu bestimmen. 2. Aus den Grundvariablen leiten wir noch weitere Arten von Variablen ab, indem wir auf die Aussagen für die Grundvariablen z. B. auf Z logische Verknüpfungen anwenden. Die so definierten Variablen heißen Variablengattungen, die sie definierenden Aussagen heißen Gattungsaussagen; für diese werden wieder jedesmal neue Individualzeichen eingeführt. So liefert die Formel Φ(f ) ∼ (a) (Z(a) → Z(f (a))) ; 11 das einfachste Beispiel für eine Variablengattung; diese Formel definiert die Gattung der Funktionsvariablen (Funktion-sein). Ein weiteres Beispiel ist die Formel Ψ(g) ∼ (f ) (Φ(f ) → Z (g(f )) ) ; sie definiert das „Funktionenfunktion-sein“; das Argument g ist die neue Funktionenfunktionsvariable. Für die Herstellung der höheren Variablengattungen muß man die Gattungsaussagen selbst mit Indizes versehen, wodurch ein Rekursionsverfahren ermöglicht wird. Nunmehr können wir kennzeichnen, was unter expliziten Definitionen und unter Rekursions-Axiomen zu verstehen ist: eine explizite Definition ist eine Äquivalenz oder Gleichheit, auf deren linker Seite das zu definierende Zeichen (großer oder kleiner griechischer Buchstabe) mit gewissen Variablen als Argumenten steht und rechts eine Figur, in der als freie Variable nur jene Argumente auftreten, und als Individualzeichen nur solche, die bereits eingeführt sind. Die Rekursions-Axiome sind Formelsysteme, die in entsprechender Weise dem Rekursionsverfahren nachgebildet sind. 11 In
the republication (p. 295), the variable of quantification is ‘x’.
70
928
71
Appendices
Dies sind die allgemeinen Grundlagen meiner Theorie. Um Ihnen die Anwendungsweise näherzubringen, möchte ich einige Beispiele | von speziellen Funktionen anführen, wie sie durch Rekursion definiert werden. Wenn wir die Funktion ι (a), die 0 ist, für das Argument 0 sonst stets den Wert 1 hat, definieren wollen, so sind die Gleichungen
5
ι(0) = 0 ι(a ) = 1, wie wir sehen, schon selbst eine Rekursion. Wie sich Summe, Produkt und die Funktion a! durch Rekursion definieren lassen, ist ja bekannt. Auch die Funktion μ(a, b), die den Wert der kleineren von den beiden Zahlen a, b hat, ist durch Rekursion leicht definierbar. Ferner erwähne ich noch zwei kompliziertere Beispiele, nämlich die Funktion τ (a) = 1, τ (a) = 0,
wenn a eine Primzahl ist sonst
10
15
und die Funktion π(a), welche die Anzahl der Primzahlen a angibt. In der Tat können auch diese durch Rekursion definiert werden; man hat dazu zunächst folgende zwei Funktionen von je drei Argumenten einzuführen 12 : ϕ(a, b, c) = 1, wenn b gleich einer der Zahlen 1 · a, 2 · a, . . . , c · a ist (b > 0), = 0, sonst13
72
20
ψ(a, b, c) gleich der kleinsten von denjenigen unter der Zahlen 1, 2, . . . , a, welche Teiler von b und > c sind, bzw., falls keine jener Zahlen diese Eigenschaft hat, gleich b. Wenn wir nun daran gehen, die Mathematik aufzubauen, so werden wir zunächst die elementare Zahlentheorie ins Auge fassen; wir erkennen, daß wir deren Wahrheiten durch inhaltlich-anschauliche Überlegungen gewinnen und beweisen können. Dabei werden die vorkommenden Formeln nur zur Mitteilung angewandt. Die Buchstaben bedeuten Zahlzeichen, und durch eine Gleichung wird die Übereinstimmung zweier Zeichen mitgeteilt. Anders ist die Sachlage in der Algebra; in der Algebra betrachten wir die Buchstabenausdrücke an sich als selbständige Gebilde, und die Sätze der Zahlentheorie, die in der Algebra inbegriffen sind, werden durch sie formalisiert. Anstelle der übrigen Zahlzeichen treten Formeln, die ihrerseits nun konkrete Objekte einer anschaulichen Betrachtung sind, und an die Stelle des inhaltlichen zahlentheoretischen Beweises tritt die Ableitung einer Formel aus einer anderen Formel nach gewissen Regeln. Die Algebra geht also schon wesentlich über die inhaltliche Zahlentheorie hinaus. Hier ist z. B. bereits die Formel 1 + a = a + 1, 12 In the republication (p. 296), ‘ebenfalls durch Rekursion’ is interposed between ‘Argumenten’ and ‘einzuführen’. 13 In the republication (p. 296), the definition of ϕ is reversed, i. e., the first clause defines 0 and the second 1.
25
30
35
‘Die Grundlagen der Mathematik’
5
10
15
20
25
30
35
929
in der a eine eigentliche Zahlenvariable ist, nicht mehr bloß die Mitteilung von etwas Inhaltlichem, sondern ein gewisses formales Gebilde, eine beweisbare Formel, die an sich nichts bedeutet und deren Beweis nicht inhaltlich geführt werden kann, sondern der Heranziehung des Induktionsaxioms bedarf. 14 Die auch durch inhaltliche Überlegung zu bestätigenden Formeln 1 + 3 = 3 + 1, 1 + 7 = 7 + 1 können erst durch ein Beweisverfahren aus jener algebraischen Formel erhalten werden, indem wir formal für a die Zahlzeichen 3 und 7 einsetzen, also eine Einsetzungsregel anwenden. So enthält schon die elementare Mathematik erstens Formeln, denen inhaltliche Mitteilungen finiter Aussagen, also im wesentlichen numerische Gleichungen oder Ungleichungen oder daraus zusammengesetzte kompliziertere Mitteilungen entsprechen und die wir auch die realen Aussagen der Theorie nennen können, und zweitens Formeln, die an sich nichts bedeuten, ebenso wie die Zahlzeichen der inhaltlichen Zahlentheorie 15 , sondern nur Objekte für die Anwendung unserer Regeln sind und als die idealen Gebilde der Theorie angesehen werden müssen. Diese Erwägungen zeigen, daß wir nur nötig haben, die Entwicklung, die das bisher übliche mathematische Verfahren bereits genommen hat, in naturgemäßer und konsequenter Weise fortzuführen, um zu der Auffassung der Formeln als idealer Aussagen zu gelangen. Und naturgemäß und konsequent ist es dann, wenn wir ebenso wie die mathematischen Variablen nunmehr auch die logischen Zeichen , (x), (Ex) →, &, ∨, und die logischen Variablen, nämlich die Aussagenvariablen A, B, C, . . . den Zahlzeichen und den Buchstaben in der Algebra gleichstellen und ebenfalls als Zeichen auffassen, die an sich nichts bedeuten, sondern nur Bausteine für die idealen Aussagen sind. 16 Zu dieser Ausdehnung des formalen Standpunktes der Algebra auf die gesamte Mathematik haben wir auch einen dringenden Anlaß. Sie ist nämlich das Mittel, um uns einer grundsätzlichen Schwierigkeit zu | entheben, die sich bereits in der elementaren Zahlentheorie geltend macht. Ich nehme als Beispiel wieder die Gleichung 1 + a = a + 1; 14 In the republication (p. 297), the words ‘ein gewisses formales Gebilde, eine beweisbare Formel, die an sich nichts bedeutet und deren Beweis’, have been replaced by ‘eine beweisbare Formel, die für sich allein keinerlei Bedeutung hat, und deren Beweis . . . ’. 15 In the republication (p. 298), the words ‘und zweitens Formeln, die an sich nichts bedeuten, ebenso . . . ’ have been replaced by ‘und zweitens Formeln, die für sich allein keinerlei Bedeutung haben, ebenso . . . ’. 16 In the republication (p. 298), the words ‘und ebenfalls als Zeichen auffassen, die an sich nichts bedeuten, sondern nur Bausteine . . . ’ have been replaced by ‘und ebenfalls als Zeichen auffassen, die für sich allein keinerlei Bedeutung haben, sondern nur Bausteine . . . ’.
73
930
Appendices
wenn wir diese als Ausdruck einer Mitteilung a+1=1+a gelten lassen wollten, wobei a irgendeine vorgelegte Zahl bedeutet, so wäre diese Mitteilung nicht negationsfähig, weil ja die Aussage, daß es eine Zahl a gibt, für welche
74
a + 1 = 1 + a ausfällt, keinen finiten Sinn gibt; man kann ja nicht alle Zahlen durchprobieren. Wir würden also im Sinne der finiten Einstellung nicht die Alternative anwenden können, wonach eine Gleichung wie die obige, in der ein unbestimmtes Zahlzeichen vorkommt, entweder für jedes Zahlzeichen erfüllt ist oder durch ein Gegenbeispiel widerlegt werden kann. Denn diese Alternative beruht ja als Anwendung des „Tertium non datur“ wesentlich auf der Voraussetzung, daß die Behauptung der allgemeinen Gültigkeit jener Gleichung einer Negation fähig ist. Aber auf die Anwendung des Tertium non datur sowie aller übrigen in unseren Axiomen ausgedrückten Gesetze der Aristotelischen Logik können wir nicht verzichten, da ohne sie der Aufbau der Analysis unmöglich ist. Die hierin liegende wesentliche Schwierigkeit wird nun durch die idealen Aussagen vermieden. Adjungieren wir nämlich zu den realen Aussagen die idealen Aussagen, so erhalten wir damit ein System von Aussagen, in dem die einfachen Regeln der Aristotelischen Logik sämtlich gelten und die üblichen Methoden des mathematischen Schließens alle zu Recht bestehen. Wie beispielsweise in der elementaren Zahlentheorie die negativen Zahlen unentbehrlich sind, wie durch die Kummer-Dedekindschen Ideale erst die moderne Zahlentheorie und Algebra möglich wird, so ist durch Einführung der idealen Aussagen erst wissenschaftliche Mathematik möglich. Freilich eine Bedingung, eine einzige, aber auch unerläßliche, ist stets an die Anwendung der Methode der idealen Elemente geknüpft; diese ist der Nachweis der Widerspruchsfreiheit: die Erweiterung durch Hinzufügen von idealen Elementen ist nämlich nur dann statthaft, wenn dadurch im alten engeren Bereiche keine Widersprüche entstehen, wenn also die Beziehungen, die sich bei der Elimination der idealen Gebilde für die alten Gebilde herausstellen, stets im alten Bereiche gültig sind. Dieses Problem der Widerspruchsfreiheit ist aber bei der gegenwärtigen Sachlage durchaus der Behandlung zugänglich. Es handelt sich ja darum zu zeigen, daß bei der Einführung der idealen Gebilde nicht zwei einander logisch entgegengesetzte Aussagen A, A herauskommen können. Nun folgt, wie ich oben bemerkte, aus den Axiomen der Negation die logische Formel (A & A) → B. Setzen wir hierin für A die betreffende Aussage A und für B die Ungleichung 0 = 0,
5
10
15
20
25
30
35
40
‘Die Grundlagen der Mathematik’
931
so bekommen wir (A & A) → (0 = 0). Und mit dieser Formel können wir aus A und A die Formel 0 = 0 ableiten. Wir haben daher zum Nachweis der Widerspuchsfreiheit nur zu zeigen nötig, daß in einem Beweise aus unseren Axiomen nach den aufgestellten Regeln 5
10
15
20
25
30
35
40
0 = 0 sich nicht als Endformel herausstellen kann, daß also 0 = 0 nicht eine beweisbare Formel ist. Und dies ist eine Aufgabe, die grundsätzlich ebenso im Bereich der anschaulichen Betrachtung liegt, wie in der inhaltlich aufgebauten √ Zahlentheorie etwa die Aufgabe des Beweises der Irrationalität von 2, d. h. des Beweises, daß es unmöglich ist, zwei Zahlzeichen a, b zu finden, welche in der Beziehung a2 = 2b2 stehen, wo also gezeigt werden soll, daß sich nicht zwei Zahlzeichen von einer gewissen Beschaffenheit angeben lassen. Entsprechend kommt es für uns darauf an, zu zeigen, daß sich nicht ein Beweis von einer gewissen Beschaffenheit angeben läßt. Ein formalisierter Beweis ist aber, ebenso wie ein Zahlzeichen, ein konkreter und überblickbarer Gegenstand. Er ist von Anfang bis Ende mitteilbar. Auch die verlangte Beschaffenheit der Endformel, daß sie „0 = 0“ lautet, ist eine konkret feststellbare Eigenschaft des Beweises. Tatsächlich läßt sich dieser Nachweis erbringen, und damit gewinnen wir die Berechtigung zur Einführung unserer idealen Aussagen. Zugleich erkennen wir, daß wir damit ein Problem lösen, das längst brennend geworden ist, nämlich das Problem, die Widerspruchsfreiheit der arithmetischen Axiome zu beweisen. Überall, wo die axiomatische Methode zur Anwendung kommt, liegt uns der Nachweis der Widerspruchsfreiheit der Axiome ob. In der | Geometrie und den physikalischen Theorien gelingt dieser Nachweis durch Zurückführung auf die Widerspruchsfreiheit der arithmetischen Axiome. Diese Methode versagt offenbar bei der Arithmetik selbst. Indem unsere Beweistheorie auf Grund der Methode der idealen Elemente diesen letzten wichtigen Schritt ermöglicht, bildet sie den notwendigen Schlußstein der Axiomatik. 17 Für jede neue Theorie ist der endgültige Prüfstein ihr Erfolg in Fragen, die schon vorher da waren und zu deren Beantwortung allein sie gar nicht geschaffen worden ist. Sobald Cantor seine ersten transfiniten Zahlen, die sogenannten Zahlen der zweiten Zahlklasse, entdeckt hatte, entstand die Frage, ob man durch dieses transfinite Zählen auch wirklich anderwärts bekannte Mengen auszählen kann, die im gewöhnlichen Sinne nicht abzählbar sind. Als solche Menge kam in erster Linie die Punktstrecke in Betracht. Diese Frage, ob durch die Zahlen der zweiten Zahlenklasse die Punkte der Strecke, d. h. die reellen Zahlen, sich auszählen lassen, ist das berühmte Kontinuumproblem, von Cantor aufgestellt, aber nicht gelöst. Ich habe in einer Abhandlung „Über das Unendliche“ 18 gezeigt, wie dieses Problem einer erfolgreichen Behandlung durch unsere Beweistheorie zugänglich wird. 17 In the republication (p. 301), the following three paragraphs concerning Hilbert’s sketch of a proof of Cantor’s Continuum Hypothesis are omitted. The omission is indirectly signalled by a ‘—’ after the paragraph ending with ‘Axiomatik’. 18 This is Hilbert 1926 .
75
932
Appendices
Um zu zeigen, daß es sich bei diesem Cantorschen Kontinuumssatz um ein ganz konkretes Problem der gewöhnlichen Analysis handelt, erwähne ich noch, daß derselbe sich als Formel folgendermaßen ausdrücken läßt: (Eh) (f ) (Φ(f ) → Nh(f )) + , & (f )(g) Φ(f ) & Φ(g) → (h(f ) = h(g)) → = (f, g) , 5
wobei zur Abkürzung
Φ(f )
für
und ferner = (f, g)
76
für
(a) Z(a) → Zf (a)
(a) Z(a) → (f (a) = g(a))
gesetzt ist. In dieser Formel tritt noch die zu der Grundvariablen der zweiten Zahlenklasse gehörige Aussage N auf. Dies läßt sich aber vermeiden, da die Zahlen der zweiten Zahlenklasse bekanntermaßen durch Wohlordnungen der Zahlenreihe, d. h. durch gewisse Funktionen zweier Zahlenvariablen mit den Werten 0, 1, dargestellt werden können, so daß der fragliche Satz die Form eines reinen Funktionensatzes annimmt. Die Grundzüge dieser meiner Beweistheorie habe ich bereits bei verschiedenen Gelegenheiten, in Kopenhagen, hier in Hamburg, in Leipzig und in Münster dargelegt 19 ; es sind inzwischen gegen diese Beweistheorie | mannigfache Ausstellungen und Einwände gemacht worden, die ich samt und sonders für so ungerecht wie nur möglich halte. Ich möchte einige derselben jetzt beleuchten. Schon Poincaré hatte an verschiedenen Stellen Ausführungen gemacht, die meiner Auffassung entgegengesetzt sind, vor allem bestritt er von vornherein die Möglichkeit eines Beweises der Widerspruchsfreiheit der arithmetischen Axiome, indem er behauptete, daß die Widerspruchsfreiheit des Verfahrens der vollständigen Induktion nie anders als wieder durch das Induktionsverfahren bewiesen werden könnte. Aber wie meine Theorie zeigt, kommen hier, bei der Begründung der Arithmetik, zweierlei rekursiv verfahrende Methoden in Betracht, nämlich einerseits der anschauliche Aufbau der ganzen Zahl als Zahlzeichen, dem auch rückwärts der Abbau eines vorliegenden Zahlzeichens bzw. der Abbau einer analog einem Zahlzeichen aufgebauten konkret vorliegenden Figur entspricht — die i n h a l t l i c h e Induktion, und andererseits die eigentliche f o r m a l e Induktion 20 , die sich auf das Induktionsaxiom stützt und durch die allein erst die mathematische Variable ihre Rolle im Formalismus zu spielen imstande ist. 19 The Copenhagen and first Hamburg lectures (from 1921) are represented in Hilbert 1922b, the Leipzig lecture (1922) in Hilbert 1923a, and the Münster lecture (1925) in Hilbert 1926 . In the republication (p. 301), these specific references are omitted; indeed, the sentence goes straight from ‘Gelegenheiten’ to ‘dargelegt’. 20 In the republication (p. 301), the words ‘— die i n h a l t l i c h e Induktion’ are omitted, as is the adjective ‘formale’ in ‘f o r m a l e Induktion’.
10
15
20
25
30
35
‘Die Grundlagen der Mathematik’
5
10
15
20
25
30
35
40
933
Poincaré gewinnt seine irrige Überzeugung dadurch, daß er zwischen diesen beiden völlig verschieden gearteten Induktionsmethoden nicht unterscheidet. — Poincaré, dieser ideenreichste und fruchtbarste Mathematiker seiner Generation, hatte bedauerlicherweise gegen die Cantorsche Theorie eine ausgesprochene Voreingenommenheit, die ihn an der gerechten Beurteilung der großartigen Konzeptionen Cantors hinderte. 21 Unter diesen Umständen mußte Poincaré meine Theorie — diese lag übrigens damals nur in den ersten und völlig unzureichenden Anfängen vor — ablehnen. Poincarés Autorität hat die jüngere Generation vielfach in einseitigem Sinne beeinflußt. Eine andere Opposition gegen meine Theorie geht von den Anhängern der Grundlagentheorie von Russell und Whitehead aus, welche die Principia mathematica als eine endgültig befriedigende Begründung der Mathematik ansehen. Die Grundlagentheorie von Russell und Whitehead ist eine allgemeine, großzügig angelegte logische Untersuchung. Indes beruht die Begründung der Mathematik darin einerseits auf dem Unendlichkeits-Axiom und dann auf dem sogenannten Reduzierbarkeits-Axiom, und diese Axiome sind beide echte, inhaltliche nicht durch einen Beweis der Widerspruchsfreiheit gestützte Annahmen — Annahmen, deren Allgemeingültigkeit sogar zweifelhaft bleibt und deren jedenfalls meine Theorie nicht bedarf. Dem Russellschen Axiom der Reduzierbarkeit steht in meiner Theorie die Regel der Behandlung der Funktionsvariablen gegenüber. | In meiner Theorie wird aber die Reduzierbarkeit nicht vorausgesetzt, sondern vielmehr als kompensabel erkannt: nur im Falle eines vorliegenden Beweises für einen Widerspruch wird die Ausführung der Reduktion erfordert, und meine Beweistheorie lehrt, daß dann auch diese Reduktion immer gelingen müßte. 22 Was nun die Untersuchungen der neuesten Zeit betrifft, so erfreut mich an sich aufs höchste die Tatsache, daß der Sinn und das Interesse für Grundlagenforschung wieder so lebhaft erwacht ist; aber wenn ich den Inhalt und die Ergebnisse dieser Untersuchungen mir vergegenwärtige, so kann ich ihrer Tendenz meist nicht zustimmen; ich empfinde dieselben vielmehr zu einem großen Teile als rückständig, wie wenn sie aus einer Zeit kämen, in der die gewaltige Gedankenwelt Cantors noch unentdeckt war. Darin sehe ich auch den Grund, warum diese neusten Untersuchungen an die großen Probleme der Grundlagentheorie, z. B. an die Frage des Aufbaus der Funktionen, an den Beweis bzw. die Widerlegung des Cantorschen Kontinuumssatzes, an die Frage der Lösbarkeit aller mathematischen Probleme, die Frage, betreffend die Äquivalenz von Widerspruchsfreiheit und Existenz mathematischer Gebilde gar nicht einmal herankommen. Den weitesten Raum in der heutigen Literatur über die Grundlagen der Mathematik nimmt diejenige Lehre ein, die Brouwer aufgestellt und die er Intuitionismus genannt hat. Nicht aus Neigung zur Polemik, sondern um meine Ansichten klar zum Ausdruck zu bringen und um mißverständlichen 21 In the republication (p. 302), ‘der großartigen Konzeptionen Cantors’ has been changed to ‘der völlig neuen und großartigen Konzeptionen C a n t o r s’ . 22 In the republication (p. 302), the text reads ‘gelingen muß’ instead of ‘gelingen müßte’.
77
934
78
Appendices
Auffassungen meiner eigenen Theorie vorzubeugen, muß ich auf gewisse Behauptungen Brouwers näher eingehen. Brouwer erklärt die Existenzaussagen 23 an sich samt und sonders für bedeutungslos, sofern sie nicht zugleich die Konstruktionen der als existierend behaupteten Gebilde enthalten, für wertlose Papiere: durch sie arte die Mathematik in ein Spiel aus. Als Beispiel dafür, wie der bloße, mit der logischen ε-Funktion geführte Existenzbeweis keineswegs ein wertloses Papierstück ist, möge folgendes dienen: Zur Begründung eines Ausspruches von Gauss, wonach ein Hinausgehen über die gewöhnlichen, mit i gebildeten imaginären Zahlen für die Analysis überflüssig ist, hatten Weierstrass und Dedekind Untersuchungen angestellt, die auch zur Aufstellung und zum Beweise gewisser Theoreme geführt haben. Ich habe nun seinerzeit ein allgemeines Theorem über algebraische Formen aufgestellt, das ein reiner Existenzsatz ist und seiner Natur nach gar nicht in einen Satz über Konstruierbarkeit verwandelt werden kann. Allein durch Anwendung dieses Existenz|theorems habe ich1) die langwierigen und undurchsichtigen Überlegungen von Weierstrass und die höchst komplizierten Rechnungen von Dedekind vermieden, und zudem deckt, wie ich glaube, mein Beweis erst den inneren Grund für die Gültigkeit der im Sinne von Gauss liegenden, von Weierstrass und Dedekind aufgestellten Behauptungen auf. Aber auch wer sich mit der Widerspruchsfreiheit nicht begnügt und noch weitergehende Gewissensskrupel hat, muß die Bedeutung des Beweises der Widerspruchsfreiheit anerkennen, nämlich als einer allgemeinen Methode aus Beweisen für allgemeine Sätze vom Charakter etwa des Fermatschen Satzes, die mit Hilfe der ε-Funktion geführt sind, finite Beweise zu gewinnen. 24 Nehmen wir beispielsweise an, daß wir den Beweis für den großen Fermatschen Satz mit Hülfe der logischen Funktion ε gefunden hätten. Aus demselben kann man dann auf folgende Weise einen finiten Beweis machen: Angenommen, es lägen Zahlzeichen
5
10
15
20
25
30
p, a, b, c (p > 2) vor, welche die Fermatsche Gleichung a p + bp = c p erfüllen, so könnten wir diese Gleichung auch als beweisbare Formel erhalten, indem wir die Feststellung der Übereinstimmung der Zahlzeichen 1)
Zur Theorie der aus n Haupteinheiten gebildeten komplexen Größen. Gött. Nachr. 1896 Hilbert 1896 . 23 In the republication (p. 302), the words ‘genau wie seinerzeit K r o n e c k e r ’ have been interposed between ‘erklärt’ und ‘die Existenzaussagen’. 24 In the republication (p. 304), this paragraph reads:
Aber der Beweis der Widerspruchsfreiheit bietet auch zugleich eine allgemeine Methode dar, aus Beweisen für allgemeine Sätze vom Charakter etwa des F e r m a t schen Satzes, die mit Hilfe der ε-Funktion geführt sind, finite Beweise zu gewinnen.
35
‘Die Grundlagen der Mathematik’
5
935
ap + bp und cp in der Form eines Beweises bringen. Andererseits hätten wir nach unserer Annahme einen Beweis für die Formel Z(a) & Z(b) & Z(c) & Z(p) & (p > 2) → (ap + bp = cp ) aus der durch Einsetzung und Schluß ap + bp = cp erhalten wird. Es wäre also sowohl a p + bp = c p wie auch
10
15
20
25
30
35
40
ap + bp = cp | beweisbar. Dies kann aber, wie der Beweis der Widerspruchsfreiheit auf finitem Wege zeigt, nicht der Fall sein. Die angeführten Beispiele sind aber nur beliebig herausgegriffene Einzelfälle. In Wahrheit ist die Mathematik angefüllt mit Beispielen, die die Brouwerschen Behauptungen, betreffend die Existenzsätze, widerlegen. Wie ist nun hinsichtlich des Vorwurfes, daß die Mathematik in ein Spiel ausarte, die wirkliche Sachlage? Die Quelle der reinen Existenztheoreme ist das logische ε-Axiom, auf dem wiederum der Aufbau der gesamten idealen Aussagen beruht. Und welches ist der Erfolg des hierdurch ermöglichten Formelspieles? Dieses Formelspiel gestattet, den gesamten Gedankeninhalt der mathematischen Wissenschaft einheitlich auszudrücken und derart zu entwickeln, daß zugleich die Zusammenhänge der einzelnen Sätze und Tatsachen deutlich werden. Die Forderung, wonach dabei jede einzelne Formel für sich allein deutbar sein soll, allgemein aufzustellen, ist keineswegs vernünftig; im Gegenteil entspricht es dem Wesen einer Theorie, daß man in einer Entwickelung nicht nötig hat, zwischendurch noch auf die Anschauung oder Bedeutung zurückzugreifen. Der Physiker verlangt gerade von einer Theorie, daß ohne Heranziehung anderweitiger Bedingungen aus den Naturgesetzen oder Hypothesen die besonderen Sätze allein durch Schlüsse, also auf Grund eines reinen Formelspieles, abgeleitet werden. Nur gewisse Kombinationen und Folgerungen der physikalischen Gesetze können durch das Experiment kontrolliert werden — sowie in meiner Beweistheorie nur die realen Aussagen unmittelbar einer Verifikation fähig sind. Das Wertvolle der reinen Existenzbeweise besteht gerade darin, daß durch sie die einzelne Konstruktion eliminiert wird und viele verschiedene Konstruktionen durch einen Grundgedanken zusammengefaßt werden, so daß allein das für den Beweis Wesentliche deutlich hervortritt: Abkürzung und Denkökonomie sind der Sinn der Existenzbeweise. Die reinen Existenzsätze sind dann auch tatsächlich die wichtigsten Marksteine in der geschichtlichen Entwickelung unserer Wissenschaft gewesen. Aber solche Erwägungen fechten den gläubigen Intuitionisten nicht an. Das Formelspiel, über das Brouwer so wegwerfend urteilt, hat außer dem mathematischen Wert noch eine wichtige allgemeine philosophische Bedeutung. Dieses Formelspiel vollzieht sich nämlich nach gewissen bestimmten
79
936
80
81
Appendices
Regeln, in denen die T e c h n i k u n s e r e s D e n k e n s zum Ausdruck kommt. Diese Regeln bilden ein abgeschlossenes System, das sich auffinden und endgültig angeben läßt. Die Grundidee meiner Beweistheorie ist nichts anderes, als die Tätigkeit unseres Verstandes zu beschreiben, ein Protokoll über die Regeln aufzunehmen, nach denen unser Denken tatsächlich verfährt. Das Denken | geschiet eben parallel dem Sprechen und Schreiben, durch Bildung und Aneinanderreihung von Sätzen. Wenn irgendwo eine Gesamtheit von Beobachtungen und Erscheinungen verdient, zum Gegenstand einer ernsten und gründlichen Forschung gemacht zu werden, so ist es diese hier — liegt es doch in der Aufgabe der Wissenschaft, uns von Willkür, Gefühl und Gewöhnung freizumachen und vor dem Subjektivismus zu bewahren, der sich schon in den Anschauungen Kroneckers bemerkbar gemacht hat und der, wie mir scheint, in dem Intuitionismus seinen Gipfelpunkt erreicht. Die schärfste und leidenschaftlichste Kampfansage des Intuitionismus ist diejenige, die er gegen die Gültigkeit des Tertium non datur z. B. im einfachsten Falle gegen die Schlußweise richtet, derzufolge eine Behauptung, in welcher eine Zahlenvariable vorkommt, entweder für alle ganzzahligen Werte derselben richtig ist oder es eine Zahl gibt, für welche jene Behauptung falsch ist. Dieses Tertium non datur ist eine Folgerung aus dem logischen ε-Axiom und hat noch niemals den geringsten Fehler hervorgerufen. Es ist zudem so klar und faßlich, daß eine mißbräuchliche Anwendung ausgeschlossen ist. Insbesondere trägt das Tertium non datur an dem Zustandekommen der bekannten Paradoxien der Mengenlehre nicht die geringste Schuld; diese Paradoxien kommen vielmehr lediglich dadurch zustande, daß man unzulässige und sinnlose Begriffsbildungen benutzt — wie sie in meiner Beweistheorie sich von selbst ausschließen. Die Existenzbeweise mittels des Tertium non datur haben meist einen besonderen Reiz wegen ihrer überraschenden Kürze und Eleganz. Dieses Tertium non datur dem Mathematiker zu nehmen, wäre etwa, wie wenn man dem Astronomen das Fernrohr oder dem Boxer den Gebrauch der Fäuste untersagen wollte. Das Verbot der Existenzsätze und des Tertium non datur kommt ungefähr dem Verzicht auf die mathematische Wissenschaft überhaupt gleich. Denn was wollen die kümmerlichen Reste, die wenigen unvollständigen und unzusammenhängenden Einzelresultate, die von den Intuitionisten ohne den Gebrauch des logischen ε-Axioms erarbeitet worden sind, gegenüber der gewaltigen Ausdehnung der modernen Mathematik bedeuten! Die Lehrsätze in der Funktionentheorie, um nur irgendwelche Beispiele aus unserer Wissenschaft herauszugreifen, die Theorie der konformen Abbildung, die fundamentalen Theoreme in der Theorie der partiellen Differentialgleichungen oder der Fourierschen Reihen sind lediglich ideale Aussagen in meinem Sinne und bedürfen zu ihrer Entwicklung des logischen ε-Axioms. Ich staune unter diesen Umständen darüber, 25 daß ein Mathematiker an der strengen Gültigkeit der Schlußweise des Tertium non datur zweifelt. Ich staune noch mehr darüber, daß, wie es scheint, eine | ganze Gemeinde von Mathematikern sich heute zusammengefunden hat, die das gleiche tut. Ich staune 25 In
the republication (p. 307), this phrase is simply ‘Ich staune darüber, . . . ’.
5
10
15
20
25
30
35
40
45
‘Die Grundlagen der Mathematik’
5
10
15
20
25
30
35
937
am meisten über die Tatsache, daß überhaupt auch im Kreise der Mathematiker die Suggestivkraft eines einzelnen temperamentvollen und geistreichen Mannes die unwahrscheinlichsten und exzentrischsten Wirkungen auszuüben vermag. 26 Auch die Skizze meines Beweises des Cantorschen Kontinuumsatzes ist nicht ohne Kritik geblieben. Ich möchte daher zu diesem Beweise des Kontinuumssatzes einige Bemerkungen machen. Was zunächst das Lemma I betrifft, welches ich dort ohne Beweis gebrauche, so ist dieses zur Fixierung des Gedankenganges zwar sehr nützlich, aber für den Beweis selbst erläßlich. Denn die Abzählbarkeit der Gebilde, die bis zu einer bestimmten Höhe der Variablengattungen sich herstellen lassen, wird durch die Hinzunahme der ε-Funktionen nicht geändert. Man kann übrigens auch diese ε-Funktionen in bestimmter Weise normieren. Z. B. braucht man im Bereich der Zahlenvariablen an Stelle der allgemeinen ε-Funktion ε(A), deren Wert ein Beispiel für das eventuelle Zutreffen der Aussage A ist, nur die spezielle Funktionen-Funktion ε(f ) zu nehmen, welche 0 ist, wenn f (a) stets = 0 ist und sonst ein Beispiel einer Zahl a darstellt, für die f (a) = 0 ausfällt. Von dieser Funktionen-Funktion bin ich ursprünglich auch ausgegangen, als ich das Tertium non datur in Verbindung mit der Auswahl formalisieren wollte. Zur Erläuterung des von mir ebenfalls nicht bewiesenen Lemmas II und zugleich 27 zur Beleuchtung meiner Auffassung von den Zahlen der zweiten Zahlenklasse will ich folgenden Satz erwähnen, der mit in der Behauptung des Lemmas eingeschlossen ist. 28 Liegt für eine bestimmte Zahl der zweiten Zahlenklasse eine Definition mit Hilfe transfiniter Rekursion vor, so kann man aus dieser auch eine Definition jener Zahl gewinnen, in der lediglich die gewöhnliche, nach einer Zahlenvariablen fortschreitende Rekursion benutzt wird. Der Sinn dieses Satzes ist, daß eine rekursiv definierte Funktion einer Zahl der zweiten Zahlenklasse sich an einer gegebenen Stelle berechnen läßt — ebenso wie eine zahlentheoretische Funktion, die durch Rekursion definiert ist, für einen gegebenen Zahlwert stets berechnet werden kann. Die Schwierigkeit bei dem Nachweis hierfür ist vor allem die, zu zeigen, daß, wenn eine Folge α(n) von Zahlen der zweiten Zahlenklasse durch eine Rekursion α(n ) = ϕ (α(n)) gegeben ist, wobei ϕ mit Hilfe transfiniter Rekursion definiert ist, diese transfinite Rekursion eliminiert werden kann. 26 The next four paragraphs are omitted in the republication, an omission indirectly signalled by a dash after ‘vermag’ on p. 307. 27 This part of the sentence, from ‘Zur Erläuterung’ to ‘zugleich’ is omitted in the republication, p. 307. 28 This final clause in the sentence, from ‘der mit’ to ‘eingeschlossen ist’ is left out in the republication, p. 307, since the discussion of the Lemma concerned has also been omitted.
938 82
Appendices
In bestimmten Fällen ist die Durchführung dieser Elimination gelungen. Beispiele dafür sind die erste ε-Zahl und die erste kritische ε-Zahl, wie sie Cantor eingeführt und bezeichnet hat. 29 Die erste ε-Zahl ist der Limes der Folge α(n), wo α(0) = ω
α(n ) = ω
5
α(n)
(n gewöhnliche Zahl)
und ω in üblicher Weise durch transfinite Rekursion definiert wird. 30 Unter einer ε-Zahl versteht man nach Cantor eine solche Zahl α, für die α
α = ωα ist. Bei der Definition der ersten ε-Zahl durch gewöhnliche Rekursion braucht man schon Variablengattungen mit Nummern:
10
N0 (a) ∼ N(a) Nn (a) ∼ (b) Nn (b) → Nn (a(b)) .31 W. Ackermann ist kürzlich ein erheblicher Fortschritt in dem Beweise der Widerspruchsfreiheit gelungen. Ich möchte mit einem ganz kurzen Referat darüber meinen Vortrag beendigen. Bei dem Beweise der Widerspruchsfreiheit für die ε-Funktion kommt es darauf an zu zeigen, daß aus einem vorgelegten Beweis von 0 = 0 die εFunktion sich eliminieren läßt, in dem Sinne, daß die mit ihr gebildeten Figuren durch Zahlzeichen ersetzt werden können derart, daß die Formeln, die durch Einsetzung aus dem logischen Auswahlaxiom 32 hervorgehen, die „kritischen Formeln“, vermöge jener Ersetzungen in „richtige“ Formeln übergehen. Diese Ersetzungen werden nach erfolgter Elimination der freien Variablen durch schrittweises Probieren gefunden, und es muß gezeigt werden, daß dieser Prozeß jedenfalls zu einem Abschluß führt. Wir machen hier folgende speziellen Voraussetzungen:
15
20
25
1. Als Zeichen für individuelle Aussagen sollen nur Z und = 33
vorkommen. 2. Die Figuren, die als Argumente stehen — wir nennen sie „Funktionale“ — sollen, soweit sie von der ε-Funktion frei sind, entweder selbst Zahlzeichen oder aus solchen aufgebaut sein mit Hilfe von Zeichen für Funktionen, die durch Rekursions-Axiome definiert sind. 29 In
the republication (p. 308), this paragraph is slightly different:
In bestimmten Fällen ist P. B e r n a y s und J. v. N e u m a n n die Durchführung dieser Elimination gelungen. Solche Fälle sind die erste ε-Zahl und die erste kritische ε-Zahl, wie sie C a n t o r eingeführt und bezeichnet hat. 30 In
the republication (p. 308), ‘gilt’ is inserted before ‘und ω α ’ in this sentence. the republication (p. 308), the variable of quantification is ‘x’. 32 The republication (p. 309) has ‘logischen ε-Axiom’ here. 33 In the republication (p. 309), only ‘=’ is designated as such a sign. 31 In
30
‘Die Grundlagen der Mathematik’
5
10
939
Für den Fall, daß nur ein mit ε gebildetes Funktional und nur eine einzige kritische Formel vorkommt, ist die Endlichkeit des Prozesses der schrittweisen Ersetzungen folgendermaßen ersichtlich: sei At → Aεa Aa die kritische Formel (wobei in t ev. auch εa Aa vorkommen kann). Wir ersetzen zunächst überall εa Aa durch 0. 34 Dann werden alle Funktionale von der ε-Funktion frei, wir können alles ausrechnen und erhalten für die Funktionale Zahlwerte. Die ElementarAussagen können nunmehr als „richtige“ und „falsche“ unterschieden werden, indem jede Z-Aussage als richtig gilt und bei den Gleichungen die Übereinstimmung der beiderseitigen Zahlzeichen maßgebend ist. 35 An Stelle der kritischen Formel bekommen wir
83
Az → A0 Diese Formel ist entweder richtig; dann sind wir am Ziel, oder 15
20
Az ist richtig. Wir haben dann also ein Beispiel z für das Zutreffen von A gefunden. Dann machen wir eine neue Ersetzung, indem wir εa Aa überall durch das Zahlzeichen z ersetzen. Führen wir nunmehr die Berechnung aller Funktionale aus, so geht die kritische Formel in eine Formel Az1 → Az
25
über, die jedenfalls richtig ist. Wenn mehrere ε-Funktionen auftreten, so können diese in komplizierter Weise verkoppelt sein, und zwar einerseits in der Form der „Einlagerung“ z. B. εa A (a, εb Kb) , wobei εb Kb von der Variablen a frei ist, oder in der Form der „Überordnung“
30
35
εa A (a, εb K(a, b)) . Im Falle der bloßen Einlagerung entsteht noch keine prinzipielle Schwierigkeit. Wir haben darauf zu achten, daß wir die Ersetzungen von innen her ausführen und daß wir dem Gleichheits-Axiom Rechnung tragen dadurch, daß wir z. B. bei zwei ε-Figuren εa A (a, εb Cb) , εa A (a, εb Kb) , |im Falle gleicher Ersetzungen für εb Cb und εb Kb auch das äußere ε in gleicher Weise ersetzen. 36 34 In
the republication (p. 309), the displayed formula is ‘At → A(εx A(x))’, with the corresponding alterations. 35 In the republication (p. 309), the words ‘jede Z-Aussage als richtig gilt und’ are omitted. 36 In the republication (p. 310), throughout the treatment of ‘Einlagerung’ and ‘Überordnung’ hitherto, ‘x’ and ‘y’ are the variables of quantification, and the ε-terms ‘εb K(a, b)’ and ‘εb Cb’ are rendered as ‘εy B(x, y)’ and ‘εy C(y)’; the first two occurrences of ‘εb Kb’, are rendered as ‘εy B(y)’, but the latter two as ‘εy D(y)’.
84
940
Appendices
Solange die Ersetzungen für die inneren ε ungeändert bleiben, sind die für die äußeren ε gefundenen Beispiele definitiv. Sie können also nur dadurch unbrauchbar werden, daß für ein inneres ε ein neues Beispiel gefunden wird. Somit dringt man mit der Auffindung von Beispielen für die ε — sofern das Verfahren nicht schon vorher zum Abschluß kommt — immer weiter nach innen, so daß schließlich für die innersten ε Beispiele gefunden werden; diese Beispiele sind dann definitiv, und der Maximalgrad der Überlagerung ist damit um 1 vermindert. Man kann die Gesamtzahl der Ersetzungsschritte, die höchstens erforderlich ist, um alle kritischen Formeln in richtige zu verwandeln, an der Hand der vorgelegten Beweisfigur von vornherein in einfacher Weise abschätzen, — wodurch der finite Charakter der Überlegung ersichtlich wird. Schwieriger ist der Fall der Überordnung. Will man hier die Ersetzung von innen her ausführen, so kann man z. B. bei εa A (a, εb K(a, b)) . das innere ε: εb K(a, b) nicht durch eine Zahl, sondern nur durch eine Funktion ersetzen. 37 Als Ersetzungsfunktionen braucht man nur solche zu nehmen, die, abgesehen von endlich vielen Stellen, stets den Wert 0 haben. Man beginnt immer mit der Funktion, die stets den Wert 0 hat („Nullersetzung“). Es ist nun keineswegs ohne weiteres ersichtlich, kann aber bewiesen werden, daß auch in diesem Falle das Verfahren der Ersetzungen zu einem Abschluß führt, und man bekommt wiederum eine elementare Abschätzung für die Zahl der erforderlichen Schritte. Wesentlich ist dabei, daß man jedesmal, wenn für die inneren ε eine neue Funktionsersetzung gemacht ist, die Ersetzung der äußeren ε wieder von neuem mit der Nullersetzung beginnen muß. Vorausgesetzt ist bei diesem Endlichkeitsbeweis, daß die ε nur direkt in der Beweisfigur, aber nicht auch in den zur Definition von Funktionen eingeführten Rekursions-Axiomen auftreten. 38 Aus meinen Darlegungen erkennen Sie, daß der Beweis der Widerspruchsfreiheit es ist, der den Wirkungsbereich meiner Beweistheorie bestimmt und überhaupt den Kern derselben ausmacht. Die Methode von W. Ackermann gestattet noch eine weitere Ausdehnung. Für die Begründung der üblichen 37 Again, in the republication (p. 311), the variables of quantification are ‘x’ and ‘y’, and the inner ε-term is ‘εy B(x, y)’. 38 At this point in the republication (p. 311), a new paragraph is added:
Schließlich, sei noch bemerkt, daß man zur Berücksichtigung des Axioms der vollständigen Induktion, welches für den Zweck des Nachweises der Widerspruchsfreiheit in der Form (εa Aa = b ) → A(b) angesetzt werden kann, nur nötig hat, jedesmal wo man ein Beispiel z für das Zutreffen einer Aussage B(a) gefunden hat, zum kleinsten Beispiel überzugehen, indem man in der Reihe der auf numerische Formeln reduzierten Aussagen
B(0), B(0 ), . . . , B(z) die erste richtige aufsucht.
This is exactly the same as the very last paragraph of Bernays’s ‘Zusatz’ to Hilbert’s original Hamburg paper (see Bernays 1928 , 92). It is also precisely this paragraph of which Bernays says that it ‘muss fallen gelassen werden’. See the Introduction to this Appendix, p. 921.
5
10
15
20
25
30
‘Die Grundlagen der Mathematik’
5
10
15
941
Analysis ist der Ansatz von ihm so weit entwickelt, daß die verbleibende Aufgabe nur noch in der Ausführung eines | rein mathematischen Endlichkeitsbeweises besteht. Schon jetzt möchte ich als Schlußergebnis die Behauptung aussprechen: die Mathematik ist eine voraussetzungslose Wissenschaft. Zu ihrer Begründung brauche ich weder den lieben Gott, wie Kronecker, noch die Annahme einer besonderen auf das Prinzip der vollständigen Induktion abgestimmten Fähigkeit unseres Verstandes, wie Poincaré, noch die Brouwersche Urintuition und endlich auch nicht, wie Russell und Whitehead, Axiome der Unendlichkeit, Reduzierbarkeit oder der Vollständigkeit, die ja wirkliche inhaltliche und durch Beweise der Widerspruchsfreiheit nicht kompensierbare Voraussetzungen sind. 39 Ich möchte noch bemerken, daß P. Bernays mir wiederum ein treuer Mitarbeiter gewesen ist: er hat mich nicht nur durch Ratschläge fortgesetzt unterstützt, sondern auch eigene Gedanken und neue Gesichtspunkte hinzugefügt, so daß ich das Werk als unser gemeinsames bezeichnen möchte. Wir beabsichtigen demnächst eine ausführliche Darstellung der Theorie erscheinen zu lassen.
39 In the republication (p. 312), the words ‘und durch Beweise der Widerspruchsfreiheit nicht kompensierbare Voraussetzungen sind’ are replaced with ‘überdies gar nicht plausible Voraussetzungen sind’.
85
942
Appendices
Textual Notes 926.19: 926.25: 927.23: 927.29: 931.35: 933.11: 934.32: 935.4:
allgemeine] allgemeinen Formelvariablen] Formelvariable I] J Z (g(f ))] Zg(f ) im gewöhnlichen] in gewöhnlichem Principia] Prinzipia p, a, b, c (p > 2)] p, a, b, c, (p > 2) Z(a) & Z(b) & Z(c) & Z(p)] Z a & Z b & Z c & Z p
Weyl: ‘Diskussionsbemerkungen’
943
Diskussionsbemerkungen zu dem zweiten Hilbertschen Vortrag über die Grundlagen der Mathematik Von H. WEYL in Zürich.
5
10
15
20
25
30
Zur Verteidigung des Intuitionismus mögen mir zunächst ein paar Worte gestattet sein. Bevor Hilbert seine Beweistheorie aufstellte, wurde von Allen die Mathematik als ein System inhaltlicher, sinnerfüllter, einsichtiger Wahrheiten aufgefaßt; dieser Standpunkt war die gemeinsame Plattform aller Diskussionen. Wenn Poincaré die vollständige Induktion als ein letztes Fundament des mathematischen Denkens in Anspruch nahm, das sich auf nichts Ursprünglicheres zurückführen lasse, so hatte er gerade jenes in voller Anschaulichkeit sich vollziehende Aufbauen und Abbauen der Zahlzeichen im Auge, von dem auch Hilbert in seinen inhaltlichen Überlegungen Gebrauch macht. Denn auch bei ihm handelt es sich ja nicht etwa bloß um 0 oder 0 , sondern um irgendein 0··· , um ein beliebiges in concreto vorliegendes Zahlzeichen. Man mag hier das „in concreto vorliegend“ betonen; es ist auf der andern Seite aber ebenso wesentlich, daß die inhaltlichen Gedankengänge der Beweistheorie in hypothetischer Allgemeinheit, an irgendeinem Beweis, an irgendeinem Zahlzeichen durchgeführt werden. Dies soll natürlich kein Einwand sein, denn dies Verfahren des „eins nach dem andern“ kann sich auf unerschütterliche anschauliche Evidenz berufen; aber man darf es doch namhaft machen, nicht als „Axiom“, sondern in seinem konkreten Gebrauch, trotz und in all seiner Evidenz und Ursprünglichkeit, 40 und erblickt wohl in ihm mit Recht das eigentümliche Merkmal des inhaltlichen mathematischen Denkens. Mir scheint, daß in diesem Punkte die Hilbertsche Beweistheorie Poincaré vollständig recht gibt. Daß in Hilberts formalisierter Mathematik das Prinzip der vollständigen Induktion in der Peano-Dedekindschen Fassung als ein Axiom auftritt, dessen widerspruchsfreie Verträglichkeit mit den übrigen Axiomen durch inhaltliche Überlegungen sicherzustellen ist, ist natürlich eine ganze andere Sache, mit der es aber Poincaré gar nicht zu tun hatte. Brouwer forderte wie alle Welt von der Mathematik, daß ihre Sätze (in Hilbert’s Ausdrucksweise) „reale Aussagen“ seien, sinnerfüllte Wahrheiten. Aber er sah zum erstenmal genau und in vollem Umfang, wie sie tatsächlich 40 The
rather odd phrasing of this clause is in Weyl’s original.
86
944
87
88
Appendices
diese Grenzen des inhaltlichen Denkens überall weit überschritten hatte. Ich glaube, für diese Erkenntnis der Grenzen des inhaltlichen Denkens sind wir ihm alle zu Dank verpflichtet. In den inhaltlichen Überlegungen, welche die Widerspruchsfreiheit der formalisierten Mathematik sicherstellen sollen, werden von Hilbert diese | Grenzen, und zwar selbstverständlicherweise, durchaus respektiert; es handelt sich hier wirklich in keiner Weise um künstliche Verbote. Danach erscheint mir auch die Gefolgschaft, welche Brouwers Ideen fanden, nicht sonderbar; sein Standpunkt ergab sich mit Notwendigkeit aus einer These, die von allen Mathematikern vor der Aufstellung von Hilberts formalen Ansätzen geteilt wurde, und einer grundlegenden neuen unbezweifelbaren, auch von Hilbert anerkannten logischen Einsicht. Daß von diesem Standpunkt aus nur ein Teil, vielleicht nur ein kümmerlicher Teil der klassischen Mathematik zu halten ist, ist eine bittere, aber unumgängliche Tatsache. Hilbert ertrug diese Verstümmelung nicht. Und es ist wiederum eine Sache für sich, daß es ihm gelang, die klassische Mathematik durch eine radikale Umdeutung ihres Sinnes ohne Minderung ihres Bestandes zu retten, nämlich durch ihre Formalisierung, durch welche sie, prinzipiell gesprochen, sich aus einem System einsichtiger Erkenntnisse verwandelt in ein nach festen Regeln sich vollziehendes Spiel mit Formeln. Der ungeheuren Bedeutung und Tragweite dieses Hilbertschen Schrittes, der offenbar unter dem Druck der Umstände notwendig geworden ist, möchte ich mich nun keineswegs verschließen. Uns alle, die wir dieser Entwicklung beiwohnten, erfüllt mit Bewunderung die geniale Folgerichtigkeit, mit welcher Hilbert durch seine Beweistheorie der formalisierten Mathematik sein axiomatisches Lebenswerk krönte. Auch in der erkenntnistheoretischen Einschätzung der dadurch geschaffenen neuen Situation, trennt, wie ich mit großer Freude konstatiere, nichts mich von Hilbert. Er machte zunächst geltend, daß der Durchgang durch die idealen Aussagen ein legitimes formales Hilfsmittel ist zum Beweise von realen Aussagen; das muß sogar der strengste Intuitionist anerkennen. Ob diese ihre Rolle den Aufwand der ganzen Beweistheorie lohnen würde, darf man vielleicht noch bezweifeln (es ist das lediglich eine Frage der Ökonomie). Denn in den meisten Fällen liegt die Schwierigkeit nicht so sehr in der Auffindung des finiten Beweises als darin, die Sätze der klassischen Mathematik überhaupt durch reale, für den Intuitionisten akzeptable Urteile auszufüllen. Um dies z. B. für den Fundamentalsatz der Algebra von der Wurzelexistenz zu leisten, muß man die finite Konstruktion angeben, vermöge deren die von Schritt zu Schritt sich genauer bestimmenden Koeffizienten einen analogen Entwicklungsprozeß der Wurzelwerte auslösen; ist diese Konstruktion einmal gefunden, so ist es leicht, einzusehen, daß die von ihr mit immer höherer Approximation gelieferten Werte tatsächlich die Wurzeln der vorgelegten Gleichung sind. Aber Hilbert wies weiter mit Nachdruck auf die benachbarte Wissenschaft der theoretischen Physik hin. Ihren einzelnen Setzungen und | Gesetzen ist kein in der Anschauung unmittelbar zu erfüllender Sinn eigen, eine Konfrontation mit der Erfahrung vertragen, prinzipiell gesprochen, nicht die isoliert genommenen Aussagen der Physik, sondern nur das theoretische System
5
10
15
20
25
30
35
40
45
Weyl: ‘Diskussionsbemerkungen’
5
10
15
20
25
30
35
945
als Ganzes. Was hier geleistet wird, ist nicht anschauende Einsicht in singuläre oder allgemeine Sachverhalte und eine das Gegebene treu nachzeichnende Deskription, sondern theoretische, letzen Endes rein symbolische Konstruktion der Welt. Man hat gesagt, die Physik habe es nur mit der Feststellung von Koïnzidenzen zu tun; insbesondere hat Mach auf dem Felde der Physik einem reinen Phänomenalismus das Wort geredet. Aber wenn man ehrlich ist, so muß man doch zugestehen, daß unser theoretisches Interesse nicht aussch1ießlich und nicht einmal in erster Linie an den „realen Aussagen“ hängt, an den Konstatierungen, daß dieser Zeiger mit diesem Skalenteil sich deckt, sondern vielmehr an den idealen Setzungen, die laut Theorie in solchen Koïnzidenzen sich ausweisen, deren Sinn selbst aber in keiner gebenden Anschauung sich unmittelbar erfüllt, — wie z. B. der Setzung des Elektrons als eines universellen elektrischen Elementarquantums. Nach Hilbert sprengt schon die reine Mathematik den Rahmen der einsichtig feststellbaren Sachverhalte durch solche ideale Setzungen. Es ist eine tiefe philosophische Frage, welches die „Wahrheit“ oder Objektivitãt ist, die dieser über das Gegebene weit hinausdrängenden theoretischen Weltgestaltung zukommt. Sie hängt eng mit der andern Frage zusammen, was uns dazu treibt, gerade dies bestimmte von Hilbert entwickelte Axiomensystem zugrunde zu legen; die Widerspruchsfreiheit ist dafür wohl ein notwendiges, aber kein hinreichendes Argument. Vorläufig kann man darauf kaum anders antworten als mit dem Glauben an die Vernünftigkeit der Geschichte, die diese Bildungen in einem lebendigen geistigen Entwicklungsprozeß hervortrieb — ohne daß freilich die Träger der Entwicklung, durch vermeintliche Evidenz geblendet, der Willkür und Kühnheit ihrer Konstruktion sich bewußt waren. Auch Hilberts Berufung auf den praktischen Erfolg der Methode scheint mir von einem solchen Glauben getragen. Oder ist seine Meinung die, daß, je mehr der Axiomenbau seiner Vollendung sich nähert, in um so höherem Maße die Willkür wieder ausgeschieden wird und das eindeutig Zwingende hervortritt? Setzt sich die Hilbertsche Auffassung, wie das allem Anschein nach der Fall ist, gegenüber dem Intuitionismus durch, so erblicke ich darin eine entscheidende Niederlage der philosophischen Einstellung reiner Phänomenologie, die damit schon auf dem primitivsten und der Evidenz noch am ehesten geöffneten Erkenntnisgebiet, in der Mathematik, sich als unzureichend für das Verständnis schöpferischer Wissenschaft erweist.
946
Appendices
Zusatz zu Hilberts Vortrag über „Die Grundlagen der Mathematik“ Von P. BERNAYS in Göttingen.
89
1. Zur Ergänzung der vorstehenden Abhandlung seien einige näheren Ausführungen über den dort angedeuteten Ackermannschen Beweis der Widerspruchsfreiheit nachgetragen. Was zunächst, beim Fall der Einlagerung, die Abschätzung für die Höchstzahl der Ersetzungsschritte betrifft, so wird eine solche durch
5
2n geliefert, wobei n die Anzahl der gestaltlich verschiedenen ε-Funktionale bedeutet. Die geschilderte Beweismethode liefert noch eine wesentlich schärfere Abschätzung, welche z. B. für den Fall, daß gar keine Einlagerung vorkommt, die Höchstzahl
10
n+1 ergibt. 2. Die Betrachtung, durch die man beim Fall der Überordnung die Endlichkeit des Verfahrens erkennt, möge unter einfachen spezialisierenden Annahmen durchgeführt werden. Die Annahmen sind folgende: Die im Beweis vorkommenden ε-Funktionale seien
15
20
εa A (a, εb K(a, b)) und εb K(a1 , b), εb K(a2 , b), . . . , εb K(an , b), worin a1 , . . . , a n das εa A (a, εb K(a, b)) enthalten können, aber sonst kein ε-Funktional enthalten sollen. Das Verfahren besteht nun in einer Aufeinanderfolge von „Gesamtersetzungen“; jede von diesen wird gebildet durch: eine Funktionsersetzung χ(a) für εb K(a, b), vermöge deren εa A (a, εb K(a, b)) übergeht in εa A (a, χ(a)), und eine Ersetzung für εa A (a, χ(a)), vermöge deren a1 , . . . , an in Zahlzeichen z1 , . . . , zn übergehen und für
25
30
Bernays: ‘Zusatz zu Hilberts Vortrag’
947
εb K(a1 , b), . . . , εb K(an , b) die Werte χ(z1 ), . . . , χ(zn ) 5
erhalten werden. Wir beginnen mit der Funktion
90
χ0 (a) die für alle a den Wert 0 hat („Nullersetzung“), und ersetzen auch demgemäß εb K(a1 , b), . . . , εb K(an , b) 10
alle durch 0. Unter Festhaltung dieser Ersetzung wenden wir auf εa A (a, χ0 (a)) das ursprüngliche Verfahren des Probierens an, das nach höchstens zwei Schritten zum Ziele führt, derart, daß dann die zu εa A (a, χ0 (a))
15
gehörigen kritischen Formeln alle richtig werden. So erhalten wir eine bzw. zwei Gesamtersetzungen E0 bzw. E0 , E0 . Nun ist entweder E0 bzw. E0 endgültig, oder es wird eine der zu
20
εb K(a1 , b) bzw. εb K(a2 , b) bzw. . . . gehörigen kritischen Formeln falsch. Es gehöre diese etwa zu εb K(a1 , b) und a1 gehe in z1 über. Dann finden wir ein Beispiel z, so daß K(z1 , z) richtig ist. Dieses Beispiel berücksichtigen wir nun, indem wir als Ersetzungsfunktion für εb K(a, b)
25
anstatt χ0 (a) die Funktion χ1 (a) nehmen, die definiert ist durch:
30
χ1 (z1 ) = z χ1 (a) = 0
für a = z1 .
Mit χ1 (a) wiederholen wir nun das obige Verfahren, wobei jetzt die Werte der εb K(aν , b)
(ν = 1, . . . , n)
sich erst nach der Wahl des Wertes für εa A (a, χ1 (a)) 35
bestimmen, und bekommen dadurch eine bzw. zwei Gesamtersetzungen
91
948
Appendices
E1 bzw. E1 , E1 . Nun ist entweder E1 bzw. E1 endgültig oder wir finden wieder ein Beispiel z für eines der aus
εb K(a1 , b), . . . , εb K(an , b) durch die letzte Gesamtersetzung hervorgehenden ε-Funktionale, derart, daß für ein gewisses z2
5
K(z2 , z ) richtig ist, während K(z2 , χ1 (z2 )) falsch ist. Daraus folgt zugleich, daß
10
z2 = z1 Nunmehr führen wir statt χ1 (a) als Ersetzungsfunktion χ2 (a) durch folgende Definition ein χ2 (z1 ) = z, χ2 (z2 ) = z , χ2 (a) = 0
15
für a = z1 , z2
Mit dieser Funktion χ2 (a) wird nun wiederum das Ersetzungsverfahren wiederholt. Indem wir in dieser Weise fortfahren, erhalten wir eine Reihe von Ersetzungsfunktionen
20
χ0 (a), χ1 (a), χ2 (a), , . . . , von denen jede aus der vorigen durch Hinzunahme eines von 0 verschiedenen Funktionswertes für einen neuen Argumentwert gebildet ist; und zu jeder Funktion χp (a) haben wir eine bzw. zwei Ersetzungen Ep bzw. Ep , Ep . Es kommt darauf an, zu zeigen, daß diese Ersetzungsreihe abbricht. Dazu betrachten wir zunächst die Ersetzungen
25
E0 , E1 , E2 , . . . . Bei diesen ist jedesmal εa A (a, εb K(a, b))
30
durch 0 ersetzt; die
92
εb K(aν , b) (ν = 1, . . . , n) gehen daher jedesmal in dieselben ε-Funktionale über; und für jedes von diesen wird entweder 0 gesetzt oder ein von 0 verschiedenes Zahl|zeichen, welches dann als definitive Ersetzung beibehalten wird. Somit können unter den Ersetzungen E0 , E1 , E2 . . .
35
Bernays: ‘Zusatz zu Hilberts Vortrag’
949
höchstens (n + 1) verschiedene sein. Ist aber Ek mit El identisch, so gehört entweder zu keiner von beiden oder zu jeder eine anschließende Ersetzung Ek bzw. El , und in diesen ist dann 5
εa A (a, εb K(a, b)) beidemal durch dieselbe als Beispiel gefundene Zahl ersetzt, so daß auch die εb K(aν , b)
10
(ν = 1, . . . , n)
für beide Ersetzungen in die gleichen ε-Funktionale übergehen. Demnach können unter den Ersetzungen El für welche El mit einer festen Ersetzung Ek übereinstimmt, wieder höchstens (n + 1) verschiedene sein. Im ganzen kann es also nicht mehr als (n + 1)2 verschiedene Ep bzw. Ep , Ep
15
20
geben. Daraus folgt aber, daß spätestens mit der Ersetzungsfunktion χ(n+1)2 (a) unser Verfahren zum Abschiuß kommt. Denn es können nicht die zu zwei verschiedenen Ersetzungsfunktionen χp (a), χq (a) (q > p) gehörigen Ersetzungen völlig übereinstimmen, da man sonst mit Hilfe von χq (a) auf dasselbe Beispiel z∗ geführt werden müßte, das man schon mit Hilfe von χp (a) gefunden hat, während dieses doch in der Definition der auf χp (a) folgenden Ersetzungsfunktionen, insbesondere also auch derjenigen von χq (a), schon benutzt ist. 3. Schließlich, sei noch bemerkt, daß man zur Berücksichtigung des Axioms der vollständigen Induktion, welches für den Zweck des Nachweises der Widerspruchsfreiheit in der Form (εa Aa = b ) → Ab
25
angesetzt werden kann, nur nötig hat, jedesmal wo man ein Beispiel z für das Zutreffen einer Aussage B(a) gefunden hat, zum kleinsten Beispiel überzugehen, indem man in der Reihe der auf numerische Formeln reduzierten Aussagen B(0), B(0 ), . . . , B(z) die erste richtige aufsucht.
950
Appendices
Letter from Paul Bernays to Hermann Weyl, 5 January 1928 Paul Bernays in Berlin.
1
2
3
Lieber Herr Professor! Verzeihen Sie, dass ich Ihren freundlichen Brief erst jetzt beantworte. Ich laboriere an einer dauernden Phasendifferenz in der Ausführung meiner Programmpunkte. — Zunächst möchte ich Ihre Neujahrswünsche herzlich erwidern, indem ich Ihnen, Ihrer Frau und den Jungen ein recht gutes Ergehen im begonnenen Jahr wünsche! Den Joachim habe ich ja vor zwei Jahren gesehen; damals war er schon recht gross, hatte aber noch keinen Ansatz zu einem Bart. — — Hilberts Befinden hat sich seit der Zeit seiner Hamburger Vorträge | wesentlich gebessert. Sie wissen wohl, dass er seit Anfang Oktober ein amerikanisches Medikament (ein Leberpräparat) zu sich nimmt; dies hat offenbar die Besserung bewirkt. — — Um nun auf Ihre Erkundigung zu kommen, so ist der bewusste Ackermannsche Beweis bisher nicht publiziert. In der Druck-Fassung der Hilbertschen Vorträge ist auch nur eine schwache Andeutung davon enthalten. Was den Hauptgedanken des Beweises betrifft, so genügt es ↑wohl↓, diesen an dem Fall einfacher Überordnung, d. h. in der Form εa A (a, εb K(a, b)) . darzulegen. Nehmen wir an, es | komme ausser diesem εa · · · 41 und den Spezialisierungen von εb K(a, b), in der Form εb K(k, b), — wo eventuell k wieder eines dieser ε enthalten kann —, kein weiteres ε vor. εb K(a, b) sei bereits ein Grundtyp im Sinne von von Neumann. Wir machen nun für diesen ↑Grundtyp↓ Funktionsersetzungen, indem wir mit der „Nullersetzung“ χ0 (a) beginnen, d. h. derjenigen Funktion, die Konstant = 0 ist, und diese schrittweise nur für solche Argumentwerte z abändern, bei welchen wir aus einer zu εb K(z, b) gehörigen „kritischen Formel“ ein „Beispiel“ finden. 41 The
elliptical dots are in Bernays’s letter.
5
10
15
20
25
30
Bernays: Letter to Weyl, January 1928
5
10
951
Man kann nun, ebenso wie in dem Ihnen bekannten Fall, (wo nur Einlagerung von ε, ↑z. B. ↓ in der Form | εc B(εd F(d)) vorkommt), folgenden Hülfsatz beweisen: Bei festgelegter Ersetzung für das „äussere“ ε (das εa ) gibt es nur eine abschätzbare Anzahl von progressiv aufeinander folgenden, merklich verschiedenen Ersetzungen χν (a) für εb K(a, b); dabei heisst „progressiv“, dass jeweils die folgende Ersetzungs-Funktion aus der vorhergehenden durch Hinzunahme eines oder mehrerer (endlich vieler) Funktionswerte = 0 entsteht, und „merklich verschieden“ heisst, dass die Verschiedenheit der Funktionen in den ↑betrachteten↓ Gesamt-Ersetzungen zur Geltung kommt. — Es wird nun folgendermassen verfahren: Wir machen zuerst für das „innere“ ε (das εb ) die Nullersetzung χ0 (a); damit reduziert sich das εa auf εa A(a, χ0 (a)), d.h. wir haben den | elementaren Fall. Nach einer abschätzbaren Anzahl ↑ n↓ von Ersetzungen
15
E11 , E12 , · · · , E1k1
4
5
(k1 n)
muss für εa alles in Ordnung sein. Entweder sind wir dann am Ziel, oder für gewisse
20
εb K(z, b) sind Beispiele gefunden, sodass wir χ0 (a) progressiv in χ1 (a) abzuändern haben und das εa übergeht in εa A(a, χ1 (a)) Unter Festhaltung der inneren Ersetzung χ1 machen wir nun in üblicher Weise die Ersetzungen für
25
εa A(a, χ1 (a)) wobei wir uns um die früheren Ersetzungen E11 , E12 , · · · , gar nicht kümmern und demgemäss jedenfalls mit der Nullersetzung für das εa beginnen. Wir erhalten nun wieder eine Reihe E21 , E22 , · · · , E2k2 ,
30
35
wobei wieder k2 n ist. Entweder sind wir nun mit E2k2 am Ziel, oder χ1 (a) muss progressiv in χ2 (a) abgändert werden, u. s. w.. Somit erhalten wir ein nach Zeilen und Spalten geordnetes Schema von Ersetzungen: E11 , E21 , E31 , .. .
E12 , · · · , E1k1 E22 , · · · , E2k2 E32 , · · · , E3k3 .. .
(k1 n) (k2 n) (k3 n)
6
952
7
Appendices
Es kommt nun darauf an, zu zeigen, dass die Anzahl der Zeilen in abschätzbarer Weise begrenzt ist. Hierzu betrachten wir die Spalten. In der ersten Spalte hat das εa (das äussere ε) immer die Nullersetzung, also ist nach dem Hülfsatz die Anzahl der hier merklich verschiedenen von den Ersetzungen χ0 (a), χ1 (a), χ2 (a) | unter einer von vornherein bestimmbaren Schranke m gelegen. Sind zwei Ersetzungen Ep1 , Eq1 nicht merklich verschieden, so ist (gemäss dem elementaren Ersetzungsverfahren) die Ersetzung für das äussere ε in Ep2 dieselbe wie in Eq2 . Hieraus folgt nach dem Hülfsatz, dass in einer Teilreihe p 1 , p2 , · · · von Zeilennummern, für welche die zum Spalten-Index 1 gehörigen Ersetzungen übereinstimmen (nicht merklich verschieden sind), höchstens m merklich verschiedene Ersetzungen E pα 2
8
9
E2k2 von E1k1 , E3k3 von E2k2 und E1k1 u. s. w. merklich verschieden ist. Das Verfahren muss also nach höchstens mn Zeilen abbrechen, sodass man dann am Ziel ist. — Die Berücksichtigung der vollständigen Induktion, bezw. des stellvetretenden Axioms (εa Aa = b ) → A(b) gelingt leicht, indem man jedesmal von einem „Beispiel“ für εb K(z, b) ↑bezw. für ein εa ↓ 43 durch Probieren zum kleinsten Beispiel übergeht. Auch elementare Rekursionsdefinitionen machen keine Schwierigkeiten. Dagegen versagt leider der skizzierte Beweis, wenn Rekursionen mit ε, wie z. B. ϕ(a, n ) = εb A (a, b, n, ϕ(b, n)) , zugelassen werden. — Ackermann hat übrigens diesen Beweis durch Spezialisierung seines allgemeinen Ansatzes für die εf (d. h. für reelle Variable) gewonnen. ellipsis is Bernays’s. addition is not, like the others, interlineated, but set in the lower margin, the place of insertion being indicated by an insertion sign. 43 This
10
15
(in der zweiten Spalte)
vorkommen können. Indem man in gleicher Weise von der zweiten Spalte auf die dritte Spalte | und ebenso weiter schliesst, erkennt man, dass in der ersten Spalte höchstens m, in der zweiten höchstens m2 , in der dritten höchstens m3 . . . 42 merklich verschiedene Ersetzungen vorkommen können. Andrerseits folgt aus der Art des Verfahrens — weil ja immer neue Beispiele ↑für das innere ε↓ gefunden werden —, dass jedenfalls
42 The
5
20
25
30
35
Bernays: Letter to Weyl, January 1928
5
10
953
— Was die Frage der Publikation betrifft, so möchte ich darüber erst Hilberts Meinung wissen — (zurzeit bin ich bei meinen Angehörigen in Berlin) —; eine genaue Darstellung des Ackermannschen Beweises ist jedenfalls für das geplante Buch von Hilbert u. mir in Aussicht genommen, — von welchem allerdings | ↑bisher↓ nur ein § im Entwurf vorliegt. — Ihre ergänzenden Bemerkungen zu Hilberts Hamburger Vorträgen habe ich mir anlässlich der Druck-Korrekturen wiederholt durchgelesen; sie sind mir sehr nach dem Sinn. Als Beilage zu diesen Zeilen sende ich Ihnen ein Exemplar meines im Herbst gehaltenen Vortrages über Logik. 44 Mit herzlichem Gruss, auch an Ihre Frau, Ihr, P. Bernays Berlin–Wilmersdorf, 5.I.28. Reguläre Adresse: Göttingen, Gauss str. 1I .
44 This is very likely to be the lecture published as Bernays 1927 , and given before the fifty-sixth Versammlung deutscher Philologen und Schulmänner held in Göttingen in late September 1927.
10
954
Appendices
Appendix C: Hilbert’s Bologna Lecture (1928)
Introduction
This Appendix reprints the text of the first published version of the lecture which Hilbert gave in Bologna on the 3 September 1928 at the International Congress of Mathematicians.1 It was published in Volume 1 of the Proceedings of the Congress, i. e., Atti del Congresso Internazionale dei Matematici, Bologna, 3–10 Settembre 1928 (VI), Bologna: Nicola Zanichelli, 1929 (Hilbert 1929 in the Bibliography). It has been only lightly edited here: orthographical mistakes have been ‘quietly’ corrected, and listed in the Textual Notes; some terms have been uniformised, e. g., ‘Zahltheorie’ is changed to the more usual ‘Zahlentheorie’; and the punctuation has been corrected. The typesetters of the Congress proceedings used the convention of setting colons, semi-colons, question marks and ‘guillemet’ quotation marks (‘«’ and ‘»’) a space away from the first or last letter of the text they govern. Sometimes the space available to the typesetter in a given line has made it hard to judge whether the practice has been carried out uniformly; we have endeavoured to make it clear here by leaving none of these spaces except in the case of the quotation marks. In the course of the text, Hilbert refers to the work of a number of authors; we have supplied references in those cases where it is clear (or suspected) that an individual work is meant. 1 This Congress was politically controversial, both internationally and within Germany. After the Great War of 1914–1918, mathematicians from Germany, Austria, Hungary and Bulgaria were explicitly excluded from the Congresses held at Strasbourg in 1920 and Toronto in 1924. Mathematicians from all countries were invited to the Bologna Congress of 1928. Some German mathematicians opposed participation, notably the ardent nationalist, Ludwig Bieberbach (who later became editor of the pro-Nazi and anti-semitic journal Deutsche Mathematik ). Also opposed was Hilbert’s philosophical rival, L. E. J. Brouwer, who, although he was Dutch, was sympathetic to German nationalism. Hilbert led a delegation of sixty-seven German mathematicians to the Congress. A fuller account is to be found in Reid 1970 , 188–189.
Introduction
955
The lecture was used in three further publications, in Mathematische Annalen in 1930 (Hilbert 1930c), again in 1930 as the final Appendix (Appendix X) to the Seventh Edition of Hilbert’s Grundlagen der Geometrie, (i. e., Hilbert 1930e), and in the Hilbert Gedenkband of 1971 edited by Kurt Reidemeister (i. e., Hilbert 1971b). On the first page of the Annalen republication (which carries the date 25 March 1929), a footnote states that it is the ‘Vortrag, gehalten auf dem Internationalen Mathematiker-Kongress in Bologna, am 3. Sept. 1928’. In the second republication in the Seventh Edition of the Grundlagen, a note under the title says it is a ‘reprint’ of the Annalen paper, which also ‘appeared’ in the Proceedings of the Bologna Congress. The note to the title of the third republication says that it is a lecture of Hilbert’s held at the Bologna Congress on 3 September 1928. Thus, one is led to expect a word-for-word reprint (perhaps with minor corrections) of the Bologna paper. But the republications are substantially altered, both from the original Bologna version and from each other. (See below.) It should be noted here that the practice of republishing papers in importantly revised form without making it explicit that they are in fact revised was fairly standard for Hilbert. The papers republished in the Gesammelte Abhandlungen are not always by any means identical to the originals, and the changes were indicated neither by Hilbert nor by his editors. The same observation applies to all the Appendices successively added to the various editions of the Grundlagen der Geometrie, both to the geometry papers and those dealing with the foundations of logic and arithmetic, as was clear with Hilbert’s paper reproduced in Appendix B above. The text of the Grundlagen itself, however, is more carefully treated: each new edition attempts to make it clear, either by a note on the title page or through Hilbert’s Vorwort, how the new edition differs, if at all, from its predecessor. The Annalen republication will be referred to below as the first, and that in the Grundlagen as the second, since it clearly derives from the Annalen paper. Aside from one or two minor adjustments in punctuation, the third republication is a direct reprinting of the Annalen version; for this reason, we make virtually no explicit reference to it below. The alterations in the first republication fall into four categories: (a) Orthographical changes: (i) the numerous spelling errors in the original are corrected; (ii) some spellings are uniformised, e. g., ‘Zahlentheorie’ is used throughout; (iii) punctuation is changed to conform to standard German usage; (iv) Umlaute are used more frequently (e. g., ‘Überzeugung’ instead of ‘Ueberzeugung’), and the Eszett (‘ß’) is standardly used (e. g., ‘dass’ becomes ‘daß’); (v) proper names are no longer rendered in small capitals. (b) Small changes in grammar (e. g., ‘Füllwörter’ are more frequently employed), arrangement (e. g., changes to the paragraph structure), and expression. There is, too, a noticeable modification in tone, the republication being less personal (e. g., ‘meine’ often becomes ‘die’), and a bit more cautious. For example, superlatives and absolutes in the original are modified. (c) A few clarifications and/or qualifications are added; the most important of these are noted in editorial footnotes.
956
Appendices
(d ) Significant changes in content. The most important of these are detailed in editorial footnotes. In the second republication, there are again alterations, for example, notable omissions from the first republication, and there are also some significant revisions. These are noted in the editorial footnotes. There are also trivial orthographic changes, and one or two changes in structure and expression, which, as a general (but not universal) rule, are not noted here. Two explicit references to work of members of the Hilbert school (Ackermann and von Neumann) are added. Curiously, while the republication in the Mathematische Annalen omits the original reference to the work of ‘Italian mathematicians’ on stronger and weaker versions of the Axiom of Choice, this second republication also omits the several references to Peano. The one significant difference in the third republication concerns, not Hilbert’s text, but an editorial addition. At the very end (Hilbert 1971b, 19), the editor has added a new sentence, not singled out from Hilbert’s text by any editorial marking, which says: Hilbert hatte einen stürmischen Beifall, am Beginn wie nach Ende des Vortrags.
Michael Hallett
‘Probleme der Grundlegung der Mathematik’
957
Probleme der Grundlegung der Mathematik 1
5
10
15
20
25
Für die mathematische Wissenschaft waren die letzten Jahrzehnte eine Periode höchster Blüte. Ich erinnere daran, wie in der Arithmetik, insbesondere in der Theorie der algebraischen Zahlkörper 2 die schwierigsten Probleme gelöst und die Vollendung dieses herrlichen Gedankengebäudes erreicht worden ist. Zugleich gelang die Entdeckung der lange gesuchten transzendenten Funktionen, die dem Zahlkörper zugehören und durch die die verborgensten zahlentheoretischen Wahrheiten ans Licht gelangten. 3 Andererseits wurden die Begriffsbildungen der Idealtheorie weit über die Grenzen der Zahlentheorie hinaus auf Algebra und Funktionentheorie mit bestem Erfolge übertragen, und dadurch erhielt ein grosser Komplex mathematischen Wissens ein einheitliches Gefüge. In 4 der Theorie der Funktionen einer komplexen Veränderlichen sind in dem verflossenen Zeitraum nicht geringe Fortschritte gemacht worden. Der Ausbildung des Prinzips der konformen Abbildung insbesondere verdanken wir die herrlichen Methoden zur Gewinnung der automorphen Funktionen und des Problems der Uniformisierung. Die so schwierigen Beweise der Existenzsätze haben durch Anwendung der Methoden der Variationsrechnung den höchsten Grad von Einfachheit und Durchsichtigkeit erreicht. Und welche Fülle der Gesichter 5 liefert die Geometrie: allein die Topologie ist so sehr durch neue Fragestellungen und Behandlungsmethoden bereichert worden, dass man darin die Entstehung eines neuen selbständigen Wissenszweiges sehen muss. Die Physik liess vor unseren Augen neue mathematische Gedankengebäude erstehen, deren Hallen von imponierender Grossartigkeit sind. Und überhaupt gedenken wir auch der Anwendungen: es sind nicht die schlechtesten Früchte, die die mathematische Forschung auf dem Felde der Anwendungen erntet, sei es dass die Anwendungen anderen Wissensgebieten oder praktischen Bedürfnissen entsprangen. Und der Bezirk, in den die Mathematik eindringt, dehnt sich beständig. 1 All three republications have a footnote to the title stating that the text is the lecture which was given in Bologna in 1928. See the Introduction above. 2 The republications insert a comma here. 3 In both republications, Hilbert changes the latter part of the sentence to ‘die Entdeckung der lange gesuchten transzendenten Funktionen, die dem Zahlkörper zugehören, und durch die mannigfache bisher verborgene zahlentheoretische Wahrheiten ans Licht gelangten’: see Hilbert 1930c, 1, and Hilbert 1930e, 313. 4 The republications begin this sentence with ‘Auch in’. 5 The republications have ‘Gesichte’.
135
958
136
Appendices
Wegen dieser so erfreulichen Sachlage erwächst dem Mathematiker die besondere Pflicht, die Mathematik in ihren Grundlagen zu sichern. Wie ist doch die allgemein verbreitete populäre Meinung über Mathematik und mathematisches Denken? « Die mathematischen Wahrheiten » so sagt man « sind | absolut sicher; denn sie werden auf Grund von Definitionen durch untrügliche Schlüsse bewiesen. Sie müssen daher auch überall in der Wirklichkeit stimmen ». Dieser populären Meinung zufolge sollte die Mathematik zum Vorbild für alle Wissenschaft überhaupt dienen. Wir wollen nun sehen, ob es so schön mit der Mathematik bestellt ist. 6 Wie war der Stand der Grundlagenfrage im drittletzten Jahrzehnt? Die grossen Klassiker und Schöpfer der Grundlagenforschung waren Dedekind und Cantor 7 ; sie hatten in Zermelo einen kongenialen Interpreten gefunden. Zermelo hatte die Annahmen, die zum axiomatischen Aufbau der Mengenlehre nötig sind, aufgestellt und damit die von Cantor nur unbestimmt und teilweise unbewusst angewandten Mittel in aller Schärfe präzisiert. 8 Diese Zermelo’schen Axiome sind zudem alle von der Art, dass ein ernster Zweifel an ihrer Richtigkeit nicht aufkommen konnte. Das Vorgehen Zermelos war durchaus berechtigt und entspricht der axiomatischen Methode. Doch die Zermelo’schen Bahnen wurden damals unter dem Druck massgebender Kreise verlassen. Alte Einwürfe Kroneckers gegen Dedekind und Cantor, die wir Jüngeren längst überwunden glaubten, und die Kronecker selbst niemals in seinen Arbeiten befolgt hatte, wurden vorgesucht 9 . Eine unglückliche Auffassung Poincarés, dieses Meisters mathematischer Erfindungskunst, betreffend den Schluss von n auf n + 1, eine Auffassung die überdies bereits zwanzig Jahre früher von Dedekind widerlegt war, verrammelte den Weg zum richtigen Vorwärtsschreiten. 10 Ein neues Verbot, das Verbot der « impraedikativen » 11 Aussage wurde erfunden und aufrecht erhalten, obwohl Zermelo sofort ein schlagendes Beispiel gegen dies Verbot angab. 12 Leider auch die sonst so scharfsinnige 13 Logik Russells leistete in ihrer Anwendung auf 6 These
last two paragraphs are omitted in the second republication: see Hilbert 1930e, 314. 7 In both republications, Hilbert adds here the name of Frege between Cantor and Dedekind: Hilbert 1930c, 2; Hilbert 1930e, 314. 8 The references are to Zermelo 1908a, and Zermelo 1908b. 9 The second republication has ‘von neuem hervorgeholt’ in place of ‘vorgesucht’. 10 The second republication has replaced this sentence with: Und zwar war es Poincaré, dieser Meister mathematischer Erfindungskunst, der durch eine unglückliche Auffassung des Induktionsschlusses — eine Auffassung, die bereits zwei Jahrzehnte früher von Dedekind durch einen ausführlichen Beweis widerlegt worden war — den Weg zum Vorwärtsschreiten verrammelte. (Hilbert 1930e, 314–315.) 11 In both republications, ‘impraedikativen’ becomes ‘imprädikativen’, but more importantly the scare quotes are omitted. See Hilbert 1930c, 2; Hilbert 1930e, 315. 12 The references to Poincaré are probably to the series of papers Poincaré 1905b, Poincaré 1906a and especially Poincaré 1906b; the other references are to Dedekind 1888 and Zermelo 1908a. 13 The first republication has ‘vortreffliche’ instead of ‘scharfsinnige’ (Hilbert 1930c, 2), while the second republication has ‘so tiefgehende’ (Hilbert 1930e, 315).
5
10
15
20
25
‘Probleme der Grundlegung der Mathematik’
5
10
15
20
25
30
35
959
Mathematik der Irrlehre Vorschub. 14 So kam es, dass unsere geliebte Wissenschaft — was die Frage nach ihrem Wesen und ihren Grundlagen betrifft — zwei Jahrzehnte hindurch wie von einem bösen Traum heimgesucht worden ist. Ich begrüsse es als ein Erwachen, als ein leuchtendes Morgenrot, wenn in letzter Zeit eine Reihe jüngerer Mathematiker wieder auf Zermelos Gedanken zurückgehen; diese Mathematiker haben die Zermelo’schen Axiome vervollständigt und eine Reihe sehr wichtiger tiefliegender mit Zermelos Axiomatik zusammenhängender Fragen erfolgreich behandelt. 15 Freilich eine endgültige Lösung der Grundlagenprobleme ist durch dieses alte axiomatische Verfahren niemals möglich. Denn die von Zermelo zugrunde gelegten Axiome enthalten echte inhaltliche Annahmen. Wenn wir inhaltliche Axiome, mögen sie noch so plausibel sein, als Ausgangspunkte und Grundlagen für die Beweise benutzen, so verliert die Mathematik damit den Charakter des absolut Sicheren. Mit der Annahme von Voraussetzungen kommen wir auf das Gebiet des Problematischen — beruhen doch die Meinungsverschiedenheiten der Menschen meist darauf, dass von verschiedenen Voraussetzungen ausgegangen wird. In einer Reihe von Vorträgen während der letzten Jahre habe ich daher | einen neuen Weg zur Behandlung des Grundlagenproblems betreten. Mit dieser Neubegründung der Mathematik, die man füglich als eine Beweistheorie bezeichnen kann, glaube ich die Grundlagenfragen in der Mathematik als solche endgültig aus der Welt zu schaffen, indem ich jede mathematische Aussage zu einer konkret aufweisbaren und streng ableitbaren Formel mache und dadurch die mathematisch-philosophischen Fragen 16 in die Domäne der reinen Mathematik versetze. Freilich bedarf es zur vollen Durchführung dieser Aufgabe der hingebenden Mitarbeit der jüngeren Mathematikergeneration. In diesem Sinne möchte ich heute einige nähere Ausführungen machen. Die wichtigsten Probleme konzentrieren sich auf das von mir aufgestellte sogenannte ε-Axiom; dasselbe lautet A(a) → A(εA). In der Verwendung des Axioms hat man vor allem die Gattung von Variabeln 17 zu beachten, auf die ε zu beziehen ist. Bei den Zahlen dient es zur Formulierung der üblichen Schlüsse mit « irgend ein »: man versteht unter εA 18 irgend eine Zahl, für die die Aussage A sicher zutrifft, wenn es überhaupt eine Zahl gibt, für die A zutrifft. Für a ist irgend eine ganze Zahl zu nehmen. Ich möchte nun einige Probleme nennen. 14 The
reference to Russell is probably to Whitehead and Russell 1910 . the republications, the sentence ends with ‘und dazu eine Reihe sehr wichtiger tiefliegender Fragen erfolgreich behandelt’. 16 In the republications, ‘mathematisch-philosophischen Fragen’ is replaced by ‘den ganzen Fragenkomplex’. 17 Replaced in the republications by ‘Variablen’. 18 Here, and in the rest of this paragraph, both republications use ‘A’ in place of ‘A’, although the statement of the ε-Axiom itself is not changed; see Hilbert 1930c, 3, and Hilbert 1930e, 316. 15 In
137
960
Appendices
Durch die Arbeiten von Ackermann und v. Neumann 19 ist der Beweis für die Widerspruchsfreiheit des ε-Axioms für die Zahlen geführt: damit sind folgende drei Probleme erledigt: 1) Das Tertium non datur für die Zahlen, d. h. wenn eine Aussage nicht für alle ganzen Zahlen gilt, so gibt es eine Zahl, für die sie nicht gilt. So war es z. B. nach Kronecker unrichtig, 20 eine ganze rationale Funktion einer Variabeln 21 x mit ganzen rationalen Koeffizienten als irreduzibel zu definieren, wenn es keine Zerlegung derselben als Produkt von zwei ebensolchen Funktionen gibt. Ich beweise durch meine Beweistheorie, dass im Gegenteil diese Definition eine völlig strenge Definition in rein mathematischem Sinne ist und dass daher die Behauptung Kroneckers nicht bloss logisch unzutreffend, sondern auch in rein arithmetischem Sinne unrichtig ist — in gleichem Sinne unrichtig, wie irgend ein falscher zahlentheoretischer Satz oder eine falsche arithmetische Formel. 2) Die Auflösung einer Behauptung über Existenz einer Zahl nach dieser Zahl: « die kleinste Zahl, welche ». 3) Der Schluss von n auf n + 1. 22 Wie Sie bemerken, ist ein wesentliches Hilfsmittel für meine Beweistheorie die Begriffsschrift, und wir verdanken dem Klassiker dieser Begriffsschrift, Peano, die sorgfältigste Pflege und weitgehendste Ausbildung derselben. 23 Die Form, in der ich die Begriffsschrift brauche, ist wesentlich diejenige, die Russell zuerst eingeführt hat. Bisher noch nicht erledigt sind folgende Probleme. 19 The second republication gives as references Ackermann 1925 , and von Neumann 1927 : see Hilbert 1930e, 316. 20 In both republications, instead of ‘So war es z. B. nach Kronecker unrichtig . . . ’, the text reads (starting a new paragraph): ‘Beispielsweise: nach Kronecker war es unzulässig . . . ’: see Hilbert 1930c, 4, and Hilbert 1930e, 316. 21 Replaced in the republications by ‘Variablen’. 22 Both republications add here the condition ‘wenn man noch die Formel (εA = b ) → Ab als Axiom hinzunimmt’. See Hilbert 1930c, 4, and Hilbert 1930e, 317, where the additional condition is written ‘(ε(A) = b ) → A(b)’. The use of the ‘ ’ symbol might be explained by the change in the second republication noted at the end of n. 39, where ‘ ’ means ‘+1’. At the very end of Bernays’s ‘Zusatz’ to Hilbert’s Hamburg lecture of 1927 (included in Appendix B to this Volume, above p. 949), we find:
Schließlich, sei noch bemerkt, daß man zur Berücksichtigung des Axioms der vollständigen Induktion, welches für den Zweck des Nachweises der Widerspruchsfreiheit in der Form (εa Aa = b ) → Ab angesetzt werden kann, nur nötig hat, jedesmal wo man ein Beispiel z für das Zutreffen einer Aussage B(a) gefunden hat, zum kleinsten Beispiel überzugehen, indem man in der Reihe der auf numerische Formeln reduzierten Aussagen
B(0), B(0 ), . . . , B(z) die erste richtige aufsucht. (Bernays 1928 , 92.)
As noted in editorial n. 38 to Appendix B, this assertion is incorporated directly into the 1930 republication of the paper resulting from the 1927 Hamburg lectures. 23 In the second republication, but not in the first, the second part of this sentence, i. e., ‘wir verdanken . . . derselben’, has been omitted: see Hilbert 1930c, 4, and then Hilbert 1930e, 317.
5
10
15
20
‘Probleme der Grundlegung der Mathematik’
5
10
15
20
25
30
961
Problem I. – Der Nachweis für die Widerspruchsfreiheit des ε-Axioms für die Funktionsvariable f . Der Ansatz eines Beweises liegt vor. Diesen hat Ackermann auch schon so weit durchgeführt, dass die verbleibende Aufgabe nur noch in dem Beweise eines rein arithmetischen elementaren Endlichkeitssatzes besteht. Mit der Lösung dieses Problems 24 ist schon ein sehr grosser Komplex von grundsätzlichen Fragen behoben. Nämlich 25 dieser Nachweis der Widerspruchsfreiheit liefert: 1) das Tertium non datur für Funktionen von ganzen Zahlen und damit auch für die reellen Zahlen; 2) die Definitionsprozesse, die als imprädikativ angefochten worden sind, die Russell und Whitehead nur mit Hilfe des sehr problematischen Reduzierbarkeits-Axioms 26 begründen, und mit Bezug auf die Weyl früher 27 einmal von einem Circulus vitiosus in der Analysis gesprochen hat; 28 3) das Auswahlprinzip in der schwächeren Form. Zu 3) sei folgendes bemerkt. Es werden in den neueren Betrachtungen über das Auswahlaxiom, wie sie besonders jetzt von den italienischen Mathematikern gepflegt werden, 29 vielfach Unterscheidungen gemacht zwischen schwächeren und schärferen Formen des Auswahlprinzips. Diese betreffen zumeist die Mächtigkeit der Mengen insbesondere den Unterschied des Abzählbaren und Ueberabzählbaren. Durch die Beweistheorie werden wir veranlasst, vor allem eine anderweitige Unterscheidung als wesentlich anzusehen, nämlich, ob verlangt wird, dass die Auswahl des Repräsentanten für eine Menge unabhängig von der Art, wie die Menge definiert ist, eindeutig durch den Elementen-Bestand der Menge bestimmt sein soll, oder ob dies nicht verlangt wird. Beispielsweise sei eine einparametrige Mengenschar M (t) vorgelegt. Für jeden Wert des reellen Parameters t bezeichne M (t) eine bestimmte Menge von reellen Zahlen. Das Auswahlprinzip in der schwächeren Form verlangt dann, dass es eine eindeutige Funktion f (t) gibt von der Art, dass für jeden Wert von t der Wert f (t) zu M (t) gehört. In der stärkeren Form verlangt das Auswahlprizip überdies die Existenz einer solchen Funktion f (t), dass f (t1 ) = f (t2 )
35
ist, falls die Mengen M (t1 ) und M (t2 ) ihrem Elementenbestande nach übereinstimmen. 24 The
republications specify the problem as ‘Problems I’. the republications the two sentences are connected by a semi-colon: ‘. . . behoben; nämlich’. 26 Spelled ‘Reduzierbarkeitsaxioms’ in the republications. 27 The ‘früher’ has been omitted in the republications. 28 The references here are clearly to the system of Whitehead and Russell 1910 , and then to the paper Weyl 1919 . 29 This clause, stressing the work of Italian mathematicians, is omitted in both republications: see Hilbert 1930c, 5; Hilbert 1930e, 318. 25 In
138
962
139
Appendices
Mit Hilfe des ε für die Funktionenvariable f erhalten wir das Auswahlprinzip für Mengen von reellen Zahlen in der schwächeren Form. Durch die Lösung unseres Problems I werden vor allem folgende Theorien beherrscht: 1) Die Theorie der reellen Zahlen. (Dedekindscher Schnitt, obere Grenze einer beschränkten Menge reeller Zahlen.) 2) Die Peanosche Begründung der Zahlenlehre. 30 — In dieser Theorie braucht man kein Auswahlprinzip, wohl aber die imprädikative Definition, z. B. die Definition für a b, d. h. jede Menge die a enthält und mit n zugleich n + 1, enthält auch b. Man hat früher immer nur das Problematische bei den mengentheoretischen Begründungen der Zahlentheorie in der Voraussetzung eines unendlichen Individuenbereichs gesehen. Diese Voraussetzung wird bereits aufgrund des Bisherigen als widerspruchsfrei erkannt. Die grössere Schwierigkeit liegt in dem Nachweis der Widerspruchsfreiheit der imprädikativen Definition. 31 3) Die Cantorsche Theorie der Wohlordnungen der Zahlenreihe. Durch diese wird die Lehre von den Zahlen der zweiten Zahlenklasse, welche sich axiomatisch ganz analog zu der Zahlentheorie aufbauen lässt, auf die Theorie der Funktionen von Zahlenvariabeln 32 zurückgeführt. Problem II. – Für die weitere Ausgestaltung der Analysis, insbesondere für die Punktmengen-Theorie (mengentheoretische Topologie), hat man die Widerspruchsfreiheit für das ε-Axiom, bezogen auf höhere Variablen-Gattungen, zunächst einmal auf die der Funktionen reeller Variablen nötig. Problem III. 33 – Andererseits gebraucht man zum Beweis des Wohlordnungssatzes und auch für manche Beweise in der Theorie der Messbarkeit (Beweise für Nicht-Messbarkeit) die schon erwähnte Verschärfung des ε-Axioms, wie sie durch die Formel (f )[A(f ) B(f )] → (εA = εB) ausgedrückt wird (Axiom der Auswahlgleichheit); εA und εB sind hier Funktionen der Zahlenvariabeln 34 und die Gleichheit bedeutet Uebereinstimmung für alle Argumentwerte. Für die Hinzunahme dieser Formel sind wiederum Beweise der Widerspruchsfreiheit nötig. Problem IV. – Die Vollständigkeit des Axiomensystems für die Zahlentheorie sowie für die Analysis wird zwar allgemein behauptet. Aber die übliche Ueberlegung, mit der man zeigt, dass je zwei Realisierungen des Axiomensy30 In
the second republication, but not in the first, the adjective ‘Peanosche’ has been changed to ‘mengentheoretische’: see Hilbert 1930c, 5, and then Hilbert 1930e, 318. 31 In both republications (see Hilbert 1930c, 5; Hilbert 1930e, 319), the following short paragraph is added: Mit der Lösung des Problems I erhält auch das geniale Verfahren Dedekinds in dessen Abhandlung „Was sind und was sollen die Zahlen?“ die volle Rechtfertigung.
The reference is to Dedekind 1888 . 32 Replaced in republications by ‘Zahlenvariablen’. 33 In both republications, this Problem is incorporated as it stands into Problem II (Hilbert 1930c, 6; Hilbert 1930e, 319–320), making four problems in all, not five. 34 Replaced in republications by ‘Zahlenvariablen’.
5
10
15
20
25
30
35
‘Probleme der Grundlegung der Mathematik’
5
10
15
20
25
30
963
stems der Zahlentheorie, bzw. der Analysis isomorph sein müssen, genügt nicht den Anforderungen finiter Strenge. Es kommt darauf an, zunächst für die Zahlentheorie, den üblichen Beweis der Isomorphie finit umzugestalten, sodass dadurch folgendes gezeigt wird. Wenn für einen Satz S 35 die Widerspruchsfreiheit mit den Axiomen der Zahlentheorie nachgewiesen werden kann, so kann nicht auch für S (das Gegenteil von S) die Widerspruchsfreiheit mit jenen Axiomen nachgewiesen werden, und damit in engstem Zusammenhange: Wenn eine Aussage widerspruchsfrei ist, so ist sie auch beweisbar. Die Aufgabe ist zunächst hier nur für den Bereich der ganzen Zahlen gestellt worden; sie ist dann sicher keine philosophische, sondern eine rein mathematische und kann nur durch rein mathematische Mittel gelöst werden. 36 Gegen meine Beweistheorie sind Einwände erhoben worden; diese beruhen wesentlich auf einer Verkennung meiner Beweistheorie. Ich gestatte mir daher, zu dieser noch einige Erläuterungen zu machen. Wenn eine Aussage oder ein Beweis vorliegt, so muss er sich in allen Teilen überblicken lassen. Die Aufweisung, das Wiedererkennen, die Unterscheidung und Aufeinanderfolge seiner einzelnen Teile ist unmittelbar anschaulich für uns da. Ohne diese Einstellung ist überhaupt ein Denken oder gar eine wissenschaftliche Tätigkeit unmöglich. Wenn ich also von einer Formel, diese als Axiom genommen, konstatieren will, ob sie zu einem Widerspruch führt, so handelt es sich darum, ob mir ein Beweis vorgelegt werden kann, der zu einem Widerspruch führt. Wenn mir ein solcher Beweis nicht vorgelegt werden kann: umso besser — da mir dann ein Eingehen erspart bleibt. Wenn mir der Beweis vorliegt, so darf ich gewisse einzelne Teile herausgreifen und für sich behandeln, insbesondere in ihnen auftretende Zahlzeichen, welche aufgebaut und hergestellt vorliegen, wieder abbauen. Damit wird der Schluss von n auf n + 1 keineswegs schon benutzt — vielmehr ist es, wie wir schon von Dedekind her wissen und wie es meine Beweistheorie von neuem bestätigt, noch ein weiter Weg, um die Gültigkeit des Schlusses von n auf n + 1 einzusehen. 37 Auf der Grundlage, die ich eben diskutiert habe, muss jedesmal der Beweis für die Widerspruchsfreiheit geführt werden. Gelingt es, diesen Beweis zu führen, so bedeutet dies für die Theorie, dass, wenn eine numerische oder finit deutungsfähige Aussage aus ihr abgeleitet wird, diese tatsächlich jedesmal
35 The symbol used in the text is a cross between a Fraktur ‘S’ and a script ‘S’. We have rendered it here with the normal Fraktur ‘S’. This is the symbol used in both republications, e. g., Hilbert 1930c, p. 6. 36 In the first republication (i. e., Hilbert 1930c, 6), this paragraph is replaced by:
In höheren Gebieten wäre der Fall der Widerspruchsfreiheit von S sowie der von S denkbar: alsdann ist die Annahme einer der beiden Aussagen S, S als Axiom durch systematische Vorzüge (Prinzip der Permanenz von Gesetzen, weitere Aufbaumöglichkeiten u. s. w.) zu rechtfertigen.
In the second republication, both versions of the paragraph are omitted: see Hilbert 1930e, 320. 37 While the last two sentences are more or less the same in the first republication (see
140
964
Appendices
richtig ist. Der Beweis für die Widerspruchsfreiheit lehrt zugleich in jedem Falle eines zu einem falschen Resultat führenden Beweises, die Stelle zu finden, wo der Fehler liegt. Es liegt auf der Hand, dass auch rein logische Probleme sich durch die Methode der Beweistheorie behandeln lassen. Als Beispiel diene folgendes Problem. Problem V. – Die Behauptung der Vollständigkeit des Axiomensystems der Zahlentheorie lässt sich auch so aussprechen: Wird eine dem Bereich der Zahlentheorie angehörige 38 aber nicht beweisbare Formel zu den Axiomen der Zahlentheorie hinzugenommen, so kann aus dem erweiterten Axiomensystem ein Widerspruch abgeleitet werden. Da wir es hier in der Beweistheorie stets mit formalisierten Beweisen zu tun haben, so ist in der ausgesprochenen Behauptung über die Vollständigkeit der Zahlentheorie zugleich die Behauptung eingeschlossen, dass die formalisierten Regeln des logischen Schliessens jedenfalls im Gebiete der Zahlentheorie ausreichend sind. Die Frage nach der Vollständigkeit des Systems der logischen Regeln, in allgemeiner Form gestellt, bildet ein Problem der theoretischen Logik. 39 Bisher haben wir nur durch Probieren die Ueberzeugung gewonnen, dass diese Regeln ausreichen. Hilbert 1930c, 7), in the second they have been replaced by the following: Wenn mir aber der Beweis vorliegt, so darf ich gewisse einzelne Teile herausgreifen und für sich ins Auge fassen, also auch die besonderen Zahlzeichen, welche in ihnen vorkommen und also hergestellt und aufgebaut vorliegen, wieder abbauen. Dadurch wird aber die eigentliche Schlußweise der vollständigen Induktion gar nicht betroffen; vielmehr besteht das Wesentliche des Induktionsschlusses — wie wir schon von Dedekind her wissen und wie es meine Beweistheorie von neuem bestätigt — darin, daß er nicht bloß auf die einzelnen finit deutungsfähigen Fälle anwendbar ist, sondern vor allem dann eingreift, wenn die Rekursion sich auf Ausdrücke mit beliebig gebundenen Variablen (mit „alle“ und „es gibt“) bezieht: dann offenbart sich der Induktionssatz als die wahre Quelle des Begriffes der mathematischen Variablen, zu dem man allein durch finite Methoden keinen Zugang hat. (Hilbert 1930e, 320–321.) 38 A 39 In
comma has been added before ‘aber’ in the republications. both republications, Hilbert adds here:
Zu dieser allgemeineren Problemstellung gelangen wir von der Zahlentheorie aus, wenn wir aus dem Bereich der betrachteten Formeln, und insbesondere auch der Axiome, alle diejenigen ausschalten, in denen das Zeichen „+1“ vorkommt, dafür aber das Auftreten von Prädikaten-Variablen zulassen. Dies bedeutet sachlich, daß wir von dem Ordnungscharakter des Systems der Zahlen absehen und dieses nur als irgendein System von Dingen behandeln, auf welches Prädikate mit einem oder mehreren Subjekten bezogen werden können. Unter diesen Prädikaten wird nur die Gleichheit (Identität) als bestimmte Beziehung durch die üblichen Gleichheitsaxiome a=a a = b → (A(a) → A(b)) festgelegt, während die übrigen Prädikate frei wählbar bleiben. In diesem Bereiche von Formeln sind diejenigen ausgezeichnet, die durch keine bestimmte Festlegung der wählbaren Prädikate widerlegbar sind. Diese stellen die allgemein gültigen logischen Sätze dar. Es entsteht nun die Frage, ob alle diese Formeln aus den Regeln des logischen Schliessens unter Hinzunahme der genannten Gleichheitsaxiome beweisbar sind, mit anderen Worten, ob das System der üblichen logischen Regeln vollständig ist. (Hilbert 1930c, 8; Hilbert 1930e, 322.)
In the second republication, the ‘+1’ here becomes ‘ ’, which probably explains the use of ‘ ’ in the addition noted above in editorial n. 22 to this paper.
5
10
15
20
‘Probleme der Grundlegung der Mathematik’
5
10
15
20
25
30
965
Ein wirklicher Nachweis dafür ist vorhanden im Bereich der reinen Aussagen-Logik. Im Bereich der Logik der Prädikate mit einem Subjekt kann aus der Methode der Lösung des Entscheidungsproblems 40 ebenfalls ein Nachweis für die Vollständigkeit der Regeln gewonnen werden, wie sie in Anknüpfung an die Ansätze 41 von Schröder zuerst von Löwenheim und später in abschliessender Form von Behmann zur Anwendung gebracht worden ist. 42 Mein heutiger Vortrag zeigt, wie viele Probleme noch der Lösung harren. Aber im allgemeinen prinzipiellen Sinne ist auch nicht mehr die leiseste Spur einer Unklarheit möglich: jede prinzipielle Frage lässt sich aufgrund meiner Beweistheorie in einer Weise beantworten, die mathematisch präzise und eindeutig ist. Die betreffenden Sätze lassen sich zum Teil schon jetzt mit Hilfe der bisherigen Ergebnisse auf absolut sichere und rein mathematische Weise beweisen und sind daher, wie ich glaube, dem Streite entzogen worden. Wer mich widerlegen will, muss, wie es in der Mathematik bisher stets üblich war und bleiben wird, mir genau die Stelle zeigen, wo der vermeintliche Fehler von mir liegt. Eine Einwendung, die das nicht tut, lehne ich a limine ab. Ich glaube, dass meine Beweistheorie uns auch noch einen allgemeinen Dienst leistet. Denn wie wäre es mit der Wahrheit unseres Wissens überhaupt und wie mit der Existenz und dem Fortschritt der Wissenschaft bestellt, wenn es nicht einmal in der Mathematik sichere Wahrheit gäbe? Tatsächlich kommt heutzutage gar nicht selten selbst in Fachschriften und öffentlichen Vorträgen Zweifelsucht und Kleinmut gegenüber der Wissenschaft zum Ausdruck; es ist das eine gewisse Art Okkultismus, den ich für schädlich halte. Die Beweistheorie beseitigt diese Einstellung und verschafft uns das Hochgefühl der Ueberzeugung, dass wenigstens dem mathematischen Verstande keine Schranken gezogen sind und dass er sogar die Gesetze des eigenen Denkens selbst aufzuspüren vermag. Cantor hat gesagt: das Wesen der Mathematik besteht in ihrer Freiheit 43 , und ich möchte für die Zweifelsüchtigen und Kleinmütigen hinzufügen: in der Mathematik gibt es kein Ignorabimus: wir können jede sinnvolle Frage durch dauerndes Nachdenken lösen. Es erfüllt sich, was vielleicht schon Aristoteles vorausfühlte, dass unser Verstand keinerlei geheimnisvolle Künste betreibt, sondern nach bestimmten aufstellbaren Regeln verfährt — worin zugleich die beste Gewähr der absoluten Objektivität liegt. 44 40 In both republications, Hilbert adds here in parentheses ‘Schrödersches Eliminationsproblem’: Hilbert 1930c, 8; Hilbert 1930e, 322. 41 The original has ‘Ausätze’ here, but the reprintings correct this to ‘Ansätze’. 42 More precise references to Löwenheim and Behmann are given in Hilbert and Ackermann 1928 , 77. These are to: Löwenheim 1915 and Behmann 1922 . The reference to Schröder (and ‘elimination’) is possibly to Schröder 1895 , Lecture 11. 43 See Cantor 1883a, 563, p. 182 of the reprinting in Cantor 1932 , and p. 896 of the English translation of the republication in Cantor 1883b. Cantor states that what had become known as ‘pure’ mathematics deserves to be called ‘free’ mathematics, the term which he would bestow if he had the choice. 44 The editor of the third republication has added a new sentence here, not singled out from Hilbert’s text by any editorial marking, which says:
Hilbert hatte einen stürmischen Beifall, am Beginn wie nach Ende des Vortrags (Hilbert 1971b, 19).
141
966
Appendices
Textual Notes 957.14: 958.1: 958.4: 958.4: 958.5: 958.6: 958.17: 958.23: 958.23: 959.36: 960.5: 960.10: 960.13: 960.14: 960.22: 960.23: 961.22: 961.28: 961.31: 962.5: 962.13: 962.21: 962.23: 962.30: 963.8: 963.26: 964.1: 964.7: 964.9: 965.1: 965.5: 965.6: 965.21: 965.23: 965.30:
Fortschritte] Forschritte erwächst] erwächts mathematischen] mathematische »] « «] » untrügliche] unträgliche Zermelos] Zermelos dieses] dieser mathematischer] matematischer zu nehmen] zunehmen ganzen] ganze rein mathematischem] rein mathematischen zahlentheoretischer] zahlentheoretischen arithmetische] aritmetische Russell] Russell Bisher] Bischer allem] allen reellen] reellem Funktion] Funhtion Dedekindscher] Dedekindsche aufgrund] auf grund mengentheoretische] mengentheorische Variablen] Variabler Uebereinstimmung] Uebereinstimnung engstem] engsten ihnen auftretende] ihren auftretenden Widerspruchsfreiheit] Widerspruchsfreheit Vollständigkeit] Vollständtgkeit Zahlentheorie] Zahltheorie Nachweis] Nachweiss Ansätze] Ausätze abschliessender] abschliessen der gar nicht] garnicht Okkultismus] Okultismus dauerndes] dauern des
Appendix D: Hilbert’s Third Hamburg Lecture (1930)
967
Appendix D: Hilbert’s Third Hamburg Lecture (1930)
Introduction
This Appendix reprints Hilbert’s paper ‘Die Grundlegung der elementaren Zahlenlehre’ (Hilbert 1931a). As Hilbert’s footnote to the title makes clear, this is the published version of a lecture given to the Philosophische Gesellschaft in Hamburg in December 1930, and was marked by the Mathematische Annalen as received on 21 December 1930. An extract from the paper was republished in Volume 3 of Hilbert’s Gesammelte Abhandlungen (Hilbert 1935 , 192–195) presenting only the central section containing what Hilbert calls the ‘Grundgedanke meiner Beweistheorie’, an extract which includes what is new in this paper. The limits of the extract are marked in editorial footnotes to the text below. There are other, small textual deviations in the reprint, and some additional notes, all of which are also noted in footnotes. The paper begins by setting out some (by this time) familiar general features of Hilbert’s approach to the foundations of mathematics. But it is remarkable above all for the appearance in it, as part of a limited argument for the completeness of the system of number theory presented, of an ‘infinitary rule’, called the ‘HR-rule’ above, p. 791.1 The completeness property Hilbert discusses was stated in the Bologna paper of 1928 under Problem IV (see Hilbert 1929 , 139, p. 962 above), where Hilbert suggests achieving a proof of completeness by ‘a finitist recasting’ of the categoricity argument for the axioms of number theory. The property comes in two parts, stated by Hilbert in the present paper (and also quoted above, p. 791) as follows: 1. If a statement can be shown to be consistent, then it is also provable; and furthermore, 1 For
the relationship between HR and the so-called ω-rule, see Feferman 1986 .
968
Appendices
2. If for some statement S the consistency with the axioms of number theory can be established, then it is impossible also to prove the consistency with those axioms of S. (Hilbert 1931a, 491, below p. 980.)
Showing this for certain ‘simple cases’, says Hilbert, can be achieved if we add to the rules of inference (modus ponens and substitution) a ‘new, likewise finitary, inference rule’, which Hilbert states as follows: In a case where it can be demonstrated that A(z) is always a correct numerical formula, whatever concrete number sign [Ziffer ] z is taken, then we can take (x)A(x) as a premise [Anfangsformel ] (loc. cit.).
Hilbert recognises the power of the rule, for he says (p. 491): ‘It should be remembered that the statement (x)A(x) extends much further than the formula A(z), . . . ’ (loc. cit.). Hilbert’s paper presents two distinct nexuses of problems, firstly, problems concerning the historical context, and secondly, problems concerning the results Hilbert is able to show. Both have been addressed above (see pp. 791– 798). Some more remarks on the second group of problems will be added here. What Hilbert proves can be summarised as follows, making use of Bernays’s notation in his correspondence with Gödel (of which more below). Let Z denote the system of number theory which Hilbert assumes as a basis, and Z∗ that system augmented by Hilbert’s new rule. Hilbert takes it as given that the work of Ackermann and von Neumann shows that Z is consistent; he then claims that a simple extension of the reasoning will show that Z∗ , too, is consistent. Given this, Hilbert argues that it can be shown that the completeness conditions set out above follow for Z∗ in certain limited cases. Assume that (x)A(x) can be consistently added to Z∗ , where A(x) contains no variables other than x (i. e., in particular is quantifier free). Hilbert argues that this means that A(z) is certainly correct for any given numeral z, for if not, A(z) would be correct, and therefore provable (presumably in Z, and therefore in Z∗ ), and hence so would (∃x)A(x) be, contrary to the assumption of the consistency of (x)A(x) with Z∗ . But if all the A(z) are correct, then, according to the new rule, (x)A(x) is an axiom, and thus provable. This establishes Hilbert’s first completeness condition for (x)A(x) where A is of the prescribed kind. Hilbert proves the second completeness condition for these universal formulas; if (x)A(x) can be consistently added to Z∗ , it can be proved in Z∗ , which means clearly that (x)A(x) (i. e., (∃x)A(x)) cannot be consistent with Z∗ . Hilbert then goes on to establish the second condition also for formulas of the form (∃x)A(x) (with the same conditions on A), pointing out that from the consistency of (∃x)A(x), it cannot be concluded that it is at the same time provable.
Introduction
969
So much for Hilbert’s results. There are two obvious questions which now arise, concerning, first, the relationship between what Hilbert shows and Gödel’s results, and, second, concerning the formulation of Hilbert’s rule itself. There are also, of course, questions surrounding Hilbert’s assumption that Ackermann and von Neumann had demonstrated the consistency of the system Z, but this has been addressed above (see pp. 797f.). Some light is thrown on all these matters in letters exchanged between Bernays and Gödel. In early 1931, Bernays and Gödel began an extensive correspondence which lasted on and off for close to forty-five years. (See Gödel 2003a.2 ) Bernays’s second letter, dated 18 January 1931, and which thanks Gödel for sending galleys of his paper on the incompleteness of arithmetic, discusses Hilbert’s extension of number theory by HR in the light of what is shown by Gödel in that paper. Indeed, Bernays writes: Your results have a particular relevance for me which goes beyond their general significance, in that they shed light on an extension of number theory which has recently been undertaken by Hilbert. (Bernays to Gödel, 18 January 1931, Gödel 2003a, 82.)3
Bernays restates Hilbert’s rule (without actually remarking that it is a restatement) by putting the restriction on the formula A(x1 , . . . , xn ) that it be recursive, and that it ‘give rise to’ a numerical identity when instantiated with numerals.4 He then points out that Gödel’s construction gives an example of a recursive formula R(x) such that each R(n) is certainly provable in Z, and thus in Z∗ , whereas (x)R(x) is not provable in Z, although it is provable in Z∗ by Hilbert’s rule. From the assumed consistency of Z∗ , it follows that (∃x)R(x) is not also provable in Z∗ , thus not in Z either, and so this latter is deductively incomplete (‘deduktiv unabgeschlossen’) (see Gödel 2003a, 84–86). Bernays concludes, rightly, that Z∗ furnishes more provable formulas than Z, but then adds . . . i. e., there are elementary sentences (which concern the general validity of recursive relations between numbers) which can be justified in the finitary sense, but which are not formally provable in Z. (Bernays to Gödel, 18 January 1931, Gödel 2003a, 86.)5 2 For a detailed review of the whole correspondence between Bernays and Gödel, see Feferman 2003 . 3 The translations from the Bernays-Gödel correspondence used both here and below are ours, and do not necessarily coincide with those found in Gödel 2003a. In the original German, the passage reads:
Ihre Ergebnisse haben für mich eine über ihre allgemeine Bedeutsamkeit hinausgehende besondere Aktualität dadurch, dass sie ein Licht werfen auf eine kürzlich von Hilbert vorgenommene Erweiterung des üblichen Rahmens der Zahlentheorie. 4 It is clear that by ‘recursive’ here and in what follows Bernays means what would now be called primitive recursive. The more inclusive notion was not introduced until 1934 in Gödel’s Princeton notes, Gödel 1934* , §9. 5 In the original German, the passage reads:
. . . d. h. es gibt elementare Sätze (betreffend die Allgemeingültigkeit rekursiver Zahlbeziehungen), die sich im finiten Sinne begründen lassen, aber nicht formal in Z beweisbar sind.
970
Appendices
Presumably he adds this latter claim because of his and Hilbert’s belief in the finitarily demonstrable consistency of Z∗ . Bernays’s argument now continues as follows. Gödel makes it clear in his paper that his results apply not just to what he calls P (roughly, Peano arithmetic), but to any formal system S which is recursively axiomatisable and in which every recursive predicate is representable. Bernays now says this: suppose we had such a system which ‘can be shown to be consistent using finitary means’, then there would be statements which are not formally provable in S, but which are nevertheless finitarily provable. Bernays then goes on: . . . certainly then not all considerations of a finitary character can be formalised in S. (Gödel 2003a, 86.)6
If now, Bernays goes on, von Neumann is right to assume that all finitary reasoning can indeed be formalised in Gödel’s system P , then it follows, says Bernays, that no finitary demonstration of the consistency of P is possible. In all this, Bernays sees an argument for Hilbert’s system Z∗ , since he argues that the above reasoning forces one to the view that Gödel’s condition on axiom systems of recursive axiomatisability should be dropped. Thus: The system Z∗ is an example of a system which does not satisfy the assumption ‘1.’ [of recursive axiomatisability], but which can be shown to be consistent in a finitary way. The extension of the system Z to the system Z∗ thus shows itself to be successful, in that (as I have determined) every formula of the functioncalculus for which it can be shown (by metamathematically finitary means) that it cannot be derived in the function-calculus is formally refutable in Z∗ . (Loc. cit.)7
Bernays ends these considerations by suggesting a more satisfactory replacement for Z∗ , namely a system Z∗∗ which would bring the new rule more into line with the induction schema, by lifting the restriction of recursiveness on A(x1 , . . . , xn ), and assuming, not that A(k1 , . . . , kn ) is ‘correct’ when numerical values k1 , . . . , kn are substituted for the variables, but that it can be derived. Gödel’s reply (composed on 2 April 1931), now brings out two of the problems. First, Gödel points out that the systems Z∗ and Z∗∗ are still vulnerable to the generality of his incompleteness result. It is possible, says Gödel, to extend the recursively axiomatisable system Z to a new system S by adding 6 In
the original German, the passage reads:
. . . es können also dann auch gewiss nicht alle finiten Überlegungen in S formalisiert werden. 7 In
the original German, the passage reads:
Das System Z∗ bildet ein Beispiel eines Systems, welches nicht der Voraussetzung „1.“ [recursive axiomatisability] genügt, das aber doch auf finitem Wege als widerspruchsfrei erwiesen kann. Die Erweiterung des Systems Z zum System Z∗ zeigt sich auch dadurch als erfolgreich, dass — (wie ich mir überlegt habe) — jede Formel des Funktionenkalkuls von der sich (metamathematisch finit) nachweisen lässt, dass sie im Funktionenkalkul nicht ableitbar ist, innerhalb Z∗ formal widerlegbar ist.
Introduction
971
a type for sets of numbers. Gödel then sketches a method for defining formally within the new system the informal notion ‘x is the Gödel number of a formula (of the language of Z) which is provable in Z∗ ’. He calls the formal predicate corresponding to this ‘B(x)’. Gödel then shows how to append to S a truth-definition W (x) for formulas of the language of Z, for which it can be shown (crucially) that (x)[B(x) → W (x)] is provable in S. The construction mimicking the Liar Paradox then gives a sentence which is clearly undecidable in Z∗ . (Gödel points out that an analogous procedure will show the incompleteness of Z∗∗ .)8 From these remarks of Gödel’s, it becomes clear that abandoning the condition of recursive axiomatisability, as Bernays had suggested in his January letter, does not help in dealing with incompleteness. The incompleteness of systems extending number theory by adjunction of new rules of Hilbert’s type was confirmed in a paper published by Rosser in 1937.9 Rosser considers what he calls ‘Carnap’s rule’ (going back to Carnap 1935 , 173), which he formulates without apparent restriction on the formula A involved, and which uses the notion of provability, not correctness. In a footnote (n. 3, p. 129), Rosser says that ‘the same rule’ appeared in Hilbert’s paper, but Rosser’s version of ‘Carnap’s Rule’ actually seems much closer to Bernays’s suggestion for his system Z∗∗ (see above) than it is to Hilbert’s restricted rule. (Rosser also states in the note that ‘. . . Hilbert did practically nothing with [the rule]’, which seems somewhat misleading.) Note that Rosser also establishes his results for natural iterations of ‘Carnap’s rule’ up through the countable ordinals, indicating in effect how far from completeness Hilbert’s system Z∗ is. In his letter to Bernays from April 1931, Gödel also expressed conceptual doubts about the extensions of Z which Hilbert and Bernays contemplated. As Gödel says: Incidentally, I believe (apart from their not being deductively closed) that one cannot rest content with the systems Z∗ , Z∗∗ as giving a satisfactory foundation for number theory. And this above all for the reason that they make use of the very complicated and problematic concept of ‘finitary proof’ without relying (in the specification of the axiom rules) on any mathematically precise sharpening of this. (Letter to Bernays, 4 April 1931, Gödel 2003a, 96.)10
Indeed, it seems the rule cannot be a straightforward rule of inference within the system, since it makes use, not just of the unclear notions which Gödel points to, but also, by invoking the notion of correctness, of a specific way of interpreting the axiom system. 8 For
all this, see Gödel’s letter to Bernays of 2 April 1931, 1–5, Gödel 2003a, 92–94. Rosser 1937 . 10 In the original German, the passage reads: 9 See
Übrigens glaube ich, daß man sich (auch abgesehen von ihrer deduktiven Unabgeschlossenheit) bei den Systemen Z∗ , Z∗∗ als einer befriedigenden Begründung der Zahlentheorie nicht beruhigen kann, u[nd] z[war] vor allem deswegen, weil in ihnen der sehr komplizierte und problematische Begriff „finiter Beweis“ ohne nähere mathem[atischen] Präzisierung vorausgesetzt wird (bei Angabe der Axiomenregel).
972
Appendices
In the light of this, it is worth quoting Bernays’s summary remarks from his Bernays 1935 : The method, by which here Hilbert so-to-speak forces the positive solution of the completeness problem (in the special case considered by him) represents a departure from the preceding programme of Beweistheorie. In fact, by the introduction of the additional rule of proof, the demand for clear and sharp formalisation of the means of inference is allowed to fall away. One does not have to regard this step as final. Certainly, given the difficulties which have emerged surrounding the consistency problem, one must have a firm eye on the possibility of an extension of the methodological framework for metamathematical considerations used hitherto. (Bernays 1935 , 216.)11
One last remark. Towards the end of the paper (and not in the section reprinted in 1935) there appears an interesting passage. On pp. 492–493 (see p. 981ff.), in points numbered 1–4, Hilbert discusses various objections which had been raised against his Beweistheorie; for example, point 2 touches again on the question of incompleteness. Point 5 is then more of a general description of his approach which stresses that one of the central aims of his theory is to give a general ‘protocol’ of the ‘rules according to which our thinking actually proceeds’. Immediately following this, Hilbert cites a statement about negation from ‘a recent philosophical lecture’, namely ‘Das Nichts ist die schlechthinnige Verneinung der Allheit des Seienden’. This, says Hilbert, is instructive because it illustrates in a short compass all the main ‘violations [Verstöße]’ of the fundamental principles of his Beweistheorie. He points out two central problems. The first being that a concept like ‘Allheit des Seienden’ contains ‘a contradiction in itself’, presumably because it flirts with the wellknown antinomies. The second is that negation is ‘a formal process’ which leads from a sentence S, in accordance with the axioms of negation, to another sentence, one which will, in general, correspond to an ideal statement. To assume that one can define something as apparently substantial (‘real’) through negation is, therefore, according to Hilbert, a mistake: . . . it would be to misunderstand the nature and the essence of thinking if one wished to take this ideal statement as itself standing for something real (p. 494).12
In these remarks, Hilbert is almost certainly referring to Heidegger’s Was ist Metaphysik? (Heidegger 1929 ), although he does not mention Heidegger or the work by name. However, if this is right, Hilbert does not quote Heidegger 11 In
the original German, the passage reads:
Das Verfahren, durch welches hier Hilbert die positive Lösung des Vollständigkeitsproblems (für den von ihm betrachteten Spezialfall) sozusagen erzwingt, bedeutet ein Abgehen von dem vorherigen Programm der Beweistheorie. In der Tat wird ja durch die Einführung der zusätzlichen Schlußregel die Forderung einer restlosen Formalisierung der Schlüsse fallen gelassen. Man braucht diesen Schritt nicht als endgültig zu betrachten. Wohl aber wird man angesichts der Schwierigkeiten, die sich bei dem Problem der Widerspruchsfreiheit gezeigt haben, die Möglichkeit einer Erweiterung des bisherigen methodischen Rahmens der metamathematischen Überlegungen ins Auge fassen. 12 See
p. 982, below.
Introduction
973
correctly. The book contains two formulations which are close to what Hilbert says: Denn das Nichts ist die Verneinung der Allheit des Seienden, das schlechthin Nicht-Seiende (p. 5).
and Das Nichts ist die vollständige Verneinung der Allheit des Seienden (p. 6).
What Hilbert writes seems to be an amalgamation of the two. Heidegger calls the latter a ‘definition’ of ‘das Nichts’, and so this is more likely to be the formulation Hilbert attempts to cite. This criticism of Heidegger appears before the paper of Carnap (Carnap 1931 ) in which he criticises the notion of ‘das Nichts’ put forward by Heidegger in the lecture cited. Carnap was clearly unaware of Hilbert’s paper when preparing his own, but he added a postscript (p. 241) to the publication in which he mentions his pleasure at seeing two other sources which declare themselves against the ‘modern Nothing-philosophy’; one of these is the Hilbert paper at issue here, and Carnap quotes some of Hilbert’s objections. He also observes that Hilbert makes his remarks ‘without mentioning Heidegger’s name’. Michael Hallett
974
Appendices
Die Grundlegung der elementaren Zahlenlehre1)
485
486
Wenn wir die beiden Quellen unserer Erkenntnis, die Erfahrung und das reine Denken, im mathematischen Bereiche untersuchen, so treffen wir eine Reihe von Gesichtspunkten an, die vielleicht auch von philosophischem Interesse sind. Und zwar weisen diese Gesichtspunkte sämtlich auf Gemeinsames dieser beiden an sich so verschieden gearteten Erkenntnisquellen hin. Z. B. beobachten wir die Einheit des Stoffes in der Materie; andererseits tritt doch gewiß in unserem Denken die Einheit der Grundlagen als eine Forderung auf, die wir zu erfüllen suchen und vielmals auch erreichen. Die Einheit der Naturgesetze, die wir oft in so überraschender Weise antreffen, kann als Beispiel für beide Erkenntnisquellen gelten. Aber noch auffallender als dieser Gesichtspunkt der Einheit ist eine Erscheinung, die wir die prästabilierte Harmonie nennen und die einen Zusammenhang zwischen Natur und Denken deutlich bezeugt. Das großartigste und wunderbarste Beispiel für die prästabilierte Harmonie ist die berühmte Einsteinsche Relativitätstheorie. Hier werden allein durch die allgemeine Forderung der Invarianz die recht komplizierten Differentialgleichungen für die Gravitationspotentiale eindeutig aufgestellt; und diese Aufstellung wäre unmöglich gewesen ohne die tiefgehenden und schwierigen mathematischen Untersuchungen von Riemann, die lange vorher da waren. Es ist sogar ein in der mathematischen Analysis vereinzelter Fall, daß ein so kompliziertes spezielles Formelsystem mit numerischen Koeffizienten aus einem allgemeinen Gedanken entspringt. Auch meine nachher hier zu erörternde Beweistheorie ist ein Beispiel für die prästabilierte Harmonie. Denn sie bedient sich des sogenannten Logikkalküls, der seinerseits vorher und zu ganz anderen Zwecken, nämlich lediglich zur Abkürzung und Mitteilung von Aussagen, ersonnen war. Indes die aufmerksame Betrachtung führt uns dazu, daß außer Erfahrung und Denken noch eine dritte Erkenntnisquelle da ist. Wenn wir | auch im einzelnen Kant heute nicht mehr zustimmen können, so behält doch der allgemeinste Grundgedanke der Kantschen Erkenntnistheorie seine Bedeutung: jene anschauliche Einstellung a priori festzustellen und damit die Bedingung der Möglichkeit jeder Erkenntnis zu untersuchen. Ich meine, daß dies im wesentlichen in meinen Untersuchungen über die Prinzipien der Mathematik geschehen ist. Das Apriori ist dabei nichts mehr und nichts weniger als eine 1)
Vortrag, gehalten im Dezember 1930 auf Einladung der Philosophischen Gesellschaft in Hamburg.
5
10
15
20
25
30
‘Die Grundlegung der elementaren Zahlenlehre’
5
10
15
20
25
30
35
40
45
975
Grundeinstellung, die ich auch als die finite Einstellung bezeichnen möchte: es ist uns eben schon im voraus etwas in der Vorstellung gegeben: gewisse, außer-logische konkrete Objekte, die anschaulich als unmittelbares Erlebnis vor allem Denken da sind. Soll das logische Schliessen sicher sein, so müssen sich diese Objekte vollkommen in allen Teilen überblicken lassen und ihre Aufweisung, ihre Unterscheidung, ihr Aufeinanderfolgen oder Nebeneinandergereihtsein ist mit den Objekten zugleich unmittelbar anschaulich gegeben als etwas, das sich nicht noch auf etwas anderes reduzieren läßt oder einer Reduktion bedarf. Dies ist die Grundeinstellung, die ich für die Mathematik wie überhaupt zu allem wissenschaftlichen Denken, Verstehen und Mitteilen für erforderlich halte, und ohne die eine geistige Betätigung gar nicht möglich ist. Damit glaube ich die dritte Erkenntnisquelle, die zu Erfahrung und Logik noch hinzutritt, erkannt und charakterisiert zu haben. Die Einsichten a priori sind diejenigen anschaulichen sowie die logischen Einsichten, die im Rahmen jener finiten Einstellung gewonnen werden. Wir werden dabei im besonderen gewahr: Es gibt Sätze, die Kant als a priori angesehen hat, und die wir der Erfahrung zuweisen. Z. B. die gesamten Grundtatsachen der Geometrie, sowie die elementaren Eigenschaften von Raum und Materie. Aber es gibt andererseits auch Sätze, die wohl meist für a priori gehalten worden sind, die aber nicht im Rahmen der finiten Einstellung gewonnen werden können, z. B. das Prinzip des Tertium non datur sowie überhaupt die sogenannten transfiniten Aussagen. Die nächstliegende Anwendung und das erste Auftreten der transfiniten Aussagen findet in der Zahlenlehre statt, und damit kommen wir zu dem hauptsächlichen Gegenstande des heutigen Vortrages. Es ist schon an sich merkwürdig und philosophisch bedeutsam, daß die ersten und einfachsten Fragen über die Zahlen 1, 2, 3, . . . so tiefliegende Schwierigkeiten bieten. Diese Schwierigkeiten müssen überwunden werden; denn wie sollte sonst überhaupt Wissen möglich sein, wenn nicht einmal die Zahlenlehre sich begründen ließe und wenn da nicht volle Einigkeit und absolute Richtigkeit erzwungen werden könnte! Es wäre viel zu weitschweifig und auch überflüssig, alle die mannigfaltigen und verschiedenen Irrwege anzuführen, die als solche heute erkannt | worden sind: Man hat versucht, die Zahlen rein logisch zu definieren; andere nahmen die übliche Schlußweise der Zahlentheorie einfach als selbstverständlich an. Auf beiden Wegen gelangte man zu Einwendungen, die nicht widerlegt werden konnten. Ein Weg war noch nicht betreten worden, der dem Mathematiker gerade am nächsten lag. Bevor ich diesen Weg beschreibe, der tatsächlich ans Ziel führt, möchte ich einige Bemerkungen machen über die wichtigsten Daten aus der Vorgeschichte des Problems. Im Jahre 1888 machte ich als junger Privatdozent von Königsberg aus eine Rundreise an die deutschen Universitäten. Auf meiner ersten Station, in Berlin, hörte ich in allen mathematischen Kreisen bei jung und alt von der damals eben erschienenen Arbeit Dedekinds „Was sind und was sollen die Zahlen?“ sprechen — meist in gegnerischem Sinne. Die Abhandlung ist neben
487
976
488
Appendices
der Untersuchung von Frege der wichtigste erste tiefgreifende Versuch einer Begründung der elementaren Zahlenlehre. Etwa zu gleicher Zeit, also schon vor mehr als einem Menschenalter, hat Kronecker eine Auffassung klar ausgesprochen und durch zahlreiche Beispiele erläutert, die heute im wesentlichen mit unserer finiten Einstellung zusammenfällt. Damals haben wir jungen Mathematiker, Privatdozenten und Studierende, den Sport getrieben, auf transfinitem Wege geführte Beweise mathematischer Sätze nach Kroneckers Muster ins Finite zu übertragen. Kronecker machte nur den Fehler, die transfinite Schlußweise für unzulässig zu erklären. Er erließ Verbote gegen die transfinite Schlußweise, insbesondere sollte man nach ihm nicht schließen dürfen, daß, wenn eine Aussage A(n) nicht für jede ganze Zahl n zutrifft, es eine ganze Zahl n geben müsse, für die jene Aussage falsch ist. Damals lehnte die ganze Mathematik einmütig seine Verbote ab und ging über sie zur Tagesordnung über. Wie verhält es sich nun tatsächlich mit dem Gebrauch der transfiniten Schlußweisen? Die Zahlkörpertheorie z. B. ist ein feingegliedertes, himmelhoch errichtetes Gebäude, verbunden mit den weitest entwickelten Theorien der Analysis, das alle anderen Geistesprodukte der Menschheit an Schönheit und Vollkommenheit weit überragt, und in ihr wird auf Schritt und Tritt das Tertium non datur und überhaupt die transfinite Schlußweise der von Kronecker verbotenen Art angewandt. Alle die Geistesheroen vor Gauß und ebenso die nach Gauß, Hermite, Jacobi bis zu Poincaré, haben die transfinite Schlußweise in mannigfaltigster und kühnster Weise gebraucht, und niemals hat sich auch nur die geringste Unstimmigkeit gezeigt. Endlich, wenn wir erst an alle Anwendungen denken und uns klarmachen, was für eine Fülle von transfiniten Schlüssen der schwierigsten und mühsamsten Art z. B. in der Relativitätstheorie und Quantentheorie steckt, und wie sich doch die Natur genau nach diesen Ergebnissen richtet: der Fixsternstrahl, der | Merkur und die kompliziertesten Spektren hier auf Erden und in der Ferne von hunderttausenden Lichtjahren; sollten wir bei dieser Sachlage wegen der schönen Augen Kroneckers und einiger als Mathematiker verkleideter Philosophen aus Gründen, die noch dazu völlig willkürlich und gar nicht einmal präzise formulierbar sind, auch nur einen Augenblick an der Berechtigung der Anwendung des Tertium non datur zweifeln? Es beruht ja überhaupt jede wissenschaftliche Erkenntnis auf einer vernünftigen Abschätzung der Wahrscheinlichkeit durch Heranziehung der Übereinstimmung und des gegenseitigen Verhaltens: Denken wir an die Theorien in der Physik oder Astronomie, z. B. den Aufbau der Sternenwelt, oder in der Biologie an die Vererbungsgesetze und den Entwicklungsgedanken, alles Ergebnisse, die wir heute als festgestellte sichere Wahrheiten ansehen. Es wäre ja der Tod aller Wissenschaft und die Unmöglichkeit irgendeines Fortschrittes, wenn wir nicht einmal solche Gesetze wie die der elementaren Arithmetik als Wahrheit gelten lassen wollten. Trotzdem gibt es auch heute noch Anhänger Kroneckers, die an die Statthaftigkeit des Tertium non datur nicht glauben: Es
5
10
15
20
25
30
35
40
45
‘Die Grundlegung der elementaren Zahlenlehre’
5
10
15
20
25
30
35
40
977
ist das wohl der krasseste Unglaube, den wir in der Geschichte der Menschheit antreffen. Aber andererseits: Eine Wissenschaft wie die Mathematik, hat sich nicht auf Glauben zu stützen, so stark dieser auch sei, sondern die Pflicht einer restlosen Aufklärung. Da nun die Anwendbarkeit des Tertium non datur bei endlich vielen Aussagen eine Selbstverständlichkeit ist, so wendet sich unsere ganze Aufmerksamkeit sofort dem Begriff „unendlich“ zu, und ich habe über das Unendliche eine ausführliche Untersuchung angestellt, kann aber hier nur das Fazit dieser Untersuchung mitteilen. Die Physik lehrt, daß ein homogenes Kontinuum, welches die fortgesetzte Teilbarkeit zuließe und somit das Unendliche im Kleinen realisieren würde, in der Wirklichkeit nirgends angetroffen wird. Die unendliche Teilbarkeit eines Kontinuums ist nur eine in Gedanken vorhandene Operation, nur eine Idee, die durch unsere Beobachtungen der Natur und die Erfahrungen der Physik und Chemie widerlegt wird. Andererseits stellen sich in der Astronomie schwerwiegende Bedenken gegen das Vorhandensein des unendlichen Raumes, also der Unendlichkeit im Großen, ein. Auch all unser Handeln ist finit, und das Unendliche findet darin keinen Platz. Das Unendliche findet sich nirgends realisiert; es ist weder in der Natur vorhanden, noch als Grundlage in unserem verstandesmäßigen Denken zulässig. Die bedingungslose Anwendung des Tertium non datur und der Negation können wir aber nicht entbehren, da sonst der lückenlose und einheitliche Aufbau unserer Wissenschaft unmöglich wäre. Das Operieren mit dem Unendlichen muß also durch das Endliche gesichert werden, und das geschieht eben durch meine Beweistheorie. Mit dieser Neubegründung der Mathematik verfolge ich ein bedeutsames Ziel: Ich möchte nämlich die Grundlagenfrage in der Mathematik als solche endgültig aus der Welt schaffen, indem ich jede mathematische Aussage zu einer konkret aufweisbaren und streng ableitbaren Formel mache und dadurch die mathematischen Begriffsbildungen und Schlüsse in eine solche Fassung bringe, daß sie unwiderleglich sind und doch ein Bild der gesamten Wissenschaft liefern. 1 Der Grundgedanke meiner Beweistheorie ist nun 2 folgender: Alles, was im bisherigen Sinne die Mathematik ausmacht, wird streng formalisiert, so daß die eigentliche Mathematik oder die Mathematik in engerem Sinne zu einem Bestande an Formeln wird. Diese unterscheiden sich von den gewöhnlichen Formeln der Mathematik nur dadurch, daß außer den gewöhnlichen Zeichen noch die logischen Zeichen, insbesondere die für „folgt“ (→) und für „nicht“ ( ), darin vorkommen. Gewisse Formeln, die als Fundament des formalen Gebäudes der Mathematik dienen, werden Axiome genannt. Ein Beweis ist eine Figur, die uns als solche anschaulich vorliegen muß; er besteht aus Schlüssen, 3 wo jede der Prämissen entweder Axiom ist oder mit der Endformel eines Schlusses übereinstimmt, der vorher im Beweise vorkommt, bzw. 1 The
extract used for the 1935 reprinting begins with the following paragraph. word ‘nun’ is omitted in the reprinting. 3 The reprinting gives at this point a footnote inserted by the Editors of Volume 3 of the 2 The
489
978
Appendices
durch Einsetzung aus einer solchen Endformel 4 entsteht. An Stelle des inhaltlichen Schließens tritt in der Beweistheorie ein äußeres Handeln nach Regeln, nämlich der Gebrauch des Schlußschemas und der Einsetzung. Eine Formel soll beweisbar heißen, wenn sie entweder ein Axiom oder die Endformel eines Beweises ist. Zu der eigentlichen so formalisierten Mathematik kommt eine gewissermaßen neue Mathematik, eine Metamathematik, die zur Sicherung jener notwendig ist, in der — im Gegensatz zu den rein formalen Schlußweisen der eigentlichen Mathematik — das inhaltliche Schließen zur Anwendung kommt, aber lediglich zum Nachweis der Widerspruchsfreiheit der Axiome. Die Axiome und beweisbaren Sätze, d. h. die Formeln, die in diesem Wechselspiel entstehen, sind die Abbilder der Gedanken, die das übliche Verfahren der bisherigen Mathematik ausmachen. Durch dieses Programm ist die Wahl der Axiome für unsere Beweistheorie schon vorgezeichnet. Was die Auswahl der Axiome betrifft, so unterscheiden wir analog wie in der Geometrie qualitativ einzelne getrennte Gruppen. I. Axiome der Folge: A → (B → A) (Zufügen einer Voraussetzung); (A → B) → {(B → C) → (A → C)} (Elimination einer Aussage);
5
10
15
20
{A → (A → B)} → (A → B). 490
II. III.
Axiome über „und“ (&) sowie „oder“ (∨). Axiome der Negation: A → (B & B) → A (Satz vom Widerspruch);
25
A→A (Satz von der doppelten Verneinung). Diese Axiome der Gruppen I, II, III sind keine anderen als die Axiome des Aussagenkalküls. IV. Transfinite Axiome: (x)A(x) → A(b) (Schluß vom Allgemeinen aufs Besondere, Aristotelisches Axiom); Umkehrung durch das Schema: 5 Gesammelte Abhandlungen: Die Formen der Schlüsse sind: das gewöhnliche Schlußschema (vgl. S. 179) und die nachfolgend unter IV angegebenen Schemata für das All- und Seinszeichen.
(The reference to ‘S. 179’ is to Volume 3 of the Abhandlungen, which is the second page of the reprinting of Hilbert’s paper Hilbert 1923a (p. 152 in the original) where the schema of modus ponens is given.) It seems plausible to assume that Bernays was responsible for this remark. See p. 19, n. 33 above. See also n. 6 below. 4 The reprinting adds here ‘oder einem Axiom’ and omits the comma after ‘vorkommt’. 5 The reprinting adds here the condition ‘Hier möge a nicht in A auftreten’.
30
‘Die Grundlegung der elementaren Zahlenlehre’
979
A → B(a) ; A → (x)B(x). A(a) → (Ex)A(x) Umkehrung wiederum durch Schema. Weitere Formeln sind ableitbar, z. B. 5
(x)A(x) (Ex)A(x) (wenn ein Prädikat nicht für alle Argumente gilt, so gibt es ein Gegenbeispiel, und umgekehrt); (Ex)A(x) (x)A(x) (wenn es kein Beispiel für eine Aussage gibt, so ist die Aussage für alle Argumente falsch, und umgekehrt).
10
15
20
25
Die Axiome dieser Gruppe IV sind die des Prädikatenkalküls. Dazu kommen die speziell mathematischen Axiome: V. Axiome der Gleichheit: a = a; a = b → (A(a) → A(b)) und VI. Axiome der Zahl a + 1 = 0; sowie das Axiom der vollständigen Induktion und das Schema der Rekursion. Der Beweis der Widerspruchsfreiheit ist zuletzt von Ackermann und v. Neumann so weit durchgeführt worden, daß in der elementaren Zahlenlehre die Widerspruchsfreiheit für die eben aufgezählten Axiome folgt 6 und mithin für den Bereich der elementaren Zahlenlehre die transfiniten Schluß|weisen, insbesondere die Schlußweise des Tertium non datur, als zulässig erkannt worden sind. Unsere wichtigste weitere Aufgabe besteht darin, folgendes zu zeigen (vgl. Math. Annalen 102, S. 6) 7 : 6 The reprinting gives at this point a footnote inserted by the Editors of Volume 3 of the Gesammelte Abhandlungen:
Zur Einschränkung dieser Angabe vgl. S. 211–213.
The reference is to subsequent pages of Volume 3 of the Abhandlungen which are from Bernays’s 1935 summary of Hilbert’s foundational work (Bernays 1935 ) included there, and in which Bernays sets out some qualifications to Hilbert’s claim. This footnote, therefore, was probably added by Bernays. In introducing these qualifications, Bernays remarks: Daß tatsächlich auch dieses Ziel noch nicht erreicht war, erkannte man erst, als man auf Grund eines allgemeinen Theorems von K. Gödel zweifelhaft geworden war, ob sich überhaupt der Nachweis der Widerspruchsfreiheit für den zahlentheoretischen Formalismus mit elementaren kombinatorischen Methoden im Sinne des „finiten Standpunktes“ erbringen lasse. (Bernays 1935 , 211.) 7 This reference is to the republication of ‘Probleme der Grundlegung der Mathematik’ (the ‘Bologna lecture’) in 1930 in Volume 102 (pp. 1–12) of Mathematische Annalen (Hilbert 1930c); the two problems listed here are found under Problem III on p. 6. The original Bologna paper (Hilbert 1929 ) appears above as Appendix C. As is explained in its Introduction (p. 955), and as is then detailed in the editorial footnotes to the text, this reprinting is considerably altered compared to the original. There, the problems mentioned here appear under Problem IV on p. 139, above p. 962.
491
980
492
Appendices
1. Wenn eine Aussage als widerspruchsfrei erwiesen werden kann, so ist sie auch beweisbar; und ferner 2. Wenn für einen Satz S die Widerspruchsfreiheit mit den Axiomen der Zahlentheorie nachgewiesen werden kann, so kann nicht auch für S die Widerspruchsfreiheit mit jenen Axiomen nachgewiesen werden. Es ist mir nun gelungen, diese Sätze wenigstens für gewisse einfache Fälle zu beweisen. Dieser Fortschritt wird erreicht, indem ich zu den bereits zugelassenen Schlußregeln (Einsetzung und Schlußfigur) noch folgende ebenfalls finite neue Schlußregel hinzufüge: Falls nachgewiesen ist, daß die Formel A(z) allemal, wenn z eine vorgelegte Ziffer ist, eine richtige numerische Formel wird, so darf die Formel (x)A(x) als Ausgangsformel angesetzt werden. Es sei hier daran erinnert, daß die Aussage (x)A(x) viel weiter reicht als die Formel A(z), wo z eine beliebig vorgelegte Ziffer ist. Denn im ersteren Falle darf in A(x) für x nicht bloß eine Ziffer, sondern auch ein jeder in unserem Formalismus gebildete Ausdruck vom Zahlcharakter eingesetzt werden, und außerdem ist die Bildung der Negation nach dem Logikkalkül ausführbar. Zunächst erkennen wir, daß das Axiomensystem auch bei Hinzunahme der neuen Regel widerspruchsfrei bleibt. Es sei nämlich eine Beweisfigur vorgelegt, die in einen Widerspruch mündet. Der bisherige Beweis der Widerspruchsfreiheit besteht nun darin, daß man nach einem bestimmten Verfahren alle Formeln des vorgelegten Beweises in numerische verwandelt; alsdann kommt es darauf an, festzustellen, daß alle Ausgangsformeln richtig sind. Nun werden bei unserem Verfahren auch aus denjenigen Formeln, die gemäß der neuen Regel hingeschrieben worden sind, numerische Formeln, und zwar wird aus (x)A(x) eine Formel A(z), wo z eine bestimmte Ziffer ist. Diese Formel ist aber nach der Voraussetzung der neuen Regel ebenfalls richtig. Unser Verfahren führt also nach wie vor alle Ausgangsformeln der Beweisfigur in richtige Formeln über. Der Beweis der Widerspruchsfreiheit ist damit geführt. Sei nun eine Formel S der Gestalt (x)A(x), die außer x keine weiteren Variablen enthält, zu den Axiomen widerspruchsfrei. 8 Dann ist A(z) sicher richtig, sobald für z eine Ziffer eingesetzt wird; denn sonst wäre A(z) richtig und daher beweisbar und würde somit einen Widerspruch zu (x)A(x) geben, entgegen unserer Voraussetzung. Also ist nach der neuen Schlußregel unsere Formel S bewiesen. Satz 1 gilt also für jede Aussage S von der Gestalt (x)A(x), die außer x keine weitere 8 The sense of Hilbert’s somewhat abbreviated sentence is: ‘Assume that the formula S can be consistently adjoined to the axioms’. The sentence remains unaltered in the shortened reprinting of the article.
5
10
15
20
25
30
35
40
‘Die Grundlegung der elementaren Zahlenlehre’
981
Variable enthält. Für eben diese Aussagen von der Art S folgt aus dem eben bewiesenen Satz 1 auch die Gültigkeit von Satz 2. Gehen wir nun von einer Aussage T der Gestalt T : (Ex)A(x) 5
aus, so ist offenbar die Negation dieser Aussage T : (x)A(x)
10
15
20
25
30
35
40
von der vorhin betrachteten Gestalt S. Nach Satz 2 ist es daher nicht möglich, für jede der beiden Aussagen T und T den Beweis der Widerspruchsfreiheit zu führen. Setzen wir also voraus, daß für T der Beweis der Widerspruchsfreiheit geführt sei, so folgt, daß für T nicht auch der Beweis der Widerspruchsfreiheit geführt werden kann, und damit ist Satz 2 auch noch für jede Aussage von der Gestalt T bewiesen. Freilich darf daraus noch nicht geschlossen werden, daß T beweisbar ist. — 9 Gegen meine Beweistheorie sind verschiedenartige Einwendungen erhoben worden; sie sind sämtlich unberechtigt. Es sei hierzu folgendes bemerkt: 1. Der Beurteiler meiner Theorie möge genau die Stelle in meinem Beweis angeben, wo mein vermeintlicher Fehler liegen soll. Andernfalls lehne ich es ab, seinen Gedankengang zu prüfen. 2. Es wird meiner Theorie zum Vorwurf gemacht, daß die Sätze zwar widerspruchsfrei seien, aber damit noch nicht bewiesen wären. Freilich sind sie beweisbar, wie ich hier in einfachen Fällen gezeigt habe. Es stellt sich auch allgemein heraus, wie es von Anfang an meine Überzeugung war, daß die Erzielung der Widerspruchsfreiheit das Wesentliche in der Beweistheorie ist und die Frage der Beweisbarkeit bei eventueller sachgemäßer Ausdehnung der Festsetzungen unter Wahrung des finiten Charakters sich dann ebenfalls mit erledigt. Doch kann in einer Theorie nicht gleich verlangt werden, daß darin alle einschlägigen Fragen zur vollen Lösung kommen: es genügt, wenn der Weg dazu gezeigt wird. 3. Begriffe, wie z. B. „widerspruchsfrei“, hat der Beurteiler meiner Theorie so zu verstehen, wie ich sie gebrauche, nicht wie andere Autoren | sie sich definiert denken. Meine Deutung ist deshalb hier die maßgebende, weil sie so für meine Theorie allein in Betracht kommt. 4. Die Einwendungen gegen meine Theorie beziehen sich mitunter auf nebensächliche und für den Erfolg völlig gleichgültige Dinge, wie z. B. wenn sie sich gegen die Bezeichnungsweise „ideal“ richten, die ich gebrauche, und allerdings trotz der gegnerischen Erwägungen für äußerst zutreffend und das Verständnis fördernd halte. Auch sonst werden einseitige Vorurteile und Schlagworte gerne ins Feld geführt. Über den Vorwurf des Formalismus habe ich mich in früheren Abhandlungen ausgesprochen. Die Formel ist ein notwendiges Hilfsmittel der logischen Untersuchung. Freilich erfordert ihr Gebrauch präzise Gedankenarbeit und macht leeres Geschwätz unmöglich. 5. Es gibt bisher keine andere Theorie, ja es ist meiner Meinung nach gar keine andere Theorie mit gleichem Erfolge denkbar, denn meine Beweis9 The
extract used for the reprinting ends at this point.
493
982
Appendices
theorie tut nichts anderes als die intime Tätigkeit unseres Verstandes nachzubilden und ein Protokoll über die Regeln aufzunehmen, nach denen unser Denken tatsächlich verfährt. Das Denken geschieht eben parallel dem Sprechen und Schreiben: durch Bildung und Aneinanderreihung von Sätzen. Und zur Begründung brauche ich weder den lieben Gott wie Kronecker, noch die Annahme einer besonderen auf das Prinzip der vollständigen Induktion abgestimmten Fähigkeit unseres Verstandes wie Poincaré, noch die Urintuition wie Brouwer, endlich auch nicht wie Russell und Whitehead das Axiom 10 der Unendlichkeit und Reduzierbarkeit, die ja wirkliche inhaltliche und durch Beweise der Widerspruchsfreiheit nicht kompensierbare Voraussetzungen sind, von denen die letztere nicht einmal plausibel ist. In einem neueren philosophischen Vortrage finde ich den Satz:
494
„Das Nichts ist die schlechthinnige Verneinung der Allheit des Seienden.“ 11 Dieser Satz ist deshalb lehrreich, weil er trotz seiner Kürze alle hauptsächlichen Verstöße gegen die in meiner Beweistheorie aufgestellten Grundsätze illustriert. Begriffe wie „Allheit des Seienden“ enthalten einen Widerspruch in sich und gefährden schon allein den Sinn einer jeden Behauptung. Aber hiervon abgesehen wird nun auf den problematischen Begriff Allheit des Seienden die Negation angewendet. Es ist gerade eine der wichtigsten Aufgaben der Beweistheorie, Sinn und Zulässigkeit der Negation klarzustellen: die Negation ist ein formaler Prozeß, durch den aus einer Aussage S eine andere hervorgeht, die mit S durch die vorhin genannten Axiome der Negation (also wesentlich principium contradictionis und tertium non datur) verbunden ist. Der Prozeß der Negation ist ein notwendiges theoretisches Forschungsmittel; seine unbedingte Anwendung ermöglicht erst die Voll|ständigkeit und Abgeschlossenheit der Logik. Aber im allgemeinen ist die durch Negation entstehende Aussage eine ideale, und es hieße Natur und Wesen des Denkens verkennen, wenn man diese ideale Aussage selbst an sich als real nehmen wollte. — Ich glaube, das, was ich wollte und versprach, durch die Beweistheorie vollständig erreicht zu haben: Die mathematische Grundlagenfrage als solche ist dadurch, wie ich glaube, endgültig aus der Welt geschafft. Den Philosophen wird es schon interessieren, daß es eine Wissenschaft wie die Mathematik überhaupt gibt. Für uns Mathematiker ist es die Aufgabe, sie wie ein Heiligtum zu hüten, damit einst alles menschliche Wissen überhaupt der gleichen Präzision und Klarheit teilhaftig wird. Daß dies kommen muss und geschehen wird, ist meine feste Überzeugung. (Eingegangen am 21. 12. 1930.)
10 Presumably 11 For
Hilbert means here ‘die Axiome’. a discussion of this citation, see the Introduction to this Appendix, p. 972.
5
10
15
20
25
30
35
Appendix E: Hilbert’s 1931 Göttingen Lecture
983
Appendix E: Hilbert’s 1931 Göttingen Lecture
Introduction
This Appendix reprints Hilbert’s paper ‘Beweis des Tertium non datur’ (Hilbert 1931b), which was presented on 17 July 1931 to a meeting of the Göttingen Gesellschaft der Wissenschaften, formerly the Königliche Gesellschaft der Wissenschaften zu Göttingen. It was Hilbert’s final paper on logical matters, and (as far as we can tell), the last of Hilbert’s published papers of any kind. It was never reprinted, and has been reproduced here with only the smallest of orthographic changes. As remarked in the Introduction to the Appendices, this paper, like the ‘Grundlegung’ paper written in late 1930 (Appendix D), also contains a version of the HR-rule. (See above, p. 799.) The formulation Hilbert adopts here is: If the statement A(z) is correct for each number z, then the general statement (x)A(x) holds. (Hilbert 1931b, 121, below, p. 985.)
The system underlying Hilbert’s paper is not a system of number theory as such, but rather a first-order predicate calculus with equality, where the version of the HR-rule is added to the quantifier axioms (group VI). Although Hilbert does not present a system of arithmetic, it is clear that he presupposes the language of arithmetic, since close to the beginning of his paper he refers to the formation of numerals in the usual way from the signs ‘1’ and ‘+’, and then later he refers (as in Hilbert 1931a) to the formation of terms for numbers; the same passage (see p. 121 of the paper, p. 986, below) speaks of using various operations introduced by recursion, above all presumably the operations ‘+’ and ‘×’. He also assumes that the natural interpretation of the language he employs is the standard arithmetic one. The concepts ‘correct [richtig]’ and ‘false [falsch]’ are actually introduced (p. 120, p. 986 below) by
984
Appendices
means of this interpretation: a statement about numerals is called ‘richtig’ if it represents a correct numerical statement ‘in the ordinary sense’; otherwise it is ‘falsch’. (See p. 120, p. 985.) This is the notion which is then used in the formulation of the new HR-rule, its point being to guarantee that correctness is preserved in the step from correct instances to generalisations. The simplest examples of statements to be assessed in this way are statements of identity and non-identity between two numerals, but the concept is also meant to be applied when formulæ are instantiated by any individual terms standing for numbers. Later, Hilbert explicitly uses the more general notion of a ‘numerical formula’ (see p. 122, p. 986, below), which is a quantifier-free formula formed from identities, non-identities and numerals or terms for numerals, and just the propositional connectives. Although the purpose of the new rule is clear, it is not clear, as was pointed out in the Introduction to Appendix D (see p. 971, above), that it is really a rule of inference proper, for (apart from the infinitary element in it), it refers directly to a particular interpretation of the language. Hilbert states various things about the notions ‘correct’ and ‘false’, and in particular argues that the consistency of statements is actually equivalent to their being correct. Given this, he then concentrates on the assertion that every statement of the language is either correct or false, and it is to enable the proof of this that he introduces the tertium non datur, in the form: (x)A(x) ∨ (Ex)A(x) This he reads as saying: . . . if A(x) is a statement containing the numerical variable x, then it is always the case either that this statement is correct for any numeral z instantiated for x, or there is a numeral which can be instantiated for x for which the statement is not correct (p. 123, p. 987, below).
The aim then becomes to show that adopting this principle as an axiom will not lead to a contradiction, assuming that the system without it is consistent, and that therefore the statement of the tertium is correct. Michael Hallett
‘Beweis des Tertium non datur’
985
Beweis des Tertium non datur Vorgelegt in der Sitzung am 17. Juli 1931.
Dem Beweise legen wir folgende Axiome und Schlußschemata zu Grunde. I. 5
10
15
20
120
Axiome der Folge: A → (B → A) (A → B) → {(B → C) → (A → C)} {A → (A → B)} → (A → B).
Diese Axiome sind als Schemata zu verstehen in dem Sinne, daß für A, B, C beliebige Formeln gesetzt werden. Das Gleiche gilt im Folgenden. II. Axiome über „und“ (&) und „oder“ (∨). III. Axiom der Gleichheit: a = b → (A(a) → A(b)) . Ein Zeichen, das mit 1 beginnt und mit 1 endigt, so daß auf 1 immer +1 folgt, heißt eine Ziffer. Nun führen wir die Begriffe „richtig“ und „falsch“ ein. Eine Aussage über Ziffern heißt richtig, wenn sie in gewöhnlichem Sinne eine numerisch richtige Aussage darstellt; sonst heißt sie falsch. Die einfachsten Aussagen sind diejenigen von der Gestalt a = b und a = b d. h. a = b, wo a, b Ziffern sind. IV. Axiom des Widerspruchs: A & A → B. V. Schlußschema: S S→T T
25
30
.
VI. Transfinite Axiome und Schlußschemata: Wenn die Aussage A(z) richtig ist, sobald z eine Ziffer ist, so gilt die Aussage (x)A(x); in diesem Falle heißt (x)A(x) richtig. Die Umkehrung wird geliefert durch das Axiom (x)A(x) → A(a). Diese Festsetzungen betreffen die Einführung und die Anwendung des Begriffes „alle“. Zur Einführung und Anwendung des Begriffes „es gibt“ darf ich
121
986
Appendices
folgende zwei Schemata anwenden: A(a) (Ex)A(x)
122
wo a eine Ziffer ist; in diesem Falle heißt (Ex)A(x) richtig. Umgekehrt darf ein Ausdruck (Ex)A(x) ersetzt werden durch A(η), wo η ein noch nicht vorgekommener Buchstabe ist. Dieser Regel entspricht die inhaltliche Auffassung, daß der Formel (Ex)A(x) die Definition einer Ziffer η zugeordnet ist, gemäß welcher im Falle, wo (Ex)A(x) richtig ist, auch A(η) richtig ist. Die Begriffe „richtig“ und „falsch“ sind auch anwendbar, wenn die in den Aussagen auftretenden Zeichen nicht unmittelbar Ziffern sind, sondern erst nach wirklicher Ausführung gewisser Operationen Ziffern werden. Es dürfen nämlich die Aussagen noch andere Zeichen enthalten; insbesondere dürfen darin durch Rekursion eingeführte Funktionen vorkommen. In diesem Falle können wir die betreffende Aussage in einzelne gewöhnliche von den problematischen Zeichen freie Aussagen auflösen, wie es das Rekursionsverfahren verlangt. Insbesondere die Begriffe „richtig“ und „falsch“ gelten unter dieser Voraussetzung in gleicher Weise, wie wenn die auftretenden Zeichen sämtlich unmittelbar Ziffern wären. Endlich werde noch die wichtige und für unsere Untersuchung entscheidende Tatsache hervorgehoben, die darin besteht, daß die sämtlichen Axiome und Schlußschemata VI, die ich transfinit genannt habe, doch ihrerseits streng finiten Charakter haben: die in ihnen enthaltenen Vorschriften sind im Endlichen ausführbar. Wenn ferner in einer Formel außer Ziffern das Zeichen η steht, so ist zwar keine Rede davon, daß wir entscheiden können, ob die betreffende Aussage richtig oder falsch ist; wohl aber wissen wir, daß die entstandene Formel bestimmt entweder richtig oder falsch | ist, — bedeuten doch die eingeführten Zeichen auf jeden Fall bestimmte Ziffern: die mit diesen gebildeten Ausdrücke bedeuten daher ebenfalls bestimmte Ziffern, d. h. sind solchen gleich. „A ist widerspruchsfrei“ bedeutet: Wenn ein Beweis vorliegt, in dem A als Axiom zugelassen worden ist, so ist die Endformel dieses Beweises von 1 = 1 verschieden. Alle transfiniten Regeln und Schlußschematen sind widerspruchsfrei; denn sie laufen auf Definitionen hinaus. Daher ist auch das ganze System widerspruchsfrei. Durch die Festsetzung, außer Ziffern auch Zeichen η einzuführen, die Ziffern b e d e u t e n , hat eine Erweiterung unseres Verfahrens stattgefunden. Diese Zeichen η werden Konstante oder auch Funktionen von einer oder mehreren Variablen, z. B. bei der Einsetzung (x)(Ey)A(x, y) . (x)A(x, η(x)) Zum genaueren Verständnis treffen wir noch folgende Festsetzungen: Numerisch heißt eine Formel, in der Ziffern und Zeichen, die Ziffern bedeuten, sowie die logischen Zeichen =, =, &, ∨, →, , aber nicht All- oder Seinszeichen auftreten.
5
10
15
20
25
30
35
40
‘Beweis des Tertium non datur’
5
10
15
20
25
30
35
40
45
987
Eine Aussage, die aus mehreren durch & bzw. ∨ verbundenen Aussagen besteht, heißt richtig, wenn jede bzw. wenigstens eine dieser Aussagen richtig ist. Die Negation A einer Formel A mit All- und Seinszeichen bildet man, indem man vorn das erste Zeichen „alle“ oder „es gibt“ wegläßt, von der so entstandenen Aussage die Negation bildet und dann das Zeichen „es gibt“ bzw. „alle“ vorsetzt; also wenn A = (x)B(x), so wird A = (Ex)B(x). Bei dieser Definition bleibt der wesentliche Umstand, daß eine Aussage mit ihrer Negation nicht zugleich gelten kann (Principium contradictionis), auch für Aussagen mit All- und Seinszeichen bestehen. Die Negation von A → B wird durch A & B erklärt. Nunmehr behaupte ich, daß „widerspruchsfrei“ mit „richtig“ identisch ist. Zum Beweise mache ich die Annahme: die Aussage A sei widerspruchsfrei. Wir betrachten zunächst den Fall, daß alle vorkommenden Allzeichen zu Beginn der ganzen Formel A stehen. Ich führe dann in A gemäß unseren Regeln und Schematen statt der All- und Seinszeichen die Zeichen z und η ein. Dadurch | entsteht aus A eine numerische Aussage, und diese ist für alle Ziffern z richtig, weil sie widerspruchsfrei ist. Sodann mache ich die vorgenommenen Operationen rückgängig und erkenne daraus die ursprüngliche Aussage A als richtig. Für die Ausdehnung der Überlegung auf den allgemeinen Fall hat man insbesondere das Auftreten des Zeichens → zu berücksichtigen. Nehmen wir eine Formel B → C, bei welcher für den Bestandteil C unser Satz bereits anwendbar ist. Wir haben dann zu zeigen : wenn die Formel B → C widerspruchsfrei ist, so ist sie auch richtig, d. h. sofern B richtig ist, ist auch C richtig. Gemäß dem für C geltenden Satze ergibt sich dies, indem wir zeigen: wenn B → C widerspruchsfrei ist und B richtig ist, so ist C widerspruchsfrei. Eine Aussage A heißt falsch, wenn sie auf einen Widerspruch führt; also „falsch“ und „auf Widerspruch führend“ sind identisch. Trotz der Einsichten, die uns diese Sätze gewähren, haben wir damit noch nicht den folgenden zur Begründung der Mathematik notwendigen Satz gewonnen. Eine jede Aussage ist entweder richtig oder falsch. Zum Beweise dieses Satzes brauchen wir das Tertium non datur (x)A(x) ∨ (Ex)A(x) Diese Formel besagt: wenn A(x) eine Aussage ist, die die Zahlenvariable x enthält, so ist stets entweder diese Aussage für jede an Stelle von x eingesetzte Ziffer z richtig oder es gibt eine Ziffer an Stelle von x, für die sie nicht richtig ist. Aus dem Tertium non datur schließen wir: Eine richtige Formel kann nicht zugleich falsch sein. Wenn A falsch ist, so ist A richtig. Denn A ∨ A ist stets richtig. Außerdem gilt:
123
988
124
Appendices
Wenn A richtig ist, so ist A falsch. Denn A & A ist stets falsch. Unser Ziel ist einzusehen, daß auch wenn wir die Formel des Tertium non datur gleich wie ein Axiom als richtig in einem Beweise benutzen, doch durch Schließen ein Widerspruch, wie 1 = 1 auf keine Weise entstehen kann, und, daß somit das Tertium non datur eine richtige Aussage darstellt. Wenn man aus einer Aussage A die Seinszeichen beseitigt und in den Allzeichen Funktionen von z einführt, so sagt das Tertium non datur aus, daß die erhaltene Aussage für alle z richtig oder für ein z falsch ist. Um den Beweis der Widerspruchsfreiheit zu führen, nehmen wir im Gegenteil an, es liege unter Benutzung jener Formel des Tertium non datur ein Beweis für die falsche numerische Formel 1 = 1 vor. Das Tertium non datur möge uns eine gewisse Anzahl von Formeln liefern, die im Beweise als Ausgangsformeln benutzt werden; diese haben die Gestalt:
5
10
(x)A(x) ∨ (Ex)A(x) (x)B(x) ∨ (Ex)B(x) .. . Diese Formeln müßten nun ohne weitere Benutzung des Tertium non datur durch gewöhnliche Schlüsse zu dem Widerspruch 1 = 1 führen. Wir erkennen indes, daß dies unmöglich ist. Sehen wir nämlich zu, wo im Beweise Formeln von der Gestalt
15
20
(x)A(x) → A(a1 ), . . . , (x)A(x) → A(an ), (x)B(x) → B(b1 ),. . . , (x)B(x) → B(bm), .. .. . . auftreten und setzen wir überall im Beweise statt (x)A(x) den Ausdruck A(a1 ) & . . . & A(an )
25
statt (x)B(x) den Ausdruck B(b1 ) & . . . & B(bm ) u. s. w. ein, so erkennen wir, daß alsdann alle Formeln einschließlich der Ausgangsformeln richtig sind. Denn da die Aussage A(ah ) ein Allzeichen weniger enthält als die ursprüngliche Formel (x)A(x), so dürfen wir annehmen, daß für die Aussage A(ah ) das Tertium non datur bereits als gültig bewiesen worden ist und demnach entweder A(ah ) oder A(ah ) und damit auch (Ex)A(x) richtig ist. In unserem Formelsystem kann demnach, da durch Schlüsse Richtiges richtig bleibt, 1 = 1 nicht vorkommen. Ein wesentlicher Vorzug der dargelegten Methode besteht darin, daß sie sich auch auf den Fall der Funktionsvariabeln und noch höherer Variabelnsorten ausdehnen läßt. Das Tertium non datur nimmt unter den Axiomen und Sätzen der Logik überhaupt eine ausgezeichnete Stellung ein: während alle übrigen Axiome und
30
35
‘Beweis des Tertium non datur’
5
989
Sätze sich ohne Schwierigkeit auf Definitionen unmittelbar zurückführen lassen, drückt das Tertium non | datur eine neue inhaltlich bedeutsame Tatsache aus, die eines Beweises bedarf. Durch das Tertium non datur erhält die Logik volle Harmonie; ihre Sätze gewinnen eine so einfache Form, und das System ihrer Begriffe wird von einer solchen Abgeschlossenheit, wie es der Bedeutung einer Disziplin entspricht, die das Gefüge unseres gesamten Denkens zum Ausdruck bringt.
125
990
Appendices
Textual Notes 985.19: 987.5:
:] „es gibt“]
es „gibt“
Hilbert’s Lecture Courses, 1886–1934∗
The following table presents a systematic list of the lecture courses given by Hilbert throughout his teaching career. It also presents a list of the semiofficial accompanying documents known to exist in the Hilbert Nachlaß in the Handschriftenabteilung of the Staats- und Universitätsbibliothek of the Universität Göttingen or in the library of the Mathematisches Institut in Göttingen; for instance, listed are Hilbert’s own lecture manuscripts or approved notes taken by collaborators or students. A few comparable documents known to the Editors and kept in other archives or libraries are given in a Supplementary List, beginning on p. 1005, below. The main sources used in the compilation of this list are the official listings of the Universities of Königsberg and Göttingen. All of Hilbert’s lectures that are listed there have been cited. Use was also made of two additional sources. The first is the Kuratorialakten in the archives of the Universität Göttingen; the signatures for these Akten are ‘UAG Kur 4.I.81’ and ‘UAG Kur 4.I.104 (II)’, abbreviated here as ‘UAG Kur’. These extend to the ‘Herbstzwischensemester’ of 1919, and list both the lecture courses announced and those actually held; they also give, where appropriate, the number of participants. The second source is a list contained in the Hilbert Nachlaß (Hilbert 1934* ) which bears the title, in Hilbert’s hand, ‘Verzeichnis meiner Vorlesungen (1886–1932)’. This list is abbreviated here as ‘HVV’, for ‘Hilbert’s Vorlesungsverzeichnis’.1 When lecture courses given in UAG Kur or HVV could not be correlated with the titles in the official lecture listings, they have been entered in the list in Sperrschrift (i. e., s p a c e d l e t t e r s ).2 If the source ∗ First published, May 2004; revised and augmented in November 2009 and June 2010 for this Volume. 1 This list records the lectures in chronological order. The entries up to the WS 1917/18 are in Käthe Hilbert’s hand, and she clearly relied mainly on those manuscripts which were available in Hilbert’s personal library. Consequently, a great many lectures listed in the first two sources specified are missing in this third source for the period up to 1917/18. The list was continued up to the WS 1926/27 by Paul Bernays; there is a further handwritten entry for the following Summer Semester added by Arnold Schmidt. The remainder of the list, which, pace Hilbert’s title, extends to the WS 1933/34, is typed. 2 The ‘Verzeichnis der von Hilbert gehaltenen Vorlesungen’ published in the third volume of Hilbert’s Gesammelte Abhandlungen (Hilbert 1935 , 430) is merely a list organized by subject matter of titles of some of Hilbert’s lecture courses, and takes no account of how many times he lectured on a particular subject or under what title. The list was therefore of little use for our purposes.
W. Ewald and W. Sieg (eds.), David Hilbert’s Lectures on the Foundations of Arithmetic and Logic 1917–1933, DOI 10.1007/978-3-540-69444-1, © Springer-Verlag Berlin Heidelberg 2013
991
992
Hilbert’s Lecture Courses 1886–1934
indicates a reason for doubting whether a course of lectures announced was actually held, the title is written in italics, and the situation is explained in a footnote. In order not to overburden this table with excessive detail, Hilbert’s ‘Übungen’ and seminars have been omitted. Of these, only a few have been recorded in surviving documents, and these often present problems of dating. The third column in the table lists all the texts for lecture courses which survive in Göttingen; to one and the same lecture course, several documents may be correlated, for example, Hilbert’s own manuscript, an official protocol, and/or notes by a participant. If a document is not a manuscript by Hilbert, the name of the author is given in parentheses after its title, and when the author is unknown, this is marked by ‘N.N.’. The titles of the various documents sometimes differ significantly from the title announced for the lectures. If so, the new or additional title for the document is given; if not, the entry just records ‘title as announced’. Where there is, as far as is known, no extant document, the third column lists a horizontal line. Associated texts for lecture courses whose titles are preceded by a ‘’ are contained in the present volume. The following abbreviations are used. In the first column (and in the Supplementary Manuscript List), ‘WS’ and ‘SS’ are short for ‘Wintersemester’ and ‘Sommersemester’ respectively. (‘HZS 1919’ denotes the exceptional Herbstzwischensemester in 1919.) In the central column, the indication ‘nst.’ following a title is short for ‘n-stündig’, and means that n academic ‘hours’ were planned each week for the lecture course, i. e., n periods of forty-five minutes each. The third column also contains the abbreviations ‘SUB’ and ‘MI’; as usual, these stand respectively for the Handschriftenabteilung (Manuscript Division) of the Staats- und Universitätsbibliothek of the Georg-August Universität Göttingen, and the Mathematisches Institut in Göttingen. More particularly, ‘SUB xyz’ here is really short for ‘Cod. Ms. D. Hilbert xyz ’, the signature under which the Manuscript Division keeps the document in question.
Title Announced
Invariantentheorie Theorie der Determinanten, verbunden mit geometrischen Übungen, 2st. Theoretische Hydrodynamik, 3st. Theorie der numerischen Gleichungen, 3st. Theorie der Kugelfunctionen, 1st. Darstellende Geometrie, verbunden mit Übungen, 2st.4 Theorie der höheren algebraischen Gleichungen, 2st. Über Linien- und Kugelgeometrie, 3st. Theorie der Determinanten, 1st. Zahlentheorie, 2st. Allgemeine Theorie der algebraischen Gebilde, 2st. Einleitung in die höhere Analysis, 2st. Bestimmte Integrale, 2st. Theorie der krummen Linien und Flächen, 2st. Theorie der ebenen algebraischen Curven, 2st. Theorie der algebraischen Zahlen und Functionen, 2st. Geometrie der Lage, 2st. Theorie der linearen Differentialgleichungen, 2st. SUB SUB SUB SUB SUB SUB SUB SUB SUB
528: 529: 530: 531: 532: 534: 533: 535: 536:
Zahlentheorie und Uebungen title as announced Einführung in das Studium der Mathematik6 title as announced Krumme Linien und Flächen title as announced title as announced Projektive Geometrie Lineare Differentialgleichungen und Uebungen
SUB 526: Höhere algebraische Gleichungen SUB 527: Kugel- und Liniengeometrie5
SUB 522: Hydrodynamik SUB 525: Numerische Gleichungen SUB 524: Kugelfunctionen
SUB 521: Invariantentheorie mit Uebungsstunde SUB 523: Determinantentheorie und Uebungen
Corresponding Documents
4 Not
announced in the official Vorlesungsverzeichnis. The title follows HVV. in HVV. 5 Added in parentheses: ‘enthält die Theorie der quadratischen Formen’. 6 Added in parentheses: ‘Zahlbegriff, Höhere Analysis, Analytische Geometrie, Differential- und Integralrechnung’.
3 Not
SS 1891 WS 1891/92
WS 1890/91
SS 1890
SS 1889 WS 1889/90
WS 1888/89
SS 1888
WS 1887/88
WS 1886/873 SS 1887
Privatdozent in Königsberg
Semester
Hilbert’s Lecture Courses in Königsberg und Göttingen, 1886–1934
Hilbert’s Lecture Courses 1886–1934
993
Title Announced Über die eindeutigen Functionen mit linearen Transformationen in sich, 2st. Einleitung in das Studium der höheren Mathematik, 2st.7 I n t e g r a l r e c h n u n g , 4st.8 Theorie der partiellen Differentialgleichungen, 2st.
Theorie der bestimmten Integrale, 4st. Die Grundlagen der Geometrie, 1st.9 Ausgewählte Capitel aus der Invariantentheorie, 1st. Theorie der Kettenbrüche, 2st.11 Theorie der elliptischen Functionen, 4st.12 A n a l y t i s c h e G e o m e t r i e d e s R a u m e s , 2st.13 E i n l e i t u n g i n d i e F u n c t i o n e n t h e o r i e , 1st.14
SUB 543, pp. 77ff.: Analytische Geometrie des Raumes SUB 540, pp. 1–31: Einleitung in die Functionentheorie
SUB 540, pp. 67–149: Bestimmte Integrale SUB 541: Die Grundlagen der Geometrie.10 SUB 521, pp. 353–369: title as announced
SUB 538: Integralrechnung und Uebungen SUB 539: Partielle Differentialgleichungen
Corresponding Documents SUB 537: Eindeutige Functionen mit linearen Transformationen in sich
8 According
in HVV. to HVV. 9 Not read, according to the title page of the manuscript. 10 The manuscript was revised for the following semester; see the Introduction to Chapter 2 of Hallett and Majer 2004 . 11 Not in HVV. 12 Not in HVV. 13 According to HVV. 14 According to HVV.
7 Not
WS 1893/94
SS 1893
Promotion to Außerordentlicher Professor in Königsberg
WS 1892/93
Semester SS 1892
Hilbert’s Lecture Courses (cont.)
994 Hilbert’s Lecture Courses 1886–1934
Title Announced
Theorie der Functionen einer complexen Veränderlichen, 4st.15 Über die Axiome der Geometrie, 2st. Analytische Geometrie der Ebene und des Raumes, 2st. Das Problem der Quadratur des Kreises, 1st. Die Dichtigkeit und Vertheilung der Primzahlen, 1–2st.
16 Not
in in 17 Not in 18 Not in
15 Not
SS 1896
HVV. HVV. HVV. HVV.
WS 1895/96
SS 1895
Theorie der gewöhnlichen Differentialgleichungen, 4st. Über die Quadratur des Kreises, 2st.18
Integralrechnung, 4st.17 Theorie der partiellen Differentialgleichungen, 4st.
Determinanten, 2st.16 Elliptische Functionen, 4st.
Appointment in Göttingen
WS 1894/95
SS 1894
Promotion to Ordentlicher Professor in Königsberg
Semester
Hilbert’s Lecture Courses (cont.)
SUB 545: Partielle Differentialgleichungen MI: Partielle Differentialgleichungen SUB 546: Gewöhnliche Differentialgleichungen
SUB 544: Doppelperiodische Functionen MI: Vorlesung über die Theorie der elliptischen Functionen
SUB 541: Die Grundlagen der Geometrie SUB 543: title as announced SUB 542: Die Quadratur des Kreises.
Corresponding Documents
Hilbert’s Lecture Courses 1886–1934
995
Mechanik, 4st.
Title Announced Theorie der algebraischen Gleichungen, 2st. Theorie der Functionen einer complexen Veränderlichen, 4st. Theorie der algebraischen Invarianten nebst Anwendungen auf Geometrie, 4st. Theorie der Functionen einer complexen Veränderlichen II. Teil, 2st.19 Über die Focaleigenschaften der Curven und Flächen zweiter Ordnung, 2st. Zahlentheorie, 4st. Über den Begriff der Irrationalzahl und das Problem der Quadratur des Kreises, 2st. Einleitung in die Theorie der Differentialgleichungen, 4st.21 Bestimmte Integrale und Fouriersche Reihen, 2st. Ausgewählte Capitel aus der Zahlentheorie, 2st.22 Determinantentheorie, 2st.24 Elemente der Euklidischen Geometrie, 2st.
20 Published
in HVV. in Hilbert 1990 . 21 Not in HVV. 22 Not in HVV. 23 Published in Hilbert 1990 . 24 Not in HVV.
19 Not
WS 1898/99
SS 1898
WS 1897/98
SS 1897
Semester WS 1896/97
Hilbert’s Lecture Courses (cont.)
SUB 551: Grundlagen der Euklidischen Geometrie SUB 552: title as announced (v. Schaper) MI: title as announced (v. Schaper) SUB 553: title as announced
SUB 550: title as announced MI: Ausgewählte Kapitel der Zahlentheorie (N.N.)23
SUB 548: Focaleigenschaften der Curven und Flächen zweiter Ordnung MI: title as announced (N.N.)20 SUB 549: Zahlbegriff und Quadratur des Kreises
Corresponding Documents SUB 547: Algebraische Gleichungen MI: Theorie der Functionen einer complexen Variablen (Dörrie, 2 copies) MI: Theorie der algebraischen Invarianten (Marxen, 2 copies)
996 Hilbert’s Lecture Courses 1886–1934
Title Announced Differentialrechnung, 4st. Ausgewählte Capitel aus der Gruppentheorie, 2st. Einführung in die Variationsrechnung, 2st. Integralrechnung, 4st.25 Zahlbegriff und Quadratur des Kreises, 2st.26 Theorie der Flächenkrümmung, 2st. Theorie der Differentialgleichungen, 4st.28 Ausgewählte Capitel aus der Flächentheorie, 2st. Theorie der analytischen Functionen, 4st.29 Theorie der partiellen Differentialgleichungen, 4st. Algebra, 4st.30 Anwendungen der Theorie der partiellen Differentialgleichungen, 2st. Zahlbegriff und Quadratur des Kreises, 2st.31 Potentialtheorie, 4st. Differential- und Integralrechnung I. Teil, 4st. Grundlagen der Geometrie, 2st. Ausgewählte Capitel der Potentialtheorie, 2st.
MI: Vorlesung über lineare partielle Differentialgleichungen (Andrae) SUB 549, pp. 52–54: only a ‘Disposition’ of the course MI: Vorlesung über Potentialtheorie (Andrae) Inserted in SUB 554 (SS 1899): title as announced MI: title as announced (Adler) MI: title as announced (Andrae)
SUB 558: title as announced
SUB 557: title as announced
SUB 557: Einleitung in die Flächentheorie
27
Corresponding Documents SUB 554: title as announced SUB 556: title as announced SUB 555: title as announced
26 Not
in HVV. in HVV. 27 The manuscript of the lecture course from WS 1897/98 was probably used in this course, too. It contains many signs of revision, and in particular, on pp. 38–51, it contains additions which, at least in part, stem from a period later than 1897–1898. 28 Not in HVV. 29 Not in HVV. 30 Not in HVV. 31 Not in HVV.
25 Not
SS 1902
WS 1901/02
SS 1901
WS 1900/01
SS 1900
WS 1899/1900
Semester SS 1899
Hilbert’s Lecture Courses (cont.)
Hilbert’s Lecture Courses 1886–1934
997
Bestimmte Integrale, 2st. Zahlentheorie, 4st.35 E i n f ü h r u n g i n d i e T h e o r i e der I n t e g r a l g l e i c h u n g e n , 2st.36 Logische Prinzipien des mathematischen Denkens, 2st.
Funktionentheorie, 4st.34 Zahlbegriff und Quadratur des Kreises, 2st. Variationsrechnung, 4st.
Title Announced Differential- und Integralrechnung II. Teil, 4st. Mechanik der Continua, 4st. Theorie der Differentialgleichungen, 4st.32 Ausgewählte Capitel aus der Mechanik der Continua, 2st. Zahlbegriff und Quadratur des Kreises, 2st.33 Theorie der partiellen Differentialgleichungen, 4st.
33 Not
in HVV. in HVV, or in UAG Kur. 34 Not in HVV. 35 Not in HVV, or in UAG Kur. 36 According to HVV; UAG Kur has ‘Theorie der Integralgleichungen’. 37 This Ausarbeitung was acquired by the Nachlaß only in 1984.
32 Not
SS 1905
WS 1904/05
SS 1904
WS 1903/04
SS 1903
Semester WS 1902/03
Hilbert’s Lecture Courses (cont.)
MI: Einführung in die Theorie der Integralgleichungen (Hellinger) SUB 558a: title as announced (Born)37 MI: title as announced (Hellinger)
MI: title as announced (Born) MI: title as announced (Hellinger, 2 different documents, of different length) MI: Bestimmte Integrale und Fouriersche Reihen (Born)
MI: Partielle Differentialgleichungen (Prinz) MI: title as announced (Tieffenbach)
MI: Mechanik der Continua. Teil II (Berkowski)
Corresponding Documents Inserted in SUB 554: title as announced MI: Mechanik der Continua. Teil I (Berkowski)
998 Hilbert’s Lecture Courses 1886–1934
Theorie der Differentialgleichungen einer unabhängigen Variabeln, 4st. Theorie der partiellen Differentialgleichungen, 4st. Einführung in die Theorie der Funktionen unendlich vieler Variabler (Integralgleichungen), 2st.
SS 1907
MI: title as announced (Haar) MI: title as announced (Haar)
MI: Integralgleichungen (Hellinger) MI: title as announced (Ewald) MI: title as announced (Hellinger) MI: Vorlesung über die Mechanik der Continua (Marshall/Crathorne)42 MI: Theorie der Differentialgleichungen (Haar)
MI: title as announced (Hellinger, 2 copies)
Corresponding Documents MI: title as announced (Hellinger)38
38 For this lecture course, there exist in addition two partial Ausarbeitungen with the titles ‘Quadratische Formen mit unendlich vielen Variablen. Aus der Vorlesung über partielle Differentialgleichungen’ and ‘Theorie der quadratischen Formen mit unendlich vielen Variablen. Auszug aus der Vorlesung über partielle Differentialgleichungen im WS 1905/06’. 39 Not in HVV. 40 Not in HVV, or in UAG Kur. 41 According to UAG Kur; HVV has ‘Integralgleichungen’. 42 Not in HVV.
WS 1907/08
WS 1906/07
SS 1906
Title Announced Einleitung in die Theorie der partiellen Differentialgleichungen, 2st. Mechanik, 4st. Differential- und Integralrechnung erster Teil mit Übungen, mit Carathéodory, 4st.39 Mechanik der Continua, 4st.40 T h e o r i e d e r I n t e g r a l g l e i c h u n g e n , 4st.41 Differential- und Integralrechnung II. Teil, 4st. Mechanik der Continua, 4st.
Semester WS 1905/06
Hilbert’s Lecture Courses (cont.)
Hilbert’s Lecture Courses 1886–1934
999
Kinetische Gastheorie (Hecke) title as announced (N.N.) Strahlungstheorie (Hecke) Partielle Differentialgleichungen (Baule) MI: Molekulartheorie der Materie (Hecke, 2 copies)
MI: MI: MI: MI:
MI: title as announced (Behrens, 2 copies) MI: title as announced (Hecke)
MI: Vorlesung über Zahlentheorie (Courant) MI: Ausg. Kapitel der Funktionentheorie (Konforme Abbildungen) (Courant) MI: Theorie der partiellen Differentialgleichungen (Courant) MI: title as announced (Courant) MI: title as announced (Courant)
Corresponding Documents MI: title as announced (N.N.) MI: title as announced (Courant)43 MI: title as announced (N.N.)
44 Not
copies, one in Courant’s hand, entitled ‘Vorlesung über Funktionentheorie’ with the addition ‘Ausgearbeitet von R. Courant (Abschrift)’. in HVV, or in UAG Kur. 45 Not in HVV. UAG Kur has ‘Grundlagen der Analysis und Geometrie’, assigned 2 (academic) hours weekly and with 87 participants.
43 2
WS 1912/13
SS 1912
WS 1910/11 SS 1911 WS 1911/12
SS 1910
Allgemeine Theorie der partiellen Differentialgleichungen, 4st. Elemente und Prinzipienfragen der Mathematik, 4st. Ausgewählte Kapitel aus der Theorie der partiellen Differentialgleichungen, 2st. Mechanik, 4st. Mechanik der Kontinua, 4st. Logische Grundlagen der Mathematik, 1st.45 Mechanik der Kontinua, 4st. Gewöhnliche Differentialgleichungen, 4st. Mathematische Grundlagen der Physik, 4st. Einführung in die Theorie der partiellen Differentialgleichungen, 2st. Mathematische Grundlagen der Physik, 2st.
Prinzipien der Mathematik, 2st.44 Zahlentheorie, 4st. Ausgewählte Fragen aus der Funktionentheorie, 2st.
SS 1909
WS 1909/10
Title Announced Prinzipien der Mathematik, 4st. Funktionentheorie, 4st.
Semester SS 1908 WS 1908/09
Hilbert’s Lecture Courses (cont.)
1000 Hilbert’s Lecture Courses 1886–1934
Ausgewählte Kapitel der statistischen Mechanik, 2st. Probleme und Prinzipienfragen der Mathematik, 4st. Variationsrechnung, 4st. Ausgewählte Kapitel über Struktur der Materie, 2st. Differentialgleichungen, 4st. Partielle Differentialgleichungen, 2st. Einleitung in die Prinzipien der Physik, 2st. Mengenlehre, 4st.47 Die Grundlagen der Physik, 4st.48 Mengenlehre, 4st.
Theorie der Elektronenbewegung, 2st. Analytische Mechanik, 4st.46 Elektromagnetische Schwingungen, 2st. Differentialgleichungen, 4st.
Title Announced Elemente und Prinzipien der Mathematik, 4st.
Vorlesung über die Struktur der Materie title as announced (N.N.) title as announced (Bär) Die Grundlagen der Physik (N.N.)
MI: Die Grundlagen der Physik II (Bär)49 MI: title as announced (Goeb, 2 copies)
MI: MI: MI: MI:
Corresponding Documents SUB 559: contains a draft as well as ‘Einige Abschnitte aus der Vorlesung über die Grundlagen der Mathematik und Physik’ (Baule) MI: Elektronentheorie (Hecke) MI: Entwurf in Mechanik–Ausarbeitung WS 1910/11 MI: title as announced (Hecke) Inserted in the document for the WS 1909/10: ‘Theorie der partiellen Differentialgl. (1914)’ (N.N.) MI: Statistische Mechanik (Lange) SUB 559: contains a draft
46 There is a reference to this lecture course in the entry ‘Mechanik mit Übungen: Prof. Hilbert und Dr. Weyl’ under ‘Theoretische, experimentelle und angewandte Physik’. 47 Not in HVV. In UAG Kur the lecture course is listed, although in the column listing the number of participants a ‘*’ appears, probably indicating that the course was not held. 48 Not announced in the Vorlesungsverzeichnis. The title comes from HVV, and the number of hours assigned from UAG Kur. 49 P. 107 of this copy is missing. However, see the entry for WS 1916/17 in the supplementary list beginning on p. 1005, below.
SS 1917
WS 1916/17
WS 1915/16 SS 1916
WS 1914/15 SS 1915
SS 1914
WS 1913/14
Semester SS 1913
Hilbert’s Lecture Courses (cont.)
Hilbert’s Lecture Courses 1886–1934
1001
Einsteinsche Gravitationstheorie, 4st. Grundgedanken der Relativitätstheorie (für Hörer aller Fakultäten), 1st.
Probleme der mathematischen Logik, 1st. Anschauliche Geometrie, 4st.
Zahlbegriff und Quadratur des Kreises, 4st. Denkmethoden in den exakten Wissenschaften, 1st. Natur und mathematisches Erkennen, 2st. Formale Logik und ihr erkenntnistheoretischer Wert, 2st. Mechanik, 4st. Höhere Mechanik und neue Gravitationstheorie, 4st.
Differentialgleichungen, 4st. Partielle Integral- und Differentialgleichungen, 4st.51 Mengenlehre, 2st.52 Über Raum und Zeit (allgemeinverständlich), 1st.
Title Announced Prinzipien der Mathematik, 2st.50 Elektronentheorie, 2st.
MI: title as announced (Bernays)
MI: title as announced (Bernays)54 MI: Logik-Kalkül (Bernays) MI: Mechanik und neue Gravitationstheorie (Kratzer) SUB 562: title as announced (Kratzer) MI: = SUB 562 MI: title as announced (Schönfinkel, Bernays) SUB 563: title as announced (Rosemann) MI: = SUB 563 (2 copies)
53
SUB 561: Raum und Zeit (Bernays) MI: = SUB 561
Corresponding Documents MI: title as announced (Bernays, 2 copies) SUB 560: title as announced (Humm) MI: = SUB 560
51 In
HVV, the title is ‘Prinzipien der Mathematik und Logik’. HVV, the title is ‘Partielle Differentialgleichungen’. 52 Not in HVV, or in UAG Kur. 53 Verzeichnis 1943* lists notes for this (a ‘Nachschrift’) which are no longer traceable. According to HVV, Bernays was the Ausarbeiter. 54 Published as Hilbert 1992 .
50 In
SS 1921
WS 1920/21
SS 1920
HZS 1919 WS 1920
SS 1919
SS 1918 WS 1918/19
Semester WS 1917/18
Hilbert’s Lecture Courses (cont.)
1002 Hilbert’s Lecture Courses 1886–1934
Wissen und mathematisches Denken (für Hörer aller Fakultäten), 1st. Grundlagen der Arithmetik, 2st.55
WS 1922/23
Mechanik, 4st.
SS 1924
59
SUB 568: Über die Einheit in der Naturerkenntnis SUB 569: title as announced60 (Diestel) MI: = Typescript of SUB 568 (N.N.) SUB 570: Einleitung in die Vorlesung über Mechanik MI: Relativitätstheorie; Ergänzung zur Vorlesung über allgemeine Mechanik im SS 24 (Nordheim)61
57
SUB 567: Logische Grundlagen der Mathematik (Bernays)56 SUB 566: title as announced (Nordheim, Heckhausen) MI: = SUB 566
Corresponding Documents MI: Grundlagen der Mathematik (Bernays) SUB 565 (Nordheim) MI: = SUB 565 MI: title as announced (Ackermann)
56 In
gives the title of the extant document. part, a typescript prepared by Bernays, in part a manuscript in Hilbert’s hand. 57 Addition in HVV, probably in Hilbert’s hand: ‘s. 1920/21’. 58 Not in HVV. See also footnote 72, below. 59 Addition in HVV, probably in Hilbert’s hand: ‘s. 1922/23’. Indeed, the handwritten part of Hilbert 1922/24* contains passages which could not have been composed before the end of 1923. This is clear from the paper on which they are written. 60 Added in parentheses on the title page of SUB 569: ‘(Einheit in der Naturerkenntnis)’. 61 HVV notes: ‘teilweise ausgearb., Nordheim’.
55 HVV
Anschauliche Geometrie, 4st. Mengenlehre, 4st.58 L o g i s c h e G r u n d l a g e n d e r M a t h e m a t i k , 4st. Unsere Vorstellungen von Gravitation und Elektrizität (allgemeinverständlich), 1st.
SS 1923 WS 1923/24
Mathematische Grundlagen der Quantentheorie, 2st.
Title Announced Grundlegung der Mathematik, 4st. Statistische Methoden insbesondere der Physik, 4st.
Semester WS 1921/22 SS 1922
Hilbert’s Lecture Courses (cont.)
Hilbert’s Lecture Courses 1886–1934
1003
Mengenlehre, 4st. Theorie der algebraischen Invarianten, 4st. Mathematische Methoden der neuen Physik, 2st. Natur und Denken, 1st. Grundlagen der Mathematik, 1st.67
SS 1929 WS 1929/30 SS 1930 WS 1930/31 SS 1931
gives only the subtitle in parentheses. pages of introductory remarks (in Hilbert’s hand) for the course in 1924/25 have been pasted in at the end of the Born Ausarbeitung for
66
MI: See Born’s Ausarbeitung for the course ‘Zahlbegriff und Quadratur des Kreises’ for SS 190465
SUB 570a: title as announced (Struik) MI: Vorlesung über die Theorie der algebraischen Zahlen (N.N.) MI: title as announced (Nordheim) MI title as announced (Schmidt)
Corresponding Documents MI: See Born’s Ausarbeitung for the course ‘Zahlbegriff und Quadratur des Kreises’ for SS 190463 MI: title as announced (Nordheim, 2 copies)
1904. 64 HVV gives the title as ‘Algebraische Zahlkörper’. 65 A few lines of introductory remarks (again in Hilbert’s hand) for the course in 1928/29 were added to those for 1924/25; see footnote 63. 66 Verzeichnis 1943* lists notes for this course, but these could not be found. 67 According to HVV, this was a seminar.
63 Two
62 HVV
Mathematische Methoden der Quantentheorie, 4st. Grundlagen der Geometrie, 4st. Grundlagen der Mathematik, 4st. Anschauliche Geometrie, 4st. Zahlbegriff und Quadratur des Kreises, 4st.
Title Announced Quadratur des Kreises (Elementarmathematik nach höheren Methoden), 4st.62 Über das Unendliche (allgemeinverständlich), 1st. Anschauliche Geometrie, 4st. Über Raum und Zeit (allgemeinverständlich), 1st. Zahlentheorie, 4st. Theorie der algebraischen Zahlen, 4st.64
WS 1926/27 SS 1927 WS 1927/28 SS 1928 WS 1928/29
SS 1926
SS 1925 WS 1925/26
Semester WS 1924/25
Hilbert’s Lecture Courses (cont.)
1004 Hilbert’s Lecture Courses 1886–1934
SUB 607/6: ‘Einleitung zu Kolleg WS 32/33’
Corresponding Documents SUB 607/1: ‘Einlage zu Vorl. Winter 31/32’68
Supplementary List of Manuscripts
Title Announced Einleitung in die Philosophie auf Grund moderner Naturwissenschaft (für Hörer aller Fakultäten), 1st. Grundlagenfragen der Geometrie, 1st. Grundlagen der Logik, allgemeinverständlich (für Hörer aller Fakultäten), 1st. Wissen und Denken (für Hörer aller Fakultäten), 1st. Grundlagen der Geometrie, mit Schmidt 2st.
68 Verzeichnis
SS 1895:
SS 1892:
SS 1891:
1943* lists notes for this course, but these could not be found.
Transcription or reworking by Julius Hurwitz of Hilbert’s lectures on projective geometry with the title ‘Geometrie der Lage’, held in the Wissenschaftlich-historische Sammlung of the library of the Eidgenössische Technische Hochschule in Zürich, Nachlaß of Adolf Hurwitz, call-sign Hs. 582: 158. Ausarbeitung by Julius Hurwitz of Hilbert’s lectures on single-valued functions entitled ‘Die eindeutigen Funktionen mit linearen Transformationen in sich, nach Vorlesungen in Königsberg 1892 SS’, held in the Wissenschaftlich-historische Sammlung of the library of the Eidgenössische Technische Hochschule in Zürich, Nachlaß of Adolf Hurwitz, call-sign Hs. 582: 154. The catalogue entry states: ‘Von Hilbert durchgesehen u. mit eigenhändigen Randbemerkungen versehen’. Manuscript of notes on the lectures on elliptic functions bearing the title ‘Theorie der elliptischen Functionen’; pp. 314– 336 appear to have been added (in pencil) in 1942. Kept in the Rare Book and Special Collections section of the Library of the University of Illinois at Urbana-Champaign under the call-sign 515.983 H54T.
The following documents (listed in chronological order) relating to Hilbert’s lecture courses are not in either of the two main official repositories of Hilbert’s work. In most cases, the Editors are not directly acquainted with the documents themselves.
WS 1933/34
SS 1933
SS 1932 WS 1932/33
Semester WS 1931/32
Hilbert’s Lecture Courses (cont.)
Hilbert’s Lecture Courses 1886–1934
1005
Manuscript of notes on the lectures on partial differential equations bearing the title ‘Partielle Differentialgleichungen’. Kept in the Rare Book and Special Collections section of the Library of the University of Illinois at Urbana-Champaign under the call-sign 515.353 H54P. Manuscript of notes on the lectures on the theory of functions of a complex variable bearing the title ‘Theorie der Functionen einer complexen Variablen’, apparently in two parts of 271 and 105 pages respectively. (Pp. 241–271 and pp. 104–105 appear to have been added in pencil in 1942.) Kept in the Rare Book and Special Collections section of the Library of the University of Illinois at Urbana-Champaign under the call-sign 515.93 H54T.69 3 copies of the autograph of the Ausarbeitung prepared by Hans von Schaper of Hilbert’s lectures on the foundations of Euclidean geometry from 1898/99. These copies exist in university libraries in Berlin, Bremen and Oslo. See the Introduction to Chapter 4 of Hallett and Majer 2004 . In addition, the Widener Library at Harvard University in Cambridge, Massachussetts, possesses a copy of this autograph made in 1902. Manuscript of notes on the lectures on the calculus of variations bearing the title ‘Variations-rechnung’. The fly-leaf bears the autograph ‘Arthur R. Crathorne’, and there is also a note on the fly-leaf which reads: ‘Up to page 68 where the red lines are drawn across the pages, these notes are as I took them during the lectures, with additions in pencil on the opposite page. From about page 69 the notes are copied from the Hefts in the Lesezimmer’. Kept in the Mathematics Section of the Library of the University of Illinois at Urbana-Champaign under the call-sign 515.64 H54V.70 (1) Manuscript (handwritten, 151 pages, bound) for the course ‘Einführung in die Theorie der Integralgleichungen’, and with this title; library of the Max-Planck-Institut für Wissenschaftsgeschichte in Berlin. The library stamp (bottom, centred) appears on the reverse of the title page. Above it is written in hand ‘Rara’, and below it the number ‘07-1568’, standing for the year (2007) in which the document was first acquired by the library, and then the order of acquisition. In the upper left-hand corner (in what appears to be the same hand) is written ‘Rara H641c’, indicating the place where the document is to be found in the library’s holdings. The page is otherwise blank. The title page carries an illegible handwritten signature; it is marked ‘Göttingen’, and appears to attribute the text to Ernst Hellinger, although the
69 The two parts might well correspond to the two courses ‘Theorie der Funktionen einer complexen Veränderlichen’ in WS 1896/97 and ‘Theorie der Funktionen einer complexen Veränderlichen, II Teil’ in SS 1897. 70 The Library of the University of Illinois at Urbana-Champaign also contains two documents listed under Hilbert which are possibly of relevance, bearing the titles ‘Mechanik’ (531 H54M), dated as 1905, and ‘Mechanik der Continua’ (532.5 H54M), no date listed. The first document might well be tied to the course ‘Mechanik’ for WS 1905/06, and ‘Mechanik der Continua’ is to be compared to the second document listed above for the WS 1906/07 lecture course ‘Mechanik der Continua’, namely ‘Vorlesung über die Mechanik der Continua’ (Marshall/Crathorne).
SS 1905:
WS 1904/05:
WS 1898/99:
WS 1896/97:
WS 1895/96:
1006 Hilbert’s Lecture Courses 1886–1934
WS 1916/17:
WS 1914/15:
WS 1913/14:
SS 1913:
SS 1912:
WS 1910/11:
WS 1906/07:
WS 1905/06:
handwriting is not the same as that of the Göttingen manuscript. It is also has only 151 pages, while the latter has 304 pages, and furthermore lacks the detailed table of contents which has clearly been added to the Göttingen manuscript. (2) Notes and an incomplete Ausarbeitung by Otto Birck for the lecture course ‘Logische Prinzipien des mathematischen Denkens’. Kept under this title in the Universitätsarchiv of the Universität Bonn. A copy of Hellinger’s Ausarbeitung for the lecture course ‘Mechanik’, in the library of the Mechanics Centre of the Technische Universität Braunschweig. 6 copies of Hellinger’s Ausarbeitung for the lecture course ‘Mechanik der Continua’, in the library of the Mechanics Centre of the Technische Universität Braunschweig. A copy of Frankfurter’s Ausarbeitung for the lecture course ‘Mechanik’, in the library of the Mechanics Centre of the Technische Universität Braunschweig. Ausarbeitung (handwritten, 149 pages of text, bound) of the lecture course ‘Gewöhnliche Differentialgleichungen’; the manuscript is entitled ‘Allgemeine Theorie der Gewöhnlichen Differentialgleichungen’, and is by E. Wicke. At the bottom of the title page is the inscription ‘Eigentum von E. Wicke, st. m.’ written in the same hand as the other details. Library of the Max-Planck-Institut für Wissenschaftsgeschichte in Berlin. The library stamp (top, centred) appears on the reverse of the title page. Above it is written in hand ‘Rara’, and below it the number ‘08-1344’, standing for the year (2008) in which the document was first acquired by the library and the order of acquisition. In the upper left-hand corner (in what appears to be the same hand) is written ‘Rara H641a’, indicating the place where the document is to be found in the library’s holdings. The page is otherwise blank. The text appears to differ from that in the MI, Göttingen, this latter being of 175 typewritten pages. In all probability, therefore, it represents a different Ausarbeitung from the anonymous one in the MI. A copy of Hecke’s Ausarbeitung for the lecture course ‘Elektronentheorie’, in the library of the Fakultät für Mathematik und Informatik of the Universität Heidelberg. 2 copies of Hecke’s Ausarbeitung for the lecture course ‘Elektromagnetische Schwingungen’, in the library of the Fakultät für Mathematik und Informatik of the Universität Heidelberg. Ausarbeitung by an unknown hand of the lecture course ‘Probleme und Prinzipienfragen der Mathematik’, held under this title in the library of the Institute for Advanced Study in Princeton. (a) An unbound copy of Bär’s Ausarbeitung for the lecture course ‘Die Grundlagen der Physik’ in the papers of Erich Hückel; Staatsbibliothek Preußischer Kulturbesitz, Berlin, Handschriftenabteilung, Nachl. Hückel 2.11. This copy exhibits exactly the same pagination as the Göttingen copy, and contains the same corrections; these are in Bär’s hand up to p. 155, but in a different, unidentified hand thereafter. This copy possesses p. 107, which missing in the Göttingen copy.
Hilbert’s Lecture Courses 1886–1934
1007
72 The
Peterhans was a student of mathematics and philosophy in Göttingen between 1921 and 1924. He later became a prominent photographer. dates named fall on Thursday, Monday and again Thursday, the weekdays on which Hilbert in these years ordinarily held his four hour lectures. These were the days for which the lecture course ‘Mengenlehre’ was also announced, which makes it likely that this latter course did not take place.
71 Walter
WS 1923/24:
WS 1922/23:
WS 1921/22:
SS 1920:
WS 1917/18:
(b) Two additional bound copies (typewritten) with identical underlying text to, but different pagination from, the Bär Ausarbeitung, and with the same corrections as in Bär’s Ausarbeitung, but incorporated in the typewritten script. The title page attributes the Ausarbeitung to Paul Scherrer. One copy is in the Born Nachlaß in the Staatsbibliothek Preußischer Kulturbesitz, Berlin, Handschriftenabteilung, Nachl. Born 1818; the other forms part of the papers of Paul Epstein, which are now in the Archives of the California Institute of Technology, Pasadena. The document carries the Call No. QA401.H5. Notes by Paul Bernays in Gabelsberger shorthand relating to the lecture course ‘Prinzipien der Mathematik’, in the Archives of the Eidgenössische Technische Hochschule in Zürich (call-sign: Hs. 973.184). Notes (32 pages) taken by Hellmuth Kneser entitled ‘Höhere Mechanik’ for the lecture course announced as ‘Höhere Mechanik und neue Gravitationstheorie’; formerly in the possession of Hellmuth Kneser’s son Martin Kneser, now in the SUB under Cod. Ms. H. Kneser B4. (a) Notes taken by Hellmuth Kneser for the lecture course announced as ‘Grundlegung der Mathematik’ with the abbreviated title ‘Grundl. d. Math.’; formerly in the possession of Hellmuth Kneser’s son Martin Kneser, now in the Handschriftenabteilung of the SUB under Cod. Ms. H. Kneser B8. (b) Incomplete notes for the same lecture course in an unknown hand, in the Archiv of the Universität Bonn under the title ‘Grundlegung der Mathematik’. (a) Notes taken by Hellmuth Kneser for the lectures course announced as ‘Grundlagen der Arithmetik’ with the abbreviated title ‘Grundl. d. Math.’; formerly in the possession of Hellmuth Kneser’s son Martin Kneser, now in the Handschriftenabteilung of the SUB under Cod. Ms. H. Kneser B9. (b) A polished Ausarbeitung (in large part typescript) by Walter Peterhans71 entitled ‘Die Grundlagen der Arithmetik und Analysis’ based on the course ‘Grundlagen der Arithmetik’ for WS 1922/23. In the possession of the Folkwangmuseum in Essen. Notes by Hellmuth Kneser relating to lectures by Hilbert on the 21, 25 and 28 February 1924, probably from the course ‘Logische Grundlagen der Mathematik’;72 formerly in the possession of Hellmuth Kneser’s son Martin Kneser, now in the Handschriftenabteilung of the SUB under Cod. Ms. H. Kneser B9.
1008 Hilbert’s Lecture Courses 1886–1934
WS 1929/30:
SS 1929:
Notes taken (handwritten, 82 pages) by Lothar Collatz with the title ‘Mengenlehre’ for the lecture course announced under the same title, in the Collatz Nachlaß held in the Handschriftenabteilung of the Library at the Universität Hamburg. Notes taken (handwritten, 102 pages) by Lothar Collatz with the title ‘Theorie der algebraischen Invarianten’ for the lecture course announced under the same title, in the Collatz Nachlaß held in the Handschriftenabteilung of the Library at the Universität Hamburg.
Hilbert’s Lecture Courses 1886–1934
1009
Bibliography
Entries marked with an asterisk refer to unpublished items, above all, doctoral theses, items from various archival sources, in particular from the Lesesaal of the Mathematisches Institut of Göttingen University.
Ackermann 1924a* Wilhelm Ackermann: Begruendung des „tertium non datur“ mittels der Hilbertschen Theorie der Widerspruchsfreiheit. – Dissertation, presented to the Georg-August-Universität zu Göttingen. Handschriftenabteilung der Staatsund Universitätsbibliothek der Georg-August Universität Göttingen, under the call-sign: ‘4 Diss Nat Göttingen 1924, Ackermann’. Ackermann 1924b Wilhelm Ackermann: Die Widerspruchsfreiheit des Auswahlaxioms. – Nachrichten von der Gesellschaft der Wissenschaften zu Göttingen. Mathematisch-Physikalische Klasse (1924), 246–250. Ackermann 1925 Wilhelm Ackermann: Begründung des „tertium non datur“ mittels der Hilbertschen Theorie der Widerspruchsfreiheit. – Mathematische Annalen 93 (1924), 1–36. Published version of Ackermann 1924a* . Ackermann 1927 Wilhelm Ackermann: J. von. Neumann. Zur Hilbertschen Beweistheorie. – Jahrbuch über die Fortschritte der Mathematik 53 (1927), 40. Ackermann 1928a Wilhelm Ackermann: Zum Hilbertschen Aufbau der reellen Zahlen. – Mathematische Annalen 99 (1928), 118–133. Ackermann 1928b Wilhelm Ackermann: Über die Erfüllbarkeit gewisser Zählausdrücke. – Mathematische Annalen 100 (1928), 638–649. Ackermann 1940 Wilhelm Ackermann: Zur Widerspruchsfreiheit der Zahlentheorie. – Mathematische Annalen 117 (1940), 162–194. W. Ewald and W. Sieg (eds.), David Hilbert’s Lectures on the Foundations of Arithmetic and Logic 1917–1933, DOI 10.1007/978-3-540-69444-1, © Springer-Verlag Berlin Heidelberg 2013
1011
1012
Bibliography
Agazzi and Darvas 1997 Evandro Agazzi and György Darvas (eds.): Philosophy of Mathematics Today. – Dordrecht, Holland: Kluwer Academic Publishers 1997. Aspray and Kitcher 1988 William Aspray and Philip Kitcher (eds.): History and Philosophy of Modern Mathematics. – Minneapolis: University of Minnesota Press 1988. Minnesota Studies in the Philosophy of Science, 11. Avigad and Zach 2007 Jeremy Avigad and Richard Zach: The epsilon calculus. – Stanford Encyclopedia of Philosophy (2007). http://plato.stanford.edu/entries/ epsilon-calculus (version of July 2007). Awodey and Reck 2002 Steven Awodey and Erich Reck: Categoricity and completeness: 19th-century axiomatics to 21st-century semantics. – History and Philosophy of Logic 23 (2002), 1–30, 77–94. Ayer 1959 Alfred J. Ayer (ed.): Logical Positivism. – New York: The Free Press 1959. Baldus 1928 Richard Baldus: Zur Axiomatik der Geometrie. I. Über Hilberts Vollständigkeitsaxiom. – Mathematische Annalen 100 (1928), 321–333. Behmann 1918* Heinrich Behmann: Die Antinomie der transfiniten Zahl und ihre Auflösung durch die Theorie von Russell und Whitehead. – Universität Göttingen 1918. Dissertation, presented to the Georg-August-Universität zu Göttingen. Handschriftenabteilung der Staats- und Universitätsbibliothek der GeorgAugust Universität Göttingen, under the call-signs: ‘4 Diss Nat Göttingen 1918, Behmann: 1, Behmann: 2’. Behmann 1921* Heinrich Behmann: Entscheidungsproblem und Algebra der Logik. – Behmann Archive, University of Erlangen. Behmann 1922 Heinrich Behmann: Beiträge zur Algebra der Logik, insbesondere zum Entscheidungsproblem. – Mathematische Annalen 86 (1922), 163–229. Behmann 1927 Heinrich Behmann: Mathematik und Logik. – Leipzig/Berlin: B. G. Teubner 1927. Mathematisch-Physikalische Bibliothek, 71.
Bibliography
1013
Behnke 1976 Heinrich Behnke: Die goldenen Jahre des Mathematischen Seminars der Universität Hamburg. – Mitteilungen der Mathematischen Gesellschaft in Hamburg 10 (1976), 225–240. Benacerraf and Putnam 1964 Paul Benacerraf and Hilary Putnam (eds.): Philosophy of Mathematics. Selected Readings. – Oxford: Basil Blackwell 1964. Benacerraf and Putnam 1983 Paul Benacerraf and Hilary Putnam (eds.): Philosophy of Mathematics. Selected Readings. Second Edition. – Cambridge: Cambridge University Press 1983. Bernays 1918* Paul Bernays: Beiträge zur axiomatischen Behandlung des Logik-Kalküls. – Bibliothek of the Eidgenössische Technische Hochschule, Wissenschaftshistorische Sammlung, Bernays Nachlaß, Cod. Ms. P. Bernays 973: 192, 1918. Habilitationsschrift, presented to the Georg-August-Universität zu Göttingen on 9 July 1918. Reprinted in this Volume, 222–268. Bernays 1921 Paul Bernays: Über Hilberts Gedanken zur Grundlegung der Arithmetik. – Jahresbericht der Deutschen Mathematiker Vereinigung 30 (1921), 99. Summary of Bernays’s lecture delivered at the Mathematikertagung in Jena, 23 September 1921, in the section Angelegenheiten der deutschen MathematikerVereinigung. See Bernays 1922a. Bernays 1922a Paul Bernays: Über Hilberts Gedanken zur Grundlegung der Arithmetik. – Jahresbericht der Deutschen Mathematiker Vereinigung 31 (1922), 10–19. Paper derived from Bernays’s lecture delivered at the Mathematikertagung in Jena, 23 September 1921. Received 13 October 1921. English translation in Mancosu 1998 , 214–222. Bernays 1922b Paul Bernays: Die Bedeutung Hilberts für die Philosophie der Mathematik. – Die Naturwissenschaften, Wochenschrift für die Fortschritte der Naturwissenschaft, der Medizin und der Technik 10 (1922), 93–99. English translation in Mancosu 1998 , 189–197. Bernays 1926 Paul Bernays: Axiomatische Untersuchung des Aussagen-Kalküls der „Principia Mathematica“. – Mathematische Zeitschrift 25 (1926), 305–320.
1014
Bibliography
Bernays 1927 Paul Bernays: Probleme der theoretischen Logik. – Unterrichtsblätter für Mathematik und Naturwissenschaften 33 (1927), 369–377. Republished in Bernays 1976a, 1–16. Bernays 1928 Paul Bernays: Zusatz zu Hilberts Vortrag über „Die Grundlagen der Mathematik“. – Abhandlungen aus dem Mathematischen Seminar der Hamburgischen Universität 6 (1928), 89–92. Reprinted in this Volume, 946–949. English translation in van Heijenoort 1967 , 485–489. Bernays 1930 Paul Bernays: Die Philosophie der Mathematik und die Hilbertsche Beweistheorie. – Blätter für deutsche Philosophie 4 (1930), 326–367. Republished in Bernays 1976a, 17–61. Bernays 1932 Paul Bernays: Methoden des Nachweises von Widerspuchsfreiheit und ihre Grenzen. – In Verhandlungen 1932 , 342–343. Bernays 1935 Paul Bernays: Hilberts Untersuchungen über die Grundlagen der Arithmetik. – In Hilbert 1935 , 196–216. Bernays 1954 Paul Bernays: Zur Beurteilung der Situation in der beweistheoretischen Forschung. – Revue internationale de Philosophie (1954), 9–21. Bernays 1967 Paul Bernays: Hilbert, David. – In Edwards 1967 , 496–504. Bernays 1976a Paul Bernays: Abhandlungen zur Philosophie der Mathematik. – Darmstadt: Wissenschaftliche Buchgesellschaft 1976. Bernays 1976b Paul Bernays: Kurze Biographie. – In Müller 1976 , xiv–xvi. Bernays 1977* Paul Bernays: Three recorded interviews, given to J-P. Sydler and E. Clavadetscher on 25.7.1977, 13.8.1977, 27.8.1977. – Bibliothek of the Eidgenössische Technische Hochschule, Wissenschaftshistorische Sammlung, Bernays Nachlaß, Cod. Ms. P. Bernays T 1285. Bernays and Schönfinkel 1928 Paul Bernays and Moses Schönfinkel: Zum Entscheidungsproblem der mathematischen Logik. – Mathematische Annalen 99 (1928), 342–372.
Bibliography
1015
Bernstein 1916 Benjamin Abram Bernstein: A set of four independent postulates for Boolean algebras. – Transactions of the American Mathematical Society 17 (1916), 1, 50–52. Bernstein 1919 Felix Bernstein: Die Mengenlehre Georg Cantors und der Finitismus. – Jahresbericht der Deutschen Mathematiker Vereinigung 28 (1919), 63–78. Blumenthal 1922 Otto Blumenthal: David Hilbert. – Die Naturwissenschaften, Wochenschrift für die Fortschritte der Naturwissenschaft, der Medizin und der Technik 10 (1922), 67–72. Boole 1847 George Boole: The Mathematical Analysis of Logic, being an essay towards a calculus of deductive reasoning. – Cambridge: Macmillan, Barclay & Macmillan 1847. Boole 1848 George Boole: The calculus of logic. – Cambridge and Dublin Mathematical Journal 3 (1848), 183–198. Boole 1854a George Boole: An Investigation of the Laws of Thought. – London: Walton and Maberly 1854. Boole 1854b George Boole: On a general method in the theory of probabilities. – London, Edinburgh and Dublin Philosophical Magazine and Journal of Science 8 (1854), 431–444. Brouwer 1912 Luitzen Egbertus Jan Brouwer: Intuitionisme en Formalisme. Rede bij de aanvaarding van bet ambt buitengewoon boogleraar in de wiskunde aan de Universiteit van Amsterdam op Maandag 14 October uitgesproken door Dr. L. E. J. Brouwer. – Amsterdam: Clausen 1912. English translation in Brouwer 1913 . Brouwer 1913 Luitzen Egbertus Jan Brouwer: Intuitionism and formalism. – Bulletin of the American Mathematical Society 20 (1913), 81–96. English translation of Brouwer 1912 . Reprinted in Benacerraf and Putnam 1964 , 66–77, Benacerraf and Putnam 1983 , 77–89 and Brouwer 1975 , 123–138.
1016
Bibliography
Brouwer 1928a Luitzen Egbertus Jan Brouwer: Intuitionistische Betrachtungen über Formalismus. – Koninklijke Akademie van Wetenschappen te Amsterdam, Proceedings of the Section of Sciences 31 (1927), 374–379. Also published as Brouwer 1928b. English translation in van Heijenoort 1967 , 490–492, and also in Mancosu 1998 , 40–44. Brouwer 1928b Luitzen Egbertus Jan Brouwer: Intuitionistische Betrachtungen über Formalismus. – Sitzungsberichte der preussischen Akademie der Wissenschaften zu Berlin. Physikalische-Mathematische Klasse 1928 (1927), 48–52. Also published as Brouwer 1928a. English translation in van Heijenoort 1967 , 490–492, and also in Mancosu 1998 , 40–44. Brouwer 1975 Luitzen Egbertus Jan Brouwer: Collected Works, Volume 1: Philosophy and Foundations of Mathematics. Edited by Arendt Heyting. – Amsterdam: North-Holland 1975. Burali-Forti 1894 Cesare Burali-Forti: Logica Matematica. – Milan: Hoepli 1894. Cantor 1883a Georg Cantor: Ueber unendliche, lineare Punktmannichfaltigkeiten (5). – Mathematische Annalen 21 (1883), 545–591. Republished (slightly expanded) as Cantor 1883b; reprinted in Cantor 1932 , 165–209. Cantor 1883b Georg Cantor: Grundlagen einer allgemeinen Mannichfaltigkeitslehre. Ein mathematisch-philosophischer Versuch in der Lehre des Unendlichen. – Leipzig: Teubner 1883. English translation in Ewald 1996 , Volume 2, 881–920. Cantor 1932 Georg Cantor: Georg Cantor: Gesammelte Abhandlungen mathematischen und philosophischen Inhalts. Mit erläuternden Anmerkungen sowie mit Ergänzungen aus dem Briefwechsel Cantor-Dedekind herausgegeben von Ernst Zermelo. – Berlin: Springer 1932. Carnap 1931 Rudolf Carnap: Überwindung der Metaphysik durch logische Analyse der Sprache. – Erkenntnis 2 (1931), 219–241. English translation by Arthur Pap in Ayer 1959 , 60–81. Carnap 1935 Rudolf Carnap: Ein Gültigkeitskriterium für die Sätze der klassischen Mathematik. – Monatshefte für Mathematik und Physik 42 (1935), 163–190.
Bibliography
1017
Cauer 1931 Wilhelm Cauer: Untersuchungen über ein Problem, das drei positiv definite quadratische Formen mit Streckenkomplexen in Beziehung setzt. – Mathematische Annalen 105 (1931), 86–132. Chwistek 1924–25 Leon Chwistek: The theory of constructive types. Principles of logic and mathematics. – Annales de la Société Polonaise de Mathématique (Rocznik Polskiego Towarzystwa Matematycznego) II (1924–25), 9–48. Part II published in vol. III, 92–141, 1925. Congresso 1929 Congresso internazionale dei matematici. Bologna, 3–10 Settembre 1928 VI . Tomo I. Rendiconto del congresso conferenze. – Bologna: Nicola Zanichelli 1929. Cori et. al. 2005 René Cori, Alexander Razborov, Stevo Todorþeviü and Carol Wood (eds.): Logic Colloquium 2000. – Wellesley, Massachussetts: Association for Symbolic Logic/A. K. Peters 2005. Courant 1981 Richard Courant: Reminiscences from Hilbert’s Göttingen. – Mathematical Intelligencer 3 (1981), 154–164. The reminiscences were originally recorded in January, 1964. Courant and Hilbert 1924 Richard Courant and David Hilbert: Methoden der mathematischen Physik. Erster Band. – Berlin: Springer 1924. Die Grundlehren der mathematischen Wissenschaften in Einzeldarstellungen mit besonderer Berücksichtigung der Anwendungsgebiete, 12. Couturat 1905 Louis-Alexandre Couturat: L’algèbre de la logique. – Paris: Gauthier-Villars 1905. van Dalen 1999 Dirk van Dalen: Mystic, Geometer and Intuitionist: The Life of L. E. J. Brouwer. Volume 1: The Dawning Revolution. – Oxford: Clarendon Press 1999. Davis 1965 Martin Davis (ed.): The Undecidable. – New York: Raven Press Books 1965. Dawson 1986 John W. Dawson: Introductory Note to Gödel 1931b. – In Gödel 1986 , 196– 199.
1018
Bibliography
Dawson 1997 John W. Dawson: Logical Dilemmas: The Life and Work of Kurt Gödel. – Wellesley, Massachusetts: A. H. Peters 1997. De Morgan 1846–63 Augustus De Morgan: On the syllogism. – Transactions of the Cambridge Philosophical Society (1846–63). I (8): 379–408, 1846; II (9): 79–127, 1850; III (10): 173–230, 1858; IV (10): 331–358 and *355–*358, 1860; V (10): 428– 487, 1863. These papers are reprinted in On the Syllogism and Other Logical Writings by Augustus De Morgan, edited, with an introduction, by Peter Heath. London: Routledge & Kegan Paul 1966. De Morgan 1847 Augustus De Morgan: Formal Logic, or The Calculus of Inference, Necessary and Probable. – London: Taylor and Walton 1847. Dedekind 1888 Richard Dedekind: Was sind und was sollen die Zahlen?. – Braunschweig: Vieweg 1888. Later editions (before the publication of Dedekind’s Gesammelte mathematische Werke) were Dedekind 1893 , Dedekind 1911 , Dedekind 1918 , Dedekind 1923 , Dedekind 1930 . Reprinted in Dedekind 1932 , 335–391. English translation in Ewald 1996 , 787–833. Dedekind 1890* Richard Dedekind: Brief an Keferstein. – In Sinaceur 1974 , 271–278. Sinaceur 1974 also gives a French translation; an English translation is in van Heijenoort 1967 , 99–103. The original is in the Dedekind Nachlaß held in the Niedersächsiche Staats- und Universitätsbibliothek, Göttingen, under the signature ‘Cod. Ms. Dedekind, Mappe 13’. Dedekind 1893 Richard Dedekind: Was sind und was sollen die Zahlen? Zweite unveränderte Auflage. Meiner Schwester Julie und meinem Bruder Adolf, Dr. jur., Oberlandesgerichtsrath zu Braunschweig in herzlicher Liebe gewidmet. – Braunschweig: Vieweg 1893. Dedekind 1911 Richard Dedekind: Was sind und was sollen die Zahlen? Dritte unveränderte Auflage. Meiner Schwester Julie und meinem Bruder Adolf Dr. jur., Oberlandesgerichtsrat zu Braunschweig in herzlicher Liebe gewidmet. – Braunschweig: Vieweg 1911. Dedekind 1918 Richard Dedekind: Was sind und was sollen die Zahlen? Vierte unveränderte Auflage. – Braunschweig: Vieweg 1918.
Bibliography
1019
Dedekind 1923 Richard Dedekind: Was sind und was sollen die Zahlen? Fünfte unveränderte Auflage. – Braunschweig: Vieweg 1923. Dedekind 1930 Richard Dedekind: Was sind und was sollen die Zahlen? Sechste unveränderte Auflage. – Braunschweig: Vieweg 1930. Dedekind 1932 Richard Dedekind: Richard Dedekind: Gesammelte mathematische Werke. Herausgegeben von Robert Fricke† in Braunschweig, Emmy Noether in Göttingen, Öystein Ore in New Haven. Dritter Band. – Braunschweig: Vieweg 1932. Dines 1915 Lloyd Lyne Dines: Complete existential theory of Sheffer’s postulates for Boolean algebras. – Bulletin of the American Mathematical Society 21 (1915), 4, 183–188. Dreben and van Heijenoort 1986 Burton Dreben and Jean van Heijenoort: Introductory Note to Gödel 1929, Gödel 1930a, Gödel 1930c. – In Gödel 1986 , 44–59. Dugac 1976 Pierre Dugac: Richard Dedekind et les fondements des mathématiques (avec de nombreux textes inédits). Préface de Jean Dieudonné. – Paris: Librairie Philosophique J. Vrin 1976. L’Histoire des Sciences. Textes et Études. Collection des Travaux de l’Académie internationale d’Histoire des Sciences, 24. Dybjer et al. 2012 P. Dybjer, S. Lindström, E. Palmgren and G. Sundholm (eds.): Epistemology versus Ontology: Essays on the Philosophy and Foundations of Mathematics in Honour of Per Martin-Löf. – Berlin, Heidelberg, New York: Springer 2012. Edwards 1967 Paul Edwards (ed.): The Encyclopedia of Philosophy. Volume Three. – New York: Macmillan 1967. Einstein 1921 Albert Einstein: Geometrie und Erfahrung. Erweiterte Fassung des Festvortrages gehalten an der Preussischen Akademie der Wissenschaften zu Berlin am 27. Januar 1921. – Berlin: Springer 1921. Ewald 1996 William Ewald (ed.): From Kant to Hilbert: A Source Book in the Foundations of Mathematics. Two Volumes. – Oxford: Clarendon Press 1996.
1020
Bibliography
Ewald 2005 William Ewald: Hilbert’s wide program. – In Cori et. al. 2005 , 225–251. Feferman 1970 Solomon Feferman: Formal theories for transfinite iterations of generalized inductive definiions and some subsystems of analysis. – In Kino, Myhill and Vesley 1970 , 303–325. Feferman 1986 Solomon Feferman: Introductory Note to Gödel 1931c. – In Gödel 1986 , 208– 213. Feferman 2003 Solomon Feferman: Introductory Note to the correspondence between Paul Bernays and Kurt Gödel. – In Gödel 2003a, 41–79. Fenstad 1970 Jens Erik Fenstad (ed.): Thoralf Skolem: Selected Works in Logic. – Oslo, Bergen, Tromsö: Universitetsforlaget 1970. Ferreirós 1999 José Ferreirós: Labyrinth of Thought. A History of Set Theory and Its Role in Modern Mathematics. – Basel, Boston, Berlin: Birkhäuser 1999. Second revised edition, 2007. Fraenkel 1928 Adolf Fraenkel: Einleitung in die Mengenlehre. Dritte umgearbeitete und stark erweiterte Auflage. – Berlin: Springer 1928. Die Grundlehren der mathematischen Wissenschaften in Einzeldarstellungen mit besonderer Berücksichtigung der Anwendungsgebiete, 9. Frege 1879 Gottlob Frege: Begriffsschrift, eine der arithmetischen nachgebildete Formelsprache des reinen Denkens. – Halle an der Saale: Nebert 1879. Reprinted in Frege 1964 . English translation in van Heijenoort 1967 , 5–82. Frege 1884 Gottlob Frege: Die Grundlagen der Arithmetik. Eine logisch mathematische Untersuchung über den Begriff der Zahl. – Breslau: Koebner 1884. English translation The Foundations of Arithmetic by J. L. Austin, Oxford: Basil Blackwell, 1950, 1953. German text with facing-page English translation. Frege 1885 Gottlob Frege: Über formale Theorien der Arithmetik. – Sitzungberichte der Jenaischen Gesellschaft für Medizin und Naturwissenschaft 19, Supplement II (1885), 94–104. English translation in Frege 1971 , 141–153, reprinted in Frege 1984 , 112–121.
Bibliography
1021
Frege 1893 Gottlob Frege: Grundgesetze der Arithmetik. Begriffsschriftlich abgeleitet. I. Band. – Jena: Pohle 1893. Reprinted in 1962 by the Wissenschaftliche Buchgesellschaft, Darmstadt, and (in one volume together with Frege 1903 ) in 1966 by Georg Olms Verlagsbuchhandlung, Hildesheim. English translation in Frege 2013 . Frege 1903 Gottlob Frege: Grundgesetze der Arithmetik. Begriffsschriftlich abgeleitet. II. Band. – Jena: Pohle 1903. Reprinted in 1962 by the Wissenschaftliche Buchgesellschaft, Darmstadt, and (in one volume together with Frege 1893 ) in 1966 by Georg Olms Verlagsbuchhandlung, Hildesheim. English translation in Frege 2013 . Frege 1964 Gottlob Frege: Begriffsschrift und andere Aufsätze. Zweite Auflage. Mit E. Husserls und H. Scholz’ Anmerkungen herausgegeben von Ignacio Angelelli. – Darmstadt: Wissenschaftliche Buchgesellschaft 1964. Frege 1971 Gottlob Frege: On the Foundations of Geometry and Formal Theories of Arithmetic. Edited and translated by Eike-Henner Kluge. – New Haven and London: Yale University Press 1971. Frege 1984 Gottlob Frege: Gottlob Frege: Collected Papers. Edited by Brian McGuinness, with translations by Victor Dudman, Peter Geach and Max Black, Hans Kaal, E.-H. W. Kluge, Brian McGuinness, Robert Stoothoff. – Oxford: Basil Blackwell 1984. Frege 2013 Gottlob Frege: The Basic Laws of Arithmetic, Derived Using Concept-Script. – Oxford: Oxford University Press 2013. English translation by Philip Ebert and Marcus Rossberg of Frege 1893 and Frege 1903 . Friedman 1970 Harvey Friedman: Iterated inductive definitions and Σ12 -AC. – In Kino, Myhill and Vesley 1970 , 435–442. Gabbay and Woods 2009 Dov Gabbay and John Woods (eds.): Handbook of the History of Logic, Volume 5: Logic from Russell to Church. – Amsterdam: Elsevier 2009. Gentzen 1933a* Gerhard Gentzen: Über das Verhältnis zwischen intuitionisticher und klassischer Arithmetik. – To have appeared in Mathematische Annalen for 1933
1022
Bibliography
(submitted 15 March 1933), but withdrawn in galleys in the light of Gödel 1933 . Published in Gentzen 1974b and in English translation as ‘On the relation between intuitionistic and classical arithmetic’, in Gentzen 1969 , 53–67. Gentzen 1933b Gerhard Gentzen: Über die Existenz unabhängiger Axiomensysteme zu unendlichen Satzsystemen. – Mathematische Annalen 107 (1933), 329–350. English translation in Gentzen 1969 , 29–52. Gentzen 1935 Gerhard Gentzen: Untersuchungen über das logische Schliessen, I, II. – Mathematische Zeitschrift 39 (1935), 176–210, 405–431. English translation in Gentzen 1969 , 68–131. Gentzen 1936 Gerhard Gentzen: Die Widerspruchsfreiheit der reinen Zahlentheorie. – Mathematische Annalen 112 (1936), 493–565. English translation in Gentzen 1969 , 132–213. Gentzen 1969 Gerhard Gentzen: The Collected Papers of Gerhard Gentzen, Edited and Translated into English by M. E. Szabo. – Amsterdam: North-Holland 1969. Gentzen 1974a Gerhard Gentzen: Der erste Widerspruchsfreiheitsbeweis für die klassische Zahlentheorie. – Archiv für mathematische Logik und Grundlagenforschung 16 (1974), 97–118. Gentzen 1936 was submitted on 11 August 1935 and accepted; however, in February 1936, §§14.1–16.1 1 of the original submission (and reprinted here) were replaced by new sections of Gentzen 1936 . Gentzen 1974b Gerhard Gentzen: Über das Verhältnis zwischen intuitionistischer und klassischer Arithmetik. – Archiv für mathematische Logik und Grundlagenforschung 16 (1974), 119–132. See Gentzen 1933a* . George 1994 Alexander George (ed.): Mathematics and Mind. – New York: Oxford University Press 1994. Gödel 1929 Kurt Gödel: Über die Vollständigkeit des Logikkalküls. – Universität Wien 1929. Dissertation, submitted to the Dean of the Philosophische Falkultät der Universität Wien on 22 October 1929. Reprinted with a facing-page English translation in Gödel 1986 , 60–101. Revised version in Gödel 1930a.
Bibliography
1023
Gödel 1930a Kurt Gödel: Die Vollständigkeit der Axiome des logischen Funktionenkalküls. – Monatshefte für Mathematik und Physik 37 (1930), 349–360. Revised version of Gödel 1929 . Reprinted with a facing-page English translation in Gödel 1986 , 102–123. Gödel 1930b Kurt Gödel: Einige metamathematische Resultate über Entscheidungsdefinitheit und Widerspruchsfreiheit. – Anzeiger der Akademie der Wissenschaften in Wien 67 (1930), 214–215. Reprinted with a facing-page English translation in Gödel 1986 , 140–143. The abstract was submitted on 23 October 1930. Gödel 1930c Kurt Gödel: Über die Vollständigkeit des Logikkalküls. – Die Naturwissenschaften. Wochenschrift für die Fortschritte der reinen und der angewandten Naturwissenschaften 18 (1930), 1068. Reprinted with a facing-page English translation in Gödel 1986 , 124–125. Gödel 1931a Kurt Gödel: Über formal unentscheidbare Sätze der Principia Mathematica und verwandter Systeme I. – Monatshefte für Mathematik und Physik 38 (1931), 173–198. Reprinted with a facing-page English translation in Gödel 1986 , 144–195. English translation also in van Heijenoort 1967 , 596–616. Gödel 1931b Kurt Gödel: Königsberg — Diskussion zur Grundlegung der Mathematik and Nachtrag. – Erkenntnis 2 (1931), 147–151. Reprinted with a facing-page English translation in Gödel 1986 , 200–205. Gödel 1931c Kurt Gödel: Besprechung von Hilbert: Die Grundlegung der elementaren Zahlenlehre [Hilbert 1931a]. – Zentralblatt für Mathematik und ihre Grenzgebiete 1 (1931), 260. Reprinted with a facing-page English translation in Gödel 1986 , 212–215. Gödel 1933 Kurt Gödel: Zur intuitionistischen Arithmetik und Zahlentheorie. – Ergebnisse eines mathematischen Kolloquiums 4 (1933), 34–38. Reprinted with a facing-page English translation in Gödel 1986 , 286–295. Gödel 1934* Kurt Gödel: On undecidable propositions of formal mathematical systems. – Lectures given at the Institute for Advanced Study in Princeton, February to May 1934. First published in the form of mimeographed notes, and then, modified slightly by Gödel and with his Postscriptum from 1964, in Davis 1965 , 41–74. Republished in Gödel 1986 , 346–371.
1024
Bibliography
Gödel 1986 Kurt Gödel: Kurt Gödel: Collected Works, Volume 1: Publications 1929– 1936. Edited by Solomon Feferman, John W. Dawson Jr., Stephen C. Kleene, Gregory H. Moore, Robert M. Solovay, Jean van Heijenoort. – Oxford, New York: Oxford University Press 1986. Gödel 1990 Kurt Gödel: Kurt Gödel: Collected Works, Volume 2: Publications 1938– 1974. Edited by Solomon Feferman, John W. Dawson Jr., Stephen C. Kleene, Gregory H. Moore, Robert M. Solovay, Jean van Heijenoort. – Oxford, New York: Oxford University Press 1990. Gödel 1995 Kurt Gödel: Kurt Gödel: Collected Works, Volume 3: Unpublished Essays and Lectures. Edited by Solomon Feferman, John W. Dawson Jr., Warren Goldfarb, Charles Parsons, Robert M. Solovay. – Oxford, New York: Oxford University Press 1995. Gödel 2003a Kurt Gödel: Kurt Gödel: Collected Works, Volume 4: Correspondence A– G. Edited by Solomon Feferman, John W. Dawson Jr., Warren Goldfarb, Charles Parsons, Wilfried Sieg. – Oxford: Clarendon Press 2003. Gödel 2003b Kurt Gödel: Kurt Gödel: Collected Works, Volume 5: Correspondence H– Z. Edited by Solomon Feferman, John W. Dawson Jr., Warren Goldfarb, Charles Parsons, Wilfried Sieg. – Oxford: Clarendon Press 2003. Goldfarb 1979 Warren Goldfarb: Logic in the twenties: the nature of the quantifier. – Journal of Symbolic Logic 44 (1979), 351–368. Goldschmidt 1928 Richard Benedict Goldschmidt: Einführung in die Vererbungswissenschaft. – Berlin: Julius Springer 1928. Fifth edition. Goldstein, Schappacher and Schwermer 2007 Catherine Goldstein, Norbert Schappacher and Joachim Schwermer (eds.): The Shaping of Arithmetic after C. F. Gauss’s Disquisitiones Arithmeticae. – Berlin, Heidelberg, New York: Springer 2007. Hahn et al. 1931 Hans Hahn, Johann von Neumann, Rudolf Carnap, Heinrich Scholz, Arendt Heyting, Kurt Gödel and Kurt Reidemeister: Diskussion zur Grundlegung der Mathematik, Königsberg, 7 September 1930. – Erkenntnis 2 (1931), 135– 151. Report of a roundtable discussion involving Hans Hahn, Johann von
Bibliography
1025
Neumann, Rudolf Carnap, Heinrich Scholz, Arendt Heyting, Kurt Gödel and Kurt Reidemeister, with a ‘Nachtrag’ added for the publication by Gödel. Gödel’s contributions and the ‘Nachtrag’ are reprinted with a facing-page English translation in Gödel 1986 , 200–205. Hahn-Neurath 1910 Olga Hahn-Neurath: Über die Koeffizienten einer logischen Gleichung und ihre Beziehungen zur Lehre von den Schlüssen. – Archiv für systematische Philosophie 16 (1910), 2, 149–176. Hahn-Neurath and Neurath 1909 Olga Hahn-Neurath and Otto Neurath: Zum Dualismus in der Logik. – Archiv für systematische Philosophie 15 (1909), 2, 149–162. Hallett 1984 Michael Hallett: Cantorian Set Theory and Limitation of Size. – Oxford: Clarendon Press 1984. Hallett 1990 Michael Hallett: Physicalism, reductionism and Hilbert. – In Irvine 1990 , 183–257. Hallett 1994 Michael Hallett: Hilbert’s axiomatic method and the laws of thought. – In George 1994 , 158–200. Hallett 1995 Michael Hallett: Hilbert and logic. – In Marion and Cohen 1995 , 135–187. Hallett 2008 Michael Hallett: Reflections on the purity of method in Hilbert’s Grundlagen der Geometrie. – In Mancosu 2008 , 198–255. Hallett and Majer 2004 Michael Hallett and Ulrich Majer (eds.): David Hilbert’s Lectures on the Foundations of Geometry, 1891–1902. – Berlin, Heidelberg, New York: Springer 2004. Volume 1 of David Hilbert’s Foundational Lectures, edited by William Ewald, Michael Hallett, Ulrich Majer and Wilfried Sieg. Hamburger 1931 Hans Hamburger: Über die partielle lineare homogene Differentialgleichung zweiter Ordnung vom hyperbolischen Typus, deren Koeffizienten in einer Veränderlichen periodisch sind. – Mathematische Annalen 105 (1931), 437–498.
1026
Bibliography
Hamilton 1860 William Hamilton: Lectures on Logic. Two Volumes. – Edinburgh and London: William Blackwood and Sons 1860. Published as Volumes III and IV of Lectures on Metaphysics and Logic by Sir William Hamilton, edited by H. L. Mansel and John Veitch. Heidegger 1929 Martin Heidegger: Was ist Metaphysik?. – Bonn: Friedrich Cohen 1929. Reprinted, with original pagination, in Heidegger 1978 , 103–121. Heidegger 1978 Martin Heidegger: Wegmarken. Zweite, erweiterte und durchgesehene Auflage. – Frankfurt am Main: Vittorio Klosterman 1978. van Heijenoort 1967 Jean van Heijenoort (ed.): From Frege to Gödel: A Source Book in Mathematical Logic. – Cambridge, Mass.: Harvard University Press 1967. Heinzmann 1986 Gerhard Heinzmann (ed.): Poincaré, Russell, Zermelo et Peano. Textes de la discusion (1906–1912) sur les fondements des mathématiques: des antinomies á la prédicativité. – Paris: Albert Blanchard 1986. von Helmholtz 1887 Hermann von Helmholtz: Zählen und Messen, erkenntnistheoretisch betrachtet. – In Philosophische Aufsätze Eduard Zeller zu seinem fünfzigjährigen Doktorjubiläum gewidmet, Leipzig, Fues’ Verlag, 17–52. Reprinted in von Helmholtz 1895 , 356–391, and also in von Helmholtz 1921 . English translation in Ewald 1996 , Volume 2, 727–752. von Helmholtz 1895 Hermann von Helmholtz: Wissenschaftliche Abhandlungen, Band III. – Leipzig: J.A. Barth 1895. von Helmholtz 1921 Hermann von Helmholtz: Schriften zur Erkenntnistheorie. Herausgegeben und erläutert von Paul Hertz und Moritz Schlick. – Berlin: Julius Springer 1921. Herbrand 1931 Jacques Herbrand: Sur la non-contradiction de l’arithmétique. – Journal für die reine und angewandte Mathematik 166 (1931), 1–8. Reprinted in Herbrand 1968 , 221–232. English translation in van Heijenoort 1967 , 620–628, and also in Herbrand 1971 , 284–295.
Bibliography
1027
Herbrand 1968 Jacques Herbrand: Jacques Herbrand: Écrits logiques. Avec une préface de Jean van Heijenoort et une notice biographique par Claude Chevalley et Albert Lautmann, et une note sur la pensée de Herbrand par Claude Chevalley. – Paris: Presses Universitaires de France 1968. Herbrand 1971 Jacques Herbrand (ed.): Jacques Herbrand: Logical Writings. Edited by Warren Goldfarb. – Cambridge, Massachussetts: Harvard University Press 1971. An English translation by Warren Goldfarb of Herbrand 1968 , using some existing translations by Jean van Heijenoort and Burton Dreben, with Notes by Dreben, Goldfarb and van Heijenoort. Hesseling 1999* Dennis E. Hesseling: Gnomes in the Fog: The Reception of Brouwer’s Intuitionism in the 1920s. – Ph.D. Thesis, University of Utrecht. Hesseling 2004 Dennis E. Hesseling: Gnomes in the Fog: The Reception of Brouwer’s Intuitionism in the 1920s. – Basel, Boston, Berlin: Birkhäuser Verlag 2004. Hilbert 1896 David Hilbert: Zur Theorie der aus n Haupteinheiten gebildeten complexen Größen. – Nachrichten von der Königlichen Gesellschaft der Wissenschaften zu Göttingen. Mathematisch-physikalische Klasse (1896), 179–183. Reprinted in Hilbert 1933a, 371–375. Hilbert 1898/99* David Hilbert: Grundlagen der Euklidischen Geometrie. – Niedersächsische Staats- und Universitätsbibliothek Göttingen, Handschriftenabteilung, Cod. Ms. D. Hilbert 551. Published in Hallett and Majer 2004 , 302–406. See also Hilbert 1899* . Hilbert 1899* David Hilbert: Elemente der Euklidischen Geometrie. – Niedersächsische Staats- und Universitätsbibliothek Göttingen, Handschriftenabteilung, Cod. Ms. D. Hilbert 552. This is Hilbert’s copy of the Ausarbeitung by Hans von Schaper of Hilbert 1898/99* , published in Hallett and Majer 2004 , 221– 301. Hilbert 1900a David Hilbert: Über den Zahlbegriff. – Jahresbericht der Deutschen Mathematiker-Vereinigung 8 (1900), 180–184. Republished, in slightly altered form, as Appendix VI in Hilbert 1909 , Hilbert 1913 , Hilbert 1922a, Hilbert 1923b and Hilbert 1930a. English translation in Ewald 1996 , Volume 2, 1092–1095.
1028
Bibliography
Hilbert 1900b David Hilbert: Mathematische Probleme. Vortrag, gehalten auf dem internationalen Mathematiker-Kongreß zu Paris 1900. – Nachrichten von der Königlichen Gesellschaft der Wissenschaften zu Göttingen. Mathematischphysikalische Klasse (1900), 253–297. Partial English translation in Ewald 1996 , 1096–1105. Hilbert 1904* David Hilbert: Zahlbegriff und Quadratur des Kreises. – Georg-AugustUniversität Göttingen, Mathematisches Institut, Lesesaal. Ausarbeitung by Max Born, to appear in Volume 2 of David Hilbert’s Foundational Lectures, edited by William Ewald, Michael Hallett, Ulrich Majer and Wilfried Sieg. Hilbert 1905a* David Hilbert: Logische Principien des mathematischen Denkens. – GeorgAugust-Universität Göttingen, Mathematisches Institut, Lesesaal. Ausarbeitung by Ernst Hellinger, to appear in Volume 2 of David Hilbert’s Foundational Lectures, edited by William Ewald, Michael Hallett, Ulrich Majer and Wilfried Sieg. Hilbert 1905b David Hilbert: Über die Grundlagen der Logik und der Arithmetik. – In Verhandlungen 1905 , 174–185. Republished as Appendix VII in Hilbert 1909 , Hilbert 1913 , Hilbert 1922a, Hilbert 1923b and Hilbert 1930a. English translation as Hilbert 1905c, and also in van Heijenoort 1967 , 130–138. Hilbert 1905c David Hilbert: On the foundations of logic and arithmetic. – The Monist 15 (1905), 338–352. Translation by George Bruce Halsted of Hilbert 1905b. Hilbert 1909 David Hilbert: Grundlagen der Geometrie. Dritte, durch Zusätze und Literaturhinweise von Neuem vermehrte und durch sieben Anhänge erweiterte Auflage. – Leipzig, Berlin: Teubner 1909. Wissenschaft und Hypothese, VII. Hilbert 1913 David Hilbert: Grundlagen der Geometrie. Vierte, durch Zusätze und Literaturhinweise von neuem vermehrte und mit sieben Anhängen versehene Auflage. – Leipzig, Berlin: Teubner 1913. Wissenschaft und Hypothese, VII. Hilbert 1914a David Hilbert: Zur Begründung der elementaren Strahlungstheorie. Dritte Mitteilung. – Nachrichten von der Königlichen Gesellschaft der Wissenschaften zu Göttingen. Mathematisch-physikalische Klasse (1914), 275–298. Reprinted in Hilbert 1935 , 238–257.
Bibliography
1029
Hilbert 1914b David Hilbert: Zur Begründung der elementaren Strahlungstheorie. Dritte Mitteilung. – Physikalische Zeitschrift 15 (1914), 878–889. Republication of Hilbert 1914a. Reprinted in Hilbert 1935 , 238–257. Hilbert 1914/15* David Hilbert: Probleme und Principienfragen der Mathematik. – Library of the Institute for Advanced Study, Princeton. Hilbert 1917* David Hilbert: Mengenlehre. – Georg-August-Universität Göttingen, Mathematisches Institut, Lesesaal. Ausarbeitung by Margarethe Goeb, to appear in Volume 2 of David Hilbert’s Foundational Lectures, edited by William Ewald, Michael Hallett, Ulrich Majer and Wilfried Sieg. Hilbert 1917/18* David Hilbert: Prinzipien der Mathematik. – Georg-August-Universität Göttingen, Mathematisches Institut, Lesesaal. Ausarbeitung by Paul Bernays, published in Chapter 1 of this Volume, 59–214. Hilbert 1918a David Hilbert: Axiomatisches Denken. – Mathematische Annalen 78 (1918), 405–415. Reprinted in Hilbert 1935 , 146–156; English translation in Ewald 1996 , Volume 2, 1107–1115. Hilbert 1918b* David Hilbert: Raum und Zeit. – Georg-August-Universität Göttingen, Mathematisches Institut, Lesesaal. Ausarbeitung by Paul Bernays, to appear in Volume 6 of David Hilbert’s Foundational Lectures, edited by William Ewald, Michael Hallett, Ulrich Majer and Wilfried Sieg. Hilbert 1919* David Hilbert: Natur und mathematisches Erkennen. – Georg-AugustUniversität Göttingen, Mathematisches Institut, Lesesaal. Ausarbeitung by Paul Bernays, published as Hilbert 1992 . Hilbert 1920* David Hilbert: Probleme der mathematischen Logik. – Georg-AugustUniversität Göttingen, Mathematisches Institut, Lesesaal. Ausarbeitung by Moses Schönfinkel and Paul Bernays, published in Chapter 2 of this Volume, 342–371. Hilbert 1921* David Hilbert: Grundgedanken der Relativitätstheorie. – Georg-AugustUniversität Göttingen, Mathematisches Institut, Lesesaal. Ausarbeitung by
1030
Bibliography
Paul Bernays, to appear in Volume 6 of David Hilbert’s Foundational Lectures, edited by William Ewald, Michael Hallett, Ulrich Majer and Wilfried Sieg. Hilbert 1921/22a* David Hilbert: Grundlagen der Mathematik. – Georg-August-Universität Göttingen, Mathematisches Institut, Lesesaal. Ausarbeitung by Paul Bernays, published in Chapter 3 of this Volume, 431–521. Hilbert 1921/22b* David Hilbert: Grundlegung der Mathematik . – Niedersächsische Staats- und Universitätsbibliothek Göttingen, Handschriftenabteilung, Cod. Ms. H. Kneser. A Mitschrift by Hellmuth Kneser of Hilbert’s 1921/22 Vorlesung announced as ‘Grundlegung der Mathematik’, partially published in this Volume, 577–594. Hilbert 1922a David Hilbert: Grundlagen der Geometrie. Fünfte, durch Zusätze und Literaturhinweise von Neuem vermehrte und mit sieben Anhängen versehene Auflage. – Leipzig, Berlin: Teubner 1922. Wissenschaft und Hypothese, VII. Hilbert 1922b David Hilbert: Neubegründung der Mathematik. Erste Mitteilung. – Abhandlungen aus dem Mathematischen Seminar der Hamburgischen Universität 1 (1922), 157–177. Reprinted in Hilbert 1935 , 157–177; English translation in Ewald 1996 , Volume 2, 1115–1134, and reprinted in Mancosu 1998 , 198–214. Hilbert 1922/23a* David Hilbert: Grundlagen der Mathematik . – Niedersächsische Staatsund Universitätsbibliothek Göttingen, Handschriftenabteilung, Cod. Ms. H. Kneser. A Mitschrift by Hellmuth Kneser of Hilbert’s Vorlesung for 1922/23 announced as ‘Grundlagen der Arithmetik’, published in this Volume, 599– 630. Hilbert 1922/23b* David Hilbert: Wissen und mathematisches Denken. – Georg-AugustUniversität Göttingen, Mathematisches Institut, Lesesaal. Ausarbeitung by Wilhelm Ackermann, to appear in Volume 6 of David Hilbert’s Foundational Lectures, edited by William Ewald, Michael Hallett, Ulrich Majer and Wilfried Sieg. Hilbert 1922/24* David Hilbert: Logische Grundlagen der Mathematik. – Niedersächsische Staats- und Universitätsbibliothek Göttingen, Handschriftenabteilung, Cod. Ms. D. Hilbert 567. A partial Ausarbeitung by Paul Bernays, and notes by Hilbert, published in this Volume, 528–562.
Bibliography
1031
Hilbert 1923a David Hilbert: Die logischen Grundlagen der Mathematik. – Mathematische Annalen 88 (1923), 151–165. Lecture held in September 1922 in Leipzig. Reprinted in Hilbert 1935 , 178–191. English translation: The logical foundations of mathematics, in Ewald 1996 , Volume 2, 1134–1148. Hilbert 1923b David Hilbert: Grundlagen der Geometrie. Sechste unveränderte Auflage, anastatischer Nachdruck . – Leipzig, Berlin: Teubner 1923. Wissenschaft und Hypothese, VII. Hilbert 1923c* David Hilbert: Weltgleichungen. I: Abstrakte Begriffsbildungen. – Niedersächsische Staats- und Universitätsbibliothek Göttingen, Handschriftenabteilung, Cod. Ms. D. Hilbert 596. Published in Sauer and Majer 2009 , 396–407. Hilbert 1923d* David Hilbert: Weltgleichungen. II: Ihre Anwendung und Auswirkung (Denken und Ergebnisse). – Niedersächsische Staats- und Universitätsbibliothek Göttingen, Handschriftenabteilung, Cod. Ms. D. Hilbert 596. Published in Sauer and Majer 2009 , 407–416. Hilbert 1923e* David Hilbert: Weltgleichungen. III: Theorie und Erfahrung (gehalten in Hamburg; der III. Teil ausserdem in Zürich). – Niedersächsische Staats- und Universitätsbibliothek Göttingen, Handschriftenabteilung, Cod. Ms. D. Hilbert 596. Published in Sauer and Majer 2009 , 416–432. Hilbert 1924* David Hilbert: Logische Grundlagen der Mathematik . – Niedersächsische Staats- und Universitätsbibliothek Göttingen, Handschriftenabteilung, Cod. Ms. H. Kneser. Notes by Hellmuth Kneser of three lectures by Hilbert in February 1924, published in this Volume, 636–643. Hilbert 1924/25* David Hilbert: Über das Unendliche. – Georg-August-Universität Göttingen, Mathematisches Institut, Lesesaal. Ausarbeitung by Lothar Nordheim, published in Chapter 4 of this Volume, 668–756. Hilbert 1926 David Hilbert: Über das Unendliche. – Mathematische Annalen 95 (1926), 161–190. Revised republication in Hilbert 1930a, 262–288. English translation in van Heijenoort 1967 , 369–392. Hilbert 1927* David Hilbert: Grundlagen der Geometrie. – Georg-August-Universität Göttingen, Mathematisches Institut, Lesesaal.
1032
Bibliography
Hilbert 1928a David Hilbert: Die Grundlagen der Mathematik. Vortrag, gehalten auf Einladung des Mathematischen Seminars im Juli 1927 in Hamburg. – Abhandlungen aus dem mathematischen Seminar der Hamburgischen Universität 6 (1928), 65–85 (86–92). Reprinted in this Volume as Appendix B, 922–949. Republished in Hilbert 1928b; revised republication as Hilbert 1930d . English translation in van Heijenoort 1967 , 464–479. Hilbert 1928b David Hilbert: Die Grundlagen der Mathematik. Mit Zusätzen von H. Weyl und P. Bernays. – Leipzig: Teubner 1928. Hamburger mathematische Einzelschriften; 5. Heft. Hilbert 1929 David Hilbert: Probleme der Grundlegung der Mathematik. – In Congresso 1929 , 135–141. Reprinted in this Volume as Appendix C, 957–965. Revised republication as Hilbert 1930c, and then as Hilbert 1930e. Hilbert 1930a David Hilbert: Grundlagen der Geometrie. Siebente umgearbeitete und vermehrte Auflage. – Leipzig, Berlin: Teubner 1930. Wissenschaft und Hypothese, VII. Hilbert 1930b David Hilbert: Naturerkennen und Logik. – Die Naturwissenschaften. Wochenschrift für die Fortschritte der reinen und der angewandten Naturwissenschaften 18 (1930), 959–963. Reprinted in Hilbert 1935 , 157–177; English translation in Ewald 1996 , Volume 2, 1157–1165. Hilbert 1930c David Hilbert: Probleme der Grundlegung der Mathematik. – Mathematische Annalen 102 (1930), 1–9. Revised republication of Hilbert 1929 . English translation in Mancosu 1998 , 227–233. Hilbert 1930d David Hilbert: Die Grundlagen der Mathematik. – Appendix IX in Hilbert 1930a, 288–312. Revised republication of Hilbert 1928a. Hilbert 1930e David Hilbert: Probleme der Grundlegung der Mathematik. – Appendix X in Hilbert 1930a, 313–323. Revised republication of Hilbert 1930c. Hilbert ?1931* David Hilbert: Über die Grundlagen des Denkens. – Niedersächsische Staats- und Universitätsbibliothek Göttingen, Handschriftenabteilung, Cod. Ms. D. Hilbert 604. Published in Chapter 4 of this Volume, 765–773.
Bibliography
1033
Hilbert 1931a David Hilbert: Die Grundlegung der elementaren Zahlenlehre. – Mathematische Annalen 104 (1931), 485–494. Reprinted in this Volume, Appendix D, pp. 974–982. Republished in abbreviated form in Hilbert 1935 , 192–195. English translation in Ewald 1996 , Volume 2, 1149–1157, reproduced in Mancosu 1998 , 266–273. Hilbert 1931b David Hilbert: Beweis des Tertium non datur. – Nachrichten von der Gesellschaft der Wissenschaften zu Göttingen. Mathematisch-Physikalische Klasse (1931), 120–125. Reprinted in this volume, Appendix E, pp. 985–989. Hilbert 1933a David Hilbert: Gesammelte Abhandlungen. Zweiter Band. Algebra, Invariantentheorie, Geometrie. – Berlin: Springer 1933. Hilbert 1933b* David Hilbert: Über das Unendliche. – Niedersächsische Staats- und Universitätsbibliothek Göttingen, Handschriftenabteilung, Cod. Ms. D. Hilbert 595. Published in Chapter 4 of this Volume, 779–782. Hilbert 1934* David Hilbert: Verzeichnis meiner Vorlesungen. – Niedersächsische Staats- und Universitätsbibliothek Göttingen, Handschriftenabteilung, Cod. Ms. D. Hilbert 520. Hilbert 1935 David Hilbert: Gesammelte Abhandlungen. Dritter Band. Analysis, Grundlagen der Mathematik, Physik, Verschiedenes. Nebst einer Lebensgeschichte. – Berlin: Springer 1935. Hilbert 1971a Hilbert. Gedenkband. Herausgegeben von K. Reidemeister. Mit 8 Abbildungen und einer Schallplatte. – Berlin, Heidelberg, New York: Springer 1971. Hilbert 1971b David Hilbert: Probleme der Grundlegung der Mathematik. – In Hilbert 1971a, 9–19. Republication of Hilbert 1930c. Hilbert 1990 David Hilbert: Zahlentheorie. – Göttingen: Mathematisches Institut 1990. Contains newly typed versions of the manuscripts for the lecture courses ‘Zahlentheorie’, Wintersemester 1897/98, pp. 1–204, and ‘Ausgewählte Kapitel der Zahlentheorie’, Sommersemester 1898, pp. 1–77, with a preface by Eckart Maus.
1034
Bibliography
Hilbert 1992 David Hilbert: Natur und mathematisches Erkennen. Vorlesung, gehalten 1919–1920 in Göttingen. Nach der Ausarbeitung von Paul Bernays. – Basel, Boston, Berlin: Birkhäuser 1992. Reprint of Hilbert 1919* . Edited, with an introduction by David Rowe. Hilbert and Ackermann 1928 David Hilbert and Wilhelm Ackermann: Grundzüge der theoretischen Logik. – Berlin: Springer 1928. Die Grundlehren der mathematischen Wissenschaften in Einzeldarstellungen mit besonderer Berücksichtigung der Anwendungsgebiete; 27. Reprinted as Appendix A in this Volume, 809–915. Hilbert and Bernays 1934 David Hilbert and Paul Bernays: Die Grundlagen der Mathematik. Erster Band. – Berlin: Springer 1934. Die Grundlehren der mathematischen Wissenschaften in Einzeldarstellungen mit besonderer Berücksichtigung der Anwendungsgebiete; 40. Second edition, Hilbert and Bernays 1968 . Hilbert and Bernays 1939 David Hilbert and Paul Bernays: Grundlagen der Mathematik. Zweiter Band. – Berlin: Springer 1939. Die Grundlehren der mathematischen Wissenschaften in Einzeldarstellungen mit besonderer Berücksichtigung der Anwendungsgebiete; 50. Second Edition, Hilbert and Bernays 1970 . Hilbert and Bernays 1968 David Hilbert and Paul Bernays: Grundlagen der Mathematik I. Zweite Auflage. – Berlin, Heidelberg, New York: Springer 1968. Die Grundlehren der mathematischen Wissenschaften in Einzeldarstellungen mit besonderer Berücksichtigung der Anwendungsgebiete; 40. Hilbert and Bernays 1970 David Hilbert and Paul Bernays: Grundlagen der Mathematik II. Zweite Auflage. – Berlin, Heidelberg, New York: Springer 1970. Die Grundlehren der mathematischen Wissenschaften in Einzeldarstellungen mit besonderer Berücksichtigung der Anwendungsgebiete; 50. Hölder 1914 Otto Hölder: Die Arithmetik in strenger Begründung. – Leipzig: Teubner 1914. Huntington 1904 Edward V. Huntington: Sets of independent postulates for the algebra of logic. – Transactions of the American Mathematical Society 5 (1904), 288–309.
Bibliography
1035
Irvine 1990 A. D. Irvine (ed.): Physicalism in Mathematics. – Dordrecht, Boston, London: Kluwer 1990. The University of Western Ontario Series in Philosophy of Science; 45. Jevons 1864 William Stanley Jevons: Pure Logic or the Logic of Quality Apart from Quantity with Remarks on Boole’s System and the Relation of Logic and Mathematics. – London: E. Stanford 1864. Jevons 1880 William Stanley Jevons: Studies in Deductive Logic. – London: MacMillan 1880. Johnson 1892 William Ernest Johnson: The Logical Calculus. – Mind (New Series) 1 (1892), 2, 235–250. Johnson 1900 William Ernest Johnson: Sur la théorie des équations logiques. – Bibliothèque du Congrès International de Philosophie 3 (1900), 185–199. Just 1927 Günther Just: Die Vererbung. – Breslau: Verlag Hirt 1927. First edition. Kanamori and Dreben 1996 Akihiro Kanamori and Burton Dreben: Hilbert and set theory. – Synthese 109 (1996), 77–125. Kant 1956 Immanuel Kant: Kritik der reinen Vernunft. Nach der ersten und zweiten Original-Ausgabe neu herausgegeben von Raimund Schmidt. – Hamburg: Meiner 1956. Keynes 1921 John Maynard Keynes: A Treatise on Probability. – London and New York: Macmillan 1921. Kino, Myhill and Vesley 1970 Akiko Kino, John Myhill and Richard E. Vesley (eds.): Intuitionism and Proof Theory. Proceedings of the Summer Conference at Buffalo N. Y. 1968. – Amsterdam, London: North-Holland Publishing Company 1970. Kirchhoff 1877 Gustav Kirchhoff: Vorlesungen über mathematische Physik. Band 1. Mechanik. – Leipzig: Teubner 1877.
1036
Bibliography
Kronecker 1887 Leopold Kronecker: Über den Zahlbegriff. – Journal für die reine und angewandte Mathematik 101 (1887), 337–355. Reprinted in Kronecker 1899 , 251–274. Partial English translation in Ewald 1996 , Volume 2, 947–955. Kronecker 1899 Leopold Kronecker: Werke. Herausgegeben auf Veranlassung der Königlich Preussischen Akademie der Wissenschaften von K. Hensel. Dritten Bandes erster Halbband. – Leipzig: Teubner 1899. Ladd-Franklin 1883 Christine Ladd-Franklin: On the algebra of logic. – In Peirce 1883b, 17–71. Lasker 1919 Emanuel Lasker: Philosophie des Unvollendbar. – Leipzig: Veit und Comp 1919. Lewis 1918 Clarence Irving Lewis: A Survey of Symbolic Logic. – Berkeley, Calif.: University of California Press 1918. Löwenheim 1910 Leopold Löwenheim: Auflösung von Gleichungen im logischen Gebietekalkül. – Mathematische Annalen 68 (1910), 145–71. Löwenheim 1913 Leopold Löwenheim: Über Transformationen im Gebietekalkül. – Mathematische Annalen 73 (1913), 245–72. Löwenheim 1915 Leopold Löwenheim: Über Möglichkeiten im Relativkalkül. – Mathematische Annalen 76 (1915), 447–470. English translation in van Heijenoort 1967 , 228–251. Luzin 1928 Nikolai Luzin: Sur les voies de la théorie des ensembles. – In Congresso 1929 I (1928), 295–299. MacColl 1877–1898 Hugh MacColl: The calculus of equivalent statements. – Proceedings of the London Mathematical Society (1877–1898). I (9):9–20, 1877; II (9): 177–186, 1877; III (10):16–28, 1878; IV (11):113–121, 1879; V (28):156–183, 1896; VI (28):555–579, 1896; VII (29):98–109, 1897; VIII (29): 545, 1897.
Bibliography
1037
MacColl 1880–1906 Hugh MacColl: Symbolical reasoning. – Mind (1880–1906). I (5):45–60, 1880; II (6):493–510, 1897; III (9):75–84, 1900; IV (11):352–368, 1902; V (12):355– 364, 1903; VI (14):74–81, 1905; VII (14):390–397, 1905; VII (15):504–518, 1906. MacColl 1906 Hugh MacColl: Symbolical Logic and its Applications. – London: Longmans, Green, & Co. 1906. Majer 1993 Ulrich Majer: Hilberts Methode der Idealen Elemente und Kants regulativer Gebrauch der Ideen. – Kant-Studien, Philosophische Zeitschrift der KantGesellschaft 84 (1993), 51–76. Majer 2001 Ulrich Majer: The axiomatic method and the foundations of science: historical roots of mathematical physics in Göttingen (1900–1930). – In Rédei and Stöltzner 2001 , 11–31. Malament 2002 David Malament (ed.): Reading Natural Philosophy. Essays in the History and Philosophy of Science and Mathematics. – Chicago, Illinois: Open Court Publishing Company 2002. Mancosu 1998 Paolo Mancosu (ed.): From Brouwer to Hilbert. The Debate on the Foundations of Mathematics in the 1920s. – New York, Oxford: Oxford University Press 1998. Mancosu 1999a Paolo Mancosu: Between Russell and Hilbert: Behmann on the foundations of mathematics. – Bulletin of Symbolic Logic 5 (1999), 303–330. Reprinted in Part 2 of Mancosu 2010 , 159–175. Mancosu 1999b Paolo Mancosu: Between Vienna and Berlin: The immediate reception of Gödel’s Incompleteness Theorems. – History and Philosophy of Logic 20 (1999), 33–45. Reprinted in Part 2 of Mancosu 2010 , 232–239. Mancosu 2002 Paolo Mancosu: The Russellian influence on Hilbert and his school. – Synthese 137 (2002), 59–101. Reprinted in Part 2 of Mancosu 2010 , 176–198. Mancosu 2008 Paolo Mancosu (ed.): The Philosophy of Mathematical Practice. – Oxford: The Clarendon Press 2008.
1038
Bibliography
Mancosu 2010 Paolo Mancosu: The Adventure of Reason: Interplay Between Philosophy of Mathematics and Mathematical Logic, 1900–1940. – Oxford and New York: Oxford University Press 2010. Marion and Cohen 1995 Mathieu Marion and Robert Cohen (eds.): Québec Studies in the Philosophy of Science, Part 1: Logic, Mathematics, Physics and the History of Science. Boston Studies in the Philosophy of Science, Volume 177. – Dordrecht, Holland: Kluwer Academic Publishers 1995. Menzler-Trott 2007 Eckart Menzler-Trott: Logic’s Lost Genius. The Life of Gerhard Gentzen. – Providence, RI: American Mathematical Society and London Mathematical Society 2007. Mohrmann 1923 Hans Mohrmann: Bestimmung aller algebraischen W-Kurven. – Mathematische Annalen 89 (1923), 260–217. Moore 1990 Gregory H. Moore: Introductory Note to 1947 and 1964. – In Gödel 1990 , 154–175. Müller 1976 Gert Müller (ed.): Sets and Classes: On the Work of Paul Bernays. – Amsterdam, New York, Oxford: North-Holland Publishing Company 1976. von Neumann 1923 Johann von Neumann: Zur Einführung der transfiniten Zahlen. – Acta Litterarum ac Scientiarum Regiæ Universitatis Hungaricæ FranciscoJosephinæ. Sectio Scientiarum-Mathematicarum 1 (1923), 199–208. Reprinted in von Neumann 1961a, 24–33. English translation in van Heijenoort 1967 , 346–354. von Neumann 1927 Johann von Neumann: Zur Hilbertschen Beweistheorie. – Mathematische Zeitschrift 26 (1927), 1–46. Reprinted in von Neumann 1961a, 256–300. von Neumann 1931 Johann von Neumann: Die formalistische Grundlegung der Mathematik. – Erkenntnis 2 (1931), 116–121. Reprinted in von Neumann 1961b, 234–239. English translation in Benacerraf and Putnam 1964 , 50–54, and Benacerraf and Putnam 1983 , 61–65.
Bibliography
1039
von Neumann 1961a Johann von Neumann: Collected Works, Volume 1. Edited by A. H. Taub. – New York: Pergamon Press 1961. von Neumann 1961b Johann von Neumann: Collected Works, Volume 2. Edited by A. H. Taub. – New York: Pergamon Press 1961. Parsons 2003 Charles Parsons: Introductory Note to the correspondence between Hao Wang and Kurt Gödel. – In Gödel 2003b, 379–395. Peano 1894 Giuseppe Peano: Notations de logique mathématique. Introduction au Formulaire de mathématiques publié par la ‘Rivista di Mathematica’. – Torino: Guadagnini 1894. Peano 1895–1908 Giuseppe Peano: Formulaire de mathématiques, 5 vols. – Torino: Bocca 1895– 1908. Peirce 1867 Charles Sanders Peirce: On an improvement in Boole’s calculus of logic. – Proceedings of the American Academy of Arts and Sciences 7 (1867), 250– 261. Peirce 1870 Charles Sanders Peirce: Description of a notation for the logic of relatives, resulting from an amplification of the conceptions of Boole’s calculus of logic. – Memoirs of the American Academy of Sciences 9 (1870), 317–378. Peirce 1880 Charles Sanders Peirce: On the algebra of logic. – American Journal of Mathematics 3 (1880), 15–57. Peirce 1883a Charles Sanders Peirce: Note B: The logic of relatives. – Studies in Logic by Johns Hopkins University (1883), 187–203. Peirce 1883b Charles Sanders Peirce (ed.): Studies in Logic by Members of the Johns Hopkins University. – New York: Little, Brown and Co 1883. Peirce 1885 Charles Sanders Peirce: On the algebra of logic; a contribution to the philosophy of notation. – American Journal of Mathematics 7 (1885), 180–202.
1040
Bibliography
Pietrkowski 1931 Stephan Pietrkowski: Untergruppen und Quotientengruppen unendlicher Abelscher Gruppen. – Mathematische Annalen 105 (1931), 666–671. von Plato 2008 Jan von Plato: Gentzen’s proof of normalization for natural deduction. – Bulletin of Symbolic Logic 14 (2008), 240–257. von Plato 2009 Jan von Plato: Gentzen’s logic. – In Gabbay and Woods 2009 , 667–721. Pohlers 2009 Wolfram Pohlers: Proof Theory: The First Step into Impredicativity. – Berlin, Heidelberg, New York: Springer 2009. Poincaré 1902 Henri Poincaré: La science et l’hypothèse. – Paris: Ernst Flammarion 1902. English translation in Poincaré 1913 . Poincaré 1905a Henri Poincaré: La valeur de la science. – Paris: Ernst Flammarion 1905. English translation in Poincaré 1913 . Poincaré 1905b Henri Poincaré: Les mathématiques et la logique. – Revue de métaphysique et de morale 13 (1905), 815–835. Reprinted with alterations in Poincaré 1908 , Part II, Chapter 3, ‘Les Mathématiques et la logique’. Original reprinted, with the alterations marked, in Heinzmann 1986 , 11–34. English translation in Ewald 1996 , 1021–1038. Poincaré 1906a Henri Poincaré: Les mathématiques et la logique. – Revue de métaphysique et de morale 14 (1906), 17–34. Reprinted with alterations in Poincaré 1908 , Part II, Chapter 4, ‘Les Logiques nouvelles’. Original reprinted, with the alterations marked, in Heinzmann 1986 , 35–53. English translation in Ewald 1996 , 1038–1052. Poincaré 1906b Henri Poincaré: Les mathématiques et la logique. – Revue de métaphysique et de morale 14 (1906), 294–317. Reprinted with alterations in Poincaré 1908 , Part II, Chapter 5, ‘Les dernières efforts des Logisticiens’. Original reprinted, with the alterations marked, in Heinzmann 1986 , 79–104. English translation in Ewald 1996 , 1052–1171. Poincaré 1908 Henri Poincaré: Science et méthode. – Paris: Ernst Flammarion 1908. English translation in Poincaré 1913 .
Bibliography
1041
Poincaré 1913 Henri Poincaré: The Foundations of Science. – New York: The Science Press 1913. English translation by G. B. Halsted of Poincaré 1902 , Poincaré 1905a and Poincaré 1908 , with a Preface by Poincaré, and an Introduction by Josiah Royce. Poretzky 1898 Platon Poretzky: Sept lois fondamentales de la théorie des égalités logiques. – Bulletin de la Société Physico-Mathématique de Kasan 8 (1898), 33–103, 129–81, 183–216. Poretzky 1908 Platon Poretzky: Théorie conjointe des égalités et des non-égalités logiques. – Bulletin de la Société Physico-Mathématique de Kasan 16 (1908), 1–2, 9–41. Pöschl 1923 Theodor Pöschl: Über die ebene radiale Strömung eines Gases mit Berücksichtigung der Reibung. – Mathematische Annalen 89 (1923), 208–214. Post 1920 Emil Post: Introduction to a general theory of elementary propositions. – Bulletin of the American Mathematical Society 26 (1920), 437. Abstract of a talk presented to the American Mathematical Society, 24 April, 1920. Post 1921 Emil Post: Introduction to a general theory of elementary propositions. – American Journal of Mathematics 43 (1921), 163–185. Reprinted in van Heijenoort 1967 , 265–283. Ramsey 1926 Frank Plumpton Ramsey: The foundations of mathematics. – Proceedings of the London Mathematical Society 25, Second Series (1925), 338–384. Reprinted in Ramsey 1931 , 1–61, and Ramsey 1978 , 152–212. Ramsey 1931 Frank Plumpton Ramsey: The Foundations of Mathematics and Other Logical Essays. – London: Routledge and Kegan Paul 1931. Edited, with an Introduction, by R. B. Braithwaite. Ramsey 1978 Frank Plumpton Ramsey: Foundations: Essays in Philosophy, Logic, Mathematics and Economics. – London: Routledge and Kegan Paul 1978. Edited by D. H. Mellor, with Introductions by D. H. Mellor, T. J. Smiley, L. Mirsky and Richard Stone.
1042
Bibliography
Ravaglia 2003* Mark Ravaglia: Explicating the Finitist Standpoint. – Pittsburgh 2003. Doctoral Dissertation, presented to the Department of Philosophy, CarnegieMellon University, Pittsburgh. Rédei 2005 Miklós Rédei (ed.): John von Neumann: Selected Letters. – Providence, Rhode Island: American Mathematical Society/London Mathematical Society 2005. Reid 1970 Constance Reid: Hilbert. – Berlin, New York: Springer 1970. Reid 1976 Constance Reid: Courant in Göttingen and New York: The Story of an Improbable Mathematician. – Heidelberg, New York: Springer 1976. Reid 1986 Constance Reid: Hilbert, Courant. – Heidelberg, New York: Springer 1986. Joint republication of Reid 1970 and Reid 1976 . Rosser 1937 Barkley Rosser: Gödel’s theorems for non-constructive logics. – Journal of Symbolic Logic 2 (1937), 129–137. Russell 1903 Bertrand Russell: The Principles of Mathematics. Volume I. – Cambridge: Cambridge University Press 1903. Russell 1906 Bertrand Russell: The theory of implication. – American Journal of Mathematics 28 (1906), 159–202. Russell 1908 Bertrand Russell: Mathematical logic as based on the theory of types. – American Journal of Mathematics 30 (1908), 3, 222–262. Reprinted in Russell 1956 , 59–102, and van Heijenoort 1967 , 152–182. Russell 1910 Bertrand Russell: La théorie des types logiques. – Revue de métaphysique et de morale 18 (1910), 263–301. Russell’s English version is in Russell 1973 , 215–252, and Russell 1992 , 4–31. Russell 1920 Bertrand Russell: Introduction to Mathematical Philosophy. – London: Allen and Unwin 1920.
Bibliography
1043
Russell 1923 Bertrand Russell: Einführung in die mathematische Philosophie. – München: Drei Masken Verlag 1923. German translation of Russell 1920 by Emil Julius Gumbel and Walter Gordon, with an introduction by David Hilbert. Russell 1956 Bertrand Russell: Logic and Knowledge: Essays 1901–1950. Edited by Robert Charles Marsh. – London: George Allen and Unwin 1956. Russell 1973 Bertrand Russell: Essays in Analysis. Edited by Douglas Lackey. – London: George Allen and Unwin 1973. Russell 1992 Bertrand Russell: The Collected Papers of Bertrand Russell, Volume 6: Logical and Philosophical Papers, 1909–1913. Edited by John Slater, with the assistance of Bernd Frohmann. – London and New York: Routledge 1992. Rédei and Stöltzner 2001 M. Rédei and M. Stöltzner (eds.): John von Neumann and the Foundations of Quantum Physics. – Dordrecht: Kluwer 2001. Sauer and Majer 2009 Tilman Sauer and Ulrich Majer (eds.): David Hilbert’s Lectures on the Foundations of Physics, 1915–1927: Relativity, Quantum Theory and Epistemology. – Berlin, Heidelberg, New York: Springer 2009. Volume 5 of David Hilbert’s Foundational Lectures, edited by William Ewald, Michael Hallett, Ulrich Majer and Wilfried Sieg. Schappacher and Petri 2007 Norbert Schappacher and Birgit Petri: On arithmetization. – In Goldstein, Schappacher and Schwermer 2007 , 343–374. Schröder 1877 Ernst Schröder: Der Operationskreis des Logikkalküls. – Leipzig: B. G. Teubner 1877. Schröder 1890 Ernst Schröder: Vorlesungen über die Algebra der Logik (exakte Logik), Band I. – Leipzig: B.G. Teubner 1890. Reprinted 1966, New York: Chelsea Publishing Co. Schröder 1891 Ernst Schröder: Vorlesungen über die Algebra der Logik, Band II. – Leipzig: B.G. Teubner 1891. Reprinted 1966, New York: Chelsea Publishing Co.
1044
Bibliography
Schröder 1895 Ernst Schröder: Vorlesungen über die Algebra der Logik, Band III: Algebra und Logik der Relative. Erste Abteilung. – Leipzig: B.G. Teubner 1895. Reprinted 1966, New York: Chelsea Publishing Co. Schröder 1909–10 Ernst Schröder: Abriß der Algebra der Logik. 2 Volumes. – Leipzig: Teubner 1909–10. Sheffer 1913 Henry M. Sheffer: A set of five independent postulates for Boolean algebras, with application to logical constants. – Transactions of the American Mathematical Society 14 (1913), 4, 481–88. Sieg 1977* Wilfried Sieg: Trees in Metamathematics: Theories of Inductive Definitions and Subsystems of Analysis. – Stanford University, Dissertation 1977. Sieg 1990 Wilfried Sieg: Relative consistency and accessible domains. – Synthese 84 (1990), 259–297. Reprinted in Sieg 2013, 299–326. Sieg 1994 Wilfried Sieg: Mechanical procedures and mathematical experience. – In George 1994 , 71–117. Sieg 1997 Wilfried Sieg: Aspects of mathematical experience. – In Agazzi and Darvas 1997 , 195–217. Reprinted in Sieg 2013, 329–343. Sieg 1999 Wilfried Sieg: Hilbert’s Programs: 1917–1922. – Bulletin of Symbolic Logic 5 (1999), 1–44. Reprinted in Sieg 2013, 91–127. Sieg 2002 Wilfried Sieg: Beyond Hilbert’s reach?. – In Malament 2002 , 363–405. Reprinted in Sieg 2013, 345–375. Sieg 2003a Wilfried Sieg: Introductory Note to the correspondence between Gödel and Jacques Herbrand. – In Gödel 2003b, 3–13. Sieg 2003b Wilfried Sieg: Introductory Note to the correspondence between Gödel and John von Neumann. – In Gödel 2003b, 327–335.
Bibliography
1045
Sieg 2005 Wilfried Sieg: Only two letters: the correspondence between Herbrand and Gödel. – Bulletin of Symbolic Logic 11 (2005), 172–184. Sieg 2009 Wilfried Sieg: Hilbert’s proof theory. – In Gabbay and Woods 2009 , 127–190. Sieg 2012 Wilfried Sieg: In the shadow of incompleteness: Hilbert and Gentzen. – In Dybjer et al. 2012 . Reprinted in Sieg 2013, 155–192. Sieg 2013 Wilfried Sieg: Hilbert’s Programs and Beyond . – New York: Oxford University Press 2013. Sieg and Parsons 1995 Wilfried Sieg and Charles Parsons: Introductory Note to ‘Vortrag bei Zilsel’. – In Gödel 1995 , 62–85. Reprinted in Sieg 2013, 193–213. Sieg and Schlimm 2005 Wilfried Sieg and Dirk Schlimm: Dedekind’s analysis of number. – Synthese 147 (2005), 121–170. Reprinted in Sieg 2013, 35–72. Simpson 1999 Stephen G. Simpson: Subsystems of Second Order Arithmetic. – Berlin, Heidelberg, New York: Springer 1999. Sinaceur 1974 Mohammed-Allal Sinaceur: L’infini et les nombres: commentaires de R. Dedekind à « Zahlen ». La correspondance avec Keferstein. – Revue d’histoire des sciences 27 (1974), 251–278. Skolem 1920 Thoralf Skolem: Logisch-kombinatorische Untersuchungen über die Erfüllbarkeit oder Beweisbarkeit mathematischer Sätze nebst einem Theoreme über dichte Mengen. – Skrifter utgit av Videnskappsselskapet i Kristiania, I. Matematisk-naturvidenskabelig klasse (1920), 4, 1–36. Skolem 1923 Thoralf Skolem: Einige Bemerkungen zur axiomatischen Begründung der Mengenlehre. – In Matematikerkongressen i Helsingfors den 4–7 Juli 1922, Den femte skadinaviska matematikerkongressen, Redogörelse, Helsinki: Akademiska Bokhandeln (1923), 217–232. Reprinted in Fenstad 1970 , 137–152. English translation in van Heijenoort 1967 , 290–301.
1046
Bibliography
Solovay 1995 Robert Solovay: Introductory Note to two unpublished lectures of Gödel’s (1939, 1940) on the consistency of the continuum hypothesis. – In Gödel 2003b, 114–127. Stein 1988 Howard Stein: Logos, logic and logistiké: Some philosophical remarks on the nineteenth-century transformation of mathematics. – In Aspray and Kitcher 1988 , 238–259. Study 1923 Eduard Study: Über S. Lies Geometrie der Kreise und Kugeln. Dritte Fortsetzung. – Mathematische Annalen 89 (1923), 298–314. Tait 2005 W. W. Tait: The Provenance of Pure Reason: Essays in the Philosophy of Mathematics and its History. – New York: Oxford University Press 2005. Tapp 2006* Christian Tapp: An den Grenzen des Endlichen—erkenntnistheoretische, wissenschaftsphilosophische und logikhistorische Perspektiven auf das Hilbertprogramm. – München 2006. Doctoral Dissertation, presented to the Ludwig-Maximillians-Universität, München. Venn 1894 John Venn: Symbolic Logic. – London: Macmillan 1894. Verhandlungen 1905 Verhandlungen des Dritten Internationalen Mathematiker-Kongresses in Heidelberg vom 8. bis 13. August 1904. – Leipzig: Teubner 1905. Verhandlungen 1932 Verhandlungen des Internationalen Mathematiker-Kongresses Zürich 1932. II. Band. Sektions-Vorträge. – Zürich, Leipzig: Füssli 1932. Verzeichnis 1943* Verzeichnis der von Geheimrat David Hilbert hinterlassenen Handschriften, Bücher, Sonderdrucke, Zeitschriften, [sic]. – Georg-August-Universität Göttingen, Mathematisches Institut, Lesesaal. Walsh 1923 Joseph Leonard Walsh: A property of Haar’s system of orthogonal functions. – Mathematische Annalen 90 (1923), 38–45. Wang 1981 Hao Wang: Some facts about Kurt Gödel. – Journal of Symbolic Logic 46 (1981), 653–659.
Bibliography
1047
Weyl 1910 Hermann Weyl: Über die Definitionen der mathematischen Grundbegriffe. – Mathematisch-naturwissenschaftliche Blätter 7 (1910), 93–95, 109–113. Reprinted in Weyl 1968a, 298–304. Weyl 1918 Hermann Weyl: Das Kontinuum. Kritische Untersuchungen über die Grundlagen der Analysis. – Leipzig: Veit 1918. English translation as The Continuum: A Critical Analysis of the Foundations of Analysis, by Stephen Pollard and Thomas Bole, Kirksville, Montana: Thomas Jefferson University Press, 1987. Reprinted by Dover Publishing Co., New York, 1994. Weyl 1919 Hermann Weyl: Der circulus vitiosus in der heutigen Begründung der Analysis. – Jahresbericht der Deutschen Mathematiker Vereinigung 28 (1919), 85–92. Reprinted in Weyl 1968b, 43–50. Weyl 1921 Hermann Weyl: Über die neue Grundlagenkrise der Mathematik. Vorträge, gehalten im mathematischen Kolloquium Zürich. – Mathematische Zeitschrift 10 (1921), 39–79. Reprinted in Weyl 1968b, 143–179. English translation in Mancosu 1998 , 86–118. Weyl 1928 Hermann Weyl: Diskussionsbemerkungen zu dem zweiten Hilbertschen Vortrag über die Grundlagen der Mathematik. – Abhandlungen aus dem Mathematischen Seminar der Hamburgischen Universität 6 (1928), 86–88. Reprinted in this Volume, 943–945. Republished in Hilbert 1928b, and in Weyl 1968c, 147–149. English translation in van Heijenoort 1967 , 482–484. Weyl 1944 Hermann Weyl: David Hilbert and his mathematical work. – Bulletin of the American Mathematical Society 50 (1944), 612–654. Reprinted in Weyl 1968d , 130–172, and also, in shortened form, in Reid 1970 , 245–283. Weyl 1968a Hermann Weyl: Hermann Weyl: Gesammelte Abhandlungen. Band I. Herausgegeben von K. Chandrasekharan. – Berlin, Heidelberg, New York: Springer 1968. Weyl 1968b Hermann Weyl: Hermann Weyl: Gesammelte Abhandlungen. Band II. Herausgegeben von K. Chandrasekharan. – Berlin, Heidelberg, New York: Springer 1968.
1048
Bibliography
Weyl 1968c Hermann Weyl: Hermann Weyl: Gesammelte Abhandlungen. Band III. Herausgegeben von K. Chandrasekharan. – Berlin, Heidelberg, New York: Springer 1968. Weyl 1968d Hermann Weyl: Hermann Weyl: Gesammelte Abhandlungen. Band IV. Herausgegeben von K. Chandrasekharan. – Berlin, Heidelberg, New York: Springer 1968. Whitehead 1898 Alfred North Whitehead: A Treatise of Universal Algebra. – Cambridge: Cambridge University Press, Cambridge 1898. Whitehead 1901 Alfred North Whitehead: Memoir on the algebra of symbolic logic. – American Journal of Mathematics 23 (1901), 4, 297–316. Whitehead 1903 Alfred North Whitehead: The logic of relations, logical substitution groups and cardinal numbers. – American Journal of Mathematics 25 (1903), 157–78. Whitehead and Russell 1910 Alfred North Whitehead and Bertrand Russell: Principia Mathematica. Volume I. – Cambridge: University Press 1910. Whitehead and Russell 1912 Alfred North Whitehead and Bertrand Russell: Principia Mathematica. Volume II. – Cambridge: University Press 1912. Whitehead and Russell 1913 Alfred North Whitehead and Bertrand Russell: Principia Mathematica. Volume III. – Cambridge: University Press 1913. Whitehead and Russell 1927 Alfred North Whitehead and Bertrand Russell: Principia Mathematica. Volumes I–III. Second Edition. – Cambridge: University Press 1927. Zach 1999 Richard Zach: Completeness before Post: Bernays, Hilbert, and the development of propositional logic. – Bulletin of Symbolic Logic 5 (1999), 331–366. Zach 2003 Richard Zach: The practice of finitism: epsilon calculus and consistency proofs in Hilbert’s Program. – Synthese 137 (2003), 211–259.
Bibliography
1049
Zach 2004 Richard Zach: Hilbert’s “Verunglückter Beweis”, the first Epsilon Theorem, and consistency proofs. – History and Philosophy of Logic 25 (2004), 79–94. Zermelo 1908a Ernst Zermelo: Neuer Beweis für die Möglichkeit einer Wohlordnung. – Mathematische Annalen 65 (1908), 107–128. Reprinted with facing page English translation in Zermelo 2010 , 121–159. English translation also in van Heijenoort 1967 , 183–198. Zermelo 1908b Ernst Zermelo: Untersuchungen über die Grundlagen der Mengenlehre I. – Mathematische Annalen 65 (1908), 261–281. Reprinted in Zermelo 2010 , 189–229. English translation also in van Heijenoort 1967 , 199–215. Zermelo 2010 Ernst Zermelo: Ernst Zermelo: Gesammelte Werke. Band 1: Mengenlehre, Varia. Edited by Hans-Dieter Ebbinghaus and Akihiro Kanamori. – Berlin, Heidelberg: Heidelberger Akademie der Wissenschaften and Springer-Verlag 2010.
Name Index Note : Page references to Hilbert’s German texts are given in roman typeface; page references to the English editorial apparatus are given in italics.
Abel, Niels Hendrik, 688 Achilles, 689 Ackermann, Wilhelm, IX, 1, 2, 10, 19, 21–25, 27, 30, 32, 39, 41, 43, 45, 48–51, 57, 227, 229, 230, 419, 427, 429, 430, 570, 571, 656, 666, 761, 788–791, 797, 806, 807, 809, 867, 880, 910, 914, 919–921, 938, 940, 946, 952, 956, 960, 961, 968, 969, 979, 1003 Adler, August, 997 Ahlers, Volker, IX Andrae, Albert, 997 Archimedes, 65, 75, 76, 78, 86, 88, 104–106, 431, 446, 447, 449– 451, 658, 693, 706 Aristides, 623 Aristotle, 130, 533, 553, 656, 846, 847, 965 Bär, Richard, 36, 1001, 1007, 1008 Baldus, Richard, 443 Baule, Bernhard, 1000, 1001 Behmann, Heinrich, 1, 34, 41, 49, 50, 54, 55, 224, 609, 800, 877, 911, 914, 965 Behnke, H., 12 Berkeley, George, 286 Berkowski, Ludwig, 998 Bernays, Ludwig, VIII Bernays, Paul, VII–IX, XV, XVI, 1–3, 5, 10, 11, 13–19, 21, 23–25, 28, 30, 32, 35–37,
39–42, 45, 48–56, 58, 93, 95, 137, 146, 148, 215–218, 218, 219, 220, 222–230, 233, 269–271, 276–279, 281, 284, 286, 291, 292, 294, 296, 297, 298, 299, 317, 322, 330, 334, 337–339, 339– 341, 356, 373, 375, 375, 376, 379, 379, 380, 384, 393, 394, 400, 402, 418, 419, 421, 423–426, 428– 430, 443, 458, 507, 508, 511, 520–524, 527, 557, 560, 561, 566–568, 571, 577, 599– 602, 604, 606, 611, 611, 612, 613, 616, 619, 621, 624, 626, 628, 635, 646, 647–650, 652, 666, 726, 761, 762, 764, 765–767, 770, 774, 788, 789, 791, 792, 794, 795, 797–802, 804, 807, 809, 830, 837, 857, 880, 911, 914, 918–921, 938, 940, 941, 950, 952, 953, 960, 968, 969, 969–972, 978, 979, 991, 1002, 1003, 1008 Bernstein, Felix, 15, 34, 740, 911 Bertrand, Joseph Louis François, 461 Bieberbach, Ludwig, 954 Birck, Otto, 1007 Blumenthal, Otto, 55, 56 Bode, ??, 748 Bohr, Niels, 705
W. Ewald and W. Sieg (eds.), David Hilbert’s Lectures on the Foundations of Arithmetic and Logic 1917–1933, DOI 10.1007/978-3-540-69444-1, © Springer-Verlag Berlin Heidelberg 2013
1051
1052
Name Index
Boltzmann, Ludwig, 364, 461, 659, 699, 703 Bolzano, Bernhard, 529, 599 Boole, George, 9, 38, 286, 603, 812, 911, 912, 914 Borel, Émile, 15 Born, Max, 1, 2, 29, 998, 1004, 1008 Brendel, Tobias, IX Brentano, Franz, 303, 603, 817, 914 Brianchon, Charles-Julien, 683 Brouwer, Luitzen Egbertus Jan, VII, 2, 3, 11–16, 37, 277, 282– 288, 293, 343, 363, 364, 418, 532, 589, 593, 594, 602, 656, 742, 746, 748, 800, 933–935, 941, 943, 944, 954, 982 Bruno, Giordano, 706 Buldt, Bernd, 795 Burali-Forti, Cesare, 288, 291, 292, 342, 350, 911 Byrne, Catriona, IX Cantor, Georg, 4–6, 10, 15, 22, 47, 57, 208, 280, 288–290, 300, 342, 344, 346, 350, 353– 355, 656, 661, 662, 733, 734, 738, 739, 741–743, 762, 900, 931–933, 937, 938, 958, 962, 965 Carnap, Rudolf, 27, 794, 796, 799, 800, 971, 973 Cassirer, Ernst, 13 Cauchy, Augustin-Louis, 289, 290, 300, 529, 599, 688 Cauer, Wilhelm, 376 Chevalley, Claude, 796 Chwistek, Leon, 911 Clausius, Rudolf, 659, 699 Collatz, Lothar, 23, 29, 430, 801, 1009 Copernicus, 706 Correns, Carl Erich, 722 Courant, Richard, 1, 2, 55–57, 564, 645, 797, 1000
Couturat, Louis-Alexandre, 910 Crathorne, Arthur R., 999, 1006 Dawson, John W., 25, 793, 794 De Morgan, Augustus, 279, 812, 911, 914 Debye, Peter, 1, 36 Dedekind, Richard, 1, 4–7, 9, 15, 18, 33, 40, 47, 57, 76, 209, 280, 281, 283, 288–291, 326, 343, 379, 402, 472, 473, 656, 658, 661, 663, 665, 693, 739, 741, 745, 755, 762, 904, 934, 943, 958, 962–964, 966, 975 Dehn, Max, 106, 217, 447 Democrates, 699, 710 Desargues, Gérard, 42 Descartes, René, 79 Diestel, Friedrich, 1003 Dines, L. L., 911 Dirichlet, Lejeune, 18, 354, 364, 471 Dörrie, Heinrich, 996 Einstein, Albert, 1, 290, 461, 660, 709, 710 Epstein, Paul, 1008 Euklid, 71, 72, 89, 90, 98, 227, 354, 431, 434, 440, 447, 448, 657, 658, 660, 673, 675, 684, 692–695, 708, 731, 742, 744, 746 Ewald, William, VIII, IX, XXIII, 30, 58, 230, 297, 667, 764, 778, 807, 999 Faraday, Michael, 701 Feferman, Solomon, 791, 792 Fermat, Pierre, 25, 288, 681, 793, 934 Fourier, Jean-Baptiste-Joseph, 936 Fraenkel, Abraham A., 665 Frankfurter, Fritz, 1007 Frege, Gottlob, 8–10, 13, 15, 33, 35, 38, 46, 48, 52, 224, 227, 232, 281, 286, 293,
Name Index 303, 326, 330, 343, 360, 472–475, 546, 600, 603, 661, 663, 665, 739, 741, 745, 755, 812, 817, 911, 914, 958, 976 Friedrichs, Kurt, 56 Fuchs, Dorothée, IX Fuchs, Wolfgang, IX Galois, Évariste, 602 Galton, Francis, 720 Gauß, Carl Friedrich, 106, 656–658, 674, 675, 681, 934, 976 Gentzen, Gerhard, 1, 16, 28, 29, 228, 278, 426, 430, 788, 799, 801–804 Gibbs, Josiah Willard, 659, 699 Gilchrist, Martin, IX Goeb, Margarethe, 1001 Gödel, Kurt, 3, 16, 22, 24–28, 40, 45, 46, 50, 230, 430, 761, 762, 764, 788–803, 968, 969, 969–971 Goldbach, Christian, 25, 718, 793 Goldschmidt, Richard, 666, 722, 723 Gordan, Paul, 799 Griffiths, Phillip, IX Haar, Alfréd, 999 Hagemann, Willem, IX Hahn, Hans, 796, 911 Hallett, Michael, VIII, IX, XXIII, 44, 443, 576, 646, 921, 956, 973, 984 Hamburger, Hans, 413 Hamilton, William, 912 Hartmann, Julia, IX Haubrich, Ralf, VIII, IX Hecke, Erich, 283, 1000, 1001, 1007 Heckhausen, G., 1003 Hehn, Nina, IX Heidegger, Martin, 972, 973 Heisenberg, Werner, 1 Hellinger, Ernst, 998, 999, 1006, 1007 Hempel, Carl Gustav, 796
1053
Herbrand, Jacques, 1, 2, 24, 26– 28, 796, 798 Hermite, Charles, 15, 976 Hertz, Heinrich, 461, 659, 699 Hertz, Paul, 802 Heyting, Arendt, 791, 799, 802, 803 Hilbert, Käthe, 991 Hillebrand, Franz, 603 Hölder, Otto, 470, 601 Hückel, Erich, 1007 Humm, Rudolf, 1002 Huntington, Edward V., 912 Hurwitz, Adolf, 5, 1005 Hurwitz, Julius, 1005 Jacobi, Carl Gustav Jacob, 976 Jevons, William Stanley, 812, 912 Johnson, W. E., 912 Johnston, Elizabeth, IX Jordan, Pascual, 1 Just, Günther, 666, 722, 723 Kant, Immanuel, 293, 533, 605, 665, 706, 707, 710, 755, 765, 779, 847, 914, 974, 975 Keferstein, Hans, 4 Keller, Oliver, IX Keynes, John Maynard, 912 Kirchhoff, Gustav, 659, 699 Klapproth, Pamela, IX Kneser, Adolf, 565 Kneser, Hellmuth, VIII, XVI, 17, 19, 21, 284, 380, 391, 393, 418, 419, 423–428, 540, 551, 554, 555, 557, 560– 562, 564, 565–571, 577, 578, 584, 586, 588, 590–592, 592, 598, 602, 606, 610, 616, 620, 627, 628, 630, 634– 636, 638, 639, 641, 645, 646, 648, 652, 665, 801– 804, 1008 Kneser, Martin, VIII, 566, 1008 Kowalewski, Christian, 13 Kowalewski, Gerhard, 13 Krämer, Stefan, IX
1054
Name Index
Kratzer, Adolf, 2, 1002 Krayer, Albert, VIII, IX Kronecker, Leopold, 4–7, 11, 14, 15, 18, 57, 277, 281, 283, 288, 289, 293, 342, 352– 355, 363, 377, 425, 528, 529, 532, 589, 593, 594, 599, 656, 742, 934, 936, 941, 958, 960, 976, 982 Kummer, Ernst, 658 Ladd-Franklin, Christine, 912 Lange, Luise, 1001 Lasker, Emanuel, 700 Legendre, Adrien-Marie, 364, 446, 447, 449, 708 Leibniz, Gottfried Wilhelm von, 286, 293, 812, 914 Lévy, Paul, 665 Lewis, Clarence Irving, 910, 916 Lindelöf, Ernst, 15 Löwenheim, Leopold, 46, 50, 877, 880, 912, 915, 965 Łukasiewicz, Jan, 227 Luzin, Nikolai, 665 MacColl, Hugh, 912 Mach, Ernst, 659, 699, 700, 945 Mai, Michael, IX Majer, Ulrich, VIII, IX, XXIII, 36 Mancosu, Paolo, 54, 795 Marshall, W., 999, 1006 Marxen, Sophus, 996 Maxwell, James Clerk, 659, 699 Mendel, Gregor, 721, 722, 725, 727 Menzler-Trott, Eckart, 29, 430 Minkowski, Hermann, 288, 355 Mints, G., 430 Müller, E., 910, 913 Nelson, Leonard, 51 Neurath, Otto, 911 Nicod, Jean, 227 Noether, Emmy, 1, 2, 36, 794 Nordheim, Lothar, 666, 759, 1003, 1004
Ore, Oystein, 794 Ostwald, Friedrich Wilhelm, 461, 659, 699, 702, 703 Parsons, Charles, 793 Pascal, Blaise, 93, 609, 610, 632, 658, 683 Pates, Rebecca, IX Patterson, Samuel, VIII Patzig, Günther, VIII Peano, Guiseppe, 33, 38, 224, 232, 571, 812, 912, 915, 943, 956, 960, 962, 970 Peirce, Charles Sanders, 9, 40, 224, 279, 286, 812, 912, 915 Peterhans, Brigitte, VIII, 570, 1008 Peterhans, Walter, VIII, 18, 419, 569–571, 575, 1008 Pietrkowski, Stephan, 413 Planck, Max, 461, 659, 699, 702 Poincaré, Henri, 14, 15, 17, 32–34, 53, 286, 288–290, 295, 342, 352, 354, 355, 402, 421, 611, 612, 642, 742, 932, 933, 941, 943, 958, 976, 982 Pólya, George, 35, 51 Poretzky, Platon, 913 Post, Emil, 45, 49, 50, 225–227, 229, 790 Prinz, Markus, 998 Ramsey, Frank Plumpton, 913 Rausch von Traubenberg, Heinrich, IX Reichenbach, Hans, 799, 800 Reid, Constance, 22, 35, 36, 56, 918, 919 Reidemeister, K., 955 Richard, Jules, 15, 47, 53, 55, 288, 344, 372, 602 Riemann, Bernhard, 353, 364, 688, 974 Rogel, Franz, 748 Rohlfing, Helmut, VIII Rosemann, W., 527, 1002
Name Index Rosenfeld, Marie, IX Rosser, Barkley, 971 Rudolph, Rachel, IX Russell, Bertrand, VII, 3, 5, 8–10, 13, 15, 32–35, 38, 40, 47– 49, 52, 54, 55, 57, 194, 205, 219, 223–225, 228, 229, 232, 243, 270, 276, 279, 280, 288, 292, 294, 303, 313, 334, 342, 346, 348, 359–363, 372, 373, 429, 432, 472, 475, 477, 487, 524, 561, 563, 577, 592, 592, 603, 629, 740, 742, 743, 758, 812, 817, 830, 886, 891, 895, 896, 902, 908– 910, 913, 915, 916, 933, 941, 958–961, 966, 982 Sauer, Tilman, VIII Scherrer, Paul, 1008 Schilling, Heiko, IX Schimmak, 461 Schlick, Moritz, 27 Schlimm, Dirk, VIII, IX Schmidt, Arnold, 19, 795, 991, 1004, 1005 Schönfinkel, Moses, 1, 41, 50, 276, 296, 375, 880, 911, 915, 1002 Scholz, Heinrich, 13, 34, 795 Schröder, Ernst, 9, 38, 40, 48, 224, 226, 232, 233, 267, 279, 812, 823, 880, 910, 913, 915, 965 Schröder-Pander, Friedericke, IX Schur, Friedrich, 797 Sheffer, H. M., 227, 603, 817, 911, 913, 915 Sieg, Wilfried, VIII, IX, XXIII, 12, 30, 58, 297, 395, 430, 576, 805, 807 Skolem, Thoralf, 46, 50, 795, 880, 913, 915 Sokrates, 144, 300, 854 Solovay, Robert M., 22
1055
Sommerfeld, Arnold, 289, 290 Stallo, J. B., 700 Steiner, Jakob, 658, 687, 688 Struik, Dirk, 1004 Szabo, M. E., 804 Tait, W. W., 430 Tapp, Christian, 12, 395 Tarski, Alfred, 230, 795 Thomae, Carl Johannes, 600 Tieffenbach, E., 998 Ulm, Helmut, 19 Vaihinger, Hans, 13 van der Waerden, Bartel, 1, 2 van Heijenoort, Jean, 22 Veblen, Oswald, 802 Venn, John, 913 Veronese, Giuseppe, 602 Voellmer, Andreas, IX von Helmholtz, Hermann, 293, 470, 601, 659, 699, 701 von Helmolt, Arnim, IX von Neumann, Johann, 1, 22, 24, 27, 28, 291, 429, 430, 666, 761, 789, 790, 792, 793, 794, 794, 796–800, 912, 938, 950, 956, 960, 968–970, 979 von Plato, Jan, 802 von Schaper, Hans, 996, 1006 Wang, Hao, 793, 794 Weierstrass, Karl, 5, 6, 18, 288– 290, 300, 353, 529, 577, 599, 656, 665, 688, 762, 934 Weyl, Hermann, VII, 1–3, 11–15, 23, 24, 37, 38, 51, 55, 56, 277, 283–285, 287, 288, 291–294, 342, 343, 359, 360, 362–364, 418, 429, 532, 560, 561, 589, 593, 594, 602, 656, 742, 788, 789, 917– 920, 950, 961, 1001 Whitehead, Alfred North, VII, 3, 9, 10, 34, 48, 49, 55, 57,
1056
Name Index
223, 225, 229, 232, 243, 270, 280, 475, 477, 487, 812, 830, 895, 896, 902, 908, 910, 913, 915, 933, 941, 961, 982 Wicke, E., 1007 Wiener, Norbert, 56 Wilhelm, Hans-Jakob, IX, 1, 2, 30 Wilson, Edwin Bidwell, 698 Woolf, Harry, IX Zach, Richard, 53 Zenon, 658, 688 Zermelo, Ernst, IX, 5, 20, 51, 288, 290–293, 342, 348, 350, 355– 357, 359–363, 373, 552, 623, 662, 665, 740, 743, 758, 796, 958, 959, 966
Subject Index Note : Page references to Hilbert’s German texts are given in roman typeface; page references to the English editorial apparatus are given in italics.
A Abstraktion, 39, 66 Algebra, 1, 2, 9, 38, 39, 43, 44, 50, 87, 107–109, 226, 232, 233, 239, 286, 288, 301, 302, 304, 316, 353, 355, 435, 490, 491, 494, 514, 533, 579, 748, 752, 753, 809, 811, 812, 814, 815, 818, 819, 849, 873, 877, 928–930, 944, 957 Analysis, 9, 10, 16–18, 20, 21, 24, 27–28, 97, 139, 204, 206, 210, 228, 280, 284–285, 289, 292–294, 300, 315, 326, 343, 354, 356, 359, 363, 364, 419, 427, 429, 452, 460–462, 470, 471, 475, 481, 483, 484, 487, 488, 490, 492, 532, 545, 546, 551, 560, 568, 570– 574, 577, 589, 592, 593, 611, 623, 625, 629, 637, 638, 656, 658, 660–662, 682, 691, 692, 695, 696, 728, 729, 743, 744, 747, 753, 771, 772, 778–790, 792, 795, 900, 901, 927, 930, 932, 934, 941, 961– 963, 974, 976 A priori, 714, 765, 780, 974, 975
Arithmetik, 4–7, 13–19, 22, 32–34, 46, 64, 65, 75, 76, 78, 95, 108– 110, 232, 237, 277, 280– 283, 287, 294, 313, 343, 352–371, 396–409, 423, 425–429, 432, 440, 441, 452, 462, 470–472, 475, 477–479, 487–521, 566, 568, 570–572, 574, 593, 601, 612, 623, 625, 664, 672, 674, 682, 689–687, 691, 695, 744–749, 753, 761–763, 789–791, 797– 798, 801–804, 927, 931, 932, 957, 969–970, 976, 983 Axiom Auswahlaxiom [axiom of choice], 291, 359, 550, 551, 553, 555, 558, 560, 593, 623, 624, 626, 637, 646–650, 754, 938, 956, 961 Axiomatische Methode, 40–42, 52–53, 64, 79, 88, 280, 293, 349, 359, 363, 364, 434, 529, 742– 744, 926, 931 ‘Axiomatisches Denken’(Hilbert 1918a), 3, 8, 34, 36, 37, 41, 48, 53, 280, 293, 492
W. Ewald and W. Sieg (eds.), David Hilbert’s Lectures on the Foundations of Arithmetic and Logic 1917–1933, DOI 10.1007/978-3-540-69444-1, © Springer-Verlag Berlin Heidelberg 2013
1057
1058
Subject Index
Axiom der Reduzierbarkeit [axiom of reducibility], 9, 10, 20, 38, 47–50, 54, 205–214, 280, 292– 294, 399, 429, 429, 432, 487, 488, 561, 577, 629, 901, 902, 902, 904, 907–909 Axiome der Geometrie, 76, 440 B Beweistheorie [proof theory], 1–3, 11, 13, 15–17, 19–24, 26, 28, 29, 277–278, 285, 287, 294, 296, 367, 378, 379, 392–394, 418, 421, 422, 428, 430, 488, 506, 552, 561, 613, 656, 663–664, 669, 749, 754–756, 761, 788–790, 792, 796, 798, 799, 800, 919, 922–923, 931–933, 935, 936, 940, 943–944, 959–961, 963– 965, 967, 972, 974, 977– 978, 981–982 Biologie, 669, 719–720, 726–727, 729, 976 D Deduktion, 21, 42, 228, 278, 426, 792, 799, 802, 969 Dualität, 111, 113, 116, 131, 155, 168, 170–171, 173, 308– 309, 325, 683–684, 821, 835, 864, 894, 914 E Entscheidbarkeit [decidability], 9, 35, 35, 38, 41–42, 56, 223, 225, 281, 282, 287, 334, 877 Entscheidungsproblem [decision problem], 1, 41, 42, 50,
542, 608–610, 808, 810, 873–874, 876–877, 879, 880, 883–884, 910, 965 Existenz, 6–7, 13, 62, 64, 122, 125, 180–181, 188, 191, 196–197, 204–205, 207–208, 213, 238, 267, 307, 358, 361, 364, 427, 432, 447, 456, 472, 478, 481, 483, 487, 505–506, 625, 675, 688, 700–701, 741, 828, 882, 886, 892, 900–903, 914, 933, 934, 960–961, 965 F Finit, Finitismus [finitist; finitary; finitism], 2, 11, 15–20, 22, 25–29, 35, 41, 226, 281– 283, 285, 287, 288, 291, 293, 296, 381, 393, 418, 420, 423, 425, 427–428, 430, 471, 488, 489, 531, 545, 546, 574, 576–578, 599, 610, 657–659, 661, 663, 665, 744–746, 749, 750, 755, 765, 780, 788, 790–792, 794, 796–801, 803, 804, 934, 937, 940, 944, 963–964, 967–971, 970, 975–977, 980 Formalismus, 21, 35, 38–40, 44, 113, 119, 130–131, 134, 144, 192, 238, 278–280, 283, 285, 294, 325, 392– 393, 476–477, 491, 493, 496, 498, 504–506, 511, 519, 532–533, 545, 560, 588, 610, 629, 660, 728, 753, 811, 841, 847, 848, 873, 881, 924, 932, 979– 981 Funktion, 83–84, 86, 110, 125, 134– 136, 139, 144–145, 157, 177, 183–187, 192–194,
Subject Index
200–201, 204, 206–207, 209–213, 237, 313, 325, 330–331, 346–348, 354, 360, 364, 422, 438, 453– 457, 459, 471, 475, 478, 540, 552, 557–558, 560– 561, 574, 588, 591, 599, 619, 621, 623, 625–627, 629, 636–639, 642–643, 647, 742, 744, 772, 836, 849, 853, 872, 887–890, 895–898, 902–903, 906, 909, 924–925, 927–928, 934, 937–940, 947–948, 950–951, 960–961 Funktionzeichen, 134–136, 139, 159, 162–163, 180, 218, 312–313, 316–317, 320– 323, 325, 334, 422, 480, 493, 536–538, 541–542, 581, 619, 636, 848–849, 855, 863–864, 866, 877, 880–882, 891, 897, 899 G Geometrie Euklidische, 33, 81, 83, 85, 431, 441– 450, 682–684, 707, 709 Nicht-euklidische, 81, 83–85, 431, 444, 447, 694 Projektive, 363, 993 Gleichheit [equality], 89–90, 105– 106, 108, 118, 120, 135, 137, 156, 173, 233, 295, 365, 379, 380, 389, 392, 422, 433, 494, 554–556, 571, 582, 617–618, 729, 754, 762–763, 852, 925, 927, 962, 964, 979, 983, 985 H Hilberts Hotel, 661, 730
1059
I Implizite Definition, 207, 553, 571, 875, 902 Imprädikativ, 206–207, 293, 902, 958, 961, 962 Induktion, Prinzip der vollständigen [principle of complete induction], 61, 180, 181, 289–290, 295, 296, 358, 370, 392, 421, 588, 925, 941, 943, 982 Intuition, 287, 424, 661 Intuitionismus, 933, 936, 943, 945 K Kategorizität [categoricity], 790, 796, 967 Kontinuum, 593, 599, 660, 696, 697, 702, 705, 779, 977 Kontinuumsproblem [continuum hypothesis], 22, 364, 561, 594, 640, 643, 656, 661, 665, 756, 795, 931–937 Kürzbarkeit, 296, 421 L Logik, 32, 276, 425, 694 Logizismus [logicism], 48, 54, 280 M Mechanik, 64, 107, 363–364, 434, 461, 659, 695, 699, 717, 728 Mengenlehre [set theory], 1, 3, 8, 9, 13, 15–17, 20, 22, 23, 29, 29, 32–35, 47–49, 53, 62, 119, 183, 184, 186, 187, 194, 204, 206, 281, 288–294, 300, 326, 342, 343, 347, 353, 355, 356, 363, 365, 430, 462, 472, 475, 488, 490, 529, 546, 550, 552, 560, 568, 593, 599, 601, 630, 637, 638,
1060
Subject Index
657, 660–662, 669, 696, 728, 729, 733, 743, 793– 794, 797, 801, 811, 886– 891, 900, 936, 958 Metamathematik, XII, 9, 16, 53, 225, 286–287, 581, 583, 612, 751, 752, 801, 978, 1044 P Parallel, Parallelenaxiom [axiom of parallels], 15, 42, 59, 74– 75, 78, 80, 81, 85, 86, 88, 89, 92–94, 96, 431, 434, 440, 444, 447, 449, 542, 609, 683, 693, 707, 708, 874 Physik, IX, XVII, 1, 2, 11, 36, 37, 75, 276, 290, 307, 343, 354, 363, 367, 376, 425, 434, 436, 452, 453, 461– 462, 491, 492, 564, 645, 657, 659–661, 666, 695– 702, 705, 706, 710–712, 715, 719, 726–729, 744, 754, 779, 828, 829, 917, 931, 935, 944, 945, 957, 976, 977 Q Quantoren [quantifiers] Allzeichen [universal quantifier], 219, 313– 317, 320, 323, 393, 421–423, 475–477, 480, 486, 534–541, 575, 589, 591, 605, 606, 607, 614, 624, 626, 643, 762, 763, 767, 771, 849–851, 863–865, 868, 869, 871, 872, 878, 881, 882, 884, 891, 903, 908, 987, 988
Seinszeichen [existential quantifier], 313–318, 320, 322, 323, 329, 422, 475–479, 487, 534–536, 541, 558, 559, 575, 606, 607, 609, 623, 627, 636, 637, 664, 767, 770, 801, 850, 851, 853– 855, 863–866, 878, 881, 896, 901, 925, 986–988 S Schlussregeln [inference rules], 25, 39, 47, 50, 226, 227, 229, 294, 296, 378–383, 392, 420, 437, 761, 763, 764, 791, 792, 799, 968, 980 Stufen Kalkül [type theory; higherorder logic], 9, 20, 34, 44, 46–49, 53–55, 199–208, 210, 214, 473, 479, 895– 909 Syntax, 39, 55, 224, 225, 229, 277– 279, 286, 293, 294, 793 T Tertium non datur, 11, 13, 17, 24– 27, 283, 288, 330, 334, 354, 424, 428, 429, 471, 516, 574, 578, 590, 664, 749, 761, 762, 764, 765– 766, 770, 771, 773, 780, 790, 798–803, 920, 924, 925, 930, 936, 937, 960, 961, 975–977, 979, 982– 984, 985–989 U Unendlich [infinite], Unendlichkeit [infinity], 197, 291, 345, 354, 488–489, 529, 599, 656–665, 670–756 passim,
Subject Index
766, 779–782, 886, 931– 933, 941, 977, 982 Unvollständigkeit [incompleteness], 3, 23, 25, 27, 46, 50, 159, 160, 265, 761, 788, 792– 798, 867, 869, 969–972 V Vollständigkeit [completeness], 4, 10, 24–27, 32, 43–46, 49–53, 65, 76, 86–87, 109, 157–160, 225–226, 228–230, 233, 235–238 240, 278–279, 286–287, 435, 439, 441, 443, 444, 574, 610, 612, 768, 788, 790–792, 795–798, 810, 836–839, 866–869, 962, 964–965, 967, 968, 972 W Wahrheit [truth], 107, 133, 148, 185, 232, 235–237, 241, 242, 277, 301, 309, 427, 435, 444, 534, 536, 540, 542, 609, 672, 747, 755, 804, 935, 945, 965, 971, 976 Wahrscheinlichkeit [probability], 657, 660, 661, 712–714, 716–719, 727, 976 Widerspruchslosigkeit/Widerspruchsfreiheit [consistency] [Hilbert employs exclusively the ‘-losigkeit’ form up to p.367 in 1920; thereafter ‘-freiheit’ predominates, though the usage is irregular.], 2, 4– 12, 15–30, 32, 34, 35, 37, 38, 40, 42–45, 53, 56, 59, 61, 65, 76, 79, 110, 111, 122, 157–160, 223, 225,
1061
226, 228, 231, 235, 237, 248, 277, 280, 281, 287, 292–296, 326, 356, 364, 365, 367, 370, 373, 374, 378–381, 388–393, 399, 400, 402, 404, 406, 407, 418–430, 431, 432, 435, 436, 438, 440, 441, 443, 444, 452, 461, 462, 488, 492, 496, 506, 512, 519, 525, 544, 547, 557, 568, 570, 571, 576, 579, 583, 584, 586, 587, 591, 593, 600, 610, 612, 615, 620, 623, 627, 628, 656, 663– 665, 669, 744, 750, 752, 755, 761–764, 765, 769, 771, 788–804, 808, 810, 812, 836, 838, 866, 867, 876, 890, 919, 920, 930– 935, 938, 940, 941, 944, 945, 960–964, 968–972, 978–982, 984, 988 Z Zahl [number] Ganze Zahl [integer], 6–8, 18, 35, 208, 346, 347, 358, 425, 446, 450, 471, 490, 602, 662, 671, 688, 737, 900, 959, 976 Kardinalzahl [cardinal number], 529–530, 599, 736–738 Ordinalzahl [ordinal number], 291, 292, 641, 642, 661, 736–738, 971 Reelle Zahl [real number], 5, 7, 40, 76, 209–211, 213, 427, 481–485, 487, 558, 593, 605, 625, 636, 639, 682, 692, 761, 901–907
1062
Subject Index
Zahlentheorie [number theory], 8, 11, 16–18, 20, 21, 24–28, 34, 35, 51, 184, 280–283, 288, 292, 294, 295, 325, 326, 329, 330, 333, 343, 353, 355, 356, 358, 363– 371, 378, 379, 419, 427, 428, 430, 438, 463, 468, 470–473, 479, 481, 490,
493, 496, 498, 532, 547, 550, 572, 573, 601, 656– 658, 661, 663, 671, 672, 676, 685, 695, 739, 745, 752, 761, 763, 764, 765, 770, 771, 781, 788–793, 797, 798, 803, 804, 928– 931, 957, 962–964, 967– 969, 971, 975, 980, 983