Titelei
Eichholz / Vilkner Taschenbuch der Wirtschaftsmathematik
Titelei
Taschenbuch der Wirtschaftsmathematik
von...
77 downloads
1406 Views
3MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Titelei
Eichholz / Vilkner Taschenbuch der Wirtschaftsmathematik
Titelei
Taschenbuch der Wirtschaftsmathematik
von Prof. Dr. rer. nat. Wolfgang Eichholz und Prof. Dr.-Ing. Eberhard Vilkner
3., verbesserte Auflage mit 55 Abbildungen, 208 Beispielen und zahlreichen Tabellen
FACHBUCHVERLAG LEIPZIG im Carl Hanser Verlag
Titelei Autoren Prof. Dr. rer. nat. Wolfgang Eichholz Kapitel 3 bis 7, 9 Hochschule Wismar Fachhochschule für Technik, Wirtschaft und Gestaltung Fachbereich Wirtschaft Prof. Dr.-Ing. Eberhard Vilkner Kapitel 1, 2, 8 Hochschule Wismar Fachhochschule für Technik, Wirtschaft und Gestaltung Fachbereich Wirtschaft
Die Deutsche Bibliothek - CIP-Einheitsaufnahme Ein Titeldatensatz für diese Publikation ist bei Der Deutschen Bibliothek erhältlich ISBN 3-446-22080-1
Dieses Werk ist urheberrechtlich geschützt. Alle Rechte, auch die der Übersetzung, des Nachdruckes und der Vervielfältigung des Buches, oder Teilen daraus, vorbehalten. Kein Teil des Werkes darf ohne schriftliche Genehmigung des Verlages in irgendeiner Form (Fotokopie, Mikrofilm oder ein anderes Verfahren), auch nicht für Zwecke der Unterrichtsgestaltung, reproduziert oder unter Verwendung elektronischer Systeme verarbeitet oder verbreitet werden.
Fachbuchverlag Leipzig im Carl Hanser Verlag 2002 Carl Hanser Verlag München Wien Internet: http://www.fachbuch-leipzig.hanser.de Lektorat: Christine Fritzsch Satz: Dr. rer. nat. Wolfgang Eichholz / Dr.-Ing. Eberhard Vilkner Druck und Binden: Kösel, Kempten Printed in Germany
Umschlag Seite2
Grundlagen
G
Lineare Algebra und Optimierung
L
Funktionen, Folgen, Reihen
R
Grundzüge der Finanzmathematik
F
Funktionen mit Einer reellen Variablen
E
Funktionen mit Mehreren Variablen
M
Numerische Verfahren
N
Statistik
S
Ausgewählte Probleme des OR
O
Tafeln
T
Vorwort und Benutzerhinweise, Seite 5
Vorwort Dieses Kompendium auf dem Gebiet der Wirtschaftsmathematik stellt eine Brücke zwischen den mathematischen Verfahren und den wirtschaftlichen Anwendungen in komprimierter Form dar. Es enthält die wichtigsten Formeln, Gesetze und Verfahren aus der Wirtschaftsmathematik. Zahlreiche, ausführlich durchgerechnete Beispiele verdeutlichen die mathematischen Zusammenhänge. Das Taschenbuch wendet sich sowohl an Studenten wirtschaftlicher Fachrichtungen als auch an die in der Praxis tätigen Wirtschaftswissenschaftler. Es ist nützlich als Nachschlagewerk beim Lösen von Übungsaufgaben, bei der Prüfungsvorbereitung, bei Klausuren sowie bei der Bearbeitung von praktischen Problemstellungen. Das Buch ist somit auch für die berufliche Weiterbildung von Interesse. Durch die Softwareentwicklung wird der Zugang zu mathematischen Verfahren und somit auch zu immer komplizierteren wirtschaftlichen Modellen erleichtert. Dem trägt das Kapitel 7 Rechnung, in dem ein kleiner Einblick in Begriffe und Methoden der numerischen Mathematik gegeben wird. Die Kapitel 8.2 und 9 entstanden unter Mitwirkung von Prof. Dr. oec. habil. Hans-Jürgen Hochgräfe, Hochschule Wismar, Fachbereich Wirtschaft, wofür wir ihm recht herzlich danken möchten. Wir danken Herrn Prof. Dr. Manfred Kiy, Fachhochschule Köln, Fachbereich Wirtschaft, für die vielen guten Hinweise. Dank gilt auch Herrn Dr.-Ing. Steffen Naake, Chemnitz, für die Anfertigung der Abbildungen der Kapitel 1, 2 und 8 und Frau Christine Fritzsch vom Fachbuchverlag Leipzig für die gute Zusammenarbeit. Für Anregungen, Verbesserungen und Kritiken aus dem Leserkreis sind die Verfasser dankbar, denn wir wünschen uns, dass dieses Buch für Studium und Beruf ein zuverlässiger Ratgeber ist. Zur 3. Auflage Unser Dank gilt erneut den Lesern unseres Taschenbuchs, die mit Hinweisen und Ergänzungswünschen zur Verbesserung beigetragen haben. Die Kapitel Lineare Algebra und Optimierung sowie Numerische Verfahren wurden überarbeitet. Alle anderen Abschnitte wurden durchgesehen und verbessert. Neu aufgenommen wurde eine Integraltafel. Über die Homepage des Verlages http://www.fachbuch-leipzig.hanser.de gelangt der Leser zu weiteren Aufgaben mit Lösungen. Wolfgang Eichholz
Eberhard Vilkner
Benutzerhinweise Das Taschenbuch ist einfach und übersichtlich gestaltet. Trotzdem sollen folgende Hinweise die Arbeit mit dem Taschenbuch erleichtern. (1)
(2)
(3) (4)
Die neun Kapitel und die Tafeln sind mit Hilfe des Daumenregisters (auf jeder ungeraden Seite) schnell zu finden. Die Inhalte der Buchstaben stehen auf der zweiten Umschlagseite. Die Überschriften der einzelnen Abschnitte in drei Ebenen sind im Inhaltsverzeichnis enthalten. Überschriften vierter Ebene in den Abschnitten sind entsprechend hervorgehoben. Verweise beziehen sich auf die entsprechenden Abschnitte. Ein umfangreiches Sachwortverzeichnis am Ende des Buches erleichtert das Auffinden gesuchter Begriffe.
(5)
Begriffserklärungen und Definitionen sind grau unterlegt ohne schwarzen Rahmen. (6) Sätze und wichtige Formeln wurden grau unterlegt mit schwarzem Rahmen. (7) Abbildungen und Beispiele werden innerhalb der Kapitel fortlaufend numeriert. (8) Bemerkungen sind kursiv geschrieben. (9) Auf den inneren Umschlagseiten sind Ableitungen und Grundintegrale sowie diskrete und stetige Verteilungen zusammengefasst. (10) Auf Abkürzungen wurde weitestgehend verzichtet. Bezeichnungen befinden sich im jeweiligen Abschnitt. Einige wenige Bezeichnungen und Abkürzungen sind im Folgenden erklärt. Bezeichnungen
Abkürzungen
: = ...
bez. bzw. d. h. i. Allg. max min u. a. u. Ä. vgl. z. B. p. a.
ergibt sich aus, bzw. definiert als ist gleich ist ungefähr gleich ungleich und so weiter (bis) für alle es existiert ein ist Element aus (der Menge) ist nicht Element aus (der Menge) Summenzeichen Produktzeichen
bezüglich beziehungsweise das heißt im Allgemeinen Maximum Minimum und andere(s) und Ähnlich(-es) vergleiche zum Beispiel pro anno ( je Jahr)
Inhaltsverzeichnis 1
Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11
1.1 1.2 1.3 1.4 1.5 1.5.1 1.5.2 1.5.3 1.6 1.7 1.8 1.9 1.9.1 1.9.2 1.9.3
Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Aussagenlogik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Zahlenbereiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Zahlensysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Reelle Zahlen R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Axiome und Rechenregeln in R . . . . . . . . . . . . . . . . . . . . . . . . . . Summen- und Produktzeichen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Fakultät, Binomialkoeffizient . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kombinatorik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Potenzen, Wurzeln, Logarithmen . . . . . . . . . . . . . . . . . . . . . . . . . . Gleichungen, Ungleichungen (eine Variable) . . . . . . . . . . . . . Lineare geometrische Zusammenhänge . . . . . . . . . . . . . . . . . . . . Gerade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Halbebene . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Dreiecke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11 13 14 15 16 16 19 20 21 23 25 30 30 30 31
2
Lineare Algebra und Optimierung . . . . . . . . . . . . . . . . . 32
2.1 2.1.1 2.1.2 2.1.3 2.2 2.2.1 2.2.2 2.2.3 2.2.4 2.3 2.3.1 2.3.2 2.3.3 2.3.4 2.3.5 2.4 2.5 2.5.1 2.5.2 2.6 2.6.1
Determinanten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Begriff, Berechnung für n 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Entwicklungssatz von Laplace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Eigenschaften von Determinanten . . . . . . . . . . . . . . . . . . . . . . . . . Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Begriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Rechnen mit Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Besondere Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Eigenwerte, Eigenvektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Lineare Gleichungssysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Lineare Abhängigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Rang . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Lösbarkeitsbedingung linearer Gleichungssysteme . . . . . . . Basistransformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Gauß-Algorithmus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Anwendungen in der Wirtschaft . . . . . . . . . . . . . . . . . . . . . . . . . . . Lineare Ungleichungssysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Begriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Lösen linearer Ungleichungssysteme . . . . . . . . . . . . . . . . . . . . . Lineare Optimierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Begriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
32 32 34 34 37 37 37 42 43 44 44 45 46 47 52 55 56 56 57 61 61
8
Inhaltsverzeichnis
2.6.2 2.6.3 2.6.4
Lösen linearer Optimierungsprobleme . . . . . . . . . . . . . . . . . . . . Simplexmethode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Dualität in der linearen Optimierung . . . . . . . . . . . . . . . . . . . . .
62 67 74
3
Funktionen, Folgen, Reihen . . . . . . . . . . . . . . . . . . . . . . . . . .
77
3.1 3.2 3.3 3.4 3.5 3.6 3.7
Begriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Eigenschaften . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Umkehrfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Verknüpfungen und Verkettungen . . . . . . . . . . . . . . . . . . . . . . . . Grundfunktionen einer reellen Variablen . . . . . . . . . . . . . . . . . Zahlenfolgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
77 79 80 81 82 84 86
4
Grundzüge der Finanzmathematik . . . . . . . . . . . . . . . . . Einfache Verzinsung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Zinseszinsen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Rentenrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tilgungsrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Investitionsrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Abschreibungsrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Lineare Abschreibung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Degressive Abschreibung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Progressive Abschreibung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kursrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kurs einer Annuitätenschuld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kurs einer Ratenschuld . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . Kurs einer gesamtfälligen Schuld . . . . . . . . . . . . . . . . . . . . . . . . . .
89
4.1 4.2 4.3 4.4 4.5 4.6 4.6.1 4.6.2 4.6.3 4.7 4.7.1 4.7.2 4.7.3
5 5.1 5.2 5.3 5.4 5.4.1 5.4.2 5.4.3 5.4.4 5.4.5 5.4.6 5.5 5.5.1 5.5.2 5.5.3 5.5.4
89 92 96 99 101 104 104 106 109 110 110 111 112
Funktionen mit einer reellen Variablen . . . . . . . . . . . 114 Grenzwert von Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114 Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 Ableitung einer Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 Anwendung der Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 Differenzial und Fehlerrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . 120 Grenzfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 Wachstumsrate und Elastizität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 Newton-Verfahren (Tangentenverfahren) . . . . . . . . . . . . . . . . . 124 Taylorscher Satz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 Regel von Bernoulli-L'Hospital . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126 Untersuchung von Funktionen mit Hilfe ihrer Ableitungen127 Stetigkeit und Mittelwertsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 Monotonieverhalten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 Extremwertbestimmung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 Krümmungsverhalten und Wendepunkte . . . . . . . . . . . . . . . . . . 129
Inhaltsverzeichnis
9
5.5.5 5.6 5.6.1 5.6.2 5.6.3 5.6.4 5.6.5 5.6.6 5.7 5.7.1 5.7.2 5.7.3
Anwendung in der Wirtschaft . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Integralrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Unbestimmtes Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Bestimmtes Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Uneigentliches Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Integration stückweise stetiger Funktionen . . . . . . . . . . . . . . . Numerische Integration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Anwendung der Integralrechnung . . . . . . . . . . . . . . . . . . . . . . . . . Differenzialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Separable Differenzialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . Lineare Differenzialgleichungen 1. Ordnung . . . . . . . . . . . . .
130 132 132 134 135 136 137 138 140 140 140 142
6 6.1 6.2 6.3 6.4 6.5 6.6
Funktionen mit mehreren Variablen . . . . . . . . . . . . . . . 144 Begriff und Eigenschaften . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 Partielle Ableitungen, Gradient, Hesse-Matrix . . . . . . . . . . . . . 145 Vollständiges Differenzial, Fehlerrechnung und Elastizität . . 146 Extremwertbestimmung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148 Extremwerte mit Nebenbedingungen . . . . . . . . . . . . . . . . . . . . . . 150 Methode der kleinsten Quadrate (MkQ) . . . . . . . . . . . . . . . . . . . 151
7
Numerische Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
7.1 7.2 7.3 7.4 7.5 7.5.1 7.5.2 7.5.3 7.6 7.7 7.8 7.9 7.9.1 7.9.2 7.9.3 7.10
Fehlerarten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Zahlendarstellungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Fehleranalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Grundbegriffe der Funktionalanalysis . . . . . . . . . . . . . . . . . . . . . Iterationsverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Fixpunktiteration bei nichtlinearen Gleichungen . . . . . . . . . . Iterative Lösung linearer Gleichungssysteme . . . . . . . . . . . . . . Iterative Lösung nichtlinearer Gleichungssysteme . . . . . . . . Direkte Lösungsverfahren der linearen Algebra . . . . . . . . . . . Lösungsverfahren für Bandmatrizen . . . . . . . . . . . . . . . . . . . . . . . Pseudolösungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Interpolation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Klassische Interpolation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Splineinterpolation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Bézier-Kurve . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Numerische Differenziation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
153 154 155 156 159 159 160 161 163 163 164 165 166 167 170 172
8
Statistik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
8.1 8.1.1 8.1.2
Wahrscheinlichkeitsrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173 Grundbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173 Diskrete Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182
10
Inhaltsverzeichnis
8.1.3 8.2 8.2.1 8.2.2 8.2.3 8.2.4 8.2.5 8.3 8.3.1 8.3.2 8.3.3
Stetige Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Beschreibende (deskriptive) Statistik . . . . . . . . . . . . . . . . . . . . . Univariate Datenanalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Bi- und multivariate Datenanalyse . . . . . . . . . . . . . . . . . . . . . . . . Maß- und Indexzahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Bestands- und Bewegungsmasse . . . . . . . . . . . . . . . . . . . . . . . . . . Zeitreihenanalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Schließende (induktive) Statistik . . . . . . . . . . . . . . . . . . . . . . . . . . Grundgesamtheit und Stichprobe . . . . . . . . . . . . . . . . . . . . . . . . . . Statistische Schätzverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Statistische Tests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
189 196 196 209 220 223 226 235 235 237 242
9
Ausgewählte Probleme des OR . . . . . . . . . . . . . . . . . . . . . . Standortproblem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Spezielle LO-Probleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Transportproblem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Zuordnungsproblem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Rundreiseproblem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Reihenfolgemodelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Algorithmus von Johnson-Bellman . . . . . . . . . . . . . . . . . . . . . . . . Zeilenbewertungsverfahren (n 3) . . . . . . . . . . . . . . . . . . . . . . . . Netzplanmodelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Zeitplanung nach Critical Path Method (CPM) . . . . . . . . . . . Standardmodell für offene Wartesysteme . . . . . . . . . . . . . . . . . Lagerhaltung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Deterministische Modelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Stochastische Modelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
246
Tafeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Verteilungsfunktion der standardisierten Normalverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . t-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Chi-Quadrat-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Zinsberechnungsmethoden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tabelle ausgewählter Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
272
9.1 9.2 9.2.1 9.2.2 9.3 9.4 9.4.1 9.4.2 9.5 9.5.1 9.5.2 9.6 9.7 9.7.1 9.7.2 9.7.3 T1 T2 T3 T4 T5
246 247 247 251 253 255 256 258 259 259 260 264 266 266 267 270
272 273 274 275 276
Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279 Sachwortverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281
1
1
Grundlagen
1.1
Mengen
G
Der Mengenbegriff Eine Menge íst nach CANTOR die Gesamtheit bestimmter, wohlunterscheidbarer Objekte unserer Anschauung oder unseres Denkens, wobei von jedem dieser Objekte eindeutig feststeht, ob es dazu gehört oder nicht. Die Objekte heißen Elemente. Zwei Mengen A und B über einem gegebenen Grundbereich sind gleich, wenn jedes Element der Menge A auch Element der Menge B ist und umgekehrt, A = B. Eine Menge A heißt Teilmenge oder Untermenge einer Menge B, wenn jedes Element von A auch Element von B ist, A B. Eine Menge M heißt leer, wenn sie kein Element enthält, M = . Mengenoperationen Die Mengenoperationen werden in der Abbildung 1.1 durch die VENNschen Diagramme graphisch unterstützt.
erstellt von ciando
Die Vereinigung A B zweier Mengen A und B ist die Menge aller Elemente, die mindestens einer der beiden Mengen A oder B angehören. Der Durchschnitt A B zweier Mengen A und B ist die Menge aller Elemente, die sowohl A als auch B angehören. Bemerkung Zwei Mengen A und B mit A B = werden als disjunkte Mengen bezeichnet. Die Differenz A \ B zweier Mengen A und B ist die Menge aller Elemente von A, die nicht zu B gehören.
A B: A B: A \ B:
A: Abbildung 1.1
Gegeben sei eine Grundmenge S und eine Teilmenge A von S, A S. Die Differenz A = S \ A heißt Komplementärmenge von A bezüglich S.
12
1 Grundlagen
Geordnete Paare, Produktmenge, Abbildung Ein geordnetes Paar (a, b) ist die Gesamtheit von zwei Elementen a und b, wobei die Reihenfolge zu berücksichtigen ist. Zwei geordnete Paare (a, b) und (c, d) heißen genau dann gleich, wenn gleichzeitig a = c und b = d gelten. Analog werden geordnete Tripel (a, b, c) bzw. geordnete n-Tupel (a1, a2, ..., an) definiert. Bemerkung Es gilt für a b: (a, b) (b, a). M1 und M2 seien Mengen. Die Menge aller geordneten Paare (x1, x2) mit x1 M1 und x2 M2 heißt Produktmenge (auch: Kreuzmenge, Kreuzprodukt, kartesisches Produkt) M1 x M2 von M1 und M2. Eine Teilmenge der Produktmenge M1 x M2 zweier gegebener Mengen M1 und M2 wird als Abbildung A aus M1 in M2 bezeichnet. Ist A eine Abbildung aus M1 in M2, so wird die Menge aller x1M1, für die ein x2 derart existiert, dass (x1, x2) A ist, der Definitionsbereich (DB) DA von A genannt. Die Menge aller x2 M2, für die ein x1 M1 derart existiert, dass (x1, x2) A ist, wird Wertebereich (WB) WA von A genannt. Bemerkung Stimmt der Definitionsbereich DA einer Abbildung A mit der Menge M1 überein, DA = M1, so wird die Abbildung als A von M1 bezeichnet. Stimmt andererseits der Wertebereich WA einer Abbildung A mit der Menge M2 überein, WA = M2, so wird die Abbildung als A auf M2 bezeichnet. Für eine Abbildung A aus M1 in M2 wird die Menge (x2, x1) mit x2 M2, x1 M1 und (x1, x2) A als Umkehrabbildung oder inverse Abbildung A1 von A bezeichnet. Eine Abbildung A aus M1 in M2 heißt eindeutig, wenn jedem Element x DA nur ein Element y WA zugeordnet wird. Eine Abbildung A heißt eineindeutig oder umkehrbar eindeutig, wenn sowohl A als auch A1 eindeutig sind. Eine eindeutige Abbildung A wird Funktion genannt.
1.2 Aussagenlogik
1.2
13
Aussagenlogik
Eine Aussage p ist die Beschreibung eines Sachverhaltes. Der Aussage können die Wahrheitswerte wahr ( W ) oder falsch ( F ) zugeordnet werden. Durch Verknüpfungen von Aussagen ergeben sich neue Aussagenverbindungen: Aussagenverbindung
Name
Kurzzeichen
nicht p p und q p oder q wenn p, so q p genau dann, wenn q
Negation Konjunktion Disjunktion Implikation Äquivalenz
p p q p q pq p q
Die Negation wird als einstellige, die weiteren als zweistellige Aussagenverbindungen bezeichnet. Die Wahrheitswerte der Aussagenverbindungen sind in der folgenden Zusammenstellung enthalten: p
p
p
q
p q
p q
pq
p q
W F
F W
W W F F
W F W F
W F F F
W W W F
W F W W
W F F W
Aussagenlogische Gesetze, Identitäten bzw. Tautologien sind Aussagenverbindungen, die bei beliebiger Belegung der Wahrheitswerte für die beteiligten Aussagen den Wahrheitswert W annehmen. Aussagenlogische Gesetze p p (p q) (q p) (p q) (q p) (p q) (q p) ( p q) p q
(p q) r p (q r) p q r (p q) r p (q r) p q r ((p q) r) (p (q r)) ( p q r) p (q r) (p q) (p r)
( p q) p q
p (q r) (p q) (p r)
(p q) ( p q)
(p q) q p
p p
p p
G
14
1 Grundlagen
1.3
Zahlenmengen komplexe Zahlen
reelle Zahlen
rationale Zahlen
ganze Zahlen
natürliche Zahlen
nicht reelle Zahlen
irrationale Zahlen
nicht ganze Zahlen
negative Zahlen
Die Umkehrung von Rechenoperationen führt zur Erweiterung von Zahlenmengen. So ist zum Beispiel die Subtraktion als Umkehrung der Addition in der Menge der natürlichen Zahlen nicht immer ausführbar. Darum werden die negativen Zahlen eingeführt. Die Division als Umkehrung der Multiplikation führt zur Einführung der rationalen Zahlen. Schließlich führen die Umkehrungen des Potenzierens, das Logarithmieren und Radizieren in die Menge der irrationalen bzw. der komplexen Zahlen. Die komplexen Zahlen bestehen aus einer reellen und aus einer imaginären Komponente. Im Allgemeinen führt die Grenzwertbildung zur Menge der reellen Zahlen. Zahlenmengen N N+ Z Q R + R C
Menge der natürlichen Zahlen Menge der positiven natürlichen Zahlen Menge der ganzen Zahlen Menge der rationalen Zahlen Menge der reellen Zahlen Menge der positiven reellen Zahlen Menge der komplexen Zahlen
1.4 Zahlensysteme
1.4
15
Zahlensysteme
Positionssysteme Eine Ziffer ist ein Zeichen aus einem Zeichenvorrat von B verschiedenen Zeichen, denen als Zahlenwerte die ganzen Zahlen 0, 1, ..., B 1 zugeordnet werden, B > 1. Für das übliche Dezimalsystem ist B = 10. Weitere gebräuchliche Positionssysteme sind das Dualsystem mit B = 2, das Oktalsystem mit B = 8 und das Hexadezimalsystem mit B = 16. Die folgende Übersicht zeigt den Zahlenaufbau verschiedener Positionssysteme: dual
oktal
dezimal
hexadezimal
0 1 10 11 100 101 110 111 1000 1001 1010 1011 1100 1101 1110 1111 10000 10001 10010 10011 10100 10101 10110 10111 11000
0 1 2 3 4 5 6 7 10 11 12 13 14 15 16 17 20 21 22 23 24 25 26 27 30
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
0 1 2 3 4 5 6 7 8 9 A B C D E F 10 11 12 13 14 15 16 17 18
Zahlendarstellung einer ganzen Zahl z im Positionssystem mit B = b n
z a k b k = (an bn + an1 bn1 + ... + a1 b1 + a0 b0 ) k 0
Ziffer: Schreibweise der Zahl z :
ak {0, 1, 2, ..., b}, an 0 z = an an1 ... a1 a0
G
16
1 Grundlagen
Umrechnung in andere Positionssysteme Die Umrechnung von Zahlen eines Positionssystems in ein anderes Positionssystem wird als Konvertierung bzw. als Rekonvertierung bezeichnet und soll an einem Beispiel gezeigt werden, das den allgemeinen Algorithmus erkennen lässt. Beispiel 1.1 Es soll z = 7510 in das Dualsystem konvertiert werden. Lösung 75 : 2 = 37 Rest 1, d.h. a0 = 1 z0 = 75 37 : 2 = 18 Rest 1, d.h. a1 = 1 z1 = 37 18 : 2 = 9 Rest 0, d.h. a2 = 0 z2 = 18 9 : 2 = 4 Rest 1, d.h. a3 = 1 z3 = 9 4 : 2 = 2 Rest 0, d.h. a4 = 0 z4 = 4 2 : 2 = 1 Rest 0, d.h. a5 = 0 z5 = 2 1 : 2 = 0 Rest 1, d.h. a6 = 1 z6 = 1 z = 7510 = 10010112 Die Probe zeigt die Rekonvertierung 6 5 4 3 2 1 0 z = 10010112 = 1 2 + 0 2 + 0 2 + 1 2 + 0 2 + 1 2 + 1 2 = 64 + 8 + 2 + 1 = 7510
1.5 1.5.1
Reelle Zahlen R Axiome und Rechenregeln in R
Das Rechnen in der Menge der reellen Zahlen R basiert auf einigen Axiomen (unbeweisbare Annahmen) und daraus ableitbaren und beweisbaren Rechenregeln. Es werden zwei Operationen (Addition und Multiplikation) erklärt, die den folgenden 11 Axiomen genügen: Axiom 1: Für a, b R existiert genau ein s R mit s = a + b (Addition). Axiom 2: Für a, b, c R gilt: (a + b) + c = a + (b + c) = a + b + c (Assoziativgesetz bez. der Addition). Axiom 3: Es gibt genau ein Element 0 R, sodass für alle a R gilt: a + 0 = a (Nullelement bez. der Addition). Axiom 4: Zu jedem a R gibt es genau ein inverses Element a R, sodass gilt: a + (a) = (a) + a = 0 (inverses Element bez. der Addition). Axiom 5: Für a, b R gilt: a + b = b + a (Kommutativgesetz bez. der Addition). Axiom 6: Für a, b R existiert genau ein p R mit p = a b (Multiplikation).
1.5 Reelle Zahlen R
17
Axiom 7: Für a, b, c R gilt: (a b) c = a (b c) = a b c (Assoziativgesetz bez. der Multiplikation). Axiom 8: Es gibt genau ein Element 1 R, sodass für alle a R gilt: a 1 = a (Einselement bez. der Multiplikation). Axiom 9: Zu jedem a R, a 0 gibt es genau ein inverses Element 1 1 1 R, sodass gilt: a = a=1 a a a (inverses Element bez. der Multiplikation). Axiom 10: Für a, b R gilt: a b = b a (Kommutativgesetz bez. der Multiplikation). Axiom 11: Für a, b, c R gilt: a (b + c) = a b + a c (Distributivgesetz). Subtraktion und Division sind Umkehroperationen zur Addition a 1 bzw. Multiplikation: a b := a + ( b), a : b = := a . b b Die Potenz ist eine mehrfache Multiplikation: an = a n := a a ... a, n Faktoren, n N Stufe
Bezeichnungen + :
a+b=c ab=c a b=c a :b=q ab = p
Summand + Minuend Faktor Dividend : Basis hoch
Summand Subtrahend Faktor Divisor Exponent
= = = = =
Summe Differenz Produkt Quotient Potenz
1 1 2 2 3
Bemerkung: Die Operation höherer Stufe hat Vorrang, falls nicht durch Klammern etwas anderes angezeigt wird. Klammern werden von innen nach außen abgearbeitet. Rechenregeln in R ( a) = a a = ( 1) a ab = a b = a ( b) = ( a) b ab = ( a) ( b) (a + b) (c + d) = a c + a d + b c + b d
a a a b b b a a , b0 a :b b b
( a :b )
Binomische Formeln (a + b)2 = a2 + 2ab + b2 (a b)2 = a2 2ab + b2
(a + b) (a b) = a2 b2
G
1 Grundlagen
18
Multiplikation und Division von Brüchen a c ac b d bd
ac a bc b
b ab a b c c c
a
a da b db
„kürzen durch c “ „erweitern mit d “
a b a c bc
a b a d ad c b c bc d
a ac , b b c
b, c, d 0
Addition von Brüchen
a b a b c c c
a c ad bc b d bd
Multiplikation und Division „mit 0“
a0 = 0a = 0 0 0 mit a 0 a a 0 a=0 b0 b
ab=0 a=0 b=0 a - nicht definiert 0
Partialdivision (Division von Summen) (0) Dividend und Divisor nach fallenden Potenzen einer allgemeinen Größe (*) ordnen. (1) Division der potenzhöchsten Terme. (2) Rückmultiplikation mit dem gesamten Divisor. (3) Subtraktion des Ergebnisses (2) vom Dividenden. (4) Abbruch, falls das Ergebnis der Subtraktion (3) eine kleinere Potenz bez. (*) hat, als die vom Divisor, sonst erneut mit (1) beginnen. Beispiel 1.2 ( 9a 6a b 2ab + b ) : ( 3a + 2b ) = 3a 4ab + 2b + 3
2
2
3
( 9a + 6a b 3
2
2
)
12a b 2ab + b 2 2 ( 12a b 8ab ) 2
2
3
6ab + b 2 3 (6ab + 4b ) 2
3
3b
3
2
3b 3 3a 2b
1.5 Reelle Zahlen R
19
Betrag einer Zahl a, a 0 a : a , a 0
a 0
a a
a b a b a b ab
1.5.2
Summen- und Produktzeichen
Summen- und Produktzeichen sind abkürzende Operationszeichen für Summationen bzw. Produktbildungen. n
ai : am am1 an ,
i m
n
i 1
n 1
n m, 1
n
! ai : am am1 an ,
i m
0
ai a1 ,
ai ai an1 , i 1
n, m Z
ai : 0, i 1
i1
nm
n, m Z
Doppelsumme n
m
aik
i 1 k 1
a11 + a12 + ... + a1m + a21 + a22 + ... + a2m + + + an1 + an2 + ... + anm
Rechenregeln n
n
n
i 1
i 1
(ai bi ) ai bi
i 1 n
n
i 1
i 1
c ai c ai n
i 1
i 1
n
i 1
i 1
! c ai c n ! ai i 1
m
n
k 1 i 1
n
n
! c cn
aik aik i 1 k 1
n
n
c nc i 1 n m
n
! (ai bi ) ! ai ! bi i 1
G
20
1 Grundlagen
1.5.3
Fakultät, Binomialkoeffizient
Fakultät Für das Produkt der ersten n natürlichen Zahlen wird abkürzend n! geschrieben und n-Fakultät gesprochen.
n! :
n
! i 1 2 ... n , i 1
STIRLINGsche Formel (für große nN)
n N,
n!"
0! : 1
n 2# n n n e n 2# n e
n
Binomialkoeffizient Die Binomialkoeffizienten entstehen bei der mehrfachen Multiplikation von zwei Summanden (Binomen) und finden z. B. bei kombinatorischen Fragestellungen Anwendung. n n! : , (n k )! k! k
n k 0,
n : 1 0
n, k N;
Bemerkung: Beim Ausrechnen kann Kürzen sinnvoll sein. Kürzen heißt, Zähler und Nenner durch die gleiche Zahl zu dividieren. n n 1 0 n
n n n n 1 1
n n k n k
n n n 1 k k 1 k 1
Binomischer Satz ( a b) n
n
n
k a n k b k ,
k 0
a, b 0
PASCALsches Dreieck n=0 1 n=1 1 n=2 1 2 n=3 1 3 n=4 1 4 6 n=5 1 5 10 k k k . . . n=k 1 0 2
1 1 3
1 4
10
1 5 k k 1
1 k k
1.6 Kombinatorik
1.6
21
Kombinatorik
Die Kombinatorik beschäftigt sich mit der Ermittlung möglicher Anzahlen bei Problemen der Anordnung von n Elementen (Permutationen) bzw. bei Auswahl von k aus n Elementen (Variationen und Kombinationen). Für die Zuordnung sind folgende Fragestellungen wesentlich: (1) Sind alle Elemente beteiligt oder wird ausgewählt? (2) Stehen die Elemente einmal oder mehrmals zur Verfügung? (3) Ist bei den ausgewählten Elementen die Reihenfolge zu beachten? Jede Zusammenstellung einer endlichen Anzahl von n unterschiedlichen Elementen in irgendeiner Anordnung, in der alle Elemente verwendet werden, heißt Permutation der gegebenen n Elemente. Sind unter den n Elementen jeweils n1, n2, ..., nk gleiche Elemente mit n1 + n2 + + nk = n, liegen Permutationen mit Wiederholung vor.
Jede Zusammenstellung von k aus n Elementen, bei der es auf die Reihenfolge der ausgewählten Elemente ankommt, heißt Variation k-ter Klasse aus n Elementen. Steht jedes Element nur einmal zur Verfügung, heißt sie Variation ohne Wiederholung; steht jedes Element beliebig oft zur Auswahl zur Verfügung, heißt sie Variation mit Wiederholung.
Jede Zusammenstellung von k aus n Elementen, bei der es nicht auf die Reihenfolge der ausgewählten Elemente ankommt, heißt Kombination k-ter Klasse aus n Elementen. Steht jedes Element nur einmal zur Verfügung, heißt sie Kombination ohne Wiederholung; steht jedes Element beliebig oft zur Auswahl zur Verfügung, heißt sie Kombination mit Wiederholung. Die Formeln für die möglichen Anzahlen von Permutationen, Variationen bzw. Kombinationen, jeweils mit oder ohne Wiederholung, sind in der Tabelle auf der nächsten Seite zusammengestellt:
G
22
1 Grundlagen ohne Wiederholung mit Wiederholung (Elemente nur ein- (Elemente mehrfach mal vorhanden) vorhanden)
Permutationen (Anordnungsmöglichkeiten von n Elementen)
Kombinationen (Auswahl von k aus n Elementen ohne Berücksichtigung der Anordnung)
n! n1 ! n2 !... nk !
mit n1 n2 nk n
Variationen (Auswahl von k aus n Elementen mit Berücksichtigung der Anordnung)
PW(nn1 ,...,nk )
Pn n!
Vn( k )
n! ( n k )!
VW(nk ) n k
mit 1 k n
n K n( k ) k
KW( kn )
n k 1 k
mit 1 k n
Beispiel 1.3 Wie viele verschiedene Möglichkeiten der Anordnung von 6 Büchern in einem Regal gibt es? Lösung: P6 = 6! = 720 Beispiel 1.4 Wie viele verschiedene Möglichkeiten der Anordnung von 6 Büchern gibt es, wenn von einem Titel 1 Exemplar, vom zweiten Titel 2 und vom dritten 6! 60 Titel 3 Exemplare vorhanden sind? Lösung: PW(1,2,3 ) 6 1! 2! 3! Beispiel 1.5 Wie viele verschiedene Ergebnisvarianten bez. der Reihenfolge der ersten drei Läufer gibt es bei einem 100-m-Lauf mit 8 Teilnehmern? 8! Lösung: V8( 3 ) 336 ( 8 3)! Beispiel 1.6 Wie viele verschiedene Buchstabenvariationen mit k Buchstaben lassen sich aus 26 Buchstaben bilden? Lösung: VW( k ) 26 k 26
Beispiel 1.7 Wie viele verschiedene Spiele (10 Karten aus 32 Karten) kann ein Skat-
32 (10) spieler erhalten? Lösung: K 32 64 512 240 10 Beispiel 1.8 Wie viele verschiedene Zahlenkombinationen ohne Berücksichtigung der Anordnung gibt es bei einem Wurf mit zwei Würfeln? ( 2) Lösung: KW 6
6 2 1 21 2
1.7 Potenzen, Wurzeln, Logarithmen
1.7
23
Potenzen, Wurzeln, Logarithmen
G
Potenzen
a, b, m, n R
am an = am + n am a mn , a 0 an (a m ) n (a n ) m a m n
(a b)n = an bn n
a an n ,b0 b b a n :
a0 := 1
1 , an
a0
Bemerkung an am und an bn lassen sich für m n und a b nicht vereinfachen. Wurzeln
a, b, n, m R; n
a 0, b 0;
a b a bn ,
n
a
1 an
n 0: m
,
n
a, b, m, n R, a, b 0, n 0:
n, m 0:
am a n n
a n b n a b
n
a
n
b
n
am
n m
n
a , b>0 b
a n
m
m
an
a mn a
mn
a
Rationalmachen des Nenners Wurzeln im Nenner können durch Erweitern mit geeigneten Ausdrücken rational gemacht werden. Beispiel 1.9
(1)
a 2
(2)
(3)
a 3
2
a 2
2 2
a 3 22 3
2 3 22
a 3 2
a 2 a 2 2 2
a 3 22 a 3 2 2 2 2
a( 3 2) ( 3 2)( 3 2)
a( 3 2) a( 3 2) 32
1 Grundlagen
24
Logarithmen
Der Logarithmus (Exponent) n von dem Numerus (Logarithmand) a zur Basis b ist die reelle Zahl n, für die gilt: a, b R, a, b > 0, b 1 log b a n a b n a, b R,
log(a b) = log a + log b a log = log a log b b log an = n log a 1 log n a = log a n
a, b > 0:
Die Logarithmengesetze gelten für beliebige Basen, b > 0, b 1.
Gebräuchliche Logarithmensysteme
b = 2: b = e: b = 10:
log 2 a = lb a log e a = ln a log 10 a = lg a
binärer Logarithmus (früher: ld a) natürlicher Logarithmus dekadischer Logarithmus
Umrechnen in andere Logarithmensysteme
log a x = log a b log b x 1 lg x = lg e ln x = ln x ln 10 mit dem Modul: M = lg e =
1 = log a b log b a ln x = ln 10 lg x =
1 lg x lg e
1 1 1 ln 10 " 2,303 " 0,434; M lg e ln 10
Bemerkung Aus log a x = log a b log b x folgen für a = 10 bzw. a = e praktikable Möglichkeiten, Logarithmen mit anderen Basen zu berechnen: lg x ln x log b x . lg b ln b Beispiel 1.10
(1) log2 16 (2) 10
x
ln 16 lg16 4 ln 2 lg 2
=2 x = log102 = lg 2 = 0,301
1.8 Gleichungen, Ungleichungen (eine Variable)
1.8
25
Gleichungen, Ungleichungen (eine Variable)
Gleichungen
Als Term T wird ein mathematischer Ausdruck bezeichnet, der eine Zahl darstellt oder nach Ersetzen vorkommender Variablen und Parameter durch Zahlen in eine Zahl übergeht. Eine Gleichung G ist die Verbindung zweier Terme T1 und T2 mit einem Gleichheitszeichen, G: T1 = T2. Die Definitionsmenge DG einer Gleichung G ist der Durchschnitt der Definitionsmengen aller auftretenden Terme. Die Definitionsmenge DT eines Terms T enthält nur die Elemente der Grundmenge, bei deren Einsetzen in den Term T der Term in eine sinnvolle, definierte Aussage übergeht. Die Lösungsmenge LG einer Gleichung G ist die Menge aller Elemente, die bei Einsetzen der Variablen in die Gleichung diese in eine wahre Aussage überführt. Hat die Lösungsmenge LG genau ein Element, ist die Gleichung G eindeutig lösbar. Enthält LG mindestens ein Element, heißt G lösbar, und hat LG kein Element, so heißt G unlösbar. Führt jedes Einsetzen zu einer wahren Aussage, heißt die Gleichung allgemeingültig, bzw. sie ist identisch erfüllt. Beispiel 1.11 (1) x 1 = 0 x =1 2 (2) x 1 = 0 x1 = 1 x2 = 1 2 (3) x + 1 = 0 2 (4) x 1 = (x + 1) (x 1)
-
eindeutig lösbar lösbar unlösbar in R allgemeingültig
Lösen von Gleichungen Äquivalente Umformungen (1) T1 = T2 T1 T3 = T2 T3 (2) T1 = T2 T1 T3 = T2 T3 , T3 0 T T (3) T1 = T2 1 2 , T3 0 T3 T3
(4) T1 = T2 a T1 a T2 , a R \ {1}, a > 0 (5) T1 = T2 log a T1 log a T2 , T1, T2 > 0, a R \ {1}, a > 0 (6) T1 = T2 T1n T2 n , n N, n ungerade (7) T1 = T2
n
T1 n T2 , n N, n ungerade
G
1 Grundlagen
26
Lineare Gleichungen: a x + b = 0 (1) Variable isolieren ax = b (2) Ausklammern b (3) Division, falls a 0 : x = a b 0 : Widerspruch Für a = 0 : b 0 : x beliebig
a x + b = c x + d, a c ax cx = d b (a c) x = d b d b x = ac
Quadratische Gleichungen: a x2 + b x + c = 0 (allgemeine Form) x2 + p x + q = 0 (Normalform)
Lösungsformel für die Normalform 2
x1,2
p p q 2 2
2
mit
p D = q 2
(1) D > 0: x1 x2 reell, 2 verschiedene Lösungen (2) D = 0: x1 = x2 reell, 1 Doppellösung (3) D < 0: x1 x2 komplex, 2 verschiedene Lösungen in C keine Lösung in R Bemerkung: Die allgemeine Form einer quadratischen Gleichung wird mittels Division durch a 0 in die Normalform gebracht, Beispiel 1.12.
VIETAscher Wurzelsatz: Für x2 + px + q = 0 gilt:
x1 + x2 = p, x1 x2 = q, sowie x2 + px + q = (x x1)(x x2) = 0
Algebraische Gleichungen höheren Grades
Ein Polynom n-ten Grades ist eine ganzrationale Funktion n-ten Grades: pn(x) = an xn + an1 xn1 + ... + a1 x + a0 , ai R $i, an 0, nN pn(x) = 0 wird als algebraische Gleichung n-ten Grades bezeichnet. Hat eine algebraische Gleichung n-ten Grades n verschiedene reelle Lösungen, so existiert nach dem Fundamentalsatz der Algebra eine Produktdarstellung analog der vom VIETAschen Wurzelsatz mit n Faktoren. Wird eine Lösung xi durch Probieren ermittelt, so kann mittels Partialdivision durch (x xi) der Grad des Polynoms um eins verkleinert werden. Im Allgemeinen kommen Näherungsverfahren zur Anwendung, zum Beispiel das NEWTON-Verfahren, siehe Abschnitt 5.4.4.
1.8 Gleichungen, Ungleichungen (eine Variable)
27
Bruchgleichungen
Eine Bruchgleichung ist eine Gleichung, in der die Variable mindestens einmal im Nenner auftritt. Bruchgleichungen lassen sich lösen, indem die Terme mit dem Hauptnenner multipliziert werden. Beispiel 1.12 3 4 1 [2x 1 x 1 x ] = Hauptnenner, x 1, 0, 1 2x 1 x 1 x 3 (1 + x) (1 x) 4 2x (1 x) = 2x (1 + x) 2 2 2 3 3x 8x + 8x = 2x + 2 x 2 3 x 10 x + 3 = 0 % :3 10 2 x+1=0 x 3
x 1/ 2
5 3
25 5 4 1 9 3 3
x1 = 3
x2 =
1 3
Wurzelgleichungen
Eine Wurzelgleichung ist eine Gleichung, in der die Variable mindestens einmal im Radikanden einer Wurzel auftritt. Die Wurzeln können in der Regel beseitigt werden, indem sie isoliert (eine Wurzel wird allein auf eine Seite der Gleichung gebracht) werden und dann die entsprechende Umkehroperation (entsprechende Potenz) auf die Gleichung angewendet wird. Es ist zu beachten, dass beim Potenzieren mit geradem Exponenten zusätzliche Lösungen entstehen können, da keine äquivalente Umformung vorliegt. Bei Wurzelgleichungen gehört die Probe zum Bestandteil der Lösung. Beispiel 1.13
x 2 2x 7 4 0 Lösung:
( )2
x 2 2x 7 4
x2
x 2 2x 7 16 2x 7 14 x 2 x + 7 = 196 28 x + x 0 = x 30 x + 189 2
Probe: x1 = 9: x2 = 21:
( )2 2
2x 7
9 2 29 7 4 = 4 4 = 0
x1 = 9, x2 = 21 x1 = 9 ist Lösung
21 2 2 21 7 4 = 30 4 0 x2 ist keine Lösung
G
1 Grundlagen
28
Exponentialgleichungen
Eine Exponentialgleichung ist eine Gleichung, in der die Variable mindestens einmal im Wurzel- oder Potenzexponenten auftritt. Tritt die Variable nur im Exponenten auf, kann eine Lösung nach dem Isolieren durch Anwendung der entsprechenden Umkehroperation ermittelt werden. Häufig sind Näherungsverfahren anzuwenden (siehe Abschnitt 5.4.4). Beispiel 1.14
3 8
3x 4
4 5
2 x 1
lg...
3x 4 lg 38 2x 1 lg 45 3 4 4 3 lg 3 x lg 2 x lg 4 lg 8 5 5 8 4 3 4 lg 5 8 0,0969 1,7039 1,4822 x 4 3 1,2780 0,1938 3 lg 2 lg 8 5 lg
Logarithmengleichungen
Eine Logarithmengleichung ist eine Gleichung, in der die Variable mindestens einmal im Argument eines Logarithmus auftritt. Tritt die Variable nur einmal im Argument eines Logarithmus auf, kann eine Lösung nach dem Isolieren durch Anwendung der entsprechenden Umkehroperation erzielt werden. In Einzelfällen kann ein geschicktes Anwenden der Logarithmengesetze erfolgreich sein. Im Allgemeinen sind Näherungsverfahren anzuwenden (siehe Abschnitt 5.4.4). Beispiel 1.15 loga (2x + 3) = loga (x 1) + 1 2x 3 1 loga x 1 2x 3 =a x 1
2 x + 3 = a (x 1) 2x + 3 = ax a a + 3 = x (a 2) a3 x , a 2: a2 a3 1. Fall: 0 < a < 2: x < 0, der Logarithmus a2 der rechten Seite in der gegebenen Gleichung ist nicht definiert, keine Lösung. a3 2. Fall: a > 2: Lösung ist x . a2
1.8 Gleichungen, Ungleichungen (eine Variable)
29
Ungleichungen
Eine Ungleichung U ist die Verbindung zweier Terme T1 und T2 mit einem der Relationszeichen < , , > oder , z. B. T1 < T2. Bemerkung: Lösungsmenge und Lösbarkeit entsprechend den Gleichungen. Regeln für Ungleichungen
(1) a < b b < c a < c a
(2)
(3) a < b c > 0 ac < bc (4) a < b c < 0 ac > bc (5)
ab > 0 (a > 0 b > 0) (a < 0 b < 0)
(6)
ab < 0 (a < 0 b > 0) (a > 0 b < 0)
Dreiecksungleichung:
a1 a 2 a n a1 a 2 a n
BERNOULLI-Ungleichung: (1 + a)n 1 + n a;
a 0, n N
Das geometrische Mittel ist kleiner als das arithmetische Mittel: 1 n a a a (a1 a 2 an ) , n N ; a1, ..., an 0 1 2 n n Bemerkungen (1) Für die anderen Ungleichheitszeichen gelten die Regeln entsprechend. (2) Multiplikationen und Divisionen mit indifferenten Ausdrücken erfordern Fallunterscheidungen. Beispiel 1.16 1 1, x 0 x
1. Fall:
1 1 x
Da der Nenner (mit dem multipliziert werden muss) bezüglich des Vorzeichens indifferent ist, müssen zwei Fälle unterschieden werden. x>0
1 x
2. Fall:
1 1 x
x<0
1 x Gesamtlösungsmenge:
Voraussetzungsmenge 1. Fall: V1 = (0,&) Ergebnismenge 1. Fall:
E1 = [1,&)
Lösungsmenge 1. Fall:
L1 = V1 E1 = [1,&)
Voraussetzungsmenge 2. Fall: V2 = (&,0) Ergebnismenge 2. Fall:
E2 = [&,1]
Lösungsmenge 2. Fall:
L2 = V2 E2 = (&,0)
L = L1 L2 = [1,&) (&,0) = (&,0) [1,&) = R \ [0, 1)
G
30
1 Grundlagen
1.9 1.9.1
Lineare geometrische Zusammenhänge Gerade
Eine Gerade ist durch zwei Punkte P1(x1, y1) und P2(x2, y2) oder durch einen Punkt P1(x1, y1) und den Anstieg m festgelegt. Es gibt verschiedene Gleichungsformen für Geraden, siehe auch Abbildung 1.2. Abbildung 1.2
Gleichungsformen für Geraden
Normalform:
y=mx+n
Allgemeine Form:
Ax+By=C
Punktrichtungsform:
y y1 = m (x x1)
Zweipunkteform:
y y1 y 2 y1 x x1 x2 x1
Achsenabschnittsform:
x y 1 a b
1.9.2
Halbebene
Eine Gerade g zerlegt eine Ebene in 2 offene Halbebenen, wobei g zu jeder Halbebene gehört. Eine Halbebene wird durch eine Gerade begrenzt. Z. B.: y m x + n oder: y m x + n (siehe Abbildung 1.3) Abbildung 1.3
1.9 Lineare geometrische Zusammenhänge
1.9.3
Dreiecke
Rechtwinklige Dreiecke In rechtwinkligen Dreiecken gelten die folgenden Beziehungen, siehe Abbildung 1.4. Bezeichnungen c Hypotenuse a, b Katheten h Höhe Abbildung 1.4
Satz des PYTHAGORAS: Satz des EUKLID:
c2 = a2 + b2 a2 = p c
Höhensatz:
h = pq
Dreiecksfläche:
A =
b2 = q c
2
ch a b 2 2
a Gegenkathete c Hypotenuse b Ankathete cos' : c Hypotenuse a Gegenkathete tan ': b Ankathete b Ankathete 1 cot ' : a Gegenkathete tan '
Trigonometrische Funktionen: sin ' :
Schiefwinklige Dreiecke
(1) Innenwinkelsumme:
' + ( + ) = 1800
(2) Sinussatz:
a : b : c = sin ' : sin ( : sin )
(3) Kosinussatz:
a2 = b2 + c2 2 bc cos '
(4) Tangenssatz:
(5) Flächeninhalt:
ab ab
A=
tan
' (
tan
' (
2 2
1 ab sin ) 2
31
G
Kapitel 2
2
Lineare Algebra und Optimierung
Für die Modellierung ökonomischer Probleme ist die lineare Algebra eine wichtige mathematische Disziplin. Sie ermöglicht die Erfassung und Beschreibung ökonomischer Zusammenhänge, speziell durch die Anwendung von Determinanten und Matrizen. Hauptgegenstand der linearen Algebra - der Lehre von den linearen Gleichungen - sind die Lösbarkeitskriterien und Lösungsverfahren für lineare Gleichungssysteme. Aus der Vielzahl der allgemeinen Lösungsverfahren für lineare Gleichungssysteme werden die Basistransformation (BT), die auch bei der Lösung von linearen Ungleichungssystemen und linearen Optimierungsproblemen (LOP) Anwendung findet, und der GAUSS-Algorithmus vorgestellt.
2.1
Determinanten
Der Determinantenbegriff ist im Zusammenhang mit der Lösung von linearen Gleichungssystemen entwickelt worden, besitzt aber in der Mathematik eine darüber hinausgehende Bedeutung.
2.1.1
Begriff, Berechnung für n 3
Die Determinante D ist eine Zahl, die einem quadratischen Schema von Zahlen durch eine bestimmte Vorschrift zugeordnet ist. Die Anzahl der Reihen (Zeilen oder Spalten) gibt die Ordnung n der Dea11 a1n terminante an. D = Bezeichnungen: |aik|, det(aik) a n1 a nn Berechnung für n 3 n = 1: D = a11 = a11 n = 2: D =
a11
a12
a21 a22
= a11a22 a12a21 a11 a12 n = 3: D = a21 a22 a31 a32
=
a13 a23 a33
SARRUSsche Regel:
a11 a22 a33 + a12 a23 a31 + a13 a21 a32 a13 a22 a31 a11 a23 a32 a12 a21 a33
2.1 Determinanten
33
Beispiel 2.1 D1 = 3 = 3 D2 =
1
2
3 2
= 1 (2) 2 3 = 8
1 3 4 D3 = 2 0 1 102 + 313 + 421 403 111 322 = 4 3 1 2
Werden im Schema einer n-reihigen Determinante genau so viele Zeilen wie Spalten gestrichen, entsteht eine neue Determinante, die als Unterdeterminante bezeichnet wird.
Durch Streichen der i-ten Zeile und der k-ten Spalte einer n-reihigen Determinante entsteht die zugehörige Unterdeterminante Uik n1-ter Ordnung. Bemerkung Den n2 Elementen aik lassen sich n2 Unterdeterminanten Uik (n1-ter Ordnung) zuordnen. Die Unterdeterminante n-ter Ordnung ist die Determinante selbst. Jedem Element aik einer n-reihigen Determinante wird eine Adjunkte Aik zugeordnet, die die mit (1) i+k multiplizierte Unterdeterminante Uik n1-ter Ordnung ist, Aik = (1) i+k Uik. Merkregel für das Vorzeichen (1) i+k (Schachbrettregel): + + +
+ +
+ + +
+ +
+ + +
Die aus den ersten k Zeilen und k Spalten gebildete Unterdeterminante der Ordnung k heißt Hauptabschnittsdeterminante det (Ak) einer gegebenen Determinante D.
L
34
2 Lineare Algebra und Optimierung
2.1.2
Entwicklungssatz von Laplace
Wird jedes Element aik einer Reihe einer Determinante n-ter Ordnung mit seiner zugehörigen Adjunkten Aik multipliziert, ergibt sich der Wert der Determinante als Summe dieser n Produkte. Zum Beispiel die Entwicklung nach der r-ten Zeile:
D = ar1 Ar1 + ar2 Ar2 + . . . + arn Arn n
n
j 1
j 1
D = arj Arj = a rj (1) r j U rj 3 4 2 1
Beispiel 2.2
D =
2 1 3 5 0 1 1 2
(entwickeln nach der 3. Zeile)
1 2 4 0
4 2 1 3 2 1 3 4 1 3 4 2 =0 · (+1) 1 3 5 + 1 · (1) 2 3 5 +1 · (+1) 2 1 5 +2 · (1) 2 1 3 2 4 0 1 4 0 1 2 0 1 2 4 = 0 + 45 7 + 40 = 78
2.1.3 (1)
Eigenschaften von Determinanten Eine Determinante ändert ihren Wert nicht, wenn alle Zeilen mit den entsprechenden Spalten vertauscht werden. (Stürzen oder Spiegeln an der Hauptdiagonalen)
Beispiel 2.3 a11 a12 a a = 11 21 = a11 a22 a12 a21 D= a21 a22 a12 a22
(2)
Eine Determinante ändert ihr Vorzeichen, wenn zwei beliebige parallele Reihen vertauscht werden.
Beispiel 2.4 a11 a12 a a D= = 21 22 = (a21 a12 a11 a22) a21 a22 a11 a12
(3)
Eine Determinante hat den Wert null, wenn zwei parallele Reihen übereinstimmen.
Beispiel 2.5 a11 a12
D = a21 a22 a11 a12
a13 a23 = a11 a22 a13 + a12 a23 a11 + a13 a21 a12 a13 a22 a11 a11 a23 a12 a12 a21 a13 = 0 a13
2.1 Determinanten
(4)
Eine Determinante hat den Wert null, wenn alle Elemente einer Reihe null sind.
Beispiel 2.6 a11 a12
D=
0
0
a31 a32
(5)
35
a13 0 0 A21 0 A22 0 A23 0 a33
Eine Determinante wird mit dem Faktor k multipliziert, indem die Elemente einer Reihe mit k multipliziert werden.
Beispiel 2.7
(1) k · D = k
a11 a12 = a21 a22
k a11 a12 = k a11 a22 k a12 a21 k a21 a22 = k (a11 a22 a12 a21)
125 41 125 41 (2) = 49 147 49 3 1
(6)
Eine Determinante hat den Wert null, wenn die Elemente einer Reihe zu den entsprechenden Elementen einer parallelen Reihe proportional sind.
Beispiel 2.8 k a12 a12 a D= = k 12 k a22 a22 a22
(7)
a12 =k0=0 a22
Eine Determinante ändert ihren Wert nicht, wenn zu den Elementen einer Reihe die mit einem beliebigen Faktor k multiplizierten Elemente einer parallelen Reihe entsprechend addiert werden.
Beispiel 2.9 a11 a12 a a12 k a11 D= = 11 a21 a22 a21 a22 k a21
= a11 a22 + k a11 a21 a12 a21 k a11 a21 = a11 a22 a12 a21 Beispiel 2.10
Rändern:
(8)
a11 a12 a21 a22 a31 a32
a13 a23 a33
=
1 x1 x 2 0 a11 a12 0 a21 a22 0 a31 a32
x3 a13 a23 a33
Eine Determinante ändert ihren Wert durch das Rändern nicht.
L
2 Lineare Algebra und Optimierung
36
Bemerkungen (1) Unter Ausnutzung von Satz (7) können in einer geeigneten Reihe Nullen erzeugt werden. Bei Entwicklung nach dieser Reihe brauchen die mit null zu multiplizierenden Adjunkten nicht berechnet werden.
(2) Der GAUSS-Algorithmus liefert bei quadratischen Koeffizientenmatrizen den Wert der Determinante durch Multiplikation der Hauptdiagonalelemente, siehe Abschnitt 2.3.5. Beispiel 2.11
Z. B. 1. Spalte mit Arbeitselement a41 : (1) Zu den Elementen der 1. Zeile wird das Minus-Dreifache der Elemente der 4. Zeile addiert (0 = x · 1 + 3, x = 3). (2) Zu den Elementen der 2. Zeile wird das Minus-Zweifache der Elemente der 4. Zeile addiert.
3 4 2 1 D=
2 1 3 5 0 1 1 2 1 2 4 0 0
=
2 10
0 3
1
5 5
0
1
1 2
1
2
4 0
2 10
Entwicklung nach der 1. Spalte. Z. B. 1. Spalte mit Arbeitselement a31: 1
= (1) 3
5 5
1
1 2
0
8
(1) Zu den Elementen der 1. Zeile wird das Doppelte der Elemente der 3. Zeile addiert. (2) Zu den Elementen der 2. Zeile wird das Dreifache der Elemente der 3. Zeile addiert.
5
= (1) 0 2 11 = (1) 1
1
2
8
5
2 11
= ( 1) ( 88 + 10 ) = 78
CRAMERsche Regel
Lineare Gleichungssysteme A x = b mit m = n und D = A 0
können mit der CRAMERschen Regel gelöst werden. D ist die Koeffizientendeterminante von A. Bei Di ist D xi i , i = 1, 2, ..., n die i-te Spalte von D durch b ersetzt. D Beispiel 2.12 3 4 1 3x1 4x2 + x3 = 9 1 5 = 174 x1 + x2 5x3 = 10 D = 1 6x1 + 2x2 + 4x3 = 12 6 2 4
9 4 1 1 5 = 174 D 1 = 10 12 2 4
x1
D 1 174 1 D 174
Bemerkung Zu linearen Gleichungssystemen und Matrizengleichungen siehe Abschnitte 2.2 und 2.3.
2.2 Matrizen 3
9
1
D 2 = 1 10 5 = 174 6
12
3 4 D3 =
2.2 2.2.1
37
x2
D2 174 1 D 174
x3
D3 348 174 D
4 9
1
1 10 = 348
6
2
12
2
Matrizen Begriffe
Eine Matrix A ist ein System von m n Elementen aik (Zahlen oder sonstige mathematische Objekte), die in einem rechteckigen Schema von m Zeilen und n Spalten angeordnet sind, A = (aik). Das geordnete Paar (m, n) bezeichnet den Typ oder das Format einer Matrix A = A(m, n). Matrizen, die nur aus einer Zeile oder nur aus einer Spalte bestehen, werden auch als Vektoren bezeichnet, a = a(m,1) = a(m) = (ai). Zwei Matrizen A = (aik) und B = (bik) sind genau dann gleich, wenn sie gleiches Format haben und alle entsprechenden Elemente gleich sind. Wenn in der Matrix A = (aik) die Zeilen und Spalten miteinander vertauscht werden, heißt die so entstehende Matrix die gestürzte oder transponierte Matrix, AT = (aki), es gilt (AT)T = A. Beispiel 2.13
2 4 1 AT 1 0 bT 3 2 1 3 T A = b = 1 3 2 (1,3) 3 6 2 c = c = a (11 , )
( 3,2 )
4 0 6 ( 2, 3 )
(3,1)
Ist in einer Matrix A(m, n) = (aik) m = n, so ist sie eine quadratische Matrix von der Ordnung m oder vom Format (m, m). Wenn für eine quadratische Matrix A gilt: AT = A, so heißt diese Matrix symmetrisch. Matrizen, deren Elemente wiederum Matrizen sind, heißen Blockmatrizen, die Elemente heißen Blöcke oder Untermatrizen.
2.2.2
Rechnen mit Matrizen
Addition und Subtraktion Es seien A = (aik) und B = (bik) zwei Matrizen mit jeweils m Zeilen und n Spalten. Zwei Matrizen A(m, n) = (aik) und B(m, n) = (bik), die das gleiche Format haben, heißen gleichartige Matrizen.
L
2 Lineare Algebra und Optimierung
38
Nur für gleichartige Matrizen sind Addition und Subtraktion erklärt. Die Summe zweier gleichartiger Matrizen A und B ist die Matrix S, deren Elemente jeweils die Summe einander entsprechender Elemente von A und B sind, A + B = S, aik + bik = sik (i = 1, 2, ..., m; k = 1, 2, ..., n ). Die Differenz zweier gleichartiger Matrizen A und B ist die Matrix D, deren Elemente jeweils die Differenz einander entsprechender Elemente von A und B sind, A B = D, aik bik = dik i, k. Beispiel 2.14
2 3 0 1 A =
4 1 3 6
3 7 9 12 A + B =
9 5 4 12
1 4 9 11 B =
5 4 1 6
1 1 9 10 A B = 2 0
1 3
Für die Addition gleichartiger Matrizen gelten das Kommutativgesetz A + B = B + A, das Assoziativgesetz (A + B) + C = A + ( B + C ) = A + B + C, sowie (A + B)T = A T + B T . Eine Matrix, deren Elemente alle gleich null sind, heißt Nullmatrix 0. Es gilt: A + 0 = A 0 = 0 + A = A und 0 A = A. Multiplikation einer Matrix mit einem skalaren Faktor
Eine Matrix A wird mit einem skalaren Faktor (Skalar) k multipliziert, indem jedes Element aik der Matrix A mit dem Faktor k multipliziert wird, k A = A k = ( k aik ), k R. Ferner: (k A)T = k AT Skalarprodukt, Betrag eines Vektors
Das Skalarprodukt (innere Produkt) zweier Spaltenvektoren x und y ist wie folgt definiert: xT y = x1 y1 + x2 y2 + ... + xn yn Der Betrag eines Vektors x vom Typ (n, 1), x , ist die Wurzel aus dem Skalarprodukt xT x :
x x T x = x12 x22 xn2
Beispiel 2.15 (1) Multiplikation einer Matrix mit einem skalaren Faktor
2 3 0 1 6 9 0 3 3A=3 =
4 1 3 6 12 3 9 18
(2) Skalarprodukt (3) Betrag eines Vektors T
2 1 = 2 + 4 = 2
1 4
3 , x 9 16 25 5 x =
4
2.2 Matrizen
39
Multiplikation von Matrizen
Zwei Matrizen A(m, n) und B(n, p) heißen verkettet, wenn die Anzahl der Spalten von A gleich der Anzahl der Zeilen von B ist, d. h. wenn A vom Typ (m, n) und B vom Typ (n, p) ist. Nur verkettete Matrizen können miteinander multipliziert werden. Als Produkt der verketteten Matrizen A und B wird die Matrix C(m, p) = A(m, n) B(n, p) bezeichnet, deren Elemente als Skalarprodukt der Elemente aus der Zeile und aus der Spalte berechnet werden, in deren Schnittpunkt das zu berechnende Element steht: n
cik =
air brk
für i = 1, 2, ..., m; k = 1, 2, ..., p
r 1
C(m, p) = A(m, n) B(n, p) wird im Schema von FALK errechnet: b11 b12 b13 AB b21 b22 b23 a11 a12 a21 a22
c11 c21
c12 c22
z. B.: c12 = a11b12 + a12b22
c13 c23
Zeilen- (bzw. Spalten-)summenprobe bei der Matrizenmultiplikation Für die Zeilensummenprobe wird eine neue Spalte eingefügt. Die Elemente der Matrix B werden zeilenweise addiert. Die Berechnung der Ergebniselemente erfolgt als neue Spalte nach dem FALKschen Schema, die Werte müssen ferner mit der Zeilensumme übereinstimmen.
b11 b21 c11 c21
AB a11 a12 a21 a22
b12 b22 c12 c22
b11 + b12 b21 + b22 c1 c2
Die Spaltensummenprobe erfolgt analog. Das Zeichen „“ steht für die positive Probe.
Für die Berechnung von c1 und c2 gilt: 1. c1 = a11 (b11 + b12 ) + a12 (b21 + b22 ) und c2 = a21 (b11 + b12 ) + a22 (b21 + b22 )
2. c1 = c11 + c12 c2 = c21 + c22
Beispiel 2.16: Schema von Falk
2 3 0 1 A=
4 1 3 6
2 1 B = 0
1
2 1 3 0 1 1 1 1
C=AB
2 1 0 1
2 3 1 1
1 0 1 1
5 4 2 3
8 14
3
25
4 1 3 6
15 20 13
48
6 4 3 7
23 34 16
73
2 3 0 1
z. B.: c13 = a11 b13 + a12 b23 + a13 b33 + a14 b43 = 2 1 + 3 0 + 0 1 + 1 1 = 3
L
40
2 Lineare Algebra und Optimierung
Für die Multiplikation von Matrizen gelten das Distributivgesetz (A + B) C = A C + B C und das Assoziativgesetz (A B) C = A (B C) = A B C, falls die einzelnen Summen und Produkte der Matrizen existieren. Das Kommutativgesetz gilt im Allgemeinen nicht, d. h. A B B A. Bemerkung Bei der Matrizenmultiplikation ist es möglich, dass das Produkt C zweier Matrizen A und B, von denen keine die Nullmatrix ist, die Nullmatrix C = 0 ergeben kann. A und B heißen in diesem Fall Nullteiler. Beispiel 2.17 1 2 3 A = 2 4 6 2 4 6
5 B = 2 3
7 13 1 1 3 5
AB
1 2 3 2 4 6 6 2 4
5 7 13 2 1 1 3 3 5 0 0 0
0 0 0
0 0 0
BA
5 7 13 2 1 1 3 3 5
1 2 2
2 4 4
3 6 6
7 14 21 2 4 6 3 1 2
Das Beispiel zeigt auch die Nicht-Kommutativität der Matrizenmultiplikation.
Verflechtungen als Anwendung der Matrizenmultiplikation Zur Herstellung eines Endprodukts seien n Produktionsstufen erforderlich. Bezeichnungen j Nummer der einzelnen Produktionsstufe ( j = 1, 2, ..., n) A j, j + 1 Matrix für den Übergang von der Stufe j zur Stufe j + 1 xj Vektor, der angibt, wie viele Einheiten in der Stufe j für die folgende Stufe j + 1 benötigt werden ( j = 1, 2, ..., n 1) yj Vektor, der angibt, wie viele Einheiten in der Stufe j zusätzlich hergestellt werden ( j = 1, 2, ..., n 1)
(1) Die Produktionsmenge entspricht in allen Stufen der Verbrauchsmenge (Verflechtung 1. Art). Die Elemente ai(,kj , j 1) der Matrix A j, j + 1 = ( ai(,kj , j 1) ) geben an, wie viele Einheiten des Erzeugnisses i der Stufe j in eine Einheit des Erzeugnisses k der Stufe j + 1 eingehen. Für den Übergang von der Stufe j zur Stufe j + 1 gilt die Beziehung x j = A j, j + 1 · x j + 1, ( j = 1, 2, ..., n 1). Ist die Endproduktion durch den Vektor x n vorgegeben, kann schrittweise der Bedarf an den Zwischenprodukten der Stufen n 1, n 2, ..., 1 (Stufe 1 evtl. Rohstoffe) ermittelt werden. (2) Werden in den Produktionsstufen über den Verbrauch der Folgestufe hinaus Einheiten gefertigt (erweiterte Verflechtung 1. Art), gilt die Beziehung x j = A j, j + 1 · x j + 1 + y j , ( j = 1, 2, ..., n 1).
2.2 Matrizen
41
Beispiel 2.18 In einem Betrieb werden zur Produktion der Mengen e1 und e2 zweier Endprodukte E1 und E2 zwei Zwischenprodukte benötigt, die wiederum aus drei verschiedenen Rohstoffen hergestellt werden. Die Mengeneinheiten der zwei Zwischenprodukte seien z1 und z2 und die der Rohstoffe r1, r2 und r3. Der Bedarf für die End- bzw. Zwischenprodukte sei Z1 Z2 E1 E2 Gesucht ist der Rohstoffbedarf für die R1 3 1 Z1 2 1 Erzeugung von e1 = 12 und e2 = 15 R2 1 2 Z2 3 2 Endprodukten. R3 1 2 Lösung Es handelt sich hier um einen dreistufigen Produktionsprozess. Zur übersichtlichen Schreibweise wird folgende Bezeichnung der Vektoren vorgenommen: x1 = r (Rohstoffe), x2 = z (Zwischenprodukte), x3 = e (Endprodukte). Wie viel von den 3 Rohstoffarten zur Produktion der einzelnen Zwischenprodukte erforderlich sind, gibt die Matrix A(13,2,2 ) an; die Matrix A(22,3,2 ) gibt an, wie
viel der einzelnen Zwischenprodukte für die Produktion der Endprodukte erforderlich sind. Die oberen Indizes stehen für den Stufenübergang, die unteren geben das Format der Matrizen an. 3 1 2 1 12 1,2 1,2 2,3 2,3 r = A z mit A = 1 2 und z = A e mit A = ,e=
3 2
15
1 2
3 1 183 3 1 2 1 12 39 e = 1 2 = 1 2 = 171 1 2 3 2 15
1 2 66 171
Für die Produktion der Mengeneinheiten e1 = 12 und e2 = 15 werden die Rohstoffmengen r1 = 183, r2 = 171 und r3 = 171 benötigt.
r=A
1,2
A
2,3
Bemerkung: (1) Unter Beachtung der Reihenfolge r = A1,2 ( A2,3 e) lässt sich die Anzahl der notwendigen Rechenoperationen effektiv gestalten. (2) Die Matrix A = A1,2 A2,3 liefert den direkten Zusammenhang zwischen dem Rohstoffverbrauch und den Endprodukten. MARKOV-Kette Wenn in einer Kette von Vektoren xj für Stufe j ( j = 1, 2, ..., n) der Vektor xj nur vom vorangegangenen Vektor xj 1 abhängt, heißen die Vektoren eine MARKOV-Kette und beschreiben einen MARKOV-Prozess. Bezeichnungen j Nummer der einzelnen Prozessstufen ( j = 1, 2, ..., n) Mj Übergangsmatrix von Prozessstufe j zur Stufe j + 1 xj Vektor für den Zustand der Stufe j Es besteht dann der folgende Zusammenhang: x Tj 1 x Tj M j , ( j = 1, 2, ..., n). Siehe z. B. Larek, 2000.
L
42
2 Lineare Algebra und Optimierung
2.2.3
Besondere Matrizen
Eine quadratische Matrix, in der alle Elemente aik = 0 sind für i k, heißt Diagonalmatrix. Beispiel 2.19
d1 0 D1 = 0 d 2 0 0
0 0 d 3
1 0 0 D2 = 0 0 0 0 0 1
Eine Diagonalmatrix, deren Diagonalelemente alle Eins sind, heißt Einheitsmatrix: E(n, n) = (eik): eik = 0 i, k bei i k und eii = 1 i. Für die Einheitsmatrix gilt: E(m, m) A(m, n) = A(m, n) E(n, n) = A(m, n) 1 0 0 Beispiel 2.20 Einheitsmatrix dritter Ordnung: E = 0 1 0 0 0 1
Eine quadratische Matrix A, die mit ihrer Transponierten multipliziert die Einheitsmatrix ergibt, heißt orthogonale Matrix, A AT = E. Beispiel 2.21
cos A=
sin
sin cos T , A = cos
sin
sin cos
1 0 T AA =
0 1
A1 heißt die zur quadratischen Matrix A inverse (reziproke) Matrix oder Kehrmatrix, wenn gilt A1 A = A A1 = E. Eine Matrix A ist orthogonal, falls AT = A1 bzw. AT A = E. Jeder quadratischen Matrix A kann eine Zahl det (A) zugeordnet werden. Eine quadratische Matrix A heißt regulär, falls det (A) 0 und singulär, falls det (A) = 0 ist. Eine reguläre Matrix A hat eine eindeutige inverse Matrix A 1: T
A11 A1n 1 A 1 = . (Die Aik sind Adjunkte, siehe 2.1.1.) det( A)
A n1 A nn
Es gelten: (A1)1 = A , (A B) 1 = B 1 A 1 und (A T) 1 = (A 1)T Beispiel 2.22
3 4 A=
5 7
T
A = 1
7 7 5 1 = 3 7 4 5 4 3
5
4 3
2.2 Matrizen
2.2.4
43
Eigenwerte, Eigenvektoren
In der Marktforschung und bei vielen Anwendungen ist das Problem zu lösen, für welche Werte (Eigenwerte) und welche Vektoren x (Eigenvektoren) die Gleichung A x = x lösbar ist. Dazu ist das homogene Gleichungssystem (A E ) x = o zu lösen. Die Gleichung det (A E ) = 0 mit der Variablen heißt charakteristische Gleichung einer quadratischen Matrix A. Die Lösungen der charakteristischen Gleichung det (A E ) = 0 heißen Eigenwerte der quadratischen Matrix A. Ist ein Eigenwert der Matrix A, so heißen die Vektoren x o, die der Beziehung A x = x oder (A E ) x = o genügen, die zum Eigenwert gehörenden Eigenvektoren der quadratischen Matrix A. Bemerkung Eine quadratische Matrix n-ter Ordnung hat n Eigenvektoren, die einoder mehrfach auftreten können und reell oder komplex sein können. Für reelle symmetrische Matrizen sind alle Eigenwerte reell. Zu m voneinander verschiedenen Eigenwerten i ( i = 1, 2, ..., m n) von A(n, n) gehören m linear unabhängige Eigenvektoren xi (siehe 2.3.1). Beispiel 2.23 5 3 A
3 5
Charakteristische Gleichung:
25 10 + 2 9 = 0,
5 3 =0 3 5
2 10 + 16 = 0,
Eigenwerte: 1 = 8 5 3 1 0 2 = 2 Eigenvektoren: x o 3 5 0 1
3 x1 3 x 2 0 3 3 1 x 1 o , 1 = 8: , Lösung: x 1 t1 3 x1 3 x 2 0
3 3
1
3 3 x 2 o ,
3 3
2 = 2:
3 x1 3 x 2 0 1 , Lösung: x 2 t 2 3 x1 3 x 2 0
1
Bemerkung: Zur Lösung homogener Gleichungssysteme siehe 2.3.5. Häufig werden normierte Eigenvektoren (Länge gleich 1) benötigt. 1 , i = 1, 2 ermittelt: Diese werden durch Wahl der ti mit ti xik2 Zum Beispiel 2.23 k
1 1 1 1 2 und x 2 2 x1 2 2
1
1
x1 und x2 sind linear unabhängig voneinander.
L
44
2 Lineare Algebra und Optimierung
2.3 2.3.1
Lineare Gleichungssysteme Lineare Abhängigkeit
Die Vektoren ai (i = 1, 2, ..., n) heißen linear unabhängig, wenn der Nullvektor o nur auf triviale Weise als Linearkombination der Vektoren ai (i = 1, 2, ..., n) dargestellt werden kann, d. h., wenn die Vektorgleichung t1 a1 + t2 a2 + ... + tn an = o nur die triviale Lösung ti = 0, (i = 1, 2, ..., n) hat, siehe Abschnitt 2.3.4. Anderenfalls heißen die Vektoren linear abhängig. Ist m die Ordnung der Vektoren, so sind höchstens m Vektoren linear unabhängig. Beispiel 2.24 1 0 0 (1) a 1 = 0 , a 2 = 1 , a 3 = 0 , 0 0 1
t1 a 1 + t2 a 2 + t3 a 3 = o
d. h., zu lösen ist das Gleichungssystem: t1 + 0 + 0 = 0 0 + t2 + 0 = 0 0 + 0 + t3 = 0 Als einzige Lösung ergibt sich: t1 = t2 = t3 = 0. Die Vektoren sind linear unabhängig. (2) Für einen anstelle von a 3 veränderten Vektor a 4 ergibt sich: 1 0 3 a 1 = 0 , a 2 = 1 , a 4 = 2 , 0 0 0
t1 a 1 + t2 a 2 + t3 a 4 = o
d. h., zu lösen ist das Gleichungssystem: t1 + 0 + 3t3 = 0 0 + t2 + 2t3 = 0 0+0+ 0=0 Eine Lösung ist z. B.: t1 = 3, t2 = 2, t3 = 1. Die Vektoren sind linear abhängig. Es gilt z. B.: 3 a1 2 a2 + a4 = o
Bemerkungen (1) n Vektoren sind genau dann linear abhängig, wenn das zugehörige Gleichungssystem eine Lösung mit nicht sämtlich verschwindenden ti (i = 1, 2, ..., n) hat. (2) Die Zeilen oder Spalten einer Matrix können als Zeilen- oder Spaltenvektoren aufgefasst werden, somit ist es sinnvoll, bei einer Matrix von linear abhängigen oder unabhängigen Zeilen oder Spalten zu sprechen.
2.3 Lineare Gleichungssysteme
2.3.2
45
Rang
Ein Vektorsystem von n Vektoren besitzt eine maximale Anzahl r linear unabhängiger Vektoren. Diese Anzahl wird als Rang des Vektorsystems r (bzw. Rang der entsprechenden Matrix) bezeichnet (r n). Berechnung des Ranges einer Matrix r = r (A)
Enthält eine Matrix A vom Format (m, n) wenigstens eine von null verschiedene Unterdeterminante der Ordnung r, während alle Unterdeterminanten höherer Ordnung null sind, dann hat A den Rang r. Beispiel 2.25 1 2 3 1 2 3 A = 1 2 2 , det(A) = 1 2 2 = 10 0, d. h. r = r (A) = 3. 1 0 1 1 0 1
Beispiel 2.26 Gesucht ist der Rang eines Vektorsystems, bestehend aus den drei Vekto 1 2 3 ren: a1 = 1 , a2 = 2 , a3 = 3 . 1 0 1
Lösung: Die drei Vektoren werden in einer Matrix angeordnet: 1 2 3 3 1 2 Also: A = 1 2 3 , det(A) = 1 2 3 = 0, 1 0 1 0 1 1
d. h., a1, a2, a3 sind linear abhängig. Der Rang ist kleiner als drei. Wenn der Rang zwei sein sollte, ist eine Unterdeterminante zweiter Ordnung ungleich null zu finden: 1 2 1 2 0, aber U23 = 2 0, also r = r (A) = 2. U33 = 1 2 1 0 Es gibt zwei linear unabhängige Vektoren.
Bemerkung: Falls alle neun Unterdeterminanten gleich null sind, müsste r = r (A) = 1 getestet werden. Das wäre der Fall, wenn A mindestens ein von null verschiedenes Element enthält. Der Rang einer Matrix mit m Zeilen und n Spalten ist höchstens gleich der kleineren der beiden Zahlen m und n, r min (m, n). Der Rang einer Matrix bleibt unverändert, wenn (1) je zwei parallele Reihen vertauscht werden, (2) eine Reihe mit einem Faktor k 0 multipliziert wird, (3) die Matrix transponiert wird, (4) das Vielfache einer Reihe zu einer parallelen Reihe addiert wird.
L
46
2 Lineare Algebra und Optimierung
2.3.3
Lösbarkeitsbedingung linearer Gleichungssysteme
Gegeben sei ein Gleichungssystem der Form: a11 x1 + a12 x2 + . . . a21 x1 + a22 x2 + . . . am1 x1 + am2 x2 + . . .
+ a1n xn + a2n xn
= =
b1 b2
+ amn xn =
bm
Matrixschreibweise A x = b , bzw. A(m, n) x(n, 1) = b(m, 1)
Bezeichnungen A Koeffizientenmatrix (aik), i = 1, 2, ..., m; k = 1, 2, ..., n A, b erweiterte Koeffizientenmatrix (Hinzufügen von b als Spalte) x Vektor der unbekannten Variablen x1, x2, ..., xn b Vektor der absoluten Werte (rechte Seite) b1, b2, ..., bm
Ein lineares Gleichungssystem A x = b heißt bei b = o homogen, bei b o heißt es inhomogen. Ein Vektor x, der die Gleichung A x = b identisch erfüllt, heißt Lösung eines linearen Gleichungssystems A x = b. Ein lineares Gleichungssystem ist genau dann lösbar, wenn der Rang der Koeffizientenmatrix gleich dem Rang der erweiterten Koeffizientenmatrix ist, also wenn r (A) = r (A, b) gilt. Für die Existenz einer eindeutigen Lösung eines Gleichungssystems ist notwendig und hinreichend, dass der Rang der Koeffizientenmatrix gleich dem Rang der erweiterten Koeffizientenmatrix und gleich der Anzahl der Unbekannten ist, d. h. r (A) = r (A, b) = n. Beispiel 2.27
x1 + 2x2 = 1 x1 + 2x2 = 2
ist auf Lösbarkeit zu untersuchen.
1 2 1 2 Lösung: A = 2 2 0, det(U11) = 2 0, r (A)= 1 , det(A) = 1 2
1 2
2 1 1 2 1 4 2 2 0, r (A, b) = 2 1 = r (A). (A, b) = , det(U1) = 2 2
1 2 2
Das Gleichungssystem ist somit unlösbar.
2.3
2.3.4
Lineare Gleichungssysteme
47
Basistransformation
Lösen von Gleichungssystemen im Fall r = n Problem: Überführung eines Gleichungssystems A x = b mit eindeutiger Lösung, r ( A) = m = n, in ein äquivalentes System E x = b’. Lösung: Die quadratische Matrix A wird durch einen Algorithmus in eine Einheitsmatrix überführt (transformiert), sodass b’ die Lösung angibt. Ein lineares Gleichungssystem der Form E x = b’ oder E xB + R xN = b’ heißt lineares Gleichungssystem in kanonischer Form (E ist eine Einheitsmatrix). Die Variablen eines linearen Gleichungssystems in kanonischer Form, die zur Einheitsmatrix gehören (enthalten in xB), heißen Basisvariable (BV). Die anderen Variablen (enthalten in xN) heißen Nichtbasisvariable (NBV). Das vollständige Schema u1 u2 us BV
xs
a12
a1s
ar2
ars
x1
x2
a11
ar1
un
u0
xn
b
s
a1n
b1
s1
arn
br
sr
am1 am2 ams amn bm sm Algorithmus 0. Aufschreiben des vollständigen Schemas. Die sr r sind die Zeilensummen und die us s die Spaltensummen. 1. Bestimmen eines Hauptelementes ars 0 (Zeile ohne BV). 2. Die Elemente der Hauptzeile werden durch das Hauptelement divia rj b s diert a ' rj , für alle j ; b'r r und s 'r r . a rs ars ars 3. Die restlichen Elemente der Hauptspalte sind gleich null. 4. Umrechnen der restlichen Elemente nach der Rechteckregel ais arj aij ars ais arj a 'ij aij . ars ars Die Rechteckregel gilt auch für die Spalten b und s a b b a ais br a s s a ais sr b'i bi is r i rs s'i si is r i rs . a rs a rs ars ars Die s-Werte müssen mit der jeweiligen Zeilensumme übereinstimmen. 5. Die Punkte 1. bis 4. werden so lange wiederholt, bis sich kein weiteres Hauptelement mehr finden lässt.
Probe: Kontrolle der Lösung: u1 x1 + u2 x2 + u3 x3 + . . . + un xn = u0.
L
48
2 Lineare Algebra und Optimierung
Beispiel 2.28 2x1 5x2 + x3 = 9 x1 + 6x2 x3 = 7 3x1 + x2 2x3 = 8 0
2
2
6
x1
x2
x3
b
s
2 1 3
5 6 1
1 1 2
9 7 8
7 1 12
x3
2 3 1
5 1 9
1 0 0
9 2 10
7 6 2
x3 x2
17 3 28
0 1 0
1 0 0
19 2 28
37 6 56
x3 x2 x1
0 0 1
0 1 0
1 0 0
2 1 1
3 0 2
1 x1 = 1
1 x2 = 1
2 x3 = 2
BV
Das Zeichen „“ steht für die positive Probe. Der Haken wird gesetzt, wenn der mit der 4. Regel der BT berechnete s-Wert mit der jeweiligen Zeilensumme übereinstimmt. Die s-Werte müssen also zweimal ausgerechnet werden.
Lösen von Gleichungssystemen im Fall r < n A x = b sei ein lineares Gleichungssystem mit n Unbekannten. Es gelte r (A) = r (A, b) = r. Dann heißt f = n r der Freiheitsgrad des linearen Gleichungssystems. f ist die Anzahl der frei wählbaren Parameter (Unbekannten). Homogenes Gleichungssystem A x = o
Ein allgemeines homogenes Gleichungssystem besitzt stets die Lösung x = o, die triviale Lösung. Weitere Lösungen existieren nur, wenn r < n, d. h. f = n r > 0 ist. In diesem Fall existieren unendlich viele Lösungen. Die Darstellung für die allgemeine Lösung lautet: x = t1 x1 + t2 x2 + ... + tf xf Dabei sind die ti, (i = 1, 2, ..., f ) frei wählbare Parameter und die Vektoren xi, (i = 1, 2, ..., f ) linear unabhängige Lösungsvektoren.
2.3
Lineare Gleichungssysteme
Beispiel 2.29 x1 2x1 3x1 x1
+ 3x2 5x3 + 3x2 4x3 + 2x2 x3 + 4x2 7x3
+ 4x4 + 2x4 2x4 + 6x4
49
x1 2 1 x 2 2 Lösung: x = 2 t 1 t 2 x3 0 1 x 0 1 4
=0 =0 =0 =0
Lösungsschema 7
12
17
10
0
x1
x2
x3
x4
b
s
1 2 3 1
3 3 2 4
5 4 1 7
4 2 2 6
0 0 0 0
3 3 2 4
x1
1 0 0 0
3 3 7 1
5 6 14 2
4 6 14 2
0 0 0 0
3 3 7 1
x1 x2
1 0 0 0
0 1 0 0
1 2 0 0
2 2 0 0
0 0 0 0
0 1 0 0
1 2
2 2
1 0
0 1
hom hom
BV
n=4 r=2 f=2
x3 und x4 sind frei wählbar und werden t1 = x3 bzw. t2 = x4 gesetzt.
Bemerkung Das Zeichen „“ steht für die positive Probe. Inhomogenes Gleichungssystem
A x = b
Die allgemeine Lösung des inhomogenen linearen Gleichungssystems A x = b ergibt sich als Summe einer speziellen Lösung des gegebenen inhomogenen Gleichungssystems und der allgemeinen Lösung des zugehörigen homogenen Gleichungssystems A x = o, x = xinh + xhom x = xinh + t1 x1 + t2 x2 + . . . + tf xf
mit f = n r.
L
50
2 Lineare Algebra und Optimierung Lösung x1 6 1 0 x 2 2 t t x= 1 2 x3 1 0 0
x4 0
Beispiel 2.30 x1 + x2 + x3 x4 = 4 x1 x2 + x3 + x4 = 8 3x1 + x2 + 3x3 x4 = 16
Lösungsschema 5
1
5
1
28
0
x1
x2
x3
x4
b inh
b hom
s
1 1 3
1 1 1
1 1 3
1 1 1
4 8 16
0 0 0
6 10 22
x1
1 0 0
1 2 2
1 0 0
1 2 2
4 4 4
0 0 0
x1 x2
1 0 0
0 1 0
1 0 0
0 1 0
6 2 0
0 0 0
6
2
0
0
1 0
0 1
1 0
0 1
BV
0 1 0 1
6 4 4 8 n = 4 2 r = 2 0 f = 2
inh hom hom
Bemerkungen (1) Es gilt A x = A xinh + A xhom = b + o = b. (2) Im Fall r (A) = r (A, b) = r = n gibt es eine eindeutige Lösung des inhomogenen Gleichungssystems (xhom= o). (3) Da im inhomogenen und im zugehörigen homogenen Gleichungssystem gerechnet werden muss, kann die b-Spalte zur besseren Übersicht als b inh- und b hom-Spalte getrennt geschrieben werden. Anwendung der Basistransformation zur Berechnung der inversen Matrix Problem: Aus der Gleichung A X = E ist die Matrix X zu bestimmen. Lösung: Damit sind n Gleichungssysteme zu lösen, die alle die gleiche Koeffizientenmatrix A mit verschiedenen rechten Seiten haben. Diese n Gleichungssysteme können mit Hilfe der Basistransformation in einem Schema gelöst werden. Das erste Gleichungssystem lautet:
a11 x11 + a12 x21 + a21 x11 + a22 x21 +
... + ... +
a1n xn1 = a2n xn1 =
1 0
an1 x11 + an2 x21 +
... +
ann xn1 =
0
2.3
Lineare Gleichungssysteme
51
Die übrigen Gleichungssysteme haben entsprechend veränderte rechte Seiten, die jeweils Spalten der Einheitsmatrix E sind. Diese rechten Seiten werden im Schema berücksichtigt, und es ergibt sich folgende Anordnung, wobei im unteren Teil die Probe A A1 = E mit dem FALKschen Schema (dickerer Strich) direkt angeschlossen werden kann: A
E
s
Berechnung
E
A1
A
E
s’
Probe
Beispiel 2.31 1 Gesucht ist zur gegebenen Matrix A die inverse Matrix A . 4 3 2 2 3 1 1 A = 1 Lösung: A = 1 1 0 5 3 1 6 4 1 2 1
Lösungsschema s
1 1 1
4 5 6
3 3 4
1 0 0
0 1 0
0 0 1
7 8 8
1 0 0
4 1 2
3 0 1
1 1 1
0 1 0
0 0 1
7 1 1
1 0 0
0 1 0
3 0 1
5 1 1
4 1 2
0 0 1
3 1 1
E:
1 0 0
0 1 0
0 0 1
2 1 1
2 1 2
3 0 1
A:
1 1 1
4 5 6
3 3 4
1 0 0
0 1 0
0 0 1
A:
E
6 1 1 A 1
E = A A (Probe) 1
L
52
2 Lineare Algebra und Optimierung
2.3.5
Gauß-Algorithmus
Lösen von Gleichungssystemen im Fall r = n Problem Überführung eines Gleichungssystems A x = b mit r ( A) = m = n in ein äquivalentes System D x = d. Lösung: Die quadratische Matrix A wird in eine Dreiecksmatrix überführt (transformiert), sodass aus der letzten Gleichung eine Variable, aus der vorletzten die nächste Variable usw. berechnet werden können. Bemerkung Die Überführung in eine Dreiecksmatrix kann in Einzelschritten oder komprimiert erfolgen. Beim verkürzten oder verketteten Algorithmus wird die entstehende Dreiecks-Null-Matrix mit notwendigen Hilfswerten besetzt, sodass der verkettete GAUSS-Algorithmus äußerst komprimiert ist. Das vollständige Schema (verketteter GAUSS-Algorithmus) u1 u2 us un u0 x1 x2 xs xn b s a11 a12 a1s a1n b1 s1
ar2
ars
arn
br
sr
an1
an2
ans
bn
sn
d12
d1n
d1
s1*
c21
d22
d2n
d2
s2*
c31
c32
d3s
ann
d11
d3n
d3
s3*
cr2
drr
drn
dr
sr*
cn1
cn2
cns
dnn
dn
sn*
x1
x2
ar1
d1s
d2s
cr1
xs
xn
Der Algorithmus 1. Aufschreiben des vollständigen Schemas. Die sr r sind die Zeilensummen und die us s die Spaltensummen. n
s k aij bi , k = 1, 2, ..., n. j 1
2. Die erste Zeile wird übernommen. Das erste Hauptelement ist a11 0.
2.3
Lineare Gleichungssysteme
53
3. Die Elemente dik „oberhalb der Treppe“ ergeben sich aus der Summe des alten Elementes und dem Skalarprodukt der bereits berechneten Elemente des Zeilenvektors ci und des Spaltenvektors dk: i 1
d ik aik cij d jk ,
für alle i = 2, 3, ... , n; k = i, i + 1, ..., n.
j 1
Die Formel gilt auch für die Spalte b und s sinngemäß: i 1
d i bi cij d j
si*
j 1
i 1
si cij s j , i = 2, 3, ..., n. j 1
4. Die Zeilensummenprobe besteht darin, dass die berechneten si* mit den si** übereinstimmen müssen:
si** d ij , i = 2, 3, ..., n. j
5. Bei der Berechnung der Elemente cik, die nur „unterhalb der Treppe“ stehen, kommt neben der Vorschrift für die dik noch eine Division durch das mit (1) multiplizierte Hauptelement dkk hinzu (dkk 0): k 1
aik cij d jk
d ik j 1 , i = 2, 3, ..., n; k = 1, 2, ..., i 1. d kk d kk Ist dkk = 0, muss ein Spaltentausch (Variablentausch im Gleichungssystem) so vorgenommen werden, dass das neue dkk 0 ist. 6. Die Berechnung der Variablen beginnt rückwärts mit xn: d d n1,n xn d xn n , xn1 n1 , usw., allgemein: d nn d n1,n1 cik
xni
1
d ni ,ni
i d ni d nk ,nk 1 xnk 1 , i = 0, 1, ..., n 1. k 1
n
7. Kontrolle der Lösung: u0 u j x j . j 1
Bemerkungen (1) Ergibt sich als Treppenelement null, muss zunächst geprüft werden, ob das Gleichungssystem lösbar ist (alle folgenden Elemente der Zeile gleich null). Sind bei Lösbarkeit alle Elemente der Zeile gleich null, ist die Gleichung linear abhängig und kann gestrichen werden. Es wird die folgende Zeile anstelle der gestrichenen Zeile genommen. Ist bei Lösbarkeit die Zeile nicht komplett gleich null, ist ein geeigneter Spaltentausch vorzunehmen. (2) Die Lösung homogener Gleichungssysteme ist als Spezialfall enthalten und wird nicht extra dargestellt. (3) Die Berechnung inverser Matrizen ist analog zu übertragen.
L
2 Lineare Algebra und Optimierung
54
Beispiel 2.32
5 x1 1 2 1 1 1 2 1 1 3 x1 = 3
3 x2 1 1 2 1
x1 2x1 x1 x1
+ x2 + x2 + 2x2 x2 2 x3 1 1 1 1
1 1 3 2 2 3 2 1 x2 = 2 x3 = 1
+
1 1 1
x3 x3 x3 x3 1 x4 1 1 2 3
+ x4 x4 2x4 + 3x4
Lösung
= 8 = 3 = 0 = 12 23 b 8 3 0 12
x1 3 x 2 x= 2 x3 1 x 4 4
s 10 4 2 14
1 3 6
8 13 21
10 16 24
4
16
20
Das Zeichen „“ steht für die positive Probe.
4 x4 = 4
Lösen von Gleichungssystemen im Fall r < n Im lösbaren Fall r < n entsteht im umgerechneten Schema eine Matrix D(r, n) mit r < n, nachdem die Nullzeilen (linear abhängige Gleichungen) weggelassen wurden. Nach Ermittlung des Freiheitsgrades f = n r können die f letzten Variablen frei gewählt werden und der inhomogene sowie f homogene Bestandteile der allgemeinen Lösung ermittelt werden. Beispiel 2.33
x1 + x2 + x3 x4 = 4 x1 x2 + x3 + x4 = 8 3x1 + x2 + 3x3 x4 = 16
Lösung x1 6 1 x 0 2 t t x = 2 1 2 1 x 0 3 x 0 0
4
0 1 0 1
5 x1
1 x2
5 x3
1 x4
1 1 3
1 1 1
1 1 3
1 1 1
4 8 16
0 0 0
6 10 22
Bemerkung Die Anzahl der vom Nullvektor verschiedenen Zeilen in D(r,n) gibt den Rang r an.
1 1 3
1 2 1
1 0 0
1 2 0
4 4 0
0 0 0
6 4 0
6
2
In dem nebenstehenden Beispiel 2.33 ist r = 2.
0
0
inh
1 0
0 1
1 0
0 1
28 0 b inh b hom
hom hom
s
2.4 Anwendungen in der Wirtschaft
2.4
55
Anwendungen in der Wirtschaft
Verflechtung Bei Verflechtungen 1. Art (siehe Beispiel 2.18 in Abschnitt 2.2.2) kann auch eine Umkehrung der Fragestellung von Interesse sein. Aus r = A1,2 · A2,3 · e = A1,3 · e , also A1,3 = A1,2 · A2,3, ist bei vorgegebenem Rohstoffvektor r die mögliche Menge an Endprodukten e zu ermitteln. Ist die Matrix A1,3 regulär, führt eine einfache Umstellung der Gleichung mit Hilfe der inversen Matrix zum Ziel: e = ( A1,3)1 = ( A1,2 · A2,3)1 · r. Existiert die inverse Matrix nicht, so stellt r = A1,3 · e bzw. A1,3 · e = r ein lineares Gleichungssystem dar, das keine Lösung, genau eine Lösung oder unendlich viele Lösungen haben kann. Beispiel 2.34 Es liege der Sachverhalt aus Beispiel 2.18 vor. Die Aufgabenstellung wird in folgender Weise modifiziert: Gesucht ist die Anzahl der einzelnen Endprodukte, die aus vorhandenen Rohstoffmengen r1 = 61 ME und r2 = r3 = 57 ME hergestellt werden können. Lösung Die Gleichung r (3,1) = A(13,3,2 ) · e (2,1) kann nach e explizit nicht aufgelöst werden, da A(13,3,2 ) nicht quadratisch und somit nicht invertierbar ist. Es muss ein Gleichungssystem gelöst werden: 9e1 + 5e2 = 61 Dieses Gleichungssystem hat die eindeutige Lösung 8e1 + 5e2 = 57 e1 = 4 und e2 = 5. Es können genau 4 ME von E1 und 5 ME von E2 produziert werden. 8e1 + 5e2 = 57
LEONTIEF-Modell Bei den Verflechtungsmodellen 1. Art in Abschnitt 2.2.2 (siehe Beispiel 2.18) wurde noch nicht berücksichtigt, dass die produzierten Einheiten in der j-ten Stufe auch gleichzeitig Ausgangseinheit in der j-ten Stufe sein können (Eigenverbrauch). Betrachtet wird eine bestimmte Stufe j einer Verflechtung. Bezeichnungen x Vektor des Eigenverbrauchs y Nachfragevektor A Verbrauchsmatrix, die für jede Stufe angibt, wie viel Mengen je produzierter Einheiten in welcher Stufe benötigt werden Es gilt dann x = A · x + y. Die Bestimmung der Gesamtproduktion der Stufe erfolgt mit Hilfe der Einheitsmatrix E durch Umstellung nach x : x = (E A)1 · y. Die Matrix (E A)1 wird als LEONTIEF-Inverse bezeichnet. Siehe z. B. Larek, 2000 oder Luderer, 2001.
L
56
2 Lineare Algebra und Optimierung
2.5 2.5.1
Lineare Ungleichungssysteme Begriffe
Ein System A x R b, mit den Relationszeichen R {, =, }, den Konstanten A = (aij) und b = (bi), i = 1, 2, ..., m; j = 1, 2, ..., n heißt lineares Ungleichungssystem mit m Nebenbedingungen (Restriktionen). Ein System A x R b, x o mit den Relationszeichen R{, =, }, den Konstanten A = (aij) und b = (bi), i = 1, 2, ..., m; j = 1, 2, ..., n heißt lineares Ungleichungssystem mit m Nebenbedingungen und n Nichtnegativitätsbedingungen. Das Relationszeichen R ist komponentenweise zu verstehen, in jeder Restriktion kann eines der angegebenen Zeichen Verwendung finden. Die Form A(m, n) x(n) R b(m), x(n) o(n) eines linearen Ungleichungssystems mit den Relationszeichen R {, =} heißt 2. Normalform des linearen Ungleichungssystems. (m und n geben das Format an.) In der 2. Normalform tritt in den Restriktionen nur das Ungleichheitszeichen oder ein Gleichheitszeichen auf. Aus den -Bedingungen können durch Multiplikation mit 1 - Bedingungen gemacht werden. Gibt es Variable xj, die der Nichtnegativitätsbedingung xj 0 nicht genügen müssen, werden sie in allen Restriktionen durch jeweils eine Differenz zweier neuer Variablen xj = xj1 xj 2 mit xj1, xj 2 0 ersetzt. Ein lineares Ungleichungssystem A x b, x o mit b o heißt normales lineares Ungleichungssystem. Ein normales lineares Ungleichungssystem enthält keine Gleichungen und der Vektor b hat keine negativen Komponenten. Die Form (A, E)(m, n + m) x(n + m) = b(m), b(m) o(m), x(n + m) o(n + m) eines normalen linearen Ungleichungssystems heißt 1. Normalform des normalen linearen Ungleichungssystems. Jede 2. Normalform eines normalen linearen Ungleichungssystems lässt sich in die 1. Normalform überführen, indem in jeder -Bedingung auf der linken Seite eine zusätzliche Schlupfvariable eingeführt wird. Das in der 1. Normalform auftretende lineare Gleichungssystem (A, E) x = b liegt in der kanonischen Form vor, siehe Abschnitt 2.3.4. Beispiel 2.35 Folgendes Ungleichungssystem soll zunächst in die 2. Normalform und anschließend in die 1. Normalform überführt werden. x1 + x2 9 x1 x2 5
x1 0 x2 beliebig
2.5 Lineare Ungleichungssysteme Lösung: Variablensubstitution 2. Normalform x1 + x21 x22 9 x1 x21 + x22 5 x1, x21, x22 0
57
x2 = x21 x22 mit x21, x22 0 1. Normalform =9 x1 + x21 x22 + x3 + x4 = 5 x1 x21 + x22 x1, x21, x22, x3, x4 0
Jeder Vektor x, für den A x b, b o gilt, heißt Lösung des normalen linearen Ungleichungssystems A x b. Jeder Vektor x, für den A x b, b o, x o gilt, heißt zulässige Lösung des normalen linearen Ungleichungssystems A x b. Eine Punktmenge heißt konvex, wenn neben zwei beliebig gewählten Punkten dieser Menge auch alle Punkte der Verbindungsstrecke der Punktmenge angehören. Die Menge M der zulässigen Lösungen von A x b, b o, x o ist eine konvexe Punktmenge, wenn sie nicht leer ist. Sind x1 und x2 zulässige Lösungen, so ist auch jede konvexe Linearkombination x x = t1 x1 + t2 x2 mit t1 + t2 = 1, t1, t2 0 eine zulässige Lösung.
2.5.2
Lösen linearer Ungleichungssysteme
Lineare Ungleichungssysteme mit zwei Variablen lassen sich graphisch lösen. Der vorgestellte Algorithmus für die rechnerische Lösung linearer Ungleichungssysteme bezieht sich nur auf normale lineare Ungleichungssysteme mit beschränkten Lösungsmengen und geht von der zugehörigen 1. Normalform (lineares Gleichungssystem) aus. Unter allen Lösungen interessieren besonders die Basislösungen. Basislösungen sind die Lösungen des Gleichungssystems, bei denen die Nichtbasisvariablen gleich null sind. Von diesen Basislösungen sind besonders die zulässigen Basislösungen mit x o von Interesse. Die Anzahl der zulässigen Basislösungen eines normalen linearen Ungleichungssystems A x b, b o, x o ist endlich. Sind x1, ..., xn die zulässigen Basislösungen eines normalen beschränkten linearen Ungleichungssystems A x b, b o, x o, so ist die Menge aller zulässigen Lösungen M durch die Menge aller konvexen Linearkombinationen der zulässigen Basislösungen gegeben: M = {x x = t1 x1 + ... + tn xn mit ti = 1 und ti 0 i}. M heißt allgemeine zulässige Lösung.
L
2 Lineare Algebra und Optimierung
58
Graphische Lösung bei zwei Variablen Die zulässige Lösungsmenge M ergibt sich als Durchschnitt aller Lösungsmengen der Nebenbedingungen, dabei sind die Begrenzungsgeraden zu zeichnen. Die Lösungsmenge jeder Ungleichung stellt eine Halbebene dar, siehe Abschnitt 1.9.2. Die „richtige Seite“ kann ermittelt werden, indem für einen ausgewählten Punkt (z. B. (0; 0) oder ein einfacher, nicht auf der Gerade liegender Punkt) die Zugehörigkeit zur Lösungsmenge geprüft wird. Die zulässige Lösungsmenge M ist eine durch die Eckpunkte bestimmte konvexe Punktmenge, alle Punkte der Strecke zwischen zwei beliebig aus M gewählten Punkten gehören der Lösungsmenge M an. Rechnerische Lösung für ein normales lineares Ungleichungssystem Bezeichnungen BV Basisvariable NBV Nichtbasisvariable BL Basislösung ZBL Zulässige Basislösung
HZ HS HE BT
Hauptzeile Hauptspalte Hauptelement Basistransformation
Lösungsweg 1. Ermitteln der 1. Normalform des normalen linearen Ungleichungssystems. 2. Wählen einer HS mit einer NBV xs, die in der vorangegangenen Tabelle keine BV war (sonst ergibt sich eine bereits bekannte BL). 3. Für alle positiven Elemente ais der Spalte s und bi der rechten Seite b werden die Quotienten qi i gebildet (zusätzliche Spalte). ais 4. Die Zeile mit dem kleinsten Quotienten qi wird die Hauptzeile HZ. 5. Die Basistransformation BT (siehe Abschnitt 2.3.4) wird für das ermittelte Hauptelement HE durchgeführt. 6. Die Punkte 2. bis 5. werden wiederholt, bis durch die BT keine neue BL gefunden werden kann. 7. Bildung der allgemeinen zulässigen Lösung. Beispiel 2.36 Zur Herstellung von zwei Erzeugnissen E1 und E2 stehen für die Bearbeitung drei Maschinen zur Verfügung. Die erforderlichen Maschinenzeiten und die zur Verfügung stehenden Zeitfonds sind in der folgenden Tabelle enthalten. Maschine 1 2 3
Maschinenzeit E2 E1 4 5 0
8 4 5
Zeitfonds 200 200 100
Es sollen alle möglichen Stückzahlenvarianten unter Einhaltung aller Bedingungen ermittelt werden.
2.5 Lineare Ungleichungssysteme Lösungsansatz x1 – Anzahl der Erzeugnisse vom Typ E1 x2 – Anzahl der Erzeugnisse vom Typ E2 Graphische Lösung: siehe Abbildung 2.1
59 Mathematisches Modell: 4x1 + 8x2 200 5x1 + 4x2 200 5x2 100 x1, x2 0
Abbildung 2.1 Die Lösungsmenge M wird als konvexe Linearkombination der fünf beteiligten Eckpunkte angegeben, die entweder als Näherungswerte der Abbildung 2.1 entnommen werden, als Schnittpunkte der entsprechenden Geraden berechnet werden oder auf rechnerischem Wege mit der Basistransformation ermittelt werden können. Lösung: 100 mit ti 0 i 10 0 0 40 5 x t1 t 2 t 3 3 t 4 t 5 25 und t i 1 20 20 0 0 i 1 3
Rechnerische Lösung: 2. Normalform 1. Normalform 4x1 + 8x2+ x3 = 200 4x1 + 8x2 200 = 200 5x1 + 4x2 + x4 5x1 + 4x2 200 + x5 = 100 5x2 5x2 100 x1, x2, x3, x4, x5 0 x1, x2 0 Lösung mit Angabe der Werte für die Schlupfvariablen (Lösungsweg auf der folgenden Seite): 100 0 40 10 0 3 25 5 0 0 20 20 3 mit t i 1 x = t 1 200 t 2 40 t 3 t t 0 40 4 5 i 1 0 200 0 70 120 und ti 0 i 0 100 100 0 0 175 3
L
2 Lineare Algebra und Optimierung
60
Lösungsschema x2
x3
x4
x5
b
x3
x1 4
8
1
0
0
200
x4
5
4
0
1
0
200
x5
0
0
0
1
100
x3
0
5 24 5
4 5
0
40
25 3
x1
1
1 5
0
40
50
x5
0
5
1
100
20
x2
0
1
x1
1
0
x5
0
0
x2
0
1
x1
1
0
x4
0
0
x2
0
1
0
0
x3
4
0
1
0
x4
5
0
0
1
BV
x5 x3 x4
1
4 5
0 0 5 24 1 6 25 24 0
0 1 6 1 3 5 6
0 1
0
1 4
0
5 4
1
wie 1. Tabelle
0
25 3 100 3 175 3
1 5
20
2 5
10
6 5 1 5
q 50
0 40 x1 = 0 -
100 70
40 x2 = 0
100 x3 = 3 25 3
10 40 x4 = 20
70
-
20
100
8 5
40
-
4 5
120
-
0 x5 = 20
2.6 Lineare Optimierung
2.6 2.6.1
61
Lineare Optimierung Begriffe
Bei der Optimierung, häufig Operations Research oder der Unternehmensforschung zugeordnet, soll unter vielen zulässigen Varianten die hinsichtlich eines bestimmten Kriteriums beste (optimale) Variante gefunden werden. Die mathematische Modellierung eines ökonomischen Problems erfordert die Umsetzung der ökonomischen Sachverhalte in mathematisch abzuarbeitende Rechenschritte. Jede Bedingung leitet sich aus ökonomischen Aussagen ab. Die ökonomische Zielstellung wird mit einer mathematischen Funktion beschrieben. Ein Optimierungsproblem besteht darin, unter Berücksichtigung gewisser Nebenbedingungen eine Zielfunktion zu maximieren oder zu minimieren. Beschreibung linearer Optimierungsprobleme Lineare Optimierung bedeutet, dass die verwendeten Funktionen, Ungleichungen und Gleichungen linear sind, die Variablen kommen also alle in der ersten Potenz vor. Bei einem linearen Optimierungsproblem (LOP) ist das Maximum oder Minimum einer linearen Zielfunktion Z (ZF) zu bestimmen, wobei die Struktur- oder Entscheidungsvariablen x1, x2, ..., xn den Nebenbedingungen (NB) oder Restriktionen und der Nichtnegativitätsbedingung (NNB) genügen müssen. Z = c0 + c1 x1 + c2 x2 + ... + cn xn max/min a11 x1 + a12 x2 + ... + a1n xn R b1 a21 x1 + a22 x2 + ... + a2n xn R b2
ZF : Z = cT x max/min NB : A x R b NNB : x o am1 x1 + am2 x2 + ... + amn xn R bm ; R (, =, )
xj 0, j = 1, 2, ..., n . Die Größen aij, bi, cj sind bekannt. Beispiel 2.37 ZF: NB:
NNB:
Z=
x1 + 4x2 max 4x1 + 8x2 200 5x1 + 4x2 200 5x2 100 x1, x2
0
Zielfunktion mit zwei Variablen x1 und x2 System von drei Nebenbedingungen, in diesem Fall drei - Beziehungen Nichtnegativitätsbedingung für die beiden Variablen x1 und x2
L
62
2 Lineare Algebra und Optimierung
Jeder Vektor x, der den Nebenbedingungen genügt, heißt Lösung des linearen Optimierungsproblems. Jeder Vektor x, der den Nebenbedingungen und der Nichtnegativitätsbedingung genügt, heißt zulässige Lösung des linearen Optimierungsproblems. Die Gesamtheit aller zulässigen Lösungen eines linearen Optimierungsproblems heißt Menge der zulässigen Lösungen. Jede zulässige Lösung, die die Zielfunktion maximiert bzw. minimiert, heißt optimale Lösung des linearen Optimierungsproblems.
2.6.2
Lösen linearer Optimierungsprobleme
Graphische Lösung linearer Optimierungsprobleme Lineare Optimierungsprobleme mit zwei Variablen können graphisch gelöst werden. Z = c0 + c1 x1 + c2 x2 max (min) ai1 x1 + ai2 x2 R bi, R (, =, ), i = 1, 2, ..., m x1, x2 0 Lösungsweg (für den Fall einer optimalen Lösung) 1. Modellierung des Problems 2. Ermittlung des zulässigen Bereiches 3. Konstruktion der Niveaulinien der Zielfunktion 4. Bestimmung des optimalen Punktes und des Zielfunktionswertes Bemerkungen (1) Die Zielfunktion stellt für einen festen Z-Wert eine Niveaulinie (Gerade) in der x1, x2-Ebene dar. Für unterschiedliche Z-Werte ergeben sich unterschiedliche, aber parallele Niveaulinien. Daher kann eine Maximierung bzw. Minimierung durch Parallelverschiebung einer beliebigen Niveaulinie von Z erfolgen. Häufig ist die Ausgangszielfunktion die für Z = 0. (2) Durch die Nebenbedingungen werden Halbebenen (bzw. Geraden bei Gleichungen) beschrieben. Der zulässige Bereich M ergibt sich als Durchschnitt der Lösungsmengen aller Nebenbedingungen. (3) Die Nichtnegativitätsbedingung verlangt eine Lösung im 1. Quadranten. Beispiel 2.38 Es wird der Sachverhalt von Beispiel 2.36 betrachtet. Der Gewinn beim Verkauf eines Erzeugnisses E1 beträgt 1 GE (Geldeinheit) und eines Erzeugnisses E2 4 GE. Wie soll produziert werden, damit der Gewinn des Betriebes maximal wird?
2.6 Lineare Optimierung
63
Modellierung: x1 - Anzahl der Erzeugnisse vom Typ E1 x2 - Anzahl der Erzeugnisse vom Typ E2 Z = x1 + 4x2 max 4x1 + 8x2 200 5x1 + 4x2 200 5x2 100 x1, x2 0
L
Graphische Lösung, siehe Abbildung 2.2: Die zunächst für z. B. Z = 0 gezeichnete Niveaulinie der Zielfunktion wird so parallel verschoben, dass noch mindestens ein Punkt von M erfasst wird.
(2)
(3)
x1 = 10 x2 = 20 (1)
Zmax = 1 10 + 4 20 = 90 Rechnerische Lösung siehe unter Beispiel 2.43
Abbildung 2.2
Beispiel 2.39 Für die Aufzucht von Vieh wird eine Mischung von zwei Futtersorten vorgesehen. Mindestgehalt von Kohlehydraten, Eiweißen und Fetten sowie Kosten sind in der Tabelle enthalten. Wie muss das Futter gemischt werden, damit die Kosten minimal werden? Futtersorte 1 2 Mindestgehalt
Kohlehydrate [mg/ME]
Eiweiße Fette [mg/ME] [mg/ME]
4 2
4 8
0 8
12
24
8
Modellierung: x1 - Mengeneinheiten Futter 1 x2 - Mengeneinheiten Futter 2
Kosten [GE] 10 12
Z = 10x1 + 12x2 min 4x1 + 2x2 12 4x1 + 8x2 24 8x2 8 x1, x2 0
64
2 Lineare Algebra und Optimierung
Graphische Lösung, siehe Abbildung 2.3:
x1 = 2 x2 = 2 Zmin = 10 2 + 12 2 = 44 Rechnerische Lösung siehe unter Beispiel 2.46
Abbildung 2.3
Sonderfälle 1. Unendlich viele Lösungen Ist die Niveaulinie der Zielfunktion für die optimale Lösung parallel zur berührenden Restriktionsgeraden, so sind alle die Punkte optimal, die gleichzeitig dem zulässigen Bereich und der Zielfunktion angehören. Beispiel 2.40 Z = x1 + 2x2 max x2 4 x1 + x2 9 x1 + 2x2 12 x1, x2 0
Abbildung 2.4 Die Menge der Lösungen lässt sich durch die konvexe Linearkombination der zulässigen Basislösungen x1 und x2 beschreiben: x = t1 x 1 + t 2 x 2
mit t1, t2 0 und t1 + t2 = 1
6 4 Lösung: x = t1 + t2 4
3
mit t1, t2 0 und t1 + t2 = 1 , Zmax = 12
2.6 Lineare Optimierung
65
2. Keine Lösung Der zulässige Bereich kann eine leere Menge sein (damit existieren keine zulässigen Lösungen). Ist der Bereich unbeschränkt, kann sich in Abhängigkeit von der Zielfunktion auch der Fall ergeben, dass es keine optimale Lösung gibt. Beispiel 2.41 Z = 3x1 + 4x2 max x1 + x2 4 x1 + 6x2 6 x1, x2 0 Der Bereich M ist die leere Menge, dieses Problem hat keine Lösung, siehe Abbildung 2.5 oben. Beispiel 2.42 Z = x1 + 2x2 max x1 + 2x2 2 x2 4 x1, x2 0 M ist unbeschränkt, die Zielfunktion hat kein endliches Maximum, siehe Abbildung 2.5 unten.
(1) (2)
(2) (1)
Abbildung 2.5
Bemerkung Der Sachverhalt von Beispiel 2.41 enthält Widersprüche in der Aufgabe, im Beispiel 2.42 fehlen bei einer wirtschaftlich sinnvollen Aufgabenstellung weitere Restriktionen.
Rechnerische Lösung linearer Optimierungsprobleme Die Normalform Wird in der Zielfunktion die additive Konstante c0 weggelassen, hat das keinen Einfluss auf die Gesamtheit der optimalen Lösungen. Lediglich bei der Berechnung des Zielfunktionswertes ist diese Konstante wieder zu berücksichtigen. Ein lineares Optimierungsproblem in der Form Zielfunktion Z = cT x max Nebenbedingungen Ax R b mit R {, =} Nichtnegativitätsbedingung x o heißt 2. Normalform des linearen Optimierungsproblems. Jedes lineare Optimierungsproblem kann in die 2. Normalform überführt werden.
L
66
2 Lineare Algebra und Optimierung
Soll das Minimum der Zielfunktion Z = c1 x1 + c2 x2 + ... + cn xn min eines linearen Optimierungspoblems bestimmt werden, ist das der Ermittlung des Maximums der Zielfunktion Z ' = Z = c1 x1 c2 x2 ... cn xn max unter den gleichen Nebenbedingungen äquivalent. Beide Aufgaben besitzen die gleiche Gesamtheit optimaler Lösungen. Lediglich die Minimalbzw. Maximalwerte der Zielfunktionen haben entgegengesetzte Vorzeichen. Eine Minimumaufgabe kann also durch eine Maximumaufgabe ersetzt werden, indem die Zielfunktion mit 1 multipliziert wird. Gibt es unter den Nebenbedingungen -Bedingung, werden sie ebenso mit 1 multipliziert, sodass daraus -Bedingungen werden. Gibt es Variable xj, die der Nichtnegativitätsbedingung xj 0 nicht genügen müssen, werden sie jeweils durch eine Differenz zweier neuer Variablen xj = xj1 xj 2 mit xj1, xj 2 0 ersetzt. Z = cT x max ( A, E ) x = b x o heißt 1. Normalform des linearen Optimierungsproblems.
Ein LOP in der Form
In jeder -Bedingung der Nebenbedingungen wird eine Schlupfvariable eingeführt; in jeder Gleichung wird ebenfalls eine zusätzliche Variable eingeführt, eine sogenannte künstliche oder Sternvariable. Jedes lineare Optimierungsproblem kann in die 1. Normalform überführt werden, bei der das Maximum für die gegebene Zielfunktion Z = c1 x1 + c2 x2 + ... + cn xn + 0 xn + 1 + ... + 0 xn + m max unter den Bedingungen a11 x1 + a12 x2 + ... + a1n xn + xn + 1 = b1 a21 x1 + a22 x2 + ... + a2n xn + xn + 2 = b2 + xn + m = bm am1 x1 + am2 x2 + ... + amn xn mit
xj 0, j = 1, 2, ..., n + m
zu bestimmen ist.
Bei Verwendung der Matrizenschreibweise mit Formatangabe, wenn dabei ( A, E ) die um die Einheitsmatrix E erweiterte Matrix A ist, gilt: 2. Normalform
1. Normalform
Z = cT(1, n) x (n, 1) max A (m, n) x (n, 1) R b (m, 1) x (n, 1) o (n, 1)
Z = cT(1, n + m) · x (n + m, 1) max ( A, E ) (m, n + m) x (n + m, 1) = b (m, 1) x (n + m, 1) o (n + m, 1)
mit R {, =}
2.6 Lineare Optimierung
67
Basisdarstellung Je m linear unabhängige Spaltenvektoren von ( A, E ) bilden eine Basis. Die zu diesen Vektoren gehörigen Variablen heißen Basisvariable (BV), (m - Anzahl der Nebenbedingungen). In der Basisdarstellung (BD) liegt das Gleichungssystem ( A, E ) x = b in kanonischer Form vor, sodass für eine Basis die Basisvariablen (BV) durch die Nichtbasisvariablen (NBV) ausgedrückt sind x B = b‘ A‘ x N. Bemerkung In der 1. Normalform sind die Schlupfvariablen xn + 1, xn + 2, ..., xn + m Basisvariable (die restlichen Variablen sind Nichtbasisvariable ). Eine Basislösung (BL) ergibt sich, wenn in einer Basisdarstellung eines Gleichungssystems alle Nichtbasisvariablen (NBV) gleich null gesetzt werden. Eine Basislösung heißt darüber hinaus zulässige Basislösung (ZBL), wenn alle Basisvariablen nicht negativ sind. Besitzt die zulässige Basislösung eines linearen Optimierungsproblems in der 1. Normalform genau m positive Komponenten, wird sie nicht ausgeartet genannt. Besitzt die ZBL weniger als m positive Komponenten, wird sie ausgeartet genannt. Bemerkung Im Falle einer Ausartung können beim Lösungsprozess Komplikationen auftreten (Zyklenbildung).
2.6.3
Simplexmethode
Mit der Simplexmethode kann ein lineares Optimierungsproblem rechnerisch schrittweise gelöst werden. Dazu wird hier die kombinierte Simplexmethode als Simplexalgorithmus vorgestellt. Voraussetzung ist das Vorliegen des linearen Optimierungsproblems in der 1. Normalform. Die Aufgabe besteht darin, zulässige Basislösungen zu finden, in denen die Zielfunktion ihr Maximum annimmt. Nebenbedingungen in Form von Gleichungen werden in der 1. Normalform mit der M-Methode berücksichtigt. In diese Gleichungen werden künstliche- oder Sternvariable xj* eingeführt, die gemeinsam mit den Schlupfvariablen die Basisvariablen der ersten Basislösung sind. Die ursprünglichen Gleichungen sind nur dann erfüllt, wenn die künstlichen Variablen null sind. Das kann erreicht werden, wenn beim Variablentausch der Basistransformation die künstlichen Variablen von Basisvariablen zu Nichtbasisvariablen werden. In der Zielfunktion erhalten die künstlichen Variablen einen sehr großen negativen Koeffizienten M, M ist sehr groß positiv, M >> 0 .
68
2 Lineare Algebra und Optimierung
Besitzt das lineare Optimierungsproblem eine optimale Lösung, nimmt die Zielfunktion ihr Extremum in mindestens einer zulässigen Basislösung der Menge der zulässigen Lösungen an (Eckpunkt des konvexen Bereiches M). Ist die Menge M der zulässigen Lösungen nicht leer und die Zielfunktion über M nach oben beschränkt (Maximumaufgabe), existiert wenigstens eine optimale Lösung. (Simplextheorem) Das Ausgangsschema enthält mit dem Koordinatenursprung in der Regel nicht die optimale Lösung. Negative g-Werte deuten an, dass noch keine maximale Lösung vorliegt, negative b-Werte zeigen, dass noch keine zulässige Lösung vorliegt. Ein Schema enthält eine optimale Lösung, wenn die Werte sowohl in der g-Zeile als auch in der b-Spalte nichtnegativ sind. Für eine optimale Lösung gilt: g j 0 j und b i 0 i . Zunächst wird über die Simplexmethode (SM), Schritt (1.1) des Algorithmus, versucht, gj 0 zu erreichen. Falls erforderlich, wird anschließend über die duale Simplexmethode (DSM), Schritt (1.2) des Algorithmus, versucht, bi 0 zu erreichen. Ob mehrere optimale Lösungen existieren, ist gegebenenfalls im Schritt (3) zu prüfen. Ist die Menge der zulässigen Lösungen beschränkt, und nimmt die Zielfunktion ihren Optimalwert in mehr als einem Eckpunkt (ZBL) an, ist die Gesamtheit der Optimallösungen eine konvexe Linearkombination aller optimalen Basislösungen: x = t1 x1 + t2 x 2 + ... + tn xn
n
mit ti 1 und t1, t2, ..., tn 0 i 1
Ist das lineare Optimierungsproblem nicht ausgeartet, führt die Simplexmethode nach endlich vielen Schritten zur Optimallösung oder zur Erkenntnis der Unlösbarkeit der Aufgabe. Als Rechenschema wird das verkürzte Schema verwendet, dabei wird auf die Spalten der Basisvariablen mit den Einheitsvektoren verzichtet. In der dadurch freien Spalte der neuen Basisvariablen wird die Spalte der neuen Nichtbasisvariablen positioniert. Es ist somit zu beachten, dass sich die Rechenregeln im Schritt (2) Verkürzte Basistransformation für die Werte in der Hauptspalte (1. Das Hauptelement HE und 3. Die restlichen Elemente der Hauptspalte) gegenüber der ausführlichen Basistransformation (Abschnitt 2.3.4) verändern.
2.6 Lineare Optimierung
69
Ausführliches Schema für die Simplexmethode (einschl. der BV-Spalten) BV x5 x6 x7 Z
x1 a11 a21 a31 c1
x2 a12 a22 a32 c2
x3 a13 a23 a33 c3
x4 a14 a24 a34 c4
x5 1 0 0 0
x6 0 1 0 0
x7 0 0 1 0
b b1 b2 b3
Bemerkung In den Spalten der BV steht immer die Einheitsmatrix E. Im folgenden verkürzten Schema werden diese Spalten der BV weggelassen. Dafür ändern sich die Regeln für die HS einschließlich dem HE. Verkürztes Schema als Ausgangsschema für die kombinierte Methode (die Spalten für die Basisvariablen entfallen, die letzte Nebenbedingung wird beispielhaft als Gleichung angenommen) 1. NBV x1 x2 x3 x4 b c2 c3 c4 0 q BV 1 c1 x5 0 a11 a12 a13 a14 b1 q1 x6 0 a21 a22 a23 a24 b2 q2 x7* M a31 a32 a33 a34 b3 q3 c1 c2 c3 c4 0 g1: g2: g3: g: Z: g a32 a33 4 a34 b3 a31 p p1 p2 p3 p4 Koeffizienten der Zielfunktion Die Koeffizienten in der Zielfunktion sind für Schlupfvariablen null und für künstliche Variablen M ( M ist eine sehr große positive Zahl, M >> 0 ). Berechnung der g-Zeile (1) Die gj und Z ergeben sich aus dem Skalarprodukt der 2. Spalte (NBV) mit den entsprechenden Spalten von A und b. (2) Die -Zeile entfällt, wenn sich unter den Basisvariablen keine -Variablen befinden. Sind -Variable unter den Basisvariablen, so besteht der g-Wert aus einem M-freien und einem M-behafteten Bestandteil. Die Koeffizienten der M-Bestandteile werden in die -Zeile geschrieben und entscheiden somit über Vorzeichen und Größe der g-Werte. z. B.: g1 = c1 a31 M, g2 = c2 a32 M oder Z = 0 b3 M p-Zeile: Die p-Zeile kann zunächst entfallen, sie wird nur bei Anwendung von Schritt (1.2) notwendig. Probe: In den Folgeschemen werden die Werte in der g-Zeile mit der verkürzten Basistransformation im Schritt (2) berechnet, können zur Kontrolle aber auch wieder als Skalarprodukt der 2. Spalte mit der entsprechenden Spalte berechnet werden.
L
70
2 Lineare Algebra und Optimierung
Schritte des Simplexalgorithmus (kombinierte Methode) (1) Bestimmen des Hauptelementes HE (1.1) Auswerten der g-Zeile (SM): Gibt es gj < 0? NEIN: (1.2) JA : Suche min gj = gs , s-Spalte wird HS Bilde für die positiven Elemente der HS und die nichtb negativen Elemente der b-Spalte die Quotienten qi i ais Existieren ein oder mehrere Quotienten qi? NEIN: Sind alle bi 0? NEIN: (1.2) JA : Das LOP hat keine weiteren ZBL. JA : min qi = qr , r-Zeile wird HZ (2) (1.2) Auswerten der b-Spalte (DSM): Gibt es bi < 0? NEIN: Optimale Lösung! Gibt es gj = 0? NEIN: | ENDE | JA : Mehrere opt. Lösungen möglich (3) JA : Suche min bi = br , r-Zeile wird HZ Bilde für die negativen Elemente der HZ arj und die gj nichtnegativen Elemente gj die Quotienten p j arj Existieren ein oder mehrere Quotienten pj ? NEIN: Das LOP hat keine weiteren ZBL. JA : min pj = ps , s-Spalte wird HS (2) (2) Verkürzte Basistransformation 0. Die BV aus der HZ wird mit der NBV aus der HS vertauscht (einschließlich der Koeffizienten der Zielfunktion). Falls eine *-Variable NBV wird, ist die entsprechende Spalte zu streichen. Ist keine *-Variable mehr unter den BV, entfällt die *-Zeile in der g-Zeile. 1 1. Das HE ars wird durch den Kehrwert ersetzt. a rs 2. Die restlichen Elemente der HZ werden durch ars dividiert. 3. Die restlichen Elemente der HS werden durch ars dividiert. 4. Alle übrigen Elemente werden nach folgender Regel ermittelt arj ais aij ars arj ais arj gs g j ars arj gs aij, aij g ,j g j ars ars ars ars
bi, bi 5. (1.1)
br ais bi ars arjbr ars ars
Z, Z
br g s Za rs br g s a rs a rs
2.6 Lineare Optimierung
71
(3) Mehrere optimale Lösungen Die Anzahl der Nullen in der g-Zeile gibt die maximale Anzahl weiterer optimaler Lösungen an. Die Nullen in der g-Zeile bestimmen die HS für die Suche weiterer optimaler Lösungen. Wähle eine Null, die noch nicht gewählt wurde HS. Bilde für die positiven Elemente der HS und die nicht negativen Elemente b der b-Spalte die Quotienten qi i . Existieren ein oder mehrere ais Quotienten qi? NEIN: Das LOP hat keine weiteren optimalen BL JA : min qi = qr, r-Zeile wird HZ (2) Beispiel 2.43 Rechnerische Lösung zum Beispiel 2.38
2. Normalform Z = x1 + 4x2 max
1. Normalform Z = x1 + 4x2 max 4x1 + 8x2 + x3 = 200 5x1 + 4x2 + x4 = 200 5x2 + x5 = 100
4x1 + 8x2 200 5x1 + 4x2 200 5x2 100 x1, x2
1 BV x3 x4 x5
NBV 1 0 0 0 g
x1 1 4 5 0 1
2 BV
NBV 1
x1 1
x3 x4 x2
3 BV x1 x4 x2
0 0 4 g NBV 1 1 0 4 g
x1, x2, x3, x4, x5
0 x2 b 4 0 8 200 4 200 5 100 4 0 x5 0
b 0
4 8/5 5 4/5 0 1/5 1 4/5
40 120 20 80
x3 x5 0 0 1/4 2/5 5/4 6/5 0 1/5 1/4 2/5
b 0 10 70 20 90
q 25 50 20
0
0 x1 = 0
q
10 24 -
0 x2 = 20
q
10 x3 = 20
Die Lösung im dritten Schema ist optimal, weil sowohl die g-Zeile, als auch die b-Spalte nur noch positive Werte enthalten. Der optimale Punkt liegt bei x1 = 10, x2 = 20. Z hat einen maximalen Wert von Zmax = 90.
L
2 Lineare Algebra und Optimierung
72
Beispiel 2.44 Ein Unternehmen produziert drei verschiedene Geräte. Beim Verkauf dieser Geräte erzielt der Unternehmer für das Gerät G1 30 GE, für das Gerät G2 20 GE und für das Gerät G3 50 GE Gewinn. In der Produktionsstätte können höchstens 60 Geräte hergestellt werden. Außerdem muss gesichert werden, dass mindestens 30 Geräte vom Typ G1, sowie von den Typen G1 und G2 zusammen mindestens 40 Geräte hergestellt werden. Wie ist zu produzieren, damit ein größtmöglicher Gewinn erzielt wird? Lösung Modell: xi - Anzahl der Geräte Gi, xi 0, i = 1, 2, 3 Z = 30x1 + 20x2 + 50x3 max x1 + x2 + x3 60 x1 30 x1 + x2 40
1. Normalform Z = 30x1 + 20x2 + 50x3 max x1 + x2 + x3 + x4 = 60 x1 + x5 = 30 x1 x2 + x6 = 40 x1, x2, x3, x4, x5, x6 0
2. Normalform Z = 30x1 + 20x2 + 50x3 max x1 + x2 + x3 60 x1 30 x1 x2 40 x1, x2, x3 0 1 NBV x1 x2 x3
b
BV
1
30
20
50
0
x4 x5 x6
0 0 0 g
1 1 1 30
1 0 1 20
1 0 0 50
60 30 40 0
2
NBV
x1
x2
x4
BV
1
30
20
0
0
x3 x5 x6
50 0 0 g p
1 1 1 0 1 1 20 30 20 30
1 0 0 50 -
60 30 40 3 000 b
q
60 -
0 x1 = 0 0
b
3
NBV
x6
x2
x4
BV
1
0
20
0
0
x3 x5 x1
50 0 30 g
1 1 1 20
0 1 1 10
1 0 0 50
20 10 40 2 200
q
q
0 x2 = 0 60
40 x3 = 0 20
Die Lösung im dritten Schema ist optimal. Es müssen x1 = 40 Geräte vom Typ G1, x2 = 0 Geräte vom Typ G2 und x3 = 20 Geräte vom Typ G3 hergestellt werden. Der Gewinn ist mit Zmax = 2.200 maximal.
2.6 Lineare Optimierung
Lösung Z = 2x1 + x2 max Dieses LOP enthält unter den Nebenbedingungen eine Gleichung, in diese wird eine Sternvariable eingeführt.
Beispiel 2.45 Aufgabe: Z = 2x1 x2 min
2 x1 + 3x2 = 30 x1 6 x2 8 x1, x2
73
0
1. Normalform: Lösungsschema 1 NBV x1
x2
b
Z = 2x1 + x2 M·x3* max M >> 0
1
2
1
0
q
x3* M x4 0 x5 0
2 1 0
3 0 1
30 6 8
10 8
*
2 2
1 3
0 30
2
NBV
x1
x5
b
BV
1
2
0
0
q
x3* M x4 0 x2 1
2 1 0
3 0 1
6 6 8
3 6 -
2 2
1 3
8 6
BV
g
g *
3
NBV
x3*
x5
b
BV
1
M
0
0
x1 x4 x2
2 0 1
1,5 1,5 1
3 3 8
g
2
14
x4
b
0
0
4
NBV
BV
1
x1 x5 x2
2 0 1 g
6 2 6 4 3
=30 2x1 + 3x2 + x3* x1 + x4 = 6 x2 + x5 = 8 x1, x2, x3*, x4, x5 0
0 x1 = 0
0 x2 = 8
Die künstliche Variable x3* ist Nichtbasisvariable geworden, also wird die Spalte gestrichen. 2 Da keine künstliche Variable mehr unter den Basisvariablen ist, ent8 fällt die *-Zeile. 3 x3 = 8
q q
6 x4 = 6
18
6 x4 = ist die optimale Lösung mit Zmin = 18. 6
L
74
2 Lineare Algebra und Optimierung
2.6.4
Dualität in der linearen Optimierung
Die Darlegungen zur Dualität beschränken sich auf lineare Optimierungsprobleme in der 2. Normalform ohne Gleichungen als Nebenbedingungen. Zu jedem LOP in der 2. Normalform
Z = c1 x1 + c2 x2 + ... + cn xn max a11 x1 + a12 x2 + ... + a1n xn b1 a21 x1 + a22 x2 + ... + a2n xn b2
Z( x ) = cT x max Ax b x 0
am1 x1 + am2 x2 + ... + amn xn bm
xj 0, j = 1, 2, ..., n existiert ein duales Problem der Form
W = b1 y1 + b2 y2 + ... + bm ym min a11 y1 + a21 y2 + ... + am1 ym c1 a12 y1 + a22 y2 + ... + am2 ym c2 a1n y1 + a2n y2 + ... + amn ym cn
W( y ) = bT y min AT y c y 0
yi 0, i = 1, 2, ..., m Dabei existieren folgende Zusammenhänge: 1. Aus der primalen Maximumaufgabe wird eine duale Minimumaufgabe. 2. Aus "" in den Nebenbedingungen wird "". 3. Die Komponenten der rechten Seite b werden Koeffizienten der Zielfunktion. 4. Die Koeffizienten der Zielfunktion c werden zu Komponenten der rechten Seite. 5. Die Matrix A wird transponiert. Dualitätssatz Existiert eine beliebige Lösung x des primalen und eine beliebige Lösung y des dualen Problems, dann gilt stets Z(x) W(y), und beide Probleme besitzen eine optimale Lösung. Sind x bzw. y optimale Lösungen des primalen bzw. dualen Problems, so gilt Z ( x ) = W ( y ) und umgekehrt.
2.6 Lineare Optimierung
75
Bemerkung (1) Die Lösung der dualen Aufgabe steht im Simplexschema in der g-Zeile. (2) Mit jedem primalen Problem ist gleichzeitig ein duales gelöst. (3) In der hier behandelten kombinierten Methode sind die Vorteile beim Lösen der primalen und dualen Aufgabe vereint, sodass nicht näher auf die Lösung der dualen Aufgabe eingegangen wird. Zwischen den Variablen des primalen und dualen Problems besteht die folgende Zuordnung:
Primalproblem Strukturvariable
Schlupfvariable
x1
xn + 1 xn + 2 ... xn + m
x2
... xn
ym + 1 ym + 2 ... ym + n
y1
y2
... ym
Schlupfvariable
Strukturvariable Dualproblem
Eine Lösung ist primal zulässig, wenn im Simplexschema alle Werte der b-Spalte nicht negativ sind. Eine Lösung ist dual zulässig, wenn im Simplexschema alle Werte der g-Zeile nicht negativ sind.
Ein Simplexschema liefert eine optimale Lösung, wenn sie sowohl primal als auch dual zulässig ist. Bemerkung Die zu den Schlupfvariablen gehörenden Werte in der g-Zeile des optimalen Schemas werden auch als Schattenpreise bezeichnet. Diese Werte geben die Gewinnsteigerung an, wenn in der Bedingung der entsprechenden Schlupfvariablen die Kapazität (rechte Seite der Bedingung) um eine Einheit erhöht wird.
L
2 Lineare Algebra und Optimierung
76
Beispiel 2.46 Rechnerische Lösung des Beispiels 2.39 primal und dual Primale Aufgabe Duale Aufgabe Z = 10x1 + 12x2 min W = 12 y1 + 24 y2 + 8 y3 max 4x1 + 2x2 12 4y1 + 4y2 10 4x1 + 8x2 24 2y1 + 8y2 + 8y3 12 8x2 8 y1, y2, y3 0 x1, x2 0
1
NBV
BV
1
x3 x4 x5
0 0 0
x1 x2
b
10 12
0
4 2 12 4 8 24 0 8 8
g
10 12
p
2,5 1,5
2
NBV
BV
1
x3
0
x2
12
x5
0
x1 x4
0
3
0
NBV 1
0
x1
10
x2
12
x5
0
y1 y2 y3
b
12 24
8
0
q
0 8
10 12
2,5 1,5
4 2
4 8
12 24 8
0
NBV
BV
1
y4
0
y2
24
y1 y5 y3
b
12
0
0 8 1 3 4 2 1 1 1 4 8
4 3 2
q 4 3
6
16
b
3
0 0
2 q
6
p
BV
y4 y5
g
b
4 1,5 36 4 6 3 x3 x4
1
10
0 1 3 4 1 1 2 8 4 1
NBV
BV
0
g
g
1 q
g
6
3 16
36
0
3
NBV
BV
1
2
y1
12
2
y2
24
q
y4 y5 y3
b
0
0
8
0 4 3 7 6
2
2
8
44
q
8 4 3
Zmax = 44
x x3 = 1 = y3 = x2
7 6
44
Zmin = 44
g Wmax = 44
y 4 2 = ist die optimale Lösung mit Zmin = Wmax = 44 y 5 2
3
Funktionen, Folgen, Reihen
3
Funktionen, Folgen, Reihen
3.1
Begriffe
Durch Funktionen werden Zusammenhänge zwischen verschiedenen mathematischen oder wirtschaftlichen Größen in eindeutiger Weise beschrieben. Beispiel 3.1 Kontostand Der Kontostand hängt unter anderem ab von: (1) der Höhe des Anfangskapitals K0, (2) der Höhe der Ein- und Auszahlungen, p (3) der Größe des Zinssatzes i = , 100 (4) der Zeit. Wird jeweils eine dieser Größen als veränderlich angesehen und sind die restlichen Größen fest vorgegeben (Parameter), so liegt eine Funktion mit einer reellen Variablen vor.
Es seien M1 und M2 nichtleere Mengen. Wenn jedem Element x Df M1 durch eine Vorschrift f genau ein Element y Wf M2 zugeordnet ist, so wird dieses als Funktion y = f (x), f : M1 M2 bezeichnet. Bezeichnungen y abhängige Variable x unabhängige Variable f Abbildungsvorschrift Df Definitionsbereich von f Wf Wertebereich von f Es liegt eine reellwertige Funktion vor, wenn Wf R. Bei reellen Funktionen mit einer reellen Variablen gilt Df R und Wf R. Arten der Vorgabe der Abbildungsvorschrift (1) Verbale Beschreibung f sei die Funktion, die jedem Jahr einer längeren Zeitperiode (1950 bis 2000) das Bruttosozialprodukt eines Landes zuordnet.
(2) Tabellenform Steuertabellen, Preistabellen
(3) Rechenvorschrift K1 = K0 (1 + i ), mit K0 Anfangskapital, i Zinssatz Hierbei gibt es folgende Möglichkeiten: a) K0 veränderlich, i fest: Schreibweise: K1 = K1(K0) < K0 < Definitionsbereich: Wertebereich: < K1 < (negatives Vorzeichen: Kredit; positives Vorzeichen: Guthaben)
R
3 Funktionen, Folgen, Reihen
78
b) i veränderlich, K1 fest: Schreibweise: K1 = K1(i ) Definitionsbereich: i 0 (in der Regel) < K1 < . Wertebereich:
(4) Durch graphische Darstellungen Eine Funktion kann auch unterschiedliche Abbildungsvorschriften für verschiedene Teile ihres Definitionsbereiches besitzen. Ein Beispiel dazu liefern bestimmte Preismodelle mit Rabatt. Beispiel 3.2 Bei einer bestimmten Warenart wird beim Kauf Mengenrabatt gewährt. Werden bis 100 Mengeneinheiten gekauft, beträgt der Preis je Mengeneinheit 50 €, für jede Mengeneinheit darüber hinaus beträgt er 25 €. Welche Funktionen beschreiben den durchschnittlichen Preis je Stück und den Gesamtpreis?
Lösung Der durchschnittliche Preis je Stück p(x) lässt sich durch die folgende Funktion mathematisch in Abhängigkeit von der gekauften Menge x beschreiben:
50 für 0 x 100 p( x ) 2500 25 für 100 x x p(x)
(siehe Abb. 3.1)
P(x) 10000
60
7500 40 5000 20 2500
0
0
50
100
Abbildung 3.1
150
200
250
300 x
0
0
50
100
150
200
250
300 x
Abbildung 3.2
Der Gesamtpreis P(x) wird dagegen durch die folgende Funktion beschrieben: für 0 x 100
50 x P( x ) (siehe Abb. 3.2) 2500 25 x für 100 x
3.2 Eigenschaften
3.2
79
Eigenschaften
Eine Funktion y = f (x), xDf, heißt auf der Menge MDf beschränkt, wenn es eine endliche Konstante c derart gibt, sodass f (x) c, d. h. c f (x) c, für alle x M gilt. Dabei wird c eine Schranke von f auf M genannt. Eine Funktion f (x), x Df, heißt auf der Menge M Df nach unten bzw. nach oben beschränkt, wenn es endliche Konstanten c1 bzw. c2 gibt, sodass c1 f ( x) für alle x M gilt. c 2 f ( x)
R
Eine Funktion y = f (x), x Df, heißt in dem Intervall I Df monoton wachsend, wenn f (x1) f (x2) für alle x1, x2 I mit x1 < x2 gilt. Entsprechend wird sie monoton fallend in I genannt, wenn f (x1) f (x2) für alle x1, x2 I mit x1 < x2 gilt. Bemerkung Tritt die Gleichheit nicht ein, so wird f streng monoton wachsend bzw. fallend genannt. Eine Funktion y = f (x), x Df, heißt im Intervall I Df konvex, wenn für alle x1, x2 I die Ungleichung y x x 1 f 1 2 f x1 f x2 20 2 2 gilt. 15 Entsprechend wird sie in I konkav Konkav genannt, wenn 10 x x 1 Konvex f 1 2 f x1 f x2 2 2 5 gilt. Der Übergangspunkt wird als 0 Wendepunkt bezeichnet. -3 -2 -1 0 1 2 (siehe Abb. 3.3).
Abbildung 3.3
Eine Funktion y = f (x), x Df, heißt im Intervall I = (a, a) Df mit a > 0 gerade, wenn f (x) = f (x) gilt, ungerade dagegen heißt sie falls f (x) = f (x) gilt.
3 x
80
3 Funktionen, Folgen, Reihen
3.3
Umkehrfunktion
Eine Funktion y = f(x), f: Df Wf heißt injektiv oder umkehrbar, genau dann, wenn es zu jedem yWf höchstens ein xDf mit y = f (x) gibt. Die entsprechende Zuordnung f 1: Wf Df wird als inverse Funktion oder Umkehrfunktion bezeichnet. Bemerkung Wird die Bezeichnung der Variablen vertauscht, so ist der Graph der Umkehrfunktion y = f 1(x) das Spiegelbild der Funktion f ( x) an der Geraden y = x. Dabei gilt: D f W f 1 und W f D f 1 . Konstruktion einer Umkehrfunktion (1) Auflösen der Gleichung y = f (x) nach x: x = f 1( y) (2) Tauschen der Bezeichnungen x und y (falls erforderlich) Eine Funktion f (x), x Df, ist in I Df umkehrbar, wenn sie in I streng monoton wachsend oder streng monoton fallend ist.
Beispiel 3.3
50 für 0 x 100 (1) p( x ) 25 für 100 x
Diese Funktion ist nicht umkehrbar, da sie nicht streng monoton ist.
50 x (2) P ( x ) 2500 25 x
für
0 x 100
für 100 x
Die Umkehrung dieser Funktion erfolgt zunächst im Bereich 0 < x 100. P Hier gilt P(x) = 50 x, aufgelöst nach x ergibt sich: x (P ) . 50 Ist dagegen x > 100, gilt P(x) = 2500 + 25 x. Das Umstellen nach x liefert P x (P ) 100. 25 Damit kann die Umkehrfunktion in folgender Weise geschrieben werden:
P für 0 P 5000 x (P ) 50 P 100 für 5000 P 25 Diese Funktion gibt an, welche Menge x für einen Gesamtpreis P erworben werden kann.
3.4 Verknüpfungen und Verkettungen
3.4
81
Verknüpfungen und Verkettungen
Sind f und g zwei reellwertige Funktionen mit den Definitionsbereichen Df bzw. Dg und ist Df Dg , so ist ihre Summe, ihr Produkt und ihr Quotient punktweise erklärt: (f g) (x) = f (x) g(x) für x Df Dg (f g) (x) = f (x) g(x) für x Df Dg f f ( x) für x Df ! x Dg ; g(x) 0 " x g( x) g Bemerkung (1) Polynome sind Funktionen, die sich aus Konstanten und der Funktion y = x mit den Verknüpfungen Addition und Multiplikation erzeugen lassen (siehe auch Abschnitt 1.8): z. B.: P(x) = 1 + 3x + 4x2 + x3 x4 (2) Rationale Funktionen werden aus Konstanten und der Funktion y = x mittels Addition, Multiplikation und Division erzeugt. z. B.: R( x )
1 x 2 1 x 2
, x 1, x 1.
Beispiel 3.4 Ein Artikel wird mit fixen Kosten von 180 € und variablen Kosten von 40 € je Stück produziert. Der Verkaufspreis beträgt 80 € je Stück. Dann lauten die Gleichungen - der Kostenfunktion K(x) = 180 + 40 x, - der Erlösfunktion E(x) = 80 x - der Gewinnfunktion G(x) = E(x) K(x) = 40 x 180 - der Durchschnittskostenfunktion (Stückkostenfunktion) K ( x ) 180 k( x ) 40 x x als Funktion der Ausbringmenge (des Outputs) x.
Es seien y = f (x), x Df, und y = g(x), xDg, zwei beliebige Funktionen. Wenn dabei WgDf gilt, dann kann eine neue Funktion y = f (g (x)), xDg, gebildet werden, sie wird mittelbare oder verkettete Funktion genannt. Die Funktion f heißt äußere Funktion und die Funktion g innere Funktion.
R
3 Funktionen, Folgen, Reihen
82
Beispiel 3.5 x 2 Gegeben sind die Funktionen f (x) = e , x Df = R, und g(x) = x , x Dg = R. 2
Durch f (g ( x )) e x entsteht eine verkettete oder mittelbare Funktion.
Wird eine Funktion mit ihrer Umkehrfunktion verkettet, so ergibt sich die identische Funktion y = x. Beispiel 3.6 2 Gegeben ist die Funktion y = f (x) = x , x R. Diese Funktion ist für x 0
umkehrbar, die inverse Funktion lautet y f 1( x ) Dann ist für x 0: f ( f 1( x ))
3.5
x
2
x, x 0 .
x.
Grundfunktionen einer reellen Variablen
(1) Lineare Funktion Lineare Funktionen haben die Normalform y = ax + b, Df = R , Wf R. (2) Potenzfunktionen, Wurzelfunktionen Standardform: y = xn, x Df Definitionsbereich und Wertebereich hängen von n ab: f nN
Df
y = xn
(, )
Wf (, ), [0, ),
Bemerkung n ungerade n gerade
Parabel (s. Abb. 3.4)
n N y = xn (, )\{0} (, )\{0}, n ungerade (0, ), n gerade
Hyperbel (s. Abb. 3.5)
1
nN
y xn
[0, )
[0, )
x n
# R y = x#
Wurzelfunktion (s. Abb. 3.6)
(0, )
(0, )
allgemeine Potenzfunktion
Bemerkung Die Umkehrfunktion einer Potenzfunktion ist wieder eine Potenzfunktion.
3.5 Grundfunktionen einer reellen Variablen
y
y
2
-2
4
x
x
x 1
-1 x
3
0
83
1
x
-1
-1
x
1 0 -1 -1
y -2
1/2
x
y=x 1
-1
x
x
1
-1
0
x
1
-1 1/3
y=x
Abbildung 3.4
Abbildung 3.5
R
Abbildung 3.6
(3) Exponential- und Logarithmusfunktionen Exponentialfunktion (siehe Abb. 3.7) allgemein y = ax, x R, a > 0, a 1,
y = 10
5 x
D = (, ), W = (0, )
speziell y = 10x a = 10 a=e y = ex, e = 2,71828... (EULERsche Zahl)
x
y 6
y = 0,5
4
x
y=e
3 2 1 -2
0
-1
0
2 x
1
Abbildung 3.7
Logarithmusfunktion (Umkehrfunktion der Exponentialfunktion) (siehe Abb. 3.8) y allgemein 2 y = ln x y = loga x, x > 0, a > 0, a 1, 1
D = (0, ), W = ( , )
y = lg x 0
speziell a = 10 y = lg(x) dekadischer Logarithmus a=e y = ln(x) natürlicher Logarithmus
0
1
2
3
4
5
6x
-1 -2
Abbildung 3.8 Beispiel 3.7 Wird zu einem bestimmten Zeitpunkt ein Kapital K auf einer Bank angelegt und mit einem Zinssatz i jährlich verzinst, so wächst dieses Kapital nach n n Jahren auf Kn = (1 + i ) ·K0. Dieses ist eine Exponentialfunktion mit der folgenden Zuordnung: y = Kn, K0 = konstant, a = 1 + i, x = n. Wird die An-
84
3 Funktionen, Folgen, Reihen
zahl der Jahre gesucht, nach denen bei einem festen Zinssatz i aus einem Kapital K0 ein Kapital Kn wird, so wird die Logarithmusfunktion benötigt: lg K n lg K 0 . n lg(1 i )
(4) Trigonometrische Funktionen (Winkelfunktionen) (siehe Abbildungen 3.9 - 3.10) Funktion Definitionsbereich sin x cos x tan x cot x
Wertebereich Periode
(, ) (, ) (, )\{$/2 + k$} (, )\{k$}
[1, 1] [1, 1] (, ) (, )
2$ 2$ $ $
y cos x
kZ kZ
y 8
1
sin x
cot x
4 - $/2 -$ -3.14 -1.57
0
0
$/2 1.57
$ 3.14
x
-$ -3.14
-$/2 -1.57
0
0
tan x $/2 1.57
$ 3.14 x
-4 -1
Abbildung 3.9
3.6
-8
Abbildung 3.10
Zahlenfolgen
Wird jeder natürlichen Zahl k genau eine Zahl ak R zugeordnet, so bilden die Zahlen a1, a2, a3, a4, ... eine Zahlenfolge. Dabei wird a1 das erste, a2 das zweite usw. sowie ak das allgemeine (k-te) Glied der Zahlenfolge genannt. Darstellung:
{ak}, ak = f (k), ak = g(ak 1),
k = 1, 2, ... Aufzählung k = 1, 2, ... unabhängige Darstellung k = 2, 3, ... rekursive Darstellung
Beispiel 3.8 Folgende drei Darstellungen repräsentieren die gleiche Zahlenfolge (1) {ak} = {2, 2, 2, 2, ...} k+1 (2) ak = 2 ( 1) , k = 1, 2, ... (3) ak = ak 1, a1 = 2, k = 2, 3, ...
3.6 Zahlenfolgen
85
Bemerkung Zahlenfolgen sind eindeutige Abbildungen (Funktionen) aus der Menge der natürlichen Zahlen N in die Menge der reellen Zahlen R. Deshalb können für sie die bei Funktionen eingeführten Begriffe (Monotonie, Schranken usw.) genutzt werden. Eine Zahlenfolge {ak} heißt eine + (1) konstante Folge, wenn für alle k N ak = a1, + (2) arithmetische Folge, wenn für alle k N ak = a1 + (k 1) · d (3) geometrische Folge, wenn für alle k N+ ak = a1 · q k 1 gilt.
Bei einer arithmetischen Zahlenfolge ist die Differenz benachbarter Glieder konstant, es gilt ak 1 ak d . Bei einer geometrischen Zahlenfolge ist der Quotient benachbarter a Glieder konstant, d. h. k 1 q. ak Beispiel 3.9 (1) 2, 5, 8, 11, ... ist eine arithmetische Folge mit a1 = 2 und d = 3. (2) 2, 4, 8, 16, ... ist eine geometrische Folge mit a1 = 2 und q = 2.
Eine Zahlenfolge heißt alternierend, wenn benachbarte Glieder entgegengesetzte Vorzeichen haben, d. h. ak 1 a k 0 % k. Beispiel 3.10 Die Folge 1, 2 , 4, 8, ... ist eine alternierende Zahlenfolge.
Eine endliche Zahl a heißt Grenzwert der Zahlenfolge {ak}, wenn es zu jedem & > 0 eine natürliche Zahl N(&) derart gibt, dass 'ak a' < & für alle k N(&) gilt. Existiert eine solche Zahl a, so wird die Folge konvergent genannt, andernfalls heißt sie divergent. Schreibweise: lim a k a oder ak a, für k . k
R
3 Funktionen, Folgen, Reihen
86
Jede Zahlenfolge, die gegen den Grenzwert null konvergiert, heißt Nullfolge. Wichtige Grenzwerte für Zahlenfolgen 1 (1) lim 0 k k
0 für a 1 (2) lim a k 1 für a 1 k divergent für a ( 1 oder a 1 k
1 (3) lim 1 e 2,71828... (EULERsche Zahl) k k
ak 0 k k !
(4) lim
Die beiden Zahlenfolgen {ak} bzw. {bk} seien konvergent gegen den lim a k a lim bk b . Grenzwert a bzw. b, d. h. k
Dann gilt: (1) lim (a k k
(2)
(3)
bk ) lim a k
k
lim bk a b
k
k
lim (a k bk ) lim a k lim bk a b
k
k
k
ak a a k klim , k bk lim bk b lim
bk, b 0.
k
3.7
Reihen
Es sei {ak } eine beliebige Zahlenfolge, dann wird die Zahlenfolge n
{sn}, sn ) a k , endliche Reihe genannt. k 1
(sn Teilsumme, Partialsumme) (ak Glieder der Reihe)
3.7 Reihen
87
Spezielle Reihen (1) Arithmetische Reihe Die Glieder einer arithmetischen Folge werden summiert. ak = a1 + (k 1) d , k N+ n 1 n d ) a1 a n 2 2
n
sn ) a k n ( a1 k 1
speziell gilt für a1 = 1, d = 1: sn
R
n(n 1) 2
Beispiel 3.11
2 4 6 8 100
50
) 2 k 50 2
k 1
50 1 2 2550 2
(2) Geometrische Reihe Die Glieder einer geometrischen Folge werden summiert.
ak = a1 q k 1, k N+ n
sn ) a1 q
k 1
k 1
1 qn a1 , q 1 1 q n a , q 1 1
Unendliche Reihen Es sei {ak } eine beliebige Zahlenfolge, dann wird
n
) ak n
s ) a k lim k 1
unendliche Reihe genannt.
k 1
Eine unendliche Reihe heißt konvergent, wenn die Zahlenfolge {sn} ihrer Teilsummen konvergiert. Liegt keine Konvergenz vor, wird die Reihe divergent genannt. Der Grenzwert s der konvergenten Folge {sn}, heißt dann Summe
der unendlichen Reihe mit der Darstellung
) ak
k 1
Grenzwert der geometrischen Reihe lim sn
n
a
) a1 q k 1 1 1q , für
k 1
q 1
s.
3 Funktionen, Folgen, Reihen
88
Beispiel 3.12: 1
1 1 1 1 ) 2 4 8 k 1 2
k 1
1 2 1 3 1 2
Besteht eine Reihe nur aus positiven Gliedern, wird sie positive Reihe genannt. Eine alternierende Reihe ist eine Reihe, deren Glieder eine alternierende Zahlenfolge bilden. n
Die Reihe
1
)k
wird als harmonische Reihe bezeichnet.
k 1
Bemerkung Die harmonische Reihe ist divergent (nicht konvergent). Konvergenzkriterien für unendliche Reihen LEIBNIZ-Kriterium Wenn die Beträge einer alternierenden Reihe monoton fallen und gegen null konvergieren, d. h., wenn |ak| > |ak + 1|, k = 1, 2, ..., und lim a k 0 gilt, dann konvergiert die alternierende Reihe. k
Quotientenkriterium Wenn es für eine positive Reihe eine nichtnegative Zahl q < 1 derart a gibt, dass lim k 1 q 1 gilt, dann konvergiert die Reihe. k a k Gibt es dagegen ein q > 1 mit lim
k
a k 1 q ( 1, so divergiert die ak
Reihe, d. h., sie ist nicht konvergent. Beispiel 3.13
ak ist im Intervall 1 a < 1 auf Konvergenz zu untersuchen. k 1 k
)
Lösung (1) Für 1 a < 0 liegt eine alternierende Reihe vor, bei der die Beträge ihrer Glieder streng monoton fallen und die den Grenzwert null hat. Nach dem LEIBNIZ-Kriterium ist diese Reihe somit konvergent. (2) Für a = 0 ist der Grenzwert null und damit die Reihe konvergent. (3) Im Fall 0 < a < 1 gilt nach dem Quotientenkriterium a k 1 k
k lim a a 1. (Konvergenz) (k 1) a k k k 1 Konvergenz liegt im Intervall 1 a < 1 vor. lim
k
4 Grundzüge der Finanzmathematik
4
Grundzüge der Finanzmathematik
4.1
Einfache Verzinsung
Bezeichnungen K0 das Anfangskapital B der Barwert Kn das Endkapital nach n Zinsperioden, Endwert n die Anzahl der Zinsperioden p der vereinbarte Zinssatz in % (Zinsfuß) p i der vereinbarte Zinssatz je 1 €, i 100 q Aufzinsfaktor q = 1 + i Z die entstehenden Zinsen
F
Für die entstehenden Zinsen bei einem Anfangskapital K0 bei einfacher Verzinsung mit dem Zinssatz i gilt für eine Zinsperiode Z i K 0 . Das Kapital beträgt dann nach der ersten Zinsperiode K1 K 0 Z , also K1 K 0 i K 0 K 0 (1 i ) . Für n Zinsperioden gilt für das Endkapital K n K 0 Z
mit den
Zinsen Z n i K 0 , also Kn = K0 (1 + n i ). Die Abbildung 4.1 zeigt die Kapitalentwicklung für verschiedene Zinssätze. p = 15
4
Kapital nach n Perioden
p = 12 3
p=9 p=6
2
p=3 1
0
0
Abbildung 4.1
5
10 Anzahl der Perioden
15
20
4 Grundzüge der Finanzmathematik
90
Zur Berechnung des Kapitals KT nach T Zinstagen und einem Jahreszinssatz i gilt die folgende Formel: T T K T 1 i K 0 , mit n 360 360 Bemerkung Es wird hier mit 12 Monaten zu je 30 Tagen, d. h., mit insgesamt 360 Tagen gerechnet. Die Anzahl der Zinstage T wird nach der folgenden Formel ermittelt. T = (m2 m1)30 + t2 t1 Hierbei bedeuten: t1, m1 Tag und Monat des ersten Termins t2, m2 Tag und Monat des zweiten Termins Einen Überblick über weitere Zinsmethoden liefert Tafel 4 (s. Anhang). Der Betrag K0, der aufgebracht werden muss, um nach n Zinsperioden bzw. T Zinstagen den Endwert (das Endkapital) Kn zu erreichen, wird als Barwert B bezeichnet. B = K0
Kn 1 i n
B = K0
KT 1 i
T 360
Daraus können auch i i
1 Kn
1 n K0
i
360 KT
1 T K0
und n bzw. T berechnet werden: n
1 Kn
1 i K0
T
360 KT
1 i K0
Zinsen bei regelmäßiger Zahlung Im Finanzwesen wird zwischen der vorschüssigen (zu Beginn der Periode - pränumerando) und der nachschüssigen (am Ende der Periode postnumerando) Zahlungsweise unterschieden. Dieses hat Einfluss auf die Verzinsung. Zinsperioden können in m Unterperioden unterteilt werden. Unterperioden eines Jahres können beispielsweise sein: Halbjahr (m = 2), Quartal (m = 4), Monat (m = 12).
4.1 Einfache Verzinsung
91
Bei einfacher Verzinsung mit dem Zinssatz i, einer Einteilung in m Unterperioden und konstanter Zahlung C in jeder Unterperiode beträgt das Kapital Sm nach der m-ten Unterperiode vorschüssig: nachschüssig: m 1 S m( N ) C m i 2
m 1 S m(V ) C m i 2
Beispiel 4.1 Ab Jahresanfang werden zu Beginn jeden Monats jeweils 300 € auf ein Konto eingezahlt, das mit 4,5 % jährlich verzinst wird. Wie hoch ist der Kontostand nach Ablauf eines Jahres? Lösung p = 4,5 %, damit i = 0,045, C = 300 €, m = 12, vorschüssig 13 (V ) S12 300 (12 0,045 ) 3 687,75 € 2 Der Kontostand beträgt nach Ablauf eines Jahres 3 687,75 €.
Bestimmung von Tageszinsen Es ist günstig, folgende Hilfsgrößen zu verwenden. Zinszahl: ZZ
T K0 100
Zinsteiler: ZT
360 p
Zinsen ZT nach T Tagen = Zinszahl/Zinsteiler: ZT
ZZ ZT
Beispiel 4.2 Ein Betrag von 500 € wird 60 Tage, ein Betrag von 800 € wird 76 Tage und ein Betrag von 1 000 € wird 25 Tage lang auf einem Guthaben verzinst. Wie hoch sind die Zinserträge, wenn der jährliche Zinssatz 5 % beträgt? Lösung 1. Berechnung der Zinszahlen Betrag in € 500 Dauer in Tagen 60 Zinszahl ZZ 50060/100 = 300
800 76 80076/100 = 608
2. Berechnung des Zinsteilers 3. Berechnung der Zinsen
ZT = 360/5 = 72 Z = 1158/72 = 16,08 €
1 000 25 1 00025/100 = 250
Summe ZZ 1 158
Bestimmung von Zinsen bei Kontobewegungen 1. Staffelmethode Bei der Anwendung der Staffelmethode wird bei jeder Kontobewegung eine Zinszahl für die Periode zwischen den letzten Bewegungen berechnet. Zur Bestimmung der Zinszahlen werden dann die Zinszahlen addiert und durch den Zinsteiler dividiert.
F
92
4 Grundzüge der Finanzmathematik
2. Progressive Zinsmethode Bei der progressiven Zinsmethode werden bei jeder Kontobewegung die zu erwartenden Zinsen bis zum Jahresende bei einer Einzahlung positiv und bei einer Abbuchung negativ (nicht realisierte Zinsen) berechnet. Die Summe ergibt die Zinsen insgesamt. Beispiel 4.3 Auf einem Sparbuch, das jährlich mit p = 2 % verzinst wird, erfolgten folgende Kontobewegungen: 31.12. Kontostand 3 000 € 22.01. Einzahlung 1 400 € 15.03. Auszahlung 2 000 € 30.06. Kontoauflösung Es sind die Zinsen zu berechnen. Lösung nach der Staffelmethode Datum Saldo 31.12. 3 000 22.01 4 400 15.03. 2 400 30.06.
Tage 22 53 105 Summe:
Zinszahl 660 2 332 2 520 5 512
Zinsteiler : ZT = 360/p = 360/2 = 180 Zinsen: Z = 5512/180 = 30,62 Damit betragen die Zinsen zum 30.06: 30,62 €. Lösung nach der progressiven Zinsmethode Datum Betrag Tage 360 31.12. 3 000 22.01. 1 400 338 15.03. 285 2 000
30.06. 180 2 400
Summe:
4.2
Zinsen 60,00 26,29
31,67
24,00 30,62
Zinseszinsen
Im Unterschied zur einfachen Verzinsung werden bei der Zinseszinsrechnung die Zinsen nach Abschluss einer Zinsperiode (in der Regel ein Jahr) mitverzinst (siehe Abbildung 4.2). Dieses Vorgehen wird als Aufzinsung bezeichnet. Aufzinsung Wird ein Kapital K0 mit einem Zinssatz i verzinst und die Zinsen nach Ablauf der Zinsperiode mitverzinst, so berechnet sich das Endkapital (der Endwert) Kn nach n Zinsperioden, auf folgende Weise: K n (1 i ) n K 0 q n K 0
(LEIBNIZsche Zinseszinsformel)
Hierbei wird q = 1+ i als Aufzinsfaktor bezeichnet.
(L1)
4.2 Zinseszinsen
93
20
p = 15
Kapital nach n Perioden
15
10
p = 12
p=9
5
p=6 p=3 0 0
5
10
15
20
Anzahl der Perioden n
Abbildung 4.2
Sind die Laufzeit n, der Endwert Kn und der Barwert K0 gegeben, so lassen sich durch Umstellen der Formel (L1) der Zinsfaktor q und der Zinssatz p bzw. i berechnen. q 1 i n
Kn , K0
in
Kn p
1, i K0 100
Sind andererseits der Zinssatz p bzw. i, der Barwert K0 und der Endwert Kn bekannt, lässt sich auch die Laufzeit n herleiten. n
log Kn log K0 p , i log(1 i ) 100
F
4 Grundzüge der Finanzmathematik
94
Abzinsung Der Barwert oder diskontierte Wert, d. h. der Wert, den das Kapital K0 haben muss, um bei einer Anlage auf Zinseszins nach n Perioden den Wert Kn zu erreichen, wird mit der folgenden Formel berechnet: B = K0
Kn (1 i ) n
Kn qn
Beispiel 4.4 Nach 10 Jahren soll ein Guthaben 15 000 € betragen. Welcher einmalige Geldbetrag ist bei einer Verzinsung von 7 % p.a. (Zinseszins) einzuzahlen? Lösung K 15 000 B K 0 nn 7 625,24 €. 1,0710 q
Zahlungen bei unterschiedlichen Terminen Unter Annahme eines konstanten Zinssatzes i können Zahlungen, die zu unterschiedlichen Terminen erfolgen, verglichen werden. Es sind zu einem festen Zeitpunkt die jeweiligen Zeitwerte zu berechnen. Dabei kann der betrachtete Termin t Zeitperioden vor oder nach dem Endwerttermin Kn liegen (siehe Abbildung 4.3). Der Zeitwert Kn + t ergibt sich für t vom Endtermin abweichende Zinsperioden: K n t K 0 (1 i ) n t K n (1 i ) t t = Anzahl der abweichenden Zinsperioden K0 0
1
Kn t
Kn
n t
n
Kn + t n+t
Zeit
Abbildung 4.3 Beispiel 4.5 Für eine Zahlung bestehen zwei Alternativen: Entweder sind je 3 000 € in 6 Jahresraten vorschüssig zu zahlen oder nach 3 Jahren ein einmaliger Betrag von 18 000 €. Dabei wird ein Zinssatz von 5 % zugrunde gelegt. Um beide Zahlungen zu vergleichen, wird der Endwert der ersten Alternative berechnet und dieser auf das dritte Jahr zurückgerechnet (mit Anwendung der Formel V1): , 6 1 105
3 , 21 426,03 K 3 K 6 105 , 18 508,61 105 0,05 Es muss für die erste Alternative mehr Kapital aufgebracht werden. K 6 3 000
4.2 Zinseszinsen
95
Unterjährliche Verzinsung Das Zinsjahr werde in m Unterperioden unterteilt. Bezeichnungen
i Jahreszinssatz irel Zinssatz für eine Unterperiode
Der Zinssatz für eine Unterperiode irel wird als relativer Zinssatz bezeichnet. Der nominelle Zinssatz i ist genau derjenige, der bezogen auf das Jahr bei der einfachen Zinsrechnung dem relativen Zinssatz entspricht: i = m irel
bzw.
irel
i m
Als konformer Zinssatz ikon wird der Zinssatz bezeichnet, der bezogen auf das Jahr dem relativen Zinssatz bei reiner (unterperiodischer) Zinseszinsrechnung entspricht: m
ikon = (1 + irel) m 1
bzw.
i ikon = 1 1 m
Der konforme Zinssatz wird oft auch als effektiver Jahreszinssatz bezeichnet. Beispiel 4.6 Für eine Zahlungsverpflichtung wurde eine monatliche Verzinsung (m =12) mit einem Jahreszinssatz von 9% vereinbart. Der relative Zinssatz beträgt 0,09 somit irel = 0,0075 ( je Monat ). Dann beträgt der effektive oder kon12 forme Zinssatz ikon = 1 0,0075 1 0,0938, d. h., 9,38 %. Damit entspricht eine monatliche Verzinsung mit einem Zinssatz von 0,75% je Monat einer jährlichen Verzinsung von 9,38 % p.a.. 12
Die Berechnung des Kapitals bei unterjährlicher Verzinsung erfolgt nach der folgenden Formel (n Anzahl der Perion m i den, m Anzahl der Unterperioden): Kn K0 1 m Stetige Verzinsung Wird das Jahr in unendlich viele Unterperioden unterteilt, das ist der Grenzfall m , und wird in jeder dieser Unterperioden gemäß der Zinseszinsrechnung verzinst, so wird dieses als stetige Verzinsung bezeichnet. Das Kapital nach n Jahren ist dann: K n K0 e in (siehe Abschnitt 5.4.3):
F
96
4 Grundzüge der Finanzmathematik
Beispiel 4.7 Ein Kapital von 1 000 € wird 5 Jahre und 9 Monate zu einem nominellen Zinssatz von 4 % p.a. angelegt. Wie hoch ist das Endkapital (1) bei gemischter Verzinsung (jährliche Zinsgutschrift), (2) bei vierteljährlicher Zinsgutschrift, (3) bei monatlicher Zinsgutschrift, (4) bei kontinuierlicher Verzinsung? Lösung Bei dem Problem (1) ist zu berücksichtigen, dass 5 Jahre die Zinseszinsrechnung und 9 Monate die einfache Zinsrechnung angewandt werden muss. 9 0,04 ) 1 253,15 (1) K 5,75 1 000 (1 0,04 ) 5 (1 12 0,04 (2) K 5,75 1 000 1 4 0,04 (3) K 5,75 1 000 1 12
5,75 4
1 257,16 5,7512
1 258,12
(4) K 5,75 1 000 e 0,04 5,75 1 258,60
4.3
Rentenrechnung
Rentenendwert Eine Rente ist eine feste Zahlung E, die zu bestimmten Zeitpunkten (in der Regel am Anfang oder Ende einer Zinsperiode oder Unterperiode) geleistet wird. Der Rentenendwert Rn stellt den Gesamtbetrag aller Zahlungen einschließlich Zinsen nach n Perioden mit K0 = 0 dar. Es gilt mit q = 1 + i (Aufzinsfaktor): (1) Zinsperiode = Zahlungsperiode, konstante Einzahlung E vorschüssig: nachschüssig: Rn(V )
qn 1 qE q 1
(V1)
Rn( N )
qn 1 E q 1
(N1)
Beispiel 4.8 Ein Rentenbeitrag von 4 000 €/Jahr wird 20 Jahre lang a) zu Beginn eines jeden Jahres, b) am Ende eines jeden Jahres geleistet. Wie hoch ist der Rentenendwert nach 20 Jahren, wenn ein Zinssatz von 6 % p.a. vorausgesetzt wird? Lösung p = 6, E = 4 000, q = 1 + i, i =
p = 0,06, n = 20 100
4.3 Rentenrechnung
97
1,06 20 1 1,06 4 000 155 970,91 1,06 1 Bei vorschüssiger Zahlungsweise beträgt der Rentenendwert 155 970,91 €. 1,06 20 1 (N ) b) R 20 4 000 147 142,36 1,06 1 Bei nachschüssiger Zahlungsweise beträgt der Rentenendwert dagegen 147 142,36 €.
(V ) a) R 20
(2) Zinsperiode > Zahlungsperiode, konstante Einzahlung C vorschüssig: (V2) nachschüssig: (N2) Rn(V )
q n 1 m 1 (m i )C q 1 2
Rn( N )
qn 1 m 1 (m i )C q 1 2
Die Einzahlung E wird hier durch die entsprechende Formel für die einfache Zinsrechnung ersetzt (vgl. Abschnitt 4.2). Zu beachten ist, dass dieser Betrag erst am Ende des Jahres entsteht und somit von der Formel (N1) auszugehen ist. Beispiel 4.9 Wird eine Rente von 600 € ab Januar am Anfang (Ende) eines jeden Monats 10 Jahre lang bezahlt und wird das Kapital jährlich zu 6 % verzinst (Zinseszins), so ergeben sich wegen C = 600, n =10, i = 0,06 folgende Rentenendwerte a) vorschüssig:
(V ) R10
1,0610 1 (12 0,06 6,5) 600 97 986,03 € 0,06
b) nachschüssig:
(N ) R10
1,06 10 1 (12 0,06 5,5) 600 97 511,52 € 0,06
Barwert einer Rente Als Barwert einer Rente wird der Betrag B bezeichnet, der zu Beginn aufgebracht werden müsste, um n Perioden lang eine Rente E zu erhalten. Der Barwert kann aus den Formeln (V1) und (N1) bzw. (V2) und (N2) berechnet werden, indem durch qn dividiert wird: (1) Zinsperiode = Zahlungsperiode, konstante Einzahlung E vorschüssig: nachschüssig: B (V )
q n 1 E q n 1 i
B(N )
q n 1 E qn i
F
4 Grundzüge der Finanzmathematik
98
(2) Zinsperiode > Zahlungsperiode, konstante Einzahlung C vorschüssig: nachschüssig: B (V )
q n 1 m 1 m i C n 2 q i
B(N )
qn 1 m 1 m i C n 2 q i
Beispiel 4.10 Welcher einmalige Betrag muss eingezahlt werden, um 10 Jahre lang einen monatlichen Rentenbetrag von 600 € zu erhalten, wenn ein Zinssatz von 6 % p.a. zugrunde gelegt wird und im Januar mit der Zahlung begonnen werden soll? Lösung: Gesucht ist der Barwert. 1,06 10 1 B (V ) (vorschüssig) (12 0,06 6,5) 600 54 714,89 € 1,06 10 0,06 B (N )
1,0610 1 1,0610 0,06
(12 0,06 5,5) 600 54 449,92 €
(nachschüssig)
Raten-Renten-Formeln (Sparkassenformeln) Es sei ein Anfangskapital K0 gegeben, das in jeder Zinsperiode (Monat, Quartal, Jahr usw.) um einen gleich bleibenden Betrag E erhöht oder verringert wird. Dann beträgt das Kapital Kn nach n Zinsperioden: vorschüssig: (V3) K n(V ) q n K 0
nachschüssig: (N3) q n 1 qE q 1
K n( N ) q n K 0
q n 1 E q 1
Beispiel 4.11 Ein Betrag von 5 000 € wird zu einem Zinssatz von 6,5 % p.a. angelegt. Eine Einzahlung von 200 € wird jeweils (1) am Ende (2) am Anfang jeden Jahres geleistet. Welcher Endbetrag steht nach 10 Jahren zur Verfügung (Zinseszins)? Lösung K0 = 5 000, i = 0,065, n = 10, E = 200, q = 1 + i = 1,065 (1) nachschüssige Zahlungsweise: 1,06510 1 qn 1 E 1,06510 5 000 200 12 084,57 € K n( N ) q n K 0 0,065 q 1 (2) vorschüssige Zahlungsweise: 1,06510 1 qn 1 q E 1,06510 5 000 1,065 200 12 260,00 0,065 q 1 Das Kapital ist nach 10 Jahren auf 12 260 € angewachsen. K n(V ) q n K 0
4.4 Tilgungsrechnung
99
Liegt der Fall einer gemischten Verzinsung vor, d. h., wird eine Periode noch in m weitere Unterperioden unterteilt (z. B.: ein Jahr in Monate oder Quartale), in denen nur einfache Verzinsung erfolgt, so gilt: bei vorschüssiger Zahlungsweise K n(V ) q n K 0
qn 1 m 1 m i C 2 q 1
bei nachschüssiger Zahlungsweise K n( N ) q n K 0
qn 1 m 1 m i C q 1 2
Da das in den Unterperioden entstandene Kapital Sm erst am Ende einer Zinsperiode vorliegt, trifft die Formel (N3) zu. Beispiel 4.12 Jemand beschließt, ab 1.1.2001 am Ende eines jeden Monats 100 € auf ein Sparkonto (6 % p.a.) zu zahlen, auf dem sich schon 1000 € befinden. Wie hoch wäre das Guthaben nach 10 Jahren? Lösung: Gemischte Verzinsung, nachschüssig. Es gilt: K0 = 1 000, C = 100 €, m = 12 (Monate), i = 0,06, q = 1,06 m 1 qn 1 m i K n( N ) q n K 0 C q 1 2 1,0610 1 000
4.4
1,06 10 1 (12 0,06 5,5) 100 18 042,77 €. 0,06
Tilgungsrechnung
Ratentilgung Zur Tilgung einer Schuld K0, die zu einem Zinssatz p ausgeliehen ist, werden für eine fest vereinbarte Laufzeit von n Jahren konstante Tilgungsraten Q gezahlt, die die fälligen Zinsen Zk für das k-te Jahr nicht beinhalten. Dabei gilt: Q
K0 n
Z k K0 ( k 1) Q i
Die Summe aus der Tilgungsrate Q und den anfallenden Zinsen Zk Ak = Q + Zk wird als Annuität bezeichnet. Bemerkung Bei der Ratentilgung bleibt die Tilgungsrate Q für die gesamte Laufzeit konstant, während die Annuität monoton fällt.
F
100
4 Grundzüge der Finanzmathematik
Annuitätentilgung Zur Tilgung einer Schuld K, die zu einem Zinssatz p ausgeliehen ist, wird über eine fest vereinbarte Laufzeit am Anfang oder am Ende jeder Zinsperiode ein gleichbleibender Betrag E bezahlt. Da die Schuld nach n Perioden vollständig beglichen werden soll, wird Kn = 0 gesetzt (siehe vorherige Seiten). Mit Hilfe von (V3) bzw. (N3) kann die Tilgungsrate A = E berechnet werden: vorschüssig: nachschüssig: A(V ) q n 1
q 1 K0 q n 1
A( N ) q n
q 1 K0 q n 1
Beispiel 4.13 Einem Hauseigentümer wird Instandhaltungskredit von 20 000 € bei 100 % Auszahlung und 8 % Jahreszinsen angeboten, der in 6 Jahren durch Annuitätentilgung jeweils am Ende eines jeden Jahres zurückzuzahlen ist. Zu bestimmen sind die Annuität und der Tilgungsplan. 0,08 20 000 4 326,31 €. Lösung: Die Annuität beträgt A ( N ) 1,08 6 1,08 6 1 Jahr
Schuld
1 2 3 4 5 6
20 000,00 17 273,69 14 329,28 11 149,31 7 714,94 4 005,83
Zinsen
1 600,00 1 381,90 1 146,34 891,94 617,20 320,47
Tilgungsrate
Annuität
2 726,31 2 944,41 3 179,97 3 434,37 3 709,11 4 005,84
Restschuld
4 326,31 17 273,69 4 326,31 14 329,28 4 326,31 11 149,31 4 326,31 7 714,94 4 326,31 4 005,83 4 326,31 -0,02
Sind die Tilgungsraten im Rhythmus der Unterperioden zu zahlen, so ergeben sich nach (V2) und (N2) die Tilgungsraten D = C (q = 1 + i): vorschüssig:
nachschüssig:
K0 K0 q 1 q 1 D(N ) qn n qn 1 m i m 1 q 1 m i m 1 2 2 Bemerkungen (1) Bei der Annuitätentilgung ist die Annuität für die gesamte Laufzeit konstant, während die Tilgung monoton steigt. (2) Bei den letzten beiden Formeln sind im Tilgungsplan die Zinsen erst jeweils am Ende jeder Zinsperiode zu berücksichtigen. Das kompliziert die Berechnung. Einfacher wird es mit den ersten beiden Formeln, wenn in jeder Periode (auch monatlich oder quartalsweise) die Zinsen sofort berücksichtigt werden. D (V ) q n
4.5 Investitionsrechnung
101
Beispiel 4.14 Um ein Darlehen von 175 000 € in 20 Jahren zurückzuzahlen, muss bei einem Zinssatz von 8 % jährlich bei nachschüssiger Zahlung ein Betrag von A E
108 , 20 0,08
175 000 17 824,14 € 108 , 20 1 aufgebracht werden. Dieses entspricht einem monatlichen ( m = 12) Betrag von A 1 7824,14 1 432,81 €. D C m 1 12 1 m i 12 0,08 2 2
4.5
Investitionsrechnung
In der Investitionsrechnung sind das einzusetzende Kapital (Ausgaben) und der Kapitalrückfluss zwei wichtige Größen, die unter Berücksichtigung der Zeit und der damit zu erwartenden Zinsen (Kalkulationszinsen) miteinander verglichen werden (dynamische Bewertung). Der Kapitalrückfluss Ck in der k-ten Zeitperiode ist die Differenz zwischen den Einnahmen ek und den Ausgaben ak: Ck = ek ak. Bei den unten vorgestellten Bewertungsverfahren werden ein konstanter Kalkulationszinssatz p und ein nachschüssiger Kapitalrückfluss Ck vorausgesetzt. Die Annuitätenmethode Die Annuitätenmethode vergleicht den Barwert Ba Ausgaben mit dem Barwert Be
n
k 0
ek qk
n
k 0
ak der qk
der Einnahmen. Dabei
werden die entsprechenden Annuitäten bestimmt, die die Überschuss- bzw. Verlustraten darstellen. Die entsprechenden Annuitäten Ae und Aa lassen sich dann mit dem qn 1 bestimmen: nachschüssigen Rentenbarwertfaktor bn n q q 1 Ae Be
q n ( q 1) n
q 1
Be bn
Aa Ba
q n ( q 1) n
q 1
Ba bn
Die Gewinnannuität ist Ag = Ae Aa.. Eine Investition ist nach der Annuitätenmethode wirtschaftlich, wenn die Differenz Ag = Ae Aa größer oder gleich null ist.
F
102
4 Grundzüge der Finanzmathematik
Bemerkung Die Annuitätenmethode und die nachfolgende Kapitalwertmethode sind äquivalente Bewertungsverfahren. Sie unterscheiden sich nur durch den Rentenbarwertfaktor. Die Kapitalwertmethode Bei der Kapitalwertmethode werden die Investitionen und die Kapitalrückflüsse verglichen. Dazu werden diese beiden Größen auf den Zeitpunkt t = 0 (Beginn der Investition) transformiert, also umgerechnet. Der Gegenwartswert G einer Investition ist der Wert G
C1 C2 C 2 nn q q q
n
Ck
k 1
qk
.
Ck = ek ak sind die in der Periode k zu erwartenden Kapitalrückflüsse. Dabei ist der Gegenwartswert das Kapital, das zu einem Zinssatz p angelegt werden müsste, um die Einnahmen C1, C2, ..., Cn in den einzelnen Perioden zu erzielen. Es werden der Barwert des einzusetzenden Kapitals mit dem Barwert des Rückflusses verglichen. Der Kapitalwert W ist die Differenz von Gegenwartswert und eingesetztem Kapital K0 W G K0
n C C1 C2 C 2 nn K0 kk K0 . q q q k 1 q
Eine Investition ist nach der Kapitalwertmethode wirtschaftlich, wenn der Kapitalwert W größer oder gleich null ist. Die interne Zinsfußmethode Die interne Zinsfußmethode wird häufig als Bewertungsverfahren herangezogen, obwohl sie mathematisch aufwendig ist und eine mehrdeutige Lösung liefern kann. Sie ist als Bewertungsverfahren deshalb nicht zu empfehlen, soll aber dennoch zum Vergleich vorgestellt werden.
4.5 Investitionsrechnung
103
Derjenige Zinsfuß pint einer Investition, der beim Diskontieren der Kapitalrückflüsse den Kapitalwert null ergibt, heißt interner Zinsfuß. Es muss also gelten: K0
n
Ck
k k 1 q int
0 mit qint = 1 + iint = 1 +
pint 100
Nach der internen Zinsfußmethode ist eine Investition zweckmäßig, wenn der interne Zinsfuß pint nicht niedriger als der Kalkulationszinssatz p ist. Beispiel 4.15 Beim Einsatz einer zusätzlichen Maschine mit einem Anschaffungswert von 7 000 € sind in einem Betrieb die folgenden Einnahmenüberschüsse bei einem geschätzten Zinssatz von 5 % zu erwarten. Jahr k
1
Kapitalrückfluss Ck (€)
1 000
2 5 000
3
4
2 000
500
(1) Lösung nach der Annuitätenmethode: 1 000 5 000 2 000 500 Be 0 7 626,56 1,05 1,05 2 1,05 3 1,05 4 Ba 7 000 0 0 0 0 7 000 A e Be
1,05 4 0,05
2 150,80
Aa Ba
1,05 4 0,05
1 974,08 1,05 1 1,05 4 1 Ag = Ae Aa = 176,70 € Die Investition ist also von Vorteil, da die Differenz positiv ist. 4
(2) Lösung nach der Kapitalwertmethode: 1 000 5 000 2 000 500 W G K0 7 626, 55 7 000 626, 55 0 1,05 1,05 2 1,05 3 1,05 4 Die Investition ist auch nach der Kapitalwertmethode vorteilhaft. (3) Lösung nach der internen Zinsfußmethode mit x = qint: 1 000 5 000 2 000 500 Es soll gelten: 7 000 4 0. x2 x3 x x Eine Multiplikation mit x (x 0) liefert 4 3 2 7 000x 1 000x 5 000x 2 000x 500 = 0. Diese Gleichung 4. Grades ist mit elementaren mathematischen Mitteln nicht lösbar. Zur Nullstellenbestimmung kann das NEWTONVerfahren verwandt werden. Lösungen sind x1 = 1,09 und x2 = 0,59. Diesen entsprechen die Zinssätze pint = 9 bzw. pint = 159. Der letzte Wert ist wirtschaftlich unsinnig. Der interne Zinsfuß von 9 % liegt über 5 %, und damit ist auch nach dieser Methode die Investition günstig. 4
F
104
4 Grundzüge der Finanzmathematik
4.6
Abschreibungsrechnung
Wirtschaftsgüter verlieren durch materiellen oder ideellen Verschleiß ihren Wert. Der dabei verloren gegangene Wert wird zu einem Kostenbestandteil zum Beispiel an einem Haus, einem Auto oder einem Computer. Es wird zwischen der technischen Nutzungsdauer und der wirtschaftlichen Nutzungsdauer unterschieden. Als wirtschaftliche Nutzungsdauer wird diejenige Zeit bezeichnet, in der eine Anlage ökonomisch günstig eingesetzt werden kann. Die Übertragung der Wertverminderung bei bestimmten Gütern auf die Kosten wird als Abschreibung bezeichnet. Diese Kostenübertragung erstreckt sich in der Regel über mehrere Jahre. Es gibt unterschiedliche Abschreibungsstrategien, die Einfluss auf die zu zahlenden Steuern haben können. Formen der Abschreibung (1) lineare Abschreibung, (2) degressive Abschreibung, (3) progressive Abschreibung, (4) leistungsbedingte Abschreibung. Bezeichnungen A0 = R0 Anschaffungs- bzw. Herstellungskosten n wirtschaftliche Nutzungsdauer (in Jahren) Q Abschreibung(-sbetrag oder -srate) p Abschreibungssatz in % Rk Restwert des Gutes nach k Jahren Rn Restwert am Ende der Nutzungsdauer (Schrottwert)
4.6.1
Lineare Abschreibung
Diejenige Abschreibungsform, bei der die jährliche Abschreibung Qk = Q, d. h. konstant ist, wird als lineare oder konstante Abschreibung bezeichnet. Die lineare Abschreibung wird bei einer n-jährigen Nutzungsdauer auf folgende Weise berechnet: Q
A0 Rn n
Häufig ist der Restwert Rn = 0, sodass sich die Formel entsprechend vereinfacht.
4.6 Abschreibungsrechnung
105
Der Abschreibungsprozentsatz p ist in diesem Fall ebenfalls konstant, und er hat die Form: p
A0 Rn 100 n A0
Da der Restwert in jeder Zeiteinheit um einen konstanten Wert Q abnimmt, entsteht eine arithmetische Folge {Rk}. R1 = A0 Q, R2 = A0 2 Q, ... , Rn = A0 n Q Rk A0 k
A0 Rn , k 1, 2, , n n
Der Abschreibungsprozentsatz der jährlichen Abschreibung kann auch auf den jeweiligen Buchwert (Restwert) Rk bezogen werden: A0 Rn pB 100 n A0 ( k 1) ( A0 Rn ) Bemerkung Mit zunehmender Laufzeit k wird der Abschreibungssatz bezogen auf den Buchwert größer. Beispiel 4.16 Eine Anlage wird zu einem Preis von 100 000 € angeschafft. Die wirtschaftliche Nutzungsdauer beträgt 10 Jahre. Es wird mit einem Schrottwert von 10 000 € gerechnet. Für die Abschreibungsrate gilt dann A R n 100 000 10 000 Q 0 9 000 € und prozentual n 10 A Rn 100 000 10 000 100 100 9. p 0 10 100 000 n A0
In der folgenden Tabelle sind die Restwerte, die Abschreibungsraten und der Prozentsatz bezogen auf den Buchwert angegeben. Restwert Abschreibungs- AbschreibungsRestwert rate prozentsatz Jahresende Jahr k Jahresanfang 1 100 000 9 000 9,00 91 000 2 91 000 9 000 9,89 82 000 3 82 000 9 000 10,98 73 000 4 73 000 9 000 12,33 64 000 5 64 000 9 000 14,06 55 000 6 55 000 9 000 16,36 46 000 7 46 000 9 000 19,57 37 000 8 37 000 9 000 24,32 28 000 9 28 000 9 000 32,14 19 000 10 19 000 9 000 47,37 10 000
F
106
4 Grundzüge der Finanzmathematik
4.6.2
Degressive Abschreibung
Bei der degressiven Abschreibung nehmen die Abschreibungsbeträge mit der Zeit ab. Zwei Formen, die arithmetisch degressive und die geometrisch degressive Form der Abschreibung, werden unterschieden. Arithmetisch degressive Abschreibung Eine Abschreibungsform, bei der die Abschreibungsraten Qk eine fallende arithmetische Folge darstellen, heißt arithmetisch degressive Abschreibung. Die Abschreibungsraten Qk berechnen sich dann auf folgende Weise: Q2 = Q1 d, Q3 = Q1 2 d, ..., Qn = Q1 (n 1) d, Qn+1 = Q1 n d = 0 . Q Aus der letzten Zeile folgt d 1 . n Aus der Bedingung, dass die Summe der Abschreibungen und dem n1 Restwert den Anschaffungswert ergibt, folgt A0 Rn Q1 . 2 Hieraus lassen sich die erste Abschreibungsrate Q1 und deren jährliche Reduzierung berechnen: Q1
2 A0 Rn n1
und d
Q1 n
Beispiel 4.17 Ein Wirtschaftsgut mit einem Anschaffungswert von 55 000 € soll in 10 Jahren voll abgeschrieben sein. Zu bestimmen ist der Abschreibungsplan für eine arithmetisch degressive Abschreibung. Lösung 2A0 R n 2 55 000 Q 10 000 = = 10 000 und d 1 1 000 Q1 n 1 n 11 10 Damit ist der folgende Abschreibungsplan aufstellbar: Jahr k 1 2 3 4 5 6 7 8 9 10
Restwert Jahresanfang 55 000 45 000 36 000 28 000 21 000 15 000 10 000 6 000 3 000 1 000
Abschreibungsrate 10 000 9 000 8 000 7 000 6 000 5 000 4 000 3 000 2 000 1 000
Restwert Jahresende 45 000 36 000 28 000 21 000 15 000 10 000 6 000 3 000 1 000 0
4.6 Abschreibungsrechnung
107
Geometrisch degressive Abschreibung p bezogen auf den jeweili100 gen Restwert konstant, so heißt eine derartige Abschreibungsform geometrisch degressive Abschreibung.
Ist der Abschreibungsprozentsatz i
Für die geometrisch degressive Abschreibung gilt somit: Qk Rk 1 i
Abschreibungsraten und Restwerte für die geometrisch degressive Abschreibung lassen sich nach den folgenden Formeln berechnen:
F
Rk A0 (1 i ) k Qk Rk 1 i A0 (1 i ) k 1 i Nach einer endlichen Zeit kann der Restwert nicht null werden. Ist für das n-te Jahr ein Restwert Rn vorgegeben, so lässt sich der Abschreibungsprozentsatz i bzw. p berechnen.
i 1 n
Rn A0
oder
R
p 100 i 100 1 n n A0
Beispiel 4.18 Ein Lastkraftwagen mit einem Anschaffungswert von 50 000 € soll in 8 Jahren geometrisch degressiv auf einen Schrottwert von 5 000 € abgeschrieben werden. Wie lautet der Abschreibungsplan? Lösung
R
5 000 25,010 571 p 100 i 100 1 n n 100 1 8 50 000 A 0 also 1 i = 0,749 894 29
Jahr k 1 2 3 4 5 6 7 8
Restwert Jahresanfang Abschreibungsrate 50 000,00 12 505,29 37 494,71 9 377,64 28 117,07 7 032,24 21 084,83 5 273,44 15 811,40 3 954,52 11 856,87 2 965,47 8 891,40 2 223,79 6 667,61 1 667,61
Restwert Jahresende 37 494,71 28 117,07 21 084,83 15 811,40 11 856,87 8 891,40 6 667,61 5 000,00
108
4 Grundzüge der Finanzmathematik
Der Übergang von der geometrisch degressiven zur linearen Abschreibung Laut Einkommenssteuergesetz kann die geometrisch degressive Abschreibung bei beweglichen Wirtschaftsgütern an Stelle der linearen Abschreibung genutzt werden, wenn die folgende Voraussetzung erfüllt ist: Der Abschreibungsprozentsatz p bei der geometrisch degressiven Abschreibung darf nicht höher sein als das Dreifache des bei der linearen Abschreibung auftretenden Prozentsatzes, und p darf den Wert 30 nicht übersteigen. (vgl. §7(2) EStG) Es ist möglich, von der geometrisch degressiven Abschreibung zur linearen Abschreibung überzugehen aber nicht umgekehrt. (vgl § 7(3) EStG)
Häufig ist es günstig, möglichst früh hohe Abschreibungsbeträge steuerlich geltend zu machen. Deshalb ist es notwendig zu wissen, in welchem Jahr die lineare Abschreibungsrate die geometrisch degressive übersteigt. Annahme Die lineare Abschreibung beginne im Jahre t und es gelte Rn = 0. n Anzahl der Jahre, in denen die Abschreibung erfolgt i lineare Abschreibungsrate
Der Zeitpunkt t des Übergangs von der geometrisch degressiven zur linearen Abschreibung wird nach der folgenden Formel berechnet:
t n 1
1 i
Damit die entsprechende Ungleichung erfüllt bleibt, ist bei gebrochenem Wert für t stets zur nächsthöheren natürlichen Zahl aufzurunden. Beispiel 4.19 Eine Produktionsanlage soll in 8 Jahren zunächst geometrisch degressiv und anschließend linear abgeschrieben werden. Der Anschaffungswert betrug 80 000 €. (1) Welcher Abschreibungsprozentsatz ist nach dem EStG maximal möglich? (2) Wann erfolgt mit diesem Abschreibungssatz der Übergang von der geometrisch degressiven zur linearen Abschreibung? (3) Wie lauten die Restwerte für die einzelnen Jahre? Lösung (1) Es gilt p = 100/8 = 12,50. Der Abschreibungssatz der degressiven Abschreibung darf höchstens das Dreifache von p, aber nicht mehr als 30 betragen, also p = min(30; 312,50) = 30. (2) Es gilt t 8 + 1 1/0,3 5,67. Die nächstgrößere ganze Zahl ist t = 6, d. h., im 6. Jahr ist von der geometrisch degressiven Abschreibung zur linearen Abschreibung überzugehen.
4.6 Abschreibungsrechnung
109
(3) Abschreibungsplan Jahr k 1 2 3 4 5 6 7 8
4.6.3
Restwert Jahresanfang 80 000,00 56 000,00 39 200,00 27 440,00 19 208,00 13 445,60 8 963,73 4 481,87
Abschreibungsrate 24 000,00 16 800,00 11 760,00 8 232,00 5 762,40 4 481,87 4 481,87 4 481,87
Restwert Jahresende 56 000,00 39 200,00 27 440,00 19 208,00 13 445,60 8 963,73 4 481,87 0,00
Progressive Abschreibung
Bei der progressiven Abschreibung wird mit niedrigen Abschreibungssätzen begonnen, die dann mit den Jahren steigen. Allgemein ist die progressive Abschreibung für den steuerlichen Bereich unzulässig. Eine Abschreibungsform, bei der die Abschreibungsraten eine steigende arithmetische Folge darstellen, heißt arithmetisch progressive Abschreibung. Die Steigerungen d werden als Progressionsbetrag bezeichnet. Ist die erste Abschreibungsrate Q1, so lauten dann bei einer arithmetisch progressiven Abschreibung die folgenden Q2 = Q1 + d, Q3 = Q1 + 2 d, ..., Qn = Q1 + (n 1) d. Die Abschreibungsrate Q1 für die lineare progressive Abschreibung lautet:
Q1
A0 Rn n 1 d n 2
d sollte so gewählt werden, dass Q1 > 0 ist. Beispiel 4.20 Eine Produktionsanlage mit einem Anschaffungswert von 30 000 € soll in 8 Jahren auf einen Schrottwert von 2 000 € arithmetisch progressiv abgeschrieben werden. (1) Wie lautet der Abschreibungsplan bei einem Progressionsbetrag von 500 €? (2) Wie groß müsste der Progressionsbetrag d gewählt werden, damit die erste Abschreibungsrate 700 € beträgt? Lösung A Rn n 1 30 000 2 000 8 1 d 500 1750 (1) Q1 0 n 2 8 2
F
4 Grundzüge der Finanzmathematik
110
Jahr k 1 2 3 4 5 6 7 8
(2)
d
4.7
Restwert Jahresanfang 30 000,00 28 250,00 26 000,00 23 250,00 20 000,00 16 250,00 12 000,00 7 250,00
Abschreibungsrate 1 750,00 2 250,00 2 750,00 3 250,00 3 750,00 4 250,00 4 750,00 5 250,00
Restwert Jahresende 28 250,00 26 000,00 23 250,00 20 000,00 16 250,00 12 000,00 7 250,00 2 000,00
2 30 000 2 000 2 A0 Rn
Q1 700 800 € 7 n 1 n 8
Kursrechnung
Anwendungsgebiet: Bewertung von Wertpapieren Ein Wertpapier besitzt einen Nennwert oder Nominalwert (Nominalkapital) und einen Handels-, Realwert oder Preis (Realkapital).
Das Realkapital hängt in der Regel von der Nachfrage nach dem Wertpapier ab. Der Quotient aus Realkapital Kreal und Nominalkapital Knom heißt Kurs C. K C real 100 (Angabe als Prozentsatz) K nom Bei der Kursrechnung spielen die Zinsen eine wichtige Rolle. Es wird zwischen einem nominellen Zinssatz und einem realen oder effektiven Zinssatz unterschieden.
4.7.1
Kurs einer Annuitätenschuld
Bei einer Annuitätentilgung ist die Summe aus Zinsen und Tilgungsrate konstant. Die Annuität A wird nach der folgenden Formel berechnet qn 1 K B A mit bn n bn bn q q 1 (bn ist der nachschüssige Rentenbarwertfaktor, vgl. Abschnitt 4.5) Die aufgenommene Schuld K ist hier gleich ihrem Barwert B. Der Kurs C einer Annuitätenschuld mit der Laufzeit n ist der Barwert aller künftigen Leistungen bezogen auf K = 100.
4.7 Kursrechnung
111
Bei Verwendung des nachschüssigen Rentenbarwertfaktors gilt unter Berücksichtigung des nominellen und des realen Zinssatzes Breal A bn , real und Bnom A bn , nom und somit C
bn , real Breal 100 100 Bnom bn , nom
Beispiel 4.21 Eine Bank möchte bei einer Annuitätenschuld, die in 10 Jahren zurückzuzahlen ist, bei einer Nominalverzinsung von p = 6 % mindestens einen Zinssatz von p = 8 % erreichen. Wie hoch darf der Ausgabekurs höchstens sein? Lösung n = 10, inom = 0,06, ireal = 0,08,
106 ,
C 108 ,
10
108 0,06 , 10 1 100 9117 , 0,08 106 , 10 1
d. h., der Kurs darf höchstens 91,17 % betragen.
4.7.2
Kurs einer Ratenschuld
Jeweils am Jahresende sind eine feste Tilgungsrate und entsprechende K (nachschüssig). Zinsen zu zahlen. Die konstante Tilgungsrate betrage n Wird der Barwert aller künftigen Zahlungen ins Verhältnis zu K0 gesetzt, ergibt sich der Kurs: C
p 100 pnom n bn , real 1 nom n preal preal
Beispiel 4.22 Eine Ratenschuld von 8 000 € soll bei einer Nominalverzinsung von 7 % und einem Realzinssatz von 9 % in 8 Jahren getilgt werden. (1) Wie hoch ist der Barwert aller künftigen Leistungen? (2) Wie hoch ist der Auszahlungskurs? Lösung
(1)
Barwertfaktor (real): bn,real Barwert: B
(2)
Kurs:
, 8 1 109 , 8 0,09 109
5,53482
8000 7 8 7
5,53482 1 7452,18. 8 9 9
745218 , 100 93,15. 8000,00
F
112
4 Grundzüge der Finanzmathematik
4.7.3
Kurs einer gesamtfälligen Schuld
Schuldablösung zu einem festen Zeitpunkt Allgemein gilt für eine Gesamtschuld mit der Laufzeit n und dem Ablösetermin t der Kurs C:
C
1 inom
K real 100 K nom 1 ireal
nt
100
Beispiel 4.23 Eine Schuld von 10 000 € wird nach 5 Jahren zuzüglich Zinseszinsen von 5 % fällig. Nach 3 Jahren zweifelt der Gläubiger an der Zahlungsfähigkeit. Er möchte seine Forderung an eine Bank abtreten, die jedoch 8 % Zinsen verlangt. Zu welchem Kurs übernimmt die Bank nach dem dritten Jahr die Schuld?
Lösung Es gilt: K0 = 10 000, p = 5, n = 5. 5 Nach 5 Jahren wäre ein Betrag von K5 = 10 000 (1,05) = 12 762,82 zu zahlen. Der Nominalwert beträgt nach drei Jahren 2 K3,nom = K5 /(1,05) =11 576,25 €. 2 Der Realwert für die Bank dagegen K3,real = K5 /(1,08) = 10 942,06. Der Übernahmekurs der Bank beträgt 10 942,06 C 100 94,52. 11576,25 Der Kurs C beträgt 94,52 % und hängt vom Verhältnis der Aufzinsfaktoren sowie von der verbleibenden Zeit ab. Diese Zeit erscheint im Exponenten.
Zinsschulden (Kuponanleihen) Im Gegensatz zu oben gilt für die Zinsen weiter der nominelle Zinssatz. Folgende Annahmen werden vorausgesetzt: (1) Zinsen sind auf den Nennwert des ausgeliehenen Kapitals am Ende eines jeden Jahres fällig, (2) Die Rückzahlung des Nennwertes erfolgt am Ende des letzten Jahres mit oder ohne Aufgeld. Kuponanleihe bedeutet: Es werden Wertpapiere ausgegeben, denen Zinsscheinbögen (Kuponbögen) beigefügt sind. Zu einem bestimmten Termin wird der Zinsbetrag für einen entsprechenden Kupon gezahlt. Die Wertpapiere entsprechen in der Regel gewissen Anteilen der gesamten Kreditsumme (z. B. 100, 500, 1000, 5000 oder 10 000 €).
4.7 Kursrechnung
113
Bezeichnungen N Nennwert eines Stücks p jährlicher Zinssatz eines Stücks in % Aufgeldprozentsatz
Der Kurs wird folgendermaßen berechnet: i qn 1 1
C 100 nom realn n i q real q real real
Allgemein gilt unter Berücksichtigung des Aufgeldes
1 n i 100 nom q real 1 C 100 n n q real q real i real
F
Folgende Aufgabenstellungen sind möglich: (1) Bestimmen des Kurses C, wenn n, pnom und preal gegeben sind. (2) Bestimmen von preal = 100 ireal , wenn n, C und pnom gegeben sind.
Problem (2) führt auf die Nullstellenbestimmung eines Polynoms vom Grade n + 1. Dazu stehen Näherungsverfahren wie z. B. das NEWTONVerfahren zur Verfügung (siehe Abschnitt 5.4.4). Beispiel 4.24 Betrachtet wird ein Kapital K = 50 000 € mit einer Laufzeit von 8 Jahren und einem nominellen Zinssatz von pnom = 4. Der reale Zinssatz betrage preal = 6. Die jährlichen Zinsen in Höhe von R = 2000 € können als jährliche nachschüssige Rente aufgefasst werden. Der Barwert der Zinsen zum 2 000 1,06 8 1 Anfangszeitpunkt ist BZ 12 419,59 €. Der Barwert des 0,06 1,06 8
Rückzahlungsbetrages beträgt BN
50 000
31 370,62 €. Die Summe 1,06 8 beider Beträge ist 43 790,21 €, was durch den Erwerber zu zahlen wäre. 43 790,21 Der Kurs, zu dem er das Wertpapier kauft, ist C 100 87,58 , 50 000,00 also 87,58 %.
5 Funktionen mit einer reellen Variablen
5
Funktionen mit einer reellen Variablen
5.1
Grenzwert von Funktionen
Untersucht werden soll eine Funktion y = f (x), x Df, an einer gewissen Stelle x = a. Beispiel 5.1 x2 9 Betrachtet wird die Funktion f ( x ) , x R \ {3}, die an der Stelle x 3 x = 3 nicht definiert ist, da der Nenner null wird. Der Funktionsverlauf an der Stelle a = 3 wird nun näher untersucht. Dazu wird eine beliebige Folge {xk} ausgewählt, die gegen 3 strebt: xk = 3 + ak, wobei ak eine beliebige Nullfolge ist. Dann gilt
x k2 9 3 ak 9 9 6 ak ak2 9 6 ak ak2 6 ak xk 3 ak ak 3 ak 3 2
f (xk )
Da ak eine Nullfolge ist, strebt f(x) gegen 6 für x 3.
Die Stelle a R habe die Eigenschaft, dass in jeder Umgebung U(a) Werte x a enthalten sind, die zum Definitionsbereich der Funktion y = f (x), x Df, gehören. (Dabei kann auch a Df gelten, muss jedoch nicht erfüllt sein.) Wenn für jede beliebige Zahlenfolge {xk} mit den Eigenschaften E1: lim x k a k
E2: xk Df x a für alle k = 1, 2, ... die Zahlenfolge der Funktionswerte {f (xk)} gegen denselben Grenzwert fa konvergiert, dann wird fa Grenzwert der Funktion an der Stelle x = a genannt oder f (x) konvergiert gegen fa für x a. Für diesen Sachverhalt werden die folgenden Schreibweisen verwendet: lim f ( x ) f a oder f (x) fa für x a. xa
Damit kann der Konvergenzbegriff von Funktionen auf den Konvergenzbegriff von Folgen zurückgeführt werden. Wenn für eine Stelle a R sowie für Zahlenfolgen {xn} mit den Eigenschaften E1 und E2 die Zahlenfolgen der Funktionswerte {f (xn)} nicht gegen den gleichen Grenzwert oder überhaupt nicht konvergieren, so hat f (x) in x = a keinen Grenzwert. f (x) heißt dann in x = a divergent.
5.2 Stetigkeit
115
Regeln für das Rechnen mit Grenzwerten Aus der Existenz der Grenzwerte lim f ( x ) f und lim g ( x ) g x a
xa
folgt: lim ( f ( x ) g ( x )) lim f ( x ) lim g ( x ) f g xa
xa
xa
lim ( f ( x ) g ( x )) lim f ( x ) lim g ( x ) f g
xa
xa
xa
lim f ( x )
f ( x ) x a f , g(x) 0 g ( x ) lim g ( x ) g
lim
xa
x a
Wichtige Grenzwerte 0 für 0 q 1 1 0 , lim e x 0 , lim e x 0 , lim q x 1 für q 1 x x x
x
x
für q 1
lim
Eine Gerade y = a· x + b heißt Asymptote von f (x) für x , wenn gilt lim ( f ( x ) (a x b)) 0 . x
Ermittlung der Konstanten a und b für y = a x + b: a lim
x
f ( x) , b lim[ f ( x ) a x ] x
x
Beispiel 5.2 x2 1 , x 2. Es ist Gegeben ist die Funktion f ( x ) x2
a lim
x
x 2 1 x 2 2 x x2 1 1 x2 1 1 x lim 1, b lim 2 . x x 2 x2 x x2 x
Also lautet die Gleichung der Asymptote y = x 2.
5.2
Stetigkeit
Der Punkt a R habe die Eigenschaft, dass in jeder Umgebung U(a) Werte x a enthalten sind, die zum Definitionsbereich der Funktion y = f (x), x Df, gehören; außerdem gelte a Df , sodass f (a) erklärt ist. Falls lim f ( x ) f (a ) gilt, heißt f (x) an der Stelle x = a stetig. xa
Wenn die Funktion diese Eigenschaft für alle x aus einem offenen Intervall I Df besitzt, heißt sie in I stetig.
E
116
5 Funktionen mit einer reellen Variablen
Beispiel 5.3
x2 9 für x 3 ist stetig, da der Grenzwert an der Die Funktion f ( x ) x 3 6 für x 3 Stelle x = 3 mit dem Funktionswert übereinstimmt (vgl. Beispiel 5.1). Beispiel 5.4 Eine Warenart kostet in Abhängigkeit von der Menge x je Mengeneinheit 100 €, wenn weniger als 10 Mengeneinheiten gekauft werden, sonst beträgt der Preis 90 €. Folgende Funktion beschreibt den Gesamtpreis in Abhängigkeit von der gekauften Menge x: P(x) 2000 100 x für 0 x 10 P( x ) für 10 x 90 x 1500
Diese Funktion ist nicht stetig, da für den Punkt x = 10 von links kom- 1000 mend der Wert 1000 und von rechts kommend der Wert 900 erreicht 500 wird. Praktisch bedeutet dieses, dass 0 0 5 10 beispielsweise für 9,9 Mengeneinheiten genau so viel bezahlt werden Abbildung 5.1 muss wie für 11, nämlich 990 € (siehe Abb. 5.1).
15
20
25 x
Jede in einem abgeschlossenen Intervall stetige Funktion ist dort beschränkt; insbesondere nimmt sie ihren größten und kleinsten Funktionswert in diesem Intervall wenigstens einmal an. Ist eine Funktion in einem abgeschlossenen Intervall stetig, so nimmt sie jeden Wert, der dem Intervall zwischen ihrem kleinsten und größten Funktionswert angehört, wenigstens einmal an. Wenn U(a) Df und lim f ( x ) einer Funktion y = f (x), x Df, xa
existiert, jedoch verschieden von f (a) ist, so heißt x = a eine Unstetigkeitsstelle 1. Art von f (x). Wenn U(a) Df und lim f ( x ) nicht existiert, so heißt x = a eine xa
Unstetigkeitsstelle 2. Art der Funktion f (x) (siehe Abb. 5.2).
5.3 Ableitung einer Funktion
117
Wenn f (x) in x = a nicht definiert ist, jedoch lim f ( x ) existiert, so xa
heißt x = a eine hebbare Unstetigkeitsstelle der Funktion f (x) (siehe Abb. 5.2). f(x)
x1 Unstetigkeitsstelle 1. Art x2 Unstetigkeitsstelle 2. Art (Sprungstelle) x3 Unstetigkeitsstelle 2. Art (Polstelle) x4 hebbare Unstetigkeitsstelle (Lücke)
o
o 0
x3
x1 x2
x
x4
Abbildung 5.2
5.3
Ableitung einer Funktion
Es sei y = f (x), x Df, eine beliebige Funktion. Werden xDf und x 0 so gewählt, dass auch x + x Df , dann heißt f ( x x ) f ( x ) f ( x ) bzw. x x Differenzenquotient der Funktion f (x) an der Stelle x. Es sei y = f (x), x Df, eine beliebige Funktion. Wenn für ein festes f ( x x) f ( x) dy lim existiert, xDf der Grenzwert y x d x x0 dann heißt er Differenzialquotient oder Ableitung der Funktion f an der Stelle x. Bemerkung In den Wirtschaftswissenschaften wird die erste Ableitung von Funktionen oft als Grenz- oder Marginalfunktion bezeichnet . Ableitungen von Grundfunktionen Konstante, Potenz- und Wurzelfunktion 1 xn x n y a xn n y´ 0 n x n1 x n1
x
n
1
1 n 1n x n
2 x
x
E
5 Funktionen mit einer reellen Variablen
118
Exponential- und Logarithmusfunktion y ex ax ln x
y´
ex
cos x
sin x
lg x
1 x ln a
1 x ln 10
1 x
a x ln a
Trigonometrische Funktionen sin x cos x y y´
log a x
tan x 1
cos2 x
Zyklometrische Funktionen y arcsin x arccos x 1 1 y´ 2 1 x 1 x2
cot x
1 tan 2 x
arctan x 1 1 x2
1 sin 2 x
1 cot 2 x
arccot x 1 1 x2
Differenziationsregeln (1) Summen-, Produkt- und Quotientenregel Es seien u(x) und v(x) zwei Funktionen, deren Ableitungen für jedes x D R existieren. Dann gilt:
(u ( x) v( x)) u ( x) v( x) (c v( x)) c v( x) (u ( x) v( x)) u ( x) v( x) u ( x) v( x) $ u ( x ) ! u ( x) v( x) u ( x) v( x) "" , v( x) 0 (v( x)) 2 # v( x) Beispiel 5.5 Gegeben ist die Funktion y (x) = x ln x. Sie ist ein Produkt der Funktionen 1 u(x) = x und v(x) = ln x. Somit gilt y ln x x ln x 1. x
Die Funktion y ( x )
ex x , x 0, ist ein Quotient von u(x) = e und v(x) = x. x
Die Ableitung nach x lautet dann y
ex x ex 1 x2
$ x 1! ex " 2 . # x
5.3 Ableitung einer Funktion
119
(2) Kettenregel Sind die Funktionen u (x) nach x und f (u) nach u differenzierbar, dann gilt
f [u ( x)]
f (u ) u ( x) oder
d y d y du d x du d x
( y = f (u) äußere Funktion, u = u (x) innere Funktion) Beispiel 5.6 Gegeben ist die Funktion y f [u( x )] ln(1 x 2 ). Hier ist die äußere Funk-
tion und deren Ableitung f (u ) ln u, f (u )
1 sowie die innere Funktion u
und deren Ableitung u( x ) 1 x 2 , u ( x ) 2 x. Die Ableitung der mittelba ren Funktion ist dann f [u( x )] f (u ) u ( x )
1 1 x 2
2x .
(3) Logarithmische Differenziation Die Funktion f (x) sei differenzierbar und es gelte f (x) 0, x Df. Dann liefert die Kettenregel für u = ln| f (x)| 1 u( x) f ( x ) (ln| f ( x )|) . Dieses umgestellt nach f ( x ) ergibt: f ( x)
f ( x ) f ( x ) (ln| f ( x )|) Beispiel 5.7 Die Funktion y f ( x ) x x , x > 0, wird zunächst logarithmiert. Das liefert
ln y x ln x , und anschließend wird nach der Kettenregel differenziert: y 1 1 ln x x ln x 1 (auf der rechten Seite wird die Produktregel y x
angewendet). Es wird nach y umgestellt: y y ln x 1 x x (ln x 1)
Ableitungen höherer Ordnung Wenn die Ableitung einer Funktion wieder eine Funktion ist und von dieser die Ableitung existiert, kann sie noch einmal differenziert werden. So entsteht eine Ableitung zweiter Ordnung. Dieser Prozess kann entsprechend fortgesetzt werden. f ( x ) f ( 2 ) ( x ) ( f ( x )) , f ( x ) f ( 3) ( x ) ( f ( x )) , ,
f
(n)
( x) ( f
( n 1)
( x ))
Beispiel 5.8
f ( x ) x 3 2x 2 3 x 2 f ( x ) f
(3 )
(x) 6
f
( 4)
f ( x ) 3 x 2 4 x 3 0
f ( x ) 6 x 4
E
120
5 Funktionen mit einer reellen Variablen
5.4 5.4.1
Anwendung der Ableitung Differenzial und Fehlerrechnung
Die Funktion f (x) sei für x I Df eine differenzierbare Funktion, dann gilt f ( x x ) f ( x ) lim f ( x) 0. x 0 x f ( x x ) f ( x ) Wird % x f ( x ) gesetzt, gilt x f ( x x ) f ( x ) x f ( x ) x % ( x ) . Der letzte Ausdruck kann, wenn x genügend klein ist, vernachlässigt werden: f ( x ) f ( x x ) f ( x ) x f ( x ) o ( x ) Damit gilt f ( x ) & x f ( x )
d f ( x ) d x f ( x )
bzw.
Das Differenzial d f (x) gibt näherungsweise die Änderung einer Funktion f (x) an der Stelle x an, wenn sich x um x ändert. Beispiel 5.9 Gegeben ist eine Kostenfunktion K(x) in Abhängigkeit von der Produktions-
höhe x (Output) K ( x ) 0,02x 3 2,5 x 2 50 x 250. Bei einer Produktion von x = 10 Mengeneinheiten entstehen Kosten von K(10 ) 20 250 500 250 520 GE. Ändert sich die Produktionshöhe nun um zwei Mengeneinheiten, das heißt x = 2 nach oben oder x = 2 nach unten, lässt sich diese Änderung näherungsweise durch
K ( x ) & K ( x ) x 0,06 x 2 5 x 50 x darstellen. Für x = 10 und x = 2 gilt K(10) = 12, für x = 10 und x = 2 K = 12. Es ist also näherungsweise eine Kostenänderung von 12 GE nach oben bzw. unten zu erwarten. Die relative Änderung beträgt K (10) 12 & 0,023 2,3% . f(x) K (10) 520
Geometrische Bedeutung des Differenzials Bei der Darstellung einer Funktion durch eine Kurve im kartesischen Koordinatensystem ist y der Zuwachs, den die Ordinate der Kurventangente im Punkt x für einen gegebenen Zuwachs x erhält (siehe Abb. 5.3).
f(x+x)
y x·f´(x)
f(x) 0
0
x
Abbildung 5.3
x+x
x
5.4 Anwendung der Ableitung
5.4.2
121
Grenzfunktion
Der Wert der ersten Ableitung f ´(x0) an der Stelle x0 einer Funktion f (x) gibt näherungsweise an, um wie viel Einheiten sich der Funktionswert f (x0) ändert, wenn die unabhängige Variable um eine Einheit (x = 1) geändert wird. Die Grenzfunktion oder Marginalfunktion einer ökonomischen Funktion f (x) ist die erste Ableitung f ´(x) dieser Funktion. Der Wert der Grenzfunktion f ´(x) gibt näherungsweise die relative Änderung der Funktion f (x) an, die durch die Änderung der unabhängigen Variablen x hervorgerufen wird. Die Untersuchung ökonomischer Probleme mit Hilfe von Grenzfunktionen wird häufig auch als Marginalanalyse bezeichnet. Beispiel 5.10
Kostenfunktion K ( x ) 0,02x 3 2,5 x 2 50 x 250, die Grenzkostenfunktion lautet dann K ( x ) 0,06 x 2 5 x 50. Für eine Produktion von x = 10 Mengeneinheiten betragen die Grenzkosten K (10) 6 Geldeinheiten je Mengeneinheit, d. h., wird die Produktion von x = 10 um eine Mengeneinheit vermehrt oder vermindert, entstehen 6 Geldeinheiten vermehrte oder verminderte Kosten.
Bemerkung Bei der Interpretation ökonomischer Zusammenhänge ist die Maßeinheit wichtig. Die Grenzfunktion (1. Ableitung) ist ein Quotient aus der Änderung der abhängigen Variablen y und der unabhängigen Variablen x, somit ist auch die Maßeinheit für die Grenzfunktion ein Quotient aus der Maßeinheit der abhängigen Variablen und der unabhängigen Variablen. Einige wichtige ökonomische Funktionen und deren Maßeinheiten (y - abhängige Variable, x - unabhängige Variable) Funktion Maßeinheit (x, y) Grenzfunktion Maßeinheit (y)
Kostenfunktion ME , GE Grenzkostenfunktion Stückkostenfunktion ME,GE/ME Grenzstückkostenfunktion Erlösfunktion ME , GE Grenzerlösfunktion Produktivität ME , ME Grenzproduktivität Konsumfunktion GE, GE Marginale Konsumquote Sparfunktion GE, GE Marginale Sparquote
GE/ME GE/(ME)2 GE/ME ME/ME GE/GE GE/GE
Es ist also jeweils durch die Maßeinheit der unabhängigen Variablen zu dividieren.
E
122
5 Funktionen mit einer reellen Variablen
5.4.3
Wachstumsrate und Elastizität
Eine Wachstumsfunktion y = f (t) beschreibt das Wachstum einer Größe in Abhängigkeit von der Zeit. Beispiel 5.11 Wachstum eines Kapitals zu einem Zinssatz i nach n Perioden mit einem n Anfangskapital K0 , K(n) = K0·(1 + i ) . Annahme: Jede Periode wird in m gleiche Zeitabschnitte unterteilt. Wird dann das in jeder dieser m n Unterperioden vorhandene Kapital zu
einem Zinssatz
i i ! $ verzinst, so ergibt sich: K (n ) K 0 "1 # m m
mn
Für m gilt: i n
m ! $ " $ !i mn " " i ! 1 $ K 0 e i n K (n ) lim K 0 "1 K 0 " lim "1 m m
m " m " # " " i # " # (stetige oder kontinuierliche Verzinsung, siehe Abschnitt 4.2).
Bemerkung Wachstumsprozesse lassen sich durch Exponentialfunktionen beschreiben.
Als Wachstumsrate wird im allgemeinen die relative Änderung f (t ) bezeichnet, die näherungsweise angibt, wie sich die Wachsf (t ) tumsfunktion f (t) pro Zeiteinheit ändert. Beispiel 5.12 Die Wachstumsrate bei der kontinuierlichen Verzinsung beträgt
K (t ) K 0 i e i t i , ist also gleich dem Zinssatz. K (t ) K 0 e i t Dagegen ist sie bei der jährlichen Verzinsung K (t ) K 0 ln(1 i ) (1 i )t ln(1 i ). K (t ) K 0 (1 i )t
5.4 Anwendung der Ableitung
123
Elastizität Die Elastizität kann ebenso wie das Differenzial genutzt werden, um Auswirkungen auf eine Funktion bei Änderung von Größen zu untersuchen. Die Funktion f (x) sei in I R differenzierbar. Dann heißt für alle f ( x0 ) x0 I mit f (x0) 0 der Ausdruck ' f x0 x0 f ( x0 ) relative Elastizität von f im Punkt x0 . Bemerkung Die relative Elastizität gibt näherungsweise an, um wie viel Prozent sich eine Funktion y = f (x) ändert, wenn sich die unabhängige Variable x um 1 % ändert. Beispiel 5.13 Gegeben ist eine Kostenfunktion K(x) in Abhängigkeit von der Produkti-
onshöhe x (Output) K ( x ) 0,02x 3 2,5 x 2 50 x 250 . Die Elastizität an der Stelle x = 10 beträgt dann 0,06 100 5 10 50 6 ' K (10) 10 10 0,115. 0,02 1 000 2,5 100 50 10 250 520 Eine Änderung von x um 1 % hat somit eine Änderung von K(10) um 0,115 % zur Folge. Ändert sich nun x um 20 % (vergleiche Beispiel 5.9), so beträgt die Änderung der Kosten 20 % 0,115 = 2,3 %.
Eine Funktion f heißt im Punkt x0 (1) elastisch, falls |'f (x0)| > 1 (2) 1-elastisch, falls |'f (x0)| = 1 (3) unelastisch, falls |'f (x0)| < 1 . Beispiel 5.14 Betrachtet wird eine Funktion u = f (p), die einen Zusammenhang zwischen der Nachfrage u und dem Preis p beschreibt (Nachfragefunktion). (1) Ist diese elastisch, so verursachen relativ kleine Preisänderungen relativ starke Nachfrageänderungen. (2) Ist sie 1-elastisch, bewirkt eine Preisänderung um 1% eine Nachfrageänderung um 1%. (3) Bei einer unelastischen Nachfragefunktion haben Preisänderungen nur eine geringe Nachfrageänderung zur Folge.
E
124
5 Funktionen mit einer reellen Variablen
5.4.4
Newton-Verfahren (Tangentenverfahren)
Ziel: Nullstellenbestimmung nichtlinearer Gleichungen Mittel: Iteration = Wiederholung der gleichen Rechenvorschrift
Das NEWTON-Verfahren f ( xn ) xn1 xn , n = 0, 1, 2, ... f ( xn ) konvergiert in der Umgebung U(x) einfacher Nullstellen, falls f ( x ) f ( x ) k 1 , x U(x) f ( x ) 2 gilt. Notwendige Schritte (1) Startwertsuche (x0) (Skizze, Wertetabelle) (2) Konvergenzuntersuchung für x0 (3) Iteration Beispiel 5.15 3 Gesucht ist eine Nullstelle der Funktion y = f(x) = x 2x 5.
(1) Startwertsuche in Form einer Wertetabelle Eine Nullstelle liegt zwischen x = 2 und x = 3. Als Startwert kann damit x0 = 2 gewählt werden. (2) Konvergenzuntersuchung: f ´(x) = 3x 2, f ´´(x) = 6x, 2
x f (x) 2 9 1 4 0 5 1 6 2 1 3 16
f (2) = 1, f ´(2) = 10, f ´´(2) = 12. Damit ist k
1 12 10 2
0,12 1 und die Konvergenz ist für x0 = 2 gesichert.
(3) Iteration x1 x 0
f (x 0 ) f ( 2) 1 2 2 2,1 f ( x 0 ) f (2) 10
x 2 x1
f ( x1) f (2,1) 0,061 , 21 2,1 2,095 ,) , f ( x 1 ) f (21 1123
x3 x2
f (x 2 ) f (2,095) 0,0002 2,095 2,095 2,095 f ( x 2 ) f (2,095 ) , 1116
Die gesuchte Nullstelle ist näherungsweise 2,095.
5.4 Anwendung der Ableitung
5.4.5
125
Taylorscher Satz
Die reelle Funktion f (x), x [a, b] R, besitze in [a, b] eine stetige Ableitung n-ter Ordnung und in (a, b) eine Ableitung der Ordnung n + 1. Wenn x0 und x Punkte aus [a, b] sind, dann gibt es eine Zahl z zwischen x0 und x, sodass f ( x0 ) f ( x0 ) f ( x ) f ( x0 ) ( x x0 ) ( x x0 ) 2 1! 2! f ( n ) ( x0 ) ( x x 0 ) n Rn ( x , x 0 ) n! gilt. Diese Beziehung wird als TAYLOR-Polynom n-ten Grades von f an der Stelle x mit dem Restglied Rn bezeichnet. Dabei gilt z x 0 , x falls x x 0 f ( n1) ( z ) Rn ( x , x0 ) ( x x0 ) n1 , ( n 1)! z x , x 0 falls x x 0
Mit Hilfe des TAYLOR-Polynoms lassen sich so näherungsweise komplizierte Funktionen einfacher darstellen. Beispiel 5.16 Gegeben ist die Funktion y f ( x ) ln x . Gesucht ist das TAYLOR-Polynom an der Stelle x0 = 1. Die Ableitungen dieser Funktionen lauten 1 1 2 (n 1)! . f ( x ) , f ( x ) 2 , f (3 ) ( x ) 3 , , f ( n ) ( x ) ( 1) n 1 x x x xn Es gilt dann
f ( x ) f (1)
f (1) f (1) f ( n ) (1) ( x 1) ( x 1) 2 ( x 1) n R n ( x,1) 1! 2! n!
1 1 1 ( x 1) 2 ( x 1) 3 ( x 1) 4 R 4 ( x, 1) . 4 2 3 Die Funktion y = ln x kann durch das TAYLOR-Polynom recht gut in der Nähe von x0 = 1 beschrieben werden. Beispielsweise führt eine näherungsweise Berechnung von ln(1,1) unter Ausnutzung der ersten fünf Glieder auf 1 1 1 f (1,1) 0 1 0,1 0,12 0,13 0,14 0,095 308 . 2 3 4 Der genaue Wert beginnt mit den Ziffern 0,095 310... Das Restglied beträgt 1 1 ,) 0,15 . Bei z = 1, z (1; 1,1), nimmt es seinen größfür n = 4 R4 (11 5 z5 ten Wert an. Damit ist die größtmögliche Abweichung 0,000 002. f ( x ) 0 1 ( x 1)
E
126
5 Funktionen mit einer reellen Variablen
5.4.6
Regel von Bernoulli-L'Hospital
0 (1) Grenzwerte vom Typ „ “ und „ “ 0
Voraussetzungen (1) Die Funktionen f1(x) und f2(x) seien in einem Intervall (x0, x0 + c), c > 0, differenzierbar und es gelte dort f 2 ( x) 0 . (2) Es gelte
lim f1 ( x) 0 und
x x0 0
lim f1 ( x) und
x x0 0
lim f 2 ( x) 0 oder
x x0 0
lim f 2 ( x)
x x0 0
f1( x) für x x0 + 0 konvergent oder hat der Ausdruck einen f 2 ( x) unbestimmten Grenzwert, so trifft dasselbe für f ( x) f ( x) f1 ( x ) lim 1 zu, und es gilt lim 1 . x x0 0 f 2 ( x ) x x0 0 f 2 ( x ) f 2 ( x)
Ist
Diese Regeln können auch mehrfach hintereinander angewandt werden. Sie gelten entsprechend auch für linksseitige Grenzwerte. Beispiel 5.17 sin x (sin x ) cos x Es gilt lim lim lim cos 0 1 . x 0 x x 0 ( x ) x 0 1
(2) Grenzwerte vom Typ „0·(± )“, „ “ Durch geeignete Umformungen (siehe Beispiele 5.18, 5.19) können diese Fälle auf Typ (1) zurückgeführt werden. Beispiel 5.18 (kürzen)
1 x ln x (ln x ) x lim x ln x lim lim lim lim 0 x 0 1 x 0 1 x 0 x 0 1 x 0 $ 1! 2 " x x #x Beispiel 5.19 (erweitern)
1 2 x 2 x 2 2x 1 $ ! 2 x lim " x x 2x 1 lim lim 1 x # x
x x 2 2x 1 x 1 1 2 1 x x2
(3) Grenzwerte vom Typ „00“, „( )0“, „1 “ Durch Logarithmieren kann Typ (3) zunächst auf Typ (2) und dann durch geeignetes Kürzen auf Typ (1) zurückgeführt werden.
5.5 Untersuchung von Funktionen mit Hilfe
127
Beispiel 5.20 Gesucht ist der Grenzwert lim x x , x > 0 x 0
Zunächst wird der Grenzwert
lim ln x x lim x ln x 0
x 0
x 0
bestimmt (vgl.
Beispiel 5.18). Damit ist der Grenzwert lim x x = e = 1. 0
x 0
5.5 5.5.1
Untersuchung von Funktionen mit Hilfe ihrer Ableitungen Stetigkeit und Mittelwertsatz
Wenn eine Funktion y = f (x), x Df, an der Stelle x = x0, x0 Df, differenzierbar ist, dann ist sie dort auch stetig. Die Stetigkeit ist eine notwendige Voraussetzung für die Differenzierbarkeit. Mittelwertsatz Wenn die Funktion y = f (x), x Df, in einem abgeschlossenen Intervall [a, b] Df stetig und im offenen Intervall (a, b) differenzierbar ist, dann existiert eine Stelle c (a, b) derart, dass f (b) f (a ) , a < c < b, gilt. f ( c) ba
5.5.2
Monotonieverhalten
Wenn eine Funktion y = f (x), x Df, in einem Intervall I Df differenzierbar ist und ihre Ableitung ein konstantes Vorzeichen hat, dann ist f in I monoton. Speziell gilt: Eigenschaft von f (x) f ( x ) > 0 f ( x ) 0 f ( x ) < 0 f ( x ) 0
5.5.3
Folgerung f (x) ist streng monoton wachsend f (x) monoton wachsend f (x) streng monoton fallend f (x) monoton fallend
Extremwertbestimmung
Eine Funktion y = f (x), x Df, hat an der Stelle x0 Df ein relatives Maximum (bzw. ein relatives Minimum), wenn ein > 0 derart existiert, dass f (x) f (x0) (bzw. f (x) f (x0)) x (x0 , x0 + ) Df gilt.
E
128
5 Funktionen mit einer reellen Variablen
Gilt x Df f (x) f (x0) (bzw. f (x) f (x0)), so hat f an der Stelle x ein absolutes Maximum (bzw. ein absolutes Minimum). Notwendige Bedingung für relative Extrema
Es sei y = f (x), x Df, eine in (a, b) Df differenzierbare Funktion. Wenn f (x) bei x0 (a, b) ein relatives Extremum besitzt, dann ist f ( x0 ) = 0. Bemerkung (1) Diese Bedingung gilt nur für Bereiche, in denen die Funktion differenzierbar ist. Es werden also nicht die Intervallgrenzen und Punkte erfasst, in denen die Funktion nicht differenzierbar ist. In diesen Punkten ist die Funktion zur Extremwertbestimmung gesondert zu untersuchen (siehe Beispiel 5.22). (2) Die Bedingung f ( x ) = 0 allein genügt nicht zum Feststellen von Extremwerten. Die Punkte, die jedoch dieser Bedingung genügen, werden kritische oder stationäre Punkte genannt. Hinreichende Bedingung für relative Extrema
Es seien y = f (x), x Df, eine in (a, b) Df n-mal differenzierbare Funktion und x0 (a, b) ein stationärer Punkt von f (d. h. f ( x0 ) = 0). Die Funktion f hat dann an der Stelle x0 (a, b) ein Extremum, wenn für die Ableitungen f ( x0 ) f ( x0 ) ... f
( n 1)
( x0 ) 0, jedoch f ( n ) ( x0 ) 0 gilt
und n eine gerade Zahl ist. Dabei ist dieses Extremum ein Maximum, wenn f ( n ) ( x0 ) 0 , und ein Minimum, wenn f ( n ) ( x0 ) 0 ist. Alternativ kann die Existenz von relativen Extremwerten an stationären Punkten durch die Vorzeichenbetrachtungen der ersten Ableitung nachgewiesen werden. Wenn für y = f (x) in der Umgebung eines stationären Punktes die erste Ableitung existiert und das Vorzeichen wechselt, so besitzt die Funktion ein Extremum. (1) Erfolgt von links nach rechts der Wechsel von plus nach minus, so liegt ein relatives Maximum vor. (2) Erfolgt von links nach rechts der Wechsel von minus nach plus, so liegt ein relatives Minimum vor. (3) Erfolgt kein Vorzeichenwechsel in der Umgebung des kritischen Punktes, so liegt ein horizontaler Wendepunkt vor.
5.5 Untersuchung von Funktionen mit Hilfe
129
Beispiel 5.21: Maximierung einer ökonomischen Größe
Gegeben ist eine Ertragsfunktion z1 = 5 + 6x 0,5x und eine Kosten2 funktion z2 = 4 3x + x . 2 Es gilt: Gewinn = Ertrag Kosten, d. h., z = z1 z2 = 9 + 9x 1,5x Es ist der Gewinn in Abhängigkeit von x zu maximieren. Die Funktion z ist differenzierbar. Es gilt z´(x) = 9 3x = 0, woraus sich die Lösung x = 3 ergibt. Weiter ist z´´(x) = 3, sodass ein Maximum vorliegt. 2
Beispiel 5.22 K(x) Gegeben ist die folgende stückweise stetige 250 Kostenfunktion 810 x 20 10 x, 0 x 10 200 . K(x) MIN 810 15 10 x, 10 x x Gesucht ist das Kostenminimum in Abhängig- 150 0 5 10 15 x keit von x (siehe Abb. 5.4). Lösung 810 Abbildung 5.4 In beiden Fällen gilt K ( x ) 2 10 = 0 x mit der Lösung x = 9. Es gilt K(9) = 90 + 20 + 90 = 200. Kritisch ist die Unstetigkeitsstelle x = 10. Zum Vergleich wird K(10) = 81 + 15 + 100 = 196 berechnet. Dieser Wert liefert das Minimum der Kostenfunktion.
5.5.4
Krümmungsverhalten und Wendepunkte
Es sei y = f (x), x Df , eine Funktion, deren zweite Ableitung für alle x (a, b) Df existiere. Dann gilt: (1) f (x) ist in (a, b) genau dann konvex, wenn dort f ( x ) 0 ist. (2) f (x) ist in (a, b) genau dann konkav, wenn dort f ( x ) 0 ist. Wächst die Funktion f (x), gilt also f ( x ) 0 , so bedeutet f ( x ) 0 progressives Wachstum und f ( x ) 0 degressives Wachstum. Notwendige Bedingung für Wendepunkte
Es sei y = f (x), x Df, eine Funktion, deren zweite Ableitung in (a, b) Df existiert. Wenn f (x) einen Wendepunkt xw (a, b) besitzt, dann gilt f ( xw ) 0 . Hinreichende Bedingung für Wendepunkte Wechselt die zweite Ableitung der Funktion unter der obigen Voraussetzung das Vorzeichen für einen kritischen Punkt xw mit f ( xw ) 0 (oder gilt f ( xw ) 0 ), so ist x Wendepunkt.
E
5 Funktionen mit einer reellen Variablen
130
Kurvendiskussion Charakteristik 1. Schnittpunkte mit den Achsen
Bedingungen x = 0 (y - Achse) y = 0 (x - Achse)
2. Polstellen
Nenner = 0 Zähler 0
3. Extremwerte
0 Maximum f ( x ) 0 , f ( x ) 0 Minimum
4. Monotonie
0 monoton wachsend f (x) 0 monoton fallend
5. Wendepunkte
6. Krümmungsverhalten 7. Verhalten im Unendlichen 8. Asymptoten 9. Graphische Darstellung
5.5.5
f ( x ) 0 , f ( x ) wechselt Vorzeichen 0 konvex f ( x ) 0 konkav lim f ( x )
x
lim f ( x ) (ax b) = 0
x
Skizze
Anwendung in der Wirtschaft
Optimale Losgröße ("optimale Bestellmenge") Problem Ein Betrieb fertigt ein Erzeugnis, das ständig verbraucht wird. Der Verbrauch je Zeiteinheit sei konstant. Es wird in Losen gefertigt. Los: Fertigung einer endlichen Anzahl gleichartiger Teile mit einer Vorbereitungs- und Abschlusszeit (Rüstzeit)
Die Losgröße beeinflusst die Selbstkosten und die Lagerkosten: Je höher die Losgröße, desto größer die Lagerkosten und desto niedriger die Produktionskosten. gesucht: optimale Losgröße, d. h., Lagerkosten + Produktionskosten min
5.5 Untersuchung von Funktionen mit Hilfe
Lösung des Problems Bezeichnungen x Losgröße l Lagerkosten (spezifisch) u Lohn- und Materialkosten aller Teile r gesamter Produktionsumfang T betrachteter Zeitabschnitt
a c L(x) S(x)
Um r Erzeugnisse zu produzieren, müssen a den, denn es gilt: r = ax.
131
Anzahl der Lose Rüstkosten Lagerkosten Fertigungskosten
r Lose aufgelegt werx
Folgende Kosten können bestimmt werden: Lagerkosten = durchschn. Bestand Lagerkosten(spezifisch) Zeit x L( x ) l T 2 Fertigungskosten = Lohn- u. Materialk. + Rüstkosten Anzahl d. Lose cr r S ( x) u c a u , a x x Gesamtkosten = Lagerkosten + Fertigungskosten x r K ( x ) L( x ) S ( x ) l T u c 2 x Gesucht ist das Minimum der Gesamtkosten. Dazu wird die erste Ableil T cr 2 0. Die Lösungen dieser tung gleich null gesetzt, K ( x ) 2 x 2r c . Nur das positive Vorzeichen ist von lT 2c r Interesse. Die hinreichende Bedingung ergibt K ( x ) 3 0, womit x Gleichung lauten x
ein Minimum vorliegt. Die Lösung dieses Problems ist x
2r c . l T
Die dazugehörigen minimalen Kosten betragen K min u 2r c l T . (Nur im Fall u = 0 liefert der Schnittpunkt von L(x) und S(x) das Kostenminimum!) Beispiel 5.23 Für l = 10 € je Stück und Woche, c = 200 € je Los, T = 52 Wochen, u = 10 000 €, r = 1000 Stück ergibt sich: x
2 1 000 200 27,74 28 10 52
K (28) 10 000 2 1 000 200 10 52 24 422,21 €.
E
5 Funktionen mit einer reellen Variablen
132
Der Schnittpunkt (SP) von S(x) und L(x) liefert nur im Spezialfall u = 0 die minimalen Kosten. Dieses Beispiel macht den Unterschied deutlich. Er liegt in der Nähe von x = 53. Die dazugehörigen Kosten betragen K(53) = 27553,58 €. Dieser Wert ist wesentlich größer als das ermittelte Minimum bei x = 28 . (siehe Abb. 5.5).
K(x) 40000 K(x) = L(x) + S(x) 30000 MIN
20000
SP
10000 0
L(x)
0
20
40
60
S(x)
80
100 x
Abbildung 5.5
5.6 5.6.1
Integralrechnung Unbestimmtes Integral
Betrachtet wird eine beliebige Funktion y = f (x), x (a, b) R, und es wird eine Funktion gesucht, deren Ableitung gleich f (x) ist. Eine in (a, b) definierte Funktion F(x) heißt Stammfunktion von f (x), wenn für alle x (a, b) die Relation F ( x ) f ( x ) gilt. Ist F(x) eine Stammfunktion von f (x) in (a, b), so hat jede andere Stammfunktion von f (x) die Form F(x) + C, wobei C eine gewisse Konstante ist. Ist F(x) eine Stammfunktion von f (x), so wird der Ausdruck F(x) + C unbestimmtes Integral der Funktion f (x) genannt. Hierbei ist C eine beliebig wählbare Konstante. Das unbestimmte Integral wird mit dem Symbol net. Es gilt:
f ( x) d x
bezeich-
f ( x) d x F ( x) C
Integrationsregeln (1) Summen- und Faktorregel ( f ( x ) g ( x )) d x f ( x )d x g ( x )d x
a f ( x) d x a f ( x) d x,
a R
(2) Substitutionsmethode
Es sei z(x) eine differenzierbare Funktion, deren Wertebereich im Definitionsbereich von f (z) enthalten ist, sodass die mittelbare Funktion y = f [z(x)], x Dz, gebildet werden kann. Dann folgt aus f ( z )d z F ( z ) C mit der Substitution z = z(x), d z z ( x ) d x die Relation
f [ z ( x)] z ( x)d x F ( z ( x)) C.
5.6 Integralrechnung
133
Beispiel 5.24
x e
x2
dz 1 z 1 1 2 e dz e z C e x C 2x 2 2 2 dz dz z ( x ) 2 x, d x dx 2x
dx x e z
z( x ) x 2 ,
(3) Partielle Integration
Ist u(x) eine differenzierbare Funktion und v(x) eine Stammfunktion von v ( x ) , so gilt u( x ) v ( x ) d x u( x ) v ( x ) u ( x ) v ( x ) d x . Bemerkung Die partielle Integration ist die Umkehrung der Produktregel der Differenziation, sie wird angewandt, wenn der Integrand ein entsprechendes Produkt zweier Funktionen ist. Durch Vertauschen der beiden Faktoren u(x) und v(x) entsteht eine analoge Formel.
Typische Anwendungsfälle für die partielle Integration sind Funktionen vom Typ x n sin x , x n cos x , x n e x , x n ln x . Beispiel 5.25
xe
x
d x x e x 1 e x d x e x ( x 1) C ,
mit u( x ) x , u ( x ) 1, v ( x ) e x , v ( x ) e x
Grundintegrale
ad x a x C x n1 C n 1 x1n n x dx 1 n C 1 x d x ln x C 2 3 xd x 3 x C x r 1 r x dx r 1 C
x
n
dx
a R
e
x
n N
a
x
n N, n 1
sin x dx cos x C
x0
cos x dx sin x C
x0 r R , r 1 x0
dx e x C dx
ax C ln a
a 0, a 0
E
5 Funktionen mit einer reellen Variablen
134
5.6.2
Bestimmtes Integral
Der Grenzwert I
n
f ( i ) xi , max x 0 lim
i 1
i
xi xi xi 1 , i xi 1 , xi b
wird bestimmtes RIEMANNsches Integral genannt: I f ( x)d x a
x0 = a, xn = b Hauptsatz der Integralrechnung
Ist f (x) im Intervall [a, b] stetig und F(x) eine beliebige Stammfunktion von f (x), so gilt b
f ( x ) dx F (b) F (a ). a
Das ist eine Zurückführung des bestimmten Integrals auf das unbestimmte Integral (Stammfunktion). Integrationsregeln
(1) (2)
b
c
c
a b
b
a
f ( x) d x f ( x) d x f ( x)d x a b
(3)
(5)
b
a
a
a
f ( x) d x f ( x) d x a b
(4)
b
c1 f 1 ( x ) c2 f 2 ( x ) d x c1 f 1 ( x ) d x c2 f 2 ( x ) d x b
b
f ( x ) g ( x ) d x f ( x ) g ( x ) a f ( x ) g ( x ) d x b
a b
z (b )
a
a
z(a )
f ( z( x )) z ( x) d x f ( z) d z
Beispiel 5.26 2
x dx
3
x2 1
z( x ) x 2 1,
15 1 dz 5 10 0,926210 2 10 z z ( x )
dz 2x dx
5.6 Integralrechnung
135
Wird ein Bereich A der x, y-Ebene durch y = f (x), y = g(x), x = a, x = b mit f (x) g(x) begrenzt, so gilt für den Flächeninhalt der einb
geschlossenen Fläche A f ( x ) g ( x )d x . a
Beispiel 5.27 Zu bestimmen ist der Flächeninhalt der zwischen f (x) = x , g(x) = sin x und x = 0 liegenden Fläche (siehe Abb. 5.6).
A
sin x x dx
$ ! x # cos x x& 2 #" %& 0 2
1
5.6.3
2
2
1 2
1
y = sin x
0 -1
0
2
f(x)
A
1
2
4 x
3 y=x-
-2 2
2
-3
E
Abbildung 5.6
Uneigentliches Integral
Es werden zwei Typen uneigentlicher Integrale unterschieden: (1) Eine oder beide Integrationsgrenzen sind unendlich, der Integrand jedoch beschränkt. (2) Die Integrationsgrenzen sind endlich, der Integrand f (x) hat jedoch im Intervall [a, b] mindestens einen Pol (einen Punkt, in dessen Umgebung f (x) unbeschränkt ist). Die Funktion f (x) sei in [a, +) definiert und in jedem endlichen A
Teilintervall der Form [a, A] integrierbar, sodass
f ( x )d x
für jedes
a
endliche A > a existiert. Dann wird durch
A
a
a
f ( x) d x Alim f ( x) d x
das uneigentliche Integral der Funktion in [a, +) definiert, falls der Grenzwert existiert und endlich ist. Die Funktion f (x) heißt in diesem Falle im unbeschränkten Intervall [a, +) integrierbar.
5 Funktionen mit einer reellen Variablen
136
Es sei f (x) eine in einem endlichen Intervall [a, b] mit a < b gegebene Funktion, die für x = b eine Polstelle besitzt. In jedem Intervall [a, b '] sei f (x) beschränkt und integrierbar. Dann wird durch b
b'
a
a
f ( x)dx 'lim f ( x ) dx 0
das uneigentliche Integral der unbeschränkten Funktion f (x) für x [a, b] definiert, falls der Grenzwert existiert und endlich ist. In diesem Fall heißt die unbeschränkte Funktion in [a, b] integrierbar. Bemerkung Diese Definitionen gelten für die unteren Integrationsgrenzen analog. Beispiel 5.28
dx
x2 2
A
dx
A x 2
lim
2
5.6.4
A
! 1 ( 1+ $ 1 ! 1$ lim # & lim # * - & A " x % A " A ) 2,% 2 2
Integration stückweise stetiger Funktionen
Viele Funktionen in der Wirtschaft sind stückweise stetig, beispielsweise Funktionen, die einen Lagerbestand beschreiben oder Kostenfunktionen, die durch Rabattgewährung bestimmt werden. Derartige Funktionen werden integriert, indem jeweils von einer Unstetigkeitsstelle bis zur nächsten integriert und die Teilergebnisse summiert werden. n xk 1
b
f ( x) d x f ( x) d x k 0 xk
a
Beispiel 5.29 Gegeben ist die folgende Dichtefunktion 0 für x 0 x f (x) für 0 x 2 2 0 für 2 x Gesucht ist die zugehörige Verteilungsfunktion
f(x) f(x) = x/2 1
f(x) = 0 0
z
F (z )
f ( x ) d x.
(siehe Abschnitt 8.1.3)
Abbildung 5.7
A=1 2
f(x) = 0 x
5.6 Integralrechnung
137
Lösung Es liegen drei Intervalle vor, die wegen unterschiedlicher Zuordnungsvorschriften und einer Unstetigkeitsstelle bei x = 2 einzeln berücksichtigt werden müssen (siehe Abb. 5.7). (1) < z < 0
F( z )
(2) 0 z < 2
F( z )
z
z
z
0
f ( x ) d x 0 dz 0 f ( x ) dx
(3) 2 < z
5.6.5
z
0
F( z )
f ( x ) dx
z
x x2 dx 0 2 4 0
z
0 dx
z
2
0 2
x x dx 0 dx 0 2 4 0 2
0 dx
z2 4
2
0 1 0 1 0
Numerische Integration
Nicht zu jeder Funktion lässt sich leicht eine Stammfunktion finden. Derartige bestimmte Integrale können mit numerischen Methoden näherungsweise ermittelt werden. ba Das Intervall [a, b] wird in n Teilintervalle der Länge h = zerlegt: n [xi 1, xi] , i = 1, 2, ..., n mit x0 = a, und xn = b, xi a i h Sehnen-Trapezregel ( f ( x0 ) f ( xn ) n1 + f ( xi ) -- Rn A h ** 2 i 1 ) , Rn
( b a) 2 12n 2
f ( ), (a, b)
Beispiel 5.30 Zu bestimmen ist das folgende Integral (Verteilungsfunktion der Normalverteilung, vgl. Abschnitt 8.1.3)
. 0 (1)
1
1
x2 2
e dx. 2 0 Die einzelnen Berechnungen erfolgen in der nebenstehenden Tabelle. Die Werte werden mit dem Faktor multipliziert und anschließend addiert.
Rn gibt den Fehler an und kann abgeschätzt werden. i
xi
f(xi)
Faktor
0
0,0
1,00000
0,5
0,50000
1
0,1
0,99501
1,0
0,99501
2
0,2
0,98020
1,0
0,98020
3
0,3
0,95600
1,0
0,95600
4
0,4
0,92312
1,0
0,92312
5
0,5
0,88250
1,0
0,88250
6
0,6
0,85327
1,0
0,85327
7
0,7
0,78371
1,0
0,78371
8
0,8
0,72615
1,0
0,72615
9
0,9
0,66698
1,0
0,66698
10
1,0
0,60653
0,5
0,30327
Summe:
8,55112
E
138
5 Funktionen mit einer reellen Variablen
Es gilt somit . 0 (1)
1 2
1 8,551 2 0,341 14. (Zum Vergleich: Der ex10
akte Wert beträgt 0,3413..., vgl. Tafel 1, mit . 0(x) =.(x) 0,5)
Simpson-Regel Die SIMPSON-Regel liefert genauere Werte, da die zu integrierende Funktion im Gegensatz zur Sehnen-Trapezregel nicht durch Sehnen sondern durch Parabelbögen angenähert wird. Die Anzahl n der Unterteilungen muss gerade sein. Ungerade Knotenpunkte werden mit dem Faktor 4, gerade mit dem Faktor 2 gewichtet. n n $ ! 1 2 2 h # & A # f ( x0 ) f ( xn ) 4 f ( x2 i 1 ) 2 f ( x2 i ) & 3 # i 1 i 1 & % "
5.6.6
Anwendung der Integralrechnung
Sind für ökonomische Kenngrößen Grenzfunktionen bekannt, so lässt sich die Ausgangsfunktion durch Integration ermitteln. Kostenfunktion Ist K ( x ) eine Grenzkostenfunktion, dann lässt sich K(x) nach dem Hauptsatz der Integralrechnung auf folgende Weise ermitteln x
K ( t ) d t K ( x ) K (0). 0
x
Daraus folgt K ( x ) K ( t ) d t K (0). Dabei 0
x
stellen K(0) = Kf die fixen Kosten und
K (t )d t Kv die
variablen
0
Kosten dar.
Erlösfunktion Durch Integration kann aus einer Grenzerlösfunktion E ( x ) die Erlösx
funktion ermittelt werden
E (t ) d t E ( x ) E (0).
Ist x die Menge des
0
x
Absatzes, so ist E(0) = 0, und damit
E (t ) d t E ( x ). 0
Gewinnfunktion Die Gewinnfunktion G(x) ist die Differenz aus der Erlösfunktion E(x) x
und der Kostenfunktion K(x), d. h. G ( x ) E (t ) K (t ) d t K f . 0
Der Deckungsbeitrag als Differenz von Erlös E(x) und variablen Kosten
5.6 Integralrechnung
139
x
Kv(x) ist dann G D ( x ) E (t ) K (t ) d t . 0
Konsumentenrente Die Funktion p(x) gibt den Preis eines Gutes in Abhängigkeit von der Nachfrage an, p0 ist der tatsächlich gezahlte Preis, dieser entspricht einer Nachfrage x0 (Gleichgewichtspunkt). Dann wird das folgende Integral als Konsumentenrente bezeichnet, K R ( x0 )
x0
p( x ) d x p0 x0 .
Das ist der Betrag, den die Konsumenten
0
insgesamt bereit zu zahlen gewesen wären, wenn jeder den für ihn höchsten akzeptablen Preis gezahlt hätte. Produzentenrente Die Funktion pA(x) gibt den Preis eines Gutes in Abhängigkeit vom Angebot an, p0 ist der tatsächlich gezahlte Preis, dieser entspricht einer Nachfrage x0 (Gleichgewichtspunkt). Diejenigen Anbieter, die zu einem geringeren Preis verkauft hätten, erhalten dadurch einen zusätzlichen Gewinn, dessen Summe als Produ-
zentenrente bezeichnet wird, PR ( x0 ) p0 x0
x0
p A ( x ) d x. 0
Zahlungsströme, Warenströme Die stückweise stetige Funktion R(x) beschreibe eine Geschwindigkeitsfunktion (Geldeinheiten/Zeiteinheit). t2
Dann ist das zwischen t1 und t2 eintreffende Kapital K R (t ) d t . t1
Stellt dagegen R(x) die Geschwindigkeitsfunktion für einen Warenstrom dar (Mengeneinheiten/Zeiteinheit), lässt sich entsprechend die zwischen t2
t1 und t2 eintreffende Warenmenge W bestimmen, W R( t ) d t . t1
Gegenwartswert kontinuierlicher Zahlungsströme Wird eine kontinuierliche Verzinsung mit dem Zinssatz i vorausgesetzt, gilt für den Gegenwartswert eines Kapitals K0 zum Zeitpunkt t = 0 , das durch einen kontinuierlichen Zahlungsstrom R(t) zwischen t1 und t2 t2
entsteht, K 0 R(t ) e i t dt. tt
E
140
5 Funktionen mit einer reellen Variablen
5.7 5.7.1
Differenzialgleichungen Einführung
Bei der Untersuchung ökonomischer Modelle treten oft Gleichungen auf, in denen neben der gesuchten Funktion auch deren Ableitung enthalten ist. Eine Beziehung der Form F(x, y, y', y", ... y(n)) = 0 zwischen der unabhängigen Variablen x, einer Funktion y = y(x) und deren Ableitungen y', y", ... heißt gewöhnliche Differenzialgleichung (Dgl.). Bemerkung Treten mehrere unabhängige Variable und ihre partiellen Ableitungen auf, so liegt eine partielle Differenzialgleichung vor. Charakterisierung der Differenzialgleichungen (1) nach der Anzahl der unabhängigen Variablen - eine unabhängige Variable: gewöhnliche Dgl. - mehrere unabhängige Variable: partielle Dgl. (2) nach der höchsten vorkommenden Ableitungsordnung (3) nach dem Grad der Potenzen der abhängigen Variablen und ihrer Ableitungen Eine Funktion y = y (x), die die Differenzialgleichung identisch erfüllt, heißt Lösung der Differenzialgleichung.
5.7.2
Separable Differenzialgleichungen
Separable Differenzialgleichungen 1. Ordnung sind Differenzialgleichungen, die auf die Form y f ( x ) g ( y ) gebracht werden können.
Die Methode "Trennen der Veränderlichen" ist eine Methode zur Lösung von separablen Differenzialgleichungen 1. Ordnung. Vorgehensweise
(1) Trennen der Veränderlichen (2) Integrieren (3) Umformen nach
dy f ( x)d x, g ( y ) 0 g ( y) dy g( y) f ( x)d x y = y(x)
5.7 Differenzialgleichungen
141
Beispiel 5.31 Gegeben ist die Differenzialgleichung 2x 2 y y . Lösung dy dx 1 dy dx y (1) Trennen der Veränderlichen: , ,x0 y y y 2x 2 2x 2 dy dx 1 (2) Integration: , ln y ln C , C 0 (Diese spezielle y 2x 2x 2 Form der Konstante ist zweckmäßig für die weitere Umformung.) 1
(3) Umformen: y C e 2x liefert die Lösung der Differenzialgleichung
(C = 0 liefert auch eine Lösung, wie eine Probe zeigt). Die Konstante C kann nach bestimmten Anfangsbedingungen angepasst werden. Beispiel 5.32: Wachstumsmodell Die Veränderung eines Geldbetrages K´(t ) in einer Zeiteinheit durch Verzinsung ist dem Wert des Geldbetrages K(t ) proportional: K (t ) K (t ), Proportionalitätskonstante, K´(t ) > 0. Die oben dargestellte Methode liefert die Lösung des Problems: dK dt dK dK K (t ) , , dt , dt , K K K K (t )
ln K t ln C ,
K C e t .
Wird jetzt für C das Anfangskapital K0 angenommen, für t = n und = ln(1+ i ), mit i als Zinssatz, ergibt sich die Zinseszinsformel: K n K (n ) K 0 (1 i ) n .
Ermittlung von Funktionen mit vorgegebener Elastizität Aus einer vorgegebenen relativen Elastizität kann über die Lösung einer Differenzialgleichung die zugehörigen Funktionen bis auf eine multiplikative Konstante ermittelt werden. f ( x) Gegeben ist die relative Elastizität in der Form f ( x) x und es f ( x) gelte x > 0 und f (x) > 0. Die relative Elastizität f (x ) sei vorgegeben und
die Funktion f (x) nicht bekannt. Dann liegt eine Differenzialgleichung für f (x) vor. Ist z. B. f (x) eine lineare Funktion der Form a · x + b dann gilt mit y = f (x): x y (a x b) y oder y
d y a x b a x b d x. y bzw. y x x
E
142
5 Funktionen mit einer reellen Variablen
dy a x b d x liefert ln y a x b ln x ln C. y x Daraus kann die allgemeine Lösung in folgender Form dargestellt werden, f (x) = y e a xb ln xln C C x b e a x . Zur Ermittlung der Konstanten C ist ein Anfangswert erforderlich. Eine ausführliche Darstellung und weitere Anwendungen sind z. B. bei Tietze, 2000, zu finden.
Die Integration
5.7.3
Lineare Differenzialgleichungen 1. Ordnung
Als gewöhnliche lineare Differenzialgleichung 1. Ordnung wird eine Gleichung der Form y p( x ) y q ( x ) bezeichnet. y abhängige Variable x unabhängige Variable q(x) Störfunktion Ist q(x) = 0, so heißt die Dgl. homogen, ist q(x) 0, so heißt die Dgl. inhomogen.
Hierbei sind:
Die allgemeine Lösung y einer inhomogenen Differenzialgleichung setzt sich additiv aus der allgemeinen Lösung yh der zugehörigen homogenen Differenzialgleichung und einer speziellen Lösung yp der inhomogenen Differenzialgleichung y = yh + yp zusammen. Bemerkung Um die allgemeine Lösung einer inhomogenen Dgl. 1. Ordnung zu bestimmen, ist zunächst die Lösung der zugehörigen homogenen Differenzialgleichung zu berechnen (Trennen der Veränderlichen) und dann eine spezielle Lösung der inhomogenen Differenzialgleichung zu ermitteln (Variation der Konstanten).
Die Lösung der homogenen Differenzialgleichung lautet in allgemeiner . Form y c e Die Struktur der Lösung der inhomogenen Differenzialgleichung entspricht der Struktur der Lösung der zugehörigen homogenen Differenzialgleichung, wenn in der homogenen Lösung die Integrationskonstante durch eine geeignete Funktion ersetzt wird. p ( x ) dx
Das Ersetzen der Konstanten c durch eine Funktion c(x) heißt Variation der Konstanten.
5.7 Differenzialgleichungen
143
Vorgehensweise (1) Die Funktionen p ( x ) dx y c( x ) e und
y c( x) e c( x ) e p( x ) werden in die Ausgangsgleichung eingesetzt. (2) Es ergibt sich eine zu lösende Differenzialgleichung für c'(x). (3) Durch Einsetzen von c(x) in die allgemeine homogene Lösung ergibt sich eine spezielle Lösung der inhomogenen Dgl. 1. Ordnung. (4) Berücksichtigung einer evtl. vorgegebenen Randbedingung. p ( x ) dx
p ( x ) dx
Beispiel 5.33 2
y 2x y x e x mit der Bedingung y(0) = 1 (1) Allgemeine Lösung der zugehörigen homogenen Differenzialgleichung über Trennen der Veränderlichen: dy dy y 2x y , 2 x d x, 2 x dx, ln y x 2 ln C , C 0, y 0 y y x 2 ln C
2
yh e C ex (2) Spezielle Lösung der gegebenen inhomogenen Differenzialgleichung über Variation der Konstanten: 2
Ansatz: y C( x ) e x ergibt differenziert 2
2
y C ( x ) e x C( x ) 2x e x . Beides in die Ausgangsdifferenzialgleichung einsetzen: 2
2
2
2
C ( x ) e x C( x ) 2x e x 2x C( x ) e x x e x . Die beiden mittleren Ausdrücke fallen heraus, sodass 2
C ( x ) e x x e x
2
und somit C ( x ) x gilt.
x x 2 x2 e . und die spezielle Lösung y p 2 2 (3) Bilden der allgemeinen Lösung der Differenzialgleichung 2 x 2 x2
x 2 x2 e . y y h y p C ex e C 2 2 2
Es ist C( x )
(4) Berücksichtigung der Anfangsbedingung y = 1 für x = 0 2 0
1 C e 0 C . Damit wird C = 1 und die spezielle Lösung ys, die 2
x 2 x 2 der Anfangsbedingung genügt, lautet y s 1 e . 2
E
6 Funktionen mit mehreren Variablen
6
Funktionen mit mehreren Variablen
6.1
Begriff und Eigenschaften
Eine reellwertige Funktion mit n Variablen y = f (x), x Df Rn,
ist eine eindeutige Abbildung f einer Teilmenge Df Rn auf eine Teilmenge Wf R. Df : Definitionsbereich von f Wf : Wertebereich von f Beispiel 6.1 Betrachtet wird eine Zielfunktion Z = f(x1, x2, x3) = 3x1 + 5x2 + 2x3 aus der 3 linearen Optimierung. Der Definitionsbereich ist Df R , im Falle einer Nichtnegativitätsbedingung xi 0, i = 1, 2, 3. Der Wertebereich der Funktion ist R.
Der Punkt a Rn habe die Eigenschaft, dass in jeder Umgebung K(a, r) Punkte x a enthalten sind, die zum Definitionsbereich der Funktion y = f (x), x Df Rn, gehören. Außerdem gelte a Df, sodass f (a) erklärt ist. Gilt lim f ( x ) f (a ) , so heißt f (x) im Punkt a stetig. xa
Wenn die Funktion diese Eigenschaft für alle x aus einer Menge M Df besitzt, so heißt sie in M stetig. (Zur Definition der Grenzwertes x a siehe z. B. Köhrt u.a., 1993.) Sind y = f (x), x Df Rn, und y = g(x), x Df Rn, in x = a stetig, dann ist es auch jede Linearkombination c1 f ( x ) c2 g ( x ) , c1, c2 R, ihr Produkt f ( x ) g ( x ) sowie ihr
Quotient
f ( x) , wobei g(x) 0. g ( x)
Beispiel 6.2 Die Produktionsfunktion x x (r1, r2 ) 3 r10,7 r20,3 gibt einen Zusammen-
hang zwischen der Ausbringmenge (Output) x in Abhängigkeit von den Einsatzmengen r1, r2 zweier Produktionsfaktoren an. Diese Funktion ist für r1, r2 > 0 stetig, da für diesen Bereich auch die einzelnen Faktoren
r10,7 , r20,3 stetig sind.
6.2 Partielle Ableitungen, Gradient, Hesse-Matrix
6.2
145
Partielle Ableitungen, Gradient, Hesse-Matrix
Die für Funktionen mit einer Variablen bekannten Begriffe Grenzwert, Stetigkeit und Ableitung werden auf Funktionen mit mehreren Variablen übertragen. Wenn der Grenzwert f (a1 x1 , a2 , ..., an ) f (a1 , a2 , ..., an ) lim x10 x1 existiert, so wird er partielle Ableitung erster Ordnung der Funktion y = f (x) nach x1 im Punkt x = a genannt. f (x)
x1 x a
Schreibweise: f x1 ( a ) oder
Bemerkungen (1) Die Definitionen der Ableitungen nach den anderen Variablen verlaufen analog. (2) Alle Variablen, nach denen nicht differenziert wird, werden als konstant angesehen. Dabei sind die Regeln für das Differenzieren bei Funktionen mit einer unabhängigen Variablen entsprechend anzuwenden. (3) Die partiellen Ableitungen höherer Ordnung werden durch Wiederholung des für die Ableitung erster Ordnung bekannten Vorgehens gebildet. Beispiel 6.3
x2 y ,z0 z Die partiellen Ableitungen erster Ordnung lauten
Gegeben ist die Funktion f ( x, y , z )
x2 y 2x y x2 , fy , fz
. z z z2 Die partiellen Ableitungen zweiter Ordnung sind fx
f xx
2y , z
fzx
f xy
2x y z
2
,
2x , z
fzy
f xz
x2 z
2
,
2x y z
2
,
f zz 2
f yx
2x , z
f yy 0,
f yz
x2 z2
,
x2 y z3
Satz von SCHWARZ
Die Funktion y = f (x), x Df R2, besitze in einer Menge M Df die partiellen Ableitungen f x1 x2 ( x ) und f x2 x1 ( x ), weiterhin seien diese dort stetig. Dann gilt f x 1 x 2 ( x ) f x 2 x 1 ( x ).
M
146
6 Funktionen mit mehreren Variablen
Dieser Satz gilt entsprechend für mehr als zwei Variable und für Ableitungen höherer Ordnung. Gegeben sei eine Funktion f (x) mit x Df Rn. Ist dann (1) f partiell differenzierbar nach x1, x2, ..., xn, so heißt der Vektor f x1 ( x ) f x ( x ) grad f ( x ) 2
f xn ( x ) Gradient von f an der Stelle x.
(2) f zweimal partiell differenzierbar nach x1, x2, ..., xn, so heißt die Matrix f x1x1 ( x ) f x1x2 ( x ) f x1xn ( x ) f x x ( x ) f x2 x2 ( x ) f x2 xn ( x ) H ( x) 2 1 f f f ( ) ( ) ( ) x x x xn x2 xn xn xn x1 HESSE-Matrix von f an der Stelle x. Beispiel 6.4 Unter Ausnutzung der Berechnung aus Beispiel 6.3 lassen sich für die
Funktion f ( x, y , z ) 2x y z x2 grad( f ) z x2 y
z2
x2 y , z 0, Gradient und HESSE-Matrix angeben: z
und H ( x , y , z )
2y z 2x z 2x y z
2
2x z 0
x2 z2
2x y z2 2 x
2 z x2 y 2 z 3
Wegen des Satzes von SCHWARZ ist die HESSE-Matrix symmetrisch.
6.3
Vollständiges Differenzial, Fehlerrechnung und Elastizität
Wie bei Funktionen mit einer Variablen ist es von Interesse, möglichst einfach einen Zusammenhang zwischen den Funktionswerten für "leicht veränderte" Variable und dem ursprünglichen Funktionswert herzustellen. Dabei sei f ( x ) f ( x1 x1 , x 2 x 2 , , x n x n ) f ( x1 , x 2 , , xn ) f ( x x) f ( x)
6.3 Vollständiges Differenzial, Fehlerrechnung
147
Es sei y = f (x), x Df R2, eine Funktion und a Df fest vorgegeben. Wenn für f (a) die Darstellung f ( a ) f x1 ( a ) x1 f x 2 ( a ) x2 x r ( x ) möglich ist, wo-
bei x
x1 2 x2 2
und r ( x ) eine nichtlineare Funktion
von x mit der Eigenschaft lim r ( x ) 0 ist, dann wird f in x = a x0
total oder vollständig differenzierbar genannt.
Der bezüglich x lineare Anteil von f (a) wird totales oder vollständiges Differenzial der Funktion im Punkt x = a genannt und mit df (a) bezeichnet: d f ( a ) f x1 ( a ) d x1 f x2 ( a ) d x2 Allgemein gilt näherungsweise:
f ( a ) f x1 ( a ) x1 f x2 ( a ) x 2 f x3 ( a ) x 3 Bei bestimmten Anwendungen ist es auch sinnvoll, die Betragsstriche wegzulassen. Auf diese Weise kann dann zwischen Abweichungen nach unten oder oben unterschieden werden. Beispiel 6.5 Gegeben ist eine Produktionsfunktion S( A, K ) 100 A0,6 K 0,4 . Dabei ist S(A, K) das Sozialprodukt, A der Arbeitsinput und K der Kapitalinput. Die gegenwärtigen Werte seien für A = 20 und K = 40. Wie ändert sich S(A, K) näherungsweise, wenn A um 10 % fällt und K um 10 % steigt? Lösung Da Änderungen nach oben und nach unten gleichzeitig berücksichtigt werden müssen, werden in der Fehlerformel die Betragsstriche weggelasS S A K . sen: S( A,K ) A K Die partiellen Ableitungen lauten: S S 100 0,6 A 0,4 K 0,4 , 100 0,4 A 0,6 K 0,6 . Die absoluten ÄndeA K rungen von A und K betragen A 2 und K 4. Damit ist die Änderung von S näherungsweise
S(20, 40 ) 60 20 0,4 40 0,4 ( 2) 40 20 0,6 40 0,6 4 52,78. Dieses entspricht einer relativen Änderung S( 20, 40 )
52,78 0,02. Damit würde das Sozialprodukt um 2 % S(20, 40 ) 2 639,02 sinken.
M
148
6 Funktionen mit mehreren Variablen
Partielle Elastizität
Ist f (x) 0 für alle x Df Rn, so wird der Term f x ( x ) xi f ( x ), xi ( y , xi ) i f ( x) partielle Elastizität der Kennziffer y = f (x) bezüglich xi im Punkt x genannt. Bemerkung f ( x ), xi gibt näherungsweise an, um wie viel Prozent sich y = f (x) ändert, wenn xi um ein Prozent vergrößert wird und alle anderen Einflussgrößen konstant bleiben. Beispiel 6.6 Betrachtet wird die gleiche Funktion wie in Beispiel 6.5. Die partiellen Elastizitäten lauten dann A S A (S( A, K ), A) 60 A 0,4 K 0,4 0,6 A S 100 A 0,6 K 0,4
K S K 40 A 0,6 K 0,6 0,4 K S 100 A 0,6 K 0,4 Wenn sich also A um 1 % ändert, so hat das eine Änderung von S um 0,6 % zur Folge. Entsprechend ändert sich S um 0,4 %, wenn sich K um 1 % ändert. Eine 10 %-ige Verringerung von A lässt somit S um 6 % fallen. Eine Steigerung von K um 10 % bewirkt eine Steigerung von S um 4 %. Erfolgt beides gleichzeitig, fällt S um 2 % (siehe Beispiel 6.5).
(S( A, K ), K )
6.4
Extremwertbestimmung
Eine Funktion y = f (x), x Df Rn, hat im Punkt x0 Df ein relatives Maximum (bzw. relatives Minimum), wenn in einer Umgebung von x stets f (x) f (x0) (bzw. f (x) f (x0)) gilt. Notwendige Bedingung für Extremwerte
Wenn y = f (x), x Df Rn, in x0 Df ein relatives Extremum besitzt und in diesem Punkt alle partiellen Ableitungen 1. Ordnung existieren, dann gilt notwendig f xi ( x ) 0, i 1, 2, , n . Speziell für n = 2 gilt f x1 ( x ) 0,
f x2 ( x ) 0.
Besitzt y = f (x), x Df Rn, alle partiellen Ableitungen 1. Ordnung, so heißt jede Lösung des Gleichungssystems f xi ( x ) 0, i 1, 2, , n stationärer Punkt der Funktion f (x).
6.4 Extremwertbestimmung
149
Hinreichende Bedingung für Extremwerte im R2
Gilt für eine Funktion y = f (x), x Df R2, f x1 ( x ) 0 und f x2 ( x ) 0 , so besitzt f (x) an der Stelle x = x0 einen relativen Extremwert, wenn gilt ( x 0 ) f x1 x1 ( x 0 ) f x 2 x 2 ( x 0 ) f x21 x 2 ( x 0 ) 0 .
Gilt zusätzlich
f x1x1 ( x 0 ) > 0, so liegt ein Minimum vor, f x1x1 ( x 0 ) < 0, so liegt ein Maximum vor.
Ist dagegen ( x 0 ) < 0, so existiert kein Extremwert, ( x 0 ) = 0, so ist keine Entscheidung möglich. Beispiel 6.7
64 64 , x, y 0. x y Zur Ermittlung der Extremwerte werden alle partiellen Ableitungen erster Ordnung berechnet und diese gleich null gesetzt: 64 64 S x y 2 0 und S y x 2 0 . Dieses Gleichungssystem wird x y gelöst, indem die erste Gleichung nach y aufgelöst und in die zweite Gleichung eingesetzt wird. Gegeben ist die Funktion S( x, y ) x y
x4 x3 0 . Aus dem x 1
2 2 2 64 64 y 64 x letzten Ausdruck sind die Lösungen x = 0 und x = 4 ablesbar. Die Lösung x = 0 entfällt wegen x 0. Aus x = 4 folgt über Einsetzen in die erste Gleichung y = 4. Damit existiert ein stationärer Punkt P(4, 4), der nun weiter zu untersuchen ist. Für die hinreichenden Bedingungen werden die partiellen Ableitungen 128 128 zweiter Ordnung benötigt: S xx 3 , S yy 3 , S xy 1. x y Im stationären Punkt P(4, 4) nehmen diese Ableitungen folgende Werte an: S xx (4, 4 ) 2, S yy (4, 4 ) 2, S xy (4, 4 ) 1 . Daraus ergibt sich die hinreiy
64
, damit x
64
x
64 x 4
x
2 chende Bedingung ( x, y ) S xx S yy S xy 22 1 3 0 .
Damit existiert ein Extremwert. Da Sxx > 0, liegt ein Minimum vor. Der zugehörige minimale Funktionswert beträgt S(4, 4) = 48.
Bemerkung Das aus den partiellen Ableitungen resultierende Gleichungssystem ist nur in speziellen Fällen lösbar. Eine Lösungsmethode für nichtlineare Gleichungssysteme ist im Abschnitt 7.3.3 dargestellt.
M
150
6 Funktionen mit mehreren Variablen
Allgemeine hinreichende Bedingung für Extremwerte
Der Ausdruck Q( x ) x T H (a ) x wird als quadratische Form bezeichnet (H(a) ist die HESSE-Matrix für einen Punkt a = x0). Gilt Q(x) > 0 für alle x o, so heißt die Matrix H (a) positiv definit. Gilt Q(x) < 0 für alle x o, so heißt die Matrix H (a) negativ definit. Gibt es Vektoren x, y mit Q(x) > 0 und Q(y) < 0, so heißt H (a) indefinit. Bemerkung Ist H(a) positiv definit, so ist H(a) negativ definit. Eine symmetrische Matrix A ist genau dann positiv definit, wenn sämtliche Hauptabschnittsdeterminanten (siehe Abschnitt 2.1.1) positiv sind. Es sei y = f (x), x Df Rn, und y= f (x) besitze stetige partielle Ableitungen zweiter Ordnung nach allen Variablen. a = x0 sei ein stationärer Punkt von f. Dann besitzt f an der Stelle a ein relatives Minimum bzw. Maximum, wenn die HESSE-Matrix 2 f (a ) H (a ) : xi xk i 1, 2, , n; k 1, 2, , n positiv bzw. negativ definit ist.
6.5
Extremwerte mit Nebenbedingungen
Gegeben ist eine Funktion y = f (x), x Df Rn, und eine Nebenbedingung g(x) = 0, unter der die Funktion f ein Extremum annehmen soll. Notwendige Bedingung (LAGRANGEsche Multiplikatorenmethode)
Für eine Hilfsfunktion F(x, ) = f (x) + g(x) gilt unter der Voraussetzung, dass sie partiell differenzierbar ist: Fxi ( x 0 , ) 0, i 1, 2, F ( x0 , ) 0, falls im Punkt x0 ein Extremum mit Nebenbedingungen vorhanden ist (stationärer Punkt).
Die hinreichende Bedingung für dieses Problem ist sehr kompliziert. Ersatzweise können verschiedene Punkte aus der Umgebung unter Berücksichtigung der Nebenbedingung eingesetzt werden, um zu prüfen, ob sie dort kleinere bzw. größere Werte als das Extremum ergeben. Dabei ist auf Vollständigkeit zu achten. (Siehe auch Fichtenholz, 1964.)
6.6 Methode der kleinsten Quadrate (MkQ)
151
Beispiel 6.8
Gegeben ist die Produktionsfunktion x 3 r10,7 r20,3 . Unter der Bedingung x = 300 soll die Kostenfunktion K ( r1, r2 ) 7 r1 3 r2 minimal werden. Lösung
F( r1, r2 , ) 7 r1 3 r2 ( 3 r10,7 r20,3 300) Fr1 7 2,1 r1 0,3 r20,3 0,
Fr2 3 0,9 r10,7 r2 0,7 0,
F 3 r10,7 r20,3 300 0. Die beiden ersten Gleichungen werden nach umgestellt und durcheinander dividiert. Dieses liefert r1 r2 . Die Ausnutzung der dritten Gleichung ergibt dann die Lösung r1 r2 100.
6.6
Methode der kleinsten Quadrate (MkQ)
Für die Analyse oder Prognose ist es häufig erforderlich, eine stetige Funktion y f ( x , a ), a (a0 , a1 , , am 1 ) R m zu ermitteln, die eine gegebene Wertetabelle (Messreihe) "möglichst gut" annähert. Dabei seien n Wertepaare (xi, yi ), i =1, 2, ..., n, gegeben. Solche Funktionen können Geraden y a1 x a0 y a2 x 2 a1 x a0
Parabeln
Exponentialfunktionen y a1 e a 2 x a0 (Transformation notwendig) a1 a0 x oder andere sein (siehe Abschnitt 8.2.2). Solche Funktionen werden als Regressionsfunktionen oder als Trendfunktionen (bei einer zeitlichen Abhängigkeit) bezeichnet. y
Hyperbeln
Optimalitätskriterium Die Summe der Quadrate der Differenzen der Messpunkte yi von den f(x) Funktionswerten f (xi, a) soll in Ab20 hängigkeit von a ein Minimum werden (siehe Abb. 6.1), d. h., n
S (a ) ! f ( xi , a ) yi i 1
15
2
min, a R m
S (a ) 0, j 0, 1, , m 1 . aj Es liegt eine Extremwertaufgabe für die Variablen a0, a1, ..., am 1 vor. also
10 5 0
0 2 4 Abbildung 6.1
6
8
10 x
M
6 Funktionen mit mehreren Variablen
152
Dabei ist im Allgemeinen ein nichtlineares Gleichungssystem zu lösen. Die partiellen Ableitungen führen auf ein lineares Gleichungssystem, wenn die Größen ai in den Ansatzfunktionen linear vorkommen. Das Vorgehen wird mit der linearen Ansatzfunktion y a1 x a 0 n
demonstriert. Es gilt: S ( a 0 , a1 ) ! (a1 xi a0 yi ) 2 min i 1
Die partiellen Ableitungen liefern n S (a0 , a1 ) 2 ! (a1 xi a0 yi ) 0 a0 i 1 n S (a0 , a1 ) 2 ! (a1 xi a0 yi ) xi 0 a1 i 1 Daraus entsteht das folgende Gleichungssystem bestehend aus den Normalgleichungen mit symmetrischer Koeffizientenmatrix. n
n
n
i 1 n
i 1 n
i 1
i 1
i 1
a0 n
a1 ! xi ! yi
a0 ! xi a1 ! xi2 ! xi yi Die hierin auftretenden Summen können aus den gegebenen Wertepaaren bestimmt und das lineare Gleichungssystem kann gelöst werden. Beispiel 6.9 Im Verlaufe von 10 Jahren wurden bei einer Maschine folgende Reparaturkosten ermittelt. Jahr i = xi 1 2 3 4 5 6 7 8 9 10
Kosten Ri = yi
0,5 1
2
1,5
2,5 3,5
4
5
4,5
5,5
Der Kostenverlauf ist durch eine lineare Trendfunktion anzunähern. Lösung Zur Berechnung der Summen i xi yi xi2 kann eine Tabelle genutzt xiyi werden. Das entsprechende 1 1 0,5 0,5 1 Gleichungssystem lautet: 2 2 1 2 4 3 3 2 6 9 10a0 + 55a1 = 30 4 4 1,5 6 16 55a0 + 385a1 = 211,5 5 5 2,5 12,5 25 Es besitzt die Lösungen 6 6 3,5 21 36 a0 = 0,1 und a1 = 0,564. 7 7 4 28 49 Damit lassen sich die Repa8 8 5 40 64 raturkosten näherungsweise 9 9 4,5 40,5 81 beschreiben durch 10 10 5,5 55 100 R(i ) 0,564 i 0,1. Summe: 55 30,0 211,5 385
7
Numerische Verfahren
Problemstellung Der Einsatz der Computer ermöglicht die Behandlung von komplizierten wirtschaftlichen Problemen, die häufig nur mit numerischen Verfahren zu lösen sind. Numerische Verfahren sind Betrachtungsgegenstand der Numerischen Mathematik. Diese beschäftigt sich im Gegensatz zu den vorangegangenen Abschnitten mit der Problematik des Rechnens mit Zahlen. Während zum Beispiel in den Gebieten Lineare Algebra und Analysis mit mathematischen Größen exakt gerechnet werden kann, können bei der numerischen Berechnung unterschiedliche (objektive) Fehler wirksam werden. Das Spektrum der Auswirkungen dieser Fehler geht von unwesentlich bis katastrophal, d. h., das erhaltene numerische Resultat hat mit der Lösung des Problems nicht das Geringste zu tun. Somit sind Lösungen, die mit numerischen Verfahren gewonnen wurden, immer gute oder schlechte Näherungslösungen. Ein teilweiser Ausweg sind symbolische Berechnungen mit dem Computer.
7.1
Fehlerarten
(1) Modellierungsfehler Modellierungsfehler entstehen durch eine idealisierte (vereinfachte) mathematische Beschreibung des Problems, z. B. werden konstante Preise, unveränderliche Rahmenbedingung (Restriktionen) vorausgesetzt oder Zusammenhänge linearisiert. (2) Datenfehler Datenfehler entstehen bei der Erfassung von Daten, z. B. durch Messfehler oder bei der statistischen Datenerfassung. (3) Rundungsfehler bzw. Abbruchfehler Rundungsfehler bzw. Abbruchfehler entstehen bei der Darstellung der Zahlen im Rechner. Rundungsfehler sind abhängig von der gewählten Zahlendarstellung. Abbruchfehler entstehen durch Weglassen der restlichen Stellen. (4) Verfahrensfehler Verfahrensfehler treten auf, wenn z. B. stetige Probleme durch diskrete Probleme näherungsweise beschrieben werden. Z. B. Differenzialgleichungen durch Differenzengleichungen, bzw. Ableitung durch Differenzenquotient, Trapezregel bei der numerischen Integration.
N
154
7 Numerische Verfahren
7.2
Zahlendarstellungen
Die Menge der reellen Zahlen kann auf einem Rechner nicht realisiert werden. Es ist die folgende Zahlendarstellung unter Verwendung einer endlichen und festen Anzahl von Mantissenstellen möglich. n2
Die Darstellungsform z d i B i wird als Computerzahl bei n1
zeichnet. B die Basis des Zahlensystems, die Ziffern mit di {0, ..., B 1} di n1 , n2 ganze Zahlen. Mit n1 < 0 werden gebrochene Zahlen, mit n1 = 0 ganze Zahlen dargestellt. Anstelle des Dezimalkommas wird häufig der Dezimalpunkt verwendet. Dabei bedeuten:
Beispiel 7.1 0 1 2 3 4 B = 10: 3.141610 = 3·10 + 1·10 +4·10 + 1·10 + 6·10 2 1 0 22410 = 2·10 + 2·10 + 4·10 2 1 0 B = 8: 2248 = 2 · 8 + 2 · 8 + 4 · 8 = 14810
Es wird zwischen den folgenden Zahlendarstellungen auf dem Computer unterschieden: ganze Zahlen (Integer), Festkommazahlen oder Festpunktzahlen (Fixpoint), Gleitkommazahlen oder Gleitpunktzahlen (Floatingpoint). Bei allen Zahlendarstellungen ist die maximale Mantissenlänge n vorgegeben, bei Gleitkommazahlen darüber hinaus noch der Exponentenbereich. Jede Gleitkommazahl y wird im Rechner wie folgt dargestellt: y = ± d1.d2d3 ... dn · B k oder y = ±.d1d2 ... dn · B k Sie besteht aus dem Vorzeichen (+ oder ), einer n-stelligen Mantisse (d1 ... dn ), dem Dezimalpunkt (.), der Basis (B) und dem Exponenten (k). Diese Darstellungen werden codiert, zum Beispiel mit Hilfe der BinärCode-Darstellung (BCD), bei der die einzelnen Ziffern jeweils durch eine Folge von vier Bits (0 oder 1) ersetzt werden. Eine immer größere Bedeutung erlangt die Gleitkommadarstellung nach dem IEEE-Standard. Da nur Zahlen mit endlich vielen Ziffern auf dem Computer dargestellt werden können, entstehen Rundungs- bzw. Abbruchfehler. Damit sind folgende mathematische Gesetze nicht mehr uneingeschränkt gültig: Assoziativgesetz der Addition Kommutativgesetz der Addition Distributivgesetz Durch geeignete Formelauswahl kann die Auswirkung von Rundungsfehlern reduziert werden.
7.3 Fehleranalyse
7.3
155
Fehleranalyse
Konditionszahl Liegt eine stetig differenzierbare Funktion vor, mit der ein Funktionswert y = f (x) berechnet werden soll, ist es möglich, die Auswirkung eines Fehlers x von x durch f ( x) f ( x) x auszudrücken. Die Größe K f ( x ) bestimmt die Verstärkung bzw. Verringerung des Eingangsfehlers bei der Funktionswertberechnung. Sie wird häufig als absolute Konditionszahl bezeichnet. Bei Funktionen mit mehreren Variablen gilt das entsprechende (siehe Fehlerformel Abschnitt 6.3). Spezielle Konditionszahlen gibt es auch für die Lösung eines linearen Gleichungssystems A x = b. Wird mit A die Koeffizientenmatrix bezeichnet, so gibt die Zahl cond( A) A A 1 über die Matrixnorm (siehe Abschnitt 7.4) die Verstärkung oder Verringerung des relativen Fehlers der Lösung x im Vergleich zu den relativen Fehlern von A und b an. Ist die Konditionszahl cond (A) sehr viel größer als eins, können sich Fehler der Eingangsdaten entsprechend stark auf die Lösung auswirken. Intervallarithmetik Vorteil: Die auftretenden Fehler werden vollständig erfasst. Nachteil: Die ermittelten Fehler können die tatsächlichen Auswirkungen beträchtlich überschätzen. (1) Intervallzahl: x x | x x x
(2) Intervalladdition: (3) Intervallsubtraktion:
x y x y, x y x y x y , x y
(4) Intervallmultiplikation:
x y min x y, x y , x y, x y , max x y, x y , x y, x y
(5) Intervalldivision:
x / y x 1 / y, (6) Intervalllänge:
mit 1 / y 1 / y , 1 / y , 0 y
d ( x) x x
Alle weiteren Rechenoperationen auf dem Rechner lassen sich auf die oben genannten Grundoperationen zurückführen. Bei der Realisierung dieser Operationen auf dem Rechner ist es sinnvoll, die Intervallrand-
N
156
7 Numerische Verfahren
punkte nach außen zu runden, d. h., der linke Randpunkt wird stets abgerundet, der rechte stets aufgerundet. Somit werden wirklich alle Fehler erfasst. Beispiel 7.2 F Z C berechnet. Hierbei bedeuten F das Fremdkapital, Z die zur Verfügung stehenden Zahlungsmittel und C das Cash-Flow. Das Fremdkapital wird in der Planungsphase voraussichtlich zwischen 310 T€ und 340 T€ liegen. Bei den zur Verfügung stehenden Zahlungsmitteln wird mit 130 T€ bis 160 T€ gerechnet und das Cash-Flow wird auf 550 T€ bis 600 T€ geschätzt. In welchem Bereich wird sich dann voraussichtlich der Verschuldungsgrad V bewegen? Der dynamische Verschuldungsgrad V wird nach der Formel V
Lösung Verwendet wird die Intervallrechnung (Angaben in T€) mit F = [310, 340], Z = [130, 160], C = [550, 600]: V
[310, 340] [130, 160] [150, 210] [0.25, 0.38]. [550, 600] [550, 600]
Der dynamische Verschuldungsgrad V wird sich voraussichtlich zwischen 0.25 und 0.38 bewegen.
7.4
Grundbegriffe der Funktionalanalysis
Betrachtet werden Punkte im n-dimensionalen Raum Rn (Vektoren). Zwischen derartigen Punkten kann auf (unendlich) verschiedene Arten ein Abstand definiert werden. Drei wichtige Abstandsdefinitionen: y1 y y 2 Elemente des Rn. y n
x1 x Es seien x 2 , x n
Dann kann der Abstand folgendermaßen beschrieben werden: n
xi yi
(1) d1 ( x , y )
i 1
2
EUKLIDischer Abstand
(2) d 2 ( x , y ) max xi yi , i = 1, 2, ..., n Maximum-Abstand i n
(3) d 3 ( x , y ) xi yi i 1
Manhattan-Abstand
7.4 Grundbegriffe der Funktionalanalysis
157
Beispiel 7.3 Es ist der Abstand zwischen den beiden Punkten x = (2, 4) und y = (3, 1) mit diesen drei Abstandsdefinitionen zu bestimmen und zu vergleichen. Lösung (1) d1( x, y )
2 3 2 4 1 2
1 25 26 5,099
(2) d 2 x ,y max 2 3 , 4 1 max (1, 5) 5 (3) d 3 ( x, y ) 2 3 4 1 1 5 6 Die Abstände sind unterschiedlich. Geometrisch können sie mit Hilfe eines rechtwinkligen Dreiecks gedeutet werden. Die Definition (1) entspricht der Länge der Hypotenuse, die Definition (2) entspricht der Länge der längeren der beiden Katheten, (3) der Summe der Länge beider Katheten.
Bemerkung Dieser Abstandsbegriff ist z. B. auch geeignet, Unterschiede zwischen verschiedenen Unternehmen bez. einer vorgegebenen Anzahl von Kennziffern (evtl. gewichtet) zu messen. Beispiel 7.4 Von zwei Unternehmen sind die folgenden Kennziffern bekannt: Vermögensstruktur in %: 70 bzw. 78; Eigenkapitalquote in %: 85 bzw. 80; Cash-Flow-Rate in %: 40 bzw. 43. Dann beträgt der Unterschied in % gemäß d1 = 9,99, d2 = 8, d3 = 16.
Metrischer Raum Eine Menge X ist ein metrischer Raum, wenn für zwei beliebige Elemente x, y X eine nichtnegative reelle Zahl d(x, y) definiert ist, die Abstand zwischen den Elementen x und y heißt, und den folgenden Axiomen genügt: (1) Äquivalenz d(x, y) = 0 genau dann, wenn x = y ist. (2) Symmetrie d(x, y) = d(y, x) (3) Dreiecksungleichung d(x, z) d(x, y) + d(y, z); x, y, z X Die Abstände d1, d2 und d3 erfüllen alle Axiome dieser Definition. Norm eines Vektors Die Norm eines Vektors ist eine reellwertige Funktion mit folgenden Eigenschaften: (1) Es gilt x 0, x = 0 genau dann, wenn x = 0. (2) Für alle x1, x2 X gilt x1 x2 x1 x 2 . (3) Für alle x X und c R gilt c x c x .
N
7 Numerische Verfahren
158
Wichtige Vektornormen sind die EUKLIDische Norm:
x
Summen- oder Betragsnorm:
x
Maximumnorm:
x
n
xi2
2
i 1
n
xi
1
i 1
max xi , i = 1, 2, ..., n i
Für Vektoren aus dem n-dimensionalen Raum gilt allgemein folgenx x 2 x 1. de Ungleichung: Bemerkung Die Norm kann u.a. auch dazu genutzt werden, eine Rangfolge verschiedener Unternehmen bez. vorgegebener Kennziffern aufzustellen. Beispiel 7.5 Für die Unternehmen aus Beispiel 7.4 ergeben sich die folgenden Bewertungen: EUKLIDische Norm: 117,15 bzw. 119,7; Summennorm: 195 bzw. 201; Maximumnorm: 85 bzw. 80. D. h., nach den ersten beiden Normen steht das zweite Unternehmen an erster Stelle, bei der Bewertung nach der Maximumnorm jedoch das erste.
Neben Vektornormen finden auch noch spezielle Matrixnormen Verwendung. Zu den Eigenschaften einer Vektornorm kommt hier bei verketteten Matrizen eine vierte Eigenschaft bezüglich der Multiplikation hinzu. Mit A wird eine Matrix vom Format (m, n) bezeichnet, 0 ist die Nullmatrix. Norm einer Matrix Die Norm einer Matrix ist eine reellwertige Funktion mit folgenden Eigenschaften: (1) Es gilt A 0 , A 0 genau dann, wenn A = 0. (2) Es gilt
A B A B .
(3) Es gilt c A c A für c R. (4) Es gilt A B A B (falls A und B verkettet). Zwei wichtige Matrixnormen für eine Matrix A( m, n ) (aij ) sind die Zeilensummennorm: A
n
z
max aij , i = 1, 2, .., m i
j 1
Spaltensummennorm: A
m
s
max aij , j = 1, 2, .., n j
i 1
7.5 Iterationsverfahren
7.5
159
Iterationsverfahren
Iterationsverfahren werden in der Numerischen Mathematik häufig angewandt. Das Grundprinzip besteht darin, dass eine bestimmte Rechenvorschrift solange wiederholt wird, bis die Lösung des Problems mit der erforderlichen Genauigkeit erreicht worden ist. Ein solches Verfahren, das NEWTON-Verfahren, wurde im Abschnitt 5.4.4 dargestellt. Benötigt werden ein Startwert bzw. ein Startvektor, eine Iterationsvorschrift sowie Aussagen zur Konvergenz.
7.5.1
Fixpunktiteration bei nichtlinearen Gleichungen
Betrachtet wird eine Gleichung f (x) = 0 mit einer in der Regel reellen Variablen x. Diese Gleichung wird so umgeformt, dass sie die Darstellung x = g(x) (Fixpunktdarstellung) erhält. Beispiel 7.6 Form f(x) = 0 Umformung x = g(x)
ln x x + 3 = 0 x 3 x = g1(x) = ln x + 3 oder x = g2(x) = e
Jede Lösung x* = x der Gleichung x = g(x) wird als Fixpunkt bezeichnet. Aus der Gleichung x = g(x) wird ein Iterationsprozess entwickelt, indem eine Folge {xk} konstruiert wird: xk 1 g( xk ) . Diese Folge konvergiert, wenn der Anstieg der Funktion g(x) in der Umgebung des Fixpunktes betragsmäßig kleiner als 1 ist: Die Funktion g(x) sei in einem Intervall I in der Umgebung des Fixpunktes x* stetig und differenzierbar, außerdem bilde die Funktion g das Intervall I in sich ab (d. h. g(x) I ). Dann konvergiert die Iterationsfolge x k 1 g( x k ) , k = 0, 1, 2, ... für einen beliebigen Startwert x0 I, wenn für jedes x I die Ungleichung g ( x ) m 1 gilt. Bei vielen in der Wirtschaft verwendeten Funktionen liegt zwar Stetigkeit aber nicht Differenzierbarkeit vor (z. B. Einkommenssteuer, Energietarife), hier liefert die LIPSCHITZ-Bedingung Aussagen über die Konvergenz: Eine Funktion f (x) genügt in einem Intervall I einer LIPSCHITZBedingung mit der LIPSCHITZ-Konstanten K, wenn f ( x1 ) f ( x2 ) K x1 x2 x1, x2 I gilt.
N
160
7 Numerische Verfahren
Die Funktion g(x) sei in einem Intervall I definiert und genüge in I einer LIPSCHITZ-Bedingung mit der LIPSCHITZ-Konstanten K < 1, und es existiere ein Fixpunkt x*. Dann konvergiert die Iterationsfolge für einen beliebigen Startwert x0 I gegen den Fixpunkt x*. Die Funktion g(x) sei in einem Intervall I definiert und genüge in I einer LIPSCHITZ-Bedingung mit der Konstanten K < 1, und es existiere ein Fixpunkt x*. Sind der Fixpunkt x* der Gleichung x = g(x) sowie sämtliche Glieder xk der Iterationsfolge in I enthalten, gilt für den Iterationsfehler die Abschätzung K x * xk x k x k 1 . 1 K Die Bestimmung der LIPSCHITZ-Konstanten K ist in der Regel recht xk 1 xk kann sie aber näherungsweise beschwierig. Durch K xk xk 1 stimmt werden.
7.5.2
Iterative Lösung linearer Gleichungssysteme
Es existiert eine Vielzahl von Iterationsverfahren zur Lösung von linearen Gleichungssystemen. Eines dieser Verfahren ist das Folgende: JACOBI-Verfahren Betrachtet wird ein Gleichungssystem der Form A·x = b. Dabei sei A eine quadratische Koeffizientenmatrix, x der Vektor der Unbekannten und b der Vektor der rechten Seite. Zur Lösung des Gleichungssystems wird jeweils die i-te Gleichung nach xi aufgelöst, d. h., n a b ij xi i x j , aii 0, i 1, 2, , n. aii j 1 aii j i
Als Startvektor kann der Nullvektor x (0) = o oder ein evtl. günstigerer Wert gewählt werden. Iterationsvorschrift für das JACOBI-Verfahren: xi( k 1)
bi aii
n
aij
a
j 1 ii j i
x (j k ) , aii 0, i 1, 2, , n, x (j0) 0.
Übersichtlicher ist die Matrizenschreibweise. Dabei wird folgende Matrix B = D A bestimmt, wobei D eine Diagonalmatrix ist, die die Diagonalelemente aii der Matrix A enthält.
7.5 Iterationsverfahren
161
0 a11 0 0 0 a 22 x ( k 1) D 1 B x ( k ) D 1 b mit D (0) 0 x =o 0 ann Die Komponenten des (k+1)-ten Lösungs(näherungs)vektors werden aus den Komponenten des k-ten Lösungs(näherungs)vektors berechnet. Eine Matrix A(n, n) heißt diagonaldominant, wenn die Diagonalelemente jeder Zeile betragsmäßig größer sind als die Summe der Beträge der restlichen Elemente dieser Zeile: aii aij , i, j = 1, 2, ..., n. i j
Ist die vorliegende Koeffizientenmatrix diagonaldominant, so konvergiert das JACOBI-Verfahren für einen beliebigen Startvektor.
7.5.3
Iterative Lösung nichtlinearer Gleichungssysteme
Nichtlineare Gleichungssysteme treten zum Beispiel bei Optimierungsproblemen auf (Extremwertaufgaben für Funktionen mit mehreren Variablen). Ein recht kompliziertes Beispiel hierfür ist das Standortproblem (vgl. Abschnitt 9.1). Ein nichtlineares Gleichungssystem kann allgemein in vektorieller Form f1 ( x ) x1 f 2 ( x) x2 geschrieben werden: F(x) = o (Nullvektor), mit x , F . f ( x) x n n Fixpunktiteration Das Gleichungssystem wird wie bei Problemen mit einer Variablen auf die Form x = G(x) gebracht. G(x) sei in der Umgebung U von x* eine Abbildung in sich und es gelte für der Startwert x(0) U. Die Iterationsvorschrift lautet x(k + 1) = G(x(k)). Die Iterationsfolge konvergiert, wenn für die JACOBI-Matrix g1 g1 xn x1 die Bedingung G ( x ) k 1 G ( x ) gn gn xn x1 für alle x in der Umgebung des Fixpunktes x* erfüllt ist. (Siehe z. B. Schwetlick/Kretzschmar, 1991.)
N
162
7 Numerische Verfahren
Diese Bedingung ist oft schwer nachzuweisen. Für das Standortproblem führt dieses Lösungsverfahren jedoch zur Lösung. NEWTON-RAPHSON-Verfahren (Verallgemeinerung des NEWTON-Verfahrens) Ausgangspunkt für das NEWTON-RAPHSON-Verfahren ist die Form F(x) = o. Benötigt wird weiterhin die zugehörige JACOBI-Matrix F '(x). Iterationsvorschrift implizit:
F ( x ( k ) ) F ( x ( k ) ) ( x ( k 1) x ( k ) ) o. In jedem Schritt ist ein lineares Gleichungssystem zu lösen.
explizit:
x ( k 1) x ( k ) F 1 ( x ( k ) ) F ( x ( k ) ) In jedem Schritt ist die JACOBI-Matrix von F zu invertieren.
Die implizite Vorschrift ist weniger aufwendig, da in jedem Schritt nur ein lineares Gleichungssystem zu lösen ist. Zur Vereinfachung kann die im ersten Schritt ermittelte JACOBI-Matrix in jedem Schritt benutzt werden (vereinfachtes NEWTON-Verfahren) oder es werden die Werte der Ableitung jeweils näherungsweise über einen Differenzenquotienten ermittelt (siehe Abschnitt 7.10), indem die folgende Formel sinngemäß auf die zu ermittelnden partiellen Ableitungen angewandt wird: d f ( x ) f ( x h) f ( x h)
, h genügend klein. dx 2h Notwendige Voraussetzung für die Konvergenz ist die Nichtsingularität der JACOBI-Matrix. Praktisch erfolgt die Konvergenzuntersuchung durch Überprüfung der folgenden Bedingung: x ( k 1) x ( k ) ! , ! gewünschte Genauigkeit. Beispiel 7.7 Zu lösen ist das nichtlineare Gleichungssystem:
2
2
f1 (x1, x2) = x1 + x1 x2 + x2 19 = 0 f2 (x1, x2 ) = x1 + x1 x2 + x2 11 = 0.
f1 f1 x1 x 2 2 x1 x 2 x1 2 x 2 F f2 f2 1 x 2 x1 1 x2 x1 Mit den Startwerten x1 = 1 und x2 = 0 liefert die explizite Iterationsvorschrift
Die zugehörige JACOBI-Matrix lautet:
1
1 2 1 18 9,667 x (1) x (0 ) F 1 x ( 0 ) F x ( 0 ) 0 1 2 10 0,667 5,544 . Dieses kann fortgesetzt werden, Ein weiterer Schritt liefert x ( 2) 0,769 bis die Lösung x1 = 3 und x2 = 2 näherungsweise erreicht wird.
7.6 Direkte Lösungsverfahren der linearen Algebra
7.6
163
Direkte Lösungsverfahren der linearen Algebra
Ausgangspunkt der Betrachtungen ist ein lineares Gleichungssystem der Form A · x = b. Das Prinzip dieser Lösungsverfahren besteht darin, die Koeffizientenmatrix des Gleichungssystems mit Hilfe von Hauptelementen so zu transformieren, dass die Lösung leicht ermittelt werden kann. Beim GAUSS-Algorithmus wird eine Dreiecksmatrix konstruiert. Anschließend erfolgt eine Rückrechnung von unten nach oben (siehe Abschn. 2.3.7). Bei der Basistransformation wird durch die Transformation eine Diagonalmatrix aufgebaut, die Lösung ist sofort ablesbar (siehe Abschn. 2.3.4). Für die numerische Lösung ist es sinnvoll, um Rundungsfehler gering zu halten, als Hauptelement immer das betragsmäßig größte Element auszuwählen. Dieses Vorgehen wird Pivotisierung genannt. Es wird unterschieden zwischen: Zeilenpivotisierung Hier wird das betragsmäßig größte Element in der Hauptzeile gesucht. Spaltenpivotisierung
Hier wird das betragsmäßig größte Element in der Hauptspalte gesucht.
globale Pivotisierung
Es wird das betragsmäßig größte Element sowohl in der Hauptzeile als auch in der Hauptspalte gesucht.
Beim GAUSS-Algorithmus wird häufig die Spaltenpivotisierung (auch partielle Pivotisierung genannt) genutzt. Dagegen bietet sich bei der Basistransformation die globale Pivotisierung an.
7.7
Lösungsverfahren für Bandmatrizen
Der Rechenaufwand zur Lösung linearer Gleichungssysteme ist recht hoch. Zum Beispiel erfordert der GAUSS-Algorithmus mindestens n2 Speicherplätze (n - Anzahl der Unbekannten) und mehr als n3/3 Rechenoperationen. In bestimmten Anwendungsfällen (z. B. bei der SplineInterpolation) treten Gleichungssysteme mit einer Koeffizientenmatrix auf, in der in jeder Zeile jeweils maximal 3 von null verschiedene Koeffizienten stehen: links und rechts vom Diagonalelement und das Diagonalelement selbst. Eine solche Matrix wird als Tridiagonalmatrix bezeichnet. Sie hat die Bandbreite 3. Allgemein wird eine Matrix als Bandmatrix bezeichnet, wenn Nicht-Null-Elemente nur in einem bestimmten Abstand von der Diagonale auftreten. Für den Spezialfall Tridiagonalmatrix wird nun ein Algorithmus vorgestellt, der nur auf die Nicht-Null-Elemente zurückgreift.
N
164
7 Numerische Verfahren
Ausgangspunkt ist tems A · x = b. a1 g1 c1 a2 g 2 A 0
die folgende Koeffizientenmatrix des Gleichungssys-
cn1
0 g n1 an
Lösungsalgorithmus (spezieller GAUSS-Algorithmus) u1 a1 (1) LU - Zerlegung c li i , ui 1 ai 1 li gi , i 1, , n 1 ui (2) Vorwärtseinsetzen y1 b1 ( y - Hilfsvektor) yi bi li 1 yi 1 , i 2, , n (3) Rückwärtseinsetzen y bn n un ( b - Lösung)
bi yi gi bi 1 / ui , i n 1, n 2, , 1
Die Lösung x ist durch den so transformierten Vektor b gegeben. (Siehe auch Schwetlick/Kretzschmar, 1991.)
7.8
Pseudolösungen
In der Praxis treten häufig nichtlösbare lineare Gleichungssysteme auf. Solche Gleichungssysteme werden durch unverträgliche Bedingungen hervorgerufen. Eine Lösung derartiger Probleme ist also nicht möglich. Es ist manchmal aber sinnvoll, nach der Lösung eines ähnlichen Gleichungssystems zu suchen, die möglichst wenig die Bedingungen des ursprünglichen Gleichungssystems verletzt. Diese kann mit Hilfe der Methode der kleinsten Quadrate realisiert werden. A·x = b sei ein unlösbares Gleichungssystem. Die Forderung lautet dann A x b
2 2
min .
Durch Differenzieren und Umformungen entsteht unter bestimmten Voraussetzungen ein lösbares Gleichungssystem, dessen Lösung das ursprüngliche System möglichst wenig verletzt, AT·A·x = AT·b. Die entsprechenden Gleichungen werden als Normalgleichungen bezeichnet.
7.9 Interpolation
165
Die Lösung dieses Gleichungssystems wird als Pseudolösung oder verallgemeinerte Lösung bezeichnet (siehe z. B. Locher, 1993). Diese Pseudolösung in das ursprüngliche Gleichungssystem eingesetzt, liefert den Defekt d = A x b. Beispiel 7.8 Gegeben ist das folgende unlösbare Gleichungssystem x1 2x2 = 9 2x1 2x2 = 9 x1 + 4x2 = 3 Bestimmen der Pseudolösung Die Koeffizientenmatrix und der Vektor der rechten Seite lauten: 9 1 2 A 2 2 , b 9 . Die Matrix A wird transponiert: 3 1 4
1 2 1 und mit A und b multipliziert. A T 2 2 4 6 6 30 , A T b A T A 6 24 12 Dadurch entsteht das Gleichungssystem 6x1 + 6x2 = 30 6x1 + 24x2 = 12 mit der Lösung x1 = 6 und x2 = 1. Der Defekt gibt an, um welche Größe jede Gleichung verletzt wird. Er beträgt in diesem Fall 1 6 d A b 1 . 1 1
7.9
Interpolation
Interpolation bedeutet, vorgegebene Funktionswerte in geeigneter Weise miteinander zu verbinden. Dabei gibt es unendlich viele Möglichkeiten. Die einfachste Form ist es, dafür Strecken zu nutzen, sodass ein Polygonzug entsteht. Weiterhin können Polynome unterschiedlichen Grades verwandt werden. Entscheidend bei der Auswahl des Typs der Interpolationsfunktion ist das zu erreichende Ziel. Eine Interpolation ist nur dann sinnvoll, wenn die vorgegebenen Funktionswerte genau getroffen werden müssen. Das ist insbesondere bei technischen Konstruktionen der Fall, beispielsweise im Schiffbau und im Karosseriebau. Hier soll darüber hinaus eine möglichst glatte Oberfläche erzielt werden. Mit Hilfe eines Computers können solche Linien bzw. Flächen optisch dargestellt werden. Bei der Approximation ist es das Ziel, eine komplizierte Funktion durch eine einfachere darzustellen, wobei die dabei entstehenden Abwei-
N
166
7 Numerische Verfahren
chungen möglichst gering sein sollen. Die Interpolation stellt somit einen Spezialfall der Approximation dar. Eine häufige Problemstellung besteht darin, eine gegebene Messreihe durch eine möglichst einfache geeignete Funktion zu beschreiben. Diese kann mit Hilfe der Methode der kleinsten Quadrate erfolgen (siehe Abschnitt 6.6). Bei praktischen Problemstellungen ist das geeignete Verfahren auszuwählen. Unterliegen zum Beispiel die Messwerte zufälligen Schwankungen (in der Wirtschaft z. B. Preise, Umsatz, Kosten, Gewinn), so ist eine Interpolation unsinnig. In diesen Fällen ist die Methode der kleinsten Quadrate mit einer geeigneten Ansatzfunktion anzuwenden. Dürfen sich die Messwerte (insbesondere bei technischen Problemen) in bestimmten Toleranzbereichen bewegen, ist die Anwendung von ausgleichender Interpolation (z. B. Ausgleichs-Splines) sinnvoll. Diese Methode stellt eine Zwischenstufe zwischen der reinen Interpolation und der Methode der kleinsten Quadrate dar. Weiterhin können auch komplizierte Funktionen näherungsweise durch einfachere ersetzt werden (siehe z. B. Schwetlick/Kretzschmar, 1991).
7.9.1
Klassische Interpolation
Aufgabenstellung Gegeben sind n + 1 Wertepaare (xi, yi), i = 0, 1, 2, ..., n. Gesucht wird ein Polynom P(x) n-ten Grades der Form
P(x) = a0 + a1x + a2 x2 + ... + an x n mit zu bestimmenden ai. Dabei ist die Forderung P(xi) = yi xi zu erfüllen. Sind n + 1 Zahlenpaare (xi, yj) mit xi xj für i j gegeben, ist das Interpolationspolynom eindeutig bestimmt. Interpolation nach LAGRANGE Zur Erfüllung der Forderung P(xi) = f (xi) , i = 0, 1, 2, ..., n werden die gegebenen x-Werte in das Polynom eingesetzt. So entsteht ein Gleichungssystem bestehend aus n + 1 Gleichungen mit n + 1 Unbekannten.
a0 + a1x0 + a2x02 + ... + an x0n = y0 a0 + a1x1 + a2x12 + ... + an x1n = y1 . . . a0 + a1xn + a2xn2 + ... + an xnn = yn Dieses Gleichungssystem ist eindeutig lösbar.
7.9 Interpolation
167
Beispiel 7.9 Für folgende Wertepaare ist ein Polynom i 0 1 2 3 3. Grades zu ermitteln. xi 0 1 2 4 Lösung y 1 0 2 1 i Das entsprechende Gleichungssystem lautet a0 = 1 a0 + a1 + a2 + a3 = 0 a0 + 2a1 + 4a2 + 8a3 = 1 a0 + 4a1 + 16a2 + 64a3 = 2 Dieses Gleichungssystem hat die Lösung: a0 = 1, a1 = 0,583333, a2 = 0,625, a3 = 0,208333. Somit lautet die interpolierende Funktion 3 2 y = 0,20833x 0,625000x 0,583333x + 1 (siehe Abbildung 7.1). y
3 2 1 0 1 2 0
1
2
3
4
x
7.9.2
Abbildung 7.1
Spline-Interpolation
Im Gegensatz zur klassischen Interpolation wird die Interpolationsfunktion durch Polynome niedrigeren Grades geeignet zusammengesetzt. Dadurch entsteht ein relativ glatter Kurvenzug. Die Werte xi werden als Stützstellen bezeichnet, yi = f(xi) sind die dazugehörigen Funktionswerte. Zwei wichtige Verfahren sollen vorgestellt werden, die lineare SplineInterpolation und die Spline-Interpolation 3. Grades. Lineare Spline-Interpolation Aufgabenstellung Gegeben sind n + 1 Wertepaare (x i , y i ) , i = 0, 1, ..., n. Gesucht ist für jedes Intervall [x i 1 , x i ] eine lineare Funktion si (x), i = 1, ..., n, die der Bedingung s i + 1 ( x i ) = s i ( x i ) = y i, i = 1, 2, ..., n 1 genügt. Lösung Für jedes Teilintervall wird aus den zwei Randpunkten mit den Wertepaaren (x i 1 , y i 1 ) und (x i , y i ) die entsprechende Geradengleichung ermittelt.
N
7 Numerische Verfahren
168
y
yi yi 1 y yi 1
x i
xi 1 yi 1 , i 1, 2, , n xi xi 1 xi xi 1
Beispiel 7.10 Die folgenden Wertepaare sind durch eine i Spline-Funktion 1. Grades zu verbinden. xi Lösung yi Intervall Funktion [0,1] y = x + 1 [1,2] y = x + 1 [2,4] y = 1,5x 4 (vgl. Abbildung 7.2)
y
0 0 1
1 1 0
2 2 1
3 4 2
3 2 1 0 1 2 0
1
2
3
4
x
Abbildung 7.2
Spline-Interpolation 3. Grades Bei der Spline-Interpolation 3. Grades (kubische Spline-Interpolation) besteht in den Stützstellen die Forderung, dass die Funktion dort zweimal stetig differenzierbar ist. Aufgabenstellung Gegeben sind n + 1 Wertepaare (xi, yi) , i = 0, 1, ..., n. Für jedes Intervall [xi1, xi] ist eine Funktion si (x), i = 1, ..., n, (Polynom 3. Grades) zu bestimmen mit den folgenden Eigenschaften: (1) Stetiger Übergang in den Stützstellen si+1(xi) = si(xi) = yi, i = 1, 2, ..., n 1 (2) Gleicher Anstieg in den Stützstellen si 1 ( xi ) si ( xi ), i = 1, 2, ..., n 1 (3) Gleiche Krümmung in den Stützstellen (das wird durch Übereinstimmung der zweiten Ableitungen in den Stützstellen erreicht) si 1 ( xi ) si( xi ) , i = 1, 2, .., n 1 Diese Bedingungen führen auf ein lineares Gleichungssystem mit zwei freien Parametern.
7.9 Interpolation
169
Allgemeine Lösung Die Länge der Teilintervalle, die unterschiedlich sein kann, wird mit hi bezeichnet. Für das i-te Teilintervall hat die Funktion folgendes Aussehen (i = 1, 2, ..., n; hi = xi xi1):
x x 3 m x xi1 3 y mi1hi2 xi x si ( x) mi 1 i i i 1 6hi 6hi 6 hi
m h2 yi i i 6
x xi 1 hi
Die unbekannten Größen mi können aus dem folgenden Gleichungssystem ermittelt werden. Für eine eindeutige Lösung sind zwei zusätzliche Randbedingungen erforderlich: s1( x0 ) s n ( xn ) 0 (natürliche Randbedingungen) liefern m0 = mn = 0, auch periodische oder HERMITE-Randbedingungen sind möglich (vgl. z. B. Preuß, 2001). Dabei entsteht eine Bandmatrix, die eine effektive Lösung ermöglicht (siehe Abschnitt 7.7): hi h hi 1 h y yi yi yi 1 , mi 1 i mi i 1 mi 1 i 1 6 3 6 hi 1 hi i = 1, 2, ..., n 1; hi = xi xi1 i xi yi
Beispiel 7.11 Die folgenden Wertepaare sind durch eine kubische Spline-Funktion zu verbinden.
0 0 1
1 1 0
2 2 1
3 4 2
Lösung
Aufstellen des Gleichungssystems für die inneren Punkte: Zu beachten: h1 = h2 = 1 , h3 = 2 , m0 = m3 = 0. 2 1 m1 m2 0 3 6 Lösung: m1 = 0,652174, m2 = 2,608696 1 5 m1 m2 6 2 y
3 2 1 0 1 2 0
1
2
3
4
x
Abbildung 7.3
N
7 Numerische Verfahren
170
Ermittlung der einzelnen Funktionen aus den mi, i = 0,1, 2, 3. Intervall
Funktion
s1( x ) 0,652174
[0,1]
0,652174 x3 1 x
x 6 6
0,1087 x 3 0,8913 x 1
s 2 x 0.652174
2 x 3
2.608696
x 1 3
6 6 0.652174 2.608698
2 x 1 x 1 6 6
[1,2]
0,5435 x 3 1,9565 x 2 1,0652 x 0,3478
s 3 x 2,608696
[2,4]
4 x 3 12
x 2 2,608698 4 4 x 1 2 6 2 2
0,2174 x 3 2,6087 x 2 8,0652 x 6,4348 (siehe Abbildung 7.3).
7.9.3 Bézier-Kurven BÉZIER-Kurven werden durch Punkte Pi = (xi, yi), i = 0, 1, ..., n, definiert. Dabei liegen nur der erste und der letzte Punkt auf der Kurve und bestimmen den Anfangs- und den Endpunkt. Die restlichen Punkte üben eine magnetische Wirkung auf die BÉZIER-Kurve aus. Die Anzahl der vorgegebenen Punkte bestimmt den Grad der zu verwendenden Polynome. Für die n + 1 Punkte werden Polynome n-ten Grades benötigt. (Siehe Locher, 1993) Die Erzeugung von BÉZIER-Kurven erfolgt über BERNSTEIN-Polynome: n J n,i t i (1 t ) n i , n - Grad des Polynoms, i = 0, 1, 2, ..., n. i Die Punkte der Kurve werden über folgende Vektorfunktion ermittelt: n
P (t ) Pi J n,i (t ), 0 t 1 i 0
P(0) Anfangspunkt der Kurve P(1) Endpunkt der Kurve
Beispiel 7.12 Gegeben sind die Punkte Pi in Form von Vektoren P0 = (1; 1), P1 = (2; 3), P2 = (4; 3), P3 = (3; 1). Damit ist n = 3. Mit den entsprechenden BERNSTEINPolynomen wird dann die BÉZIER-Kurve über die folgende Darstellung berechnet.
P (t ) P0 J 3,0 (t ) P1 J 3,1(t ) P2 J 3,2 (t ) P3 J 3,3 (t ), t 0, 1.
7.9 Interpolation
171
Die benötigten BERNSTEIN-Polynome lauten: J 3,0 1 t
3
J 3,1 3t (1 t ) 2 J 3,2 3t 2 (1 t ) J 3,3 t 3 Die Koeffizienten der BÉZIER-Kurve können für beliebig gewählte t-Werte mit 0 t 1 ermittelt werden (siehe Tabelle). t
J3,0(t )
J3,1(t )
J3,2(t )
J3,3(t )
0,00 0,15 0,35 0,50 0,65 0,85 1,00
1,000 0,614 0,275 0,125 0,043 0,003 0,000
0,000 0,325 0,444 0,375 0,239 0,057 0,000
0,000 0,057 0,239 0,375 0,444 0,325 0,000
0,000 0,003 0,043 0,125 0,275 0,614 1,000
Berechnung der Koordinaten für die ausgewählten Kurvenpunkte: P(0) = P0 = (1,1) P(0,15) = 0,614·P0 + 0,325·P1 + 0,057·P2 + 0,003·P3 = (1,504; 1,765) P(0,35) = 0.275·P0 + 0,444·P1 + 0,239·P2 + 0,043·P3 = (2,246; 2,365) P(0,50) = 0.125·P0 + 0,375·P1 + 0,375·P2 + 0,125·P3 = (2,750; 2,500) P(0,65) = 0.043·P0 + 0,239·P1 + 0,444·P2 + 0,275·P3 = (3,119; 2.365) P(0,85) = 0.003·P0 + 0,514·P1 + 0,325·P2 + 0,614·P3 = (3,261; 1,765) P(1) = P3 = (3,1) In der Abbildung 7.4 ist die komplette Kurve dargestellt. y
4 3 2 1 0
0
1
2
3
4
5 x
Abbildung 7.4
N
172
7 Numerische Verfahren
7.10
Numerische Differenziation
Modellierungen von Problemen können Ableitungen von Funktionen enthalten. Diese lassen sich numerisch nicht direkt auswerten. Näherungsweise ist es jedoch möglich, Ableitungen beliebiger Ordnung durch Differenzenausdrücke zu ersetzen. Eine derartige Möglichkeit bietet der Differenzenquotient. Die dabei entstehenden Diskretisierungsfehler haben Einfluss auf die Genauigkeit der Lösung. Das betrachtete Intervall [a, b] wird in n äquidistante (gleich lange) ba unterteilt. Dabei entstehen die diskreten Teilstücke der Länge h n Werte xi und mit ihnen die zugehörigen Funktionswerte yi = y(xi). Wichtig ist dabei die Fehlerordnung O(hn). Sie gibt die Veränderung des Diskretisierungsfehlers in Abhängigkeit von h an, d. h., halbiert sich z. B. bei n = 2 die Schrittweite h, so verringert sich der Fehler näherungsweise auf ein Viertel. Einige wichtige Differenzenausdrücke sind ( yi = y(xi)): Ableitung y´
y´ y´ y"
Näherung Fehlerordnung O(h) yi yi 1 h O(h) yi 1 yi h O(h2) yi 1 yi 1 2 h O(h2) yi 1 2 yi yi 1 h2
Bezeichnung Rückwärtsdifferenz
Vorwärtsdifferenz zentrale Differenz zentrale Differenz
Beispiel 7.13
Von der Funktion y ( x ) 1 x 2 sind numerisch die erste und zweite Ableitung im Punkt x = 1,5 zu bestimmen.
Lösung Zunächst ist die Größe h festzulegen. Gewählt wird h = 0,1. Damit ergeben sich die xi -Werte 1,4; 1,5; 1,6 (i = 1, 0, 1)
y
y
1 1,6 2 1 1,5 2 1 1,6 2 1 1,4 2 = 0,8317 0,8402; y 0,1 2 0,1 (exakt: 0,8321...) 1 1,4 2 2 1 1,5 2 1 1,6 2
0,1710 (exakt: 0,170677...) 0,12 Die zentralen Differenzen liefern die besseren Näherungen.
Kapitel 8
8
Statistik
8.1 8.1.1
Wahrscheinlichkeitsrechnung Grundbegriffe
Gegenstand 1. Deterministische Erscheinungen Diese sind dadurch gekennzeichnet, dass aufgrund vorliegender Bedingungen die folgenden Reaktionen eindeutig bestimmt sind, z. B. der freie Fall. 2. Zufällige (oder stochastische) Erscheinungen Sie können unter bestimmten Bedingungen eintreten, brauchen es aber nicht; es besteht keine zwingende Ursache-Wirkung-Beziehung, z. B.: Wettererscheinungen, Qualität von Erzeugnissen. Untersuchungsgegenstand der Wahrscheinlichkeitsrechnung (WR) sind diese zufälligen (stochastischen) Erscheinungen. Zufallsversuch, zufälliges Ereignis Ein Versuch, der unter Beibehaltung eines festen Komplexes von Bedingungen beliebig oft wiederholbar ist und dessen Ergebnis im Bereich gewisser Möglichkeiten ungewiss ist, wird als Zufallsversuch bezeichnet. Jedes Ergebnis eines Zufallsversuches wird ein zufälliges Ereignis genannt. Ein Ereignis, das bei jeder Wiederholung eines Zufallsversuches als Ergebnis auftritt, wird sicheres Ereignis genannt. Es wird mit S oder bezeichnet. Ein Ereignis, das bei jeder Wiederholung eines Zufallsversuches niemals als Ergebnis auftreten kann, wird unmögliches Ereignis genannt. Es wird mit U oder bezeichnet. Tritt mit dem Ereignis A stets auch das Ereignis B auf, dann zieht das Ereignis A das Ereignis B nach sich, A B.
S
174
8 Statistik
Zwei Ereignisse heißen gleich (A = B), wenn sowohl das Ereignis A das Ereignis B nach sich zieht (A B) als auch umgekehrt das Ereignis B das Ereignis A nach sich zieht (B A), (A B) (B A) (A = B). Sind A und B Ereignisse, dann wird das Ereignis, das genau dann eintritt, wenn mindestens eines dieser beiden Ereignisse eintritt, als Summe (oder Vereinigung) A B der Ereignisse A und B bezeichnet. Sind A und B Ereignisse, dann wird das Ereignis, das genau dann eintritt, wenn sowohl A als auch B eintritt, als Produkt (oder Durchschnitt) A B der Ereignisse A und B bezeichnet. Zwei Ereignisse A und B werden einander ausschließend, unvereinbar oder unverträglich genannt, wenn ihr gemeinsames Auftreten unmöglich ist, d. h., wenn A B = U gilt. Tritt ein Ereignis genau dann ein, wenn das Ereignis A nicht eintritt, wird es das zu dem Ereignis A komplementäre Ereignis A genannt. Sind A und B Ereignisse, dann wird das Ereignis, das genau dann eintritt, wenn das Ereignis A aber nicht das Ereignis B eintritt, Differenz der Ereignisse A und B genannt. Die Differenz wird mit A \ B bezeichnet. Die Ereignisse A1, A2, A3, ..., An bilden ein vollständiges System von Ereignissen, wenn im Ergebnis eines Versuches genau eines dieser Ereignisse eintreten muss. Beispiel 8.1 Beim Würfeln sind die Ergebnisse 1, 2, 3, 4, 5, 6 möglich. Es können z. B. folgende Ereignisse erklärt werden: Ak = { k }, k sei die Augenzahl beim Würfeln B = { 2, 4 } C = { gerade Zahl } D = { ungerade Zahl } E = { 1, 2, 3, 4, 5, 6 } F ={7}
8.1 Wahrscheinlichkeitsrechnung
175
Dann gilt z. B.: E =S A 1 B = { 1, 2, 4 } BC=B
F =U A1 B = U S\C=D
B C A2 A4 = B C D
Vollständige Systeme sind z. B.:
A1, A2, A3, A4, A5, A6;
C, D;
A 2 , A 4 , A 6 , D.
Eigenschaften von Ereignissen A U = A, A A = A, A S = S A (B C ) = (A B ) C
AB=BA A\ B = A B
A A B, B A B
ABAB=B
A (B C ) = (A B ) (A C )
A (B C ) = (A B ) (A C )
A B A B
A B A B
A A U
A A S
Beispiel 8.2 Eine Heizungsanlage bestehe aus 3 Pumpen, 2 Speichern und einem Brennwertgerät. Die Anlage ist funktionstüchtig, wenn wenigstens zwei Pumpen, ein Speicher und das Brennwertgerät funktionieren. Nachstehende Ereignisse werden betrachtet.
Pj = die j-te Pumpe ist intakt, j = 1, 2, 3 Si = der i-te Speicher ist intakt, i = 1, 2 B = das Brennwertgerät ist funktionstüchtig P = die Pumpenanlage ist funktionstüchtig: P = ( P1 P2 P3 ) ( P1 P2 P3 ) ( P1 P2 P3 ) ( P1 P2 P3 ) S = die Speicheranlage ist funktionstüchtig: S = S1 S2 A = die Anlage ist funktionstüchtig: A = PSB
Ereignisfeld Führt die Anwendung der oben erklärten Operationen ( , , , \ ) auf eine Menge von Ereignissen eines Zufallsversuches stets auf Ereignisse dieser Menge, so wird diese Menge ein Ereignisfeld genannt.
S
176
8 Statistik
Ein Ereignisfeld besitzt folgende typische Eigenschaften: (1) Es enthält das sichere Ereignis S und das unmögliche Ereignis U. (2) Mit beliebigen Ereignissen A1, A2, ... enthält es auch deren Summe Ai sowie deren Produkt Ai . i
i
(3) Mit beliebigem Ereignis A enthält es auch dessen Komplementärereignis A . Ein Ereignis eines Ereignisfeldes heißt atomar, wenn es sich nicht als Summe von Ereignissen des Ereignisfeldes darstellen lässt, die vom unmöglichen Ereignis und dem betrachteten Ereignis selbst verschieden sind. Ein Ereignis eines Ereignisfeldes heißt zusammengesetzt, wenn es als Summe verschiedener atomarer Ereignisse des Ereignisfeldes darstellbar ist. Bemerkung Im Beispiel 8.1 sind z. B. die Ereignisse Ak atomare Ereignisse und die Ereignisse B, C, D und E zusammengesetzt. Wahrscheinlichkeit eines zufälligen Ereignisses Für jedes zufällige Ereignis A (mit Ausnahme des unmöglichen Ereignisses U ) besteht die objektive Möglichkeit, bei einem Zufallsversuch als Resultat zu erscheinen. Um mehrere Ereignisse hinsichtlich ihres Möglichkeitsgrades vergleichen zu können, ist es notwendig, ein quantitatives Maß für diesen Grad einzuführen. Die Wahrscheinlichkeit P(A) eines zufälligen Ereignisses A ist der quantitative Ausdruck der objektiven Möglichkeit des Ereignisses, bei dem betreffenden Zufallsversuch als Ergebnis zu erscheinen. Der Quotient
f n ( A) =
hn ( A) n
wird die relative Häufigkeit des
Ereignisses A genannt. hn(A) ist die absolute Häufigkeit des Ereignisses A und n die Anzahl der Versuche. Statistische Bestimmung der Wahrscheinlichkeit hn ( A) eines Ereignisses A strebt mit wachn sendem Umfang n der Versuchsserie gegen dessen objektive Wahrscheinlichkeit P(A).
Die relative Häufigkeit
8.1 Wahrscheinlichkeitsrechnung
177
Die relative Häufigkeit eines Ereignisses besitzt folgende Eigenschaften: (1) Die relative Häufigkeit ist mindestens 0 und höchstens 1, 0 fn(A) 1. (2) Die relative Häufigkeit des unmöglichen Ereignisses ist gleich null, fn(U) = 0. (3) Die relative Häufigkeit des sicheren Ereignisses ist gleich 1, fn(S) = 1. (4) Für die relative Häufigkeit der Summe zweier Ereignisse gilt: fn(A B) = fn(A) + fn(B) fn(A B). (5) Für die relative Häufigkeit des zum Ereignis A gehörigen komplementären Ereignisses A gilt: f n ( A ) 1 f n ( A). (6) Die relative Häufigkeit fn(A) eines Ereignisses A, das ein Ereignis B nach sich zieht, ist höchstens so groß wie die relative Häufigkeit des Ereignisses B : A B fn(A) fn(B). Die axiomatische Definition der Wahrscheinlichkeit (KOLMOGOROV, 1933): Für ein Ereignisfeld gilt Axiom 1: Jedem Ereignis A ist eine nichtnegative Zahl P(A) zugeordnet. Diese Zahl heißt die Wahrscheinlichkeit (WK) des Ereignisses A mit P(A) 0. Axiom 2: Die WK des sicheren Ereignisses S ist 1, P(S ) = 1. Axiom 3: Die Wahrscheinlichkeit der Summe zweier unverträglicher Ereignisse A und B ist gleich der Summe der WK der beiden Ereignisse, P(A B ) = P(A ) + P(B ). Die WK der Summe abzählbar unendlich vieler paarweise unverträglicher Ereignisse A1, A2, ... ist gleich der Summe der WK dieser Ereignisse P( Ai ) P( Ai ). i
i
Die Wahrscheinlichkeit eines Ereignisses hat folgende Eigenschaften: (1) Die WK des unmöglichen Ereignisses ist 0, P(U ) = 0. (2) Für die WK des zum Ereignis A gehörigen Komplementärereignisses A gilt: P( A ) = 1 P(A) oder P(A) + P( A ) = 1. (3) Für zwei beliebige Ereignisse A und B gilt: P(A B ) = P(A ) + P(B ) P(A B ). (4) Zieht das Ereignis A das Ereignis B nach sich, dann gilt: P(A ) P(B ). n
(5) Bilden A1, ..., An ein vollständiges System, so gilt
P( Ai ) 1.
i 1
S
178
8 Statistik
Klassische Definition der Wahrscheinlichkeit Der klassische Wahrscheinlichkeitsbegriff ist an Ereignisfelder gebunden, deren Versuche nur endlich viele gleichmögliche Ausgänge haben.
Ein LAPLACEsches Ereignisfeld erfüllt folgende Bedingungen: (1) Das Ereignisfeld enthält nur endlich viele atomare Ereignisse A1, A2, ..., An. (2) Das Auftreten dieser atomaren Ereignisse Ai ist gleichmöglich. Die Wahrscheinlichkeit P(A) eines Ereignisses A, das einem LAPLACEschen Ereignisfeld mit n atomaren Ereignissen angehört, k berechnet sich gemäß P( A) = . Dabei bedeutet k die Anzahl dern jenigen atomaren Ereignisse, die das Ereignis A nach sich ziehen. k ist die Anzahl der für das Eintreten von A günstigen Ereignisse. n ist die Anzahl der möglichen Ereignisse. Beispiel 8.3 Gesucht ist die Wahrscheinlichkeit, mit zwei Würfeln mindestens eine „6“ zu würfeln. Lösung: Ai, i = 1, 2, sei das Ereignis, beim i -ten Wurf eine „6“ zu würfeln. 1 1 1 1 11 a) P ( A 1 A 2 ) P ( A 1 ) P ( A 2 ) P ( A 1 A 2 ) , oder 6 6 6 6 36
b) P ( A 1 A 2 ) P (( A 1 A 2 ) ( A 1 A 2 ) ( A 1 A 2 ))
=
5 5 1 11 36 36 36 36
Bedingte Wahrscheinlichkeit
Die bedingte Wahrscheinlichkeit P(A/B) eines Ereignisses A unter der Bedingung B ist die Wahrscheinlichkeit für das Eintreten des Ereignisses A unter der Bedingung, dass das Ereignis B eingetreten ist. Es gilt: P( A B ) , für P( B ) 0 P( A / B ) = P( B ) 0 , für P( B ) = 0. Beispiel 8.4 In einem Betrieb sind 96,7 % aller Erzeugnisse normgerecht (Ereignis N), 60 % aller Erzeugnisse gehören der Qualitätsstufe 1 (Ereignis Q1 N) an, 36,7 % gehören der Qualitätsstufe 2 (Ereignis Q2 N) an und 3,3 % sind Ausschuss (Ereignis A). Wie groß ist die Wahrscheinlichkeit dafür, dass ein normgerechtes Erzeugnis zur Qualitätsstufe Q1 gehört?
8.1 Wahrscheinlichkeitsrechnung
179
P(Q1 N ) 0,6 = 0,62 0,967 P(N ) Damit entfallen 62 % der normgerechten Erzeugnisse auf die Qualitätsstufe 1 und 38 % auf die Qualitätsstufe 2. Lösung: P Q1 / N
Aus der Formel für bedingte Wahrscheinlichkeiten kann die Wahrscheinlichkeit des Produkts zweier Ereignisse A und B berechnet werden. Multiplikationsregeln für Wahrscheinlichkeiten
P( A B) = P ( A / B) P ( B) P ( A B ) = P ( A) P ( B / A) Beispiel 8.5 Wie groß ist die Wahrscheinlichkeit, aus einem Kartenspiel mit 32 Karten zunächst eine Herzkarte und dann eine Karokarte zu ziehen? Lösung: A - Ziehen einer Herzkarte als 1. Karte B - Ziehen einer Karokarte als 2. Karte 8 1 8 8 8 , P(B / A) = P(AB)= P ( A) P ( B / A) = 0,065 P(A) = 32 4 31 32 31
Formel für die totale Wahrscheinlichkeit
Bilden die Ereignisse A1, A2, ..., An ein vollständiges System, dann n
gilt für ein beliebiges Ereignis B P( B) = P( Ai ) P( B / Ai ). i =1
Beispiel 8.6 In einem Betrieb wird ein bestimmtes Erzeugnis gleichzeitig durch vier Anlagen gefertigt. Dabei wurden folgende Daten ermittelt: Alle Teile gelangen in ein Lager und Anlage Anteil (%) Ausschuss (%) es ist dort nicht mehr festzustellen, 1 45 2 auf welcher Anlage sie produziert 2 30 1 wurden. 3 20 5 Gesucht ist die Wahrscheinlichkeit 4 5 6 dafür, dass ein aus dem Lager entnommenes Erzeugnis nicht den Qualitätsanforderungen entspricht.
Ai - Fertigung auf der i-ten Anlage, i = 1, 2, 3, 4 B - Erzeugnis ist Ausschuss Die Ereignisse Ai bilden ein vollständiges System. P(B/A1) = 0,02 P(A1) = 0,45 P(B/A2) = 0,01 P(A2) = 0,3 P(B/A3) = 0,05 P(A3) = 0,2 P(B/A4) = 0,06 P(A4) = 0,05 P(B) = 0,45 0,02 + 0,3 0,01 + 0,2 0,05 +0,05 0,06 = 0,025 Lösung:
Die Formel für die totale WK entspricht dem gewogenen Mittel.
S
8 Statistik
180
Formel von Bayes
Bilden die Ereignisse A1, A2, ..., An ein vollständiges System, dann P ( Ai ) P ( B / Ai ) . gilt für ein beliebiges Ereignis B U: P ( Ai / B ) = P( B) Anwendung findet diese Formel, wenn eine bestimmte Wirkung (B ) bekannt ist und eine endliche Anzahl von sich paarweise ausschließenden Ursachen ( A i ) möglich sind. Der Einfluss der einzelnen Ursachen kann dann untersucht (quantifiziert) werden. Zum Beispiel 8.6 Ein nicht normgerechtes Teil wird dem Lager entnommen. Mit welcher Wahrscheinlichkeit wurde es auf der 1. Anlage produziert? P ( A 1 ) P (B/A 1 ) 0,45 0,02 Lösung: P ( A 1 / B ) = 0,36 P (B ) 0,025
Ein Ereignis A heißt unabhängig von einem Ereignis B U, wenn P(A) = P(A/B) gilt. Ist diese Relation nicht erfüllt, dann heißt das Ereignis A abhängig vom Ereignis B. Ist ein Ereignis A unabhängig von einem Ereignis B, dann ist ebenfalls das Ereignis B unabhängig vom Ereignis A. Für unabhängige Ereignisse gilt: P( A B ) = P ( A) P ( B ). (Multiplikationssatz für unabhängige Ereignisse) Beispiel 8.7 Wie groß ist die Wahrscheinlichkeit, beim ersten Wurf eines Würfels eine „6“ (Ereignis A) und beim zweiten Wurf eine gerade Zahl (B) zu würfeln? 1 3 P(B) = , A und B sind unabhängig voneinander. Lösung: P(A) = 6 6 1 3 1 P ( A B) = P ( A) P (B) 6 6 12
Multiplikationssatz für n Ereignisse n
n
i 1
i 1
Für unabhängige Ereignisse A1, A2, ..., An gilt: P( Ai ) P( Ai ). Additionssatz (unabhängige Ereignisse)
Für unabhängige Ereignisse A1, A2, ..., An gilt: n
n
i 1
i 1
P ( Ai ) 1 (1 P( Ai )).
8.1 Wahrscheinlichkeitsrechnung
181
Beispiel 8.8 Wie groß ist die Wahrscheinlichkeit, beim ersten Wurf eines Würfels eine „6“ (Ereignis A 1 ) oder beim zweiten Wurf eine gerade Zahl (Ereignis A 2 ) zu würfeln? 1 3 P(A 2 ) = Lösung: P(A 1 ) = 6 6 2 2 5 3 21 P ( A i ) 1 (1 P ( A i )) 1 (1 P ( A 1 )) (1 P ( A 2 )) 1 6 6 36 i 1 i 1
Zufallsgröße Im Weiteren wird eine numerische Beschreibung der Ergebnisse von Zufallsversuchen vorgenommen. Dabei wird vorausgesetzt, dass sich jedes Resultat eines Zufallsversuches durch eine reelle Zahl erfassen lässt.
Eine Zufallsgröße ist eine Kenngröße, die die Ergebnisse eines Zufallsversuches quantitativ beschreibt. Ihre möglichen Werte werden Realisierungen der Zufallsgröße genannt. Eine Zufallsgröße heißt diskret, wenn sie nur endlich oder abzählbar unendlich viele Realisierungen besitzt. Eine Zufallsgröße heißt stetig, wenn ihre Realisierungen wenigstens ein Intervall der reellen Zahlengeraden kontinuierlich ausfüllen, d. h., wenn sie jeden Zahlenwert in einem bestimmten Intervall annehmen können. Bemerkung Die Zufallsgröße „Anzahl der Schüler einer Klasse“ ist z. B. eine diskrete Zufallsgröße, die Zufallsgröße „Größe der Schüler einer Klasse“ ist eine stetige Zufallsgröße.
Die Verteilungsfunktion F(z) einer Zufallsgröße X ist die für jede reelle Zahl z erklärte reellwertige Funktion F(z) = P(X z). Für die Verteilungsfunktion F(z) einer Zufallsgröße X gilt: (1) 0 F(z) 1, (2) lim F ( z ) 0 , lim F ( z ) 1, z
z
(3) F ( z1 ) F ( z2 ) für z1 z2 . Für die Verteilungsfunktion F(z) einer Zufallsgröße X gilt: P(a < X b) = F(b) F(a).
S
8 Statistik
182
8.1.2
Diskrete Verteilung
Die allgemeine diskrete Verteilung Die Verteilungstabelle einer diskreten Zufallsgröße X ist ein Verzeichnis aller Realisierungen x1, x2, ..., xn der Zufallsgröße X und der zugehörigen Wahrscheinlichkeiten pi = P( X = xi) = f (xi), i = 1, 2, ..., n ; (pi - Einzelwahrscheinlichkeiten), mit denen die Zufallsgröße die Realisationen annimmt. f ist die Wahrscheinlichkeitsfunktion.
Für die Wahrscheinlichkeiten einer diskreten Zufallsvariablen X gilt die Vollständigkeitsrelation
n
n
i 1
i 1
pi P( X
xi ) 1.
Ist eine diskrete Zufallsvariable X in Form einer Verteilungstabelle gegeben, dann lautet ihre Verteilungsfunktion für z x1 0 k F ( z ) P ( X z ) f ( xi ) pi für xk z xk 1 , k 1, 2, , n 1. xi z i 1 für xn z 1 Die Verteilungsfunktion einer diskreten Zufallsvariablen ist eine Treppenfunktion. Ihre Sprungstellen sind die Realisierungen x1, x2, ..., xn mit den endlichen Sprunghöhen p1, p2, ..., pn. Verteilungsparameter Verteilungsparameter charakterisieren in einem gewissen Grade die Verteilung. Aus der Statistik kommen die Begriffe Mittelwert, Durchschnitt, Streuung, mittlere Abweichung vom Mittelwert usw. Diesen Größen entsprechen in der Wahrscheinlichkeitsrechnung die theoretischen Begriffe Erwartungswert und Varianz. Als Erwartungswert E(X ) einer nach der Verteilungstabelle verteilten Zufallsvariablen X xi x1 x2 x3 xn pi
p1
p2
p3 n
pn
wird der Ausdruck E ( X ) = xi pi bezeichnet. i 1
8.1 Wahrscheinlichkeitsrechnung
183
Für den Erwartungswert einer diskreten Zufallsvariablen X gilt: (1) Der Erwartungswert einer linearen Funktion von einer diskreten Zufallsvariablen X ist gleich derselben Funktion des Erwartungswertes E (X ) , E (a + b X ) = a + b E (X ) ; a, b konstant (2) Der Erwartungswert einer Summe n diskreter Zufallsgrößen Xi ist gleich der Summe der Erwartungswerte der Summanden n n E X i E ( X i ).
i 1 i 1 (3) Der Erwartungswert eines Produkts n unabhängiger Zufallsvariablen ist gleich dem Produkt der Erwartungswerte der Faktoren n n E X i E ( X i ).
i 1 i 1 Als Varianz einer diskreten Zufallsvariablen wird der Ausdruck
n
Var ( X ) 2 ( X ) E X E ( X ) 2 xi E ( X ) 2 pi bezeichnet. i 1
Die Varianz ist gleichbedeutend mit dem Erwartungswert des Quadrates der Abweichung einer Zufallsvariablen von ihrem Erwartungswert. Für die Varianz einer diskreten Zufallsgröße gilt: (1) Die Varianz ist stets nichtnegativ, Var ( X ) 2 ( X ) 0. (2) Verschiebungssatz
2
n n Es gilt: Var ( X ) = E X 2 E 2 X xi2 pi xi pi . i 1
i 1
(3) Linearitätssatz Es gilt: Var (a b X ) = b 2 Var ( X ) ; a, b konstant (4) Die Varianz einer Summe beliebig vieler unabhängiger diskreter Zufallsgrößen ist gleich der Summe der Varianzen der Summanden: n n Var X i Var ( X i ).
i 1 i 1 Die Quadratwurzel aus der Varianz Var(X ) einer diskreten Zufallsgröße X heißt Standardabweichung der Zufallsgröße und wird mit
(X) bezeichnet, ( X ) = Var ( X ) .
S
8 Statistik
184 Beispiel 8.9
Für eine Klausur wurden die folgen- Lösung den 18 Noten verteilt: Noten
1
2
3
4
5
Anzahl 6
4
4
2
2
4 18
2 18
2 18
WK
6 4 18 18
Es sollen die Einzelwahrscheinlichkeiten im Verteilungsdiagramm sowie die Verteilungsfunktion dargestellt werden und Erwartungswert sowie Standardabweichung ermittelt werden. Abbildung 8.1 In Abbildung 8.1 sind Verteilungsdiagramm (oben) sowie Verteilungsfunktion (unten) dargestellt. 6 4 4 2 2
2
3
4
5 2,44 4 E(X ) = 1 18 18 18 18 18 n 6 4 2 Var ( X ) = x i E ( X ) pi (1 2,44 4 ) 2
(2 2,44 4 ) 2 18 18 i 1
(3 2,44 4 ) 2
4 2 2
( 4 2,44 4 ) 2
(5 2,44 4 ) 2 1,802 18 18 18
Oder besser nach dem Verschiebungssatz: n
Var ( X ) = x i2 pi E 2 X i 1
6 4 4 2 2
22
32
42
52 = 12 2,44 4 2 18 18 18 18 18
= 7,7778 2,44 4 2 = 1,802
( X ) 1,802 1,343
Für eine diskrete Zufallsvariable X mit dem Erwartungswert E(X ) und der Standardabweichung (X ) gilt die
TSCHEBYSCHEV-Ungleichung: P X E ( X ) c 1
Dabei ist c eine beliebige positive Zahl.
2( X ) c2
.
8.1 Wahrscheinlichkeitsrechnung
185
Statistische Momente
Das gewöhnliche Moment r-ter Ordnung ist: Gr ( X ) xi r pi , r 0. i
Das zentrale Moment r-ter Ordnung ist: Z r ( X ) xi E ( X ) pi , r 0. r
i
Bemerkung Das arithmetische Mittel entspricht dem gewöhnlichen Moment erster Ordnung und die Varianz dem zentralen Moment zweiter Ordnung. Für weitere statistische Maßzahlen, wie Schiefe und Exzess, werden höhere Momente genutzt. Schiefe
Als Maß für die Symmetrie einer diskreten Zufallsgröße mit Z (X ) (X ) > 0 wird die Schiefe S ( X ) definiert: S ( X ) 33 . (X ) Bemerkung Bei einer rechtssteilen (linksschiefen) Verteilung ist die Schiefe kleiner null und bei einer linkssteilen (rechtsschiefen) Verteilung größer null. Bei einer symmetrischen Verteilung ist die Schiefe null.
Spezielle diskrete Verteilungen Binomialverteilung
Eine diskrete Zufallsgröße X genügt einer Binomialverteilung, wenn ihre Wahrscheinlichkeitsfunktion die Gestalt n n i P( X = i ) pi p i 1 p , i = 0, 1, ..., n
i mit n > 0 und 0 < p < 1 besitzt. Es wird eine Serie unabhängiger Versuche des Umfangs n unter gleich bleibenden Bedingungen betrachtet. Bei jedem Versuch tritt ein gewisses Ereignis A mit der Wahrscheinlichkeit p = P ( A ) auf. Die Anzahl X der Versuche dieser Serie mit dem Ausgang A ist eine diskrete Zufallsgröße, die der Binomialverteilung mit den Parametern n und p genügt (BERNOULLIsches Versuchsschema).
S
186
8 Statistik
Für den Erwartungswert E ( X ) und die Varianz Var ( X ) einer binomialverteilten Zufallsgröße X gilt: E ( X ) = n p und Var ( X ) = n p (1 p ). Beispiel 8.10 Wie groß ist die Wahrscheinlichkeit dafür, dass unter den drei Kindern einer Familie genau ein Junge ist? Die Wahrscheinlichkeit für die Geburt eines Jungen sei 0,514.
3 Lösung: P ( X 1) p1 0,5141 (1 0,514) 2 0,364
1 Bemerkung: Es gilt ferner : p0 = 0,115, p2 = 0,385, p3 = 0,136 E ( X ) = 3 0,514 = 1,542 Var(X ) = 3 0,514 (1 0,514) = 0,749
Hypergeometrische Verteilung
Eine diskrete Zufallsgröße X genügt einer hypergeometrischen Verteilung bei folgender Wahrscheinlichkeitsfunktion, i = 0, 1, 2, ..., n: M N M N p N (1 p) i n i i n i M
= , P(X = i) = pi = , p N N N
n
n 0 < p < 1, 0 < n N , 0 < M < N und n, M, N, N p N+ . In einer Urne mit N weißen und schwarzen Kugeln ist die Anzahl der weißen Kugeln M, ihr Anteil p. Bei zufälliger Entnahme von n Kugeln, ohne sie zurückzulegen, ist die Anzahl der gezogenen weißen Kugeln i eine Zufallsgröße, die der hypergeometrischen Verteilung mit den Parametern N, n und M bzw. N, n und p unterliegt. Für den Erwartungswert E(X ) und die Varianz 2(X ) einer hypergeometrisch verteilten Zufallsgröße X gelten E ( X ) = n p und N n Var ( X ) = n p 1 p . N 1 Bemerkung Im Gegensatz zur Binomialverteilung, bei der nach dem BERNOULLIschen Schema die Wahrscheinlichkeit p für alle Versuche konstant ist (Modellvorstellung des Ziehens mit Zurücklegen, Unabhängigkeit der einzelnen Versuche), wird bei der hypergeometrischen Verteilung die Anzahl der gezogenen Elemente mit berücksichtigt (Modellvorstellung des Ziehens ohne Zurücklegen und damit Abhängigkeit der einzelnen Versuche).
8.1 Wahrscheinlichkeitsrechnung
187
Die hypergeometrische Verteilung strebt für N gegen die Binomialverteilung und stellt somit eine Verallgemeinerung der Binomialverteilung dar. Beispiel 8.11 In einem Lager befinden sich 50 Geräte, darunter 15 defekte. 10 Geräte werden zufällig ausgewählt. Wie groß ist die Wahrscheinlichkeit, dass sich unter diesen 10 Geräten höchstens zwei defekte befinden? 15 = 0,3, n = 10, i = 0, 1, 2 Lösung: N = 50, p = 50
p0 + p1 + p2 =
2
50 0,3 50 (1 0,3)
i 10 i 50
10
i 0
=
15 50 0,7
0 10 0 50
10
+
15 35
1 10 1 50
10
+
15 35
2 10 2 50
10
= 0,018 + 0,103 + 0,240 = 0,361
POISSON - V erteilung
Eine diskrete Zufallsgröße X genügt einer POISSON - Verteilung, wenn ihre Wahrscheinlichkeitsfunktion die Gestalt i e - P( X = i ) pi , i = 0, 1, ... mit > 0 besitzt. i! e = 2,71828... (EULERsche Zahl) Bemerkung Die POISSON - V erteilung ist durch den Parameter bereits eindeutig bestimmt. Die Werte sind in Tabellen gegeben oder können leicht mit einem Taschenrechner ermittelt werden. Die POISSON - V erteilung kann näherungsweise zur Berechnung der Wahrscheinlichkeitsfunktion der Binomialverteilung benutzt werden, wenn etwa folgende Bedingungen erfüllt sind: n p 10 und n 1500 p. Grenzwertsatz von POISSON
Die Binomialverteilung strebt für n und p 0 bei konstant bleibendem = n p gegen die POISSON-Verteilung:
n i lim p i (1 p ) ni e , ( = n p) und ( i = 0, 1, ..., n). n i i!
p0
S
188
8 Statistik
Für den Erwartungswert E ( X ) und die Varianz Var(X ) einer POISSON-verteilten Zufallsgröße gilt: E(X) = Var(X ) = . Beispiel 8.12 Die Anzahl der täglich eintreffenden Eilsendungen einer Firma besitzt eine POISSON-Verteilung mit dem Parameter = 3. Mit welcher Wahrscheinlichkeit trifft je Tag höchstens eine Eilsendung in der Firma ein? 30 e- 3 31 e - 3 Lösung: p0 0,050 p1 0,149 0! 1! P (X 1) = p0 + p1 = 0,050 + 0,149 = 0,199
Geometrische Verteilung
Eine diskrete Zufallsgröße X genügt einer geometrischen Verteilung, wenn ihre Wahrscheinlichkeitsfunktion die Gestalt P(X = i) = pi = p (1 p)i ; i = 0, 1, ... mit 0 < p < 1 besitzt. Die Verteilungsfunktion F(z) einer geometrisch verteilten Zufalls0 für z 0 größe X lautet F ( z ) P ( X z ) z 1 für z 0 1 1 p
mit z als größte ganze Zahl < z.
Es wird eine Serie unabhängiger Versuche unter gleichbleibenden Bedingungen betrachtet. Bei jedem Versuch tritt ein gewisses Ereignis A mit der Wahrscheinlichkeit p = P (A) ein. Die Anzahl X der Versuche vor dem ersten Auftreten des Ereignisses A ist eine diskrete Zufallsvariable, die der geometrischen Verteilung mit dem Parameter p genügt. Für den Erwartungswert E(X ) und die Varianz metrischen Verteilung gilt E ( X ) =
2
X
einer geo-
1 p 1 p , Var( X ) 2 . p p
Eine geometrische Verteilung ist stets linksschief, ihr wahrscheinlichster Wert ist stets die Realisierung i = 0. Beispiel 8.13 Ein Würfel wird geworfen. Wie groß ist die Wahrscheinlichkeit, dass beim fünften Wurf erstmals eine „sechs“ gewürfelt wird? Lösung: Zunächst wird i = 4mal keine „sechs“ gewürfelt, p [„6“] = 1/6. 4
4
1 1 5 1 4 P(X = 4 ) = ( 1 p ) · p = 1 0,080
6 6 6 6
8.1 Wahrscheinlichkeitsrechnung
8.1.3
189
Stetige Verteilung
Allgemeine stetige Verteilungen
Eine Zufallsvariable X heißt stetig, wenn es eine nichtnegative integrierbare Funktion f (x) gibt, sodass sich ihre Verteilungsfunktion z
F(z) = P(X z) für jedes reelle z in der Form F ( z )
f ( x ) dx
dar-
stellen lässt. Die Funktion f (x) wird die Dichtefunktion der Zufallsvariablen X genannt, siehe Abbildung 8.2. Für die Dichtefunktion f (x) einer stetigen Zufallsvariablen gelten: b
P( a X b) f ( x) dx (siehe Abbildung 8.2) und a
f ( x )dx 1,
die Vollständigkeitsrelation.
Ist die Dichtefunktion f (x) an der Stelle x = x0 stetig, so gilt: f ( x0 ) F ( x0 ).
Abbildung 8.2
Verteilungsparameter
Als Erwartungswert oder mathematische Erwartung E ( X ) einer stetigen Zufallsvariablen X mit der Dichtefunktion f (x) wird das In
tegral E ( X ) =
x f ( x ) dx
bezeichnet, sofern es existiert.
Als Varianz Var ( X ) einer stetigen Zufallsvariablen X mit der Dichtefunktion f (x) wird das Integral Var ( X )
x E ( X )
2
f ( x ) dx
x
2
f ( x )dx E ( X ) 2
bezeichnet, sofern es existiert. Die Quadratwurzel aus der Varianz heißt Standardabweichung
( X ) = Var( X ) der Zufallsgröße X.
S
8 Statistik
190
Beispiel 8.14 Welchen Wert muss die Konstante c annehmen, damit die Funktion
c, 0 x 10 die Dichtefunktion einer stetigen Zufallsvariablen ist? f (x ) sonst 0, Wie lauten Erwartungswert, Varianz und Standardabweichung? Lösung: Es muss gelten
10
0
f ( x )dx cdx cx
10 1 . 10 c 1, d. h. c 10 0
Die Dichtefunktion und die zugehörige Verteilungsfunktion lauten: 0 , z 0 1 z , 0 x 10 f ( x ) 10 bzw. F (z ) , 0 z 10 10 sonst 0 , 1 , 10 z
E ( X ) = x f ( x )dx =
10
0
x - E ( X )
Var ( X )
1
x cdx 10
2
x 2 10 1 100 5 2 0 10 2
f ( x )dx
10
x - 5
2
0
10 250 x2 1 1 x3 dx ( 10
25 x ) 8,33 10 10 3 2 0 30
( X ) = Var ( X ) 2,89
Statistische Momente Eine stetige mit der Dichtefunktion f (x) verteilte Zufallsgröße X hat die gewöhnlichen Momente k-ter Ordnung Mk ( X )
x
k
f ( x ) dx ,
k = 1, 2, ...
und die zentralen Momente k-ter Ordnung Zk ( X )
x E ( X )
k
f ( x ) dx ,
k = 1, 2, ...
Quantil
Eine stetige Zufallsgröße X mit der Dichtefunktion f (x) und ihrer Verteilungsfunktion F (x) hat zu jedem p mit p (0, 1) ein (unteres) Quantil p-ter Ordnung xp, wenn gilt: xp
F(xp )
f ( x ) dx P( X x p ) p.
Schiefe
Die Schiefe S ( X ) als Maß für die Symmetrie: S ( X )
Z3 ( X )
3( X )
.
8.1 Wahrscheinlichkeitsrechnung
191
Exzess
Als Maß für die Steilheit einer stetigen Zufallsgröße X mit (X) > 0 Z (X) 3. wird der Exzess (Wölbung) wie folgt erklärt: A( X ) 44 (X) Bemerkung: Der Exzess ist ein Maß dafür, wie stark eine stetige Verteilung der Steilheit einer Normalverteilung angenähert ist. Für A > 0 ist sie steiler, für A < 0 flacher und für A = 0 entspricht sie der Steilheit einer Normalverteilung. Gleichverteilung
Eine stetige Zufallsvariable genügt einer Gleichverteilung (Rechteckverteilung), wenn ihre Dichtefunktion f (x) die Gestalt 1 , für a x b f ( x) b a 0 , sonst hat, mit a und b beliebig reell.
Abbildung 8.3
Die Verteilungsfunktion der Gleichverteilung lautet: , für x a 0 x a Dichte- und Verteilungsfunktion F ( x) , für a x b . sind in Abbildung 8.3 dargestellt. b a 1 , für b < x Für den Erwartungswert E ( X ) und die Standardabweichung (X ) ba a b und ( X ) Var( X ) . gelten: E ( X ) = 2 2 3 Exponentialverteilung
Eine stetige Zufallsvariable genügt einer Exponentialverteilung, wenn ihre Dichtefunktion f (x) die Gestalt, siehe Abbildung 8.4, , für x 0 0 hat, dabei ist eine positive Konstante. f ( x) e x , für x 0
S
192
8 Statistik
Die Verteilungsfunktion F(x) der Exponentialverteilung lautet: , für x 0 0 F ( x) 1 e x , für x 0 Für den Erwartungswert und die Standardabweichung gelten: 1 1 bzw. X . E( X ) =
Abbildung 8.4
Typische Anwendungen der Exponentialverteilung sind: (1) zufällige Zeitdauer eines Telefongespräches, (2) zufällige Zeit bis zum ersten Ausfall eines Bauelementes in der Elektronik, (3) zufällige Zeitdauer für die Durchführung gewisser Instandhaltungsmaßnahmen an technischen Anlagen. Beispiel 8.15 Die Laufzeit einer Maschine ist exponentiell verteilt. Ihre mittlere Laufzeit beträgt 20 Stunden. Mit welcher Wahrscheinlichkeit liegt die Laufzeit zwischen 15 und 25 Stunden? 1 Lösung: E ( X ) 20 ,
1 d. h. 0,05 20 Die zugehörige Verteilungsfunktion lautet, siehe Abbildung 8.5, Abbildung 8.5 0,05x F(x) = 1 e für x 0 0,05 25 0,05 15 ) (1 e ) P(15 x 25) = F(25) F(15) = (1 e 1,25 0,75 0,75 1,25 = (1 e ) (1 e )=e e = 0,472 0,286 = 0,186
Normalverteilung Eine Zufallsgröße unterliegt näherungsweise einer Normalverteilung, wenn auf sie eine große Anzahl unabhängiger Einflussfaktoren mit jeweils nur einem geringen Einfluss wirken, d. h., kein Einflussfaktor darf dominieren. Typische Anwendungsfälle sind (1) zufällige Beobachtungs- und Messfehler (2) zufälliges Abweichen vom Nennmaß bei einem Werkstück oder bei einer Verpackung u. Ä.
8.1 Wahrscheinlichkeitsrechnung
193
Eine stetige Zufallsvariable genügt einer Normalverteilung, wenn ihre Dichtefunktion die Gestalt f ( x)
1
2!
e
( x " )2 2 2
, x hat, dabei sind µ eine reelle
und eine positive reelle Konstante. Bemerkung Besitzt eine Zufallsvariable X eine Normalverteilung mit den Parametern µ und , dann wird gesagt: Die Zufallsvariable X ist N (µ, 2 ) -verteilt.
Gemäß der Definition hat die Verteilungsfunktion der Normalverteilung die Gestalt F ( x)
1
2!
2 x ( z " ) 2 2 e d z,
x .
Die Normalverteilung ist durch die Parameter µ und eindeutig bestimmt, siehe Abbildung 8.6.
F(x)
S x Abbildung 8.6
Eigenschaften der Dichtefunktion der Normalverteilung
(1) (2) (3) (4)
f (x) ist symmetrisch bezüglich E(X ) = µ f (x) hat ein Maximum an der Stelle x = µ f (x) hat Wendepunkte an den Stellen x = µ ± f (x) enthält innerhalb des 3 -Bereiches 99,7 % aller Realisierungen.
194
8 Statistik
Für den Erwartungswert und die Varianz einer N (µ, 2)-verteilten Zufallsvariablen gelten: E ( X ) = µ und Var(X ) = 2 ( X ) = 2 . Die Verteilungsfunktion für die Normalverteilung lässt sich analytisch nicht berechnen. Es wird eine standardisierte Normalverteilung eingeführt, deren Werte in Tabellen gegeben sind (siehe Tafel 1). Standardisierte Normalverteilung N (0, 1)
Die standardisierte Normalverteilung ist eine Normalverteilung mit µ = 0 und 2 = 1, siehe Abbildung 8.7. Sie besitzt die Dichtefunktion ( x)
und die Verteilungsfunktion
( x)
1 2 1 2
e
x2 2
, x
2 x z 2 dz ,
e
x .
Es gilt: ( x ) 1 ( x ), ( x ) ( x ).
(x)
x
Abbildung 8.7
8.1 Wahrscheinlichkeitsrechnung
195
Transformation in die standardisierte Normalverteilung
Durch die Transformation t
x"
kann eine Normalverteilung
N (µ, 2) mit der Verteilungsfunktion F(x) in eine standardisierte Normalverteilung N (0, 1) mit der Verteilungsfunktion $ ( t ) überführt werden, siehe Abbildung 8.7. Insbesondere gilt: a" b" P( a X b) $ ( t 2 ) $ ( t1 ) , mit t1 , t2
Ferner gilt:
c P( X " c) 2 $ 1.
Bemerkung Die Literatur enthält für die standardisierte Normalverteilung Tabellen mit unterschiedlichem Ansatz bezüglich der Integrationsgrenzen: x
$ x # ( x )dx
x
x
0
x
oder $ 0 # ( x ) dx oder $ x # ( x )dx
Sigma-Regeln
c P ( X " c ) 2 $ 1
c = : P ( %X "%)
) = 2 $ ( 1 ) 1 = 0,683
c = 2 : P ( %X "%) 2 ) = 2 $ ( 2 ) 1 = 0,954 c = 3 : P ( %X "%) 3 ) = 2 $ ( 3 ) 1 = 0,997 Beispiel 8.16 Eine Zufallsgröße X sei normalverteilt mit den Parametern " = 4 und = 2. Gesucht ist die Wahrscheinlichkeit, dass die Zufallsgröße kleiner als 7 ist.
Lösung x" 74 P(X < 7) = F(7) = $ ( ) $( ) $ (15 , ) 0,9332 2 Gesucht ist die Wahrscheinlichkeit dafür, dass die Realisierungen der Zufallsgröße X zwischen 2,5 und 8 liegen. Lösung P( 2,5 X 8) = F(8) F(2,5) 84 2,5 4 = $ $ 2
2 = $ (2) $ ( 0,75) = $ (2) (1 $ (0,75)) = 0,9772 (1 0,7734) = 0,7506
(siehe Tafel 1)
S
8 Statistik
196
Beispiel 8.17 Ein Werkstück besitzt die gewünschte Qualität, wenn die Abweichung eines bestimmten Maßes vom entsprechenden Nennmaß dem Betrage nach nicht größer als 3,6 mm ist. Der Herstellungsprozess sei so beschaffen, dass dieses Maß als eine normalverteilte Zufallsgröße angesehen werden kann, deren Erwartungswert mit dem Nennmaß übereinstimmt. Weiterhin sei = 3 mm bekannt. a) Wie viel Prozent der Werkstücke einer Serie werden durchschnittlich mit gewünschter Qualität produziert? b) Wie groß müsste sein, damit 98 % aller Werkstücke den Qualitätsanforderungen genügen? Lösung a) Gegeben: = 0, = 3 Gesucht: P( 3,6 X 3,6 ) = F (3,6) F ( 3,6) oder c P( X c ) 2 ( ) 1
P ( X 0 3,6) 2 (1,2) 1 = 2 0,8849 1 = 0,7698 b) Gegeben: = 0, P( 3,6 X 3,6 ) = 0,98 Gesucht: P( 3,6 X 3,6 ) = P ( X 0 3,6) 2 ( 2 (
3,6
) 198 , ; (
3,6
) 0,99 ;
3,6
3,6
) 1 0,98
2,32 ;
3,6 155 , 2,32
Grenzwertsatz Für große Werte des Parameters n strebt die Binomialverteilung gegen die Normalverteilung mit E ( X ) = n p und
2 2 ( X ) = n p (1 p),
d. h., die Normalverteilung kann zur
näherungsweisen Berechnung der Binomialverteilung benutzt werden.
8.2
Beschreibende (deskriptive) Statistik
Dargestellt werden Methoden zur Auswertung von Messergebnissen. Ergebnisse, häufig mit einer sehr großen Zahl von Daten, müssen geordnet und gegebenenfalls verdichtet werden, bevor sie in verschiedensten Varianten dargestellt und ausgewertet werden können. Die grundlegenden Etappen einer statistischen Untersuchung sind die Untersuchungsplanung, Datenerhebung, Datenaufbereitung und Datenanalyse.
8.2.1
Univariate Datenanalyse
Das Einzelobjekt einer statistischen Untersuchung ist die statistische Einheit, die Träger der interessierenden Information(en) ist. Jede statistische Einheit wird im Hinblick auf das Untersuchungsziel durch sachliche, räumliche und zeitliche Kriterien identifiziert.
8.2 Beschreibende (deskriptive) Statistik
197
Die Eigenschaften der statistischen Einheiten oder Merkmalsträger werden als Merkmale bezeichnet und mit Großbuchstaben X, Y, ... gekennzeichnet. Ein metrisch messbares Merkmal, das abzählbar viele Ausprägungen besitzt, heißt diskret. Ein metrisch messbares Merkmal, das überabzählbar viele Ausprägungen besitzt, heißt stetig. Die einzelnen Messergebnisse werden als Merkmalswerte oder Messwerte bezeichnet und mit kleinen Buchstaben gekennzeichnet, z. B. x1, x2, ... . Die Messung der Merkmalswerte erfolgt mit Hilfe einer Skala. Die Werte auf der Skala heißen Skalenwerte. Eine Skalentransformation ist die Übertragung der Skalenwerte in Werte einer anderen Skala, wobei die Ordnungseigenschaften der Skala erhalten bleiben. Skalentypen
nicht-metrische Skalen Nominalskala
Merkmalsausprägungen bilden keine natürliche Reihenfolge (z. B. Krankheitsklassifikationen).
Ordinalskala
Merkmalsausprägungen bilden eine natürliche Rangordnung, Abstände sind aber nicht quantifizierbar (z. B. Bundesligatabellen).
metrische Skalen Intervallskala
Merkmalsausprägungen bilden eine natürliche Rangordnung, deren Abstände aber quantifizierbar sind. Der Bezugspunkt der Skala kann willkürlich festgelegt werden (z. B. Temperatur).
Verhältnisskala Wie Intervallskala, aber mit absolutem Bezugspunkt (z. B. Längenmessung). Absolutskala
Anzahlen (z. B. Anzahl der Kinder).
Die unbearbeiteten Messwerte bilden die Urliste oder das Protokoll. In der Variationsreihe sind die Messwerte der Größe nach sortiert. Treten einzelne Messwerte mehrfach auf, wird eine Häufigkeitstabelle aufgestellt, siehe Beispiel 8.18. Beispiel 8.18 Der Bedarf an einem Ersatzteil wurde über 10 Wochen in folgender Urliste erfasst: 2, 2, 1, 5, 4, 2, 1, 3, 2, 3. Der Größe nach sortiert, ergibt sich folgende Variationsreihe: 1, 1, 2, 2, 2, 2, 3, 3, 4, 5
S
8 Statistik
198
Häufigkeitstabelle
absolute Häufigkeit relative Häufigkeit relative Summenhäufigkeit
xi
(Strichliste)
(1) 1 2 3 4 5
(2)
hi (3) 2 4 2 1 1
n = 10
fi
hi n
(4) 0,2 0,4 0,2 0,1 0,1
i
si f j j 1
(5) 0,2 0,6 0,8 0,9 1
1
Graphische Darstellungen
Das obere Bild von Abbildung 8.8 zeigt die graphische Darstellung der absoluten Häufigkeit (Spalte (3) der Häufigkeitstabelle) in einem Stabdiagramm. Im unteren Bild von Abbildung 8.8 ist die zugehörige empirische Verteilungsfunktion im Intervall ( , ) als Treppenfunktion (Spalte (5)) dargestellt.
Abbildung 8.8
Als empirische Verteilungsfunktion FX (xi) des Merkmals X werde die kumulierte relative Häufigkeit derjenigen statistischen Einheiten bezeichnet, deren Merkmalswerte x kleiner oder gleich xi sind, d. h. 1 1 i FX (xi) = H( x xi ) = h j . n n j 1 Bemerkung: Bei diskreten Merkmalen ist die empirische Verteilungsfunktion immer eine Treppenfunktion. Bei einer Vielzahl unterschiedlicher Werte in der Urliste kann eine Verdichtung des Zahlenmaterials durch Zusammenfassung bzw. Häufung erfolgen. Bei Gruppierung bzw. durch Einteilung der Messwerte in Klassen entstehen reduzierte bzw. sekundäre Häufigkeitstabellen.
8.2 Beschreibende (deskriptive) Statistik
199
Bei einer Datenverdichtung durch Gruppenbildung werden die Realisationen eines Merkmals mit gleichen Merkmalswerten zu Gruppen zusammengefasst. Sollen oder können bei einer Erhebung oder bei der Aufbereitung von Daten diskreter oder stetiger Merkmale nicht alle möglichen Merkmalsausprägungen einzeln erfasst werden, lassen sich benachbarte Merkmalsausprägungen zu Klassen zusammenfassen. Im Fall diskreter Merkmale werden die Daten als quasi-stetig behandelt. Es wird unterstellt, dass die Werte innerhalb einer Klasse gleichmäßig verteilt sind. Hinweise zur Festlegung der Klassenanzahl k : (1) Es sollten mindestens 5 und höchstens 20 Klassen gewählt werden. (2) k n. (3) k 5 log n. (4) Sinnvolle Ganzzahligkeitsrechnungen können k beeinflussen. Bemerkung Wird k zu groß gewählt, ist der typische Verlauf der Verteilung möglicherweise noch nicht zu erkennen. Wird k zu klein, können wichtige markante Eigenschaften der empirischen Verteilung verloren gehen. Bezeichnungen xiu , xio untere bzw. obere Grenze der i-ten Klasse xi Klassenmitte der i-ten Klasse xi
Klassenbreite der i-ten Klasse
Die absolute Klassenhäufigkeit hi ist die Anzahl ni der Elemente, deren Merkmalswert in die Klasse i (i = 1, 2, ..., k) fällt. k h Die relative Klassenhäufigkeit fi ist bei k Klassen: f i i , f i 1 n i 1 Die graphische Darstellung der Häufigkeit klassierter Daten erfolgt i. Allg. als Histogramm in Form eines Säulendiagramms. Dabei sind die Flächeninhalte der einzelnen Säulen den absoluten bzw. relativen Klassenhäufigkeiten proportional. h f Die Säulenhöhe hi* ergibt sich aus hi* i a , bzw. fi* i a mit xi xi hi f die absolute und i die relative Häufigkeits xi xi dichte angibt und a ein Proportionalitätsfaktor ist. i = 1, 2, ..., k; wobei
S
8 Statistik
200
Aus der relativen Summenhäufigkeit Fi ergibt sich die Summenhäufigkeitsfunktion (empirische Verteilungsfunktion) F(x) als: 0 für x x1u
f
F ( x ) F ( xio1 ) i ( x xio1 ) für xio1 x xio xi
für x xko
F(x) gibt (näherungsweise) den Anteil der Elemente an, die einen Merkmalswert kleiner oder gleich x besitzen. Eine exakte Bestimmung der Summenhäufigkeit ist nur für die Klassenobergrenzen xio möglich.
Bei linearer Verbindung der Funktionswerte F ( xio ) für die Klassenobergrenzen ergibt sich der sogenannte Summenpolygon, der den Verlauf der empirischen Verteilungsfunktion graphisch beschreibt. Beispiel 8.19 Zur Analyse der Altersstruktur der 100 Beschäftigten eines mittleren Unternehmens werden die erfassten Werte in Klassen zusammengefasst:
Altersklasse absolute von... bis unter... Häufigkeit hi
relative Häufigkeit fi
relative Summen- Dichte häufigkeit Fi fi*
16 20 30 40 50 60
0,06 0,24 0,26 0,21 0,16 0,07
0,06 0,30 0,56 0,77 0,93 1,00
20 30 40 50 60 65
Abbildung 8.9
6 24 26 21 16 7 100
0,015 0,024 0,026 0,021 0,016 0,014
Das obere Bild von Abbildung 8.9 zeigt die graphische Darstellung der Dichte fi * über den Altersklassen in einem Histogramm. Die Klassen, besonders die Randklassen können, wie im Beispiel 8.19, eine unterschiedliche Breite haben. Im unteren Bild von Abbildung 8.9 ist die empirische Verteilungsfunktion im Intervall ( , ) als Summenhäufigkeitsfunktion der relativen Summenhäufigkeit Fi dargestellt.
8.2 Beschreibende (deskriptive) Statistik
201
Statistische Maßzahlen 1. Lageparameter Lageparameter sind Maßzahlen, die eine statistische Masse durch mittlere charakteristische Größen beschreiben. Es gibt Mittelwerte der Lage, die nur von der Lage zueinander abhängen (z. B. Modalwert, Median) und berechnete Mittelwerte, die unter Einbeziehung der Merkmalwerte ermittelt werden (arithmetisches, geometrisches Mittel). Modalwert (Modus, häufigster Wert)
Der Modalwert x D ist die Merkmalsausprägung, die am häufigsten vorkommt. Es kann mehrere Modalwerte geben. Für klassierte Daten wird die Klassenmitte der Klasse mit der größten Dichte (modale Klasse), d. h. dem größten Quotienten aus relativer Häufigkeit und Klassenbreite genommen. Median
Der Median ~ x , x0,5 (früher: Zentralwert xZ) ist der Wert, der in der Mitte der Variationsreihe liegt, x n 1 , falls n ungerade, d.h. n = 2k 1 2 ~ x = 1
x n x n , falls n gerade, d.h. n = 2k . 1 2 2 2 0,5 F ( xio 1 ) xi , Klassierte Daten: ~ x = F 1 ( p 0,5) xio 1 f ( xi ) wobei xi die Klasse ist, der Fi = 0,5 zugeordnet ist.
Die Summe der absoluten Abstände der Einzelwerte vom Median ist ein Minimum. Quartile und andere Quantile Wird die Variationsreihe einer Verteilung in gleich große Teile zerlegt, entstehen Quantile (früher: Fraktile). Speziell: Millile (1000), Perzentile (100), Dezile (10), Quintile (5), Quartile (4) Wird die Variationsreihe einer Verteilung in vier gleich große Teile geteilt, entstehen vier Quartile. Innerhalb der Variationsreihe der Merkmalswerte liegen links vom 1., 2. bzw. 3. Quartil x0,25, x0,5, bzw. x0,75, 25, 50 bzw. 75 % aller Merkmalswerte. Der Quartilabstand (Quartilspannweite) QA ist die Differenz zwischen 3. und 1. Quartil, QA = x0,75 x0,25 = x3/4 x1/4.
S
8 Statistik
202
Bemerkung: Zwischen dem 1. (unteres Quartil) x1/4 und dem 3. (oberes) Quartil x3/4 liegen die sogenannten mittleren 50 % der Merkmalswerte. Das 2. Quartil x1/2 ist mit dem Median identisch.
Der Dezilabstand DA ist die Differenz zwischen dem oberen Dezil x0,9 und dem unteren Dezil x0,1, DA = x0,9 x0,1. Das p-Quantil, p (0, 1), einer Verteilung ist die Realisierung xp einer Variationsreihe, für die sich p 100 % aller Realisierungen links von xp befinden. xi / p heißt i-tes p-Quantil, wenn gilt:
x j xi / p
f (x j )
i . p
Klassierte Daten: xp = F 1(p) = xio1
p F ( xio1 ) xi , p (0,1). f ( xi )
Arithmetisches Mittel (arithmetischer Mittelwert)
Das arithmetische Mittel x ist die durch den Umfang der statistischen Masse n dividierte Summe aller Merkmalswerte xi . k k 1 n 1 k x xi . Gruppierte Daten: x x j h j x j f j , n h j n i 1 n j 1 j 1 j 1 k
Klassierte Daten: x x j f j . j 1
Bemerkungen (1) Bei Unkenntnis der Verteilung der Werte innerhalb einer Klasse wird statt des arithmetischen Mittelwertes dieser Werte ersatzweise die Klassenmitte x j verwendet.
(2) Das arithmetische Mittel ist als Lageparameter besonders dann geeignet, wenn die Verteilung eingipflig und näherungsweise symmetrisch ist. (3) In der Physik entspricht das arithmetische Mittel dem „Schwerpunkt“. Harmonisches Mittel
Das harmonische bzw. gewichtete harmonische Mittel ist der Kehrwert aus dem arithmetischen Mittel der Kehrwerte der Messk n n mit n h j . werte: xh n k 1 1 j 1 ( )hj i 1 xi j 1 x j
8.2 Beschreibende (deskriptive) Statistik
203
Beispiel 8.20 Ein Fahrradfahrer fährt 10 km mit einer Geschwindigkeit von 10 km/h und 10 weitere km mit 20 km/h. Wie groß ist seine Durchschnittsgeschwindigkeit? n 20 40 20 Lösung: x h n 13,3 km/h 1 1 1 1 0,5 3 ( ) hi 10 10 20 10 i 1 x i
Geometrisches Mittel
Es seien x1, x2, ..., xn beliebige positive Merkmalswerte. Das geometrische Mittel ergibt sich nach: n
k
k
i 1
j 1
j 1
x g n xi n x j h j mit n h j . Bemerkung Das geometrische Mittel wird bei der Mittlung von Wachstumsraten oder anderen multiplikativ verknüpften Merkmalswerten angewendet. Beispiel 8.21 Ein Preis wird im Jahr 2000 mit 100 % angenommen. Die Preissteigerungen seien in den ersten drei Jahren 2 %, den fünf darauffolgenden Jahren 4 % und den dann folgenden 2 Jahren 6 %. Wie groß ist die durchschnittliche jährliche Preissteigerung und auf welchen Wert steigt der Preis in 10 Jahren?
Lösung
xg
10
1,02 3 1,04 5 1,06 2 1,0379
oder 3,79 %.
10 , 145,07 % . Der Preis steigt in 10 Jahren auf 100 10379
Für das arithmetische, geometrische und harmonische Mittel gilt die Größenbeziehung: xmax x x g xh xmin 2. Streuungsmaße Streuungsmaße liefern Angaben über die Ausbreitung der Merkmalsausprägungen vom Mittelwert. Streuungsmaße nach der Lage sind die Spannweite, Quantilabstände; berechnete Maße sind die mittlere absolute Abweichung, die Varianz, die Standardabweichung und der Variationskoeffizient. Spannweite
Die Spannweite (Range) R ist die Differenz zwischen größtem und kleinstem Merkmalswert: R = xmax xmin. Klassierte Daten :
R = x1u xko.
S
204
8 Statistik
Mittlere absolute Abweichung
Die mittlere absolute Abweichung bei M = xD oder ~ x oder x ist 1 n s M xi M . n i 1 Gehäufte diskrete Daten:
sM
k 1 k x j M hj x j M f j. n j 1 j 1
Klassierte Daten:
sM
k 1 k xj M h j xj M f j . n j 1 j 1
Varianz Die Varianz (mittlere quadratische Abweichung) ist das arithmetische Mittel der Abweichungsquadrate: 1 n 1 n Var ( X ) 2 ( xi x ) 2 xi 2 x 2 n i 1 n i 1 Gehäufte diskrete Daten: k 1 k 1 k Var ( X ) 2 ( x j x ) 2 h j ( x j x ) 2 f j x j 2 h j x 2 n j 1 n j 1 j 1
Klassierte Daten: k 1 k 1 k Var ( X ) 2 ( xj x ) 2 h j ( xj x ) 2 f j xj 2 h j x 2 n j 1 n j 1 j 1 Bemerkung (1) Die Varianz wird häufig mit s2 bezeichnet. Bei Schätzungen führt die Division durch n 1 zu einer erwartungstreuen Schätzung für die Streuung einer Grundgesamtheit, siehe 8.3.2. In Analogie zu vielen Taschenrechnern werden die Formeln für Varianz und Standardabweichung hier bei Division durch n mit 2 bzw. und bei Division durch n 1 als empirische Varianz und Standardabweichung mit s2 bzw. s bezeichnet. (2) In der Physik entspricht die Varianz dem „Trägheitsmoment vom Schwerpunkt“. Standardabweichung
Die Standardabweichung ist die Quadratwurzel aus der Varianz
Var ( X ) .
8.2 Beschreibende (deskriptive) Statistik
205
Variationskoeffizient Der Variationskoeffizient v ist ein auf das arithmetische Mittel be-
zogenes relatives Streuungsmaß v
x
, sofern nur positive
Merkmalswerte auftreten. Empirische Varianz Die empirische Varianz ist definiert durch: 1 n 1 n 2 n ( xi x ) 2 s2 xi n 1 x 2 . n 1 i 1 n 1 i 1 Gehäufte diskrete Daten: 1 k 1 k 2 n s2 (x j x)2 h j x j h j n 1 x 2. n 1 j 1 n 1 j 1
Klassierte Daten: n 1 k 2 1 k s2 x 2. ( xj x )2 h j xj h j n 1 j 1 n 1 j 1 n 1 Empirische Standardabweichung
Die empirische Standardabweichung ist die Quadratwurzel aus der empirischen Varianz s s 2 . Empirischer Variationskoeffizient
Der empirische Variationskoeffizient v ist ein auf das arithmetis sche Mittel bezogenes relatives Streuungsmaß vs , sofern nur x positive Merkmalswerte auftreten. Bemerkung Der Variationskoeffizient kann zum Vergleich empirischer Verteilungen herangezogen werden. Häufig wird er in Prozent angegeben. Zum Beispiel 8.18 Modalwert:
xD 2
Median:
1 1 x~ x 5 x 6 2 2 2 2 2
arithmetisches Mittel:
x xi fi
5
i 1
= 1 0,2 + 2 0,4 + 3 0,2 + 4 0,1 + 5 0,1 = 2,5
S
8 Statistik
206
Spannweite:
R=51=4
mittlere absolute Abweichung:
s x x i x fi
5
i 1
= 1 2,5 0,2 + 2 2,5 0,4 + 3 2,5 0,2 + 4 2,5 0,1 + 5 2,5 0,1 = 1 5
Var ( X ) 2 ( x i x ) 2 fi
Varianz:
i 1
= (1 2,5) 0,2 + (2 2,5) 0,4 + (3 2,5) 0,2 + (4 2,5) 0,1+ (5 2,5) 0,1 = 1,450 2
2
2
2
2
Var( X ) =
Standardabweichung:
1,45 1,204
Variationskoeffizient:
1,204 v 0,482 x 2,5
empirische Varianz: empirische Standardabweichung:
s 2 1,611 s 1,269
empirischer Variationskoeffizient:
vs
Zum Beispiel 8.19 Modale Klasse: Modalwert:
[ 30; 40 ) xD 2
s 1,269 0,508 2,5 x
Median:
0,5 0,3 x~ = 30 + 10 = 37,69 0,26
arithmetisches Mittel:
x xi fi
6
i 1
= 18 0,06 + 25 0,24 + 35 0,26 + 45 0,21 + 55 0,16 + 62,5 0,07 = 38,805 Spannweite: R = 65 16 = 49 6
s x x i x fi
mittlere absolute Abweichung:
i 1
= 18 38,8 0,06 + 25 38,8 0,24 + 35 38,8 0,26 + 45 38,8 0,21 + 55 38,8 0,16+ 62,5 38,8 0,07 = 11,102 6
Var ( X ) 2 ( x i x ) 2 fi
Varianz:
i 1
= (18 38,8) 0,06 + (25 38,8) 0,24 + (35 38,8) 0,26 + (45 38,8) 0,21 2 2 + (55 38,8) 0,16 + (62,5 38,8) 0,07 = 164,8 2
2
Standardabweichung: Variationskoeffizient: empirische Varianz: empirische Standardabweichung: empirischer Variationskoeffizient:
2
Var( X ) =
2
164,8 = 12,837
12,837 = 0,331 v x 38,808 2 s = 166,46 s = 12,90 12,9 s = 0,332 vs x 38,808
8.2 Beschreibende (deskriptive) Statistik
207
Konzentrationsmaße Konzentrationsmaße beschreiben die wirtschaftliche Konzentration (Zusammenballung) beispielsweise von Umsatz, Einkommen oder Vermögen auf einzelne Merkmalsträger. Eine hohe Konzentration liegt vor, wenn ein großer Anteil einer Merkmalssumme auf einen geringen Anteil von Merkmalsträgern verteilt ist. Bei einer Gleichverteilung der Merkmalssumme auf die Merkmalsträger liegt keine Konzentration vor.
Der Konzentrationskoeffizient pk
xk n
berechnet den Anteil
xi
i 1
eines Merkmalswertes an der Merkmalssumme. Das Konzentratik
onsmaß Pk pi beschreibt die relative Merkmalssumme. i 1
Bemerkung Ebenso ist eine absolute Betrachtung unter Verwendung von Anzahlen anstelle von Anteilen möglich, gilt aber als weniger aussagefähig. LORENZ-Kurve Die LORENZ-Kurve veranschaulicht das Konzentrationsmaß graphisch. Sie ergibt sich aus der Darstellung der Punkte (F(xk); Pk) und deren geradliniger Verbindung unter Einbeziehung des Punktes (0; 0). Dabei beschreibt F(xk) den Anteil der Merkmalsträger. Die Merkmalswerte müssen in aufsteigender Folge sortiert vorliegen. Die Fläche zwischen der LORENZ-Kurve und der Gleichverteilung, beschrieben durch die Gerade Pk = F(xk), d. h. die „450-Linie“, wird LORENZ-Fläche genannt und stellt ein weiteres Konzentrationsmaß dar. Beispiel 8.22 Der Umsatz von 5 Betrieben sei 400, 200, 800, 200 bzw. 400 Stück. Lösung Betrieb 1 2 3 4 5 k F( x k ) 0,2 0,4 0,6 0,8 1 n Umsatz 200 200 400 400 800 2000 k
xi
200
400
800
1200
2000
0,1
0,2
0,4
0,6
1
i 1
Pk
k 1 xi 2000 i 1
Die folgende Abbildung 8.10 zeigt die zugehörige LORENZ-Kurve.
S
8 Statistik
208
P [%]
0
Abbildung 8.10
F [%]
Bemerkung Je größer die LORENZ-Fläche, desto höher die Konzentration. Abbildung 8.11 zeigt von links keine, geringe, hohe bzw. vollständige Konzentration. Das Verhältnis von LORENZ-Fläche zur Fläche bei maximaler Konzentration (0,5) heißt GINI-Koeffizient G, 0 G 1.
Abbildung 8.11
Im Fall klassierter Daten ergibt sich die relative Merkmalssumme aus i
P ( xi )
x j
j 1
, wobei xj Klassenmitte der j-ten Klasse ist.
Nx
Beispiel 8.23 In einem kleinen Unternehmen werden folgende Gehälter gezahlt:
Gehalt Anzahl
1.000 – 2.000 2.000 – 3.000 3.000 – 4.000 4.000 – 5.000 5 7 4 4
Lösung Gehalt
xj
Häufigkeit hi F(xj)
1.500
2.500
3.500
4.500
5
7
4
4
0,25
0,60
0,80
1
Gehalt
7.500 17.500 14.000 18.000
7.500 25.000 39.000 57.000
Pi
0,132
0,439
0,684
1
57.000
8.2 Beschreibende (deskriptive) Statistik
8.2.2
209
Bi- und multivariate Datenanalyse
Mehrdimensionale Häufigkeitsverteilungen stellen Zusammenhänge zwischen mehreren Merkmalen von Elementen einer statistischen Masse dar. Dabei sind folgende Fragen zu klären: (1) Existiert ein Zusammenhang zwischen den Merkmalen? (2) Wie stark ist dieser Zusammenhang, wenn er existiert (Korrelationsrechnung)? (3) Wie lässt sich ein existierender Zusammenhang funktional beschreiben (Regressionsrechnung)? Bivariate Häufigkeitsverteilungen Darstellungs- und Vorgehensweise werden im Wesentlichen an einer bivariaten Datenmenge (eine Datenmenge mit zwei sachlichen Merkmalen) dargelegt. Es werden statistische Einheiten mit den Merkmalen X und Y betrachtet. Die abhängige Variable Y (Wirkung) besitzt die Realisationen yk (k = 1, 2, ..., n); die unabhängige Variable X (Ursache) besitzt die Realisationen xi (i = 1, 2, ..., m). Die Menge der Elemente, die zugleich die Merkmalsausprägungen xi und yk haben, werden als die Klasse (xi, yk) oder kurz (i, k) bezeichnet. Die Anzahl der Elemente in der Klasse (i, k) heißt absolute Häufigkeit der Klasse (i, k) und wird mit h(xi, yk) oder kurz hik bezeichnet. Es gilt:
m n
m
n
i 1 k 1
i 1
k 1
hik hi h k
N
Randhäufig- Randhäufigkeit von X keit von Y Eine übersichtliche Darstellung liefert die Häufigkeitstabelle, in der die Merkmalsausprägungen in aufsteigender Folge angeordnet werden. Die Häufigkeitstabelle heißt (1) Kontingenztabelle bei zwei nominal skalierten Merkmalen bzw. (2) Korrelationstabelle im Fall zweier mindestens ordinal skalierter Merkmale. Die folgende Tabelle zeigt den Aufbau einer tabellarischen Darstellung für eine zweidimensionale Häufigkeitsverteilung mit absoluten Häufigkeiten, die auch analog mit relativen Häufigkeiten möglich wäre.
S
8 Statistik
210
Merkmal Y X
Spalte der Zeilensummen
y1
y2
... yk ...
yn
x1 x2 xi
h11 h21
h12 h22
... h1k ... ... h2k ...
h1n h2n
hi1
hi2
... hik ...
xm
hm1
hm2
Zeile der Spaltensummen
h1
h2
h1 h2
hin
hi
... hmk ...
hmn
hm
hk
hn
N
Die Zeilensummen sind gegeben durch:
hi
n
hik
, (i = 1, 2, ..., m)
k 1 m
h k hik , (k = 1, 2, ..., n).
und die Spaltensummen durch:
i 1
Dabei werden die Summen von absoluten bzw. relativen Häufigkeiten immer so bezeichnet, dass der Summationsindex durch einen Punkt ersetzt wird. Bezeichnungen (1) marginale Klasse: ( i, ) bzw. ( , k ) oder (Xi) bzw. (Yk) Menge der Elemente, die die Eigenschaft Xi bzw. Yk haben (2) marginale Häufigkeiten: Zeilensummen hi und die Spaltensummen h k
hi h , f k k N N Wie im eindimensionalen Feld lassen sich die absoluten Häufigkeiten in relative Häufigkeiten umrechnen. Daraus ergibt sich eine zweidimensionale Verteilung von relativen Häufigkeiten, die als Häufigkeitsfunktion (auch Häufigkeitsverteilung) bezeichnet wird. (3) marginale relative Häufigkeiten: f i
m
Für die relativen Häufigkeiten gilt:
n
m
n
i 1
k 1
f ik f i f k i 1 k 1
1.
Am Rand der Tabelle können die beiden Verteilungen abgelesen werden, die sich ergeben, wenn jedes Merkmal für sich allein betrachtet wird. Als Randhäufigkeitsfunktion (oder marginale Häufigkeiten) des Merkmals (X, Y ) werden die durch die einzelnen Merkmale X bzw. Y gegebenen eindimensionalen Häufigkeitsfunktionen (bzw. -verteilungen) bezeichnet.
8.2 Beschreibende (deskriptive) Statistik
211
Bedingte Häufigkeitsverteilung Werden nur einzelne Zeilen der zweidimensionalen Tabelle betrachtet, so zerfällt das Merkmal X in die marginalen Klassen (X1), (X2), ..., (Xm). Es lässt sich nun jede Klasse wiederum als eine Grundgesamtheit auffassen, die durch das Merkmal Y in n Klassen zerlegt wird. Jeder Klasse Xi lässt sich wieder eine Verteilung zuordnen. Eine analoge Betrachtung ist für die Spalten möglich.
Bedingte Häufigkeit von Yk bei gegebenem Xi: absolute Häufigkeit von y k xi h f ( y k xi ) ik hi Randhäufigkeit von x i Bedingte Häufigkeit von Xi bei gegebenem Yk: absolute Häufigkeit von xi y k h f ( xi y k ) ik h k Randhäufigkeit von y k Die Gesamtheit der relativen Häufigkeiten einer Zeile (Spalte) wird als bedingte Häufigkeitsverteilung von X bei gegebenen Yk (von Y bei gegebenen Xi) bezeichnet. Das Merkmal X heißt statistisch unabhängig vom Merkmal Y, wenn alle bedingten Verteilungen von X |Yk für k = 1, 2, ..., n gleich sind. Formal gilt dann h( X i ) hi für i = 1, 2, ..., m N N Aussagen über statistisch unabhängige Merkmale (1) Ist das Merkmal X vom Merkmal Y statistisch unabhängig, dann ist auch das Merkmal Y vom Merkmal X unabhängig (Symmetrie). (2) Sind die Merkmale X und Y voneinander statistisch unabhängig, so sind die bedingten Häufigkeitsverteilungen gleich der zugehörigen Randverteilung. (3) Sind die beiden Merkmale X und Y voneinander statistisch unabhängig, dann ist die zweidimensionale Häufigkeitsverteilung (X, Y ) durch die Vorgabe der beiden Randverteilungen von X und Y eindeutig bestimmt. f ( X i Y1 ) f ( X i Y2 ) ... f ( X i )
Korrelationsrechnung Für zwei metrisch skalierte Merkmale X und Y von statistischen Einheiten werden die Messergebnisse in geordneten Paaren (xi, yi), i = 1, 2, ..., n erfasst und in der Urliste festgehalten. Die Punktepaare können in ein Koordinatensystem eingetragen werden. Es entsteht eine Punktwolke, die im Streuungsdiagramm einen ersten Eindruck von Art und Stärke des Zusammenhangs zwischen den Merkmalen vermittelt. Die Abbildung 8.12 enthält 4 Beispiele.
S
8 Statistik
212
Abbildung 8.12
Die beiden ersten Beispiele zeigen einen positiv linearen Zusammenhang, das erste mit einem wesentlich stärkeren Zusammenhang. Während im dritten Beispiel kein Zusammenhang erkennbar ist, hat das vierte wieder einen stärkeren, aber nichtlinearen Zusammenhang. Statistische Maßzahlen Getrennt nach den x- und y-Werten werden die arithmetischen Mittelwerte x und y sowie die Varianzen X 2 und Y 2 definiert.
x
1 n xi n i 1
X2
1 n 1 n ( xi x ) 2 xi 2 x 2 n i 1 n i 1
y
1 n yi n i 1
Y2
1 n 1 n ( y i y ) 2 yi 2 y 2 n i 1 n i 1
Für den Grad des Zusammenhanges der beiden Merkmale X und Y werden die Kovarianz Cov (X, Y ) und der Korrelationskoeffizient rXY definiert: 1 n 1 n Cov( X , Y ) ( xi x ) ( yi y ) xi yi x y n i 1 n i 1 n
rXY
=
Cov( X , Y ) x y
( xi x ) ( y i y ) i 1
n
n
i 1
i 1
( xi x ) 2 ( y i y ) 2
n
xi yi n x y i 1
n 2
n xi n x 2 yi 2 n y 2 i 1 i 1
Für empirische Kovarianz und empirischen Korrelationskoeffizienten gelten entsprechende Formeln unter Berücksichtigung von s 2.
Bemerkung Der Korrelationskoeffizient rXY kann Werte zwischen 1 und +1 annehmen. Bei rXY = 1 liegt ein starker negativer Zusammenhang vor. Wächst rXY langsam an, so nimmt der starke Zusammenhang langsam ab, bis bei
8.2 Beschreibende (deskriptive) Statistik
213
rXY = 0 kein Zusammenhang erkennbar ist. Bei positiv wachsendem rXY wächst der Zusammenhang (die Korreliertheit) wieder, bis bei rXY = +1 ein starker positiver Zusammenhang vorliegt. Regressionsrechnung Liegt ein relativ stark korrelierter Zusammenhang zweier Merkmale vor, kann er durch die Regressionsgerade yˆ a0 a1 x angegeben werden. Mit der Methode der kleinsten Quadrate (siehe Abschnitt 6.6) werden die Normalgleichungen und daraus die Bestimmungsgleichungen für a0 und a1 ermittelt.
yˆ a0 a1 x heißt empirische Regressionsgerade. a1 ist der empirische Regressionskoeffizient und a0 ist die empirische Regressionskonstante. Wurde bereits der Korrelationskoeffizient rXY ermittelt, so können zur Berechnung von a1 und a0 folgende Beziehungen genutzt wer Cov( X , Y ) rXY Y und a0 y a1 x. den: a1 2
X
X
Die praktische Berechnung des empirischen Korrelationskoeffizienten und der empirischen Regressionsgeraden erledigt ein Taschenrechner mit Statistikteil, kann aber auch mit einer Häufigkeitstabelle erfolgen. Beispiel 8.24 Gegeben sind folgende Realisierungen der Zufallsgrößen X und Y: X 2 5 8 4 Y 1 1 2 2 (1) Es soll der empirische Korrelationskoeffizient berechnet werden. (2) Die empirische Regressionsgerade ist zu ermitteln. Lösung: Zunächst wird die Korrelationstabelle angegeben: 2 2 yi xi yi xi yi i xi 1 2 1 4 1 2 2 5 1 25 1 5 3 8 2 64 4 16 4 4 2 16 4 8
19 4 109 19 1 n 4,75 (1) x x i = 4 n i 1
10
27 4 1 n y yi 1 4 n i 1
X2
1 109 90,25 1 n 2 x i n x 2 (109 4 4,75 2 ) 4,6875 4 4 n i 1
Y2
1 10 4 1 n 2 y i n y 2 (10 4 12 ) 1,5 4 n i 1 4
S
8 Statistik
214
Cov( X ,Y ) r XY
1 8 1 n ( x i y i n x y ) (27 4 4,75 1) 2 n i 1 4 4
Cov( X ,Y ) x y
(2) yˆ a0 a1 x
yˆ 0,43 x 1,03
2 4,6875 1,5 a1
0,7542 Cov( X ,Y )
x2
2 0,4267 4,6875
a0 y a1 x 1 0,4267 4,75 1,0267
Streuungszerlegung
Für eine empirische Regressionsgerade yˆ a0 a1 x lässt sich zu jedem xi der zugehörige Regressionswert yi berechnen. Für die Varianz der Regressionswerte gilt: Y2
1 n 2 yi y . n i 1
Wegen Y2 b 2 2X kann die Varianz der Regressionswerte auf die Varianz des Merkmals X zurückgeführt werden. Die gesamte Varianz Y2 eines abhängigen Merkmals Y setzt sich aus der Varianz Y2 der Regressionswerte, die durch das unabhängige Merkmal X erklärt wird, und der Varianz U2 der Residuen zusammen:
Y2 = 2 + U2 . Y
Diese Streuungszerlegung gilt für lineare Regressionen und für solche nichtlineare Regressionen, die linear in den Regressionskoeffizienten sind. Bestimmtheitsmaß Zur Beschreibung des Zusammenhangs zwischen zwei metrisch messbaren Merkmalen X und Y mit einer in den Regressionskoeffizienten linearen Regressionsfunktion y f ( x ) findet das Bestimmtheitsmaß B 2 Verwendung.
B2 =
Y2 Y2
heißt Bestimmtheitsmaß und gibt den Anteil der durch X
erklärten Varianz von Y an. B B 2 heißt Bestimmtheitskoeffizient. Bemerkung Für lineare Regressionsfunktionen stimmen Bestimmtheitsmaß und Quadrat 2 2 des Korrelationskoeffizienten überein: B XY rXY .
8.2 Beschreibende (deskriptive) Statistik
215
Nichtlineare Regression Funktionen zur Beschreibung nichtlinearer Zusammenhänge yˆ a0 a1 x a 2 x 2 (1) die quadratische Funktion
yˆ a x b
(2) die Potenzfunktion
a) yˆ a b x b) yˆ a e bx a (4) logistische Funktion yˆ , a0 1 e bcx a (5) GOMPERZ-Funktion yˆ , a0 bc x e b (6) die Hyperbelfunktion yˆ a x ax (7) die TÖRNQUIST-Funktion ; a, b > 0, a - Sättigungsniveau. yˆ b x Die Schätzung der Regressionskoeffizienten erfolgt auf der Basis der Methode der kleinsten Quadrate. Zur Bestimmung der Normalgleichungen kann häufig durch eine geeignete Transformation die Linearisierung der Funktion erreicht werden (siehe Abschnitt 6.6). a) Bei den Regressionsfunktionen vom Typ (2) und (3) ergibt sich die Linearisierung durch Logarithmieren. (3) die Exponentialfunktionen
Aus y a x b ergibt sich durch Logarithmieren log y log a b log x . Substitution: Y log y ; A = log a; X = log x Auf die linearisierte Potenzfunktion Y A b X wird Vorgehensweise „Methode der kleinsten Quadrate“ angewendet. 2 2 Y Yˆ Y A b X Min. i
i
i
i
i
Daraus ergeben sich die Normalgleichungen
Yi i
und
X i Yi X i A X i i
die
i
2
n A Xi b i
b.
i
Die Bestimmungsgleichungen für die Koeffizienten log a und b der linearisierten Funktion lauten:
log xi log yi log xi log xi log yi 2 n log xi 2 log xi n log xi log yi log xi log yi b 2 n log xi 2 log xi 2
log a
S
216
8 Statistik
a , a0 1 e bcx 1 1 1 b cx 1 1 1 Übergang zum Kehrwert: e , bzw. e b cx . y a a y a a y
b) Logistische Funktion:
1 1
a
1
Logarithmieren: ln ln b cx , bzw. ln 1 b cx, y a a y Damit ist das Problem linearisiert. a , a0 c) GOMPERZ-Funktion: y x e bc Übergang zum Kehrwert und zweimaliges Logarithmieren führt auf a ln(ln ) ln b x ln c . Hierbei müsste a geschätzt werden. y d) Linearisierung für Funktionen der Typen (6) und (7) am Beispiel der ax y TÖRNQUIST-Funktion: x b 1 1 vi und ui Substitution: yi xi
1 b u A Bu a a vi A n B ui
v
Linearisierte Funktion: Normalgleichungssystem:
ui vi A ui B ui2
Bemerkung Die Anpassung der Trendwerte an die Istwerte ist nur im Messbereich optimal. Deshalb sollten Trendfunktionen bei prognostischen Untersuchungen nur für kurzfristige Vorausberechnungen genutzt werden. Bei der Transformation ist zu beachten, dass die Minimaleigenschaft verloren gehen kann, und somit unter Umständen nur eine Näherungslösung des Problems erzielt wird. Beispiel 8.25 Der Bestand an Bettwäsche (Bezüge und Laken) in Stück in Abhängigkeit von der Haushaltgröße beträgt
Haushaltgröße
1
2
3
Bestand an Bettwäsche
6,6
10,5
13,6
TÖRNQUIST-Funktion:
4 14,9
5
6 u. mehr Pers.
15,6 16,4
24,34 x y 2,675 x
Maximales Bestandsniveau: x , y a = 24,34 Stück
8.2 Beschreibende (deskriptive) Statistik
217
Multiple Regression Bei der Untersuchung der statistischen Abhängigkeit eines Merkmals Y von mehreren Merkmalen X1, ..., XP wird eine Funktion gesucht, die beschreibt, wie die Werte eines Merkmals Y tendenziell oder durchschnittlich von den anderen Merkmalen X1, ..., XP, die gemeinsam mit Y erhoben wurden, abhängen (Multiple- oder Mehrfachregression). Die einfachste Form der Beschreibung der Abhängigkeit besteht in einer linearen Regressionsfunktion (Lineare Mehrfachregression): p
y = a0 + a1x1 + a2x2 + ... + ap xp = a0 + ai xi . i 1
Spezialfall: Zweifachregression
Das Merkmal Y hängt statistisch von X und Z ab: y = a + b x + c z. Die Regressionskoeffizienten a, b und c ergeben sich unter Anwendung des Kriteriums der Methode der kleinsten Quadrate aus f (a, b ,c) = ( yi yˆ i ) 2 ( yi a b xi c zi ) 2 min i
i
Durch null setzen der partiellen Ableitungen ergeben sich die Normalgleichungen: yi n a b x i c z i
yi xi a xi b xi 2 c xi zi yi zi a zi b xi zi c zi 2 . Multiple Korrelation Ebenso wie bei zwei metrisch messbaren Merkmalen kann auch bei mehr als zwei Merkmalen die Ausgeprägtheit eines statistischen Zusammenhanges untersucht werden. Dafür eignet sich das bereits eingeführte Bestimmtheitsmaß.
Für eine Mehrfachregression heißt B 2 =
Y2 Y2
multiples Bestimmt-
heitsmaß.
Für die lineare Mehrfachregression gilt die folgende Definition. Für eine lineare Mehrfachregression y = a0 + a1x1 + ... + ap xp heißt rY , X1 ,, X p B 2 Es gilt 0 r 1.
Yˆ Y
multipler Korrelationskoeffizient.
S
8 Statistik
218
Beispiel 8.26
Für die Merkmale Y (Wirkung) sowie X und Z (Ursachen) seien folgende Werte festgestellt worden: Y 18,6 19,3 21,1 23,2 24,7 26,3 25,1 28,8 X
3,1
3,4
3,8
4,1
4,6
4,8
5,2
5,5
Z
4,8
4,5
4,9
5,3
5,5
5,4
4,8
6,1
Daraus ergibt sich die Regressionsfunktion y = 1,02124 + 3,095897 x + 2,141923 z 2
Multiples Bestimmtheitsmaß r = 0,986 6 Multipler Korrelationskoeffizient r = 0,993 3
Zusammenhangsmaße ordinal messbarer Merkmale Bisher wurden ausschließlich Verfahren und Möglichkeiten zur Untersuchung von Zusammenhängen zwischen metrisch messbaren Merkmalen behandelt. Eine Ordinalskala schreibt zwar eine Reihenfolge der Skalenwerte vor, aber keine Abstände. Für ordinal messbare Merkmale ist eine graphische Darstellung nur bei kleiner Anzahl von Beobachtungswerten sinnvoll. Rangkorrelation Günstiger ist es, wenn die Beobachtungen (xi, yi) durch Paare von Rangzahlen (xi*, yi*) ersetzt werden, die durch fortlaufende Numerierung der x- bzw. y-Werte ihrer Größe nach erhalten werden. Für diese Rangzahlenpaare lässt sich nach der bekannten Formel der Korrelationskoeffizient r berechnen. Hierbei werden die Rangzahlen als metrisch messbar interpretiert. Bei gleichen Beobachtungswerten ist die gleiche (mittlere) Rangzahl zuzuordnen. Unter Berücksichtigung, dass die Rangzahlen xi* und yi* die Werte von 1 bis n durchlaufen, kann eine vereinfachte Formel gewonnen werden, die den Rangkorrelationskoeffizienten R nach SPEARMAN liefert.
Gegeben seien zwei gemeinsam erhobene Merkmale X und Y sowie die Rangzahlen xi* und yi* der Beobachtungen (xi, yi), (i = 1, 2, ..., n) und die Rangdifferenzen di = xi* yi*. R 1
6 di 2
i
n n2 1
heißt Rangkorrelationskoeffizient und ist ein Maß
für die Ausgeprägtheit des Zusammenhangs. Es gilt 1 R 1.
8.2 Beschreibende (deskriptive) Statistik Beispiel 8.27 Für eine Gruppe von 10 voneinander Ranglisten. Bewerber 1 2 Rang in Liste X* 2 5 Rang in Liste Y* 2 3
Differenz di 2 di 6 26 R 1 1 10 99
219
Bewerbern erstellen zwei Gutachter unabhängig 3 4 5 1 9 8 1 7 10
6 7 8
7 3 5
8 9 10 4 6 10 6 4 9
0 2 0 2 2 1 2 2 2 0 4 0 4 4 1 4 4 4 156 1 0,1576 0,8424 990
1 1
55 55 26
Konkordanz und Diskordanz Beim Rangkorrelationskoeffizienten werden statt der Beobachtungswerte Rangzahlen verwendet, die dann als Werte eines metrisch messbaren Merkmals interpretiert werden. Darin liegt eine stark einengende Wirkung. Es wird ein weiteres Zusammenhangsmaß angegeben, das nur die Eigenschaften der Ordinalskala voraussetzt und dabei von der Ordnung je zweier Paare von Beobachtungswerten ausgeht.
Gegeben seien zwei Paare von Beobachtungswerten zweier ordinal messbarer Merkmale. Liegt für die Paare bezüglich beider Merkmale gleiche Ordnung vor, so heißen sie konkordant. Liegt verschiedene Ordnung vor, dann heißen sie diskordant. Bezeichnungen für die Paarvergleiche nk Anzahl der konkordanten Paare, nd Anzahl der diskordanten Paare, nx Anzahl der Paare, die bezüglich des Merkmals X übereinstimmen und bezüglich Y verschieden sind, ny Anzahl der Paare, die bezüglich des Merkmals Y übereinstimmen und bezüglich X verschieden sind, nxy Anzahl der Paare, die bezüglich beider Merkmale übereinstimmen.
Es gilt: nk + nd + nx + ny + nxy = 0,5 n (n1). Gegeben sei die gemeinsame Verteilung zweier wenigstens ordinal messbarer Merkmale X und Y, sowie die Anzahl nk der konkordanten und nd der diskordanten Paare. 2 nk nd heißt Konkordanzkoeffizient und ist ein Maß für K n n 1 den Zusammenhang der beiden Merkmale.
S
220
8 Statistik
8.2.3
Maß- und Indexzahlen
Eine Maßzahl ist eine Größe zur quantitativen Charakterisierung eines zu untersuchenden Sachverhalts. Bemerkung Gleichen Sachverhalten sollen gleiche Werte der Maßzahl entsprechen. Eine Verhältniszahl ist der Quotient aus zwei (absoluten oder relativen) Maßzahlen. Sie dient dem statistischen Vergleich. Bemerkung Die Berechnung von Verhältniszahlen sollte nur mit solchen Zahlen erfolgen, die in eine sinnvolle Beziehung gebracht werden können. Es sind folgende Arten von Verhältniszahlen zu unterscheiden: (1) (2) (3) (4)
Gliederungszahlen, Beziehungszahlen, Messzahlen und Indexzahlen.
Gliederungszahlen Eine Gliederungszahl ergibt sich aus dem Verhältnis einer Teilmenge zur Gesamtmenge. Eine Gliederungszahl ist dimensionslos und beschreibt einen Anteil. Beispiel 8.28 Die relative Häufigkeit f(xi) einer Merkmalsausprägung bzw. einer Merkmalsklasse stellt eine Gliederungszahl dar.
Beziehungszahlen Der Quotient zweier verschiedenartiger, sachlich sinnvoll zusammenhängender Größen heißt Beziehungszahl. Beziehungszahlen dienen der vereinfachten Berechnung eines arithmetischen Mittels ohne Kenntnis der Häufigkeitsverteilung des betreffenden Merkmals. Sie besitzen eine Maßeinheit. xi Summe der Merkmalswerte Beziehungszahl x i n Anzahl der statistischen Einheiten Beispiele 8.29 (1) Bevölkerungsdichte (2) Geburtenziffer (3) Rentabilität
8.2 Beschreibende (deskriptive) Statistik
221
Messzahlen
Eine Verhältniszahl aus zwei gleichartigen, aber räumlich oder zeitlich verschiedenen Größen heißt Messzahl. Messzahlen sind dimensionslos. Der Vergleich erfolgt (1) für zeitlich gleiche, aber räumlich verschiedene Größen (z. B. Preismesszahlen zum Preisvergleich für eine Ware in zwei Ländern), (2) für zwei zeitlich verschiedene Messwerte (Zeitreihenwerte) eines Merkmals. Für eine Reihe von Werten xt ( t = 0, 1, ..., T ) eines Merkmals wird die Messzahl für t zur Basis 0 berechnet nach x x M 0 t t (bzw. t 100 %), t = 1, 2, ..., T. x0 x0 Sind die xt Zeitreihenwerte, so heißt die Periode 0 Basisperiode und t heißt Berichtsperiode. Bemerkung Messzahlen beschreiben stets nur die Entwicklung einer einzelnen Größe, z. B. eines einzelnen Preises. Indexzahlen
Eine Verhältniszahl heißt Index oder Indexzahl, wenn zwei zusammengefasste statistische Größen (Preise bzw. Mengen) in einer einzigen Kennzahl in Beziehung gesetzt werden. Bemerkung Die beiden aggregierten Größen beziehen sich auf unterschiedliche Zeiträume oder unterschiedliche Regionen.
In der Wirtschaftsstatistik werden vorwiegend Wert-, Preis- und MengenIndizes berechnet. So soll mit einem Preisindex die "durchschnittliche" Preisentwicklung mehrerer Güter, die in einem Warenkorb zusammengefasst werden, durch eine einzige Zahl ausgedrückt werden. Beispiele 8.30 Preisindex: Lebenshaltung Mengenindex: Einfuhr von Investitionsgütern
Für einen Warenkorb mit n Waren sei für jede Ware i der Preis pi und die Menge qi bekannt, dann ergibt sich das Wertvolumen W des n
n
i 1
i 1
Warenkorbes W wi pi qi Mengen-Produkte aller Waren.
aus der Summe der Preis-
S
222
8 Statistik
Mit Hilfe des zu verschiedenen Zeitpunkten erfassten Wertvolumens kann ein Ausgabenvergleich angestellt werden. Gegeben sei ein Warenkorb mit n Waren, für den das Wertvolumen in der Basisperiode 0 und in der Berichtsperiode t ermittelt wurde. Die t
Verhältniszahl IW0
pi t qi t i
pi 0 qi 0
heißt Wertindex des Warenkorbes
i
für die Berichtsperiode t zur Basisperiode 0. Um besonders die Veränderungen der Preise (bzw. Mengen) eines Warenkorbes herauszuarbeiten, werden die Mengen (bzw. die Preise) in beiden Perioden konstant gehalten. Entsprechende Formeln wurden von LASPEYRES (1834-1913) und PAASCHE (1851-1925) entwickelt. Bezeichnungen qi0 Menge des Gutes i in der Basisperiode (0) qit Menge des Gutes i in der Berichtsperiode (t) pi0 Preis des Gutes i in der Basisperiode (0) pit Preis des Gutes i in der Berichtsperiode (t)
t
Die Indexzahlen IP0 ( L)
pi t qi 0 i
pi 0 qi 0
t
, IM 0 ( L)
i
qi t pi 0 i
qi 0 pi 0 i
heißen Preisindex bzw. Mengenindex nach LASPEYRES. t
Die Indexzahlen IP0 ( P)
pi t qi t i
pi 0 qi t i
t
, IM 0 ( P)
qi t pi t i
qi 0 pi t i
heißen Preisindex bzw. Mengenindex nach PAASCHE. Bemerkung (1) LASPEYRES verwendet als konstante Gewichte die Mengen (bzw. Preise) der Basisperiode. Der Vorteil besteht in der einmaligen Berechnung der Gewichte. Häufig zeigt der LASPEYRES-Index bei wirtschaftlichen Zeitreihen die Entwicklung überhöht an. (2) PAASCHE verwendet als konstante Gewichte die Mengen (Preise) der Berichtsperiode. Der Vorteil besteht in einer besseren Widerspiegelung der aktuellen Situation.
8.2 Beschreibende (deskriptive) Statistik
223
Beispiel 8.31: Ein Händler für Bürotechnik verkaufte in den Jahren 2000 und 2001 drei Arten von Kopierern in folgenden Mengen: Jahr Typ A Typ B Typ C Menge Preis Menge Preis Menge Preis 2000 32 2 000 15 5 000 4 25 000 2001 28 2 100 18 4 800 5 24 000 Es sind die Preis- und Mengenindizes für 2001 zur Basis 2000 nach LASPEYRES und PAASCHE zu berechnen. Preisindizes: LASPEYRES: 0,9841; PAASCHE: 0,9786; Mengenindizes: LASPEYRES: 1,1339; PAASCHE: 1,1276.
8.2.4
Bestands- und Bewegungsmasse
Eine statistische Masse, die stets nur zu einem bestimmten Zeitpunkt (Stichtag) erfasst wird und deren Einheiten für ein gewisses Zeitintervall der Masse angehören, heißt Bestandsmasse. Eine statistische Masse, die nur für einen bestimmten Zeitraum erfasst werden kann, weil deren Einheiten nur zu bestimmten Zeitpunkten auftreten, heißt Bewegungs- oder Ereignismasse. Bemerkung: Zu jeder Bestandsmasse existieren die korrespondierenden Bewegungsmassen Zugangsmasse und Abgangsmasse. Beispiel 8.32 Bestandsmasse
Bewegungsmassen Zugangsmasse
Abgangsmasse
Lagerbestand
Lagerzugang
Lagerabgang
Bevölkerung
Geborene Zuwanderungen
Gestorbene Abwanderungen
Verweildiagramm
8
9
t
10
Verweildiagramm (BECKERsches Schema): Die Verweildauern der einzelnen Einheiten werden in der Abbildung 8.13 über t dargestellt. Abbildung 8.13
Bestandsdiagramm: Darstellung der Bestandsfunktion B = f ( t ) B (siehe Abbildung 8.14) 40 Bemerkung 30 Die Fläche unter der Kurve 20 beschreibt den 10 Zeit-Mengen-Bestand. 0
0
1
2
3
4
5
t
Abbildung 8.14
S
224
8 Statistik
Bezeichnungen Bestand Bj
Anzahl der Einheiten einer Bestandsmasse zum Zeitpunkt tj Anfangsbestand B0 Bestand B0 = B(t0) zum Zeitpunkt t0 Endbestand Bm Bestand Bm = B(tm) zum Endzeitpunkt tm Zugang zj Anzahl der Einheiten, die zu einem Bestand im Zeitintervall ( tj-1, tj ] hinzukommen. Abgang aj Anzahl der Einheiten, die einen Bestand im Zeitintervall ( tj-1, tj ] verlassen. Verweildauer v Differenz zwischen Abgangszeitpunkt ta und Zugangszeitpunkt tz Eine Bestandsmasse heißt geschlossen, wenn für den Bestand Bt = 0 sowohl für t < t0 als auch für t > tm gilt, andernfalls liegt eine offene Bestandsmasse vor. Bestandsfortschreibung Bestandsmasse Bj zum Zeitpunkt tj
B j B0 Z j A j ,
j
wobei Z j zi - Zugangssumme i 1 j
und
A j ai - Abgangssumme i 1
Kennzahlen der Bestandsentwicklung Durchschnittliche Bestandsentwicklung 1 m 1 m Zugangsrate z z j Abgangsrate a a j m j 1 m j 1 Zeit-Mengen-Bestand
D = B (t m t 0 ) , vgl. Abbildung 8.14
Durchschnittsbestand
Zeit - Mengen - Bestand D Zeitraum t m t0 (2) Bei Kenntnis der Bestandsfunktion B(t): m 1 B B j 1 (t j t j 1 ) t m t 0 j 1 (1) Allgemein:
B
tj sind diejenigen Zeitpunkte, an denen sich der Bestand B ändert. (3) Ohne Kenntnis der Bestandsfunktion B(t): (1) Voraussetzung: Erfassung des Bestandes Bj zu beliebigen Kontrollzeitpunkten tj m B 1 j 1 B j B (t j t j 1 ) t m t 0 j 1 2
8.2 Beschreibende (deskriptive) Statistik
(2) Voraussetzung:
225
Erfassung des Bestandes B zu gleichen Abständen zwischen den Zeitpunkten t0 bis tm: B 1 B m1 B 0 B j m 2
m 2 j 1
Mittlere Verweildauer Durchschnittliche Zeitspanne zwischen Zugang und Abgang einer Einheit. (1) Bei geschlossener Bestandsmasse: B (t m t0 ) B (t m t0 ) v Am Zm Der Zähler beschreibt den Zeit-Mengen-Bestand. Bei einer geschlossenen Bestandsmasse stimmen die Anzahl der Zugänge und der Abgänge überein. (2) Bei offener Bestandsmasse: 2 B (t m t 0 ) 2 B (tm t0 ) oder v v Am Z m Am1 Z m1 Die zweite Formel ist dann anzuwenden, wenn Am und Zm zum Zeitpunkt tm eintreten. Umschlagshäufigkeit Mittlere Anzahl von Erneuerungen eines Bestandes in einem Intervall (t0, tm]: t t A Zm A Z m1 . U m 0 bzw. U m oder U m1 2 B v 2 B Beispiel 8.33 In einem Lager wird innerhalb einer Woche ein technisches Gerät bei einem Anfangsbestand B0 = 0 in folgenden Anzahlen eingelagert: Tag Zugang Abgang
ti Z A
0 20 0
1 20 10
2 30 20
3 20 40
4 10 20
5 0 10
Bestand
Bi
20
30
40
20
10
0
Die Lagerbewegung erfolgt jeweils am Beginn des Arbeitstages. Der Bestandsverlauf wird in Abb. 8.14 dargestellt. Mengen-Zeit-Bestand Durchschnittsbestand
Mittlere Verweildauer Umschlagshäufigkeit
D = 1 20 + 1 30 + 1 40 + 1 20 + 1 10 = 120 120 B 24 Geräte 5 120 v 12 , Tage 100 5 U 4,17 12 ,
S
226
8 Statistik
8.2.5
Zeitreihenanalyse
Aufgabenstellung Ist im Gegensatz zur Regressionsrechnung die Gesamtheit der Einflussgrößen oder die Art ihres Einflusses nicht bekannt oder die mathematische Beschreibung nur schwer möglich, wird nur das zeitliche Verhalten der beobachteten Größe selbst untersucht. Die Zeit tritt als Ursache an die Stelle der Gesamtheit der tatsächlichen Einflussfaktoren.
Eine statistische Reihe von Beobachtungswerten, die für aufeinander folgende Zeitpunkte oder Zeitintervalle erhoben werden, heißt Zeitreihe. Zielstellungen (1) Feststellung, ob für die aufeinander folgenden Werte einer Zeitreihe irgendeine Gesetzmäßigkeit besteht (2) Vergleich der zeitlichen Entwicklung verschiedener Tatbestände (3) Gewinnung von Aussagen über Zeitpunkte des Beobachtungsintervalls, für die kein Wert beobachtet wurde (Interpolation) (4) Formulierung von Aussagen über Zeitpunkte, die außerhalb des Beobachtungsintervalls liegen (Extrapolation, Prognose) Bewegungskomponenten von Zeitreihen Eine Zeitreihe entsteht durch das Zusammenspiel mehrerer zeitlicher Bewegungskomponenten. Dabei werden unterschieden: (1) eine Trendkomponente mT zur Erfassung einer langfristigen Grundrichtung der zeitlichen Entwicklung, (2) eine zyklische Komponente zT zur Erfassung von mittelfristigen, sich periodisch wiederholenden Einflüssen, insbesondere konjunkturelle Schwankungen, die mit einer mehrjährigen, aber nicht völlig konstant bleibenden Periode den Trend überlagern, (3) eine saisonale Komponente sT zur Erfassung jahreszeitlicher Ereignisse, die mit einer konstanten jährlichen Periode (z. B. Ursache: Jahreszeiten) auftreten und dem Trend und der zyklischen Komponente überlagert sind, (4) eine zufällige Restkomponente rT zur Erfassung aller Schwankungen der beobachteten Zeitreihe, die nicht durch die drei systematischen Komponenten (1) - (3) erfasst und gedeutet worden sind. Von diesen zufälligen Schwankungen wird postuliert, dass ihr Mittelwert null ist. Da eine klare Trennung von Trend- und zyklischer Konjunkturkomponente oftmals nicht exakt möglich ist, werden beide meistens zu einer glatten Komponente gT zusammengefasst.
8.2 Beschreibende (deskriptive) Statistik
227
Beschreibung der Beobachtungswerte YT für die Zeitpunkte T = 1, 2, ..., n : (1) additive Verknüpfung der Komponenten YT = gT + sT + rT . Sinnvoll, wenn die saisonale Komponente einen Ausschlag aufweist, der unabhängig vom Niveau der glatten Komponente gT der Zeitreihe YT ist. (2) multiplikative Verknüpfung der Komponenten YT = gT sT rT. Anzuwenden, wenn der Wert der Saisonkomponente vom Niveau der glatten Komponente abhängt. Trendermittlung Bei der Trendermittlung besteht die Aufgabe, die grundlegende Tendenz des Zeitreihenverlaufs zu ermitteln. Dazu müssen die periodischen Schwankungen und die irregulären Restschwankungen ausgeschaltet werden. Methoden (1) Bestimmung gleitender Durchschnitte Ältestes Verfahren zur Analyse von Zeitreihen. Das Ziel besteht in der Ausschaltung der Restschwankungen einer Zeitreihe der Form YT = gT + rT. Aus k Zeitreihenwerten wird das arithmetische Mittel berechnet und dem mittleren der bei der Durchschnittsbildung berücksichtigten Zeitpunkte bzw. Zeitintervalle zugeordnet.
Die Anzahl k der in die Berechnung eingehenden Werte bestimmt die Ordnung des gleitenden Durchschnitts. Durchschnitt ungerader Ordnung: 1 i DT k 2i 1 YT h für T = i + 1, i + 2, ..., n i, wobei i = 1, 2, 3, ... k h i bzw. k = 3, 5, 7, ... Durchschnitt gerader Ordnung: i 1 1 1 1 DT k 2i YT i YT h YT i für T = i + 1, i + 2, ..., n i, k 2 2
h i 1 wobei i = 1, 2, 3, ... bzw. k = 2, 4, 6, ... Beispiel 8.34 Intervall T Zeitreihe YT
D2 D3 D4
1 7
2 10
3 14
4 15
5 18
6 20
7 23
-
10,3 13,3 15,5 17,8 20,3 22,8 10,3 13,0 15,7 17,7 20,3 22,7 12,9 15,5 17,9 20,3 -
8 25 -
Nachteil: Der letzte gleitende Durchschnitt bezieht sich auf den Zeitpunkt T = n i. Das Verfahren eignet sich kaum für Prognosezwecke.
S
228
8 Statistik
(2) Bestimmung einer Trendfunktion nach dem Kriterium der kleinsten Quadrate Vorgehensweise ähnlich wie bei der Regressionsrechnung. Eine Funktion x = f (t), die den Trend einer Zeitreihe x in Abhängigkeit von der Zeit t beschreibt, heißt Trendfunktion. Beispiel zur Wahl der Zeitwerte t Jahr 1996 1997 1998 1999
2000
2001
2002
t 1 2 3 4 5 6 7 oder 3 2 1 0 1 2 3 Neben den bereits bei der Regression verwendeten Funktionstypen wird a0 häufig bei der Trendrechnung die logistische Funktion y 1 e a1 a2 t genutzt. Sie dient der Beschreibung von Wachstumsprozessen im Zeitablauf. Eine Trendfunktion lässt sich nur näherungsweise mit der Methode der kleinsten Quadrate bestimmen. Notwendige Schritte (1) Schätzung von a0 (evtl. mit iterativer Verbesserung) a (2) Umstellen der Funktion: e a1 a2 t 0 1 y a (3) Linearisierung (durch Logarithmierung): a1 a 2 t ln( 0 1) Y y (4) Normalgleichungen:
Yi n a1 a2 ti ti Yi a1 ti a2 ti 2
(3) Verfahren der exponentiellen Glättung a) Vorstufe: Gewichtete gleitende Durchschnitte Es wird eine Gewichtung der einzelnen Zeitreihenwerte vorgenommen, die ihrer Bedeutung (Informationsgehalt) bei der Bildung des gleitenden Durchschnitts entspricht: GDT = k0YT + k1YT1 + k2YT2 + ... + knYT n n
Die Gewichtsfaktoren müssen so normiert sein, dass
ki 1 gilt. i 1
Bemerkung Der gewichtete gleitende Durchschnitt wird dem aktuellen Zeitpunkt T zugeordnet. Schwierigkeiten dieser Methode (1) Bestimmung der Gewichtsfaktoren (2) Speicherung von n Beobachtungswerten und Gewichtsfaktoren
8.2 Beschreibende (deskriptive) Statistik
229
b) Verfahren der exponentiellen Glättung (Einführung) Statt der Beobachtungswerte der Vergangenheit steht nur noch der zuletzt aus n Beobachtungswerten berechnete Mittelwert YT zur Verfügung. Nach
der Beobachtung eines neuen Wertes YT+1 soll der neue Mittelwert YT1 berechnet werden. An die Stelle von YT kann ein geschätzter Mittelwert G T (Y) treten (G - Glättung). Es sei (0 < < 1) ein Reaktionsparameter, GT (Y) ein bekannter oder geschätzter Mittelwert von Y zum Zeitpunkt T, dann lässt sich mit GT 1 (Y ) YT 1 (1 ) GT (Y ) ein Mittelwert von Y für den Zeitpunkt T schätzen. Das durch diese Beziehung definierte Verfahren wird als exponentielle Glättung bezeichnet. c) Exponentielle Glättung bei zufälligen Schwankungen um eine horizontale Komponente Es soll den Beobachtungswerten eine Zeitreihe der Form YT = gT + rT zugrunde liegen, wobei die glatte Komponente ein konstantes Niveau a0 besitzt mit zufälligen Schwankungen rT, d. h. YT = a0 + rT. Die Vorhersage zur Zeit T für eine Periode im Voraus lässt sich auf folgende Weise darstellen YT 1 a 0 GT (Y ) YT (1 ) GT 1 (Y ).
Durch sukzessives rückwärtiges Einsetzen entsteht n
GT (Y ) (1 ) i YT i . Wäre die gesamte Vergangenheit bekannt, i 0
ließe sich schreiben: GT (Y ) (1 ) i YT i . Damit setzt sich der i 0
exponentiell geglättete Wert G T ( Y ) aus einer Linearkombination aller vergangenen Beobachtungswerte zusammen. Die Gewichtsfaktoren, mit denen die einzelnen Beobachtungswerte dabei gewichtet werden, fallen geometrisch mit dem Alter des Beobachtungswertes. Die Wichtungsfaktoren betragen für (1) den jüngsten Beobachtungswert: (2) den eine Periode zurückliegenden Beobachtungswert: (1) (1)i (3) den i Perioden zurückliegenden Beobachtungswert:
(1 ) i 1
i 0
Wahl des Wertes für den Reaktionsparameter (1) Ein kleiner Wert für , z. B. = 0,1, bewirkt eine fast gleichmäßige Verteilung der Gewichtsfaktoren über einen längeren Zeitraum. Der Mittelwert passt sich nur langsam an Änderungen im Kurvenverlauf an;
S
230
8 Statistik
das System reagiert "träge". Zufällige Schwankungen haben nur geringe Wirkung. (2) Ein großer Wert für , z. B. = 0,5, bewirkt eine Anhäufung der Gewichtsfaktoren auf die jüngsten Beobachtungsperioden. Es wird eine schnelle Anpassung an den Verlauf der jüngsten Beobachtungswerte erreicht; das System reagiert "nervös" auf zufällige Schwankungen der Beobachtungswerte. (3) Optimaler Wert für den Reaktionsparameter : Es existiert kein allgemeines theoretisches Suchverfahren. In der Praxis werden bereits vorhandene Mengen von Beobachtungswerten analysiert. Durch Simulation mit verschiedenen Werten für den Reaktionsparameter wird dann derjenige bestimmt, der für die Vergangenheit die beste Anpassung ergeben hat. Mit dem so bestimmten Wert für beginnt dann die Prognose. Startwert für G0(Y ) Es wird der einfache Durchschnitt der letzten N Beobachtungen gewählt: 1 N G0 (Y ) yt i . N i 1 d) Exponentielle Glättung bei Berücksichtigung eines Trendparameters Enthält die den Beobachtungswerten zugrunde liegende Zeitreihe einen Trendparameter, so hinkt der exponentiell geglättete Mittelwert hinter der Zeitreihenentwicklung her, weil zu seiner Berechnung auch Daten früherer Beobachtungsperioden beitragen. Zur Vermeidung eines systematischen Fehlers in den Prognosewerten wird das Verfahren der exponentiellen Glättung zusätzlich auf die bereits geglätteten Werte angewandt (exponentielle Glättung zweiter Ordnung). Gegeben sei eine Zeitreihe mit linearem Trend YT = gT + rT = a0 + a1 T + rT, GT (Y ) der einfach geglättete Mittelwert und GT '(Y ) der geglättete Mittelwert 2. Ordnung, dann ergibt sich zum Zeitpunkt (bzw. im Intervall) T eine Prognose für T + 1 aus YT 1 2 GT (Y ) GT 1 '(Y ). Verfahren zur Untersuchung periodischer Schwankungen Für eine aussagefähige Beschreibung des zeitlichen Verlaufes einer ökonomischen Größe reicht die Trendbestimmung im Allgemeinen nicht aus, da der Trend oft durch periodische oder auch nichtperiodische (irreguläre) Schwankungen überlagert wird. Zur Ermittlung der periodischen Schwankungen wird angenommen, dass der Gesamtzeitraum aus m Perioden (z. B. Jahre) besteht und jede Periode in n Phasen (Teilzeiträume, z. B. Woche, Monat, Quartal) zerlegbar ist.
8.2 Beschreibende (deskriptive) Statistik
231
Periodische Schwankungen sind innerhalb bestimmter Zeitabschnitte regelmäßig wiederkehrende Veränderungen der Größe einer Erscheinung, die einen unterschiedlichen Rhythmus aufweisen. Sind die Schwankungen jahreszeitlich bedingt, so heißen sie Saisonschwankungen. Die Kennziffern zur Charakterisierung der Schwankungen werden als Saisonindizes (Saisonindexziffern) bezeichnet.
Im Handel sind Saisonschwankungen jahreszeitlich gebundene, typische Veränderungen im Niveau des Warenumsatzes, deren Ursachen aus den spezifischen Angebots- und Nachfragebedingungen resultieren. Zwei wesentliche Verfahren zur Berechnung der Saisonindizes sind das (1) Phasendurchschnittsverfahren für Zeitreihen vom Typ YT = sT + rT; T = 1, 2, ..., n, in denen kein (oder nur ein geringer) Trend erkennbar ist. (2) Phasendurchschnittsverfahren für Zeitreihen vom Typ YT = gT + sT + rT; T = 1, 2, ..., n, bzw. YT = gT sT rT; T = 1, 2, ..., n, die einem Trend unterliegen. Die multiplikative Verknüpfung der Komponenten wird angewandt, wenn die periodische Schwankung mit dem Trend wächst. Es ist sinnvoll, die Zeitreihenwerte in Form einer Tabelle mit m Zeilen (Perioden) und n Spalten (Phasen) anzugeben. Die Beobachtungswerte erhalten dann eine Doppelindizierung, z. B. yik = gik + sik + rik. Bezeichnungen yik Messgröße der k-ten Phase in der i-ten Periode i Ordnungsnummer der Periode i = 1, 2, ..., m k Ordnungsnummer der Phase k = 1, 2, ..., n p Planungszeitraum y k arithmetisches Mittel aus den k-ten Phasen aller m Perioden (k-te Spalte) y arithmetisches Mittel aus allen n Phasendurchschnitten (Gesamtdurchschnitt) Ik Saisonindex der k-ten Phase tik Zeitwert für die k-te Phase in der i-ten Periode yikT Trendwert für die k-te Phase in der i-ten Periode, berechnet auf der Grundlage einer Näherungsfunktion yT = f (t) * yik trendbereinigter Wert für die Messgröße der k-ten Phase in der i-ten Periode ~ yik theoretischer Wert der k-ten Phase in der i-ten Periode auf der Grundlage der Saisonindizes yi arithmetisches Mittel aus den n Phasen der i-ten Periode (i-te Zeile) yp Plangröße für den Gesamtzeitraum p (Planzeitraum)
S
8 Statistik
232
Schrittfolge für das einfache Phasendurchschnittsverfahren (ohne Trendausschaltung) (1) Berechnung des Phasendurchschnitts: m
yik i 1
y k
, k = 1, 2, ..., n m (2) Berechnung des Gesamtdurchschnitts: n
n
y k
m
yik
k 1 i 1 , k = 1, 2, ..., n; i = 1, 2, ..., m n mn (3) Berechnung der Saisonindizes. n y I k k , k = 1, 2, ..., n mit I k n y k 1 (4) Berechnung der theoretischen Werte: ~ yik yi I k , i = 1, 2, ..., m; k = 1, 2, ..., n y
k 1
n
yi
yik
k 1
, i = 1, 2, ..., m n Schrittfolge für das Phasendurchschnittsverfahren mit Trendausschaltung Vorausgesetzt wird A) eine additive Verknüpfung der Zeitreihenkomponenten YT = gT + sT + rT B) eine multiplikative Verknüpfung der Zeitreihenkomponenten YT = gT sT rT
mit
(1) Berechnung der saisonbereinigten Trendwerte yikT - als gleitende Durchschnitte j-ter Ordnung (sinnvoll: n-ter Ordnung) - mit Hilfe einer Trendfunktion (z. B. Trendgerade) (2) Berechnung der trendbereinigten Werte yik* , indem a) die Trendwerte yikT von den Messwerten yik subtrahiert werden:
yik* yik yikT b) die Messwerte yik durch die Trendwerte yikT dividiert werden:
yik*
yik yikT
8.2 Beschreibende (deskriptive) Statistik
233
(3) Berechnung durchschnittlicher trendbereinigter Werte für a) und b) durch Bildung des arithmetischen Mittels 1 y*k yi*k , k = 1, 2, ..., n, jeder Spalte und des Gesamtmittels m1 i
y*
1 n * y k n k 1
(4) Bildung der Saisonindizes durch Normierung der Spaltenmittelwerte a) I k y*k y * (Summe der Ik muss 0 ergeben) b) I k
y*k
(Summe der Ik muss n ergeben)
y*
Bemerkung Die Berechnung der theoretischen Werte kann nach Schritt (4) des Verfahrens ohne Trendausschaltung erfolgen. Zum Vergleich der Anpassung der theoretischen Werte an die Messwerte lassen sich Varianz, Standardabweichung bzw. Variationskoeffizient nutzen. Beispiel 8.35
Ein Unternehmen setzt sich das Ziel, im Jahr 2001 einen Umsatz in Höhe von 27,4 Mio. € zu erreichen. Dieser Umsatz ist auf die Quartale aufzugliedern. Es wird vorausgesetzt, dass im betreffenden Planjahr keine zusätzlichen Faktoren wirksam werden. Folgende Umsatzdaten der Vergangenheit stehen zur Verfügung: Gesamtzeitraum 1996 1997 1998 1999 2000 Summe
I. Quartal
Phasen II. Quartal III. Quartal IV. Quartal insgesamt
4,8 5,0 5,4 5,7 5,9
5,1 5,5 5,8 6,0 6,3
5,6 5,9 6,1 6,6 6,7
5,8 6,2 6,6 6,9 7,3
21,3 22,6 23,9 25,2 26,2
26,8
28,7
30,9
32,8
119,2
Die graphische Darstellung der Umsatzwerte lässt den vorhandenen Trend und ein geringfügiges Ansteigen der Schwankungen erkennen. Es wird deshalb das Phasendurchschnittsverfahren mit Trendausschaltung bei multiplikativer Verknüpfung der Komponenten gewählt.
S
234
8 Statistik
Die Trendwerte werden berechnet als gleitende Durchschnitte 4. Ordnung: 1996 1997 1998 1999 2000
I. Qu.
II. Qu. III. Qu. IV. Qu.
5,513 5,850 6,163 6,438
5,600 5,925 6,263 6,500
5,350 5,700 6,013 6,325 -
Trendbereinigte Werte y ik*
1996 1997 1998 1999 2000
y ik y Tik
5,425 5,788 6,075 6,388 :
I. Qu.
II. Qu. III. Qu. IV. Qu.
0,9069 0,9231 0,9249 0,9164
0,967 0,975 0,967 0,969
1,029 1,028 1,012 1,034 -
1,089 1,067 1,080 1,073 -
Durchschnittliche trendbereinigte Werte: Quartal y *k
I.
II.
III.
IV.
0,9178 0,9721 1,0349 1,0767
Gesamtmittel y * 1,00039
Normierung der Spaltenmittelwerte: Quartal Ik
I.
II.
III.
IV.
0,9175 0,9717 1,0345 1,0763
Aufschlüsselung der Planwerte: Quartal ypk
I. 6,2847
II.
III.
IV.
6,6561 7,0866 7,3726
yp
27,4 [Mio. €]
Zum Vergleich: Beim additiven Ansatz ergeben sich die Planwerte Quartal ypk
I.
II.
III.
IV.
6,3600 6,6790 7,0540 7,3070
yp
27,4 [Mio. €]
8.3 Schließende (induktive) Statistik
8.3
235
Schließende (induktive) Statistik
Für Statistiken sind Vollerhebungen und Teilerhebungen möglich. Nach Vollerhebungen sind die Methoden der beschreibenden Statistik anwendbar. Aus Kostengründen werden häufig nur Teilerhebungen realisiert. Dann sind Rückschlüsse auf die Grundgesamtheit interessant.
8.3.1
Grundgesamtheit und Stichprobe
Die Grundgesamtheit besteht aus allen Realisierungen eines Merkmals X und stellt somit die gesamte statistische Masse dar, über die irgendwelche Aussagen gemacht werden sollen. Eine Stichprobe besteht aus n beliebig, sachadäquat ausgewählten Elementen der Grundgesamtheit. n heißt Stichprobenumfang. Das Ziel der schließenden Statistik besteht nun im Schließen von der Stichprobe auf die Grundgesamtheit. Dazu müssen die Elemente zufällig und repräsentativ ausgewählt werden. Jedes Element ist mit gleicher Wahrscheinlichkeit auszuwählen. Es wird von einer Zufallsstichprobe gesprochen. Eine Menge von n Realisierungen {x1, x2, ..., xn} einer Grundgesamtheit X wird als konkrete Stichprobe mit dem Stichprobenumfang n bezeichnet. Hat die Grundgesamtheit einen Umfang N und die konkrete Stich N probe einen Umfang n, so gibt es konkrete Stichproben. n Als mathematische Stichprobe wird die n-dimensionale Zufallsgröße (X1, X2, ..., Xn) mit den untereinander unabhängigen und der Grundgesamtheit X entsprechend identisch verteilten Komponenten Xi, i = 1, 2, ..., n bezeichnet. Bemerkung Die konkrete Stichprobe (x1, x2, ..., xn) ist dann eine Realisierung dieser n-dimensionalen Zufallsgröße. Gegeben sei eine Grundgesamtheit eines Merkmals X einer Zufallsgröße. Diese Zufallsgröße unterliegt ihrer theoretischen Verteilungsfunktion FX (t) = F(t), < t < +, die in der Regel unbekannt ist.
S
236
8 Statistik
Jede konkrete Stichprobe vom Umfang n beschreibt nun eine konkrete empirische Verteilungsfunktion Fn (t ).
Einen wichtigen Zusammenhang liefert der Hauptsatz der mathematischen Statistik: Satz von GLIWENKO Ist Fn ( t ) die empirische Verteilungsfunktion der mathematischen
Stichprobe (X1, X2, ..., Xn) vom Umfang n und FX (t) die Verteilungsfunktion der Grundgesamtheit X, dann konvergiert Fn ( t ) für n mit Wahrscheinlichkeit 1 gleichmäßig in t gegen FX (t). Bemerkung Für einen hinreichend großen Stichprobenumfang kann die konkrete empirische Verteilungsfunktion Fn ( t ) als Schätzung der theoretischen
Verteilungsfunktion FX (t) betrachtet werden. Stichprobenfunktionen
Eine von der mathematischen Stichprobe X = (X1, X2, ..., Xn) abhängige Zufallsgröße T heißt Stichprobenfunktion T = T (X1, X2, ..., Xn). Für eine konkrete Stichprobe ( x1, x2, ..., xn) ist t = T (x1, x2, ..., xn) die Realisierung von T. Bemerkung Bei statistischen Schätzmethoden wird die Stichprobenfunktion T als Punktschätzung oder Schätzfunktion, bei statistischen Tests als Test- oder Prüfgröße bezeichnet.
Es wird vorausgesetzt, dass die Xi des Zufallsvektors X unabhängig und identisch normalverteilt mit und 2 sind, d. h., es liegt eine Stichprobe vom Umfang n aus der nach N (, 2) normalverteilten Grundgesamtheit vor. 1 Die Stichprobenfunktion X ( X 1 X 2 X n ) ist normalvern teilt nach N ( ;
2 n
).
Die Stichprobenfunktion Z
X
n unterliegt der standardi-
sierten Normalverteilung mit = 0 und = 1.
8.3 Schließende (induktive) Statistik n
1 n 1
Die mit der empirischen Varianz s 2 ( x ) dete Stichprobenfunktion 2
237
( n 1) s 2
2
( xi x ) 2
1
gebil-
i 1
n
( Xi X )2 2
ge-
i 1
nügt der stetigen Verteilung mit der Dichtefunktion für x 0 0 x m mit m = n 1. f 2 ( x) 1 2 2 für x 0 Cm e x Bemerkung Die durch f 2 ( x ) definierte Verteilung heißt 2 -Verteilung mit m = n 1
Freiheitsgraden, siehe Tafel 3. Die Stichprobenfunktion t
X n besitzt die stetige Verteilung s
x2 mit der Dichtefunktion f t ( x ) Dm 1 m
m1 2
für < x < + ,
m = n 1 und Dm eine von m abhängige Konstante. Bemerkung Die durch ft (x) definierte Verteilung heißt t-Verteilung oder StudentVerteilung mit m = n 1 Freiheitsgraden, siehe Tafel 2.
8.3.2
Statistische Schätzverfahren
Mittels statistischer Schätzverfahren sollen durch Stichproben unbekannte Parameter der Grundgesamtheit oder unbekannte Verteilungen geschätzt werden. Die Bestimmung eines einzelnen Schätzwertes wird Punktschätzung genannt. Besser sind Intervallschätzungen, die Intervalle liefern, in denen der zu schätzende unbekannte Parameter mit einer bestimmten Wahrscheinlichkeit erwartet wird. Punktschätzungen
Bei der Punktschätzung eines unbekannten Parameters wird ein einziger aus der Stichprobe gewonnener Wert mit dem unbekannten Parameter identifiziert. Punktschätzfunktion
( X 1 , X 2 ,, X n )
Punktschätzwerte
( x1 , x2 ,, xn )
S
8 Statistik
238
Beispiel 8.36 Z. B. stellt 1 ( x 1, x 2 ,, x n ) x ( x 1, x 2 ,, x n ) = x einen Punktschätz-
wert des Parameters = E(X) der Grundgesamtheit dar.
Kriterien zur Auswahl einer Punktschätzung Welche der möglichen Schätzfunktionen enthält die meisten Informationen? (Kriterien von R. A. FISCHER)
(1) Erwartungstreu (unverzerrt) ist eine Schätzung , falls der Erwartungswert gleich dem zu schätzenden Parameter ist: E( ) .
(2) Konsistent (passend) ist eine Schätzung , wenn die Schätzfunktion mit zunehmendem n immer enger um den Parameter streut: lim P( ) 1. n
(3) Effizient (am wirksamsten, kleinste Varianz) ist eine Schätzung ~ ~ gegenüber anderen Schätzungen , wenn Var (ˆ ) Var ( ). (4) Suffizient (erschöpfend) ist eine Schätzung , wenn sie alle in der Stichprobe enthaltenen Informationen über den unbekannten Parameter ausnutzt und keine andere Schätzung besseren Aufschluss über gibt. Solche Schätzungen können mit der Maximum-Likelihood-Schätzmethode ermittelt werden, siehe z. B. bei STORM, 2001. Konfidenzschätzungen (Bereichsschätzungen)
Für einen unbekannten Parameter der Grundgesamtheit wird mit Hilfe einer Stichprobe ein Intervall mit den Grenzen G1 und G2 (G1 G2 ) gesucht, das mit einer vorgegebenen Wahrscheinlichkeit 1 überdeckt: P(G1 < < G2) = 1 . Bezeichnungen G1, G2 Konfidenzgrenzen, Vertrauensgrenzen (G1, G2) Konfidenzintervall, Vertrauensintervall Konvidenzniveau, Vertrauensniveau 1 Irrtumswahrscheinlichkeit (Üblich für : 0,05; 0,01; 0,001)
8.3 Schließende (induktive) Statistik
239
Konfidenzschätzung für den Erwartungswert einer normalverteilten Grundgesamtheit mit bekannter Varianz Gegeben sei eine normalverteilte Grundgesamtheit mit N (, 2). Es wird angenommen, dass - aus Erfahrungswerten - die Varianz 2 der Grundgesamtheit bekannt ist. Der unbekannte Erwartungswert soll mit einer Konfidenzschätzung aus einer Stichprobe mit dem Umfang n geschätzt werden, siehe Abbildung 8.15.
Konfidenzintervall für den Parameter = : xz
1
2
n
xz
1
2
n
Abbildung 8.15 Beispiel 8.37 2 (1) Gegeben sei eine normalverteilte Grundgesamtheit mit = 400. Eine Stichprobe mit n = 16 liefert x 55 . Für ist eine konkrete Konfidenzschätzung mit einer Irrtumswahrscheinlichkeit von 5 % zu ermitteln. Lösung: = 0,05 z z 0,975 196 , (Tafel 1) = 20 1
2
20
45,2 < < 64,8 55 9,8 , 16 42,1 < < 67,9. Für = 0,01 ergibt sich z0,995 = 2,58 und somit: Mit einer statistischen Sicherheit von 95 % liegt im Bereich zwischen 45,2 und 64,8 (bzw. bei 99 % zwischen 42,1 und 67,9). 55 196 ,
(2) Wie groß ist der Stichprobenumfang n zu wählen, damit bei = 0,05 das Konfidenzintervall die Länge 10 hat?
Lösung:
2z
1
2
n 2
2 2 2 20 62 n z
196 , 1 10 2
S
8 Statistik
240
Konfidenzschätzung für den Erwartungswert einer normalverteilten Grundgesamtheit mit unbekannter Varianz
Gegeben sei eine normalverteilte Grundgesamtheit mit N (, 2). Unbekannt seien und 2 der Grundgesamtheit. Der unbekannte Erwartungswert soll mit einer Konfidenzschätzung aus einer Stichprobe mit dem Umfang n geschätzt werden, siehe Abbildung 8.16. Die verwendete Schätzfunktion unterliegt einer t-Verteilung mit m = n 1 Freiheitsgraden. Konfidenzintervall für den Parameter = : s s x t x t 1 ,m 1 ,m n n 2 2
Abbildung 8.16
Bemerkung Die t-Verteilung strebt für n gegen die Normalverteilung. Daher ist für m = n 1 > 120 möglich: t t z . 1
2
;m
1
2
;
1
2
Beispiel 8.38 Einer normalverteilten Zufallsgröße entstammt eine Stichprobe vom Um2 fang n = 12 mit x 35,3 und s = 3,44, also s = 1,86.
Mit = 0,05 soll ein Konfidenzintervall für den Erwartungswert der Grundgesamtheit ermittelt werden. Lösung t t 0,975;11 2,201 (siehe Tafel 2) 1
2
;m
35,3 2,201
186 , 12
35,3 118 ,
34,12 < < 36,48
8.3 Schließende (induktive) Statistik
241
Konfidenzschätzung für die Varianz einer normalverteilten Grundgesamtheit
Gegeben sei eine normalverteilte Grundgesamtheit mit N (, 2). Unbekannt seien und 2 der Grundgesamtheit. Die unbekannte Varianz 2 soll mit einer Konfidenzschätzung aus einer Stichprobe mit dem Umfang n geschätzt werden, siehe Abbildung 8.17. Die verwendete Schätzfunktion unterliegt einer 2 -Verteilung mit m = n 1 Freiheitsgraden. Zweiseitiges Konfidenzintervall für den Parameter = 2 : (n 1) s 2
2 m ; 1
2
( n 1) s 2
2
m;
2
2
f 2 ( x)
2
2
2
1 2
m,
2
2m,1 2
m,1
2
Abbildung 8.17
Bemerkung Das Konfidenzintervall für ergibt sich, indem aus dieser Ungleichung die positive Wurzel gezogen wird. Beispiel 8.39 Gegeben sei eine normalverteilte Grundgesamtheit mit unbekanntem und . 2 Aus einer Stichprobe vom Umfang n = 30 mit s = 24 soll eine Konfidenzschätzung mit = 0,05 ermittelt werden. Lösung = 0,05 229;0,025 16,05 229;0,975 45,72 (siehe Tafel 3)
29 24 29 24 2 45,72 16,05 2 15,22 < < 43,36 bzw. 3,9 < < 6,6
S
242
8 Statistik
8.3.3
Statistische Tests
Hypothesen über Parameter oder Verteilungen einer Grundgesamtheit sind durch eine Stichprobenuntersuchung zu überprüfen. Hypothesen sind Annahmen über interessierende unbekannte Charakteristika der Grundgesamtheit, z. B. deren Kennwerte. Die Prüfung einer Hypothese H erfolgt mit statistischen Prüfverfahren, statistischen Tests, Signifikanztests bzw. Tests.
Die Aufgabe besteht darin, auf der Grundlage einer konkreten Stichprobe zu einer Entscheidung über die Hypothese H zu gelangen. Die Hypothese H wird als Nullhypothese Ho bezeichnet, wenn neben ihr noch weitere Hypothesen aufgestellt werden können, die dann als Alternativhypothesen H1 bezeichnet werden. Fehler 1. Art: Die Nullhypothese wird abgelehnt, obwohl sie richtig ist. Fehler 2. Art: Die Nullhypothese wird nicht abgelehnt, obwohl sie falsch ist. Ho ist dabei so zu wählen, dass die unangenehmeren Konsequenzen einer eventuellen Fehlentscheidung zu einem Fehler 1. Art führen. Fehler 2. Art können nur mit Alternativtests mit Alternativhypothesen H1 angegeben werden. Die Irrtumswahrscheinlichkeit (Signifikanzniveau) ist die Wahrscheinlichkeit, einen Fehler 1. Art zu machen (übliche Werte sind 0,05; 0,01 oder 0,001). Je höher das Risiko einer Fehlentscheidung ist, desto kleiner ist zu wählen. S = 1 heißt statistische Sicherheit. Bei Signifikanztests wird vorgegeben und auf die Berücksichtigung des Fehlers 2. Art und die Alternativhypothese verzichtet, obwohl ein Fehler 2. Art trotzdem bei jeder Entscheidung auftreten kann. Ein Signifikanztest zielt auf die Ablehnung der Nullhypothese und damit auf eine signifikante (statistisch gesicherte) Abweichung. Schema eines Signifikanztests
Aufstellen der Nullhypothese Ho Vorgabe der Irrtumswahrscheinlichkeit Wahl einer Testgröße U Ermittlung eines kritischen Bereiches (Ablehnungsbereich) K Berechnung einer Realisierung u zu der Testgröße U mit Hilfe einer konkreten Stichprobe vom Umfang n (6) Entscheidung über die Nullhypothese: Falls u K, so wird Ho abgelehnt! Falls u K, so wird Ho nicht abgelehnt!
(1) (2) (3) (4) (5)
8.3 Schließende (induktive) Statistik
243
z - Test: Prüfung des Erwartungswertes einer normalverteilten Grundgesamtheit mit bekannter Varianz
(1) Aufstellen der Nullhypothese Ho: E ( X ) = o (2) Vorgabe der Irrtumswahrscheinlichkeit X 0 (3) Wahl der Testgröße U n , U ist eine standardisierte
normalverteilte Zufallsgröße. (4) Ermittlung des kritischen Bereiches K (zweiseitige Fragestel # lung): K u : u $ z oder u z " 1 1 2 2! (5) Berechnung einer Realisierung u zu der Testgröße U mit Hilfe x 0 einer konkreten Stichprobe vom Umfang n : u n
(6) Entscheidung über die Nullhypothese: Falls u K , d. h.: u $ z , so wird Ho abgelehnt! 1
2
Beispiel 8.40 Einer normalverteilten Grundgesamtheit mit dem Sollwert = 4 und der bekannten Varianz = 0,003 wird eine Stichprobe vom Umfang n = 25 mit x = 4,0012 entnommen. Liegt eine signifikante Abweichung von x zum Sollwert vor?
Lösung (1) Aufstellen der Nullhypothese Ho : E(X) = o = 4 (2) Vorgabe der Irrtumswahrscheinlichkeit: = 0,05 (3) Wahl der Testgröße: U
X 0
n
(4) Kritischer Bereich: (z - Wert aus Tafel 1) # K u : u $ z oder u z " 1 1 2 2 ! K % u : u $ 1,95997 oder u 1,95997 (5) Berechnung einer Realisierung u :
u
x 0
n
4,0012 4 25 2 0,003
(6) Entscheidung: Da u 2 $ 1,95997 z
1
Wichtige Werte bei zweiseitiger Fragestellung:
&
z
0,05 0,01 0,001
1,959 97 2,575 83 3,290 53
1
2
(siehe auch Tafel 1)
, wird Ho abgelehnt, es liegt eine signi-
2
fikante (wesentliche) Abweichung von x zum Sollwert vor.
S
8 Statistik
244
t - Test: Prüfung des Erwartungswertes einer normalverteilten Grundgesamtheit mit unbekannter Varianz
(1) Aufstellen der Nullhypothese Ho: E(X) = o (2) Vorgabe der Irrtumswahrscheinlichkeit X 0 (3) Wahl der Testgröße U n , S 2 - empirische Varianz. S U ist eine t-verteilte Zufallsgröße mit m = n 1 Freiheitsgraden. (4) Ermittlung des kritischen Bereiches K (zweiseitige Fragestellung): # K u : u $ t oder u t " mit m = n 1 1 , m 1 , m 2 2 ! (5) Berechnung einer Realisierung u zu der Testgröße U mit Hilfe x 0 n einer konkreten Stichprobe vom Umfang n : u s (6) Entscheidung über die Nullhypothese: Falls u K , d. h.: u $ t , so wird Ho abgelehnt! 1
2
,m
Beispiel 8.41 Einer normalverteilten Grundgesamtheit mit einem Sollwert = 18,6 und unbekanntem wird eine Stichprobe vom Umfang n = 9 mit x = 17,7 und s = 0,2 entnommen. Ist die Abweichung von x zum Sollwert signifikant?
Lösung (1) Aufstellen der Nullhypothese Ho : E(X) = o = 18,6 (2) Vorgabe der Irrtumswahrscheinlichkeit: = 0,05
X 0 n S (4) Kritischer Bereich: (t - Wert aus Tafel 2) # K u : u $ t oder u t " 1 , m 1 , m ! 2 2 K % u : u $ 2,306 oder u 2,306 &
(3) Wahl der Testgröße: U
(5) Berechnung einer Realisierung u : x 0 17,7 18,6 9 13,5 u n 0,2 s (6) Entscheidung: Da
u 13,5 $ 2,306 t 0,975;8 , wird Ho abgelehnt;
es liegt eine signifikante (wesentliche) Abweichung von x zum Sollwert vor.
8.3 Schließende (induktive) Statistik
245
Doppel-t-Test: Prüfung der Gleichheit der Erwartungswerte zweier unabhängiger normalverteilter Grundgesamtheiten
Gegeben seien zwei unabhängige normalverteilte Grundgesamtheiten X und Y, wobei gilt: D 2(X ) = D 2(Y ) = 2 ( 2 unbekannt). Es soll geprüft werden, ob E(X ) = E(Y ) gilt. (1) Aufstellen der Nullhypothese Ho: E(X ) = E(Y ) (2) Vorgabe der Irrtumswahrscheinlichkeit (3) Wahl der Testgröße U, Sx 2, Sy 2 - empirische Varianzen U
X Y 2
(n1 1) S x (n2 1) S y
2
n1 n2 (n1 n2 2) , n1 n2
U ist eine t-verteilte Zufallsgröße mit m = n1 + n2 2 Freiheitsgraden (4) Ermittlung des kritischen Bereiches K (zweiseitige Fragestellung): # K u : u $ t oder u t " 1 , m 1 , m ! 2 2 (5) Berechnung einer Realisierung u zu der Testgröße U mit Hilfe einer konkreten Stichprobe vom Umfang n : u
n1 n2 (n1 n2 2) n1 n2
xy 2
(n1 1) sx (n2 1) s y
2
(6) Entscheidung über die Nullhypothese: Falls u K , d. h.: u $ t , so wird Ho abgelehnt! 1
2
,m
Beispiel 8.42 Zwei Stichproben unterschiedlicher unabhängiger normalverteilter Grundgesamtheiten ergaben:
x = 152,5 sx = 1,6 n1 = 15 y = 159,9 sy = 1,2 n2 = 12 Aus der Erfahrung ist bekannt, dass die Stichproben gleiche Varianzen haben. Es ist zu überprüfen, ob die Erwartungswerte der Grundgesamtheiten übereinstimmen. Lösung: Bei = 0,05 (zweiseitig) ergibt sich für Ho: E(X) = E(Y): u
152,5 159,9 , 14 2,56 11 144
15 12 25
13,3 und daher mit 27
u 13,3 2,06 t 1 0,025; 25 eine Ablehnung von Ho (t - Wert aus Tafel 2).
S
Ausgewählte Probleme des OR
9
Ausgewählte Probleme des OR
9.1
Standortproblem
Gesucht wird ein Standort für das Zentrallager (Verteillager) eines Unternehmens, wobei zu berücksichtigen ist, dass zwischen dem Lager und den Abnehmern unterschiedliche Mengen zu transportieren sind (STEINERWEBER-Problem). STEINER-WEBER-Problem Die Aufwandsfunktion unter Berücksichtigung der Mengen ai, die zwischen dem Lager mit den Koordinaten (x, y) und den Aufkommens- (bzw. Ziel-) orten mit den Koordinaten (xi, yi) zu transportieren sind, lautet: n
n
Z f ( x, y ) ai ( xi x ) 2 ( yi y) 2 ai ri i 1
i 1
mit ri ( xi x ) ( yi y ) 2
2
Es werden die partiellen Ableitungen erster Ordnung gleich null gesetzt. Z n ai Z n ai Zx x xi = 0 Zy y yi = 0 x i 1 ri y i 1 ri Diese liefern eine Fixpunktdarstellung für x und y (ri = ri (x, y)) n a n a ri xi ri yi x i 1n i y i 1n i ai a r ri i 1 i i 1 i Damit ist die Anwendung der Fixpunktiteration möglich. Startwert Schwerpunkt des Systems mit den Schwerpunktkoordinaten: n
x ( 0)
n
ai xi i 1 n
y ( 0)
ai
ai yi
i 1 n
i 1
ai i 1
Iterationsvorschrift (k = 0, 1, 2, ...) ai xi (k ) , y(k ) ) i 1 ri ( x n a (k ) i (k ) r x ( ,y ) i 1 i n
x
( k 1)
ai yi (k ) , y(k ) ) , ai (k ) (k ) ,y ) i 1 ri ( x n
y
( k 1)
i 1 ri ( x n
9.2 Spezielle LO-Probleme
9.2 9.2.1
247
Spezielle LO-Probleme Transportproblem
Gegeben sind die Aufkommensorte A1, A2, ..., Am mit den Aufkommensmengen ai (i =1, ..., m) und die Bedarfsorte B1, B2, ..., Bn mit den Bedarfsmengen bj ( j = 1, ..., n). Beim klassischen Transportproblem ist eine solche Transportvariante zu finden, die mit minimalem Gesamtaufwand verbunden ist. Dabei wird ohne Beschränkung der Allgemeinheit vorausgesetzt m
n
i 1
j 1
ai b j ,
d. h., die Gesamtsumme der Aufkommensmengen ist gleich der Gesamtsumme der Bedarfsmengen. Andernfalls ist ein fiktiver Erzeuger oder Verbraucher hinzuzufügen. Bezeichnungen xij Menge, die von Ai nach Bj transportiert wird cij Aufwand (Kosten, Entfernung) beim Transport einer Mengeneinheit von Ort Ai nach Bj Damit kann das Transportproblem als lineares Optimierungsproblem dargestellt werden: m n
Z cij xij min i 1 j 1
n
m
j 1
i 1
xij ai , xij b j ,
xij 0
j 1, 2, , n; i 1, 2, , m
Die Aufgabe liegt damit in einer Normalform vor. Sie besitzt m + n Gleichungen mit m n Unbekannten und kann mit dem Simplexverfahren gelöst werden. Häufig ist jedoch das folgende spezielle Verfahren günstiger. Lösungsverfahren zum Transportproblem Es sind zwei Schritte erforderlich. (1) Bestimmen einer zulässigen Basislösung als Startlösung für ein iteratives Lösungsverfahren. (2) Untersuchung der Lösung auf Optimalität und gegebenenfalls Verbesserung der Lösung.
O
248
9 Ausgewählte Probleme des OR
(1) Ermittlung einer zulässigen Startlösung (1.1) Nord-West-Ecken-Regel 1) In der Transportmatrix X wird die linke obere Ecke (Nordwesten) mit x11 = min (a1, b1) besetzt. 2) Ist a1 < b1, so wird den restlichen Variablen in der 1. Zeile der Wert null zugeordnet. Die erste Zeile wird nun von den weiteren Betrachtungen ausgeschlossen. 3) Ist a1 > b1, so wird den restlichen Variablen in der 1. Spalte der Wert null zugeordnet. Die erste Spalte wird dann von den weiteren Betrachtungen ausgeschlossen. 4) Ist a1 = b1, so werden entweder alle restlichen Variablen der ersten Zeile oder der ersten Spalte null gesetzt. Die entsprechende Zeile oder Spalte wird von den weiteren Betrachtungen ausgeschlossen. (Es darf aber nicht die einzig übrig gebliebene Zeile oder Spalte gestrichen werden. Wegen Ausartung wird eine Belegung mit Null-Elementen erforderlich.)
5) Es wird a1 durch a1 x11 und b1 durch b1 x11 ersetzt. Die Berechnungen beginnen erneut in der NW-Ecke der so um eine Reihe (d. h. Zeile oder Spalte) reduzierten Matrix bis alle Mengen zugeordnet worden sind. Die Nord-West-Ecken-Regel liefert meist eine ungünstige Ausgangslösung. Die beiden folgenden Methoden berücksichtigen die Aufwendungen (Kosten) und liefern somit günstigere Ausgangslösungen. (1.2) Minimum-Regel In jedem Schritt werden das Feld mit dem geringsten Aufwand (Kosten) maximal belegt sowie Zeilen oder Spalten entsprechend der Nord-WestEcken-Regel gestrichen. (1.3) VOGELsche Approximationsmethode (VAM) Dieses Verfahren liefert häufig schon die optimale Lösung oder eine gute Näherungslösung. Es umfasst folgende Teilschritte: (Reihe = Zeile oder Spalte) 1) Es werden die Differenzen zwischen den zwei kleinsten Elementen jeder Zeile und jeder Spalte der Aufwandsmatrix C gebildet. 2) Die Reihe mit der größten Differenz wird bestimmt und in ihr das Feld mit kleinstem cij maximal belegt. 3) Reihen werden entsprechend der Nord-West-Ecken-Regel gestrichen. Das formulierte Transportproblem hat folgende Eigenschaften: Sind die Parameter ai und bj ganzzahlig, dann ist jede zulässige Basislösung automatisch ganzzahlig. In jeder Reihe der Matrix (Tabelle) einer zulässigen Basislösung ist mindestens ein Feld belegt. In der Matrix (Tabelle) gibt es mindestens eine Reihe, in der genau ein Feld belegt ist.
9.2 Spezielle LO-Probleme
249
(2) Überprüfung der Optimalität Optimalitätskriterium Existieren für eine zulässige Basislösung der klassischen Transportaufgabe Potenziale u1, ..., um, v1, ..., vn , die den Bedingungen ui + vj = cij für jede Basisvariable ui + vj cij (i = 1, 2, ..., m, j = 1, 2, ..., m) genügen, dann ist diese Lösung optimal. Daraus leitet sich die Potenzialmethode (auch modifizierte Distributionsmethode (MODI) genannt) ab: Schritt 1: Die Kostenmatrix C wird zu einer Matrix C1 umgeformt, indem zeilenund spaltenweise der Reihe nach die noch zu bestimmenden Zahlen (Potenziale) u1 ..., um, v1, ..., vn von cij subtrahiert werden, und zwar so, dass alle die Elemente von C, die zur Basislösung (d. h. xij 0, falls das Problem nicht ausgeartet ist (siehe folgende Seite)) gehören, null werden. Diese Potenziale werden in der Regel rechts bzw. unten eingetragen und durch ein einfach zu lösendes Gleichungssystem bestimmt (beginnend mit v1 = 0). Die Bewertungsmatrix C1 wird durch C1 = (cij (ui + vj)) gebildet. Dabei treten durch die Bildungsvorschrift von ui und vj an den Stellen der Basiselemente Nullen auf. Sind alle Elemente von C1 0, so ist die optimale Lösung erreicht und der Algorithmus ist beendet, sonst Schritt 2. Schritt 2: Von der so gebildeten Bewertungsmatrix C1 wird das kleinste Element bestimmt. Das zugehörige Element der Transportmatrix X wird gleich einem Wert gesetzt, der so bestimmt wird, dass durch eine zyklische Umverteilung ein anderes Element null aber keins negativ wird. Dabei dürfen die Verbrauchsmengen bi und Erzeugungsmengen ai nicht verändert werden. Weiter mit Schritt 1. Beispiel 9.1 An vier Standorten eines Unternehmens werden die gleichen Rohstoffe hergestellt. Die Tagesproduktionen betragen je 40 Tonnen. Vier Abnehmer, die einen täglichen Bedarf von 30, 40, 42, 48 C S1 S2 S3 S4 Tonnen haben, sollen kostenoptimal be- A 14 16 12 4 1 liefert werden. Folgende Tabelle gibt die A2 13 12 10 5 spezifischen Transportkosten je Tonne in A3 12 18 10 7 €/t an. A4 14 15 14 9 Lösung Zunächst wird eine zulässige Basislösung nach VAM bestimmt. Die Differenzen der beiden kleinsten Elemente sind jeweils fett geschrieben. Der Übersicht halber wird das Streichen der Reihen nur angedeutet.
O
9 Ausgewählte Probleme des OR
250
C
2 1 4 5 7 9
X A1 A2 A3 A4 S1 40 40 S2 32 8 40 40 40 S3 40 S4 30 8 2 30 40 42 48 Kosten: K = 40 4 + 32 12 + 8 5 + 40 10 + 30 14 + 8 15 + 2 14 =1552 1 14 13 12 14
3 16 12 18 15
0 12 10 10 14
8 5 3 5
Die ermittelte Zuordnung wird nun bewertet. Begonnen wird mit u1 = 0, womit die Größen u und v vollständig bestimmt werden können. Die Elemente der Bewertungsmatrix C1 werden als Exponenten geschrieben. Da noch ein negativer Wert auftritt, ist zur Verbesserung der Lösung eine Umverteilung erforderlich. C
v
4
14 2 13 2 12 0 14 10
5
16 0 12 7 18 0 15 11
2
0
12 4 1 0 10 5 0 3 10 7 0 1 14 9 10 4
u 0 1 0 4
X A1 S1 S2 S3 S4 30
A2
A3
32
0+ 40 2
8+
A4 40 8
Der negative Wert tritt bei k23 auf (2. Zeile, 3. Spalte der Kostenmatrix). Das entsprechende Element x23 der Transportmatrix ist maximal zu belegen. In diesem Fall mit = 2. X A1 S1 S2 S3 S4 30 30
A2 A3 A4 40 30 2 8 40 10 40 42 48
C 40 40 40 40 v
4
14 2 13 1 12 0 14 10
5
16 0 12 6 18 0 15 11
3
12 0 10 0 10 1 14 9
0
4 0 5 2 7 1 9 4
u 0 1 1 4
Die Bewertungszahlen sind sämtlich positiv. Somit ist die optimale Lösung erreicht. Die minimalen Kosten betragen K = 1550 €.
Mehrfache Optimallösungen Gilt in einer optimalen zulässigen Basislösung, in der alle Basisvariablen positiv sind, für eine Nichtbasisvariable xij (mit Null belegtes Feld (i, j) in der Transportmatrix X ) ui + vj = cij (also die Differenz ist gleich null), so gibt es mindestens zwei optimale Basislösungen. Die weiteren Lösungen werden durch eine neue Umverteilung für das mit null belegte Element erreicht. Ausartungen Auch beim Transportproblem kann eine zulässige Basislösung ausgeartet sein, wenn weniger als m + n 1 Felder positiv belegt sind. Dieser Fall kann behoben werden, indem ein beliebiges nichtbelegtes Feld in der Näherungslösung mit einer Transportmenge versehen wird. Nach Erreichen der optimalen Lösung wird der Grenzübergang 0 vollzogen.
9.2 Spezielle LO-Probleme
251
Gesperrte Verbindungen Sollen bestimmte Transportwege gesperrt werden, sind die betreffenden Aufwandskoeffizienten durch eine sehr große Bewertung M (oder ) zu ersetzen. Danach kann mit den üblichen Verfahren gearbeitet werden.
9.2.2
Zuordnungsproblem
Das Zuordnungsproblem ist ein spezielles Transportproblem; dabei gilt m = n, ai = 1, bj = 1 (i, j = 1, 2, ..., n). Solche Probleme können bei Maschinenbelegungen, bei Arbeitsmittelumsetzungen und bei Personalzuordnungen auftreten. Für die Zuordnung von n Mitteln zu n Einsatzmöglichkeiten gibt es n! Möglichkeiten (Permutationen). Bezeichnungen cij Aufwand, der bei der Zuordnung von Mi zu Ej entsteht, 0 M i wird nicht E j wahrnehmen xij 1 M i wird E j wahrnehmen Damit lautet das Zuordnungsproblem als lineares Optimierungsproblem n
n
Z cij xij min i 1 j 1
n
n
j 1
i 1
xij 1, xij 1,
xij {0, 1} i, j
Eine Lösung des Zuordnungsproblems hat folgende Eigenschaft: In jeder Reihe des Tableaus steht genau eine 1 und sonst nur 0. Damit sind nur n der n² Felder belegt. Es liegt eine starke Ausartung vor. Aus diesem Grund ist die oben beschriebene Potenzialmethode zur Lösung des Transportproblems nicht besonders gut für die Lösung von Zuordnungsaufgaben geeignet. Eine spezielle Methode für das Zuordnungsproblem ist die folgende ungarische Methode. Ungarische Methode Schritt 1: Matrixreduktion Zeilen und Spalten der Matrix C werden reduziert, indem jeweils das Minimum jeder Zeile von jeder Zeile und anschließend das Minimum jeder Spalte von jeder Spalte subtrahiert wird. So entsteht eine Matrix mit mindestens n Nullelementen.
O
9 Ausgewählte Probleme des OR
252
Schritt 2: Erste Zuordnung Es wird xij = 1 so den Nullelementen zugeordnet, dass in jeder Zeile und in jeder Spalte genau eine 1 steht. Wurde eine vollständige Zuordnung gefunden, ist diese optimal. Sonst Schritt 3: Schritt 3: Matrixtransformation (3.1) Zeilen und Spalten, in denen Nullelemente auftreten, werden derart mit Linien belegt, dass alle Nullelemente mit möglichst wenig Linien überdeckt werden. Das geschieht so: a) Es werden die Zeilen ohne Zuordnung durch einen Stern (*) markiert. b) Es werden die noch nicht markierten Spalten, die Nullelemente in den bereits markierten Zeilen haben, mit (*) markiert. c) Es werden die noch nicht markierten Zeilen, die Zuordnungen in den markierten Spalten haben, mit (*) markiert. d) Es werden die Schritte b) und c) solange wiederholt, bis keine Markierungen mehr erfolgen. e) Es werden alle nichtmarkierten Zeilen und alle markierten Spalten gestrichen, d. h. mit einer Linie belegt. (3.2) Es wird die Matrix so reduziert, dass das kleinste nicht überdeckte Element von allen nicht überdeckten Elementen subtrahiert und zu allen doppelt überdeckten Elementen (wo sich Linien kreuzen) addiert wird. Die nur einmal überdeckten Elemente bleiben unverändert. Schritt 4: Sekundärzuordnung Für die durch Schritt 3 entstandenen Nullelemente werden weitere Zuordnungen entsprechend Schritt 2 vorgenommen. Beispiel 9.2 In einer Abteilung sind 6 Stellen S1, S2, ..., S6 mit 6 Mitarbeitern M1, M2, ..., M6 zu besetzen. Jeder Mitarbeiter ist in der Lage, die entsprechende Tätigkeit zu verrichten, jedoch unterschiedlich S2 S3 S4 S5 S6 S1 schnell. In der nebenstehenden M1 11 15 15 13 10 12 Tabelle sind die Zeiten angegeM2 23 33 34 25 30 27 ben, die die Mitarbeiter zur Erledigung der jeweiligen Arbeits- M3 33 36 40 38 39 37 M4 15 16 20 17 15 13 aufgabe benötigen. M5 11 11 13 16 12 12 M6 20 21 19 17 24 25 Lösung Schritt 1: a) Subtraktion des jeweils kleinsten Zeilenelementes M1 M2 M3 M4 M5 M6
S1 1 0 0 2 0 3
S2 5 10 3 3 0 4
S3 5 11 7 7 2 2
S4 3 2 5 4 5 0
S5 0 7 6 2 1 7
S6 2 4 4 0 1 8
9.3 Rundreiseproblem
253
b) Subtraktion des jeweils kleinsten Spaltenelements S1 S2 S3 S4 S5 S6 Schritt 2: Erste Zuordnung M1 1 5 3 3 2 0 Die so gefundenen 5 Zuordnungen 10 9 2 7 4 M2 0 (fette Nullen) sind noch nicht M3 0 3 5 5 6 4 vollständig. Deshalb wird die M4 2 3 5 4 2 0 Matrixtransformation notwendig M5 0 0 5 1 1 0 (Schritt 3). M6 3 4 0 7 8 0 Schritt 3: Matrixtransformation S1 S2 S3 S4 S5 M1 1 5 3 3 0 10 9 2 7 M2 0 M3 0 3 5 5 6 M4 2 3 5 4 2 M5 0 0 5 1 0 M6 3 4 0 7 0 *2 Die Reduktion liefert: S1 S2 S3 S4 S5 M1 3 5 3 3 0 M2 0 8 7 5 0 1 3 3 4 M3 0 M4 4 3 5 4 2 M5 2 0 5 1 0 M6 5 4 0 7 0
9.3
S6 2 4 4 0 1 8
S6 2 2 2 0 1 8
*3 *1
Der Übersicht halber sind die Sterne durchnummeriert. Das kleinste nicht überdeckte Element ist 2.
Schritt 4: Es ist eine vollständige Zuordnung möglich und so die optimale Lösung erreicht: S1 ist mit M3, S2 mit M5, S3 mit M6, S4 mit M2, S5 mit M1 und S6 mit M4 zu besetzen.
Rundreiseproblem
(Traveling-Salesman-Problem) Problemstellung Gegeben sind n verschiedene Orte Ai, i = 1, 2, ..., n. cij (i j) sei der Aufwand für einen Reisenden (ein Fahrzeug), wenn er von Ai zu Aj fährt. (Aufwand steht für Entfernung, Kosten oder Zeit usw.) Allgemein wird cij cji angenommen, da z. B. Einbahnstraßen oder ähnliches vorliegen können. Das Rundreiseproblem (engl.: Traveling-Salesman-Problem) kann folgendermaßen formuliert werden: Ein Reisender, der in einem Ort startet, möchte alle restlichen Orte genau einmal besuchen und zum Ausgangsort zurückkehren. In welcher Reihenfolge hat er die Orte zu besuchen, damit der Gesamtaufwand des Reiseweges minimal ist? Dabei ist die Anzahl aller möglichen Wege (n 1)! ((n 1)-Fakultät).
O
9 Ausgewählte Probleme des OR
254
Lösungsverfahren (1) Verfahren der vollständigen Enumeration Alle (n 1)! Möglichkeiten werden durchgerechnet und verglichen. Der geringste Aufwand liefert die Lösung. Dieses Verfahren ist nur für eine sehr kleine Anzahl von Orten geeignet. (2) Näherungsverfahren (heuristisches Verfahren) Diese Verfahren liefern im Allgemeinen nicht die optimale Reihenfolge der Orte, sondern nur eine suboptimale Lösung. Die Qualität der Lösung (Abweichen vom Optimum) ist meist nicht einschätzbar. (2.1) Verfahren des besten Nachfolgers Ausgehend von einem Startort wird der mit dem geringsten Aufwand erreichbare Ort in die Rundreise einbezogen. Es sind dabei Kurzzyklen (weniger als n Orte sind in der Rundreise) zu vermeiden. Bei der Einbeziehung der letzten Orte können ungünstige Gesamtlösungen entstehen. (2.2) Verfahren der sukzessiven Einbeziehung von Orten (Zeilen- bzw. Spaltensummenverfahren) Dieses Verfahren liefert bessere Lösungen. Ausgegangen wird von einem beliebigen Anfangszyklus, der aus drei Orten besteht. Ein weiterer Ort wird dann jeweils an der günstigsten Stelle eingefügt. Es ist zweckmäßig, den Anfangszyklus aus den drei am ungünstigsten gelegenen Orten zu bilden. Sie zeichnen sich durch die höchste Zeilen- bzw. Spaltensumme der Aufwandskoeffizienten aus. Einbezogen wird anschließend der nächst ungünstig gelegene Ort. (3) Die "Branch-and-Bound"-Methode (Verzweigungsverfahren) Dieses relativ aufwendige Verfahren ermittelt die optimale Lösung durch sinnvolles Aufspalten der Lösungsmenge in disjunkte (elementefremde) Teilmengen. Eine ausführliche Beschreibung des Algorithmus ist z. B. bei Zimmermann, 2001, zu finden. Lösungsalgorithmus für das Spaltensummenverfahren (1) Bestimmen der Aufwandsmatrix C = (cij). (2) Bestimmen der Spaltensummen Sj (ohne Hauptdiagonalelemente), Sj
n
cij ,
i 1 i j
j 1, 2, , n .
(3) Nummerierung der Ortspunkte nach fallenden Sj. (4) Zusammenstellung einer ersten Rundreise aus den drei Ortspunkten mit den größten Sj. (5) Einfügen eines Ortes mit dem nächst kleineren Sj in die Rundreise, sodass ein minimaler Aufwandszuwachs entsteht. (6) Falls alle Orte in der Rundreise berücksichtigt wurden, liegt die Näherungslösung vor, sonst (5).
9.4 Reihenfolgemodelle Beispiel 9.3 Durch die Orte A (Ausgangsort), Rundreise bestimmt werden. Der Aufwand in €, um von Ort zu Ort zu gelangen, ist in der nebenstehenden Tabelle gegeben.
255
B, C, D, E soll eine kostenoptimale
A B C D E
A 10 12 24 26
B 10 150 14 26
C 12 150 12 62
D 24 14 12 56
E 26 26 62 56 -
Lösung (1) Verfahren des besten Nachfolgers Von A aus liegt B am nächsten (10 €). Weiter von B zu D (14 €), von D zu C (12 €), von C zu E (62 €) und schließlich von E zu A (26 €). Die so ermittelte Rundreise ist dann R(A, B, D, C, E, A) mit dem Gesamtaufwand von 124 €. (2) Verfahren der sukzessiven Einbeziehung von Orten A B C D E Nr.
A 10 12 24 26 72 5
B 10 150 14 26 200 2
C 12 150 12 62 236 1
D 24 14 12 56 106 4
E 26 26 62 56 170 3
Begonnen wird mit der Rundreise zwischen den Orten mit der Rangfolge 1, 2, 3 zwischen den Orten C, B, E: R1(C, B, E, C) hat einen Aufwand von 238 €. Anschließend wird Nr. 4, also Ort D, einbezogen. Der Vergleich der drei Möglichkeiten liefert die günstigste Variante R2(C, D, B, E, C) mit einem Aufwand von 114 €. Schließlich wird die Rangposition 5 und damit der letzte Ort A berücksichtigt. Unter den vier Rundreisen ist die günstigste Rundreise R3(C, D, B, E, A, C) mit einem Aufwand von 90 €. Ein Starten im Ausgangsort A verändert den Aufwand nicht. Der (sub)-optimale Reiseweg ist dann R(A, C, D, B, E, A). Damit wurde ein wesentlich besseres Ergebnis erzielt als mit dem ersten Verfahren.
9.4
Reihenfolgemodelle
Klassisches Reihenfolgeproblem ( Fertigungs-Ablaufplanung) Gegeben sind n Maschinen M1, ..., Mn und m Aufträge A1, ..., Am, zu deren Bearbeitung die Maschinen Mj notwendig sind. Jeder Auftrag hat eine bestimmte "technologische Reihenfolge". Es soll ein solcher Ablaufplan, eine solche Auftragsfolge, gefunden werden, damit ein günstiger Effekt entsteht, z. B. - minimale Durchlaufzeit (Gesamtbearbeitungsdauer) - maximale Kapazitätsauslastung.
O
9 Ausgewählte Probleme des OR
256
Allgemeine Voraussetzungen (1) Auf jeder Maschine (Fertigungsstufe) kann zur gleichen Zeit nur ein Auftrag bearbeitet werden; (2) die Aufträge werden ohne Unterbrechung (ohne Zwischenschieben eines anderen) auf den Maschinen bearbeitet; (3) die Aufträge sind unteilbar (nicht zerlegbar in Teile, die nacheinander bearbeitbar sind); (4) die Bearbeitungszeiten (-dauer) tij für Ai auf Mj sind bekannt; (5) die Bearbeitungszeiten tij sind unabhängig von der Auftragsfolge; (6) wird eine Maschine frei, dann wird sofort der nächste Auftrag des Ablaufplanes in Angriff genommen, sofern einer vorhanden ist; (7) verlässt ein Auftrag eine Maschine, dann wird er der nächsten Maschine zugeführt, sofern diese frei ist; (8) Transportzeiten zwischen den einzelnen Maschinen können vernachlässigt werden; (9) Zwischenprodukte (unvollendete Aufträge) können zwischen den Stufen (Maschinen) gelagert werden, falls sie warten müssen. Dabei ist die technologische Reihenfolge für alle Aufträge gleich (FlowShop-Scheduling-Problem) und die Aufträge müssen eine Maschine nur einmal durchlaufen.
9.4.1
Algorithmus von Johnson-Bellman
Fall 1: Gleiche technologische Reihenfolge, n = 2 Maschinen
M1
M2
Es sei T = (tij) die Matrix der Bearbeitungszeiten und die Durchlaufzeit D das Optimalitätskriterium, dann liefert die Regel von JOHNSON-BELLMAN: Auftrag Ai steht in der optimalen Reihenfolge vor dem Auftrag Ak, wenn min (ti1, tk2) < min (tk1, ti2), einen Algorithmus zur Konstruktion der optimalen Lösung. (Matrix T: Aufträge - Zeile, Maschine - Spalte!) (1) Zu bestimmen ist ein Minimum in T. Tritt dieses in der 1. Spalte (für Maschine 1) ein, dann ist der entsprechende Auftrag als erster zu fertigen; andernfalls als letzter. Wird dieses Minimum sowohl in der 1. als auch in der 2. Spalte angenommen, kann über beide Aufträge beliebig verfügt werden. (2) Es wird die Zeile, die zum fixierten Auftrag gehört, gestrichen; auf die reduzierte Matrix T wird dann erneut Prozedur (1) angewandt, bis alle Aufträge eingeordnet wurden.
9.4 Reihenfolgemodelle
257
Beispiel 9.4 Folgende Matrix gibt die Bearbeitungszeiten der 6 Aufträge Ai auf den Maschinen Mj an. M2 Nr. Von den 6! = 720 Möglichkeiten M1 lautet die durchlaufzeitminimale 7 11 1 Reihenfolge A1 - A6 - A4 - A2 - A3 - A5 A1 A2 15 24 4 23 16 5 A3 9 12 3 A4 19 8 6 A5 8 18 2 A6
Maschine
Die Bestimmung der Durchlaufzeit kann über ein GANTT-Diagramm erfolgen
0
7
18
Bearbeitungszeit auf den Maschinen 1 und 2 36 48 72 A6 A4 A2 A3
A1 2 1 A1 A6 A4 0 0 7 15 24
A2
A3 39
88
96100 A5
A5 52
71
100
Zeiteinheiten
Damit beträgt die Bearbeitungsdauer aller 6 Aufträge 96 Zeiteinheiten.
Fall 2: Gleiche technologische Reihenfolge, n = 3 Gilt min ti1 max ti 2 oder min ti 3 max ti 2 , dann ergibt sich eine sehr i i i i gute Näherungslösung, indem auf die Matrix T ' = (t'ij) mit t'i1 = ti1 + ti2, t'i2 = ti2 + ti3 der im Fall 1 angegebene Algorithmus angewandt wird. Beispiel 9.5 8 5 4 8 5 5 4 13 9 3 T = 11 4 19 modifizierte Matrix T´ = 11 4 4 19 = 15 23 1 11 8 21 11 8 8 21 19 29 2 Die erste der oben genannten Bedingungen ist erfüllt. Als optimal erweist sich die Auftragsfolge A2 - A3 - A1. Zur Bestimmung der Gesamtdauer werden die Zeilen von T entsprechend der berechneten Auftragsfolge sortiert. Aus der so entstehenden Matrix T1 wird die Matrix TG der Gesamtdauer berechnet, indem jeweils zum größeren Wert die Bearbeitungsdauer tij addiert wird: 11 4 19 11 15 34 T1 = 11 8 21 TG = 22 30 55 8 5 4 30 35 59 Damit ist der Bearbeitungsprozess nach 59 Zeiteinheiten beendet.
O
258
9 Ausgewählte Probleme des OR
9.4.2
Zeilenbewertungsverfahren (n 3)
Gegeben ist die Arbeitsgangzeitenmatrix T = (tij), i = 1, ..., m; j =1, ..., n. ( i - Auftrag, j - Maschine) 1. Schritt: Wertreduzierung von T Alle Elemente tij, die kleiner als ein gegebenes t* sind, werden gleich null gesetzt Matrix T*. Empfohlen wird die Wahl von t* derart, dass 0 < t* min {Zi}, mit Zi = max {tij}, d. h. Zeilenmaximum. 2. Schritt: Bewertung von T* In der somit erhaltenen Matrix T* erfolgt die Doppelbewertung von Zeilen aus der Anzahl (i) der am Zeilenanfang in zusammenhängender Folge stehenden Nullen und aus der Anzahl (i) der am Zeilenende in zusammenhängender Folge stehenden Nullen. 3. Schritt: Umordnen Umordnung der Zeilen in T* nach fallenden (i) und steigenden (i): Aus der Menge aller (i) und (i) wird das (ein) Maximum gesucht. Ist das Maximum ein -Wert (-Wert), so wird die betreffende Zeile (der betreffende Auftrag) aus T in der aufzubauenden Matrix T* an die Spitze (das Ende) der Bearbeitungsreihenfolge gestellt. Mit dem Rest der Aufträge wird in gleicher Weise verfahren, bis alle Aufträge eingeordnet sind. Beispiel 9.6 In der folgenden Tabelle sind die Bearbeitungszeiten gegeben. A1 A2 A3 A4 A5 A6
M1 45 70 30 30 5 8
M2 65 18 39 25 15 5
M3 9 15 55 10 50 22
M4 10 5 6 5 61 32
max 65 70 55 30 61 32
gewählt wird t* = min {Zi} = 30
Die Reduzierung der Matrix liefert das folgende Ergebnis. A1 A2 A3 A4 A5 A6
M1 45 70 30 30 0 0
M2 65 0 39 0 0 0
M3 0 0 55 0 50 0
M4 0 0 0 0 61 32
0 0 0 0 2 3
2 3 1 3 0 0
R 4 5(6) 3 6(5) 2 1
Damit sind die Aufträge in der Reihenfolge A6, A5, A3, A1, A2, A4 oder A6, A5, A3, A1, A4, A2 abzuarbeiten.
9.5 Netzplanmodelle
9.5 9.5.1
259
Netzplanmodelle Einführung
Einsatzgebiete (1) Projektierung und Ausführung von Investitionsvorhaben (2) Vorbereitung von Modernisierungs- und Instandhaltungsmaßnahmen (3) Planung und Organisation von Produktionsprozessen (4) Vorbereitung und Realisierung von Forschungs- und Entwicklungsaufgaben (5) Organisation von Wahlkämpfen, Großveranstaltungen, Messen Aufgabenstellung Viele Einzelvorgänge (Aktivitäten) eines Prozesses müssen zeitlich, kapazitätsmäßig und kostenmäßig aufeinander abgestimmt werden, wobei bestimmte Bedingungen eingehalten werden müssen. Die Modellierung erfolgt durch einen Netzplan. Die Teilprozesse heißen Aktivitäten oder Vorgänge, ein Ereignis der Beginn oder das Ende einer Aktivität. Darstellungsmöglichkeiten (1) Vorgangspfeilnetz (VPN) Vorgänge (Aktivitäten, Arbeitsgänge) werden durch Pfeile repräsentiert, Ereignisse durch Knoten (Kreis, Rechteck). (2) Vorgangsknotennetz (VKN) Vorgänge werden durch Knoten dargestellt, die Pfeile drücken nur die Abhängigkeit zwischen den Vorgängen aus. Folgende Schritte sind bei der Anwendung der Netzplantechnik erforderlich: 1. Strukturanalyse und Erstellung des Netzplanes (1) Zerlegung des Projekts in einzelne Vorgänge (Arbeitsgänge) (2) Ermittlung der Zeitdauer für die einzelnen Vorgänge (3) Feststellung der technologischen bzw. wirtschaftlichen Abhängigkeiten (4) Graphische Darstellung des Netzplanes 2. Zeitplanung (Terminplanung) (1) Berechnung des frühestmöglichen Endtermins, der von der Dauer der einzelnen Vorgänge und ihrer wechselseitigen Abhängigkeiten bestimmt wird. (2) Erfassen der zeitlichen Spielräume (Pufferzeiten), um die gewisse Vorgänge ausgedehnt werden können, ohne dass der Endtermin gefährdet wird. 3. Kapazitätsplanung (1) Ermittlung des Kapazitätsbedarfs in Abhängigkeit von den Vorgängen und der Zeit, (2) Eventueller Kapazitätsausgleich durch zeitliche Verschiebung einzelner Vorgänge.
O
260
9 Ausgewählte Probleme des OR
4. Kosten- und Finanzplanung (1) Feststellung der Kosten der Vorgänge auf der Grundlage der Zeitplanung, (2) Untersuchung, inwieweit sich eine zeitliche Verschiebung von Vorgängen auf die Kosten auswirkt oder die Projektdauer durch den erhöhten Einsatz zusätzlicher Mittel verkürzt wird. Bei der Aufstellung eines Vorgangspfeilnetzes können Scheinaktivität mit der Dauer null auftreten. Voraussetzungen für ein Vorgangspfeilnetz (1) Die Pfeile, die Aktivitäten darstellen, sollten sich möglichst nicht kreuzen. (2) Die Ereignisse sind im Netzplan von 1 (Anfangsereignis) bis N (Endereignis) derart durchnummeriert, dass die Nummer an einer Pfeilspitze stets größer ist als die Nummer am betreffenden Pfeilende. Es sind alle "Punkte" (Knoten) eines Netzplanes Ereignisse und alle Strecken zwischen zwei Punkten vollständige Aktivitäten. Entsprechend zweiter Annahme kann die Struktur eines Netzplanes (und damit des Prozesses) auch mittels einer (oberen Dreiecks-) Matrix, der sog. Adjazenzmatrix oder Strukturmatrix A = (aij), dargestellt werden. Diese ist folgendermaßen erklärt: aij 1, falls i < j und Verbindung zwischen i und j vorhanden aij 0, falls i < j und Verbindung zwischen i und j nicht vorhanden aij 0, falls i j
9.5.2
Zeitplanung nach Critical Path Method (CPM)
Folgende Voraussetzungen sind für CPM erforderlich: (1) Eine deterministische logische Struktur muss vorliegen, d. h., das Prozessergebnis erfordert die Realisierung aller Vorgänge im Netz. (2) Es wird nur zwischen parallel ablaufenden und nacheinander ablaufenden Vorgängen unterschieden, d. h., Überlappungen können nicht berücksichtigt werden. (3) Die Dauer der Vorgänge D (V ) ist für alle Vorgänge bekannt, für Scheinvorgänge gilt D (V ) = 0. Bezeichnungen i, j Ereignisnummern (i, j) Vorgang vom Ereignis i zum Ereignis j i = 1 Nummer des Startereignisses i = n Nummer des Zielereignisses Dij Dauer des Vorgangs (i, j) Als Startzeitpunkt des Prozesses wird der Zeitpunkt 0 festgelegt.
9.5 Netzplanmodelle
261
Bemerkung Zeitpunkt ist ein festgelegter Punkt im Ablauf, dessen Lage durch Zeiteinheiten (z. B. Minuten, Tage, Wochen) beschrieben und auf einen Nullpunkt bezogen ist (relativ). Termin ist ein durch Kalenderdatum und/oder Uhrzeit ausgedrückter Zeitpunkt (absolut). (nach DIN 69900, Teil 1) Algorithmus zur Zeitplanung (1) Vorwärtsrechnung Ermittlung der frühest möglichen Zeitpunkte (FZ): FZ1 = 0 Zj = max [FZi + Dij], j = 2, 3, .., n (i, j ) Bj Bj ist die Menge der im Ereignis j endenden Vorgänge. FZn ist die berechnete Gesamtdauer des Prozesses. (2) Rückwärtsrechnung Ermittlung der spätest zulässigen Zeitpunkte (SZ) für das Eintreten jedes Ereignisses: SZn = FZn , min [SZ j D ij] , i = n 1, n 2, .., 1 SZi = (i, j ) Bj Bi+ ist die Menge der im Ereignis i beginnenden Vorgänge. (3) Berechnung der Pufferzeit Pi = SZi FZi Ereignisse mit Pi = 0 heißen kritische Ereignisse. (4) Berechnung folgender Zeitwerte für jeden Vorgang FAZ (Frühester AnfangsZeitpunkt) Zeitpunkt für den frühesten Anfang eines Vorgangs FAZij = FZi SAZ (Spätester AnfangsZeitpunkt) Zeitpunkt für den spätest zulässigen Anfang eines Vorgangs SAZij = SZj Dij FEZ (Frühester EndZeitpunkt) Zeitpunkt für die frühest mögliche Beendigung eines Vorgangs FEZij = FZi + Dij SEZ (Spätester EndZeitpunkt) Zeitpunkt für das spätest zulässige Ende eines Vorgangs SEZij = SZj
O
262
9 Ausgewählte Probleme des OR
GP (Gesamte Pufferzeit eines Vorgangs) Zeitspanne zwischen frühest möglichem und spätest zulässigem Anfang (Ende) eines Vorgangs GPij = SZj FZi D ij = SAZij FAZij = SEZij FEZij FP (Freie Pufferzeit eines Vorgangs) Anteil an der gesamten Pufferzeit, der verbleibt, wenn alle "Nachfolger" zu ihrem frühest möglichen Zeitpunkt beginnen FPij = FZj FZi Dij UP (Unabhängige Pufferzeit eines Vorgangs) Anteil der freien Pufferzeit, der verbleibt, wenn alle "Vorgänger" zum spätest zulässigen Zeitpunkt enden und alle "Nachfolger" zu ihrem frühest möglichen Zeitpunkt beginnen 0 UP ij = max FZ j SZ i Dij FRP (Freie RückwärtsPufferzeit eines Vorgangs) Zeitspanne, um die ein Vorgang gegenüber seiner spätesten Lage verschoben werden kann FRPij = SZj SZi Dij BP (Bedingte Pufferzeit) Differenz zwischen gesamter und freier Pufferzeit eines Vorgangs BPij = SZj FZj = GPij FPij Bemerkungen Pufferzeiten sind Zeitreserven im Netzplan, sie können beim Eintreten von Störungen genutzt werden. Verschoben oder verlängert werden können nur nichtkritische Vorgänge, wenn die Gesamtdauer gleich bleiben soll. Die unabhängige Pufferzeit steht immer zur Verfügung. Von vorhergehenden Vorgängen ist kein Einfluss möglich, ihre Nutzung hat auch keinen Einfluss auf nachfolgende Vorgänge. Die freie Pufferzeit hat keinen Einfluss auf nachfolgende Vorgänge. Sie ist aber abhängig von Vorgängern. Die Nutzung der bedingten Pufferzeit wirkt sich auf nachfolgende Vorgänge aus. (5) Markierung der Vorgänge mit GPij = 0 (kritische Vorgänge) und der Vorgänge mit kleinem GP-Wert (subkritische Vorgänge). Eine Folge kritischer Vorgänge heißt kritischer Weg. In jedem CPM-Netz gibt es mindestens einen kritischen Weg vom Startereignis zum Zielereignis.
9.5 Netzplanmodelle
263
Der kritische Weg ist der zeitlängste Weg im Netz, er bestimmt die Gesamtdauer des Prozesses. Eine Folge subkritischer Vorgänge wird als subkritischer Weg bezeichnet. Er besitzt nur geringe Pufferzeiten. Graphische Darstellung der Pufferzeiten Vorgang (i, j ) Vorgang ( j, k ) FAZ (FZi)
SAZ (SZi)
FAZ (FZj) UP
Vij
Vij
Vjk
FP
Vij
SAZ (SZj)
Vjk
GP
Vij
Vjk
FRP
Vjk BP
Vjk
Beispiel 9.7 Ein technologischer Ablauf wird auf folgende Weise beschrieben: Vorgang A B C D E Lösung
Vorläufer A A B, C
Dauer (Tage) 42 56 28 70 14 2 42
A 1 0
D
42
4
0
112
42
70
0
112 0
C 28
0
B E 56 70
Bezeichnung:
Nr. FZ
SZ P
14
3 28
98
Der kritische Weg A, D ist durch die stärkeren Pfeile gekennzeichnet. Die Dauer beträgt 112 Tage.
O
264
9 Ausgewählte Probleme des OR
Tabelle zur Ermittlung der weiteren Größen: Vorgang A (1; 2) B (1; 3) C (2; 3) D (2; 4) E (3; 4)
Dauer FAZ FEZ SAZ SEZ GP FP BP UP 42 0 42 0 42 0 0 0 0 56 0 56 42 98 42 14 28 14 28 42 70 70 98 28 0 28 0 70 42 112 42 112 0 0 0 0 14 70 84 98 112 28 28 0 0
Zur Darstellung des zeitlichen Ablaufes kann ein GANTT-Diagramm genutzt werden. Vorgang A B C D E
Zeit (FAZ)
0
9.6
40
80
112
Tage
Standardmodell für offene Wartesysteme
Voraussetzung: M/M/s - System (1) s-Kanalsystem mit exponentiell verteilten Ankunftsintervallen und Bedienzeiten (exponentiell verteilt = M (MARKOV-Eigenschaft)), (2) offenes Wartesystem mit s parallel angeordneten, gleichwertigen und absolut zuverlässigen Bedienungsstellen (Servicestellen), (3) Forderungenstrom in diesem Modell sei ein POISSON-Strom, d. h. die Ankunftshäufigkeit der Forderungen aus der Quelle genügt einer POISSON-Verteilung mit dem Parameter (Ankunftsrate). Der inverse Wert 1 ist die mittlere Zwischenankunftszeit (Erwartungswert), die exponentiell verteilt ist. Im Abfertigungsprozess werde die Bedienungsdauer mit TB und ihr Erwartungswert mit E(TB) bezeichnet. Der Parameter ! = 1/E(TB) heißt Bedienungs- oder Abfertigungsrate und gibt die mittlere Anzahl von Forderungen an, die ein Bedienungskanal in einer Zeiteinheit abfertigen kann. Um alle Forderungen bedienen zu können, muss somit < s ! gelten. Nur wenn je Zeiteinheit weniger Forderungen eintreffen als abgefertigt werden können, werden die Bedienungsstellen über einen längeren Zeitraum mit den an sie gestellten Forderungen fertig. Der Grenzfall = s ! führt in der Tendenz zu einer unendlichen Länge der Warteschlange, da Stillstandszeiten eines Bedienungskanals später nicht mehr aufgeholt werden können.
9.6 Standardmodell für offene Wartesysteme
265
Der Quotient " = /! wird als Verkehrswert des Systems bezeichnet. Für das betrachtete System M/M/s gilt: - für die Wahrscheinlichkeit p (Warteschlange ist leer) 1
s1 " n "s + p0 = n= 0 n! ( s 1)!( s " ) - für die mittlere Schlangenlänge E(LW) E( LW ) =
" s+1 p0 2
" s s!1 s - für die mittlere Wartezeit E(TW) E( T W ) =
E ( LW )
=
" s p0 2
" ! s s!1 s - für den Auslastungsgrad des Systems #b = " /s - für die mittlere Anzahl besetzter Bedienungskanäle E(Lb) = s#b = " - für die mittlere Anzahl im System verweilender Forderungen E(Lv) = E(LW) + E(Lb). Beim einkanaligen Wartesystem M/M/1 lassen sich die angegebenen Größen als Spezialfall für s = 1 schreiben. Dann gilt p0 = 1 " , E(LW) = " ²/(1 ") und E(TW) = " /(! ) . Bei konstanter Bedienungsdauer ergibt sich ein System M/D/s. Für dessen mittlere Schlangenlänge gilt E(LW [M/D/s])= 0,5E(LW [M/M/s]). Beispiel 9.8 Gegeben ist ein Verkaufslager mit einer Bedienungsstelle. Es treffen durchschnittlich 15 Kunden/Stunde ein. Die Bedienungsdauer beträgt durchschnittlich 3 Minuten/Kunde und ist exponentiell verteilt. Die Ankünfte sind POISSON-verteilt. Lösung: System M/M/1 = 15 K/h = 0,25 Kunden/Minute Ankunftsrate Bedienungsrate ! = 20 K/h = 0,33 Kunden/Minute Verkehrswert " = 0,75 = hb (Auslastungsgrad) Leerwahrscheinlichkeit p0 = 0,25 Mittlere Schlangenlänge E(LW) = 0,75²/0,25 = 2,25 Kunden Mittlere Wartezeit E(TW) = 0,75/(0,33-0,25) = 9 Minuten/Kunde Mittlere Verweilzeit E(TV) = E(TW) + E(TB) = 9 + 3 = 12 Minuten
O
266
9 Ausgewählte Probleme des OR
9.7
Lagerhaltung
9.7.1
Einführung
Die Beschaffung Bestellzyklus: Zeit t zwischen aufeinanderfolgenden Bestellungen; Bestellmenge: Menge, die zur Auffüllung des Lagers bestellt wird; Beschaffungszeit: Dauer zwischen Bestellung und Verfügbarkeit des Gutes am Lager. Beim Bestellpunktsystem wird eine Bestellung mit konstanter Bestellmenge stets dann ausgelöst, wenn ein Meldebestand s im Lager erreicht oder unterschritten wird. Der Meldebestand ist so zu wählen, dass Fehlmengenkosten möglichst vermieden werden. Daraus ergeben sich variable Bestellintervalle. Das Bestellrhythmussystem ist durch konstante Beschaffungsintervalle gekennzeichnet. Zum Zeitpunkt der Bestellung wird die Bestellmenge als Differenz zwischen dem Maximalbestand S des Lagers und dem aktuellen Lagerbestand festgestellt. Die Kosten (bezogen auf einen festen Zeitraum) K = KB + KL + KF
KB KL KF
Beschaffungskosten Lagerkosten Fehlmengenkosten
Die Nebenbedingungen Diese können in der folgenden Form auftreten: der Bedarf wird in diskreten Einheiten angegeben; die Bestellung ist nur in diskreten Verpackungseinheiten möglich; Gewährung von Rabatt ab einer bestimmten Bestellmenge; beschränkter Lagerraum. Aufgabenstellung Gegeben b Bedarf [ME/ZE], k0 konstante Beschaffungskosten je Beschaffung [GE], k1 variable Beschaffungskosten je Mengeneinheit [GE/ME], kl Lagerkosten je Mengeneinheit und Periode [GE/(ME·ZE)]. kf Fehlmengenkosten je Mengeneinheit und Periode [GE/(ME·ZE)]. Gesucht z Bestellumfang (Liefermenge) [ME], T Bestellzyklus (Länge einer Bestellperiode)[ZE] Kmin die minimalen Kosten [GE]. In Abhängigkeit von den gegebenen Größen entstehen unterschiedliche Berechnungsmodelle.
9.7 Lagerhaltung
9.7.2
267
Deterministische Modelle
Modell 1: Klassisches Losgrößen-Modell Voraussetzungen (1) Der Bedarf b an einem Gut ist zeitlich gleichmäßig verteilt. (2) Fehlmengen werden nicht zugelassen. (3) Die Beschaffungszeit ist gleich null. (4) Bestellungen sind jederzeit in beliebiger Höhe möglich. Dabei sollen in gleichen zeitlichen Abständen gleich große Bestellungen realisiert werden ((T, z)-Bestellregel), siehe Abbildung 9.1. Die (T, z)-Regel hat folgenden Verlauf des Lagerbestandes I(t) zur Folge:
Abbildung 9.1
Die Gesamtkosten betragen in diesem Fall: K ( z)
b k0 k z b k1 l z 2
z*
2 k0 b kl
Diese kostenoptimale Bestellmenge z* entspricht der Minimalstelle von K(z). Die Herleitung verläuft analog Abschnitt 5.5.5. (siehe Abbildung 9.2)
Abbildung 9.2 Beispiel 9.9 Der jährliche Bedarf b ist gleichmäßig verteilt und er beträgt 1000 kg, die konstanten Beschaffungskosten k0 betragen 200 € je Lieferung, die variablen Beschaffungskosten k1 0,5 €/t, die Lagerkosten kl 10 €/kg im Jahr.
O
9 Ausgewählte Probleme des OR
268
Dann gilt für die optimale Bestellmenge: z*
2 k0 b kl
2 200 1000 200 kg. Die dazugehörigen Kosten betra10
gen 2500 €. Notwendig sind 5 Lieferungen im Jahr zu je 200 kg.
Modell 2: Deterministisches Modell mit Mengenrabatt Lagerhaltungssysteme, bei denen der Einkaufspreis je ME von der eingekauften Menge abhängt, werden allgemein als System mit Mengenrabatt bezeichnet. Gewöhnlich verringert sich der Preis, wenn die eingekaufte Menge vergrößert wird. Die Beschaffungskosten einer Periode berechnen sich auf folgende Weise kB = k0 + k1(z) z. Die variablen Kosten k1(z) sind abhängig vom Rabatt und können in folgender Form dargestellt werden: k1(1) für z1 z z2 k1 ( z ) ( m 1) für zm 1 z zm k1 k ( m ) für z zm 1 Hierdurch sind m Preisstufen festgelegt. Losgrößen kleiner als z1 sind nicht erlaubt. Die Kosten je Zeiteinheit des Lagerhaltungs-Systems betragen K ( z)
b k0 k z b k1 ( z ) l z 2
z*
2 k0 b kl
Das Kostenminimum kann an der Stelle z* mit K´(z*) = 0 liegen oder an den Stellen zi (i = 1, 2, ..., n), da hier der neue Rabatt zu wirken beginnt. Die kostenoptimale Bestellmenge zopt ergibt sich dann aus dem z-Wert, der zu minimalen Gesamtkosten führt (siehe Abbildung 9.3): zopt = {z*, zi | K(z) = min{K(z*), K(zi)}} Beispiel 9.10 Der Bedarf b ist konstant und gleichmäßig verteilt, er beträgt 1 000 Stück im Quartal (90 Tage). Die konstanten Beschaffungskosten betragen k0 = 40 €/Lieferung. Die variablen Beschaffungskosten k1 (in €/Stück) haben für z Stück die Höhe 5 für 1 z 120 k1 4 für 100 z 300 3 für 300 z die Lagerkosten sind kl = 20 €/Stück im Quartal.
9.7 Lagerhaltung
269
Abbildung 9.3 Lösung Es gilt z * 2 40 1000 / 20 63,25 63 (Stück). Die dazugehörigen Kosten betragen K(z*) = 6 264,91 €. Bei den (sinnvollen) unteren Rabattgrenzen betragen die Kosten K(z2) = 5 400 € bzw. K(z3) = 6 133,33 €. Damit liegt das Minimum bei z2 = 100 (Lieferumfang von 100 Stück) mit den minimalen Kosten von 5 400 €. Das bedeutet, dass 10 Lieferungen in einem Abstand von 9 Tagen erforderlich sind.
Modell 3: Deterministisches Modell mit Fehlmengen Voraussetzungen (1) Der Bedarf b an einem Gut ist zeitlich gleichmäßig verteilt. (2) Fehlmengen werden zugelassen; ihre Kosten/ZE betragen kf. (3) Die Beschaffungszeit ist = 0. (4) Bestellungen sind jederzeit in beliebiger Höhe möglich. (5) Es wird eine (T, z) - Bestellregel angewandt. Aus den Voraussetzungen ergibt sich, dass die Losgröße eine Konstante ist mit z = bT. (siehe Abbildung 9.4)
O Abbildung 9.4
270
9 Ausgewählte Probleme des OR
Für das optimale Bestellniveau S* , die minimalen Kosten K(z) und die optimale Bestellmenge z* gelten: S* z
kf kl k f
K ( z)
b k0 ( z S *) 2 S 2 k1 b * k l kf z 2z 2z
z* 2b k 0
kl k f kl k f
Der Servicegrad c = S/z des Lagers beschreibt das Verhältnis von unmittelbar befriedigtem Bedarf zum Gesamtbedarf. Der kostenoptimale Servicegrad c* ergibt sich aus:
c*
kf kl k f
Beispiel 9.11 Der jährliche Bedarf b ist gleichmäßig verteilt und er beträgt 3000 t, die konstanten Beschaffungskosten k0 je Lieferung betragen 100 €, die variablen Beschaffungskosten k1 50 €/t, die Lagerkosten kl 10 €/t im Jahr, die Fehlmengenkosten kf = 20 €/t im Jahr. Dann gilt für die optimale Bestellmenge z* in t: z * 2b k 0
kl kf 10 20 300. 2 3000 100 kl kf 10 20
Das optimale Bestellniveau beträgt S * z
kf 20 300 200 t. kl kf 10 20
Notwendig sind 10 Lieferungen im Jahr zu je 300 t. Dabei ist der maximale Lagerbestand 200 t. Für die Kosten bei einer Bestellmenge von z = 300 gilt: 2 2 b k0 S * k ( z S *) k k1 b l f z 2z 2z 2 (300 200 ) 2 200 3000 100 20 152 000 50 3000 10 2 300 2 300 300 Die dazugehörigen Kosten betragen somit 152 000 €. kf 20 0,667. Der optimale Servicegrad ist hierbei c * k l k f 10 20
K (z)
9.7.3
Stochastische Modelle
Bei der Behandlung stochastischer Lagerhaltungsprobleme wird versucht, den stochastischen Nachfrageprozess über Prognosen und Einführen eines Sicherheitsbestandes in den deterministischen Grundmodellen zu berücksichtigen. Bei stochastischem Bedarf können 4 grundsätzlich unterschiedliche Verfahren zur Bestimmung der Bestellintervalle und Bestellmengen angewendet werden (siehe folgende Tabelle).
9.7 Lagerhaltung
271
Bestellintervall T variabel
Bestellmenge z
fix
fix
(T, z) - Politik
(s, z) - Politik
Losgrößen-Verfahren
variabel
(T, S) - Politik
(s, S) - Politik
Auffüll-Verfahren
Bestellpunkt-
Bestellzyklus-
Verfahren
T konstante Bestellperiodenlänge s Bestand, bei dem bestellt wird z konstante Bestellmenge S Höchstbestand Exemplarisch wird ein stochastisches Modell mit (T, z)-Politik behandelt. Wie beim deterministischen Modell 1 des vorhergehenden Abschnitts erfolgt die Lieferung einer konstanten Menge z in festen Zeitintervallen T. Um die Bedarfsschwankungen auszugleichen und stets eine gewisse Lieferbereitschaft sicherzustellen, muss hier zusätzlich ein Sicherheitsbestand R gehalten werden. Dieser Sicherheitsbestand R kann mit Hilfe der Statistik über die Standardabweichung bestimmt werden: R = · . Der Sicherheitsfaktor resultiert aus der Normalverteilung, die bei diesen Bedarfsschwankungen unterstellt wird. Die dazugehörige Lieferbereitschaft lässt sich direkt aus der Tafel 1 (siehe Anhang) ablesen. Die empirische Standardabweichung wird über
1 n ( xi x ) 2 n 1 i 1
bestimmt (siehe auch Abschnitt 8.2.1). Der Verbrauch der vergangenen Perioden wird analysiert. Dabei ist xi der Bedarf in der Zeitperiode i (i = 1, 2, ..., n) und x der mittlere monatliche Verbrauch (arithmetisches Mittel). Der Bestand unmittelbar nach einer Lieferung sollte dann s = x + · betragen. Beispiel 9.12 In einem Lager wurde in den vergangenen 12 Monaten folgender Abgang an einem Gut festgestellt: Monat J F M A M J J A S O N D Menge in t 18 20 24 16 12 26 23 19 14 22 23 18 Zu ermitteln ist die Höhe des Sicherheitsbestandes der mit einer Sicherheit von 95% ausreichen wird und die Höhe des Lagerbestandes direkt nach der Lieferung. Lösung Eine Auswertung liefert x = 19,6 und = 4,2 (siehe Abschnitt 8.2.1). Der Sicherheitsfaktor für 95 % wird aus der Tafel 1 unten, Quantile z q der standardisierten Normalverteilung, entnommen (s. Anhang). Diese liefert den Wert 1,64486. Damit beträgt der Sicherheitsbestand R = · = 1,64486 · 4,23 6,96 t. Der Lagerbestand s ist dann monatlich auf 26,6 t aufzufüllen.
O
Tafeln
272
Tafel 1: Verteilungsfunktion ( x ) der standardisierten Normalverteilung x
.,.0
.,.1
.,.2
.,.3
.,.4
.,.5
.,.6
.,.7
.,.8
.,.9
0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 4,0 5,0 >5
,5000 ,5040 ,5398 ,5438 ,5793 ,5832 ,6179 ,6217 ,6554 ,6591 ,6915 ,6950 ,7257 ,7291 ,7580 ,7611 ,7881 ,7910 ,8159 ,8186 ,8413 ,8438 ,8643 ,8665 ,8849 ,8869 ,9032 ,9049 ,9192 ,9207 ,9332 ,9345 ,9452 ,9463 ,9554 ,9564 ,9641 ,9649 ,9713 ,9719 ,9772 ,9778 ,9821 ,9826 ,9861 ,9864 ,9893 ,9896 ,9918 ,9920 ,9938 ,9940 ,9953 ,9955 ,9965 ,9966 ,9974 ,9975 ,9981 ,9982 ,9987 ,9987 ,999 68 ,999 999 71 1
,5080 ,5478 ,5871 ,6255 ,6628 ,6985 ,7324 ,7642 ,7939 ,8212 ,8461 ,8686 ,8888 ,9066 ,9222 ,9357 ,9474 ,9573 ,9656 ,9726 ,9783 ,9830 ,9868 ,9898 ,9922 ,9941 ,9956 ,9967 ,9976 ,9982 ,9987
,5120 ,5517 ,5910 ,6293 ,6664 ,7019 ,7357 ,7673 ,7967 ,8238 ,8485 ,8708 ,8907 ,9082 ,9236 ,9370 ,9484 ,9582 ,9664 ,9732 ,9788 ,9834 ,9871 ,9901 ,9925 ,9943 ,9957 ,9968 ,9977 ,9983 ,9988
,5160 ,5557 ,5948 ,6331 ,6700 ,7054 ,7389 ,7704 ,7995 ,8264 ,8508 ,8729 ,8925 ,9099 ,9251 ,9382 ,9495 ,9591 ,9671 ,9738 ,9793 ,9838 ,9875 ,9904 ,9927 ,9945 ,9959 ,9969 ,9977 ,9984 ,9988
,5199 ,5596 ,5987 ,6368 ,6736 ,7088 ,7422 ,7734 ,8023 ,8289 ,8531 ,8749 ,8944 ,9115 ,9265 ,9394 ,9505 ,9599 ,9678 ,9744 ,9798 ,9842 ,9878 ,9906 ,9929 ,9946 ,9960 ,9970 ,9978 ,9984 ,9989
,5239 ,5636 ,6026 ,6406 ,6772 ,7123 ,7454 ,7764 ,8051 ,8315 ,8554 ,8770 ,8962 ,9131 ,9279 ,9406 ,9515 ,9608 ,9686 ,9750 ,9803 ,9846 ,9881 ,9909 ,9931 ,9948 ,9961 ,9971 ,9979 ,9985 ,9989
,5279 ,5675 ,6064 ,6443 ,6808 ,7157 ,7486 ,7794 ,8078 ,8340 ,8577 ,8790 ,8980 ,9147 ,9292 ,9418 ,9525 ,9616 ,9693 ,9756 ,9808 ,9850 ,9884 ,9911 ,9932 ,9949 ,9962 ,9972 ,9979 ,9985 ,9989
,5319 ,5714 ,6103 ,6480 ,6844 ,7190 ,7517 ,7823 ,8106 ,8365 ,8599 ,8810 ,8997 ,9162 ,9306 ,9429 ,9535 ,9625 ,9699 ,9761 ,9812 ,9854 ,9887 ,9913 ,9934 ,9951 ,9963 ,9973 ,9980 ,9986 ,9990
,5359 ,5753 ,6141 ,6517 ,6879 ,7224 ,7549 ,7852 ,8133 ,8389 ,8621 ,8830 ,9015 ,9177 ,9319 ,9441 ,9545 ,9633 ,9706 ,9767 ,9817 ,9857 ,9890 ,9916 ,9936 ,9952 ,9964 ,9974 ,9981 ,9986 ,9990
Quantile zq der standardisierten Normalverteilung ( x ) q 0,9 0,95 0,975 0,99 0,995 0,999 0,9995
zq 1,28155 1,64486 1,95997 2,32635 2,57583 3,09024 3,29053
Interpolationsformel d 10 n bzw. n 10 D d - kleine Tafeldifferenz D - große Tafeldifferenz n - zu interpolierende Stelle d D
Tafeln
273
Tafel 2: Quantile tm;q der t-Verteilung mit m Freiheitsgraden m 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 35 40 45 50 60 70 80 90 100 200 500
q 0,8 1,376 1,061 0,978 0,941 0,920 0,906 0,896 0,889 0,883 0,879 0,876 0,873 0,870 0,868 0,866 0,865 0,863 0,862 0,861 0,860 0,859 0,858 0,858 0,857 0,856 0,856 0,855 0,855 0,854 0,854 0,852 0,851 0,850 0,849 0,848 0,847 0,846 0,846 0,845 0,843 0,842 0,842
0,9 3,078 1,886 1,638 1,533 1,476 1,440 1,415 1,397 1,383 1,372 1,363 1,356 1,350 1,345 1,341 1,337 1,333 1,330 1,328 1,325 1,323 1,321 1,319 1,318 1,316 1,315 1,314 1,313 1,311 1,310 1,306 1,303 1,301 1,299 1,296 1,294 1,292 1,291 1,290 1,286 1,283 1,282
0,95 6,314 2,920 2,353 2,132 2,015 1,943 1,895 1,860 1,833 1,812 1,796 1,782 1,771 1,761 1,753 1,746 1,740 1,734 1,729 1,725 1,721 1,717 1,714 1,711 1,708 1,706 1,703 1,701 1,699 1,697 1,690 1,684 1,679 1,676 1,671 1,667 1,664 1,662 1,660 1,653 1,648 1,645
0,975 12,71 4,303 3,182 2,776 2,571 2,447 2,365 2,306 2,262 2,228 2,201 2,179 2,160 2,145 2,131 2,120 2,110 2,101 2,093 2,086 2,080 2,074 2,069 2,064 2,060 2,056 2,052 2,048 2,045 2,042 2,030 2,021 2,014 2,009 2,000 1,994 1,990 1,987 1,984 1,972 1,965 1,960
0,99 31,82 6,965 4,541 3,747 3,365 3,143 2,998 2,896 2,821 2,764 2,718 2,681 2,650 2,624 2,602 2,583 2,567 2,552 2,539 2,528 2,518 2,508 2,500 2,492 2,485 2,479 2,473 2,467 2,462 2,457 2,438 2,423 2,412 2,403 2,390 2,381 2,374 2,368 2,364 2,345 2,334 2,326
0,995 63,66 9,925 5,841 4,604 4,032 3,707 3,499 3,355 3,250 3,169 3,106 3,055 3,012 2,977 2,947 2,921 2,898 2,878 2,861 2,845 2,831 2,819 2,807 2,797 2,787 2,779 2,771 2,763 2,756 2,750 2,724 2,704 2,690 2,678 2,660 2,648 2,639 2,632 2,626 2,601 2,586 2,576
0,999 318,289 22,328 10,214 7,173 5,894 5,208 4,785 4,501 4,297 4,144 4,025 3,930 3,852 3,787 3,733 3,686 3,646 3,610 3,579 3,552 3,527 3,505 3,485 3,467 3,450 3,435 3,421 3,408 3,396 3,385 3,340 3,307 3,281 3,261 3,232 3,211 3,195 3,183 3,174 3,131 3,107 3,090
0,9995 636,578 31,600 12,924 8,610 6,869 5,959 5,408 5,041 4,781 4,587 4,437 4,318 4,221 4,140 4,073 4,015 3,965 3,922 3,883 3,850 3,819 3,792 3,768 3,745 3,725 3,707 3,689 3,674 3,660 3,646 3,591 3,551 3,520 3,496 3,460 3,435 3,416 3,402 3,390 3,340 3,310 3,291
T
Tafeln
274
Tafel 3: Quantile 2m;q der 2 -Verteilung mit m Freiheitsgraden q M
0,005
0,01
0,025
0,05
0,95
0,975
0,99
0,995
1 0,00004 0,0002 0,001 0,004 3,841 5,024 6,635 7,879 2 0,010 0,020 0,051 0,103 5,991 7,378 9,210 10,60 3 0,072 0,115 0,216 0,352 7,815 9,348 11,34 12,84 4 0,207 0,297 0,484 0,711 9,488 11,14 13,28 14,86 5 0,412 0,554 0,831 1,145 11,07 12,83 15,09 16,75 6 0,676 0,872 1,237 1,635 12,59 14,45 16,81 18,55 7 0,989 1,239 1,690 2,167 14,07 16,01 18,48 20,28 8 1,344 1,647 2,180 2,733 15,51 17,53 20,09 21,95 9 1,735 2,088 2,700 3,325 16,92 19,02 21,67 23,59 10 2,156 2,558 3,247 3,940 18,31 20,48 23,21 25,19 11 2,603 3,053 3,816 4,575 19,68 21,92 24,73 26,76 12 3,074 3,571 4,404 5,226 21,03 23,34 26,22 28,30 13 3,565 4,107 5,009 5,892 22,36 24,74 27,69 29,82 14 4,075 4,660 5,629 6,571 23,68 26,12 29,14 31,32 15 4,601 5,229 6,262 7,261 25,00 27,49 30,58 32,80 16 5,142 5,812 6,908 7,962 26,30 28,85 32,00 34,27 17 5,697 6,408 7,564 8,672 27,59 30,19 33,41 35,72 18 6,265 7,015 8,231 9,390 28,87 31,53 34,81 37,16 19 6,844 7,633 8,907 10,12 30,14 32,85 36,19 38,58 20 7,434 8,260 9,591 10,85 31,41 34,17 37,57 40,00 21 8,034 8,897 10,28 11,59 32,67 35,48 38,93 41,40 22 8,643 9,542 10,98 12,34 33,92 36,78 40,29 42,80 23 9,260 10,20 11,69 13,09 35,17 38,08 41,64 44,18 24 9,886 10,86 12,40 13,85 36,42 39,36 42,98 45,56 25 10,52 11,52 13,12 14,61 37,65 40,65 44,31 46,93 26 11,16 12,20 13,84 15,38 38,89 41,92 45,64 48,29 27 11,81 12,88 14,57 16,15 40,11 43,19 46,96 49,65 28 12,46 13,56 15,31 16,93 41,34 44,46 48,28 50,99 29 13,12 14,26 16,05 17,71 42,56 45,72 49,59 52,34 30 13,79 14,95 16,79 18,49 43,77 46,98 50,89 53,67 35 40 45 50
17,19 20,71 24,31 27,99
18,51 22,16 25,90 29,71
20,57 24,43 28,37 32,36
22,47 26,51 30,61 34,76
49,80 55,76 61,66 67,50
53,20 59,34 65,41 71,42
57,34 63,69 69,96 76,15
60,27 66,77 73,17 79,49
60 70 80 90 100
35,53 43,28 51,17 59,20 67,33
37,48 45,44 53,54 61,75 70,06
40,48 48,76 57,15 65,65 74,22
43,19 51,74 60,39 69,13 77,93
79,08 90,53 101,9 113,1 124,3
83,30 95,0 106,6 118,1 129,6
88,4 100,4 112,3 124,1 135,8
92,0 104,2 116,3 128,3 140,2
Tafeln
275
Tafel 4 Zinsberechnungsmethoden (Überblick)
Laufzeit
t
Methode
Berechnung der Zinstage T
Jahreslänge Anwendung LJ
30E/360
monatlich je 30 Tage
360 Tage
30/360
monatlich je 30 360 Tage Tage
actual/360 (EuroZinsmethode)
taggenau
360 Tage
actual/365
taggenau
365 Tage
actual/actual
taggenau
taggenau
Zinstage T Jahreslänge in Tagen LJ
In Deutschland: Wertpapiere, Sparbücher, Termingelder Häufig bei Taschenrechnern und Computerprogrammen am Euromarkt für fast alle Währungen, in Deutschland z. B. für Floating Rates Notes In England, in Deutschland bei Geldmarktpapieren
Bemerkungen 1. Fällt bei der 30E/360-Methode ein Zinstermin auf den 31. Tag eines Monats, so wird er auf den 30. Tag gelegt. Auch der Februar zählt 30 Tage mit der Ausnahme, wenn das Geschäft am 28.2. endet. 2. Die 30/360-Methode funktioniert wie die 30E/360-Methode, jedoch mit dem folgenden Unterschied: Endet ein Geschäft an einem 31., so wird als Endtag der 1. des Folgemonats genommen. Endet das Geschäft am 28.2., werden für den Februar 28 Tage gezählt.
Weitere Informationen zu den Zinsmethoden sind z. B. bei Grundmann, 2001, und bei Pfeifer, 2000, zu finden.
T
Tafeln
276
Tafel 5: Tabelle ausgewählter Integrale (die Integrationskonstante wurde stets weggelassen) Integrale rationaler Funktionen ax b n 1 n ax b dx an 1 , n 1 dx 1 ax b a ln ax b dx 1 x x 2 a 2 a arctan a ax 1
2a ln a x , x a dx ,a 0 a2 x2 1 x a
ln , x a
2a x a Integrale irrationaler Funktionen
x 2 a 2 dx
1 2 2 2 2 2 x x a a ln x x a 2
x 2 a 2 dx
1 2 2 2 2 2 x x a a ln x x a 2
a 2 x 2 dx
1 x x a 2 x 2 a 2 arcsin , 2 a
x a x a , 1 a x , dx 3
1 3 1 2 2 x x a dx 3
x
x
x 2 a 2 dx
a2 x2
dx x a2 dx 2
x2 a2 dx
2
2 3
2
2 3
2
2
x a
ln x x 2 a 2 ln x x 2 a 2 ,
x arcsin , a a x 2
2 3
x a
x a
x a
,
x a
x a
Tafeln
x dx x a x dx 2
2
x2 a2 x dx a2 x2
277
x2 a2 x2 a2 ,
x a
a2 x2 ,
xa
Integrale von trigonometrischen Funktionen, k Z, a 0 1 sin ax dx a cos ax 1 1 2 sin ax dx 2 x a sin ax cos ax
1
1
sin ax dx a ln tan
ax , 2
x
k a
1
cos ax dx a sin ax cos
2
1
ax dx
1 1 x sin ax cos ax 2 a
ax ,
2 4
1
cos ax dx a ln tan 1
sin ax cos ax dx 2a sin
2
x (2k 1)
ax
2a 1 2 tan ax dx a tan ax x, x (2k 1) 2a 1 k cot ax dx a ln sin ax , x a 1 k 2 cot ax dx a cot ax x, x a 1
tan ax dx a ln cos ax ,
2a
x (2k 1)
T
Tafeln
278
Integrale von Exponential- und Logarithmusfunktionen, n Z 1 ax ax e dx a e 1 ax ax x x e dx e a a 2 x2 2x 2 e dx e ax a a 2 a3 1 ax 2 ax 2 x e d x 2a e
x
2 ax
ln x dx x ln x x, x
n
ln x dx
ln x
2
x 0,
x n 1 1 ln x , n 1 n 1
x 0, n 1
dx xln x 2 2 x ln x 2 x, x 0
ln x n dx x
1 ln x n 1, x 0, n 1 n 1
Rekursionsformeln, n Z
x
n
e ax dx
x n ax n n 1 ax e x e dx , a 0, n > 0 a a
e ax 1 ! e ax e ax n 1 a n 1 dx , n 1, n > 0 dx n n 1 x x x
(ln x)
n
dx x (ln x) n n (ln x) n 1 dx , n 1
Literaturverzeichnis Bartsch H.-J. (2001): Taschenbuch mathematischer Formeln. - München, Wien: Fachbuchverlag Leipzig im Carl Hanser Verlag Beyer, O.; Hackel, H.; Pieper, V.; Tiedge, J. (1999): Wahrscheinlichkeitsrechnung und mathematische Statistik. - Leipzig: Teubner Bosch, K. (1996) Großes Lehrbuch der Statistik. - München, Wien: Oldenbourg Dürr, W.; Kleibohm, K. (1992): Operations Research, Lineare Modelle und ihre Anwendungen. - München, Wien: Carl Hanser Dürr, W.; Mayer, H. (2002): Wahrscheinlichkeitsrechnung und schließende Statistik. - München, Wien: Carl Hanser Eckstein, P. (2001): Repetitorium Statistik, Deskriptive Statistik, Stochastik, Induktive Statistik. - Wiesbaden: Gabler Ferschl, F. (1985): Deskriptive Statistik. - Würzburg, Wien: Physika-Verlag Fichtenholz, G. M. (1964): Differential- und Integralrechnung. (3 Bände) - Berlin: Deutscher Verlag der Wissenschaften Garus, G.; Westerheide, P. (1985): Differential- und Integralrechnung. - München, Wien: Carl Hanser Grundmann, W.; Luderer, B. (2001): Formelsammlung Finanzmathematik, Versicherungsmathematik, Wertpapieranalyse - Stuttgart, Leipzig: B. G. Teubner Hering, E., u.a. (1999): Taschenbuch für Wirtschaftsingenieure. - München, Wien: Fachbuchverlag Leipzig im Carl Hanser Verlag Hettich, G.; Jüttler, H.; Luderer, B. (2001): Mathematik für Wirtschaftswissenschaftler und Finanzmathematik. - München, Wien: Oldenbourg Verlag Hochstädter, D. (1996): Statistische Methodenlehre, Ein Lehrbuch für Wirtschaftsund Sozialwissenschaftler. - Frankfurt am Main, Thun: Harri Deutsch Kobelt, H.; Schulte; P. (1999): Finanzmathematik - Herne, Berlin: Neue Wirtschaftsbriefe Köhler, H. (1997): Finanzmathematik. - München, Wien: Carl Hanser Köhler, H. (1998): Lineare Algebra. - München, Wien: Carl Hanser König, W., u.a. (1999): Taschenbuch der Wirtschaftsinformatik und Wirtschaftsmathematik. - Frankfurt am Main, Thun: Verlag Harri Deutsch Körth, H.; Dück, W.; Kluge, P.-D.; Runge, W. (1993): Wirtschaftsmathematik, Hochschullehrbuch in zwei Bänden. - Berlin, München: Die Wirtschaft Kröpfl, B., u.a. (1999): Angewandte Statistik. München, - Wien: Carl Hanser Verlag Kruschwitz, L. (2001): Finanzmathematik. - München: Franz Vahlen Kruschwitz, L. (2002): Finanzierung und Investition. - München, Wien: Oldenbourg Verlag
280
Literaturverzeichnis
Larek, E. (2000): Lineare Systeme in der Wirtschaft. - Frankfurt am Main, Berlin, Bern, Bruxelles, New York, Wien: Peter Lang Larek, E. (2002): Analytische Methoden in der Wirtschaft. - Frankfurt am Main, Berlin, Bern, Bruxelles, New York, Wien: Peter Lang, Locher, F. (1993): Numerische Mathematik - Berlin, Heidelberg, New York: Springer Verlag Luderer, B.; Nollau, V.; Vetters, K. (2000): Mathematische Formeln für Wirtschaftswissenschaftler. - Stuttgart, Leipzig: B. G. Teubner Luderer, B.; Würker, U. (2001): Einstieg in die Wirtschaftsmathematik. - Stuttgart, Leipzig: B. G. Teubner Pfeifer, A. (2000): Praktische Finanzmathematik. - Frankfurt am Main, Thun: Verlag Harri Deutsch Preuß, W.; Wenisch, G. (1998): Lehr- und Übungsbuch Mathematik in Wirtschaft und Finanzwesen. - München, Wien: Fachbuchverlag Leipzig im Carl Hanser Verlag Preuß, W.; Wenisch, G. (2001): Lehr- und Übungsbuch Numerische Mathematik. München, Wien: Fachbuchverlag Leipzig im Carl Hanser Verlag Puhani, J. (2001): Statistik. - Würzburg: Lexika Verlag Puhani, J. (2000): Kleine Formelsammlung zur Statistik. - Würzburg: Lexika Verlag Purkert, W. (2001) Brückenkurs Mathematik für Wirtschaftswissenschaftler. Stuttgart, Leipzig: B. G. Teubner Rinne, H. (1997) Taschenbuch der Statistik. - Frankfurt am Main, Thun: Verlag Harri Deutsch Salomon, E.; Poguntke, W. (1999): Wirtschaftsmathematik. - Köln: Fortis Verlag, Schwarze, J. (2001): Grundlagen der Statistik, Band I: Beschreibende Statistik, Band II: Wahrscheinlichkeitsrechnung und induktive Statistik. - Herne, Berlin: Neue Wirtschaftsbriefe Schwetlick, H.; Kretzschmar, H. (1991): Numerische Verfahren für Naturwissenschaftler und Ingenieure. - Leipzig: Fachbuchverlag Stingl, P. (2001): Einstieg in die Mathematik für Fachhochschulen. - München, Wien: Carl Hanser Stöcker, H. (1999): Taschenbuch mathematischer Formeln und moderner Verfahren. - Frankfurt am Main, Thun: Verlag Harri Deutsch Storm, R. (2001): Wahrscheinlichkeitsrechnung, mathematische Statistik und statistische Qualitätskontrolle. - Fachbuchverlag Leipzig im Carl Hanser Verlag Tietze, J. (2000): Einführung in die angewandte Wirtschaftsmathematik. - Braunschweig.: Vieweg Zimmermann, W. (2001): Operations Research, Quantitative Methoden zur Entscheidungsvorbereitung. - München, Wien: R. Oldenbourg
Sachwortverzeichnis 1-elastisch 123 Abbildung 12 Abbruchfehler 153 Abgangsmasse 223 Ableitung 117 -, höherer Ordnung 119 -, partielle 145 -, von Grundfunktion 117 Abschreibung 104 -, arithmetisch degressive 106 -, degressive 106 -, digitale 106 -, geometrisch degressive 107 -, konstante 104 -, lineare 104 -, progressive 109 Abschreibungsprozentsatz 105 Abschreibungsrate 107 Abschreibungsrechnung 104 Absolutskala 197 Abstand 156 Abzinsung 94 Adjazenzmatrix 260 Adjunkte 33, 42 Anfangskapital 89 Annuitätenmethode 101 Annuitätenschuld 110 Annuitätentilgung 100 Anzahl der Zinstage 92 Approximation 165 Äquivalenz 13 arithmetisches Mittel 202 Asymptote 115 Aufzinsfaktor 89, 96 Aufzinsung 92 Ausartung 248, 250, 251 ausgeartete zulässige Basislösung 67 Aussagenlogik 13 Bandmatrix 163 Bankjahr 90 Barwert 89, 90, 94, 97 Basis 66 Basisdarstellung 66
Basislösung 57, 67 Basisperiode 221 Basistransformation 47 Basisvariable 47, 66 BECKERsches Schema 223 bedingte Häufigkeitsverteilung 211 bedingte Wahrscheinlichkeit 178 Berichtsperiode 221 BERNOULLIsche Regel 126 BERNOULLIsches Versuchsschema 185 BERNSTEIN-Polynom 170 Bestandsdiagramm 223 Bestandsfortschreibung 224 Bestandsmasse 223 Bestellmenge 266 Bestellniveau 270 Bestimmtheitskoeffizient 214 Bestimmtheitsmaß 214 Betrag einer Zahl 19 Bewegungsmasse 223 Beziehungszahl 220 BÉZIER-Kurve 170 Bi- und multivariate Datenanalyse 209 Binär-Code-Darstellung (BCD) 154 Binomialkoeffizient 20 Binomialverteilung 185 binomische Formel 17 binomischer Satz 20 bivariate Häufigkeitsverteilung 209 Blockmatrix 37 "Branch-and-Bound" -Methode 254 Buchwert 105 charakteristische Gleichung 43 2 (Chi Quadrat)-Verteilung 241, 274 Computerzahl 154 CRAMERSCHE Regel 36 Critical Path Method (CPM) 260 Datenfehler 153 Defekt 165 Definitionsbereich 12, 77, 78, 114, 115 deskriptive Statistik 184
282
Sachwortverzeichnis
Determinante 32 diagonaldominante Matrix 161 Diagonalmatrix 42 Dichtefunktion 189 Differenzial 120 -, totales 147 -, vollständiges 147 Differenzialgleichung 140 -, gewöhnliche 140 -, lineare 142 -, partielle 140 -, separable 140 Differenzialquotient 117 Differenziationsregel 118 Differenz 11 Differenzenausdruck 172 Differenzenquotient 117 disjunkte Menge 11 Disjunktion 13 diskontierter Wert 94 Diskordanz 219 diskrete Verteilung 182 divergente Zahlenfolge 114 Doppelsumme 19 Doppel-t-Test 245 Dreieck 31 Dualität 74 Durchschnitt 11 Eigenvektor 43 Eigenwert 43 Einheitsmatrix 42 Einkommenssteuergesetz 108 elastische Funktion 123 Elastizität 123, 146 -, partielle 148 -, relative 123, 141, 148 Element einer Menge 11 empirische Standardabweichung 205 empirische Varianz 205 empirischer Variationskoeffizient 205 empirische Verteilungsfunktion 198, 200 Endkapital 89, 90 Endwert 89, 90 Entwicklungssatz von LAPLACE 34 Ereignis -, abhängiges 180 -, komplementäres 174
-, sicheres 173, 176 -, unabhängiges 180 -, unmögliches 173, 176 -, unvereinbares 174 -, unverträgliches 174 -, zufälliges 173 Ereignisfeld 175 Ereignismasse 223 Erlösfunktion 138 Erwartungswert 182, 189 EUKLIDischer Abstand 156 EULERsche Zahl 83, 86, 187 Exponentialfunktion 83 Exponentialverteilung 191 exponentielle Glättung 228, 229, 230 Extremum 128 Extremwertbestimmung 148 -, mit Nebenbedingung 150 Exzess 191 Fakultät 20 Fehler 1. und 2. Art 242 Fehleranalyse 155 Fehlerart 153 Fehlerrechnung 120, 146 Fehlmenge 269 Fixpunkt 159 Fixpunktiteration 159, 161 Folge -, alternierende 85 -, arithmetische 85 -, divergente 85 -, geometrische 85 -, konstante 85 -, konvergente 85 Format einer Matrix 37 Formel von Bayes 180 Freiheitsgrad 48 Funktion 12, 77 -, äußere 81 -, elastische 123 -, gerade 79 -, identische 82 -, injektive 80 -, innere 81 -, inverse 80 -, konkave 79 -, konvexe 79 -, lineare 82
Sachwortverzeichnis -, monotone 79 -, rationale 81 -, trigonometrische 84 -, ungerade 79 -, verkettete 81 Funktionalanalysis 156 GANTT-Diagramm 257, 264 GAUSS-Algorithmus 52, 163 Gegenwartswert 102 geometrisches Mittel 203 geometrische Verteilung 188 geordnetes Paar 12 Gerade 30 Gewinnannuität 101 Gewinnfunktion 138 gewöhnliches Moment 185 GINI-Koeffizient 208 Gleichung 25 Gleichungssystem -, lineares 32, 44, 46, 160, 163 -, nichtlineares 161 Gleichverteilung 191 gleitender Durchschnitt 227, 228 Gleitkommazahl 154 Gliederungszahl 220 GOMPERZ-Funktion 215 Gradient 146 Grenzfunktion 117, 121 Grenzwert 85 einer Funktion 114 einer Reihe 87 für Folgen 86 -, Rechenregeln 115 -, wichtige 115 Grenzwertsatz 196 Grenzwertsatz von POISSON 187 Grundgesamtheit 235 Grundintegral 133 Gruppe 199 Gruppierung 198 Halbebene 30 harmonische Mittel 202 Häufigkeitsfunktion 210 Häufigkeitstabelle 197, 198, 209 Hauptabschnittsdeterminante 33, 150 Hauptsatz der Integralrechnung 134 hebbare Unstetigkeitsstelle 117
283 HESSE-Matrix 146 Hexadezimalsystem 15 Histogramm 199 Hyperbel 82 hypergeometrische Verteilung 186 Hypotenuse 31 Hypothese 242 Implikation 13 indefinite Matrix 150 Indexzahl 221 induktive Statistik 235 inhomogenes Gleichungssystem 49 Integral -, bestimmtes 134 -, unbestimmtes 132 -, uneigentliches 135 Integration -, numerische 137 -, partielle 133 Integrationsregel 132, 134 interne Zinsfußmethode 102 Interpolation 165 Intervallarithmetik 155 Intervallschätzung 237 Intervallskala 197 inverse (reziproke) Matrix 42, 50 inverse Abbildung 12 Investitionsrechnung 101 Irrtumswahrscheinlichkeit 242 Iteration 124 Iterationsverfahren 159 JACOBI-Verfahren 160 JACOBI-Matrix 161 JOHNSON-BELLMAN 256 kanonische Form 47 Kapitalrückfluss 101 Kapitalwert 102 Kapitalwertmethode 102 kartesisches Produkt 12 Kathete 31 Kehrmatrix 42 Kettenregel 119 Klasse 198, 199 Klassenanzahl 199 Klassenhäufigkeit 199 KOLMOGOROV 177 Kombination 21
284
Sachwortverzeichnis
Kombinatorik 21 Komplementärereignis 174, 176, 177 Komplementärmenge 11 Konditionszahl 155 Konfidenzschätzung 238, 239, 240, 241 Konjunktion 13 konkave Funktion 129 Konkordanz 219 Konkordanzkoeffizient 219 Konsumentenrente 139 Kontingenztabelle 209 Konvergenzkriterien 88 konvexe Funktion 129 konvexe Linearkombination 64 konvexe Punktmenge 57 Konzentrationskoeffizient 207 Konzentrationsmaß 207 Korrelationskoeffizient 212 Korrelationsrechnung 211 Korrelationstabelle 209, 213 Kosinussatz 31 Kostenfunktion 138 Kovarianz 212 Kreuzmenge 12 kritischer Punkt 128 Krümmungsverhalten 129 Kuponanleihe 112 Kursrechnung 110 Kurvendiskussion 130 Lageparameter 201 Lagerbestand 266 Lagerhaltung 266 LAGRANGEsche Multiplikatorenmethode 150 LAPLACEsches Ereignisfeld 178 LASPEYRES 222 LEIBNIZ-Kriterium 88 LEIBNIZsche Zinseszinsformel 92 LEONTIEF-Modell 55 L'HOSPITALsche Regel 126 linear abhängiger Vektor 44 linear unabhängiger Vektor 44 lineare Optimierung 61 lineares Gleichungssystem 44, 46 lineares Ungleichungssystem 56 Linearkombination 44, 144 -, konvexe 57, 64
LIPSCHITZ-Bedingung 159 logarithmische Differenziation 119 Logarithmus 24 -, dekadischer 83 -, natürlicher 83 Logarithmusfunktion 83 logistische Funktion 215, 228 LORENZ-Fläche 207 LORENZ-Kurve 207 Lösung -, allgemeine zulässige 57 -, graphische 58, 62 -, optimale 63 -, verallgemeinerte 165 -, zulässige 57, 62 Manhattan-Abstand 156 Marginalanalyse 121 Marginalfunktion 117, 121 MARKOV-Kette 41 Maß- und Indexzahl 220 Matrix 37 -, gestürzte 37 -, indefinite 150 -, inverse, reziproke 42 -, negativ definite 150 -, orthogonale 42 -, positiv definite 150 -, reguläre 42 -, singuläre 42 -, symmetrische 37 -, transponierte 37 Matrizen -, gleichartige 38 -, verkettete 39 Matrizenmultiplikation 39 Maximum 128 -, absolutes 128 -, relatives 127, 148 Maximum-Abstand 156 Maximum-Likelihood-Schätzmethode 238 Maximumnorm 158 Median 201 Menge 11 -, disjunkte 11 -, Differenz 11 -, Durchschnitt 11 -, Komplement 11
Sachwortverzeichnis -, Vereinigung 11 Mengenindex 222 Mengenoperation 11 Merkmal -, diskretes 197 -, stetiges 197 Merkmalswert 197 Messzahl 221 Methode der kleinsten Quadrate (MkQ) 151, 166 Minimum 128 -, absolutes 128 -, relatives 127, 148 Mittel -, arithmetisches 202 -, geometrisches 203 -, harmonisches 202 Mittelwertsatz 127 mittlere absolute Abweichung 204 mittlere quadratische Abweichung 204 mittlere Verweildauer 225 Modalwert 201 Modellierungsfehler 153 Modus 201 monotone Funktion 127 Monotonieverhalten 127 multiple Korrelation 217 multiple Regression 217 multipler Korrelationskoeffizient 217 multiples Bestimmtheitsmaß 217 Multiplikation von Matrizen 39 Multiplikationsregel von LAGRANGE 150 Multiplikationsregel für Wahrscheinlichkeiten 179 nachschüssige Zahlungsweise 90 Nebenbedingung 61 Negation 13 negativ definite Matrix 150 Nennwert 110 Netzplan 259 -, kritischer Weg 262 -, Pufferzeit 263 -, Vorgangsknotennetz 259 -, Vorgangspfeilnetz 259 NEWTON-RAPHSON-Verfahren 162 NEWTON-Verfahren 113, 124
285 Nichtbasisvariable 47 nichtlineares Gleichungssystem 161 nichtlineare Regression 215 Nichtnegativitätsbedingung 61 Nominalskala 197 Nominalwert 110 Nord-West-Ecken-Regel 248 Norm 157 -, EUKLIDische 158 -, Matrix- 158 -, Maximum- 158 -, Summen- 158 -, Vektor- 158 Normalform, 1. und 2. 56, 65, 66 Normalgleichungen 152, 164 Normalverteilung 192 normierter Eigenvektor 43 Nullfolge 86 Nullhypothese 245 Nullmatrix 38 Nullstellenbestimmung 124 Nullteiler 40 Nutzungsdauer 104 Oktalsystem 15 optimale Bestellmenge 130 optimale Losgröße 130 optimale Lösung 62 Optimierung -, lineare 61 Optimierungsproblem 61 Ordinalskala 197 orthogonale Matrix 42 PAASCHE 222 Parabel 82 Partialdivision 18 Partialsumme 86 PASCALsches Dreieck 20 periodische Schwankung 230 Permutation 21 Phasendurchschnittsverfahren 232 Pivotisierung 163 POISSON-Verteilung 187 Polynom 26, 81 Positionssystem 15 positiv definite Matrix 150 postnumerando 90 Potenz 23
286
Sachwortverzeichnis
Potenzfunktion 82 pränumerando 90 Preisindex 222 Produktmenge 12 Produktzeichen 19 Produzentenrente 139 Progressionsbetrag 109 progressive Zinsmethode 92 Protokoll 197 Pseudolösung 164 Punktschätzung 237 quadratische Form 150 Quantil 190, 201, 272, 273, 274 Quartil 201 Quotientenkriterium 88 Randhäufigkeitsfunktion 210 Rang 45 Rangkorrelation 218 Rangkorrelationskoeffizient 218 Raten-Renten-Formel 98 Ratenschuld 111 Ratentilgung 99 Raum, metrischer 157 Reaktionsparameter 229 Realwert 110 Regressionsrechnung 213 reguläre Matrix 42 Reihe -, arithmetische 87 -, divergente 87 -, geometrische 87 -, harmonische 88 -, konvergente 87 -, unendliche 87 Reihenfolgeproblem 255 -, Algorithmus von JOHNSONBELLMAN 256 -, Zeilenbewertungsverfahren 258 Rekonvertierung 16 relative Häufigkeit 176 Rente 96 Rentenbarwertfaktor 101, 110 Rentenendwert 96 Restriktionen 56, 61 Restwert 104 RIEMANNsches Integral 134 Rundreiseproblem 253
Rundungsfehler 153 Saisonindex 231 Saisonschwankung 231 SARRUSsche Regel 32 Satz des EUKLID 31 Satz des PYTHAGORAS 31 Satz von GLIWENKO 236 Satz von SCHWARZ 145 Schachbrettregel 33 Schätzverfahren 237 Schema von FALK 39 Schiefe 185, 190 schließende (induktive) Statistik 235 Schlupfvariable 56, 66 Schranke 79 Schwerpunktkoordinate 246 Sehnen-Trapez-Regel 137 Servicegrad 270 sicheres Ereignis 173 Sicherheitsbestand 270 Sigma-Regel 195 Signifikanzniveau 242 Signifikanztest 242 Simplexmethode 67 SIMPSON-Regel 138 singuläre Matrix 42 Sinussatz 31 Skala 197 Skalarprodukt 38 Skalentransformation 197 Skalentyp 197 Skalenwert 197 Skalierung 163 Spannweite 203 Sparkassenformel 98 Spline-Interpolation 163, 167 Stabdiagramm 198 Staffelmethode 91 Stammfunktion 132 Standardabweichung 183, 189, 204 standardisierte Normalverteilung 194, 272 Standortproblem 161, 246 stationärer Punkt 128, 148 statistische Einheit 196 statistische Maßzahl 201, 212 statistisches Moment 185, 190 statistische Sicherheit 242
Sachwortverzeichnis statistischer Test 242 STEINER-WEBER-Problem 246 stetige Verteilung 189 Stetigkeit 115 Stichprobe 235 Stichprobenfunktion 236 Stichprobenumfang 235 STIRLINGsche Formel 20 Streuungsmaß 203 Streuungszerlegung 214 Strukturmatrix 260 Substitutionsmethode 132 Summenhäufigkeitsfunktion 200 Summennorm 158 Summenpolygon 200 Summenzeichen 19 Tageszinsen 91 Tangenssatz 31 Tautologie 13 TAYLOR-Polynom 125 Teilmenge 11 Teilsumme 86 Tilgungsrate 99, 100 Tilgungsrechnung 99 TÖRNQUIST-Funktion 215 totale Wahrscheinlichkeit 179 totales Differenzial 120 transponierte Matrix 37 Transportproblem -, Ausartung 250 -, gesperrte Verbindung 250 -, klassisches 247 -, Minimumregel 248 -, Optimalitätskriterium 249 -, Potenzialmethode 249 -, VOGELsche Approximationsmethode 248 Trapezregel 137 Traveling-Salesman-Problem 253 Trendermittlung 227 Trendfunktion 151 Trendparameter 230 Trennen der Veränderlichen 140,142 Treppenfunktion 198 Tridiagonalmatrix 163 triviale Lösung 48 TSCHEBYSCHEV-Ungleichung 184 t-Test 244
287 t-Verteilung 273 Typ einer Matrix 37 Umkehrabbildung 12 Umkehrfunktion 80 Umschlagshäufigkeit 225 uneigentliches Integral 135 unelastische Funktion 123 Ungarische Methode 251 Ungleichung 29 Ungleichungssystem -, lineares 56 -, normales 56 univariate Datenanalyse 196 unmögliches Ereignis 173 Unstetigkeitsstelle 116 Unterdeterminante 33 unterjährliche Verzinsung 95 Untermatrix 37 Unterperiode 90, 95 Urliste 197 Varianz 183, 189, 204 Variation 21 Variation der Konstanten 142 Variationsreihe 197 Vektor 37 Vereinigung von Mengen 11 Verfahrensfehler 153 Verflechtung 1. Art 55 Verhältnisskala 197 Verhältniszahl 220 verkettete Matrizen 39 Verschiebungssatz 183 Verteilungsfunktion 181, 182, 189 Verteilungsparameter 182 Verteilungstabelle 182 Verweildauer 224 Verweildiagramm 223 Verzinsung -, einfache 91 -, gemischte 99 -, stetige 95 VOGELsche Approximationsmethode 248 vollständiges System 174 Vollständigkeitsrelation 182, 189 Vorgangsknotennetz 259 vorschüssige Zahlungsweise 90
288
Sachwortverzeichnis
Wachstum -, degressives 129 -, progressives 129 Wachstumsfunktion 122 Wachstumsmodell 141 Wachstumsrate 122 Wahrscheinlichkeit 176, 178 -, bedingte 178 -, totale 179 Wahrscheinlichkeitsfunktion 182 Wahrscheinlichkeitsrechnung 173 Warenstrom 139 Wartesystem 264 -, Bediendauer 264 Wendepunkt 79, 129 -, horizontaler 128 Wertebereich 12 Wertindex 222 Wertvolumen 221 Wölbung 191 Wurzelfunktion 82 Wurzel 23 Zahlenmenge 14 Zahlendarstellung 15, 154 Zahlenfolge 84, 85 Zahlenreihe 86 Zahlensystem 15 Zahlungsstrom 139 Zahlungsweise -, nachschüssig 90 -, vorschüssig 90
Zeilensummennorm 158 Zeit-Mengen-Bestand 224 Zeitreihe 226 Zeitreihenanalyse 226 Zeitreihenwert 221 zentrales Moment 185 Zentralwert 201 Zielfunktion 61 Ziffer 15 Zinsen bei Kontobewegungen 91 Zinseszinsen 92 Zinsfuß -, interner 103 Zinssatz -, effektiver 110 -, konformer 95 -, nomineller 95, 110 -, realer 110 -, relativer 95 Zinsschulden 112 Zinstage 90 Zinsteiler 91 Zinszahl 91 Z-Test 243 zufälliges Ereignis 173 Zufallsgröße 181 Zufallsstichprobe 235 Zufallsversuch 173 Zugangsmasse 223 Zuordnungsproblem 251 Zusammenhangsmaß 218 Zweifachregression 217
Umschlag Seite 1
Ableitung
Funktion
Stammfunktion
y´
y = f (x)
F(x) =
0
a
a⋅x
n ⋅ x n−1
xn
ex
ex
a x ⋅ ln a
ax
1 x
ln x
1 x ⋅ ln a 1 x ⋅ ln 10 cos x − sin x 1 cos2 x −1 sin 2 x 1 1− x2 −1 1− x2 1 1+ x2
log a x
lg x sin x cos x
∫ f ( x )dx
x n+1 , n ≠ −1 n +1 ex ax a > 0 , ln a a ≠ 1
x ⋅ ln( x ) − x x ⋅ ln( x ) − x ln(a ) x ⋅ ln( x ) − x ln10 − cos x sin x
tan x cot x arcsin x
arccos x arctan x
Differentiationsregeln (u ( x) ± v( x))′ = u′( x) ± v′( x) (c ⋅ v( x))′ = c ⋅ v′( x) (u ( x) ⋅ v( x))′ = u′( x) ⋅ v( x) + u ( x) ⋅ v′( x) ′ u ( x) u′( x) ⋅ v( x) − u ( x) ⋅ v′( x) = , v( x) ≠ 0 (v( x))2 v( x)
( f [u ( x)])′ =
f ′(u ) ⋅ u′( x)
Umschlag Seite 3
Diskrete Verteilungen n
E ( X ) = ∑ xi ⋅ pi
F(z) = P(X ≤ z)
i =1
Var ( X ) = E (( X − E ( X )) 2
pi = P( X = xi) = f (xi) n
n
i =1
i =1
∑ p i = ∑ P ( X = xi ) = 1 0 k F ( z ) = P ( X ≤ z ) = ∑ pi i =1 1
=
n
∑ ( xi − E ( X ))2 ⋅ pi i =1
für z < x1 für xk ≤ z < xk +1 , k = 1, 2, L, n − 1 für xn ≤ z
Binomialverteilung
E(X) = n ⋅ p
n n −i P( X = i ) = pi = ⋅ p i ⋅ (1 − p) i
Var ( X ) = n ⋅ p ⋅ (1 − p)
Hypergeometrische
E(X) = n ⋅ p
Verteilung
Var ( X ) = n ⋅ p ⋅ (1 − p) ⋅
N ⋅ p N ⋅ (1 − p) ⋅ i n−i P(X = i) = pi = = N n
POISSON verteilung P ( X = i ) = pi =
λi ⋅ e − λ i!
geometrische Verteilung P(X = i) = pi = p (1 − p) i
M N − M ⋅ i n−i N n
E(X ) = λ Var ( X ) = λ 1− p p 1− p Var ( X ) = p2
E(X) =
N −n N −1
Umschlag Seite4
Stetige Verteilungen ∞
z
∫ f ( x ) dx
F(z) = P(X ≤ z) =
E(X) =
−∞
∫ x ⋅ f ( x ) dx
−∞
∞
∞
∫ f ( x ) dx = 1
−∞
+∞
b
E(X) =
1 , für a ≤ x ≤ b f ( x) = b − a 0 , sonst
Exponentialverteilung 0 , für x < 0 f ( x) = λ ⋅ e −λx , für x ≥ 0
Normalverteilung σ ⋅ 2π
⋅e
Normalverteilung 1 2π
x2 − ⋅e 2
ϕ ( − x) = ϕ ( x)
2
⋅ f ( x)dx − [E ( X )] 2
a+b 2
Var ( X ) =
2σ 2
(b − a ) 2 12
, für x < a 0 x − a F ( x) = , für a ≤ x ≤ b b − a 1 , für b < x E(X) =
1
Var ( X ) =
λ
1
λ2
0 , für x < 0 F ( x) = 1 − e −λx , für x ≥ 0 Var ( X ) = σ 2
E(X) = µ
( x−µ )
standardisierte
ϕ ( x) =
⋅ f ( x ) dx
−∞
Gleichverteilung
−
∫x
=
a
f ( x) =
2
−∞
P ( a ≤ X ≤ b ) = ∫ f ( x ) dx
1
∫ (x − E ( X ) )
Var ( X ) =
2 x − ( z −µ ) 2 2 σ e dz
2
F ( x) =
1
σ ⋅ 2π
⋅ ∫
−∞
E ( X ) = µ = 0 Var ( X ) = σ 2 = 1 x−µ Φ (t ) = F ( x ) t=
σ
Φ ( x) =
1 2π
2 x − z e 2 dz
⋅ ∫
−∞
Φ (− x) = 1 − Φ ( x)