Springer-Lehrbuch
Springer Berlin Heidelberg New York Hongkong London Mailand Paris Tokio
Kai Michels Frank Klawonn Rudolf Kruse Andreas NUrnberger
Fuzzy-Regelung Grundlagen, Entwurf, Analyse
Mit 174 Abbildungen und 9 Tabellen
Springer
Dr. Kai Michels Fichtner GmbH & Co. KG Sarweystr.3 70191 Stuttgart
[email protected]
Prof. Dr. Frank Klawonn FH Braunschweig/wolfenbuttel Pachbereich Informatik Salzdahlumer Str. 46/48 38302 Wolfenbuttel
[email protected]
Prof. Dr. Rudolf Kruse Otto-von-Guericke-Universitat Fakultat Informatik Universitatsplatz 2 39106 Magdeburg kruse@ iws.cs.uni-magdeburg.de
Dr. Andreas Nurnberger University of California, Berkeley Dept . of Electrical Engineering and Computer Sciences Computer Science Division 94720 Berkeley, California, USA
[email protected]
ACM Computing Classification (1998): 1,1.2,1.2.8 ISBN 3-540 -43548-4 Springer-Verlag Berlin Heidelberg New York Die Deutsche Biblioth ek - CIP-Einheitsaufnahme Michels, Kai: Fuzzy- Regelung: Grundlagen, Entwurf, Analyse 1 Kai Michels ; Frank Klawonn; Rudolf Kruse; Andreas Nurnberger. - Berlin ; Heidelberg; New York; Hongkong; London; Mailand; Paris; Tokio: Springer, 2002 (Springer-Lehrbuch) ISBN 3-540-43548-4 Dieses Werk ist urheberrechtlich geschutzt. Die dadurch begrundeten Rechte, insbesondere die der Ubersetzung, des Nachdrucks, des Vortrags, der Entnahme von Abbildungen und Tabellen, der Funksendung, der Mikroverfilmung oder der Vervielfaltigung auf anderen Wegen und der Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Eine Vervielfaltigung dieses Werkes oder von Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen der gesetzlichen Bestimmungen des Urheberrechtsgesetzes der Bundesrepublik Deutschland vom 9. September 1965 in der jeweils geltenden Fassung zulas sig. Sie ist grundsatzlich vergutungspflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des Urheberrechtsgesetzes. Springer-Verlag Berlin Heidelberg New York ein Unternehmen der BertelsmannSpringer Science+Business Media GmbH http://www.springer.de © Springer-Verlag Berlin Heidelberg 2002
Printed in Germany Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeiehnung nieht zu der Annahme, daB solche Namen im Sinne der Warenzeichen- und Markenschutzgesetzgebung als frei zu betrachten waren und daher von jedermann benutzt werden durften. Umschlaggestaltung: design & production GmbH, Heidelberg Satz: Reproduktionsfertige Vorlagen von den Autoren Gedruckt auf saurefreiem Papier SPIN: 10869016 33/3142 ud
543210
Vorwort
"Fuzzy Control revolutioniert die Regelungstechnik". "Mit Fuzzy Control wird alles einfacher". So oder ahnlich lauteten zu Beginn der neunziger Jahre die Schlagzeilen, als Erfolgsberichte aus Japan iiber Fuzzy-Hegler durch die deutsche Presse gingen. Dart hatte man eine Idee in die industrielle Praxis umgesetzt , die 1965 von Prof. Lotti A. Zadeh in Berkeley vorgeschlagen und anschlieBend vor allem in Europa weiterentwickelt und in einigen praktischen Anwendungen erprobt worden war. Fuzzy-Regelung wurde in Japan als Technologie gefeiert , die mit ihrer Unscharfe und impliziten Uberlagerung verschiedener Aussagen die japanische Denkweise besonders gut widerspiegele. Ein neuer Technologie-Boom in Japan wurde vorhergesagt, durch den die Europaer ins Hintertreffen geraten wiirden. Verstandlicherweise losten diese Meldungen in Deutschland groBe Unruhe aus. Forschungsprojekte wurden initiiert, Entwicklungsabteilungen damit beauftragt, Fuzzy-Regelung en in Produkte umzusetzen. Schnell formierten sich Gegner und Befilrworter, und heftig wurde diskutiert, ob denn die "konventionelle" oder die Fuzzy-Regelung die bessere sei. Mittlerweile hat sich die Aufregung gelegt , insbesondere da die FuzzyRegelung in den letzten Jahren aus Sicht der klassischen Regelungstechnik analysiert wurde und somit eine objektivere Evaluierung ihrer Starken und Schwachen erfolgt ist . Desweiteren wurden verschiedene Einsatzmoglichkeiten von Fuzzy-Systemen in der dem Regelkreis iiberlagerten Steuer- und Automatisierungsebene , insbesondere im Zusammenspiel mit anderen Methoden des Soft Computing und der kiinstlichen Intelligenz, aufgezeigt. Das Ziel des vorliegenden Buches ist es, auf diesen Grundlagen den - sinnvoUen - Einsatz von Fuzzy-Reglcrn und Fuzzy-Systemen in der Rcgelungsund Automatisierungstechnik zu unterstiitzen. Es wendet sich daher sowohl an Regelungstechniker, die Fuzzy-Hegler als zusatzliche Option zum Losen regelungstechnischer Probleme betrachten sollten, als auch an Informatiker, urn ihnen die Welt der Regelungstechnik zu erschlieBen und einige Anwendungsmoglichkeiten der Methoden aus dem Soft Computing und der kiinstlichen Intelligcnz aufzuzeigen . Dabei soll dieses Buch einerseits als Lehrbuch die zur Beschaftigung mit Fuzzy-Reglern erforderlichen Grundlagen vermitteln, und zwar sowohl ftir Ingenieur- als auch Informatikstudentcn nach dem Vordiplom . Andererseits
VI
Vorwort
soli das Buch aber auch dem Anwend er als umfassend es Nachschlagewerk zu den verschiedenen Aspekten der Fuzzy-R egier und dem akt uellen St and der Forschung dienen. Der Aufb au des Buches t ragt diesen Zielen Rechnung. Im ersten Kapi tel ent halt das Buch eine fundi erte Einfuhru ng in die Theorie der Fuzzy-Syst eme, in der nicht nur die Vorgehensweise z.B. zur Verkniipfung von Fuzzy-Mengen beschri eben wird , sondern auch die semant ischen Hintergriinde. Ers t diese Kenn tnis verset zt den Anwend er in die Lage, die Einsatzm6glichkeiten eines Fuzzy-Syst ems richt ig einzuschatzen. 1m zweit en Kapitel folgt eine br eit e Darstellung der regelun gstechnis chen Grundlagen , die fur die Beschaftigun g mit Fuzzy-Reglern erforderlich sind. Obwoh l das zweite Kapitel damit in erste r Linie fur Nicht-Regelun gst echniker geschrieben wurde, konnen einzelne Teilkapitel wie z.B. iiber die Hyp ers tabilit atst heorie ode r Sliding-Mode-Regler auch fur Regelun gstechnik er int eressant sein , da diese Themen im Allgemeinen nicht zum regelungstechnischen Grundlagenwissen gehoren . Die Fuzzy -RegIer selbst werden im dritten Kapitel eingcfiihrt, wob ei dieses Kapi tel nach der fundi erten Einfuhrung der Fuzzy-Syst eme im ersten Kapitel relativ kurz ausfallen konnte. Sein Schwerpunkt liegt auf einer Dars t ellung der heute gan gigen T yp en von Fuzzy-Reglern, ent ha lt daruber hinaus ab er auch eine Interpretation des Mamdani-Reglers mit Hilfe von Ahnli chkeitsrelati onen , mit deren Hilfe die dem Fuzzy-Re gIer zugrunde liegenden Ide en nah er erlaute rt werden. Der letzte Abschnitt dieses Kapi tels widmet sich der anfangs erwahnte n Frage nach den Vor- und Nachtei len von Fuzzy-R eglern gegeniibe r klassischen Reglern. Das vierte Kap itel beha nde lt die Stabilitatsanalyse von Fuzzy-R eglern. Da die Frage nach der Stab ilit at gru ndsiitzlich die entscheidende Frage bei jeder Regelung ist und gerade auf diesem Gebiet in den letzten J ahren besonders int eressante En twicklun gen zu verzeichnen waren, wur de diesem Thema ein eigenes Kapitel gewidmet. Zielsetzun g des Kapitels ist , zunac hst einen Uberblick tiber die diversen Ansa tze zur Stabili tatsan alyse zu gebe n und am Schlu ss des Kapi tels tiber die Vor- und Nachteile der Verfahren zu diskutie ren, urn auch eine Entscheidungshilfe im pr aktischen Anwendungsfall zu bieten. 1m letzten Kapitel werden Ansatze zur Evaluierung und Optimierung von Fuzzy -Reglern beschr ieben , d.h. Methoden, die den Entwurf von FuzzyReglern unterstiitzen oder soga r automat isieren, insbesondere auch durch den Ein sat z von Neuronalen Net zen und evolutiona ren Algorithmcn . Zusatzlich zur gru ndlegenden Erlauterung der Themen werden jeweils auch akt uelle Forschun gsergebni sse beriicksichtigt. AbschlieBend mocht en wir uns bei all jenen bedanken , deren Arbeit im Rahmen von Forschun gsproj ekten oder st udent ischen Arbeiten und deren wert volle Beitrage in interessanten Disku ssion en uns erst in die Lage versetzt haben , dieses Buch zu schreibe n. Unser besonderer Dank gilt Prof. Werner Leonhard ftir die Ini tiierung des Forschungsprojektes "Stabilitatsana lyse und
Vorwort
VII
Selbsteinstellung von Fuzzy-Reglern ", Prof. Kai Muller fur die hervorragende Unterstiitzung in Fragen der Regelungstheorie, Prof. Lotfi A. Zadeh fur viele Anregungen und Diskussionen , Herrn Dr. Engesser vom Springer-Verlag fur die gute Zusammenarbeit, sowie einer Vielzahl von Kollegen und Freunden, die uns ~ direkt oder indirekt ~ bei der Arb eit unt erstiitzt haben.
Stuttgart, Magdeburg, Braunschweig, Berkeley im Mai 2002 Die Autoren
Inhaltsverzeichnis
1.
Grundlagen der Fuzzy-Systeme . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1 Fuzzy-Mengen ... ...... .. .. .. . . . . . . . . . . . . . . ... ... . . .... 1.2 Reprasentation von Fuzzy-Mengen . . . . . . . . . . . . . . . . . . . . . . . . 1.2.1 Definition mittels Funktionen . . . . . . . . . . . . . . . . . . . . . . 1.2.2 Niveaumengen . . . ....... .... .. .... ......... .. .. .. 1.3 Fuzzy-Logik . . . . . . . .. .. ....... .. .. ........ ..... . .. . . . . . 1.3.1 Aussagen und Wahrheitswerte 1.3.2 t-Normen und t-Conormen 1.3.3 Voraussetzungen und Probleme 1.4 Operationen auf Fuzzy-Mengen . . . . . . . . . . . . . . . . . . . . . . . . . .. 1.4.1 Durchschnitt . .. . .. . . . . . . . . . . . .. . .. .. . . .. . . .... ... 1.4.2 Vereinigung . .. . ... .. . .. .. . .. . . . .. .. . .. ........... 1.4.3 Kompl ement . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.4 Linguistische Modifizierer 1.5 Das Extensionsprinzip 1.5.1 Abbildungen von Fuzzy-Mengen . . . . . . . . . . . . . . . . . . .. 1.5.2 Abbildungen von Niveaumengen. . . . . . . . . . . . . . . . . . . . 1.5.3 Kartesisches Produkt und zylindri sche Erweiterung . . . 1.5.4 Extensionsprinzip fiir mehrelementige Abbildungen . .. 1.6 Fuzzy-Relationen................ . . . . . .. . .. . . . . .. ... . . . . 1.6.1 Gew6hnliche Relationen . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6.2 Anwendung von Relationen und Inferenz . . . . . . . . . . . . 1.6.3 Inferenzketten . . . . . ... . .. . . . . . ... ... . . . . . . . . . . . . . 1.6.4 Einfache Fuzzy-Relationen . . . . . . . . . . . . . . . . . . . . . . . . . 1.6.5 Verkettung von Fuzzy-Relationen . . . . . . . . . . . . . . . . . .. 1.7 Ahnlichkeitsrelationen . . . . . . . . . . . . . . . . . . .. . . . . . . . . . .. . ... 1.7.1 Fuzzy-Mengen und ext ensionale Hiillen , . . . . . . . . . . . . . 1.7.2 Skalierungskonzepte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.7.3 Int erpretation von Fuzzy-Mengen . . . . . . . . . . . . . . . . . . .
1 2 6 6 8 10 11 14 19 20 21 22 23 25 26 27 29 30 31 33 33 34 37 39 43 45 47 48 52
2.
Regelungstechnische Grundlagen 2.1 Grundbegriffe . . . .. . . . . . . . . . . . . . . . . . . . .. .. . . . . . . . . . . . . .. 2.2 Modell der Strecke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.1 Problemstellung. .. . . . . . . .. ... .. . . . . ... . . . . ..... . .
59 59 63 63
X
Inhaltsverzeichnis
2.3
2.4
2.5
2.6
2.7
2.8
2.2.2 Normierung . .. . . . .. . . . . . . . . . . . . ... . . . . . . .. . . .. . . 2.2.3 Elementare lineare Ubertragungsglieder . .. 2.2.4 Elementare nichtlineare Ubertragungsglieder . . . . . . . . . 2.2.5 Verz6gerungsglieder erster und zweiter Ordnung . . . . . . 2.2.6 Anwendungsbereich . .. . . . .. .. .. . . ... .. . . . . . . . . . . . . 2.2.7 Linearisierung . .... ....... . . . .... .. ... . . . . .... . . .. 2.2.8 AbschlieBende Bemerkungen . . . . . . . . . . . . . . . . . . . . . .. Ubertragungsfunktion.. . .. . .. . . . . . . . . .. . ... . . . . . . . . . . . . . 2.3.1 Laplace- Transformation . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.2 Berechnung von Ubertragungsfunktionen . . . . . . . . . . . . 2.3.3 Interpretation der Ubertragungsfunktion 2.3.4 Berechnung der Sprungantwort . . . . . . . . . . . . . . . . . . . .. 2.3.5 Vereinfachung einer Ubertragungsfunktion . . . . . . . . . . . Frequenzgangdarstellung .. . . ... .................... .. . . . 2.4.1 Einftihrung des Frequenzganges 2.4.2 Ortskurve . .. . .. . . . . .. . .. .. . .. . . . .. . .. . . .. . .. . . . . 2.4.3 Bode-Diagramm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Stabilitat linearer Systeme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5.1 Definition der Stabilitat . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5.2 Stabilitat einer Ubertragungsfunktion . . . . . . . . . . . . . . . 2.5.3 Stabilitat eines Regelkreises . . . . . . . . . . . . . . . . . . . . . . . . 2.5.4 Kriterium von Cremer, Leonhard und Michailow 2.5.5 Nyquist-Kriterium PID-Regler 2.6.1 Anforderungen an einen Regler 2.6.2 Reglertypen 2.6.3 Reglerentwurf. 2.6.4 Strukturerweiterung Zustandsdarstellung und Zustandsregelung 2.7.1 Grundlagen 2.7.2 Steuerbarkeit und Beobachtbarkeit 2.7.3. Der Ljapunovsche Stabilitatsbegriff fur lineare Systeme 2.7.4 Entwurf eines Zustandsreglers 2.7.5 Linearer Beobachter 2.7.6 Stationare Genauigkeit von Zustandsreglern 2.7.7 Normoptimale Regler , Nichtlineare Systeme 2.8.1 Eigenschaft en nichtlinearer Syst eme 2.8.2 Behandlung nichtlinearer Systeme mit linearen Methoden 2.8.3 Schaltende Ubertragungsglieder 2.8.4 Definition der Stabilitat bei nichtlinearen Systemen 2.8.5 Direkte Methode von Ljapunov 2.8.6 Harmonische Balance
64 65 67 69 73 74 75 76 76 78 80 82 85 87 87 88 92 93 93 95 96 98 100 105 105 109 115 118 127 127 136 ~40
143 149 151 153 160 160 161 168 180 188 192
Inhaltsverzeichnis
2.8.7 2.8.8 2.8.9 2.8.10 2.8.11
XI
Popov-Kriterium Kreiskriterium Hyperst ab ilitat Sliding Mode-R egler Nicht linea rer Beobacht er
205 214 222 232 237
3.
Fuzzy-Regler und Regier-Evaluierung 3.1 Mamdan i-Regler 3.1.1 Hinweise zum Reglerentwurf 3.1.2 Defuzzifizierungsmethoden 3.2 Ta kagi-Sugeno-Ka ng-RegIer 3.3 Logikbasierte RegIer 3.4 Mamdani-Rcgler und Ahnlichkeits relat ionen 3.4.1 Interpretation eines Reglers 3.4.2 Kons truktion eines Reglers 3.5 Fuzzy-Regelung versus klassische Regelun g
239 239 244 247 249 252 254 254 256 258
4.
Stabilitatsanalyse von Fuzzy-Regiern 4.1 Vorausset zungen 4.1.1 St ru kt ur des Regelkreises 4.1.2 Analyt ische Approximation eines Fuzzy-Regiers 4.1.3 Takagi-Sugeno-Kan g-Syst eme 4.2 Direkte Methode von Ljapunov 4.2.1 Anwendung auf gewohnliche Fuzzy-RegIer 4.2.2 Anwendung auf Takagi-Sugeno-Kang-Regier 4.2.3 Anwendung auf Facettenfunkt ionen 4.3 Harmonische Ba lance 4.4 Pop ov-Kriteriurn 4.5 Kreiskriterium 4.5.1 RegIer mit einer E ingangsg rofe 4.5.2 Regier mit mehreren Eingangsgrofen 4.5.3 Mehrgrof enregler 4.6 Normenbasierte St abili t at san alyse 4.7 Hyp erstabilit a tskriterium 4.8 Vergleich mit einem Slidin g Mode-Regler 4.9 Direkte Analyse im Zust andsraum 4.9.1 Konvexe Zerlegung 4.9.2 Cell-t o-Cell Mapping 4.10 Fazit
263 263 263 265 267 272 273 274 287 291 294 295 295 295 298 298 302 303 306 306 308 313
5.
Einstellung und Optimierung von Fuzzy-Reglern 5.1 Entwurf von TSK-Reglern 5.2 Adaption von Kenn feldern 5.2.1 Adap tiver Komp ensationsregler 5.2.2 Adapt iver Sliding Mode-Hegler
317 320 322 322 330
XII
Inhaltsverzeichnis 5.3 Modifikation der Fuzzy-Regeln 5.4 Modellbasierte Regelung 5.4.1 Modellstruktur 5.4.2 Einschritt-Regelung 5.4.3 Optimale Regelung 5.5 Fuzzy-RegIer und Fuzzy-Clustering 5.5.1 Fuzzy-Clu steranalyse 5.5.2 Erzeugung von Mamd ani-Reglern 5.5.3 Erzeugung von TSK-Modellen 5.6 Neuro Fuzzy-Regelung 5.6.1 Neuron ale Netze 5.6.2 Kombin ation Neuronaler Netze und Fuzzy-RegIer 5.6.3 Modelle mit iiberwachten Lernverfahren 5.6.4 Modelle mit verstarkendem Lernen 5.6.5 Diskussion 5.7 Fuzzy-Regier und evolut ionare Algorithmen 5.7.1 Evolut ionsstrat egien 5.7.2 Genetische Algorithmen 5.7.3 Evolutionare Algorithmen zur Optimierung von FuzzyReglern 5.7.4 Ein Genetischer Algorithmus zum Erlernen eines TSKReglers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.7.5 Diskussion
332 334 334 339 345 350 350 355 355 356 357 361 365 369 375 375 376 377 379 383 384
A. Anhang A.l Korr espondenzt afel zur Laplace-Transform ati on A.2 Systeme mit nicht-minimaler Phase A.3 Normen A.4 Die Ljapunov-Gleichung A.5 Die Lie-Ableitung A.6 Positiv reelle Syst eme A.7 Lineare Matrixungleichungen
387 387 388 391 396 398 399 400
Literaturverzeichnis
401
Index
413
1. Grundlagen der Fuzzy-Systeme
Die klassische Mathematik basiert auf der Grundannahme, dass allen formallogischen Aussagen immer einer der beiden Wahrheitswerte wahr oder falsch zugeordnet werden kann . Sofern sich ein formal es Modell fur eine zu bearbeitend e Aufgab e angeben lasst, st ellt die gewohnl iche Mathematik miichtige Werkzeuge zur Problem16sung bereit. Die Beschreibung eines formalen Modells geschieht in einer Terminologie, die sehr viel strikteren Regeln folgt als die natiirliche Umgangssprache. Auch wenn die formal e Spezifikation hiiufig mit groBem Aufwand verbunden ist , so lassen sich durch sie Missinterpretationen verm eiden . AuBerd em konnen im Rahmen eines formalen Modells Vermutungen bewiesen oder bisher unbekannte Zusammenhiinge abgeleite t werden. Trotzdem spielen im allt iiglichen Leben formale Modelle bei der Kommunikation zwischen Menschen im Pri nzip keine Rolle. Der Mensch ist in der Lage, naturlich-sprachliche Informationen hervorragend zu verarbeiten , ohne ub erh aupt an eine Formalisierung der Gegebenheiten zu denken . Beispielsweise kann ein Mensch den Rat , beim langsamen Anfahr en nur wenig Gas zu geben, direkt in die Praxis umsetzen. Soll das langsame Anfahren aut omat isiert werd en , so ist zunachst nicht klar, wie dieser Hinweis konkret umgesetzt werd en kann . Eine konkrete Angab e in Form eines eindeuti gen Wertes - etwa: driicke das Gasped al mit einer Geschwindigkeit von einem Zentimeter pro Sekunde herunter - wird bei einer Automati sierung benotigt. Umgekehr t kann der Mensch mit dieser Information wenig anfangen. Ublicherweise wird daher die Automatisierung eines Vorgangs nicht auf "gute Ratschliige" aus heuristischem oder Erfahrungswissen gestutzt, sondern auf der Grundlage eines formalen Modells des technischen oder physikalischen Syst ems vorgenommen . Diese Vorgehensweise ist sicherlich sinn voll, insbesond ere dann, wenn sich ein gutes Modell angeben lasst . Ein vollig and erer Ansatz best eht darin , das umgangssprachlich formulierte Wissen direkt fur den Entwurf der Automatisierung zu nutzen. Ein Hauptproblem dabei ist die Umsetzung verbaler Beschreibungen in konkr ete Werte, z.B. die oben erwahnte Zuordnung von "ein wenig Gas geben" und dem Herunterdrucken des Gasp edals mit einer Geschwindigkeit von einem Zentimeter pro Sekundc. K. Michaels et al., Fuzzy-Regelung © Springer-Verlag Berlin Heidelberg 2002
2
1. Grundlagen der Fuzzy-Systeme
Der Mensch verwendet in seinen Beschreibungen iiberwiegend unscharfe oder vage Konzept e. Nur selten t rete n fest definierte Begriffe wie beispieIsweise Uberschallgeschwindigkeit als Angab e fur die Geschwindigkeit eines beobachteten FIugzeugs auf. Uberschallgcschwindigkeit chara kte risiert eine eindeutige Menge von Geschwindigkeiten , da die Schallgeschwindigkeit eine feste GroBe ist und somit eindeut ig klar ist , ob ein FIugzeug schneller als der Schall ist oder nicht . Bei den haufiger verwendeten unscharfen Konzepten wie schn ell, sehr groB, kurz usw. ist eine eindeut ige Ents cheidun g, ob ein gegebener Wert das entsprechende Att ribu t verdient , nicht mehr moglich, Dies hangt zum einen damit zusammen, dass die Attribute eine kontext abh angige Bedeutung hab en. Wenn wir schnell auf Flugzeuge beziehen, verstehen wir sicherlich andere Geschwindigkeiten darunter, als wenn wir an Autos denken. Aber selbst in dem Fall, dass der Kont ext - z.B. Aut os - klar ist , WIt es schwer, eine scharfe Trennung zwischen schnellen und nicht-schnellen Autos zu ziehen. Die Schwierigkeit besteht nicht darin , den richtigen Wert zu finden , ab der ein Auto (bzw. dessen Hochstgeechwindigkeit) als schnell bezeichnet werden kann . Dies wiirde voraussetzen, dass es einen solchen Wert iiberhaupt gibt . Es widerstrebt einem eher, sich iiberhaupt auf einen einzeInen Wert fest zulegen. Es gibt sicherlich Geschwindigkeiten , die man eindeut ig als schnell fiir ein Auto einst ufen wiirde, genauso wie einige Geschwindigkeiten als nichtschnell gelten. Dazwischen gibt es jedoch einen Bereich der mehr oder weniger schnellen Auto s.
1.1 Fuzzy-Mengen Die Idee der Fuzzy-Mengen besteht nun darin , dieses Problem zu losen , indem man die scharfe, zweiwert ige Unt erscheidun g gewohnlicher Mengen , bei denen ein Element entweder vollstandig oder gar nicht dazugehort, aufgibt . Stat t dessen lasst man bei Fuzzy-Mengen grad uelle ZugehOrigkeitsgrade zu. Bei einer Fuzzy-Menge muss daher fur jedes Element angegeben werden, zu welchem Grad es zur Fuzzy-Menge gehort . Wir definieren daher:
Definition 1.1 Ei ne Fuzzy-Menge oder Fuzzy-Teilm enge fJ der Grundm enge X ist eine A bbildun g fJ : X -. [0,1], die jedem Element x E X seine n ZugehOrig keitsgrad M( X) zu fJ zuordnei. Die M enge alter Fuzzy-Mengen von X bezeichnen uns: mit F(X) . Eine gewohnliche Mengen M S;; X kan n man als spezielle Fuzzy-Menge ansehen, indem man sie mit ihrer charak teristischen Funkti on oder 1ndikatorfunktion I falls x E M 1M : X -. {O, I} , x ...... { sonst
°
identifiziert . In diesem Sinne konnen Fuzzy-Mengen auch als verallgemeinerte charakte rist ische Funk tionen aufgefasst werden.
1.1 Fuzzy-Mengen
3
Beispiel 1.2 Abb . 1.1 zeigt die cha ra kterist ische Funk tion der Menge der Geschwindi gkeit en , die grofier als 170 km /h sind. Diese Menge ste llt keine adaquate Modelli erung der Menge aller hohen Geschwindigkeiten dar. Aufgrund des Sprunges bei dem Wert 170 ware 169.9 km/h keine hohe Geschwindigkeit , wahrend 170.1 km /h bereits vollstandig als hohe Geschwindi gkeit gelte n wiirde, Ein e Fuzzy-Menge wie in Abb. 1.2 darg este llt scheint dah er das Kon zept hohe Geschwindigkeit besser wiederzugeb en. 0 1
10
20
140 150 160 170 180 190 200
Abb. 1.1. Die charakteristische Funktion der Menge der Geschwindigkeiten gr6Ber als 170 krri /h 1
10
20
140 150 160 170 180 190 200
Abb. 1.2. Die Fuzzy-Menge /LhG der hohen Geschwindigkeiten
Einige Autoren verstehen unt er einer Fuzzy-Menge explizit nur ein vages Kon zept A wie hohe Geschwindigkeit und bezeichnen die Funktion /LA , die jedem Element seinen Zugehorigkeitsgrad zu dem vagen Kon zept zuordnet , als Zugehorigkeit s- oder chara kterisierende Funktion der Fuzzy-Menge bzw. des vagen Konzept s A . Vom formalen Standpunkt aus betracht et bringt diese Unterscheidung keinen Vort eil, da fur Berechnungen immer die Zugehorigkeitsfunkti on - also das , was wir hier unter einer Fuzzy-Menge verst ehen benoti gt wird. Neben der Not ation einer Fuzzy-Menge als Abbildung in das Einheitsi nterva ll sind zum Teil auch andere Schr eibweisen ublich, die wir in diesem Buch aber nicht weiter verwend en werd en. In man chen Veroffent lichungen wird eine Fuzzy-Menge als Menge von Paaren der Elemente der Grundmenge und den ents prechenden ZugehOrigkeitsgrad en in der Form {( x,/L(x )) I x E X} geschrieben in Anlehnung daran, dass in der Mathematik eine Funktion ilbli-
4
1.
Grundlagen der Fuzzy-Systeme
cherweise als Menge von Urbild-Bild-Paaren formal definiert wird. Eh er irrefiihrend ist die manchmal verwendete Not at ion einer Fuzzy-Menge als formale Summ e L:XEX x//-L(x) bei hochstens abzahlbarer Grundmenge X bzw. als "Integral" JXEXx //-L (x ) bei uberabzahlbarer Grundmenge X. Es sollte betont werden , dass Fuzzy-Mengen innerh alb der "herkommlichen" Mathematik formalisiert werden , genauso wie die Wahrscheinlichkeitstheorie im Rahmen der "herkommlichen" Mathematik formuliert wird . In diesem Sinne eroffnen Fuzzy-Mengen nicht eine "neue" Math ematik , sondern lediglich einen neuen Zweig der Mathematik. Aus der Erkenntnis, dass sich bei der streng zweiwertigen Sicht vage Konzept e, mit denen der Mensch sehr gut umgehen kann , nicht adaquat modellieren lassen, haben wir den Begriff der Fuzzy-Menge auf einer rein intuitiven Basis eingefiihrt . Wir hab en nicht naher spezifiziert, wie ZugehOrigkeitsgrade zu int erpr etieren sind . Die Bedeutungen von 1 als volle Zugehorigkeit und 0 als keine Zugehorigkeit sind zwar offensichtlich. Wie ein Zugehorigkeitsgrad von 0.7 zu deuten ist oder warum man lieber 0.7 anst att 0.8 als Zugehorigkeitsgrad eines bestimmten Element es wahlen sollte, haben wir offen gelassen. Diese Fragen der Semantik werden oft vernachlassigt , was dazu fiihrt , dass keine konsequente Int erpret ation der Fuzzy-Mengen dur chgehalten wird und so Inkonsistenzen entstehen konnen. Versteht man Fuzzy-Mengen als verallgemeinerte charakte rist ische Funk tionen, ist es zunachst einmal nicht zwingend , das Einheits int ervall als kanonische Erweiterung der Menge {O, I } anzusehen. P rinzipiell ware auch eine andere linear geordnete Menge oder allgemeiner ein Verb and L anstelle des Einheitsintervalls denkb ar. Man spricht dann von L-Fuzzy-Mengen. Diese spielen jedoch in den Anwendungen im allgemeinen fast keine Rolle. Aber selbst wenn man sich auf das Einheitsintervall als die Menge der moglichen Zugehorigkeitsgrade festl egt , sollte geklart werden, in welchem Sinne bzw. als welche Art von Struktur es verstanden wird . Das Einh eitsintervall kann als eine ordinale Skala aufgefasst werden, d.h., es wird allein die lineare Ordnung der Zahlen verwendet , beispielsweise urn Praferenzen auszudriicken. In diesem Fall ist die Interpretation einer Zahl zwischen 0 und 1 als Zugehorigkeitsgrad nur im Vergleich mit einem anderen Zugehorigkeitsgrad sinnvoll. Auf diese Weise kann ausgedriickt werden , dass ein Element eher zu einer Fuzzy-Menge gehort als ein anderes. Ein Problem, das sich aus dieser rein ord inalen Auffasung des Einheitsintervalls ergibt, ist die Unvergleichbarkeit von Zugehorigkeitsgraden, die von verschiedenen Personen angegeben wurden. Die gleiche Schwierigkeit besteht beim Vergleich von Benotungen. Zwei Priifungskandid at en, die dieselbe Note bei verschiedenen Priifern erhalte n hab en , konnen in ihren Leistungen dur chaus sehr unterschiedlich sein. Die Notenskala wird jedoch La. nicht als reine ordinaIe Skala verwendet. Dur ch die Festlegung, bei welchen Leistungen oder bei welcher Fehlerquote eine ents prechende Note zu vergeben ist , wird versucht , eine Vergleichbarkeit der von verschiedenen Priifern stammenden Note n zu erreichen.
1.1 Fuzzy-Mengen
5
Das Einheitsintervall besitzt mit der kanonischen Metrik, die den Abst and zweier Zahlen quant ifiziert, und Operation en wie der Addition und der Mult iplikat ion wesentlich reichere Strukturen als die lineare Ordnung der Zahlen. In vielen Fallen ist es daher gunst iger, das Einh eitsintervall als metrische Skala aufzufassen, urn so eine konkretere Interpret ation der Zugehorigkeitsgrade zu erhalte n. Wir ste llen diese Fragen nach der Semanti k von Zugehorigkeitsgraden und Fuzzy-Mengen bis zum Abschnitt 1.7 zuruck und beschranken uns zunachst auf eine naive Interpret at ion von Zugehorigkeitsgraden in dem Sinne, dass die Eigenschaft , Element einer Menge zu sein, graduell erftillt sein kann . Es sollte betont werden, dass Gradu alit at etwas vollig anderes als das Konzept der Wahrs cheinlichkeit ist . Es ist klar , dass eine Fuzzy-Menge JL nicht als Wahrscheinlichkcit svert eilung bzw. -dichte aufgefasst werd en darf, da JL La. der wahrscheinlichkeitstheoret ischen Bedingung
L
JL( x) = 1
bzw.
xE X
nicht geniigt. Der ZugehOrigkeitsgrad JL(x) eines Element es x zur FuzzyMenge JL sollte auch nicht als Wahrscheinlichkeit dafiir inter pret iert werden , dass x zu JL gehort . Urn den Unterschied zwischen gradueller Erflilltheit und Wahrscheinlichkeit zu veranschaul ichen , betr achten wir folgendes Beispiel in Anlehnung an
[16] . U bezeichne die "Menge" der ungiftigen Fhissigkeiten. Ein Verdurste nder erhalt zwei Flaschen A und B und die Information, dass die Flasche A mit Wahrscheinlichkeit 0.9 zu U gehort, wahrend B einen ZugehOrigkeitsgrad von 0.9 zu U besit zt . Aus welcher der beiden Flaschen sollte der Verdurstende trinken? Die Wahrscheinlichkeit von 0.9 fur A konnt e etwa daher stammen, dass die Flasche einem Raum mit zehn Flaschen, von denen neun mit Mineralwasser gefullt sind und eine eine Zyankalilosung ent halt , zufallig ent nommen wurde. Der Zugehorigkeit sgrad von 0.9 dagegen bedeutet , dass die Flu ssigkeit "einigermaBen" trinkbar ist. Beispielsweise konnte sich in B ein Fru chtsaft befinden, dessen Haltbarkeitsdatum gerade iiberschrit ten wurd e. Es ist daher rat sam , die Flasche B zu wahlen, Die Fltissigkeit in der Flasche A besitzt die Eigenschaft ungiftig zu sein cntweder ganz (mit Wahr scheinlichkeit 0.9) odcr gar nicht (mit Wahrs cheinlichkeit 0.1). Dagegen erflillt die Fliissigkeit in B die Eigenschaft ungiftig zu sein nur graduell. Wahrscheinlichkeit sthcorie und Fuzzy-Mengen dienen also zur Modellierung vollig unterschiedlicher Phanornene - namlich der Quantifizierung der Unsicherheit , ob ein Ereignis eint ritt oder ob eine Eigenschaft erflillt ist, bzw. der Angab e inwieweit eine Eigenschaft vorhanden ist .
6
1.
Grundlagen der Fuzzy-Systeme
1.2 Reprasentation von Fuzzy-Mengen Nachdem wir im ersten Abschnitt Fuzzy-Mengen formal als Funk tion en von einer Grundmenge in das Einh eitsintervall eingefiihrt hab en, beschaftigen wir uns nun mit verschiedenen Moglichkeiten , Fuzzy-Mengen anzugeben, und mit geeignete n Methoden zur Darstellung und Speicherung von Fuzzy-Mengen.
1.2.1 Definition mittels Funktionen Ist die Grundmenge X = {Xl, .. . , x n } , iiber der wir Fuzzy-Mengen bet rachte n, eine endliche, diskrete Menge von einzelnen Obj ekt en, kann eine Fuzzy-Menge f.L i.a. nur dur ch die direkte Angab e der Zugehorigkeitsgrade f.L (x) fur jedes Element X E X spezifiziert werden - etwa in der Form f.L :;;; {(Xl ,f.L( Xl)) " ' " (Xn,f.L(Xn))}. In den meisten Fallen, die wir hier betrachten werden , besteht die Gru ndmenge X aus Werten, die eine reellwert ige Variable annehmen kann, so dass X fast immer ein reelles Int ervall ist . Eine Fuzzy-Menge f.L ist dann eine reelle Funktion mit Wert en im Einheitsinter vall, die beispielsweise durch die Zeichnung ihres Graph en fest gelegt und veranscha ulicht werden kann . Bei einer rein grafischen Definition von Fuzzy-Mengen lassen sich die Zugehorigkeitsgrade einzelner Elemente nur ungenau bestimmen, was zu Schwierigkeite n bei weit eren Berechnungen fuhrt , so dass sich die grafische Dar stellung nur zur Veranschaulichung eignet . Ublicherweise werden Fuzzy-Mengen zur Modellieru ng von Ausdr iicken - die haufig auch als linguistische Ausdriicke bezeichnet werden , urn den Sprac hbezug zu betonen - wie "ungefahr 3", "mittelgroB" oder "sehr groB" verwendet , die einen unscharfen Wert oder ein unscharfes Intervall beschreiben. Solchen Ausdr iicken zugeordnete Fuzzy-Mengen sollten bis zu einem bestimmt en Wert monoton steigend und ab diesem Wert monoton fallend sein. Fuzzy-Mengen dieser Art werden als konvex bezeichnet . Abb . 1.3 zeigt drei konvexe Fuzzy-Mengen, die zur Modellierung der Ausdriicke "ungefahr 3", "mitt elgroB" und "sehr groB" verwendet werden konnten. In Abb . 1.4 ist eine nichtkonvexe Fuzzy-Menge dargestellt . Aus der Konvexit at einer Fuzzy-Menge f.L folgt nicht , dass IJ, auch als reelle Funk t ion konvex ist .
'\2\ 2
3
mittelgroB
4
Abb. 1.3. Drei konvexe Fuzzy-Mengen
sehr groB
1.2 Repriisentation von Fuzzy-Mengen
7
Abb. 1.4. Eine nichtkonvexe Fuzzy-Mengen Es ist oft sinnvoll, sich auf einige wenige Grundformen konvexer FuzzyMengen zu beschranken, so dass eine Fuzzy-Menge durch die Angabe von wenigen P arametern eindeutig fest gelegt wird . Typische Beispiele fur solche parametrischen Fuzzy-Mengen sind die Dreiecksfunktioncn (vgl. Abb . 1.5) x- a
falls a :::; x:::; b c- b falls b :::; x :::; c a sonst , b-a
Aa,b,c :
X
lR ---.. [0,1],
c-x
1---7
{
wobei a < b < c gelten muss. Dreiecksfunktionen sind Spezialfalle von Trapezfunktionen (vgl. Abb. 1.5)
:,=~, falls a' < x < b' IIa' ,b' ,c' ,d' : IR ---.. [0,1]'
X I---7
falls b' < x < c'
1
{
d'
-
-
d' =~ falls c' :::; x :::; d' a sonst ,
wobei a' < b' :::; c' < d' gelte n muss. Wir lassen auBerd em die Paramet erkombinationen a' = b' = - 00 bzw. c' = d' = 00 zu. Die sich ergebenden Trapezfunktionen sind in Abb . 1.6 dargestellt. Fur b' = c' folgt IIa' ,b' ,c' ,d' = A a' ,b' ,d" Sollen anstelle stuckweiser linearer Funktionen wie den Dreiecks- oder Trap ezfunktionen glat te Funktionen verwendet werd en , biet en sich beispielsweise Glockenkurvcn der Form [Jm ,s :
an . Es gilt [Jm ,s(rn) ist.
a
b
C
a'
x
IR ---.. [0, 1]'
1---7
exp
(-(x ~ m)2)
= 1. Der P arameter s legt fest , wie breit die Glockenkurve
b'
c'
Abb. 1.5. Die Dreiecksfunktion Glockenkurve fl rn,s
d' A a ,b,c,
m
die Trapezfunktion
fla' ,b' ,c' ,d'
und die
8
1. Grundlagen der Fuzzy-Systeme
Abb. 1.6. Die Trapezfunktionen II - oo,- oo ,a,b, n .i.: und IIc,d,oo ,oo
1.2.2 Niveaumengen Die Angab e oder Dar stellung einer Fuzzy-M enge als Funkti on von der Grundmen ge in das Einheit sintervall , die jedem E lement einen ZugchOrigkeitsgrad zuordnet , bezeichn et man als vertikale Sieht. Eine andere Moglichkeit , Fuz zyMengen zu beschr eib en , biet et die horizontal e Sicht , bei der man ftir jeden Wert a au s dem Einheit sintervall die Men ge der Elemcnt e bctracht et , die einen Zugehorigkeit sgrad von mindestens a zur Fuzzy-Menge besit zen .
Definition 1.3 Es sei Ji E F (X ) eine Fuzzy-Menge tier Grundmenge X un d es sei a:: : a ::::: 1. Die (gewohnli che) M enge
heiflt a -Niveeiuuenge oder a -Scunit t der Fuzzy-Menge Ji.
Abb. 1. 7. Die o -Niveaumenge oder der o -Schnitt [f1] a der Fuzzy-Menge f1
Abb. 1.7 zeigt den o -Schnitt [Ji] a der Fuzzy-Menge Ji fur den Fall , dass Ji cine Tr ap czfunktion ist. Der o -Schnit t ist dann ein abgeschlossenes Intervall, Fur beliebige Fuzzy-Mengen gilt weit erhin, dass eine Fuzzy-Menge tiber den reellen Zahlen genau dann konvex ist , wenn aile ihr e Nivcau mengen Intervalle sind . In Abb. 1.8 ist der aus zwei disjunkten Intervallen bestehende o -Schnitt einer nicht-k onvexen Fuzzy-Menge dar gestellt . Eine wicht ige Eigenschaft der Nivea umenge n einer Fuzzy-M enge ist , dass sie d ie Fuzzy-Menge einde ut ig charakt erisieren. Ken nt man die Niveaumengen [Ji]a einer Fuzzy-Menge Ji fur aile a E [0, 1], so lasst sich der Zugehorigkeitsgr ad Ji(x) eines beliebigcn Elementes x zu Ji durc h die Form el
Ji(X)
=
sup {a E [0, 1] I x E [Ji]a }
(1.1)
1.2 Repriisentation von Fuzzy-Mengen
9
Abb. 1.8. Der aus zwei disjunkten Intervallen bestehende o-Schnitt [/1-10 der FuzzyMenge /1 bestimmen. Geometrisch bedeutet dies, dass eine Fuzzy-Menge die obere Einhiillende ihrer Niveaumengen ist . Die Charakterisierung einer Fuzzy-Menge durch ihre Niveaumengen erlaubt es uns spater in den Abschnitten 1.4 und 1.5, Operationen auf FuzzyMengen niveauweise auf der Ebene gewohnlicher Mengen durchzufuhren, Der Zusammenhang zwischen einer Fuzzy-Menge und ihren Niveaumengen wird haufig auch zur internen Darstellung von Fuzzy-Mengen in Rechnern verwendet. Man beschrankt sich auf die o-Schnitte fur endlich viele ausgewahlte Werte 0: , beispielsweise 0: = 0.25,0.5, 0.75,1, und speichert die zugehOrigen Niveaumengen einer Fuzzy-Menge . Urn den Zugehorigkeitsgrad eines Elementes x zur Fuzzy-Menge f.L zu bestimmen, kann dann die Formel (1.1) herangezogen werden, wobei das Supremum nur noch tiber die endlich vielen Werte von 0: gebildet wird. Auf diese Weise werden die ZugehOrigkeitsgrade diskretisiert, und man erhalt eine Approximation der urspriinglichen Fuzzy-Menge. Abb. 1.10 zeigt die Niveaumengen [f.Llo.25' [f.LJ O.5,[f.LJ O.75 und [f.L]1 der in Abb . 1.9 dargestellten Fuzzy-Menge u. Verwendet man nur diese vier Niveaumengen zur Speicherung von /1, ergibt sich die Fuzzy-Menge j'i(x)
= max {a E {0.25, 0.5, 0.75, I} I x
E
[IlL:. }
in Abb . 1.11 als Approximation fiir u , Die Beschrankung auf endlich viele Niveaumengen bei der Betrachtung oder Speicherung einer Fuzzy-Menge entspricht einer Diskretisierung der Zugehorigkeitsgrade, Neben dieser vertikalen Diskretisierung kann auch eine horizontale Diskretisierung, d.h., der Domanen, vorgenommen werden. Wie fein oder grob die Diskretisierungen der beiden Richtungen zu wahlen sind, ist problemabhangig, so dass es hierzu keine generellen Aussagen gibt. Allgemein bringt eine groBe Genauigkeit fur die ZugehOrigkeitsgrade selten signifikante Verbesserungen, da die ZugehOrigkeitsgrade meist lediglich heuristisch ermittelt oder ungefahr angegeben werden konnen und ein menschlicher Experte bei einer Beurteilung eben falls nur auf eine begrenzte Anzahl von Unterscheidungsstufen bzw. Akzeptanz- oder Zugehorigkeitsgraden zurtickgreift.
10
1. Grundlagen der Fuzzy-Systeme
1.00 0.75 0.50 0.25 Abb . 1.9. Die Fuzzy-Menge I-t 1.00 0.75
H f------J
0.50 0.25 Abb. 1.10. Die o-Niveaumengen der Fuzzy-Menge I-t fur a = 0.25,0 .5, 0.75, 1 1.00 0.75 0.50 0.25 Abb. 1.11. Die aus den o-Niveaurnengen erhaltene Approximation der FuzzyMenge I-t
1.3 Fuzzy-Logik Der Begriff Fuzzy-Logik hat drei unterschiedliche Bedeutungen. Am haufi gste n vers teht man unt er Fuzzy-Logik die Fuzzy-Logik im weiteren Sinne, zu der aile Applikationen und Theorien zahlen, in denen Fuzzy-Mengen auftreten. Hierzu zah len insb esond ere auch die Fuzzy-R egIer, mit denen sich dieses Bu ch auseinandersetzt . 1m Gegensatz zur Fuzzy-L ogik irn weiteren Sinne urnfasst die zweite , etwas enger gefasste Bedeutung des Begriffs Fuzzy-Lo gik die Ansatze des appr oximativen SchlieBens , bei denen Fuzzy-Mengen innerh alb eines Inferenzmechanismus - wie er etwa in Expertensystemen auftritt - gehandhabt und pr opagiert werden . Die Fuzzy-Logik irn engeren Sinne, urn die es in diesem Abschnitt geht, betracht et die Fuzzy-Systeme aus der Sicht der mehrw erti gen Logik und befasst sich mit Fragest ellungen , die eng mit Iogischen Kalkul en und den damit verbundenen Dedukt ionsmechanismen zusa mmenhiingen. Wir beschranken uns in diesem Abschni tt auf die fur das Verstandnis der Fuzzy-Regier notwendi gen Begriffe der Fuzzy-Logik. Eini ge etwas weite rflihrende Aspekte der Fuzzy-Logik im engeren Sinne werden im Abschni tt 3.3 tiber Iogikbasierte Fuzzy-RegIer bespro chen. Wir ben6t igen die Fuzzy-
1.3 Fuzzy-Logik
11
Logik vor allem fur die Einfiihrung der mengentheoretischen Op erat ionen fiir Fuzzy-Mengen. Die Grundlage dieser Operat ionen wie Vereinigun g, Dur chschnit t oder Komp lement bilden die logischen Verkniipfungen wie Disjunktion, Konjunktion bzw. Negat ion. Wir wiederholen daher kur z die fur die Fuzzy-Logik zu vera llgemeinernden Konzepte aus der klassischen Logik. 1.3.1 Aussa ge n u n d W ahrheitswert e
Die klassische Aussagenlogik beschaftigt sich mit dem formalen Umgang von Aussagen , denen einer der beiden Wahrheitswerte 1 (fur wahr) oder 0 (fur falsch) zugeordnet werden kann . Die Aussagen reprasentieren wir durch griechische Buchst ab en
[1/1]
[
1 1 0 0
1 0 1 0
1 0 0 0
1 1 11~1 1 0
o o
[
[
[1/1]
[
1 0
1 1 1 0
1 1 0 0
1 0 1 0
1 0 1 1
[
[.
1 0
0 1
Tab elle 1. 1. Die Wahrheitswerttabellen fur die Konjunktion, die Disjunktion, die Implikation und die Negat ion
12
1. Gruncllagen der Fuzzy-Systerne
Aus diesen Definitionen ergibt sich, dass die Aussagen Vier ist eine gerade Zahl UNO 2
+5=
9.
und Vier ist eine gerade Zahl IMPLIZIERT 2
+5=
9.
falsch sind, wiihrend die Aussagen Vier ist eine gerade Zahl OOER 2
+5=
9.
und NICHT 2
+5=
9.
beide wahr sind. Formal ausgedrtickt bedeutet dies ['Pi /\ 'P2] = 0, ['P i ---+ 'P2 ] = 0, ['Pi V 'P2] = 1 und [--''P2] = 1. Die Ann ahme, dass eine Aussage nur entweder wahr oder falsch sein kann , erscheint bei der Betrachtung mathemat ischer Sachverh alte durchaus sinnvoll. Fiir viele der natiirli ch-sprachlichen Aussagen, mit denen wir tiiglich umgehen, ware eine st renge Trennung in wahr e und falsche Aussagen unr ealistisch und wiirde ungewollte Konsequenzen hab en. Wenn jemand verspricht, zu einer Verabredung urn 17.00 Uhr zu kommen, so war seine Aussage falsch, wenn er urn 17.01 Uhr erscheint . Niema nd wiirde ihn als Liigner bezeichnen, auch wenn in einer sehr st rengen Auslegun g seine Behaup tung nicht korrekt war. Noch komplizierter verhalt es sich, wenn jernand zusagt, urn ca. 17.00 zu einem Treffen zu erscheinen. J e gr6Ber die Differenz zwischen Abweichung seines Eint reffzeitpunktes zu 17.00 Uhr, desto "weniger wahr" war seine Aussage . Eine scharfe Abgrenz ung eines fest en Zeitraurns, der ca. 17.00 Uhr ents pricht, lasst sich nicht angebe n. Der Mensch ist in der Lage, unscharfe Aussagen zu forrnulieren, zu verstehen, aus ihnen Schlussfolgerungen zu ziehen und mit ihnen zu planen. Wenn jema nd urn 11.00 eine Autofahrt beginnt , die ca. vier St unden da uert und die Fahrt voraussichtl ich ftir eine etwa halbstiindige Mit tagspause unterbrechen wird, kann ein Mensch diese unscharfen Inform ationen problemlos verarbeite n und schlussfolgern, wann der Reisende sein Ziel ungefiihr erre ichen wird . Ein e Formalisierung dieses einfachen Sachverhalts in einem logischen Kalkiil , in dem Aussagen nur wahr oder falsch sein konnen, ist nicht adaquat. Die Verwendung unscharfer Aussagen oder Angaben in der natiirlichen Spr ache ist nicht die Ausnahme, sondern eher die Regel. In einem Kochrezept wiirde niemand die Angabe "Man nehme eine Prise Salz" durch "Man nehm e 80 Salzkorner" ersetzen wollen. Die Verliingerung des Bremsweges beim Auto fahren auf nasser Fahr bahn berechnet der Fahrer nicht , indem er in einer physikalischen Formel die kleinere Reibungskonstante der nassen Fahrbahn berticksichtigt , sondern er beachtet die Regel, dass der Bremsweg umso langer wird, je ru tschiger die St raBe ist . Urn diese Art der mensch lichen Informationsverar beitung besser modellieren zu konn en, lassen wir da her grad uelle Wahrheitswerte fur Aussage n
1.3 Fuzzy-Logik
13
zu, d.h. , eine Aussage kann nicht nur wahr (Wahrheitswert 1) oder falsch (Wahrheits wert 0) sein , sond ern auch mehr oder weniger wahr, was durch einen Wert zwischen 0 und 1 ausgedriickt wird. Der Zusammenh an g zwischen Fuzzy-Men gen und unscharfen Aussagen lasst sich folgend ermaBen beschreib en. Ein e Fuzzy-Menge modelliert i.a. eine Eigenschaft , die die Element e der Grundmenge mehr oder weniger au sgepragt besitzen konn en . Betracht en wir beispielsweise noch einma l die Fuzzy-Menge f-Lh G der hohen Geschwindi gkeiten aus Abb. 1.2 auf Seit e 3. Die Fuzzy-Menge repriisentiert die Eigenschaft oder das Pradikat hohe Geschwindigkeit , d .h. der ZugehOrigkeit sgrad einer konkreten Geschwindi gkeit v zur Fuzzy-Menge der hohen Geschwindigkeiten gibt den "Wahrheits wert" an, der der Aussage "v ist eine hohe Geschwindi gkeit " zugeordnet wird. In diesem Sinne legt eine Fuzzy-M enge ftir eine Menge von Aussagen die jeweiligen Wahrheitswerte fest - in unserem Beispi el fiir aile Aussagen, die man erhalt , wenn man fur v einen konkreten Geschwindi gkeitswert einsetzt. Urn zu verstehen , wie man mit Fuzzy-Mengen operiert, ist es dah er niitzlich, zun achst einmal unscharfe Aussagen zu betracht en. Der Umgang mit zusammengesetzten uns charfen Aussagen wie ,,160 km jh ist eine hohe Geschwindi gkeit UND die Lang e des Bremsweges betragt ca . 110m", erfordert die Erweit erung der Wahrheitswertt ab ellen ftir die logischen Verkniipfungen wie Konjunktion , Disjunktion, Impli kation oder Negat ion. Die in Tab elle 1.1 dar gestellten Wahrheitswert t ab ellen legen fiir jede logische Verknupfung eine Wahrheitswertfunktion fest. Fur die Konjunktion, die Disjunkti on und die Impli kation ordnet diese Wahrheit swertfunktion jeder Kombi nation von zwei Wahrheitswerten (den ip und 7/J zugeordneten Wahrheitswerten ) einen Wahrheitswert zu (den Wahrheitswert der Konjunkt ion, Disjunktion von sp und 7/J bzw. der Implikation cp --+ 7/J). Die der Negation zugeordnete Wahrheitswer tfunktion besitzt als Argum ent nur einen Wahrheitswert. Bezeichen wir mit w. die Wahrheitswer tfunkti on, die mit der logischen Verknupfung * E {A, V, --+ , --,} assoziiert wird , so ist w. eine zwei- bzw. einste llige Funktion, d.h . W I\ ,WV ,W_
:
{O,1}2 --+ {0,1}, W~ : {O,l} --+ {0,1}.
Fur unscharfe Aussagen , bei denen das Einheitsintervall [0,1] an die Stelle der zweielementigen Menge {O, I} als Menge der zulassigen Wahrheitswerte tritt , rniissen den logischen Verkniipfungen Wahrheitswertfunktionen W I\ , ui.), w_
:
[0, 1]2 --+ [0, 1], W~: [0,1] --+ [0,1]
zugeordnet werd en , die auf dem Einheit squadrat bzw. dem Einheits intervall definiert sind. Ein e Mind estanford erung, die wir an diese Funktionen ste llen, ist, das s sie eingeschra nkt auf die Werte und 1 dasselb e liefern , wie die entsprechenden Wahrheitswertfunktion , die mit den klassischen logischen Verkniipfungen assoziiert werden. Diese Ford erung besagt , dass die Verkniipfung uns charfer
°
14
1.
Grundlagen der Fuzzy-Systeme
Aussag en, die eigent lich scharf sind , da ihnen einer der beiden Wahrheitswerte 0 oder 1 zugeordnet ist , mit der iiblichen Verkniipfung scharfer Aussagen ub ereinstimmt. Die am haufigsten verwendeten Wahrheitswertfunktionen in der FuzzyLogik fur die Konjunktion und die Disjunktion sind das Minimum bzw. das Maximum, d.h. WA(ex, {3) = min{ex, {3} , wv(ex ,{3) = max{ex,{3} . Ublicherweise wird die Negation durch w~(ex) = 1 - ex definiert. In dem 1965 erschienenen Aufsatz [202], in dem L. Zadeh den Begriff der Fuzzy-Menge einfiihrte, wurden diese Funktionen zugrundegelegt . Die Implikation wird oft im Sinne der Lukasi ewicz-Implikation min{1- ex + {3, 1} oder der Godel-Implikation 1 falls ex { {3 sonst
< (3
verstanden. 1.3.2 t-Normen und t-Conormen
Da wir die Wahrheitswerte aus dem Einheitsintervall bisher nur rein intuitiv als graduelle Wahrheiten interpretiert haben, erscheint die Wahl der oben genannten Wahrheitswertfunktionen fiir die logischen Verkniipfungen zwar plausibel, aber nicht zwingend. Anstatt willkurlich Funktionen festzulegen , kann man auch einen axiomatischen Weg beschreiten, indem man gewisse sinnvolle Eigenschaften von den Wahrheitswertfunktion veriangt und so die Klasse der rnoglichen Wahrheitswertfunktionen einschra nkt . Wir erklaren diesen axiomatischen Ansatz exemplarisch am Beispiel der Konjunktion . Wir betrachten als potentiellen Kandidaten fiir die Wahrheitswertfunktion der Konjunktion die Funktion t : [0,1]2 ----7 [0,1]. Der Wahrheitswert einer Konjunktion mehrerer Aussagen hangt nicht von der Reihenfolge ab , in der man die Aussagen konjunktiv verkniipft. Urn diese Eigenschaft zu garantieren , muss t kommu tativ und assoziativ sein , d .h., es muss gelten: (T1) t(ex ,{3) = t({3 ,a)
(T2) t(t(a , (3), "() = t(a, t({3 ,"()) . Der Wahrheit swert der Konjunktion If! 1\ 'l/J sollte nicht kleiner als der Wahrheitswert der Konjunktion If! 1\ X sein, wenn X einen geringeren Wahrheitswert besitzt als 'l/J . Dies erre ichen wir durch die Monotonie von t: (T3) Aus {3 ::; "( folgt iio; (3) = t(a ,"(). Aufgrund der Kommutativitat (T1) ist t mit (T3) in beiden Argumenten monoton nicht-fallend .
1.3 Fuzzy-Logik
15
SchlieBlich verlangen wir noch, dass sich durch konjunktives Hinzufiigen einer wahr en Aussage 'lj; zu einer and eren Aussage
(T4) t(a, 1) = a . D efinit ion 1. 4 Ein e Funktion t : [0, IF ----+ [0, 1] heijJt t-Norm (triangu lare Norm) , wenn sie die Axiome (Tl) - (T4) erfiillt. Als Wahrheitswertfunktion fiir die Konjunktion sollt e im Rahmen der Fuzzy-Logik immer eine t-Norm gewahlt werden . Aus der Eigenschaft (T4) folgt, dass fur jede t-Norm t gilt : t(l , 1) = 1 und t(O, 1) = O. Aus t(O, 1) = 0 erhalte n wir mit der Kommutativitat (Tl) t(l , 0) = O. AuBerdem muss wegen der Monotonieeigenschaft (T3) und t(O, 1) = 0 auch t(O, 0) = 0 gelten. Somit stimmt jede t-Norm eingeschrankt auf die Werte 0 und 1 mit der durch die Wah rheitswerttabelle der gewohnlichen Konjunktion gegebenen Wahrheitswertfunktion iiberein . Man verifiziert leicht, dass die bereits erwahnte Wahrheitswertfunktion t(a , (3) = min{ a , (3} fiir die Konjunktion eine t-Norm ist. And ere Beispiele fiir t-Normen sind
+ (3 -
Lukasiewicz-t-Norm:
t(a , (3) = max{ a
algebraisches Produkt:
t( a , (3) = a . (3
drastisches Produkt:
t(a, (3) = { min{a , (3} sonst
0
1, O} falls 1 tt {a , (3}
Diese wenigen Beispiele zeigen schon , dass das Spektrum der t-Normen sehr breit ist . Die Grenzcn werden durch das drastisehe Produkt , das die kleinste t-Norm darstellt und auBerdem unstetig ist , und das Minimum, das die groBte t-Norm ist , vorgegeben . Das Minimum hebt sich noeh dureh eine weitere wichtige Eigensehaft von den and eren t-Normen ab o Das Minimum ist die einzige idempotente t-Norm, d.h., dass allein fiir das Minimum die Eigensehaft t(a , a) = a fur alle a E [0,1] erfiillt ist. Nur die Idempotenz einer t-Normen gar antiert, dass die Wahrheitswerte der Aussagen sp und ip /\
16
1.
Grundlagen der Fuzzy-Systeme Aussage Der Preis ftir Hau s Die Lage von Haus Der Preis fti r Hau s Die Lage von Hau s
Wah rheitswert A ist gilnstig. A ist gut. B ist gilnst ig. B ist gut.
[ip i]
0.9
0.6 0.6 0.6
Die Wahl fall t auf das Hau s x E {A , B} , ftir das die Aussage "Der Preis fiir Hau s x ist gilnstig UND die Lage von Hau s x ist gut" den graBeren Wahrheitswert ergibt, d.h., der Kaufer entscheidet sich fur Haus A , falls [ip I 1\ ip2] > [ip3 1\ ip4 ] gilt, im umgekehrten Fall fu r das Hau s B . Wird der Wahrheitswert der Konjunktion mit Hilfe des Minimums besti mmt , erhalte n wir in beiden F allen den Wert 0.6, so dass die beiden Hau ser als gleichwert ig anzusehen war en. Dies widerspricht aber der Tatsache, dass zwar die Lage der beiden Hauser gleich bewert et wurde, Haus A jedoch fur einen gilnstigeren Preis zu erwerb en ist . Wahl t man als Wahrheitswertfunktion fur die Konjunktion eine nicht-idemp ot ent e t- Norm wie beispielsweise das algebraische Produkt oder die Lukasiewicz t- Norm, so wird in jedem Fall das Haus A vorgezogen . Nebe n den hier erwahnten Beispielen fiir t-Normen gibt es zahlreiche weite re . Insbesond ere lassen sich mit Hilfe eines frei wahlbaren Par am et ers ganze Familien von t-Normen definieren , etwa die Web er-Familie
t>.(o:,{3)
=
max {
0: + {3 - 1 + )..0:{3 1 +)..
,0
}
die fur jedes ).. E (- 1,00) eine t-Norm festlegt . Filr ).. = 0 ergibt sich die Lukasiewicz-t- Norm . Da in pr aktischen Anwendungen neben dem Minimum meist nur noch das algebrais che Produkt und die Lukasiewicz-t- Norm auftreten, verzichten wir an dieser Stelle auf die Vorst ellun g weit erer Beispiele flir t-Normen. Ein e ausflihrlichere Behandlung der t-N ormen findet man beispielsweise in [26 , 97]. Analog zu den t-Norme n, die mogliche Wahrheitswertfunktionen ftir die Konjunktion reprasen t ier en , werd en die Kandidaten fiir Wahrheitsfunk tion en der Disjunktion definiert . Wie die t-Normen sollt en sie die Eigenschaft en (T1) - (T3) erfiillen. Anstelle von (T4) fordert man allerdings (T4 ') t(o: ,O) =
(X ,
d .h., dass sich durch disjunktives Hinzufligen einer falschen Aussage 'l/J zu einer anderen Aussage ip der Wahrheitswert nicht andert, dass also der Wahrheitswert von ip mit dem von ip V 1/J ilbereinstimmt .
IF
Definition 1.5 Ein e Funktion s : [0, --+ [0,1] heiflt t-Conorm (triang uliu» Conorm), wenn sie die Axiome (T 1) - (T 3) un d (T 4') erfiiilt. Zwischen t-Normen und t-Co normen besteht ein dualer Zusammenh ang: J ede t-No rm t ind uziert eine t-Conorm s mittels
1.3 Fuzzy-Logik 8(0:,(3)
=
1-t(1-0:,1-(3),
17
(1.2)
genau wie man umgekehrt aus einer t-Conorm s durch
t(o:,(3) = 1 -8(1-0:,1-(3) ,
(1.3)
die entsprechende t-Norm zuruckerhalt, Die Gleichungen (1.2) und (1.3) korrespondieren mit den DeMorganschen Gesetzen
wenn man die Negation durch die Wahrheitswertfunktion [.ip] = 1 - [ip] berechnet. Die t-Conormen, die man aufgrund der Formel (1.2) aus den t-Norrnen Minimum, Lukasiewicz-t-Norrn, algebraisches und drastisches Produkt erhalt, sind
Maximum :
8(0:, (3) = max{ 0:, (3}
Lukasiewicz-t-Conorm:
8(0:,(3) = min{o: + (3, I}
algebraische Summe:
8(0:, (3) = 0: + (3 - 0:(3
drastisch e Summe:
8(0:,(3) =
{~ax{O:,(3}
falls 0 (j. {o, (3} sonst.
Dual zu den t-Normen ist die drastische Summe die grofite , das Maximum die kleinste t-Conorm. AuBerdem ist das Maximum die einzige idempotente t-Cononn. Wie bei den t-Normen lassen sich parametrische Familien von tConormen definieren.
bilden beispielsweise die Weber-Familie der t-Conormen . Beim Rechnen mit t-Normen und t-Conormen sollte man sich bewusst sein, dass nicht unbedingt alle Gesetze, die man fur die Konjunktion und die Disjunktion kennt, auch fiir t-Normen und t-Conormen gelten. So sind Minimum und Maximum nicht nur die einzigen idempotenten t-Normen bzw. t-Conorrnen, sondern auch das einzige uber die Dualitiit (1.2) definierte Paar, das die Distributivgesetze erfullt . Wir hatten im Beispiel des Hauskaufs gesehen , dass die Idempotenz einer t-Norm nicht immer wtinschenswert ist . Das gleiche gilt fur t-Conormen. Betrachten wir die Aussagen ipl , . .. , ipn , die konjunktiv oder disjunktiv verkniipft werden sollen. Der entscheidende Nachteil der Idempotenz ist, dass bei der Konjunktion mittels des Minimums der sich ergebende Wahrheitswert der Verkntipfung der Aussagen allein vom Wahrheitswert der Aussage abhiingt, der der kleinste Wahrheitswert zugeordnet ist . Entsprechend bestimmt bei der Disjunktion im Sinne des Maximums nur die Aussage mit dem graBten
18
1.
Grundlagen der Fuzzy-Systeme
Wahrheitswert den Wahrheitswert der verkniipften Aussage. Durch den Verzicht auf die Idempotenz wird dieser Nachteil vermieden. Ein anderer Ansatz besteht in der Verwendung kompensatorischer Operatoren , die einen Komprom iss zwischen Konjunktion und Disjunktion darstellen. Ein Beispiel fur einen kompensatorischen Operator ist der Gamma-Operator [214]
Dabei ist , E [0, 1] ein frei wahlbarer Parameter. Fur , = 0 ergibt der Gamma-Operator das algebraische Produkt, fiir , = 1 die algebraische Summe. Ein anderer kompensatorischer Operator ist das arithmetische Mittel. Weitere Vorschlage fur derartige Operatoren findet man z.B. in [117]. Ein groBer Nachteil dieser Operatoren besteht in der Verletzung der Assoziativitat. Wir werden diese Operatoren daher nicht weiter verwenden . A.hnlich wie zwischen t-Norrnen und t-Conormen ein Zusammenhang besteht, lassen sich auch Verbindungen zwischen t-Normen und Implikationen herstellen. Eine stetige t-Norm t induziert die residuierte lmpliketion t durch die Formel t(a , (3) = supb E [0,1] I t(a, ,) < (3}. Auf diese Weise erhalt man durch Residuierung die Lukasiewicz-Implikation aus der Lukasiewicz-t-Norm und die Codel-Implikation aus dem Minimum. Spater werden wir noch die zugehorige BiimplikatioIJ t benotigen, die durch die Formel t(a ,(3) = t ( max{a , (3}, min{a, (3})
(1.4)
= t(t(a ,(3), t((3,a)) = min{ t(a,(3), t((3 ,a)} festgelegt ist. Motiviert ist diese Formel durch die Definition der Biimplikation oder A.quivalenz in der klassischen Logik mittels
Neben den logischen Verkniipfungen wie der Konjunktion, der Disjunktion, der Implikation oder der Negation spielen in der (Fuzzy-)Logik noch die Quantoren V (fur alle) und :J (es existiert ein) eine wichtige Rolle. Es ist naheliegend, den Quantoren Wahrheitswertfunktionen zuzuordnen, die an die Wahrheitswertfunktion der Konjunktion bzw. der Disjunktion angelehnt sind . Wir betrachten die Grundmenge X und das Pradikat P(x). X konnte beispielsweise die Menge {2, 4, 6, 8, 10} sein und P(x) das Pradikat "x ist eine gerade Zahl." 1st die Menge X endlich , etwa X = {Xl, ... , X n }, so ist offenbar die Aussage (Vx E X)(P(x)) aquivalent zu der Aussage P( xd 1\ . . . 1\ P(x n ) . Es ist daher in diesem Fall moglich, den Wahrheitswert der Aussage (Vx E X)(P(x)) tiber die Konjunktion zu definieren, d.h.
1.3 Fuzzy-Logik
19
[(\fx E X)(P(x)) ] = [P (xd /\ . .. /\ P( x n )] . Ordnet man der Konjunktion das Minimum als Wahrheitswertfunktion zu, ergibt sich [(\fx E X)(P( x))] = min{[P(x )] I x EX} , was problemlos mittels
[(\fx E X)(P( x))]
=
inf {[P( x)] I x EX} ,
auch au f unendliche Grundmengen X erwcite rbar ist . Andere t-Norrnen als das Minimum werd en i.a . nicht fur den Allqu antor herangezogen, da sich bei einer nicht-idempotenten t- Norm bei un endlicher Grundmenge sehr leicht der Wahrheit swert 0 ftir eine Aussage mit einem Allquantor ergebe n kann . Analoge Uberlegungen fur den Existenzquan tor, fur den bei einer endlichen Grundmenge die Aussagen (:Jx E X)(P( x)) und P(xd V . . . V P(x n ) aquivalent sind, fuhren zu der Definition
[(:Jx E X) (P( x))]
= sup{[ P (x) ] I x EX} .
Als Beispiel betrachten wir das P radikat P( x) , mit der Interpret ation " x ist eine hoh e Geschwindigkeit ". Der Wahrheit swcrt [P (x )] sei durch die Fuzzy-Menge der hoh en Geschwindigkeiten aus Abb . 1.2 auf Seit e 3 gegebe n, d.h . [P( x)] = J-Lhc( X) . Somit gilt beispielsweise [P (150)] = 0, [P (170)] = 0.5 und [P(190) ] = 1. Die Aussage (\fx E [170,200])(P( x)) ("AUe Geschwindigkeit en zwischen 170 km /h und 200 km /h sind hoh e Geschwind igkeit en ") besit zt somit den Wahrheit swert
[(\fx E [170, 200]) (P( x))] = inf {[P( x)] I x E [170, 200]} = inf{J-Lhc( X) I x E [170,200]}
= 0.5. An alog erhalt man [(:Jx E [100, 180]) (P (x))]
0.75.
1.3.3 Voraussetzungen und Probleme Wir hab en in diesem Abschni t t tiber Fuzzy-Logik verschiedene Moglichkeit en untersucht , wie uns char fe Aussagen verkniipft werden konn en, Eine wesent liche Grundannahme, die wir dab ei get roffen hab en , ist , dass wir Wahrheitsfunktion alitiit vorau sset zen du rfen, Das bedeutet , dass der Wahrheit swert der Verkntipfung meh rer er Aussagen allein von den Wahrheitswerten der einzelnen Aussagen , abe r nicht von den Aussagen selbst abhiingt . In der klassischen Logik gilt diese Ann ahme. Ein Beispiel, wo sie nicht gilt, ist die Wahrscheinlichkeitstheorie bzw. die probabilistis che Logik. In der Wahrscheinlichkeitstheorie reicht es nicht aus , die Wahrscheinlichkeit zweier Er eignisse zu kennen ,
20
1. Grundlagen der Fuzzy-Systeme
urn die Wahrscheinlichkeiten dafiir zu bestimmen, ob beide Ereignisse gleichzeitig eintreten oder mindestens eines der beiden Ereignisse eintritt. Hierzu beni.itigt man zusatzlich die Information, inwieweit die beiden Ereignisse abhangig sind . 1m Falle der Unabhangigkeit etwa ist die Wahrscheinlichkeit fur das Eintreten beider Ereignisse das Produkt der Einzelwahrscheinlichkeiten und die Wahrscheinlichkeit daftir, dass mindestens eines der beiden Ereignisse eintritt, die Summe der Einzelwahrscheinlichkeiten. Ohne zu wissen, ob die Ereignisse unabhangig sind, lassen sich diese Wahrscheinlichkeiten nicht angeb en. Man sollte sich der Voraussetzung der Wahrheitsfunktionalitat im Rahmen der Fuzzy-Logik bewusst sein. Sie ist durchaus nicht immer erftillt . Mit dem Beispiel des Hauskaufs haben wir die Verwendung nicht-idernpotenter t-Normen motiviert. Werden diese t-Normen wie z.B. das algebraische Produkt dann auch auf solche Aussagen wie "Der Preis ftir Haus A ist gtinstig UND .. . UND der Preis ftir Haus A ist gtinstig" angewandt , so kann diese Aussage einen beliebig kleinen Wahrheitswert erhalten, wenn nur gentigend viele Konjunktionen auftreten. Je nachdem, wie man die Konjunktion interpretiert, kann dieser Effekt widersprtichlich oder wimschenswert sein. Versteht man die Konjunktion eher im klassischen Sinne, so sollte die konjunktive Verknupfung einer Aussage mit sich selbst zu sich selbst aquivalent sein, was bei nicht-idempotenten t-Normen nicht gegeben ist . Eine andere Interpretation sieht die Konjunktion eher als Auflistung von Argumenten fur oder gegen eine These oder in einem Beweis. Die mehrfache Verwendung desselben (unscharfen) Arguments innerhalb eines Beweises fuhrt dazu , dass der Beweis weniger glaubwtirdig wird und so Idempotenz selbst bei der Konjunktion einer Aussage mit sich selbst nicht erwunscht ist. Fur die Fuzzy-Regelung haben diese Uberlegungen glticklicherweise nur eine geringe Bedeutung, da dort die Fuzzy-Logik in einem sehr begrenzten Kontext verwendet wird: Schwierigkeiten ergeben sich eher bei dem Einsatz der Fuzzy-Logik in komplexeren Expertensystemen.
1.4 Operationen auf Fuzzy-Mengen In den Abschnitten 1.1 und 1.2 haben wir Fuzzy-Mengen zur Modellierung vager Konzepte und Reprasentationsformen fur Fuzzy-Mengen kennengelernt. Urn mit Hilfe yager Konzepte operieren oder schlussfolgern zu konnen, benotigen wir geeignete Verkntipfungen fur Fuzzy-Mengen. Wir werden daher in diesem Abschnitt aus der gewi.ihnlichen Mengenlehre bekannte Operationen wie Vereinigung , Durchschnitt oder Komplementbildung auf Fuzzy-Mengen erweitern.
1.4 Operationen auf Fuzzy-Mengen
21
1.4.1 Durchschnitt Die Vorgehensweise, wie die Mengenoperationen ftir Fuzzy-M engen definiert werden, erlautern wir ausfiihrlich am Beispiel des Durchschnit ts . Ftir zwei gewohnliche Mengen .kh und M 2 gilt, dass ein Element x genau dann zum Durchschnitt der beiden Mengen gehort , wenn es sowohl zu M; als auch zu kh gehort. Ob x zum Durchschnitt gehort , hangt also allein von der Zugehorigkeit von x zu M 1 und M 2 ab , aber nicht von der Zugehorigkeit eines anderen Elementes y =I x zu M 1 und M 2 . Formal ausgedrlickt bedeutet dies (1.5) Fur zwei Fuzzy-Mengen J-tl und J-t2 gehen wir ebenfalls davon aus, dass der Zugehorigkeitsgrad eines Elementes x zum Durchschnitt der beiden FUzzyMengen allein von den ZugehOrigkeitsgraden von x zu J-tl und J-t2 abhangt. Den ZugehOrigkeitsgrad J-t(x) eines Elementes x zur Fuzzy-Menge J-t interpretieren wir als Wahrheitswert [x E III der unscharfen Aussage "x E J-t" , dass x ein Element von J-t ist. Urn den ZugehOrigkeitsgrad eines Element es x zum Durchs chnitt der Fuzzy-Mengen J-tl und J-t2 zu bestimmen , mtissen wir daher in Anlehnung an die Aquivalenz (1.5) den Wahrheitswert der Konjunktion "x ist Element von J-tl UND x ist Element von J-t2 " berechnen. Wie man den Wahrheitswer t der Konjunktion zweier unscharfer Aussagen definiert , hab en wir im vorhergehenden Abschnitt tiber Fuzzy-Logik kennengelernt . Dazu ist es notwendig , eine t-Norm t als Wahrheitswertfunktion fur die Konjunktion zu wahlen, Wir definieren daher den Durchs chnitt zweier Fuzzy-Mengen J-tl und J-t2 (bzgl. der t-Norm t) als die Fuzzy-Menge J-t l n t J-t2 mit
Int erpretieren wir den Zugehorigkeitsgrad J-t(x) eines Element es x zur FuzzyMenge J-t als Wahrheitswert [x E J-t] der unscharfen Aussage "x E J-t" , dass x ein Element von 11, ist , liisst sich die Definition fiir den Durchs chnitt zweier Fuzzy-Mengen auch in der Form
schreiben, wobei der Konjunktion als Wahrheitswertfunktion die t-Norm t zugeordnet wird . Durch die Definition des Dur chschnitts von Fuzzy-Mengen mit Hilfe einer t-Norm iibertragen sich die Eigenschaften der t-Norm auf den Durchschnittsoperator: die Axiome (T'l ) und (T2) sorgen dafiir , dass die Durchschnittsbildung fur Fuzzy-Mengen kornmut ativ and assoziati v ist. Die Monotonieeigenschaft (T3 ) garantiert , dass dur ch Austauschen einer Fuzzy-Menge J-tl dur ch eine Fuzzy-Ob ermenge Il2, d.h. , J-t1( X) :::: J-t2 (X) fur alle x , bei der Durchschnittsbildung mit einer Fuzzy-Mange J-t sich der Dur chschnitt nicht verkleinern kann:
22
1. Grundlagen der Fuzzy-Systeme
Aus der Ford eru ng (T4) fur t-Norrnen erha lte n wir, dass der Durchschni tt einer Fuzzy-Menge mit einer scha rfen Menge bzw. der cha ra kte rist ischen Funkt ion der scharfen Menge wieder die ur spriingliche Fuzzy-Menge eingeschrankt auf die Menge, mit der geschnitten wird, ergibt. Ist M ~ X eine gewohnliche Teilmenge von X und f.l E F (X ) eine Fuzzy-Menge von X , so folgt
( n I )( ) f.l
t
M
=
X
{lAx) 0
falls x E M sonst.
Ublicherweise wird bei der Durchschnittsbildung von Fuzzy-Mengen da s Minimum als t-Norm zugrundegelegt , sofern nicht explizit darauf hingewiesen wird, dass eine andere t-N orm verwend et wird. Wir schreiben dah er /11 n f.l2 st att f.ll nt f.l2 im Fall t = min. 1
10 20
140 150 160 170 180 190 200
Abb. 1.12. Die Fuzzy-Menge jL170 - 19 0 der Geschwindigkeiten, die nicht wesentlich kleiner als 170 km/h und nicht viel grofer als 190 km/h sind Wir betrachten den Durchschni tt der Fuzzy-Menge /1hG der hohen Geschwindigkeite n aus Abb . 1.2 auf Seite 3 mit der in Abb . 1.12 dargest ellten Fuzzy-Menge f.l170- 190 der Geschwindi gkeiten , die nicht wesentli ch kleiner als 170 km /h und nicht viel grofler als 190 km /h sind . Beide Fuzzy-Mengen sind Tr ap ezfunk tionen: IthG
= II150 ,180 ,oo ,oo ,
/1170- 190
= II160,170 ,190 ,200 .
Abb . 1.13 zeigt den Durchschnitt der beiden Fuzzy-Mengen auf der Basis des Minimums (durchgezogene Linie) und der Lukasiewicz-t-N orm (gestrichelte Linie). 1.4.2 Vereinigung Ga nz analog wie wir aus der Repriisentation (1.5) die Definition des Durchschn itts zweier Fuzzy-Menge abgeleitet hab en , lasst sich auf der Basis von
1.4 Operationen auf Fuzzy-Mengen
10 20
23
140 150 160 170 180 190 200
Abb. 1.13. Der Durchschnitt
Il h C n t1l 170 - 190 der Fuzzy-Mengen IlhC und 1l 170 -190 , berechnet mit dem Minimum (durchgezogene Linie) und der Lukasiewicz-t-Norm (gestrichelte Linie)
die Vereinigung zweier Fuzzy-M engen festlegen. Es ergibt sich
als Vereinigung der beiden Fuzzy-Mengen III und 112 bzgl. der t-Conorm s . In der Interpret ation des ZugehOrigkeitsgrades JL(x) eines Element es x zur Fuzz y-M enge JL als Wahrheitswert Ix E JL] der unscharfen Aussage " x E JL" , dass x ein Element von 11 ist , lasst sich die Definition ftir die Vereinigun g au ch in der Form
wiedergeben , wobei der Disjunktion als Wahrheitswertfunktion die t-Conorrn s zugeordnet wird . Die am haufigst en verwend et e t-Conorrn als Grundlage fur die Vereinigung von Fuzzy-Mengen ist das Maximum. Im Fall t = max verwend en wir daher auch die Abkiirzung III U JL2 fur JLl Us JL2. 1.4.3 Komplement
Das Kompl ement einer Fuzzy-Menge wird au s der Form el
-,( x E 114) fur gewohnliche Mengen abg eleit et, in der 114 ftir das Komplement der (gewohnlichen) Menge 114 steht. Ordnen wir der Negation die Wahrheitswertfunktion w~ ( o:) = 1- 0: zu, erhalte n wir als Kompl ement Ji der Fuzzy-Menge Il die Fuzzy-Menge JL l (X) = 1 - JL (x), was gleichbedeutend ist mit
[z E
Jil
= [-,(x E JL )].
Die Abb . 1.14 verans chaulicht die Durchschnitts-, Vereinigungs- und Komplementbildung fiir Fuzzy-M engen.
24
1.
Grundlagen der Fuzzy-Systeme
1
1
ji,l
n ji, 2 " .
1
1
+-- - ,
Abb. 1.14. Durchschnitt , Vereinigung und Komplement fur Fuzzy-Mengen Die Komplementbildung fiir Fuzzy-Mengen ist zwar wie das Komplement fur gewohnliche Mengen involutorisch, d.h., es gilt 11 = ft . J edoch sind die Gesetze ftir klassische Mengen, dass der Durchschnit t einer Menge mit ihrem Kompl ement die leere, die Vereinigung mit ihrem Komp lement die Grundmenge ergibt, abgeschwiicht zu (J.l n Ji) (x) ::; 0.5 und (J.l U Ji)(x) ~ 0.5 fur aile x aus der Grundmenge. In Abb . 1.15 ist dieser Sachverh alt noch einmal verd eutli cht. Werd en der Dur chschnitt und die Vereinigun g auf der Grundlage des Minimums bzw. des Maximums definiert, kann man auf die im Abschnitt 1.2 eingefiihrte Repr iisentation von Fuzzy-Mengen durch die Niveaumengen zuriickgreifen . Es gilt
1.4 Operat ionen auf Fuzzy-Mengen
1.0
25
.
0.5
1.0+------. JL UJi
0.5
1.0
.
0.5
Abb. 1.15. Vereinigung und Durchschnitt einer Fuzzy-Menge mit ihrem Komple-
ment fur aile a E [0,1] . Die Niveaumengen des Durchschnitts und der Vereinigung zweier Fuzzy-Mengen ergeben sich nach diesen beiden Gleichun gen als Durchschnitt bzw. Vereinigung der Niveaumengen der einzelnen Fuzzy-Mengen.
1.4.4 Linguistische Modifizierer Neben dem Komplement als einste llige Op eration auf Fuzzy-Mengen, die aus der entsprechenden Op eration fiir gewohnliche Mengen hervorgegangen ist , gibt es noch weitere Fuzzy-Mengen-spezifische einstellige Op erationen , die fur gewohnliche Mengen nicht sinnvoll sind. Eine Fuzzy-M enge reprasentiert i.a . ein vages Konzept wie "hohe Geschwindigkeit", "jung" oder "grof". Aus solchen Konzepten lassen sich weit ere vage Konz epte mit Hilfe linguistischer Modiii zierer ("linguisti c hedges") wie "sehr" oder "mehr oder weniger " herleit en. Wir betracht en als Beispiel die Fuzzy-Menge J.1hG der hohen Geschwindigkeit en aus Abb . 1.2 auf Seit e 3. Wie sollte die Fuzzy-M enge J.1 shG auss ehen , die das Konzept der "sehr hohen Geschwindigk eiten" repr asentiert? Da eine sehr hohe Geschwindi gkeit sicherlich auch als hohe Geschwindi gkeit bezeichnet werd en kann , aber nicht unb edin gt umgekehrt , sollte der Zugehorigkeitsgrad einer spezifischen Geschwindi gkeit v zur Fuzzy-Menge J.1 sh G La. niedriger
26
1. Grundlagen der Fuzzy-Syst eme
sein als zur Fuzzy-Menge J.lhC . Dies erreic ht man , ind em man den linguistischen Modifizierer "sehr" ahnlich wie die Negat ion als einste lligen logischen Op erator verst eht und ihm eine geeignet e Wahrheitswertfunktion zuordnet , beispielsweise Wse hr (a ) = a 2, so da ss sich J.lshC( X) = (J.lhC( X) )2 ergibt . Damit ist eine Geschwindigkeit , die zum Gr ad 1 eine hohe Geschwindigkeit ist , au ch eine sehr hohe Geschwindi gkeit . Ein e Geschwindigkeit , die keine hohe Geschwindi gkeit ist (Zugehorigkeit sgrad 0) , ist genauso wenig eine sehr hohe Geschwindigkeit . Liegt der Zugehori gkeits grad einer Geschwindi gkeit zu JLhG echt zwischen 0 und 1, so ist sie ebe nfalls eine sehr hohe Geschwindi gkeit , allerdings mit einem geringeren ZugehOrigkeit sgrad. Analog ordnet man dem linguistischen Modifizierer "mehr oder weniger" eine Wahrheitswertfunk tion zu, die eine Vergroferung des Wahrheitswertes bzw . Zugehori gkeitsgrades ergibt, beispielsweise Wmehr oder we niger (a) = Abb . 1.16 zeigt die Fuzzy-Menge J.lhC der hohen Geschwindi gkeit en und die sich daraus ergebenden Fuzzy-Menge n J.lshC der sehr hohen Geschwindi gkeit en und J.lmhG der mehr oder weniger hohen Geschwindi gkeit en.
va·
1
10
20
140 150 160 170 180 190 200
Abb. 1.16. Die Fuzzy-Mengen uso , J-tsh G und meh r oder weniger hohen Geschwind igkeiten
J-tm h G
der hohen , sehr hohe n und
1.5 Das Extensionsprinzip 1m vorh ergehend en Abschnitt hab en wir die Erweit erung der mengentheoret ischen Operationen Durchschnitt, Vereinigun g und Komplement auf FuzzyMengen kenn engelernt. W ir wenden uns jet zt der Frage zu, wie man gewohnliche Abbildungen ftir Fuzzy-Mengen verallgemeinern kann. Die Antwort ermoglicht es, Operationen wie das Qu adrieren , die Addition, Subtraktion , Multiplikation und Division , aber au ch mengentheoreti sche Begriffe wie die Hintereinanderschaltung von Relationen fur Fuzzy-Mengen zu definieren .
1.5 Das Extensionsprinzip
27
1. 5.1 Abbildungen vo n Fuzzy- M engen Wir betr achten als Beispiel die Abb ildun g j : JR ---t JR, x f--t [z], Die in Abb. 1.17 dar gest ellt e Fuzzy-Menge f.l = A - 1.5,-O.5,2.5 ste ht fur das vage Konzept "ca. - 0.5".
-1.5
-0.5 0
2.5
Abb. 1.17. Die Fuzzy-Menge /-L
= A_1.5 , - O.5 ,1.5 , die fur "ca. - 0.5" steht
Dur ch welche Fuzzy-Menge sollte "der Betrag von ca. - 0.5" repr asent iert werd en , d.h ., was ist das Bild j [f.l] der Fuzzy-Menge f.l? Fur cine gewohnliche Teilmenge M einer Grundmenge X ist das Bild j[M] unt er der Abbildung j : X ---t Y definiert als die Teilmenge von Y, deren Elemente Urbilder in M besit zen . Formal heiBt das
j[M]
=
{y E Y I (3x E X )(x E M /\ j (x ) = y)} ,
oder anders ausgedriickt
y Ej[M ]
(3x E X )(x E M /\ j (x ) = y).
(1.6)
Beispielsweise ergibt sich fiir M = [- 1, 0.5] ~ JR und die Abbi ldun g j (x ) = Ixl die Menge j [M] = [0,1 ] als Bild von M unter f . Die Beziehung (1.6) errnoglicht uns, das Bild einer Fuzzy-Menge f.l unter cincr Abbildung f zu dcfinicren. Wic im vorh ergchcnd en Abschnitt bei der Erweiteru ng mengentheoretischer Op eratio nen auf Fuzzy-Mengen greifen wir hier auf die im Abschnitt 1.3 vorgest ellten Konzepte der Fuzzy-Logik zuriick. Fu r Fuzzy-Mcngcn bcdcutct (1.6)
[y E f [f.lll = [(3x
E
X)( x
E
u r; f (x)
= y)].
Dab ei ist der Exist enzquantor wie in Abschnit t 1.3 erlautert mit Hilfe des Supremums auszuwerten und der Konjunktion eine t-Norrn t zuzuordnen , so dass sich die Fuzzy-Menge
j[f.ll(y) = sup {t (f.l( x), [j (x) = y)]) I x E X }
(1.7)
als Bild von f.l unter f ergibt. Die Wahl der t-Norrn t spielt in diesem Fall keine Rolle, da die Aussage f (x) = y entweder wahr odcr falsch ist , d.h. If(x) = y] E {O, I }, so dass
28
1. Grundlagen der Fuzzy-Systeme
t (JL(x), [f (x ) = y )]) = {JLo(X) falls f (x ) = y
sonst
folgt. Dam it vereinfacht sich (1.7) zu
f[JL](Y) = sup {JL(x ) I f (x ) = y} .
(1.8)
Diese Definition besagt , dass der Zugehorigkeitsgrad eines Elementes y E Y zum Bild der Fuzzy-Menge JL E F (X ) unt er der Abb ildung f : X --> Y der grofitmogliche ZugehOrigkeitsgrad aller Urbilder von y zu JL ist . Man bezeichnet diese Art der Er weiterung einer Abbildung auf Fuzzy-Mengen als Ex tensionsprinzip (fur eine Funktion mit einem Argum ent) . Fur das Beispiel der Fuzzy-Menge JL = A_1. 5 ,- O.5 ,2 .5 die fur das vage Konzept "ca. -0.5" steht, ergibt sich als Bild unter der Abbildung f( x) = Ixl die in Abb . 1.18 dar gest ellte Fuzzy-Menge . W ir bestimmen im folgenden exemplarisch den ZugehOrigkeitsgrad f[JL](Y) fur y E {-0.5, 0, 0.5,1}. Da wegen f( x) = Ixl 2:: a der Wert y = - 0.5 kein Urbild unt er f besit zt , erhalte n hat als einziges Urbild x = 0, so dass f[JLJ(O) = wir f[JL]( -0.5) = O. y = JL (O ) = 5/6 folgt . Ftir y = 0.5 existieren die beiden Urbilder x = -0.5 und x = 0.5, so dass sich
°
f[JL ](0.5) = max{JL(-0.5), JL (0.5)} = max{I ,2/3} = 1 ergibt. Die beiden Urb ilder von y = 1 sind x = -1 und x = 1. Somit erhalte n wir f[JL]( I) = maxVt( -I ),JL( I)} = max{0.5, 0.5} = 0.5.
- 1.5
-0.5 0 0.5 1
2.5
Abb. 1.18. Die Fuzzy-Menge, die fur das vage Konzept "der Betr ag von ca. - 0.5"
steht Beispiel 1.6 Es sei
X = Xl X .. . X
X n , i E {I , ... , n }. Wir bezeichnen mit
die Projekt ion aus dem kartesischen Produkt Xl x ... X X n in den i-ten Koordinatenraum Xi ' Die Projektion einer Fuzzy-Menge JL E F (X ) in den Raum Xi ist nach dem Extensions pri nzip (1.8) 7f;[J.tJ(x)
= sup] JL(XI, . .. , Xi - I , x , Xi + l, ... , x n ) I X l E Xl , ... , Xi - l E X i- I , Xi+1 E X i+l ,'" , X n E
Xn }.
1.5 Das Extensionsprinzip
29
Abb . 1.19 zeigt die Projektion einer Fuzzy-Menge, die in zwei verschiedenen Bereichen Zugehorigkeitsgrade grofe r als 0 annimmt. 0
1
Abb. 1.19. Die Projektion einer Fuzzy-Menge in den Raum X 2
1.5.2 Abbildungen von N iveaumengen Der Zugehorigkeitsgrad eines Elementes zum Bild einer Fuzzy-Menge lasst sich dur ch die Bestimmung der Zugehorigkeits grade der Urbilder des Elementes zur ursprilnglichen Fuzzy-Menge berechnen. Eine andere Moglichkeit , das Bild einer Fuzzy-Menge zu charakterisieren, besteht in der Angab e ihrer Niveaum engen. Leider kann die Niveaum enge des Bildes einer Fuzzy-Menge i.a. nicht direkt aus der ents prechenden Niveaumenge der ursprilnglichen Fuzzy-Menge bestimmt werden. Es gilt zwar die Beziehun g [f[fllL, 2 f [[fl]a]. Die Gleichheit ist jedoch nicht zwingend . Beispielsweise erhalte n wir fiir die Fuzzy-Menge fl( X) = fallsO ~ x~l o sonst
{x
als Bild unt er der Abbildung
f (x ) = I{ l}( X) = die Fuzzy-Menge
f[ fl ]() y
=
{Io
falls x sonst
=1
{I
falls yE{O,l} 0 sonst .
Dami t folgt [f[flJ] 1 = {O, I} und f [[flh] = {I} wegen [flh = {I} . Dieser unangenehme Effekt , dass das Bild einer Niveaumenge echt in der ents prechenden Niveaumenge der Bild-Fuzzy-Menge ent halten ist , kann , sofern die Grundmenge X = IR aus den reellen Zahlen besteht , nicht auftreten, wenn die Abbildung f stetig ist und filr aile a > 0 die o-Niveaumenge n
30
1. Grundlagen der Fuzzy-Systeme
der betrachtet en Fuzzy-Menge kompakt sind. In diesem Falle ist daher eine Charakteris ierung der Bild-Fuzzy-Menge tiber die Niveaumengen moglich. Beispiel 1.7 Wir betrachten die Abbildung f : lR einer Fuzzy-Menge f.L E F(lR) ist offenbar dureh
f[f.L ]() y
-t
lR, x
f---+
x 2 • Das Bild
= {max{f.L(VY) ,f.L( - vyn fallsy 20
0
sonst
gegeben. Die Fuzzy-Menge f.L = AO,I,2 reprase ntiere das vage Konzept "ca . 1" . Wir beantworten die Frage, was "ca. 1 zum Quadrat " ist , indem wir die Niveaumengen der Bild-Fuzzy-Menge f[f.Ll aus den Niveaumengen von f.L bestimmen. Dies ist hier moglich, da die Funk tion fund die Fuzzy-Menge f.L stetig sind. Offenbar gilt [f.L] o = [a ,2 - a] fur alle 0 < a :::; 1. Daraus folgt
Die Fuzzy-Mengen f.L und f[f.L] sind in Abb. 1.20 zu sehen. Es zeigt sieh, dass das vage Konzept "ca. 1 zum Quadrat " nicht mit dem vagen Konzept "ca. 1" iibereinstimmt. Die "Vagheit" vergrofiert sich bei "ca. 1 zum Quadrat" gegentiber "ca . 1" , ahnlich wie sieh Fehler bei Bereehnun gen fortpfl anzen. 0 1
1
2
3
4
Abb. 1.20. Die Fuzzy-Mengen f.L und f[f.L] ftir das vage Konzept "ca. 1" bzw. "ca. 1 zum Qu adr at "
1.5.3 Kartesisches Produkt und zylindrische Erweiterung Bisher hab en wir nur Abbildungen mit einem Argument auf Fuzzy-Mengen erweitert . Urn Operationen wie die Addition fur Fuzzy-Mengen tiber den reellen Zahlen zu definieren, benotigen wir ein Konzept , wie man eine Abbildun g f : Xl X . .. X X n - t Y auf ein Tup el (f.LI , " . , f.Ln) E F(Xd x . .. x F(Xn ) von Fuzzy-Mengen anwendet . Da wir die Addit ion als Funktion mit zwei Argument en f : lR x lR - t lR, ( X l , X2) f---+ X l + X 2 auffassen konnen , lieBe sich damit die Addition von Fuzzy-Mengen tiber den reellen Zahlen einfiihren. Urn das in Gleiehung (1.8) besehriebene Exte nsionsprinzip auf Abbildungen mit mehreren Argumenten zu verallgemeinern , fuhren wir den Begriff des kart esischen Produkts von Fuzzy-Mengen ein. Gegeben seien die FuzzyMengen f.Li E F(Xi ) , i = 1, . . . , n . Das kartesische Produkt der Fuzzy-Mengen f.LI , · · · , f.Ln ist die Fuzzy-Menge
1.5 Das Extensionsprinzip
/11
X ... X
/1n E F (X I
X ... X
31
Xn )
mit (/11 x . . . X /1n)( XI , . . . ,X n ) = min{/1I (x r) "" ,/1n(x n )} .
Diese Definition ist durch die Eigenschaft Xl
E
!vII 1\ .. . 1\ X n E
1v[n
des kartesischen P rodukts gewohnlicher Mengen moti viert und entspricht der Form el
wobei der Konjunkt ion das Minimum als Wahrheit swertfu nkt ion zugeor dnet wird. Ein Spezialfall eines kartesischen Produkts ist die zylindrische Erweiterung einer Fuzzy-Menge /1 E F(X;) auf den P rodukt raum X l X ... X X n . Die zylindrische Erw eiterung ist das kart esische P rodu kt von /1 mit den rest lichen Grundmengen X j , j -I i, bzw. deren charakte rist ischen Funkti onen:
Offenb ar ergibt die P roj ekt ion einer zylindrischen Erw eiteru ng wieder die urspriingliche Fuzzy-Menge, d .h. 71"; [iri (/1)] = /1, sofern die Mengen Xl , ' .. , X n nicht leer sind. Allgemein gilt 71"i [/11 X . .. X /1nJ = /1i , wenn die Fuzzy-Mengen li j , j -I i , normal sind , d.h . (3x j E X j )( /1j (Xj )) = 1. 1. 5.4 Ext ensionsprinzip fiir m ehrel ementige Abbildungen
Mit Hilfe des kart esischen Prod ukt s konnen wir das Extensionsprinzip fur Abbildungen mit mehreren Argum ent en auf das Extensionsprinzip fur Funktionen mit einem Argum ent zuriickfiihre n. Es sei die Abb ildung
1 : Xl
X . .. X
Xn
-+
Y
gegebe n. Dann ist das Bild des Tupels
von Fuzzy-Mengen unter
1 die
Fuzzy-Menge
1[/11 , . . . , /1nl
tiber der Grundmenge Y , d.h .
=
J[/11
X .. . X
/1nJ
1. Grundlagen der Fuzzy-Systeme
32
(1.9)
sup (Xj , . . . ,xn ) EX j
=
{ (Jil
sup ( X j , •. . ,x n )EX j
X •.•
x ... x X n
x ... x X n
x Jin)(XI, .. . , xn)f (x I' .. . , x n ) =
v}
{ min{JiI (Xl) , . .. , Jin(Xn )} f (x I, . .. , Xn ) = y}.
Diese Formel repr asent iert das Ex tensionsprinzip von Zadeh [206, 207, 208]. Beispiel 1.8 Die Abbildung f : JR x JR -; JR, (XI ,X2) 1--+ Xl + X2 sei die Addit ion. Die Fuzzy-Mengen Jil = AO,I,2 und Ji2 = AI,2,3 repr asenti eren die vagen Konzepte "ca. 1" und "ca. 2". Dann ergibt sich nach dem Extensionsprinzip die Fuzzy-Menge f[JiI , Ji2] = AI ,3,5 fur das vage Konzept "ca. 1 + ca. 2" (vgl. Abb. 1.21). Auch hier tritt derselbe Effekt wie beim Quadrieren von "ca. 1" (s. Beispiel 1.7 und Abb. 1.20) auf, dass die "Unscharfe" bei der Er gebnis-Fuzzy-Menge grofler ist als bei den Fuzzy-Mengen, die addiert wurd en. 0 ca. 1
ca. 2 ca. 1 + ca. 2
1
1
2
3
4
5
Abb. 1.21. Das Resultat des Extensionsprinzips fur "ca. 1 + ca. 2"
Analog zur Addi tion von Fuzzy-Mengen lassen sich Subtrakt ion, Multi plikation un d Division tiber das Extensionsprinzip definicren. Da diese Operati onen ste t ig sind, konnen wie im Beispiel 1.7 die Niveaumengen der resulti erenden Fuzzy-Mengen bei diesen Op erati onen direkt aus den Niveau mengen der gegebenen Fuzzy-Mengen berechnet werd en, sofern diese stetig sind. Rechnet man mit konvexen Fuzzy-Mengen , betreibt man durch das Betrachten der Niveaumengen Intervallarithrnetik auf den jeweiligen Niveaus. Die Intervallarithmet ik [126, 127] erla ubt das Rechnen mit Intervallen anste lle von rcellen Zahlen. Bei der Anwendung des Ext ensionsprinzip s sollte man sich bewusst sein, dass zwei Verallgemeinerun gsschrit te gleichzeit ig durchgefuhrt werden: zum einen die Erweite rung von einzelnen Elementen auf Mengen und zurn anderen der Ubergang von scharfen Mengen auf Fuzzy-Mengen. Dass durch das Extensionsprinzip wichtige Eigenschaften der ursprilnglichen Abbi ldung verloren gehen , muss nicht unb edingt an dem Ubergang von schar fen Mengen zu Fuzzy-Mengen liegen, sondern kann bereits durch die Erweiterung der Abbildung auf gewohnliche Mengen verursacht werden . Beispielsweise kann die
1.6 Fuzzy-Relationen
33
Addition bei Fuzzy-M engen im Gegensatz zur Addi tion einer gewohnlichen Zahl La. nicht mehr ruckgan gig gemacht werden. So gibt es keine FuzzyMenge , die addier t zu der Fuzzy-Menge fur "ca. 1 + ca . 2" aus Abb. 1.21 wieder die Fuzzy-Menge fur "ca. 1" ergib t. Dieses Phanomen trit t ab er schon in der Intervallarithrnetik auf, so dass nicht das "Fuzzifizieren" der Addition , sondern das Erw eit ern der Addition auf Mengen das eigent liche Problem darstellt.
1.6 Fuzzy-Relationen Relationen eignen sich zur Beschreibung von Zusammenhangen zwischen verschiedenen Variablen , Crofen oder Attributen. Formal ist eine (zweistelli ge) Relation ub er den Grundmengen X und Y eine Teilmenge R des kartesischen Produkts X x Y von X und Y. Die Paar e (x,y) E X x Y , die zur Relation R gehoren, verbindet ein Zusammenhang, der durch die Relati on R beschrieb en wird . Man schreibt daher haufig statt (x, y) E R au ch xRy. Wir werden den Begriff der Relat ion zu Fuzzy-Relationen verallgemeinern. Fuzzy-Relati onen sind niitzlich fur die Dar st ellung und das Verstandnis von Fuzzy-Reglern , bei denen es urn eine Beschreibung eines uns charfen Zusammenh angs zwischen Ein- und Ausgangsgroben geht . AuBerd em kann auf der Basis spez ieller Fuzzy-Relationen, den in Abschnit t 1.7 behandelten Ahnli chkeitsrelationen, eine Interpretation von Fuzzy-M engen und Zugehorigkeitsgra den angegeben werd en , die besond ers fiir Fuzzy-Hegler von Bedeutung ist .
1.6.1 Gewohnliche Relationen Bevor wir die Definiti on von Fuzzy-Relationen einfuhren, wiederholen wir kur z gru ndlegende Sichtweisen und Konz epte fiir gewohnliche Relationen , die zum Verst andni s der Fuzzy-Relationen notwendi g sind.
Beispiel 1.9 Die sechs T iiren eines Hauses sind mit Schlossern versehen , die durch bestimmte Schlussel geoffnet werd en konn en. Die Menge der Tti ren sei T = {t 1, . . . ,t6}, die Menge der verfiigbaren Schliissel sei S = {SI, .. . , S5 } und S5 sei der Generalschltissel mit dem jede der sechs T iiren geoffnet werden kann. Der Schlussel S 1 passt nur zur Tii r t 1, S2 zu t 1 und t2, S3 zu t 3 und t«, S4 zu t5. Form al konn en wir diesen Sachverhalt durch die Relation R S;; S x T ("passt zu") beschreiben . Das Paar (s, t) E S x T ist genau dann ein Element von R , wenn der Schliissel s zur T iir t passt , d.h.
R = { (S1 ' tl) , (S2' t 1 ) , (S2, t2), (S3, t3), (S3' t4), (S4 , t 5), (S5 ' td , (S5' t2), (S5, t3), (S5, t4), (S5' t 5), (S5, t6) }. Ein e andere Moglichkeit die Relation R darzust ellen , zeigt die Tabelle 1.2. Dabei ste ht eine 1 an der Position (Si, tj) , wenn (Si, tj) E R gilt, bzw. eine 0, falls (Si,tj ) ¢ R . 0
34
1. Grundlagen der Fuzzy-Syst eme
1 1
0
1
0 0
0 0
0 0
1
1
84
0
0
85
1
1
1
1
81 82 83
0 0
0 0 0
1 1
0 0 0 0
1
Tabelle 1.2. Die Relation R: "Schliissel passt zur T iir"
Beispiel 1.10 Wir betrachten ein Messgerat , das eine Crofie y E IR mit einer Genauigkeit von ±O.l misst . Ist Xo der gemessene Wert, so wissen wir, dass der wahre Yo im Int ervall [xo - 0.1, Xo + 0.1] liegt . Die Relation
R = {( x,y) E IR x IR I lx -
yl :::; O.l}
beschreibt diesen Sachverhalt . Sie ist in Abb . 1.22 graphisch dargest ellt.
0
x
Abb . 1.22. Die Relation y= x ± 0.1
Abbildungen bzw. deren Gr aph en konnen als Spezialfall von Relationen angesehen werden. Ist f : X ----. Y eine Abbildung von X nach Y , so ist der Graph von f die Relation gra ph(J) = {(x,J(x)) I x EX} . Umgekehrt reprasentiert eine Relation R ~ X x Y genau dann den Graphen einer Funktion, wenn zu jedem x E X genau ein y E Y exist iert, so dass das Paar (x,y) in R ent halten ist. 1.6.2 Anwendung von Relationen und Inferenz Bisher hab en wir Relationen nur deskriptiv verwendet . Relationen lassen sich ab er auch ahnlich wie Funktionen auf Element e oder Mengen anwenden. Ist
1.6 Fuzzy-Relationen
R ~ X x Y eine Relat ion zwischen den Mengen X und Y und M Teilmenge von X , dann ist das Bild von Munter R die Menge R[M] = {y
E
Y I (:Jx E X)((x,y) E R l\ x EM)} .
~
35
X eine
(1.10)
R[M] enthalt diejenigen Element e aus Y , die zu mind estens einem Element aus der Menge M in Relati on stehen. Ist f : X -> Y eine Abbi ldun g, ergibt die Anwendu ng der Relation gra ph(J) auf eine einelement ige Menge {x} <;;; X die einelement ige Menge, die den Funktionswert von x ent halt: gra ph(J) [{ x }]
{ f( x)} .
Allgemein gilt graph(J)[M] = j[M] = {y E Y
I (:Jx E X)( x E M 1\ f( x) =
V)}
fur beliebige Teilmengen M <;;; X . B eispiel 1.11 Wir benut zen die Relation R aus dem Beispiel 1.9, urn zu best immen, welche Tiiren sich offnen lassen, wenn man im Besit z der Schltissel 81, . . . ,84 ist . Dazu miissen wir aile Element e (Turen) berechnen , die zu mindestens einem der Schlussel 8 1 , . . . , 8 4 in der Relation "passt zu" stehen, d .h.,
ist die gesuchte Menge von Tiir en. Die Menge R[{81 " ' " 8 4 } ] kann sehr einfach mit Hilfe der Matrix in Tabelle 1.2 best immt werd en. Dazu kodieren wir die Menge M = {81 , ... , S4} als Zeilenvektor mit fiinf Komponent en , der an der i-te n Stelle eine 1 als Eintrag erhiilt , wenn 8 i E M gilt, bzw. cine 0 im FaIle 8 i !f- M . So ergibt sich der Vektor (1,1,1 ,1 ,0) . Wie bei dem Falk-Schema fiir die Matrixmultiplikation eines Vektor s mit einer Matrix schreiben wir den Vektor links unt en neben die Matrix. Dan ach transponieren wir den Vektor und ftihren einen Vergleich mit jed er einzelnen Spalte der Matrix durch. Tritt bei dem Vektor und einer Spalte gleichzeitig eine 1 auf, notieren wir unter der ent sprechenden Spalte eine 1, ansonsten eine O. Der sich auf diese Weise ergebende Vektor (1, 1, 1, 1, 1, 0) unterhalb der Matrix gibt in kodierter Form die gesuchte Menge R[M] an: Er ent ha lt an der i-ten Stelle gena u dan n eine 1, wenn t i E R[M] gilt. Tab elle D 1.3 verd eutlicht dieses "Falk-Schema" fur Relatio nen. Beispiel 1.12 Wir greifen das Beispiel 1.10 wieder auf und nehmen an, dass wir die Information hab en , dass das Messgeriit einen Wert zwischen 0.2 und 0.4 angezeigt hat . Daraus konn en wir folgern , dass der wahre Wert in der Menge R[ [0.2, 0.41] = [0.1,0.5] ent halte n ist. Abb. 1.23 verans chauli cht diesen Sachverh alt .
36
1.
Grundlagen der Fuzzy-Systeme
1
1
1
0
1 1 0 0 1 1
0 1 0 0 1 1
0 0 1 0 1 1
0 0 1 0 1 1
0 0 0 1 1 1
0 0 0 0 1 0
Tabelle 1.3. Das Falk-Schema zur Berechnung von R[M] y I
I I
0.5 - - - -
R[M ]
I
frx(M)
I
I
I
+- - - -
I
I I I I
M
x 0.4
Abb . 1.23. Grafische Bestimmung der Menge R[M]
Aus der Grafik erkennt man , dass man die Menge R[M ] als P roj ekt ion des Durchschni tt s der Relation mit der zylindr ischen Erweiteru ng der Menge M erha lt , d.h. (1.11) R[M] = 'lr y [R n 7T x(M) ] . D
B eispi el 1. 13 Logische Inferenz mit Implikationen der Form x E A ---+ Y E B lasst sich mit Relati onen berechnen . Dazu kodieren wir die Regel x E A ---+ Y E B durch die Relat ion R = {(x , y) E X x Y lxE A ---+yE B }
(A x B ) U
Ax
y.
(1.12)
Dab ei sind X und Y die Mengen der moglichen Werte die x bzw. y annehmen konn en, Fiir die Regel "Wenn die Geschwindigkeit zwischen 90 km/h und 110 km /h betragt , dann liegt der Benzinverbrauch zwischen 6 und 8 Litem" (als logische Formel: v E [90, 110] ---+ b E [6, 8]) ergibt sich die Relat ion aus Abb. 1.24.
1.6 Fuzzy-Relationen
37
Benzinverbrauch
8 6 "'--''----L.---L..-- . L - I -_ _--JL-.L.-<'----L._
90
Geschwindigkeit
llO
Abb, 1.24. Die Relation fur die Regel v E [90, 110] -> b E
[6,8]
Wenn wir wissen, dass die Geschwindigkeit den Wert v hat, konnen wir im Faile 90 ::; v ::; 110 schlieBen, dass fur den Benzinverbrauch b die Beziehung 6 ::; b ::; 8 gilt . Andernfalls konnen wir nur aufgrund der gegebenen Regel nichts tiber den Benzinverbrau ch aussagen, d .h., wir erhalte n b E [0, (0 ). Dasselbe Ergebnis liefert die Anwendung der Relation R auf die einelement ige Menge {v} : R[{v}] = {[6, 8] falls v E [90, 110] [0, (0) sonst. Allgemeiner gilt : Wenn die Geschwindigkeit irgendeinen Wert aus der Menge M annimmt , so folgt im Faile M ~ [90, 110], dass der Benzinverbrauch zwischen 6 und 8 Litern liegt , andernfalls folgt nur b E [0, (0 ), was sich ebenfalls aus der Anwendung der Relation R auf die Menge M ergibt:
[6,8] R [M ]
= { (/) [0, (0 )
falls M ~ [90, 110] falls M = (/) sonst .
o 1.6.3 Inferenzketten
Das obige Beispiel zeigt, wie sich eine logische Inferenz mit einer Relation darst ellen lasst . Beim Schlussfolgern treten iiblicherwelse Inferenzket ten der Form !PI -> !P2, !P2 -> !P3 auf, aus der wir !PI -> !P3 ableite n konn en, Ein ahnliches Prinzip kann auch fur Relationen angegeben werden. Es seien die Relat ionen R I ~ X X Y und R 2 ~ Y X Z gegeben. Ein Element x steht indirekt in Relation zu einem Element z E Z , wenn es ein Element y E Y gibt , so dass x und y in der Relat ion R I und y und z in der Relation R 2 stehen. Man "gelangt von x nach z tiber y" . Auf diese Weise lasst sich die Hintereinand erschaltung der Relationen R I und R 2 als Relati on R 2 °R 1
=
{( x , z) E X x Z I (3y E Y ) ((x , y ) E RI A (y , z) E R 2 )}
(1.13)
38
1.
Grundlagen der Fuzzy-Systerne
zwischen X und Z definieren. Es gilt dann fiir aile M
~
X
Fiir die Relationen graph (J ) und gra ph(g), die von den Abb ildungen ---. Y bzw. 9 : Y ---. Z indu ziert werden, folgt , dass die Hintereinanderscha ltung der Relati on mit der von der Hintereinanderschaltung der Abbildungen fund 9 indu ziert en Relat ion iibereinstimmt :
f :X
gra ph(g ° f) = gra ph(g) ° gra ph(J). Beispiel 1.14 Wir erweitern das Beispiel 1.9 der Schliissel und Tiiren, indem Wir cine Menge P = {PI ,P2,P3} von drei Personen betrachten , die im Besit z verschiedener Schliissel sind, was wir dur ch die Relation
ausdriicken. Dabei ist (pi, Sj) E R' gleichbedeutend damit , dass Person Pi der Schliissel S j zur Verfiigung ste ht. Die Hinterand erschaltung
R ° R' = { (PI , tl ),(PI, t2),(P2,t3), (P2 , t4), (P2, t5),
(P3, t l) , (P3, t2), (P3 , t3), (P3 , t 4), (P3 , t5),( p3 , t 6) } der Relationen R' und R ent halt das Paar (p, t) E P x T genau dann , wenn Person P die Tiir t offnen kann . Mit der Relation RrR' lasst sich beispielsweise bestimmen, welche Turon geoffnot werden konnen , wenn die Personen PI und P2 anwesend sind. Die gesuchte Menge der Tiiren ist
o Beispiel 1.15 Im Beispiel 1.1a gab der von einem Messgerat angezeigte Wert x den wahren Wert y bis auf eine Genauigkeit von a.1 an, was dur ch die Relation R = {( x,y ) E IR x IR Ilx - yl ~ a.1} wiedergegeben wurd e. Lasst sich die GroBe z aus der GroBe y mit einer Genauigkeit von a.2 bestimmen, ent spricht dies der Relation R' = { (y, z) E IR x IR Ilx - yj ~ a.2}. Die Hint ereinanderschalt ung von R' und R ergibt die Relation R' «R = {(x , z) E IR x IR I Ix - z ] ~ o.aj. Wenn das Messgerat den Wert Xo anzeigt, konnen wir folgern , dass der Wert der GroBe z in der Menge
(R' oR )[{xo}] liegt .
= [xo - a.3,xo + a.3] o
Beispiel 1.16 Das Beispiel 1.13 demonst riert e, wie sich eine Impli kation der Form x E A ---. Y E B durch eine Relation darstellen lasst . 1st eine weitere
1.6 Fuzzy-Relationen
39
z E D bekann t , so lasst sich im Faile B ~ C die Regel x E A ---+ z E D ableite n. And ernfalls lasst sich bei der Kenntnis von x nichts tiber z aussagen, d.h. , wir erh alt en die Regel x E X ---+ z E Z. Die Hint erein anerschaltung der die Implikationen x E A ---+ Y E B und y E C ---+ z E D repr asentierenden Relat ionen R' und R ergibt entsprechend die Relation, die mit der Implikation x E A ---+ z E D bzw. x E A ---+ Z E Z Regel y E C
---+
assoziiert wird :
R' oR
(A x D) U (.:1 x Z) { (A x Z) U (A x Z )
falls B X x Z sonst .
<:: C o
1.6.4 Einfache Fuzzy-Relationen Nachdem wir einen kur zen Uber blick tiber gru ndlegende Begriffe und Konzepte ftir gewohnliche Relationen gegeben hab en, wend en wir uns nun den Fuzzy-Relat ionen zu , Definition 1.17 Ein e Fuzzy-Menge (! E F(X x Y) heijJt (zweist ellige) Fuzzy-Relation zwischen den Gru ndrnengen X un d Y . Eine Fuzzy-Relation ist demnach eine verallgemeinert e gewohnliche Relation, bei der zwei Elemente gradu ell in Relation st ehen konnen . J e grofe r der Zugehorigkeitsgrad {!(x,y) ist , desto st arker ste hen x und y in Relation. Beispiel 1.18 X = {a, j , i} bezeichne die Menge der Renditeobj ekt e Akti en (a), festverzinsliche Wertpapiere (I) und Immobilien (i). Die Menge Y = {g ,m,h} ent halt die Elemente geringes (g) , mit tleres (m) und hohes (h) Risiko. Die in Tabelle 1.4 angegebene Fuzzy-Relation (! E F(X x Y) gibt fur jedes Paa r (x,y) E X x Y an, inwieweit x als Rend iteobj ekt mit dem Risikofaktor y angese hen werd en kann.
I e II
g
a
0.0 0.6 0.8
f i
I
rn 0.3 0.9 0.5
I
h 1.0 0.1 0.2
I
Tabelle 1.4. Die Fuzzy-Relation e: "x ist Renditeobjekt mit Risikofaktor y" Beispielsweise bedeut et der Tab elleneintrag in der Spalt e m und der Zeile i, dass Immobilien zum Grad 0.5 als Renditeobjekt mit mittlerem Risiko angesehen werden konnen , d.h., es gilt {!(i, m) = 0.5. 0 Beispiel 1.19 Fiir das Messgeriit aus Beispiel 1.10 wurd e eine Genauigkeit von 0.1 angegeben. Es ist jedoch nicht sehr realist isch anzunehmen, dass bei einem angezeigten Wert Xo jed er Wert aus dem Int ervall [x o - 0.1, Xo +
1. Grundlagen der Fuzzy-Systeme
40
0.1] als gleich glaubwurdig als wahrer Wert der gemessenen GroBe angesehen werden kann . Als Alternative zur scharfen Relati on R aus Beispiel 1.10 zur Repriisentation dieses Sachverhalts bietet sich daher eine Fuzzy-Relation an, z.E. (l : 1R x 1R --+ [0, 1], (x,y) f--> 1- min{1O lx - yl, I} ,
die den ZugehOrigkeitsgrad 1 fur x = y ergibt und eine in Ix - yl lineare Abnahme des ZugehOrigkeits grad es zur Folge hat , bis die Differen z zwischen x und y den Wert 0.1 uberschreitet . 0
Urn mit Fuzzy-Relation en ahnlich wie mit gewohnlichen Relationen operieren zu konnen, milssen wir die in Gleichung (1.10) angegebene Formel zur Bestimmung des Bildes einer Menge unt er einer Relati on au f Fuzzy-Mengen und Fuzzy-Relati onen erweite rn. Definition 1.20 Fur eine Fuzzy-Relation (l E F (X x Y) und eine FuzzyMenge p, E F (X) ist das B ild von p, unier (l die Fuzzy-Menge
(l[p,](y) = sup {min{ (l(x, V) , p,(x)} I x E X }
(1.14)
iiber der Grundmenge Y.
Diese Definition lasst sich auf mehrere Art en rechtfertigen. Sind (l und p, die chara kte rist ischen Funktionen einer gewohnlichen Relation R bzw. Menge M , so ist (l[p,l die chara kteristische Funk tion des Bildes R[M ] von Munter R. Die Definition ist somit eine Verallgemeinerung der Formel (1.10) fur scharfe Mengen. Die Formel (1.10) ist aquivalent zu der Aussage
Y E R[M] ~ (:Jx E X)(( x,y) E R Ax E M ). Man erhalt die Formel (1.14) ftir Fuzzy-Relati onen aus dieser .i\quivalenz, indem man der Konju nktion das Minimum als Wahrheitswert funkt ion zuordnet und den Existenzquanto r als Supremum auswertet, d .h.
(l[p,] (y) = [y E (l[p,ll = [(:Jx E X )( (x ,y ) E (l A x E p,)J
= sup {min{(l(x , V), p,(x )}
I x E X }.
Die Definition 1.20 lasst sich auch aus dem Extensionsprinzip herleit en. Wir betrachten dazu die partielle Abbildung
f :X
x (X x Y)
--+
Y,
I (
)
x, (x , y)
{
f-->
Es ist offensicht lich, dass fur eine Menge M
y falls x = x' und efiniert sonst. ~
X und eine Relation R
(1.15) ~
X xY
1.6 Fuzzy-Relationen
f[M,R]
f[M x R]
41
R[M]
gilt. Bei der EinfUhrung des Extensionsprinzips haben wir an keiner Stelle gefordert, dass die auf Fuzzy-Mengen zu erweiternde Abbildung f uberall definiert sein muss. Das Extensionsprinzip lasst sich daher auch auf partielle Abbildungen anwenden. Das Extensionsprinzip fur die Abbildung (1.15), die der Berechnung eines Bildes einer Menge unter einer Relation zugrundeliegt, liefert die in der Definition 1.20 angegebene Formel ftir das Bild einer FuzzyMenge unter einer Fuzzy-Relation. Eine weitere Rechtfertigung der Definition 1.20 ergibt sich aus der in Beispiel 1.12 und Abb . 1.23 beschriebenen Berechnungsweise des Bildes einer Menge unter einer Relation als Projektion des Durchschnitts der zylindrischen Erweiterung der Menge mit der Relation (vgl. Gleichung (1.11)). Setzt man in die Gleichung (1.11) statt der Menge Meine Fuzzy-Menge p, und fur die Relation Reine Fuzzy-Relation g ein, ergibt sich wieder urn die Formel (1.14), wenn der Durchschnitt von Fuzzy-Mengen durch das Minimum bestimmt wird und die Projektion und die zylindrische Erweiterung fur Fuzzy-Mengen wie im Abschnitt 1.5 berechnet werden. Beispiel 1.21 Mit Hilfe der Fuzzy-Relation aus dem Beispiel 1.18 soll eine Einschatzung des Risikos eines Fonds vorgenommen werden, der sich VOfwiegend auf Aktien konzentriert, sich aber auch zu einem geringeren Teil im Immobilienbereich engagiert. Wir reprasentieren diesen Fond tiber der Grundmenge {a, i, f} der Renditeobjekte als Fuzzy-Menge p, mit
p,(a)
= 0.8,
p,(j) = 0,
p,(i) = 0.2.
Urn das Risiko dieses Fonds zu bestimmen, berechnen wir das Bild der FuzzyMenge p, unter der Fuzzy-Relation Q aus Tabelle 1.4. Es ergibt sich
A.hnlich wie im Beispiel 1.11 lasst sich die Fuzzy-Menge dp,] mit Hilfe eines modifizierten Falk-Schemas angeben. Dazu miissen anstelle der Nullen und Einsen in der Tabelle 1.3 die entsprechenden Zugeh6rigkeitsgrade eingetragen werden . Unter der jeweiligen Spalte ergibt sich der Zugehorigkeitsgrad des korrespondierenden Elementes zur Fuzzy-Menge g[p,], indem man ftir jeden Eintrag der Spalte das Minimum mit dem dazugehorigen Wert des p, reprasentierenden Vektors bildet und das Maximum dieser Minima errechnet. In diesem Sinne gleicht die Berechnung des Bildes einer Fuzzy-Menge p, unter einer Fuzzy-Relation g der Matrixmultiplikation einer Matrix mit einem Vektor, bei der die Multiplikation der Komponenten durch das Minimum und die Addition durch das Maximum ersetzt wird . 0 Beispiel 1.22 Wir nehmen an, dass das Messgerat aus Beispiel 1.19 einen Wert von "ungefahr 0.3" angezeigt hat, was wir mit der Fuzzy-Menge p, = AO.2 ,o .3 ,0.4 modellieren. Fur den wahren Wert y ergibt sich die Fuzzy-Menge
42
1. Grundlagen der Fuzzy-Systeme
e[p](y) = 1-min{5Iy-0.31,1} als Bild der Fuzzy-Menge punter der Relation
e aus Beispiel 1.19.
0
Beispiel 1.23 Das Beispiel 1.13 hat gezeigt, dass sich logisehe Inferenz auf der Basis einer Implikation der Form x E A -> Y E B mit einer Relati on dar st ellen lasst . Wir verallgemeinern dieses Verfah ren fur den Fall, dass A und B dureh Fuzzy-Mengen p bzw. II erset zt werd en. Dazu definieren wir in Anlehnun g an die Gleichung (1.12) mit der Formel [(x, y) E e] = [x E P -> YEll] , in der wir als Wahrheit swertfunktion fur die Implikation die God el-Implikation wahl en , die Fuzzy-Relation X
)
{III (Y)
_
e( , y -
fallsp(x) :::;II(Y) sonst .
Die Regel "Wenn x ungefah r 2 ist, dann ist y un gefahr 3" fuhrt dann zur Fuzzy-Relatio n
(x 7) (}
,Y
=
{I
yl , I}
1 - min{1 3 -
falls min{1 3 sonst,
yl ,
I}:: ;
12 - x l
wenn man "ungefahr 2" dureh die Fuzzy-Menge p = A 1 ,2,3 und "ungefahr 3" dureh die Fuzzy-Menge II = A2 ,3 ,4 modelliert . Aus der Kenntnis von "x ist ungefah r 2.5", reprasentiert dureh die Fuzzy-Men ge p' = A1. 5 ,2 .5 ,3 .5 , erha lten wir fur y die Fuzzy-Menge y - 1.5 falls 2.0 < y < 2.5
Q[p'](y) =
{
~.5 0.5
falls 2.5 :::; y :::; 3.5 y falls 3.5 :::; y < 4.0 sonst,
die in Abb . 1.25 zu sehen ist. 1.0 0.5+-------./
2 2.5 3 3.5 4 Abb. 1.25. Die Fuzzy-Menge g[,./] Der Zugehori gkeitsgrad eines Elementes Yo zu dieser Fuzzy-Menge sollte in dem Sinne interpret iert werden , dass er angibt , inwieweit es noeh fur moglich gehalte n wird , dass die Variable y den Wert Yo annirnmt . Diese Sichtweise ist die Verallgemeinerun g dessen, was sieh bei der auf gewohnlichen Mengen basierenden Implikation irn Beispiel 1.13 ergab. Dort ware n als Er gebn is nur
1.6 Fuzzy-Relationen
43
zwei Mengen moglich: die gesamte Grundmenge, wenn die Priimisse der Implikation nicht unb edingt erfiillt war , bzw. die in der Konklusion der Implika tion angegebene Menge fur den Fall, dass die Pramisse galt . Der erste Fall besagt , dass aufgrund der Regel noch aile Wert e ftir y denkb ar sind , wahrend im zweit en Fall ausschlieBlich Wert e aus der Konklu sionsmenge in Frage kommen. Dur ch die Verwendung von Fuzzy-Mengen anste lle der gewohnlichen Mengen kann sowohl die Pramisse als auch die Konklusion der Implikation partiell erfiillt sein. Dies hat zur Folge, dass nicht mehr nur die Grundmenge und die Konklusions(-Fuzzy-)Menge als Ergebnisse in Betracht kommen, sondern auch Fuzzy-Mengen dazwischen. Die Tatsache, dass aile Werte y einen Zugeh6rigkeitsgrad von mindestens 0.5 zur Fuzzy-Menge g[ill besitzen , ist dadurch begrtind et , dass ein Wert , namlich Xo = 2.0, existiert , der einen ZugehOrigkeitsgrad von 0.5 zur Fuzzy-Menge Ii und einen Zugehorigkeitsgrad von 0 zu 11 hat. Das bedeutet , dass die Variable x zurn Grad 0.5 einen Wert annehmen kann , bei dem sich aufgrund der Implikation nicht s tiber y aussagen lasst , d .h., dass y jeden beliebigen Wert aus der Grundmenge annehmen kann. Der Zugehorigkeitsgrad 1 des Wertes Xo = 2.5 zur Fuzzy-Menge J.l' hat zur Folge, dass alle Werte aus dem Int ervall [2.5, 3.5] einen Zugehorigkeitsgrad von 1 zu g[/l l besitzen . Denn fiir Xo = 2.5 ergibt sich J.l (2.5) = 0.75, d.h ., die P riimisse der Implikation ist zum Grad 0.75 erftillt , so dass es fur die Gtiltigkeit der Implikation ausreicht , wenn die Konklusion ebenfalls zum Grad von mindestens 0.75 erfiillt ist . Dies gilt gena u fur die Werte aus dem Intervall [2.5, 3.5]. Fur die Zugehorigkeitsgrade zwischen 0 und 1 zur Fuzzy-Menge g[/ll lassen sich analoge Uber legungen anst ellen. 0 1.6.5 Verkettung von Fuzzy-Relationen Zum End e dieses Abschnit ts wenden wir uns der Verkettung oder Hintereinanderschalt ung von Fuzzy-Relat ionen zu. Ahnlich wie wir bei der Definition des Bildes einer Fuzzy-Menge unter einer Fuzzy-Relat ion die Formel (1.10) ftir gewohnliche Mengen zugrundegelegt hab en, greifen wir fur die Hintereinanderscha lt ung von Fuzzy-Relationen auf die Gleichung (1.13) zuruck. Definition 1.24 E8 8eie n gl E F (X x Y) und g2 E F(Y x Z) F1LzzyR elation en . Dan n erqibt die Hin tereinanderschaltung del' beid en Fuzzu-Relationen die F1Lzzy-Relation
(1.16) zwischen den Gru ndm engen X usul Z .
Diese Definition erhalt man aus der Aquivalenz
44
1. Gruncllagen der Fuzzy-Systeme
indem man der Konjunktion das Minimum als Wah rheitswert funkt ion zuordnet und den Existenzquantor durch das Supremum auswert et , so dass sich (g2° gI)( X, z) = [(x, y) E (g2° gdl
= [(:Jy E Y)(( x,y) E R I A (y,z) E R2 )] = sup { min{gI (x , y), g2(y, z )} l yE
Y}
ergibt. Die Formel (1.16) erhalt man auch, wenn man das Extensionspri nzip auf die parti elle Abbildung
f : (X
x Y) x (Y x Z)
((x,y), (y',z) )
-----*
(X x Y) ,
{( X, Z)
fallsy=y' und efiniert sonst
f-+
anwendet, die der Hint ereinanderschaltung gewohnlicher Relationen zugrunde liegt , da gilt. Sind gl und g2 die cha rakteristischen Funk tionen der gewohnlichen Relationen R I bzw. R 2, so ist g2° gI die chara kterist ische Funktion der Relation R 2 R I • In diesem Sinne vera llgemeinert die Definition 1.24 die Hint ereinanderschaltung von Relationen ftir Fuzzy-Relationen . Fur jede Fuzzy-Menge J-l E F(X) gilt 0
Beispiel 1.25 Wir erweitern die in Beispiel 1.21 diskutierte Risikoeinschatzung eines Fonds urn die Menge Z = {gv ,kv,kg, gg} . Die Elemente stehen fiir "groBer Verlust ", "kleiner Verlus t ", "kleiner Gewinn " bzw. "groBer Gewinn " . Die Fuzzy-Relati on g' E F(Y x Z ) in Tab elle 1.5 gibt fur jedes Tup el (y , z) E Y x Z an , inwieweit bei dem Risiko y der Gewinn bzw. Verlust z fur moglich gehalte n wird . Das Ergebnis der Hint ereinand erschaltung der Fuzzy-Relati onen g und g' zeigt Tab elle 1.6.
I r/ I
gv
g m
0.0 0.3 1.0
h Tabelle 1.5. Die Fuzzy-Relation moglich"
I
kv
0.4 1.0 1.0
I
kg
1.0 1.0 1.0
I
gg
I
0.0 0.4 1.0
r/: "Bei dem Risiko y ist dcr Gewinnn/Verlust z
1.7 Ahnlichkeitsrelationen
r/
gv
kv
a
1.0 0.3 0.3
1.0 0.9 0.5
f
i
Tabelle 1.6. Die Fuzzy-Relation winnri /Verlust z moglich "
I
kg
1.0 0.9 0.8
I
45
I
gg
1.0 0.4 0.4
r/o r}: "Bei dem Renditeobjekt
x ist der Ge-
In diesem Fall, in dem die Grundmengen endlich sind und sich die FuzzyRelationen als Tab ellen oder Matrizen darstellen lassen, entspricht die Berechnungsvorschrift ftir die Hint ereinanderschaltung von Fuzzy-Relationen einer Matrixmultiplikation, bei der anstelle der kompon entenweisen Multiplikation das Minimum gebildet und die Addition dur ch das Maximum ersetzt wird . Fur den Fond aus Beispiel 1.21, der dur ch die Fuzzy-Menge JL
JL(a) = 0.8,
JL(f) = 0,
JL( i) = 0.2.
reprasenti ert wurd e, ergibt sich
als die den moglichen Gewinn bzw. Verlu st beschreibende Fuzzy-Menge
D
Beispiel 1.26 Die Genauigkeit des Messgerate s aus Beispiel 1.19 wurde durch die Fuzzy-Relation g(x , y) = 1 - min{lOlx - yl , I} beschrieben , die angibt, inwieweit bei dem angezeigte n Wert x der Wert y als wahrer Wert in Frage kommt . Wir nehmen an, dass das (analoge) Messgerat nicht genau abgelesen werden kann , und verwenden dafur die Fuzzy-Relat ion g' (a, x) = 1 - min{5la - z ], I} . Dab ei gibt g'(a, x) an, inwieweit bei dem abgelesenen Wert a der Wert x als wahrer Wert der Anzeige angenommen werden kann . Wenn wir von dem abgelesenen Wert a direkt auf den wahren Wert y der zu messenden GroBe schlieBen wollen , benotigen wir dazu die Hintereinanderschaltung der Fuzzy-Relationen g' und g.
Bei einem abgelesenen Wert a = 0 erhalte n wir fur den wahren Wert y die Fu zzy-M eng e D
1. 7 Ahnlichkeitsrelationen In diesem Abschnitt werden wir einen speziellen Typ von Fuzzy-Relationen , die Ahnlichkeitsrelat ionen, naher unt ersuchen , die eine wichtige Rolle bei der
46
1. Grundlagen der Fuzzy-Systeme
Int erpretation von Fuzzy-Reglern spielen und ganz allgemein dazu verwendet werden konnen, die einem Fuzzy-Syst em inh arent e Ununterscheidb arkeit zu chara kterisieren. Ahnl ichkeitsrelationen sind Fuzzy-Relationen, die fur je zwei Elemente oder Obj ekt e angeben, inwieweit sie als ununterscheidbar oder ahnlich angesehen werden. Von einer Ahnlichkeits relation sollt e man erwarte n, dass sie reflexiv und symm et risch ist , d .h., dass jed es Element zu sich selbst (zum Grad eins) ahnlich ist und dass x genauso ahnlich zu y wie y zu x ist . Zusatzl ich zu diesen beiden Mind est anforderungen an Ahnlichkeitsrelationen verla ngen wir noch die folgende abgeschwachte Transitivitatsbedin gung: 1st x zu einern gewissen Grad ahnlich zu y und ist y zu einern gewissen Gr ad ahnlich zu z , dann sollte auch x zu einem gewissen (eventuell geringeren) Gr ad ahnlich zu z sein . Form al definieren wir eine Ahnlichkeitsrelation wie folgt :
Definition 1.27 Eine .Ahnlichkeitsrelation E : X x X ---.. [0, 1] beziiglich der t-Norm t auf det: Grundm enge X ist eine Fuzzy-Relation iiber X x X, die den Bedingungen (E 1)
E( x , x) = 1,
(Reflexivitat)
(E2)
E (x, y) = E (y,x) ,
(Symmetrie)
(E3)
t( E( x ,y) ,E(y, z)) < E( x , z) .
(Transitivitat)
filr alle x, y, z E X geniigt. Die Transitivitat sbedin gun g fiir Ahnlichkeitsrelationen kann im Sinne der Fuzzy-Logik, wie sie im Kapit el 1.3 vorgest ellt wurd e, folgend erm aBen verstanden werd en : Der Wahrheitswert der Aussage x und y sind ahnlich UND y und z sind ahnlich sollt e hochst ens so graB sein wie der Wahrheitswert der Aussage x und z sind ahnl ich,
wobei der Konjunktion UND als Wahrheit swertfunktion die t- Norm t zugeordnet wird. 1m Beispiel 1.19 hab en wir bereits ein Beispiel fur eine Ahnli chkeitsrelation kenn engelernt , namlich die Fuzzy-Relation {} : lR x lR ---.. [0,1],
(x ,y) f-+ 1- min{lOlx - yl, I} ,
die angibt , inwieweit zwei Werte mit einem Messgerat unt erscheidb ar sind. Es lasst sich leicht na chweisen, dass diese Fuzzy-Relation eine Ahnlichkeitsrelation bezuglich der Lukasiewicz-t-Norrn t (a , j3) = max{a + j3 - 1,0} ist . Wesentli ch allgemeiner gilt , dass eine beliebige P seudometrik, d .h., ein Abst andsm aB 0 : X X X ---.. [0, (0), das die Symm etriebedin gun g o(x , y) = o(y, x ) und die Dreiecksun gleichung o(x , y) + o(y, z ) ~ o(x , z ) erfullt , mittels
E(6)(x, y) = 1-min{o(x ,y),1}
1.7 Ahnlichkeitsrelation en
47
eine Ahnl ichkeitsrelat ion beziiglich der Lukas iewicz-t- Norm induziert und umgekehrt, dass jede Ahnlichkeitsrelation E beziiglich der Lukasiewicz-tNorm durch J(E)(X, y) = 1 - E (x, y) cine P seudometrik definiert. Es gelte n die Beziehun gen E = E (8(E») und J(x , y) = J(E(C»)(x, y), falls J(x, y) :s 1 gilt , so dass Ahnlichkeitsrelat ionen und (durch eins beschr ank te) Pseudometriken als du ale Konzepte angesehen werden konn en , Wir werd en sparer noch sehen, dass es sinnvoll ist , Ahnli chkeitsrelar ionen beziiglich anderer t-Norm en als der Lukasiewicz-t- Norm zu betrachten , urn die Unscha rfe bzw. die damit verbundene Ununt erscheidb arkeit in FuzzySystemen zu kenn zeichnen . 1. 7.1 Fuzzy-Mengen und extensionale Hiillen
Geht man davon , dass eine Ahn lichkeitsrelati on eine gewisse Ununterscheidbarkeit charakte risiert, so sollte man erwa rten, dass sich kaum unterscheidb are Elemente auch ahnlich verhalte n bzw. ahnliche Eigenschaft en besitzen. Fiir Fuzzy-Syste me ist die (un scharfe ) Eigenschaft , Element einer (Fuzzy-)Menge zu sein, wesentlich. Dah er spielen die Fuzzy-Mengen eine wichti ge Rolle, die eine gegebene Ahnlichkeit srelation in dem Sinne respekt ieren , dass ahnliche Elemente au ch ahnliche Zugeh6ri gkeitsgrad e besitzen . Diese Eigenschaft wird als Extensiona litat bezeichnet und formal folgend erm aBen definiert :
Definition 1.28 Es sei E : X x X ~ [0, 1] eine A hnlichkeitsrel ation beziiqlicli der i- N orm t auf der Grundmenge X . Eine Fuzzy-Menge J1 E F (X) heiflt extensional beziiqlicli E, wenn fur aile x , y E X t (J1( x ), E(x , y )) :::; J1(Y) gilt. Die Exte nsiona litats bedingung lasst sich im Sinne der Fuzzy-Logik so interpret ieren, dass der Wahrheitswert der Aussage ist ein Element der Fuzzy-Menge J1 UND x und y sind ahnlich (ununterscheidba r)
.1:
hochstens so grof sein sollte wie der Wah rhei tswert der Aussage y ist ein Element der Fuzzy-Menge J1 , wobei der Konjunktion UND als Wahrheitswertfunktion die t- Norm t zugeordnet wird. Ein e Fuzzy-Menge kann immer zu einer exte nsionalen Fuzzy-Menge erweitert werd en , ind em man zu ihr aile Elemente hin zufiigt , die zumindest zu einem ihrer Element e ahnlich sind. Form alisiert man diese Idee, ergibt sich die folgend e Definition.
48
1. Grundlagen der Fuzzy-Syst ems
Definition 1.29 Es sei E : X x X - t [0,1] eine Ahnlichkeitsrelation bezilglich der t-Norm t auf der Grundmenge X . Die extensionale Hillle p, der Fuzzy-Menge J.L E F(X) (bezilglich der Ahnlichkeitsrelation E) ist durch
My) = sup {t(E( x , y) ,J.L(x))
I x E X}
gegeben. 1st t eine steti ge t-Norm , so ist die exte nsionale Htille p, von J.L die kleinste exte nsionale Fuzzy-Menge, die J.L entha lt - ent halten sein im Sinne von ::;. Man erha lt die exte nsionale Hiille einer Fuzzy-Menge 11 unter der Ahnlichkeitsrelation E im Prinzip als das Bild von J.L unt er der Fuzzy-Relation E wie in der Definition 1.20. Allerdings ist bei der extensiona len Hillle das Minimu m in der Formel (1.14) in Definition 1.20 durch die t- Norrn t ersetzt . Beispiel 1.30 Wir betrachten die Ahnlichkeitsrelation E : IR. x IR. - t [0,1], E( x , y) = 1 - min{lx - yl, I} beziiglich der Lukasiewicz-t-Norm, die durch die iibliche Metrik 8(x , y) = Ix - yj auf den reellen Zahlen induziert wird. Eine (gewohnliche] Menge M ~ IR. lasst sich durch ihre chara kte rist ische Funk tion 1M als Fuzzy-Menge auffassen, so dass sich auch exte nsionale Hiillen gewohnlicher Mengen berechnen lassen. Die exte nsionale Hiille eines Punktes xo, d .h. der einelementigen Menge xo, beziiglich der oben angegebenen Ahnlichkeitsrelation E ergibt eine FuzzyMenge in Form der Dreiecksfunktion A xo-1 ,xo,xo+!' Die extensionale Hiille des Intervalls [a , b] ist die Trap ezfunktion IIa -1 ,a ,b,b+l (vgl. Abb . 1.26).
Xo - 1
Xo
Xo
+1
a -I
a
b
b+ 1
Abb. 1.26. Die exte nsio nale Htille des Punktes Xo und des Intervalls [a , b]
o Dieses Beispiel stellt eine int eressante Verbindung zwischen Fuzzy-Mengen und Ahnlichkeitsrelat.ionen her: die in der P raxis haufig verwendeten Dreiecksund Trapezfunktionen lassen sich als exte nsiona le Htillen von Punkten bzw. Int ervallen inte rpret ieren, d.h ., als unscharfe Punkte bzw. Int ervalle in einer vagen Umgebung, die dur ch die von der tiblichen Metrik auf den reellen Zahlen induziert en Ahnlichkeitsrelatio n charakte risiert wird . 1. 7.2 Skalierungskonzepte
Die ubliche Met rik auf den reellen Zahlen lasst nur sehr eingeschrankte Formen von Dreiecks- und Trap ezfunktion en als exte nsionale Hullen von Punkten bzw. Int ervallen zu: der Betrag der Steigung der Schragen muss eins
1.7 Ahnlichkeitsrelatlonen
49
sein. Es ist allerdings sinnvoll, Skalierungen der iiblichen Metrik zu erlauben, so dass sich auch andere Formen von Fuzzy-Mengen als extensionale Bullen ergeben. Diese Skalierungen konnen zweierlei Bedeutungen haben. Der Ahnlichkeitsgrad zweier Messwerte hangt von der MaBeinheit abo Zwei Messwerte in Kilo-Einheiten gemessen konnen einen sehr geringen Abstand haben und daher als nahezu ununterscheidbar bzw. ziemlich ahnlich angesehen werden, wahrend dieselben Werte in Milli-Einheiten angegeben sehr weit voneinander entfernt liegen und als unterscheidbar erachtet werden . Urn die Ahnlichkeitsrelation an die MaBeinheit anzupassen, muss der Abstand oder die reelle Achse wie im Beispiel 1.19 mit einer Konstanten e> a skaliert werden , so dass sich als skalierte Metrik [c x - c yl ergibt, die die Ahnlichkeitsrelation E(x , y) = 1- minj ]c- x - c YI, I} induziert. Eine Erweiterung dieses Skalierungskonzepts besteht in der Verwendung variabler Skalierungsfaktoren, die eine lokale problemabhiingige Skalierung errnoglichen. Beispiel 1.31 Das Verhalten einer Klimaanlage soli mit unscharfen Regeln beschrieben werden . Es ist weder notwendig noch sinnvoll, die Raumtemperatur, auf die die Klimaanlage reagiert, mit einer moglichst groBen Genauigkeit zu messen. Jedoch spielen die einzelnen Temperaturen unterschiedliche Rollen. So sind beispielsweise Temperaturen von lQoe oder 15°C als viel zu kalt anzusehen, und die Klimaanlage sollte mit voller Leistung heizen, genauso wie Werte von 27°C oder 32°C als viel zu warm zu beurteilen sind und die Klimaanlage daher mit voller Leistung kuhlen sollte . Eine Unterscheidung der Werte lQoe und 15°C bzw. 27°C und 32°C ist daher fur die Regelung der Raumtemperatur irrelevant. Da zwischen lQoe und 15°C nicht unterschieden werden muss, bietet sich ein sehr kleiner, positiver Skalierungsfaktor an - im Extremfall sogar der Skalierungsfaktor Null, bei dem die Temperaturen tiberhaupt nicht unterschieden werden . Es ware jedoch falsch, ftir den gesamten Temperaturbereich einen kleinen Skalierungsfaktor zu wahlen , da die Klimaanlage z.B. zwischen der zu kalten Temperatur 18.5°e und der zu warmen Temperatur 23.5°e sehr deutlich unterscheiden muss. Anstelle eines globalen Skalierungsfaktors sollten hier verschiedene Skalierungsfaktoren fur einzelne Bereiche gewahlt werden , so dass bei Temperaturen, die nahe der optirnalen Raumternperatur liegen, eine feine Unterscheidung vorgenommen wird , wahrend bei viel zu kalten bzw. viel zu warmen Temperaturen jeweils nur sehr grob unterschieden werden muss. Tabelle 1.7 gibt exemplarisch eine Unterteilung in funf Temperaturbereiche mit jeweils eigenem Skalierungsfaktor an . Mittels dieser Skalierungsfaktoren ergibt sich ein transformierter Abstand zwischen den Temperaturen, der zur Definition einer Ahnlichkeitsrelation herangezogen werden kann. In Tabelle 1.8 sind die transformierten Abstande und die sich daraus ergebenden Ahnlichkeitsgrade ftir einige Temperaturwertepaare angegeben. Die einzelnen Wertepaare liegen jeweils paarweise in einem Bereich, in dem sich der Skalierungsfaktor nicht andert. Urn den trans-
50
1. Grundlagen der Fuzzy-Systeme
I Temperatur (in be) I Skalierungsfaktor I Interpretation < 15
0.00
15-19
0.25
19-23 23-27
1.50 0.25
> 27
0.00
genauer Wert bedeutungslos (viel zu kalte Temperatur) zu kalt, aber annahernd o.k., nicht sehr sensitiv sehr sensitiv, nahe dem Optimum zu warm, aber annahernd o.k., nicht sehr sensitiv genauer Wert bedeutungslos (viel zu heiBe Temperatur)
Tabelle 1.7. Unterschiedliche Sensitivitat und Skalierungsfaktoren fur die Raumtemperatur formi erten Abstand und den daraus resultierenden Ahnlichkeitsgrad fur zwei Temp eraturen zu bestimmen , die nicht in einem Ber eich mit konstantem Skalierungsfaktor liegen , ub erlegen wir uns zun achst die Wirkung eines einzelnen Skalierungsfaktors. Wertepaar
Skal.-Faktor
tr ansf. Absta nd
Ahnlichkeitsgrad
(x ,y)
e
(13,14) 14,14.5) 17,17.5) 20,20.5) (21,22) 24,24.5) 28,28.5)
0.00 0.00 0.25 1.50 1.50 0.25 0.00
8(x ,y) = [c x - c -yl 0.000 0.000 0.125 0.750 1.500 0.125 0.000
E( x ,y) = 1- min{8(x,y) , I} 1.000 1.000 0.875 0.250 0.000 0.875 1.000
Tabelle 1.8. Mittels Skalierungsfaktoren tr ansformiert e Absta nde und der induzierte Ahnlichkeitsgrad Betrachten wir ein Int erval! [a , b], bei dem wir den Abst and zwischen zwei Punkten mit dem Skalierungsfaktor c messen , konn en wir ebenso das Interval! urn den Faktor c strecken (falls c > 1 gilt) bzw. st auchen (falls 0 :::; c < 1 gilt) und die Abstande zwischen den Punkten in dem transforrnierten (gest reckten bzw . gestauchten) Intervall berechnen. Urn verschiedene Skalierungsfaktoren ftir einzeln e Bereiche zu beriicksichtigen , miissen wir daher jed es Teilint ervall , auf dem der Skalierungsfaktor konst ant bleibt , ent sprechend strecken bzw. stauchen und die so transformierten Teilint ervalle wieder aneinanderfugen. Auf diese Weise ergibt sich eine stii ckweise linear e Transformation des Werteb ereiches wie sie in der Abb . 1.27 dar gestellt ist . An dr ei Beispielen sol! die Berechnung des transformi erten Abstands und des dar aus resultierend en Ahnlichkeitsg rad es erlaute rt werden. Es soll der Ahnlichkeitsgrad zwischen den Werten 18 und 19.2 bestimmt werden. Der Wert 18 liegt im Interval! 15 bis 19 mit dem konstanten Skalierungsfaktor
1.7
Ahnlichkeitsrelationen
51
transformierter Wertebereich
o1
o
15
7 8
19
23
27
35
ursprlinglicher Wertebereich Abb. 1.27. Transformation eines Wertebereichs rnittels Skalierungsfaktoren 0.25. Dieses Int ervall der Lange vier wird sornit zu einern Int ervall der Lange eins gestaucht . Der Abstand des Wertes 18 zur Intervallgren ze 19 wird daher ebenfalls urn den Faktor 0.25 gestaucht, so dass der transforrnierte Abstand zwischen 18 und 19 genau 0.25 bet ri:i.gt . Um den transforrni ert en Abstand zwischen 18 und 19.2 zu berechnen , rniissen wir zu diesern Wert noch den transforrnierten Abst and zwischen 19 und 19.2 addieren. In diesern Bereich ist der Skalierungsfaktor konst ant 1.5, so dass der Abstand zwischen 19 und 19.2 urn den Faktor 1.5 gestreckt wird und somit den transforrnierten Abst and 0.3 ergibt. Als transforrniert en Abst and zwischen den Werten 18 und 19.2 erh alt en wir somit 0.25+0.3=0.55, was zu einern Ahnli chkeitsgrad von 1 min {0.55, I} = 0.45 fiihrt . Als zweites Beispiel betrachten wir das Wertepaar 13 und 18. Der transforrnierte Abst and zwischen 13 und 15 ist aufgrund des dort konst anten Skalierungsfaktors 0 ebenfalls O. Als transformierter Abstand zwischen 15 und 18 ergibt sich mit dem dor tigen Skalierun gsfaktor 0.25 der Wert 0.75, der auch gleichzeit ig den t ransformierten Abst and zwischen 13 und 18 angibt . Der Ahnli chkeitsgrad zwischen 13 und 18 ist daher 0.25. SchlieBlich sollen noch der t ransformierte Abst and und die Ahnlichkeit zwischen den Werten 22.8 und 27.5 bestimmt werden. Hier mtissen insgesamt dr ei Bereiche mit verschiedenen Skalierungsfaktoren beriicksichtigt werd en : zwischen 22.8 und 23 betri:i.gt der Skalierungsfaktor 1.5, zwischen 23 und 27 genau 0.25 und zwischen 27 und 27.5 konst ant O. Damit ergeben sich als transformierte Abst and e 0.3, 1 und 0 ftir die Wertpaare (22.8,23), (23,27) bzw. (27,27.5). Als Summ e dieser Abst and e gibt der Wert 1.3 den transformierten Abst and zwischen 22.8 und 27.5 an. Als Ahnlichkeit sgrad erhalte n wir somit 1-min{1.3,1} = 0. 0 Die Idee, ftir einzelne Bereiche unterschiedliche Skalierungsfaktoren zu verwenden , lasst sich erweit ern, ind em man jedem Wert einen Skalierungsfaktor zuordnet , der angibt, wie genau in der dir ekt en Umgebung des Wertes unt erschieden werden sollte . Anst elle einer stii ckweise konst anten Skalierun gsfunk tion wie im Beispiel 1.31 konnen so beliebige (integrierbare) Ska-
52
1. Grundlagen der Fuzzy-Systeme
lierungsfunktionen c : IR - t [0,00) verwendet werden. Der transformierte Abstand zwischen den Werten x und y unter einer solchen Skalierungsfunktion wird dann mit Hilfe der Formel (1.17) berechnet [89] .
1.7.3 Interpretation von Fuzzy-Mengen Fuzzy-Mengen lassen sich als induzierte Konzepte ausgehend von Ahnlichkeitsrelationen, etwa als extensionale HiiIlen scharfer Mengen, interpretieren. 1m Folgenden solI die Betrachtungsweise umgekehrt werden, d.h., wir gehen von einer Menge von Fuzzy-Mengen aus und suchen eine geeignete Ahnlichkeitsrelation dazu. Die hier vorgestellten Ergebnisse werden wir spater ftir die Interpretation und Untersuchung von Fuzzy-Reglern verwenden. Bei Fuzzy-Reglern werden iiblicherweise ftir den Wertebereich jeder relevanten Variablen unscharfe Ausdriicke zur Beschreibung von ungefahren Werten verwendet. Diese unscharfen Ausdriicke werden wiederum durch Fuzzy-Mengen reprasentiert. Es ist also fur jeden Wertebereich X eine Menge A ~ F(X) von Fuzzy-Mengen vorgegeben. Die diesen Fuzzy-Mengen inharente Ununterscheidbarkeit lasst sich - wie wir spater noch genauer sehen werden - mit Hilfe von Ahnlichkeitsrelationen charakterisieren. Eine entscheidende Rolle spielt dabei die grobste (grofite) Ahnlichkeitsrelation, bei der aIle Fuzzy-Mengen in der betrachteten Menge A extensional sind. Der folgenden Satz, der in [90] bewiesen wird, beschreibt, wie diese Ahnlichkeitsrelation berechnet werden kann.
Satz 1.32 Es sei t eine stetige t-Norm und A C F(X) eine Menge von Fuzzy-Mengen. Dann ist
EA(X,y) = inf {t(J-t(x) ,J-t(y)) I J-t E
A}
(1.18)
die grobste Ahnlichkeitsrelation bezilglich der t-Norm t, bei der olle FuzzyMengen aus A extensional sind. Dabei ist t die zur t-Norm t gehOrende Biimplikation aus Gleichung (1.4). Mit grobster Fuzzy-Relation ist hier gemeint, dass fiir jede Ahnlichkeitsrelation E, bei der aIle Fuzzy-Mengen aus A extensional sind, folgt, dass EA(X , y) 2: E(x , y) fiir aIle x, y E X gilt. Die Formel (1.18) fiir die Ahnlichkeitsrelation EA lasst sich sinnvoll im Rahmen der Fuzzy-Logik erklaren, Interpretiert man die Fuzzy-Mengen in A als Reprasentation unscharfer Eigenschaften, so sind zwei Elemente x und y beziiglich dieser Eigenschaften ahnlich zueinander, wenn ftir jede "Eigenschaft" J-t E A gilt , dass x genau dann die Eigenschaft J-t besitzt, wenn auch
1.7 Ahnlichkeitsrelationen
53
y sie besit zt . Ordnet man der Aussage " x besit zt die Eigenschaft J..l" den Wahrheitswert J..l (x) zu und interpr etiert "genau dann , wenn " mit der Biimplikation t, so ergibt sieh, wenn "flir jede" im Sinne des Infimums aufgefasst wird , gerade die Formel (1.18) ftir den Ahnlichkeitsgrad zweier Element e. Beispiel 1.30 zeigte, dass typische Fuzzy-Mengen wie Dreieeksfunktionen als exte nsionale Hilllen einzelner Punkte auft rete n. Fur die Fuz zy-Hegler wird die Int erpret ation einer Fuzzy-Menge als unsehar fer Punkt sehr hilfreieh sein. Wir widmen uns dah er noeh der Frage, wann die Fuzzy-Mengen in einer vorgegebenen Menge A ~ F(X ) von Fuzzy-Mengen als exte nsiona le Hull en von Punkten aufgefasst werden konnen . Satz 1.33 Es sei t eine stetige i-Norm und A ~ F(X) eine Menge von Fuzzy-Mengen. Zu jedem J..l E A existiere ein x /l E X mit J..l(x/l) = 1. Es existiert genau dann eine Ahnlichkeitsrelation E, so dass fur alle J..l E A die extensionale Hiille des Punkt es x /l mit der Fuzzy-Menge J..l iibereinstimmi, wenn die Bedingung
sup {t(J..l (X), v (x )) } ::; in£{ t (J..l (y), v (y ))} xEX
(1.19)
yEX
fur alle u; v E A erfullt ist. In diesem Fall ist E = EA die grobste Ahnlichkeitsrelation, bei der die Fuzzy-Mengen in A als extensionale Hiillen von Punkt en aufgefasst werden kimnen. Die Bedingung (1.19) besagt , dass der Nicht-Disjunktheits grad zweier beliebiger Fuzzy-Mengen u ;v E A nieht grofer sein dar f als ihr Gleichheitsgrad . Die entspreehenden Forrneln ergeben sieh, indern die folgenden Bedingungen im Sinne der Fuzzy-Logik int erpr etiert werden: • Zwei Mengen J..l und v sind genau dann nieht disjunkt , wenn gilt
(:3x )(x
E
J..l f\ x
E
v ).
• Zwei Mengen J..l und v sind gena u dann gleich, wenn gilt
(Vy)(y E f.1
<-4
Y E v).
Die Bedingung (1.19) aus Satz 1.33 ist insbesondere dann automa tiseh erfullt, wenn die Fuzzy-Mengen f.1 und v bezuglich der t-Norm t disjunkt sind, d.h., es gilt t (IL (x ), v(x )) = 0 fur aIle x E X . Der Beweis des Satzes findet sieh in [97]. Die Variablen, die bei Fuzzy-Reglern eine Rolle spielen, sind tiblicherweise reelI. Ahnliehkeit srelat ionen tiber den reellen Zahlen lassen sich sehr einfach und sinnvoll auf der Grundlage von Skalierungsfunktionen basierend auf dem Abstandsbegriff, wie er in der Formel (1.17) gegeben ist , definieren. Fur den Fall, dass die Ahnliehkeitsrelation im Sat z 1.33 dur ch eine Skalierungsfunktion indu ziert werden solI, wurd e in [89] das folgende Result at bewiesen .
54
1.
Gruncllagen der Fuzzy-Systeme
~ F (IR) eine nicht-leere, luichstens abziihlbare Menge von Fuzzy-Mengen, so dass fur jedes j.L E A gilt:
Satz 1.34 Es sei A • • • • •
Es existiert ein xJ1 E lR mit j.L(xJ1) = 1. j.L ist (als reellwertige Funktion) auf (-00, xJ1] monoton steigend. j.L ist auf [xJ1 , - 00) monoton fallend. j.L ist stetig. j.L ist fast iioeroll differenzierbar.
Es existiert genau dann eine Skalierungsfunktion c : lR --+ [0, 00), so dass fur aile j.L E A die extensionale Hillle des Punktes xJ1 bezuglich der Ahnlichkeitsrelation Y
E(x,y) = I -min { 11
C(S)ds l,l }
mit der Fuzzy-Menge j.L tibereinstimmt, wenn die Bedingung min{j.L(x), v(x)}
>0
~ Id~~) I = Id~~) I
(1.20)
fur aile u, v E A fast iiberall erfullt ist. In diesem Fall kann c : lR --+ [0, 00),
t-+ {
X
Id~~x) I falls j.L E A o
und j.L(x) > 0
sonst
als (Jast iiberall wohldefinierte) Skalierungsfunktion gewiihlt werden. B e ispiel 1.35 Urn zu veranschaulichen, wie extensionale Hiillen von Punkte n beziiglich einer durc h eine stiickweise konst ante Skalierungsfunktion induzierte Ahnlichkeitsrelation aussehen, greifen wir noch einmal die Skalierungsfunktion
c : [0,35)
--+
[0, 00),
S t-+
r
0.25 1.5 0.25 0
falls falls falls falls falls
0 15 19 23 27
:Ss< :Ss< :Ss< :Ss< :Ss<
15 19 23 27 35.
aus Beispiel 1.31 auf. Abb . 1.28 zeigt die extensionalen Hiillen der Punkte 15, 19, 21, 23 und 27 beziiglich der Ahnlich keitsrelation, die durch die Skalierungsfunktion c induziert wird. Dass diese extensionalen Hiillen Dre iecks- oder Trapezfunktionen darstellen, liegt daran, dass die Skalierungsfunkt ion links bzw. rechts der angegebenen Punkte sich friihestens dan n ande rt, wenn der Ahnlichkeitsgrad zu dem betrachteten Punkt auf null gesunken ist . Wahlt man Punkte, in deren Nahe sich die Skalierungsfunktion andert , die abe r nicht direkt auf einer Sprungstelle der Skalierungsfunktion liegen, ergeben sich La. nur stiickweise lineare ,
1.7 Ahnlichkeitsrelationen
55
1
-'l- . . . ..
---->'f--+---.l...- -+---l----+-----jl'-----
~
o
19 19.7 21 22.3 23
15
27 35
Abb . 1. 28. Die extensionalen Hiillen der Punkt e 15, 19, 21, 23 und 27
o
+---- ---+----1--+- --
15
18 1919.5
-+--1---+ -
-"1--
21.822 .523 24
-
-
--+ . . . ..
27 35
Ab b. 1. 29. Die extensionalen Hiillen der Punkte 18.5 und 22.5 konvexe Fuzzy-Mengen als extensionale Hiille von Punkten, wie sie in Abb. 1.29 zu sehen sind . Haufig werden bei Fuzzy-Rcglcrn die zugrundelicgend en Fuzzy-Mcngcn auf die folgend e Weise festgelegt , wie sie in Abb . 1.30 veran schaulicht ist. Man wahl t Werte Xl < X2 < . .. < X n und verwend et Dreicksfunktionen der Form A Xi _1 ,Xi ,Xi +l bzw. an den Randern X l und X n des betracht et en Bereichs die Trap ezfunk tionen IJ- oo , - oo ,X l ,X2 und IJXn _ 1,x n ,oo ,oo , d.h.
In diesem Fall lass t sich immer eine Skalierungsfunk tion c angeben, so dass die Fuzzy-Mengen als exte nsionale Hullen der Punkte X l, . . . , X n interpreti erb ar sind, namlich
c(X )
=
1
falls
Xi
< X < X i+ l, o
Nachdem wir uns so ausfiihrlich mit Ahnlichkeitsrelationen auseina ndergesetzt hab en , sollen einige prin zipielle Uberlegungen iiber Fuzzy-Mengen , Ahnli chkeitsrelationen und deren Zusammenh iinge folgen. Der Grundgedank e bei Fuzzy-Mengen best eht in der Moglichkeit , gra duelle Zugehori gkeitsgrade zu verwend en. Ahnli chkeitsrelatlonen basieren auf dem fund am entalen Konzept der Ununterscheidba rkeit oder Ahnlichkeit. Das
56
1.
Grundlagen der Fuzzy-Systeme
1
Abb. 1.30. Fuzzy-Mengen, fur die sich eine Skalierungsfunktion definieren lasst
Einheitsint ervall dient als Wertebereich sowohl ftir gradueller Zugehor igkeiten als auch ftir Ahnlichkeitsgr ade . Die Zahlenwerte zwischen 0 und 1 werden dab ei auf eine eher intuitive Weise interp retiert. Eine eindeut ige Festi egung, was ein Zugehorigkeits- oder Ahnlichkeitsgrad von 0.8 oder 0.9 bedeut et und worin der Unterschied zwischen beiden besteht , auBer, dass 0.9 grofler als 0.8 ist , wird nicht naher festgelegt . Ahnlichkeitsrelati onen beziiglich der Lukasiewicz-t-Norrn lassen sich auf P seudometriken zuriickfuhren. Das Konzept der Metrik bzw. der Abst and sbegriff ist zumindest bei dem Umgang mit reellen Zahlen elementar und bedarf keiner weit eren Erkl iirung. In diesem Sinne sind Ahnlichkeitsrelationen auf den reellen Zahl en, die dur ch die kanonische Metrik - eventuell unt er Beriicksichtigung einer geeigneten Skalierung - indu ziert werden , als elementares Konzept anzusehen, bei dem die Ahnlichkeitsgrade dual zum Abstandsbegriff bei Metriken interpretiert werden. Fuzzy-Mengen lassen sich wiederum als aus Ahnlichkeitsrelat ionen abgeleitetes Konzept im Sinne exte nsionaler Hiillen von Punkten oder Mengen auffassen, so dass auf diese Weise den Zugehorigkeitsgraden eine konkrete Bedeutung beigemessen wird . Es stellt sich die Frage, inwieweit Fuzzy-Mengen in diesem Sinne interpret iert werden sollten. Die Antwort laut et sowohl ja als auch nein. Ja , in dem Sinne, dass eine fehlende Int erpret at ion der Zugehorigkeitsgrade dazu fuhrt , dass die Wahl der Fuzzy-Mengen und der Op erationen wie t-No rmen mehr oder weniger willkiirlich wird und sich als reines P arameterop timi erungsprobl em darstellt. Ja, auch in dem Sinne, dass man es zumindest im Bereich der Fuzzy-Reglcr La. mit reellen Zahlen zu tun hat und dass nicht willkiirliche Fuzzy-Mengen im Sinne beliebiger Funktionen von den reellen Zahlen in das Einheitsint ervall verwendet werd en, sondern ublicherweise Fuzzy-Mengen, die auf der Basis von Ahnlichkeitsrelati onen interpretierb ar sind. Auch die vorgest ellten Zusamm enh iinge zwischen Fuzzy-Mengen und Ahnlichkeitsrelation en, die es ermoglichen, aus Ahnlichkeitsrelationen Fuzzy-Mengen abzuleiten und umgekehrt, Ahnlichkeitsrelat ionen zu FuzzyMengen zu bestim men , spr echen fiir die Int erp reta tion der Fuzzy-Mengen mittels Ahnlichkeitsrelat ionen. Trotz dieser Griinde ist die Deutung der Fuzzy-Mengen im Sinne von Ahnlichkeits relationen nicht zwangslaufig, wie die Possibilit iitstheorie zeigt. Es
1.7
A.hnlichkeitsrelationen
57
wiirde zu weit fiihren , detailliert zu erlautern, wie Fuzzy-Mengen als Possibilitiitsverteilungen aufgefasst werden konnen . Das folgende Beispiel vermittelt eine Idee, wie Possibilitiitsverteilungen interpretiert werden konnen. Beispiel 1.36 Wir betrachten ein kleines Gebiet in dem Flugzeuge mit einer automatischen Kamera beobachtet werden. Die Aufzeichnungen mehrerer Tage ergeben, dass 20 Flugzeuge vom Typ A, 30 vom Typ B und 50 vom Typ C das Gebiet tiberquert haben. Wenn man hart , dass ein Flugzeug tiber das Gebiet fliegt, wiirde man annehmen, dass es sich mit 20-, 30- bzw. 50-prozentiger Wahrscheinlichkeit urn ein Flugzeug des Typs A, B bzw. C handelt. Dieses Beispiel soli nun leicht modifiziert werden, urn die Bedeutung von Possibilitiitsverteilungen zu erliiutern. Zusatzlich zu der automatischen Kamera steht ein Radargeriit und ein Mikrophon zur Verfiigung. Wiederum wurden 100 Flugzeuge mit Hilfe des Mikrophons registriert. Allerdings konnten aufgrund schlechter Sichtverhaltnisse durch die Kamera nur 70 Flugzeuge eindeutig identifiziert werden, namlich 15 vom Typ A, 20 vom Typ B und 35 vom Typ C. Bei den rest lichen 30 Flugzeugen ist das Radargeriit bei 10 Flugzeugen ausgefallen, so dass uber den Typ dieser Flugz euge nichts ausgesagt werden kann. Uber die 20 Flugzeuge, die das Radargeriit geortet hat und die nicht durch die Kamera identifiziert werden konnten, lasst sich sagen , dass 10 eindeutig vom Typ C sind, da dieser Flugzeugtyp durch seine wesentlich geringere GroBe durch das Radar von den Typen A und B unterschieden werden kann , wahrend die anderen 10 vom Typ A oder B sein miissen. Die 100 Beobachtungen liegen jetzt nicht mehr wie im ersten Fall vor, in dem man bei jeder Beobachtung genau einen Flugzeugtyp identifizieren konnte und somit fur jeden Flugzeugtypen genau angeben konnte , wie oft er beobachtet wurde. Jetzt lassen sich die einzelnen Beobachtungen als Mengen moglicher Flugzeuge darstellen. Wie oft die jeweilige Menge beobachtet wurde, ist noch einmal in Tabelle 1.9 zusammengefasst. Menge beobachtete Anzahl Tabelle 1.9. Mengenwertige Beobachtungen von Flugzeugtypen Eine Wahrscheinlichkeit fur die einzelnen Flugzeuge lasst sich nun nicht mehr ohne Zusatzannahmen tiber die Verteilung der Flugzeugtypen bei den Beobachtungen {A , B} und {A , B , C} angeben. Eine Alternative bieten hier die (nicht-normalisierten) Possibilitiitsverteilungen. Anstelle einer Wahrscheinlichkeit im Sinne einer relativen Haufigkeit bestimmt man einen Moglichkeitsgrad, indem man den Quotienten aus den Fall en, in denen das Auftreten des ent sprechenden Flugzeugs aufgrund der beobachteten Menge moglich ist, und der Gesamtzahl der Beobachtungen bildet. Auf diese Weise erhalt man als Moglichkeitsgrad 35/100 fiir A, 40/100 fiir B und 55/100
58
1. Grundlagen der Fuzzy-Systeme
fiir C. Diese "Fuzzy-Menge" tiber der Grundmenge {A,B,C} bezeichnet man dann als Possibilitiitsvertcilung. 0 Dieses Beispiel verdeutl icht den Unterschied zwischen einer possibilist ischen und einer auf Ahnlichkeitsrelationen bas ierenden Interpret at ion von Fuzzy-Mengen. Der possibilisti schen Sicht liegt eine Form von Unsicherheit zugrun de, bei der das wahrscheinlichkeitstheoretisc he Konzept der relat iven Haufigkeit durch Moglichkeitsgrade ersetzt wird . Die Grundlage der Ahnlichkeitsrelationen bildet nicht ein Unsicherheitsbegriff, sondern eine Vorste llung von Ununterscheidbarkeit oder Ahnlichkeit , insbesondere als Dualit iit zum Konzept des Abstandes. Bei den Fuzzy-Reglern steht eher die Modellierung von Imprazision auf der Basis "kleiner Abst and e" im Vordergrund , so dass fiir das Verst andnis der Fuzzy-Regler die Ahnlichkeitsrelationen wichtiger sind.
2. Regelungstechnische Grundlagen
Dieses Kapi t el wend et sich an diejenigen Leser , die noch keine Kenntnisse auf dem Gebiet der Regelun gst echnik hab en. Es sollen einerseit s die regelungst echnischen Grundlagen vermi ttelt werd en , die zum Verstandnis eines Fuzzy-Reglers und zur Beha ndlung weiterflihrend er Fragen in diesem Zusammenh ang erforderlich sind . And ererseit s solI ab er auch ein Uberb lick tiber die Moglichkeiten der klassischen Regelun gst echnik gegeben werd en , damit der Leser im Hinblick auf einen konkret en Anwendungsfall selbst abscha tze n kann , ob das P robl em mit einem Fuzzy-RegIer oder doch besser mit einem konventionellen RegIer zu losen ist . Auf eine vollst andige Einftihrung in die Grundlagen der Regelungst echnik muss hier aber verzicht et werden , da das Kapi tel sonst den Rahmen dieses Buch es spr engen wiird e. Umfassendere Darst ellun gen finden sich zum Beispiel in den Biichern von O. Follinger [44, 45, 46], W . Leonh ard [106] und H. Unbeha uen [190] - [192].
2.1 Grundbegriffe Die Regelun gst echnik beschaftigt sich mit der Beeinflussung von Syst emen , urn bestimmten Ausgangs groben einen gewtinschten zeitlichen Verlauf aufzu pr agen. Dies konn en technische Syst eme sein wie eine Raumheizun g mit der Ausgangsgrofe Ternperatur , ein Schiff mit den Ausgan gsgroben Kurs und Geschwindigkeit oder ein Kr aft werk mit der Ausgan gsgrolle abgegebene elek trische Leistung. Es konn en aber auch soziale, chemische oder biologische Syst eme sein, wie zum Beispiel das System Volkswirtschaft mit der Ausgan gsgrofe Inflationsrat e. Die Nat ur der Syst eme spielt keine Rolle. Lediglich ihr dyn amisches Verhalten ist fur den Regelungstec hniker von Interesse. Dieses kann durch Differential gleichungen , Differenzengleichun gen oder andere Funktionalb eziehungen beschrieben werd en. In der klassischen Regelun gstechnik , die sich vorwiegend mit technischen Systemen beschaftigt, wird das zu beeinflussende Syst em als Strecke bezeichnet . Wie kann die Beeinflussung der Str ecke erfolgen ? Jede Strecke hat nicht nur Ausgan gs-, sondern auch Eingangsgrofe n. Bei der Raumheizun g ist dies zum Beispiel die Stellun g des Heizun gsventils, beim Schiff die Leistung des Schiffsmotors und die Ruderstellung. Diese Ein gan gsgrofen sind so zu verstellen , dass die Ausgan gsgrofien den gewunschten Verlauf aufweisen. Sie werden K. Michaels et al., Fuzzy-Regelung © Springer-Verlag Berlin Heidelberg 2002
60
2. Regelungstechnische Grundlagen
deshalb auch als StellgroBen bezeichnet. Neben den Stellgrofen wirken auf die Strecke aber auch StorgraBen ein. Bei der Raumheizung wird die Temperatur zum Beispiel noch durch die Anzahl der Personen im Raum oder durch das Offnen der Fenster beeinflusst, wahrend beim Schiff Stromungen auftreten konnen, die den Kurs beeinflussen. Der gewiinschte zeitliche Veriauf der Ausgangsgroflen wird durch die Sol1graBen oder Sol1werte definiert. Diese konnen von Menschen festgelegt werden oder aber auch von einem vollig anderen System stammen. Ihre Entstehung soll hier nicht diskutiert werden, sie werden als gegeben hingenommen. Zu beachten ist, dass ein Sollwert nicht unbedingt einen konstanten Wert aufweisen muss. Er kann auch durchaus ein zeitveranderliches Signal sein. Welche Information ist nun erforderlich, urn Stellgrofen zu berechnen, die die Strecke so beeinflussen, dass die Ausgangsgrofen gleich den Sollwerten sind? Offensichtlich miissen die einzuhaltenden Sollwerte ftir die Ausgangsgrofen, das Verhalten der Strecke und der zeitliche Verlauf der Storgrofen bekannt sein. Damit lassen sich, zumindest theoretisch, Stellgrofen erzeugen , die wiederum das System gerade so beeinflussen, class die Ausgangsgroben den vorgeschriebenen Verlauf haben. Dies ist das Prinzip einer Steuerung (Abb . 2.1). Eingangsgrofe der Steuerung ist der Sollwert w, ihre AusgangsgroBe ist die Stellgrofe u. Diese ist wiederum - zusammen mit der Storgrofe d - eine Eingangsgrofie der Strecke . y ist die Ausgangsgrofie des Systems. Der Nachteil des Verfahrens liegt auf der Hand. Entspricht das Verhalten der Strecke nicht den gemachten Annahmen oder treten unvorhergesehene Storungen auf, so werden die Ausgangsgrofien nicht mehr dem gewlinschten Veriauf entsprechen. Eine Steuerung kann auf diese Abweichung aber nicht reagieren, da ihr die Ausgangsgroflen der Strecke gar nicht bekannt sind.
y Steuerung
Strecke
Abb. 2.1. Prinzip einer Steuerung
Als Verbesserung ergibt sich sofort das Prinzip einer Regelung (Abb. 2.2). Der Sollwert w (FiihrungsgroBe) wird im Hegler mit der gemessenen Ausgangsgrofle der Strecke y (Istwert, RegelgraBe) verglichen , und im Regelglied wird aus der Differenz LJ.y (Regelabweichung) eine geeignete ReglerAusgangsgrofie u berechnet. Friiher ist das Regelglied selbst als Hegler bezeichnet worden, doch weisen moderne Regier, unter anderem auch FuzzyRegier , eine Struktur auf, in der sich Differenzbildung und Rechnen des Regelalgorithmus nicht mehr auf die gezeichnete Art und Weise trennen lassen . Deshalb geht man heute dazu tiber, den Block, in dem aus Fiihrungs- und gemessener Regelgrofe eine Regler-AusgangsgroBe erzeugt wird , als Regier zu bezeichnen.
2.1 Grundbegriffe
61
Die GroBe u liegt normalerweise als Signal mit niedri ger Leistung, heutzut age meist als digit ales Signal, vor. Mit niedri ger Leistung ist ab er eine Beeinflussung des physikalischen Prozesses nicht zu erreichen. Wie will man beispielsweise mit einem digital errechneten Rud erwinkel, also einer Folge aus Nullen und Einsen bei einer Spannung von 5 Volt , ein Schiff dazu bringen, den Kurs zu andern? Da dies nicht auf dir ekt em Wege moglich ist , sind beispielsweise noch ein Stromrichter und eine elekt rische Ruderm aschine erforderlich, die ihrerseits erst die Ruderst ellung und damit auch den Kurs des Schiffes beeinflussen kann. Fasst man die Ruderstellun g als Stellgrofie des Syste ms auf, so bilden Stromrichter, Ruderm aschine und Ruder zusa mmengefasst das Stellglied, in dem ein Signal niedriger Leistung, namlich die Regler-Ausgangsgr6Be, in ein Signal hoher Leistung, die Rud erst ellun g, umgewand elt wird . Man konnte ab er beispielsweise auch die Ausgangsgrofe des Stromricht ers , also die Ankerspannung bzw. den Ankerstrom der Rudermaschine, schon als Stellgrofe auffassen. In dem Fall bestande das Stellglied nur noch aus dem St romrichter, wahrend das dyn amische Verh alten der Rud erm aschine und des Ruders selbst dem der Strecke hinzu zur echnen ware. Daran wird deutlich, dass eine allgemein giilt ige Abgrenzung zwischen Ste llglied und Strecke nicht moglich ist . Letztendl ich ist sie aber auch gar nicht erforder lich, denn fiir die Auslegung eines Reglers muss sowieso das gesamte Ubertragungsverhal ten von der Ausgan gsgr6Be des Reglers bis zur Regelgr6Be berlicksichtigt werd en. Das Stellglied wird daher von nun an als Teil der Strecke betrachtet und die Regler-Ausgangsgr6Be im Folgenden als Stellgr6Be bezeichnet . Fur die Rilckfiihrung der Regelgrofie zum RegIer stellt sich in umgekehr ter Richtung dieselbe Aufgab e wie fur das Ste llglied. Ein Signal hoher Leistung ist in ein Signa l niedriger Leistung umzuform en . Dies geschieht im Messglied , dessen dynamische Eigenschaften entweder zu vernachlassigen oder wie schon beim Stellglied der Strecke hinzuzurechnen sind. Durch die Ruckkopplung entsteht ein entscheidendes Problem, das durch ein Beispiel verdeutlic ht werden soli (Abb. 2.3). Die Regelst rategie fur den Kursregler eines Schiffes konnte lau ten: J e gr6Ber die Kursabweichung, desto starker muss das Rud er in entgegengeset zter Richtung ausgelenkt werden. Ob erflachlich betracht et wirkt diese Stra tegie verniinftig. Falls aus irgendeiHem Grund eine Kur sabweichung vorliegt , wird das Ruder verst ellt. Dur ch die Auslenkung des Rud ers entsteht eine Drehbeschleuni gung des Schiffes in Richtung des Sollkur ses. Die Kursabweichung verringert sich, bis sie schlieBlich verschwindet . Die Drehgeschwindigkeit des Schiffes ist zu diesem Zeitpunkt aber nicht verschwunden, sie kann nur durch entgegengesetzt es Auslenken des Ruders wieder zu Null gemacht werden. 1m vorliegenden Beispiel wird das Schiff als Folge seiner Drehgeschwindigkeit nach Erreichen des Sollkur ses eine Kursabweichung zur anderen Seite erfahren. Erst dann wird die Drehgeschwindigkeit durch entgege ngesetztes Auslenken des Rud ers verschwinden. Da nun aber wieder eine Kur sabweichung vorliegt , beginnt der ganze Vorgang
62
2. Regelungstechnische Grundlagen
y
!'J.y
w
' - - - -.-'
Regelghed -
-
-
-
-
-
-
-
-
1 1 1
1
'---.-' 1 Stellghed Prozess 1 1 _____ _ _________ _ 1
_I
Strecke
Regier
Messglied I
----+---
Signale niedriger Leistung 1 Signale hoher Leistung I
Abb . 2 .2. Elemente eines Regelkreises mit anderem Vorzeichen von neuem. Die entstand ene Kur sabweichung ist rnoglicherweise sogar noch grofier als die vorhergeh end e. Das Schiff wird sich in einem Schlingerkurs bewegen , dessen einzelne Auslenkungen im ungun sti gsten Fall imm er groBer werd en. Diesen Fall bezeichnet man als Instabilitat . Bei gleichbleib end en Schwingun gsamplituden spricht man vom Stabilitiitsgrenz fall, nur bei abnehmenden Ampli tuden ist das System sta bil. Urn eine akzeptable Regelung zu erha lte n, hatte man im vorliegenden Fall die Dynamik der Strecke bei der Auswahl der Regelstrategie berucksicht igen mu ssen . Ein geeignete r RegIer erzeugt rechtz eitig eine Gegenauslenkung des Ruders, dami t bei Erreichen des vorgegebe nen Kurses auch die Drehgeschwindigkeit des Schiffes verschwunden ist .
Sollkurs
Abb. 2.3. Kursregelung eines Schiffes Anhand dieses Beispiels werd en auch die Anforderungen an eine Regelung klar. Ein e Ford erung ist die Genauigkeit , d.h. die Regelabweichun g soli im stationaren Zustand nach Beendi gun g aller Ein schwingvorgange moglichst klein sein. Ein e weit ere Ford erung ist die Schnelligkeit , d.h. im Faile einer Ftihrungsgrollenanderu ng oder einer Storung soli die entstandene Regelabweichung moglichst schnell wieder eliminiert werd en . Man spricht in diesem
2.2 Modell der Strecke
63
Fall votn Fiihrungs- bzw. Storverhalten des geschlossenen Regelkreises . Die dritte und wichtigste Forderung ist die nach der Stabilitat des Gesamtsyst ems. Es wird sich noch zeigen, dass diese Forderungen einander teilweise widersprechen, so dass jeder RegIer (auch ein Fuzzy-Regler) immer nur einen Kompromiss hinsichtlich dieser Forderungen darstellen kann.
2.2 Modell der Strecke 2.2.1 Problemstellung In der klassischen Regelungstechnik besteht der Entwurf einer Regelung aus zwei Schritten. Im ersten Schritt wird die Regelstrecke analysiert und ein sie beschreibendes, mathematisches Modell erste llt. Im zweit en Schritt wird auf der Basis dieses Modells ein RegIer entwickelt. Zur Beschreibung eines dynamischen Systems biet en sich Differentialoder Differenzengleichungen an. Es wird versucht , das dynamische Verhalten durch einen Satz moglichst einfacher Gleichungen zu beschr eiben . Diese konnen dann durch graphische Symbole veranschaulicht und zu einem Strukturbild , dem sogenannten Blockschaltbild zusammengefasst werden . Die graphische Darstellung hat den Vorteil, dass die Wirkung der einzelnen GraBen aufeinander relativ einfach zu iiberschauen ist, was spater die Auslegung einer Regelung natiirlich erleichtert. An einem einfachen Beispiel soli die Vorgehensweise erlautert werden (Abb . 2.4): Gegeben sei ein Korp er der Masse m, der tiber eine Feder an einer Wand befestigt und auf einer ebenen Unterlage in einer Richtung frei beweglich ist . Auf diesen Korp er wirken die Antriebskraft fa sowie die durch Reibung auf der Unt erlage entstehende Kraft f r und die Riickstellkraft der Feder !J . Reibungs- und Riickstellkraft wirken der Antriebskraft entgegengericht et. Die GroBe l gibt die Auslenkung des Korpers aus der Ruhelage an . Gesucht ist ein Modell, das den dyn amischen Zusammenhang zwischen Antriebskraft und Auslenkung des Korp ers beschreibt .
~~ [<-f. ;;;7;;;--;:;;};
Abb, 2.4. Aufbau eines Feder-Masse-Systems
Nun sind die das System beschreibenden Gleichungen aufzust ellen. Als erstes wird die Newtons che Bewegungsgleichung betrachtet , die den Zusammenhang zwischen den am Korp cr angreifenden Kraften und der resultierenden Beschleuni gung a angibt : 1
a(t) = - (Ja(t ) - !J(t) - f r(t)) m
(2.1)
64
2. Regelungstechnische Grundlagen
Weiterhin gelten die durch Differentiation oder Integration definierten Zusammenhange zwischen Beschleunigung und Geschwindigkeit v bzw. zwischen Geschwindigkeit und Weglange l:
J t
a(t) = dv(t) dt
bzw.
a(r)dr + v(O)
v(t ) =
(2.2)
r=O
J t
v(t) = dl(t) dt
bzw. l(t)
v(r)dr + l(O)
=
(2.3)
r=O
Die RiicksteBkraft der Feder sei proportional zu ihrer Auslenkung, ebenso sei die durch die Reibung entste hende Kraft proportional zur Geschwindigkeit des Korpers:
ft(t) = ci l(t)
(2.4)
v(t )
(2.5)
fr (t) =
Cr
2.2.2 Normierung
Da ftir die weiter en Betrachtungen vorausgeset zt wird, dass aBe GraBen in diesen Gleichungen dimensionslos sind , miissen sie nun zunachs t normi ert werden. Dazu sind beispielsweise ftir Gleichung (2.1) eine konstante Beschleunigun g ao , eine konstante Masse mo und eine konst ante Kraft fo = aomo festzulegen. Diese Crofen sollten, urn unnotigen Rechenaufwand zu vermeiden, jeweils den Wert Eins hab en, also ao = 1 ~ , mo = lkg und fo = 1~ . AnschlieBend wird die Gleichung durch ao dividiert:
a(t) = ao
~ ~(fa(t) - ft(t) - f r(t)) ma
fo
(2.6)
Man erhalt eine neue Gleichung
a'(t) =
],(f~(t) m
fj(t) - f;(t))
(2.7)
Ii:) ,
mit den dimensionslosen GraBen a'(t) = a~~) , m' = ~ und f'(t) = die ab er zahlenmafiig dieselben Zusamm enhange aufweist wie die Ausgangsgleichung (2.1). Dieses Beispiel zeigt , dass es sich bei der Normierung im Prinzip urn einen rein formalen Schritt hand elt. Wenn man von vornherein in den Einheiten des MKS-Systems arbeitet , erfolgt die Normierung dur ch einfaches Weglassen der Einh eiten. Es kann aber auch Faile geben , in denen es sinnvoll ist , einzelne GraBen nicht mit dem Wert Eins , sondern mit anderen Werten zu normi eren. Beispielsweise, wenn die in eine Gleichung eingehenden GraBen vollig verschiedene GraBenordnungen aufweisen und es so zu numm erischen Problemen
2.2 Modell der Strecke
65
komm en kann. Oder auch, wenn ein Wertebereieh auf das Einh eitsintervall beschrank t werd en soil, wie d ies oft bei Fuzzy-Reglern der Fall ist . Ein e Ausna hme stellt allerdings die Zeit t dar. Sie sollt e immer mit to = I s normiert werden , urn aueh naeh der Normieru ng noeh eine Abschat zung der zeitliehen Ablau fe zu errnoglichen . Im Folgend en wird davon ausgegangen , dass aile auftrete nden physikalisehen GraBen geeignet normiert sind, weshalb auf eine besondere Kennzeiehnung verziehtet werden solI. Als Grundlage der weiteren Betraehtungen kann man dami t wieder zu den Gleiehung en (2.1) bis (2.5) zurliekkehren und st illsehweigend vorau ssetzen , dass es sieh bei allen beteiligte n C rofen urn dim ensionslose GraBen handelt . 2.2.3 Elementare lineare Ubertragungsglieder
Die einzelne n Gleiehungen miissen nun dureh geeignet e Symb ole repr asenti ert werd en. Benotig t werd en demn aeh gra phisehe Darstellun gen fur die additive Uberlagerung versehiedener Signale, die Multiplikation mit einem konstant en Faktor und die Integration einer Cr of e. Diese sogena nnte n Ubertragungsglieder sind in Abb . 2.5 dar gestellt. Die Ausgan gsgrofle des Summierers entsprieht der Summ e der beiden Eingangsgrofen , die Ausgangsgrofe des Proportionalgliedes der mit k mult iplizierten Eingan gsgroflc, und die Ausgangsgrofe des Integrat ors dem iiber die Zeit t integrierten Eingangssignal, wobei die Ausgan gsgrofie zu einem Zeitpunkt t = 0 normalerweise als Null angeno mmen wird .
Summ ierer
Proporti onalglied
Integrator
Abb. 2.5. Elementc von Blockschaltbildern Mit diesen Elernenten lasst sieh das Bloeksehaltbild 2.6 der St reeke angebe n. Die Surnmi erer und das Proportionalglied ~ ste llen die Newtonsehe Bewegun gsgleiehun g (2.1) dar , wobei das negative Vorzeiehen von !J und Idur eh ein Minuszeichen am oberen Summierglied beriieksichti gt ist . Der erste Integrator repr asentiert Gleiehun g (2.2), der zweite Integrator Gleiehun g (2.3). Die Proportionalglieder mit den Koeffizienten cf und c; stehen ftir Gleichun g (2.4) und (2.5). Anha nd dieses Blocksehalt bildes wird aueh klar , war urn die Verwendung von Integrati onsblocken sinnvoller ist als die Verwendung von Different iationsblocken , So ist beispielsweise beim erst en Integrator die Besehleuni gun g die Ein gan gs- und die Gesehwindigkeit die Ausgan gsgrofie. Dies ents prieht aueh den physikalisehen Gegebenheit en, denn die Gesehwindigkeit resultiert aus der Besehleun igun g bzw. der Ant riebskraft und nieht urngekehrt. Bei
66
2. Regelungstechnische Grundlagen
Abb. 2.6. Blockschaltbild eines Feder-Masse-Systems Verwendung eines Differenzierers miissten ab er Ein- und Ausgangsgr6Be vertauscht werd en, womit der Signalfluss im Blockschaltbild nicht mehr der Anschauung ent sprache, Dargestellt wird der Int egrator durch einen Block, in dem ein Funktionsverlauf eingezeichnet ist. Dieser ist charakterist isch fur den Int egrator, es ist die sogenannte Sprungantwort. Springt das Eingangssignal eines Integrators zum Zeitpunkt t = 0 von Null auf Eins (Abb . 2.7), so hat das Ausgangssigna l des Integrators, wenn es vorher den Wert Null hatte, wegen der Int egration den abgebildeten, rampenforrnigen Verlauf. Der Integrator lasst sich als Speicher auffassen, dessen Inh alt durch eine Eingangsgr6Be verand ert wird. Sofern diese Eingangsgr6Be nicht unendlich groB wird , kann sich der Speicherinhalt nur ste tig verandern, Es ist in der regelun gstechn ischen Literatur weit verbreitet, linear e Ubertragun gsglieder , d.h. Ubert rag ungsglieder, die durch eine linear e Differenti algleichung beschrieben werd en konnen , durch einen Block mit der zugehorigen Spru nga ntwort zu kenn zeichnen . Auch im Folgend en solI diese Konvention, mit Ausnahm e der ebenfalls linearen Ube rt ragungsg liede r Summierer und Proportion alglied , eingeha lten werden. set)
Sprungfunktion
wet)
Sprungantwort
Abb. 2.7. Sprungantwort des Integrators Lin eare Ubertra gun gsglieder zeichnen sich durch zwei besond ers angenehme Eigenschaft en aus, die durch die folgenden beiden Satze chara kterisiert werden :
Satz 2.1 ( Uberlagerungssatz) Ein Ubertragungsglied erzeuge aus dem Eingangssignal Xl (t) das A usgangssignal Yl (t) und aus dem Eingangssignal X2 (t) das Ausgangssignal Y2 (t) . Es ist genau dann linear, wenn es aus dem Eingangssignal al x l (t ) + a2x2(t) das Ausgangssignal alYl(t) + a2Y2(t) erzeugt.
2.2 Modell der Strecke
Satz 2.2 Entsteht ein Ubertragungsglied durch Verkniipfung linearer
67
t u-:
tragungsglieder, so ist es ebenfails linear. Summierer , Proportionalglied und Integrator sind lineare Ube rt rag ungsglieder. Die Bedeutung von Satz 2.2 ist weitreichend: J ede beliebige Kombination von linear en Ubertragungsgliedern st ellt wieder ein lineares Ube rt rag ungsglied dar . Dariiber hinau s lasst sich nun auch erklaren, warum die Spr unga nt wort zur Kenn zeichnung Iinear er Glieder gewiihlt wurde. Bei einem linear en Ubertragungsglied unt erscheiden sich namlich nach Satz 2.1 bei Eingangssprtingen verschiedener Ampli tude die Syst emantwortcn ebenfalls nur urn eben diese Ampli tude, nicht abe r im prinzipiellen Veriauf. Insofern stellt die Sprungantwort schon cine relati v allgemeingiilt ige Syst emeigenschaft dar , und ihre Verwendung zur Cha rakte risieru ng des Syst ems erscheint gcrechtfertigt. Neben den dr ei in Abb. 2.5 vorgcst ellt en Ubertragungsgliedern exist ieren noch vier weitere elementare Bau st eine von Blockschaltbildern. Der erste ist das Tot- oder LauEzeitglied. Es ist die graphische Repr asent ation der Gleichung y(t ) = x(t - T L ) , d .h. der zeit liche Veriauf des Ausgangssignales entspricht dem urn die Laufzeit TL verschobenen Veriauf des Einga ngssignales (Abb. 2.8). Auch das Laufzeitglied ist ein lineares Ube rt rag ungsglied und wird durch seine Sprungantwort gekennzeichnet . Laufzeit en trete n beispielsweise bei der Kommunikati on tiber weite Entfernungen auf. So darf ein Mensch, der einen Rob oter im All von der Erde aus ste uert, nicht ungeduldig worden , wenn der Roboter aus seiner Sicht nur zogerlich reagiert. Denn die zogerliche Reaktion ist nicht das Result at einer schlecht konstruierten Maschine, sonde rn die Folge der lan gen Signallaufzeite n zwischen Mensch und Roboter. Eb enso muss ein automatischer RegIer die in der St recke vorha ndenen Lau fzeite n berticksicht igen. x(t)
y(t)
Abb. 2.8. Laufzeitglied
2.2.4 Elementare nichtlineare Ubertragungsglieder Weitere Bausteine sind M ult iplizieret und Dividieier (Abb . 2.9). 1m Gegensatz zurn Proportionalglied wird beirn Multiplizi erer nicht nur ein Signal mit einem konst ante n Fak tor , sonde rn zwei zeit veriinderliche Signa le werd en miteinander multipli ziert . Ein Beispiel ist die Entstehung des Drehmomentes T a
68
2. Regelungstechnische Grundlagen
in einer Gleichstrommaschine. Dieses ist proportional zum Produkt aus Ankerstrom i a und Erregerfluss P e , die beide unabhangig voneinand er geregelt werden konnen: (2.8) Analog zum Multiplizierer werden beim Dividierer zwei zeitverand erliche Signale durcheinand er dividiert , wobei eine Division dur ch Null naturlich auszuschlieBen ist. Ein Beispiel ist die Berechnun g der Winkelgeschwindigkeit w urn die Hauptachse eines Roboters. In Analogie zur Newtonschen Bewegungsgleichung (2.1) gilt fur rotatorische Bewegungen der Zusamm enhang (2.9) Dab ei ist Ta(t) das Antriebsmom ent an der Hauptachse und J(t) das Tragheitsmoment des roti erenden Korp ers. Wahrend einer Drehung des Roboters urn seine Haup t achse kann sich die Stellung der and eren Drehgelenke, also gewissermaBen die Armhaltung und dami t auch das Triigheitsmoment des rotierenden Korp ers, vera nder n. J (t ) ist deshalb in dieser Gleichung als zeit abhiingige GroBe anzuset zen, die abe r auf jeden Fall von Null verschieden ist .
Multiplizierer
Dividierer
Kennlinienglied
A b b. 2 .9. Weiter e elem ent a re Uber tragungsgli ed er
Die Gleichungen (2.8) und (2.9) sind wegen der Multipli kation bzw. Division nicht lineare Differentialgleichungen und die zugehorigen Ubert ragungsglieder da mit im Gegensatz zu den vorher behand elten Gliedern nichtlineare Ubertragungsglieder. Dies gilt auch fur den letzt en Baustein, das Kennlini englied . Mit Hilfe dieses Bausteins konnen beliebige statische Zusammenh iinge repr asentiert werden. So ste ht der in Abb. 2.9 dargest ellt e Block ftir den Zusamm enhang y(t) = sin x( t ). Die Sinusfunktion tritt zum Beispiel auf, wenn die Bewegungsgleichung fur ein frei aufgehiingtes Pendel aufgestellt werden soIl (Abb. 2.10). Die Gleichung fur das Kriift egleichgewicht in tangenti aler Bewegungsrichtung lautet : d2 a (t ) 9 m sin a (t) + mZ ~
oder
d2 a (t )
~ =
-9 .
- Z sma(t)
=0
(2.10)
(2.11)
Dab ei ist 9 die Erdbeschleunigung, Z die Seilliinge des Pendels und m seine punktformig gedachte Masse. Das zugehorige Blockschaltbild zeigt Abb . 2.11.
2.2 Modell der Strecke
69
Das negative Vorzeichen fur q bedeutet , dass der Korp er ftir positive Winkel wieder abgebremst und in entgegengeset zter Richtung beschleunigt wird . Weit erhin sind keine Reibun gseffekte berticksichtigt , so dass das Modell ein ideales Pendel beschreibt , das, einmal angesto Ben, ohne auflere Einwirkung unendlich lange weit erschwingt .
m gm sin a
Abb. 2.10. Pendel da
at
Abb. 2 .11. Blockschaltbild des Pendels Im Gegensatz zu den linearen Ubert ragungsgliedern wird das Kennlini englied dur ch einen dopp elt umrand eten Block gekennzeichnet, in dessen Mitte die jeweilige Kennlini e eingezeichnet ist . Dur ch die dopp elt e Umrandung ist damit sofort klar, dass es sich bei der eingezeichnete n Funk t ion nicht urn eine Sprungantwort , sondern urn eine Kennlini e handel t . 2.2.5 Verzogerungsglieder erster und zweiter Ordnung
Oft werden bestimmte, aus elementaren Ubert ragungsglieder n bestehende Strukturen zu einem einzigen Ubertragungsglied zusa mmengefasst, urn die Ubersicht lichkeit des Blockschaltbildes zu erhohen. Zwei dieser nichtelementaren Ubertragun gsglieder kommen dab ei besonders haufig vor, namlich die Verzogerungsglieder erste r und zweite r Ordnung, das PT1 - und das P T 2-Glied , die im Folgenden beschrieben werden. Denkt man sich im Feder-Masse-System die Feder weggelassen, so besteht das System aus einem Korp er auf einer reibun gsbehaftet en Unt erlage, der von einer Antriebskra ft beschleunigt wird . Unt ersucht werden soll der Zusammenhang zwischen Antriebskraft fa und Geschwindigkeit v . Weglassen der Federkr aft !J in Gleichung (2.1) und Einset zen der Gleichungen (2.2) und (2.5) liefert die gesuchte Differenti algleichung
() -dv(t) - + -c; v (t ) -_ -1 1,at dt m m
(2.12)
70
2. Regelungstechnische Grundlagen
Mit T
=
!!!:., V c-
=
.l. , y(t) Cr
= v(t) und x(t) = f a(t ) ergibt sich
Td~~t) + y(t) = Vx( t) bzw.
dy(t ) dt
-
1
= -(Vx(t ) - y(t)) T
(2.13)
(2.14)
Ebenso wie z.B. y(t) = kx(t) das Ubertragungsverha lten eines Proportionalgliedes beschreibt , so kenn zeichnet diese Gleichung das Ubertragungsverhalt en eines sogenannten Verzogerungsgliedes erster Ordnung oder auch PT1-Gliedes. y
Abb. 2.12. Normiertes Blockschaltbild eines PT1 - Gliedes
Abb . 2.12 zeigt das zugehorige Blockschaltbild. Diescs solI jetzt durch ein einziges, wegen Sat z 2.2 lineares Ubertragungsglied ersetzt werden, das dann das PT1 -Glied chara kterisiert . Dazu ist die Berechnun g der Sprun gan twort erforderlich. Set zt man x(t) = 1 und y(O) = 0, so lasst sich die Sprungantwort des PT1-Gliedes leicht aus der Differenti algleichung berec hnen : y(t) = V( l - e "T')
(2.15)
Sic ist in Abb. 2.13 gezeigt, ebenso wie das gesuchte Ubert rag ungsglied. Dieses ersetzt das gesamte Blockschaltbild 2.12. wet)
v - - - ;- -- - - - -- T
Abb. 2.13. Sprungantwort des PT1-Gliedes
Die Sprungantwort zeigt , dass sich die Kurve umso schneller dem Endwert nahert, je kiirzer die Verzogerungszeit T ist. Erreicht wird der Endwert jedoch erst nach unendli ch lan ger Zeit . Dieser Endwert ist mit dem Faktor V prop ortional zur Einga ngsgrofie, die bei der Sprungantwort konstant Eins ist . Der Verlauf der Spru ngan twort lasst sich ftir den beschleunigten Korp er sehr einfach erklare n, Setzt ma n die Ant riebskra ft fa auf den konstant en Wert Eins, so wird die Geschwindigkeit anste igen. Dadurch steigt aber die der Antriebskraft entgege ngesetzte Reibungskraft [; ebe nfalls an, so dass die
2.2 Modell der Strecke
71
Summe aller Krafte bzw. die Beschleunigung und dami t der Ansti eg der Gesehwindigkeit imm er kleiner wird. Nach einer gewissen Zeit (grofer als T ) ist der Endwert nah erungsweise erreicht , und der Name Verzogerungsglied da her gereeht fert igt. Fur die Einfiihrung des PT2-Gli edes (Verzogen mgsglied zweiter Ordnun g ) wird das gesa mte Feder-M asse-Syst em betrachtet. Dureh Einsetz en der Gleichun gen (2.2) bis (2.5) in Gleichung (2.1) lassen sieh die Grofen v und a eliminieren, und es ergibt sich eine Differenti algleichung zweite r Ordnun g fur den Weg I: 21
m d (t ) cf dt 2
Mit Wo
= VfiL, m
D
=
wQ cr
2Cf
,
+ c,. dl(t ) + l(t) = ~ fa(t) cf
dt
(2.16)
cf
V = ..l.. , y(t) = l(t) und x(t) = fa(t) erhalt man Cf
die Normalform 2y
_1 d wo2
bzw .
d
2y(t
d~
(t) dt2
+ 2D dy(t) + y(t)
V x(t )
(2.17)
) = w 2 [VX(t ) _ 2D dy(t) _ y(t )]
(2.18)
Wo
=
dt
Wo
0
ili
un d das normi erte Bloeksehaltbil d 2.14. Da gegeniiber den urspriinglichen Differentialgleiehungen des Feder-M asse-Syst ems lediglich einige Umb enennu ngen erfolgt sind, weist dieses Blocksehaltbild natiirlieh eine ahnliche Struktur auf wie das in Ab b. 2.6. y
Abb. 2.14. Normiertes Blockschaltbild eines PT2Gli edes Wie schon beim P1J.-Gli ed soll dieses Bloeksehaltbild nun dureh ein einziges, lineares Ub ertragungsglied , das PT2-Glied , erset zt werden. Urn die graphi sehe Darstellun g zu erhalte n, aber au eh, urn einige vertiefend e Aussagen maehen zu konnen, ist wieder die Kenn tnis der Sprungan twort erforderlieh. Das cha ra kterist isehe Polynom der hom ogenen Differenti algleiehung (2.17) lau tet 1 2 2D -8 + -8 + 1 (2.19) 2 wo
Mit dessen Nullste llen
81 ,2
= Wo
Wo
[- D ± J D2 - 1], den
Anfa ngsbedingungen
y(O) = y(O) = 0 und x(t) = 1 erhalt man aus (2.17) die gesuehte Spru ngant wort des PT2-Gli edes
72
2. Regelungstechnische Grundlagen
V(1
+ ~ es lt + _ Sl_ e s 2t)
y(t) = { V [1- (r~281t)esl tr - S l
: :
D =I- 1 D = 1
(2.20)
so dass das PT2-Glied nun dargestell t werden kann (Abb. 2.15) . Der sogenannte Diimpfungsfaktor D bestimmt die Form des Einschwingvorgan ges. Fiir D > 0 weisen 8 1 und 82 einen negati ven Realt eil auf. Damit sind die Exponenti alfunktionen in der Sprungantwort abklingend , und diese konvergiert gegen den Endwert V . Fiir D ~ 1 sind 8 1 und 82 sogar rein reell, und die Sprungantwort sieht in diesem Fall ahnlich aus wie beim PT1 -Glied. Lediglich die Anfangsste igun g ist Null. Man spricht vom aperiodischen Fall. w(t)
w(t)
v - -- - - -- - - -- -
D>loderD=1
D
Abb. 2.15. Sprungantwort des PT2 -Gliedes Fii r 0 :::; D < 1 lasst sich schreiben: S1 ,2 = Wo [- D ±jJl- D2J . Die Exponenten in (2.20) sind jet zt komplex. In diesem Fall bieten sich einige Umformungen an, so dass man schlieBlich fiir die Sprungantwort den Ausdruck
y(t) =
V[1- ~ sin ( )1- D2wot + arccos D)]
(2.21)
erha lt . Das Syst em ist jet zt schwingungsfahig, wie man an der Sinusfunktion erkennen kann . Wie schnell die Schwingun gen nach einer Anregun g, also beispielsweise einem Sprung der Eingangsgrofe, abklingen, hangt vom Exponenten der e-Funkt ion und damit von D ab . Der Par amet er Wo ist die Eigenkreisfrequenz des Syste ms. Aus Gleichun g (2.21) sieht man , dass fiir D = 0 die Sprungantwort des Syst ems eine Sinusschwingung mit konst anter Amplitude und eben dieser Frequenz Wo ist. Bei o < D < 1 ergibt sich eine abklingende Schwingung mit der - etwas kleineren - natiirlichen Kreisfrequenz Wn = Wo J 1 - D2. Interessanterweise besteht ein sehr einfacher geomet rischer Zusammenhang zwischen der das Einschwingverh alt en des Syst ems bestirnmenden GroBe D und der Lage der Nullst ellen 8 1,2 in der komplexen Eb ene (Abb. 2.16):
woD =D woJD2 + 1 - D2
(2.22)
J e grofler also der Winkel ao wird , desto kleiner wird die Dampfung. Fiir ao = 0 weist das System ein aperiodisches Einschwingverhalt en auf, wahrend fiir a o = Jr / 2 die Schwingungen iiberhaupt nicht rnehr abklingen.
2.2 Modell der Strecke
73
jIm
Re 52
Abb. 2.16. Eigenwert e des PT2 - Gliedes
Nach Einfiihrung des PT2-Gli edes kann das gesamte Blockschaltbild 2.6 durch ein einziges PT2-Glied mit der Eingangsgrofie f a und der AusgangsgroBe I ersetzt werd en. Die inncrcn GroBen Beschlcunigung und Geschwindigkeit tret en dann ab er nicht mehr explizit auf. PT1 - und PT2 - Glied sind nach Satz 2.2 offensichtlich lineare Ubertragungsglieder. Sie werd en haufi g auch benutzt , urn komplizi ertere Strukturen nah erungsweise zu beschr eiben . Wenn beispielsweise fur das Feder-MasseSyst em am Anfang dieses Kap itels eine Regclung cnt worfen worden soU, so muss auch die Entstehung der Antriebskraft f a in einer Maschine beriicksicht igt werden . Hier bietet es sich an, die maschinenin ternen Vorgang e nicht explizit zu modellieren , sondern das Ube rt rag ungsverha lte n von der St ellgrofe des Reglers (also der Eingangsgrofle der Maschine) bis zur mechanischen Kr aft durch ein Ver zogerungsglied angena hert zu beschr eiben . Wegen der Schnelligkeit der maschin enin ternen Ausgleichsvorgange im Vergleich zu den dyn ami schen Vorgan gen im Feder-Masse-System ist der dadurch entstehend e Mod ellfehler relati v gering. Wie eine solche Vereinfachung im einzelnen vorzun ehmen ist , wird spater noch beschrieb en . 2 .2.6 Anwendungsbereich
Obwohl die Beispiele in diesem Kapi tel ausschlieBlich mechanischer Natur war en , so lassen sich mit den jetzt bekannten Ubertragungsglicdern auch dynami sche Vorgange z.B. in der Elekt rote chnik oder Hydromechan ik beschreiben . P rinzipieU kann jedes Syst em beschrieb en werden , das die folgenden Eigens chaften erfullt : • Das Syst em ist zeitinvnris nt, die Paramet er der Strecke bleiben im Laufe der Zeit konstant. Ein Beispiel fur ein zeit variantes System ist ein Flugzeug, dessen Tankinhalt wahrend des Fluges verbraucht wird . Dadurch ande rt sich auch das Gewicht , also ein Streckenp ar am eter , und dami t das dyn ami sche Verhalten des Flugzeuges. • Das System ist kontin uietlicu, der Verlauf der Signale ist fur jeden Zeitpunkt gegebe n. Im Gegensatz dazu ste hen zeitdiskte te Systeme, wo der Wert eines Signales Bur zu bestimmte n Zeitpunkten bckannt ist . Werde n fiir die Regelung zum Beispiel Mikro prozessoren eingesetzt, so trit t
74
2. Regelungstechnische Grundlagen
durch die notwend ige Analog/Digit al-Wandlung eine Zeitdiskreti sierun g auf (Abb . 2.17). Da Information verlor en geht, muss diese Tat sache bei der Auslegun g des Reglers beru cksichtigt werden . Hierzu exist iert eine umfangreiche Theorie [1, 67, 68, 107, 191], auf die aber in diesem Buch nicht weiter eingegangen werd en solI. Wenn die Abtastrate des A/D-Wandl ers narnlich hoch ist im Vergleich zu den Frequenzen der Streckensignale, kann man die Zeitdiskretis ierung vern achlassigen und das System als kontinui erlich behandeln . Prinzipiell gibt es aber fur aIle Verfahren, die in den folgend en Unter kapite ln noch vorgest ellt werden, auch eine zeit diskrete Varia nte. Fu r ihre Anwendung muss man beim Streckenmod ell von den Different ial- auf Differenzengleichungen iibergehen. Bei linear en Systemen ist dieser Ubergang sehr einfach und wird von regelungstechnischen Software-Tools qua si auf Knopfdruck erledigt. Bei nichtlinearen Syst emen existie rt ftir dieses P roblem dagegen oft nur eine Naher ungslosung.
Abb. 2 .17. Zeitdiskretisierung eines Signals • Die Paramet er des Systems sind konzentriert . So ist zum Beispiel die Temperatur in einem Raum nicht nur zeit-, sondern auch ortsabhangig, Zur Beschreibung der Vorgange sind daher pa rt ielle Differential gleichungen notwendi g. J edes Volumenelement ste llt einen kleinen Energiespeicher dar und t ritt mit den benachbart en Volumenelement en in Wechselwirkung. Wurde man versuchen , das Syst em durch ein Blockschaltbild mit den vorgeste llten Ubert rag ungsgliedern zu modellieren, so brauchte man unendli ch viele Baust eine, weil jedes Volurnenelement einzeln modelliert werd en muss. Die Param eter dieses Syst ems sind nicht konzentriert . In solchen Fallen wird auf eine exakte Modellierung verzichtet und das System naherun gsweise durch einige wenige Energiespeicher und damit eine endliche Anzahl an Ubertragun gsgliedern angenahert.
2.2.7 Linearisierung Die Linear it at des Ubertrag ungsverhaltens ist dagegen keine Bedingung fur die Anwendbarkeit von Blockschalt bildern. Sowohllineare als auch nicht lineare Differenti algleichungen lassen sich durch Ubertragun gsglieder bzw. Blockscha lt bilder reprase nt ieren. Da die weitergehende Behandlung, und zwar insbesond ere der Reglerentwurf, fur lineare Systeme aber wesentlich einfacher
2.2 Modell der Strecke
75
ist , versucht ein Regelungst echniker grundsatzlich zunachst einmal, sein zu behand elnd es System durch lineare Differenti algleichungen zu beschreiben. Andererseits kommen aber in den meist en rea len Regelst recken Nichtlineari t aten vor, die nicht einfach vernachlassigt werd en diirfen, Hier behilft man sich dami t , nichtl ineare Strecken zu linearisieren: Es wird ein Arbeitspunkt definiert, in dessen Umgebung man eine nichtl inear e Funk tion durch cine linear e Funkti on annahert. Dies geschieht durch Entwicklung in eine Taylorr eihe, die nach dem erst en Glied abgebrochen wird . Gegeben sei beispielsweise ein nichtlinear es Glied mit der Ubertragun gsfunk tion y = f (x) und dem Arb eitspunkt (xo,j(xo)) . Fur die Abweichungen vom Arb eitspunkt gilt Llx = X-Xo und Lly = Llf = f (x )- f (xo). Die Entwi cklun g der Funktion f (x ) in eine Taylorreihe urn den Arb eit spunkt ergibt :
f( x)
of
= f( xo) + ax (xo) Llx + r( x)
(2.23)
r(x) ste llt dabei ein Restglied mit den hoheren Ableitungen der Funktion f (x ) dar und soll vern achlassigt werd en . Betrachtet man nun anstelle der Grofen fund x nur noch ihre Abweichungen vom Arb eitspu nkt Llf und Llx , so ergibt sich naherungsweise ein linear er Zusammenh ang zwischen Eingangsund Ausgangsgrofle des Ube rtragungsgliedes: Llf
of
= f (x ) - f (xo) ;::; ax (xo) Llx = k Llx
(2.24)
Ein anschauliches Beispiel ste llt wieder das Pendel dar (Abb. 2.10). Das Verhalt en des Syst ems soll am Arb eitspunkt 0:0 = 0 linearisiert werd en. Dazu ist die Sinusfunkti on in Gleichung (2.11) durch ein lineares Ubertragungsglied zu erset zen. Mit f (0:) = sin 0: gilt
8f
Llf ;::; 00:(0:0) Llo: = cos O (0: - 0) = 1 0:
(2.25)
Demn ach kann die Sinusfunk tion in einer Umgebung des Arb eitspunkt es auch durch ein Proportion alglied mit dem Faktor Eins ersetzt werden. Dies bedeutet aber, dass das Kennlinienglied im Blockschaltbild 2.11 auch vollig entfallen kann , womit das Syste m dann linear ist . Die Linearisierung von nichtlinearen Ubertragungsgliedern mit mehreren Ein- und Ausgangsgrofien wird in Kap itel 2.8.2 noch ausfuhrlich erlautert . Auch in dem Fall kann das Verfahren schemat isch durchgefuhr t werd en und ist nicht besond ers schwierig. Zu beachten ist aber grundsa t zlich, dass ein d urch eine Lineari sierung gewonnenes St reckenmodell nur in einem begrenzten Bereich urn den Arb eitspunkt Gtilti gkeit besitzt . 2.2.8 AbschlieBende Bemerkungen
Es ist leicht einzusehen , dass es fur ein und dieselbe Strecke verschiedene Blockschaltbilder gcben kann . J e nach Wahl der Zwischengr6Ben und Uber-
76
2. Regelungstechnische Grundlagen
t ragungsblocke entstehen vollig unterschiedliche Strukturen, die ab er zuein-
ander aquivalent sind. Entscheidend fiir die Auft eilung des Blockschaltbildes ist meistens, welche Crofen tat siichlich messbar sind oder eine bestimmte physikalische Bedeutung hab en . In diesem Fall spiegelt das Blockschaltbild den realen Aufbau eines Syst ems rccht gut wider , und die Verkniipfung und gegenseit ige Beeinflussung der einzelnen physikalischen GraBen ist wesentlich einfacher zu iiberblicken als bei einem Gleichungssystem. Dies ist fur den Regelungstechniker hilfreich, denn trotz aller Moglichkeiten , die sich durch den Einsatz von Computern im Bereich der Regelungstechnik eroffnet hab en, ist immer noch ein gewisses MaB an Intuition und Ubersi cht bei der Auslegung einer Regelung erforderlich. Zur Bestimmung von Blockschaltbildern stehen statistische Verfahren zur Verfiigun g, mit deren Hilfc aus den Messwerten der Strecke Informationen iiber ihre Struktur gewonnen werden konnen [69, 70, 105, 113, 192]. Der Einsatz dieser Verfahren ist unerlasslich, wenn die physikalischen Zusammenhange der Strecke nicht mehr so einfach zu iiberschauen sind wie in den Beispielen dieses Kapitels, oder auch, wenn zwar die Struktur, nicht ab er die einzelnen Parameter der Differentialgleichungen bekannt sind. Wenn das Blockschaltbild erstellt ist , existiert dariiber hinaus die Moglichkeit einer Simulation der Strecke mit Hilfe numm erischer Integrationsverfahren . Dadurch konnen weitere Einblicke in das Streckenverhalten gewonnen und nicht zuletzt auch RegIer iiberpriift werd en. Prinzipiell sind aIle in diesem Kapi tel vorgest ellten Gedanken auch auf Ubertragun gsglieder mit mehr eren Ein- und Ausgangsgrofien erweiterbar. Auf diese Erweiterung solI aber hier und auch in den folgenden Abschnitten zunachst noch verzicht et werden , urn das Verstandnis zu erleichte rn . Erst ab Kapi tel 2.7 werden auch die Mehr grofensysteme Gegenst and des Int eresses sein.
2.3 Ubertragungsfunktion Fiir dieses und die folgenden Kapitel solI die Klasse der betrachteten Ubertragungsglicder bzw. Syst eme noch weiter eingeschrankt werden, und zwar auf die rein linearen Systeme mit einer Ein- und einer Ausgangsgrofe. Vor einer Anwendung der vorgest ellt en Verfahren ist also gegebenenfalls eine Linearisierung der nichtlinearen Ubertragungsglieder vorzun ehmen. 2.3.1 Laplace-Transformation
Ein gefiihrt werden solI zun achst die Laplace-Tran sformation , mit deren Hilfe Probleme der linearen Regelungst echnik sehr einfach und elegant zu losen sind [24,43, 190]. Die Laplace-Transformation kann angewendet werden auf eine komplexwertige Funk tion f (t ) der reellen Variabl en t, wenn sie die folgenden Eigenschaft en erftillt:
2.3 Ubert ragungsfunkt ion
77
• f(t ) ist ftir t ;:: 0 definiert. • f(t) ist tiber (0, 00) int egrierbar. • f(t ) unterliegt einer exponent iellen Wachstumsbeschrankung: If( t) 1~ K ect
(2.26)
Damit ist die Laplace-Transformation auf Signalverlaufe in einem Regelkreis in den meisten F allen anwendba r. Mit der komplexen Variablen s ist die Lapl ace-Transformierte f (s) der Funkti on f (t) definiert als
J st 00
f(s ) = t: {f (t )} =
e- f(t )dt
(2.27)
o Das Int egral konvergiert absolut fiir Re(s) > e mit c aus (2.26). In dieser Konvergenz-Halbebene ist f(s) eine analyt ische Funktion von s. Da t bei einer Anwendung der Transformation auf Signalverlaufe die Dimension Z eit hat , muss s wegen der Exponentialfunkt ion in (2.27) die Dimension Z eir 1 hab en. s ist damit eine komplexe Frequenz. In der Regelungstechnik wird deshalb auch der Bildb ereich der Laplace-Transform ation als Frequenz- und der Originalb ereich als Zeitbereich bezeichnet. Urn die weit eren Betrachtungen aber nicht unn 6ti g zu erschweren, werd en t und s als dimensionslose Variablen behandelt. Unt er bestimmten Vorauss et zungen lasst sich eine Riicktransformation durchfiihren: c-l-joo
f (t ) = £ -1 {f (s)} =
~ 27r]
J est f (s)ds
fur t ;:: 0
c - j oo
f (t) = 0
fur t
<0
(2.28)
Der Par amet er c ist so zu wahlen, dass der Int egration sweg innerh alb der Konvergenz-Halb ebene verlauft und c gr6Ber als die Realteile aller singularen Punkt e von f (s) ist. Es gelte n die folgend en Satz e:
1. Additionssatz (Uberlagerungssat z) (2.29) 2. Integrationssatz
i:
{I
j (T)dT }
~ ~£{j(t)}
(2.30)
78
2. Regelungstechnische Grundlagen
3. Differentiationssatz (2.31)
4. Verschiebungssatz (2.32)
5. Faltungssatz
(2.33)
6. Grenzwertsatze
= 8---+ lim sJ (s) 0
falls lim J(t ) existiert
(2.34)
J(t) = s----+oo lim s J(s )
falls lim J (t) existie rt
(2.35)
lim J(t)
t--+oo
lim t _O
t >O
t->oo
t-O t >O
2.3.2 Berechnung von Ubertragungsfunktionen Gegeben sei nun das Problem , dass in einem Regelkreis der Verlauf des Eingangssignales einer Strecke gegeben ist und das zugehorige Ausgan gssigna l berechnet werd en solI. Prinzipiell ist eine Losung dieses P rob lems mit Hilfe der Different ialgleichung der Strecke m6glich, erfordert abe r einen auBerorden tlic h hoh en Aufwand . Hier biet et sich der Einsat z der Lapl aceTr an sform ation an. Zunachst wird das Einga ngssignal nac h (2.27) oder besser mit Hilfe der Korresp ond enzt afel im Anh ang transformiert. Dann werden im Bildbereich mit Hilfe der oben gena nnt en Sat ze die Ausgangss igna le der einzelnen Ubert rag ungsglieder in der Reihenfolge berechnet , wie sie vom Einga ngssignal dur chlaufen werden. Das Ausgan gssignal des letzten Ubert ragungsgliedes ist das Ausgan gssignal der Strecke, das schlieBlich in den Zeitbereich zurii cktransformiert wird . Auch dafur ste ht wieder die Korresponde nztafel im Anh an g zur Verfiigun g, so dass sich das Problem auf die Berechnung des Ausgan gssignales im Bildbereich reduziert. Diese Berechnung ist aber bei linearen Ubertrag ungsgliedern sehr einfach. Die Integration eines Signales reduziert sich im Bildbereich wegen des Int egrat ionssatzes auf eine Mul tiplikation mit Ents preche nd wird aus der einfachen Differentiati on bei verschwinden den Anfangswerten nac h dem Differenti at ionssat z eine Multiplikati on mit s. Summation und Mult iplikati on mit einem konst ant en Fakt or bleiben wegen des Additionssatzes erha lte n, und ein Laufzeitg lied wird nach dem Verschiebungssatz durc h den Fakt or e- T L S berii cksichti gt. In allen Fallen wird ein t ransformiertes Einga ngssigna l
±.
2.3 Ubertragungsfunkt ion
79
x(s) mit einer von s abha ngigen Funktion G(s ) multipliziert, urn das Ausgangssignal y(s) zu erhalten. G(s) wird als Ubertragun gsfunktion bezeichnet (Abb. 2.18): y(s) = G(s )x (s ) (2.36) Von einer aufwiindigen Losung von Differenti algleichungen im Zeitbereich hat sich das Problem damit auf das Aufst cllen einer Ubert ragungsfunkt ion und die Multiplikation mit dem Eingangssignal im Frequenzb ereich reduziert. x(s)
G(s)
y(s) = G(s) x(s)
1
Frequenzbereich
. -- - - - - -- - - -- - - - - - -- - - - - - - --- - - - - - - -- --- - - - -
j
- - - - - - -- - - - - - - --
Zeitbcrcich x(t)
y( t)
Abb. 2.18. Anwendung der Laplace-Transformation Fur den Integrator lautet die Ubertragungsfunkt ion 1 s
G(s) = -
(2.37)
fur das Laufzeitglied
G(s) = e- h
s
(2.38)
und fur das Proportionalglied
G(s ) = k
(2.39)
Auch fur das PTJ- und PT2 -Glied lassen sich Ubertragungsfunktionen angeben: Aus Gleichun g (2.13) wird durch Anwendung des Differentiationssatzes bei verschwindendem Anfangswert von y(t )
T sy (s ) + y(s) = Vx(s )
(2.40)
und damit fiir die Ubertragungsfunktion des PTJ-Gliedes
G(s)
= y(s) = _V_ x (s)
(2.4 1)
Ts + 1
Analog crgibt sich fur das PT2-Glied aus Gleichung (2.17)
1 2D -2 s2y(s) + - sy( s) + y(s) WQ
= V x( s )
(2.42)
WQ
und die Uber tragungsfunk tion
G(s) = y(s) x(s)
V __ = ~_~ 1 s2
WK
+
2D S WQ
+1
(2.43)
80
2. Regelungstechnische Grundlagen
Die Koeffizienten der Differentialgleichung finden sich dir ekt in der Ubertragungsfunktion wieder. Der Nenner der Ubertragungsfunktion entspricht gerade dem charakterist ischen Polynom der homog enen Differenti algleichung. Best eht ein Blockschaltbild nur aus Integratoren , Summierern und Proportionalgliedern, so ent ste ht durch Zusammenfassen der einzelnen Terme imm er eine rein rationale Ubertragungsfunktion
m m- l G( s) = y(s) = bms + bm_l s + x (s ) ans n + an_ l s n- l +
+ bls + bo + al s + ao
m "5.n
(2.44)
bei der der Grad des Nenners grundsatzlich gr6Ber oder gleich dem Grad des Zahlers ist . Es sei aber nochmals darauf hingewiesen , dass eine solche Ub ertragungsfunktion nur dann ents te ht, wenn die Anfangswert e der einzelnen Signale und gegebenenfalls ihr er Ableitungen verschwind en. Andernfalls wlird en durch die Anwendung des Differentiationssatzes zusatzliche Terme entste hen. Im Folgend en soll diese Tat sache ohne weit ere Erw ahnung vorausgesetzt werd en . Weiterhin muss man sich dariiber im Klaren sein, dass nur ftir lineare Ubertragungsglieder Ubert ragungsfunkt ionen angegebe n werden konn en, Fur nichtlinear e Ubertragun gsglieder ist dies nicht moglich. Es ist sogar Vorsicht gebote n, denn eine Mul tiplikation oder Division im Zeitbereich entspri cht nicht einer Multiplikation oder Division im Frequenzbereich. Auch eine Kennlinie darf nicht dir ekt vom Zeit- in den Frequenzbereich libertragen werden. Nicht linea re Ubert ragun gsglieder miissen deshalb nach wie vor im Zeitb ereich behandelt werd en . 2.3.3 Interpretation der Ubertragungsfunktion Im Folgend en sollen nu n einige Betrachtungen ang estellt werd en , die die Int erpretation des Begriffes Ubertragungs funktion erleichte rn . Dazu wird zunachst die Impulsiuukiion 8(t) (Abb . 2.19) eingefiihrt, die nah erungsweise definiert ist durch: . 1 8(t) = lim -( s(t) - s(t - c)) (2.45) <-- 010
s(t ) sei dab ei die Sprungfunktion. Man kann dah er die Impulsfunktion auch als Ableitung der Sprungfunktion auffassen . Die Flache unter einer Impulsfunktion ist gerade Eins. B(t) £.1
Abb. 2.19. Impulsfunktion
2.3 Ubertragungsfunkt ion
81
Fur die Laplace-Transformierte der Impulsfunkti on ergibt sich 00
.c {8(t)} =
j e- st lim ~ (s(t) - s(t - c))dt C~ O e o 00
= lim
C~O
~j e
e-st(s(t ) - s(t - c))dt
o (2.46)
Dam it kann man schreiben:
G(s) = G(s) 1 = G(s).c {8(t)}
(2.47)
Ein Vergleich mit Gleichun g (2.36) zeigt , dass die Ubertrag ungsfunkt ion
G(s) auch als Lapl ace-Transformierte des Ausgangssignales bei Anregung der Strecke durch einen Impuls interpr etiert werd en kann. G(s) ist damit die Lapl ace-Transformiert e einer gedachten Impulsan twort g( t). Diese Interpret ation fi.ihrt wiederum auf eine sehr anschauliche Erkl arung mit Hilfe des Faltungssat zes. Urn das Ausgangssignal im Bildb creich zu berechnen, hat man nach (2.36) die Lapl ace-Transformierte des Einga ngssignales mit der Ubertragungsfunkt ion zu multiplizieren. Mit dem Falt ungssatz ents pricht diese Op eration eincr Falt ung im Zeitbcreich:
J t
y(s)
= G(s)x (s) <----+ y(t) =
g(t - r) x(r)dr
(2.48)
o Die Funk t ion g(t ) ist dabei gerade die Impul santwort. Abb. 2.20 vera nscha ulicht diese Forme!. Man kann sich das Einga ngssigna l naherungsweise als eine Folge von Impulsen mit der Hohe x (r ) und der Breite dr vorste llen, von denen jeder am Ausgang eine Impulsantwort hervorruft . Wegen der Lineari t iit der Strecke beeinflussen sich diese Antworten nicht gegenseitig, so dass der Moment anwert am Ausgang eine Uberlagerung aller Impul santworten darste llt . Der zum Zeitpunkt r am Eingang anliegende Impul s mit der Flache x(r )dr verursacht die Impulsantwort g(t-r) x(r)dr . Dies ist auch gera de der Beitr ag dieser Impulsantwort zum Moment anwert y(t ).
x(r ) + - ----+J
x(t)
dt Abb. 2.20 . Anschanliche Erklarung des Faltnngsintegrals
82
2. Regelungstechnische Grundlagen
2.3.4 Berechnung der Sprungantwort Mit Hilfe der Ubertrag ungsfunkt ionen gelangt ma n auch zu Regeln , wie man Blockschaltbilder linearer Strecke n umstrukturieren kann , ohne das Ubertragun gsverh alt en des Modells zu vera ndern. In Abb . 2.21 sind jeweils zwei zueinander aqu ivalent e Blockschalt bilder nebeneinand er aufgefiihrt . Die Aquivalenz lasst sich sofort durch Berechnun g der jeweiligen Ubertragungsfunktio nen nachweisen , wobei fur die aufgeste llten Gleichungen natiirlich alle Rechenregeln wie z.B. Kommut ativi t at oder Assoziati vitat Giilti gkeit hab en . Der erste Fall zeigt beispielsweise, dass lineare Ubertrag ungsglieder in ihrer Reihenfolge beliebig vert auscht werd en diirfen. Zu beacht en ist allerdings, dass durch so1che Umformungen in der Regel die Zuordnung zu inte rne n, rea len physikalischen GraBen verloren geht .
yt s)
=G 1(s) G 2(s) x(s)
y(s)
=(G 2(s) + I) G 1(s) x(s)
x
y(s ) = (G 2(s) G1(s) + Gjts) x(s)
Abb. 2.21. Aquivalente Umformungen bei linearen Ubert ragungsgliedern Anh and eines einfachen Beispiels soll nun demonstriert werden , wie sich bei rationalen Ubertragungsfunktionen Ausgangss igna lverlaufe bestimmen lassen . Mit Hilfe der Korr espondenzt ab elle im Anhang ist dies kein besonderes Problem. Die Lapl ace-Transformierte der Sprun gfunktion ist beispielsweise ~ . Mit der allgemeinen Formel y(s) = G(s)x(s ) ergibt sich daher fiir die Sprungantwort eines linearen Ubertragungsgliedes: 1
y(s) = G(s)-
(2.49)
s
Set zt man in diese Gleichung die Ubert ragungsfunktion des PT1 -Gliedes ein, so erha lt man als Sprungantwort
y(s) = -
V
Ts
1
--
+1s
(2.50)
Dieser Ausdruck ist nun nur noch in den Zeit bereich zuriickzut ra nsformieren. Er findet sich aber nicht in der Korr espondenztafel. Fiihrt man jedoch eine Partialbruchzerlegun g durch, so ergibt sich
2.3 Ubertragungsfunktion
y(s) = V
[~ _ _1_]
(2.51)
s +.1 T
s
83
Wegen des Additionssatzes diirfen beide Summanden in der Klammer einzeln in den Zeitbereich zurucktransformiert werden. ~ ist die Laplace- Transferdie Transformierte der Funktion mierte der Sprungfunktion s(t) = 1 und
8:1-
s(t)e- t / T
=
T
e- t / T ,
wie sich aus der Korrespondenztafel ablesen lasst . Man erhalt damit den schon bekannten Funktionsverlauf
(2.52)
fiirt::::O
Fur die Sprungantwort eines Ubertragungsgliedes mit einer rationalen Ubertragungsfunktion lasst sich ein allgemeiner Ausdruck angeben. Zunachst sind Zahler- und Nennerpolynom aus (2.44) in Linearfaktoren zu zerlegen: m
IT (s G( s) = bm a
1=::-1
:.-1
n
IT (s -
n
nil) _
mit m:::; n
(2.53)
Pv)
v=l
Da G(s) nur reelle Koeffizienten hat, sind alle Pole Pv bzw. Nullstellen nil entweder reell oder paarweise komplex konjugiert. Fur die Sprungantwort y(s) gilt wegen y(s) = ~G(s): m
IT (s -
nil) ys=-'-----:---=-------() a n+1 n IT (s - Pv) bm
11=1
mit Pn +1
=0
(2.54)
v=l
Fur die folgende Betrachtung sei angenornmen, dass Zahler- und Nennerpolynom von y(s) teilerfremd sind. Ansonsten sind sie vorher entsprechend gegeneinander zu kiirzen . Die Ordnung des Zahlers von y( s) ist wegen der zusatzlichen Polstelle Pn +1 = 0 auf jeden Fall kleiner als die Ordnung des Nenners. Berucksichtigt man weiterhin, dass auch mehrfache Pole in y( s) auftreten konnen, so lautet die Partialbruchzerlegung nach einer geeigneten Umbenennung der Pole: i
mit n+ 1 = Ln>>-=1
(2.55)
i ist die Anzahl verschiedener Pole und n>- ihre jeweilige Vielfachheit. Mit Hilfe der Korrespondenztafel im Anhang lasst sich eine Rucktransformation in den Zeitbereich durchftihren . Fur die einzelnen Summanden ergibt sich bei Anwendung des Additions- und Verschiebungssatzes (2.56)
84
2. Regelungstechnische Grundlagen
Jeder Pol s>. liefert damit entsprechend seiner Vielfachheit n>. zur Sprungantwort im Zeitbereich den Beitrag (2.57) also das Produkt aus einem Polynom h>.(t) vom Grad n>. - 1 und einer Exponentialfunktion. Insgesamt folgt fur die Sprungantwort
y(t) =
L h>.(t)es>. t
(2.58)
>'=1
Fur rein reelle Poistellen mit negativem Realteil verschwindet der Beitrag h>.(t) es>.t mit wachsendem t , denn die Exponentialfunktion konvergiert schneller gegen Null als jede endli che Potenz von t anwachst . 1st dagegen Re(s>.) > 0, so wachst dieser Ausdruck mit tuber aile MaBen. Fur jedes komplex konjugierte Polpaar lassen sich die zugehOrigen Ausdrucke ahnlich wie beim PT2-Gli ed (Gleichung (2.21)) zusammenfassen. Damit kennz eichnet jedes derartige Polpaar einen schwingungsfahigen Anteil des Syst ems. Analog zu den rein reellen Polen sind diese Schwingungen je nach Realteil des Polpaares auf- oder abklingend. Fur Pole s>. = 0 nimmt die Exponenti alfunktion den Wert Eins an und kann deshalb ent fallen. Ubr ig bleibt nur das Polynom. Hat die Strecke selbst kein en Pol bei Null , so ent halt y(s ) wegen der Sprungfunktion ~ nur einen einfachen Pol an dieser Stelle. Das zugehorige Polynom h>.(t) ist demnach vom Gr ad Null , d.h. konst an t . Der zugehOrige Ausdruck h>.(t)es>.t ist damit ebenfalls konstant. Falls sonst nur Pole mit negativem Realteil vorliegen , deren Beitrag mit wachsendem t verschwind et , bild et dieser konstante Wert den Endwert der Sprungantwort. Falls dag egen die Strecke seiber mindest ens einen Pol bei s>. = 0 ent halt, st eigt der Grad von h>.(t) , und der Ausdruck wachst mit t tiber aile MaBen. Ein Polpaar mit Re( s>.) = 0 und Im(s)J =1= 0 erzeugt gemaf Gleichun g (2.21) eine Schwingung mit konstanter Amplitude. Wenn es in groferer Vielfachheit als Eins auft rit t, wird der Grad des Polynoms h>.(t) grofer als Null, und das Produkt h>.(t)es>.t wachst dann auch hier iiber aile MaBen. Offensichtlich wird das Einschwingverhalten des Syst ems vollst andig durch die Pole der Ubertragungsfunktion beschrieben. Zusammenfassend lasst sich sagen, dass die Sprungantwort immer gegen einen endlichen Wert konvergiert, wenn aile Pole der Ubertragungsfunktion einen negativen Realteil aufweisen. Interessant ist , dass sich Anfangs- und Endwert der Sprungantwort auch mit Hilfe der Crenzwertsatze der Laplace-Tr ansformat ion berechnen lassen , sofern die Grenzwerte exist ieren. Fur den Endwer t der Sprungantwort gilt mit dem Grenzwertsatz der Lapl ace-Transform ation (2.34) , der allgemeinen Ub ertragu ngsfunktion (2.44) und der Formel fur die Sprungantwort eines linear en Ubertragungsgliedes (2.49) :
2.3 Ubertragungsfunktion
lim y(t)
t--. oo
= lim sy( s) = lim s ~ G(s) = lim G(s) = bo 8--. 0
8--. 0
S
ao
8--. 0
85
(2.59)
und analog dazu fiir den Anfangswert lim y(t) = lim G(s ) = 0
t- O
fur m
(2.60)
8---+00
Der Endwert der Sprungantwort lasst sich demnach auch sofort aus den Koeffizienten der Ubertragungsfunktion ablesen. Die spateren Kapitel werden zeigen, dass die Berechnung von Signalverlaufen fur die Auslegun g von Reglern und die Analyse von Regelkreisen gar nicht erforderlich ist , denn eine Analyse der Ubertragungsfunkt ion liefert bereits alle notwendigen Informationen tiber Stabilit at und Einschwingverhalten der Strecke. 2.3.5 Vereinfachung einer Ubertragungsfunktion
Zum Abschluss dieses Kapitels soll noch die Moglichkeit der Vereinfachung einer Ubertragungsfunktion diskutiert werd en. Insbesondere wenn diese zur Auslegung eines Reglers herangezogen werden soll, kann die Approximation eines gegebenen Ubert ragungsverhalte ns durch eine moglichst einfache Funktion sinnvoll sein. Gegeben sei die folgende Ubertragungsfunktion, die aus einem ra t iona len Ant eil und einem Laufzeit glied besteht . Der rationale Anteil besitze ausschlieBlich Pole mit negativem Realteil, d.h. die Sprungantwort habe einen endlichen Endwert:
G( S ) =
bm sm + bm _l s m - l + ... + bls + bo e ans n + an_I Sn- 1 + ... + al S + aO
T
8
L
mit m < n
(2.61)
Eine Zerlegung in Linearfaktoren liefert
(2.62)
Nun konnen Zahlerfaktoren und Exponent ialfunkt ion in Potenzreihen entwickelt werd en:
(2.63)
Ausrnultipli zieren ergibt eine neue Reihe irn Nenner
86
2. Regelungstechnische Grundlagen
O(s) = bo ao 1 + (-
m
2::
(2.64)
:
Tzp,
p,=1
+ 2::
v=1
T nv + TL)s
+ ...
Bricht man diese Reihenentwi cklung nach dem erst en Glied ab, so ergibt sich ein PT1-Glied mit der Ersatzzeitkonstanten Ts:
O(s ) ~ bo 1 ao 1 + Tes wobei
n
(2.65)
m
t; = LTnv - L p,=1 v=1
r.; + T L = a1 -
b1 + T L
(2.66)
Die Ersatzzeitkonst ant e kann damit sehr einfach aus den Koeffizient en der Ubertragungsfunktion berechnet werd en, ohne dass eine Zerlegun g in Linearfaktoren notwendi g ist. Anh and der Sprungantwort kann man dieses approximierende PT1-Glied recht gut mit der Originalstrecke vergleichen (Abb . 2.22). Es lasst sich zeigen , dass die sogenannte Regelflache mit y(t) = Sprungantwort
(2.67)
also die Flache zwischen der Sprungantwort und ihrem Endwert, in beiden F allen gleich groBist. Aufgru nd dieser Tatsache best eht auch die Moglichkeit , eine Ersat zfunktion auf gra phischem Wege zu konstruieren , wenn von der Originalstrecke keine Ubertragun gsfunktion, sondern lediglich eine gemessene Sprungantwort vorliegt . yet)
\ Naherung Original
Abb. 2 .22. Zur Ersatzzeitkonstanten
J e nach Anford erungen an die Genauigkeit der Approximati on kann die Reihe in Gleichung (2.64) auch nach einem spat eren Glied abgebro chen werden . Zu bedenken ist aber, dass es sich immer nur urn eine Naherung hand elt. Die dyn amischen Vorgange in einer Strecke n-t er Ordnung konnen durch cine Ub ertragungsfunkt ion niedrigerer Ordnung nicht vollst and ig beschrieben werd en. Insbesondere im Hinblick auf das St abilitatsverh alten kann dies schwerwiegende Konsequenzen hab en . Wahrend ein PT1 -Glied keine Probleme bereit et , kann sich die Strecke, die sich hinter dieser Naherung verbirgt ,
2.4 Frequenzgangdarstellung
87
dicht an der Grenze zur Instabilitat befinden. Und ein Regier , der mit einem PT1 -Glied als Strecke hervorragend funkt ionieren wiird e, kann zusammen mit der t at siichlichen Strecke ein instabiles Syst em bilden. Die vorgeste llte Naherung ist also prin zipiell mit Vorsicht zu genieBen. Grundsiitzlich kann eine Strecke niedr iger Ordnung eine St recke hoherer Ordnung nur im Bereich tiefer Signalfrequenzen gut approximieren. J e hoher die Frequ enzen werd en , desto un genau er ist die Naherung. Liegt allerdings der Nut zfrequenzb ereich eines Regelun gssystems eher bei niedrigen Frequ enzen , so ist diese Na herung durcha us angebrac ht, urn zu einer ub ersichtl icheren Ubertragungsfunktion zu gelangen.
2.4 Frequenzgangdarstellung 2.4.1 Einfiihrung des Frequenzganges Ist die Ubert rag ungsfunkt ion einer Strecke bekannt , so lasst sich mit Hilfe dieser Darst ellung auch leicht ein geeigneter Regier berechnen. Falls es nicht moglich ist , die Ubertrag ungsfunkt ion anhan d th eoretischer Uberlegungen aufzust ellen, lasst sie sich auch mit tels stat ist ischer Methoden auf der Basis ausreic hend vieler Messwert e best imm en. Dies set zt abe r das Vorh and ensein eines Rechners vorau s, was fruher naturlich nicht gegeben war. Deshalb ist damals hiiufig ein anderes Mittel verwend et worden , urn das dynamische Verh alten einer Strecke zu beschreiben , der Frequenzgang . Wie im Foigend en noch erlaute rt wird , ist dieser relativ einfach zu messen . Auch seine Darst ellung ist sehr an schauli ch und ftihrt auf eine ub ersichtliche Vorgehensweise bei der Auslegung von einfachen P1D-Reglern . Nicht zuletz t basier en diverse Stabilit at skri terien , die auch im Zusammenh an g mit Fuzzy-Reglern Verwendung finden , auf der Frequenzgan gdarstellun g des St reckenverhaltens. Der Frequ enzgang Iasst sich am einfachste n definieren als die Ubertragungsfunkt ion eines linearen Ubertrag ungsgliedes ftir rein imaginiire Werte von s . Die kompl exe Variabl e s in der Uber t rag ungsfunkt ion wird demnach lediglich durch eine rein imaginate Vari abl e jw ersetzt: G(jw) = G(s)l s=jw. Dami t ist der Frequ enzgang eine kompl exe Funktion des Paramet ers w . Wegen der Beschr iinkung auf rein imaginate Werte von s ste llt der Frequenzgan g nur einen Ausschnitt der Ubertragungsfunkt ion dar , der allerdings eine besondere Eigenschaft aufweist, wie der folgend e Sat z zeigt.
Satz 2.3 Besitzt ein lineares Ubenragungsglied den Frequenzgang G(j w), so antwortet es auf das Eingangssignal x (t ) = asinw t nach Abklingen der Einschwingvorgiinge mit dem Ausgangssignal
y(t) = a IG(j w)1 sin (wt + cp(G(jw ))) sofem gilt:
(2.68)
88
2. Regelungstechnische Grundlagen
J 00
Ig(t)ldt
< 00
(2.69)
o
Der Beweis zu diesem Satz findet sich in [43] . Mit diesem Satz wird auch klar, welche Art von Information tiber die Strecke im Frequenzgang enthalten ist: Der Frequenzgang charakterisiert das Verhalten des Systems fiir ganz bestimmte Frequenzen des Eingangssignales. Wegen der vorausgesetzten Linearitat des Ubertragungsgliedes beeinflussen sich die Wirkungen, die durch die einzelnen Frequenzanteile hervorgerufen werden, nicht gegenseitig . Dah er kann man fur jeden einzelnen Frequenzanteil des Eingangssignales vorhersagen, was am Ausgang des Systems passieren wird. 1m Gegensatz zu den Koeffizienten einer Ubertragungsfunktion sind Betrag und Phase des Frequenzganges direkt messbar: Die Strecke wird durch ein sinusformiges Eingangssignal mit einer bestimmten Frequenz und Amplitude angeregt. Nach Abklingen der Einschwingvorgangc wird sich am Ausgang ein ebenfalls sinusfOrmiges Ausgangssignal einstellen, das sich gegentiber dem Eingangssignal aber in Amplitude und Phasenlage unterscheidet. Beide GraBen sind messbar, und aus ihnen lassen sich nach Gleichung (2.68) auch sofort Betrag und Phase des Frequenzganges G(jw) berechnen. So lasst sich fur verschiedene Frequenzen eine Wertetabelle bestimmen, die den prinzipiellen Verlauf des Frequenzganges skizziert. Die Messung mit negativen Werten von w, d.h. mit negativen Frequenzen ist natiirlich nicht moglich, aber auch nicht notwendig. Denn ftir rationale Ubertragungsfunktionen mit reellen Koeffizienten und auch fur Laufzeitglieder ist G(jw) konjugiert komplex zu G( -jw). Da die Funktion G(jw) ftir w 2': 0 also bereits die gesamte Information enthalt, eriibrigt sich demnach eine Betrachtung negativer Werte von w.
2.4.2 Ortskurve Besonders anschaulich wird die Darstellung des Frequenzganges als Kurve in der komplexen Ebene. Dies ist die sogenannte Ortskurve. Wegen des zuvor Gesagten kann man sich dabei auf eine Darstellung G(jw) fur positive Werte von w beschranken. Gestalt und Interpretation solcher Ortskurven sollen nun anhand einiger Beispiele demonstriert werden (Abb . 2.23). Der Frequenzgang eines PT1 -Gliedes lautet mit (2.41):
.
G(Jw)=T '
V
JW+
V
1
;=~~==:=
";w
2T 2
+1
e- j
arctan wT
(2.70)
2.4 Frequenzgangdarstellung
89
Die zugehorige Ortskurve ist der in Abb . 2.23 gezeichnete Halbkreis. Jeder Punkt der Ortskurve stellt den komplexen Wert G(jwr) fur eine bestimmte Frequenz 0 ::::: WI < 00 dar. Er kann aber auch als Endpunkt eines Vektors interpretiert werden, der im Ursprung beginnt. Jeder dieser Vektoren hat eine bestimmte Lange, die gleichbedeutend mit der Verstarkung des Ubertragungsgliedes ftir die Frequenz WI ist, und eine Phasenlage, die gerade der Phasenverzogerung fur die Frequenz WI entspricht. Ablesen lasst sich nun beispielsweise, dass die Verstarkung fur Gleichsignale , also Signale mit der Frequenz W = 0, den Wert V hat. Wegen Gleichung (2.59) ist dies auch gerade der Endwert der Sprungantwort. Das ist aber wiederum kein Zufall, denn beim Sprung liegt nach Abklingen der Einschwingvorgange ebenfalls eine reine GleichsignaHibertragung vor. Weiterhin zeigt die Ortskurve, dass fiir hohere Frequenzen die Verstarkung immer weiter abnimmt , bis sie sich schlieBlich dem Wert Null nahert, was nach Gleichung (2.60) gerade dem Anfangswert der Sprungantwort entspricht. Insgesamt stellt das PT1-Glied wegen der fur hohere Frequenzen immer weiter abnehmenden Verstarkung einen Tiefpass dar. Mit zunehmender Frequenz nimmt aber auch die Phasenverzogerung durch das PT1 -Glied immer weitcr zu, wie man am Kurvcnvcrlauf und den gedachten Vektorcn vorn Ursprung zur Kurve leicht nachvollziehen kann . Fur W = 0 ist G(jw) rein reell und die Phasenverzogerung damit Null, wahrend fur wachsende Frequenzen die Phasenverzogerung gegen den Wert -rt: / 2 konvergiert . Eine hochfrequente Sinusschwingung wird durch das PTI-Glied also urn nahezu eine Viertelperiode verzogert. Aus Gleichung (2.43) ergibt sich fur den Frequenzgang des PT2-Gliedes :
V G(jw) =
w2
'2D
-:-:2+J W o
-+ 1 W
Wo
2D..!:!:L
V
-;========== e
- j arctan
1 -(
::;0)2
Wo
(2.71)
(1 - C:;'0)2) 2 + 4D2C;)J2 Die Cleichsignalverstarkung betragt wie beim PTI-Glied gerade G(O) = V, die Verstarkung fur hohe Frequenzen geht ebenfalls gegen Null. Auch das PT2-Glied ist also ein Tiefpass. Fur D < ~ nimmt der Betrag aber nicht wie beim PTI -Glied monoton ab, sondern weist ein Maximum bei der sogenannten Resonanzfrequenz W r = wav'l - 2D2 auf, wie man leicht durch eine einfache Extremwertberechnung des Frequenzganges nachprufen kann . Der Maximalwert des Betrages wird umso groBer, je kleiner die Dampfung D ist . Man spricht von einer Resonanziiberhohung. Fur eine Dampfung D ::::: ~ tritt dagegen keine Resonanzuberhohung auf. Ein Unterschied zum PTI-Glied besteht auch im Verlauf der Phasennacheilung, die fur hohe Frequenzen gegen den Wert -Jr geht.
90
2. Regelungstechnische Grundlagen j lm(G(joo))
j Im(G(joo))
Re(G(joo»
Re(G(joo))
PTTGlied
jlm(G(joo»
jlm(G(joo»
Re(G(joo»
Re(G(joo»
Integrator
Laufzeitglied
jlm(G(joo»
j lm(G(joo»
Re(G(joo»
Re(G(joo))
Abb. 2.23. Ortskurven linearer Ubertragungsglieder
Sehr einfache Verh altnisse liegen beim Int egrator vor. Die Formel fur den Frequenzgang lautet : 1
G(jw) = --;-
(2.72)
JW
Die Verst arkung nimm t mit W ab, weshalb man auch den Integrator als Tiefpass auffassen kann . Fur Gleichsignale ist die Verstarkung unendli ch groB, was leicht dadurch zu erklaren ist , dass der Int egrator bei einer konst anten Ein gangsgrofe immer weiter aufintegr iert. Die Phasenverzogerung bet ragt wegen des Faktors ]' konst ant - 7r / 2. Dies ergibt sich auch sofort, wenn man das Ausgan gssignal des Integrators mit einer Sinusschwingung am Eingang im Zeitbereich berechne t: t
y(t) = ! sin(WT)dT = o
-~ cos(wt) + ~ W
W
=
~ sin(wt - ~ ) + ~ W
2
W
(2.73)
2.4 Frequenzgangdarstellung
91
Man sieht, dass das Ausgangssignal nicht nur die verzogerte Sinuss chwingung, sondern auch einen konstanten Term ~ enthalt , obwohl doch nach Satz 2.3 auch am Ausg ang eine reine Sinusschwingung auftret en miisst e. Dies liegt daran , dass der Integrator als einziges der hier genannten Beispiele die Voraussetzung des Satzes nicht erfiillt, d.h. dass das Integral seiner Impulsantwort nicht konvergiert . ~ st ellt damit das in Sat z 2.3 erwiihnte Restglied r(t) dar. Da dies im vorliegend en Fall ab er konstant ist und keine weiteren Auswirkungen hat , kan n es au ch vernachliissigt werden. Interessant ist eine Betrachtung der Ortskurve des Laufzeitgliedes . Wegen G(s) = e- T L 5 ergibt sich fiir den Frequenzgang (2.74)
Die Verstiirkung ist damit immer Eins , und die Phasennacheilung hiingt von Frequenz und Laufzeit ab oDieses Verh alten ist sofort einsichtig. Beaufschlagt man ein Laufzeitglied mit einer stationiiren Sinuss chwingung, so erscheint das Signal im Bet rag unveriindert, aber um die Laufzeit TL verzogert am Ausg ang . Druckt man diese Verzogerung als Winkel aus, so ist dieser na turlich umso grofier, je hoh er die Frequenz des Signales ist. Das nachste Beispiel ist die Ortskurve eines IT1-Gliedes , also der Hinterein anderschaltung eines Integrators und eines PT1 -Gliedes: 1
V
G(s) = - - s Ts + 1 G( ·w) _ ~ V J - JW . T'JW +1
(2.75)
Fur W ---> 0 geht der Realteil gegen - VT und der Imaginiirteil gegen -00 . Fur W ---> 00 gehen beide Ant eile gegen Null. Auch hier liegt also ein Tiefpass vor. Den Abschluss bild et eine etwas kompliziertere , rationale Ub ortragungsfunktion : mit bzw.
G(j w) =
+W2 2 2 W Jw + s~ 2 s1
Sl
»
S2
>0
e2 a rctan *-arct a n ~ - 1r
(2.76)
(2.77)
Die Ermittlung dieser Form el ist recht einfach, wenn man jeden Faktor der Ub ertragun gsfunktion einzeln betrachtet . So liefert der Faktor (jw + S1) beispielsweise einen Betragsanteil von + w 2 und einen Winkelanteil zur Phasenverzogerung von arctan s-. 5, Die einzelnen Betragsanteile aller Faktoren werd en dann miteinander multipliziert und die Winkel anteile addiert . Der Betragsverlauf beginnt offenbar im Unendli chen und endet bei Null. Der Winkel der Funktion ist fur kleine Werte von w zunachst kleiner als -7r , da die Funktion arc tan ~ wegen 81 » 82 zuniichst schneller wachst als die
J si
92
2. Regelungstechnische Grundlagen
also im Funktion 2 arctan s-. 8, Die Kurve befindet sich fiir kleine Frequenzen . zweiten Quadranten. Fiir w -+ ()() konvergieren die arctan-Funktionen dann aber jeweils gegen ~, so dass der Gesamtwinkel gegen 2~ - ~ - Jr = -~ konvergiert. Nach diesen Beispielen lassen sich fur Ubertragungsfunktionen gemaf Gleichung (2.61), d .h. rationale Ubertragungsfunktionen mit Laufzeit, einige allgemeine Aussagen machen: Ist die Ordnung des Zahlerpolynoms kleiner als die Ordnung des Nennerpolynoms, so enden die Ortskurven immer im Ursprung der komplexen Ebene, da der Betrag der Ubertragungsfunktion offensichtlich gegen Null konvergiert. Falls keine Polstelle bei Null vorliegt, liegt der Anfangspunkt immer auf einem endlichen reellen Wert, wie es beim PT1 - oder PT2-Glied der Fall ist . Ist mindestens ein Pol bei Null vorhanden, so beginnt die Ortskurve im Unendlichen, und zwar unter einem Winkel -k~, wobei k die Ordnung dieses Pols ist. Phasen- und Betragsverlauf miissen aber keinesfalls immer monoton fallen, wie schon die Betrachtung des PT2-Gliedes gezeigt hat. Der Verlauf der Ortskurve hangt von der Verteilung der Pol- und Nullstellen der Ubertragungsfunktion ab o
2.4.3 Bode-Diagramm Der Nachteil an der Ortskurvendarstellung ist die fehlende Zuordnungsmoglichkeit einzelner Punkte zu bestimmten Frequenzen. Hier bietet sich als Alternative die Darstellung des Frequenzganges im Bode-Diagramm [19] an. Betrag und Phase werden in zwei Diagrammen getrennt voneinander iiber der Frequenz aufgetragen, und zwar Betrag und Frequenz im logarithmischen und die Phase im linearen MaBstab. In Abb. 2.24 werden als Beispiele die Bode-Diagramme von einem PT1 und einem PT2-Glied gezeigt. Deutlich zu erkennen sind die Anfangs- und Endwerte bei den Phasenverlaufen, die man auch sofort aus den Gleichungen (2.70) und (2.71) oder den zugehorigen Ortskurven erhalt. Dasselbe gilt fur die Anfangswerte bei den Betragsverlaufen. Der Endwert Null der Betragsverlaufe liegt wegen der logarithmischen Darstellung im negativ Unendlichen. AuBerdem erkennt man beim PT2-Glied im Bereich der Eigenfrequenz Wo die Resonanzuberhohung ftir kleinere Dampfungen D. Die Analyse eines dynamischen Systems anhand von Ortskurven und Bode-Diagrammen bietet sich immer dann an, wenn bei unbekannten Strecken Bur der gemessene Frequenzgang, aber kein Streckenmodell vorliegt. Aber auch bei gegebener Ubertragungsfunktion ist eine graphische Analyse mit ihrer Hilfe anschaulicher und natiirlich einfacher zu iiberpriifen als beispielsweise die nummerische Analyse mit einem Rechner. Die Auswirkungen von Parameteranderungen in einem System lassen sich meist vieI einfacher auf graphischem Wege abschatzen als durch eine nummerische Berechnung. Daher bietet heutzutage jede regelungstechnische Software die Moglichkeit, BodeDiagramm oder Ortskurve bei gegebener Ubertragungsfunktion auf Knopfdruck zu erstellen.
2.5 St abil itat linearer Systeme
v -+-
o
T-l ~------,,-
v-+-~~\----OlJog
OlJog
q>
fs==-w: '
0
OlJog
OlJog
:
-1tI2
93
'
-1tI2 -1t
PT, -Glied
PTz-Glied
Abb. 2.24. Bode-Diagramme von PT 1 - und PT2-Gli ed
Ein weit eres wichti ges Werkzeug zur Anal yse linearer Regelstrecken soll hier nicht unerwahn t bleiben, die Wurzelortskurven. Bei diesem Verfahren wird die Lage der Pole in der komplexen Eb ene in Abh angigkeit von bestimmten Par amet en dargestellt . Die Charakte risieru ng des Streckenverha ltens erfolgt hier also durch eine direkte Betrachtung der Polstellen und nicht indir ekt mit Hilfe des Frequenzganges, wie es bei Ortskurven und Bode-Diagrammen der Fall ist . Dafur sind Wurzelortskurven aber nicht bei der Ana lyse nichtlinearer Regelkreise einsetzbar. Und da diese das hau pt sachliche Einsatzgebiet von Fuzzy-Reglern sind , wurdc hier auf die Behandlung von Wur zelortskurven verzichtet.
2.5 Stabilitat linearer Systeme 2.5.1 Definition der Stabilitat In diesem Kapitel soll fiir linear e Syst eme der Begriff der St abilitat erlautert werd en. Das lineare Syst em sei gegeben durch die Ubertragungsfunktlon G (s )
= bms m + bm_l s m - 1 + ans n + an_l s n- l
+ bl s + bo e- T L S + + al s + ao
mitm
~
n
(2.78)
mit dem Verst arkungsfaktor
(2.79)
94
2. Regelungstechnische Grundlagen
Zuniichst ist zu klaren , was eigent lich Stabili tat eines Systems bedeutet. Es exist ieren verschiedene Definitionsmoglichkeiten , von denen an dieser Stelle zwei betrachtet werden sollen. Ein e dri t te Definition nach dem ru ssischen Mathematiker Ljapunov wird dann spater noch erlautert. In der erst en Definit ionsrnoglichkeit wird die Sprungantwort des Systems betrachtet :
Definition 2.4 W enn die Sprungantwort eines System s fur t -+ 00 einem endlichen Wert zustre bt, so heiflt das Sys tem sta bil. Andernfalls heifle es instabil. Dass fur diese Definit ion als Anr egun g der Einheitssprung gewahlt wurde, bedeutet keine Ein schr ankung, Denn wenn die Sprunghohe urn den Faktor k verandert wird , so andern sich wegen der Linearit at des Syste ms die Werte am Ausgang ebenfalls urn den Faktor k , Die Endlichkeit bleibt abe r erhalte n. Ansch aulich lasst sich diese Definition wie folgt begriinden: Wenn ein Syste m nach einer derart hefti gen Anr egung, wie es ein Sprung des Eing angssigna les ist , wieder zur Ruhe kommt und einem endlichen Wert zust rebt, so kann man davon ausgehen, dass es auch bei and eren Anregungen nicht in bleib end e Schwingungen versetzt wird. Es lasst sich leicht nachvollziehen , dass PT1 - und PT2- Glied nach dieser Definiti on stabil sind und ein Integra tor inst abil ist . Ein e andere Definition beriicksichtigt , dass die Ein gan gsgrof e eines Systems standigen Schwankungen unterworfen sein kann :
Definition 2.5 Ein lineares System heifle stabil, wenn bei einer Eingangsgrofle mit beschriinkter Amplitude auch die Amplitude der Ausgangsgrofle beschriinkt ist. Dies ist die BIBO-S tabilitiit (bounded input - bounded output). Es ste llt sich sofort die Frage nach einem Zusammenh ang zwischen beiden Definitionen , der im Folgend en kurz untersucht werden soll. Ausgan gspunkt der Uberlegungen ist das Faltungsint egral (vgl. Gleichun g (2.48)) , das den Zusammenhang zwischen Ein- und Ausgangsgrofie eines Systems beschreibt (g(t) ist die Impulsan twort ):
J t
y(t) =
g(t - T)X(T)dT =
T= O
J t
g(T)X(t - T)dT
(2.80)
T= O
X(t) ist gena u dann beschran kt , wenn Ix(t)1 :::; k mit k > 0 fiir aile t gilt . Dami t ergibt sich: t
ly(t)l ::;
J T=O
t
Ig(T) llx(t - T)ldT :::; k
J
Ig(T)ldT
T=O
Wenn das Integral der Impulsantwort also absolut konvergent ist ,
(2.81)
2.5 Stabilita t 1inearcr Systeme
J
95
00
Ig(r)ldr = c < 00
(2.82)
r= O
dann ist auch y(t ) durch kc beschrankt und das Syst em somit BIBO-stabil. Ebenso lasst sich zeigen, dass ftir jedes BIBO-st abile System das Integral (2.82) absolut konvergen t ist . BIBO-Stabilitat und die absolut e Konvergenz des Integrals sind also zueinander gleichwert ige Eigenscha fte n. Nun solI die Bedingung ermittelt werd en , unter der ein System st abil im Sinne einer endlichcn Sprungantwort (Definition 2.4) ist: Fur die Sprungantwort eines Syste ms gilt im Frequenzbereich (vgl. (2.49)) 1
y(s) = G(s) s Fasst man den Fakt or 1/ s nicht als Laplace-Tr ansformi erte des Sprungsignals , sond ern als Integra tion auf, so ergibt sich im Zeitbereich mit y(O) = 0
J t
y(t) =
g(r)dr
(2.83)
r=O
y(t ) strebt nur dan n einem endlichen Wert zu, wenn das Integral konvergent ist :
J 00
g(r)dr = c < oo
(2.84)
r =O
Die Konvergenz ist offensichtlich eine schwachere Bedingung als die absolute Konver genz. Dami t hat jedes BIBO-stabile Syst em auch eine endliche Sprungantwort. Es wiirde sich nun anbiete n, Stabilitat imrner im Sinne der BIBO-St ab iliUit aufzufassen , weil dies die strengere Definiti on ist und somit keine weit ere Unte rscheid ung notwend ig war e. And ererseits werd en die £01genden Betrachtungen wesentlich vereinfacht , wenn man Stabilitat nur im Sinne einer endlichen Sprungantwort auffasst. Zudem sind ftir rein rationale Ube rtragu ngsfun ktione n ohn ehin beide Definit ionen aquivalent. Fur die St abili t at gilt dah er von nun an immer Definiti on 2.4. Manchmal wird St abili t at auch so definiert, dass die Impulsantwort g(t) mit t ----7 00 gegen Null gehen muss. Ein Blick auf das Int egral au s (2.84) zeigt , dass diese Bedingung zwar notwendi g, nicht abe r hinreichend fiir St abilitat nach Definition 2.4 ist . Diese Definition ist damit schwacher als Def. 2.4. Kann man also den Nachweis einer endlichen Sprungantwort erbr ingen, so geht die Impulsantwort auf jeden Fall gegen Null.
2.5.2 Stabilitat einer Ubertragungsfunktion
Urn zu vermeiden, dass fur den Nachweis der St abilitat die Sprungantwort des Syst ems explizit zu berechnen ist , biet et es sich an, die Ub ertragungsfunktion des Systems direkt zu betracht en und die Bedin gun gen abzuleite n,
96
2. Regelungstechnische Grundlagen
unt er denen das System st abil ist. Dies ist nach den Uberlegungen , die bereits zur Sprungantwort einer rationalen Ubertragungsfunktion gemacht wurd en, relativ einfach. Es gilt der folgende Satz:
Satz 2.6 Ein Ubertragungsglied mit einer rationalen Ubertragungsfunktion ist genau dann stabil im Sinn e von Definition 2.4, wenn aile Pole der Ubertragungsfunktion einen n egativen Realteil aufweisen. Nach Gleichung (2 .58) lautet die Sprungantwort eines rati onalen Ubertragungsgliedes:
y(t) =
L h),(t)es>.t
(2.85)
), = 1
Zu jedem n),-fachen Pol s), gehort ein Summand h),(t)es>.t mit einem Polynom h),(t) vom Grade n), - 1. Weist der Pol einen negativen Realt eil auf, so verschwindet dieser Summand mit wachsendem t , da die Exponentialfunktion schneller gegen Null konvergiert als das Polynom h),(t) wachsen kann . Wenn aile Pole der Ubertragungsfunktion einen negativen Realt eil aufweisen, so verschwinden aile zugehorigen Summanden. Ubrig bleibt nur der durch die Sprungfunktion verursachte Summand hi(t) es•t mit dem einfachen Pol S i = O. Das Polynom hi(t) ist vom Grade ni - 1 = 0, d .h. konstant, und die Exponentialfunktion reduziert sich ebenfalls auf cine Konstante. Damit bildet dieser Summand gerade den endlichen Endwert der Sprungfunktion, und das System ist stabil. Auf den Beweis der Umkehrung, dass namlich bei mindest ens einem Pol mit nicht negativem Realteil ein instabiles System vorliegt , solI an dieser Stelle verzichtet werden, da er keine neuen Erkenntniss e brin gen wiirde, Interessant ist , dass Satz 2.6 auch Fiir Systeme mit Laufzeit nach (2.78) gilt. Auf den zugehorigen Beweis solI hier ebenfalls verzichtet werden. 1m allgemeinen ist neben der Tatsache der Stabilitat auch die Form der Einschwingvorgange nach einer iiuBeren Anr egung interessant. Weist die Strecke unt er anderem ein konjugiert komplexes Polpaar s )" s-), auf, so ist na ch Gleichung (2.22) das Verhaltnis IRe(s),)I/JRe(s),)2 + Im( s),)2 gerade gleich der Dampfung D und somit fiir die Form des zu diesem Polpaar gehorenden Einschwingvorgangs verantwortlich. Man wird daher in der Praxis nicht nur darauf achten, dass die Pole eines Systems einen negativen Realteil aufweisen , sondern auch darauf, dass die Dampfung D einen ausreichend graBen Wert hat , d.h. dass ein konjugiert komplexes Polpaar ausreichend weit von der imagin aren Achse entfernt liegt . 2.5.3 Stabilitat eines Regelkreises Das Syst em, dessen Stabilitat beurteilt werden soli, ist in den meisten Fall en ein geschlossener Regelkreis, wie er in Abb . 2.2 dar gestellt ist. Eine vereinfacht e Struktur gibt Abb. 2.25 wieder. Das Regelglied habe die Ubert ragungsfunkt ion K (s ), die St recke ist dur ch G(s) und das Messglied dur ch
2.5 Stabilitat linearer Systeme
97
M(s) gegeben. Urn die weitercn Herleitungen nicht unnotig zu erschweren, wird aber M(s) = 1 gesctzt, d.h . das dynamische Vcrhalten des Messgliedes wird vernachlassigt. Es ist abcr kein Problem, im Einzelfall ein Messglicd zu beriicksichtigcn. d
w
e
- - 0 - - - 11
I
K
II--u~)---ll G I I
l
-----i
L--
I
M
It-
y 11---....--::.-
I
--'
I
Abb. 2.25. Regelkreis
Die Storgrofen, die prinzipiell an beliebigen Stellen des Regelkreises angrcifen konnen , werden ZIl einer einzigen Storgrofie d zusammengefasst, die direkt am Eingang der Strecke aufgeschaltet ist . Auch diese MaBnahme vereinfacht die Theorie, ohne dass die Verhaltnisse ails Sicht des Reglers einfacher werden, als sie in der Praxis sind. Der Angriffspunkt am Eingang der Strecke ist namlich die fur cine Regelung denkbar ungiinstigste Stelle, da die StOrgroBe zunachst unbehelligt auf die Strecke einwirken kann , wahrend der Regier erst nach einer Veranderung der Ausgangsgrofle GegenmaBnahmen einleitcn kann . Zur Anwendung der Stabilitatskriterien auf dieses System ist zunachst die Ubertragungsfunktion aufzustellen, die das Ubertragungsverhalten von der Eingangsgrofe w zur Ausgangsgrofie y beschreibt. Dies ist die Ubertragungsfunktion des geschlossenen Kreises und wird auch als Fiihrungs-Ubertragungsfunktion bezeichnet. Zur Berechnung wird die Storgrofle d zunachst gleich Null gesetzt . 1m Frcquenzbereich gilt:
y(s) = G(s)u(s) = G(s)K(s)(w(s) - y(s)) T(s)
= y(s) = G(s)K(s) w(s) G(s)K(s) + 1
(2.86)
Analog dazu lasst sich auch eine StOr- Ubertragungsfunktioll berechnen, die das Ubertragungsverhalten des Systems von der Storgrofe d zur Ausgangsgrofe y beschreibt:
S(s) _ y(s) _ G(s) - d(s) - G(s)K(s)
+1
(
) 2.87
Der Term G(s)K(s) hat eine besondere Bedeutung: Entfernt man narnlich die Hiickfiihrung, so bildet er gerade die Ubertragungsfunktion des dann vorliegenden, offenen Kreises. Er wird auch als KreisiibertraguIlgsfuIlktioIl bezeichnet. Der Verstarkungsfaktor V dieser Funktion (vgl. Glcichung (2.78)) wird als Kreisverstiirkung bezeichnet,
98
2. Regelungstechnische Grundlagen
Man sieht , dass sowohl Fiihrungs- als auch Stor-Ubert ragun gsfunktion denselb en Nenner G( s)K(s) + 1 aufweisen. Andererseits ist es ab er nach Satz 2.6 gerade der Nenner der Ubertragungsfunktion, der fiir die Stabilit at verantwort lich ist . Daran lasst sich erkenn en, dass ftir die Stabilitat eines Syst ems nur die Kr eisiibertragungsfunktion, nicht aber der Angr iffspunkt der Eingangsgrofe relevant ist . Ein e Stabilit atsuntersuchung kann sich dah er auf die Unt ersuchung von G( s)K(s) + 1 beschranken. Da Zahler und Nenner der beiden Ubertragungsfunktionen T (s) und 8(s) offensichtlich jeweils t eilerfremd sind , ents prechen die Nullstellen von G(s)K( s) + 1 gera de den Polen dieser Funktionen, und es ergibt sich als direkt e Folgerung aus Sat z 2.6: Satz 2.7 Ein geschlossen er Kreis m it der K reisubertragungsfunktion G(s)K(s) ist genau dann stabil, wenn alle Lo sunq en. der charakteristischen Gleichung (2.88) G(s)K(s) + 1 = 0 eine n negativen R ealteil aufw eisen.
Eine Berechnun g dieser Nullst ellen ist aber auf analyt ischem Wege nicht mehr moglich, wenn die Ordnung der Strecke grofier als zwei ist oder die Kr eisiibe rtragun gsfunktion eine Exponent ialfunktion entha lt . Die exakte Lage der Nullstellen muss aber fur eine St abilitatsuntersuchung auch gar nicht bekannt sein . Wichtig ist lediglich die Tatsache, ob sic einen positiven oder negativen Realt eil aufweisen. Aus diesem Grund sind in der Vergangenheit St abilitat skriterien entwickelt worden, mit denen ohne aufwandige Rechnung genau dies iiberpriift werd en kann .
2.5.4 Kriterium von Cremer, Leonhard und Michailow Als erstes soll auf ein Kriterium eingegangen werd en, das von Cremer [33], Leonh ard [104] und Michailow [118] in den J ahren 1938 bis 1947 unabhangig vonein and er herausgefund en wurd e und gewohnlich auch nach diesen Forschern benannt wird. Gegenstand der Betrachtungen ist die Phasendrehung der Ortskurve eines Polynoms in Abh angigkeit von der Lage seiner Nullste llen. Gegeben sei ein Polynom der Form
P(s) = s"
+ an_l s n- l + ... + al s + ao =
n
II (s -
sv )
(2.89)
v=l
Mit s = j w wird daraus n
P( j w) =
II (j w -
n
II (lJw -
sv) =
v =l
sv lej'i'v(w ))
v =l n
n
=
II v= l
L 'i'v (w) . Ijw - svl e v=1 = IP(j w)leJ'i'(w) j
(2.90)
2.5 Stabilitat Iinearer Systeme
99
Der Frequenzgang P (j w) ist also das Produkt der Vektoren (jw - s,,), wobei die Ph ase
Abb, 2.26 . Zum Kriterium von Cremer-Leonhard-Michailow
Durchlauft der Par ameter w das Int ervall (- 00, (0), so wand ert der Endpunkt der Vektoren (jw - s,, ) einma l langs der imaginar en Achse in positiver Richtung. F ur Nullst ellen mit negativem Realt eil durchlauft der zugehOrige Winkel r.p" das Intervall von - ~ bis + ~ , fiir Nullstellen mit positivem Realteil das Intervall von + bis + ~ . Fur Nullst ellen auf der irnaginar en Achse hat der zugehorige Winkel
3;
-r
Satz 2.8 Ei n Polynom P (s) vom Grad n m it reellen K oefjizient en weist gen au dann nur Null st ellen m it n egativem R ealteil au], wenn seine Ortskurve nicht durch den Ursprung der kompl cxen Ebene geht und die Phas endrehung .:1r.p des Frequenzganges Jilr - 00 < w < + 00 gerade nat betriigt. Durchliiuft w nur den B ereich 0 :s; w < +00, so betriigt die notwendige Ph asendrehung ~7f. Die Tatsache, dass fiir 0 :s; w < +00 die notwendi ge Phasendrehung nur noch ~7f und dami t gerade die Halfte betragt , ist leicht zu beweisen: Fur Nullstellen auf der reellen Achse ist es offensicht lich, dass ihr Beitrag zur Phasendrehung nur noch halb so grof ist , wenn w nur die hal be imaginate Achse von 0 bis 00 durchlauft , Interessan ter sind die Nullste llen , deren Imaginarteil von Null verschieden ist. Diese konn en aber wegen der
100
2. Regelungstechnische Grundlagen
reellen Koeffizienten des Polynoms immer nur als komplex konju giertes Polpaar auftreten. Abb . 2.27 zeigt ein solches Polp aar, S l = S-2 und a1 = - a 2 . Fur -00 < W < +00 ist der Beitrag dieses Polp aars zur Phasendrehung 21f. F ur 0 ::; W < + 00 betriigt der Beitrag von S l gerade ~ + la11, fur S2 ist er ~ - la11. Insgesamt ist der Beitrag dieses Polp aars damit n , auch hier hat sich also die Phasendrehung auf die Halft e reduz iert. 1m
Re
Abb. 2.27. Zur Phasendrehung bei einem konjugiert komplexen Polpaar
Abb . 2.28 zeigt als Beispiel zwei Ortskurven von Polynomen funft er Ordnun g. Da die Ortskurve die gra phische Repriisent ati on des Frequenzganges ist , lasst sich die jeweilige Phasendrehung auch dir ekt an der Ortskurve ablesen. Dazu ist ein Fahrstrahl vom Ursprung zur Ortskurve einzuzeichnen, wie dies fur Kurve 1 zu sehen ist. Dann hat man die Anzahl der Umdrehungen urn den Urspru ng zu ermitteln, die dieser Vektor fur den gesamten Verlauf der Or tskurve vollzieht . Der so gewonnene Winkel ents pricht der gesuchte n Phasendrehung des Frequenzganges. Im(G(jco)
Re(G(jco»
Abb. 2.28. Ortskurven von Polynomen 5. Ordnung
Kurve 1 weist eine Gesamt-Phasendrehung d
2.5 Stabilitat linearer Systeme
101
auch einfach gemessen werden kann , falls die F'unktion nicht in analytischer Form vorliegt. Es sei
Zk(S) = G(s)K(s) Nk(S) mit zwei teilerfremden Polynomen Zk(S) und Nds). AuBerdem sei der Grad m von Zds) hochstens gleich dem Grad n von Nk(S), was aber fur physikalisch realisierbare Systeme immer erftillt ist. Wegen
T s _
Zk(S)
G(s)K(s) N;;(Sj ( ) - 1 + G(s)K(s) - 1 + Zk(S)
(2.91)
N.(s)
ist Ng(s) = Zk(S) + Nk(S) gerade der Nenner der Ubertragungsfunktion des geschlossenen Kreises T(s) und ebenfalls vom Grad n . Damit gilt :
Zk(S)
Ng(s)
1 + G(s)K(s) = 1 + Nk(s) = Nds)
(2.92)
Die Phase des Frequenzganges 1 + G(jw)K(jw) ist die Differenz der Phasengange von Zahler- und Nennerpolynom: (2.93) Damit ergibt sich fur die gesamte Phasendrehung (2.94)
Zur Berechnung der Phasendrehungen fJ.ifJN g und fJ.ifJN k muss nach Satz 2.8 die Verteilung der Nullstellen der Poly nome Ng(s) und Nk(S) bekannt sein. Die Nullstellen von Ng(s) sind die Polstellen des geschlossenen Kreises . Von diesen n Polstellen mogen "s in der rechten Halfte der s-Ebene, i g auf der imaginaren Achse und n - r 9 - i g in der linken Halfte liegen. Entsprechend sind die Nullstellen von Nk(s) gerade die Polstellen der Kreisiibertragungsfunktion. Von diesen ebenfalls n Polstellen mogen rk rechts von der imaginaren Achse, ik auf und n - rk - ik links von ihr liegen. Da sowohl i g als auch ik von Null verschieden sein konnen, weisen die Phasengange ifJNg(W) und ifJNk(W) einen moglicherweise unstetigen Verlauf auf, wie schon in der Herleitung von Satz 2.8 erklart wurde. Urn Schwierigkeiten zu vermeiden, soll nur der stetige Anteil der Phasendrehungen betrachtet werden . Nach Satz 2.8 steuert zur Phasendrehung einer Ortskurve mit 0 < w < 00 jede Nullstelle mit negativem Realteil die Phasendrehung jede mit positivem Realteil die Phasendrehung - bei:
i
i,
(2.95)
102
2. Regelungstechnische Gruncllagen
Fur den stetigen Anteil der Phasendrehun g von 1 + G (jw )K(j w ) ergibt sich: L1
.
.
~
~
[(n - rg - Zg ) - rgl"2 - [(n - rk -lk ) - rk]"2 ~
= [2(rk - rg) + ik - ig] "2
(2.96)
Fordert man nun Stabilitiit des geschlossenen Kreises, so darf dieser nur Polstellen mit negativem Realteil aufweisen. Es muss r 9 = i g = 0 gelte n und dam it (2.97) Ob die Kreisiib ertragun gsfunktion dab ei stabil oder inst abil ist , spielt keine Rolle. Lediglich die Anzahl ihrer Pole auf und rechts neben der imaginaren Achse muss bekannt sein. Allerdings ist in dieser Form el nur der steti ge Ant eil der Phasendrehung behandelt worden. Nullst ellen von Ng(s) auf der imaginaren Achse verursachen aber unsteti ge Phasenan derungen . Demnach kann durch eine Analyse der st et igen Phasendrehung nach Gleichung (2.97) zwar ausgeschlossen werden , dass Ng(s) Nullste llen mit positivem Realteil besitzt, nicht aber , dass rein imaginate Nullst ellen auft rete n . Wegen Gleichun g (2.92) entsprechen die Nullste llen von Ng(s) den Nullste llen von G(s)K(s) + 1. Eine rein imaginare Nullste lle von Ng(s) hat demnach zur Folge, dass auch der Frequenzga ng G(jw) K(jw) + 1, dessen Argument jw rein imaginar ist , eine Nullstelle bei der entsprec henden Frequenz aufweist. Das bedeut et ab er wiederu m, dass die Or t skurve von G(jw) K(jw) + 1 durch den Urspru ng geht. Damit ergibt sich, class fur einen stabilen Regelkreis nicht nur Gleichung (2.97) gelten muss , sondern die Or tskurve G(jw) K(jw) + 1 auch nicht durch den Urspru ng lau fen darf. St att der Or tskurve 1+ G (jw )K(jw) kann man auch die - dir ekt messbare Or tskurve der Kreisiibertragun gsfunk tion G (jw) K (jw) betrachten. Samt liche Uberlegun gen beziehen sich dann nicht mehr auf den Ursp rung der kompl exen Ebene, sondern auf den Punkt -1 , wie aus Abb . 2.29 ersicht lich ist. Dies fiihr t zum folgend en Sat z. 1m
1m Re
Abb. 2.29 . Ubergang von der Kurve (l+GK) auf (GK)
Satz 2.9 (Nyquist-Kriterium) Ein geschlossener Kreis ist genau dann sta-
bil, wenn die stetige Phasendrehung der Ortskurve seiner Kreisiibertragungsfunktion G(s) K(s) um den Punkt -1 gerade
2.5 Stabilitat linearer Systeme
103
beiriiqt und die Kurve nicht durch den Punkt -1 lauft. Dabei ist i k die Anzahl der Polstellen der Kreisiibertragungsfunktion auf der imaquuiren. Achse der s-Ebene und rk die Anzahl der Polstellen rechts von ihr. Wicht ig fur die Anwendun g des Nyquist-Kriteriums ist , dass rk und ik bekannt sein miissen. Weiterhin sei angemerkt , dass das Nyquist-Kriterium auch fiir Laufzeiten in del' Kreisiibertragun gsfunk tion gilt . Auf den Beweis hierzu soli abel' verzichtet werden. In Abb. 2.30 werden dr ei Beispiele zur Anwendung des Nyquist-Krite riums gezeigt. Die linke Ortskurve entsteht bei del' Hint ereinand erschaltung eines Int egrators und eines PTI - Gliedes, es ist also rk = 0 und ik = 1. Die fur St abilit at erforderliche Phasendrehun g urn den Punkt - 1 betragt damit gerade ~. Man sieht , dass del' Zeiger vom Punkt - 1 zur Ortskur ve zunachst nach unten zeigt und sich dann nach recht s dreht . Diese Viert eldrehung im mathematisch positiven Sinn entspricht gera de dem erforderlichen Winkel ~ . Ein geschlossener Kreis mit einern Int egrator und einem PTJ-Glied ware daher stabil. Wiirde man die Kr eisverstarkung V verandern , so wiirde die Ortskurve gestrec kt oder gestaucht . Ihr prinzipieller Verlauf bliebe aber erhalte n und damit auch die Phasendrehung, d.h. auch bei einer Vera nderung von V bleibt das Syste m stabil. Dies gilt nicht fur aIle Syst eme, wie die nachsten beiden Beispiele zeigen. Irn(GK(jro))
Irn(GK(jro)) -I
Re(GK(jro»
Irn(GK(jro)) -I
Re(GK(jro))
Abb. 2 .30. Beispiele zum Nyquist-Kriterium Die Mitte del' Abbildu ng ent halt die schon bekannte Ortskurve del' Kr eisiibertragun gsfunk ti on
G(s )K(s)
=V
(s + SI? (S + S2)s2
(2.99)
Wegen ik = 2 betragt die fiir Stabilitat erforderliche Ph asend rehung beziiglich - 1 gera de tt, Die Ortskurve kommt aus dem negativ Unendlichen. Del' Zeiger vorn Punkt -1 zur Ortskurve zeigt dah er zunachst nach links und dr eht sich dann im positi ven Sinn nach rechts, was einer Ph asendrehung von IT ents pricht. Auch hier ware also ein geschlossener Kreis mit einer solchen Kreisiibertragun gsfunk tion stabil. Verkleinert man jet zt ab el' V , so wird die Kurve gestaucht und del' Punkt - 1 schlieBlich oberha lb passiert. Die Ph asendrehung betragt dann statt IT gerade - IT , und del' geschlossene Kreis ware instabil.
104
2. Regelungstechnische Grundlagen
Das dri t te Beispiel ist die Hintereinanderschaltung eines PT1 - und eines Laufzeitgliedes: V G( s)K(s) = _ _ e- T L S (2.100) Ts + 1 Die Kurve beginnt wie beim P T1-Glied auf der reellen Achse, lauft dann abe r spiralfOrmig in den Ursprung, denn die Phase des Frequenzgan ges wird durch das Laufzeitglied und der Betrag durch das PT1 - Glied immer weit er verkleinert . J e nach Wahl der Param et er V und T L wird der Punkt -1 ein oder mehrere Male umfahren oder nicht . Wird er, wie gezeichnet , nicht umfahren, so betragt die Phasend rehung Null. Denn der Zeiger vom Punkt -1 an die Ortskurve schwingt zwar standig zwischen posi tiven und negativen Winkeln , in der Gesamtbilanz andert sich aber nichts, da sowohl der Anfangsals auch der Endpunkt rechts von -1 auf der reellen Achse liegen und der Punkt -1 auch nicht umfahren wird . Wegen rk = i k = 0 ware ein geschlossener Kr eis somit stabil. Wird bei einer Vergroferung von V die Kurve gedehnt und der Punkt -1 umfahren , so erhalt man beim SchlieBen des Kr eises ein inst abil es Syst em. Mit diesen Beispielen wird klar , dass man das Nyquis t-Kriterium fur stabile Strecken auch in einer vereinfachten , anscha ulicheren Form formulieren kann:
Satz 2.10 Ist die K reisilbertragungsfunktion G(s)K( s) stabil, so ist der geschlossene K reis genau dann stabil, wenn die Ortskurve der K reisilbertragungsfunktion den Punkt - 1 von sich aus gesehen rechts passiert . Mit Hilfe der Ort skurven lassen sich auch Aussagen iiber die Dampfung des geschlossenen Regelkreises machen. Zunachst gilt: Das Ein schwingverhalt en eines Syste ms wird durch die Lage der Pole seiner Ubertragun gsfunktion bestimmt, und je weiter ein konju giert komplexes Polpaar von der imaginaren Achse entfernt ist , desto grofler ist die Dampfung der zugehorigen Schwingun g (vgl. Gl. (2.22)). Weit erhin sind die Pole des geschlossenen Kr eises gera de die Nullstell en der Gleichun g G(s)K (s) + 1 = O. Alle Pole werd en demnach durch die Abbildung G( s)K(s) in den Punkt -1 abgebildet . Dagegen wird ein Punkt mit verschwind end em Realt eil s = jw auf G(j w)K(j w) abgebildet . Daraus folgt wiederum, dass die imag ina re Achse der kompl exen Eb ene auf die Ortskurve G(jw)K(jw) abgebildet wird . Wenn aber -1 das Abbild aller Pole ist und die Ortskurve da s Abbil d der imaginaren Achse, so ist bei Steti gkeit der Abbildung der Abstand der Or tskurve vom Punkt - 1 auch ein MaB fur den Abst and der Pole von der imagi naren Achse und somit ftir die Dampfung des geschlossenen Kreises. Zwei weitere Stabilitat skri t erien sollen hier nur kur z erwahnt werden, es sind die Kriterien von Hurwitz [65] und Routh [163] . Beide beziehen sich auf die Koeffizienten des Nenn ers der Ubertragungsfunktion und sind gewissermaBen nummerische Kriterien . Derar tige Kriterien sind aber durch die heutige Moglichkeit , Nullst ellen von Polynom en vom Computer nummerisch berechnen zu lassen , pr aktisch nicht mehr relevan t .
2.6 PID-Regler
105
2.6 PID-Regler 2.6.1 Anforderungen an einen RegIer Nachdem in den bisherigen Kapiteln die notigen Kenntnisse zur Analyse dynamischer Systeme vermittelt wurden, soll in diesem Kapitel auf den eigentlichen Entwurf von Reglern eingegangen werden. Zur Rekapitulation sei dazu noch einmal die Standardkonfiguration eines Regelkreises skizziert (Abb. 2.31), wobei im Vergleich zu Abb . 2.25 das Messglied von vornherein vernachlassigt wird. Fuhrungs- und Stortibertragungsfunktion lauten:
T(s) = y(s) = G(s)K(s) w(s) G(s)K(s) + 1 S s _ y(s) _ G(s) ( ) - d(s) - G(s)K(s) + 1
w
e
(2.101) (2.102)
y
Abb. 2.31. Regelkreis Zu einer gegebenen Strecke G(s) soll nun ein geeigneter RegIer K(s) gefunden werden. Aber welche Forderungen sind iiberhaupt zu erftillen? Optimal ware offensichtlich T(jw) = 1 und S(jw) = O. Die erste Forderung bedeutet , dass die Regelgrofle y unabhangig von der Frequenz des Eingangssignales immer gleich der Fuhrungsgrofie wist. Damit ware das System naturlich auch BIBO-stabil. Die zweite Forderung entspricht einer vollstandigen Unterdriickung des Einfiusses der Storgrofie d auf die Regelgrofe. Insgesamt stehen die beiden Forderungen demnach ftir die Forderung nach Genauigkeit der Regelung. Leider ist dieser fur einen Regelungstechniker paradiesische Zustand nicht zu verwirklichen. Nach Gleichung (2.101) kann namlich fur einen gegebenen Frequenzgang der Strecke G(jw) die Funktion T(jw) nur dann konstant Eins werden, wenn der Frequenzgang des Reglers K (jw) flir alle Frequenzen unendlich groBe Werte annimmt. Auf dasselbe Ergebnis ftihrt auch die Forderung nach vollstandiger Unterdriickung der Storgrofe. Ein solcher Regier ist aber nicht zu realisieren, und seine Ausgangsgrofie wiirde auch die Moglichkeiten jedes Stellgliedes iibersteigen. Andererseits ist es bei praktischen Strecken auch gar nicht notwendig, dass die oben genannten Forderungen fiir alle Frequenzen erfullt werden. Vielmehr reicht es aus, wenn Genauigkeit im Nutz£requenzbereich erzielt wird, d.h. im Bereich derjenigen Frequenzen, die im Eingangssignal auch tatsachlich enthal-
106
2. Regelungstechnische Grundlagen
ten sind. Dies sind aber normalerweise die niedrigen Frequenzen einschlieBlich der Frequenz Null, was einem Gleichsignal entspricht. Dabei kann ftir Gleichsignale auf Genauigkeit am wenigsten verzichtet werden, denn gerade bei einem konstanten Eingangssignal sollte man von einem geregelten System nach Beendigung aller Einschwingvorgange erwarten durfen, dass seine Ausgangsgrofie denselben Wert wie die Eingangs- bzw . Sollgrofe annimmt. Die Anforderungen an eine Regelung werden deshalb so weit zurlickgenommen, dass die Optimalforderungen nur noch ftir Gleichsignale (Frequenz s = 0) erhoben werden: lim T(s)
8->0
I
~
1
lim 5(s)
und
8-> 0
,
~
0
(2.103)
Und wegen der Stetigkeit der beiden Ubertragungsfunktionen T(s) und 5(s) sind dann auch fur kleine Werte von s bzw . w und damit im Nutzfrequenzbereich die Forderungen zumindest noch naherungsweise erftillt. Bei Zutreffen der Gleichungen (2.103) spricht man auch von stationiirer Genauigkeit . Ein stationer genaues System ist auch auf jeden Fall stabil im Sinne von Def. 2.4, d.h. es weist eine endliche Sprungantwort auf. Es ergibt sich namlich fur die Sprungantwort 1 lim y(t) = lim s-T(s) = lim T(s) = 1
t ->oo
8->0
S
8->0
(2.104)
d .h . die Ausgangsgrofe des geregelten Systems weist bei einem Eingangssprung den konstanten Endwert Eins auf. Fur den Regier folgt aus der Forderung nach Genauigkeit mit Gleichung (2.101) (2.105) lim K(s) = 00 8->0
Setzt man voraus, dass K(s) eine rationale Funktion ist , so fiihrt dies auf die notwendige Bedingung, dass K(s) einen Pol bei s = 0 aufweisen muss . Sofern G(s) keine Nullstelle bei s = 0 hat , wird das Produkt G(s)K(s) fiir s = 0 unendlich graB, und T(s) konvergiert gegen Eins. Besitzt G(s) dagegen eine solche Nullstelle, so nimmt lim G(s)K(s) einen endlichen Wert an , und 8->0
lim T(s) konvergiert nicht gegen Eins. Offensichtlich muss die Ordnung des
8->0
Pols von K(s) die Ordnung der Nullstelle von G(s) bei s = 0 urn mindestens Eins libersteigen. Ein Sonderfall soll hier nicht unerwahnt bleiben: Wenn die Strecke integrierende Wirkung hat, kann man die Ubertragungsfunktion in der Form G(s) = ~G(s) mit G(O) -I- 0 schreiben, was einer Hintereinanderschaltung von Integrator und dem Streckenteil G(s) entspricht. Wenn auBerdem die Storgrofle d erst hinter dem Integrator angreift (Abb. 2.32), so ergibt sich fur T(s) und 5(s):
T(s) = _ G(s)K(s) G(s)K(s) + s
2.6 PID-Regler
5(s) = _ sG(s) G(s)K (s) + s
107
(2.106)
Die geforderten Gr enzwert e zur Erzi elu ng st ationa rer Genauigkeit (vgl. (2.103)) werd en hier schon erre ieht, wenn K (O) -=I- 0 gilt . Man kann K (s) = 1 setze n und somit im Prinzip auf den Regier verzieht en. Od er anders ausgedriiekt, man kann den Integrator als Teil des Reglers auffassen, so dass lim K( s) = 00 gegebe n ist . Diese giinst ige Konstellation kann vor allem da nn 8 --->0
ent stehen, wenn das St ellglied , das aus Sicht des Reglers Teil der Streeke ist , int egrierende Wirkun g hat . Ein Beispiel fur ein solches St ellglied ist ein dureh einen Motor an getriebenes Ventil, mit dem der Durehfluss dureh ein Rohr geregelt werden solI. Der Mot or , desse n interne Ausgleichsvorgange vernachlassigt werd en sollen , wird mit der Ste llgrofie des Reglers angesteuert . Der Offnungs quersc hnitt des VentiIs verandert sieh dan n st et ig wie die Ausgangsgrof e eines Integrators.
Abb. 2.32. Abspalten eines Integrators von der Strecke Die Erfullung der Gleiehungen (2.103), d.h . stationa re Genaui gkeit , ist fast imm er die element are Vorau sset zung fiir eine Regelun g. Daruber hinaus gibt es aber noeh weitere Kriterien , die nieht zu vernachlassigen sind. Zum einen ist dies die Ford erung naeh einer ausreichenden Regelgeschwindigkeit . So kann man es beispielsweise den Fahrgasten in einem Aufzug nicht zum uten , minuten lang auf das Err eiehen des nachsten Sto ekwerks zu warten . Wie die spate ren Beisp iele zeigen werd en , ist dies der Ford erung naeh st at iona rer Genau igkeit und dami t nach St abi lit at oft ent gegengeriehte t, so dass eine Regelun g hier immer nur einen Kompromiss dar stellen kann . Ein weiteres Kriterium ist eine ausreiehend grol3e Dampfung des Syst ems. So ist beim Aufzug ein Ube rschwingen des Lageregelkre ises ebenfalls nicht akzept abel, den n soli ein bestimmtes Sto ckwerk erreieht werd en, so dar f der Aufzug nieht erst etwas zu weit fah ren und sieh dann auf die riehti ge St elle einpendeln. Hier ist ein aperiodisehes Einsehwingverhalte n geford ert , d.h. die Damp fun g D muss grofler als Eins sein. Bei Syst emen , wo ein leieht es Uberschwingen nicht so kritiseh ist , st rebt man meist eine Dampfung D = ~ an, weil dies die kleinstmogliche Darnpfung ist , bei der noeh keine Resonan ziiberhohung auft ritt (vgl. Abb . 2.24). Im Einz elfall lassen sieh noeh weite re Kriterien definieren . J e naeh Anwendungsfall kann zum Beispiel die Amplitude des Uberschwingers bei der Sprungantwort relevan t sein, oder die Zeit , die benot igt wird, urn einen vor-
108
2. Regelungstechnische Grundlagen
gegebe nen Toleran zbereich urn den Endwert der Sprungantwort zu erreichen. Dement sprechend kann man auch die versch iedensten Giit emaBe ftir eine Regelung definieren. Ein oft verwend et es, zu minimi erendes Giit emaB lautet beispielsweise:
J 00
Q=
[(e(t))2 + k(u(t))2] dt
mit k > 0
(2.107)
o Damit Q moglichst klein ist, muss somit einerseits der mittlere quadrati sche Regelfehler e und damit die Abweichung zwischen Soll- und Istwert klein sein . Der zweit e Summand gewiihrleistet dagegen , dass dieses Ziel mit einer kleinen Stellgrofe erreicht werd en kann , urn so die Stelleinrich tung des Regelkreises zu schonen . Das Verh alten des Stellgliedes ist beim Reglerentwurf ohnehin in zweierlei Hinsicht zu beriicksichtig en. Zum einen als Teil der zu regelnd en Strecke, wenn es urn Stabilit at , Dampfung und Regelgeschwind igkeit geht. Zum anderen ist Z\l beachten , dass es aufgru nd seiner technischen Ausfiihrung nur Signale mit einer bestimmten maximalen Amplitude und Frequenz iibertragen kann. Es niit zt also nichts, wenn die Ausgangsgrofle des Reglers Signalante ile von hoher Frequ enz oder Amplitude ent halt , die vom Stellglied gar nicht an die Strecke weitergegeb en werden konn en , Es best eht dann sogar die Gefahr, dass das Stellglied iiberst euert und ein nicht linear es Verhalten aufweist , womit der gesa mte Reglerentwurf, der von einem linearen Verh alt en der einzelnen Ubertrag ungsglieder ausgeht, wieder in Frage geste llt wird . Ein einfaches Beispiel hierfiir ist das Ruder bei einem Schiff. Uber einen durch technische Randbedingungen vorgegeb enen Maximalwinkel hin aus kann es nicht verst ellt werd en. W ahrend im Norm alb et rieb der Ruderwinkel pr oporti onal zur Eingangsgrofie der Rudereinrichtung ist , kann nach Erreichen der maximalen Auslenkung auf eine weitere Erhohung der Ein gangs grofe nicht mehr reagiert werd en. Aus dem linearen Ubertragungsglied mit proportionalem Verhalten ist ein nichtlineares Glied geworden, dessen Kennlinie in Abb . 2.33 zu sehen ist. Ein e solche Kennlinie ist ty pisch fur viele Stellglieder . y
u
Abb, 2.33. Kennlinie eines Stellgliedes
Nachdem jetz t eine Vorst ellun g iiber die Anford erungen an einen RegIer best eht , sollen im Folgend en einige Standardregler behandelt werd en , die
2.6 PID-Regler
109
einfach zu verst ehen, zu realisieren und vor allem zu dim ensionieren sind . Aus diesem Grund wird auch der weit aus groBte Teil aller in der Praxis vorkommenden Regelun gen mit diesen Reglern verwirkli cht. 2.6.2 Reglertypen P-Regler. Der Proportionalregler (P-Regler) ste llt sicherlich den einfachsten Ansatz dar . Da die Einga ngsgrofe des Reglers die Regelabweichun g ist und seine Ausgangsgrofle die Stellgrofe, erzeugt dieser Regier mit der Ubertragun gsfunk tion
K (s) = P
(2.108)
eine zur Regelabweichun g prop ort ionale Stellgrofie. J e grofier die Abweichung zwischen Ist- und Sollwert ist , desto grofe r ist die Stellgrofle des Reglers. Ais einzigen einste llba ren Param eter hat dieser Regier seinen Verst iirkun gsfak tor
P. St ati onare Genauigkeit und die vollst andi ge Ausregelung einer Storung konn en mit dem P-Regler nicht erzielt werden, denn dazu miisst e K(O) = P nach den obigen Betrachtungen unendli ch groB werden . Damit der Regier zumindest naherungsweise genau arbeitet, sollte P demn ach moglichst groB gewahlt werden. Neben der Genauigkeit steigt dadurch auch die Regelgeschwindigkeit , denn bei gegebener Regelabweichung ftihrt eine Vergroflerung von P offensichtli ch zu einer Vergrofierung der Stellgrofe. Und aus dieser starkeren Anr egung der St recke resultiert natiirlich eine schnellere Ann aherun g der Regelgrofe an den Sollwert , auch wenn dieser zum Schluss nicht gena u erreicht wird. Ein er Erhohung von P sind aber aus St abilitatsgrtind en Grenzen gesetzt. An zwei Beispielen soll dies verd eutlicht werd en. Gegeben seien zwei Tiefpassst recken zweiter und drit ter Ordn ung, d.h . Hint ereinand erschaltungen von zwei bzw. drei PT1-G liedern, deren Ortskurven aus Abb. 2.34 ersicht lich sind. Bei Regelun g mit einem P-Regler ergibt sich fur die Kreisub ertragungsfunkt ionen des geschlossenen Kr eises jeweils: G(s)K(s ) = G(s )P. Die zugehOrigen Ort skurven gewinnt man durch Multi plikat ion der gegebenen Ortskur ven mit P , was fur P > 1 gleichbedeute nd mit einer Dehnung ist . Und damit wird auch die Gefahr deutlich, die eine Erhohun g von P beinh altet : Nach dem Nyquist-Kriterium ist die zulassige Phasend rehung bezuglich -1 in beiden Fallen Null, anschaulich gesehen diirfen die Ortskur ven den Punkt -1 also nicht links umfahr en und sollte n sich ihm im Int eresse einer ausreichend en Darnpfung auch nicht zu sehr nahern, Der Kr eis mit der Strecke dr itter Ord nung wird demnach inst abil , wenn ma n P immer weiter vergrofert, Der Kreis mit der Strecke zweite r Ordnung kann zwar durch Er hohen von P nicht instabil werd en, die Ortskurve kommt dem Punkt -1 aber immer naher , so dass der geschlossene Kreis eine unzumutbar kleine Dampfung aufweist.
110
2. Regelungsteehnisehe Grundlagen
In der Praxis sind die durch Stabilitats- bzw. Damp fungsanford erungen gegebenen Obergrenzen fur die Verst arkung des P-Reglers norm alerweise so niedrig, dass mit den zulassigen Werten ftir P eine stat ionare Genauigkeit nicht einmal nah erungsweise realisiert werd en kann . Denno ch gibt es geniigend Anwendungsfalle, in denen stat ionare Genauigkeit nicht wichti g ist und stat tdessen das Kost enargument zugunsten des P-Reglers entscheidet. Und nicht zuletzt kann ein P-Regler immer dann eingeset zt werden, wenn , wie oben erlautert, die Strecke bzw. das Stellglied integrierende Wirkun g hat . j Im(G(jro»
j Im(G(jro» -1
-1
Re(G(jro»
Re(G(jro»
PTz-Glied
Abb. 2.34. Ortskurven von Tiefpassstreeken zweiter und dritt er Ordnung Urn das Verh alten des P-Reglers und auch anderer, im Folgend en noeh vorgest ellter Regier besser einschatze n zu konn en, zeigt Abb . 2.35 die Sprungantworten eines geschlossenen Kreises mit verschiedenen Reglern und einem T iefpass dritter Ordnung als Strecke:
(2.109) Die mit P bezeiehnete Kurve kennzeichnet die Sprungantwort bei Regelun g mit einem P-Regler. Deutli ch ist zu sehen , dass nach Beend igun g des Einschwingvorga nges eine stationare Regelabweichun g zuriickbleibt. Wiirde man die Reglerverstarkung erhohen, so ki:innte man zwar die Regelabweichung verkleinern , miisst e aber gleichzeitig noch gri:iBere Schwingun gen am Anfang und schlieBlich sogar Instabilitat in Kauf nehmen. yet)
p
Abb. 2.35. Vergleich versehiedener Reglertypen
2.6 PID-Regler
111
I-RegIer. Wesentlieh bessere Regelergebnisse lassen sich mit einem Int egralregler (I-R egIer) erzielen:
1 1 K( s) = I - = S
(2.110)
Ti S
Dieser ist wegen (2.105) offensicht lieh ein st ationar genauer Regler , sofern die Streeke keine Nullstelle bei s = 0 hat . Doeh von diesem Fall soll hier abgesehen werden . Die stationare Genauigkeit lasst sich aueh ansehaulieh begriinden: Solange die Ein gangsgrofe e des Reglers ungleieh Null ist, wird sieh wegen der Int egrati on aueh die Ausgangsgrofe n des Reglers immer weiter verand ern . Er st wenn e = 0 gilt, andert sieh aueh die Stellgrofe n nicht mehr, und das Syst em hat seinen stationaren Endzust and erreicht. e = 0 bedeutet aber, dass die Regelgrofie y gleich der Fuhrun gsgrofe w ist . Der Parame ter T; wird Int egrierzeit genannt . J e kur zer diese Integrierzeit ist , desto schneller andert sich die St ellgrofe bei gegebener Regelabweichung. Irn Interesse einer hohen Regelgeschwindigkeit sollt e man T i also rnoglichst klein wahlen. Aueh bei diesem Hegler steht dem aber die Ford erung nach St abil it at im Wege. Als Beispiel soll ein PT2-Glied mit einem Integralregler geregelt werd en. Die Kr eisiibertragungsfunktion lautet
G(s )K(s) =
V ,2
w2
o
+
2D Wo S
+
1 1 T;s
.
V
1
T,
+ 2D s2 + s w5 ,3
(2.111)
Wo
f.
mit der Kreisverst arkung Die zugehorige Ortskurve zeigt Abb . 2.36 (linke Kurve). Die zulassige Phasendrehung der Ortskurve urn den Punkt -1 betragt wegen des Integrators ~. Falls die Ortskurve der Kr eisiibertragungsfunkt ion also wie eingezeichnet verlauft , ist der geschlossene Kreis stabil. Verklein ert man aber die Integrierzeit T; zur Erhohung der Regelgeschwindigkeit , so ste igt die Kr eisverst arkung, und die Ortskurve wird gedehnt, bis sie den Punkt -1 links umfah rt . Dann ware der geschlossene Kreis instabil. j Im(GKGro))
j Im(GKGro)) -I
Rc(GKGro))
Rc(GKGro))
Abb. 2.36 . Ortskurve cines PT2-Gliedes mit 1- und PI-Regier Im Hinblick auf die St ab ilitat ist der Int egralregler nicht besonders giinst ig. Urn die Kreisiibertragungsfunktion zu erha lten, muss die St reekeniibert ragungsfunkt ion mit dem Faktor T~s multipliziert werd en . Die Ph ase der Kr eisiibertragungsfunktion ergibt sieh demn ach als Summe aus der Phase der Streckeniib ertragun gsfunk tion G(s) und dem konstanten Winkel - ~ . Dies bed eutet , dass die Phase der Kr eisiibertragungsfunktion gegeniiber
112
2. Regelungstechnische Grundlagen
der Streckentibertragungsfunktion urn den konstanten Winkel - ~ abgesenkt und die Ortskurve im mathematisch negativen Sinn, naher zum Punkt -1 hin verdreht wird . Dadurch steigt offensichtlich die Gefahr der Instabilitat. Weiterhin ist der Integralregler, unabhangig von der Integrierzeit, schon von seiner Konfiguration her ein langsamer RegIer. Tritt beispielsweise eine plotzliche Regelabweichung auf, so muss der RegIer diese Grofe erst aufintegrieren, bevor die Stellgrofle einen nennenswerten Betrag erreicht. Dieser Effekt ist auch deutlich in Abb. 2.35 zu erkennen. Die Sprungantwort des mit dem IRegIer geregelten PT3-Gliedes erreicht zwar den richtigen Endwert , steigt aber zu Anfang nur sehr Iangsam an .
PI-RegIer. Die Nachteile werden behoben, wenn man P- und I-RegIer miteinander kombiniert. Man gelangt dann zu dem am haufigsten eingesetzten RegIer iiberhaupt, dem PI-Regier. Seine Ubertragungsfunktion lautet: (2.112) Man kann den PI-RegIer also entweder als Parallelschaltung aus P- und IRegIer oder als Hintereinanderschaltung aus Vorhalt (Tpis + 1) und Integra1 tor -p,s T auffassen . Die zweite Darstellungsart bietet sich zur Aufstellung von Kreisiibertragungsfunktionen G(s)K(s) an, da sich bei faktorieller Darstellung Ieichter die Phase und der Betrag angeben lassen . Anhand der ersten Darstellungsart konnen dagegen leichter die Sprungantwort und die Ortskurve des Reglers skizziert werden (Abb. 2.37). Aus der Sprungantwort wird sofort deutlich, warum dieser RegIer schneller ist als ein I-RegIer: Auf eine sprungformige Regelabweichung reagiert der RegIer von vornherein mit einer von Null verschiedenen Stellgrofe, die dann durch den Integrator nur noch nachgebessert wird. Die Stellgrofle muss im Gegensatz zum I-RegIer nicht erst Iangsam aufintegriert werden . Das verbesserte Regelverhalten ist auch in Abb . 2.35 zu erkennen. y(t)
j Im(KGm))
tm Re(KGm)) Abb. 2.37. Sprungantwort und Ortskurve eines PI-Reglers Das im Vergleich zum I-RegIer gunstigere Stabilitatsverhalten lasst sich aus der Ortskurve ablesen. Fur niedrige Frequenzen betragt die Phase zwar auch annahernd - ~ , geht dann aber fur hohe Frequenzen gegen Null. Wahrend beim I-RegIer also die Ortskurve der Strecke in jedem Frequenzbereich urn - ~ verdreht werden muss, urn die Ortskurve der Kreistibertragungsfunktion zu erhalten, fallt diese Verdrehung beim PI-RegIer umso ge-
2.6 PID-Regler
113
ringer aus, je hoher die Frequenz ist . Gerade im Bereich hoher Frequenzen gelangen abe r die Ortskurven vieler realer Strecken in die Nahe des Punktes -1. Wenn daher in diesem Frequenzbereich auch der Regier selber noch eine nennenswert e Phasendrehung aufweist , kann es leicht passieren , dass die Ortskurve der aus Stre cke und Regier bestehenden Kreisiibertragungsfunkt ion den Punkt - 1 umfahrt und der geschlossene Kreis instabi! wird. Aus diesem Grund ist es fur die Stabilitat des geschlossenen Kreises von Vorteil, dass der PI-Regier gerade in diesem Frequenzbereich nur eine geringe Ph asendrehun g verursacht. Die Verb esseru ng ist deutlich in Abb . 2.36 zu erkennen. Die rechte Or tskurve weist fur hohe Frequenzen eine geringere Ph asendrehun g auf, wodurch die Stabilitat nicht mehr gefahrdet ist. PID-Regl er . Die St ellgrofc des PI-Reglers setzt sich aus zwei Antei!en zusammen, einem Integralant eil fiir die Genauigkeit und einem Proportionalantei! zur Erh ohung der Regelgeschwindigkeit . Eine weitere Verbesserung des Regelverhalt ens ist zu erwarten, wenn eine Regelabweichung nicht erst dann bekarnpft wird , wenn sie schon existiert, wie es dur ch den P roportion alantei! geschieht, sondern am best en schon dann, wenn sie im Entstehen ist . Zu diesem Zweck kann man den PI-Regier urn einen Differentialanteil erweitern , und man erhalt einen PID -Regler: 1
K (s ) =P +I- +Ds s
(2.113)
Ein idealer Differenzierer mit der Ubert ragungsfun ktion s ist abe r weder realisierbar noch erwiinscht . Denn ein Faktor s in einem Sumrnanden bedeutet , dass der Summand umso grofere Werte annimmt , je hoher die Frequenz ist . Wegen dieser Hochpasseigenschaft verstarkt ein idealer Differenzierer daher die in der Praxis immer vorhand enen hochfrequenten Rauschsignale, was natu rlich vermieden werden sollte. Bei einem realen PID -Regler ist deshalb der D-Anteil mit der Zeitkonst anten Tv verzogert:
K (s) = P
+I~ +D s
s = VR T 1 S + 1 T2 S + 1 Tv s + 1 T 1 S Tv s + 1
(2.114)
Wie man sieht , lasst sich der PID-Regler auch als Reihenschaltung von PI-RegIer und einem rationalen Ubertragungsglied erster Ordnung, einem sogenan nte n DT1-Glied, auffassen. Grundsatzlich konnen dab ei die beiden Nullstellen T 1 und T 2 auch konjugiert komplex sein. Die Vorteile des PIDReglers gegeniiber dem PI-Regier lassen sich anh and seiner Sprungantwort und der Ortskurve erklaren, die in Abb. 2.38 dargestellt sind . Dabei sind die Verliiufe des idealen PID -Reglers (nach Gl. (2.113)) gest richelt eingezeichnet . Die Sprungantwort zeigt , dass der Regier genau das geforderte Verha lten aufweist: Eine (hier sprungforrnige) Regelabweichung wird durch den D-Anteil in ihrer Anfangsphase sehr heftig bekampft, wahrend sich der Regier im weiter en Verlauf wie ein PI -Regier verhalt . Daneben ist anhand der Ort skurve eine weitere Verb esserung des Stabilitatsverhaltens gegeniiber dem PI -Regier
114
2. Regelungstechnische Grundlagen
festzustellen: Die Phase des PI-Reglers geht fiir hohe Frequenzen gegen Null, wodur ch gewiihrleistet ist , dass die Ortskurve der Str ecke ftir hohe Frequenzen dur ch den Regier nicht naher zum Punkt -1 verdreht wird. Dagegen weist der Frequenzgang des PID-Reglers fur hohere Frequenzen eine positive Phase auf. Die gegebene Ortskurve einer Str ecke kann daher dur ch den Regier in diesem Frequenzbereich sogar im mathematisch positiven Sinn vom Punkt -1 weggedreht werden. Zu beacht en ist , dass wegen der hoheren Anzahl an einstellbaren Par ametern der PID-Regler naturlich schwieriger zu dimensionieren ist als ein PI-Regier. W ahr end PI-RegIer hiiufig ohne Rechnun g von Hand eingestellt werden, ist dies bei einem PID-Regier kaum moglich, vor allem nicht , wenn eine opt imale Einstellung angestrebt wird , die die Moglichkeit en des Reglers voll ausschopft . Abb. 2.35 zeigt deutlich, dass der PID-Regler von den Regelergebnissen her der beste der vorgestellten Regier ist. Prinzipiell lasst sich sagen, dass mit zunehmender Kompl exitiit des Reglers die Regelergebnisse immer besser werden. Dies ist nicht verwunderlich, da mehr Freiheitsgrade zur Verfligung ste hen, urn die gegensiitzlichen Forderung en nach Stabilitat und ausreichender Diimpfung einerseits sowie Schnelligkeit andererseits zu erfiillen. An Gleichung (2.113) ist zu erkennen, dass der PID-Regier als Sonderfalle auch die anderen vorgestellten Regier ent halt . Je nachdem, ob I , P oder D zu Null gesetzt werden, erhiilt man einen P- , 1- oder PI-Regier. Aus diesem Grund wird der Ausdruck PID-Regler hiiufig als Sammelbegriff ftir aile hier vorgestellten Regier verwendet. j Im(K(joo))
yet)
Re(K(joo))
Abb. 2.38. Sprungantwort und Ortskurve eines PID-Reglers PD-Regier. Nicht unerwiihnt bleiben soil an dieser Stelle der PD-Regler , der, wie der Name schon sagt, aus einem Proportional- und einem Differentialanteil besteht. Da der Differentialant eil ebenso wie beim PID-Regler nicht ideal realisiert werden kann , ergibt sich fur die Ubertragungsfunkt ion des Reglers: ]« (s)
=P +D
S
Tvs
+1
= Vn T I S + 1 Tvs
+1
(2.115)
Stationiire Genauigkeit kann mit diesem Regier wegen ]«(0) -I- CXl nur bei integri erenden Strecken erzielt werden. Bei geeigneter Dimensionierung reagiert
2.6 PID-Regler
115
er aber auf eine And erung der Regelabweichung starker als ein P-Regler. Sein Ein sa tz biet et sich dah er an , wenn Genauigkeit nicht so wichtig od er durch einen Integrator in Strecke bzw. Stellglied gewahrleist et ist und die mit einem P-Regler erreichbare Regelgeschwindigkeit nicht grof genug ist. IGI,", 1
LL
VR~-~"T---------;'-----~ , , ffiJo , , ,
g
,
o-~~-- -:--
ffiJog
Abb. 2 .39. Bode-Diagramm eines PD-Reglers Der PD-Regler kann abe r au ch ganz anders verwend et werden. Ein e Bet rac htung des zugehorigen Bod e-Diagramms fur T I > Tv (Abb. 2.39) zeigt, dass das Hinzufiigen eines PD -Reglers zur Strecke eine Anhebung der Phase der Kreisiibert ragungsfunktion in einem einstellbaren Frequ enzbereich mit sich bringt. Denn die Phase der Kreisub ertragungsfunktion ergibt sich als Summe de r Phasen aller einzelnen Ube rt rag ungsglieder . So kann man den PD-Regler dazu nutz en , die Or tskurve der St recke in ebe n diesem Frequenzbereich im mathemati sch positiven Sinn vom Punkt - 1 wegzudrehen. Die eigentliche Regelun g wird dann von einem anderen Regier iibemommen . Zu beachten ist allerdings, dass mit einer Anhebun g der Phase auch eine Vergrofe rung des Betrages fur hoh ere Frequ enzen einhergeht . Dies fiihr t zu einer Dehnung der Or tskurve und dami t moglicherweise zu einer Ann aherung an den kri t ischen Punkt. Andererseits kann natiirlich auch T I < Tv gewa hlt werde n. In diesem Fall wird der Bet rag verkleinert, was jetzt aber mit einer Absenkung der P hase bezahlt werde n muss. 1m Einzelfall ist abz uwagen, ob die Verwendung eines PD-Reglers als Phasenkorrek turglied einen Vort eil br ingt .
2.6.3 R egl erentwurf Damit sind die verschiedenen Regler-Grundtypen mit ihren wesentlichen Eigenscha ften vorges te llt worden. 1m Folgend en soli nun auf Verfahren eingegangen werde n, mit deren Hilfe sie zu berechnen sind. Wenn die Strecke nicht allzu kompliziert ist , konn en soga r schon einige einfache Ube rlegungen fiir die Dimensionierung des Reglers ausre ichend sein. Als Beisp iel fur solche Uberlegungen soli die Berechnung eines geeignete n PI - Reglers fur ein PT2-Gli ed vorgefUhrt werden. Es sei angenommen, dass das P T2 - Glied zwei reelle Pol e aufweist und sich dami t schreiben lasst als
V G(s) = (TIS + 1)(T2s + 1)
(2.116)
116
2. Regelungstechnische Grundlagen
Dann kann man den Regier so dirnensionieren, dass sich sein Vorhalt gegen eine Polstelle der Strecke kiirzen lasst und ein IT1-Glied entsteht (rechte Ortskurve in Abb. 2.36). Diese MaBnahme vereinfacht zunachst einmal die Kreisii bertragungsfunktion
(2.117)
mit T p i = T 2 > T 1 . Im Interesse einer hohen Regelgeschwindigkeit ist die grofere von beiden Zeitkonstanten gekiirzt worden . Denn der zugehorige Eint schwingvorgang e- 1"2 verlauft langsamer und sollte deshalb eliminiert werden. Das Kiirzen von Zeitkonstanten macht aber natiirlich nur dann Sinn, wenn die Zeitkonstante in der Ubertragungsfunktion auch eine Entsprechung in der realen Strecke hat. Insbesondere bei einer Ersatzzeitkonstanten lasst sich eine Polkiirzung nicht durchfuhren, denn dort stellt der durch die Polstelle reprasentierte Einschwingvorgang nur eine vereinfachte Naherung ftir den tatsachlichen Einschwingvorgang dar. Nach der Festlegung Tp i = T 2 ist nun noch der verbliebene Reglerparameter VR zu bestimmen. Dazu stellt man die Ubertragungsfunktion des geschlossenen Kreises auf:
T s _ yes) _ G(s)K(s) ( ) - w(s) - G(s)K(s) + 1
1
(2.118)
Der geschlossene Kreis ist also offenbar ein PT2-Glied, dessen Dampfung D durch den Parameter VR eingestellt werden kann . Ein Koeffizientenvergleich mit Gleichung (2.43) liefert (2.119)
Durch die Wahl einer gewiinschten Dampfung D wird damit auch der zweite Reglerparameter festgelegt, und der geschlossene Kreis verhalt sich wie ein gewohnliches PT2-Glied mit vorgegebener Dampfung. In der Praxis erfolgt die Berechnung der Reglerparameter nach entsprechender Vereinfachung der Streckeniibertragungsfunktion oft anhand solcher einfachen Ubcrlegungen, fur die es allerdings keinen festen Algorithrnus gibt und die von daher ein gewisses MaB an Ubersicht und Erfahrung erfordern. Etwas starker schematisiert ist dagegen das Wurzelortsverfahren. Bei diesem Verfahren wird zunachst die Lage der Pole des geschlossenen Kreises in Abhiingigkeit von den einstellbaren Reglerparametern angegeben. Aus einer ftir gut befundenen Polkonfiguration ergibt sich dann die Einstellung des Reglers. Welche Polkonfiguration die beste ist, hiingt von den Anforderungen an den Regelkreis und darnit vom Anwendungsfall ab oHier bleibt beim Entwurf
2.6 PID-Regler
117
noch ein groBes Mall an Freiheit, weshalb auch dieses Verfahren ein gewisses Mall an Intuition erfordert . Vollstandig schematisiert ist der Reglerentwurf dagegen bei Verwendung der Einstellregeln nach Ziegler-Nichols. Anhand der gemessenen Sprungantwort der Strecke werd en gewisse Kenndaten ermit te lt, aus denen dann mit Hilfe fester Form eln die Reglerparameter zu ber echnen sind . Die regelungstechnischen Uberlegungen, die zu diesen Form eln fuhr ten, sind nicht ohne weiteres nachzuvollziehen , so dass der Anwend er im Faile eines Misserfolges kaum weifi, wie die Parameter zu modifizieren sind . Eine weitere Moglichkeit ist die Optimierung eines vorgegebenen Cutemafies (vgl. (2.107)). Aus der Losung dieser Ex tremwertaufgabe ergibt sich automatisch die Einst ellung des Reglers . Der oft tibersehene Freiheitsgrad bei diesem Verfahren ist die Definition des Gutemafes. Der berechnete Regier ist natiirlich nur genau hinsichtlich des vorgegebenen Cutemafies optimal. Ist dieses ungunstig gewahlt, kann sich keine gute Regelung ergeben . Insofern setz t auch dieses Entwurfsverfahren eine gewisse Intuition voraus. Aile bisher vorgeste llte n Auslegungsverfahren hab en gemeins am , dass die Struktur des Reglers fest gelegt werd en muss und sich nur seine Parameter aus den jeweiligen Verfahren ergeben. Und es ist offensichtli ch, dass nicht mit jedem Regier jede Strecke stabilisiert werd en kann . So lasst sich beispielsweise eine aus zwei hintereinand ergeschalt et en Int egratorcn best ehend e Strecke prinzipiell nur mit dem PID- , nicht aber mit einem P-, 1- oder PI-Regier regeln. Vor der Dimensionierung eines Reglers ste ht also in allen Fallen die Analyse der Strecke und die Festlegung eines geeigneten Reglertyps. Dieser Schritt entfallt bei den sogenannten analytischen Verfahren. Hier liefert das Verfahren nicht nur die Reglerparameter , sondern auch die Strukt ur des Reglers , also die gesamte Regler-Ubertragun gsfunktion. Dab ei konnen natiirlich Ubertrag ungsfunkti onen ents tehen, die mit dem PID-Regler nichts mehr gemein hab en. Beispielhaft sei hier das Verfahren des Kompensation sreglers beschrieben. Bei diesem Verfahr en wird ftir den geschlossenen Kr eis eine Mcd ell-Ubertragun gsfunktion M (s) vorgegeben, die sich ihrerseits aus bestimrnten Anford erungen an das Einschwingverh alt en des geschlossenen Kreises ergibt : G(s)K(s) ~ M( s) (2.120)
T(s) = 1 + G(s)K(s)
Fur den Regier ergibt sich darnit sofort 1 M (s ) K(s ) = G(s) 1 - M (s)
(2.121)
Der Regier ent halt also die inverti erte Streckentib ertragungsfunktion, so dass der Einfluss der Strecke in der Kreisiibertragungsfunktion G(s )K(s ) vollstandig eliminiert ist. M (s) muss allerdings so gewahlt werd en , dass ein realisierbarer Regier entste ht, bei dem die Ordnung des Zahlerpolynoms kleiner als die des Nenn erpolynoms ist. Ein weiteres Problem stellt die Tatsache dar, dass die Pole und Nullstellen von G(s) normalerweise nicht exakt
118
2. Regelungstechnische Grundlagen
bestimmt werden konnen . G(s) und der Faktor G(s) in der Ubertragungsfunktion des Reglers kompensieren sich also moglicherweise nicht vollstandig, Solange G(s) nur Pole und Nullstellen mit negativem Realteil aufweist , ist dies zwar argerlich, aber noch kein Problem. Schlimmstenfalls treten (abklingende) Schwingungen auf, die eigentlich hatten eliminiert werden sollen. Hat aber G(s) beispielsweise einen Pol mit positivem Realteil und wird dieser Pol dureh K(s) nicht exakt gekiirzt, so weist die Kreisiibertragungsfunktion G(s)K(s) einen instabilen Pol auf. Aueh wenn dies nieht zwangslaufig Instabilitat des gesehlossenen Kreises bedeutet, sollte man eine instabile Kreisiibertragungsfunktion doeh vermeiden, wenn man die Moglichkeit dazu hat. Denn es kann durehaus vorkommen, dass dureh den Ausfall eines Sensors die Riiekfiihrung des Regelkreises aufgetrennt und der Kreis damit geoffnet wird . Dann ist das Ubertragungsverhalten vom Ein- zum Ausgang nur noeh dureh die instabile Kreislibertragungsfunktion bestimmt. Diese Instabilitat ist aber hier relativ einfaeh zu vermeiden. M (s) muss lediglieh so festgelegt werden, dass 1 - M(s) die einem instabilen Pol von G(s) entspreehende Nullstelle enthalt. Dadurch kiirzen sieh Pol und Nullstelle auf der rechten Seite von Gleichung (2.121), und vom Regier wird die Kompensation dieser Poistelle gar nieht mehr erwartet. Falls G(s) eine Nullstelle mit positivem Realteil enthalt, tritt dasselbe Problem auf. Damit nun K(s) keinen instabilen Pol bekommt, muss fur M (s) eine entspreehende Nullstelle gewahlt werden . Insgesamt gesehen bedeuten die Uberlegungen, dass bei der Auswahl der Modellfunktion M(s) von vornherein die Besonderheiten der Streeke zu berlieksichtigen sind . Damit hat aueh dieses Verfahren seinen Freiheitsgrad, der auf das Gelingen des Reglerentwurfs ganz wesentliehen Einfluss hat. 2.6.4 Strukturerweiterung Vorfilter. Noeh weitergehende Moglichkeiten eroffnen sieh, wenn man die in Abb. 2.31 gezeiehnete Struktur hinter sich lasst und zusatzliche Elemente und Verbindungen in den Regelkreis einftigt. Eine sehr einfaehe MaBnahme ist die Verwendung eines Vorfilters (Abb . 2.40). Mit dicsem crgibt sieh ftir die Fiihrungs-Ubertragungsfunktion
T(s) = y(s) = F(s) G(s)K(s) 1 + G(s)K(s) w(s)
(2.122)
wahrend die Stor- Ubertragungsfunktion S(s) unverandert ist , da das Filter auBerhalb des gesehlossenen Kreises liegt. Aus dem Grund hat es naturlich aueh keine Auswirkungen auf die Stabilitat des Systems. Damit erhalt man die Moglichkeit, Fuhrungs- und Storiibertragungsfunktion unabhangig voneinander zu gestalten. Zunachst wird der Regier K(s) fur ein optimales Storverhalten dimensioniert und anschlieBend das Vorfilter F(s) fur das Fiihrungsverhalten.
2.6 PID-Regler
119
Optim ales Storverhalten bedeutet meist eine schnelle Ausregelung von Storungen. Dab ei muss zwar die St abilit at berucksichtigt werden , eine hohe Darnp fung ist aber nicht unb edingt erforderlich. Bei der Auslegung ergibt sich daher ein Regier mit groBer Verstarkung und als Folge davon ein schlecht gedampftes Syst em. Dagegen ist beim Fiihrungsverhalten eine ausreichende Mindestdampfung von groBem Interesse. Ein gut gedampftes Fiihrungsverhalten lasst sich abe r nun dur ch das Vorfilter erzielen. Verwendet man hier beispielsweise einen Tiefpass , so gelangt eine Sollwertvera nderung nur noch verzogert , d.h. mit ste t igem Verlauf auf den geschlossenen Kreis und kann diesen trotz seiner geringen Dampfung nicht mehr zu Schwingungen anrege n. Aus Sicht der Eingangsgrofe stellt sich das System dami t als gut geda mpft dar. Dur ch Einba u eines Vorfilt ers wird es also moglich, die gegensatzlichen Forderungen nach schneller Ausregelung von Storun gen und einem gut geda mpften Fiihrungsverh alt en besser in Einklang zu bringen. d w
F I '---------lIf---Q--
e
--1'I
K
I--u-<>---J' G , I
y
I'1-----...--"--
Abb. 2.40 . Vorfilter Storgr oBen a u fschaltung. Eine andere einfache Strukturerweiterung ist die S targroBenaufschaltung , die ebenfalls nicht im geschlossenen Kreis erfolgt und somit keine Auswirkun g auf die St abilitat des Syste ms hat. In Abb. 2.41 ist die ents prechende Strukt ur gezeichnet . Dab ei sei angenommen, dass die St orun g zwischen zwei Str eckent eilen G1(s) und G2 (s) angreift. Ziel ist , die Storu ng zu komp ensieren , bevor sie sich auf die Strecke auswirken kann. Voraussetzung ist natiirli ch, dass die Storgrofle messbar ist. Die einfachste Idee ist , an der Angriffsstelle der Storun g ein gleich groBes Signa l mit entgegengesetztem Vorzeichen aufzuscha lten. Dies ist aber normalerweise nicht moglich, da die Sto rung oft an einer St elle auf die Strecke einwirkt, an der der Mensch mit einem Stellglied iiberhaupt keinen Einfiuss nehmen kann. So wird beispielsweise der Kur s eines Schiffes dur ch eine seit lich angreifende St romung beeinfiusst , ohne dass sich die dadurch auf das Schiff wirkende Kraft dur ch eine an derselben St elle wirkende Gegenkraft komp ensieren lasst . Abh ilfe bietet hier nur ein recht zeitiges Gegenauslenken des Ruders, also ein Eingriff mit der Stellgrofie selbst. Ents prechend erfolgt eine Storgrofenaufschaltu ng normaierweise direkt nach dem Regier, so dass die zusat zliche Inform at ion in die Stellgrofe mit eingehen kann. Fiir eine vollstandige Komp ensation an der Angriffsstelle der Storung muss gelten: 1
F( s) = G1 (s)
(2.123)
120
2. Regelungstechnische Grundlagen
Weil diese Funktion aber im allgemeinen nicht exakt zu realisieren ist , hat man sich meist mit einer unvollstandigen Kompensation zu begntigen. Im Hinblick auf die Stabilitat oder Genauigkeit der Regelung spielt dies jedoch keine Rolle. Denn aus Sicht des Reglers stellt die Aufschaltung nur eine weitere Storung dar, die mit ausgeregelt wird . Eine Storgrofenaufschaltung macht immer dann Sinn, wenn Abweichungen zwischen Ausgangs- und Fuhrungsgrofle wegen technischer Randbedingungen unbedingt klein zu halten sind und ein erhoht er mess- und rechentechnischer Aufwand damit gerechtfcrtigt ist. d
w
y
Abb, 2.41. Storgrobenaufschaltung
Erganzende Riickfiihrung. Eine weitere Moglichkeit zur Verbesserung der Regelung besteht in einer etgiiuzetuieu Riickfiihrung. Diese wird im Gegensatz zu den beiden bisher vorgestellten strukturerweiternden MaBnahmen in den geschlossencn Kreis eingefUgt und hat damit Auswirkungcn auf die Stabilitat des Systems (Abb . 2.42) . Die Idee ist die folgende: Bei tiefpasshaltigen Strecken, wie sie meistens in der Praxis vorliegen , ist die Ausgangsgrofe gegentiber internen GraBen verzogert. Wenn es daher moglich ist, eine oder mehrere der internen GraBen zu messen, kann dem Regier im Falle einer Storung d 1 Information tiber eine bevorstehende Anderung der Ausgangsgrobe schon zugefuhrt werden , wenn sich die Ausgangsgrofe selbst noch gar nicht verandert hat. Entsprechend friiher kann der Regier auch GegenmaBnahmen einleiten, was zu einem verbesserten Storverhalten flihrt . Dieser Vorteil besteht natiirlich nicht , wenn die Storung hinter der Abgriffsstell e angreift, wie es ftir die eingezeichnete Storgrofe d2 der Fall ist . Hier ist sogar zu beachten, dass die Storiibertragungsfunktion
G2(s) + EKG 1G2(S) 1 + KG1(s)(E(s) + 1)
(2.124)
bei integrierendem Regier nur dann fiir s -> 0 gegen Null gehen kann (vgl. Gl. (2.103)) , wenn E(s) die Polstelle des Reglers bei s = 0 im Zahlerterm EKG 1G2 kompensiert. Im Interesse stationarer Genauigkeit muss daher fiir die Funktion E(s) in der hier vorgestellten Form grundsatzlich gelten : E(O) =
O.
2.6 PID-Regler
d2
d) W
I - I
K
H
E
I I
u
121
I G I 1 I
I
I G I 2 I I
y
I I
Abb. 2.42. Erganzende Riickfiihrung
K a skadenschaltung. Eine spezielle und in der P raxis sehr haufig eingesetzte Form der erganzenden RiickfUhru ng ist die Kaskadenschaltun g . In Abb. 2.43 ist ein Beispiel ftir eine zweischleifige Schaltung gezeigt. Dabei konnen im Prinzip belie big viele Schleifen auftreten. Eine Kaskadenschalt ung bietet sich an, wenn die Strecke als Reihenschalt ung versch iedener Ubertragungsglieder mit T iefpasswirkung dargestellt werden kann. Das System wird als eine Folge ineinander geschachtelter Regelkreise behandelt. Jeder RegIer ist dabei fiir den in seiner Ruckko pplungsschleife liegenden Streckenteil zustandig. In Abb. 2.43 regelt also RegIer 2 die GroBe Y2 und bekommt als Sollwert die Ausgangsgrofe UI des Reglers 1. Der geschlossene, innere Kreis ist fur den RegIer 1 wiederum Teil der von ihm zu regelnden Strecke. Seine Regelgrofe ist die Ausgangsgrofe des Systems YI. Ein Vorteil ist zunachst wie bei der erganzenden Ruckfuhrung die schnellere Ausrege lung von Storungen. Entsteht beisp ielsweise an der in Abb. 2.43 eingezeichneten Ste lle eine Storung d, so kann diese vom RegIer 2 bereits bekampft werden, sobald sich Y2 andert . Die Auslenkung der eigentlichen Regelgrofe YI wird dann naturlich weniger stark ausfallen. Ein weiterer Vortei l ist die Moglichkeit, interne GraBen zu begrenzen. In Abb. 2.43 ist am Ausgang des Reglers 1 eine so1che Begrenzung eingezeichnet , die in ihrer Funktionsweise dem nichtlinearen Ubertragungsglied in Abb . 2.33 entspricht. Diese Begrenzung wirkt zwar auf die GroBe UI ein , soli aber eigentlich eine Begrenzung ftir die interne Crofie Y2 darstellen. Wenn namlich Regier 2 schnell und genau genug arbeitet , kann man davo n ausgehen, dass Y2 in etwa dem durch UI vorgegebenen Verlauf entspricht und damit auch innerhalb der gegebenen Grenzen bleibt . SchlieBlich wird die Auswirkung von nichtlinearen Gliedern auf den Regelkreis beschrankt, in dem sie ent ha lten sind. Wiirde der innere Regelkreis beispielsweise ein nicht lineares Ubertragungsglied enthalten, so ware von dieser Nichtlinearitat bei hinreichend schnellem und genauem Regier 2 im auBeren Regelkreis kaum etwas wahrzunehmen. Denn durch die Regelu ng ist gewahrleistet, dass Y2 in etwa dem Signal UI folgt, was einem verzogerten, proportionalen und damit linearen Ubertragungsverhalten entspricht .
122
2. Regelungstechnische Grundlagen
Del' fur den Praktiker interessanteste Vorteil ist ab el' die leichte Inb etri ebnahme einer Kaskad enschaltung. Zunachst wird Regier 2 fiir den inner en Kreis dim ensioniert. Del' geschlossene innere Kr eis kann dann, bei hinr eichend schneller Regelung , dureh ein PT1 -Glied angenahert werd en. Mit diesel' Vereinfaehun g ist es anschlieBend auch moglich, Regier 1 fur den aufieren Kreis zu berechnen. Grundsatzlich dimensioniert man bei einer Kaskad enschaltung die Regier sukzessive von innen nach auBen, wobei jeweils del' innere Kreis durch ein einfaches Ubertragungsglied angenahert wird .
Abb. 2. 43 . Kaskadenschaltung
Diese Vorgehensweise soli anhand des Beispieles in Abb . 2.43 kurz erlautert werden . Gegeben sei eine aus drei hintereinand ergeschaltet en PT1 Gliedern best ehende Strecke, wobei das erste PT1-Glied als Naherung fur das dynamische Vel'halten des St ellgliedes zu verste hen ist . Aile drei PT1 Glieder hab en die Verstarkung Ein s, was die Reehnung erleichtert . Del' von Regier 2 zu regelnde Str eckent eil best eht aus zwei PT1 -Gliedern . Diesel' Fall ist ab el' bereits behand elt worden . Ais Regier ist ein P I-Regier zu wah len , dessen Zeitkonstante T p i man del' grofiercn del' beiden Streckenzeitkonstant en gleiehzusetzen hat, urn die ents prechende Poistelle zu kompensieren . Hier ist abel' eine del' beiden Zeitkon st anten, namlich T s , sowieso nur eine Ersatzzeitkonstante, d.h. es exist iert in del' realen Strecke kein entsprechender Pol , del' durch den Regier komp ensiert werd en konnte, Von daher erub rigt sich die Frage naeh del' groBeren Zeitkonstan ten , und man setzt T p i = T 2 . Fur die Reglerverst ark ung ergibt sieh nach Gleichun g (2.119)
Vn
=
T2
4T
2 (2.125) sD Nun ist noch eine geeignete Dampfung D zu wahlen. Del' innere Kreis wird naeh auBen als PT2 -Glied mit gerade diesel' Dampfung erscheinen. Wahlt man D < 1, so ist dieses PT2-Gli ed schwingungsfahig, was wiederum die Regelung des auberen Regelkreises erschwert. Aus dem Grund kommt nur ein Wert D ~ 1 in Frage, wobei ftir aile diese Werte del' innere Kreis ein aperiodisches Einsehwingverh alt en aufweist , das mit grofe r werdendem Dimmer langsamer wird. Fur eine opt ima le Regelgesehwindigkeit bei aperiodisehem Einschwingverh alten ist deshalb D = 1 die riehti ge Wahl fiir den Dampfungsfaktor. Fur das Uber tragungsverha lte n des inneren Kreises folgt daraus
Y2 (S) 1 Ul(S) - 4T§s2 +4Tss+1
(2.126)
2.6 PID-Regler
123
Ann ah erun g dieser Ubertrag ungsfunkt ion nach Gleichung (2.66) durch ein PT1-Glied ergibt Y2(s) 1
Ul(S):::::: 4T ss + 1
(2.127)
Dam it best eht dann aber auch die vorn RegIer 1 zu regelnde Strecke aus zwei P T1-Gliedern , und bei Vern achliissigung der Begrenzung ergeben sich hier nach vollig analogen Uberlegungen die Reglerp arameter zu T pi = T 1 und
(2.128) Statische Vorsteuerung. Neben den genannte n Vort eilen hat die Kaskadenschaltung allerdings den Nachteil eines schlechten Fiihrungsverh alt ens. Der Grund ist leicht einzusehen. Wird am Eingan g der Scha lt ung flir den auferste n Kreis ein neuer Soliwert vorgegeben , so muss diese Anregung erst die gesamte Reglerkaskade durchlaufen, ehe die Strecke selbst angeregt wird und sich die Ausgangsgrofe verandert . Abhilfe bietet hier eine Vorst euerung . Sie verbessert das Fiihrungsverhalten und wird daher oft in Verbindung mit einer Kaskadenr egelung verwendet . Eine sogenannt e statische Vorst eueru ng ist in Abb . 2.44 zu sehen. Die Fuhrungs-Ubertragungsfunkti on des Systems lau tet:
T (s) = y(s) w(s)
= G(s )(K (s) + V ) G(s)K (s) + 1
(2.129)
Da die Vorsteuerun g auBerhalb des geschlossenen Kreises liegt , kann der Faktor V ohne Riicksicht auf die Stab ilitat fest gelegt werd en, was man auch daran erkennt, dass V nicht im Nenner der Ubert ragungsfunkt ion auftaucht. Die stationare Genauigkeit der Regelung ist ebenfalls nicht gefiihrdet , denn falls K (s) einen Int egralanteil enthalt, d .h. lim K (s) = . 00 , gilt weiterhin 8~ 0
lim T (s) = 1. Die Wir kun g einer Vorsteueru ng lasst sich folgend erm aBen
8-> 0
erklaren: Falls der Regier beispielsweise ein PI-RegIer ist , so wird bei einer Sollgrobenanderung Liw dieser Sprung , multipli ziert mit dem P roportionalanteil P des Reglers, an die St recke weitergegeben . Gleichzeitig gelangt aber auch ein Sprung V Liw tiber den Vorsteuerkanal auf die St recke. Bei einer Verand erung der Sollgrofie vergroliert also gewissermaBen der Vorsteuerkanal den Proportionalanteil des Reglers. Das riickgekopp elte Signal y lauft dagegen nicht tiber den Vorsteuerkanal, d.h. im weit eren Verlauf ist der RegIer auf sich allein gestellt. Der Vorsteuerkanal bleibt konstant auf dem anfangs erreichte n Wert , und der RegIer wird, falls er einen Integrator ent halt , seine Stellgrofe so lange weiter vera ndern, bis die Regelabweichung e verschwunden ist . In der Anfangsph ase wird durch die Vorst eueru ng also die Anregung auf die Strecke vergrofert, was zu einer erhohten Regelgeschwindigkeit fuhrt , wahrend im weiteren Verlauf der Vorst euerkanal die Ausregelung der Regelabweichung nicht mehr beeinflusst.
124
2. Regelungstechnische Grundlagen
w
y
Abb. 2.44. Statische Vorsteuerung
Dynamische Vorsteuerung. Bei einer Kaskadenschaltung lasst sich im Prinzip fur jeden Regelkreis eine statische Vorsteuerung einfugen. Elegant er ist aber eine dynamische Vorsteuerung, die auch als F iihrun gsgroBengenerator bezeichnet wird. Das Prinzip der Vorsteuerung, namlich durch eine zusat zliche Aufschaltung das Fuhrungsverh alt en des Regelkreises zu verbessern , bleibt aber erhaIten. Die Funktionsweise eines Fuhrungsgrofengenerators soll anhand des Beispieles in Abb . 2.45 erlautert werden . Die Zeitverluste, die bei der Kaskad enr egelung dadurch entstehen, dass ein neuer Sollwert erst die gesamte Reglerkaskade durchlaufen muss, ehe er auf die St recke gelangt , sollen hier dadurch eliminiert werden, dass passend zum Sollwert Y l ,Z i ei fur die Haupt regelgrolle Yl ein Sollwert Y2 ,Soll fur die innere Regelgrofe Y2 abge leitet und direkt an den inneren Regier 2 gegeben wird . Dieser regelt dann seine Regelgrofe Y2 auf den geforderte n Wert , und die Hauptregelgrofle ste llt sich in der Foige theoretisch ohne Mitwir kung von Regier 1 auf den richtigen Wert ein. FGG
Abb. 2.45. Dynamische Vorsteuerung
Die Berechnun g des Sollwertes Y 2,S oll erfolgt im Fiihrungsgroflengenera tor (FGG) mittels eines Streckenmodells. Zwischen Y2 ,Soll und Yl ,S oll muss der gleiche Zusammenh ang wie zwischen Y2 und Yl bestehen, im vorliegenden Fall also ein PTrGlied mit der Verzogerungszeit T 1 • Dieses PT1-Glied ist aber im FGG auch vorhanden. Wenn nun ein neuer Sollwert Y l,Ziei ftir die Hauptregelgrofe vorgegeben wird , so wird sich der Ausgang des Int egrators im FGG so lange verand ern ,
2.6 PID-Regler
125
bis sein Eingang gleich Null ist, also bis Yl ,Soll = Yl ,Ziel gilt. In dem Fall hat aber wegen des oben erwahnte n Zusamm enhanges auch Y2 ,Soll gerade den zu Yl ,Zi el passenden Wert erreicht . Durch den Int egrator im FGG wird dariiber hinaus auch gewahrleistet , dass Y2 ,Soll einen st et igen Verlauf aufweist , der vom Hegler 2 fur die als Ausgang eines Verzogerungsgliedes sicherlich ebenfalls stetige GraBe Y2 dann auch eingehalte n werden kann . Die Gesamtschaltung im FGG , also das Ubertragungsverhalten von Yl ,Ziel nach tn.ssu, entspricht einem PT2-Glied , dessen Dampfung iiber die Integrator-Z eitkonstante T eingeste llt wird. Wird diese Zeitkonstante groB genug gewahlt , so ist die Dampfung grofer als Eins , das Einschwingverhalten ist aperiodisch, und sowohl Yl ,Soll als auch Y2 ,S oll verand ern sich monoton vom alten auf den neuen Sollwert. Es ste llt sich die Frage, warum der aufere Regelkreis iiberhaupt noch benotigt wird . Man muss aber in der Praxis immer damit rechnen, dass das Streckenmodell im FGG nicht exakt ist oder Storungen in der Strecke zwischen Y 2 und Yl angr eifen, die vom Regier 2 natiirlich nicht erkannt werden konnen, Daher ist ein aufe rer Regelkreis fur die Hauptregelgrofle unerlasslich, Da der Sollwert Y l ,S oll ftir diese Regelgrofe ebenfalls vom FGG stammt, ist sichergestellt, dass die Sollwert e ftir beide Regier zueinander passen und die Regier nicht gegeneinand er arbeiten. Wie bei der stat ischen Vorsteuerung gibt es auch beim Ftihrungsgrofengenerator keine St abilitatsprobleme, sofern seine interne Ubertragungsfunktion nicht inst abil ist , da auch er auBerhalb des geschlossenen Kreises ar beitet . Damit ist er natiirlich auch nur bei einer Anderung der Fuhrungsgrofle wirksam . Die schnelle Ausregelung von StOrungen ist aber dur ch die Kaskadenschalt ung ohnehin gewahrleistet . Entkopplung. Bisher nicht behandelt wurden in diesem Kapitel die MehrgraBensysteme. Dab ei ist es in der Realit at der Norm alfall, dass auf ein System mehrere Grofen einwirken und andererseit s auch mehr ere Ausgan gsgrofe n von Interesse sind, wobei jede Ausgangsgrofe von mehreren Eingangsgrofen abh angen kann . Man spricht hier von einer Verkopplung der einzelnen Grofen .
In man chen Fallen lasst sich zu jeder Ausgangsgrofe genau eine Eingangsgrofe angeben, die einen wesentli chen Einfluss auf die Ausgangsgrofie hat , wahrend der Einfluss aller anderen Eingangsgrofien eher gering ist. Dann kann man versuchen , die Ubort ragungsfunkt ion von jeder Eingangs- zur zugehorigen Ausgangsgrofe zu bestimmen und fur dieses Teilsyst em eine Regelung wie fur ein gewohnliches Eingrofiensyst em auszul egen. Der Einfluss der anderen Teilsyst eme wird ignorier t . Das Mehrgrofensystem wird also in mehrere Teilsysteme zerlegt, die als voneinand er unabhangige Eingrofensysteme behandelt werden. Voraussetzung fur den Erfolg dieser Vorgehensweise ist offensichtlich , dass die Kopplungen zwischen den Teilsyste men ausreichend schwach sind .
126
2. Regelungstechnische Grundlagen
Bei zu starker Verkopplung der Teilsysteme kann diese Methode aber fatal e Folgen hab en. Wird beispielsweise durch einen RegIer eine Eingangsgr6Be der Mehrgr6Benstrecke verand ert , so verand ern sich mehrere Ausgangsgr6Ben, was Reaktionen anderer Regier hervorruft , die sich wiederum auf die Regelgr6Be des erste n Reglers auswirken konnen, Dieser leitet daraufhin entsprechende GegenmaBnahm en ein, was wiederum GegenmaBnahmen anderer Regier hervorruft. Es ist unwahrscheinlich, dass das Syst em jemals in einen st ationar en Endzustand kommt . Schlimmstenfalls konnen die Schwingungen sogar aufklingen. Man kann aber weiterhin fur jede Gr6Be einen eigenen Regelkreis auslegen, falls sich der Einfluss der anderen Gr6Ben auf diesen Kreis komp ensieren lasst . Abb. 2.46 zeigt als Beispiel eine Zweigr6Benstrecke, bei der sich die Stellgr6Ben U1 und U2 tiber die Ubertragungsglieder Gi j auf beide Ausgangsgr6Ben auswirken. Damit jeder der beiden Regelkreise fur sich dimensioniert werden kann , sind die Gr6Ben d1 und d2 zu kompensieren. Dies geschieht mit den Signalen a1 und a2, die tiber die Entkopplun gsglieder E i j aus den Stellgr6Ben hervorgehen. Beispielsweise muss fur eine Komp ensat ion von d2 durch a2 gelten: (2.130) Die Entkopplung ents pricht damit im Prinzip einer St6rgr6Benaufschaltung. Aus (2.130) folgt mit d2(s) = G 12(S)U2(S) und a2(s) = E 12 (S)U2(S) fur die Berechnun g des Ent kopplungsgliedes: I
Gll (s )Ed s)U2(S) == -G 12(S)U2(S) =} E () __ G 12(S) 12 S Gu(s)
(2.131)
Analog dazu gilt fur das zweite Entkopplungsglied: E
( ) __ G21(S) 21 S
-
G22 ( S )
(2.132)
Da bei diesen Formeln Ubertragungsfunktionen im Nenner auftauchen, gibt es naturlich Beschrankungen in Bezug auf Nullst ellen mit positi vem Realt eil und auch in Bezug auf die Ordnung von Zahler- und Nennerpolynom, so dass eine solche Ent kopplung in vielen Fallen nur eingeschra nkt oder gar nicht moglich ist . Die in diesem Kap itel vorgestellt en Methoden eignen sich hervorr agend zur Regelung linearer Eingr6Bensysteme, aber auch nichtlineare Strecken (nach einer Linearisierung) und sogar Mehrgr6Bensyste me lassen sich teilweise noch mit diesen einfachen Mitte ln regeln. Daher besteht der iiber walt igende Ant eil aller indus tri ell eingesetzten Regier aus Reglern vom PID -Typ mit den verschiedensten Strukt urerweiterungen. In der Forschung wird dagegen seit den sechziger J ahren ein anderer Ansat z verfolgt , der eine wesentli ch t iefere Einsicht in das Systemverhalt en mit sich bringt und dadurch eine
2.7 Zustandsdarstellung und Zustandsregelung
127
Entkopplung t- -
, .
, , ,
- - - - - - - - -- - -- - - - ---,
Ut
' I
,
1
,,
Y2 ' '
,
Abb. 2.46. Entkopplung bei einem Zweigrofiensyst em
Mehrgrof enr egelun g von St recken beliebiger Ordnung in einem geschlossenen Ansat z errnoglicht . Es ist das im niichst en Kapit el vorgest ellte Prinzip der Zustand sregelun g.
2.7 Zustandsdarstellung und Zustandsregelung 2.7.1 Grundlagen Definition von Zustandsgroflen. Die Met hodik , die den klassischen regelungstechnischen Verfahren zu Grunde liegt , lasst sich folgenderm aBen skizzieten: Die Different ialgleichungen der St recke werden in den Frequenzbereich t ransform iert und zu einer Ubertragungsfunkt ion zusa mmengefasst , fur die dann - ebenfalls im Frequenzb ereich - ein geeignet er Regier gesucht wird. Diese Vorgehensweise ist in der Mitte des J ah rhu nderts entwickelt word en, wahr end sich die Regelun gstechn ik als eigenstiindige W issenschaft etablierteo Aber seit Beginn der sechziger J ahre ist an ihre Seite eine vollig andere Meth odik getreten, die in diesem Kapitel vorgestellt werden solI. Sie wird als Zust andsraumrnethodik bezeichnet und geht zu gra Ben Teilen auf Rudolf Kalm an zuriick [79, 209]. Der entscheidende Unte rschied zur bisherigen Vorgehensweise liegt in einer Betrachtung der int ernen GraBen des Systems. Versucht e ma n friiher , die internen Grof en zu eliminieren und durch die Ube rt rag ungsfunktio n einen direkt en Zusammenh ang zwischen Ein- und Ausgan gsgrof en herzustellen , so wird bei der Zust and sr au mmeth odik gerade das gegent eilige Ziel verfolgt. Hier wird auf das Verhalten der int erne n Syst emgrofen besonderes Augenmerk gelegt , wiihrend d ie Ausgan gsgrofien nur am Rande betrachtet werden. Es wird sich zeigen , dass die Bet rachtung der intern en Grofen zu wesentli ch besseren Einsicht en in das Systemverhalten fuhrt .
128
2. Regelungstechnische Grundlagen
Das zu Grunde liegende Prinzip ist relativ einfach. Die Differenti algleichungen der Strecke werden nicht mehr in den Frequenzbereich transformiert und zu einer Ubertrag ungsfunktion zusammengefasst , sond ern im Zeitbereich so zerlegt, dass ein System aus Differenti algleichungen erst er Ordnung entsteht . Dies ist immer mi:iglich, denn jede Differentialgleichun g k-t er Ordnung lasst sich in k Gleichungen erster Ordnun g zerlegen, sofern man genligend inte rne Hilfsgri:iBen, die sogena nnte n Zustand sgroBen einfiihrt. Diese Zust and sgri:iBen oder Zustandsvariablen konnen da bei durchaus realen physikalischen Gri:iBen ents prechen. Am Ende erhalt man ftir eine Strecke n-ter Ordnung ein System von n Differentialgleichungen erste r Ordnung, wodurch die n Zustandsgri:iBen festg elegt sind . Die Ausgangsgri:iBen des Syst ems konn en dann durch gewi:ihnliche Funktionen der Eingangs- und Zustandsgri:iBen beschrieben werden. Es ergibt sich
Xi = Yj
Ii( XI , X 2 " " , UI , U 2,
= gj ( X I , X 2 , ... ,UI,U2 ,
,t) ,t)
,n } j E {l , ,m}
i E {l ,
(2.133)
bzw. in vekto rieller Schreibweise
x = f (x, u , t ) Y = g (x , u , t)
(2.134)
= [Xl , ...,xn]T , U = [UI , ...]T , Y = [YI, ... ,Ym]T, f = [h ,..., fn]T und [gl ' ...,gm]T.
mit x g =
Diese Gleichun gen bezeichnet man als die Zustandsdarstellung des Syst ems . Dab ei sind die Ui die Eingangsgri:iBen des Syst ems, die Xi die Zustandsgri:iBen, die Yi die Ausgangsgri:iBen und die Ii und gi zunachst beliebige, skalare Funktionen der Zust and s- und Eingangsgri:iBen sowie der Zeit t. Die Ausgangsgri:iBen mussen nicht unb edingt von den Zust and sgri:iBen verschieden sein. Bei Gleichheit einer Zustand sgri:iBe und einer Ausga ngsgri:iBe wird die zugehi:irige Funk tion gj natii rlich trivial: Yj = g j( x, u , t ) = X j ' Allgemein ist aber davon auszugehen, dass die Anzahl der Ausgangsgri:iBen m kleiner ist als die Anzahl der Zust and sgri:iBen n. Da u und y als Vektoren definiert werden , sind Mehr gri:iBensysteme in diesem Ansatz offensicht lich von vornherein ent halte n. Bei Bedarf kann aus diesen Gleichungen auch ein direkter Zusamm enhang zwischen Ein- und Ausgangsgri:iBen ermit te lt werd en, wie spa ter noch gezeigt wird . Eine Beschrankung auf lineare und zeit invariante Syst eme, wie sie bisher durch die Anwendung der Laplace-Transformati on erforderlich war , ent fallt .
Eigenschaften von Zustandsgroflen. Anh and eines sehr einfachen Beispieles soli nun ein GefUhl da ftir vermittelt werden, was eigent lich eine Zustandsgri:iBe ist . Gegeben sei ein Korper der Masse m , auf den eine Kraft f a einwirkt (Abb. 2.47), wobei die Reibung vernachlassigt werd en solI. Die zugehor igen Gleichungen lau ten:
2.7 Zustandsdarstellung und Zustandsregelung
129
fa(t) = m a(t) a(t) = dv(t) dt
= dl(t)
v(t)
dt
(2.135)
"j",7",~
Abb. 2.47. Beschleunigter Korper Ausgehend von einem festen Zeitpunkt to soll nun die Lage 1des Korpers zu einem spateren Zeitpunkt tl > to ermittelt werden . Eine Umformung der Gleichungen liefert
a(t)
1
= - fa(t) m
J t
v(t) =
a(T)dT + v(to)
to t
l(t) =
J
v(T)dT + l(to)
(2.136)
to
und Einsetzen in die letzte Gleichung schlieBlich
l(td =
J [j ~ to
fa(eJ)deJ + V(tO)] dr + l(to)
(2.137)
to
Folgendes ist ersichtlich: Die Lage l(td zu einem bestimmten Zeitpunkt kann nur dann berechnet werden, wenn die Anfangswerte l(to) und v(to) sowie der Verlauf der Eingangsgr6Be des Systems fa(t) im Zeitintervall t E [to, t l ] bekannt sind . Fruhere Vorgange fur t < to spielen keine Rolle. Daraus folgt, dass l(t o) und v(t o) offenbar den Zustand des Systems zum Zeitpunkt to vollstandig charakterisieren. Mit Kenntnis dieses Zustandes und der von diesem Zeitpunkt an angreifenden Eingangsgr6Be fa(t) lasst sich jeder Folgezustand berechnen. a(to) ist dafiir nicht erforderlich, da zur Berechnung von a(t) aus der Eingangsgr6Be im Gegensatz zu v(t) und l(t) auch keine Integration erforderlich ist. Die Beschleunigung kann sogar ohne weiteres eliminiert werden. Man erhalt dann eine Zustandsdarstellung des Systems gemaf Gleichung (2.133) mit den Zustandsgr6Ben X l = v und X 2 = l; der Ausgangsgr6Be y = lund der Eingangsgr6Be u = fa:
130
2. Regelungstechnische Grundlagen
.
dv(t ) t dl (t)
1
Xl = -d- = - ia (t) = ft(u ) . X2
m
= d,t = v(t ) = !2(Xl) y = I(t) = g(X2)
(2.138)
Anhan d der Form der beiden Gleichungen (2.134) lasst sich auch allgemein beweisen, dass das Systemverhalte n durch die Werte der Zust an dsgrofen zu einem bestimmten Zeitpunkt und den weiteren Verlauf der Eingangsgrofen eindeutig bestimmt ist. Eb enso ergibt sich durch Umstellen der Zust andsgleichungen sofort , dass die Zust andsgroflen immer durch Integration aus anderen Crofen hervorgehen und dah er in einem Blockschaltbild Ausgan gsgrofen von Integratoren sein miissen (vgl. auch Abb. 2.47):
J t
x (t) =
f (x (r ),u(r),r)dr +x(O )
(2.139)
r =O
Da weiterhin als Argumente des Vekt ors f keine Ableitungen auftreten, sind die Zust andsgrofien immer das Er gebnis einer Integration endlicher GraBen und dami t grundsatzlich stetig. Die Integrat oren konnen daher wegen ihr es nur stetig vera nderlichen Inh alt es auch als Speicher int erpretiert werden , was in vielen Fallen die Anschaulichkeit der Zust andsdarstellung erhoht . Als Speichergrofen komm en stetig veranderliche GraBen wie Masse an Fliissigkeit in einem Behalter oder En ergie in Frage. Die Zust andsgrofien reprasentieren dann beispielsweise den En ergieinh alt des Syst ems. Fasst man die Zust andsgrofien zu einem Zust and svektor x = [Xl , ...,xnV zusammen, so beschreibt dieser Vektor einen Punkt im n-dimensionalen Zustandsraum . Wegen der St etigkeit der einzelnen Komp onenten bilden diese Punkte im zeit lichen Verlau f eine Trajekto rie oder Zustandskurve. In Abb . 2.48 ist eine solche Kurve fur die oben beschriebene St recke dargestellt. Ausgehend vom Anfan gszustand 1(0) = v(O) = 0 nehm en Lage und Geschwindi gkeit bei konstanter positi ver Beschleuni gun g zun achst zu. Da die Geschwindigkeit in der Anfangsph ase der Bewegung starker anste igt als die Lage, ergibt sich eine parab olische Kurvenform. Anschauli ch gesehen muss erst eine Geschwindigkeit vorh anden sein , bevor cine Lageanderung eintri tt . Zum Zeitpunkt t l wird die Kraft bzw. die Beschleuni gung auf einen negativen Wert umgeschaltet . Die Geschwindi gkeit verringert sich wieder, bis die Endposition zum Zeitpunkt t 2 erreicht ist . Berechnen lasst sich eine solche Zustandskurve, wenn ma n in den Zust an dsgleichun gen die Zeit eliminiert und v dir ekt in Abh an gigkeit von 1 angibt. Zu st a n d sda r st e ll u n g linearer Systeme. Die Zust andsdarstellun g kann noch starker schema tisiert werden , wenn man sich auf lineare und zeitinvariant e Syste me ohne Totz eit en beschra nkt . Die Vektorfunktionen f = [ft ,..., i nf' und g = [gl' ...,gm]T werd en dadurch zu linearen Funktionen
2.7 Zustandsdarst ellung und Zustandsregelung
131
v let)
t=O
,, a>0 : a
t=t z
---.-
att)
Abb. 2.48. Verstellvorgang mit konstanter Beschleunigung von den Zust ands- und Eingan gsgr6£en. Damit lassen sich die Gleichun gen (2.134) auch schreiben als
x = Ax+Bu y = Cx-l Du
(2.140)
A , B , C und D sind Matrizen mit konst ant en Koeffizient en. A bezeichnet man als Systemm atrix , B als Einga ngsma trix, C als Ausgangsmatrix und D als Durchgangsmatrix . Abb . 2.49 skizziert die Zusarnmenh an ge. Der Integrator ste ht dabei fur eine komponentenweise Integration des Vektors x .
u
Abb, 2 .49. Zustandsdarstellung einer linearen Strecke
1m Eingr6J3enfali hat das Syst em zwar nur eine Ein- und Ausgangsgr6Be, d .h. u und y sind Skalare, abe r weiterhin beliebig viele Zust andsgr6£en. A ist dah er imm er von der Ordnung n x n, wobei n die Streckenordnung kennzeichn et . Dagegen wird B im Ein gr6BenfaIl zu einer n x l-Matrix , C zu einer 1 x n-Mat rix und D zu einem Skalar. Zur Verd eutli chun g soIl das oben angegebene Beispiel urn eine Feder und eine geschwindigkeitsabha ngige Reibung erweite rt werd en , so dass sich das schon in Abb. 2.4 dargest ellte System ergibt. Umformen der Gleichun gen (2.1) bis (2.5) und Eliminati on der Beschleuni gun g liefert die Zustandsgleichun gen
dv(t ) = ~ fa(t) _ c,. v(t ) _ cf l(t) dt m m m dl(t) = v(t) dt und die triviale Ausgan gsgleichun g
(2.141)
132
2. Regelungstechnische Grundlagen
l(t) = l(t)
(2.142)
Hier bietet sich eine Deutung der Zust and sgrofen als Energieinh alt des Systems an. Und zwar repr asentiert die Lage die Auslenkung der Feder und damit die potenti elle En ergie des Syst ems, wiihrend die Geschwindigkeit ein MaB fiir die kinetis che Energie darstellt . In Matrizenschreibweise lau t en die Gleichungen
x=
[J]
= [
y = l = [0 1]
-r-:f] [~] *] +[
[n + a
fa
f a = Ax + Bu
= ex + Du
(2.143)
Wegen D = 0 ist in diesem Beispiel die Ausgangsgrofe ausschlieBlich eine Linearkombination der Zust and sgrofen und nicht dir ekt von der EingangsgroBe abhiingig. Damit kann sich die Ausgangsgrofle aber ebenso wie die Zust andgroflen auch bei spru ngfOrmiger Eingangsgrofie nur stetig veriindern. Dies gilt ftir alle Strecken, bei denen der Ubertragungskan al vorn Ein- zum Ausgang einen T iefpass wie z.B. einen Int egrator oder ein Verzogerungsglied ent ha lt, denn die Ausgangsgrofie eines solchen Ubertragungsgliedes und damit natiirlich auch die Ausgan gsgrofie des Syst ems kann gru ndsiitz lich nur ste t ig verla ufen. Da weiterhin fast alle realen Strecken t iefpasshaltig sind, ist der Fall D = 0 der Norm alfall in der Praxis und wird auch als Vorausset zung insb esond ere fur die Auslegun g von Reglern oft benotigt . Zu beachten ist auBerdem, dass Laufzeitglieder , obwohl sie lineare Ubertragun gsglieder sind , in einer Zust and sgleichung nicht dargestellt werden konn en, Dies widersprache auch dem Gedanken, dass sich aus dem moment anen Zust and der Strecke alle folgenden Vorgiinge im Syste m berechnen lassen konn en. Zur Berechnun g der Ausgan gsgrofie eines Laufzeit gliedes ist dagegen wegen seiner Speicherwirkung die Kenntnis eines vergangenen Zust and es notwendig. Normalformen. In den beiden vorangega ngenen Beispielen waren die gegebenen Differentialgleichungen der Strecke von vornherein erster Ord nung. Dies hatte zur Folge, dass keine zusat zlichen Crofen als Zust and sgrofen eingefiihrt werd en musst en. Sie erga ben sich aus der Struktur der Strecke und hatten deshalb auch eine reale physikalische Entsprechung in den GroBen Geschwindigkeit und Lage. Dies muss nicht immer so sein. Grundsiit zlich konn en die Zust and sgrof en nach beliebigen Kriterien fest gelegt werd en, beispielsweise, urn der Systemm atrix A eine best immt e Form zu verleihen. Anhand eines einfachen Beispiels soll dies verd eut licht werd en. Gegeben sei ein Eingrofensyst em mit der Ubertragun gsfunktion n n- 1 + G(s ) = bns + bn_1s n sn + an_l s - 1 +
+ bo + ao
(2.144)
2.7 Zustandsdarstellung und Zustandsregelung
133
Zunachst soli versucht werd en, ein zu dieser Ubertrag ungsfunkt ion gehorendes Blockschaltbild zu entwickeln, das nur Integratoren und Multiplikationen mit konst anten Fak toren ent halt . Da ab er die Mult iplikat ion eines Signales mit einem Faktor und anschlieBende Int egra ti on gena u dasselbe Er gebni s liefern wie die Integration und anschlieBende Multip likation , gibt es offensichtl ich verschiedene Moglichkeiten, ein solches Blockschaltbild zu konstruieren. Zwei dieser Moglichkeiten sind in Abb . 2.50 gezeigt. Es hand elt sich dab ei urn zwei besond ers haufig vorkommende Formen , und zwar die Regelungsnormalform und die Beobachtun gsnorm alform . Diese Normalformen zeichnen sich dadurch aus, dass die Koeffizienten der Ubertrag ungsfunkt ion auch direkt als Faktoren im Blockschaltbild auft auchen.
u
Regelungsnonnalfonn
y
Beobachtungsnonnalfonn
Abb. 2.50. Normalformen einer rationalen Ubert ragungsfunktion
Beide Blockschaltbilder ent ha lten jeweils n Int egratoren, und n ist auch gerade die Ordnung des Syst ems . Fur eine Zustandsdarst ellung des Syst ems sind damit n Zustandsgrofien Bowie eine Ein- und eine Ausgangsgrofe notwendig. Andererseits gehen Zust andsgrofen immer durch Int egra tion aus anderen Grofen hervor. Urn eine Zust and sdarstellung zu erha lten , ist es deshalb naheliegend , die Ausgangsgrofen der Int egratoren als Zust and sgrofien zu verwenden , wie sie auch schon in den Blockschaltbildern eingezeichnet sind. Die Gleichung fur die Zust and sgrofie X n in der Beobachtungsnorm alform lau tet beispielsweise
134
2. Regelungstechnische Grundlagen
J t
x n (t ) =
bn-IU(T) + Xn-I(T) - an -I( Xn(T) + bnU(T))dT +
.1:n (O)
(2.145)
r =O
bzw . (2.146) Insgesamt ergibt sich anhand der Blockscha ltbilder fur die Zustandsdarstellung des Systems in Regelungsnormalform
0 0
x=
••
•
1 0 0
.
0
••
0 1 •
•
•
0 0
••
•
•
•
••
•
•
•
0 0 •
•
•
•
•
•
•
•
0 •
•
0 0 0 .. . 1 0 1 0 0 0 ... 0 -aD -al -a2 . . . -a n-2 -an-I
x+
U
0 1 (2.147)
und in Beobachtungsnormalform:
x=
00 · · ·0 -aD 10 · · ·0 - a l 0 1 . . . 0 - a2
x
+
bo - bnao bi - bnal b2 - bna2
U
00 · ··1 -an-I y= [O , ..., O, l]x + bn u
(2.148)
Neben diesen beiden Normalformen existieren noch andere, von denen man je nach Anwendungsfall eine bevorzugen wird. Allgemein lasst sich die Festlegung von Zustandsgrofen auch als Definition eines Koordinatensystems im n-dimensionalen Zustandsraum int erpreti eren . Ein gegebener Systemzustand zu einem bestimmten Zeitpunkt tl ist ein Punkt in diesem Raum . Dieser Punkt ist gerad e durch den Wert jeder einzelnen Zustandsgrofe zum Zeitpunkt tl definiert . Bei anders gewiihlten Zustandsgrofen ergeben sich zwar andere Werte, der Punkt und damit der Systemzustand muss aber imm er derselbe bleiben. Eine andere Wahl der Zustandsgrofen entspricht damit lediglich einer A.nderung bzw . Transformation des Koordinatensystems. Eine solche Koordinatentransformation lasst sich durch eine reguliire und deshalb auch invertierbare Tr ansformationsmatrix T beschreiben. Mit dieser gilt ftir den neuen Zustandsvektor: z = T - Ix . Einsetzen von x = Tz und x = Tz in (2.140) liefert die Zustandsdarstellung fur die neu en Zustandsgrofen
z= y
T - I AT z + T - IBu
= CTz +Du
(2.149)
2.7 Zustandsdarstellung und Zustandsregelung
135
mit den neuen Matrizen
A' = T - IAT
C'=CT
D ' =D
(2.150)
Da das neue System aber lediglich durch eine Koordinatent ra nsformation aus dem alte n hervorgegangen ist , miissen beide Darstellun gen vollstandig aquivalent sein. Weiterh in sind die Eigenwer te der Syst emm atrix A als die Nullstellen SJl der Determinante (2.151) lsI- AI definiert . Desha lb ents prechen wegen
lsI - T - l ATI = 1sT-l IT - T- l ATI = IT- l (sI - A )T I
= lsI - AI
(2.152)
die Eigenwerte der neuen Syst emm atrix gera de den Eigenwerten der alte n. Diese Tatsache wird fur die folgend en Herleitungen noch benot igt . Allgemeine Losung e iner linearen Zustandsgleichung. Eb enfalls als Grundlage fur spa te re Rechnungen wird die allgemeine Losung der Zustandsgleichung gebra ucht , die direkt den Zusammenh an g zwischen Ein- un d Ausga ngsgrofen des Syst ems angibt. Der Losungsan satz lau t et
J t
x (t ) = eAtx o +
eA(t-T )B u(T )dT
(2.153)
o mit xo = x(O) und der Matri zen-e-Funkti on e
At
:=
I
+At +A
2
t2
3t
3
I' + A I' 2.
+ ... = 3.
k
LA k -kt . 00
k =O
(2.154)
'
Nun ist noch zu beweisen , dass dieser Ansatz tatsachlich die Zust an dsgleichung x = Ax -l- B u (2.155) erftillt. Zuniichst lasst sich zeigen , da ss die Reihe (2.154) fiir alle Matrizen A und ItI < 00 absolut konvergier t . Desha lb ist d ie gliedweise Differenti ation nach der Zeit zulassig, und man erhalt in Analogie zum skalaren Fall: (2.156) Eb enso gilt das Addi tionsth eorem der Exponenti alfunkt ion: (2.157) Die Differenti ation des Losungsa nsatzes (2.153) liefert
136
2. Regelungstechnische Grundlagen
J t
x (t ) = eAtx o + eAt
e- AT B u(T)dT
o
J t
x (t ) =
A eAtxo + A e At
~ A [,A 'xO+ =
i
e- ATB u (T)dT + eAte- AtB u (t )
o , At' - <}B U(T)dT]
+ Bu(t)
Ax(t ) + Bu(t )
(2.158)
Dami t ist gezeigt, dass dor Ansatz (2.153) die Zust and sgleichun g (2.155) erfiillt und somit eine Losung dieser Gleichun g ist. An ihm lasst sich ablesen , dass ein bestimmter Zustand immer von einem Anfangszustand Xo un d vom anschlieBenden Verla uf der Anr egun g u (t ) ab ha ngig ist. 1st keine aufiere Anregung vorhanden (u(t) = 0), so red uziert sich die Losung auf den Term eAtx o. Der Anfangszustand Xo ist also mit der Matrix eAt zu multiplizieren , urn den akt uellen Zustan dsvekt or zu erhalten. Diese Mat rix wird desha lb auch als Transitionsmatrix bezeichnet . Die Ausgangsgrofen ergebe n sich aus den Zustandsgrofien gernaf der Ausga ngsgleichung
y (t ) = Cx(t ) + Du(t )
J t
= C eAtxo +
CeA(t- rlBu(T)dT + Du(t )
(2.159)
o 2.7.2 Steuerbarkeit und Beobachtbarkeit Mit der Losung (2.153) konn en nun zwei Eigenschafte n von Syst emen hergeleitet werden, die nicht nur ftir die Regelun g linearer sondern auch nichtlinearer Str ecken und dami t auch ftir Fuzzy-R egier auBerordent lich wicht ig sind. Urn ihre Bedeutung erkennen zu konn en , muss ab er zunac hst kur z auf das Konzept der sogena nnten Zustandsregelung eingega ngen werden. Wahrend bei den bisher vorgestellt en Reglern die Ausgan gsgrof en der St recke geregelt wurden , sind dies bei den Zust andsreglern die Zust andsgrof en. Durch die Regelung der Zust an dsgrofien unterliegen aber sa mt liche internen Vorgiinge einer standigen Kontrolle, was natiirlich eine wesentl ich bessere Beherr schun g des Systems errnoglicht , Eine Anpassung der Ausgan gsgrofien an die vorgegebenen Sollwerte ist da nn kein P roblem rnehr, da diese lediglich Linearkombin ati onen der Zust andsgrof en darstellen. Zwei Eigenscha ften muss ein Syst em aber aufweisen , urn eine Zust and sregelung zu errnoglichen, und zwar die St euerbarkeit und die Beobechtberkeit . Beide Begriffe wurden von Rudolf Kalman 1960 eingefiihrt [79] und sollen im Folgenden erlautert werden .
2.7 Zustandsdarstellung und Zustand sregelung
137
Bei der Steuerbark eit geht es urn die Frage, ob es die Syst ems truktur iiberhaupt zulasst , die Zustandsgrof en mit Hilfe der vorh andenen Stellgrofen in der gewiinschten Weise zu beeinflussen . 1st dies der Fall , so bezeichn et man das Syst em als steuerbar. Ein e geeignete Beeinflussun g der Zustandsgrofen ist aber wiederum nur moglich, wenn ihr Verlauf auch bekannt ist . Da normalerweise nur die Ausgan gsgrof en des Syst ems als Messgrof en zur Verfiigung st ehen , muss gewahrleist et sein, dass jede Zust andsgrofle in einer bestimmten Art und Weise auf die Ausgangsgrofen einwirkt , dami t man aus diesen den Verlauf der Zustandsgrofien ermit te ln kann. Ein solches System bezeichn et man dann als beob achtbar. Ganz offensichtlich sollte n sowohl die Steuerbarkeit als au ch die Beobacht barkeit vor Beginn des eigcntl ichen Reglerentwurfs untersucht und sichergestellt werden. Dab ei hang en beide Eigensch aft en ausschlieBlich von der Konfiguration des Systems ab und nicht von der Art der eingesetzten Rcgelun g. Eine nicht st euer- oder beobachtbare Strecke kann daher auch Bur durch And erung ihr er Konfiguration und nicht durch Wahl cines anderen Regelalgorit hmus in eine ste uer- bzw. bcobachtbare Strecke umg ewandelt werden. Hinsi chtlich der Steuerbarkeit betrifft diese And erung Ar t od er Anzahl der Stellgrofen , hinsichtich der Beobachtbarkeit die der gemessenen Ausgangsgrofe n. Sowohl Steuerbarkeit als auch Beobachtbarkeit sind kein spezielles Problem der Zust andsregelun g, sondern grundlegend e Systemeigenschaften , deren syste matische Behandlung durch die Zust andsdar stellun g iiberhaupt erst errnoglicht wurde. Wegen der Wi chtigkeit der beiden Begriffe soli nun zunac hst auf die St euerbarkeit et was Hab er eingega ngen werden . Dab ei lasst sich ein gewisses Verst andnis fiir diese Eigenschaft am best en anhand von zwei Beispielen vermitteln. Die Zustan dsdar stellun g des ersten Beispi els lautet : (2.160)
Da die Zustandsgrofe X l offenb ar nur durch sich selbst angeregt wird, kann durch die Stellgrofie hier kein Einfluss ausg eiibt werden , und das System ist nicht steuerbar. Als nicht ste uerba r wird ein Syst em ab er auch dann bezeichn et, wenn seine Zust andsgrofen wie im folgend en Fall nicht unabhangig voneinander beeinflusst werden konn en, (2.161)
Hier wirkt nicht nur die Ein gan gsgrofc u auf beide Zust andsgrofien gleichermaBen ein, sondern auch die internen Riickkopplungen sind fiir beide GraBen gleich . Die Folge ist , dass dieses Syst em beispielsweise nicht aus dem Anfan gszustand [X l, X2 ] = [1, 2] in den Nullzust and [0,0] iib erfiihrt werden kann . Eine anscha uliche Definition der Ste uerba rkeit lautet dami t:
138
2. Regelungstechnische Grundlagen
Definition 2.11 Ein Sy stem heijJe (zustands-) steuerbar, wenn es durch geeignete Wahl der Eingangsgroflen nach endlicher Zeit aus jedem beliebigen A njangszustand in den End zustand 0 uberjuhrt werden kann . Der Endzustand 0 bedeutet dabei keine besond ere Ein schrankung, da durch eine Koordinatenverschiebung jeder beliebige Punkt zum Nullpunkt gemacht werden kann. Die Frage ist nun , ob man nicht bereit s anhand der Matrizen der Zust andsdarstellun g ablesen kann, ob das Syst em ste uerba r ist oder nicht . Wie die folgend e Herleitung zeigt, ist dies der Fall. Ausgangspunkt ist die allgemeine Losung der Zust andsgleichun g
J t
x(t)
= eAtxo +
eA(t- r)B u (T)dT
(2.162)
J
(2.163)
o Nach einer endlichen Zeit tl soli gelte n
tl
0= x(h) = eAtlx o +
eA(tt - r )B u (T)dT
o Daraus folgt tt
- xo =
J
e- ATB u( T)dT
(2.164)
o Das System ist ste uerbar, wenn die Matri zen A und B so beschaffen sind, daf fiir jedes beliebige Xo ein St ellgrofenverlauf u( T) existie rt, mit dem diese Gleichun g erfiillt ist. Die weiteren Berechnungen solien nun eine leicht zu iiberpriifende Bedingung fur A und B liefern. Dazu wird zunachst der folgend e Satz beno ti gt , der hier aber nicht bewiesen werden soli:
Satz 2.12 Gegeben sei eine quadratische Matrix A der Ordnung n x n sowie eine Funkt ion F dieser Matrix mit der Ordnung p 2: n:
F = F(AP , AP- l , A P- 2 , .. ., A)
(2.165)
Dann liisst sich die Funktion F auch ersetze n durch eine Funkt ion H der Ordnung n - 1 mit F = H(An - 1 , A n - 2 , .. . , A ) (2.166)
F iir die Matrizen-Exponenti alfu nkt ion folgt darau s 00
eAr = L A k k=O
:! k
n -l
= L Ck(T)A k k=O
(2.167)
2.7 Zustandsdarstellung und Zustandsregelung
139
Einsetz en in Gleichung (2.164) liefert tl n - l
-xo = j L Ck(- T)AkBU (T)dT a k =O n- l
= LAkB k=O
J tl
cd - T)u( T)dT
a
Jcd tl
mit
Zk =
- T)U(T)dT
(2.168)
o Ausschreiben del' Summe liefert
(2.169)
Mist eine n x (np)-rvlat rix, wobei n die Anzahl del' Zustandsgroflen un d p die Anzahl del' St ellgrofen dar st ellt. -xo ist eine Lineark ombination del' np Spa lte n von M . Offensichtli ch kann fur beliebige xo eine Losung nur dann exist ieren, wenn die Spaltenvektoren von M den gesamte n n-dimensionalen Raum aufspa nnen, in dem xo liegen kann: Sa tz 2.13 Ein S ystem ist genau dann steuer bar, wenn die Matrix
M= [B , AB , A 2 B , ..., A n - 1 B]
(2.170)
n linear un abhiingige Spaltenve ktoren enthiilt. Dab ei wurde bisher nur gezeigt, dass aus dem Hochstrang von M die St euerba rkeit folgt , wahrend del' Satz auch die um gekehrte Behauptung ent halt. Auf deren Beweis soli an diesel' St elle abel' verzichtet werd en . Del' hier vorgest ellte Begriff del' St euerbarkeit wird gelegent lich auc h als Zust and sst euerbarkeit bezeichn et , urn ihn von del' sogena nnte n Ausgangsste uerbarkeit zu unterscheiden, die sich auf die Beeinfiussb arkeit del' Ausgangsgroflen bezieht . Angemerk t sei auBerdem, dass es neben dem hier vorgeste llte n St euerbarkeitskriteriurn von Kalman no ch eine Reihe anderer Kr iterien fiir die St euerbarkeit gibt, die sich abel' ebenfalls nur auf linear e Strecken beziehen . Fiir nichtlinear e Strecken , die das bevorzugte Anwendungsgebiet von Fuzzy-Reglern sind, existieren derartige Kri t erien bisher nicht . Dennoch ist es auch dart wichtig, mit dem Begriff del' Steuerbarkeit vert raut zu sein, den n schlieBlich ist es grundsatzlich fur aile St recken von elementarem Interesse, ob ein Syst em mit den zur Verfiigung st ehend en St ellgrofen iiberha upt in del' gewiinschten Weise beeinfiusst werden kann .
140
2. Regelungstechnische Grundlagen
Auf die Beobachtbarkeit soil wegen ihrer engen Verwand schaft zur Steuerbarkeit nun nicht mehr so det ailliert eingegangen werden. Es gilt die Definition: Definition 2.14 Ein S ystem ist genau dann beobachtbar, wenn m an aus den tiber eine endliche Zeitspanne t E [to , til gem essenen Eingangs- un d Ausgangsgroflen u (t), y et) j eden beliebigen Anfangs-Zustandsvektor x (to) rekonstru ieren kann.
P raxisnaher ware diese Definition, wenn aus den bisher gemessenen GraBen nicht der langst vergangenc Anfangsvekto r, sondern der akt uelle Zust and svektor X(tI ) berechnet werden konnte. Diese Eigenschaft gibt es naturlich auch, sie wird als R ekonstruierbarkeit bezeichnet . Bei linear en, zeitinvarianten Systemen sind Rekonstruierb arkeit und Beobachtbarkeit aquivalent e Eigenschaften. Ohn e Beweis sei das Beobachtbarkeitskriterium von Kalman angegeben: Satz 2.15 Ein S yst em ist genau dann beobachtbar, wenn die Matrix
(2.171)
n linear' unabhiingige Zeilenvektoren enihiilt. 2.7.3 Der Ljapunovsche StabiliUi.tsbegriff flir lineare Systeme
Ein e noch vieI wicht igere Eigenschaft als Ste uerbar keit und Beobachtbarkeit ist natiirlich die St abilitat eines Systems. Mit den jetzigen Kenntn issen ist klar, dass die bisher verwendeten Stabilitatsdefinit ionen im P rinzip recht unvollstandig waren, weil sie sich nur auf das Verh alt en der Ausgangsgroflen des Syst ems bezogen. Deshalb soil an dieser Stelle die Stabilitatsdefinit ion von M.A. Ljapunov [112] fur lincare Systeme vorgestellt werden: Definition 2.16 Ein lineares Sy stem ist genau dann asymptotisch stabil, wenn sein e Zust andsgroflen ohne iiuflere Anregung aus jedem beliebigen Anf angszustand gegen Nu ll stre ben:
lim x (t) = 0
t - oo
mit
u (t )
=0
(2.172)
Ein stabiles System kommt also von allcine aus jedem beliebigen Anfangszustand wieder zur Ruh e. In Kapitel 2.8.4 wird diese Definition verallgemeinert und auch der Unt erschied zwischen einfacher und asymptot ischer Stabilitat
2.7 Zustandsdarstellung und Zustandsregelung
141
erlaute rt . Spricht man bei lineare n Syste men von Stabilitat, so ist norm alerweise die asymptotische Stabilitat gemeint, weshalb hier auf eine Unte rscheidun g verzichtet werden kann. 1m Gegensatz zu den friiher behandelt en St abilit atsdefinitionen 2.4 (endliche Spru ngantwort) und 2.5 (begre nzter Ausgang bei begrenztem Eingang) wird bei dieser Definition nicht die Reaktion der Ausgangs- auf eine Eingangsgr6Be betrachtet , sonde rn das auf einen Anfangszust and folgende, interne Verh alt en des Systems. Wie bei der Steuerbarkeit und Beobachtbarkeit ist nun die Frage, ob sich die Stabilitat schon aus den Matrizen der Zust andsdarstellun g ablesen lasst. Da der Ljapuno vsche Stabilitiitsbegriff von einem Syste m ohne aufe re Anregung ausgeht, vereinfacht sich die zu betrachtende Zustandsgleichung mit u = 0 zu einer homogenen Vektor-Differentialgleichung:
x =Ax
(2.173)
Fur die Stabilitatsdefinition ist nun zu unt ersuchen, unter welchen Bedingungen die Losung dieser Gleichung fur beliebige Anfangswerte gegen Null strebt. Dab ei gestaltet sich die weitere Betrachtung am einfachste n, wenn man die Gleichung einer Laplace-Tr ansform ation unt erzieht. Wegen ihrer Lineari t at ist dies ohne weiteres moglich, Dabei wird die Tran sform ation von Vektoren ebenso wie Differentiation oder Integration komp onentenweise dur chgefiihrt. Nach dem Differentiationssatz der Laplace-Transformation ergibt sich
sx(s) - Xo = Ax (s)
(2.174)
bzw. (2.175) Die Anwendung der Cra merschen Regel auf die inverse Matrix liefert
x (s)
=
P (s) lsI _ AI Xo
(2.176)
Dab ei ist P( s) eine Polynommatrix, d.h . ihre einzelnen Element e sind von s abhangige Polynome. Diese Schreibweise ist natiirlich nur moglich, wenn die Inverse iiberhaupt exist iert bzw. die Determinant e lsI - AI von Null verschieden ist . Fur diese Determin ant e wiederum gilt mit den Eigenwerten s, von A n
[sl - A ] = II (s - Si)
(2.177)
i =1
Damit lasst sich fiir jedes einzelne Element von (s] - A ) - 1 eine Par tialbru chzerlegung durchfiihren. In Matrizenschreibweise ergibt sich
P (s)
IT (s -
i= 1
L Lr" (s M_: I
x (s ) = (sI - A )- lxO= n
Xo = s;)
JL=l v= 1
v
)v Xo JL
(2.178)
142
2. Regelungstechnische Grundlagen
wobei das Syst em l verschiedene Eigenwerte hab e und r{t die Vielfachheit des Eigenwertes S{t ist . M {tv ist eine Matrix mit konst ant en Koeffizienten. Die Riicktransformation in den Zeit bereich liefert schlieBlich I
rl'
ir:'
x(t ) = ~ es"t ~ (II _ I )! M{tvx o
(2.179)
J ede Komponente von x (t ) ent halt dami t P roduk te aus Exp onentialfunkt ionen und Polynomen in t. In einem solchen Produkt ist die Expone nt ialfunk ti on immer der ausschlaggebende Term . 1st ihr Realteil positi v, so wachst das Produk t unabhiingig vom Polynom iiber alle MaBen, wahrend sie bei einem negati ven Realt eil so schnell gegen Null konvergiert , dass das Polynom ebenfalls keine Rolle mehr spielt. Der Vektor x (t ) strebt damit genau dann gegen Null , wenn der Realt eil aller Koeffizient en s{t negativ ist .
Satz 2.17 Ein lineares, zeitinvari antes Sys tem ist genau dann asymptotisc h stabil im Sinne der Definition von Lj apunov, wenn aile Eigenwerte der Systemmatrix A einen negativen Realteil aufweisen. Dabei entscheiden die Eigenwerte natii rlich nicht nur iiber die Stabilitat des Systems, sondern auch iiber die Form der Einschwingvorgiinge, wie man an Gleichun g (2.179) unschwer erkennen kann. J e nach GroBe der Realteile wird das Syste m schneller oder langsamer gegen den Nullzustand konvergieren , und im Falle eines konju giert komplexen Eigenwertpaares komm t es wie im skalaren Fall bei einem konjugi ert komplexen Polp aar zu Schwingun gen . Von der Wahl der Zust andsgrofen ist die St abilitiit natiirli ch un abh angig, da die Eigenwerte einer Mat rix A durch eine Basistransform ation T - 1 AT nicht veriindert werden. Es stellt sich noch die Frage, inwieweit der neue Stabilitiitsbegriff mit den beiden alten Definitionen in Zusamm enh ang gebracht werden kann. Dazu wird diesmal die komplette Zustandsdarstellung in den Frequenzbereich tra nsformiert:
sx(s) - Xo = Ax (s) + Bu(s) y (s) = Cx(s) + Du(s)
(2.180)
Falls lsI - AI i- 0, so kann man die Inverse (sI - A )-l bilden , und es gilt
x (s) = (s I - A)- lBu(s) + (sI - A )-lxO
(2.181)
Einsetzen in die Ausgangsg leichung liefert
y (s) = (C(sI - A )- lB + D ) u (s) + C( sI - A)- lXO , "
(2.182)
G (s )
Anh and dieser Gleichung lasst sich erkennen, dass man G (s ) als Ubertragun gsmatrix des Syst ems interpreti ercn kann , die das Ubert ragungsverhalte n
2.7 Zustandsd arstellung und Zustandsregelung
143
vom Ein- zum Ausgan g beschreibt . Der von Xo abha ngige Term st ellt dann den Einfluss einer Anfan gsstorung auf die Ausgangsgrofe dar. Ein Element G ik(s) von G (s) lasst sich als Ubert ragungsfunkt ion von cler Ein gan gsgrolie U k zur Ausgangsgrofe Yi auffassen. Im Ein grofenfall redu ziert sich G(s) auf eine gewohn liche Ubertragungsfunkt ion. Die Inverse (sl - A )-l lasst sich nach Gleichung (2.176) als Quo tient aus einer Polynommat rix und der Det erminanten darst ellen :
(sl _ A) -l =
P (s)
IsI - AI
(2.183)
Da der hier auftre te nde Nenner durch die Multiplikat ion mit den konstanten Matri zen B und C nicht vera ndert wird , ist die Determinante gera de der (gemeinsa me) Nenn er aller Ubert rag ungsfunkt ionen Gik(S) in G( s) . Die Nullste llen der Det erminante, also die Eigenwerte der Systemmatrix, bilden daher die Po lstellen der skalaren Ubertragun gsfunk tionen Gik(S). Diese Polstellen sind aber gera de nach Sat z 2.6 in einem Eingrof ensystem flir die St abilit at ausschlaggebend. Ist das System deshalb stabil im Sinn e der Definition von Ljapunov, d.h. weisen alle Eigenwerte der Syst emm atrix einen negativen Realt eil auf, so gilt dies auch fur aile Pole der Ubert rag ungsfunkti onen Gik(s), und die Uber t rag ungsfunkt ionen sind stabil. Wenn ab er aIle Elemente Gid s ) von G( s) stabile skalare Ubertrag ungsfunktionen sind , so ist das Gesamtsystem ebenfalls stabil im Sinne der Definitionen 2.4 und 2.5. Aus der Ljapunov-St abili t at folgt also die Ubertra gungsstabilitat cines Syst ems. Andersheru m gilt diese Folgerung aber nicht , denn da sich die Pol- und Nullste llen der Ubert rag ungsfunkt ionen gegeneinander kiir zen lassen , milssen nicht aIle Eigenwerte der Systemmat rix auch tatsachlich als Poist ellen der Ubertragun gsfun ktionen in Erscheinung t reten. Wenn also aIle Polst ellen einen negativ en Realt eil aufweisen, so muss dies nicht unb edin gt auch fur alle Eigenwerte der Syste mmatrix gelte n. Der Ljapunovsche St ab ilit atsbegriff ist dami t um fassender als die bisher behandelten Stabilitatsdefinitionen , was nicht verwunderlich ist , denn wenn samt lichen int ern en Syste mgrofen einen st abilen Verlauf aufweisen, kann es keine Ausgan gsgrofe mit einem instab ilen Verlauf geben . Andererseits kann ein Syst em nach auBen hin durchau s als stabil erscheinen, wahrend int erne Vorgiinge inst abil werd en und nur deshalb nicht bemerkt werd en , weil sie sich gegenseitig komp ensieren oder die entsprechend en Ausgangsgrofien nicht gemessen werden.
2.7.4 Entwurf eines Zustandsreglers Nachdem bisher die Eigenschafte n eines linearen Systems in der Zust andsdarst ellun g ausfuhrlich behandelt wurd en , solI nun auf den Entwurf linearer Zust andsregler eingegangen werd en. Sinn dieser Dar st ellun g ist es, dem Leser einen Ube rblick zu verrnit te ln , welche Verfahren und Moglichkeit en die
144
2. Regelungstechnische Grundlagen
klassische, lineare Regelungsteehnik bietet, damit er im Einzelfall entscheiden kann , ob der Einsatz eines Fuzzy-Reglers tatsiiehlieh Vorteile gegeniiber klassisehen Verfahren mit sieh bringt. Konzept. 1m Weiteren sei vorausgesetzt, dass D = 0 ist und B und C Hochstrang aufweisen, d.h . die Spalten von B bzw. die Zeilen von C sind linear unabhiingig. Wiirde B diesen Hochstrang nicht aufweisen, so hiitte der Stellgrofenvektor mehr Komponenten als notwendig, was in der Praxis natiirlieh vorkommen kann, die Theorie aber unnotig ersehweren wiirde und fiir eine Regelung offensiehtlieh aueh keinen Gewinn bringt. Ahnliehes gilt fiir C . Der Hochstrang bedeutet hier , dass alle Ausgangsgrofen linear unabhangig sind . Ware eine Ausgangsgrofie von den anderen linear abhangig, so ware dies redundante Information und brachte fur die Reglerauslegung keinen Vorteil. In der Praxis kommt dieser Fall natiirlieh insbesondere in sicherheitsrelevanten Bereiehen vor. Die Zusammenfassung redundanter Information erfolgt aber, bevor sie als Messgrofe dem RegIer zugefiihrt wird, so dass dieser Fall hier vernachlassigt werden kann. Weiterhin ist die Matrix D fiir die in der Praxis normalerweise vorkommenden Tiefpassstreeken immer O. Dies kann man sieh sehr einfaeh anhand der Tatsaehe klarmaehen, dass D den direkten Durehgriff vom Eingang zum Ausgang darstellt. Fiir D =f 0 hat daher ein Sprung einer Eingangsgrofie aueh einen Sprung mindestens einer Ausgangsgrofle zur Folge, was bei Streeken mit Tiefpassverhalten nieht vorkommen kann. Aueh diese Bedingung stellt daher keine besondere Einschrankung dar. Dureh die Kenntnis der internen Zustandsgrofen ist eine Systembeeinflussung nun sehr einfaeh und elegant moglich, wie Abb. 2.51 zeigt . Der Zustandsvektor wird lediglieh mit einer konstanten Matrix F multipliziert und auf den Eingang zuriiekgefiihrt. w
u
Abb. 2.51. Grundstruktur einer Zustandsregelung Die Zustandsdarstellung dieses Systems lautet: X= (A+BF)x+Bw y= Cx
(2.184)
Man sieht , dass sieh dureh die Regelung ein neues System mit der Systemmatrix (A + BF) ergibt. Die Matrix Fist nun so zu bereehnen, dass die neue
2.7 Zustandsdarstellung und Zustandsregelung
145
Systemmatrix eine geeignete Eigenwertkonfiguration, also Stabilitat und ausreichende Diimpfung aufweist . Damit wird das System aus einem Anfangszustand bei konstanter Eingangsgrofe immer in einen stationiiren Ruhezustand iibergehen. Dariiber hinaus ist aber auch stationiire Genauigkeit zu gewahrleisten, was bedeutet, dass die Ausgangsgrofe yin diesem Ruhezustand auch tatsachlich dem Sollwert w entspricht. Sowohl zwei Entwurfsverfahren fur die Matrix F als auch MaBnahmen zur Erzi elung stationarer Genauigkeit werden im Folgend en noch behandelt. Der prinzipielle Unterschied zwischen einem Zustandsregler nach Abb . 2.51 und den vorher behandelten Reglern vom PID-Typ besteht darin, dass fur eine Zustandsregelung die Kenntnis aller Zustandsgrofen notwendig ist. Dies kann sich in der Praxis als groBes Problem her ausstellen, da die Zustandsgrofen normalerweise nicht aile messbar sind . Abhilfe schaffen hier die sogenannten Beobachter, die spater beschrieben werden. Mit einem Beobachter ist es moglich , aus den Ein- und Ausgangsgrofen der Strecke die Zustandsgrofen zu berechnen, sofern die Strecke iiberhaupt beobachtbar ist. Ein weiterer Unterschied zum PID-Regler ist die fehlende Dynamik im Zustandsregler, der lediglich aus einer konstanten Matrix F besteht, wahrend zur Beschreibung eines PID-Reglers Differentialgleichungen erforderlich sind . Dies ist darauf zuruckzufuhren , dass einem PID-Regler nur die Ausgangsgrofen der Strecke als Informationsquell e zur VerfUgung stehen, wahrend ein Zustandsregler st andig auf die Information iiber den gesamten Zustand der Strecke zugreifen kann. Dieses Informationsdefizit muss im PID-Regler durch aufwiindigere reglerinterne Berechnungen ausgeglichen werden. Ein Zust andsregler entspricht dagegen einem simplen mehrdimensionalen Proportionalglied. Die Entwurfsverfahren ftir die Matrix F sind sehr vielfiiltig. Ebenso wie die Entwurfsverfahren fur PID-Regler weisen au ch sie verschiedene Vor- und Nacht eile auf, so dass man im Einzelfall abwag en muss, welches Verfahren geeignet ist. Ihre Herleitung ist meist sehr aufwandig, so dass die giingigst en zwei Verfahren im Folgenden nur kurz vorgestellt werden. Polvorgabeverfahren. Ein Standardverfahren ist das Polvorgab everfahren, bei dem die Eigenwerte der Systemmatrix (A + BF) vorzugeben sind und damit die entsprechende Reglennatrix F berechnet wird . Der Einfachheit halber wird das Verfahren nur fiir eine Eingrofenstrecke dargestellt , wobei auf den Beweis der Forrneln verzichtet werden soil (siehe [1] oder [129]). Bekannt sein muss das chara kterist ische Polynom der Strecke, also der Nenner der Ubertragungsfunktion: (2.185) Das charakteristische Polynorn des geschlossenen Kreises kann frei gewahlt werden. Einzige Bedingung ist, dass aile Nullstellen einen negativen Realteil aufweisen , damit der geschlossene Kreis st abil ist.
lsI - (A + BF)I =
s"
+ Pn_I Sn-1 + ... + PIS + Po
(2.186)
146
2. Regelungstechnische Grundlagen
Beide Polynome lassen sich durch ihre Koeffizientenvekt oren beschreiben : q = [qn -l qn- 2
qo]
p = [Pn- l Pn- 2
po]
(2.187)
Mit 1 qn- l qn- 2 ... qi 1 qn- l'" q2
W =[BABA 2B . .. An- 1B]
o
00
1
o
0· · · 1
0
" ' q3
(2.188)
gilt dann fur den Regier:
F =(q -p)W- 1
(2.189)
In diesem Ausdruck ist zu berticksicht igen , dass die Ein gangsma trix B im hier behand elten Eingrofienfall nur ein einfacher Vektor der Dimension n x 1 ist . Damit wird W eine Matrix der Dimension n x n . Die Exist enz der Losun g, d.h. eines Reglers F , han gt offensichtl ich von der Invertierb arkeit der Matrix W ab oSie ist wiederum das Produkt aus einer Dreiecksmatrix, die auf jeden Fall invertierb ar ist , und der Steuerb arkeitsmatrix, die ftir ste uerbare Systeme gera de den Rang n aufweist und damit ebenfalls invert ierbar ist. Fur nicht steuerbare Syst eme lasst sich daher auch kein Regier berechnen. Der Grund ist offensicht lich: Dur ch das Polvor gab everfahren wird versucht , die Eigenwerte des Systems und dami t das Einschwingverha lten samt licher Zust and sgrofen zu modifizieren , was naturlich nur dann gelingen kann , wenn alle Zust andsgrof en prinzipiell iiberh aupt beeinfiussbar sind. Ausr eichend kann es jedoch auch sein, wenn man zwar nicht alle Zust and sgroflen beeinfiussen kann , aber zumindest diejenigen, die ohn e Regelun g einen instabilen Verlauf aufweisen wiirden. Man spricht dann von einem sta bilisierbar en Syst em: Definition 2.18 E in Sy st em (A , B) bezeichn et m an als stobilisie rbar, wen n eine R eqlermairix F existiert, so dass die Sy st emmatrix des geregelten S ystems (A
+ BF)
nur Ei genwerte m it negativem R ealteil auf weist.
F ur solche Systeme kann ebenfalls ein Polvorgab everfah ren , natiirlich in einer modi fizierten Version , durchgeftihrt werd en. Angemerkt sei, dass es bei Eingrofe nstrecken, wenn iiberha upt, nach Gleichung (2.189) gena u einen Regier gibt, mit dem eine vorgegebene Eigenwertkonfigur ation des geschlossenen Kreises erzielt werd en kann. Bei Mehr grofensystemen gibt es dagegen unendli ch viele Regier bzw. Losun gen dieses Problems, sofern die Strecke steuer bar ist . Fur eine nachtragliche Auswahl unt er den verschiedenen Reglern mussen daher weitere Kriterien herangezogen werden . Ein Beispiel soll nun das Polvorgab everfahren und auch den Aufbau eines Zust and sreglers et was verdeutli chen . Gegeben sei eine Eingrofe nst recke
2.7 Zustandsdarstellung und Zustandsregelung
147
dritter Ordnung in del' Regelun gsnormalform (Abb. 2.50). Die Matrizen A und B del' Strecke lauten nach (2.147) :
(2.190)
Fiir die St euerbarkeit smat rix ergibt sich
(2.191)
und dam it fiir W
o 1• a2 = [001] 010 • 001
= W-
I
(2.192)
100
Nach Vorgab e eines charakteristischen Polynoms p = [Pn- I Pn- 2 . .. Po] fiir den geschlossenen Kr eis erha lt ma n fur die Reglermatrix
F = (q - p)W-
I
= ([ a2 al ao] - [P2 PI po D
= [ao - Po al - PI a2 - P2]
0 0 1] 0 10 [ 100 (2.193)
Das Blockschaltbild 2.52 verdeutlicht , dass durch Hinzufiigen del' Riickfiihrung jeder einzelne Streckenkoeffizient a ; eliminiert und durch den vorgegebenen Koeffizient en Pi ersetzt wird. Diese besonders einfache Vorgehensweise resulti ert aus del' speziellen Struktur del' Regelun gsn ormalform , die gerade deshalb ihr en Nam en zu Recht t ragt. Del' Vorteil des Polvorgabeverfahrens liegt in seiner Ei nfachheit, wahrend sein Nachte il darin besteht , dass die Festlegung geeignete r Koeffizienten Pi ein gewisses MaB an Intuition und Erfahru ng erfordert. Insbesondere bei Mehrgr6Bensystemen ist die Auswirkung einzelner Eigenwerte oft kaum noch zu iiberschau en , so dass bei diesem Verfahren normalerweise einige Versu che erforderlich sind, urn einen del' Problemstellung angepa sst en Regier zu finden .
Riccati-Entwurf. Ein anderes Verfahren ist del' Entwur f eines Optim alen Zustandsreglers [131]. Dabei wiI'd derjenige Regier gesucht, del' das Syste m aus einem Anfangszust and in den Ruhezust and iiberfiihrt unt er Minimierung des Funkt ionals
J 00
J=
(x T(t)Qx(t) + uT(t )Ru(t)) dt .
n
(2.194)
148
2. Regelungstechnische Grundlagen u
,,
,,, , ,, ,,
, -
- -
-
-
-
- -
-
- -
-
- -
-
-
-
- -
_ _ -
-
- -
-
-
- -
- -
-
-
- -
-
-
- -
- -
-
_ _ -
-
- -
-
-
_ _ -
- -
-
-
- -
__ I
Reglennatrix F Abb. 2.52. Zustandsregelung einer Strecke in Regelungsnormalform Das Funktional wird dann klein, wenn einerseits der Zust andsvektor schnell gegen den Nullvektor konvergiert und dies andererseits mit kleinen Stellgrofen erreicht wird . Q und R stellen im Prinzip Gewichtungsfaktoren fur den Verlauf von Stell- und Zust ands grofen dar . Beide Matrizen miissen symmetrisch sein, Q zudem positiv semidefinit und R positiv definit . Fur ein st abilisierb ares System (A , B) besteht dann die Losung des Optimierungsproblems in der Reglermatrix (2.195) mit der (positiv definiten) Losung P der algebraischen Ri ccati-Gleichung (2.196) Der entste hende Regier wird deshalb auch Ri ccati-Regler gena nnt. Die St abilisierbarkeit der Strecke ist Voraussetzung ftir die Existenz einer Losung. Ware das System namlich nicht stabilisierbar , so wiirde mindestens eine Zustandsgrofe exist ieren, die mit t tiber alle MaBen wachsen wiirde. Dann konnte aber auch da s Funk tional J keinen endlichen Wert mehr annehmcn, und eine Optimierun g war e nicht mehr moglich. Aus demselben Grund ist der geschlossene Kreis mit dem gefundenen Regier sicher stabil, d .h. alle Zustandsgrofien konvergieren gcgen Null, denn sonst wiirde J ebenfalls keinen endlichen Wert aufweisen. Der Riccati -Entwurf unterscheidet sich in einem ganz wescntlichen Punkt von der in Kapitel 2.6.3 kur z angesprochenen Optimierung eines PID-Reglers hinsichtlich eines Gtitefunktionals. Beim PID-Regler liefert die Optimierung namli ch nur die Parameter des Reglers, wahrend die PID-Struktur vorgcgeben werden muss. Der Riccati-Entwurf liefert dagegen sowohl Strukt ur als auch Par ameter des Reglers. Dab ei ist der Regier optimal auch im Vergleich mit zeitvariant en und nichtlinear en Reglern , wie sich mit Hilfe der Variationsrechnung beweisen lasst .
2.7 Zustandsdarstellung und Zustandsregelung
149
Da die Losung der Riccati-Gleichun g ein Standardproblem ist , fur das geeignete nummerische Algorithmen zur Verfugung ste hen [100], lasst sich mit (2.195) ein optimaler Regier nach Vorgabe von A , B , R und Q aut omat isch erzeugen. Dennoch ist auch hier Intuition und Erfahrung des Anwenders gefragt , urn die Gewichtungsmatrizen R und Q geeignet fest zulegen. Denn die Definition des Funktion als entsc heidet letztendlich tiber das Auss ehen des Reglers. Angemerkt sei zum E nde, dass neb en dem vorgest ellten Funktional noch eine Vielzah l anderer Funktionale exist iert, die auf ganz unterschiedliche Regelungen fuhren . Der Grundg edanke, namlich die Minimierung des Funktionals , ist jedoch in allen F allen gleich.
2.7.5 Linearer Beobachter Nachdem nun die beiden bekanntesten Verfahren zur Auslegung von Zustandsreglern vorgestellt worden sind , soll jet zt auf die schon erwahnte n Beobacht er eingegangen werden . Mit Hilfe eines Beobacht ers wird aus dem gemessenen Vektor der Ausgan gsgroflen y der Zustandsvektor x berechnet . Ein Beobacht er ist ebenso wichtig wie der Hegler selbst , falls die vom RegIer benot igten Zust andsgrofien nicht direkt messbar sind und auf irgendeine Art und Weise aus dem Ausgan gsvektor, d.h. aus den gemessenen GraBen , berechn et werd en miissen . Auch beim Entwurf von Fuzzy-Reglern wird dieses P robl em oft iibersehen . Die einfachste Losung war e sicher lich, den Zust andsvekt or direkt aus dem Ausgan gsvektor zu berechn en : x = C -1y. Wegen der normalerweise unterschiedlichen Anzahl von Ausgangs- und Zustandsgrofen ist C ab er im allgemeinen nicht quadratisch und somit nicht invertierbar . Diese Losung kommt dah er nicht in Frage. Auf D.G .Luenb erger ([114],[115]) geht die Idee zur uck, den Zust andsvektor mit einem St reckenmodell zu schatzen. Dieses Streckenmodell wird parallel zur realen Strecke mit gerechnet und erha lt dieselben Ein gan gsgrofien wie die Strecke (Abb. 2.53). 1m Mod ell werden dann ein Zustandsvektor x und ein Ausgangsvektor y berechn et , die naturlich nicht unb edingt den realen Gr aBen x und y ent sprechen miissen . Die Abweichun g zwischen den Aus gangsgrofen des Modells und denen der Strecke wird desh alb zur Verbesseru ng der Schat zun g als Kor rekturterm tiber eine Matrix H wieder in das Mod ell eingesp eist. Aus dem Blockschal tbild lasst sich fur den Schat zfehler x = x-x ablesen:
i = x - i = Ax + Bu -
[Ax + Bu + Hy - Hy] = Ax+Bu- [Ax+Bu+HCx - HCx] = [A + H Cl(x - x) = [A+HClx
(2.197)
Wenn die Matrix (A + HC) nur Eigenwerte mit negativem Realteil aufweist, konvergiert der Schatzfehler im stationa ren Zust and gegen Null. Da A und C durch die Strecke vorgegeben sind, ist also eine geeignete Riickftihrrnatrix H
150
2. Regelungstechnische Grundlagen
u
,,.- -- ----- - ---- --- -- - - - --- - - ---- - - - - - --- -- - --- --- -- ---- - - - -,, ,, ,, , ,,, ,, ,, ,,, , , ,
,:- -Beobachter - - - - - - - - --- --- -- -- - - ----- - - - --- - - ---- - - - - - - - - - - - - - -- --- - -
Abb. 2.53. Aufbau eines Beobachters zu finden. Offensichtlich t aucht beim Ent wurf eines Beobacht ers ein ahnliches Problem auf wie beim Ent wurf eines Zust and sreglers. Wahrend beim Reglerentwurf eine Matrix F so zu bestimmen war , dass die Systemmatrix (A+BF) stabil ist, muss jetzt eine Matri x H so bestimmt werden, dass (A + HC) stabil wird. Da die Matri zen C und H gegeniiber B und F in ihrer Reihenfolge aber vertauscht sind , ist das Problem nicht vollstandi g aquivalent . Dennoch lasst sich der Entwur f eines Beobachters auf den Entwurf eines Zustandsreglers zuriickfiihren. Und zwar ist das charakter istische Polynom der Mat rix (A + HC ) eine Determinante, die sich dur ch Transposition nicht verand ert:
(2.198) Vergleicht man diesen Ausdruck mit der Det ermin anten beim Reglerentwurf
lsI - A - BF I
(2.199)
so sieht man , dass die Entwurfsverfahren fur Zustandsregler auch hier angewendet werden konnen, wenn man folgendermaBen ersetzt: (2.200) Einen nach dem Polvorgab e-Verfahren entworfenen Beobachter bezeichnet man als Lu enberger-Beobachter und einen, der nach dem Riccat i-Verfahren entworfen wurde, als Kalman-Filt er. Mit Gleichung (2.200) folgt nach einem Vergleich von Steuerb arkeits- (2.170) und Beobachtbarkeitsmatrix (2.171) auch, dass das Kriterium fur die Berechenbarkeit einer Matrix H gerade die Beobachtbarkeit der Strecke ist . Steuerbarkeit und Beobachtbarkeit werden als zueinander du ale Eigenschaft en bezeichnet .
2.7 Zustandsdarstellung und Zustandsr egelung
151
w
,, , ,, , , , , , ,,, , , , ,, ,,, , , , ,,, ,
,,
, Beobachter und Regier
1-
: ,
Abb. 2.54. Zustandsregelung mit einem Beobachter Im Normalfall ergibt sich die in Abb . 2.54 gezeigt e Gesamtstruktur aus St recke, Beobachter und Regier. Beobachter und Regelung sind bei ents prechender Auslegung jeweils fur sich genommen stabil, es dr angt sich ab er die Frage auf, ob dies auch noch fur das Gesamtsyst em gilt , da beide in einern groBen geschlossenen Kr eis wirken . Man kann jedoch zeigen , dass die Eigenwerte der Zust andsregelun g und die des Beobacht ers auch gerade die Eigenwerte des Gesarntsyst erns sind . Regelung und Beobachter beeinflussen ihr e Eigenwerte also nicht gegenseit ig und konn en ohne St abilitat sprobleme vollig un abhan gig voneinander entworfen werd en. Sind beide Teile jeweils fur sich genommen st abil , so gilt dies auch ftir das Gesamtsyst em . Diese Tatsache bezeichnet man als Separationsth eorem . Vorau sset zun g fiir das Theorem ist allerdings, dass das Modell exa kt mit der Strecke ubereinstimmt , was in der P raxis selte n gegeben ist. And ererseits hat sich herausgestellt , das s auch bei ungenau em Modell eine weitgehend ent koppelte Auslegung von Beobachter und RegIer moglich ist , ohn e die Stabilitat des Gesamtsyst ems zu gefahrden,
2.7.6 St.ationare Genauigkeit von Zustandsreglern Bisher stand immer die Syst emmatrix des rtickgekopp elten Systems und damit seine St abilitat bzw. sein Einschwingverhalten im Vordergrund. Von einer Regelun g wird abe r daniber hinaus au ch Genauigkeit , also die Ube reinst immung von Sollgrofen w und Regelgrofien y zurnindest im st at ionaren Zustand gefordert . Es ist aber nur in den selt ensten Fallen moglich, dass durch
152
2. Regelungstechnische Grundlagen
geschickte Auslegung der Reglermatrix F neben der Stabilitat auch noch die Genauigkeit gewahrleistet werden kann. Abhilfe kann hier eine Multiplikation des Sollwertvektors w mit einer konstanten Matrix M schaffen , die gewissermaBen als mehrdimensionaler Verstarkungsfaktor auBerhalb des geschlossenen Kreises wirkt und so ausgelegt werden kann, dass im stationaren, ungestOrten Zustand alle Ausgangsgr6Ben den Sollwerten entsprechen. Bei stationaren Storungen treten allerdings weiterhin Regelfehler auf. Denn da sowohl F als auch M konstante Matrizen sind, wird auch nur eine zu den Sollund Zustandsgr6Ben proportionale Stellgr6Be erzeugt. Falls diese Stellgr6Be noch nicht zum Ziel fuhrt , wird sie nicht nachgebessert. Fiir eine stationer genaue Regelung ware es dagegen erforderlich, die Stellgr6Be so lange nachzubessern, bis die Regelabweichung verschwunden ist . Erforderlich ist also ein zusatzlicher Integrator mit der Regelabweichung als Eingangsgr6Be. Seine Ausgangsgr6Be wird sich so lange verandern, bis die Regelabweichung gleich Null ist. Vorher ist ein stationarer Zustand des Systems nicht m6glich . Abb. 2.55 verdeutlicht die Strategie. Der Angriffspunkt der Sollgr6Be hat sich nicht verandert, er ist nur anders eingezeichnet. w wird jetzt als Storund nicht mehr als Eingangsgr6Be aufgefasst. Die Regeldifferenz wird aufintegriert und das System somit um einen kiinstlichen Zustandsvektor e erweitert , dessen Komponenten ebenfalls auszuregeln sind. Sofern der Zustandsregler F ftir das erweiterte System stabil ist , wird das System auch friiher oder spater einen stationaren Endzustand erreichen. Der stationare Endzustand ist dadurch definiert, dass sich keine Gr6Be mehr andert , Dies kann ab er nur dann der Fall sein, wenn die Eingangsgr6Ben aller Integratoren Null sind, da sie sonst weiter auf- oder abintegrieren wiirden. Damit muss im stationaren Endzustand die Ausgangsgr6Be y der Eingangsgr6Be w entsprechen, und die Regelung ist stationer genau. Das erweiterte System, fiir das nun ein Zustandsregler auszulegen ist, hat die Zustandsgleichung (2.201) Bei den bisher vorgestellten Verfahren war immer die Kenntnis des vollstandigen Zustandsvektors und daher meist auch der Einsatz eines Beobachters erforderlich. Es sind aber verschiedene Ansatze entwickelt wor-
Abb, 2.55. Erweiterte Zustandsregelung fur stationare Genauigkeit
2.7 Zustandsdarstellung und Zust andsregelun g
153
den , die cine Zust andsregelun g auf der Basis der gemessenen Ausgangsgrofien ermoglichen (Abb . 2.56). 1m Gegensatz zum Zust andsregler , der au ch als Zustandsriickfiihrung bezeichnet wird , spricht man hier von einer Ausgangsriickfiihrung. Ihr Entwurf wird dadurch kompliziert , dass dem Regler weniger Information zur Verftigung steht als einem Zust andsregler und er trotzdem ein vergleichba res Ergebnis liefern soll. Eine Moglichkeit ist , zunachst einen einfachen Zust and sregler F zu entwerfen und dann die Ausgangsriickflihru ng R so zu berechnen , dass die Eigenwerte des geschlossenen Kr eises moglichst gena u denen ents prechen, die man mit dem Zustandsregler erha lte n hatte. Man kann R ab er auch dir ekt berechnen mit Hilfe von modifizierten Polvorgabe- oder Riccati- Verfahren. All diesen Verfahren ist jedoch gemeinsam, dass sie nicht so elegant und geradlinig sind wie die Entwurfsverfahren ftir Zust andsregler und die ents te henden Gleichun gen manchmal gar nicht oder nur nummerisch losbar sind (vgl. [44]) . w
u
Abb. 2.56. Ausgangsriickfiihru ng
2.7.7 Normoptimale RegIer Ein en vollig anderen Ansatz stellen die normoptimalen RegIer [36, 37, 128, 200,201] dar, zu deren Erkl arung allerdings einige Vorb etrachtungen notwendig sind. Wie schon mehrfach angesprochen, ents pricht das Streckenmodell, das als Gru ndlage des Reglerentwurfs dient , im Normalfall nicht exakt der Realitat . Fehier konn en dad urch entstehen, dass man der Ubersichtlichkeit halb er nicht aile physikalischen Effekt e mitmodelliert hat , wie z.B. die Dynamik von Mess- und Stellgliedern . Auch die Linearisi erung des Modells , die notwendig ist , wenn die Reglerentwurfsverfahren nur fur linear e Strecken konzipi ert sind, verursacht natiirlich Abweichungen zwischen realem und rnadelliert em Streckenverh alten. SchlieBlich konn en Modellfehler auch durch die zeitliche And erung der Strecke auftreten. So verandert sich beispielsweise das Gewicht eines Flugzeuges wahrend des Fluges durch den Treibstoffverbrauch oder sein Auftrieb in Abh angigkeit vom Luftdruck bzw. von der Flughohe. Dies sind, gemessen an den iibri gen dyn am ischen Vorgan gen beim FIugzeug, lan gsam e Veranderungen , die deshalb auch nicht als eigenstandige Einflu ssgrofien beriicksichtigt werde n, sondern nur ais And erungen der St reckenparameter.
154
2. Regelungstechnische Grundlagen
Man ist natiirlich daran int eressiert , dass der auf der Basis eines Modells entwickelte und an einer realen Strecke eingesetzte RegIer auch bei Abweichungen zwischen Mod ell und Strecke ein stabiles Systcmverhalten gara nt iert . Ein so1cher RegIer wird als robuster RegIer bezeichnet. Die Verwendung des Begriffs R obustheit macht abe r nur dann Sinn , wenn gleichzeitig qu antifiziert werden kann, wie grof die Abweichun gen zwischen Strecke und Modell denn sein diirfen , bevor das System instab il wird. Ohne eine so1che Qu antifizierung kann man praktisch jeden RegIer als robust bezeichnen. Ein PID-Regler fur eine Ein grofenstrecke wird beispielsweise imm er so au sgelegt , dass die Ortskurve der Kreisiibertragungsfunktion in einem gewissen Mind est abst and am Punkt -1 vorb eilauft , schon urn eine ausreichend e Diimpfung des geschlossenen Kreis es zu gewiihrleisten . Falls sich dann die Strecke etwas verandert, wird sich auch die Ortskurve und damit die Dampfung etwas verander n. Der Abstand zum kritischen Punkt wird moglicherweise kleiner , abe r das System ist trotzdem noch st abil und der RegIer demnach robust . Dennoch bleibt hier imm er ein gewisses Restrisiko, da man nicht gena u qu antifizieren kann , wie grof die Anderungen der Strecke denn sein diirfen , bevor die Ortskurve den kri tischen Punkt beriihrt oder sogar auf der falschen Seite passiert. Deshalb soli hier ein RegIer nur dann als robust bezeichn et werden , wenn au ch gleichzeit ig die zulassi ge Abweichun g der Strecke vom ursprunglichen Modell qu an tifiziert werden kann. Weiterhin kann man fur Signa lverlaufe und Uber t rag ungsfunkt ionen Normen definieren. Ein e solche Norm ordnet einem Signal , einer Ubertragungsfunk tion oder auch einer Ubert rag ungsmat rix eine positi ve reelle Zahl zu , die ein MaB fiir die "GroBe" des Elementes dar st ellt. Die p-Norm eines Signa les lau tet beispi elsweise 1
lIull, ,~ (l IU(tll'dt) ,
(2.202)
sofern das unbestimmte Integral exist iert . Fur p = 2 ergibt sich die 2-Norm
(2.203)
die au ch als Energieinhalt des Signales interpretiert werd en kann . 1st u(t) namlich beispielsweise die Spannung an einem elekt rischen Widerstand R , so gilt fur die in diesem Widerst and umg esetzte elektrische Leistung P u(t)i(t ) = ~ U2 (t) und fiir die Energie
J 00
P (t )dt =
- 00
J 00
~
2( u t)dt =
~ l lulI~
(2.204)
- 00
Die En ergie ist also proporti onal zum Quadrat der 2-Norm der Spannung.
2.7 Zustandsdarstellung und Zustandsr egelung Fur p
-+ 00
155
er ha lt man die oo-Norm
Ilul loo =
sup lu(t)1
(2.205)
t
die gerade die maximale Amplitude des Signales definiert . Offensichtlich konn en mehrere Sign ale denselb en Wert bezuglich ein er Norm aufweisen , so dass ein solcher Wert immer eine ga nze Klasse von Signalen reprasentiert, Das Rechn en mit einem Skalar ist dariiber hin aus wesentlich einfacher als mit einem Signalverlauf. Allerdings geht das Detailwissen tiber den zeitli chen Veri auf beim Ubergan g zur Norm verloren , doch ist dieses Detailwissen meist auch ga r nich t von Interesse. Insbesondere bei Storsignalen kann man den genauen Verlauf sowieso nicht vorhersagen , wohl ab er ihren En ergi einhalt oder ihr e maximale Amplitude abschatzen . In ahnlicher Weise lassen sich Normen auch fur Signalvektoren und Ubertragungsmatrizen definieren , womit sie auch auf Mehrgrofiensyst eme anwendbar sind. Fur die oo-Norm einc r Ubertragungsrnatrix lasst sich zeigen :
. )11 II G (JW
00
=
IIyl 12
sup -11-'1 Ilx1l2"'O x 2
(2.206 )
Die oo-Norm einer Ub ertragungsm atrix ste llt dami t den grolitmog lichen Faktor dar , mit dem die "E nergie "des Eingan gssignales x auf dasAusgan gssignal y = Gx iibertragen wird. Ex ak te Definitionen zu Normen und auch etwas weitergehende Betrachtungen finden sich im Anh an g. Das Entwurfsziel ist nun , einen RegIer so zu bestimmen , dass die Norm einer Ube rtrag ungsmatrix minimal wird , d .h . dass die Ausgan gssignale bezogen a uf die Eingan gssignale moglichst klein im Sinne einer bestimmten Norm werd en. Ein Beispiel fur eine solche Konfigurati on zeigt Abb. 2.57. Als Eingang ssignale werden die Vcktoren fur das Messrau schen m und die an der Strecke an greifenden Sto rsignale z defini ert , als Ausgan gsgrofen die Regelgroflen y un d die St ellgrofen u. Dabei ist eine Gewichtung der einzelnen Gr aBen mit den Wi chtun gsm atri zen W i moglich . Wird nun das Ub ertragungsverhalte n minimiert, so bedeutet dies, dass einersei ts die Regelgrofen y trotz Storungen und Messr au schen so klein wie moglich bleib en und sich nicht weit yom Sollwert w = 0 entferne n. Implizit ist damit natiirlich au ch die St abilitat des Systems gewahrleist et. And ererseits sind aber auch die Stellgrofien u zu minimierende Aus gan gsgrofen des Systems. Das Regelziel y = w = 0 soli demnach mit den kleinstrn oglichen St ellgrofen erre icht werd en , urn die St elleinrichtung zu schonen. Allerdings widersprechen sich die Ford erungen nach kleiner Regelabweichung und klein en Stellgrofen , so dass die Norm der Ub er tragun gsm atrix nicht beliebig klein gemacht werd en kann und zwischen den verschiedenen Forderungen mittels der Wichtungsfunkti onen ein Kompromiss einzuste llen ist. Der gesuchte RegIer ist de r einzige noch unbestimmte Teil der Ubert ragungsmatrix, da die Wi chtungsfunktionen festgelegt werde n und die Strecke
156
2. Regelungstechnische Grundlagen m
w=o
e
y
Abb, 2.57. Ubertragungsmatrix zur Berechnung eines normoptimalen Reglers
vorgegeben ist. Bei einer Minimierung der Norm dieser Matrix entsteht gewissermaBen als Abfallprodukt der zugehorige RegIer. Eine Herleitung und genauere Beschreibung der entsprechenden Algorithmen wiirde allerdings ein eigenes Buch (vgl. [128]) erfordern, so dass hier darauf verzichtet werden muss. Entscheidend ist, dass diese Algorithmen das Minimum nicht mittels Suchverfahren bestimmen, sondern auf direktem Wege. Damit ist auch gar antiert, dass das gefundene Optimum in der Tat ein globales Optimum darstellt und nicht nur ein lokales Optimum, wie es bei Suchverfahren oft der Fall ist. Mittlerweile enthalt jede regelungstechnische Programmbibliothek diese Algorithmen, so dass die Aufgabe des Regelungstechnikers nur noch darin besteht, das zu minimierende Ubertragungsverhalten mittels der Wichtungsfunktionen festzulegen. Die Bedeutung der Wichtungsfunktionen lasst sich am einfachsten erklaren, wenn man das in Abb. 2.57 gezeichnete System als Eingr6Bensystem ansieht und als zu rninimierende Norm die oo-Norm wahlt. Der maximale Verstarkungsfaktor von den Ein- zu den Ausgangen tiber alle Frequenzen solI also so klein wie m6glich werden . Unter anderem wird beispielsweise auch das Ubertragungsverhalten von der Streckenstorung zur gewichteten Regelgrofe (2.207) minirniert. Das Verfahren wird einen RegIer liefern, mit dem diese Funktion fur alle Frequenzen moglichst klein ist. Man wahlt beispielsweise WI = 1 und Wz als Tiefpassfunktion, also beispielsweise als PTI-G lied mit groBen Werten IWzi fur niedrige Frequenzen (Abb. 2.58). Da das Ubertragungsverhalten der Gesamt-Ubertragungsfunktion tiber alle Frequenzen rninirniert wird, ergibt sich eine Rest-Funktion I+~K' die ftir niedrige Frequenzen besonders kleine Werte annimmt. Diese Funktion stellt aber gerade das Ubertragungsverhalten von der St6rung zur Ausgangsgrofle dar. Die Ausgangsgr6Be wird daher auf niederfrequente
2.7 Zustandsdarstellung und Zustandsregelung
157
St6rungen eine sehr geringe Reaktion zeigen, was bedeut et , dass der Regier in der Lage ist , solche St6rungen gut auszuregeln. Wahlt man W2 sogar als Int egrator mit unendlicher Verstarkung fiir Gleichsignale , so muss sich zwangslaufig ein Regier ergeben, der das Ubertragungsverhalt en l+~K ftir Gleichsignale zu Null macht , damit sich iiberhaupt noch ein endlicher Wert ftir die Norm der Cesamt-Ubertragungsfunktion ergibt . Wenn das Stor-Ubertragungsverhalten ftir Gieichsignale Null ist , d.h. wenn die RegeIgr6Be trotz st ationarer Storung gleich dem Sollwert Null ist, bedeutet dies aber doch gerade st ationare Genauigkeit . Erreicht werden kann dies nur dur ch eine Regler-Ub ertragung sfunktion mit K(O) ----> 00, da nur in dem Fall die Stor -Ub ertragungsfunktion fiir s = 0 zu Null wird . Der RegIer muss also entweder einen Integraianteil enthalt en , oder er weist eine unendlich groBe, konst ant e Verstarkung auf, was natiirlich nicht realisierbar ist . Deshalb werden die Stellgr6Ben des Reglers ebenfalls als Ausgangsgr6Ben des Minimierungsverfahrens betrachtet . Da auch sie moglichst kleine Werte annehmen sollen, wird das Verfahren einen Regier mit Int egralanteil und nicht mit unendlich groBer Verstarkung liefern.
OlJog
OlJog
Abb. 2.58. Bodediagramme der Wichtungsfunktionen Die Beriicksichtigung der Stellgr6Be erfolgt dur ch die Minimierung des Ubertragun gsverhalt ens vom Messrausch en zur gewichteten Stellgr6Be: (2.208) Die Uberlegungen sind ahnlich wie oben. Im Gegensatz zu W 2 wird man fur die Wichtungsfunkt ion W3 aber Hochpassverhalt en vorgeben (Abb . 2.58). Dami t wird hier die Rest-Funktion l+~K ' also das Ubertragungsverhalt en vom Messrauschen zur Stellgr 6Be, ftir hohe Frequenzen besonders klein. Gerade dies ist aber erwiinscht , denn ein Regier sollte auf hochfrequent e Messst6rungen in der Tat m6glichst wenig reagieren. Die Minimierung dieser Funktion hat jedoch noch einen anderen Aspekt , der allerdings eine kurz e Nebenbetrachtung erfordert. Abweichungen der realen Strecke vom Streckenmodell lassen sich durch eine addit ive Komponente ausdriicken, wie die ober e Darstellung in Abb. 2.59 zeigt . Dab ei ist Go das nominale Stre ckenmodell und G = G o+L1G die reale Strecke. Umzeichnen liefert das unt ere Blockschaltbild. Mit einem geeigneten Regier K fur das nomin ale Modell Go ist der innere Kreis auf jeden Fall st abil. Zu klar en ist, unt er welcher Bedingung auch der auBere Kreis stabil ist . Fiir
158
2. Regelungstechnische Gruncllagen
diese Betrachtung muss die Abweichung LlG ebenfalls als stabil vorausgeset zt werden , was aber keine besonders stark einschra nkende Bedingung darstellt , da LlG bei der Anwendung des Verfahrens sowieso frei festgelegt wird . Der offene Kreis, also die Hintereinanderschaltung aus innerem Kreis und L1G ist dam it stabil. Nun kann man die sehr konservative Aussage machen , dass der geschlossene Regelkreis stabil ist , wenn die Verstarkung des offenen Kreises fiir alle Frequenzen kleiner als Eins ist (small gain theorem). F ur eine Eingr6Benstrecke lasst sich diese Aussage leicht mit dem NyquistKriterium beweisen. Das small gain t heorem bedeutet hier , dass der Betr ag der Kreisub ertragungsfunktion immer kleiner als Eins sein muss. Damit wird der Punkt - 1 von der Ortskurve nicht mehr umfahr en, d.h. die Phasendrehun g urn diesen Punkt ist Null. Pole auf der imaginaren Achse kann die Kreisub ertragungsfunktion nicht haben, da ihr Betrag fur kleine Frequenzen sonst unendlich grof ware. Und da die Kreisiibertragungsfunktion wegen der St abilitat der einzelnen Streckenteile auch keine Pole in der rechten Halb ebene aufweist, ist der geschlossene Kreis laut Nyquist-Kriterium st abil. Bei einer Mehrgr6Benstrecke muss entsprechend die co-Norm der Ubertragungsmatrix des offenen Kreises kleiner als Eins sein. Diese Ubert ragungsmatrix lautet hier nach Abb. 2.59 L1GK(I + GOK)-l. Der vorliegende Kreis ist daher stabil, wenn gilt : IIL1G K(I + GOK)-li loo < 1
(2.209)
Schreibt man nun die Ubertragungsfunkt ion aus Gleichung (2.208) als Ubertragungsmatrix fur Mehrgrof enstrecken auf, so zeigt sieh, dass gegeniiber (2.209) lediglich der zulassige Modellfehler L1G durch die Wichtungsfunktion W 3 ersetzt ist : (2.210) Nach erfolgter Reglerauslegung lasst sich daher anhand der Wichtungsmatri x W 3 der zulassige Modellfehler ermitteln: Und zwar ist W 3 dur ch Multiplika tion mit einem Faktor zunachst so zu normieren, dass mit der modifiziert en Matri x W~ die Norm IIW~K (I +GoK ) -l ll oo gerade den Wert Eins annimmt. Dan n ents pricht W~ derjenigen zulassigen Streckenabweichung LlG zwischen Modell und Strecke, fiir die das reale System nach (2.209) lau t small gain theorem noch stabil ist. Auf diese Art und Weise gewinnt man beim Entwurf eines oo-Norm-opt imalen Reglers gleichzeitig ein MaB fur die Robustheit der Regelung, was fur die praktische Anwendung natiirlich von besonderem Vorteil ist . Man kann auch umgekehrt zunachst die gewiinschte Robusth eit in Form der Matri x L1G bzw. W 3 vorgeben und dann den Regier berechnen , mit dem die Norm des Ausdrucks (2.210) minimal wird. Wenn sie kleiner als Eins ist , ist die St abilit at des geschlossenen Kreises auch bei Abweichungen des St reckenverha ltens yom linearen Modell gewahrleistet. Dei dieser Vorgehensweise ist allerdings die auBerst konservati ve Stabilitatsabschatzung mit dem sma ll gain theorem zu ber ucksicht igen, was
2.7 Zustandsdarstellung und Zustandsregelung
159
z
w
y
u
e
z
w
e -
-
y
I I
K Go
I I
u
I tJ.G I I I
tJ.y
I I
Abb. 2. 59. Zerlegung der realen Strecke in nominales Modell und Abweichung
anhand eines Eingrofensystems erlautert werd en soU. Bei Eingrofensystemen ist dieses Theorem gleichbedeutend mit der Forderung, dass der Betrag der Ortskurve der Kreisubertragungsfunktion immer kleiner als Eins bleiben muss. Laut Nyquist-Kriterium waren ab er wesentlich grofere Betrage zulassig, sofern nur der kritische Punkt -1 nicht umlaufen wird . Ein unnotig kleiner Betrag der Ortskurve bzw. der Kreisubert ragungsfunkt ion ist ab er gleichbedeut end mit einer unnotig kleinen Reglerverstarkung, was wiederum eine geringe Regelgeschwindigkeit zur Folge hat . Diese zu geringe Regelgeschwindigkeit kann jedoch leicht dazu fuhren, dass der RegIer fur den praktischen Einsatz untau glich ist . Ein e weitere Schwierigkeit liegt in der Auswahl geeignet er Wichtungsfunk tionen, die offensichtlich entscheidenden Einfiuss auf den berechnet en RegIer haben. Dartiber hinaus sind einige, wenn auch nicht gravierende Randbedingungen bei ihrer Festlegung einzuhalten, damit das Verfahren iiberhaupt ein Erg ebnis liefert. AuBerd em muss die Strecke sowohl steuer- als auch beobachtbar sein . Dennoch steUen die norrnoptimalen RegIer ein machtiges Werkzeug fur den Entwurf von Reglern insb esond ere fur kornplexe Mehrgrofensysteme dar. Trotz der Uberlegenheit der in diesem Kapitel vorgesteUten , modernen Regelungsverfahren tiber den klassischen PID-Regler finden sie Bur sehr langsam Verbreitung im industrieUen Einsatz. Dies liegt nicht zulet zt an ihr er Kornplexitat. Ftir einen erfahrenen Praktiker ist die EinsteUung von Verstarkung und Integrat ionszeit beim PI-Regier wesentli ch einfacher als die Festlegung von Gute- oder Wichtungsmatrizen fur den Riccati- oder normoptimalen Reglerentwurf. Dennoch ist anzunehrnen, class sich clie ZustanclsclarsteUung unci mit ihr au ch die rnodernen Regelungsverfahren im Laufe cler
160
2. Regelungstechnische Grundlagen
Zeit durchsetzen werden. Zum einen lassen sich nur mit ihrer Hilfe komplexe Mehrgroflensysteme behandeln und geeignete RegIer fur solche Systeme entwickeln. Zum anderen kann ein System, welches in der Zustandsdarstellung vorliegt , auch direkt in eine Rechnersimulation umgesetzt werden, was in Zukunft immer wichtiger wird , da schon heute praktisch jeder hoherwertige RegIer vor seinem Einsatz in einer Simulation erprobt wird . Fur die Beschaftigung mit Fuzzy-Reglern ist die Kenntnis der Zustandsdarstellung und der entsprechenden Regler-Auslegungsverfahren aus zwei Grunden interessant. Zum einen wird sich zeigen, dass ein Fuzzy-Hegler nichts weiter als ein nichtlinearer Zustandsregler ist und daher die in diesem Kapitel vorgestellte Theorie zu gewissen Teilen ubernommen werden kann . Zum anderen solIten fur eine Einschatzung der Leistungsfahigkeit von Fuzzy-Reglern als Vergleich nicht nur PID-Regler herangezogen werden, sondern die besten Verfahren, die in der klassischen Regelungstechnik existieren.
2.8 Nichtlineare Systeme 2.8.1 Eigenschaften nichtlinearer Systeme In den vorangegangenen Kapiteln wurden ausschlieBlich lineare Strecken und die zugehorigen RegIer behandelt, also Systeme, die durch lineare Differentialgleichungen beschrieben werden konnen. Reale Systeme enthalten aber fast immer ein oder mehrere nichtlineare Ubertragungsglieder, wie beispielsweise auch ein Fuzzy-Regler ein solches nichtlineares Element darstellt. Schon ein nichtlinearer Zusammenhang macht jedoch aus einem linearen ein nichtlineares Gleichungssystem, zu dessen Beschreibung man von der vereinfachten, linearen Form der Zustandsdarstellung
x=
Ax+Bu
y = Cx+Du
(2.211 )
wieder zur allgemeinen Form (vgl. (2.134)) zuruckkehren muss:
x = f(x , u) y = g(x, u)
(2.212)
Denkbar ist auch noch eine Zeitvarianz des Systems, was dadurch ausgedruckt werden kann, dass die Funktionen fund gals zusatzlichen Parameter die Zeit t enthalten. Solche zeitvarianten Systeme sollen aber in diesem Kapitel nicht behandelt werden. Fur nichtlineare Systeme sind viele der aus der linearen Regelungstechnik bekannten Werkzeuge nicht mehr anwendbar, So muss jetzt beispielsweise auf die Laplace-Transformation verzichtet werden, die nur fiir lineare Systeme eingefiihrt wurde. Ebenso verhalt es sich mit Ortskurven, die nur ftir
2.8 Nichtlineare Systeme
161
lineare Systeme Auskunft dariiber geben, wie das Ausgangssignal gegeniiber einer Sinusschwingung am Eingang in Amplitude und Phase verandert ist. Auch das Uberlagerungsprinzip (Satz 2.1) hat bei nichtlinearen Systemen seine Gultigkeit verloren, d.h. fur gleichzeitig angreifende Eingangsgrofen konnen die Ausgangsgrofen nicht mehr zunachst unabhangig voneinander berechnet und dann iiberlagert werden. Ebenfalls nicht aufzuweisen haben die nichtlinearen Systeme die Proportionalitatseigenschaft (ebenfalls Satz 2.1), die besagt, dass sich bei Vergroferung des Eingangssignales um einen bestimmten Faktor das Ausgangssignal um denselben Faktor vergrofiert. Wenn aber damit beispielsweise Sprungfunktionen verschiedener Hohe am Eingang moglicherweise vollig unterschiedliche Systemantworten hervorrufen, wird es auch sinnlos, Sprungantworten zur Charakterisierung des Systemverhaltens zu verwenden.
2.8.2 Behandlung nichtlinearer Systeme mit linearen Methoden Linearisierung am Arbeitspunkt. Aus den oben genannten Grunden ist der Regelungstechniker natiirlich daran interessiert, ein nichtlineares System auf irgendeine Art und Weise als lineares System darzustellen und auch als solches zu behandeln. Eine Moglichkeit bildet die Linearisierung des Systems an einem festen Arbeitspunkt, d.h. das nichtlineare Systemverhalten wird durch ein lineares Modell beschrieben, das in der Umgebung eines Arbeitspunktes das reale Verhalten moglichst gut reprasentieren soll. Dafiir ist die allgemeine Zustandsdarstellung in eine Taylorreihe um diesen gegebenen Arbeitspunkt zu entwickeln. Beisp ielsweise habe das nichtlineare Eingrofensystem x = f(x,u) (2.213) den Arbeitspunkt x = Xo , u = Uo und f(xo, uo) von diesem Arbeitspunkt gilt
.dx = x - Xo .du = u - Uo Llx = x = f(x,u)
= O. Fur die Abweichungen
(2.214)
Die Entwicklung von f(x , u) in eine Taylorreihe urn den Arbeitspunkt liefert dann (2.215) Das Restglied r(x, u) enthalt dabei die hoheren Ableitungen und soll vernachlassigt werden. Aus (2.214) und (2.215) ergibt sich mit f(xo, uo) = 0 (2.216)
162
2. Regelungstechnische Grundlagen
also eine lineare Differenti algleichung fur die Abweichungen vom Arb eitspunkt mit den Koeffizient en a und b. In entsprechender Weise ist die Ausgangsgleichung y = g(x,u) zu linear isieren. Damit ist das nichtlinear e Syst em am Arb eitspunkt durch ein lineares Modell dar gestellt und kann nun mit Methoden der linear en Regelungstechnik behandelt werden. 1m Mehrgroflenfall ist die Vorgehensweise analog. Fur
x=
f (x , u)
(2.217)
erha lt man als Erge bnis der Linearisierung (2.218)
wobei die einzelnen Elemente der Jacobimatrizen F x und F u definiert sind durch und (2.219) mit f = [iI, ..., f n]T . Die Linearisierung ist ein haufig eingeset ztes Mittel, urn die Werkzeuge und Entwurfsverfahren der linearen Regelungstechnik auf eine nichtlineare Strecke anwenden zu konnen. Die nichtlin eare Str ecke wird linearisiert , und fur das linear e Modell wird dann ein linearer Regier entworfen. Dabei ist aber zu beriicksichtigen , dass die Abweichungen zwischen Modell und realer Strecke mit zunehmender Entfernung vom Arb eitspunkt immer groBer werden. Der lineare Regier muss deshalb eine ausreichende Robu stheit aufweisen. Man chmal kann die Nichtlinearit at jedoch so beschaffen sein, dass das Verhalt en der realen Strecke schon in relati v kleiner Entfernun g vom Arbeit spunkt stark vom linearisierten Modell abweicht . Dar aus resultiert , dass der Regier eine hohe Robu sth eit aufweisen muss, was sich wiederum negativ auf die Regelgeschwindigkeit auswirken kann. In solchen Fallen erhalt man deshalb mit dieser Vorgehensweise oft keinen brauchbaren Regier mehr . Exakte Linearisierung. Die Nicht linearitat in der Strecke kann aber auch durch eine inverse Nichtlinearitat irn Regier kompensiert werden, so dass insgesa mt ein rein linear es Syst em entsteht. Abb. 2.60 zeigt ein sehr einfaches Beispiel fur diese Vorgehensweise. Die Sinusfunktion in der Strecke wird dur ch die Arcussinus-Funk tion im Regier gerade kornpensiert , so dass das Syst em Strecke
y
w
arcsin
,, ',
sin
_ _ ___ ____ ___ ___ ___ ___ __ l
Abb. 2 .60. Beispiel fur eine exakte Linearisierung
2.8 Nichtlineare Systeme
163
letzt endlich nur aus einer linearen Strecke mit dem dafiir ausgelegte n PIHegler besteht. Eine solche Vorgehensweise bezeichnet man als exakte Linearisierung [71 , 172]. Das Verfahren lasst sich verallgemeinern auf Mehrgrofiensyst eme der Form
x= y
a(x ) + B(x)u
= c(x)
(2.220)
die auch als analytisch-lineare Systeme (ALS) bezeichnet werden. Ein Beispiel ftir ein solches Syst em ist eine Gleichst rommaschine (Blockschaltbild Abb . 2.61) mit den Eingangsgrofien Erregerfluss ¢Je und Ankerspannung U a und den Zust andsgrofien Ankerstrom i a und Drehzahl w. Die Drehzahl geht bei einer unb elast eten Maschine dur ch eine Int egrat ion aus dem Antriebsmom ent T a hervor, und das Antriebsmoment seinerseits aus einer Produktbildung aus Ankerstrom und Erregerfluss. Der Ankerst rom wird wiederum get rieben dur ch die Differenz aus Ankerspannung und indu zierter Gegenspannung ¢Jew. Insgesamt ergibt sich die Zust and sdarstellung
(
~)
= (
C~a
)
+ ( c~ ~:~ )
( ~:)
(2.221)
mit den maschinenabhangigen, konst ant en Param etern c., die im Blockschalt bild der Ubersicht lichkeit halber nicht mit dargestellt sind. Diese Zust andsgleichung ents pricht offenbar der Form (2.220).
Abb. 2 .61. Blockschaltbild einer fremderregten Gleichstrommaschine Da die Darst ellung des Verfahr ens fur allgemeine Mehrgro ben-Al.S sehr aufwandig ware, soll hier nur die Variante fur Eingrofensysteme naher erlautert werden. Dies ist aber ausreichend, urn den Grundgedanken der exakte n Linear isierun g zu verstehen. Zunachst vereinfacht sich die Syst erngleichung zu
x = a (x) + b (x)u y = c(x )
(2.222)
Weiterhin gilt ftir den sogenannten Differenzengrad dieses Systems die folgende Definition.
Definition 2.19 Ein EingrojJen- A LS gemiijJ (2.222) hat den DijJerenzengrad oder relative n Grad d in euier Umge bung U um einen Punkt xo, wenn gilt :
164
2. Regelungstechnische Grundlagen
< d - 1 gilt LbL~c(x)
1. Fur aile x E U und k 1= 0
= 0
2. LbL~-lc(x)
La und L b sind im Anhang definierte Lie-Ableitungen. Der Differenzengrad entspricht ftir lineare Eingrofiensysteme der Graddifferenz zwischen Nennerund Ziihlerpolynom der Ubertragungsfunktion: d = n - r . Dabei ist n die Ordnung des Nenner- und r die Ordnung des Ziihlerpolynoms. Ein Differenzengrad d = n wtirde demnach bei einer linearen Eingrofenstrecke bedeuten, dass das Ziihlerpolynom nur aus einem konstanten Faktor besteht. Ftir den Reglerentwurf wird nun unter anderem vorausgesetzt, dass das nichtlineare System eben diesen maximalen Differenzengrad d = n aufweist. In dem Fall wird es exakt linearisierbar genannt. Anwendbar ist das Verfahren aber auch ftir d < n , doch werden dann die Formeln etwas aufwiindiger. 1m erst en Schritt wird zunachst durch die Koordinatentransformation
z(x)
=
(~~~~~) = ( L~~~~)
(2.223)
)
L~-lC(X)
zn(x)
aus (2.222) die Normalform (vgl. Abb . 2.62)
( .~:) (.~.~.) .~.
z=
+(
~ -l
~
in
f(z)
)
U
0 g(z) (2.224)
y={10 ·· ·0)z
Dabei sind fund 9 nichtlineare, skalare Funktionen von z. Wahlt man nun ftir die Stellgrofie u entsprechend Abb. 2.62 das Regelgesetz 1
u = g(z) (- f(z) +u*)
(2.225)
mit einer noch festzulegenden GroBe u*, so geht das System tiber in
. Z=
(~.~ ~) ( ~) * 00 1 z+ ... u 00 .. · 0
y={10 .. . 0)z
1
(2.226)
Dies ist ein rein lineares, vollstandig steuer- und beobachtbares System, fur das dann nur noch ein linearer Regier bestimmt werden muss. u*(z) ist die Stellgrofle dieses linearen Reglers, der fur das lineare System (2.226) nach
2.8 Nichtlineare Systeme
165
Transfonnierte Strecke
z
z
Abb. 2.62. Grundgedanke der exakten Linearisierung einem herkornmli chen Verfahr en fur lineare Zustandsregler auszulegen ist. Die tatsachlich auf die niehtlineare Streeke wirkend e Ausgangsgrofie u geht aus u* dann laut (2.225) hervor. Sehreibt man u in Abh angigkeit von x , so ergibt sieh 1
u(t )
= LbL~ lC(X(t)) (- L :c(x (t)) + u* (z(x (t)) ))
(2.227)
u ist also von den Zust andsgrofen der Streeke abh angig. Somit liegt ein niehtlinear er Zustandsregler vor. Fiir diesen ist dann noeh, sofern die Zust and sgraBen nieht messbar sind, ein Beobaehter zu konstruieren . Dab ei ist unt er gewissen Voraussetzungen dieselbe Vorgehensweise wie schon beim Reglerentwurf moglich, d .h. dureh eine geeignete Transformation wird das Problem auf einen linear en Beobaehterentwurf redu ziert. Dar auf soll hier aber nieht eingegangen werd en. In Kap itel 2.8.11 wird stattdessen die Auslegung eines Beobaeht ers ftir allgemeine, niehtlin eare Systeme erlaute rt, da solche Beobaehte r aueh im Zusammenspiel mit Fuzzy-Reglern erforderlieh sein konnen. Weiterhin ist anzumerken, dass der Anwendungsbereich des Verfahrens dureh zwei Vorausset zungen nieht unwesentli eh eingeschrankt wird : Erst ens miissen fund 9 bekann t sein, und zweitens muss g(z) bzw. im Mehr gr6Benfall G (z) zur Bereehnun g der Stellgr6Be u fur alle Zust and e z inverti erb ar sein. Sind diese Vorausset zungen aber erfiillt , so ste llt die exakte Linearisi erung ein elegante s Werkzeug fur den Reglerentwurf dar. Adaptive Regelung. Einen anderen Weg, das Wissen und die Methoden der linear en Regelungst eehnik in die Behandlung niehtlinear er Syst eme einzubringen , bilden die adaptiven R cgc1ungen. Als ada pt iv bezeiehnet man einen Regier , der dureh ein libergeordnetes Syst em laufend vera ndert wird , urn eine bessere Anp assung an ein sich m6glieherweise verand erndes Streckenverhalt cn zu erreiehen (Abb. 2.63). Dab ei erh alt das iibergeordnet e Syst em stand ig Inform ationen in Form von Messwerten iiber das akt uelle Verh alt en der Strecke. Ob die Veranderung des Streekenverh altens dureh eine Zeit varianz der St reeke oder lediglich durch den Weehsel des Arbeits pu nktes bei einer niehtlinear en, zeitinvariante n Streeke hervorgerufen wird , spielt keine
166
2. Regelungstechnische Grundlagen
Rolle. Die Anderu ng des Streckenverhalte ns muss aber in jedem Fall wesentlich langsamer als die ubrigen dynamischen Vorgan ge in der St recke erfolgen. Andern falls ist es sinnvoller, den sich vera ndem den Str eckenp ar ameter von vornherein als Zustandsgrofle aufzufassen .
Direkte Adaption
Indirekte Adapt ion
Abb. 2 .63. Adaptive Regelung Man unt erscheidet im wesentli chen zwei Ansatze, und zwar die direkt en und die indirekt en adaptiven Verfahren. Bei den indi rekt en Verfahren wird im laufend en Bet rieb mit Hilfe eines Identifikationsverfahrens jeweils in kurzen Abstanden auf der Basis der neu hinzugekommenen Messwerte ein neues, linear es Modell der Strecke berechnet . Die Berechnung eines linearen Modells am jeweiligen Arb eitspunkt entspr icht vom Er gebnis her einer gewohnlichen Linear isierung gemaf Gleichun g (2.218). Der Unterschied besteht nur darin, dass hier die Berechnu ng durch ein Identifikationsverfah ren auf numme rischem Wege erfolgt , wahrend sie obe n auf analytisc hem Wege durchgefiihrt wur de. Nach der Identifikation wird da nn, ebenfalls im laufenden Betrieb, nach einem vorher festgelegten Auslegun gsverfahren ein linearer RegIer passend zum Streckenmodell entworfen. Sobald ein neuer RegIer entworfen ist , wird der bis dahin arbeite nde RegIer durch den neuen ersetzt. Dab ei sollte allerd ings gewahrleiste t sein, dass die Stellgrofe einen stetigen Verlauf aufweist , urn eine unnot ige Anregung der St recke und damit Schwing ungen bei jedem Reglerwechsel zu vermeiden. Problematisch bei diesem Verfahren ist die Identifikati on . Wenn namlich die in die Identifikati on eingehenden Messwerte eine ungtinstige Verteilun g aufweisen, d.h. insb esondere zu wenig voneinander unabhan gige Informationen ent halten, kann der Identifikationsalgorithmus nummerisch instabil werden und ein vollig falsches Streckenmodellliefern . Diese Gefah r besteht schon aufgrund der Tatsache, dass Messwerte im geschlossenen Regelkreis gar nicht unabhan gig von bereits verga ngenen Messwert en sein konnen , Beispielsweise wirkt ein Signal am Streckeneingan g zunachst auf die St recke, dann tiber die Rtickkopplung auf den RegIer und taucht schlieBlich in veran derter Form wieder am St reckeneingang auf. Bei einem indirekten Verfahren ist demn ach auf jeden Fall eine zusatzliche Ube rwachung in Form einer Pl ausibilit atsprufung des jeweils ident ifizierten Modells erforderlich. Derselbe Gru ndge da nke wie den indirekten Verfahre n liegt den direkten adaptiven Verfahren zu Grunde. Hier ent fallt allerdings die Ident ifikation .
2.8 Nichtlineare Systeme
167
St attdessen wird der RegIer direkt nach einem vorher zu formulierend en Adapt ionsgeset z in Abhangigkeit von den akt uellen Messwerten verand ert. Die Informat ion tiber die Strecke, die bei indirekten Verfahren erst durch die Identifikation gewonnen wird , muss bei direkten Verfahr en daher schon vorher vorliegen und in das Adap tionsgeset z eingearbeitet werden. Ein besond ers einfaches direktes Verfahr en, das allerdings eine zeit invariante Strecke voraussetzt , ist das sogenannte Gain Scheduling . Man kann dieses Verfah ren auch als eine vereinfacht e Version des indirekten Verfahrens fur zeit invariante Strecken ansehen. Denn die Rechnungen, die beim indirekten Verfahren im laufend en Betrieb durchgefUhrt werd en , erfolgen beim Gain Scheduling vor Inbetriebnahme des Reglers . Es werd en zun achst verschiedene Arb eit spunkte ausgewiihlt und an diesen Arbeitspunkten jeweils ein linear es Modell der St recke gebildet , wobei diese Modellbildung auf analytischem oder nummerischem Wege durch eine Identifikation erfolgen kann. Fur jeden Arb eitspu nkt wird dann auf der Basis des dort giilt igen linearen Modells ein linearer Hegler entworfen. Dabei dtirfen sich die RegIer an den verschiedenen Arb eitspunkten nur in ihren Par ametern , nicht aber in ihrer Struktur unterscheiden. Das heiBt, es kann nicht an einem Arb eit spunkt ein Pl- und an einem anderen ein PID-Regler konzipiert werd en. Im lau fend en Betrieb wird dann vom Ada pt ionsalgorit hmus bei jedem Wechsel des Arbeitspunktes lediglich ein neuer Sat z Reglerp aramet er in den RegIer geladen. Somit ent fallt die onlin e-ld entifikati on, und das Gain Scheduling ist ein direktes ada pt ives Verfahren. Urn spr ungformige Veriinderungen der Stellgrofe zu verm eiden, sollten beim Uberga ng vom alten zum neuen RegIer die alt en Paramet er nicht in einem Schrit t , sondern stet ig in die neuen Param eter ub erfuhrt werd en. Optimal ist es, wenn sogar dir ekt cine stetige Funk tion der Reglerpar amet er in Abh iingigkeit vom Streckenzust and als Adaptionsgeset z angegeben werd en kann . Leider fehlt fur ada pt ive Verfahr cn, obwohl sie iiuBcrst plausibel erscheinen und in der Praxis zu guten Ergebnissen fiihren, von wenigen Ausnahmen abgesehen der Stab ilitiitsb eweis. Eine dieser Ausnahmen bilden die sogenannte n TSK-Regler , die in den Abschnitten 4.1.3, 4.2.2 und 5.1 ausfuhrlich vorgeste llt werden . Mehrschleifige oder Kaskaden-Regelung. Hiiufig konnen die P robl eme, die eine Nicht linearitat im Regelkreis mit sich bringt , durch eine mehrschleifige Regelung (vgl. Abb . 2.64) abgemildert werden. So wird beispielsweise fur eine elekt rische Maschine, deren Drehzahl geregelt werden soll, als Stellglied ein Stromricht er benotigt , der ein stark nichtlin eares Verh alt en aufweist . Der Strom wird deshalb als inte rne Regelgrofe definiert , und es wird ein innerer Regelkreis aufgebaut, der aus einem Stromregler und dem Stromricht er als St recke besteht . Dieser RegIer ist natii rlich mit Methoden der nichtlin earen Regelun gstechnik zu dim ensionieren . Nach au Ben erscheint dieser innere, geschlossene St romregelkreis aber naherungsweise als einfaches, linear es Verzogerun gsglied , dessen Ausgangsgrolle i der Stellgrofie u des Drehzahlreg-
168
2. Regelungstechnische Grundlagen
lers im wesentlichen proportional ist. Die Wirkung der Nichtlinearitat bleibt damit auf den innersten Regelkreis beschrankt. Der eigentliche Drehzahlregler im auferen Kreis kann dann fiir eine annahernd lineare Strecke ausgelegt werden. w
Abb. 2.64. Linearisierung durch mehrschleifige Regelung Die bisher angesprochenen Verfahren dienten der Eindammung oder Eliminierung nichtlinearer Effekte , urn die Methoden aus der linearen Regelungstechnik auch fur nichtlineare Systeme anwend en zu konnen, Es bleiben allerdings genugend Faile iibrig, in denen keines dieser Verfahren angewendet werden kann und man sich explizit mit den vorhandenen Nichtlinearitaten auseinandersetzen muss . Dabei miissen Nichtlinearitaten nicht unbedingt von Nachteil sein. Oft werden sie mit Absicht in den Regelkreis eingefUgt, urn die nichtlinearen Effekte fiir eine Verbesserung der Regelung zu nutzen. Nichtlinearitaten treten also nicht nur unbeabsichtigt in der Strecke oder im Stellglied , sondern auch beabsichtigt im Regier selbst auf. Als Beispiel seien hier nur die zeitoptimale Regelung genannt, die spater noch beschrieben wird , und naturlich Fuzzy-Regler. Eine geschlossene Theorie wie beispielsweise fur lineare Zustandsregler existiert auf dem Gebiet der nichtlinearen Systeme allerdings nicht , weil es dafur auch zu viele, vollig verschiedenartige nichtlineare Phanornene gibt. 2.8.3 Schaltende Ubertragungsglieder
Ideales Zweipunktglied. Urn ein Ceftihl dafur zu vermitteln, welche Effekte bei Nichtlinearitaten uberhaupt auftreten konnen, sollen nun die in der Praxis sehr haufig vorkommenden, schaltenden Ubertragungsglieder etwas genauer untersucht werden. Das einfachste Ubertragungsglied ist das ideale Zweipunktglied, das man auch als einen idealen Schalter auffassen kann . Abb . 2.65 zeigt die Kennlinie. Fur eine positive Eingangsgrofe hat die AusgangsgroBe den Wert 1 und fur eine negative Eingangsgrofie den Wert -1. Urn Zweideutigkeiten zu vermeiden, wird ftir x = a die Ausgangsgrofie y(O) = 1 definiert. Neben der Kennlinie ist eine Schaltung gezeigt , mit der diese Kennlinie unter idealen Bedingungen zu realisieren ist. Beide Schalter A und B sind miteinander gekoppelt und werden durch das Feld der Induktivitst angesteuert, die ihrerseits als Eingangsgrofe den Strom i e erhalt. Sobald der Strom sein Vorzeichen wechselt , andern sich die Richtung des Feldes und damit die als masselos angenommenen Schalter ihre Position. Als Folge davon andert auch die Spannung UR ihr Vorzeichen . Betrachtet man i e als Eingangs-
2.8 Nichtlineare Systeme
169
und UR als Ausgangsgrofe, so hat die Anordnung gerade das in der Kennlinie abgebildete Ubertragungsverhalten.
i -' Ii ,1:"=) ~ e-
_ _ _
_
---
--- ---
A
_
B
Abb. 2.65. Ideales Zweipunktglied Schaltende Ubertragungsglieder kommen in der Praxis sehr haufig als Stellglieder vor, wobei die Ausgangsgrofe nicht unbedingt zwischen den Werten -1 und +1 hin- und herschaltet, sondern vielleicht auch zwischen 0 und 1. Ein Transistor ist beispielsweise ein solcher Schalter, oder auch eine Ventilklappe. Mit diesen Beispielen kann auch schon die Frage beantwortet werden , warum solche Ubertragungsglieder iiberhaupt eingesetzt werden , wenn dadurch die Theorie so erschwert wird: Ein Schalter ist einfacher und billiger als ein kontinuierliches Ubertragungsglied. Sein Nachteil ist naturlich, dass seine Ausgangsgrofie keinen kontinuierlichen Wertebereich abdecken kann . Aber auch dieser Nachteil kann vielfach durch das sparer noch beschriebene Verfahren der Pulsweitenmodulation aufgehoben werden.
Abb. 2.66. Regelkreis mit idealem Zweipunktglied als Regier Interessant ist, dass Zweipunktglieder nicht nur als Stellglieder im Regelkreis auftauchen, sondern dass man sie auch als Regier selbst verwenden kann . Ideale Zweipunktglieder sind im Prinzip die einfachsten denkbaren RegIer uberhaupt. Abb . 2.66 zeigt ein Beispiel mit einem idealen Zweipunktglied als Regier und einem doppelten Integrator als Strecke. Die beiden Integratoren lassen sich als Beschleunigungsstrecke auffassen (vgl. Abb . 2.47). Die Stellgrofe U des Reglers entspricht damit gleichzeitig der Beschleunigung a des Korpers und die Regelgrofe seiner Lage l . Die Ausgangsgrofie U des Reglers ist entweder auf ihrem positiven oder negativen Maximalwert, und der Korper wird mit maximaler Kraft in positiver oder negativer Richtung beschleunigt. Der zeitliche Verlauf eines Regelvorgangs ist aus Abb . 2.67 ersichtlich. Der Istwert der Lage l sei zunachst kleiner als der Sollwert w. Die Regelabweichung e ist demnach positiv, worauf der Regier mit maximaler positiver Stellgrofe u bzw. Beschleunigung a reagiert. Der Korper wird nun zum Lagesollwert hin beschleunigt. Bei Erreichen des Lagesollwertes ist die Geschwindigkeit v aber grofier als Null, so dass der
170
2. Regelungstechnische Grundlagen
Korper iiber das Ziel hinaus schieBt und eine Regelabweichung zur andere n Seite erfahrt. Der Regier antwortet mit maximaier negativer Stellgrofie, was den Korp er zunachst abbremst und dan n in die andere Richtung beschleunigt. Der ganze Vorgang wiederholt sich dann mit entgege ngesetztem Vorzeichen. Offensichtlich kommt der Korper nie zur Ruh e. Dieses Verha lten lasst sich auch in der Zust and sebene beschre iben. Wie friiher bereits erlautert, sind Lage lund Geschwindigkeit v Zust and sgrof en des Systems. Der Regelvorgang lasst sich daher auch durch cine Trajekto rie in der v -l-Zust and sebene beschreiben. Da eine Dauerschwingung vorliegt, ist diese Traj ektorie eine geschlossene Kur ve, die immer wieder durchlaufen wird , und die Ausgangsgrofe I flihrt Schwingungen urn den Sollwert w aus.
' t=tl
v
/ t=O
,,
, ,, ,, , :l=w , , a>0 : a
"'t=t2
---.-
Abb. 2.67. Zust andsk ur ve und zeitliche r Verlauf beim idealem Zweip un ktglied mit do ppelte m Integrator
J e weiter der Anfangswcrt der Lagc vom Sollwert ent fernt liegt , desto langer braucht der Korp er, urn den Sollwert zu erreichen, und desto grofler ist auch seine Geschwindigkeit , wenn er den Sollwert erreicht. Dadurch fallt dann aber wiederum die Auslenkung in die entgege ngesetzte Richt ung umso grofe r aus, was insgesamt zu einer Vergrofieru ng sowohl der Amplitude der Schwingung als auch des Zeitintervalles zwischen zwei Nulldurchga ngen fiihrt . Demnach sind sowohl die Amplitude als auch die Frequenz dieser Dauerschwing ung von den Anfangsbedingungen abh angig. Ein solches Verhalten kann es bei linearen Syst emen nicht geben. Die Frequenz einer Schwingung ist dort immer durch das ents prechende konjugiert komplexe Polpaar der Ubertragungsfunkt ion festgelegt. Nur die Ampli t ude hangt von den Anfangsbedin gungen abo Abklin gende Schwingun gen ergebe n sich dagegen , wenn die Strecke aus einem Verzogerungsglied und einem Integrat or besteht , wie Abb . 2.68 zeigt. Als Zust andsgrofen konnen hier X l und X2 gewahlt werden . Die Trajektorie strebt offenbar immer weiter dem Endwert (X l , X2) = (w , 0) zu. Unabhangig
2.8 Nichtlineare Systeme
171
vom Anfangszust and erreicht das Syste m immer diesen Endzustand und ist damit stabil. ,
X2
u>O : u
~
~ 1=0 xl
, :Xt=w
Abb. 2.68. Ideales Zweipunktglied mit IT1-Strecke Zweip u nkt glied mit Hysterese. Das ideale Zweipunktglied ist , wie der Name schon sagt , praktisch aber gar nicht zu realisieren. So weisen beispielsweise die beiden Schalt er in Abb . 2.65 selbstverstandlich eine Masse und auch eine Haftreibun g auf. Das hat aber zur Folge, dass sie nicht schon bei einem Vorzeichenwechsel des Feldes bzw. des Stromes i e ihre Position andern, sondern erst, wenn die Feldstiirke eine gewisse Mindest schwelle ub erschreitet . Das Ubertragungsglied verharrt demnach auch bei einem Vorzeichenwechsel der Eingangsgrofie zunachst noch auf seinem alte n Wert . Erst bei Uberschreite n eines Schwellwertes dur ch die Eingangsgrofe springt die Ausgangsgrofle urn. Die Kennlini e eines solchen Ubertragungsgliedes ist damit im Bereich urn den Nullpunkt zweideut ig (Abb. 2.69). Welcher Zweig der Kennlinie gerade giiltig ist , hiingt vorn vorhergehenden Zust and abo Insofern kann man dieses Ubert ragungsglied als eine Art Zweipunktglied mit Gediichtni s ansehen. Einen solchen Effekt bezeichnet man als Hysterese. P rak tisch weisen alle schalte nden Ubert ragungsgliedcr eine mehr oder minder groBe Hysterese auf.
Abb. 2 .69. Kennlinie mit Hysterese Abb. 2.70 zeigt ein hyst eresebehaftet es Zweipunktglied als RegIer mit einern dopp elten Integrator als St recke. Die Umschaltung der Stellgrofe bzw. der Beschleunigung a erfolgt verzogert gegenuber dem Nulldurchgang der Regelabweichung e. Dieses Verhalte n lasst sich in der Zustan dsebene durch eine Parallelverschiebun g der Schaltgeraden beriicksichtigen. Denn das Urnschalten z.B. vorn positi ven auf den negativen Wert erfolgt beirn Regier nicht dann , wenn die Regelabweichung Null ist , sondern erst fur e = -d bzw. l = w + d. Dies ist abe r gerade auf der urn d nach rechts verschobenen Scha ltgeraden
172
2. Regelungstechnische Grundlagen
der Fall. Analog dazu ist die Schaltgerade ftir das Umschalten vom negativen auf den positiven Wert bei I = w - d. Dur ch dieses verzogerte Umschalten klingt die Schwingung aber immer weiter auf, und das Syst em ist instabil.
t=Q
"
Abb. 2.70. Zweipunktglied mit Hysterese und doppeltem Integrator Schaltet man das Zweipunktglied mit Hyst erese dagegen mit einem IT1Glied zusammen, so fiihrt das System unabh angig vom Anfangszust and nach einer gewissen Zeit immer die gleiche Schwingung aus. In Abb . 2.71 ist deutlich zu erkennen, wie das Syst em aus zwei verschiedenen Anfangszustand en in die gleiche Schwingung hineinlauft . Eine solche Schwingung bezeichnet man als Grenzzyklus. Im Gegensatz zur Dauerschwingung, bei der Frequenz und Amplit ude vom Anfangszustand abhangig waren , sind beim Grenzzyklus sowohl die Frequenz als auch die Amplit ude durch die Systemparameter vorgegeben und vom Anfangszustand vollig un abhangig. Auch Grenzzyklen konnen bei linearen Systemen nicht auft reten , da dort die Ampli tude immer vom Anfangszustand abhangig ist . Dauerschwingungen und Grenzzyklen als spezielle nichtlineare Phanornene werde n spater noch exakt definiert .
Abb. 2.71. Zweipunktglied mit Hysterese und IT1-Strecke
2.8 Nichtlineare Systeme
173
Trotz ihres gegeniib er idealen Zweipunktgliedern schon verschlecht erten St abilitatsverh altens sind die realisierbaren Zweipunktglieder mit Hyst erese in der Praxis haufig eingesetz te Regier. Ihr Vorteil ist ein einfacher Aufb au und der damit verbundene, niedrige P reis sowie ein schnelles Regelverhalten , was darin begriindet liegt , dass die Stellgrofie immer den posi tiven oder negativen Maximalwert annimmt. Problematisch ist aber die Tat sache, dass ein Syst em mit Zweipunktregler nie zur Ruhe kommt , sondern auch im stabilen Zust and immer Schwingun gen aus fuhrt. Denn die Ausgangsgrofie des Reglers alte rn iert st andig zwischen zwei Ext remwerte n und ist damit immer entweder zu grof oder zu klein. Solan ge die Amplituden dieser Schwingungen innerhalb eines vorgegebenen Toleran zbereiches bleib en , konn en sie akzept iert werd en . Wenn der Toleran zbereich aber nicht eingehalte n wird , sind andere MaBnahmen zu ergreifen. Ein e weitverbreit et e Moglichkeit best eht in der oben schon angesprochenen , mehrschleifigen Regelung. Wird das Zweipunktglied im innerst en Regelkreis eingesetz t , so fuhrt natiirlich die Ausgangsgrofe dieses inneren Kreises Schwingungen au s. Falls die nachfolgend en Ubertragun gsglieder T iefpasscharakter haben, werd en diese Schwingungen aber gedampft, so dass die Ausgangsgrofe des Gesam tsyst ems nur noch Schwingun gen mit wesentlich kleinerer Amplitude ausfiihrt . Diese liegen da nn moglicherweise schon innerhalb des vorgegeb enen Toleran zb ereiches.
Dreipunktglied. Ein e andere Moglichkeit besteht im Ein satz eines Reglers mit mehr als zwei moglichen Ausgang szust anden. Ein Beispiel hierfiir ist der ideale Dreipunktregler bzw. der realisierb are Dreipunktregler mit Hyst erese (Abb . 2.72). Als Regelstrecke sei ein Integrator mit einem nachfolgend en Verzogerungsglied beliebiger Ordnung angenommen. Solan ge sich die Regelabweichung e und damit die Differenz w - y auBerhalb des Intervalles [-c, c] befinden, ist auch u =I- O. Da dam it die Einga ngsgrofie des Integrators von Null verschieden ist , verandert sich seine Ausgangsgrofle y' und mit ihr auch y . Erst fiir u = 0 bleibt der Integrator auf dem erreic hte n Wert stehen, und das System kann zur Ruhe kommen. u = 0 ist ab er gleichbedeutend damit , dass sich die Regelabweichun g e = w - y innerhalb des Int ervalles [-c,c] befindet. Das Syst em erreicht also gera de dann seinen Ruhezust and, wenn sich die Ausgan gsgrofle y in einem Toleran zbereich [-c, e] urn den Sollwert w befindet . Dies ist ein fiir viele praktische Anwendungen ausreichendes Er gebnis. Stationare Gen auigkeit (d .h. w = y) wird allerdings nicht erzielt . Zu beachten ist , dass ein Dreipunktregler nur mit nachgeschaltet em Integra tor sinnvoll ist , wie dies in Abb . 2.72 auch skizziert wurde. Damit das Syst em namlich t atsachlich zur Ruhe kommen kann , muss am Ein gang des hint eren Streckent eiles die Gro Be y' einen Wert annehmen, fiir den die Regelgrofe y am Ausgang im Toleranzbereich [- c, c] von w liegt . Ein solcher Wert fiir y' kann aber yom Dreipunktregler selbst , der nur drei verschieden e Ausgan gswerte kennt, in den meist en Fallen gar nicht erzeugt werd en . Mit ei-
174
2. Regelungsteehnisehe Grundlagen
Abb. 2.12. Dreipunktglied ohne und mit Hysterese nem Dreipunktregler ohne naehgesehalteten Integrator wtirde der Regelkreis genauso in eine stationare Schwingung tibergehen wie mit einem Zweipunktregler. Dagegen kann mit Hilfe des Integrators wegen seines kontinuierlichen Ausgangsgrofenbereiches genau der passende Wert ftir y' bereitgestellt werden. Dies heiBt aber nieht , dass der in Abb . 2.72 gezeigte Kreis in jedem Fall zur Ruhe kommt . Wenn namlich die Integrationszeit sehr kurz im Verhaltnis zu den nachfolgenden Streckenzeitkonstanten ist , wird die Ausgangsgrofe y dem Integrator-Ausgang y' nieht schnell genug folgen konnen . Der Integrator durchlauft dann den richtigen Wertebereich, d.h. die Werte, die am Streekenausgang einen im Toleranzbereich liegenden Wert von y hervorrufen wurden, wah rend die Ausgangsgrofe y aber noeh auBerhalb des Toleranzbereiches von w liegt. Wenn sie diesen dann endlieh erreicht, hat sieh y' schon wieder aus dem richtigen Wertebereich entfernt. y wird dem neuen Wert von y' folgen und daher den Toleranzbereich wieder verlassen . Bei ungiinstig gewiihlten Parametern entstehen also auch hier Schwingungen, die nicht abklingen. Fiir die Kombination aus Dreipunkt-Regler und Integrator spricht aber, dass ein Integrator bei technischen Systemen relativ haufig am Anfang der Strecke vorkommt , so dass ftir diese Kombination nicht extra ein Integrator in die Strecke eingefUgt werden muss . Ein Beispiel ist die Druckregelung in einem Kessel mit einem Motorventil, das den Ablauf aus diesem Kessel regelt . Das SchlieBen des Ventils hat also einen Dru ckanstieg im Kessel zur Folge, und das Offnen einen Druckabfall. Der Ventilmotor wird tiber einen Wahlschalter mit den drei Moglichkeiten auf, zu und stop angesteuert. Bei auf dreht sich der Motor in die eine Richtung und der Ventil-Offnungsquerschnitt vergrofert sich, bei zu erfolgt eine Drehung in die andere Richtung und der Querschnitt verkleinert sich. Der Wahlschalter bildet demnach das Dreipunkt-Glied, das Ubertragungsvcrhaltcn zum Ventiloffnungsquerschnitt lasst sich durch einen Integrator beschreiben, und das dynamische Verhalten des Kessels durch das Verzogerungsglied hoherer Ordnung. Vorzeitiges Umschalten und Sliding Mode. Wie die obigen Beispiele gezeigt haben , fuhrt ein System, das einen Zweipunktregler enthalt, immer
2.8 Nichtlineare Systeme
175
Schwingungen ails. Enthalt der Zweipunktregler Hysterese, kann das System durch das verzogerte Umschalten sogar instabil werden. Die Uberlegung liegt deshalb nahe , durch vorzeitiges Umschalten das Systemverhalten zu verb essern. Die Umschaltgerade eines idealen Zweipunktgliedes miisste also in der oberen Halft e der Zust ands ebene nach links und in der unt eren Halft e nach rechts verschoben werden. A.hnliche Auswirkungen ha t auch eine Verdrehung der Schaltgeraden in posit iver Richtung. Diese Verdr ehun g lasst sich fur das System in Abb . 2.66 bzw. 2.67 beispielsweise erzielen, wenn man die Gleichung e = 0 bzw. l = w ftir die Schalt gerade in der Zustandsebene dur ch l = w - kv mit k > 0 ersetzt. Fur die Stellgrofe folgt die Definitionsgleichung: 0 < w - kv-l u= { 1 (2.228) - 1 0 > w - kv -l Dieses Verh alten lasst sich offenbar erzielen, wenn man als Eingangsgrofe des Zweipunktgliedes statt e bzw. w -l gerade w - kv -l wahlt. Man erhalt dann die in Abb . 2.73 gezeichnete Struktur mit einer zusatzlichen Riickfiihrung. Anhand der Zust and skurve ist deutlich zu sehen, dass sich das Stabilitatsverhalten des Syst ems verb essert hat. Die Amplituden der Schwingung nehmen immer weiter ab, bis schlieBlich der Sollwert w = l erreicht ist . v
t=O
Abb. 2.73. Zweipunktregler mit zusatzlicher Rlickfiihrung Betrachtet man das Einschwingverhalte n aber etwas genauer , so stellt man fest , dass das System nicht ganz so ideal ist , wie es auf den ersten Blick erscheint (Abb. 2.74). Die Zust and skurve nah ert sich beispielsweise irgendwann von rechts mit u = -1 der geneigten Schaltgeraden. Bei Errei chen der Schaltgerad en wird auf u = 1 umgeschaltet . Der Systemzustand sollte sich jetzt eigent lich nach links von der Schaltgeraden ent fernen. Da die Neigung der Zustandskurve aber grofier ist als die Neigung der Schaltgeraden , ent fernt sich das System nach rechts . Da in diesem Bereich jedoch die Bedingung fur u = - 1 gilt , wird sofort wieder umgeschalt et , und das System nahert sich wiederum der Schalt geraden. Auf diese Art und Weise gleitet das System bei einer t heoretisc h unendlich hohen Umscha lt frequenz in den Endzust and hinein. Ein solches Verhalt en wird als sliding mode bezeichnet . Eine unendlich hohe Umschalt frequenz kann es dabei in der Realit iit naturlich nicht geben,
176
2. Regelungstechnische Grundlagen
weshalb die vorangegangene Erkl arung auch eher als Erkl iirungsans at z denn als Beweis zu verstehen ist. Dennoch ist bei einer solchen Anord nun g in der Tat eine auBerordent lich hohe Schaltfrequenz kur z vor Erreichen des Sollwertes zu beobachten. Ein e exakte Herleitung fur einen Sliding Mode-RegIer findet sich in Kapitel 2.8.10 . Bei hyst eresebehafteten Zweipunktreglern weicht das Syste mverhalten durch die jeweils verzogerten Umschaltungen zwar etwas vom hier beschriebenen Idealzustand ab , ist im Prinzip aber das gleiche. Die Verwendung eines Dreipunktreglers bringt den Vort eil mit sich, dass der RegIer abschaltet , sobal d sich die Ausgangsgrofse ausreichend nahe am Sol1wert befindet. So konnen die hochfrequent en Umschaltvorgiinge in der Endphase vermieden werden. v
: l=w Abb. 2.14. Sliding mode mit einem schaltenden Ubert ragungsglied Zeitoptimale Regelung. Bisher war es immer so, dass ein Syst em mit einem scha lte nden Ubertragungsglied bei Vorgab e eines neuen Sol1wertes zunachst tiber das Ziel hinausgeschossen ist . Er st dann naherte es sich nach mehreren Umschaltv orga ngen - wenn iiberhaup t - dem gewtinschte n Endzustand. Dieses Verh alten soll fiir einen dopp elt en Integrator , d.h . einen beschleunigte n Korp er kur z ana lysiert werd en. Der Anfangszustand sei (I, v) = (0, 0), und der Endzust and sei (w, 0). Urn den Endzustand zu erreichen, muss der Korp er zunachst beschleunigt werden. Ein HinausschieBen tiber das Ziel bedeut et demn ach, dass die anfangliche Beschleunigun gsph ase zu lange gedauert hat und es nicht mehr moglich war, den Korp er bis zum Erreichen des Zielpunktes abzubremsen. Ein verb essertes Regelverh alten ergibt sich dernnach auf jeden Fall, wenn man rechtz eitig mit dem Abbremsen beginnt. Und ein zeitoptimales Verhalten liegt vor, wenn der Korp er so lange wie moglich beschleuni gt und dann im letztrnoglichen Augenblick mit dem Abbremsen begonnen wird. Ein Blick auf die Zust and sebene zeigt , welches Vorgehen dazu notwendig ist (Abb. 2.75). Zunachst wird eine Schaltkurve berechnet. Dies ist die Zustandskurve , auf der das System fur v > 0 bei maxim al moglicher negativer Beschleuni gung exakt in den Zielpunkt iiberfilhrt wird (bzw. ftir v < 0 bei maxima l moglicher positiver Beschleunigung). Befindet sich der Systemzust and unterhalb dieser Schaltkurve (P unkt 1), so kann das System zunachst noch so lange positiv beschleunigt werden, bis die Schaltkurve erre icht wird . Dann wird au f maxim al mogliche negati ve Beschleuni gung umgeschalt et , und das Syst em bewegt sich auf der Scha lt kurve exa kt in den Zielpunk t. Liegt der Sy-
2.8 Nichtlineare Systeme
177
stemzustand dagegen oberhalb der Schaltkurve (Punkt 2), so bedeutet dies, dass das System nicht mehr so abgebremst werden kann, dass der Zielpunkt noch erreicht wird. Stattdessen befindet sich das System nach dem Abbremsen im Zustand 3. Urn von dort aus in den Zielzustand zu gelangen, ist es zunachst weiterhin in negativer Richtung zu beschleunigen, bis der untere Ast der Schaltkurve erreicht wird . Von dort aus kann es dann mit maxi maier positiver Beschleunigung in den Zielzustand iiberfiihrt werden. ~S chaltkurve
v
I
-:
2
Abb. 2.75. Zeitoptimaler Verstellvorgang
Eine Regelungsstruktur, die solche Verstellvorgange ermoglicht, wird zeitoptimale Regelung genannt und ist in Abb . 2.76 gezeichnet. Im Regier 1 wird zunachst der Wert der Schaltkurve us fur die jeweilige Regeldifferenz e berechnet. Da l in diese Regeldifferenz mit negativem Vorzeichen eingeht, erscheint die Schaltkurve im zugehorigen Block geradc seitenverkehrt. Dies ist auch anschaulich leicht zu erklaren. Beispielsweise befindet man sich fiir eine positive Regeldifferenz, wenn also der Sollwert groBer als der lstwert ist, in Abb . 2.75 links vorn Zielpunkt. Daher muss in diesem Fall der zugehorige Wert der Schaltkurve positiv sein , was die im Regier 1 eingezeichnete Schaltkurve auch widerspiegelt. Der so berechnete Wert der Schaltkurve vs wird dann mit der tatsachlichen Geschwindigkeit v verglichen. Ist die Differenz positiv, so befindet sich das System unterhalb der Schaltkurve. Entsprechend erzeugt der Zweipunktregler 2 die maximal mogliche positive Stellgrofe. Sobald die Differenz us - v kleiner als Null wird , schaltet der Regier auf die negative Stellgrofe urn, und das System bewegt sich auf der Schaltkurve in den Zielpunkt. Im Zielpunkt ist das Verhalten dann allerdings undefiniert. Da der Regier 2 immer eine von Null verschiedene Ausgangsgrofie liefert , kann das System nicht zur Ruhe kommen. Es wird mit theoretisch unendlich hoher Schaltfrequenz urn den Zielpunkt herum schwingen . Hier sollte die Moglichkeit einer Abschaltung vorgesehen werden , beispielsweise, indem man das Zweipunktglied durch cin Dreipunktglied ersetzt. Anhand der Variationsrechnung Iasst sich beweisen , dass die durch diese Reglerstruktur erzeugten Regelvorgange immer zeitoptimale Regelvorgange
178 w
2. Regelungstechnische Grundlagen e
Abb. 2.76. Zeitoptimale Regelung sind . Dies ist auch ansehaulieh sofort klar , denn die St reeke wird zunachst , abhangig vorn Anfangszust and , mit maximaier positiver oder negative r Kraft besehleunigt und dann im let ztmo glichen Augenbliek mit der entgege ngeriehteten Kraft abgebremst. Ganz offensiehtlieh kann man ein solches Verhalt en nur mit einem sehaltenden Regier erzeugen. 1st der Regier hysteresebehafte t , so kann das System wegen der verspateten Umsehaltung nieht exakt auf der Sehaltkurve in den Zielpu nkt lau fen. St attdessen bewegt es sieh neben der Sehaltkurve und sehieBt deshalb etwas tiber das Ziel hinaus. In der Umgebung des Zielpunkt es stellen sieh dann Sehwingun gen mit kleiner Ampli tude und sehr hoher Frequenz ein. In der Praxis ergibt sieh auBerdem noeh das Problem, dass man die Streeke zur Bereehnung der Sehaltkurve genau kenn en muss , was meist ens nieht gegeben ist . Aber aueh bei nicht exakt bereehnete r Sehaltkurve ergibt sieh noeh ein reeht gutes Regelverh alt en. Ein e zeitoptimale Regelung ist aueh fur Systeme hoherer Ordnung moglieh. In einem Syst em dri tter Ordnung ist beispielsweise die Sehaltkurve dureh eine Sehalt ebene im Zust and sraum zu ersetzc n. Dur eh eine maxim ale positi ve oder negat ive Ausgangsgrolle 1L des Reglers wird zunachst diese Sehaltebene erre ieht. Dort muss das Vorzeiehen von 1L geweehselt werden. Das Syst em bewegt sieh dann im Zust and sraum auf der Sehaltebcnc bis zu einer Sehaltkur ve, die in der Ebene verlauft . Dart wird dann erne ut das Vorzeiehen von 1L geweehselt , und das Syst em strebt in den Endzustand . Es lasst sieh zeigen, dass fur cin Syst em der Ordnung n, das keine Pole mit positivem Realteil aufweist , gena u n - 1 Varzeiehenweehsel der Stellgrolle fur einen Regelvorgang erforderlieh sind. Pulsweitenmodulation. Zum Absehluss soll auf das fiir die Praxis auBerst wiehti ge Verfahr en der Pulsweitenmodul ati on (PWM) eingegangen werd en. Der Naehtei l sehalte nder Ubert ragungsglieder best eht darin , dass ihre Ausgangsgrofie nur wenige, diskrete Werte annehmen kan n. Damit sind sie zunachst als Stellglieder fur eine hoehwerti ge Regelung nicht zu gebra uehen. And ererseit s ist man wegen ihres geringen Preises aber trotzdem daran int eressiert , sic innerhalb einer Regelung einzusetzen. Hier stellt die P WM ein geeignetes Verfahren dar , urn einem Sehalt er dureh intelligente Anst euerung ein quasi-kont inuierliehes Verhalten aufzupragen. Bei der PWM wird ein sehalt end es Ubertragun gsglied naeh einem sp eziellen Sehaltmust er hoehfrequent umgesehaltet , so dass sieh an seinem Ausgang eine hoehfrequente Reeht eeksehwingung mit variabler Pulsweit e einste llt . Gibt man diese Reeht eeksehwin-
2.8 Nichtlineare Systeme
179
gung als Stellgrofe auf eine Tiefpassstrecke, so werden die hochfrequenten Anteile aus dem Signal herausgefiltert. Die Ausgangsgrofe der Strecke ist demnach nur vom Mittelwert der Rechteckschwingung abhan gig. Damit kann man den Mittelwert nah erungsweise als Stellgrofe ansehen. Da dieser Mittelwert andererseit s aber in Abh angigkeit vom Schaltmuster st etig veranderlich ist , ist es nur eine Frage des Schaltmusters, urn dem schaltenden Ubertragungsglied die Eigenschaften eines linearen Reglers aufzupriigen. Ein sehr anschauli ches Verfahren, ein solches Schaltmuster und damit einen quasilinearen RegIer zu erzeugen, bildet die Linearisierung durch eine Riickfiihrung (Abb. 2.77). DeI' aus Zweipunktglied und Riickflihrfunktion G R (s) bestehend e, int erne Kreis wiI'd unter der Voraussetzung, dass er stabil ist , Schwingungen ausfuhren, Und zwar fuhrt u eine Recht eckschwingung aus, und YR schwingt urn die Eingangsgrofie e. Je kleiner die Hysteresebreite des Zweipunktgliedes ist , desto hochfrequenter ist die Rechteckschwingung und desto weniger entfernt sich auch YR von e. Wenn weiterhin die Strecke G(s) Tiefpasseigenschaften besitzt , wiI'd nur der Mittelwert der Recht eckschwingung am Ausgang Y wirksam. Das gleiche gilt auch fur die Auswirkungen c1er Stellgrofe auf die int ern e Riickkopplungsgrofle YR. Man kann sich da her auf eine Betrachtung der Mittelwer te beschranken, Es gilt YR (S) = GR(s)u(s) und bei ausreichend kleiner Hysteresebr eite au ch e ~ fiR . Darau s folgt 1
u(s) ~ GR(s)e(s)
(2.229)
d.h. hinsichtlich der Mittelwerte ents pricht das gesamte Ubertragungsverh alten des Reglers mit Riickflihrung in etwa dem Kehrwert der int ern en Ubertragungsfunktion. J e nach Wahl dieser Funktion lassen sich so niiherungsweise die verschiedensten linearen Regier realisieren. Regier
1--- - - - - - - - - - - - - --- - - - -,
w
e
y
:,
,
y
, , , , ,,, , , , , '- -
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
_ I
Abb. 2.77. Lineari sierung durch int erne Rtickfiihrung
Neben der Linearisierung durch eine Riickflihrung gibt es noeh viele ander e Verfahren zur Pulsweitenmodulation. Haufig werden optirnierte Schaltmuster in Tabellen abgel egt und c1ann je nach zu erzeugendem Mittelwert u ausgelesen (vgl. [108]). Die gesamte Pulsweit enrnodulation wird dabei von
180
2. Regelungstechnische Grundlagen
einem einzigen Ie Iibern ommen. Insbesond ere im Bereich der elektrischen Antriebst echnik ist die Pulsweit enm odulation von groBer Bedeutung. Damit ist die Dar st ellung der verschiedenen Aspekt e schalt ender Ubertragun gsglieder abgeschlossen . Anh and dieser Ubertragungsglieder sollten die wichtigst en nichtlinearen Effekt e anschaulich erlautert und ein gewisses Grundverst andnis ftir die Problematik nichtlinearer Regelkreise vermitt elt werden. Von zentraler Bedeutung fur den Regelungstechniker ist da bei die Stabili tat sfrage. Urn ein nichtlin eares System hinsichtli ch seiner Stabilit at analysieren zu konnen, ist es ab er erforderlich, dass man von der bisher praktizierten , eher int uitive n Sichtweise zu einer exakte n Formuli erung des Problems iibergeht . Die folgenden Definition en und Satze sind dabei nur fur zeitkonti nuierliche Systeme angegeben, gelten ab er in ana loger Weise auch fur zeitdi skrete Syst eme. AnschlieBend werden dann die fur nichtlinear e Syst eme wichtigst en Stabilitatskriterien , die au ch auf Syst eme mit Fuzzy-Reglern anwendbar sind, vorgestellt . 2.8.4 Definition der Stabilitiit bei nichtlinearen Systemen Ruhelage. Urn den Begriff der Stabilitat fur nichtlineare Systeme exakt definieren zu konnen , muss zunachst auf den Begriff der Ruhelage eingegangen werd en (vgl. [45, 46, 54]): Definition 2.20 Ein dynamisches Sys tem befindet sich fur einen gegebenen konstanten Eingangsvektor Uo genau dann in der durch den Zustands vektor X R bezeichneten Ruh elage, wenn sich die Zustand sgrojlen nicht mehr veriindern, d.h, wenn gilt (2.230)
Dab ei ist die Festlegun g eines konstanten Ein gangsvektors notwendig, da das Syst em sonst offensicht lich nie zur Ruh e kommen konnte. Bei einem linearen Syst em ergebe n sich die Ru helagen aus
o = X R = AXR + Bu.,
(2.231)
Fur IA I =I 0 ergibt sich genau eine Losun g bzw. Ruh elage XR = -A-1BuO . And ernfalls treten keine oder unendli ch viele Losun gen auf. Ein Beispiel ist ein einfacher Int egrator, der sich durch die Zustandsgleichun g
x = Ox + 1u
(2.232)
darstellen lasst . Offenbar ist IAI = O. Fur u =I 0 gibt es keine Ruh elage, wahr end die Gleichun g fiir u = 0 unendli ch viele Losun gen besitz t. Dieses Ergebni s ist einsichtig, wenn man sich klarm acht , dass ein Int egrator fiir eine
2.8 Nichtlineare Systeme
181
von Null verschiedene Eingangsgrobe immer weiter auf- oder abintegriert, wahrend er fur u = 0 an der Stelle stehenbleibt, wo er sich gerade befindet. Wahrend ein lineares System also entweder keine, eine oder unendlich viele Ruhelagen besitzt, konnen bei einem nichtlinearen System auch endlich viele, und zwar mehr als eine Ruhelage auftreten. Ein Beispiel ist das Pen del aus Abb . 2.10. Falls der Korper mittels einer starren Stange aufgehangt ist, existieren offensichtlich Ruhelagen fur a = 0 und a = tt . Stabilitatsdefinition nach Ljapunov. Dabei existiert fur beide Ruhelagen des Pendels ein wesentlicher qualitativer Unterschied, der mit Hilfe der Stabilitatsdefinition nach Ljapunov [112] prazise angegeben werden kann: Definition 2.21 Eine Ruhelage XR heijJt genau dann stabil fur eine gegebene konstante EingangsgrojJe uo, wenn zu jedem E > 0 ein 8 > 0 existiert, so dass fur alle Ix(O) - xRI < 8 die Bedingung Ix(t) - xRI < Emit t 2 0 erjiill: ist.
Eine Ruhelage heiBt also genau dann stabil, wenn der Zustand x(t) des Systems ftir aIle t > 0 in einer beliebig engen Umgebung (E) der Ruhelage bleibt, sofern der Anfangszustand ausreichend nahe (8) bei der Ruhelage liegt (Abb. 2.78).
,, , , , , , ,, , ,,
,, , , ,
,
, , ,,
Abb. 2.78. Zur Stabilitatsdefinition nach Ljapunov
Laut dieser Definition ist die obere Ruhelage des Pendels instabil, wahrend die untere Ruhelage stabil ist. Lenkt man beispielsweise das Pendel etwas aus der unteren Ruhelage aus und betrachtet diese Stellung als Startzustand, so wird das Pendel zwar schwingen, sich aber nie weiter von der Ruhelage entfernen als beim Startzustand. Hier existiert also zu jeder beliebigen s-Urngebung, die fur t > 0 nicht mehr verlassen werden solI, gerade ein Abstand 8 = E, in dem der Anfangszustand liegen muss, urn diese Bedingung einzuhalten. Dies ist bei der oberen Ruhelage offenbar nicht der Fall. Angenommen, es ist gefordert, dass eine e-Umgebung beispielsweise von einigen Winkelgraden urn die obere Ruhelage nicht rnehr verlassen werden darf. Der einzige Anfangszustand, fiir den diese Bedingung erfiillt ist , ist die Ruhelage seIber. Falls der Anfangszustand nur ganz leicht von der Ruhelage abweicht, kippt
182
2. Regelungstechnische Grundlagen
das Pendel nach unt en , und die geforderte Umgebung wird verlassen. Andererseits ist aber in der Definition gefordert, dass man zu jedem beliebigen c eine J-Umgebung fur den St artzustand mit J > 0 angeben konnen muss, damit die Ruh elage stabil ist . Da dies offenbar fiir die obere Ru helage nicht erfullt wird , ist sie inst abil. Ein anderes anschauliches Beispiel ist das ideale Zweipunktgli ed mit doppelt em Int egrat or (Abb . 2.67). Das System fiihrt um die Ruh elage (l ,v) = (w,O) eine Dauerschwingung aus, deren Amplitude vom Anfangszust and abha ngig ist. Verlangt man hier, dass das System ftir t > 0 innerh alb einer ganz best immt en s-Umgebung um die Ruh elage bleibt , so muss man nur den Anfan gszust and ents prechend wahlen, Daher ist dieses Syst em stabil im Sinne von Ljapunov. Man muss sich aber dartib er im klar en sein, dass die Stabilitat nach Ljapunov nur gewahrleist et , dass eine vorgegebene Umgebung um die Ruh elage nicht mehr verlassen wird. Dies ist in vielen Anwendungsfallen jedoch nicht ausreichend . Dort wird daruber hinaus auch verlangt , dass eine vorgegebene Ruh elage frilher oder spater tatsachlich erreicht wird. Diese Forderung fiihrt auf den Begriff der asymptotisclJen S tabilitat : Definition 2.22 Ein e Ruhelage XR heiflt asymptotisch stabil, wenn sie fur eine konstante Anregung "0 stabil ist un d auflerdem eine (3- Umgebung besitzt mit lim x (t) = XR fur Ix(O) - xRI < (3, d.h. eine Umgebung, aus der aile t -wcc Zustiind e in die Ruhelag e streben. Die Gesam theit aller Punkte des Zustandsraumes, aus denen die Traj ektorien gegen X R streben, heiflt Einz ugsbereiclJ der RulJelage . Umfas st der Einzugsbereich aile Anfangszustiinde, die unter gegebenen, technischen Beschriink ungen auftre ten kon nen, so heifJt die Ruhelage asymptotisch stabil im Groflen. Umf asst der Einzugsbereich den gesamten Zustandsraum, so heiflt die Ruhelage global asymp totisclJ sta bil . Als anschauliches Beispiel kann wieder das Pendel dienen, und zwar seine unt ere Ruh elage. Wenn ein ideales Pendel vorliegt und als Anfangszust and eine Auslenkung vorliegt , so schwingt das Pendel immer weit er und kommt nie zur Ruh e. Die Ruh elage ist stabil nach Ljapunov, aber nicht asympt otisch st abil . Beriicksichtigt man dagegen beispielsweise den Luftwid erst and , so nimmt die Amplitude der Schwingung immer weiter ab und die Ruh elage wird - wenn auch theoretisc h nach unendlich langer Zeit - erreicht. Damit ist die Ruh elage asymptot isch stabil. Globale asympt ot ische Stab ilitat liegt aber nicht vor, denn es exist iert gena u ein Punkt im Zust andsraum , aus dem keine Traj ekto rie in die unt ere Ruh elage verlauft , und zwar die obere Ruh elage. Setzt man jedoch vorau s, dass das Pendel an einer Decke aufgehangt ist und die obere Ruh elage damit sowieso nie erreicht werden kann , so kann man das System als asympt ot isch st abil im Gra Ben bezeichnen. Den Ljapunovschen St abilit iit sbegriff kann man auch auf zeitvariante Syste me anwenden. Da sich hier das System aber mit der Zeit verandern kann , muss die obige Definition nicht nur fur einen einzigen Anfangszeitpunkt t = 0
2.8 Nichtlineare Systeme
183
sond ern fur aile beliebigen Anfangszeitpunkte erfiillt sein. Damit ist 8 moglicherweise nicht nur eine Funktion von e, sondern auch von der Zeit t. Falls 8 ab er bei einem zeitvarianten System t rotz der Zeitvari anz weit erhin nur eine Funktion von e ist , spricht man von gleichmaBiger St abilitat. Stabilitat von Trajektorien. Gegenstand der bisherigen Stabilitatsbet ra cht ungen waren die Ruhelagen. Die vorgest ellten Stabilitatsb egriffe lassen sich aber auch auf Traj ektorien anwenden. In der jeweiligen Definition ist dann lediglich die Ruh elage durch eine Traj ekt orie zu ersetzen. Eb enso wie eine Ruh elage kann auch eine Traj ektorie inst abil , stabil oder asymptot isch stabil sein. Als Beispiel sei eine Schwingun g betrachtet , wie sie bei einem doppelten Int egrator mit idealem Zweipunktglied auftritt (Abb. 2.67). Bei dieser Schwingung hangen Amplitude und Frequenz, d.h. der Verlauf der Schwingun g, vom jeweiligen Anfangszustand ab o Ein veranderter Anfangszustand fuhrt auf einen and eren Zyklus. Liegt der verand ert e Anfan gszust and beispielsweise et was recht s vom ursprtin glichen Anfangszust and in der Zustandsebene, so bedeutet dies eine kleinere Anfan gsauslenkung von der Ruh elage und daher auch eine kleinere Schwingun gsamplitude. Es ergibt sich eine ahnliche Traj ektorie wie im ursprunglichen Fall, allerdings naher zur Ruh elage ais die crste Trajektorie. Offensichtlich lasst sich zu jeder e-Umgebung urn die ursprimgliche Tr aj ektorie auch eine 8-Umgebung angeben, in der ein Anfangszu stand liegen muss, dami t die dar aus resulti erend e Tr ajektorie in der z-Umgebung der ursprtinglichen Schwingungstraj ektorie bleibt. Dies bedeutet ab er gerade St abilitat der urspriinglichen Schwingung im Ljapunovschen Sinn e. Eine solche Schwingung bezcichnet man als Dauerschwingun g. Asymptotis che St abilitat liegt abe r nicht vor , denn die aus einem verand erten Anfangszustand resultierend e Schwingun g wird nie in die urspriinglich vorgegebe ne Schwingung ubergehen. Aber nur wenn dies gilt, kann man von asymptotischer Stabilitat sprechen. Ein Beispiel fiir diesen Fallliegt beim Zweipunktglied mit Hyst erese und IT}-Glied vor (Abb. 2.71). Aus jedem beliebigen Anfangszust and geht die Traj ekt orie fruher oder spater in die Traj ektori e der gegebenen Schwingun g tiber . Eine solche Schwingun g mit asymptotischem Einschwingverhalten bezeichnet man als Grenzzyklu s. Damit ist der Unt erschied zwischen Dauerschwingung und Grenzzyklus mit Hilfe des Ljapunovschen Stabilitat sbegriffs noch einm al prazisiert word en. Dab ei rniissen Grenzzyklen nicht unbedin gt asy mptotisch st abil, sondern konnen auch instabil sein. Ein instabiler Grenzzyklu s ist dadurch definiert, dass sich die von einem dem Grenzzyklus benachbarten Anfangszust and ausgehende Traj ektori e von der Traj ektorie des Grenzzyklus entfernt. Ein Grenzzyklus kann sogar stabil und instabil zugleich sein. Bei einem System zweiter Ordnung unterteilt der Zyklus die Zust and sebene in zwei Gebiete, ein inneres und ein auferes. Nun kann es vorkommen , dass aile Traj ektorien im Innengebiet zum Grenzzyklus hinstreben, wahr end aile Trajektorien auBerhalb von ihm wegstreben. Ein solcher Grenzzyklu s ist dann nach innen stabil
184
2. Regelungstechnische Grundlagen
und nach auBen instabil. Dies ist allerd ings nur eine rein theoret ische Konst ru kt ion, denn auch ein nur einseitig inst abil er Grenzzyklu s kann nicht von lange r Lebensdauer sein. Einc kleine Storung reicht aus, damit das System den Zyklus nach auBen verlasst und nie wieder zu ihm zunickkehr t. Denn och sollte man sich tiber die Moglichkeit solcher Grenzzyklen mit unterschiedlichem Stabilit ats verhalte n im klaren sein, da sie beim spater bchandelten Verfahren der Beschreibungsfunktion noch einmal aufta uchen werden. Zu beachten ist , das s, urn die St abili tat einer Schwingun g zu untersuchen, der Ljapunovsche Stabilitatsbegriff nur auf die zugehorigen Trajektorien im Zustandsr aum angewendet wurde. Wilrde man den Verla uf der Zustandsgrofen tiber die Zeit betrac hte n, ergabe sich ein ganz ande res Bild. Als Beispiel soil wieder das Pend el dienen . Unter Vern achlassigun g des Luftwiderst andes fuhrt es eine yom Anfangszustand abhangige Dauerschwingung aus. Auf eine bestimmte Anfan gsausl enkung folgt eine Dauerschwingung mit einer ganz bestimmten Frequ enz und Amplitude, wahrend auf eine ctwas grofere Anfangsauslenkung eine Dau erschwingung mit etwas kleinerer Frequenz und etwas groferer Amplitude folgt. Zeichnet man die Traj ektorien der beiden Schwingungen , so werden sie eine ahnliche Form aufweisen und in unmi ttelb arer Nachb arschaft zueinander verlaufen, wobei die Traj ektorie der Schwing ung mit der kleineren Ampli tude innerhalb der anderen Trajekt orie verlauft , Daraus folgt die einfache St abili tat der Schwingun g nach Ljapunov. Zcichnet man ab er den Veriauf der Positi on des Pend els als Funk tion der Zeit fur beide Faile auf, so werden sich die Kurven wegen der unt erschiedlichen Frequenzen der Schwingun gen immer weit er ausein an der bewegen. Wii rde man die Stabilitat anha nd dieser Ku rven definieren , ware das System nicht stabil. In [124] und [151] wird deshalb eine Schwingung nur dann als asymptotisch stabil bezeichnet , wenn die Ljapunovsche Stabilitatsdefinit ion auf den zeitli chen Verlauf der Zust andsgrofen zutrifft. Wenn dagegen nur St abil it at hinsichtli ch der Trajektorien vorliegt, so wird von or bitaler Stab ilitiit gesprochen. In der Praxis ist dieser Unterschied allerdings nicht relevant , weil im allgemeinen nicht der explizite zeitli che Verlauf der Zustand sgroflen sondern nur die prinzipielle Form einer Schwingung interessiert . Deshalb soil hier die St ab ilitat einer Schwingun g weit erhin anhand der Trajektorien beurteilt werden. Stabilitat von linearen Systemen. Nachdem nun die Ljapunovsche Stabilit atsdefinition ftir nichtlin eare Systeme ausfiihrlich erorte rt wurde, soil noch einma l die Verbindung zu den linearen Syst emen hergestellt werden . Ein linear es Syst em ist nach Def. 2.16 gena u dann asymptotisch stabil, wenn seine Zust andsgrofen ohne aufere Anr egun g aus jedem beliebigen Anfangszustand gegen Null st reben. Die Frage ist nun , wie man diese Definition mit Def. 2.21 und 2.22 in Einklang br ingt . Zunachst fallt auf, dass in Def. 2.16 von der St abili tat des Systems die Rede ist , wahrend sich 2.21 und 2.22 nur auf die Stabilitat einer einzigen
2.8 Nichtlineare Systeme
185
Ruhelage beziehen. Zur Erklarung sei ein lineares System mit konstanter Anregung Uo betrachtet: x = Ax-i-Bu., (2.233) Eine sich bei dieser Anregung einstellende Ruhelage tialgleichung
XR
erftillt die Differen(2.234)
Mit L1x = x -
XR
ergibt sich nach Subtraktion der beiden Gleichungen L1x = AL1x
(2.235)
Nun gilt aber doch, dass ftir die Stabilitatsanalyse der Ruhelage ausschlieBlich der Abstand des Zustandsvektors zur Ruhelage relevant ist. Die Untersuchung kann damit anhand von Gl. (2.235) durchgeftihrt werden. In dieser Gleichung tauchen aber sowohl die Anregung als auch die Ruhelage selbst gar nicht mehr auf. Das Ergebnis, das man erhalt, wird daher fur alle Ruhelagen und aIle Anregungen das gleiche sein, d .h. wenn eine Ruhelage fiir eine Anregung asymptotisch stabil ist, so sind alle Ruhelagen ftir alle Anregungen asymptotisch stabil. Man spricht aus dem Grund bei einem linearen System nicht von der Stabilitiit einer Ruhelage, sondern von der Stabilitiit des Systems. Dies ist ein ganz wesentlicher Unterschied zu einem nichtlinearen System, bei dem verschiedene Ruhelagen ein vollig unterschiedliches Stabilitatsverhalten aufweisen konnen . Wenn daher eine einzige Ruhelage eines linearen Systems fur eine Anregung asymptotisch stabil nach Definition 2.21 und 2.22 ist, so gilt dies fur aIle Ruhelagen und insbesondere auch fiir die Ruhelage x = 0 und u = o. Damit ist das System aber auch nach Definition 2.16 asymptotisch stabil. Analog gilt die Umkehrung fur Instabilitat. Aus DeL 2.21 und 2.22 folgt fiir lineare Systeme also Def. 2.16. Fiir die Herleitung der Aquivalenz der Definitionen ist nun noch zu zeigen, dass bei linearen Systemen aus DeL 2.16 auch die beiden anderen Definitionen folgen. Wegen des gleichen Stabilitatsverhaltens aller Ruhelagen bei einem linearen System ist naheliegend, diesen Nachweis fur den einfachsten Fall, namlich fur die Ruhelage x = 0 und u = 0 zu fiihren und das Ergebnis auf das gesamte System zu erweitern. Aus (2.233) ergibt sich wegen u = 0 zunachst (2.236) x=Ax Nun sei vorausgesetzt, dass das System nach Def. 2.16 asymptotisch stabil ist , d .h. seine Zustandsgrofen streben ohne iiuBere Anregung aus jedem beliebigen Anfangszustand gegen Null. Dies ist aber nach Satz 2.17 genau dann der Fall, wenn alle Eigenwerte von A einen negativen Realteil aufweisen. In dem Fall sind aber auch eventuell auftretende Schwingungen abklingend. Demnach lasst sich fiir jede s-Umgebung urn die Ruhelage x = 0, die fur t > 0 nicht verlassen werden solI, eine J-Umgebung angeben, in der der Anfangszustand liegen muss: J = c. Damit ist die Ruhelage nach DeL 2.21 stabil. Und die
186
2. Regelungstechnische Grundlagen
asymptot ische St abilit at nach Def. 2.22 ist gewahrleiste t , weil alle Zust and sgrofe n gegen die Ruhel age Null streben. Auch hier gilt die Umkehrung fur Instabilitat analog. Dartiber hinaus ist die Ruh elage x = 0 und u = 0 global asympto t isch stabil, d .h aus allen Zustand en des Zust andsraum es st reben die Trajekto rien in diese Ruh elage. Als Beweis ist es ausrei chend zu zeigen, dass keine weit ere Ruh elage exist iert . Dies ist ab er der Fall, denn wenn A ausschlieBlich Eigenwerte mit negativem Realt eil aufweist, gilt IAI -I 0, und Gleichung (2.236) kann ftir x = 0 nur die Losung x = 0 besitzen.
Steuerbarkeit und Beobachtbarkeit. Zwei weite re wicht ige Systemeigenschaft en neben der St abilitat sind die Steuer- und Beobachtbarkeit . Wie schon in Kapitel 2.7.2 angesprochen, sollte man vor dem Entwurf der Regelung sicherstellen, ob man auf das System uberhaupt den gewiinschte n Einfluss nehmen kann , d.h . ob Steuerbarkeit vorliegt . Falls ftir die Regelung Zust ands grofen verwendet werd en, muss auch sichergeste llt sein, dass man diese Zust and sgroflen aus den messbaren Ausgangsgroflen Iiberhaup t berechnen kann . Diese Systemeigenschaft ents pricht der Beobachtbarkeit . Zwei Moglichkeit en biet en sich hier fur nichtlin ear e Syst eme an. Die eine ist , das Syst em am Arbeitspunkt zu linearis ieren und auf das lineare Modell die Steuer- und Beobachtbarkeits kriterien linearer Systeme anzuwenden. Hier tritt ab er wieder das Problem auf, dass ein lineares Modell das nichtlin eare Systemverhalt en nur in einem engen Bereich urn den Arbei tspunkt ausr eichend gut approximiert und die Aussagen hinsichtlich Steuer- und Beobachtb arkeit dement sprechend auf einen kleinen Bereich des Zust and sraum es beschrank t sind. Der andere Ansatz ist , die Definitionen und Kriterien fur nichtlineare Syste rne geeignet abzuandern, So gibt es beispielsweise in [172] Definitionen fiir Erreichbarkeit und Untersc heidbarkeit von Zust and en. Hinreichende und leicht handzuhab ende Kriterien entsprechend Sat z 2.13 und 2.15 fur allgemeine nichtlin eare Systeme existieren aber nicht . Nur ftir spezielle Klassen von nichtlin ear en Syst emen wie beispielsweise bilinear e Syst erne existieren so1che Kri terien. Definition der Ruhelage Null. Im weiteren Verlauf wird der Einfachheit halb er immer vorausgeset zt , dass in der betrachteten Ruh elage alle Systemgroflen den Wert Null annehmen. Ist dies nicht der Fall, so muss das System umd efiniert werden. Diese MaBnahme kann man auch so interpretieren, dass man von den tatsachlichen Crofen x zu deren Abweichungen von der Ruh elage Llx = x - X R iibergeht . Der Vektor Llx wird dann als neue Systemgrof e definiert und erfiillt gerade die Forderu ng, dass er in der Ruh elage den Wert Llx = 0 annimmt. Es sei ausdrucklich darauf hingewiesen, dass es sich bei diesem Schritt urn eine exa kte Umdefinit ion des Systems und nicht urn eine Linearisierung am Arb eitspunkt hand elt . Fur ein lineares System ist dieser Ubergang nicht notwendig. Denn da das Systemverhalten von allen Ruh elagen gleich ist, kann man immer von vornherein ausschlieBlich die Ruhelage x = 0 betrachten. Relevant ist diese
2.8 Nichtlineare Systeme
187
Umdefinit ion dah er nur fur nichtlineare Syst eme. Als Beispiel zeigt Abb . 2.79 die dafur erforderlichen Schritte fur einen aus einem linearen und einem nichtlinearen Teil bestehend en Stand ardregelkreis. Der nichtlineare Teil sei dab ei durch eine von e und e abhiingige Funk ti on u = f(e , e) gegeben.
TB BT u
A.y
w
o
A.y
A.e
nichtlinearer Teil Abb. 2 .79. Umformen cines nichtlinearen Standardregelkreises Die zu betrachtende Ruhelage sei durch die Vektoren w , UR , YR und e R = YR chara kterisiert. Der Ubergang von den t atsachlichen GraBen u , Y und e zu ihren Abweichun gen von der Ruhelage .1u,.1y und .1e geschieht nun folgendermaBen : Im ersten Schrit t wird an zwei Stellen des Regelkreises die Orofle Y R subtrahiert. Beide Subt rakti onen heben sich in ihrer Wirkung wegen der negativen Riickkopplung gera de auf, d.h . das Syst em wird durch diese MaBnahm e nicht vera ndert . Im zweiten Schrit t soli die Subtraktion von YR am Ausgan g des linearen Teiles durch die Subt raktion eines Vektors UR am Eingang des linearen Teiles ersetzt werden, wobei U R gerade der zur Ruhelage gehorende Stellgroflenvektor ist . Das Gleichsignal UR kann dabei aus dem Gleichsignal YR mit Hilfe des Zusammenh anges YR = G( s = O)UR berechnet werden . .1u = U - U R kenn zeichnet dann die Abweichung von der Ruhel age. AuBerd em werden die Anregun gsgrofien W und YR vor dem Einga ng des nichtlinearen Teiles zusammengefasst . Insgesamt lasst sich damit ein neues nichtlin eares Ubert ragungsverha lt en W -
_
.1u
.
= fpe , .1e ) = f(.1e + W
d -
YR , dt (.1e
+W
-
YR)) - UR
(2.237)
definieren. Das dadurch ents tandene, neue Gesamt syst em mit seinen Systemgrofe n Lle, .1u und Lly erfullt die Bedin gung , dass alle Syst emgrof en in der
188
2. Regelungstechnische Grundlagen
Ruhelage den Wert Null annehmen. Im Folgenden wird nun immer vorausgesetzt, dass vor der Stabilitatsanalyse eine derartige Umdefinition erfolgt ist. Es wird deshalb immer die Ruhelage Null bei der Anregung Null betrachtet. 2.8.5 Direkte Methode von Ljapunov
Damit kann nun auf die Frage eingegangen werden , wie denn bei einem gegebenen System die Stabilitat einer Ruhelage zu bestimmen ist. Wiirde man streng nach Def. 2.21 und 2.22 vorgehen, so miisste man fur jeden moglichen Anfangszustand die Losung der nichtlinearen Differentialgleichung ftir die zu untersuchende Ruhelage ermitteln. Bei unendlich vielen Anfangszustsnden ist dies offensichtlich nicht moglich, Es sind daher Kriterien oder Methoden erforderlich, die auch ohne aufwandige Rechnungen eine Stabilitatsaussage fur die betreffende Ruhelage zulassen. Fur ein System zweiter Ordnung lasst sich eine Betrachtung in der Zustandsebene durchfuhren, wie dies bei den schaltenden Ubertragungsgliedern bereits gezeigt wurde . Fur Systeme hoherer Ordnung und auch Mehrgrofiensysteme sind dagegen andere Kriterien erforderlich, die im Folgenden vorgestellt werden sollen. Das erste dieser Kriterien stammt von Ljapunov selbst und wird als direkte Methode von Ljapunov bezeichnet. Folgende Idee liegt dem Verfahren zu Grunde: Es wird eine vom Zustandsvektor abhangige, skalare LjapunovFunktion V(x) definiert, die im Nullpunkt den Wert Null haben muss und ansonsten mit zunehmender Entfernung vom Nullpunkt ansteigt. Man kann V auch als eine Art verallgemeinerten Abstand zur Ruhelage auffassen. Abb . 2.80 zeigt als Beispiel die Hohenlinien einer solchen Funktion in der Zustandsebene . Weiterhin hat ein Zustandsvektor und mit ihm die Funktion V entsprechend der Zustandsgleichung des Systems einen bestimmten zeitlichen Verlauf. Wenn man nun zeigen kann, dass die zeitliche Ableitung der Funktion V ftir beliebige Zustandsvektoren x negativ ist, so bedeutet dies doch , dass die Zustandskurve frtiher oder spater aile Hohenlinien von auBen nach innen uberschreitet und der Zustandsvektor damit zwangslaufig gegen Null strebt. Das System ist in dem Fall offenbar asymptotisch stabil.
x
v' Abb. 2.80. Direkte Methode nach Ljapunov
2.8 Nichtlineare Systeme
189
Satz 2.23 Das dyna mische Sy stem x = f (x) besitze die Ruhelage x = O. Es gebe eine in de, Umgebung de, Ruhelag e sam t ihren partiellen Ableitungen ersie r Ordnung stetige Funktion V(x), die dart positiv definit ist , d.h. V (x) > a fu r x =1= 0 und V (x ) = 0 fur x = o. Weiterhin sei die zeitliche A bleitung
v= ~ 8V Xi = ~ 8V Ii ~ 8x · ~8x· i=1
t
i= 1
(2.238)
t
in der Umgebung der R uhelage negativ definit. Dan n ist die Ruh elage asympto tisch stabil und die Umgebung ihr Einzugsbereich. G sei ein Gebiet innerhalb de, Umgebung, in dem V < c gilt (mit c > 0) und dessen Rand durch V = c gebildet unrd. Wenn G dariiber hinaus beschriinkt ist und die Ruh elage enthiilt, so gehort G zum Einzugsbereich de, Ruh elage. Wenn de, Einzugsbereich de, gesamte Zustandsmum ist und dariiber hinaus mit zunehmen der Entfernung von der Ruh elage [x] = + ...+ 00 auch V(x) -. 00 gilt, so ist die Ruhelage global asymptotisch stabil. Falls V negativ semi definit ist (V(x ) :::; 0), so kann nur die einfache Stab ilitiit gewiihrleistet werden. Falls abe, die Punktmenge, auf der V = 0 ist, aujler x = 0 keine an dere Traj ektorie enthiilt, so liegt auch hier asymptotische St abilitiit vor.
Jxi
x; -.
Der Beweis fur diesen Sat z findet sich beispielsweise in [99]. Der erste Teil des Sat zes bedarf wegen der vora ngegangenen Betrachtung keiner weiteren Erkl arung, wohl aber die letzten dr ei Absatz e, Die Uberlegungen zum Einzugsbereich der Ruhelage gestalten sich am einfachsten, wenn man sich V anhand von Hohenlinien in einer Zustandsebene gegeben denkt . Zum zweiten Absatz des Satzes zeigt Abb. 2.81 ein Beispiel, in dem die Funk t ion V nicht im gesamten Zust and sraum, sondern nur zwischen den beiden gestrichelten Linien negativ definit und sonst positiv definit ist. Damit ist eine Zustandskurve m6glich, wie sie in der Abbildung
Abb. 2.81. Einzugsbereich einer stabilen Ruhelage
190
2. Regelungstechnische Grundlagen
eingezeichnet ist . Solange sich die Kurve zwischen den gestrichelten Linien befindet , ub erschreit et sie die Hohenlini en von aufe n nach innen , im tibrigen Bereich aber von innen nach aufen. Der Einzugsbereich der Ruhelage muss dami t keinesfalls den gesamten Bereich zwischen den gestrichelte n Linien umfassen , in dem V < 0 gilt. Sicher zum Einzugsbereich gehort nur das Gebiet G innerh alb der Hohenlinie H. Denn diese kann auf keinen Fall von innen nach aufien ub erschri t ten werden, weil sie vollstandig im Gebiet mit V < 0 verlauft. Offensichtli ch muss man als Begrenzun g eines Einzugsbe reiches daher immer eine geschlossene Hohenlinie angeben . Dies ist abe r gena u die Bedin gun g, die im zweiten Absa tz des Satz es gefordert wird. Mit der Vorst ellung , dass V durch Hohenlini en gegeben ist , lasst sich auch die Ford erung nach dem unendli chen Wachstum von V mit unendlicher En tfernung vom Nullpunkt erklaren, Wenn V namlich nicht mit zunehmender Entfernung immer weit er wachsen wiird e, so gab e es Hohenlinien , die bis ins Unendliche reicht en und doch nie geschlossen waren , Zwei aufeina nder folgend e Hohenlini en konnten daher im Unendli chen unendli ch weit auseinanderliegen. Wenn dann bei V < 0 die Zust andskurve die Hohenlini e mit dem gr6Beren Wert von V ub erschri tt en hat , so mtisste eine unendlich lan ge Zeit bis zum Uberachreiten der Hohenlinie mit dem kleineren Wert vergehen. Der Zustandspunkt wiirde demn ach unendli ch lan ge Zeit zwischen beiden Holienlinien in m6glicherweise unendli cher Ent fernung vom Ruhepunkt verweilen, und das System ware nicht stabil. Der letzte Absa tz des Satzes ist wieder recht einfach zu verstehen. Wenn V und dami t der Abst and zum Nullpunkt mit der Zeit nicht kleiner wird, sondern gleich bleibt (V = 0) , so liegt offensicht lich nur einfache Stabilitat vor. Wenn abe r andere rseits die P unkte des Zustan dsrau mes mit V = 0 keine zusa mmenha ngenden Tr aj ektorien bilden , so muss das System (sofern es noch nicht den Nullpunkt erreicht hat ) immer wieder auch Zustan de annehmen, in denen V < 0 gilt. Dami t ist die Funkti on V im zeit lichen Veriauf zwar nicht st reng monoton , aber doch monoton fallend. Der Nullpunkt wird fruher oder sparer erre icht, und das System ist deshalb asymp toti sch stabil. Mit Hilfe der direkt en Meth ode lasst sich auch die Instabili tat einer Ruhelage na chweisen. In v611iger Analogie zu Satz 2.23 ist hier die positive Definitheit von V zu zeigen . Sowohl fur den Nachweis der Inst abilitat als auch der Stabilitat einer Ruhelage exist ieren ftir verschiedene Randbedin gungen zahlreiche Varianten von Satz 2.23 [54], darunter auch die sogenannten Inst ab ilit atstheoreme von Ljapunov seibe r. Selbst fur zeitvar iante Syst eme (z.B. [18, 151]) und sogar fiir Systeme mit auferer Anregun g [99] exist ieren T heore me. Die zu Grunde liegende Idee, namli ch die Verwendung einer Ljap unov-Funktion, ist aber in allen Fallen dieselb e, weshalb hier auf nah ere Er lauterungen verzichtet wird. Stattdessen soil noch kur z auf das entsc heidende Problem bei der Anwend ung der direkten Met hode eingega ngen werden. Offensichtlich hau gen doch Form und Gr6Be des nachweisbaren Ein zugsbereiches einer Ruhelage
2.8 Nichtlineare Systeme
191
ganz wesentlich von der gewahlten Ljapunov-Funktion V ab o Eine anders gewahlte Funktion V kann einen vollig anderen Einzu gsbereich liefern . Die Wahl der Ljapunov-Funktion entse heidet sagar dartib er , ob iiberha upt die St abilitat der Ruh elage naehgewiesen werden kann. Und falls keine geeignete Funkt ion gefunden wird, so heiBt dies nieht , dass die Ruh elage inst abil ist , sondern lediglieh, dass die Suehe erfolglos war. Zum Nachweis der Instabilitat mtisste, wie oben erwahnt, eine Ljapunov-Funktion gefunden werd en, deren Ableitung inaner positiv definit ist . Aus dem Grund sind tiber die Jahre versehiedene Ansatze entst anden, urn die Suehe naeh einer Ljapunov-Funktion zu syste ma tisieren [18, 45, 46, 52, 54, 151, 156]. Den entse heidenden Makel des Verfahr ens, dass narnlich im Faile des Nieht-Auffind ens einer Ljapunov-Funktion keine Stabilitatsaussage moglich ist, konnten aber aueh sie nieht beseitigen. Erst in jlingster Zeit konnte dieser Mangel durch den Einsatz von LMIAlgorithmen (vgl. Anhang A.7) fur die sehr umfassende Klasse von TSKSystemen (vgl. Kap . 4.1.3) behoben werden . Mit Hilfe dieser Algorithmen ist es narnlich moglich, die generelle Frage naeh der Exist enz einer LjapunovFunk tion mit negativ definit er Ableitung fur das gegebene System zu beantworten. Und diese ist , wie sich zeigen lasst , gleichbedeut end mit der Frage naeh der Stabilitat des Syst ems. Behandel t wird dieser Ansatz in Kapitel 4.2.2. Hier solI st attdessen noeh ein Beispiel ftir die Anwendung der direkt en Methode behandelt werden , und zwar die sehwingende Masse aus Abb. 2.4. Dab ei maeht die St abilit atsanalyse eines linearen Systems mit Hilfe der direkte n Methode eigentlieh keinen Sinn , weil eine Unte rsuehung der Eigenwerte der Syste mmat rix wesentlieh einfaeher ware. Andererseits ist dieses Beispiel anseha ulieh und erfordert aueh keinen graBen Reehenaufwand. Die Zustandsgleiehung des von auBen nieht angeregt en Systems lautet naeh Gleiehung (2.143) (2.239) Del' Gesamt-Energieinhalt des Syst ems ist die Summ e aus der in der bewegten Masse enthaltenen kinetis ehen Energie und der in der Feder gespeieherten potentiellen Energic. Dur eh die Reibung verliert dieses System Energi e, bis die Sehwingung sehlieBlieh zum Erliegen kommt . Da somit die Energi e monot on abnehmend ist, liegt es nah e, den En ergieinhalt des Syst ems als Ljapunov-Funktion zu definiercn und auf diese Art und Weise die Stabilitat der Ruh elage (v,1) = (0, 0) zu beweisen:
+J I
V
= E = Ekin + E pot =
21 m v 2
fJdx
o 1
2
1
= - mv + - cf l 2
2
2
+J I
=
21 m v 2
cfxdx
0
(2.240)
192
2. Regelungstechnische Grundlagen
V ist stetig und stetig differenzierbar. AuBerdem ist die Funktion im gesamten Zustandsraum auBer im Ursprung (v, i) = (0,0) positiv und wachst mit [x] = I(v, if I ---+ 00 iiber alle MaBen. Damit sind die Voraussetzungen aus Satz 2.23 fur globale Stabilitat erfullt. Zu untersuchen ist jetzt noch die negative Definitheit von V. Die Ableitung von V nach der Zeit ergibt unter Berucksichtigung der Zustandsgleichung
V=
triuii + Cfii
= mv[- Cr
m
=
-v 2cr
V -
cf i] m
+ cfiv (2.241)
Offensichtlich ist diese Funktion negativ semidefinit, da sie nicht nur im Ursprung den Wert Null annimmt, sondern in allen Zustanden mit v = O. Dies ist leicht zu erklaren. Ein Energieverlust und damit eine Abnahme von V wird durch Reibung verursacht. Diese tritt genau dann auf, wenn die Geschwindigkeit von Null verschieden ist. In den Punkten maxi maier Auslenkung der Feder sind aber die Geschwindigkeit und damit auch die Reibung und V gleich Null. Zunachst ist also global nur die einfache Stabilitat, nicht aber asymptotische Stabilitat gewahrleistet. Untersucht man jedoch die Punkte des Zustandsraumes, in denen V = 0 gilt , so stellt man fest , dass diese (auBer im Ursprung) keine zusammenhangende Trajektorie bilden. Ein Zustand (v = 0, l =1= 0) bedeutet, dass die Feder maximal ausgelenkt ist und die Amplitude der Schwingung gerade den Maximalwert erreicht hat . Durch die Feder wird die Masse aber sofort wieder beschleunigt, und das System nimmt einen Zustand mit v =1= 0 und V < 0 an. Insgesamt ist V daher monoton abnehmend und die globale asymptotische Stabilitat des Systems gemaf dem vierten Absatz von Satz 2.23 bewiesen.
2.8.6 Harmonische Balance Damit sollen die Ausfiihrungen zur direkten Methode abgeschlossen werden. Ein vollig anderer Ansatz liegt der Methode der Beschreibungsfunktion oder auch Methode der harmonischen Balance zu Grunde. Bei diesem Verfahren, das hier nur fur Eingrofensysteme betrachtet werden solI, wird zunachst davon ausgegangen, dass die Ausgangsgrofie y des Systems urn die Ruhelage y = 0 eine Schwingung ausfiihrt . Damit schwingen dann natiirlich auch die Regelabweichung e und die Stellgrofle u . Die Entstehung der Schwingung wird nicht betrachtet. Die Analyse der Schwingung lasst dann Ruckschlusse auf das Stabilitatsverhalten des Systems hinsichtlich der betrachteten Ruhelage zu . Die zu Grunde gelegte Schwingung kann dabei eine Dauerschwingung oder ein Grenzzyklus sein , was im Folgenden nicht unterschieden werden soll. Voraussetzung ist die Unterteilbarkeit des Regelkreises in einen linearen und einen nichtlinearen Teil wie beim Standardregelkreis gernaf Abb . 2.79. Die gesamte Dynamik des Systems wie z.B . Integratoren, Laufzeitglieder,
2.8 Nichtlineare Systeme
193
usw. soIl dabei im linearen Teil enthalten sein , wahrend der nichtlineare Teil momentan wirkend sein muss:
u(t)
= f(e,sgn(e))
(2.242)
Dies bedeutet, dass sich die Ausgangsgrofe u des nichtlinearen Teiles im Prinzip aus der momentan anliegenden Eingangsgrofie e ohne Kenntnis frtiherer Werte von e oder u berechnen lasst. So kann man beispielsweise bei Kennliniengliedern direkt aus dem Momentanwert der Eingangsgrofe e die AusgangsgroBe u = f(e) berechnen. Sie sind damit momentan wirkend. Als momentan wirkend gelten aber auch die hysteresebehafteten Ubertragungsglieder, obwohl dart cine gewisse Kenntnis der Vorgeschichte erforderlich ist, weil man sonst nicht weiB, in welchem Zweig der Hystereseschleife sich das System gerade befindet. Diese Vorgeschichte wird durch den Term sgnte) ausgedruckt, Dartiber hinaus muss die auftretende Kennlinie des nichtlinearen Teiles monoton steigend sein und eine ungerade Funktion darstellen (Nullpunktsymmetrie). Dies ist beispielsweise bei den sehaltenden Ubertragungsgliedern gegeben . Die Ubertragungsfunktion des linearen Teiles muss dagegen ein ausgepragtes Tiefpassverhalten aufweisen, wobei auf die Bedeutung dieser Eigensehaft im Verlauf der folgenden Herleitung noeh naher eingegangen wird. Auch diese Forderung ist in der Praxis in vielen Fallen erfullt, so dass es fur das Verfahren der Besehreibungsfunktion einen groBen Anwendungsbereieh gibt . Fur die Herleitung geht man davon aus, dass am Ausgang des Systems eine harmonische Schwingung y(t) = -Asin(wt) vorliegt, deren Amplitude A und Frequenz w bestimmt werden sollen. Da das System vor Anwendung des Verfahrens entsprechend Abb . 2.79 umdefiniert wurde und somit die Fiihrungsgrofe w gleich Null ist, liegt am Eingang des nichtlinearen Gliedes die GroBe e(t) = Asin(wt) an . Dann ergibt sich als Ausgangsgrofie des nichtlinearen Gliedes ebenfalls ein periodisches Signal , das sich als Fourierreihe mit der Grundfrequenz w darstellen lasst und wegen der Nullpunktsymmetrie der nichtlinearen Kennlinie keinen Gleichanteil enthalt: 00
u(t) =
LA
k
cos kwt
+ B k sin kwt
k =l
J ~J T
mit
Ak =
~
u(t) cos(kwt)dt
o
T
e; =
u(t) sin(kwt)dt
o
T = 21f w
(2.243)
Dieses Signal bildet wiederum die Eingangsgrofie ftir den linearen Teil. Nach Satz 2.3 erzeugt jede Teilschwingung am Eingang des linearen Teiles cine
194
2. Regelungstechnische Grundlagen
Ausgangsschwingung mit derselben Frequenz . Wenn nun die Tiefpasswirkung des linearen Teiles ausreichend ausgepragt ist , so werden aber alle Schwingungen mit einer Frequenz, die grofler als die Grundschwingung wist, aus dem Signal weitgehend herausgefiltert, und iibrig bleibt nur der Grundschwingungsanteil. Die ausreichende Tiefpasswirkung ist dabei eine formal schwer zu beschreibende Eigenschaft. Als Faustregel gilt, dass in der Ubertragungsfunktion der Grad des Nennerpolynoms den des Zahlerpolynoms urn mindestens 2 iibersteigen sollte . Aber auch eine Graddifferenz von 1 kann schon ausreichend sein. Auf jeden Fall sollte man am Ende des Verfahrens, wenn die Parameter der Schwingung und damit auch w berechnet sind, noch einmal uberpriifen, ob durch den linearen Teil die hoherfrequenten Signalanteile 2w, 3w, ... tatsachlich ausreichend unterdriickt werden konnen. Andernfalls ist eine wesentliche Voraussetzung des Verfahrens nicht erfullt und die gesamte Rechnung ungiiltig . Die am Ausgang des linearen Teiles ubrlggebliebene Grundschwingung stellt gerade das anfangs vorgegebene Signal y(t) = - A sin(wt ) dar. Alle anderen Schwingungsanteile, die am Ausgang des nichtlinearen Teiles erzeugt wurden, konnten den linearen Teil nicht passieren. Aber nur Signalanteile, die in der Lage sind , alle Teile des Regelkreises zu passieren, konnen zu einer sich selbst aufrecht erhaltenden oder sogar aufklingenden Schwingung des Gesamtsystems beitragen und damit dessen Stabilitat gefahrden. Fur die Stabilitatsanalyse ist es daher zulassig, alle hoherfrequenten Anteile am Ausgang des nichtlinearen Teiles zu vernachlassigen. Es bleibt
u(t)
Ai
= Al coswt + B I sinwt = C I sin(wt +
Br
(2.244)
mit C I = J + und
; = N(A,w) = CI(1'w) ejcp,(A ,w)
9t
(2.245)
Dabei sei angemerkt, dass diese Art der Linearisierung nichts mit der Linearisierung am Arbeitspunkt zu tun hat (Gleichung (2.218)). Gemaf der Definition von Al und B I haugen C I und
2.8 Nichtlineare Systeme
195
Dies ist ein ganz entscheidender Unterschied zwischen einer solchen quasilinearen und einer echte n linearen Ubertragungsfunktion , deren Lau fzeit und Verst arkung ausschlieBlich von der Frequenz des Ein gangssignales abhangig sind . Zudem gibt die Beschreibun gsfunk tion nur das Ubertragungsverhalt en des nichtlin earen Gliedes hinsichtlich der Grundschwingung wieder. Die Beschreibungsfunkt ion darf daher nur dann wie eine lineare Ubert ragungsfunktion benut zt werden , wenn gewiihrleiste t ist , da ss das Eingangssignal des nichtlinearen Teiles tatsiichlich e(t ) = A sin (wt) ist . Eine Anwendung beispielsweise zur Berechnun g der Sprungantwort ist damit ausgeschlossen. 1m vorliegenden Fall sind jedo ch die Voraussetzungen erfiillt, und die Beschreibun gsfunktion darf demnach wie eine linear e Ubertragungsfunk tion verwende t werden. Die Kreisiibertragungsfunktion des Systems setzt sich nun zusammen aus der Beschreibun gsfunktion und der Uber tragungsfunkt ion des linear en Teiles: N(A)G(jw). Damit sich eine gleichbleibende Schwingung einst ellt, muss das Ausgangssignal y , na chdem es einmal den geschlossenen Kreis durchlaufen hat , am Ausgang in unveriindert er Form wieder erscheinen. Die Bedingung fur eine solche Schwingung lautet damit:
y = -N (A)G(jw )y
(2.247)
-1 = N (A )G(jw )
(2.248)
oder Die Zerlegung dieser komplexen Gleichung in Real- und Imaginiirteil liefert zwei Gleichungen fur die beiden Unbekannten , namlich die Amplitude A und die Frequenz w der Schwingung. Wenn eine Losun g dieser Gleichung exist iert, so ist auch eine entsprechende Schwingung im System moglich, wobei dies eine Dau erschwingung oder ein Grenzzyklus sein kann . Es konnen auch mehrere Losun gen existieren, was bedeut et , dass verschiedene Schwingungen moglich sind. Falls keine Losun g exist iert , so bedeut et dies, dass keine harm onische Schwingung im Regelkreis existieren kann . Nicht ha rmonische Schwingungen sind dann immer noch moglich, doch im allgemeinen recht unwahrscheinlich. Wie oben schon erwiihnt, sollte fur jede mogliche Schwingung am Ende noch einma l iiberpriift werden , ob durch den linearen Teil t atsiichlich eine ausreichende T iefpassfilte rung der hoherfrequent en Schwingungsant eile erfolgt , da dies eine ganz wesentli che Voraussetzung fur das Verfahren ist . Das Stabilitiitsverha lten einer moglichen Schwingung kann im Rahmen einer gra phischen Losung dur ch Hinzuziehen des Nyquist-Kriteriums (Satz 2.9) ermittelt werden. Dieses Kriterium schreibt die erforderliche Phasendrehung der Ortskurve der Kreisiibertragungsfunktion urn den kritischen Punkt -1 vor. In Gleichung (2.248) ist die linke Seit e gerade der kritische Punkt und die rechte Seite die Kreisiibertragungsfunktion. Umschreiben in
1
.
- N (A ) = G(Jw)
(2.249)
196
2. Regelungstechnische Grundlagen
lasst aber auch eine andere Interpretation zu . Die Kreisiibertragungsfunktion besteht jetzt nur noch aus dem linearen Teil, wahrend der kritische Punkt zu einer von der Amplitude A abhangigen Kurve - NtA) erweitert wird . Es wird dann zunachst die Beschreibungsfunktion des nichtlinearen Teiles N(A) berechnet oder gemessen. Dann wird die Kurve - NtA) in der komplexen Ebene dargestellt. AnschlieBend misst oder berechnet man den Frequenzgang G (jw) und stellt dessen Ortskurve ebenfalls in der komplexen Ebene dar. Jeder Schnittpunkt der beiden Kurven bildet dann eine Li.isung der Gleichung (2.249) , steht also fur eine mogliche Schwingung, deren Stabilitatsverhalten mit Hilfe des Nyquist-Kriteriums ermittelt werden kann, wie in den folgenden Beispielen gezeigt wird . 1m ersten Beispiel besteht der nichtlineare Teil aus einem idealen Zweipunktglied. Zunachst wird dessen Beschreibungsfunktion berechnet. Die Parameter C i und 'Pi der Beschreibungsfunktion resultieren aus den Koeffizienten Ai und B i , die demnach zuerst zu berechnen sind. Das Ausgangssignal u(t) ist bei sinusforrnigem Eingangssignal eine Rechteckschwingung (Abb. 2.82) . Mit T = :: ergibt sich:
J J = ~J T
e,
=
~
u(t) sin(wt)dt
o
T
"2
4K sin(wt)dt = --;:-
2 y2K
o
T
u(t) cos(wt)dt = 0
Ai =
(2.250)
o und daraus
Ci = JAi + Br = s, Ai
=
4:
'Pi = arctan B = arctan 0 = 0
(2.251)
i
bzw . die Beschreibungsfunktion
(2.252) Die Phasenverzi.igerung -'Pi der Beschreibungsfunktion betragt damit Null und die Verstarkung = ~~ . Dies ist auch anschaulich sofort einsichtig. Die am Ausgang des Zweipunktgliedes anliegende Rechteckschwingung ist phasengleich zu der am Eingang anliegenden Sinusschwingung, weshalb die Phasenverzogerung offensichtlich Null sein muss. Weiterhin bleibt die Amplitude der am Ausgang anliegenden Rechteckschwingung immer gleich. Da
9t
2.8 Nichtlineare Systeme
197
die Verstarkung aber als das Verhaltnis der Ausgangs- zur Eingangsamplitude definiert ist, muss sie gerade umgekehrt proportional zur Amplitude des Eingangssignales sein. +K -t----==:-'-.,
-K
Abb. 2.82. Ein- und Ausgangssignal beim idealen Zweipunktglied Tabellarische Auflistungen weiterer Beschreibungsfunktionen finden sich unter anderem in [18, 45, 46, 191]. Die ausfuhrlichsten Informationen zur Beschreibungsfunktion bietet [50], das man durchaus als Standardwerk zu dieser Thematik bezeichnen kann . Wenn die Beschreibungsfunktion bekannt ist, kann die eigentliche Stabilitatsanalyse durchgefuhrt werden . Dazu muss man zunachst die Funktion - N(A) als Kurve in Abhangigkeit von der Amplitude in die komplexe Ebene eintragen. Fur das 2-Punkt-Glied ergibt sich nach (2.252) - N(A) = - :::' also eine Kurve auf der negativ-reellen Achse, die sich mit wachsendem A immer weiter vom Nullpunkt entfernt. In dasselbe Bild wird dann die Ortskurve des linearen Teiles eingetragen. Anhand der entstehenden Schnittpunkte bzw. der Lage der Kurven zueinander sind dann Aussagen tiber die Stabilitat des Systems moglich. Abb. 2.83 zeigt verschiedene Beispiele ftir den Fall, dass der nichtlineare Teil des Standardregelkreises (Abb . 2.79) aus einem idealen Zweipunktglied besteht. 1m
1m
-IIN(A)
- IIN(A)
\ ~ GUm)
Re
--A-
"/
~
Re
GUm)
/ro ro
1m
1m
- IIN(A )
--A-
/
-IIN(A)
\ Re
Re
~ GUm)
Abb . 2.83. Stabilitatsanalyse mittels Beschreibungsfunktion beim idealen 2Punkt -Glied
198
2. Regelungstechnische Grundlagen
1m Beispiel links oben best eht der lineare Teil aus einem Integrator und einem Verzogerungsglied mit der Ubert rag ungsfunkt ion 1
G(s) = s(Ts
+ 1)
(2.253)
Der gesamte Kreis ents pricht damit dem Syst em in Abb . 2.68. Die Ortskurve und die Kurve der Beschreibungsfunktion schneiden sich nur im Ursprung, d.h. ftir A = 0, W = 00 . Dami t besitzt aber auch Gleichun g (2.248) nur diese eine Losung, was bedeutet , dass in diesem System nur eine Schwingung mit der Amplitude A = 0, d.h. keine Schwingung moglich ist . Man kann auch ents prechend der Int erpret ation der Gleichun g (2.249) die Kurve - N (A ) als amplit udenabha ngigen kritischen Punkt deuten . Dann ist G(s) die Kreisiibertragun gsfunk tion, deren Ortskurve lau t Nyquist kriterium beziiglich des kritischen Punktes eine ganz bestimmte Phasendrehun g ausfuhren muss, damit das System st abil ist. Da G(s) einen Integrator ent ha lt , betragt diese Phasendrehung +i . Das ist aber gerade gegebe n, wenn man den Schnit tpunkt im Ursprung auBer Acht lasst . Denn bezuglich jedes andere n Punktes der Kurve - N (A ) hat die Phasendrehung genau diesen Wert. Dies kann man leicht fest stellen , wenn man einen Vektor von einem Punkt der Kurve - N(A) zur Ortskurve des linearen Teiles einzeichne t und seine Phasendrehung mit wachsend em w bet racht et . Dami t ist das System stabil. 1m Beispiel rechts oben besteht der lineare Teil aus einem doppelten Integrator , und man erhalt das in Abb . 2.66 gezeigte Syst em . Die Kurve der Beschreibungsfunk tion und die Or tskurve des linearen Teiles liegen gena u iibereinander. Es exist ieren also unendli ch viele Schnittpunkte und dam it auch unendli ch viele Losungen der Gleichung (2.248). Dab ei weist die Ortskurve des linearen Teiles um so grofero Werte fur w auf, je weiter sie sich dem Ursprung nahert , wahrend die Kurve der Beschreibungsfunk tio n umso grofere Wer te fiir A aufweist , je weit er sie sich vom Ursprung ent fernt . Fur einen Schnittpunkt und dami t fur eine mogliche Losung bzw. Schwingun g gilt also, dass die Amplit ude umso grofe r ist , je kleiner die Frequenz ist . Das ent spricht aber auch genau den bereits gemachte n Unte rsuchungen zu diesem Syst em. Wie man anha nd von Abb . 2.67 erkennen kann, han gt die sich einstellende Dauerschwingun g vorn Anfang szustand des Syst ems abo J e grofier die Ampli tude, desto lan gsam er die Schwingun g bzw. desto kleiner die Frequ enz. Unt en links besteht der linear e Teil aus einem zweifachen Integrator mit Lau fzeit . Da sich die Ortskurve des linearen Teiles spir alforrnig immer weit er dem Ursprung nah ert , exist ieren unendlich viele Schn ittpunkte zwischen beiden Kurven . Die Frage ist nun , welche Schwingung sich t atsachlich einste llen wird . Hier biet et sich eine Erkl arung an, die zwar nicht ganz exakt, dafur ab er anschaulich ist und let ztendli ch zum richt igen Er gebnis fuhrt . Zun achst sei angenommen, dass sich das System in einem Schnit tpunkt befindet und eine Schwingun g ausfiihrt . Wenn nun eine kleine Storung auft ritt und die Amplitude moglicherweise etwas verkleinert wird , bewegt sich das System auf
2.8 Nichtlineare Systeme
199
der Kurve der Beschreibungsfunktion ein wenig na ch rechts . Dieser Punkt ist ab er, wie alle ancleren Punkte der Kurve - N (A) auch , ein kritischer Punkt . Die Phasenclrehung der Ortskurve urn cliesen Punkt ist sicherlich negativ , wah rend sie laut Nyquist-Kriterium wegen der beiden Integratoren im linear en Teil +7r betragen musst e, Hinsichtlich dieses Punktes ist das System also instabil, und die Schwingung klingt auf. Das Syst em bewegt sich auf der Kurve der Beschreibungsfunk tion nach links zuriick in den Schnittpunkt. C egenuber einer Verkleinerung der Amplitude ist die Schwingung daher st abil. Tritt nun durch eine Storung eine Vergroferung der Amplitude auf, so bewegt sich das System auf der Kurve der Beschreibungsfunktion nach links . Dieser Punkt ist ebenfalls ein kritischer Punkt, urn den die Phasendrehung der Or tskurve wegen der bis ins Unendliche fortg esetzten Spiralform sicherlich negativ ist , d .h. es liegt laut Nyquist-Kriterium wieder Instabilitat vor. Die Schwingung klingt deshalb weit er auf und lauft in den nach st en , weiter vorn Ursprung ent fernt liegend en Schnittpunkt hinein. Dieselb en Uberlegungen gelten fiir alle Schnittpunkte, d.h . aile Grenzzyklen sind , in der Zustandsebene betrachtet , nach innen st abil und nach auBen instabil. Daher wird das System im Laufe der Zeit mit jeder Storung zu imm er weit er vorn Ursprung ent fernt liegend en Schnittpunkten wandern , was eine standige Zunahme der Schwingungsamplitude bedeutet . Dami t ist das Syst em instabil. Fur das letzte Beispiel ist der Zweipunktregler mit doppeltem Integrator urn eine Ruckfuhrung nach Abb . 2.73 erganzt. Hier stellt sich vor der Anwendung des Verfahrens zunachst das Problem , das gegebene System so umzuformen , dass seine Struktur der des Standardregelkreis es (Abb. 2.79) entspricht . Dazu wird das Zweipunktglied als nichtlinearer Teil definiert und alles andere als linearer Teil des Regelkreises. Fur diesen linear en Teil muss nun die Ubertragungsfunktion bestimmt werden. Sie ergibt sich dadurch , dass man den Zusammenh an g zwischen Ausg angsgrofe n und Eing angsgrofe e des nichtlin ear en Teiles herst ellt . 1m Standardregelkreis lautet dieser Zusamm enhang e = - G(s)n. Im vorliegend en Syst em gilt nach Abb . 2.73
k
e(s ) = -n(s)( -
S
1
+ -s 2 )
(2.254)
und damit
G(s) = _ e(s ) = ks + 1 n(s) S2
(2.255)
Die Ortskurve dieser Funktion ist unten rechts in Abb. 2.83 eingezeichnet . Wie im ersten Beispiel liegt der einzige Schnittpunkt zwischen beiden Kuryen wieder im Ursprung bei A = 0, was bedeutet , dass es keine harmonische Schwingung geb en kann. Die Phasendrehung der Or tskurve bezuglich des kritischen Punktes, d .h. beziiglich der Kurve der Beschreibungsfunktion betragt it, Genau dieser Wert ist aber wegen der beid en Integratoren in der Ubert ragungsfunkt ion laut Nyquist-Kriterium auch erforderlich, dami t das Gesamt systern stabil ist . Das hier vorliegende System ist also stabil. Allerdings
200
2. Regelungsteehnisehe Grundlagen
ist dieses Ergebnis mit Vorsicht zu genieBen, da die Graddifferenz zwischen Nenner- und Zahlerpolynom nur 1 betragt und von daher die ausreiehende Tiefpasswirkung des linearen Teiles, die vorausgesetzt werden muss, fraglich ist . Da man aber bei der zu Abb. 2.73 bereits durchgeftihrten Betraehtung in der Zustandsebene zu demselben Ergebnis kommt , kann es hier ebenfalls akzeptiert werden . Beim Zweipunktglied mit Hysterese hat die Kurve der Besehreibungsfunktion cine etwas andere Form. Wegen der Hysterese erfolgt die Umschaltung vom einen auf den anderen Ausgangswert gegeniiber dern idealen Zweipunktglied und damit auch gegenuber einer Sinusschwingung am Eingang verzogert. Deshalb ist der Winkel 'P ungleich Null und die Beschreibungsfunktion nicht mehr rein reel I. Auf die Berechnung der Funktion soIl verziehtet werden, aus Abb . 2.84 ist die Form der Kurve - N(A) ersichtlieh. 1m
-11N(A)
rx:
1m
Re
G(jc.o)
Re
-11N(A)
G(jc.o)
Abb. 2.84. Besehreibungsfunktion beim 2-Punkt-Glied mit Hysterese 1m Beispiel links besteht der lineare Teil wieder aus einem Verzogerungsglied und einem Integrator (vgl. Abb . 2.71). Beide Kurven weisen einen Schnittpunkt bei einer von Null verschiedenen Amplitude auf. Dies deutet auf eine Grenzschwingung hin. Zu untersuehen ist allerdings noeh das Stabilitatsverhalten dieser Grenzsehwingung, wobei wieder eine zwar nicht exakte, dafiir aber anschauliche Erklarung versucht werden soll. Das System befinde sieh zunachst in diesem Sehnittpunkt. Nun tritt eine Storung auf, die die Amplitude der Sehwingung etwas verkleinert. Das System nimmt einen Punkt auf der Kurve der Besehreibungsfunktion reehts yom Sehnittpunkt ein. Die Phasendrehung der Ortskurve beziiglich dieses Punktes betragt ungefahr -1f, wahrend laut Nyquist-Kriterium die fur Stabilitat erforderliehe Phasendrehung wegen des einen Integrators in der linearen Ubertragungsfunktion + ~ betragen miisste. Es liegt demnaeh Instabilitat vor, die Sehwingung klingt auf, die Amplitude steigt an, und das System lauft wieder in den Schnittpunkt der beiden Kurven. Wandert das System infolge einer Storung auf der Kurve der Besehreibungsfunktion dagegen naeh links, so betragt die Phasendrehung ungefahr +~ . Hier liegt Stabilitat vor, die Sehwingung klingt ab , und das System nahert sieh ebenfalls wieder dem Sehnittpunkt. Insgesamt ergibt sieh, dass das System den Sehnittpunkt nicht verlassen kann. Die Sehwingung ist daher ein stabiler Grenzzyklus. Im Beispiel reehts besteht der lineare Teil aus einem doppelten Integrator. Die Phasendrehung der Ortskurve hinsiehtlich des kritischen Punktes musste
2.8 Nichtlineare Systeme
201
laut Nyquist-Kriterium +71" betragen, weist aber stattdessen hinsichtlich der gesamten Kurve der Beschreibungsfunktion negative Werte zwischen - ~ und -71" auf. Das System ist daher instabil. Dasselbe Ergebnis lieferte auch die Betrachtung zu Abb. 2.70. Nach diesen Beispielen ist wohl einsichtig, dass das Verfahren fur einen geiibten Anwender eine sehr einfache und ubersichtliche Moglichkeit der Stabilitatsanalyse bietet. Dabei ist die benotigte Information leicht zu beschaffen. Sowohl die Beschreibungsfunktion als auch die Ortskurve konnen gemessen werden, wenn die Darstellung mit Hilfe von Formeln nicht moglich oder zu schwierig ist. Darilber hinaus ist die graphische Darstellung so anschaulich, dass man sich auf dieser Basis auch Moglichkeiten zur Stabilisierung eines Systems iiberlegen kann. Denn die Aufgabe besteht lediglich darin, die Ortskurve des linearen Teiles durch EinfUgen linearer Korrekturglieder so zu verandern, dass kein Schnittpunkt zwischen der Ortskurve und der Kurve der Beschreibungsfunktion mehr auftritt. Der Phantasie des Anwenders sind hier keine Grenzen gesetzt. Der einzige Nachteil ist, dass das Verfahren in der bisher vorgestellten Form nur auf eine bestimmte Klasse von Systemen anwendbar ist. Hier existieren aber verschiedene Erweiterungsmoglichkeiten, die im Folgenden kurz vorgestellt werden sollen . Eine wichtige Einschrankung des bisher vorgestellten Verfahrens ist die Forderung nach einer ausreichend ausgepragten Tiefpasseigenschaft des linearen Teiles. Dazu wird in [50] vorgeschlagen, bei nicht ausreichender Tiefpasswirkung die der Beschreibungsfunktion zu Grunde liegende Fourierreihe erst nach einem spateren Glied abzubrechen. Der Charme des Verfahrens, narnlich die Darstellung der Nichtlinearitat durch eine lineare Ubertragungsfunktion und damit die einfache Handhabbarkeit, geht durch diese MaBnahme allerdings verloren. Ebenfalls in [50] wird die Moglichkeit diskutiert, auch fur andere Signalformen als harmonische Schwingungen Beschreibungsfunktionen nichtlinearer Ubertragungsglieder zu berechnen, beispielsweise ftir gauBsches Rauschen oder Gleichsignale. Dann kann die Beschreibungsfunktion aber nicht mehr aus einer nach dem ersten Glied abgebrochenen Fourier-Reihe berechnet werden. Stattdessen wird eine lineare Ubertragungsfunktion mit zunachst unbekannten Parametern angesetzt. Dann werden die Parameter so bestimmt, dass der quadratische Fehler zwischen dem Ausgangssignal dieses linearen und dem des realen , nichtlinearen Ubertragungsgliedes bei gegebenem Eingangssignal moglichst klein wird. Setzt man als lineares Ubertragungsglied ein Laufzeitglied mit variabler Verstarkung an, so liefert diese Vorgehensweise bei sinusf6rmigem Eingangssignal dieselbe Beschreibungsfunktion wie die nach dem ersten Glied abgebrochene Fourier-Reihe. In [45, 46] wird erlautert, wie das Verfahren der harmonischen Balance anzuwenden ist , wenn der Regelkreis nicht nur aus einem linearen und einem nichtlinearen Teil wie im Standardregelkreis besteht, sondern mehrere nichtlineare Teile aufweist, die durch lineare Teile voneinander getrennt sind .
202
2. Regelungstechnische Grundlagen
~
Abb. 2.85. Erweiterter Regelkreis fur die Methode der Beschreibungsfunktion Ein einfaches Beispiel zeigt Abb. 2.85. Unte r der Voraussetzung, dass die linear en Teile ausreichende Ti efpasseigenschaft aufweisen , konnen fiir e l und e2 harm onische Schwingun gen angeset zt werd en: el
= A l sin wt
e2
= A 2 sin(wt + 4'2)
(2.256)
bzw. in der Darstellung als komplexe Zeiger
= A1ejwt e2 = A 2 ej (Wt+'P2) el
(2.257)
AnschlieBend werd en die nichtlinearen Teile durch quasilineare Beschreibungsfunkt ionen N1(A1, w) und N 2 (A 2,w ) ersetzt . Fiir das Schwingun gsgleichgewicht gilt dann : (2.258)
Eine Zerlegung in Real- und Imaginarteil liefer t zwei Gleichungen. Hier gibt es ab er drei Unbekannte, namlich AI , A 2 und w . Da die l3eschreibungsfunkt ionen jedoch wie lineare Ubertragu ngsfunkt ionen behandelt werd en konn en, lasst sich ein weit erer Zusammenh ang, und zwar zwischen den Ein gangssignalen der nichtlinear en Glieder aufstellen: e2 = N1(A1,w)G l( w)el j A 2 e (wt+'P2) = NI( AI ,W) GI(w) Al ejwt j A 2 e 'P2 = N 1(A1,w )G1(w)A 1
(2.259)
Ein e Betrachtung der Betrage liefert dann die notwendi ge, dr itte Gleichung : (2.260)
Das so erhaltene Gleichun gssystem ist leider nur noch in Sonderfallen graphi sch zu losen. Es bleibt aber die Moglichkeit einer nummerischen Losung. Wichtiger fiir die P raxis ist die Moglichkeit , das Verfahren fiir Nicht linea ritaten zu erweitern , die nicht mehr momentan wirkend sind, sondern eine intern e Dyn amik aufweisen. Damit ist die Ausgangsgrolle des nicht linearen Teiles u nicht mehr nur vom Eingangssignal e bzw. dem Ausgan g des linearen Teiles y abha ngig, sondern auch von dessen Ableit ungen: u = f (e , e, ...). Eine solche Abhangigkeit tritt offenbar ebenfalls auf, wenn der nichtlinear e
2.8 Nichtlineare Systeme
203
'Ieil zwar keine Dyn amik aufweist, dafur aber als Eingangsgrofe n nicht nur die Regelabweichun g bzw. die Ausgangsgrofe der Strecke, sondern auch ihre Ableitungen erha lt. Dies ist eine Konstellation, wie sie beispielsweise beim Fuzzy-RegIer gegeben ist . So sei der nichtlinear e Teil jetzt statt durch 1L = f (e) durch ein Ubertragungsverhalte n erster Ordnung 1L = f( e, e) definiert . Weit erhin sei diese Funkt ion ungerade: f( - e, -e) = - f( e, e). Und schlieBlich muss filr jedes e > 0 die Funktion f( e, e) mit e monoton steigen . Der ausreichende T iefpasscharakter des linear en Teiles wird ebenfalls voraus gesetzt . Dann kann man genau wie im Fall moment an wirkender Nicht linearitaten die Oberschwingun gen am Ausgang des nichtlin ear en Teiles vernachlassigen. F i.ir die Koeffizienten der Grundschwingung gilt jetzt : T
Al
= T2
T
J '
f( e, e) cos(wt)dt
= T2
o
J .
f (A sm(wt) , Aw cos(wt )) cos(wt)dt
0
(2.261) T
BI =
~
T
J
f( e, e) sin(wt)dt =
o
~
J
f(A sin(wt), Aw cos(wt )) sin(wt)dt
0
mit T = ~ . Nach denselben Form eln wie ftir momentan wirkende Nicht lineari t at en ergibt sich wieder eine Beschreibungsfunktion N (A , w), die jet zt aber nicht mehr nur von der Ampli tude A, sondern auch von der Frequenz w der Schwingung abhangig ist . Dies ftihrt dazu , dass die Darst ellun g dieser Beschreibungsfunk tion nicht Bur eine Kurve - N tA) , sond ern eine ganze Kurvenschar - N(~ ,w ) mit w als Parameter erfordert , d.h. ftir jede Frequenz W I exist iert eine am plit udena bhangige Kurve - N( l ,w!l ' F i.ir eine St abilit atsanalyse werden diese Kurvenschar und die Ortskurve des linearen Teiles in der komplexen Eb ene aufgetragen. Die Kurvenschar wird dann als kritischer Punkt des Nyquist- Kriteriums gedeutet. Aus der Lage der Ortskurve zur Kurvenschar lassen sich auch hier Riickschliisse auf das Stabil it atsverhalten ziehen. Als Beispiel zeigt Abb . 2.86 die Ortskurve eines P T3 -Gliedes und eine Kurvenschar , wie sie bei einem Fuzzy-Hegler entstehen konn te , 1m _ -_ 1_ N(A,ro)
Re
Abb. 2.86 . Harmonische Balance mit frequenzabhangiger Beschreibungsfunktion
204
2. Regelungstechnische Grundlagen
Sollte iiberh aup t einer der Schnittpunkte eine Schwingung im System kenn zeichnen , so wird es sich auf jeden Fall urn einen stabilen Grenzzyklus hand eln. Zur Erkl arung sei angenommen, dass sich das System in einem Schnittpunkt befindet und eine Schwingung ausfiihrt . Falls dur ch eine Storu ng die Amplitude verkleinert wird , so nah ert sich das System auf der ents prechenden Kurve der Kurvenschar dem Ursprung und befindet sich dadur ch in einem Punkt, der von der Ortskurve umschlossen wird. Die Phasendre hung der Ortskurve urn diesen Punkt ist negativ, wiihrend sie laut Nyquist-Kriterium fiir ein stabiles System Null betragen miisste. Es liegt Instabilitat vor, die Schwingung klingt wieder auf, und das System wandert zuriick in den Schnittpunkt . Falls sich das Syst em dagegen im Schnittpunkt befindet und die Amplitude dur ch eine Storung vergrofe rt wird , so entfernt sich das Syst em auf einer Kurve der Kurvenschar vom Ursprung. Die Phasendrehun g der Ortskurve urn den dann vom System eingenommenen Punkt betriigt Null. Es liegt Stabilitiit vor , die Schwingung klingt ab, und das System wandert auch hier wieder zuriick in den Schnittpunkt . 1m Gegensatz zu vorher reprase ntiert jetzt aber nicht mehr jeder Schnittpunkt eine mogliche Schwingung. Bisher wurde in einem Schnitt punk t dur ch die Kurve der Beschreibun gsfunkt ion die Amplitude und dur ch die Ortskurve des linear en Teiles die Frequenz der Schwingung definiert , und jeder Schnittpunkt ents prach einer moglichen Losung der Gleichung (2.249). Jetzt ist die Kurve der Beschreibun gsfunktion dagegen zusiitzlich noch frequenzabh iingig. Damit ein Schnittpunkt eine mogliche Schwingung reprasenti ert , miissen die durch die Kurve der Beschreibun gsfunk tion und die durch die Ortskurve des linearen Teiles im Schnittpunkt gegebenen Frequenzen iibereinstimmen. Nur dann ist diese Frequenz auch die Frequenz einer moglichen Schwingung. Die Ampl itude ergibt sich nach wie vor aus der Kurve der Beschreibu ngsfunkt ion. Offenbar ist eine graphische Losung unter diesen Bedingungen reiner Zufall, so dass zur Er mittlung der Werte fiir Amplit ude und Frequenz der Schwingung von vorn herein nur eine nummerische Losung der (2.249) entsprechenden Gleichung .
1
G(Jw) = - N( A,w)
(2.262)
in Frage kommt. Auf numm erischem Wege lasst sich auch die Beschreibungsfunktion N (A ,w) selbst grundsiitzlich immer bestimmen. Dies bietet sich an, wenn vom nichtlin earen Teil iiberhaup t keine analytische Beschreibun g vorliegt, wie dies vor allem bei einem Fuzzy-Regler der Fall ist. Dazu wird ein best immtes Werte paar (A l , wt} vorgegeben und die entsp rechende Sinusschwingung am Eingang des nichtlin ear en Teiles aufgeschaltet. An seinem Ausgang wird sich eine periodische Schwingung einstellen, die aber nicht unbedingt einer Sinusschwingung ents pricht . Mit der Methode der kleinsten Fehlerquadrate kann sie jedoch durch eine Sinusschwingung approximiert werden. Ein Vergleich dieser approximierenden Schwingung mit der Eingangsschwingung
2.8 Nichtlineare Systeme
205
liefert dann die Verst arkung V und die Phasenverzogerung - cp des nichtlinear en Teiles fiir das Wert epaar (A I , WI) ' Dies fiihrt aber auch sofort auf den (komplexen) Wert N (AI ,WI ) der Beschreibungsfunktion. Auf diese Art und Weise kann die Beschreibungsfunktion punktweise ermitte lt werden. In [187J wird sogar eine Erweiterun g des Verfahr ens auf Mehrgrobensysteme diskutiert . Diese Erweiteru ng erfordert aber Voraussetzungen beim Syste m, die im Anwendun gsfall nicht nachzupriifen sind. Eine Stabilitatsanalyse mit diesem Verfahren steht damit auf recht unsicherem Fundament , so dass hier auf eine Darstellung von vornherein verzichtet werden soli.
2.8.7 Popov-Kriterium Dami t kann zu einem anderen Verfahren iibergegangen werden , das auf dem Stabilitatskriterium von Popov basiert. Im Gegensatz zur Methode der harmonischen Balance ist es ein exaktes Kriterium. Allerdings kann es in Einzelfallen zu sehr konservativen Ergebnissen fiihren , da es zwar hinr eichend , abe r nicht notwendig ist . Das bedeut et , dass die Stabilitat eines stabilen Systems moglicherweise nicht nachgewiesen werden kann. Andererseits ist es einfach anzuwenden. Voraussetzung ist wieder , dass das Syste m in einen moment an wirkenden, nichtlin earen Teil und einen linear en Teil unterteilt werden kann. Das Verfahr en soli zunachst fiir Eingrofensyst eme vorgest ellt werden. Die Kennlini e des nichtlin earen Teiles und die Ort skurve des linearen Teiles miissen bekannt sein. Urn die Formulierung des Kriteriums moglichst einfach zu halt en, ist fur den nichtlin earen Teil eine zusat zliche Definition erforderlich (vgl. Abb . 2.87):
Definition 2.24 Ein e Kennlinie f (e) verliiuft im Sekior [k l , k 2 ], wenn gilt
und f (O) = 0
e
Abb. 2 .87. Sektor einer Kennlinie
(2.263)
206
2. Regelungsteehnisehe Grundlagen
Damit kann das Pop ov-K riterium formuliert werden , dessen Beweis mit Hilfc der dire kten Methode von Ljapunov erfolgen kann , auf den hier aber verzichtet werde n soli (siehe [2]): Sa t z 2.25 (P opov-Krite rium) Gegeben sei ein geschlossen er Kreis, best ehend aus eine m lin earen und eine m nichtlinearen Teil. Die Ubertraquuqsfunktion G(s) des lin earen Teiles sei rein rational, habe ausschli efJlich P olstellen m it n egati vem R ealt eil und eine n Verstiirkungsfaktor Vi = 1. W eit erh in sei die Ordnung des N ennerpo lynoms grafJer als die des Ziihlerpolynoms. D er nichtlin eare Teil sei durch eine ein deutige und siii ckuieis e ste tige K ennlinie u = f (e) gegeben. Wenn dann die Ungleichung R e((l
1
+ jqw)G(jw)) > - "k
(2.264)
mit 0 < k ~ 00 und beliebigem , en dlichem q fur alle Frequenzeti 0 ~ w < 00 erj iill: ist, so besitzt der R egelkreis fur je de K en nlin ie, die im S ekio r [0, k] verliiujt, eine global asymptotisch stab ile R uhelage fu r u = y = O. Er wird dann auch als absolut stabil im S ektor [0, k] bezeichn et . W enn die rechie S eit e der Ungleichung auch gleich Null (d.h. k = (0) gesetzt werden kann, so ergibt sich ein Sekior [0, 00] . W eist die Funktion G (s) ni cht nur Polstellen m it n egativem R ealt eil, sondern au ch eine Pol st elle auf der imaginiiren A chse auf, so ist zus iitzlich zu m it irgen dei ne m E > 0 zei gen, dass die lin eare Ubertragungsfunktion stabil ist (Grenzstabilitiit) . In dies em Fall ist der zuliissige S ekior fur die nichtline are K en n linie (0, k ]. Tret en tnehrere Polstellen auf der imaginii ren A chs e auf, so ergibt sich n eben der Forderung nach Gren zstab ilitiit als uieit ere Vers chiirfung, dass fur k nur no ch en d liche W ert e zugelassen sind und sich der S ekior abso lut er Stabilitiit auf [C, k ] reduzieri. W eit erh in darf kein e Frequen z existie ren, die das Gleichungssystem
l:;2:{S)
un d
w Im(G(jw) )
=0
(2.265)
erf ullt. D afur is t in (2.264) ober das Gleic hheitszeichen zugelasse n .
Als sehr starke Einschr iinkung mag zunachst die Fordcru ng nach ciner Verstarkun g Vi = 1 des linearen Teiles erseheinen. Dies ist aber nicht so, denn ein Verstiirkungsfaktor Vi =I 1 kann ohne P rob leme dem nicht linearen Teil hinzugerechnet werden. Statt u = f( e) erhalt ma n dann die Kennl inie
u=
Vi f( e) = j(e ).
Auch die Voraussctz ungen fur die lineare Ubert ragungsfunktion sollen kurz erlautert werden . Wenn eine Kennlinie t atsachlich auf der im Satz angegebenen unt eren Sektorgrenze k 1 = 0 verlauft , so bedeutet dies doeh, dass die Stellgr6Be u und damit die Eingangsgr6Be des linearen Teiles immer gleich Null sind . Damit ist ab er der lineare Systemteil ohn e aufiere Einwirkung,
2.8 Nichtlineare Systeme
207
also gewisserma Ben sich selbst ub erlassen . Wenn dann asy mpt ot ische Stabilit at des Gesamtsyst ems gefordert ist , so kann dies nur dadurch gewahrleiste t werden, dass der lineare Teil auch ohne Einwirkung von auBen aus jedem Anfangs zustand zur Ruhe kommen kann. Daraus resultiert wiederum die im Satz formulierte Ford erung nach dem negativen Realt eil siimtlicher Polstellen (vgl. Satz 2.17). Wenn nun die linear e Ubertragun gsfunktion auch rein imag inate Polstellen aufweist (also beispielsweise einen Int egralant eil), wiirde der lineare Syste mte il ohne aufere Einwirkung nicht in den Nullzust and laufen. Deshalb muss in diesem Fall Null als untere Sektorgren ze ausgeschlossen werd en. Diese Einschriinkung des zuliissigen Sektors ist aber noch nicht ausreichend. Zusiitzlich muss noch gezeigt werd en, dass der geschlossene Kr eis tiberh aupt stabilisierbar ist , und zwar durch die Kennlinie f (e) = ceo Der nichtlinear e Teil muss demn ach durch einen linearen Verstiirkun gsfaktor E ersetzt und fur den so ents tandenen, linearen Kr eis
EG(S) 1 + EG (S)
(2.266)
die St abilitiit na chgewiesen werd en. Diese Eigenschaft bezeichnet man als Grenzst abilitiit. Ihr Nachweis ist aber nicht weit er schwierig, da es sich urn ein rein linear es P roblem hand elt. SchlieBlich bleiben noch die Verschiirfungen im letz ten Absatz des Sat zes zu disku t ieren. Die Redu zierun g auf endliche Werte von k bedeutet , dass beispielsweise ein ideales Zweipunktglied nicht mehr die Voraussetzun gen fur eine Anwendung erfiillt, da die Steigung seiner Kennlinie im Nullpunkt unendlich grof ist . Und die Bedingung, dass fiir keine Frequenz das Gleichungssyste m (2.265) erfullt sein darf, ist gleichbedeutend mit der Forderu ng, dass die im Folgend en noch vorgestellte Popov-Or tskurve nicht durch den Punkt 0) laufen dar f, Erweitert werden kann der obige Satz auch fur den Fall, dass der lineare Teil eine Laufzeit ent halt. Die Voraussetzungen des Sat zes sind dann dahingehend zu verscharfen, dass die nicht lineare Kennlinie nicht nur st uckweise stetig , sondern stetig sein muss und weiterhin q jet zt nicht mehr beliebig gewahlt werd en kann, sondern q > 0 gelten muss. Verschiedene andere Spezialfalle, die aber fiir die Praxis nicht mehr so relevan t sind, finden sich in [2]. Man muss sich aber immer dariib er im klaren sein, dass das Popov-Kriterium keine Aussage fur den Fall macht , dass eine Kennlinie den Sektor verlasst . Inst abilitat kann mit dem Pop ov-Krit erium nicht nachgewiesen werd en. Es ste llt sich noch die Frage nach der Vorgehensweise bei der Anwendung auf ein praktisches Problem. Gegeben sind beispielsweise eine nichtlineare Kennlinie und die Ortskurve des linearen Teiles, der wiederum die Voraussetz ungen des Satzes erfiillt . Die Frage ist , ob der geschlossene Kreis stabil ist . Dazu ist mit Hilfe der Ungleichung (2.264) der zuliissige Sektor [0, k] zu
(- t,
208
2. Regelungstechnische Grundlagen
ermitteln und zu tiberpnifen , ob die gegebe ne Kennlinie in diesem Sektor liegt . Zuniichst wird ein beliebiger Wert q fest gelegt und aus der Ungleichung (2.264) der zugehorige Wert k berechnet, mit dem diese Ungleichung fur alle w erfiillt ist . Wenn dann d ie Kenn linie im durch k definiert en Sektor liegt , so ist die Stabilitat des Syst ems nachgewiesen . Ein Prob lem entsteht abe r, wenn eine gegebene Kennlinie in diesem Sekto r nicht ent halte n ist. Da Satz 2.25 nur ein hinreichend es Stabilitatskrite riurn darstellt , lasst sich in diesem Fall keine Aussage machen. Die Frage ist dann, ob ein q existiert, mit dem ma n einen groferen Sekto r erhalte n hatte, Eine ahn liche Frage stellt sich auch, wenn die nichtlineare Kennli nie (z.B. beim Reglerentwurf) erst noch fest gelegt werd en soll. In dem Fall ist man natiirlich daran interessiert , einen rnoglichst groBen Sektor ftir die Kennlinie zur VerfUgung zu hab en. Grundsat zlich sollt e man q also nicht beliebig festlegen , sond ern versuchen , q so zu bestimmen , dass k maximal wird . Fur diese Aufgab e exist iert eine sehr elegante, graphische Losung. Dazu ist zunachst die Popov-Ungleichun g (2.264) umz uschreiben in
Re(G(j w)) - qwIm(G(jw)) >
1
-k
(2.267)
Nun definiert man eine neue Or t skurve G(jw) = x+ Hj mit dem Realt eil x = Re(G(j w)) und dem Imaginar teil y = wIm(G(jw)). Dies ist die sogenannte Popov-Ortskurve. Die Popov-Ungleichun g lau tet mit den Koordinaten dieser Or tskurve _ _ 1 x - qy > - (2.268) k oder umgestellt _ _ 1 x > qy - k (2.269) Diese Ungleichung muss fur alle Werte von w, also ftir jeden Punkt der Or tsku rve, erftillt sein. Der Gre nzfall dieser Ungleichung ist _ _ 1 Xc = qy - k
bzw.
_
Y=
1(_
-q
*
Xc
+-k1)
(2.270)
(2.271)
-to
Durch also eine Gera de mit der Steigung und dem x-Achsenabschnitt diese Grenzgerade wird zu jedem Imaginar teil y der Popov-Or tskurve ein Realt eil Xc vorgegeben . Ande rerse its muss aber der Realteil x der PopovOr tskurve nach Gleichung (2.269) gr6Ber sein als der durch die Gre nzgerade vorgegebene Realteil. Die Ungleichungen (2.269) und da mit (2.264) sind daher nur da nn fur aile Werte von w erfiillt , wenn die Popov-Or tskurve rechts von der Grenzgeraden, d.h. im Bereich gr6Berer Realteile verlauft (Abb. 2.88).
2.8 Nichtlineare Systeme
209
1m
_ 1 a-arctan q
Re
Popov-Ortskurve
/ Abb. 2.88. Graphische Bestimmung des maximalen Sektors Die Vorgehensweise zur Bestimmung der gr6Btm6glichen Sektorgrenze k wird anhand von Abb . 2.88 deutlich. Anhand der gemessenen oder berechnete n Or tskurve des linearen Teiles G(j w) ist zunachst die Popov-Ortskurve zu zeichnen. Dann muss eine Grenzgerade eingezeichnet werd en. Ihre Steigun g ~ ist beliebig, da auch q lau t Satz 2.25 beliebig gewiihlt werd en kann . Allerd ings muss sie links von der Ortskurve verlau fen, damit die Ungleichung (2.264) erfullt ist . Dur ch den Schnit tpunkt - j; der Grenzgeraden mit der reellen Achse wird dann die obere Sekto rgrenze k festgelegt . J e weiter dieser Schnitt punkt rechts liegt , desto gr6Ber ist k. Das maxim ale k ergibt sich offensichtlich, wenn die Grenzgerade wie eingezeichnet annahernd eine Tangent e an die Popov-Or tskurve darstellt. Eine echt e Tangente dar f sie nicht sein, da sonst in der Ungleichung (2.264) auch die Gleichheit zugelassen sein miisste . Diese Unte rscheidung kann aber in der Praxis ruhi gen Gewissens vernac hliissigt werden , da dort wegen der Ungenauigkeit beim Messen und Zeichnen sowieso keine exakt en Werte ermit telt werden. Interessan t fiir die Anwendung ist auch die Moglichkeit einer Sektort ransforma tion. Satz 2.25 geht immer von einer unt eren Sektorgrenze 0 bzw. e aus. Falls nun die Kennlini e in einem beliebigen Sekto r [k1 , k2 1 mit k 1 < 0 liegt , so ist der Satz zunachst einmal nicht anwendbar. In einem solchen Fall ist die Kennlinie u = f (e) zu ersetze n durch die transformiert e Kennlinie Ut = f t (e) = f( e) - k 1 e, wie es in Abb . 2.89 dargest ellt ist . Die neue Kennlinie liegt dann in einem Sektor [0, k] mit k = k 2 - k1 . Diese MaBnahme kann man auch so deuten , dass man in den geschlossenen Kreis par allel zur Nichtlinearitiit ein Proportional glied mit dem Verst iirkungsfaktor -k1 einfugt, so dass dann die Nichtlinearitat f (e) zusam men mit dem Pr oportionalglied gera de die tra nsformiert e Nicht linearitiit ft (e) bildet. Eine solche Veriinderung des Syste ms wiirde natiirlich das Er gebni s der Stabilitatsanalyse verfalschen , Deshalb ist vor Beginn der Rechnung die durch die Kennlinientransform ation erfolgte Vera nderung an and erer St elle wieder aufzuheben. Es biet et sich an, parallel zur transformierten Nicht linearitat It(e) ein weiteres Proporti onalglied mit der Verstarkung k 1 einzufugen, das die Wir kung des erste n Prop orti onalgliedes gerade wieder aufhebt. Dieses
210
2. Regelungstechnische Grundlagen
e
,------{ k] l---------.
- - - - - - - --_ !~~~---- - - - - - w
e
u
, ,, , , , ,,,
u
y
,
J
1
Abb . 2 .89. Sektortr ansformation Proportionalglied wird dann fur die Anal yse allerdings dem linearen Syste mte il hin zugerechnet . Die Fr age ist jetzt , wie die Ubertragun gsfunk tion des veranderten linear en Systemteiles aussieht . In einem nicht transformierten Syst em gilt die Beziehun g e - = -G(s) (2.272) U
1m t ra nsformierte n System nach Abb. 2.89 ergibt sich
(Ut + k1 e)G(s) = - e e
Ut
G(s)
1 + k1G(s) = -Gt(s)
(2.273)
und dami t fur die linear e Ubertragungsfunk tion des tran sformierten Systems
G(s) Gt(s) = 1 + k1G(s)
(2.274)
Ein e Sektortransformation umfasst also zwei Schrit t e: Der Sekt or [k1 , k2 ] wird durch den Sektor [0, k] erset zt mit k = k2 - k 1, und die Ubertragungsfunk tion G(s) des linearen Teiles durch Gt(s) nach (2.274). Auf dieses transformierte Syst em wird dann das Popov-Kriterium angewendet, was bedeutet , dass G t die Vorauss et zungen des Kriteriums fiir den linearen Syst emt eil erfiillen muss.
2.8 Nichtlineare Systeme
211
Kan n dann fur das transformierte System Stabili tat naehgewiesen werden, so gilt dies aueh fur das Original system . Angemerk t sei, dass eine Sektortransformati on aueh fiir k1 > 0 Vorteile bringen kann. Wenn man beispielsweise weiB, dass die Kennlinie im Sekt or [k1 , k 2 ] mit k1 > 0 verlauft, so verkleinert sich dureh die Sekto rt ra nsformation die obere Sektorgrenze k = k2 - k1 und dam it auch der Sektor [0, k]' fur den Stabil it at nachzuweisen ist . Die Bedin gung fiir den linearen Systemteil fallt dadureh offenbar weniger st reng aus. Zum Abschluss soll noeh auf die Erweiteru ng des Verfahrens fur Mehrgr6Bensysteme eingegangen werd en. Die entspreehende Version des PopovKriteriums lautet hier: Satz 2.26 (Popov-Kriterium [iir Mehrgroflens ystem e) Gegeben sei ein S tandardregelkreis, best ehend aus einem lin earen und ein em nichtlin earen Teil, wobei der lineare Teil durch die lineare Ubertragungsmatrix G(s ) und der nichtlin eare Teil durch den Vekt or f defin iert ist . Die Vekt oren e , u un d y haben gleiche Dim ension . Die ein zelnen Ubertragungsjunktionen Gi j (s) der Ubertragungsmatrix weisen nur Pole m it n egativem R ealteil auf. Die einzeln en K omponent en von f best ehen aus stiickweise st etigen, eindeutigen K enn linien, die j eweils nur von der en tsprechen den K omponent e des Eingangsvektors e abhiingig sind (u, = j i (ei)) und in den S ektoren [0, k i] verlauje n. Dann ist der Standardregelkreis global asymptotisch sta bil im Pun kt w = u = y = 0 , wenn die quadratische Ubert ragungsmatrix G p(s) = (I + sQ)G (s) + V
(2.275)
streng positiv reell ist. Dabei ist Q eine beliebige, reelle Diagonalm atrix und
V eine positiv sem idefin it e Diagonalm atrix mit Vii =
t: : : : O.
Sollten die Vektoren u und y nicht dieselbe Dimension aufweisen , so best eht die Moglichkeit , die Vektoren urn zusatzliche (Pseudo-)Komponenten zu erweite rn. Die Erweiteru ng lasst sich durch Einfiigen zweier statischer, linear er Ubert ragungsglieder beschreiben , die sich in ihrer Wirkung gegenseit ig aufheben . Die Vorgehensweise wird im Kapitel 2.8.9 dargest ellt . Die St abili tat im Mehr gr6Benfall ist nach Sat z 2.26 gewahrleistet, wenn die Matrix G p(s ) streng positiv reell ist. Dies bedeutet nach Sat z A.lO im Anh ang unt er and erem, dass ihre Elemente [Gp(S)]ij ausschlieBlich Pole mit negat ivem Realteil aufweisen diirfen. Da die Pole der Element e von G p(s ) gegeniiber denen von G (s ) nieht vera ndert sind und andererseits die Funktion en Gij (s ) lau t Vorau ssetz ung nur Pole mit negativem Realteil besitzen , gilt dies auch ftir die Pole von [Gp(S)] ij. Sollten die Pole der Ubertragungsfunktionen G ij(s ) auch nicht- negative Realteilc aufweisen , so beste ht prin zipiell die Moglichkeit , ein lineares Ru ckkopplungsglied in den linear en Syst emt eil einzufugen und den linear en Syste mte il vor Beginn der eigent liehen Stabilitat san alyse in ein stabiles Syst em umzuform en. Diese Verand erun g des Gesamtsystems muss aber durch
212
2. Regelungstechnische Grundlagen
Einfiigen eines weiteren Elementes an anderer Stelle wieder aufgehoben werden , urn das Syst em in seiner W irkung nicht zu vera ndern, Dieses weite re Element wird im nichtlinearen Systemteil eingefUgt. Auch diese MaBnahme wird im Kapi tel 2.8.9 beschrieb en. Fur die weite ren Ausfiihrungen sei nun vorausgesetzt, dass die Vektoren u und y gleiche Dimension hab en und der lineare Syst emt eil stabil ist , d .h. die Funkt ionen Gij (s) nur Pole mit negat ivem Realt eil besitzen. Nun ist zu iiberp rufen , ob die Matrix G p(s) positiv reell ist bzw. ob die mit G p(s) gebildete Matrix Hp(jw) (entspricht Matrix H aus Sat z A.lO ) fur aIle Frequenzen ausschlieBlich positi ve Eigenwerte aufweist . Falls die Kennl inien des nichtlinearen Teiles mit den Sektorgrenzen k; und damit auch die Elemente von V vorgegebe n sind, so kann man G p und H p mit einer beliebigen Matrix Q bild en und hoffen , dass aIle Eigenwerte von H p (jw) fiir aIle Frequ enzen posit iv sind. 1st dies nicht der Fall, so stellt sich dieselbe Frage wie im Eingrofienfall: Gib t es iiber haupt eine Matrix Q, die auf posit ive Eigenwert e von H p(j w) fuhrt? Und wie findet man diese Matrix? Sinnvoller ist offensichtlich der schon im Ein grofienfall besch ritte ne Losungsweg, namlich von vorn herein die freien P aram eter so zu besti mme n, dass sich moglichst groBe zulass ige Sektoren fiir die nicht linear en Kennlinien ergeben. Zunachst ist festzustellen , dass die zulassigen Sekt oren fiir die nicht linearen Ke nnlin ien durch die Elemente der Diagonalmatrix V vorgegeben werden. Je kleiner die Vii, desto grofer die zulassigen Sektoren. Die Matrix V wird daher zunachst zu Null gesetzt, was bedeutet, dass die obe re Sektorgre nze fiir aIle Kennlinen den Max imalwert 00 ann immt. Dan n wird nach Satz A.I0 die Matrix 1
H p(j w) = 2" (Gp(jw) =
+ G- Tp (jw))
1
-
T
2"((1 + jw Q) G(jw) + G (jw)(1 - jw Q))
(2.276)
mit einer beliebigen Matrix Q gebildet . Auf nummerischem Wege wird nun Q da hingehend optimiert, dass der kleinst e vorkommende Eigenwert von H, (j w) tiber aIle Frequenzen moglichst groB wird . Die Opt imierung wird vorzeiti g abg ebrochen, sobald dieser Wert grofer als Null ist . In dem Fall ist G p mit V = 0 st reng positiv reell, und die zulassigen Sektoren fiir aIle Kennlinien betragen [0, 00]. Falls am Ende der Optimierung der kleinst e vorkomm end e Eigenwert einen Wert J.l < 0 aufweist, so muss V = 1J.lII gewahlt werden. Mit dieser Wahl ergibt sich namlich fiir H p(j w) statt (2.276) gera de 1
H p(j w) = 2"((1 + jw Q) G(jw)
+ G- T (jw)( 1 -
jw Q))
+ 1J.lII
(2.277)
Dadur ch werden aber aIle Eigenwerte der Matrix urn 1J.l1 nach rechts und somit auch der kleinste Eigenwert in den positiven Bereich verschoben. H p(j w) ist dann fur aIle Frequenzen pos it iv definit, d.h. G p mit V = 1J.lII st reng
2.8 Nichtlineare Systeme
213
positiv reell. Die Sektorgrenzen ftir aile Sektoren lauten damit [0, 1~ ll . Selbstverstandlich ist auch eine and ere Wahl von V moglich, die fur einzelne Kennlinien moglicherweise grofe re obere Sektorgrenz en als I ~I zulassen wiirde, doch kann bei verschiedenen Diagonalelement en von V deren Wirkung auf die Eigenwerte von Hp(jw) nicht mehr so einfach vorhergesagt werd en . Auch im Mehrgrofenfall ist die Moglichkeit einer Sektortransformation gegeben. 1m Eingrofienfall geschah die Transformation dadurch, dass sowohl dem nichtlinearen als auch dem linearen Teil jeweils ein Proportionalglied mit der Verstarkung - k 1 bzw. +k 1 hinzu gefilgt wurd e, so dass sich die Wirkun g insgesa mt wieder aufhob (Abb. 2.89). Dieses Proportionalglied wird im Mehr grofienfall durch eine konst ant e Diagonalmatrix D erset zt . Es ergibt sich fur die Komp onent en des neuen nichtlin earen Ubert ragun gsverhaltens f' :
f:( ei) = f;( ei) - diiei
(2.278)
und fur den linearen Teil (vgl. Abb . 2.89 und Gleichung (2.274) ) (2.279) AbschlieBend ist zu sagen, dass das Popov-Kriterium zumindest im Eingrofienfall recht einfach anzuwenden und dami t ftir die Praxis gut geeignet ist. Die benotigten Informati onen iiber das Syst em sind leicht zu beschaffen. Fur den linearen Syst emteil reicht der gemessene Frequenzgang (bzw. im Mehr grofenfall die verschiedenen Frequenzgange Gij (j w)) aus, wahrend ftir den nichtlinearen Teil nur der Sektor bekannt sein muss, in dem die Kennlinie verlauft . Daftir liefert das Popov-Kriterium, da es nur ein hinreichendes Kriterium ist , sehr konser vative Ergebni sse, d.h. oft kann mit dem PopovKriterium kein St abilitatsnachweis erbracht werd en, obwohl das Syst em stabil ist. 1m Mehrgroflenfall ist das Popov-Kri terium wohl eher selten anwendbar, und zwar wegen der sehr einschrankenden Bedin gun g, dass jede Komponente des Ausgangsvektors des nichtlinearen Teiles nur von der jeweiligen Kornponent e des Eingan gsvektors ab hangen darf: Ui = f i(Ci)' Denn dies bedeutet letztendlich, dass z.B. ein nichtlin ear er (Fuzzy-)Mehrgrobenr egler nur cine Parallelschaltung von Eingrofienreglern sein darf. Mit einer solchen Reglerstrukt ur lassen sich aber reale Mehr grofienstrecken , in denen sich eine Eingangsgrofie auf verschiedene Ausgangsgroflen auswirken kann , im allgemeinen nicht regeln. Sinnvoller ist im Mehrgrof enfall sicherlich die Anwendung des Hyp erst abilit atskriteriums, weshalb die fur die Praxis wicht ige Erweiterung aller Vektoren auf gleiche Dimension und die St abilisierung des linearen Syste mte iles wie erwahn t dor t behand elt werden. Nicht unerwahnt bleiben soli hier die beruhmte Vermutung von Aisermann . Sie lautet : Wenn man den nichtlinearen Systemteil U = f( e) durch ein Proportionalglied mit dem Verstarkungsfaktor k 1 erset zt und das so entst andene Gesamtsystem stabil ist und dasselbe auch fur einen Verst iirkun gsfaktor
214
2. Regelungstechnische Grundlagen
k z > k 1 gilt, dann ist das System au ch fur jede beliebige nichtlin ear e Kennlinie im Sektor [k1 , k2 1 stabil. Obwohl diese Vermutung plausib el erscheint, so ist sie doch nicht allgemeingiilt ig. Ein Gegenb eweis findet sich in [54] und Gegenb eispiele gibt es schon fur Systeme zweite r Ordnung. Man kan n die St abili t at eines Syst ems mit einer nichtlinearen Kennlinie eben nicht dadurch abscha t zen, dass man die nichtlineare Kennlinie mit linear en Kennl inien vergleicht. Leider findet sich dieses Vorgehen in der Praxis aber relati v haufig, weshalb hier ausdriicklioh davor gewarnt werd en soli. 2.8.8 Kreiskriterium Das nachste vorgest ellte Stab ilit atskriter ium ist das Kreiskriterium . Es basiert auf gena u denselb en Voraussetzun gen wie das Popov-Kriterium. Auch hier wird von einer Unt erteilun g des Syst ems in einen linearen und einen nichtlinearen Teil ausgegangen, wobei das Ubert ragungsverhalte n des nichtlinear en Teiles aber nicht unb edin gt durch eine st atische Kennlinie darstellbar sein muss. Fur den Eingrofenfall mit einer stat ischen Kennlinie lasst sich das Verfahren relativ einfach herleit en , indem man in der Pop ov-Ungleichun g (2.264) den freien Par am et er q zu Null set zt, einige Umformungen vornimmt und das Erg ebnis graphisch int erpret iert (vgl. [45, 46]). Geradliniger auf Mehrgrofensysteme erweit erb ar ist aber eine Herleitung, die auf der Verwendung von Normen basiert (vgl. [18]). Normen sind schon im Zusammenh an g mit normopt imalen linearen Zust andsreglern erwahnt word en und im Anhang ausfiihrlich behandelt . So lasst sich die Norm einer Ubert rag ungsmatrix als eine Art maximal er Verst arkungsfaktor vorn Ein- zum Ausgan gssignalvektor inte rpret ieren. Es gilt beispielsweise fur die oo-Norm einer linearen Ube rtragungsmatrix G mit y = Gu gemaf Gleichung (A.22)
. IIG(Jw)lloo =
sup sup w
u;ofO
IG(jw)ul 1I u
(2.280)
und fur die oo-Norm einer nichtlinearen Ubertragungsfunktion mit f( e , e , ...) = u laut Gleichung (A.25)
lui Ilflloo = sup -II e;ofO e
(2.281)
wobei e , u und y die Orofien des Regelkreises gemaf Abb. 2.79 darstellen . Fur Eingrofensyst eme wird dara us (vgl. Gleichun g (A.24))
IIG(j w)ll oo
= sup IG(jw)1 w
lui 11/1 100 = sup -II e;ofO e
(2.282)
2.8 Nichtlineare Systeme
215
In einem Regelkreis, der aus einem linearen und einem nichtline aren Teil besteht, gilt mit diesen Definitionen fur die Ausgangsgrofe y = G(jw)f(e,e , ...). Ware f eine lineare Uber tragungsm atrix F , so konnte man schreiben y = GFe, und GF ware die Matrix der Kreisub ert ragungsfunktion, an han d der eine St abilitatsan alyse erfolgen kann . Da f ab er nur als nichtlin eare Vektorfunktion von e definiert ist , existiert keine explizite Kreisube rt ragungsfunkt ion. Es lasst sich lediglich, entsprechend der Definition der einzelnen Normen, der maxi male Ubertragungsfaktor von lei nach Iyl abschat zen , und zwar dur ch das Produkt der einzelnen Normen IIGII IIfII. Weiterhin gilt das small gain theorem, das ebenfalls schon im Zusarnrnenhang mit normoptim alen Zust and sreglern angesprochen wurd e. Es besagt , dass der geschlossene Kreis aus linearem und nichtlin earem Teil sicherlich dann st abil ist , wenn der maxim ale Ubertragungsfaktor von lei nach Iyl kleiner als Eins und auBerdem der lineare Teil fur sich genommen st abil ist . Die erste Bedingung ist leicht einzusehen, denn sie gara nt iert, dass Iyl < lei gilt. Dami t wird dann durch die Riickkopplung ein gegentiber e verkleinerter Vektor y wieder vorn in den Kreis eingespeist, beim Dur chlaufen von fund G weit er verkleinert usw., so dass e , u und y friiher oder spat er gegen Null konvergiercn. Das System ist demnach st abil. Daneben muss der Fall beriicksichtigt werden, wenn die Ausgangsgrofle u des nichtlinearen Teiles konst ant Null ist. Die GroBe y = Gu und damit auch der Ubertragungsfaktor von lei nach Iyl waren fur bcliebige Eingangsvektoren e damit ebcnfalls Null und die erste Bedingung des small gain theorem offenbar erftillt . Der linear e Teil wiirde dann aber keine Anrcgun g von auBen mehr erha lten, weshalb zusat zlich sichergestellt sein muss, dass er auch ohne aufe re Anregung aus jedem beliebigen Anfangszust and wieder zum Ruh ezust and zuriickkehrt. Er muss also stabil sein, was dur ch die zweite Bedingung des small gain th eorem gewahrleistet wird . Mit dem small gain t heorem und der obigen Abschat zung fur den maximalen Ubertragungsfakt or von lei nach Iyl ergibt sich als hinr eichende Bedingung fiir die Stabilitat des aus nichtlinearem und linearem Teil bestehcnden Regelkreises zum einen die Forderung nach der Stabilitat von G sowie die Bedingung (2.283) IIG(jw)1111f11< 1 Wahlt man ftir die Normen jeweils die oo-Norm, so ergibt sich fur ein Mehrgrofiensyst em (2.284) IIG(jw)lloo 11£11 00 < 1 und ftir ein Eingrof ensystem mit (2.282) sup
IG(jw) 1sup lull < 1
w
e# O
e
(2.285)
Die Norm des linear en Teiles ist gerade der maxim ale Abst and der Ortskurve zum Urspru ng, wahrend die Norm des nichtlin ear en Teiles dem betragsmaliig
216
2. Regelungstechnische Grundlagen
groBtmoglichen Verst arkungsfaktor vorn Eingang zum Ausgang des nichtlinear en Ubertragungsgliedes entspricht. Kann man fiir das nichtlin ear e Ubert ragungsverhalten eine obere und untere Sektor grenze angeben wie beispielsweise fur eine Kennlinie nach Abb. 2.87, so ist dieser Verst arkungsfakt or sicherlich kleiner als der maximale Betrag einer Sektorgrenze (2.286)
Einsetz en in Gleichung (2.285) ergibt als neue, verscharfte Bedingung fur die Stabilitat des geschlossenen Kreises sup IG(jw)1 max {lkll , Ik21} < 1
(2.287)
w
bzw. (2.288)
Das Syst em ist also stabil, wenn der Abstand der Ortskurve des stabilen, linear en Teiles vorn Ursprung immer kleiner ist als der Kehrwert des maximalen Betrages einer Sektorgrenze. Demnach ist nur die Sektorgrenze ausschlaggebend, die den grofieren Betrag aufweist . Dann kann man aber doch, ohne das Ergebnis der Ungleichung zu beeinflussen, die andere Sektorgrenze dahingehend verand ern , dass gilt: Ik11 = Ik21 und k1 < 0 < k 2 • Durch diese MaBnahm e vergrofer t sich der zulassige Sekt or fur das nichtli neare Ubertragungsverhalte n, ohne dass die St abilitatsbedingung fur den linearen Teil verscharft wird . Die gleiche Uberlegung lasst sich anstellen, wenn das nichtlin eare Ubert ragungsverhalten bereits vorgegeben ist und durch cinen Sekto r [k1, k 2 ] mit Iki l =1= Ik21 begrenzt wird . Durch eine Sektortransformation von [kl , k 2 ] auf [-k d, kdl mit kd = ~lk2 - kd (Abb. 2.90) and ert sich die rechte Seit e der Ungleichung (2.288) zu Wegen kd < max{ lkll , Ik21} ist sie gr6Ber geworden und die Bedingung ftir den linearen Teil damit nicht mehr so st reng. Diese Bedingung soli im Folgenden hergeleitet werden. Wie beim Popov-Kriterium erfolgt die Sektor- Transformation durch Einfu gen zusatzlicher Proportionalglieder (vgl. Abb. 2.89) , wobei hier der Sckt or ab er nicht urn die unt ere Sektorgrenze k1, sondern urn den Mittelwert km = Hk 1 + k2 ) verdreht wird . Mit kd = ~l k2 - kil wird das nichtlin eare Ubert ragungsverhalte n dann dur ch den symm etrischen Sektor [- kd, kd l begrenzt , und der linear e Systemteil vera ndert sich (vgl. (2.274)) zu
IL.
G(s) Gt(s) = 1 + kmG(s) Aus Gleichung (2.288) wird dann die Bedingung
(2.289)
2.8 Nichtlineare Systeme
217
k.Je
e
Abb. 2.90. Sektortransformation fiir das Kreiskriterium
(2.290) fur aile w. Zu beachten ist, dass der lineare Teil fur das small gain theorem nun nicht mehr G(s) , sondern Gt(s) ist und G t daher eine stabile Ubertragungsfunktion sein muss, wahrend fur G zunachst keine Vorgaben mehr bestehen. Weiterhin ist eine Berechnung von k« und k m nur fur k 2 < 00 moglich, weshalb der Fall k 2 = 00 auszuschlieBen ist . Einsetzen fiir G, und umstellen liefert dann (2.291) Diese Ungleichung wird nun quadriert, wobei die Betragsquadrate durch Produkte der komplexen GraBen mit ihren konjugiert komplexen Werten dargestellt werden :
0< (k;" - kJ)G(jw)G(jw) + km(G(jw) + G(jw)) + 1
(2.292)
Mit k;, - kJ = k 1k2 ergibt sich (2.293) Nun sind in Abhangigkeit der Vorzeichen von k1 und k 2 verschiedene Faile zu unterscheiden. Im ersten Fall sei k 1 k 2 > 0, d.h. beide Sektorgrenzen haben das gleiche Vorzeichen. Dann lasst sich die Ungleichung mit den Abkiirzungen r = 11.1... -.1...1 und m = _1(...L +.1...) umformen zu 2 k k2 2 kl k2 1
IG(jw) -
rnl > r
(2.294)
Die Ortskurve muss also auBerhalb eines Kreises mit dem Radius r und dem Mittelpunkt m verlaufen (Abb. 2.91 oben links). Fiir k 1 < 0 < k 2 erhalt man mit denselben Abkiirzungen
IG(jw) - rn] <
T
(2.295)
218
2. Regelungstechnische Grundlagen
Die Ortskurve muss hier innerhalb des Kreises verlaufen (Abb . 2.91 oben rechts) . Fur k1 = 0, k 2 > 0 entfallt der erste Term in (2.293), und es ergibt sich 1 (2.296) Re(G(jw)) > - k 2
f
Die Ortskurve muss also rechts von der durch - 2 definierten Geraden verlaufen (Abb. 2.91 unten links) . In analoger Weise ergibt sich ftir k: < 0, k 2 = 0 eine Gerade durch - f1 ' von der aus gesehen die Ortskurve links verlaufen muss (Abb. 2.91 unten rechts). j Im(G(jOl))
J!!.l1(G(jOl»
Re(G(jOl))
Re(G(jOl»
j Im(G(jOl»
-k;:I :,
Re(G(jOl))
,,
j Im(G(jOl»
I : Re(G(jOl» --k
I :, , ,
Abb. 2.91. Zum Kreiskriterium
In den letzten drei Fallen tritt aber noch ein weiteres Problem hinzu . Denn prinzipiell ent halt wegen 0 E [k1 , k2 ] jed er von ihnen auch die Moglichkeit einer Kennlinie f( e) = O. Wie schon ftir das Popov-Kriterium und das small gain theorem diskutiert , wiirde damit der lineare Systemteil sich selbst iiberlassen bleiben. Stabilitat des Gesamtsystems kann daher nur dann erreicht werden , wenn der lineare Systemteil fur sich genommen stabil ist . Zur Forderung, dass G t stabil ist und nur Pole mit negativem Realteil aufweist , tritt daher in diesen Fallen die Forderung, dass dies auch ftir G selbst gilt. Fur jede Konstellation von Sektorgrenzen k 1 , k 2 lasst sich also ein verbotenes Gebiet V(k 1 , k2 ) angeben, in dem die Ortskurve des linearen Teiles nicht verlaufen darf, damit der geschlossene Kreis stabil ist . Wenn man eine Gerade als einen Kreis mit unendlichem Radius ansieht, so ist dieses verbotene Gebiet immer kreisforrnig. Daraus resultiert der Name des Kreiskriteriums:
Satz 2.27 (Kreiskriterium) Gegeben sei ein geschlossener Kreis, bestehend aus einem linearen und einem nichtlinearen Teil. Das nichtlineare Ubertra-
2.8 Nichtlineare Systeme
219
gungsverhalten sei durch einen S ektor [kl , k 2 ] m it k 2 < 00 beschriinkt. Falls k l und k 2 verschieden e Vorzeichen haben oder eine der beiden S ektorg renzen gleich Null ist, muss die Ubertragungsjunktion des lin earen Teiles G ( s) stabil
Hk
sein. Di e Funktion Gt( s ) = I+~~~(s) mit k m = l + k 2 ) muss immer sta bil sein und doriiber hinaus auch die Ordnung ihres N enn erpolynom s grojler als die Ordnung des Ziihlerpolynoms . W enn dann die Ortskurve G(jw) fur alle w > 0 aujlerhalb des durch k l un d k 2 gegebenen, verbotene n Gebietes V (k l , k 2 ) verliiuft, so besitzt der geschloss ene K reis eine global asymptotisch stabile Ruhelage fur u = y = o.
Interessant ist es, kur z den Zusamm enhang zwischen dem Kreiskriteriurn und dem Popov-Kri terium sowie der Methode der harmonischen Balance aufzu zeigen. Wie bereit s erwahnt , lasst sich das Kreiskriterium ftlr stat ische Nichtlinearitiiten auch aus dem Popov-Kriterium herleiten, indem man in der Popov-Ungleichun g (2.264) den freien Parameter q zu Null setzt, einige Umformungen vorn immt und das Er gebnis gra phisch int erpretiert (vgl. [45, 46]). Dieser Verzicht auf einen frei wahlb aren Par amet er bed eutet aber eine Verschiirfung einer hinreichenden St abili tiitsb edin gung , so dass das Kreiskrit erium offenba r eine noch konservati vere Aussage als das Popov-Kriterium darstellt . Es kann daher durchaus vorkommen, dass man die Stab ilitiit eines Systems mit dem Kr eiskriterium nicht nachweisen kann , wohl aber mit dem Popov-Kriteriurn . Inst abili t iit kann man mit beiden Krit erien nicht nachweisen, da beide nur hinreichend , aber nicht notwendi g sind . Ahnli ches gilt auch fiir den Zusamm enhang zwischen dem Kr eiskriterium und der Methode der harmonischen Balance. Hier lasst sich na chweisen, dass die fur cine gegebene Kennlinie berechnet e Kurve der Beschreibungsfunktion - N l A) vollstiindig in dem mit dem Kreiskriterium ermit telte n, verbotenen Gebiet V( k 1 , k2 ) liegt [18]. Wird daher mit dem Kreiskriterium Stabilitiit nachgewiesen, d.h . verlau ft die Ortskurve des linearen Teiles auBerha lb des verbotenen Gebietes, so wiirde man auch mit der Methode der Beschreibun gsfunkti on St ab ilitiit nachweisen , da die lineare Ortskurve und die Kurve der Beschreibun gsfunk tion offensicht lich keinen Schnittpunkt aufweisen konnen , In der anderen Richtung gilt diese Folgerung ab er nicht . Denn wenn die Ortskurv e die Kurve der Beschreibungsfunktion nicht schneidet bzw. die durch diese Kurve abgedeckt e Fla che nicht beriihrt, so bedeutet dies noch lange nicht , dass sie auch auBerhalb des wesentli ch gr6Beren , verbotenen Gebiet es des Kreiskriteriums bleibt . Das Kreiskriterium ist also das konservativste der dr ei Kriterien, dafur aber, da es im Gegensatz zu den beiden anderen Kri terien auch fur dynamische Nicht linearit at en gilt , das Kri terium mit dem gri:iBten Anwendungsb ereich, wenn man von einigen Spezialfallen absieht , die im Pop ov-Kriterium noch ent halten sind. Dariiber hinaus ist es offensichtlich von allen drei Kriterien am einfachst en anzuwenden. Die Sektorgrenzen eines nichtlinear en Ubertragun gsgliedes sind einfach zu bestimmen, und die Ortskurve des linearen Syst emt ciles kann man durch eine Messung erh alt en. Es biet et sich dah er im
220
2. Regelungstechnische Grundlagen
Anwendungsfall an , den Stab ilitatsnachweis zunachst mit dem Kreiskri teriurn zu versuchen und nur im Faile eines Misserfolges die anderen Kri terien heranzuz iehen. Eine Ubertrag ung des mit Hilfe des small gain theorem hergeleiteten Kreiskriteriums auf Mehr grof ensyst eme ist nun kein P roblem mehr , obwohl sich hier bei weit em kein so gut han dhabb ares Verfahren zur Uberpnifung der Stabilitat ergibt wie im Eingrof enfall. Ausgangspunkt ist die Ungleichung (2.284) (2.297) IIG(jw)lloo 11£1100 < 1 Die Norm des nichtlinear en Syst ernteiles wird ents prechend Gleichung (2.281) bestimmt:
Ilflloo =
lui
sup -II e#O e
(2.298)
Eine relativ einfache und trotzdem genaue Abschiitzung lasst sich durchftihren , wenn fur jede Komp onent e des Vektors u gilt : Ui = Ji(ei )' J ede dieser nichtlinearen Funk ti onen verlaufe in einem Sekt or [ki 1 , ki 2 ]. Dann fugt man ents prechend Abb . 2.92 zunachst eine Diagonalmatrix M parallel zur Nichtlineari t at ein, urn die Sekto ren in den einzelnen Komp onent en jeweils ftir sich zu symmet rieren. Fur die Elemente von M muss dam it gelte n (2.299)
AnschlieBend wird noch eine Diagonalm atrix H eingefiigt, mit deren Komp onenten die neu entstandenen Kennlini en und damit auch die sym rnetrischen Sektorgrenzen multipliziert werden. Wahlt man (2.300)
so verlauft jede Kennlinie der neu entstandenen Nicht linearitat f' im Sektor [- 1,1]. Das Verhaltnis ~ ist dam it fur jedes i maxim al gleich Eins, weshal b sich die Norm der Nichtlin earitat nach (2.298) durch Ilf'lloo :::; 1 abschat zen
lasst. Die Erweiterung der Nichtlinearitat urn M und H darf natiirlich nicht erfolgen, ohn e auBerhalb von f' , also irn linear en Teil des Regelkreises, entsprechende Matrizen einzufugen, die die Wirkung von M und H gerade kompensieren. Denn sonst wiirde die Stabilitats analyse mit einem veranderten Regelkreis erfolgen, und die resultierenden Stabili tatsaussagen waren ftir das Originalsystem unbrauchbar. Abb. 2.92 zeigt, wie dies geschieht. H wird durch die inverse Matri x H -l kompensiert , und M durch eine andere Matrix M , die mit entge gengesetz tem Vorzeichen parallel geschaltet wird . Insgesamt sind damit die beiden Regelkreise in Abb. 2.92 aquivalent, Fur den unt eren, erweiterten Regelkreis ergibt sich fiir das linear e Ubertrag ungsverha lten von u' nach e
2.8 Nichtlineare Systeme
G' =
(I -
GM)-IGH- 1
221 (2.301)
und fur die St abilitat sforderung (2.297)
IIG'(jw) lloo 11£' 1100 < 1 Mit
11£' 1100 < 1 wird
(2.302)
daraus die Forderung
11(1- GM)-IGH- 1 1100 < 1
(2.303)
Diese Ungleichung ist sicherlich erftillt , wenn (2.304) gilt . Aus (A.20) folgt sofort 1
- 1
11(1 - GM) 1100 = III - GMll oo
(2.305)
und damit (2.306) Da die Berechnun g der oo-Norm mitt lerweile in jedem regelungstechnischen Software-Tool ent ha lten ist , lasst sich diese Bedingung quasi auf Knopfdruck ub erpriifen. Falls eine algebraische Losung angest rebt wird , kann man die 00Norm auch durch andere, leichter zu berechnende Normen abscha tzen (vgl. [18]). Eine solche Abschat zung kann allerdings sehr grob sein. AbschlieBend muss dann noch wie im Eingroflenfall die Stabilitat von G und G' nachgewiesen werden, was abe r ein rein lineares Problem und somit nicht besonders schwierig ist.
f ee) w
e
, ,, , ,,, , , ~
•
•
,
J
Abb. 2.92. Sektortran sformation im Mehrgroflenfall
222
2. Regelungstechnische Grundlagen
2.8.9 Hyperstabilitat Urn das nachste Stabilitiitskriterium vorstellen zu konnen, muss zunachst ein neuer, strengerer Stabilitiitsbegriff als der von Ljapunov eingefuhrt werden, und zwar die Hyperstabilitat [154, 155]:
Definition 2.28 Gegeben sei ein lineares, steuer- und beobachtbares System mit dem Zustandsvektor x, dessen Eingangsvektor u(t) und Ausgangsvektor y(t) dieselbe Dimension haben. x(O) ist der AnJangszustand. Damit ist y(t) von x(O) und u(t) abhiingig. Das System heiflt hyperstabil, wenn fur jeden Anfangszustand, jeden Eingangsvektor und jedes (30 gleichung
> 0 aus der Integralun(2.307)
fur alle T > 0 die Ungleichung Ix(t)1 ::; (30 + (31Ix(0)1 fur alle 0 < t < T mit einer beliebigen positiven Konstanten (31 folgt. Konvergiert dariiber hinaus der Zustandsvektor gegen Null, lim x(t) = 0, so heiflt das System asymptotisch t-i-co
hyperstabil.
Die Idee dieser Definition lautet: Wenn das Produkt aus Ein- und Ausgangsgrofen eines hyperstabilen Systems in einem gewissen Sinne beschrankt ist, so bleiben auch die Zustandsgrofen beschriinkt. Die Voraussetzung gleicher Dimension ftir die Ein- und Ausgangsgrofe ist notwendig, weil das Produkt u T y sonst nicht gebildet werden kann. Interessant ist ein Vergleich dieser Definition mit den bisher verwendeten Stabilitiitsdefinitionen. Die ersten beiden Stabilitiitsdefinitionen 2.4 (endliche Sprungantwort) und 2.5 (BIBO-Stabilitiit) bezogen sich auf die Reaktion des Systemausgangs auf eine Eingangsgrofie, wahrend die Definition nach Ljapunov 2.21 das interne Verhalten des Systems (Zustandsgrofen) ohne iiuBere Anregung als Reaktion auf einen Anfangszustand betrachtete. Dagegen werden bei der Hyperstabilitat sowohl der Anfangszustand als auch eine aufiere Anregung in Betracht gezogen . Offensichtlich ist ein (asymptotisch) hyperstabiles System auch (asymptotisch) stabil nach Ljapunov. Denn die Ungleichung (2.307) ist sicherlich erfullt fur einen Eingangsvektor u(t) = 0 , d .h. fur ein System ohne iiuBere Anregung. In einem hyperstabilen System ist dann auch der Zustandsvektor beschriinkt durch Ix(t)[ ::; (30+(31Ix(0)1. Damit ist das System aber auch stabil nach Ljapunov. Und die Verschiirfung hinsichtlich asymptotischer Stabilitiit ist sowieso in beiden Definitionen gleich. Ein lineares System, das stabil nach Ljapunov ist, ist aber auch stabil nach den Definitionen 2.4 und 2.5, wie bereits friiher gezeigt wurde. Von allen vorgestellten Stabilitiitsdefinitionen ist daher die Hyperstabilitiit die strengste. Dies kann man auch daran erkennen, dass beispielsweise die Riickkopplung zweier hyperstabiler Systeme HI und H 2 gemiiB Abb . 2.93 wieder ein hyperstabiles System mit der EingangsgroBe
2.8 Nichtlineare Systeme
223
w und der Ausga ngsgrofe y ergibt , wie sich beweisen Iasst . Die Riickkopplung zweier Ljapunov-stabil er Systeme muss dagegen nieht zwangs ldufig wieder auf ein Ljapunov-st abiles System fiihren. w
Abb. 2.93 . Rtickkopplung zweier hyperstabiler Systeme
Anh and der Integralungleiehun g sieht man , dass die Hyp erst abi lit at in gewissem Sinne eine Erw eiterung der im Popov-Kriterium erwahnte n absolute n Stabilitat ist . Absolute St abilitat nach Satz 2.25, beispielsweise im Sekt or [0, (0) , setzt vorau s, dass die Kennlinie f (e) in genau diesem Sektor verliiuft . Diese Bedin gun g lasst sieh aber aueh ausdriieken dureh die Forderu ng f( e)e 2: O. Mit f (e) = u und e = -y wird dar au s uy ::::: O. Der Zusammenh an g mit der Integralungleiehun g ist deut lieh zu erkennen. Der Begriff der Hyp erst abili tiit lasst sieh aueh energet isch deu ten . So lassen sich u und y beispielsweise als Strom und Spannung am Ein gan g einer elekt rischen Sehaltu ng interpr et ieren und die Zustandsgrof e x als interner Energiespeieher, zum Beispiel die Spa nnung an einem Kond ensat or . Das P rodukt aus u un d y entsprieht dann der zugefUhrten elekt risehen Leistung, und das Integral iiber diesem P roduk t der zugefUhrten elekt risehen En ergie. Wenn diese gemaf der Integralungleiehung beschrank t ist , so muss, sofern die Sehaltung hyperstabil ist , aueh die intern gespeieherte Energie und da mit x beschrank t sein. Fiir passive elekt risehe Seha lt ungen t rifft dieser Saehverhalt immer zu, sie sind demn aeh hyp erstabil. Enthalt eine Sehalt ung abe r akt ive Baut eile wie z.B. Verstarker , so ist die Hyp erstabilitiit nicht unbedin gt gegeben. Anzumerken ist noeh, dass die hier angegebene Definition eine st ark vereinfaehte und enger gefasste Version der allgemeinen Definition (vgl. [1 44, 155] ist , die sieh auf niehtlineare, zeitvariante Systerne bezieht , wobei dort zudem noeh die Bet rage dureh verallgemeinerte Funktionen ersetzt sind . Fiir soleh allgemeine Syst eme ergeben sieh dann aber keine pr aktiseh anwendba ren Stabilitiitskriterien mehr. Stattdessen soli hier , ausgehend von der eng gefasste n Definition fur lineare Syste rne, ein St abili tatskriterium fiir den Standardregelkreis naeh Abb . 2.79 entwiekelt werd en . Die betraehtete Ruhelage sei w = y = 0 , andern falls ist das System geeignet umzud efinieren. Erfiill t nun der niehtlineare Teil die Ungleiehung (2.308)
224
2. Regelungstechnische Grundlagen
ftir aile T > 0, dann erfiillen wegen e = -y offensiehtlieh die Ein- und Ausgangsgroflen u und y des linearen Systemteiles aueh die Voraussetzung (2.307) aus Definition 2.28. Wenn dann noeh gezeigt werden kann, dass der lineare Systemteil hyperstabil ist, so ist garantiert, dass seine Zustandsgrofen beschrankt bleiben, und zwar unabhangig vom internen Verhalten des nichtlinearen Systemteiles. 1m Falle asymptotiseher Hyperstabilitat konvergieren die Zustandsgrofen sogar gegen Null. Wenn man daruber hinaus fordert , dass der niehtlineare Systemteil keine internen Zustandsgrofen enthalt, so kann es keine Zustandsgrofien im Gesamtsystem geben , die nicht gegen Null konvergieren. Das bedeutet aber doeh , dass das Gesamtsystem in der Ruhelage x = 0 asymptotiseh stabil im Ljapunovschen Sinne ist. Damit gilt .
Satz 2.29 Der nichtlineare Standardregelkreis hat filr den Sollwert w = 0 die (asymptotisch) stabile Ruhelage x = 0, wenn das lineare Teilsystem (asymptotisch) hyperstabil ist und das statische, nichtlineare Teilsystem filr alle T > 0 die Integralungleichung
(2.309)
erfilllt .
Was ist aber zu tun, wenn der nichtlineare Teil nicht statiseh ist, sondern ebenfalls interne Zustandsgroflen enthalt? Wie schon gesagt , haben interne Vorgange im nichtlinearen Teil keinen Einfluss auf die Beschranktheit der Zustandsgrofen des linearen Teiles, sofern nur die Ungleichung (2.309) eingehalten wird. Damit ein Standardregelkreis mit einem dynamischen niehtlinearen Teil asymptotiseh stabil ist , muss daher lediglieh neben den Bedingungen aus Satz 2.29 sichergestellt sein, dass die Zustandsgrofien des nichtlinearen Teiles gegen Null konvergieren . Dafur gibt es aber kein einfach anzuwendendes, allgemeingliltiges Kriterium, oft jedoeh ermoglicht eine vergleichsweise einfache dynamische Struktur des nichtlinearen Teiles cine Abschatzung des Zustandsgrofenverlaufes gewissermaBen von Hand. Und falls die Zustandsgrofien des niehtlinearen Teiles unter teehnischen Gesichtspunkten sowieso nieht von Interesse sind , kann man auf diese Betrachtung aueh vollig verzichten. Man darf dann allerdings nicht mehr von der asymptotischen Stabilitat des gesamten Systems sprechen, sondern nur noch davon, dass die Zustandsgrofen des linearen Teiles fur den gegebenen Sollwert gegen Null konvergieren. Es stellt sich nun die Frage, wie im Anwendungsfall vorzugehen ist. Oft wird schon die Forderung nach gleicher Dimension der Vektoren u und y das erste Problem darstellen, weil dies in vielen Fallen nicht von vornherein gegeben ist. Meist weist der niehtlineare Teil (z.B. cin Fuzzy-Hegler) mehr Ein- als Ausgangsgrofen auf. Urn hier gleiehe Dimension zu gewiihrleisten, miissen fur den nichtlinearen Systemteil zusatzliche Ausgangsgrofen mit dem
2.8 Nichtlineare Systeme
225
kons t an ten Wert Null definiert werden. Entsprechend ist die Anzahl der Eingangsgr6Ben des linear en Systemteiles zu erhohen und dessen Ubert rag ungsmatrix zu verandern . Nichtlinearer Teil
Linearer Teil
Abb. 2.94. Einftigen zusa t zlicher Matrizen zur Herstellung gleicher Dimension von Ein- und Ausgangsvektoren
Die Definition zusatzlicher Ausgan gsgr6Ben ents pric ht dem EinfUgen zweier Matri zen M und N in den geschlossenen Kr eis (Abb . 2.94). Urn dab ei das System nicht zu verandern , muss die Bedingun g NM = I erftillt sein. In Abb . 2.94 gilt fur die Mat rizen N und M
N= (1 0)
(2.310)
Dadurch wird aus der Ausgan gsgrof e u des nichtlinear en Systemteiles der Ausgan gsvektor u = [u ,O]T und aus der Ube rt ra gungsmatrix (2.311) die qu adratische Ubertrag ungsmat rix (2.312) Dam it weisen beide Syst emteile die gleiche Anzahl an Ein- und Ausgangsgrof en auf. 1m Folgend en wird auf eine explizite Dar stellung der Matrizen M und N verzichtet, d.h . sowohl f als auch G gelte n als entsprechend erweite rte Syst em teile, Nun soll zun achst das linear e Teilsyst em auf Hyp erstabilitiit ub erpruft werden . Dazu wird der folgend e Satz benotigt , der hier aber nicht bewiesen werd en soil: Satz 2.30 Ein lineares, zeitinvariantes, steuer- und beobachtbares Sys tem ist genau dann asymptotisch hyperstabil, wenn es streng positiv reell ist (vgl. K ap. A.6). Wie im Anschluss an Satz A.lO schon erwahnt , ist damit fur die Hyperst abilitat des linearen Syst emteilcs zunachst einmal Vorau ssetzung, dass dieser st abil ist. Sollte dies nicht der Fall sein, so kann man versuchen , durch eine Tr an sform at ion ein stabiles Syst em zu erzeugen. Zu diesem Zweck wird
226
2. Regelungstechnische Grundlagen
fur den linearen Teil eine Riickkopplungsmatrix K eingefUgt, wie es in Abb .
2.95 dar gest ellt ist. Die Matrix D sei zunachst Null. Dann ergibt sich dur ch die Riickkopplung ein neues, lineares System G ' = (I + GK) -lG , dessen Eigenwert e unter gewissen Voraussetz ungen bei geeigneter Wahl von K aile einen negativen Realt eil aufweisen. In der Zust andsdarstellung wird die Wirkung von Knoch etwas deutlicher:
x=
Ax + B(u - Ky) = (A -BKC)x+Bu A'=A-BKC
mit
y
=
Cx
und
D= 0 (2.313)
Verand ert wird also die Syst emmatrix, und die Stabilisierun g kann nur bei einer bestimmten Struktur von A , B und C gelingen. Vorausgeset zt wurd e bei dieser Darst ellung, dass im urspr iinglichen System kein direkter Durchgriff von der Stell- zur Ausgangsgrofle besteht (D = 0) . Grundsatzlich kann das Verfahr en aber auch bei direkt em Dur chgriff angewendet werden. Die Gleichungen werden dann lediglich etwas aufwandiger. Die dur ch das Hinzufiigen von K erfolgte Verand erung des Gesamtsyste ms muss aber an anderer Stelle wieder ruckgangig gemacht werden , da sonst die Stabilit atsanalyse anhand eines veranderten Regelkreises erfolgen wiirde. Man kann sich leicht klarm achen, dass durch das HinzufUgen von K die urspriingliche Eingangsgrofle u des linearen Teiles urn den addit iven Term - Ky verand ert wird . Eine zusatzlich tiber den nichtlinearen Systemteil f par allel geschaltete Mat rix K hebt diese Wirkun g wegen -Ke = +Ky aber gerade wieder auf, so dass das abgebildete , erweite rte System (mit D = 0) gerade dem urspriin glichen Originalsystem entspricht. Fur die St abilitatsanalyse wird demnach der lineare Teil G dur ch G' und der nichtlin eare Teil f durch £1 erset zt. Diese Systemtransfor mation ist der Sektor transformation beim Popov- und Kreiskri terium vergleichbar. Man passt einen gegebenen St and ardregelkreis dur ch Transform ation an die Vorausset zungen des anzuwendenden St abilit at skrit eriums an. Kann dann fiir das transformiert e Syste m St abilitat nachgewiesen werden , so gilt dies auch fur das Originalsyst em. Es liege nun ein st abiles, lineares Syst em G'(s) vor. Nun ist nach Satz A.lO zu prufen, ob die Matri x H'(jw) =
~(G' (jw) + G,T(j w))
(2.31 4)
ftir aile Frequenzen w ausschlieBlich positive Eigenwert e aufweist. Dies kann numm erisch durch gefiihrt werden. Die erforderlichen Schritte sind denen ahnlich, die auch schon beim Popov-Kriterium fiir Mehrgrofensysterne durchgefuhrt wurd en. Wegen der Frequenzabh angigkeit von H' ergibt sich ftir jeden Eigenwert eine frequenzabh angige Kur ve. Sollte diese Kur ve ftir jeden
2.8 Nichtlineare Systeme
227
Eigenwert im Positiven verla ufen, so ist das lineare System G' streng positi v reell. Andernfalls ist wiederu m eine Systemtransformation notwendig (Abb. 2.95). Ziel dieser Transfo rmation ist , den linearen Systemt eil durch Parallelschaltung einer Diagonalmatrix streng positiv reell zu machen, wobei diese Diagonalmatrix aber moglichst kleine Elemente hab en soll. Denn je kleiner die Elemente, desto grofe r sind die zulassigen Sektoren fur das Ubertragungsverhal ten des nichtli nearen Systemteiles, wie spat er noch gezeigt wird . Zu ermitte ln ist zunachst der kleinste auftretende Wert d < 0 aller Eigenwert e von H ' iiber w . Die Addition einer Matrix D = IdlI zu G' fiihrt dann auf das System G" = G' + D mit der zugeord neten Matrix
~ (G"(jw) + G"T(j w) ) = ~(G'(jw) + D + C,T(jw ) + D) = H ' (jw) + IdlI (2.315)
H" (jw) =
Offensichtli ch sind die Eigenwert e von H" gegeniiber denen von H' urn Idl na ch rechts verschob en und deshalb alle positiv. Da G" zudem dieselben, st abilen Pole aufweist wie G' , ist das erweite rte Syst em G " damit streng posit iv reell. Moglich ist auch, die Erweiterung mit einer beliebigen, positiv semidefiniten Diagonalmatrix D dur chzufiihren, deren Element e nicht alle gleich sind. Doch in dem Fall kann kein direkt er Zusamm enhan g zwischen diesen Elementen und der Verschiebung der Eigenwerte von H' angegeben werden. Dies kann wiederum die Bestimrnung der Matrix D sehr schwierig und zeitaufwandi g machen. Urn groBere zulassige Sektoren fiir einzelne nichtlin ear e Kennlinien zu erhalte n, kann eine unt erschiedliche Wahl der Diagonalelemente jedoch manchmal notwendig sein. Die Diagonalmatrix D , dur ch deren Einfiigen der lineare Syst emt eil stre ng positiv reell wird , lasst sich auch anhand der Zust and sdarstellung des Systems und Sat z A.ll berechnen. Dazu wird zunachst eine Matrix L mit gra d(L ) = n beliebig festgelegt . Mit L und gegebener Systemmatrix A' lasst sich dann aus dcr Ljapunov-Glcichung (A.41) cine Matrix P bere chnen. Da es sich bei A ' urn die Systemmatrix des st abilcn Syst ems G' hand elt , sind samtliche Eigenwerte von A' negativ. Aus grad(L) = n folgt , wie bereits im Anhang skizziert , da ss LL T eine symmet rische, positiv definit e Mat rix ist . Damit folgt aus Satz A.6, dass P positiv definit ist lind die Vorausset zung aus Satz A.ll erfiillt . Wegen der Regulari tat ist L invertierb ar , und V ergibt sich aus Gleichung (A.42) zu (2.316) Da schlieBlich D eine Diagonalmatrix sein soll, kann ihre Symmetrie vorausgesetzt werden: D = D T . Damit lasst sich ab er Gleichung (A.43) zur Bestimmung von D umform en:
228
2. Regelungstechnische Grundlagen D =
~ VTV
(2.317)
2
GemaB Abb . 2.95 wird diese Matrix zum stabilen linearen Systemt eil
G'(s) parallel geschalt et . Das entstehende Syst em G"( s) erfullt wegen der Anwendung der Gleichungen (A.41) - (A.43) zur Berechnun g von D sicherlich die Voraussetzungen aus Satz A.ll und ist damit st reng positi v reell. Im Gegensatz zum vorherigen Ansatz ist bei diesem Verfah ren abe r nicht gewahrl eist et , dass die Diagonalelemente von D so klein wie moglich sind. 1m Hinbli ck auf die weitere Verwendung von D ist der vorherige Ansatz daher vorzuziehen. D
D
- - -- -- - - - - -- - -- - - - - -w
e'
e
u'
o o o
u
G(s)
y o o o
o o
,
o
, 1
0 I
f f'
~ - -- - - -- - - - - - - - - - - - - ~ G'
GOO
Abb. 2.95. Erweiterung des linearen Systemteiles zur Cewahrleistung der Hyperstabilit at Die durch das Hinzufiigen von D erfolgte Verand erung des Gcsamt syste ms muss nun an anderer St elle wieder kompensiert werd en. J etzt ist es so, dass durch das Hinzu fugen von D die ursprtingliche Eingangsgrofie des nichtli near en Teiles e urn den addit iven Term - D u' verand ert wird . Diese Wirkung kann durch eine Ruckkopplung mit D tiber den nichtli nearen Teil f' aufgehoben werden. Damit entspricht das abgebildet e, erweiterte Syste m gerade wieder dem urspriinglichen Originalsyst em. Insgesamt wird also fur die St abilit atsanalyse der linear e Teil G durch Gil und der nichtlinear e Teil f durch f " ersetzt. Falls fur das tra nsformierte Syst em Stabilitat nachgewiesen werd en kann , so gilt dies auch fur das Originalsystem. Bevor der letz te und entscheidende Schrit t der Stabilitat sanalyse vorgest ellt wird , sollen zuna chst noch einmal aIle bisherigen Transform ationen aufgelist et werden: • Hinzufiigen zweier Matriz en N und M , urn gleiche Dimension der Vekto ren u und e hzw. y zu erreichen. • Hinzuftigen einer RtickfUhrmatri x K zur St abilisieru ng des linearen Teiles. • HinzufUgen einer parallelgeschalteten Diagonalmat rix D , urn den linearen Teil positi v reell zu machen. Nach den Transform ati onen ist der linear e Teil Gil des t ransformierte n Systems sicher asymp totis ch hyp erst abil. Somit muss zum Nachweis der St a-
2.8 Nichtlineare Systeme
229
bilitat des geschlossenen Kreises jetzt noch gezeigt werden, dass der erweite rte nichtl inear e Syst emteil f" die Ungleichung T
!
u'T e' dt :::::
- fJ5
(2.318)
o bzw.
T
! [f(e) - Ke f[e - D (f (e) - Ke )]dt ::::: o
- fJ6
(2.319)
erftillt . Hinreichend dafiir ist auf jeden Fall, wenn jeweils die i-te Komponent e beider Vekt oren im Int egranden dasselbe Vorzeichen aufweist . Dies flihrt auf die Sekt orb edingung
O<
I i (e )
-
- kTe ei
1 dii
<-
-
falls e ; =I- 0 falls
!i(e) - kTe = O
ei =
0
(2.320)
y.
k, ist also der i-te Zeilenvektor fiir alle i mit dii > 0 und K = [k 1 , k 2 , . . von K . Fur dii = 0 ergibt sich als obere Sektorgrenze 00 . Man sieht , dass der zulassige Sektor umso grofer ist , je kleiner di i gewiihlt wurde , und wie wichtig es daher ist , D so zu wahlen, dass ihre Element e moglichst klein sind. Falls das lineare Syst em von vornh erein stabil ist , entfiillt die Transformat ion mit der Matrix K , und die Sekto rbedingungen lau ten
0<
I i( e )
-
ei
<~ -
Ji( e)
dii
=0
falls e, =I- 0 falls ei = 0
(2.321)
Diese Bedingun gen, zusa mmen mit der Forderu ng, dass der lineare Teil streng positi v reell ist , ents prechen ab er im P rinzip den Forderungen des PopovKriteriums fur Mehrgrofiensysteme. Dies ist nicht verwunder lich, denn Gleichung (2.275) aus dem Popov-Kritcrium kann ftir Q = 0 doch auch dahingehend inte rpre t iert werd en , dass ein stabiles, lineares Syste m G so durch eine Diagonalmatrix V zu erweitern ist, dass es positi v reell wird. Gena u dies wurd e abe r in diesem Kapitel auch durchgefuhr t . Daher sollen kur z die Unt erschiede zwischen beiden Kriterien festgeste llt werden: Das Popov-Kri t erium beinhaltet im Gegensatz zum gerade hergeleiteten Hyperstabilit iit skriteriu m noch eine beliebig wahlbare Matrix Q, die so bestimmt werden kann , dass sich letztendlich moglichst groBe Sektoren fur die nicht linearen Kennli nien ergeben. Insofern stellt das Popov-Kriterium eine Erweiterung des Hyperstabilit atskriteriurns da r. Andererseits gilt das PopovKriterium ab er nur fiir den Spezialfall zeitinvariant er, statischer Kennlinien , die zudem jeweils nur von einer einzigen Komponente des Eingangsvektors
230
2. Regelungstechnische Grundlagen
(Ui = !i(ei)) abhiingig sein durfen. Dagegen muss der nichtlineare Teil beim Hyperstabilitatskriterium nur die Integralungleichung erftillen, Interne Dynamik und beliebige Abhangigkeiten von den Eingangsgr6Ben sind zugelassen . In der Praxis werden die Bedingungen (2.320) bzw. (2.321) nur in sehr einfachen Fallen analytisch uberpriift werden konnen. 1m Normalfall geht dies nur auf nummerischem Wege. Man wird dann eine ausreichend groBe und reprasentative Menge aus der Menge aller Fehlervektoren e festlegen und fur jeden einzelnen Vektor die Bedingungen iiberprilfen miissen. Noch besser ist aber, statt der konservativen Abschatzung (2.320) bzw. (2.321) direkt den Integranden aus (2.319) auszuwerten. Wenn dieser Integrand fur jeden Vektor e aus der reprasentativen Menge von Fehlervektoren positiv ist, dann ist auch Bedingung (2.319) sicher erfullt. Ein ganz einfaches Beispiel solI nun die Anwendung des Hyperstabilitatskriteriums verdeutlichen: Gegeben sei ein Eingr6Bensystem, dessen nichtlinearer Teil aus einer Multiplikation von e(t) mit einer zeitabhiingigen Verstarkung k(t) besteht (Abb. 2.96 oben) . Die Ubertragungsfunktion G(s) des linearen Teiles sei streng positv reell und damit asymptotisch hyperstabil. Urn die asymptotische Stabilitat des Regelkreises in der Ruhelage w = U = Y = 0 nachzuweisen, muss daher nur noch die Integralungleichung (2.309) betrachtet werden. Mit u = ke ergibt sich
J
J
o
0
T
T
u(t)e(t)dt =
k(t)e 2(t)dt
~ -135
(2.322)
Die Dngleichung ist sicher dann erfiillt, wenn der Integrand positiv ist , d.h . wenn k(t) ~ 0 gilt.
~k(l)" ~ , , , , , , ,, e , ~
w
-
-- -
-
-
- -- -
-- ----I
e
I
I
I
I
:-- - - - - - - - - - - - - - - ~
:- - - - - - - - - - - - - - - - - _:
f'
G"
Abb. 2.96. Beispiel zur Anwendung des Hyperstabilitatskriteriums Nun sei die Voraussetzung dahingehend abgeandert, dass die lineare Ubertragungsfunktion zwar asymptotisch stabil, aber nicht hyperstabil ist . Sie besitzt demnach ausschlieBlich Pole mit negativem Realteil, ist aber nicht streng
2.8 Nichtlineare Systeme
231
positiv reelI. Laut Satz A.lO bedeutet dies, dass der Realteil des Frequenzgan ges G(jw) nicht nur positive Werte aufweist, d.h. ein Teil der Ortskurve verlauft in der linken Hiilfte der komp lexen Eb ene. Abb . 2.97 und der untere Teil der Abb . 2.96 verdeutlichen , wie in diesem Fall vorzugehen ist . Die Ortskurve ist so weit nach rechts zu verschieben , dass sie vollst iindig rechts von der imaginaren Achse verlauft , Dies kann durch das Einftigen eines Proportionalgliedes par allel zum linearen Systemteil erreicht werd en. Gleichzeit ig muss diese Veranderung des Gesamtsystems durch eine Riickkopp lung iiber den nichtlinearen Teil wieder komp ensier t werden . Man erhalt schlieBlich einen tra nsfor mierten Regelkreis mit dem linearen Teil Gil (s) und dem nichtlinearen Teil 1". Gil (s) ist streng positiv reell und damit asy mptotisch hyp erst abil. Es ist demnach noch die Integralungleichun g fur den nichtlinearen Teil zu betracht en. Mit
'( ) k(t) '( ) u t = 1 _ dk(t ) e t
(2.323)
ergibt sieh T
T
J
J :~k(t)
o
0
u'(t) e'(t) dt =
1
e'2(t)dt
~ - f35
(2.324)
Die Ungleiehun g ist sicher erfullt fur l~d~(t) ~ 0 bzw. fiir 0 ::; k(t ) < ~. Die I3edin gung ftir k(t ) ist gegeniiber dem erste n Fall eingeschrankt , da G(s) nicht st reng positiv reell ist . j Im(G(jw)) d
j Im(G(jw» d
Re(G (joo))
Re (G (joo))
Abb . 2.97. Verschiebung der Ortskurve zur Erzielung von Hyp erstabilit at AbsehlieBend soli noeh eine Variante des Hyp erstabilitatskriteriums (vgl. [140]) vorgest ellt werd en , die auf Satz A.ll im Anh an g basiert. AuBerd em werd en die moglicherweise notwendi gen Erw eiterungen des linearen Systemteils dazu genutzt , urn zusatzliche Freiheitsgrad e fiir die St abil itatsan alyse zu erhalte n und sie damit weniger konservativ zu machen . Im Gegensat z zur ob igen Darst ellun g der Erwe iterungen wird bei diesem Verfahren zunachst die Stabilisieru ngsmatrix K eingefugt , ansehlieBend die Erweiterung N ftir gleiche Anzahl von Ein- und Ausga ngsgroben der beiden Systemteile (M ergibt sieh dir ekt aus N M = I ) und sehlieBlieh die Diagonalm atrix D , urn den linear en Syst emt eil positiv reelI zu machen . D wird ents prechend der zweiten oben aufgefiihrte n Vari ante berechnet , d.h. D ergibt sich hier mit den Gleiehun gen (A.41) , (2.316) und (2.317) aus einer frei
232
2. Regelungstechnische Grundlagen
wahlbaren, regularen Matrix L. K , N und L lassen sich demnach als Parameter b etrachten , die ftir die St abilit atsanal yse frei unt er Einha ltung von Nebenbedingungen gewahlt werden konnen , Bei Beriicksichtigung von N und M und unter Beachtung der geand erten Reihenfolge der Systemerweiterungen ergibt sich statt Gleichung (2.319) jetzt
J T
(M(f(e) - Ke) f (e - DM(f(e) - Ke) )dt ;:::
-(35
(2.325)
o als Stabilitatsbedingung. Diese Ungleichung ist leicht nachzuvollziehen , wenn man in Abb . 2.95 die Blocke M und N einfiigt, die bei dieser Variant e explizit beriicksichtigt werd en. M wird direkt nach der Subt raktionsstelle von u und Ke eingefiigt, und N direkt vor der Subtraktionsstelle von u ' und Ky. Diese Position ergibt sich aus der Reihenfolge der Erweiterungen. Ein hinr eichendes Krit erium ftir die ErfUllung der Bedingung ist , wenn der Integrand fiir beliebige Werte von e positiv ist :
(M(f(e) - K e) f( e - DM(f(e) - Ke)) ;::: 0
(2.326)
It erativ wird nun ein Optimi erungsverfahren dur chlaufen: Die Matrizen
N , K und L werden in einem erste n Schritt beliebig festgelegt , nat iirlich unte r Beachtung der Randbedingungen, dass L regular ist, eine Matrix M mit NM = I exist iert und K das lineare System stabilisiert. Aus L ergibt sich mit (A.41), (2.316) und (2.317) die Matrix D. Dann wird fur eine geeignete Menge an Wert en e die Ungleichung (2.326) iiberpriift. Falls sie ftir aIle Werte erfiillt ist , gilt das Syste m als stabil. Falls nicht , werden im Rahmen des Optimi erungsverfahrens andere Matrizen N , K und L gewahlt und die gesamte Berechnung erneut dur chgefiihrt . Im Laufe des Verfahrens werden N , K und L so opt imiert, dass die linke Seite von Gleichung (2.326) ftir alle Werte von e rnoglichst groB wird . Das Verfahren wird abgebrochen, sobald sie keine negativen Werte mehr annimmt. P roblematisch ist allerdings, dass kein Gradientenfeld fiir die Abh angigkeit der linken Seit e der Ungleichung (2.326) von den Koeffizient en der drei zu optimierenden Matriz en exist iert. Daher kann die Suche nach den optimalen Koeffizienten nicht syste matisch, sondern nur mit Hilfe eines evolut ionaren Algorithmus erfolgen. Trot zdem ist eine solche Optimierung als sinnvoll zu werten , da das Result at der St ab ilitat sanal yse mit optimi erten Mat rizen sicherlich weniger konservativ ausfallen wird als mit nicht optimi ert en Mat rizen , auch wenn die Optimi erung nicht auf das absolute Optimum fuhrt .
2.8.10 Sliding Mode-RegIer Nachdem nun verschiedene St abilit atskriterien fiir nichtlineare Systeme vorgeste llt wurden, solI jet zt auf ein Regler-Entwurfsverfahren fur Eingrofiensyste rne eingegangen werden. Dieses eignet sich aber, wie spat er noch gezeigt
2.8 Nichtlineare Systeme
233
wird , ebenfalls zur St abilit at sanal yse von Fuzzy-Reglern. Es handelt sich urn den Sliding Mod e-Regle: [148]. Voraussetzung ist ein Stre ckenmodell mit der Zust andsgleichung x (n) (t ) = f(x(t)) + u(t ) + d(t) (2.327) mit dem Zust andsvekt or x = (x , x , ..., x (n- I)f , der St ellgrofie u(t) und einer unb ekannten Storgrof e d(t ). Ein solches Modell ents pricht im linear en Eingrofienfall der Regelungsnorm alform (Abb. 2.50). Der Sollwert Xd muss nicht unb edingt konst ant sein, so dass stat tdessen ein Sollvektor Xd = ( X d , Xd, . . . , x~n- I) ) T eingefUhrt wird. Damit ist auch der Regelfehler e = X d - x dur ch den Fehlervektor e = Xd -x = (e, e,..., e(n-I)f zu erset zen. Ziel der Regelung ist e = 0 , d.h. der Regelfehler und seine samt lichen Ableitungen sollen verschwinden. Nun soll dieses Regelziel aber nicht direkt verfolgt , sondern zunachst durch ein anderes Regelziel erset zt werden , da s durch die Differentialgleichung
a + A)n-I e
0= q(e) = ( at
= e(n- I) +
(2.328)
(n~ 1) Ae(n- 2) + (n; 1) A2e(n-3) + ... + An-I e
= e(n- I) + 9>..(e)
(2.329)
mit A > 0 beschrieben wird. Genligt der Fehlervektor dieser Differentialgleichung, so wird er, ausgehend von jedem beliebigen Anfangszustand , immer gegen Null gehen. Verfolgt man also das Regelziel q = 0, so wird sich das urspriingliche Regelziel von ganz allein einste llen. Dies kann man sich auch anscha ulich klarm achen. Gleichung (2.328) entspricht doch der Differenti algleichung von n - 1 hint ereinand ergeschalt eten P TI-G liedern (Abb . 2.98). Wenn die Eingangsgrobe q Null wird , so gilt dies in der Folge auch fur e und seine n - 1 Ableitungen.
~- - - - - ~
Abb. 2.98. Anschauliche Deutung von q Das neue Regelziel q(e) = 0 soll nun wiederum dur ch eine andere Bedingung ersetzt werden. Und zwar ist doch die Funktion q2(e) sicher iiberall positiv auBer im Regelziel q(e) = O. Wenn man daher gewahrleisten kann , dass fur die Ableitung dieser Funktion immer die Bedingung (2.330)
mit T) 2 0 gilt, so wird q2(e) von jedem beliebigen Anfangswert gegen q2(e) = 0 gehen, womit dann auch q(e) = 0 gilt. q2 lasst sich damit als
234
2. Regelungstechnische Grundlagen
Ljapunov-Funktion deuten. Die Einhaltung der Ungleichung (2.330) fiihrt also dazu , dass irgendwann auch Gleichung (2.328) erfiillt ist. Und daraus result iert wiederum, wie schon gesagt, frtiher oder spater die Erftillung des urspriinglichen Regelzieles e = O. Es ste llt sich die Frage, welchen Vort eil das zweimalige Erset zen des Regelzieles gebracht hat. Gleichung (2.330) lasst sich zunachst etwas einfacher formulieren. Die Berechnung der Ableitung liefert namlich (2.331) und damit
q sgn (q) < -TJ
(2.332)
Mit dieser Formulierung des Regelzieles lasst sich eine Antwort auf die eben geste llte Frage geben. Hatte die urspriingliche Regelaufgabe, das anfangs gegebene System auf einen gegebenen Sollvektor zu regeln, wegen der n - 1 Ableitungen von enoch die Ordnung n , so hat die durch das neue Regelziel (2.332) gegebene Aufgab e offenbar nur noch die Ordnung Eins. Denn die betrachtet e, zu regelnde GroBe kommt in dieser Gleichung nur in der ersten Ableitung VOL Interessant ist auch eine geomet rische Interpret at ion der verschiedenen Regelziele. Die Bedingung q(e) = 0 definiert im durch e aufgespa nnte n, n-dim ensionalen Raum eine Hyperflache. Das System wird bei Einhaltung der Ungleichung (2.330) bzw. (2.332) gezwungen, sich dieser Hyp erflache zu nahern , und kann sie nach ihrem Er reichen nicht mehr verIassen. Auf der Hyp erflache gleitet das System dann von allein in den Punkt e = 0 hinein. q(e) = 0 wird daher auch als sliding surface bezeichnet . Abb . 2.99 verdeutlicht dies fiir den Fall n = 2. Die Hyperflache best eht hier wegen 0 = q(e) = e + .Ae aus einer Geraden dur ch den Ursprung der e - e- Ebene. Die anderen eingezeichnete n Geraden sowie die Variable P werden spate r erlautert .
/ \ "'
e=-Ae
e
,,(,~ \
\ q=+
, q=O q=-
Abb. 2.99 . Zur Sliding Mode-Regelung Die Frage ist nun , wie die Stellgrofie beschaffen sein muss, damit Ungleichung (2.332) immer erfiillt ist . Nach (2.329) ergibt sich zunachst q = e (n -l)
q=
e(n)
+ g).,(e)
+ g)Je) =
x~, )
- x(n)
+ g).,(e )
(2.333)
2.8 Nichtlineare Systeme
235
und mit (2.327)
q = g).,(e) -
f(x) - u - d + x~n)
(2.334)
Dar aus folgt fur die Ungleichung (2.332) (2.335) Die Funktion
f lasst sich zerlegen in f
= fa + L1f
(2.336)
Dab ei kenn zeichnet fa das nominale Streckenmodell, d.h . den Ant eil des Streckenmodells, von dem man weiB, dass er richt ig ist , wahr end L1f die Modellunsicherheit darstell t. Wahlt man dann fur die Stellgrofie
u = - fo(x)
+ g)., (e) + x~n) + Usgn(q)
(2.337)
mit einem konst anten , spater zu bestimmenden Wert U, so wird aus Ungleichung (2.335) (- L1 f( x ) - d) sgn(q) - U < -TJ (2.338) Die Modellunsicherheit L1f und die Storgrofe d sollen durch obere Grenzen abschatzbar sein: (2.339) Idl < D lL1fl < F Dann ist die Ungleichung (2.338) und damit auch (2.330) sieher erfiillt, wenn
U= F + D+ TJ
(2.340)
gilt, und aus (2.337) folgt fur die Stellgrofie
u = - f a(x ) + g>, (e) + x~n)
+ (F + D + TJ) sgn(q)
(2.341)
Damit ist der Sliding Mode-Regler definiert. Die erst en drei Summand en kann man als inverses Streekenmod ell auffassen, wahr end der let zte Sum mand im wesentli ehen dureh die Modellunsieherheit en und Storungen hervorgerufen wird. Weiterhin lasst sich ablesen, dass fur eine solche Regelun g zunachs t die Streeke in der Form (2.327) darstellbar und das zugehorige Streekenmodell fa auch bekann t sein muss. Dab ei ist eine Modellun sicherh eit L1f zugelassen , deren maxim aler Wert abe r dureh F ab zuschatzen ist . Falls fa unbekannt ist , muss man f a = 0 setze n und F ents preehend gra B wahlen. Ebenfalls abschatz bar sein muss die maxim ale Ampli tude der Storgrofe durch den Wert D . Dariiber hinaus muss der Zust and svektor x gemessen werd en konn en , Mit dem sowieso bekannten Veriauf des Sollwertvektors X d lassen sich dar aus dann aber sofort x~n), der noch benotigte Fehlervektor e = X d - x und damit auch g>,(e) sowie q(e) bestimmen. Die Bestimmung des Fehlervektors birgt allerdings ein Problem . Gemessen wird am Ausgang der Strecke zunachst nur e = Xd - x , benotigt werd en
236
2. Regelungstechnische Grundlagen
aber n Ableitungen fur den Fehlervektor e. Durch einfache diskrete Ableitungen sind diese GraBen jedoch nicht zu gewinnen, da sich das unvermeidliche Messrauschen auf e so stark auf die hoheren Ableitungen auswirken wiirde , dass diese ftir Rechnungen nicht mehr zu gebrauchen waren, e kann daher nur mit Hilfe eines nichtlinearen Beobachters bestimmt werden , der aber wiederum ein relativ prazises Streckenmodell io erfordert. Festzulegen sind schlieBlich noch die Parameter A und TJ. Durch TJ wird nach Ungleichung (2.330) die Annaherungsgeschwindigkeit des Systems an die Hyperflache vorgegeben. Je grofer TJ gewahlt wird, desto schneller nahert sich das System der Hyperflache. Dies erfordert aber auch, wie Gleichung (2.341) zeigt, eine umso grofere Stellgrofe, so dass bei der Festlegung von TJ technische Gesichtspunkte zu berucksichtigen sind. Wahrenddessen wird durch A entsprechend Gleichung (2.329) die HyperHache definiert. Befindet sich das System auf der Hyperflache, so wird durch diese das dynamische Verhalten des Systems vorgegeben. Und zwar geht der Fehler umso schneller gegen Null, je grofler A gewahlt wird . Wie schon fur TJ sind offenbar auch bei der Wahl von A die technischen Gegebenheiten des Systems zu berucksichtigen. Ist A jedoch erst einmal festgelegt, so bestimmt allein dieser Parameter das Systemverhalten auf der Hyperflache, und zwar unabhangig von den Streckenparametern, Storungen oder Anderungen der Streckenparameter. Dies kennzeichnet aber doch gerade eine robuste Regelung, denn bei einer robusten Regelung ist das beabsichtigte Regelverhalten auch dann gewahrleistet, wenn sich die Streckenparameter verandern, Und das MaB fur die Robustheit, d.h. die zulassigen Abweichungen der realen von der nominalen Strecke, ist durch F gegeben. Crundsatzlich kann q(e) anstelle von (2.328) auch durch ein allgemeines Polynom n -2
q(e) =
LCie(i) +e(n-l)
(2.342)
i =O
definiert werden, dessen Koeffizienten c; so zu bestimmen sind, dass alle Nullstellen des Polynoms C(S)
=
S
n -l
+ Cn-2S n -2 + ...+ C1S + Co
(2.343)
einen negativen Realteil aufweisen. Dies bedeutet Stabilitat des entsprechenden linearen Ubertragungsgliedes. Und damit ist sichergestellt, dass mit q(e) = 0 auch e gegen Null konvergiert . Im Gegensatz zu vorher einem freien Parameter A hat man nun n - 1 freie Parameter, mit denen man die Hyperflache besser an die Erfordernisse des Systems anpassen kann. Im konkreten Fall ist diese Anpassung allerdings nicht trivial. Unangenehm an einem Sliding Mode-RegIer nach Gleichung (2.341) ist der unstetige Stellgrofienverlauf bei jedem Vorzeichenwechsel von q. Und zwar fallt der Sprung umso grofler aus, je grofer die Modellungenauigkeit Fund die Abschatzung ftir die Storung D sind . TJ dagegen kann zur Verkleinerung
2.8 Nichtlineare Systeme
237
der Sprunghohe auch zu Null gesetzt werden , da sich dadurch nur die Regelgeschwindigkeit verand ert , Fur ein exaktes Modell und eine ungest6rte Strecke lieBe sich daher ein st etiger Stellgr6Benverlauf erzielen. Da dies aber in der Praxis nie gegeben ist , muss man mit anderen Mitteln versuchen, die Unstetigkeit zu verm eiden, Hier biet et es sich an , die Signumfunktion durch die Funktion
h( ) - { iq : Iq[ < q - sgn(q) : Iql 2':
(2.344)
zu ersetzen (Abb . 2.100). And ererseits war die Signumfunktion im Regelgesetz (2.341) ab er zur Einhaltung der Ungleichung (2.330) erforderlich. Erset zt man sie daher durch h(q), so wird fur Iql < die Ungleichung moglicherweise nicht mehr eingehalten. Als Folge davon kann das mit der Sliding ModeRegelung eigent lieh beabsi chtigte Syst emverhalten fur solche Werte von q nicht mehr garantiert werd en. Durch die Regelung wird nur noeh gewahrleist et , dass das System in die durch Iql < gegebene Zone urn die Hyp erflache q = 0 eintritt und auch dort verbleibt (Abb. 2.99). Es nahert sich dem Zielpunkt, wird ihn jedoch in Anwesenh eit von Modellunsicherh eiten und Storungen nieht exakt erreiehen. And ererseits wird die Zone abe r aueh nieht mehr verlassen. Insofern kann sie als Toleranzb ereich der Regelung anges ehen werden . Je grofier <1> , d.h . je weicher der Verlau f der Stell grofe, desto grofer ist aueh der zu akzept ierende Toleran zbereich. h(q)
q
Abb. 2 .100. Ersatzfunktion fur die Signumfunktion
2.8.11 Nichtlinearer Beohachter
Zum Abschluss dieses Kapitels soli auf ein Problem gan z anderer Art eingegan gen werden. Wie sich noch zeigen wird , ist ein Fuzzy-RegIer oftmals nichts anderes als ein nichtlinearer Zustandsregler. Damit tritt aber dasselbe Problem auf wie schon bei den linearen Zustandsreglern. Es muss namlich der Verlauf der Zustandsgrofen der St reeke bekannt sein. Sofern diese nicht direkt messbar sind, ist daher der Eins atz eines Beobachters erforderlich . Die Grundidee des niehtlinear en Beobaeht ers ist dieselbe wie die des linear en Beobaeht ers. Das nichtlineare Modell der Strecke wird mit den gleichen Stellgrofen u beaufsehlagt wie die Streeke selb er , und die Differenz e zwischen Modell- und Streckenausgang wird als Korrekturterrn , multipliziert mit einer Korrekturmatrix H in das Mod ell zuruckgefuhrt (Abb. 2.101). W ie
238
2. Regelungstechnische Grundlagen
beim linearen Beobacher darf das System jedoch keinen direkt en Durchgriff von der St ellgrofle zur Ausgangsgrofie aufweisen, d.h. gist nur eine Funktion von x und nicht von x und u (wie in Gl. (2.212)) . u
, , ,, , ,, ,
Beobachter
,, ,, ,, ,, ,, 1
e
, , ,, , - ,,
,, ,, , , , , , , ,
J
Abb. 2.101. Nichtlinearer Beobachter Die Frage ist , wie die Matrix H best immt werden kann . Fur allgemeine nichtlineare Systeme existiert dazu kein Algorithmus, der die St abilitat des Beobacht ers und die Exaktheit der geschatzten Wert e garant ieren wurde. Anders ist die Situation bei TSK-Systemen (vgl. Kap . 4.1.3), deren Grundgedanke derselbe ist wie beim bereits vorgestellten Verfahren des Gain Scheduling. Ein TSK-System besteht aus linearen Teilsyst emen , deren Ausgangsgrofen je nach Arbeitspunkt zu einer Cesamt-Ausgangsgrofle des TSK-System s uberlagert werden. Fur einen TSK- Beobacht er wird das Streckenmodell an verschiedenen Arbeitspu nkt en linearisiert , und man erhalt jeweils ein lineares Modell mit den Syst emmatrizen (A i , Hi, C i) . Fur jedes lineare Modell wird dann eine Beobacht er-Korrekturmatrix H i berechnet . Die Matrizen (A i, Hi, C i , H i) bilden dann den linearen Beobachter am Arb eitspunkt i. Analog zur Uberlagerung der linearen Systeme werden die linear en Beobachter zu einem nichtlinearen TSK-B eobachter zusammengefiigt . Die exakte Berechnun gsvorschrift fur die H i solI hier nicht angegeben werd en, da die Formeln sehr umfangreich sind . Sie ist aber sehr ahnlich zu den Verfahren, die in den Kapiteln 4.2.2 fur die St abilitatsan alyse von TSKSyst emen und insbesondere 5.1 fur den Entwurf von TSK-Reglern angegeben sind . Dort wird auch auf Veroffentli chungen hingewiesen, in denen der Entwurf solcher Beobacht er ausfiihrlich dargestellt wird.
3. Fuzzy-Hegler und Regier-Evaluierung
Wah rend in der klassischen Regelungstechnik grundsa tz lich versucht wird , das Verhalten eines Systems mit analytischen Mitteln zu beschreiben und da nn auch mit analytischen Methoden den RegIer zu entwerfen, eignen sich Fuzzy-Syst eme besond ers zur Modellierung vagen Wissens , z.B. tiber einen Prozess oder einen existierenden RegIer . Aus diesern grundsa tz lichen Unterschied resultieren auch die vollig unterschiedlichen Vorgehensweisen zur Losun g eines regelungstechnischen Problems. In der klassischen Regelun gstechnik wird in einem erste n Schritt ein Modell der Strecke gebildet und erst im zweiten Schrit t auf der Basis dieses Modells ein geeigneter Regier entworfen. Man kann somit diese Vorgehensweise als modellorientiert bezeichnen. Im Gegensatz dazu ist der Entwurf cines Fuzzy-Reglers reglerorientiert . Hier wird kein Modell der St recke gebildet , sondern der RegIer wird direkt , gewissermaBen int uitiv ent worfen , wobei diesem Entwurf natiirlich eine gewisse Vorstellun g vom Verh alt en der St recke oder cines exist ierenden Reglers - z.B. cines menschlichen Bedieners - zu Grunde Iiegen muss. Damit biet et sich der Fuzzy-RegIer insbesond ere fiir Syst eme an, von denen kein Streckenmodell vorliegt , oder bei denen das Streckenm odell eine so unglinstige nicht lineare St ru kt ur aufweist , dass ein klassischer Reglerentwurf prak tisch nicht mehr moglich ist . Inwieweit ein Fuzzy-Regier daruber hinaus auch fiir and ere Systeme in Frage kommt , solI am Ende dieses Kapitels disku tiert werd en .
3.1 Mamdani-Regler Das erste Modell eines Fuzzy-Reglers, das wir hier vorst ellen, wurd e 1975 von Mamd ani [116] auf der Grundlage der in [203, 204, 205] publiz ierten allgemeineren Ideen von Zadeh entwickelt . Der Mamd ani-R egler basiert auf einer endlichen Menge R von WennDann-Regeln R E R der Form
R:
( 1) i I f X l is J1R and . . . an d z., X n IS t hen y is /-lR.
K. Michaels et al., Fuzzy-Regelung © Springer-Verlag Berlin Heidelberg 2002
(n ) J1 R
(3.1)
240
3. Fuzzy-Regler und Regler-Evaluierung
Dabei sind Xl , .. ' ,X n Eingangsgroflen des Reglers und Y die Ausgangsgrofe. Ublicherweise stehen die Fuzzy-Mengen p,W bzw. P,R fur linguistische Werte, d.h . fur vage Konzepte wie , ungefiihr null" , "mitt elgroB" oder "negat iv klein", die wiederum durch Fuzzy-Mengen reprasentiert werden . Zur Vereinfachung der Notation verwenden wir im Foigenden auch die Fuzzy-Mengen synonym fur die linguistischen Werte, die sie modellieren. Wesentlich fur das Verstandnis des Mamdani-Reglers ist die Interpretation der Regeln . Die Regeln sind nicht als logische Implikationen aufzufassen, sondern im Sinne einer stuckweise definierten Funktion. Besteht die Regelbasis n aus den Regeln R l , ... , R r , so sollte man sie als stiickweise Definition einer unscharfen Funktion verstehen, d.h.
P,R, falls Xl ~ p,~! und f(Xl""'X n) ~
{
und
Xn
~ p,C;! (3.2)
: P,R r falls Xl ~ p,~; und
ist eine gewohnliche Funktion punktweise tiber einem Produktraum endlicher Mengen in der Form Yl falls Xl
f(Xl ' '' ''Xn) ~
{
= xP)
und ... und Xn = x~n) ,
(3.3)
: Yr fa IIs Xl = Xr(1) un d . . . un d Xn = Xr(n)
gegeben, erhalt man ihren Graphen mittels der Formel r
graph(f) = U(1Tl({xp)})n ... n1Tn({X~n)})n1Ty({y;})).
(3.4)
i= l
Eine "Fuzzifizierung" dieser Formel unter Verwendung des Minimums ftir den Durchschnitt und des Maximums (Supremums) ftir die Vereinigung ergibt als Fuzzy-Graphen der durch die Regelmenge n beschriebenen Funktion die Fuzzy-Menge P,n : Xl X . .. X X n X Y -+ [0,1],
(Xl , .. . , Xn, y)
t-+
sup {min{p,~) (Xt} , ... ,p,C;) (Xn) , P,R(Y)} REn
bzw.
P,n : Xl x . .. (Xl, .. . , Xn , y)
t-+ .
X
Xn
X
Y -+ [0,1],
max {min{p,~: (XI) , .. . , P,~\Xn), P,R, (y)}
tE{I ,.. . ,r }
im FaIle einer endlichen Regelbasis n = {R I , .. . , R; }. Liegt ein konkreter Eingangsvektor (al"'" an) fur die Eingangsgrofien XI, ... , Xn vor, erhalt man als "Ausgangswert" die Fuzzy-Menge
3.1 Mamd ani-Regler
241
Die Fuzzy-Menge fln kann als Fuzzy-Relation tiber den Mengen Xl x ..• X X n und Y int erpret iert werd en. Die Fuzzy-Menge fl~~~~,~.~ ,an ents pricht dann dem Bild der einelement igen Menge {(a l , . . . , an)} bzw. ihrer char akteristischen Funktion unt er der Fuzzy-Relation fln . Im Prinzip konnte daher anstelle eines scharfen Eingangsvektors auch eine Fuzzy-Menge als Eingabe verwendet werd en . Aus diesem Grund wird bei Fuzzy-Reglern haufig von Fuzziiiziettmg gesprochen, d.h. der Eingangsvektor (al, . . . , an ) wird in eine Fuzzy-Menge umgewandelt , was i.A. nur der Darstellung als chara kte rist ische Funktion einer einelementigen Menge ent spricht . Man kann die Fuzzifizierung auch in einem anderen Sinne int erpretieren. Im Abschnitt iiber Fuzzy-Relati onen hab en wir gesehen, dass man das Bild einer Fuzzy-Menge unter einer Fuzzy-Relation erhalt, indem man die FuzzyMenge zylindrisch erweite rt, den Dur chschnitt mit der zylindrischen Erweiterun g mit der Fuzzy-Relation bildet und das Erg ebnis in den Bildraum projiziert . In diesem Sinn e kann man die zylindrische Erweit erung des gemessenen Thples bzw. die zugeh6rige charakteristische Funk t ion als Fuzzifizieru ng auffassen , die fur die Dur chschni ttsbildung mit der Fuzzy-Relation notwendig ist . Abb . 3.1 veranschauli cht diese Vorgehensweise. Urn eine gra fische Darstellung zu errnoglichen, werd en nur eine Eingangsgrofie und die Ausgangsgrofle betrachtet . Im Bild sind dr ei Regeln dar gest ellt , wobei die Fuzzy-Mengen auf der vorderen Achse von links nach rechts den Fuzzy-Mengen auf der nach hinten verlaufenden Achse entsprechend von vorn nach hinten durch die dr ei Regeln zugeordnet werden. Die Fuzzy-Relation fln wird durch die dr ei Pyramiden im Bild repr asent iert. Ist der Eingangswert x gegebe n, so wird durch die zylindrische Erweiteru ng von {x} eine Schnittflache durch die Pyramid en definiert. Die Projektion dieser Schnittflache auf die nach hinten verlaufende Achse ergibt die Fuzzy-Menge Jl~u;put , die den gesuchte n Ausgangswert unscharf charakte risiert . '
Abb. 3.1. Die Proj ektion eines Eingabewertes
Xl
auf die Ausgabe Achse y.
Schematisch lasst sich die Berechnun g des St ellwertes folgend erm aBen veranscha ulichen. In Abb. 3.2 werden zwei Regeln eines Mamda ni-Reglers mit
242
3. Fuzzy-Regler und Regler-Evaluierung
zwei Eingangsgrofien und einer Ausgangsgrofie betrachtet . Zunachst wird nur eine der beiden Regeln - nennen wir sie R - betrachtet. Der ErfUllungsgrad der Pram isse fur die vorliegenden Eingangswert e wird in Form des Minimums der jeweiligen ZugehOrigkeit sgrade zu den entsprechenden Fuzzy-Mengen bestimmt . Die Fuzzy-Menge in der Konklusion der Regel wird dann auf der Hohe des vorher bestimmten Er fUllungsgrades "abgeschnitten" , d.h. als Zugehorigkeitsgrad eines Ausgangswert es ergibt sich das Minimu m aus Zugehorigkeitsgrad zur Konklusions-Fuzzy-Menge und Erfiillungsgrad der Regel. Pr arni
en
Kon k lusio nen
r=t~; •
X2
'L '
_-===ooiL_- .
x,
is ,kross'
y is .gross'
then
I
I-- ---.>}. : j
R2: If
X,
I
XI
is ,se~r gro s' and
X2
is J lein'
I I
!
X,
X2
- ---x,
I '
-~~5:~~~:::i-
then
. y
y is .klein'
Defuzzifizierter Ausgangswert:
y
Abb. 3 .2 . Schemati sche Veranschauli chung des Mamda ni-Reglers
Ist der ErfUllungsgrad der Regel 1, so erhalt man exakt die Konklu sions= J-l~~;;,~t,an ' Kann die Regel im Falle Fuzzy-Menge als Resultat , d .h. des betracht eten Eingangsvektors nicht angewendet werden (ErfUllungsgrad 0), folgt J-l~~;;,~t,an = 0, d.h. aufgrund der Regel kann nichts iiber den Ausgangswert ausgesagt werden. Analog wird mit den anderen Regeln verfahren - in Abb. 3.2 ist nur eine weitere dar gestellt -, so dass man ftir jede Regel R eine Fuzzy-Menge J-l~~;;,~~,an erhalt, die aber nur fur die "feuernden" , d .h. bei dem akt uell vorliegenden Eingangsvektor anwendb aren Regeln nicht identisch 0 ist . Diese
J-l R
3.1 Mamdani-Regler
243
Fuzzy-Mengen miissen im nachst en Schritt zu einer einzeln en , den Ausgangswert cha rakte risierenden Fuzzy-Menge zusammengefasst werden . Urn zu erklaren , auf welche Weise diese Aggregation durchgefUhrt wird , greifen wir noch einma l die Interp ret ation der Regelbasis des Fuzzy-Reglers im Sinn e einer unscharfen, stiickweisen Definit ion einer Funktion (vgl. (3.2)) auf. Bei einer gewohnlichen stiickweise definierten Funktion miissen die einzelnen Falle disjunkt sein bzw. dasselb e Resultat liefern, da sonst der Funktionswert nicht eindeut ig fest gelegt ist . Man st elle sich vor, dass jeder einzelne Fall fur jeden Eingangswert einen "Funkt ionswert" in Form einer Menge vorschre ibt : Trifft der Fall fur den betrachteten Eingan gswert zu , so liefer t er die einelementige Menge mit dem spezifizierten Funkt ionswert. And ernfalls liefert er die leere Menge. Bei dieser Int erpret ation ergibt sich der Funktionswert bzw. die eineleme ntige Menge, die den Funkt ionswert ent ha lt, durch die Vereinigung der sich in den Einzelfallen erge benden Mengen. Aus diesem Grund mu ssen auch die sich aus den Regeln ergebe nden output . . t wer den, was UiibliICh erweise . F uzzy- Mengen J-lR,al ,...,an (d"ISJunktiv] IV vereimg durch die t-Conorm max geschieht , d.h. out put
J-l'R ,al ,·· · ,a n --
{output } max J-l R ,al ,.. .,a n H ER
(3.5)
ist die Ausgangs-Fuzzy-Menge unter der Regelbasis R bei gegeb enem Einga ngsvekt or (aI , ... ,an)' Auf diese Weise ergibt sich fur die beiden in Abb . 3.2 dargest ellt en Regeln die dor t gezeigte Ausgan gs-Fu zzy-Menge. Urn einen konkret en Au sgangswert zu erha lte n, muss fur die AusgangsFuzzy-Menge noch eine Defu zzifizierung vorgenommen werden . Wir beschr anken un s an dieser St elle exemplarisch auf eine heuristische Defuzzifizierungsstrat egie. Am Ende dieses Abschnitts und nach der Einfuhrung der konjunkt iven Regelsyst eme werden wir das T hema der Defuzzifizierung erneu t aufgreifen und tiefer untersuchen . Urn die Grundidee der Defuzzifizierung bei dem Mamdani-Regler zu verst ehen , betrachten wir noch einma l die in Abb. 3.2 bestimmte AusgangsFuzzy-Menge. Die Fuzzy-Mengen in der Konklusion der beiden Regeln interpret ieren wir als uns charfe Werte. Ebenso st ellt die Ergebnis-Fuzzy-Menge eine unscharfe Beschr eibung des gewiinschte n Ausga ngs wertes dar. Int uitiv Iasst sich die Ausgan gs-Fu zzy-Menge in Abb . 3.2 so verst ehen, dass eher ein Wert irn recht en Bereich zu wahl en ist , zu einem gewissen geringeren Gr ad komm t jedo ch auch ein Wer t aus dem linken Bereich in Frage. Diese Interpretation wird auch dadurch gerecht fert igt, dass die Prami sse der erst en Regel, die einen uns charfen Wert im recht en Bereich vorschlagt, besser erftillt ist als die der zweiten . Es sollte daher ein Ausgangswert gewahlt werden der etwas meh r im rechte n Bereich liegt , der also das Er gebn is der ers ten Regel st arker beriicksichti gt als das der zweiten, die zweite Regel aber trot zdem mit beriicksichti gt . Eine Defuzzifizierungsstrategie, die diesem Krit er ium geniigt, ist die Schwerpunkt smethode (Cent er of Gr avity (COG ), Cente r of Area (CO A)) .
244
3. Fuzzy-Regier und Regler-Evaluierung
Als Ausgangswert wird bei dieser Methode der Schwerpunkt (bzw. seine Projektion auf die Ordinate) der Flache unter der Ausgangs-Fuzzy-Menge verwendet, d.h . output d COA( output ) = Jy f.-lR,al, ...,an . y y. (3 .6) f.-lR,al, ...,an J output d y f.-lR,al, ...,a n Y Voraussetzung fur die Anwendbarkeit dieser Methode ist naturlich die Inte. b ar kei output d output di d hi grIer eit d er Fu n ktilOnen f.-lR,al, ... ,a n un f.-lR,al ,...,a n· y, Ie Je oc Immer gegeben sein wird, sofern die in den Regeln auftretenden Fuzzy-Mengen halbwegs "vernunft ige" , z.B. stetige Funktionen reprasentieren. 3.1.1 Hinweise zum Reglerentwurf Bei der Wahl der Fuzzy-Mengen ftir die Eingangsgr6Ben sollte sichergestellt werden, dass der Wertebereich der jeweiligen Eingangsgr6Be vollstandig abgedeckt ist, d.h. dass es fur jeden m6glichen Wert mindestens eine FuzzyMenge existiert, zu der er einen Zugeh6rigkeitsgrad gr6Ber als Null aufweist. Andernfalls kann der Fuzzy-Regier fur diesen Eingangswert keinen Ausgangswert bestimmen. Da die Fuzzy-Mengen ungefahren Wert en oder Bereichen entsprechen sollen, ist eine Beschrankung auf konvexe Fuzzy-Mengen sinnvoll. Dreiecks- und Trapezfunktionen eignen sich besonders gut, da sie parametrisch dargestellt werden konnen und die Bestimmung der Zugeh6rigkeitsgrade keinen groBen Rechenaufwand erfordert. In den Bereichen , wo der Regier sehr sensitiv auf kleine Anderungen einer Eingangsgr613e reagieren muss, soliten sehr schmale Fuzzy-Mengen gewahlt werden , urn eine gute Unterscheidbarkeit der Werte zu gewahrleisten. Dabei ist allerdings zu beachten, dass die Anzahl der moglichen Regeln sehr schnell mit der Anzahl der Fuzzy-Mengen wachst . Bei k i Fuzzy-Mengen fiir die i-te Eingangsgr6Be bestehteine vollstiindige Regelbasis, die jeder Kombination von Fuzzy-Mengen der n Eingangsgr6Ben genau eine Fuzzy-Menge der Ausgangsgr613e zuordnet, aus insgesamt kl . . . . . k n Regeln. Bei vier Eingangsgr613en mit nur jeweils funf Fuzzy-Mengen ergeben sich bereits 625 Regeln. Fur die Wahl der Fuzzy-Mengen ftir die Ausgangsgr6Be gilt ahnliches wie ftir die Eingangsgr6Ben. Sic sollten konvex sein und in den Bereichen, wo ein sehr genauer Ausgangswert wichtig fiir die Strecke ist, sollten schmale FuzzyMenge verwendet werden. Die Wahl der Fuzzy-Mengen fur die Ausgangsgr6Be hangt auBerdem eng mit der Defuzzifikationsstrategie zusammen. Es ist zu beachten, dass z.B. asymmetrische Dreiecksfunktionen der Form A xo-a,xo,xo+b mit a i- b bei der Defuzzifizierung zu Resultaten flihren , die nicht unbedingt der Intuition entsprechen. Feuert nur eine einzige Regel mit dem Erfullungsgrad Eins und alle anderen mit Null, so erhalt man vor der Defuzzifizierung als Ergebnis die Fuzzy-Menge in der Konklusion der Regel. Ist diese cine asymmetrische Dreiecksfunktion A xo-a ,xo,xo+b, folgt COA(Axo-a ,xo,xo+b) i- x o, da der Schwerpunkt des Dreiecks nicht direkt unter der Spitze Xo liegt.
3.1 Mamdani-Regler
245
Ebenso kann mit der Schwerpunktsmethode niemals ein Randwert des Intervalls der Ausgan gswerte erreicht werden , d.h. der Minimal- und Maximalwert der Ausgan gsgrofe ist fur den Fuzzy-R egIer nicht erreichba r. Eine Moglichkeit, dieses P roblem zu losen , besteht da rin, die Fuzzy-Mengen iiber die Intervallgrenzen ftir die Ausgangsgrof e hin aus zu definieren . Dabei sollte sichergestellt werd en , dass dur ch die Defuzzifizierung kein Wert auBerha lb des zulassigen Int ervalls fur die Ausgan gsgrofie berechn et wird bzw . der Ausgangswert dann automat isch durch den ents prechenden Rand wert begrenzt wird . Bei der Festl egun g der Regelbasis sollte man auf Vollstandigkeit achten, d.h. dass fur jeden rnoglichen Ein gangsvektor mindestens eine Regel feuert. Das bedeutet nicht , dass fur jede Kombination von Fuzzy-Mengen der Eingangsgrofien unbedin gt eine Regel mit diesen Fuzzy-Mengen in der Prami sse formuliert werd en muss . Zum einen gewahrleistet eine hinreichende Ube rlappung der Fuzzy-Mengen , dass auch bei einer geringeren Anzahl als der Max ima lzahl der Regeln trotzdem fur jeden Einga ngsvektor noch eine Regel feuert. Zum anderen kann es Kombinationen von Einga ngswerten gebe n, die eine m Systemzustand entsprechen, der nicht erre icht werden kann oder unter keinem Urnstanden erreicht werden darf. Fur diese Falle ist es ub erflussig, Regeln zu formulieren . Weit erh in sollte dar auf geachtet werd en , dass keine Regeln mit derselb en Pram isse und unterschi edlichen Konklusion en exist ieren o Den Ma mdan i-Reg ler, wie er hier vorgestellt wurde, bezeichnet man aufgru nd der Formel (3.5) ftir die Ausgan gs-Fu zzy-Menge J.L~~~~,~.~ ,an auc h als Max-Mi n-Regler. Maximum und Minimum wurden als Interpret ation der Vereinigung bzw , des Durchschni tts in der Form el (3.4) verwendet. Naturlich konnen auch andere t- Normen und t-Conormen an Ste lle des Minimums bzw. des Maximums verwend et werden. In den Anwendungen werde n hau fig das P rodukt als t- Norm und die Bounded Sum 8(0:, {3) = min{ 0: + {3, 1} als t-Co norm bevorzugt . Der Nac hteil des Minimums und des Max imums liegt in der Idempotenz. Die Ausgabe-Fu zzy-Menge J.L~~;;'~~,an einer Regel R wird allein durc h den Einga ngswert best immt , fur den sich der mini male Zugehorigkeitsgrad zu der ents preche nden Fuzzy-Menge in der Prarnisse ergibt. Ein e And erung eines anderen Ein gan gswertes bewirkt ftir die betrachtete Regel erst dann etwas, wenn sie so groB ist, dass sich fur diesen E inga ngswert ein noch kleinerer Zugehorigkeit sgrad ergibt. Wenn die Fuzzy-Mengen J.L~~;;'~~,an mehrerer Regeln zum gleichen Gr ad fiir einen bestimmten Ausgangswert sp rechen, so kann es erwiinsc ht sein, dass dieser Ausgangswert ein grofieres Gewicht erha lte n sollte, als wenn nur eine Regel mit demselben Grad ftir ihn sprechen wiird e. Die Aggregation der Ergebni s-Fuzsy-Mengen der einzelnen Regeln durch das Maximum schlieBt das jedoc h aus, so dass in diesem Fall z.B. die Bounded Sum zu bevorzugen ware.
246
3. Fuzzy-Regier und Regler-Evaluierung
Im Prinzip kann au ch die Berechnu ng des Erflillungsgrades der Pramiss e und der Einflus s, den der Erfiillun gsgrad auf die Fuzzy-Menge in der Konklusion einer Regel hat , auf unterschiedlich e Weise geschehen, d.h. durch unterschiedlich t-Normen realisiert werd en. In einigen Ansat zen wird sogar individuell fur jede einzelne Regel eine passende t-Norm ausgewahlt . Teilweise werd en sogar t- Conormen ftir die Berechnung des Erfullungsgrad es einer Regel zugelassen, die dann naturlich als
R : If X l is Il~) or . . . or
Xn
is /It;)
then y is /l R. gelesen werden muss. Im Sinn e unserer Interpret ation der Regeln als st uckweise Definiti on einer Funktion kann diese Regel durch die n Regeln
Ri
:
If Xi is /l~) then y is /l R .
erset zt werden . In einigen kommerziellen Programmen werd en gewichte te Regeln zugelassen, bei denen die berechneten Ausgab e-Fuzzy-Mengen noch mit dem zugeordneten Gewicht multipliziert werd en. Gewicht e erhohen die Anzahl der frei wahlbaren Par amet er eines Fuzzy-Reglers , ihre Wirkung kann dir ekt durch eine geeignete Wahl der Fuzzy-M engen in der P ram isse oder der Konklusion erzielt werd en und sie erschweren die Interpret ierbarkeit des Reglers . Die Grundidee des Mamdani-Reglers als stiickweise Definition einer unscharfen Funkt ion set zt implizit vora us, dass die Pramissen der Regeln eine unscharfe disjunkte Fallunterscheidung repr asentieren . Wir wollen an dieser St elle diesen Begriff nicht exa kt for malisieren. Missachtet man diese Vorausaussetzung, kann der Fuzzy-R egier ein unerwlin schtes Verhalten zeigen. So kann eine verfeinert e Regelun g nicht durch bloBes hin zufiigen weit erer Regeln erre icht werd en , ohne die bestehend en Fuzzy-Mengen zu verandem, Ais Ex tremb eispiel bet rachten wir die Regel If X is l x t hen y is /y , wobei als Fuzzy-Mengen fiir die Pramisse und die Konklusion die cha ra kteristische Funkt ion des jeweiligen Wertebereichs gewahlt wurde, die also konst ant eins ist. Unabhngig davon welche Regeln man noch hinzufiigt wird die Ausgangs-Fu zzy-Menge immer konst ant eins bleib en. Wi r werden auf dieses Problem noch einmal zuruckkommen, wenn wir die konjunktiven Regelsyst eme einfiihren . Ein weite res Problem der unscharfen disjunkten Fallunterscheidung illustriert Abb. 3.3, in der eine Ausgan gs-Fuzzy-Menge gezeigt wird, deren Defuzzifizierung Schwierigkeit en bereit et . Sollte zwischen den beiden unscharfen Werten die die Dreiecke repr asentie ren interpoliert werden , wie es z.B. die Schwerpunktsmethode t un wiird e?
3.1 Mamdani-Regler
247
Abb. 3.3. Ausgangs-Fuzzy-Mengc bestehend aus zwei nebeneinander liegenden Fuzzy-Mengen.
Das wiird e bedeuten , dass man bei der Defuzzifizierung einen Wert erhalt, dessen Zugehorigkeitsgrad zur Ausgangs-Fuz zy-Men ge Null betriigt , was sicherlich nicht der Intuition ents pricht. Oder st ellen die beiden Dreiecke zwei alt ern at ive Ausgan gswerte dar , von den en einer auszuwiihlen ist ? So konn te die dargest ellte Fuzzy-Menge die Ausgangs-Fu zzy-Menge eines Reglers sein, der ein Auto urn Hindernisse st euern solI. Die Fuzzy-Menge besagt dann, dass man nach links oder nach recht ausweichen soli, aber nicht gerade au s weiter dir ekt auf das Hindernis zufahren sollte . Diese Interpretation st eht im Wid erspruch zum Mamdani-RegIer als stiickweise Definition einer unscharfen Funktion, da die Funktion in diesem Fall nicht wohldefiniert ist , weil einer Eingabe gleichzeit ig zwei unscharfe Werte zugeordnet werd en. 3.1.2 Defuzzifizierungsmethoden In den let zten J ahre n wurden zahlreiche Defuzzifizierungsmethoden vorgeschlagen, die mehr oder wen iger intuitiv auf der Basis entwickelt wurden , dass eine Fuzzy-Menge und keine weit ere Information gegeben ist . Ein systemat ischer Ansat z, der von der Int erpret ation der zu defuzzifizierend en FuzzyMenge ausgeht , fehlt allerdings noch. Ein e allgemeine Defuzzifizierung hat zwei Aufgab en gleichzeit ig auszufuhren, Zum Einen muss aus einer unschar fen Menge eine scharfe Menge errechnet werden, zum andere n muss aus einer Menge von (unscharfen) Wer ten ein Wert ausgewiihlt werd en. Es ist keineswegs eind eutig, in welcher Reihenfolge dies zu geschehen ha t. Beispielsweise konn te auch die Fuzzy-Menge aus Abb. 3.3 defuzzifiziert werd en , indem man zuerst einen der beiden uns charfen Werte, d.h. eines der beiden Dreiecke auswahlt und dann diese Fuzzy-Menge, die nur noch einen uns charfen Wert repr asenti ert , geeignet defuzzifiziert . Urngekehrt konn te ma n zunac hst aus der unscharfen Menge eine scha rfe Menge erzeugen - namlich die Menge, die die beid en Punkte unter den Spit zen der Dreiecke ent ha lt - und dann einen der beiden Punkt auswahlen. Diese Uberlegung en flieBen weder in den axiomatischen Ansatz fiir die Defuzzifizierung [166] noch in die meist en Defuzzifizierungsmethoden ein, die implizit davon ausgehen, das s die zu defuzzifizierend e Fuzzy-Menge nur einen unscharfen Wert und nicht eine Menge unscharfer Werte darst ellt . Wesentlich fur die Wahl der Defuzzifizierungsstrategie ist ebenso die Semantik des zugru nde liegenden Fuzzy-Reglers bzw. des Fuzzy-Systems. Wir werd en im nachst en Abschnitt gena uer erlaute rn, dass der Marnd ani -R egler
248
3. Fuzzy-Regier und Regler-Evaluierung
auf einer Interpolationsphilosophie beruht. Andere Ansatz e t eilen diese Philosophie nicht , wie wir im Abschnitt iiber konjunktive Regelsysteme sehen werden. An dieser Stelle gehen wir noch auf einige Defuzzifizierungsstrategien und ihre Eigenschaften ein , um die Defuzzifizierungsproblematik etwas ausfiihrlicher zu erlautern. Mean-oi-Maxima (MOM) ist eine sehr einfache Defuzzifizierungsstrategie, bei der als Ausgangswert der Mittelwert der Werte mit maximalem Zugehorigkeitsgrad zur Ausgangs-Fuzzy-Menge gewahlt wird . Diese Methode wird in der Praxis nur sehr selten angewandt , da sie bei symmetrischen Fuzzy-Mengen zu einer sprunghaften Regelung fiihrt . Der Ausgangswert bei der Mean-of-Maxima-Methode hangt bei vorgegebenen Eingangswerten allein von der Ausgangs-Fuzzy-Menge ab , die zu der Regel mit dem hochstcn Erfiillungsgrad gehort - sofern nicht zufallig zwei oder mehr Regeln denselb en maximalen Erfiillungsgrad aufweisen, deren zugeordnete AusgangsFuzzy-Mengen auch noch verschieden sind. Werden Fuzzy-Mengen verwendet , die (als reellwertige Funktionen) achsensymmetrisch um einen ihrer Werte mit ZugehOrigkeitsgrad 1 sind , so ergibt sich bei der Mean-of-MaximaMethode dieser Wert fiir die Achsensymmetrie unabhangig vom Erfiillungsgrad der entsprechenden Regel. Das bedeutet, dass der Ausgangswert solange konstant bleibt, wie die zugehorige Regel den maximalen Erfiillungsgrad aufweist . Andern sich die Eingangswerte so, dass eine andere Regel (mit einer anderen Ausgangs-Fuzzy-Menge) den maximalen Erfiillungsgrad liefert, andert sich der Ausgangswert bei MOM sprunghaft. Genau wie die Center-of-AreaMethode ergibt sich auch bei MOM der eventuell unerwiinschte Mittelwert in dem in Abb . 3.3 illustrierten Defuzzifizierungsproblem. In [78] wird eine Methode zur Vermeidung dieses Effektes von COA und MOM vorgeschlagen. Es wird immer der am weitesten rechts (oder alternativ immer der am weitesten links) liegende Wert mit maximalem ZugehOrigkeitsgrad gewahlt. Diese Methode wurde laut [78] patentiert. Ahnlich wie MOM kann sie ab er auch zu sprunghaften And erungen des Ausgangswertes fiihren. Die Schwerpunktsmethode ist relativ rechenaufwandig und besitzt nicht unbedingt die Interpolationseigenschaften, die man erwarten wiirde . Betrachten wir beispielsweise einen Mamdani-Regler mit der folgend en Regelbasis:
If x If x If x If x If x
is is is is is
'ungefahr 'ungefahr 'ungefahr 'ungefahr 'ungefahr
0' l.' 2' 3' 4'
then t hen then then then
is is is is y is
y y y y
'ungefahr 'ungefahr 'ungefahr 'ungefahr 'ungefahr
0' l' 2' 3' 4'
Dabei werden die Terme 'ungefahr 0' ,... , 'ungefahr 4' jeweils durch FuzzyMengen in Form symmetrischer Dreiecksfunktionen der Breite Drei , d.h. durch A_l ,o,i, AO,1,2 , Ai ,2,3 , A 2 ,3 ,4 bzw . A 3 ,4 ,5 dargestellt. Scheinbar beschreiben die Regeln die Gerade y = x . Bei der Anwendung der Schwerpunktsmethode ergibt sich ab er als Funktion die nur bei den Werten 0, 0.5, 1, 1.5,. .. ,
3.2 Takagi-Sugeno-Kang-Regler
249
3.5 und 4 mit dieser Geraden iibereinst immt . An allen anderen St ellen ergeben sich leichte Abweichungen wie Abb . 3.4 zeigt . 4
/ /
3.5
..
3
.:
2.5 2 1.5
0.5
o
17
o
/ 0.5
.:
/
1.5
/
3
2.5
3.5
4
Abb. 3 .4. Interpolation einer Geraden mitt els Schwerpunktmethode Diese und andere unerwimscht e Effekte, wie sie etwa bei der Verwendun g assymetrischer Zugehorigkeit sfunktionen in den Konklu sionen auft rete n konnen , lassen sich vermeiden, indem Regeln verwendet werden, deren Konklusion jeweils aus einem scharfen Wert best eht. Fur die Beschreibung der Eingabewert e verwendet man weit erhin Fuzzy-Mengen, die Ausgab en werden in den Regeln aber scharf vorgegeben. Die Defuzzifizierung gestaltet sich in diesem Fall ebenfalls als sehr einfach: Man bildet den Mittelwert aus den mit den zugehOrigen Erfiillungsgraden der Regeln gewichtete n Ausgab ewerten in den Regeln, d.h, '" output . Y R L. 1
-
Y -
R J.l R ,a" ... ,an
'"
output
(3.7)
L.R Jl R,a , ,...,an
Dab ei liegen die Regeln in der Form
mit den schar fen Ausgab ewerten YR vor. al , ... , an sind die gemessenen Ein.. d'ie E'mgangsgro''6 en Xl, '" , X n un d J.l output . h net WIC . ga b ewerte fur R ,a" ...,a n b ezerc bisher den Erfiillungsgrad der Regel R bei diesen Eingabewerte n.
3.2 Takagi-Sugeno-Kang-Regler Takagi-Sugeno oder Takagi-Sugeno-Kang-Regler (T S- oder TSK-Modelle) [176, 179] verwenden Regeln der Form R : If X l is J.l~ l and . .. and Xn is J.lC;l t hen Y = f R(Xl , " " z., ).
(3.8)
250
3. Fuzzy-Regier und Regler-Evaluierung
Wie bei den Mamdani-Reglern (3.1) werd en die Eingangswerte in den Regeln unscharf beschrieb en. Die Konklusion einer einzelnen Regel besteht bei den TSK-Modellen aber nicht mehr aus einer Fuzzy-Menge, sondern gibt eine von den Eingan gsgr6Ben ab ha ngige Funkti on an. Die Grundidee best eht dab ei darin, dass in dem unscharfen Bereich, der durch die Pramisse der Regel beschreiben wird , die Funktion in der Konklusion eine gute Beschreibung des Ausgan gsgr6Be darst ellt. Werd en beispielsweise lineare Funktionen verwend et , so wird das gewiinscht e Ein-IAusg ab everh alt en lokal (in uns charfen Bereichen) durch linear e Modelle beschrieben. An den Ubergan gen der einzelnen Bereich muss geeignet zwischen den einzelnen Mod ellen inte rpoliert werd en . Dies geschieht mittels y -
2: Rf.lR, UI ,...,Un ' ! R ( X l, " " X n )
-
2:Rf.lR ,UI ,... ,Un
(3.9) •
Hierb ei sind al , ... , an die gemessenen Eingabewerte fiir die Eingan gsgr6Ben x n und f.lR ,UI ,... ,Un bezeichnet den Erfiillungsgrad der Regel R bei diesen Eing abewerten. Ein en Spezialfall des TSK-Modells stellt die Variante des Mamdani-Regler dar , bei dem wir die Fuzzy-Mengen in den Konklusionen der Regeln durch konst ante Werte ersetzt werd en und den Ausgab ewert somit nach Gleichun g (3.7) berechnen. Die Funktionen ! R sind in diesem Fall konst ant. Bei TSK-Modellen fiihrt eine starke Uberlappung der Regeln, d.h . der unscharfen Bereiche, in denen die lokalen Modelle ! R gelte n sollen, dazu , dass die Interpolationsform el (3.9) die einzelnen Modelle vollig verwischen kann . W ir betrachten als Beispiel die folgend en Regeln: X l, .. . ,
If X If x If x If x
is is is is
'sehr klein ' 'klein' 'gra B' 'sehr grofl'
th en th en then th en
y
=X
y= 1 y= x - 2 y = 3
Zun achst sollen die Term e 'sehr klein ', 'klein ', 'grofl' und 'sehr groB' durch die vier Fuzzy-M engen in Abb . 3.5 mod elliert werd en . In diesem Fall werden die vier in den Regeln lokal definierten Funktionen y = x , y = 1, y = x - 2 und y = 3 wie in Abb . 3.5 zu sehen jeweils exakt wiedergegeben. Wahlen wir leicht iiberlappende Fuzzy-Mengen , so berechnet das TSK-Modell die Funktion in Abb. 3.6. In Abb . 3.7 wird schlieBlich das Resultat des TSKModells dar gest ellt , das mit den noch st arker iiberlappend en Fuzzy-Mengen arbeite t . Wir sehen somit, dass das T SK-Modell zu leicht en Uberschwingern fiihren kann (Abb. 3.6), selbst wenn die Fuzzy-Mengen nur eine geringfiigige Uberlappung aufweisen. Bei Fuzzy-Mengen mit einer Ubc rschneidung wie sie bei Mamdani-Reglern durchaus iiblich ist , erkennt man die einzelnen lokalen Funktionen iiberh aupt nicht mehr (Abb. 3.7). Eine sinnvolle Stra t egie, diesen im Allgemeinen unerwiin schten Effekt zu verhindern , besteht in der Vermeidung von Dreiecksfunk tionen, die beim
3.2 Takagi -Sugeno-Kang-Reg ler
251
TSK-Modell besser dur ch Trapezfunktionen ersetzt werd en. Wa hlt man die Trapezfunktionen so, dass eine Uberlappung nur an den Flanken der Trapezfunktionen auft ritt, wird das jeweilige lokale Modell in den Bereichen mit ZugehOrigkeitsgrad Eins exakt wicdergegeben.
2.5
/
1.5
~ ,
,,
,
/
,,
' ~
/
/
0.5
o
/
1/ ·
o
Abb . 3 .5. Vier nicht iiberlappend e Fuzzy-Menge: Exakte Wiedergab e der lokalen Mod elle
2.5
/
1.5
~ ,,
,
~
,,
~ .....
, 0.5
o
J
.....
/
J
/
/
o
Abb. 3.6. Vier gerin gfiigig iiberlappend e Fuzzy-Mengen: Leicht e Verm ischung der lokalen Mod elle ~
2.5
/
/
/
1.5
~
I
....
/
1/
Abb. 3.7. Vier sta rk iiberlappend e Fuzzy-Mengen : Nahezu vollige Verm ischun g der lokalen Mod elle
252
3. Fuzzy-Regier und Regler-Evaluierung
3.3 Logikbasierte RegIer In diesem Abschnitt betrachten wir, welche Konsequenzen sich ergeben, wenn die Regeln eines Fuzzy-Reglers im Sinne von logischen Implikationen interpretiert werden. Wir haben bereits in Beispiel 1.23 gesehen, wie sich eine logische Inferen z mit Hilfe einer Fuzzy-Relation modellieren lasst . Dieses Konzept soll jetzt ftir die Fuzzy-Regelung verwendet werden. Zur Vereinfachung der Darstellung betrachten wir zunachst nur Fuzzy-RegIer mit jeweils einer Eingangsund einer Ausgangsgrofe. Die Regeln haben die Form If x is J1 then Y is
1/.
Bei einer einzelnen Regel dieser Form und einem vorgegebenen Eingangswert x erhalte n wir eine Ausgab e-Fuzzy-Menge nach der Berechnungsvorschrift aus Beispiel 1.23. Genau wie bei dem Mamd ani-Regler ergibt sich als Ausgab e-Fuzzy-Menge exakt die Fuzzy-Menge 1/, wenn der Eingangswert x einen Zugehorigkeitsgrad von Eins zur Fuzzy-Menge J1 aufweist. 1m Gegensatz zum Mamdani-Regler wird die Ausgab e-Fuzzy-Menge umso grofe r, je schlechter der Prarnisse zutrifft, d .h. je geringer der Wert J1(x) wird . Im Ext remfall J1(x) = 0 erhalte n wir als Ausgabe die Fuzzy-Menge, die konstant Eins ist . Der Mamdani-Regler wiirde hier die Fuzzy-Menge, die konstant Null ist , liefern, Bei einem logikbasiert en RegIer sollte die Ausgab e-Fuzzy-Menge daher als Menge der noch moglichen Werte interpret iert werden. Wenn die Pramisse iiberhaupt nicht zutrifft (J1( x) = 0) kann aufgrund der Regel nichts geschlossen werden und alle Ausgab ewert e sind moglich. Trifft die Regel zu 100% zu (J1( x) = 1), so sind nur noch die Werte aus der (unsch arfen) Menge 1/ zulassig. Eine einzelne Regel liefert daher jeweils eine Einschrankung aller noch rnoglichen Wert e. Da alle Regeln als korrekt (wahr) angesehen werden, miissen alle durch die Regeln vorgegebenen Eins chrankungen erfiillt sein, d.h . die resultierenden Fuzzy-Mengen aus den Ein zelregeln miissen im Gegensatz zum Mamdani-Regler mit einand er geschnitten werden. Sind r Regeln der Form
(i=l, ... ,r) vorgegeben, ist die Ausgabe-Fuzzy-Menge bei einem logikbasierten RegIer daher bei der Eingabe x = a
J1~~~' logic : Y
----+
[0,1]'
Y f-+
.
min
t E { l ,... .r }
{[a E J1 Ri
----+
Y E I/RJ}.
Hierbei muss noch die Wahrheitswertfunktion der Implikation legt werden. Mit der Godel-Implikation erhalte n wir
[a E J1Ri
----+
I/K (Y) falls I/Ri(Y) < J1Ri(a) Y E I/RJ = { l ' sonst,
wahrend die Lukasiewicz-Implikation zu
----+
fest ge-
3.3 Logikbasierte Regier
253
fiihrt . 1m Gegensat z zur Godel-Impli kation , bei der sich unsteti ge Ausgab eFuzzy-Mengen ergeben konnen , sind die Ausgabe-Fuz zy-Mengen bei der Lukasiewicz-Implikation immer stetig, sofern die beteiligte n Fuzzy-Mengen (als reelwertige Funk tionen) stetig sind . Wird in den Regcln nicht nur eine Eingan gsgrofe sondern mehrere verwendet , d.h . es liegen Regeln der Form (3.1) vor , so muss der Wert J1R. (a) bei dem Eingangsvekt or (ai , . . . , an) lediglich durch
[al E /1~!
1\ ... 1\
an E /1%)]
ersetzt werden . Fur die auft retende Konjunktion sollte als Wah rheitswertfunktion wiederum eine geeignete t-Norrn gewahlt werd en, z.B. das Minimum, die Lukasiewicz-t-Norm oder das algebraische P rodukt . 1m Faile des Mamdani-Reglers, wo die Regeln unscharfe Punkte repr asentieren, macht es keinen Sinn , Regeln der Art If
XI
is /11 or
X2
is /12 then y is
II.
zu verwenden. Bei logikbasierten Reglern kann jedoch ein beliebiger logischer Ausdruck mit Pradikaten (Fuzzy-Mengen) iiber den Eingangsgrofen in der P ramisse ste hen, so dass Regeln mit Disjunktionen oder auch Negationen bei logikb asierten Reglern durchaus auft reten du rfen [88]. Es miissen nur geeignete Wahrheitswertfunktio nen fiir die Auswertung der verwendeten logischen Op erationen spe zifiziert werden. Auf einen wesentli chen Unterschied zwischen Marndani- und logikbasierten Reglern sollte noch hingewiesen werden. Da jede Regel bei einem logikb asierten RegIer eine Einschrankung (Const ra int) an die Ubert rag ungsfunkt ion darste llt [91], kann die Wahl sehr schmaler Fuzzy-Mengen in der Ausgab e bei (stark) iiberlapp end en Fuzzy-Mengen in der Eingab e dazu fiihren , dass die Einschra nkungen einen Widerspruch ergeben und der RegIer die leere FuzzyMenge (konstant Null) ausgibt . Bei der Spezifikat ion der Fuzzy-Mengen sollte diese Tatsache beru cksichtigt werd en, indem die Fuzzy-Mengen in den Eingangsg roflen eher schmaler , in der Ausgangs grofle eher breiter gewahlt werden . Beim Mamdani-Regler fiihrt eine Erhohung der Anzah l der Regeln, dadurch dass die Ausgab e-Fuzzy-Mengen der einzelnen Regeln vereinigt werden , im allgemeinen zu einer weniger scharfen Ausgabe. 1m Ex tremfall bewirkt die t riviale aber inh altslose Regel If X is anyt hing t hen y is anything,
wobei anything durch eine Fuzzy-Menge die konst ant Eins ist modelliert wird , dass die Ausgab e-Fuzzy-Menge ebe nfalls immer konstan t Eins ist . Dies ist unabhiingig davon , welche weiteren Regeln in dem Mamdani-Regler noch verwendet werd en . Bei einem logikbasiert en RegIer hat diese Regel keine Auswirku ngen.
254
3. Fuzzy-Regier und Regler-Evaluierung
3.4 Mamdani-Regler und Ahnlichkeitsrelationen Bei der Einfuhrung der Mamdani-Regler hab en wir bereits gesehen, dass die dab ei verwend et en Fuzzy-Regeln unscharfe Punkte auf dem Gra phen der zu beschreibend en Regelun gs- oder Ubert ragungsfunktion repr asenti eren o Mit Hilfe der Ahnlichkeit srelationen aus dem Kapitel 1.7 lassen sich Fuzzy-Mengen, wie sie bei Mam dani-Reglern auftrete n, als uns char fe Punkte int erpretieren. Diese Interpret ation des Mamda ni-Reglers soli hier gena uer unt ersucht werden . 3.4.1 Interpretation eines Reglers Zunachst gehen wir davon aus, dass ein Mamdani-Regler vorgegebe n ist . W ir set zen weiterhin voraus , dass die Fuzzy-Mengen , die auf den Werteb ereichen der Ein gan gs- und Ausgan gsgroflen definiert sind, die Vorau sset zun gen des Satzes 1.33 oder besser noch des Sat zes 1.34 erfiillen. In diesem Fall konnen Ahnli chkeit srelationen berechn et werd en , so dass sich die Fuzzy-Mengen als extensionale Hiillen von einzelnen Punkten int erpretieren lassen. Beispiel 3.1 Fur einen Mamda ni-Regler mit zwei Eingangsgrof en x und y und einer Ausgan gsgrofe z wird fur die Ein gangsgrof en jeweils die linke Fuzzy-Par ti t ion aus Abb. 3.8 und fur die Ausgan gsgrofie die recht e FuzzyP ar tition aus Abb . 3.8 verwend et . Die Regelbasis besteht aus den vier Regeln R 1: R2: R3: R4:
If x If x If x If x
is is is is
klein mi ttel mittel graB
2
3
4
y is y is y is y is
graB
mittel
o
and and and an d
5
6
kl ein klein graB graB
then t hen t hen th en
z z z z
is is is is
positiv null null negativ positiv
negativ
-3 -2 -I
0
2
3
Abb. 3.8 . Zwei Fuzzy-Part itionen Die verwend eten Fuzzy-Partitionen erftillen die Voraus set zun gen von Sat z 1.34, so dass sich geeignete Skalierungsfunktio nen finden lassen . F ur die linke Fuzzy-Partition in Abb. 3.8 lautet die Skalieru ngsfunktio n Cl :
[0,6] ---+ [0,00) ,
ftir die rechte Fuzzy-P ar t ition
x
f---+
0.25 falls 0 < x < 4 { 0.5 falls 4 :::; x :::; 6,
3.4 Mamdani-Regler und Ahnlichkeitsrelationen
C2 :
[-3,3]
-+
255
[0, 00),
Die Fuzzy-Mengen klein, mittel, graB, negativ, null und positiv ents prechen den extensionalen Willen der Punkte 0, 4, 6, - 3, bzw. 3, wenn die durch die angegebenen Skalierungsfunktionen induziert en Ahnli chkeit srelationen zugru ndegelegt werden. Die vier Regeln besagen dann , dass der Graph der durch den RegIer beschriebenen Funkt ion durch die Punkte (0,0,3), (4,0,0), (4,6,0) und (6,6,-3) gehen sollte . 0
°
Die Interpret ati on auf der Basis der Ahnli chkeitsrelat ionen in dem obigen Beispiel liefert vier Punkte auf dem Graphen der gesuchte n Funktion und zusa tzl ich die Inform ation, die in den Ahnli chkeitsrelationen steckt . Die Berechnun g der gesamte n Funktion ste llt somit cine Interpolationsaufgab e dar : Gesucht ist eine Funktion , die durch die vorgegeben en Punkte geht und im Sinne der Ahnlichkeit srelationen ahnli che Werte wiederum auf ahnliche Werte abbildet . Wenn wir beispielsweise den Ausgab ewert fur die Eingab e (1,1) berechnen wollen , so ist (1,1) am ahnlichsten zu der Einga be (0,0), fur die wir den Ausgab ewert 3 auf Grund der Regeln kennen. Der Ahnlichkeitsgra d von 1 zu ist nichts anderes als der Zugehor igkeitsgrad des Wertes 1 zur extensionalen Hiille von 0, d.h. zur Fuzzy-Menge klein, also 0.75. Eine gewisse, wenn auch etwas geringere Ahnlichkeit weist die Einga be (1,1) noch zu der Eingab e (4,0) auf. Der Ahnli chkeitsgrad von 1 zu 4 betragt 0.25, der von 1 zu wiederum 0.75. Der Ausgab ewert zu (1,1) sollte also vor allem ahnlich zum Ausgabewert 3 der Eingab e (0,0) und ein bisschen ahnlich zum Ausgab ewert zur Eingab e (4,0) sein. Hierb ei hab en wir bisher offen gelassen, wie die beiden Ahnlichkeit sgrade, die man durch die beiden Komp onent en der Einga ngswert e erhalt , zu aggregieren sind . Hier bietet sich eine t-Norm, zum Beispiel das Minimum an. Wie gut ist beispielsweise der Ausgab ewert 2 ftir die Einga be (1,1)? Hierzu berechnen wir den Ahnlichkeitsgrad des Punkt es (1,1,2) zu den durch die vier Regeln vorgegebenen Punkt en. Dab ei werd en die Ahnlichkeitsgrade zunachst komponent enweise in Form der Zugehori gkeit sgrade zu den ents prechcnden Fuzzy-Mengen besti mmt. Fu r den durch die Regel R 1 vorgegebenen Punkt ergibt sich so ein Almlichkeit sgrad von 2/ 3 = min {0.75, 0.75, 2/3} . Fur R 2 erhalten wir 0.25 = min{0.25, 0.75, 2/3}. F ur die beiden Regeln R 3 und R 4 ist der Ahnlichkeitsgra d 0, da schon die Eingab ewerte nicht zu den Regeln passen. Der Ahnlichkeitsgrad bzgl. der vorgegebenen vier Punkte bzw. Regeln ents pricht dem bestrno glichen Wert , d.h. 2/3. Auf diese Weise konnen wir zu jedem Ausgabewert z einen Ahnlichkeit sgrad bei vorgegebener Eingabe (1,1) bestimmen, indem wir die eben beschriebene Berechnung fur den Punkt (1,1 , z) durchfuh ren, Dam it erhalte n wir bei vorgegebener Ein gab e (1,1) eine Funktio n
°
°
°
256
3. Fuzzy-Regler und Regler-Evaluierung /-l : [- 3, 3] --> [0,1],
die wir als Fuzzy-Menge tiber dem Ausgab ebereich interpretieren konnen . Vergleichen wir die Berechnung mit der Berechnun gsvorschrift des MamdaniReglers, so erhalte n wir exakt die Ausgabe-Fuzzy-Menge (3.5) des ents prechenden Mamd ani- Reglers. 3.4.2 Konstruktion eines Reglers
Anst att die Skalierungsfaktoren bzw. Ahnlichkeitsrelati onen und die ents prechenden Interpolationspunkte indirekt aus einem Mamd ani- Regier zu bestimmen , konnen diese auch dir ekt vorgegeben und der Mamdani-Regler daraus berechnet werden. Der Vorteil best eht zum einen darin, dass man nicht mehr beliebige Fuzzy-Mengen spezifizieren kann, sondern nur Fuzzy-Mengen , die eine gewisse Konsistenz aufweisen. Zum anderen ist die Int erpretation der Skalierungsfaktoren und insbesond ere der zu spezifizierenden Int erpol ationspunkte sehr einfach. Die Skalierungsfaktoren lassen sich im Sinne des Beispiels 1.31 deuten. In den Bereichen , wo es bei der Regelung auf sehr genaue Werte ankommt, sollt e zwischen den einzelnen Werten auch sehr genau unterschieden werd en , d.h. ein groBer Skalierungsfaktor gewiihlt werd en, wiihrend ftir Bereiche, in denen es auf die exakte n Werte weniger ankommt, ein kleiner Skalierungsfaktor ausreicht. Dies fi.ihrt dazu , dass in Bereichen, in denen gena u geregelt werd en muss, bzw. in denen die Reglerausgab e sehr sensitiv auf die Eingab e reagieren muss, bei dem zugeh6rigen Mamdani-Regler sehr schmale Fuzzy-Mengen verwend et werd en , wiihrend die Fuzzy-Mengen in den unb edenklichen Bereichen breiter sein durfen, Dami t lasst sich auch erklaren, warum die Fuzzy-Mengen in der Nahe des Arbeitspunktes cines Reglers im Gegensatz zu anderen Bereichen hiiufig sehr schmal gewiihlt werden: 1m Arb eitspunkt ist meistens eine sehr genaue Regelun g erforderlich. Dagegen muss, wenn der Prozess sich sehr weit vom Arb eitspunkt entfernt hat , in vielen Fall en vor allem erst einmal stark gegengeregelt werd en , urn den Prozess erst einmal wieder in die Niihe des Arb eitspunktes zu bring en. Bei der Verwendung der Skalierungsfunktionen wird auch deutlich , welche implizite n Zusatzannahmen bei dem Entwurf cines Mamd ani-Reglers gemacht werd en . Die Fuzzy-Partitionen werden jeweils auf den einzelnen Bereichen definiert und dann in den Regeln verwend et . 1m Sinne der Skalierungsfunktionen bedeutet dies, dass die Skalierungsfunktionen als un abh iingig voneina nder angenommen werd en. Die Ahnlichkeit von Werten in einem Bereich han gt nicht von den konkret en Werten in and eren Bereichen abo Urn diesen Sachverhalt zu verdeutlichen, betrachten wir einen einfachen PD-Regler , der als Eingangsgr6Ben den Fehler - die Abweichun g vom Sollwert - und die And erung des Fehlers verwendet . Es ist offensichtlich, dass es bei einem kleinen Fehlerwert ftir den Regier sehr wicht ig ist zu wissen, ob die Fehlerand erun g eher etwas gr6Ber oder eher et was kleiner als Null ist . Man wiirde daher einen groBen Skalierungsfaktor in der Nahe von Null des Grun dbereic hs der
3.4 Mamdani-Regler und Ahnlichkeitsrelationen
257
Fehleranderung wahlen, d.h . schm ale Fuzzy-Mengen verwenden . Andererseits spielt es be i einem sehr graBen Fehlerwert kaum eine Rolle , ob die Fehleranderung eher etwas in den positiven oder negativen Bereich tendiert. Dies spricht abe r ftir einen kleinen Skalierungsfaktor in der Nahe von Null des Grundbereichs der Fehleranderung, also fur breite Fuzzy-Mengen . Urn dieses Problem zu losen , gibt es dr ei Moglichkeit en: 1. Man spezifiziert eine Ahnlichkeitsrelation im Produktr aum von Fehler
und Fehleranderung, die die ob en beschri ebene Abh an gigkeit modelliert . Dies erscheint allerdings auferst schwierig , da sich die Ahnlichkeitsrelation im P roduktraum nicht mehr tiber Skalierungsfunktionen angeben lasst . 2. Man wahlt einen hoh en Skalieru ngsfaktor in der Nahe von Null des Grundbereichs der Fehleranderung und muss dafur unter Umst anden , wenn der Fehlerwert groB ist , viele fast identische Regeln haben, die sich nur bei der Fuzzy-Menge fiir die Fehleranderung unterscheiden , etwa
If Fehler is groB and And erung is positiv klein If Fehler is groB and Anderung is null If Fehler is graB and And erung is negativ klein
then y is negativ. then y is negativ. then y is negativ.
3. Man verwendet Regeln, in denen nicht alle Eingangsgroflen vorkommen , z.B.
If Fehler is groB then y is negativ. Die Interpretation des Mamdani -Reglers im Sinn e der Ahnlichkeitsrelationen erklart auch, warum es durchaus sinnvoll ist , dass sich benachbarte FuzzyMengen einer Fuzzy-P artition auf der Hohe 0.5 schn eiden . Eine Fuzzy-Menge stellt einen (un scharfen) Wert dar, der spater bei den Interpolationspunkten verwend et wird . Wenn ein Wer t spezifiziert wurde, lasst sich aufgrund der Ahnli chkeitsrelacionen etwas tiber ahnliche Werte aussagen, so lange bis der Ahnlichkeitsgrad auf Null ab gefallen ist . An dieser Stell e sollte spateste ns ein neuer Wert fiir die Interpolation eingeflihrt werden. Dieses Konz ept flihr t dazu, dass sich die Fuzzy-Mengen genau auf der Hohe 0.5 schneiden. Man konnte die Int erpolationspunkte naturlich au ch beliebig dicht setze n , sofern ents prechend detaillierte Kenntnisse tiber den zu regelnd en Prozess vorhanden sind . Dies wiirde zu sehr stark tiberlappend en Fu zzy-Mengen ftihre n. Im Sinne einer moglichst komp akt en Reprasentation des Exp ertenwissens wird man dies abe r nicht tu n, sondern erst dann neue Interpolationspunkte einfilhren, wenn es notig ist . Selbst wenn ein Mamdani-Regler nicht die Voraussetzungen einer der Sat ze 1.33 oder 1.34 erfiillt , kann es sinnvoll sein , die zugehOrigen Ahnlichkeit srelationen aus Satz 1.32 zu berechnen , die die Fuzzy-Mengen zumindest extensional machen , auch wenn sie nicht unb edingt als extensionale Hullen von Punkten interpretierbar sind. In [90] wurde u.a . folgend es fur diese Almlichkeitsrelationen gezeigt :
258
3. Fuzzy-Regier und Regler-Evaluierung
1. Die Ausgabe eines Mamd ani-Reglers andert sich nicht , wenn man an-
st elle eines scharfen Eingab ewertes seine exte nsionale Hulle als Eingab e verwendet . 2. Die Ausgab e-Fuzzy-Menge eines Mamd ani-Reglers ist immer extensional. Dies bedeut et, dass die Ununterscheidbarkeit oder Unscharfe, die in den Fuzzy-Partitionen inhar ent kodiert ist, nicht uberwunden werden kann .
3 .5 Fuzzy-Regelung versus klassische Regelung In diesem Kapit el hat sich gezeigt , dass auch beim Fuzzy-Regier die nach der Defuzzifizierung gewonnenen Ausgangsgr6Ben wie bei einem klassischen RegIer scharf und eindeut ig von den Eingangsgr6Ben abhiingig sind. Der FuzzyRegier stellt demnach ein nichtlin eares Kennfeld ohne int erne Dynamik dar. Man kann ihn auch als eine Art nichtlinearen Zust andsregler auffassen. Diesem Kennfeld sind dann im Regelkreis lineare, dynamische Ubertragungsglieder zur Int egrati on oder Differentiation vor- oder na chgeschalt et. Ais Kennfeld mit zusatzlichen vor- oder nachgeschalt eten linearen Ubertragungsgliedern lasst sich aber auch jeder klassisch entworfene Regier darstellen. Hinsichtlich des Verhalt ens kann daher zwischen einem Fuzzy-Regier und einem klassischen Regier prin zipiell kein Unterschied bestehen. Der Unte rschied zwischen beiden Reglern besteht ausschlieBlich in der Darst ellung und der Entwurfsmet hodik. Und ausschlieBlich hinsichtli ch dieser beiden Gesichts punkte macht es demn ach Sinn , die Vor- oder Nachteile eines FuzzyReglers gegeniiber dem klassischen Reglerentwurf zu diskutieren. Nach diesen gru ndsiitzlichen Feststellungen konnen die Vor- und Nachteile und die darau s resultierenden Anwendungsbere iche von Fuzzy-Reglern disku t iert werden. Zuniichst muss bemerkt werden , dass der klassische Reglerentwurf gewisse Vorteile aufweist. Sowohl die Modellbildun g der Strecke als auch der dar auf aufbauende Reglerentwurf konnen syste mat isch erfolgen. Stabilit at und gegebenenfalls gewiinschte Diimpfungseigenschaft en beim Einschwingverha lten sind implizit gewahrl eist et . Modellunsicherheiten oder -ungenauigkeite n durch Linear isierung konnen mit Hilfe robuster, insbesondere normoptimaler Regier beru cksichtigt werden, so dass auch in diesen Fallen die Stabilitat des Regelkreises garantiert werden kann . 1m Gegensat z dazu erfolgt der Entwurf eines Fuzzy-Reglers im allgemeinen auf heuristischem Wege, was sich natiirli ch im ben6tigt en Zeit aufwand niederschliigt und den Entwurf bei komplexen Strecken sogar unmoglich rnachen kann . Daruber hinaus kann zunachst einmal keine Gewiihr fur die St abilitat des ents tehenden geschlossenen Kreises iibernommen werden. Diese Aussagen sind allerdings insofern zu relativieren , als dass sowohl der systematische Entwurf als auch die St abilit at sanalyse von Fuzzy-Reglern seit End e der acht ziger J ahre Gegenstand inte nsiver Forschungst iitigkeit geworden sind
3.5 Fuzzy-Regelung versus klassische Regelung
259
und mit tlerweile einige brauchbar e Ansatz e auf diesen Gebiet en vorliegen (vgl. Kap . 4 und 5). Teilweise ent krafte n lasst sich auch das gegen den Fuzzy-Hegler spr echende Argument des groBen Rechenzeitbedarfs. Grundsiitzlich miissen beim Fuzzy-Regler in jedem Abt astschritt sarnt liche Regeln abgearbeite t , die Ausgangs-Fuzzy-Menge gebildet und anschlieBend defuzzifiziert werden. Diese aufwandigen Berechnun gen ubersteigen ab er meistens die Leistungsfahigkeit der zur VerfUgung stehenden Prozessoren, insbesondere wenn das Abtast inte rvall wegen der Dynamik der Str ecke klein sein muss. Zur Abhilfe bietet es sich an , fur eine ausreichend groBe Anzahl an EingangsgroBen die Ausgangsgrofen a priori zu berechnen und in einem Kennfeld abzuspeichern . Zwischen den Wert en des Kennfeldes wird dann im laufenden Betrieb interpoliert . Damit entspricht zwar das Ubertragungsverh alt en eines so implementiert en Fuzzy-Reglers normalerweise nicht exakt dem eigent lichen Entwurf, die Unterschiede konnen jedoch bei ausreichend hoher Auflosun g des Kennfeldes vernachlassigt werden. Ein weite res zu diskutierendes Argument ist die Robustheit . FuzzyReglern wird wegen der ihnen zu Grunde liegenden Unscharfe eine besonders groBe Robu stheit nachgesagt . Wie oben aber schon erwahnt wurde , weist ein Fuzzy-Hegler ein ebenso klar definiert es Ubertragun gsverhalten auf wie ein klassischer Hegler. Daher ist seine Robustheit nichts Geheimnisvolles und lasst sich ebenso diskutieren wie die von klassischen Reglern. Hier ist aber zunachst folgendes klarzustellen: Wie schon in Kapitel 2.7.7 ausgefiihrt wurde, macht die Verwendung des Begriffes Robusth eit nur dann Sinn , wenn man auch quantifizieren kann , wie gr oB die Abweichungen zwischen nominaler und realer Strecke denn sein durfen, ohne dass der geschlossene Kreis instabil wird. Denn das unquantifizierte Att ribut robust trifft praktisch auf jeden Hegler zu und ist dah er nicht aussagekraftig. Bei Fuzzy-Reglern , die fur eine St recke entworfen wurd en , von der kein Modell exist iert, ist eine Quantifizierung der Robu stheit aber unmoglich. Und auch wenn ein solches Modell zur Verfiigung steht, kann die Robus theit norm alerweise nur in Form von Simulationslaufen mit veranderten Stre ckenpar ametern nachgewiesen werden , also lediglich anhand einiger ausgewahlter Beispiele, was natiirlich kein echter Beweis filr die Robus thei t ist . Dagegen exist ieren im Bereich der klassischen , linearen Regelungstechnik mittlerweile Verfahren (vgl. [129]), bei denen man ftir jeden beliebigen Streckenparameter den erwarteten Unsicherheitsbereich vorgeben kann und der mit diesen Verfahr en berechnete RegIer dann fur jede dami t mogliche Streckenkonstellation einen stabilen geschlossenen Kreis gara nt iert . SchlieBlich bleibt die Ubersichtlichk eit und Anschauli chkeit des FuzzyReglers. Fraglos ist eine Fuzzy-Regel anschaulicher und insb esondere fur Nicht-Regelungstechniker leichter zu verstehen als die Ubert ragungsfunktion eines PI-Reglers oder gar die Koeffizient enmatrix eines Zustandsreglers. Wenn die Strecke und damit der Regier ab er eine gewisse Kompl exit at aufwei-
260
3. Fuzzy-Regler und Regler-Evaluierung
sen , so besteht der Fuzzy-Regier nicht mehr nur aus einigen wenigen , sondern aus bis zu einigen hundert Regeln . Die Anschaulichkeit jeder einzelnen Regel bleibt dann zwar erhalten, das gesamte Regelwerk ist aber nicht mehr zu iibe rblicken. Die Wirkung der Veranderung einer bestimmten Eingan gsgrofe kann nur noch vorhergesagt werd en , ind em man den gesamten RegIer durchrechn et . Dagegen lasst sich beispielsweise an hand der Koeffizient enm atrix eines Zustandsreglers noch recht gut ablesen, wie sich die Ausg angsgrofien bei der Veranderung einer Ein gan gsgrofe vergrofiern oder verkleinern . Zusammenfassend ist daher ftir den sinnvollen Ein satz eines Fuzzy-Reglers festzustellen: Wenn ein Modell der Strecke in Form von DifferentiaI- oder Differenzengleichung en vorliegt und es auch moglich ist , anhand dieses Mod ells (ggf. nach einer Linearisierung) mit klassischen Methoden einen Regier auszulegen , so sollt e dies auch versucht werd en . Der Einsatz eines Fuzzy-R eglers biet et sich jedoch an, wenn • kein Streckenmodell in Form von Differenzen- oder Differentialgleichun gen zur Verfiigung steht. • die St recke au fgrund von Nichtlinearitaten eine Struktur aufweist, die den Ein satz klassischer Verfahren unmoglich macht. • die Regelziele nur uns charf formuli ert sind, wie z.B. die Ford erung nach weichem Umschalten beim Automatikgetriebe eines Kr aftfahrzeuges [171J . • die Strecke und damit die notwendige Regeistrategie so einfach zu tiberblicken sind, dass der Entwurf eines Fuzzy-Reglers weniger Zeit erfordert als die Modellbildung der Strecke und der Entwurf eines klassischen Reglers. Dan eb en best eht auch noch die Moglichkeit , den Fuzzy-RegIer nicht im geschlossenen Kreis ais echten RegIer zu bet reib en, sondern auf einer iibergeordnete n Eb ene, beispielsweise zur Vorgab e geeigneter Sollwert e (Bahnplanung) , zur Adaption eines klassischen Reglers , zur Prozessiiberwachung oder zur Fehlerdi agnose. In diesem Bereich sind der Phantasie des Anwend ers keine Grenzen gesetzt. Da hier der Fuzzy-RegIer nicht im geschlossenen Kreis arbeite t , exist ieren auch keine spezifisch regelungstechnischen Probleme wie beispielsweise das Stabilit atsproblem, Bei diesen Anwendungen sind eher sicherheitstechnische Fragen relevant, beispielsweise die Ausfallsicherh eit oder ob durch den Fuzzy-R egIer tatsachlich alle moglichen F alle erfasst sind. Obwohl gerade bei dieser Art von Anwendungen die Vort eile von FuzzyMethoden erst richtig ZUlli Tragen kommen, sind sie nicht Gegenstand dieses Buches. Da es sich hierb ei urn dem Regelkreis iibergeordn et e Strukturen handelt , sind diese zwangslaufig sehr fachspezifisch, so daB ihr e Darst ellung den Rahmen dieses Buches spr engen wiird e. In den verschiedenen Fachzeitschrifte n finden sich jedoch vielfalti ge Anwendungsbeispiele aus allen Bereichen der Technik . AbschlieBend sollen noch kurz einige pr aktische Asp ekt e des Eins atzes von Fuzzy-Reglern diskutiert werd en . Ein er dieser Asp ekt e ist die Bereitstellung der beno tigten Ein gangsgrofen fiir den Fuzzy-RegIer. Sofern diese
3.5 Fuzzy-Regelung versus klassische Regelung
261
GraBen dir ekt messbar sind , gibt es kein Problem. Eine einfache Differenzbildung, urn beispielsweise aus zwei aufeinander folgenden Messwerten des Fehlers e die Fehlerdifferenz Lle(k) = e(k) - e(k - 1) zu erhalt en, ist ebenfalls unproblematisch. Kritisch wird dagegen schon eine zweifache Differenzbildun g Ll2 e(k) = Lle(k) - Lle(k - 1) = e(k) - 2e(k - 1) + e(k - 2). Diese ist zwar leicht aus vergangenen Messwerten des Fehlers zu berechnen , wird aber im allgemeinen keine br auchbaren Ergebnisse liefem. Der Grund liegt darin, dass die Differen zbildung einer Hochpassfilterung erster Ordnung und die zweifache Differenzbildung soger einer Filterung zweit er Ordnung entspricht . Eine Hochpassfilterung bedeutet aber eine Verst arkung hochfrequenter Signalanteile, und damit insbesondere auch des Messrauschens. Daher kann eine zweifache Differenzbildung nur dann ein brauchbares Ergebnis liefern , wenn das Messsignal fast ra uschfrei ist . Erfolgversprechender ist hier sicherlich die Verwendung eines Beobachters , wie er in Kapitel 2.7.5 oder 2.8.11 beschrieben wurde . Dieser beinhaltet keine Differenzbildungen oder Differenti ationen, sondern lediglich Integration en, so dass hier keine Rauschsignalverst arkung erfolgen kann. Dafur erfordert ein Beobacht er ab er ein relativ prazises Str eckenmodell in Form von Differenzenoder Different ialgleichungen. Bei Vorliegen eines solchen Modells ste llt sich aber wiederum die Frage, ob ein klassisches Entwurfsverfahren nicht sinnvoller ware als der Entwurf eines Fuzzy-Reglers. Die gleiche Frage ste llt sich auch, wenn der Entwurf und die Optimierung eines Fuzzy-Reglers anhand von Simulationen erfolgen. Denn fur eine Simulat ion, die brau chbare Riickschliisse auf das zu erwartende reale Systemverhalt en zulasst , wird ebenfalls ein prazises Streckenmodell benotigt.
4. Stabilitatsanalyse von Fuzzy-Reglern
Fur die Stabilitatsanalys e von Fuzzy-Reglern kommen grundsatzlich aile Verfahren in Betracht , die fur die Analyse nichtlinearer Systeme geeignet sind und von denen die bekan ntesten in Kapitel 2.8 bereits vorgeste llt wurden. Dabei kann ma n nicht sagen, dass irgendwelche Verfahr en grundsatzlich besser oder schlechter sind als andere. Welches Verfah ren im Einzelfall tatsachlich anzuwenden ist , hangt ausschlieBlich von den Voraussetzungen ab oUnd zwar sind dies im wesentlichen die Struktur des Gesamtsystems und die Art der Information, die tiber die zu regelnde Strecke vorliegt. Von da her ist es notwendi g, die einzelnen Verfahren hinsichtlich ihrer Voraussetzungen genau zu kenn en, urn im Anwendungsfall eine vern tinftige En tscheidung tiber ihren Einsatz fallen zu konnen. Bei den Verfahr en, die schon in Kapitel 2.8 ausfuhrli ch behandelt wurden, soli in diesem Kap itel nur auf die Besonderh eiten eingegangen werd en , die sich aus ihrer Anwendung auf Syst eme mit Fuzzy-Reglern ergeben. Der Einfachheit halber werden diese Verfahren dabe i hier in derselben Reihenfolge behandelt , erganzt durch das Kapitel 4.6 tiber norm enbasierte Stabilitatsanalyse und zwei A.nsiitze zur dir ekt en Analyse im Zust and sraum (4.9). Verzichtet wird dagegen auf die Behandlung von Methoden , die ein vollstandig fuzzifiziertes System voraussetzen, d .h. bei denen das gesamte Syst emverhalten in Form von Fuzzy-Relationalgleichungen gegeben ist (vgl. [22, 73, 80]), denn diese Ansatze sind eher von th eoretischem als praktischem Int eresse.
4.1 Voraussetzungen 4.1.1 St ruktur d es R egelkrei ses Vor der Durc hfiihrung der Ana lyse muss ma n sich grundsatzlich dariiber im klar en sein, dass der RegIer nicht nur aus einer reinen Fuzzy-Komponente mit Fuzzifizierung, Regelbasis, Inferenzmechanismus und Defuzzifizierung beste ht, sondern dass die Bereitstellung der Ein- und Ausgangsgrofien fur diese Komponente ebenfalls Berechnun gen erfordert . Abb . 4.1 zeigt als Beispiel einen RegIer mit der Eingangsgrofle e, der Ausgangsgrolie u und dor linearen Strecke G(s). Eine der Fuzzy-Regeln konn te beispielsweise lauten: K. Michaels et al., Fuzzy-Regelung © Springer-Verlag Berlin Heidelberg 2002
264
4. Stabilitatsanalyse von Fuzzy-Reglern
If e = ... and e = ... and
J
e
= ... t hen u = ...
(4.1)
Die Fuzzy-Komponente selbst ben6t igt also die Ein gangsgr6Ben Fehler e, Ableitung des Fehlers e und Int egral des Fehlers e und liefert zudem nicht direkt die St ellgr6Be u, sondern nur ihre Ableitung ii . Dami t beinhaltet der Regier offenb ar zusat zlich zur Fuzzy-Komponent e eine Differenti ation (bzw. diskrete Differenzbildung) sowie zwei Integrationen (bzw. diskrete Sum menbildungen). Fur eine vereinfacht e Nam ensgebung soli in Zukunft die reine Fuzzy-Komponent e ohne int erne Dyn amik als Fuzzy-Regier und das diesen Fuzzy-Regier sowie Differentiationen und Integrationen beinh altend e, gesamte Ube rtrag ungsglied als Regier bezeichnet werden.
J
.
.
I3~¥~e!
w
'-==::..J , 1
, :, ,,
y
J
Abb. 4.1. Elemente eines Systems mit Fuzzy-Regier Weiterhin ist die Syst emstruktur in Abb. 4.1 ftir eine Stab ilit ats an alyse nicht besond ers gut geeignet . Zum einen entspricht die Auft eilung nicht der fur einige Verfahren erforderlichen St andard-Aufteilun g in einen linearen und einen nichtli nearen Systernteil (Abb . 2.79), zum andere n ent ha lt das Blockschaltbild eine Differenti ation. Differenti ationsglieder solite n aber in einem Blockschaltbild grundsatzlich vermi eden werden, da bei Ihnen Ursac he und Wirkung vertauscht sind. Beispielsweise lasst sich der Zusam menh an g zwischen Beschleuni gun g und Geschwindigkeit ent weder durch ein Different iat ionsglied mit der Geschwindi gkeit als Eingangsgr6Be oder durch einen Integrator mit der Beschleuni gun g als Ein gan gsgr6Be angeben. Die Beschleunigun g ist aber gerad e pro portion al zur ant reibe nden Kr aft , und die Kr aft ist offenb ar die Ursac he der Bewegun g. Der Int egrator weist damit im Gegensatz zum Differenti ationsglied die Ursache als Einga ngsgr6Be auf und bildet deshalb sicherlich die bessere Darst ellungsvari ante. Aus diesem Grund wird das Blockschalt bild gemaf Abb. 4.2 ums trukturiert . Der Int egrator am Ausgan g des Fuzzy-Reglers bleibt erha lte n. Die hier als linear angenommene St recke G (s) wird dagegen zerlegt in einen Integrator und eine Rest- Ubertragun gsfunk tion G' (s). Durch diese Aufteilung gewinnt man die Ableit ung der Ausgangsgr6Be iJ und damit auch die Ableitung der Fehiergr6Be e, ohne dass ein Different iati onsglied notwendig ist . Stattd essen wird noch eine Differenzbildung mit der Ableitung des Sollwertes w ben6ti gt . Da bei der Stab ilitats an alyse abe r nor malerweise eine Ruhelage untersucht wird , gilt w= 0, womit diese Differenzbildung wieder entfallt .
4.1 Voraussetzungen
r
•
LinearerSystemteil
265
~
Ie Abb. 4.2 . Umstrukturiertes Blockschaltbild fur die Stabilitats analyse Neben der Verm eidung der Different iat ion gelang durch diese Umstrukt ur ieru ng auch die Auft eilun g des Kreises in einen linear en und einen nichtlinearen Syst emt eil, wie sie fur einige Analyseverfahren erforderlich ist. Bei Strecken mit nichtlinearen Anteilen ist diese Auft eilun g naturlich nicht mehr so einfach. Hier kann man nur versuchen, die nichtlinearen Teile der Strecke ebe nfalls dem Fuzzy-Regier zuzurechnen. Sollt e dies nicht moglich sein, bleiben aber immer noch die Verfahren, die cine solche Aufteilung nicht erfordern .
4.1.2 Analytische Approximation eines Fuzzy-Reglers Zusat zlich zu einer Umstrukturierung des Regelkreises ist es fur die Anwendung einiger Stabilit at skr iterien erforderlich, das Ubertragun gsverhalten des Fuzzy-Reglers in einer best immte n, ana lyt ischen Form zu beschreiben . Urn den Zusammenh ang zwischen der herkomml ichen und der analyt ischen Darste llung zu verdeutli chen , soll die analytische Darstellung fur einen einfachen Fuzzy-Regier aus der herkornmlichen Darstellung ent wickelt werden. Der Ausgangsvektor u = [UI , ..., um]T des Reglers sei dur ch Regeln der Form (4.2) If ... then Ul = Jiu " l an d U2 = JiU ,,2 and ... bzw. If ... t hen u = JiUi
(4.3)
definiert . Dab ei ist Jiu = [J1u e,. l ' .. . , J1u l.,m ]T ein Vekt or aus Fuzzy-Mengen , und i ist die Nummer der Fuzzy-Regel. Die Pramisse einer jeden Regel ordnet jeder moglichen Kombination von Ein gangsgrofien einen Wahrheitswert zu. Mit diesem Wer t wird die Regel dann akt iviert . Dah er kan n jede Prarnisse au ch aqui valent durch eine analyt ische Darstellun g in Form einer mehrdimensionalen Wah rheitsfunktion erset zt werden. Die Pramisse der i-ten Regel wird dabei du rch die Funktion ki (z) E [0, 1] ersetzt, wobei z(t ) der Vekto r der Eingangsgroflen ist. Diese Eingangsgrofen mussen nicht zwangslaufig Zust andsgroflen sein. Allerdings wird dies in einigen Verfah ren vorau sgesetzt. ki (z(t )) gibt fiir einen Einga ngsvekto r z(t ) den Wahrheitswert an, zu dem die Pramisse der Regel i erftillt ist , d.h . den Wert , mit dem die Regel aktiviert wird. t
266
40 Stabilitat sanalyse von Fuzzy-Regiern
Fiir die weitere Betraehtung sollen die Prarnissen des Fuzzy-Reglers zwei Varau ssetz ungen erflillen: 1. Die Summe der Wah rheitswerte aller Pramissen muss ftir jede beliebige
Kombination von Eingangsgrof en des Regiers immer gieich Eins sein: (4.4)
20 Es exist iert zu jeder Regel mind estens ein Wert des Eingangsgrofenvektors z (t), fur den der Wahrheitswert ihr er Pramisse den Wert Ein s annimmt . Mit der erst en Ford erung folgt darau s unrnit telbar , dass ftir eine solche Ein gan gsgrofenkombinat ion die Wah rheitswer te der Pramissen aller anderen Regeln gieich Null sind. Diese Ford erungen sind nicht restriktiv und werd en von Fuzzy-Reglern in der P rax is gewohnlich erfullt . Sie stellen sicher , dass der Fuzzy-Regier vollstandig definiert ist , d oh. dass fiir jede Kombination von Eingangsgrofen eine Ausgangsgrofle bereehnet werden kann. Und darii ber hinaus miissen die FuzzyMengen in den P ramissen norm ale Fuzzy-Mengen beschreiben, d.h. es muss mindestens ein Element mit dem ZugehOrigkeitsgrad Eins exist ieren. Naeh dem die Pramissen dur eh eine analyt ische Darstellung in Form von Wahrh eitsfunk ti onen ki (z(t) ) ersetzt word en sind , solI ein ahnlicher Schritt auch ftir die Konklusionen und die Defuzzifizieru ng vollzogen werden. W ahrend im Fall der P rarnissen die analyt ische Darstellung allerdings aquivalent zur ur spriinglichen Darstellung ist , konnen die Konk lusionen in Verb indung mit der Defuzzifizierung nur approx imiert werden . Dazu ist fur jede Regel ein geeignete r Ausgangsvektor u, zu best immen, der den Vekto r aus Fuzzy-Mengen /lU i in der Konklusion erset zt. Die GesamtAusgangsgroile U des Reglers ergibt sich dann mit Hilfe der analyti schen Wahrheitsfunk t ionen ki( z(t )) als Uberlagerung dieser Vekto ren u , zu (4.5) An dieser Formel ist zu erkennen, dass die u, in Abh an gigkeit von der Form der Fuzzy-Mengen /lU i ,! und der Defuzzifizierungsstrat egie bestimmt werd en miissen , urn eine gute App roximation des urspriingliehen Reglerverh alt ens zu gewahrleiste n. Auf die not wendi gen Berechnungsschri tte soil an dieser Stelle abe r nicht weiter eingegangen werden. Sie ergebe n sich aus dem Vergleich der Ausgan gsgrofie des Original-R egiers (Gleichung (4.3)) mit der Ausgangsgrof e der analytisehen Darst ellun g in Gleiehung (4.5) fur eine bestimmt e Menge relevant er Ein gan gsgrof en z (t ). Damit ist der ursprii ngliche Fuzzy-R egIer dur ch einen analyt ischen RegIer approximiert worden. Diejenigen Vekt oren z (t ), fiir die eine Wahrheitsfunktion k, den Wert Eins annimmt und aile anderen den Wert Null, werd en im Folgenden als Stii t zst ellen bezeichnet. Der Vektor u , ist demnach der Ausgan gsvektor des
4.1 Voraussetzungen
267
Reglers an der i-ten Stii tzst elle, und allgemein ergibt sich mit dieser Definition der Ausgan gsvektor des Reglers aus der gewichtete n Mittelwertbildung der Ausgangsvektoren an den Stiitzst ellen. Die Gewichtung ki(z(t)) ergibt sich wiederum aus dem Moment anwert der Eingangsgrofen. Ein solcher Fuzzy-Hegler ist da mit ein echtes Kenn feld , wie es in Abb. 4.3 ftir einen Fuzzy-Hegler mit zwei Eing angsgrofen Z l und Zz und einer Ausgangsgrofie u dar gest ellt ist. In einem Kennfeld sind fur bestimmte Stiitzstellen die Ausg angswerte vorgegeb en. Liegt ein Ein gangsvekt or ( Zl ' zZ)T nicht exa kt auf einer Stii tzstelle, so ist zwischen den benachbarten Stii t zstellen zu int erpolieren . Wie dies zu geschehen hat, zeigt die recht e Zeichnung. Vorausgesetzt wird , dass die Abstande zwischen den Stiitzst ellen jeweils Eins betragen , was durch eine geeignete Normierung der Ein gan gsgrofien leicht zu erre ichen ist . Fiir den Ein gangsv ektor z berechnet sich dann die Ausgangsgrofe nach
(4.6)
Uz
Abb. 4 .3. Kennfeld-Fuzzy-R egler
4.1.3 Takagi-Sugeno-Kang-Systeme Der Fuzzy-Regler kann auch von vorn herein als Takagi-Sugeno-Kang-Regler (TSK-R egler) vorliegen (vgl. Kap . 3.2). Dieser zeichnet sich dadur ch aus, dass die Ausgangs grofle einer Regel nicht durch Fuzzy-Mengen /-lU i festg elegt wird , sondern durch eine Funkti on von beliebigen Syst emgrofen x ent sprechend Gleichung (3.8) . Hier sollen im Zusammenhan g mit der St abil it atsanalyse aber nur diejenigen TSK -R egler betrac htet werd en , bei den en diese Funktionen lineare Funktionen sind, da andern falls keine pr aktikablen Kriterien ableit bar sind: If ... then u = F iX (4.7) Dab ei ist F , eine konst ant e Koeffizient enm atrix. Beschreibt man au ch hier die Pramissen durch ent sprechend e Wahrheit sfunktionen ki (z), so ergibt sich die Ausgang sgrofe des TSK-Reglers aus der Uberlagerung der Ausgangsgrofen der einzelnen Regeln zu
268
4. Stabilitat sanalyse von Fuzzy-Reglern
(4.8) An dieser Form el ist ersicht lich, dass die Regler-Eingangsgrofen x nicht unbedin gt dieselben Grofen sein miissen , die die Regler-Pramissen bestirnmen (z) . Auch hier lassen sich, sofern die Wahrheit sfunktionen normale FuzzyMengen beschreiben und Bedingung (4.4) erfiillt ist , wieder Stii tzstellen angeben . Befindet sich das System an der i-ten Stiitzstelle, so ist das Ubert ragungsverhalte n des TSK-Reglers durch den rein linearen Zusammenhang u = F ix gegebe n. Und da der Ein gangsvektor x auch vergan gene Wert e von u enthalten kann, kann dieser lineare Zusammenh an g sogar int ern e Dyn amik darst ellen , was beim vorh er behandelten Kenn feld nicht moglich war. An einer Stii tzst elle ents pricht der TSK-Regler demn ach einem Iinearen Ubertragungsglied. Deshalb lasst sich ein T SK-Regler au ch als Para llelscha lt ung linearer Ubertragungs glieder auffassen, aus deren Ausgan gsgrofien der je nach Ein gang sgrofie gewichtete Mit telwert gebildet wird . Damit ents pricht ein TSK-Regler aber gerade einem Gain-S cheduling-Regier , wie er in Kapitel 2.8.2 beschrieben wurde. Fur den T SK-Regler mit den Eingangs groflen x = [Xl , .. ., x n] T lasst sich eine zusatzliche, kiinstli che Eingan gsgroBe Xn+ l definieren , die immer den konst anten Wert Eins au fweist. Set zt man dann alle Element e der Matrizen F , gleich Null und nur die (n + l)-te Spalte von F , jeweils gleich u , aus Gleichun g (4.5), so wird aus dem TSK-Regler gera de der Kennfeldregler aus (4.5): und
x' =
(7)
(4.9)
o ist
hier die Nullm atrix der Dimension n x n . Dami t ist gezeigt , dass der Kennfeldr egler lediglich ein Spezialfall des TS K-Reglers ist . TSK-Syst eme lassen sich auch zur Modelli erung gegebener Strecken-Ubertragungsglieder heran ziehen . Mit Hilfe eines solchen TSK-Modelles lasst sich jedes beliebige lineare oder nichtlineare Ubertragun gsverh alten mit oder ohne int erne Dynamik mit st eigend er Anz ahl der Regeln bzw. Stii t zst ellen beliebig gena u approximieren, sofern es keine Hyst erese oder Laufzeiten ent ha lt , Das TSK-Modell best eht aus einzelnen linearen Modellen , deren Ausgan gsgrollen mit wechselnd en Gewicht sfakto ren je nach dem Momentanwert der Ein gan gsgrofien iiberlagert werd en. Fur das Zust andsmodell einer Strecke ergibt sich beispielsweise
(4.10) In der Praxis gewinn t man ein solches Mod ell, wenn man wie bei indirekten adapt iven Verfahren zunachst verschiedene Stiitzstellen als Arb eit spunkte auswahlt und anschlieBend an jedem Arb eitspunkt eine klassische Ident ifikat ion der Strecke durchftihrt. Diese liefert ein lineares Modell des StreckenUbe rt ra gungsverhalte ns an diesem Arbeitsp unk t bzw. an dieser Stiitzstelle.
4.1 Voraussetzungen
269
Das gleiche wird fur aile anderen Stiitzstellen dur chgefiihr t . Damit ist das T SK-Modell der Strecke festgelegt . Es ist allerdings darauf zu achten, dass an jedem Arb eit spunkt dieselbe Systemstruktur vorau sgesetzt wird, d .h. insbesondere dieselb e Anzahl an Zust and s- und Eingangsgrof en, damit die Mat rizen A, und B i an jedem Arb eitsp unkt dieselb e Dimension aufweisen . Sofern ein klassisches nichtlin eares Mod ell der St recke vorliegt , anha nd dieses Modells ab er wegen seiner Kornplexit at kein Reglerentwurf moglich ist , kann es au ch durchau s Sinn machen , dieses Modell in ein TSK-Modell zu ub erftihren und einen T SK-Regler auf Basis des T SK- Modells zu entwerfen. In [184] wird ein dazu geeigneter Ansatz vorgest ellt . Bevor auf diesen Ansatz nah er eingegangen wird , sollen aber zun achst einige gru ndlegende Uberlegungen skizziert werd en . Ausgan gspunkt der Uberlegungen ist ein allgemeines nichtlineares Modell der Strecke: x = f'(x , u ) (4.11) Die Entwicklung der rechten Seite an einem gegebenen Arb eitspunkt (x o, u o) in eine nach dem erst en Glied abgebrochene Taylor-R eihe liefert (vgl. Gleichung (2.215))
.
x = f (xo, u o) +
of ax (xo, u o)(x -
xo) +
of au (x o, uo)(u -
u o)
(4.12)
Offensichtlich weist diese Gleichung einen konstanten Anteil f (xo, un) auf, der nicht zwangslaufig gleich Null sein muss, sonde rn im Gegenteil, wenn man eine solche Taylor-Entwicklun g an verschiede nen Arb eitspunkt en durchfiihr t , sicherlich an den meist en Arb eitspunkt en ungleich Null sein wird. Die Taylor-Entwicklun g der nichtlin earen Funktion an den einzelnen Arbeitspunkten fiihrt demnach im allgemeinen nicht auf lineare Teilmodelle der Form x = A ix + B ill , sondern auf affine Teilmodelle der Form
x = A ix + B iu + a ,
(4.13)
d .h. linear e Modelle mit konst anten Ant eilen. Fur den Reglerentwurf und auch die Stabilitatsbetrachtungen anha nd von TSK-Modellen werden ab er lineare Teilmod elle beno tigt . Abhilfe bietet hier der schon angesprochene Ansat z in [184], mit dem das allgemeine nichtlinear e Modell an jedem Arb eitspunkt in ein lineares Modell tiberftihrt werden kann. Der Ansatz gilt zwar nur Iiir Syst eme ohn e aufiere Anr egun g, soli hier aber denno ch vorgest ellt werd en , urn zumindest eine Vorst ellung von den notwendi gen Schritten zu geben. Ausgan gspunkt ist die allgemeine Gleichun g x = f'(x ), die an einem Arb eitspunkt Xo durch die linear e Gleichung x = Ax approximiert werd en soil. In der Umgebung des Arbeits pun ktes muss demnach gelte n: f (x )
~
Ax
f (x o) = Ax-,
(4.14) (4.15)
270
4. Stabilitatsa nalyse von Fuzzy-Reglern
Gesucht sind die Koeffizienten der Matri x A . Fiir jede einzelne Zeile aT von A folgt aus (4.14) und (4.15):
!i(X) >::! aTx ! i(XO) = aTXo
(4.16) (4.17)
Die Entwicklung der linken Seite von Gleichung (4.16) in eine Taylor-Reihe und Abbru ch der Reihe nach dem erste n Glied liefert f;(xo)
+ ( ~~ (xo)f(x -
xo) >::! aTx
(4.18)
xo) >::! aT(x - xo)
(4.19)
Einsetzen von (4.17) in (4.18) ergibt
(~~ (xo)f(x -
Die Koeffizient en von a , miissen demnach so bestimmt werden, dass a, zum einen moglichst genau ~( xo) entspricht, d .h.
J
+ 00
21
(af; ) - a, )T( af; ax (Xo ax (Xo) - ai )dt
(4.20)
- 00
minim al wird, und zum anderen die Nebenbedingung ! i(XO ) = aTXo erfiillt ist. Ent spr echend der Theorie der Variationsrechnun g (vgl. [24]) wird zur Losung des Problems zunachst die Lagrange-Funktion gebildet : 1 ( 8ax f; (Xo) - a , )T ( af; ) - a , ) + A(T L = 2 ax (Xo a i Xo - ! i(XO))
(4.21)
Die Euler-Lagrange-Gleichung liefert
0 = 8L 8ai
= ai -
af; (xo) + AXo ax
(4.22)
Die Multiplikation dieser Gleichung mit X6 , Einsetzen von Gleichung (4.17) und Auflosen nach A fiihrt auf
A = X6 ~(Xo) - f;(xo) II xo l1 2
(4.23)
Dab ei sei Xo =I 0 vorausgesetzt . Dieser Ausdruck fiir A wird in (4.22) eingeset zt und liefert die gesuchte Berechnungsvorschrift fiir a . : (4.24) Mit dieser Formel lassen sich fiir jeden Arb eit spunkt aus der nichtlin ear en Funk tion f (x) die Zeilen der an dem Arb eitspunkt giilt igen Mat rix A berechnen , und man erhalt an jed em Arb eitspunkt ein lineares Str eckenmodell.
4.1 Voraussetzungen
271
Diese linearen Teilmodelle konnen dann zu einem T SK-Modell der Str ecke vereinigt werd en. Es sei ausdriicklich davor gewarn t , TSK-Streckenmodelle fur einen klassischen Reglerentwurf heran zuziehen. Denn durch die Uberlagerung der einzelnen linearen Modelle entste hen Fehler bei hoheren Ableitungen der Modelle wie z.B. negative Verst iirkun g, die verheerende Auswirkungen auf den Reglerentwurf haben konn en, In [138] wird ein solcher Fall anschaulich erliiutert . Geeignet ist allerdings der Entwurf eines linearen Zust andsreglers mit der Koeffizient enmatri x F, fur jedes einzelne lineare Teil-Streckenmodell (Ai, B j ), Diese einzelnen Regier werden dann zu einem TS K-Regler zusammengefasst , der die gleichen Prarnissen [St iitzstellen ) aufweist wie das TSKStreckenmodell. Es ergibt sich ein T SK-Regler ent sprechend Gleichung (4.8), wobei der Vekt or x dort ein Vekt or beliebiger Syst emgrofen war , wahrend er jet zt ausschlieBlich aus Zustandsgrofen best eht . Inwieweit ein so entworfener Regier das Syst em dann tat sachlich stabilisiert , wird in Kapitel 4.2.2 behandelt . Einsetzen der Gleichun g (4.8) des T SK-Reglers in (4.10) liefert die Zust andsgleichung eines von auBen nicht angeregte n geschlossenen Kr eises in Form eines T SK-Modelles
L L ki (z(t ))kj (z(t )) [A i + B iF x(t) = L L ki (z(t ))kj (z(t ))Gijx (t ) x (t) =
j ]
x (t)
(4.25)
j
(4.26)
j
mit G ij = A , + B iF j , und nach einer Umindizieru ng und Zusamm enfassun g mit A g,l = G ij und kt(z(t)) = ki( z(t) )kj(z(t ))
x (t ) =
L ki (Z(t ))Ag,lX(t )
(4.27)
1
Der Ind ex g an der Syst emmat rix soli verdeut lichen, dass es sich hierb ei urn ein Modell des geschlossenen Kreises hand elt und nicht urn ein Modell der Strecke. Unter Beriicksichtigung einer auferen Anregung ergibt sich dar aus die allgemeine Form des TSK-Modelles eines geschlossenen Kreises mit iiuBerer Anr egung (vgl. [182]): (4.28) Weil Fuzzy-Regier im allgemeinen mit einem Mikroprozessor realisiert werden , ist gegebenenfalls auch die diskrete Form dieser Zustandsgleichung erford erlich: (4.29) x(k + 1) = ki (z(k)) [Ag,ix(k) + B g,iW(k)]
L
272
4. Stabilitatsanalyse von Fuzzy-Reglern
Dab ei sind x(k) der Zustandsvektor des Syst ems und w(k) die Anregung zu einem Zeitpunkt t = kT , wobei T das Abtastintervall der Regclung dars tellt. Zu beachten ist, dass die hier auft reten den Matrizen A g,i und B g,i nicht identis ch sind mit denen in Gleichung (4.28) . Der TSK-Regler als Zust and sregler wirft allerdings die Frage auf, wie die Zustandsgrofen als Ein gangsgrofen des Reglers bereitgest ellt werden konn en, da Zust andsgrofen in vielen Fallen nicht direkt messbar sind . Wie schon bei klassischen Zustandsreglern ist daher auch hier ein Beobacht er erforderlich. Und da sowohl das Streckenmod ell als auch der Regier als TSK-S yst eme vorliegen , bietet es sich an , auch den Beobachter als TSK -Syst em auszufiihren . Dab ei ist es nah eliegend , fur den Beobachter die gleichen Stii tzst ellen zu wahlen wie fur Streckenmodell und Regier. F ur jede Stiitzstelle wird dann zun achst ein linearer Beobachter ents prechend Abb . 2.53 definiert: (4.30)
Ai und B , entsprechen den Matrizen des Streckenmodells aus Gleichung (4.10). x(t) ist der geschatzte Zust andsvektor und y(t) der Ausgangsvektor des Beobachters, der einen Schatzwert fur den realen Ausgangsvektor y(t) darst ellt . H i schlieBlich ist die Korr ekturmatrix , mit der die Differenz zwischen realem und geschatztem Ausgan gsvektor multipliziert und als Korrekturterm in den Beobachter zurtickgefiihr t wird . Diese einzelnen Beobachter werden dann zu einem TSK-Beobachter zusammengefUgt : (4.31) Spezielle Beachtung verdienen bei einem derartigen Beobachter die Eingangsgrofe n der Prarnissen z. Denn sofern Zust andsgrofen als Eingan gsgrofien verwend et werden, kann es sich dab ei auch nur urn die gescha tzte n Zust and sgrofe n hand eln . Diese Tatsache muss in allen Verfahren , in denen es urn T SK-Beobachte r geht , geeignet beriicksichti gt werd en .
4.2 Direkte Methode von Ljapunov Nach diesen Vorbetrachtungen konnen die einzelnen Verfahren zur Stabilit atsanalyse von Fuzzy-Reglern dargestellt werden , und zwar zunachst die direkte Methode von Ljapunov. Voraussetzung fiir diese Methode ist , dass die Zust andsgleichungen der Strecke bekannt und die Eingangsgrofen des Fuzzy-Reglers Zust andsgrofen sind . Ein e Aufteilung des Systems in einen linearen und einen nichtlinear en Systemt eil ist aber nicht erforderlich. Auch Mehrgrofiensyst eme konnen beh and elt werd en .
4.2 Direkte Methode von Ljapunov
273
4.2.1 Anwendung auf gewohnliche Fuzzy-Hegler Zunachst sei angenommen , dass ein Fuzzy-Regier mit Fuzzifizierung, RegeIbasis und Defuzzifizierung vorliegt. Sein Ubertragungsverh alten ist damit zwar gegeben, kann aber nicht oder nur mit sehr viel Aufwand an alyti sch beschrieben werden. Weit erhin wird vora usgesetz t, dass der Sollwert w des geschlossenen Kreises gleich Null ist , was durch eine Umdefinition des Systems nach Abb . 2.79 erreicht worden kann. Dann lasst sich fur den Fuzzy-RegIer eine zunac hst unb ekannte Funkt ion u = r(x) anset zen, wobei x der Zustandsvektor der Strecke ist . Dagegen miissen die Differentialgleichungen der Strecke als bekannt vorau sgeset zt werd en: = f'(x , u) . Fur die Zust andsgleichun g des geschlossenen Kreises folgt damit
x
x = f(x , r(x))
(4.32)
Nun ist eine positiv definite Ljapunov-Funktion V(x) zu finden , deren Ableitung V(x) fur aile Vektoren x innerhalb des interessierenden Zust andsraumbereiches negativ definit ist . Falls eine so1che Funkti on exist iert , ist die betracht et e Ruhelage nach Satz 2.23 asy mpt ot isch stabil und ein Gebiet innerh alb des untersucht en Bereiches, das von einer geschlossenen Hohenlini e von V begrenzt wird , der Einzugsbereich der Ruhelage. Der einfachste Ansatz besteht darin, eine positiv definit e Mat rix P vorzugeben und die Ljapunov-Funkt ion gemiiB V = xTpx zu definieren. Wegen der positiven Definitheit von P ist diese Funktion sicherlich ebenfalls positiv definit . Fur die Ableitung dieser Funktion gilt mit (4.32) V(x) = x Tpx
+ xTpx
= f T(x , r(x))Px
+ xTpf(x , r(x))
(4.33)
Als St abilitiitsbedin gun g folgt dah er f T (x, r(x) )Px + xTpf(x , r(x))
<0
(4.34)
Dies ist eine Bedingung ftir die unb ekannte Funktion r(x) , d .h. fur das Ubertragun gsverh alten des Fuzzy-Reglers. Nun ist lediglich noch zu ub erpriifen , ob dieses Ubertragungsverha lte n r(x) die Bedin gun g fur aile Vektoren x des int eressierend en Zust andsraumb ereiches erftillt . Da dies auf analyt ischem Wege nicht moglich ist , behilft man sich mit einer nummerischen Losun g, d.h. man muss fur ausreichend viele Vektoren x den Ausgan gsvektor r(x) des FuzzyReglers best irnmen und ermit teln, ob jeweils die Ungleichung (4.34) erftillt ist . In sehr einfachen Fallen ist es sogar moglich, die Ungleichung vorh er nach r(x) aufzulosen. Wenn man dann das Ungleichheitsze ichen durch ein Gleichheit szeichen ersetzt, so ergibt sich ein Crenz-Ub ertragun gsverh alt en , das un mittelbar mit dem Ubert rag ungsverha lte n r(x) des Fuzzy-Reglers verglichen werd en kann [30].
274
4. Stabilitatsanalyse von Fuzzy-Reglern
Falls die Ungleichung (4.34) fur einen oder mehrere Zust andsvektoren nieht erfullt ist , kann keine Aussage iiber das Stabilitatsverhalten des Regelkreises gemacht werden. Man steht dann vor der Frage, ob die LjapunovFunktion, also insbesondere die Matri x P , ungiinstig gewahlt war oder das Syst em tatsachlich instabil ist. Urn diese Situat ion zu vermeiden, ist man an Verfahren int eressiert, die die Festl egung einer geeigneten Ljapunov-Funktion bzw. einer Matrix P unterstiitzen. Das bekannteste dieser Verfahren ist die Methode nach Aiserm ann . Dazu muss die Zust andsgleichung (4.32) des Gesamtsystems zerlegt werden konnen in einen moglichst groBen, linearen st abilen Anteil und einen nichtlinearen Ant eil: (4.35) x = Ax+n(x) Eine positiv definite Matrix P ergibt sich dann aus der mit dem linearen Ant eil aufgeste llte n Ljapunov-Gleichung (vgl. Sat z A.6) (4.36) Mit dieser Matrix wird dann die Ljapunov-Funktion V = x Tpx gebildet . Die Wahrsch einlichkeit , dass mit dieser Funk tion die Stabilitat des Syst ems na chgewiesen werden kann (sofern es iiberhaup t st abil ist) , ist umso grofer, je kleiner der nichtl ineare Ante il n(x) ausfallt . Ein Beispiel zu diesem Verfahren findet sieh in [20]. 4.2.2 Anwendung auf Takagi-Sugeno-Kang-Regler Stabilitatskriterien. Eine andere Vorgehensweise ergibt sieh, wenn der Fuzzy-Regier ein TSK-Regler ist oder zumindest als solcher aufgefasst wird . Wie in Kapitel 4.1 schon erlautert wurd e, lassen sich auch die iibrigen Systemteile und damit der gesamte geschlossene Kreis durch ein TSK-Modell approximieren. Die St abilitatsan alyse kann dann basierend auf dem TSKModell des geschlossenen Kreises (4.28) bzw. der diskreten Version (4.29) dur chgefuhrt werden. Mit der diskret en Version soll begonnen werden. Hier gilt der Satz (vgl. [182]) : Satz 4.1 Gegeben sei ein diskretes System in der Form x(k + 1) =
L k;(z(k))A;x(k)
(4.37)
Dieses Syst em besitzt eine global asymptotisch stabile Ruh elage x = 0 , wenn eine gemeinsame, positiv definite Matr ix P fur aile Teilsyst eme A ; existiert, so dass (4.38) M ; = AfPA; -P fur aile i negativ definit (M; < 0 ) ist.
4.2 Direkte Methode von Ljapunov
275
Fur den Beweis sei ange nommen, dass eine positi v definite Matrix P exist iert. Mit dieser wird die Ljap unov-Funkt ion V = x T (k )Px(k) angesetzt . Dann gilt: L1V (x (k)) = V( x (k
+ 1)) -
V( x(k))
= xT (k + l )Px(k + 1) - xT (k )Px(k)
~ (~ k'A'X(kr P (~ kjAjX(k)) - xT(k)Px(k)
~ xT(k)[(~k'AT) P (~kjAj) -+ (k) =L
kik jxT( k)(A;PA j - P)x(k)
i, j
=L
k;xT (k )(A;PA i - P )x(k )
+L
kikj xT(k) (A;P A j + A JPA i - 2P )x(k ) < 0 (4.39)
i< j
Die Matrizen in der ersten Surnme sind lau t Vora ussetzung negati v definit , so dass jeder einzelne Sum ma nd sicher kleiner als Null ist. Die Matrizen in der zweiten Summe lassen sich folgend erm aBen umformen: A' TpA ·+ AJ TpA- 2P J '
=-
(A-' - A J·)Tp (A-' - A·J ) + A; P A i + A JPAj - 2P
= -(A i -
A j fp (A i - A j ) + (A;PA i - P ) + (AJP Aj - P ) (4.40)
Wegen der positiv en Definith eit von P ist der erste Summand sicher negativ definit , wahrend dies fiir die beiden anderen Summand en lau t Vorausset zun g gilt. Damit sind abe r auch aile Matri zen in der zweite n Summe von Gleichun g (4.39) negativ definit und demn ach auch hier aile Summanden kleiner als Null. Die Ableitung bzw. Differenz der Ljapunov-Funkt ion ist deshalb sicher negativ definit , worau s die St abili tat des Syst ems folgt . Fur kontinuierliche T SK-Systeme nach (4.28) sind die Verh altni sse noch einfacher. Der St abili t at ssatz lau tet hier :
Satz 4.2 Gegeben sei ein koni inuierliches Sys tem in der Form
x=
L ki( z(t)) A i x( t)
(4.41)
Dieses System besitzt eine global asymptotisch sta bile Ruhelaqe x = 0 , wenn eine gem einsame, positi v definit e Matrix P fur alle Teilsystem e Ai existiert, so dass
276
4. Stabilitatsanalyse von Fuzzy-Reglern
M i =A;P+PAi fur aile i n egativ definit (M i
(4.42)
< 0 ) ist.
Fur den Beweis wird wieder eine Ljapunov-Funktion V = x Tpx mit positiv definiter Matrix P gewahlt , Fur die Ableitung dieser Funk tion nach der Zeit gilt :
v = x Tpx + x Tpx T = L kix A;Px + L kixT p Aix (4.43) Nach Voraussetzung sind wieder aile Matriz en der Summe negativ definit und damit jeder einzelne Summand kleiner als Null. Das Syst em ist demnach st ab il. Beide Satz e konnen direkt ftir die Stabilitat sanalyse eines TSK-Systems verwendet werden. Die Analyse gestaltet sich besonders einfach, wenn man die Frage nach der Existenz der Mat rix P als LMI-P roblem (Lineare Mat rixUngleichung) formuliert . 1m Anhang A.7 wird ausflihrlich beschrieben, wie ein Syst em aus Ungleichungen (4.44) in die Form (A.44) gebracht werden kann. Auf diese Form lasst sich dann ein Llvll-Losungs-Al gorithmus anwenden, der die Frage nach der Existe nz einer Losun g P und dami t die Frage nach der Stabilitat des Syste ms beantwort et. Gegebenenfalls kann sogar eine Losung fur P berechnet werden, was bei der Auslegung eines Reglers mit Hilfe eines LMI-Algorithmus erforderlich ist , wie im Folgenden noch erlautert wird. Erleichterung der Stabilitatsbedingungen. Zu beachte n ist , dass die negative Definith eit aller M , zwar ein hinreichendes, abe r kein notwendiges Kriterium fur die Stabilitat des Systems ist . Die negative Definith eit aller M , bewirkt doch , dassjeder Summand in den Gleichungen (4.39) bzw. (4.43) fur beliebige x negativ ist , obwohl doch eigentlich nur die gesamte Summe negativ sein musst e, urn St abilitat zu gewahrleisten. Einzelne Summanden diirften also dur chaus positiv sein, ohne dass das System instabil ware. Ein e entscheidende Abschwachung bzw. Vereinfachung der Stabilitatsbedingungen lasst sich daher erzielen, wenn die Koeffizienten k; und ihre Abhangigkeit vom Eingangsvektor z in den Gleichungen (4.39) bzw. (4.43) fur ein Stabilitatskriterium mit beru cksichtigt werden. Derartige Ansatze existieren aber bisher nur fur TSK-Systeme mit Reglern (vgl. (4.26)) und werden in Kapitel 4.2.2 noch vorgeste llt . Eine andere Moglichkeit besteht darin , auf numm erischem Wege fur eine vorgegebene Matrix P und eine ausreichend groBe Anzahl an Vektoren x
4.2 Direkte Methode von Ljapunov
277
und z die Ungleichung (4.39) bzw. (4.43) direkt iiberpriifen. Dieser Ansatz weist aber gegeniiber der Losung mit tels LMI-Algorithmen den entscheidenden Nachteil auf, dass er nur flir eine einzelne, gegebene Mat rix P die Stabilitat unt ersucht . 1st das Ergebnis negati v, so wird eine miihsame, unstrukt urierte und moglicherweise erfolglose Suche nach einer geeigneten Matrix P erforderlich, mit der sich die Stabilitat des Systems nachweisen lasst , ohne zu wissen, ob eine solche Matrix iiberhau pt existiert . Dagegen beantwortet ein LMI-Algorithmus gerade diese grundsatzliche Frage nach der Existenz einer Matrix P , mit der das Ungleichungssyste m (4.44) erfiillt ist . Von daher ist die Vorgehensweise mit tels LMI-Algorithmen auf jeden Fall vorzuziehen , auch wenn es einzelne Systeme geben wird , deren St abilit at mit dieser Methode nicht nachgewiesen werden kann. 1m weiteren Veriauf dieses Kapitels wird grundsat zlich von der Verwendung eines LMIAlgorithmus ausgegangen. Erst am Ende werden noch einmal kurz andere Ansatze skizziert . Zur Abschwachung der St abilit at sbedingungen (4.38) und (4.42) lasst sich in diesem Zusammenhang aber auch die Methode nach Aiserm ann einsetzen (vgl. Kap . 4.2.1 und [211]). Da der grundsiitzliche Ansatz dur ch diese Methode nur leicht variiert wird , fuhrt sie ebenfalls auf linear e MatrixUngleichungen, und die Losung kann auch hier wieder mit einem LMILosun gsalgorithmus gewonnen werden. 1m Folgenden soli die Met hode ftir kontinui erliche Modelle dernonstri ert werden. Dazu ist in (4.45) jedes Teilsystem Ai zu zerlegen in einen gemeinsamen , stabilen Anteil A und einen Rest L1Ai , so dass sich als neue Syst emdarstellung ergibt : (4.46) Mit der positiv definit en Losung P der Ljapunov-Gleichung (vgl. Satz A.6)
PA +Al'P =-1 wird dann die positiv definite Ljapunov-Funktion V deren Ableitung gilt
(4.47)
=
xTpx gebildet, fiir
V = xl'px + x Tpx
~ xT [A + ~ k;LlA,r Px + xTp [A + ~ k,LlA,] x = x l' [A TP +
(~kiL1Ai)TP + PA + P(~ kiL1A i)] x
(4.48)
278
4. Stabilitatsanalyse von Fuzzy-Reglern
Mit (4.47) wird daraus die Stabilitat sbedin gun g
v= x
T
[-I +
~ ki( z)(Ll A; P + P LlAi)] x < 0
und unter Beriicksichtigung von
L
k i (z)
(4.49)
=1
i
(4.50)
Dami t lasst sich die Bedin gun g (4.42) durch die Ford erung LlA;P + P LlA i - 1 < 0
(4.51)
ersetzen, die bei entsprechender Struktur des Syst ems, z.B. nur schwach ausgepr agton Nichtlinearitaten, sichcrlich weniger konservativ e Er gebnisse liefern wird .
Robustheit. Mit Hilfe der obigen Siitze kann nicht nur die Stabili t at , sondern auch die Robustheit eines Syst ems untersucht werd en (vgl. [29]). Ausgangspunkt der Uberlegung en ist die sehr allgemeine, zeitdiskrete Darst ellung eines Systems mit zeitveriinderlichen Systernpar am etern und von auBen angreifend en Stor- und Eingangsgrofen x (k + l )
= L:)
i [AliX(k) + B liv (k) + B 2i u(k) ]
i
(4.52)
mit dem zeitdiskr et en Zust andsvektor x , dem Vekt or der Ein gangsgrof en u , einem von auBen angre ifenden St orgrofenvekto r v und dem Ausgan gsvektor y . Dab ei sind usw.
(4.53)
die urn einen zeitveriinderlichen Ant eil erweite rte n Syst cmmatrizen. Die zeitveranderlichen Ant eile sind wiederum definiert durch (4.54)
E li, E 2i sowic H li , H 2i , H 3i sind konst ante Matrizcn geeigneter Dimension , wahrend die Matri x Fi(k ) die Zeitver iinderlichkeit beinh alt et. All diese Matrizen sind frei wahlbar , lediglich fur Fi (k ) muss die Bedingung
F f( k )Fi(k ) < 1
(4.55)
4.2 Direkte Methode von Ljapunov
279
erfiillt sein. Sinnvollerweise wahlt man fur Fi(k) eine Diagon alm atrix, deren einzelne Hauptdiagonalelement e zwischen -I und 1 variieren. Die Gleichungen (4.54) und (4.55) erscheinen zunachst als sehr einschra nkende Bedingungen hinsichtlich der Form der zulassigen Param eteranderungen. Reduziert man das Syst em (4.52) aber auf ein von auBen nicht angeregtes oder gest6 rtes System (alle Matrizen sind gleich Null auBer Ali) , so wird aus (4.54) die Bedin gung L\Ali(k) = E liFi(k)Hl i (4.56)
Offensichtlich kann hier jede beliebige Par am eter anderung L\AIi(k) schon durch die Koeffizienten von H j, det ailliert darg est ellt werden , wenn man Eli = lund mit
- I < !l (t),!2 (t ) < I
(4.57)
wahlt. F ur ein Syst em des T yps (4.52) werden in [29] die Bedingungen angegeben, unter denen die St abilitat des Systems trotz varii erend er Paramet er gewahrleiste t und die H oc-Norm seiner St or-Ubert rag ungsfunkt ion kleiner als eine wahlbare Schr anke v ist . Die Bedingungen sind in Matrix-Ungleichungen zusammengefasst, so dass au ch hier zum Nachweis der Stabilitat wieder ein LMI-Algorithmus zum Einsatz komm en kann. Da diese Ungleichungen aber sehr umfangreich sind, sollen sie hier nicht angegebe n werden. Stattdessen soll hier nur die Beweisid ee skizziert werden . Ausg angspunkt des Beweises ist die H oc-Norm der Stor-Uber tragungsfunkt ion , Gem iiB Gleichung (A.20) gilt fur diese Norm
IIYl12 IIGlloc,stoer = vto sup -II-II v 2
(4.58)
Damit diese Norm kleiner als , ist , muss also fiir beliebige St6rsignale v und die daraus entstehend en Ausg angssignale y die Ungleichung (4.59) erfullt sein. Das mit , mult iplizierte St6rsignal bildet also gewissermaBen die Ob ergrenze ftir das resul tierende Ausgan gssignal. 1m vorliegend en zeit diskret en Fall ergibt sich daraus (vgl. Gleichun g (A.12) mit p = 2) N- l
L
y T(k)y(k)
<,
k=O
N- l
L
N- l
N- l
L yT (k)y(k) <,2 L k=O N -l
L
k=O
[yT(k)y (k) -
,2v T (k )v (k )] <
vT(k)v(k)
k=O
v T(k)v(k)
k=O
0
(4.60)
280
4. Stabilitatsanalyse von Fuzzy-Reglern
Wenn Ungleichung (4.60) erfiillt ist, dann ist die Hoc-Norm der Star-Ubertragungsfunktion kleiner als 'Y. Eine einfache additive Erweiterung der Ungleichung fiihrt auf N -l
L [yT(k)y(k) + xT(k + 1)Px(k + 1) -
xT(k)Px(k)
k =O
mit
x(O) = 0 (4.61)
Dabei wird ohne Einschrankung der Allgemeingtiltigkeit x(O) = 0 angenommen. Einsetzen von (4.52) in (4.61) und geeignetes Zusammenfassen verschiedener Grofen fiihrt dann auf die Bedingung
<0
(4.62)
mit dem urn die Storgroflen erweiterten Zustandsvektor xT(k) zum Zeitpunkt k. Gi j ist eine erweiterte Systemmatrix, die die ursprungliche Systemmatrix, die Rtickkopplung durch einen Regier (vgl. (4.26)) und aIle entsprechenden Parameterunsicherheiten enthalt. Ci j ist analog dazu eine erweiterte Ausgangsmatrix. Und schlieBlich ist P definiert durch
P=
(Po 0)
(4.63)
'Y1
und damit lediglich eine auf der Hauptdiagonalen erweiterte Matrix P. (4.62) ist sicher erfullt und damit die Hoc-Norm der Stor-Ubertragungsfunktion kleiner als 'Y, wenn aIle (4.64) negativ definit sind . Quasi als Nebenprodukt des Beweises sind damit aber sicher auch aile G'l;PG i j - P negativ definit und das System mit Satz 4.1 stabil auch bei variierenden Parametern. Einige weitere Umformungen und die Beriicksichtigung von (4.55) fiihren dann auf die Stabilitatsbedingungen in Form eines LMI-Systems, die hier, weil sie zu umfangreich sind, nicht aufgefiihrt werden soIlen. Systeme mit variabler Laufzeit. In [28] wird gezeigt, dass man die Satze 4.1 und 4.2 sogar fiir Systeme mit variabler Laufzeit erweitern kann . Fur kontinuierliche Systeme ergibt sich dann beispielsweise der folgende Satz: Satz 4.3 Gegeben sei ein kontinuierliches System in der Form
x = L ki(z(t)) [Alix(t) + A 2iX(t -
T(t))]
(4.65)
4.2 Direkte Methode von Ljapunov
281
mit der variablen Laujzeit T, die durch li( t) I :::; f3 < 1 begrenzt ist . Dieses System besitzt eine global asymptotisch stabile Ruh elage x = 0 , wenn gemeinsame, positi v definite Matri zen P und S Jiir alle Teilsysteme (Ail , A i2) existieren, so dass die jolgende Matri x- Ungleichung erjiillt ist: (4.66)
d.h, die linke Seite der Ungleichung mu ss negativ definit sein. Fur den Beweis wird die Ljapunov-Funkt ion t
V(x(t) ) = xT(t)Px(t)
+ 1 ~ f3
J
xT(a)Px(a)da
(4.67)
t-T(t)
definiert und unter Verwendung von (4.66) gezeigt , dass Ihre Ableitung fur aile x(t) negativ ist . Da der Grundgedanke des Beweises derselb e ist wie in den Beweisen der Sat ze 4.1 und 4.2, soli hier auf eine Darstellung verzichtet werden. Wichtig er ist eine Betrachtung der Matrix-Ungleichung (4.66) , die fur die unbekannten Mat rizen P und S nicht linear ist . Ein LMI-Algorithmus kann daher auf Ungleichun gen dieses Typs nicht angewendet werd en. Mit Hilfe des Schur-Komplementes (A.45) lasst sich (4.66) aber umformen in (
A 'i:P
+ PA l i + l~,13S PA 2i ) A~P
S
<0
(4.68)
Dies ist eine Matrix, deren einzelne Komponenten linear von den gesuchten Matri zen P und S abhangen. Wie im Anh ang A.7 erlaute rt, lassen sich Ungleichung en mit Teilmatrizen dieses Typs prablemlos zur Grundform (A.44) eines LMI-Problems zusammenfassen und mit einem LMI-Algorithmus behand eln . Anzumerken bleibt , dass in [28] das St abilitat skriterium fiir Systeme mit var iabler Laufzeit nicht nur in der dargest ellt en Form (4.66), sondern daruber hinaus sowohl fur kontinuierliche als auch fur diskr ete Systeme mit Reglern und sogar Beobachtern hergeleitet wird . Das P rinzip ist ab er in allen F allen gleich.
Systeme mit Reglern. In den meist en Anwendungsfallen wird das System nicht direkt in der Form (4.37) bzw , (4.41) vorliegen, sond ern in der Form (4.26), denn die Stabilitat san alyse erfolgt norm alerweise zusa mmen mit oder direkt nach dem Reglerentwurf. Daher miisst e Ai in Gleichung (4.42) durch G i j erset zt und die Bedingung dann ftir samtliche Ind expaare (i, j) tiberpriift werd en . Prinzipiell ist dies naturlich moglich, es flihrt aber wegen der graBen Anzahl zu ub erpnifend er Ungleichungen auf ein sehr umfangreiches
282
4. Stabilitatsanalyse von Fuzzy-Reglern
LMI-Problem. Eleganter ist dagegen sicherlich, die Darstellung (4.26) des Syste ms zunachst umzuformulieren und erst dann den Sat z 4.2 auf das System anzuwenden (vgl. [181]). Ausgangspunkt fur den kont inuierlichen Fall ist die Gleichung (4.26), deren rechte Seite in zwei Teilsumm en zerlegt wird :
j
x(t) =
L ki(z(t))ki(z(t))GiiX(t) +2 L<. ki(z (t))kj(z(t)) [G ,
ij;
(4.69)
G ji] x(t)
J
Dieselbe Ljapunovfunktion und die gleiche Rechnun g wie in (4.43) liefern dann
11 = xTpx + xTpx = '"'" k 2xTG T.px + 2'"'" kkx T L-J ' " L-J ' J i< j
i
+L
k;xTpG iix + 2
, =
t;
[
T
+ G J' ] 2
Px
L: kik jxTp [G ij ; Gj i] x
(4.70)
'<J
Lk;xT (G~P+PGii)X +2
T
G 'J
kik jxT ([Gi
j;
G
ji
r
j ji P + P [G i ; G
J)
x
(4.71)
<0 und damit die folgenden beiden Stabilitatsbedingungen, die beide ftir samtliche i und j > i erfullt sein miissen:
j ji [G i ; G
r
P
G~P +PG ii < 0
+P
j [G i ; G ji] < 0
(4.72) fur i < j
(4.73)
Offensichtlich hat sich dur ch diese Umformulierung die Anzahl der zu tiberprufenden Ungleichungen von i x j auf rund die Halfte redu ziert . Die Schritte ftir den diskret en Fall sind ana log. Das LMI-Problem lasst sich noch weiter reduzieren , wenn man berucksicht igt , dass sowohl jedes Teilmodell der Strecke (A i, B i) als auch jeder Teilregler Pj nur in der Umgebung der jeweiligen Stiitzstelle i bzw. j akti v sind . Da die Indi zes i und j dieselben Stiitzstellen beschreiben, folgt dar aus , dass das Produkt ki(z( t))kj(z (t)) fur weit voneina nder ent fernt liegende Indizes i und j immer Null ist . Damit miissen aber auch in Bedingung (4.73)
4.2 Direkte Methode von Ljapunov
283
nur diejenigen G i j iiberprii ft werden , deren Indi zes zueinan der benachbart sind . Eine andere Abschwachun g bzw. Vereinfachung der Stabilitatsbed ingungen (4.72) und (4.73) lasst sich erzielen, wenn , wie in Kapitel 4.2.2 schon erwa hnt , die Koeffizienten k i fur die Stabilitatsbedingu ng mit beriicksicht igt werden und die Sum me in (4.71) als Ganzes betrachtet wird . Bedin gung (4.73) result iert aus der Forderung, dass jeder Summ and in (4.71) kleiner als Null sein muss. Dagegen wird im folgenden Ansatz beriicksicht igt , dass die einzelnen Summand en durch die k; gewichtet werd en und posit ive Summanden durch negative Summ and en durchaus komp ensiert werde n konn en , Denn entsc heidend fur die Stab ilit at des Systems ist nur , dass die gesamte Summe negativ ist , nicht jeder einzelne Summand. Ausgangspunkt der Uberlegungen ist Gleichun g (4.71), die lediglich in Matrizenform darzustellen ist (vgl. [85]):
kk1X x) 2
·
(k1X) k x
T
2
X
( kr··x
...
<0
(4.74)
krx
mit
X =
!
(LT' ~rL,, 2~l~: ~t,~,) .•.•.•.~~~~: : :~:;i) o
o
·..
L rrP
(4.75)
+ PL rr
und Lij = Gij ~Gji • Offensichtlich ist diese Ungleichung immer erfiillt , wenn die Mat rix X negativ definit ist. Da die Matrix linear von P ab ha ngt , kann auch hier mit einem LMI-Algorith mus iiberpruft werden, ob ub erh aup t ein P exist iert , ftir das die Matrix negativ definit und das System dam it stabil ist . Es ste llt sich die Frage nach einem Vergleich zwischen dieser St abilitatsbedin gung und den beiden Bedingun gen (4.72) und (4.73). Zunachst ist festzustellen, dass die negative Definitheit der hier entwickelte n Matrix insb esondere erfordert , dass samt lichc Matri zen auf ihrer Hauptdiagonalen negat iv definit sind, also die Bedingun g L [;P + PL i i < 0 fiir aile i erfiillt sein muss. Dies entspricht aber gera de der Bedingung (4.72). Dur ch die Forderung nach negativer Definith eit der Matri x X ent fallt also nur Bedin gun g (4.73), wahrend Bedin gung (4.72) implizit ent halten ist. Da aber fur die negative Definith eit der Matrix X nicht ihre samt lichen Eintriige auBerha lb der Haup tdi agonalen negativ definit sein miissen, was gleichbede utend mit Bedingung (4.73) ware, ist die negative Definitheit dieser Matrix offenbar die weniger strenge Bedin gung und demnach fur den Stabilitiits nachweis giinst iger .
284
4. Stabilitat sanalyse von Fuzzy-Reglern
Als weitere Option wird in [181] vorgeschlagen, eine weitere, positiv semidefinit e Matrix Q einzufilhren, urn zusatzliche Freiheitsgrade bei der Suche nach einer gemeinsamen, positiv definit en Matri x P zu gewinnen. Aus (4.72) und (4.73) wird dann
r
G [;p + PG ii + (8 - l )Q
j ji [G i ; G
P
+P
[G
ij
; G
ji]
<0
- Q<0
(4.76) fiir
i
<j
(4.77)
Dab ei ist 8 die maxim ale Anzahl an Fuzzy-Regeln, die gleichzeit ig akt iv sind, bzw. bei einer Kennfelddar stellung die maximale Anzahl zueinander benachbarter Stiitzstellen, die in die Berechnung der Ausgangsgrofie des TSKSystems eingehen. Q geht wie P als Unbekannte in den LMI-Algorithmus ein, und dieser liefert dann als Result at eine Antwort auf die Frage, ob Matrizen P und Q exist ieren, fur die das Syste m aus Ungleichungen (4.76) und (4.77) erftillt ist. Die unt ersuchte Losun gsmenge ent halt auch die Losungsmenge des Ungleichungssystems (4.72) und (4.73). Denn da Q nicht posit iv definit , sondern nur posit iv semidefinit sein muss, kann Q auch die Nullmat rix sein. Der Fall Q = 0 und P beliebig ist demnach implizit in der Unte rsuchung ent halte n. Dieser Fall ents pricht aber gerade den Gleichungen (4.72) und (4.73). Der Gedanke der Er weiterun g des Ungleichungssystems zur Gewinnung zusatzlicher Freiheitsgrade wird auch in [76] aufgegriffen. Das Resultat ist ahnlich wie (4.76) und (4.77), so dass hier auf eine Darstellung verzichtet werden kann. Statt der bisher beschriebenen Vorgehensweise, nam lich eine nachtragliche Stabilitatsanalyse eines bereits entworfenen T SK-Reglers durchzufiihren , lasst sich der Reglerentwurf schon in die Formulierung des LMI-Problems integrieren [181]. Da es sich dab ei aber nicht mehr urn eine Stabilitatsanalyse, sondern urn ein Entwurfsverfahren hand elt , findet sich die Darstellung dieses Verfahrens in Kapi tel 5.1. Samtli che hier vorgest ellten Meth oden sind auch auf Systcme mit Beobachtern anwendbar. Der Zust and svektor eines solchen Gesamtsyst ems ent halt dann nicht nur die Zust and sgrofen der Strecke, sondern auch die des Beobachte rs. Durch geeignetcs Zusamm enfassen der Zustandsgleichungen kann man das System dann wieder auf die Form (4.26) brin gen und unmittelbar die St abilitatsbedingungen angeben (vgl. [181, 87, 28]). Die Gleichungen werden dann allerdings sehr umfangreich. Weitere Ansatze, Ein vollig anderer Ansat z, der sich aber ebcnfalls die Vorteile der LMI-Algorithmen zu Nut ze macht , findet sich in [3]. Das ursprungliche Syst em wird dort nicht wie in (4.41) als Uberlagerung von verschiedenen Systemm at rizen A i aufgefasst, sondern als System, dessen Syste mmatrix stetig vom Vektor der Eingangsg rofe n abhangt
x (t ) = A (z(t ))x(t )
(4.78)
4.2 Direkte Methode von Ljapunov
285
Fur den Ansatz muss diese Klasse von Systemen dann a11erdings eingeschrankt werden auf Systeme mit einer einzigen Eingangsgr6Be 8 :
x(t) = A(8(t))x(t)
(4.79)
Weiterhin gelte, dass die Ableitung von 8 kleiner als eine vorgebbare Schranke v sein muss (8 :::; v ) und 8 ausschlieBlich Werte aus dem Interva11 [0,1] annimmt, was aber bei geeigneter Normierung keine Einschrankung der A11gemeingiiltigkeit bedeutet. Die Stabilitatsbedingungen fiir dieses System lassen sich wieder zu einer linearen Matrix-Ungleichung F < 0 zusammenfassen und sind prinzipie11 mit der Bedingung (4.44) vergleichbar. F enthalt auch hier sowohl die Systemmatrix A als auch die positiv definite Matrix P, und da A von 8 abhangig ist, gilt dasselbe auch fiir P. Das LMI-System ist demnach nicht konstant, sondern von 8 abhangig:
F(A(8),P(8)) < 0
(4.80)
Nun ist die Frage zu beantworten, ob eine Matrix P(8) existiert, fiir die die Ungleichung (4.80) erfii11t ist, und das System demnach stabil ist. Diese Frage kann von einem LMI-Algorithmus aber leider nur fiir konstante Systeme beantwortet werden. Aus dem Grund sol1 das System durch eine Summe aus konstanten Systemen approximiert werden , auf die dann ein LMIAlgorithmus angewendet werden kann . Zunachst werden A(8) und P(8) approximiert, die in F enthalten sind : Lp
La
A(8) ~ :L8iAi
und
P(8) ~ :L 8 iP i
i=O
(4.81)
i=O
wobei die Pi symmetrisch sein miissen und zu einer gemeinsamen Matrix
(4.82) zusammengefasst werden. Es sei darauf hingewiesen , dass diese Approximation nur die Abhangigkeit von P bzw. A von 8 beriihrt, nicht aber die Zeitabhangigkeit von 8 selbst. Mit (4.81) und (4.82) lasst sich dann auch F approximieren: Lf
F(A(8) ,P(8)) ~
:L8iFi(Pges)
<0
mit
L f = L p + La
(4.83)
i=O
Die Abhangigkeit der Koeffizienten der F, von den Matrizen A, ist dabei nicht mehr explizit dargeste11t. Denn fur die weiteren Betrachtungen ist nur die Abhangigkeit von P ges relevant . Die Ungleichung ist wegen e E [0,1] sicher erfiillt, wenn
286
4. Stabilitatsanalyse von Fuzzy-Reglern Lf
Fo(P ges) + LPiF i(Pg es) < 0
(4.84)
i= l
ftir beliebige Pi E {O, 1} erftillt ist . Dies bedeut et , dass 2L f Ungleichungen zu uberprufen sind . Diese konnen aber, zumindest t heoretisch, zu einer gemeinsam en linearen Matrix-Ungleichung zusammengefasst werden. Man erhalt dann ein konst ant es LMI-System, das affin von der symmet rischen Matrix P ges abhangig ist. Somit kann mit Hilfe eines LMI-Algorithmus ub erpruft werden , ob eine Matrix P ges exist iert, die das Ungleichungssyst em (4.84) erftillt. Damit ware dann die Stabilitat des Systems (4.79) bewiesen. Angesichts der sehr elegante n und exakte n Vorgehensweise mit tels LMIL6sungs-Algorithmen verbl assen andere Ansatze zum St abilit at snachweis basierend auf Sat z 4.1 bzw. 4.2. Denno ch sollen hier einige von Ihnen kur z erwahnt werden , da sie te ilweise interessante Ideen entha lten. In [184] wird aus Gleichung (4.71) eine ahnliche St abilitatsbedingung entwickelt wie (4.74). Zunachst werden dort die Summ and en (4.85) durch die maxim alen Eigenwcrte der Matrizen
Q ij
abgeschatzt
fur alle x
(4.86)
und anschlicBend statt der Matrix X in (4.74) eine analog st rukt uriertc Matrix aus Eigenwerten gebildet, die dann auf negative Definith eit zu uberprtifen ist . Der Vorteil dieser Vorgehensweise bestcht darin , dass die Dimension der zu iiberprufenden Matrix, da ihre Element e reelle Zahlen und keine Matrizen sind, natiirlich wesentli ch geringer ist . Der ent scheidende Nacht eil besteht aber darin, dass mit dieser Vorgehensweise nur ftir eine gegebene Matrix P die negati ve Definith eit bzw. die St abilitat unt ersucht wird , wah rend bei dem zu (4.74) geh6renden Verfahren mittels eines LMI-Algorithmus die grundsat zliche Frage nach der Existe nz einer Mat rix P und damit nach der Stabilit at beantwortet werden kann . Ein vollig anderer Ansat z wird in [87] vorgestellt. Ausgehend von einem TSK-Modell der Strecke (4.10) werden dort zunachst die Mit telwerte der Systemmatri zen bestimmt 1
und
Bo =
L
L LBi
(4.87)
i= l
und anha nd dieser Mittelwerte dann oin einziger, linearer Regler entworfen. Fur diesen Hegler werden dann Robustheitsgrenzen angegeben, innerhalb derer er das nichtlin eare Syst em stabilisieren kann. Mit einbezogen werden dab ei sogar Modellunsicherheit en.
4.2 Direkte Methode von Ljapunov
287
In [74] wird gezeigt , wie man zunachst fur ein einzelnes diskr etes Teilsyst em , d.h. fur einen bestimmten Wert i au s Gleichung (4.38) eine positiv definite Matrix P i berechn et und dann durch Rtickwartseinset zen eine allgemeine Matrix P erhalt , die die Bedingun g von Satz 4.1 erfiillt . Voraussetzung fur diese Vorgehensweise ist ab er , dass jeweils zwei Matrizen (Ai , A j ) paarweise kommutativ sein mussen , was in der Praxis iiuBerst selte n gegeben sein diirfte. 4 .2.3 A nwendung a u f Facettenfunk t ionen Die letz te Variante der dir ekten Methode set zt wiederurn eine andere Darst ellung des Systems voraus, und zwar die Approximation des Syst emverhaltens durch Facettenfunktionen [83, 84]. Eine Facettenfunktion liegt vor, wenn der Raum der Eingangsgrofen der Funktion in konvexe Polyeder zerlegt und in jedern Polyeder die Funktion durch eine affine Funkti on gegebe n ist. Fur ein einfaches nichtlineares Ubert ragungsglied u (x ) wie beispielsweise einen gewohnlichen Fuzzy-RegIer lau t et eine solche Darst ellun g
u
= d i +Kf x
fur x E Pi
(4.88)
wobei Pi ein konvexes, nicht unb edin gt beschr iinkt es Polyeder im Raum der Eingang sgroflen x darst ellt . K , und d , sind konstante Matrizen bzw. Vektoren . Soll ein gegeb enes Ubertragungsverhalten durch eine Facettenfun ktion approximiert werden, so sind sie im allgemeinen nur auf numrn erischem Wege zu bestimrnen. Offenbar kann eine Approximation durch Facettenfunktionen auch auf beliebige, dyn arnische Ubertragungsglieder angewendet werd en. Eine nichtlineare Zust andsgleichun g x = f'(x ) lasst sich bcispielsweise durch affine Funktionen (4.89) x = d, + Ki x fur x E Pi approximieren. Interessant ist ein kurz er Vergleich zwischen dieser Dar stellung und einem Kennfeld bzw. einem TSK-R egler. Bei Facettenfunktionen wird der Raum der Eingangsgrofen in Geb iete (Po lyeder) unt erteilt , in deHen das Ubertragun gsverh alten durch eine einh eitli che, affine Funktion definiert ist. Dagegen wird bei Kennfeldern und TSK -R eglern das Ub ertragungsver halte n inn erh alb cines Gebietes durch die Interpolat ion des an den benachbarten Stlitzst ellen gillt igen Verh altens beschrieb en. Fur die Stabilitatsanalyse muss nun das Verh alten des geschlossenen Kr eises durch eine Facett enfunktion beschrieben werd en. Dazu ist zunachst das Gesamtsystern entsprechend Abb . 2.79 so um zuform en , dass der konstan te Sollvekt or w des Syste ms gleich Null ist. Da dam it keine Anr egung von auBen mehr auf das Syste m trifft , sind die Ausgan gsgrofen aller Ubert ragungsglieder ausschlieBlich von den Zustandsgrofen des Systems ab hangig.
288
4. Stabilitat sanalyse von Fuzzy-Reglern
J edes Ubert ragungsglied lasst sich demnach durch eine von den Zustandsgrofien abhangige Facettenfunktion approximieren , wobei die Auft eilun g des Zustandsraumes in Polyeder fiir die einzelnen Ubert ragu ngsglieder durchaus verschieden sein kann . AnschlieBend kann man ab er den Zust andsraum durch Bildung von Schnit tm engen in kleinere Polyeder zerlegen , in denen das Verh alten jedes Ubertragungsgliedes nur noch durch jeweils eine affine Funkt ion beschrieben wird. Die innerhalb eines solchen Polyeders giilt igen affinen Funktionen aller Ubertragungsglieder werd en dann miteinander verknupft , was auf eine neue affine Funkti on fuhr t , die das Verhalten des geschlossenen Kr eises beschr eibt. So wird das Verh alt en des Gesamtsystems durch eine Facet te nfunktion approximiert. Fur den folgend en Stabilitatsb eweis ist dabei nicht einmal die Stetigkeit der Facettenfunktion erforderlich, so dass sogar schalte nde Ubertragungsglieder behandelt werden konn en, Ausgangspunkt der folgend en Uberlegungen ist damit die Darstellung des geschlossen en Kreises durch eine Facettenfunktion
(4.90) Dab ei sind K, und d j jeweils in einem konvexen , nicht unb edin gt beschrankten Polyeder Pj definiert, und x ist der Zust andsvektor des Systems. AIle Punkte mit x = 0 sind Ruhepunkte. Offenbar konnen ganze Polyeder aus Ruhepunkten best ehen , sofern dort K, = 0 und d j = 0 gilt . Die Vereinigun gsmenge aller Ruhepunkt e mage ein kompaktes, konvexes Polyeder E bild en. Beispiele fur verschiedene Konst ellationen zeigt Bild 4.4. Im erst en Fall ist der Ruhepunkt gerade der Eckpunkt aller vier benachbar ten Polyeder , im zweiten Fall besteht die Grenzlinie der Polyeder P2 und P4 aus Ruhepunkten , und im letzt en Fall bild et das mittlere , schwarz gezeichnete Polyeder die Menge aller Ruhepunkte.
Abb. 4.4. Ruhepunkt e bei einer Systemdarstellung durch Facett enfunktionen
Da die Facettenfunktion jet zt nicht mehr unb edingt steti g sein muss, ist es moglich, dass es an der Grenze mehrerer Polyeder zu einem Sliding ModeVerhalten des Syst ems kommt , d .h. durch schnellen Wechsel des Zustandsvektors zwischen den einzelnen Polyedern bewegt sich das System immer auf dieser Grenze. Es lasst sich zeigen , dass in dem Fall die Zust andsgleichun g des Systems durch
(X)sm = LlLj (K jx +dj ) j
mit LlLj = 1 j
und
ILj
?: 0
(4.91)
4.2 Direkte Methode von Ljapunov
289
beschrieben wird , d.h. dur ch eine gewichtete Mittelwertbildung iiber die Zustandsgleichungen der benachbarten Polyeder. Nun wird eine Ljapunov-Funk tion in Form einer anderen, jetzt allerdings steti gen Facettenfunktion (4.92)
definiert , wobei die Polyeder Pj mit denen aus (4.90) identisch sein sollen. Dariiber hinaus muss der durch V definierte Halbraum H mit H := {x I V(x) c} und einer positi ven Konst anten c kompakt sein. Dieser Halbraum ent hiilt die Menge der Ruh epunkt e E . Dann ist zu zeigen, dass fur alle Eckpunkte X i aller Polyeder P, c (HnE) , d.h. aller Polyeder aus dem Halbr aum auBer den Ruh epunkt en , die Bedingung
s:
11,.IJ- (( X. i ) T/)
=
hT(K IJ-
l)Xi
+ d T/ ) { << 00 :: XX ii E(j. EE
(4.93)
erfullt ist . Dab ei sind (J.l , '1]) die Indizes der Polyeder , deren gemeinsame Grenze diesen Eckpunkt und noch mindestens einen weiteren Punkt umfasst. Dies schlieBt auch den Fall J.l = 'I] mit ein. Fiir den Eckpunkt X = A in Bild 4.4 sind demnach die Bedingungen
(4.94)
zu iiberpriifen , nicht aber beispielsweise (4.95)
denn P2 und P5 hab en nur A als gemeinsa men Punkt. 1st (4.93) erfiillt, so gilt : Die Menge E ist asympto t isch stabil, und H ist ihr Einzu gsbereich. Fur den Beweis kann zuniichst festgest ellt werden: Eine affine Funktion, die tiber einem Polyeder Pj definiert ist , nimmt ihren Maxim alwert in einem der Eckpunkte des Polyeders an. Weiterh in ist nicht nur die in einem Polyeder definierte Ljapunov-Funktion affin, sondern auch ihre Ableit ung nach der Zeit : (4.96)
290
4. Stabilitatsanalyse von Fuzzy-Reglern
Wenn daher fur alle Eckpunkte eines Polyeders gezeigt wird , dass V < 0 ist, so ist V fur alle Punkte innerhalb des Polyeders kleiner als Null. Besitzt das Polyeder dagegen eine gemeinsame Grenze mit E, so wird fur die auf dieser Grenze liegenden Eckpunkte nur V :::; 0 nachgewiesen . Zusammen mit der Tatsache, dass die Ableitung von V aber an den ubrigen Eckpunkten negativ ist, folgt V < 0 auch ftir alle Punkte innerhalb des Polyeders. Kritisch sind die Riinder der Polyeder, da V dort wegen der Unstetigkeit der Systemdefinition ebenfalls einen unstetigen Verlauf aufweisen kann . Betrachtet sei der Fall, dass eine Zustandstrajektorie von Polyeder PJl in Polyeder PT) hineinlauft. Da fur die zugehorigen Eckpunkte Xi an der Grenze VJl((Xi)T)) < 0, VJl((Xi)Jl) < 0, VT)((Xi)/,) < 0 und VT)((Xi)T)) < 0 nachgewiesen wurde , gelten diese Eigenschaften wegen der Affinitat der Funktionen VJl und VT) auch fur alle Punkte auf der Grenze . Damit ist aber sichergestellt, dass sich der Wert von V beim Uberschreiten der Grenze verringert. Ubrig bleibt der Fall eines Sliding Mode-Verhaltens, d.h . dass eine Zustandstrajektorie entlang der Grenze zweier oder mehrerer Polyeder verliiuft . Mit (4.91) ergibt sich fur jedes der angrenzenden Polyeder Pj
~((X) m) = hJ (~llk(KkX + dk)) = L Ilk h J(Kkx + d k) = L Ilk~ ((X)k) < 0 s
k
(4.97)
k
Da die Eigenschaften ~((xh) < 0 fur alle beteiligten Eckpunkte bereits nachgewiesen wurden, gilt dies wegen der Affinitat von V auch fur alle Punkte auf der Grenze. Damit nimmt auch fur diesen Fall der Wert der LjapunovFunktion V stiindig abo Insgesamt ist nach diesen Betrachtungen gewiihrleistet, dass im gesamten Bereich H n E, und zwar sowohl innerhalb der Polyeder als auch an ihren Grenzen, die Ableitung der Ljapunov-Funktion unabhangig vom Verlauf der Trajektorien negativ ist . Daraus kann aber noch nicht direkt nach Satz 2.23 die asymptotische Stabilitiit des Systems gefolgert werden , da die hier verwendete Ljapunov-Funktion nicht stetig differenzierbar ist, was fur den Satz aber vorausgesetzt wird . Die Stabilitiitsbehauptungen sind in diesem Fall anders nachzuweisen . Da innerhalb von H V(x) :::; c gilt und auf dem Rand von H gerade V(x) = c, miissen die am Rand von H liegenden Polyeder eine konstante oder zum Rand hin ansteigende Ljapunov-Funktion aufweisen. Da weiterhin innerhalb von Haber V < 0 gilt , kann der Halbraum H von keiner Trajektorie verlassen werden. Nun soll die einfache Stabilitiit des Gebietes E gezeigt werden. Vorgegeben wird eine e-Umgebung S, urn E. Existieren muss dann eine b-Umgebung, so dass ftir aIle Startzustiinde, die in dieser b-Umgebung liegen, die zugehorige Trajektorie das Gebiet S; nicht mehr verlasst. Urn diese b-Umgebung zu
4.3 Harmonische Balance
291
bestimmen , wird im kompakten Rest-Gebiet H n (E U Be) des Halbraumes H der kleinste vorkommende Wert Ve der Ljapunov-Funktion bestimmt, der wegen (4.92) sicherlich positi v ist. Wegen der Stetigkeit von V und der Kompaktheit von E lasst sich damit wiederum eine 8-Umgebung urn E angeben mit V(x) < Ve fur aile Punkte innerh alb dieser Umgebung . Diese Umgebung ist vollst andig in Be ent halte n, weil Ve sonst nicht der kleinste vorkommend e Wert des Rest gebiet es ware. Da die Ableitung von V immer negativ ist, kann eine Tr aj ektorie, die innerh alb der 8-Umgebung beginn t , nie einen Wert V(x) 2: ~ aufweisen und daher au ch nie das Gebiet Be verlassen. Damit ist die St abili t at von E nachgewiesen. Die asymptot ische St abil it at von E ergibt sich darau s, dass die Ableitung der Ljapunov-Funktion in allen Punkten von H n E immer negativ ist , und zwar auch beim Uberschreite n oder entlang der Polyedergrenzen. Ein e Tr aj ektorie, die innerh alb des Halbraumes H beginnt, weist zunachst einen bestimmten Wert V > 0 auf. Da keine Trajektorie den Halb raum verlassen kann, wird dieser Wert so lang e verr ingert, bis V = 0 gilt . Dann ist abe r E err eicht , womit die asy mptot ische St abilitat bewiesen ist . Die Anwendung dieses St abi lit at skri teriums kann nur auf nummerischem Wege erfolgen. Zunachst ist , wie bereits skizziert , das Systemverhalten durch cine Facettenfunktion zu approximieren, was natiirlich nur nummerisch moglich ist . Dann miissen die Param et er der Ljapunov-Funktion festgelegt werd en , und zwar die Par ameter h j und Cj jedes einzelnen Polyeders. Dab ei miissen die Randbedin gun gen (4.92) sowie die Steti gkeit von V beachtet werd en. Zudem sollte der ent st ehende Halb raum H das Gebiet des Zust andsraumes beinh alten , das fur eine technische Anwendung von Interesse ist. Auch dieser Schri t t muss auf nummerischem Wege erfolgen. Diese Festl egung der Ljapunov-Funktion ist der Schwachpunkt des Verfahrens, da kein Algorithmus exist iert, der immer eine fur den Stabilit atsn achweis geeignete Ljapunov-Funktion liefert . Abschliefiend ist die St abil it atsbedin gun g (4.93) zu ub erp rufen, Falls diese nicht erfullt ist , muss eine andere LjapunovFunkti on gewahlt oder das Verfahren ergebnislos abgebrochen werd en .
4.3 Harmonische Balance Auf einem vollkomm en anderen Grundgedank en basiert das Verfahren der harmonischen Balan ce, das bereits in Kapi tel 2.8.6 ausfuhrlich dargest ellt wurde. Anwendbar ist das Verfahren auf Regelkreise mit einer Stell- und einer Regelgrofe, wobei der Fuzzy-Regier aber mehr ere Eingan gsgrofen wie beispielsweise den Regelfehler e, dessen Ableitung e oder sein Integral e aufweisen darf . Weit erhin ist vorauszusetzen , dass das Gesamtsyst em in einen linearen Teil mit ausreichender Tiefp asswirkung und einen nichtlin earen Teil mit symmet rischem Ub ert ragun gsverh alten untert eilbar ist. Der erste Schritt best eht in einer geeigneten Unt erteilun g des Regelkreises in einen linearen und einen nichtlinearen Teil, wie dies in Abb. 4.1 bzw. 4.2
J
292
4. Stabilitatsanalyse von Fuzzy-Reglern
vorgefUhrt wurde. Aus Abb . 4.2 ist ersicht lich, dass hier nur der Fuzz y-Hegler selbst zum nichtlinearen Syst emt eil gehort, wahr end aile anderen Element e den linearen Systemteil bilden. Dies ist aber selbstverst andli ch nur der einfachste Fall. In der Praxis werden Nichtlinearitat en der Strecke zusamm en mit dem Fuzzy-Regier den nichtlinearen Systemteil bilden . Dann muss eine der Ein gangsgrofen des nichtline ar en Teiles als seine Haupt-Eingangsgrofe bzw. als Haupt-Ausgangsgrofle des linear en Teiles definiert werden. Dies sollte grundsatzlich die Aus gangsgrofe des letzten Integrators des linearen Teiles sein, in Abb . 4.2 also beispielsweise e' = e. Damit erhalt man fur die Ubertragun gsfunktion des linearen Syst emteiles
J
(4.98) Dann ist zu uberprufen, ob der lineare Systemteil eine ausreichende Tiefpasseigenschaft aufweist , d.h . es ist sicherzuste llen, dass aile Eingangsgrofien des nichtlinearen Teiles mehr oder weniger reine Sinusschwingungen darstellen. Diese Eingangsgroflen sind in Abb . 4.2 beispielsweise e, e und e, und die auf ausreichende Tiefpasswirkung zu uberpriifenden Ubertragungsfunktionen demnach -ioG(s), ~ G ( s ) und G(s). Da ein Integrator die Tiefpasswirkung verstarkt, ist die Tiefpasswirkung aller Uber tragungsfunktionen sicherlich ausreichend, wenn G(s) eine ausreichende Tiefpasswirkung aufweist . Der nachste Schritt best eht in der Berechnung der Beschreibun gsfunktion des nichtlin earen Syst emt eiles. Am einfachste n ist sicherlich die numm erische Losun g. Dazu wird zunachst fur das Haupt-Ausgangssignal e' = e des linearen Systemt eiles eine Sinusschwingung mit der Amplitude A und der Frequenz w definiert . Entsprechend ergeben sich fur e und e als Ableitungen dieses Signales ebenfalls harmonische Schwingungen. Dam it stehen die Eingangssignale fur den nicht lineare n Systemt eil fest . Schaltet man sie an dessen Ein gang auf, so wird sich an seinem Ausgang eine periodische Schwingung einste llen, die sich dur ch eine Sinusschwingung approximieren lasst. Der Vergleich der Sinusschwingung am Ausgang mit der Sinusschwingung e' liefert die Verst arkung und die Ph asenverzogerung des nichtlinearen Teiles ftir das Wertepaar (A ,w) und damit den Wert der Beschreibungsfunktion N (A,w) . Auf diese Weise lasst sich die Beschreibungsfunktion punktweise ermitte ln. Moglich ist natiirlich auch die ana lytische Berechnun g der Beschreibungsfunktion , was aber die analytische Beschreibun g des nichtlin earen Syst emteiles voraussetzt. Da diese normalerweise bei einem Fuzzy-Hegler nicht gegeben ist , muss sein Ubertragun gsverhalt en zunachst durch eine einfache Funk tion approximiert werden. Erst mit dieser kann dann die Beschreibun gsfunkt ion berechnet werden. Sofern der nichtlin eare Systemt eil aber nicht nur den Fuzzy-Regier , sondern auch andere nichtlin eare Ubertragun gsglieder umfasst , darf der Fuzzy-Regier nicht fur sich allein approximiert werden. St at t dessen muss eine geschlossene Approximation des gesamten nichtlin earen Systemt eiles erfolgen.
J
J
4.3 Harmonische Balance
293
Urn die fur eine analytische Bestimmung der Beschreibungsfunktion erforderlichen Schritte zu zeigen, soll das Beispiel aus Abb . 4.2 fortges etzt werden . Es sei angenommen, dass das Ubertragun gsverhalten des Fuzzy-Reglers durch eine an alyti sche Funk tion f(1 e, e, e) approximiert werden kann . Mit e' = J e wird dar aus f( e', e' ; ii') . Damit ergibt sich fiir die zur Berechnun g der Beschreibungsfunktion notwendigen Koeffizienten A r und B, ents prechend Gleichung (2.262)
J ~J ~J ~J T
Ar =
~
f( e', e', ii' ) cos(wt )dt
o
T
=
f(A sin(wt) , Aw cos(wt ), -Aw2 sin (wt)) cos(wt )dt
o
T
e, =
f( e', e', ii' ) sin(wt )dt
o
T
=
f(A sin(wt) ,Aw cos(wt) ,-Aw2sin( wt))sin(wt)dt
(4.99)
o
2:.
mit T = Mit C r = Beschreibun gsfunktion
J Ai + Bf und
<.p r = arctan ~ erhalt man dann die
(4. 100)
Damit kann vorausgesetzt werden, dass die Beschreibungsfunktion entweder punktweise auf numm erischem Wege oder auf analytischem Wege ermittelt wurd e. Fiir die Stabilitatsanal yse lasst sich dann die von A und w abhiingige Funktion - N(~ ,w ) als Kurvenschar in der komplexen Ebene darste llen. Und zwar erhalt man fur jeden festen Wert Wr eine nur noch von der Amplitude A abhiingige Kurve - N (l ,wJl ' Eb enfalls einzuzeichnen ist die Ortskurve G l (j w) des linearen Teiles. Aus der Lage der Ortskurve zur Kurvenschar lassen sich anhand des Nyquist-Kriteriums Riickschliisse auf das Stabilit iitsverhalten des Systems ziehen, wie dies in Kapitel 2.8.6 ausfuhrlich beschrieben ist . Konk rete Beispiele finden sich in [22] und [58]. Die Parameter A und weiner moglichen Dauerschwingung ergeben sich aus der komplexen Gleichung .
Gl(JW)
1
= - N(A ,w)
und lassen sich am besten auf nummerischem Wege bestimmen.
(4.101)
294
4. Stabilitat sanalyse von Fuzzy-Reglern
4.4 Popov-Kriterium Eine Alt ernative zum Verfah ren der har monischen Balan ce ste llt das PopovKriterium dar , dessen Vorau sset zungen allerdings von den wenigst en Syst emen mit Fuzzy-R eglern erfullt werden. Zunachst ist das Syst em wieder in einen linear en und einen nichtl inear en Teil zu zerlegen, wobei der nichtlineare Teil keine int erne Dyn amik aufweisen darf. Besit zen beide Teile jeweils nur eine Ein- und eine Ausgangsgrofe, so kann Satz 2.25 dir ekt angewendet werd en . Die Ortskurve des linear en Teiles wird durch eine Messung ermittelt , falls die Ub ertragungsfunktion nicht bekannt ist. Die Ken nlini e des nichtlinear en Teiles kann anschlieBend ebenfalls sehr einfach aufgenommen werd en , da dieser jedem Eingan gswert unmittelbar einen Ausgang swert zuweist . Eine an alytische Beschr eibung ist dab ei nicht einma l notwendig, da ftir das PopovKriterium sowieso nur die Sektorgrenzen k 1 und k 2 relevant sind (vgl. Abb. 2.87). AnschlieBend kann die Analyse exa kt so durchgefiihrt werden , wie es in Kap itel 2.8.7 beschrieb en wur de . Nach einer event uell notwendi gen Sektortran sform ation und der daraus resultierenden Umd efinition der linear en Ub ertragungsfunktion gemaf (2.274) wird die Popov-Ortskurve des linearen Teiles in der kompl exen Ebene gezeichnet (Abb. 2.88). Ein zeichnen einer Gr enzgeraden liefert die max imale obere Sektorgrenze, die dann nur noch mit der t atsiichlichen Sektorgrenze der nichtli nearen Kennl inie zu vergleichen ist . Falls diese nicht grofer als die maximale Sektorgrenze ist , ist das System absolut st abil. In [20J wird dazu ein konkret es Beispiel vorgefiihr t . Prinzipiell kommt auch eine Anwendung des Popov-Kriteriums flir Mehrgrofensysteme (Satz 2.26) auf Systeme mit Fuzzy-Reglern in Betracht. Schwer zu erfiillen ist allerdings die Bedingung, dass der Fuzzy-Re gier (bzw. der nichtlinear e Systemteil) die gleiche Anzahl an Ein- und Ausgan gsgroflen aufweist und jede Au sgangsgrofle Ui au sschlieBlich eine Funktion der ents prechen den Ein gangsgrofl e ist: Ui = fi (ei ) ' Falls diese Ford erung nicht erfullt ist , kann man versuchen , durch eine Tran sform ation der Ein gangsgrofen die Abh iingigkeiten der Funktionen Ii von anderen Ein gangs grollen auBer dem jeweiligen e, zu beseitigen . Im niichst en Kapitel zum Kreiskriterium wird eine solche Tr ansformat ion vorgefUhrt . Und zwar wird dort gezeigt, wie sich fur eine Funktion fe e, e) im Nullpunkt e = 0 die Ab hiingigkeit der Funktion von e mit Hilfe einer Tran sformation der Ein gangsgrofien e un d e beseitigen lasst . Beim Mehrgrofen-Popov-Kriterium ist das Problem aber wesentlich schwieriger , denn es muss eine Transform ation gefunden werden, die nicht nur fur eine einzige Ausgangsgrofe, sondern gleichzeit ig fiir aile Aus gan gsgrofen Ui sa mt liche Abh iingigkeit en von anderen Einga ngsgroflen auBer ei beseiti gt. Dies wird jedo ch kaum moglich sein. Sinnvoller ist hier sicherlich die Anwendung eines anderen Kr iteriums.
4.5 Kreiskriterium
295
4.5 Kreiskriterium Eb enso wie fur das Verfahren der harmonischen Balance oder das PopovKrit erium ist fur das Kreiskriterium das Syst em in einen linearen und einen nichtlinearen Systemteil zu zerlegen. 1m Gegensat z zu den beiden anderen Verfahren sind jet zt ab er von vornh erein Nicht linearitaten mit interner Dynamik und auch Mehr grofensyst eme zugelassen. 4.5.1 RegIer mit einer Eingangsgrofle Zunachst soli jedoch auf Eingrofensyst eme eingegangen werd en, deren Nichtlineari tat nur eine Eingangsgrofe und auch keine int ern e Dyn amik aufweist. Bei solchen Syst emen kann das Kreiskriterium in seiner einfachste n Form angewendet werden . Erst ist die Ortskurve des linearen Teiles zu messen oder zu berechnen und in die komplexe Ebene einzuzeichnen. Dann muss die Kennlinie des nichtlinearen Teiles bestimmt werden , was ebenfalls nicht weiter schwer ist , da jedem Eingangswert direkt ein Ausgangswert zugeordnet ist . Aus der Kennlinie ergeben sich die Sektorgrenzen k1 und k 2 und daraus wiederu m das verbotene Gebiet in der komplexen Ebene. Wie in Kapitel 2.8.8 schon erwahnt, lasst sich das Kr eiskriterium fur diesen einfachste n Fall direkt aus dem Pop ov-Kriterium ableite n, indem man den freien Par amet er q in der Ungleichung (2.264) gleich Null set zt . Das Kreiskriteriu m ste llt damit ftir solche Faile nur eine spezielle Vari ant e des Popov-Kriteriums dar. Aus dem Grund exist ieren Systeme , deren St abilitat zwar mit dem Popov-Kri terium, nicht aber mit dem Kreiskr iterium nachgewiesen werden kann . Dafiir lasst sich das Kreiskriterium einfacher anwend en, da durch den Wegfall von q statt der Popov-Ortskurve nur noch die gewohnliche Ortskurve des linearen Teiles zu betrachten ist . Und auch die beim Popov-Kriterium oft erforderliche Sektortransformation ist im Kreiskritcriurn bereit s ent ha lten. 4.5.2 RegIer mit mehreren Eingangsgroflen Int eressant er ist der in der Praxis am haufigst en vorkommend e Fall, narnlich ein Fuzzy-RegIer mit mehreren Eingangsgrofen und einer Ausgangsgrofie. Zunachst wird eine der Eingangsgroflen als Hau pt-Eingangsgrofe e definiert und das Ubertragun gsverh alt en des nichtlin earen Syst emt eiles, das eigent lich von mehreren EingangsgroBen abha ngig ist , als eine nur von e abha ngige, dafur abe r zeitvariante Kennlinie u(t ) = f (e(t ), t) aufgefasst. Dann miissen Sekt orgrenzen k: und k 2 festgelegt werd en, so dass ftir jeden Zeitpunkt t gilt (4.102) Dies sind die im Kreiskriterium zu verwendend en Sektorgren zen. Ob u neben e von weit eren Eingangsgrofien abhangt oder durch eine Different iaigieichun g
296
4. Stabilitatsanalyse von Fuzzy-Reglern
aus e hervorgeht, spielt keine Rolle mehr. Die Festlegung der Sektorgrenzen erfordert naturlich die Auswertung aller moglichen Kombinationen von Eingangsgrofen des nichtlinearen Teiles, damit Gleichung (4.102) tatsachlich immer erftillt ist. SchlieBlich muss noch die Ubertragungsfunktion des linearen Systemteiles ermittelt werden, dessen Ortskurve fiir das Kreiskriterium ebenfalls benotigt wird. Dazu ist das Ubertragungsverhalten von der Ausgangsgrofe des nichtlinearen Systemteiles zu seiner Haupt-Eingangsgrofe zu bestimmen. Definiert man beispielsweise in Abb. 4.2 die GroBe e als Haupt-Eingangsgrofle des nichtlinearen Systemteiles und it als seine Ausgangsgrofie, so ergibt sich als Ubertragungsfunktion des linearen Systemteiles ~G(s). Ein Problem tritt hierbei jedoch auf: Aus Ungleichung (4.102) folgt doch, dass die Ausgangsgrofie des nichtlinearen Teiles fiir e = 0 ebenfalls den Wert Null annehmen muss, und zwar unabhiingig von allen anderen Eingangsgrofien. Es muss also f(O , t) = 0 gelten, was bei einem Fuzzy-Regier normalerweise nicht erftillt ist . Celost werden kann dieses Problem aber durch eine Koordinatentransformation, wie sie in [25] vorgeschlagen wird. Als Beipiel dient der Kreis in Abb. 4.2. Der Einfachheit halber sollen jedoch die Abhiingigkeit des Fuzzy-Reglers von J e sowie die Integration der Regler-Ausgangsgrofie entfallen. Damit ist das Ubertragungsverhalten des Fuzzy-Reglers durch eine Funktion f(e,e) und die Ubertragungsfunktion des linearen Systemteiles durch G(s) gegeben. Eine Erweiterung des Verfahrens auf Fuzzy-RegIer mit weiteren Eingangsgrofsen ist aber prinzipiell moglich.
INB~M ZO PM PB PB ZO PS PM PB PB PM NS ZO PS PS PB ZO NM NS ZO PS PM NMNB NS NS ZO PS NB NB NB NM NS ZO Abb. 4.5. Regelbasis Die Regelbasis des Fuzzy-Reglers sei die in Abb. 4.5. Tragt man die Funktionswerte von f in einer e - e- Ebene auf, so stellt man fest, dass auf einer gegeniiber der e- Achse urn Q: verdrehten Geraden aile Funktionswerte den Wert Null aufweisen. Man kann ein et - et-Koordinatensystem definieren, dessen et-Achse genau mit dieser Geraden zusammenfallt und das somit gegeniiber dem alten Koordinatensystem gerade urn Q: verdreht ist . Hinsichtlich dieser Koordinaten lasst sich mit f'(et , et) = f(e, e) eine neue Abbildung definieren, die offenbar die Bedingung f'(0 , et) = 0 erfiillt. Die Drehung eines Vektors urn den Winkel Q: entspricht einer Multiplikation mit der Matrix
4.5 Kreiskriterium
( c~s a -sina)
T =
297
(4.103)
sin o cos o
Ein Vekt or [e, ejT in alte n Koordinat en muss aber urn -a verdreht werd en , urn seine Darst ellung in neuen Koordinaten let, edT zu erha lte n. Die Drehung urn - a entspricht aber gera de einer Multiplikat ion mit T - 1 . Fur die Stabilitat san alyse werd en nach Abb . 4.6 die Matrizen T - 1 und T so in den geschlossenen Kreis eingefiigt, dass sie sich in ihrer Wirkung gerade aufheben und das System nicht verandert wird . Aus dem Vektor fe, entsteht somit durch Drehen urn - a zunachst der Vektor let, etV und anschlieBend durch Drehen urn a wieder fe, e]T . Rechnet man die Matrix T zum nichtlinearen und T - 1 zum linearen Syst emt eil, so besteht der nichtlinear e Syste mteil au s der Abbildung 1'( et , et), die offenb ar die Voraussetzun g 1'(0 , et ) = 0 erftillt .
eV
G(s)
,r -
- - - - - - - - - - - - - - - - - - - -- - - - - - - - - - - - - - -- - -- - - - -- I
,
.......--.....'-1
'
Abb. 4.6. Koordinatentr ansformation fiir die Anwendung des Kreiskriteriums Die Multiplikation mit der Matrix S = [1, s]T dient nur der Umwandlung der skalaren GroBe e zum Vektor fe, e]T . Sie wurde in das Blockschaltbild eingefiigt , urn eine saube re Darstellung zu erhalte n, und bewirkt keine Veranderung des Systems. Damit kann das Kreiskriterium auf das aus l' und G' best ehend e System an gewend et werden. Zunachst ist die linear e Ubertragun gsfunk tion zu berechn en , also das Ubert rag ungsverhalte n von der Ausgan gsgrofle u des nichtlinearen Teiles zu seiner Haupt-Eingan gsgrofie et:
G'( s) = - et (s) u
(4.104)
F ur den Zusammenh an g zwischen let, etV und fe, ejT gilt (4.105)
und mit e
=w -
y
=e,
y
= cos a e + sin a e = - cos a y - sin a
iJ
et(s) = -(cos a G(s) + sin o sG(s ))u(s)
(4.106)
wegen y(s) = G(s)u(s) . Es folgt
G'(s) = cos a G(s) + sin o sG(s )
(4.107)
298
4. Stabilitatsanalyse von Fuzzy-Reglern
Dann ist der Sektor der Kennlinie des nichtlinearen Teiles zu ermitteln , was am einfachsten durch simples Einsetzen von verschiedenen Werten fur et und Et geschehen kann . Fiir jeden Wert von et werden sich je nach Wahl von Et unterschiedliche Wert e fur u ergeben, so dass eine ganze Schar von Kennlinien moglich ist (Abb . 4.7). Die Sektorgrenzen sind so festz ulegen, dass die gesamte Schar im Sektor ent halte n ist. Mit den Sekt orgrenzen und der linearen Ubertragun gsfunktion nach (4.107) kann dann unmittelbar cine St abilit atsanalyse nach dem Kreiskrit erium dur chgefiihrt werden.
Abb. 4.7. Kennlinienschar nach der Transformation
4.5.3 Mehrgrofienregler
Die Behandlung echte r Mehrgrofiensysteme, bei denen alle Systemt eile sowohl mehrere Ein- als auch Ausgangsgrofien aufweisen konnen , ist nur unt er Verwendung von Normen praktikabel, wie auch das Kreiskriterium selbst auf dieser Basis hergeleitet wurde. Die Berechnung einer Norm erfordert aber eine analytische Beschreibung des Syst emverhaltens. Der Fuzzy-Hegler muss also durch (4.5) oder besser gleich als TSK-Regler (4.8) definiert oder approximiert werden. Wenn dies der Fall ist , kann aber auch das Gesamtsyst em als TSK-Modell (4.28) bzw. (4.29) in einer geschlossenen Formel beschrieben werden. Mit der direkten Betrachtung des Gesamt systems wird aber wiederum der dur ch das Kreiskriterium gesteckte Rahm en , der dur ch die Unterteilung des RegeIkreises in einen linearen und einen nichtlin ear en Systemt eil vorgegeben ist , verlassen. Aus dem Grund finden sich die Ansat ze, die auf der Verwendung von Normen basieren , im folgenden Kapitel wieder.
4.6 Normenbasierte Stabilitatsanalyse Die Verwendung von Normen zur Stabilit atsanalyse ist sowohl fiir kontinui erliche (Gl. (4.28)) als auch diskr ete (Gl. (4.29)) Fuzzy-Systeme moglich. Den
4.6 Normenbasierte Stabilitatsanalyse
299
einfacheren Fall stellt dab ei der diskr ete Fall dar , der deshalb auch zuerst behand elt werden soll (vgl. [27]). Ausgangspunkt ist das TSK-Modell eines diskr eten Systems (4.29) ohne iiuBere Anr egung (4.108) Der Ubergang zu den Norrnen liefert
Das Syst em ist stabil irn Ljapunovschen Sinne, wenn der Zustandsvektor gegen Null konvergiert . Als Forderung ftir St abilit at ergibt sich daher (4.110) Wegen (4.111) ist die Ungleichung (4.110) erftillt, wenn fur alle i
(4.112)
gilt . Verwendet man beispielsweise die co-Norm, so gilt mit (A.23) (4.113) Dab ei ist Am a x der maxim ale Eigenwert oder auch Spektralradius einer Matrix. Die Suprernurnbildu ng tiber w in Gleichung (A.23) ent fallt , da A i nur konstante Koeffizient en besit zt . Darnit ist mit (A.21) die eo-Norm gleich der Spekt ralnorrn (j {Ad. Als St abilitat sforderun g erha lt man (j
{Ad < 1
ftir alle i
(4.114)
Da diese Bedin gung sehr einfach mit einem entsprechenden Software-Paket zu uberprufen ist , best eht das einzige P roblem bei diesem Analyseverfahr en im Aufstellen des zu Grunde liegenden T SK-Modells des geschlossenen Kreises. In [185] wird neben dieser Bedingung fiir die Spektralnorm auch eine Bedingung ftir den Spektralradius Am a x {Ad entwickelt. Zunachst einmal ist wegen Am a x {Ad < (j {Ad die Bedingung
Am a x {Ad < 1
fiir alle i
(4.115)
offensichtlich eine notwendige Vorausset zung ftir die Stab ilitat des Syst ems. Hinreichend ist diese Bedingung aber erst dann , wenn eine gemeinsame Matri x 8 exist iert, so dass 8- 1 A i8 fiir alle A i norm al ist . Eine Matrix M wird
300
4. St abilitatsan alyse von Fuzzy-Reglern
als normal bezeichnet , wenn M ™ = MM T gilt . In [185] werden Kriterien fur die Existenz von S abgeleitet, auf deren Darst ellung hier aber wegen doch eher geringer Praxisrelevanz verzichtet werden solI. Interessanter ist dagegen ein Verfahren , das ein konti nuierliches TSKModell (4.28) des geschlossenen Kreises erfordert (vgl. [180]) und auf dem folgenden Satz basiert:
Satz 4.4 Gegeben sei ein System
x=
(A
+ DF(t )E )x
(4.116)
mit den gegebenen, reellen Matrizen A , D und E und einer reellen, zeitvarianten Unsic herheit F , von der nur bekannt ist, dass ihre Norm klein er als Ei ns ist: IIFlloo :::; 1. Dieses System ist stabil, wenn A ausschliejJlich Eigenuierte mit negativem Realteil aufwei st und dariiber hinaus
A) -lDlloo < 1
IIE(sI -
(4.117)
gilt.
Abb, 4 .8 . Blockscha lt bild des Systems
Der Beweis ist recht einfach anhand des Blockschaltbildes 4.8 des Syst ems dur chzufiihren. Der geschlossene Kreis wird bei der GroBe h aufgetrennt . Fiir die Kreisiibertragungsfunktion ergibt sich FE(sI - A ) - 1 D und fur ihre Norm die Abschatzung (4.118) Wegen IIFlloo :::; 1 und (4.117) ist die Norm der Kreisiibertragungsfunktion demnach sicher kleiner als Eins. Daraus folgt ab er mit dem small gain theorem sofort die Stabilitat des Syste ms. Die Ungleichung (4.117) ist numm erisch leicht zu iiberpriifen. Es ste llt sich abe r die Frage, wie das T SK-Modell (4.28) r
(4.119) auf die Form (4.116) zu bringen ist. Zunachst ist jede Matrix A i zu zerlegen in einen gemeinsamen Ant eil A g , der ausschlieBlich Eigenwerte mit negati vem Realteil besitzt, und einen moglichst kleinen Rest L1A i . Man erhalt
4.6 Normenbasierte Stab ilitatsanalyse
~ ( A, +
,;(t)
t
k;(X(t))LlA;) x(t )
301
(4.120)
Dann lasst sich mit den Matrizen L1Ai eine Singuliirwertzerlegun g durchftihren, d .h. (4.121) L1Ai = u.s.v" mit orthogonalen Matrizen V i und V i und einer Diagonalm atrix Si, die als Diagonalelemente die singularen Werte der Matrix L1Ai ent halt . Eine solche Singularwertzerlegung ist nummerisch unproblematisch. Aus (4.120) wird dann (4.122) x = (A g + VS(t)V)x mit V = [Vi , V
, V r]
= [Vi , , V r]T
(4.123)
und der Diagonalm atrix (4.124) S ent halt also die Matrizen Si, multipliziert mit ki(t) , auf der Hauptdiagonalen. Diese Form ent spricht schon der im Sat z gcforderten Form (4.116). Allerdings ist noch nicht gewahrleistet , dass IIS(t)ll oo :::: 1 gilt . Aus dem Grund wird eine Normierungsmatrix eingefiihrt mit N
= ~diag[Sl
(4.125)
... Sr]
Gleichung (4.122) liisst sich damit umschreiben zu
x = (A + VNV + VNN-l(S(t) g
(4.126)
N)V)x
Set zt man r
A = Ag
+ VNV =
Ag
1
+ 'L 2ViS iVT = i
1
Ag
r
+ 2 'LL1A i i
D=VN
F(t) = N- l(S(t) - N) E =V
(4.127)
so erha lt man die geforderte Dars tellung (4.116), wobei jet zt auch IIFlloo :::: 1 gesichert ist . Denn ein beliebiges Diagonal element von S best eht doch aus dem Produkt eines singularen Wertes a und einem Fakt or ki(t) , wobei o :::: k, :::: 1 gilt . Da singulare Werte nicht negat iv sein konnen , liegt das
302
4. Stabilitatsa nalyse von Fuzzy-Reglern
betraehtete Diagonalelement dam it in einem Int ervaIl [0, a]. Dur eh die Subt ra ktion S - N wird daraus [- %, %] und dureh die Mult iplikat ion mit N- 1 gerade [-1, I]. Demn aeh weisen aIle Elemente der Diagonalm atrix F (t) einen Betrag auf, der maximal gleieh Eins ist . Aus dem Grund kann der Betrag des Ausgangsvekt ors von F nie grofler sein als der Betrag des Eingangsve kto rs. Wegen (A.22) ist da mit die oo-Norm von F nieht grofe r als Eins. Auf die in (4.127) aufgefUhrten Matrizen kann dann Satz 4.4 angewendet werden. Die Wahr seheinliehkeit , dass A nur Eigenwert e mit negativem Realteil aufweist, ist umso grofer , je kleiner die Matrizen LlA i gewiihlt wurd en. F erfiillt sicher die geforderte Bedin gung, womit dann noeh Gleiehung (4.117) zu iiberprufen ist . Die dazu notwendi ge Bereehnun g der Norm lasst sich ebenso wie die Singuliirwert zerlegung in (4.121) mit der ents preehenden Software ohne Probleme du rchfuhren. Damit st ellt die Verwendung von Norm en eine sowohl fiir den diskret en als aueh fur den kontinuierliehen Fall einfaehe und elega nte Moglichkeit der St abilit iitsan alyse dar. Vorausset zung ist aber die Dar stellung bzw. Dars t ellbarkeit des gesehlossenen Kreises als TSK -Syst em.
4.7 Hyperstabilitatskriterium Ein weite res Verfah ren basiert auf der Hyp erst abilit iitsth eorie. Dab ei sind fur eine Anwendung dieses Verfahrens auf Fuzzy-Regler keine wesent liehen Erweiterungen gegeniiber der in Kapi tel 2.8.9 vorgestellten Form erforderlieh. Zuniiehst ist der gesehlossene Kreis in einen linearen und einen niehtlinearen Teil aufzuteilen. Dann ist das System so zu strukturieren, dass beide Teile die gleiehe Anzahl an Ein- und Ausgangsgrof en aufweisen. Als Beispiel soll wieder der Regelkreis in Abb. 4.2 dienen, wobei der Fuzzy-Hegler mit der Ausgangsgrofle it hier aber nur die Eingangsgrofien e und e besit zen soll, d.h . die Abh iingigkeit von J e ent fallt . Dieses Syst em kann als Ein- oder Zweigrofiensyst ern behand elt werd en. Bei einer Behandlung als Eingrof ensyst em sind dieselben Sehritt e notwendig wie beim Kreiskriterium. Zuniiehst ist festzulegen , welche der beiden Ein gangsgrofen als Haupt-Eingangsgrofe definiert werd en soll, 1st dies beispielsweise e, so muss das Uber t rag ungsverhalte n des Fuzzy-Reglers f( e, e) als zeitvariante Funktion f( e, t) aufgefasst werden. Die Ubertragun gsfunktion des linear en Syst emt eiles ergibt sieh aus dem Ubert rag ungsverhalte n vom Ausgang it des Fuzzy-Reglers zur GroBe e. Man erhiilt hier demnaeh ~G ( s ) . Mit f (e, t) und ~G ( s ) kann dann das Verfahr en so dur ehgefUhrt werd en, wie es in Kapi tel 2.8.9 besehrieben wurde. Dab ei ist der erste Sehritt, also das EinfUgen der Matrizen N und M , natiirli ch nicht mehr notwendi g, weil beide Systemteile jeweils nur noeh eine Ein- und Ausgangsgrof e haben. Soll das System dagegen als Zweigrof ensystem behandelt werd en, so gilt wegen e = ( :) = e
( ~G(s)) it G(s)
(4.128)
4.8 Vergleich mit einem Sliding Mode-Regler zuniichst
G( s) =
G(S ) ) ( ~G(s)
303
(4.129 )
Der lineare Systemteil hat also zwei Ausgangsgrofien, wahrend der nichtli neare Syst emteil nur eine Ausgangsgrofle aufweist . Daher ist fur den FuzzyRegier eine zusatzliche, kunstliche Ausgangsgrofle mit dem konst anten Wert Null zu definieren. Es ergibt sich der Ausgangsvektor u = [UI , U 2] T = [u, of , und dami t gilt ftir die Matri zen N und M wie in Kapitel 2.8.9 (4.130)
N=(10 )
Es folgt fur die Ubert ragungsmatrix des linearen Syst emt eiles (vgl. (2.312))
0) = G
lG (s) G (s)N = ( sG(s ) 0
n eu
(4.131)
Mit diesen Definitionen hab en nun sowohl der linearc als auch der nichtlinear e Systemteil jeweils zwei Ein- und zwei Ausgangsgrofen, womit die Gru ndvoraussetzung ftir die Hyp erst abilitatsanalyse erflillt ist. Gegebenenfalls ist der geschlossene Kreis anschlieBend noch urn die Matriz en K und D (vgl. Abb . 2.95) zu erweitern , urn sicherzuste llen, dass der lineare Teil stabil bzw. positiv reell ist . Die dazu notwendigen Schritte sind in Kapitel 2.8.9 ausfuhrlich erlaut ert worden . AnschlieBend bleibt noch die Bedin gung (2.318)
J T
u'T e'd t
~ -{35
(4.132)
o fiir den erweite rten nichtlinearen Systemteil zu iiberprufen. Dies kann nah erun gsweise dadurch geschehen, dass man fur cine geeignete Menge an Vekt oren e die Positivi t at des Integranden in (2.319) bzw. (2.325) nachweist .
4.8 Ver gieich mit einem Sliding Mode-RegIer Wesentli ch weniger Probleme bei der Anwendung bereitet die St abilitatsanalyse durch den Vergleich eines Fuzzy-Reglers mit einem Sliding Mode-Regier [41, 148]. Dieses Verfahr en erfordert keine Auft eilun g des Systems in einen linearen und einen nichtlin earen Teil, ist daflir allerd ings nur auf Eingrobensysteme anwendbar, wobei der Regier aber auch mehr ere Einga ngsgrofien besit zen darf. Die Strecke, oder gena uer gesagt , das Gesamt system auBer dem Fuzzy-Regler , muss durch die Zust and sgleichung (2.327)
x(n) (t ) = f(x (t))
+ u(t) + d(t)
(4.133)
304
4. Stabilitatsanalyse von Fuzzy-Reglern
beschrieben werden konn en , Eine solche Zustandsgieichung erhalt man , wenn man das System ent sprechend Abb. 4.2 umstrukturiert, wobei hier die Strecke aber durchaus Nichtlinearitaten enthalten darf. Ausgangspunkt der Ub erlegun gen ist dann das in KapiteI2.8.1O ermitte ite Regelgesetz (2.341) eines Sliding Mod e-Reglers
u = - fo(x)
+ g;..(i~) + x~n) + (F + D + TJ)sgn(q)
(4.134)
Urn die Formeln zu vereinfachen, sei an genommen, dass die n-te Ableitung des Sollwert es verschwindet (x~n) = 0), was im Anwendungsfall keine wesentliche Eins chrankung bed eutet. AuBerd em soli davon ausgegangen werd en , dass kein nominales Mod ell der Strecke vorliegt : fa = O. F als Abschatzung fur die Mod ellunsi cherheit ist damit naturlich ents prechend grofer zu wahl en. Und schlieBlich soli die Signumfunktion, urn einen st etigen Stellgrofenverlauf zu erzielen, durch die ebenfalls schon in Kapi tel 2.8.10 eingefuhrte Funktion h(q) erset zt werden. Damit bleibt das Regeigesetz
u
= g;..(e) + (F + D + TJ)h(q)
(4.135)
Entsprechend der Herleitung in Kapitel 2.8.10 lasst sich zur Stabilitat eines solchen Regiers aussagen, dass jedes Regeigeset z
u = g;..(e)
+ Uh(q)
(4.136)
mit U 2: F + D+TJ das System aus jedem Anfangszustand in eine Zone Iql < rp (mit rp aus Definition (2.344)) urn die durch q = 0 definierte Hyp erflache iiberfiihrt und in dieser Zone halt . Innerhalb dieser Zone nah ert sich das System dann dem Zielpunkt e = 0 , kann ihn abe r nicht exakt erre ichen. J e grofer rp gewahlt wird , desto grofer ist der zu akzept ierende Toleran zbereich. Urn einen anscha ulichen Bezug zwischen Sliding Mode- und Fuzzy-Hegler herst ellen zu konnen, soli das Regeigeset z (4.136) flir ein System zweit er Ordnung etwas gena uer betracht et werd en. Aus dem Regeigesetz wird zunachst
u = Ae + Uh(q)
(4.137)
Dieses Regeigesetz lasst sich in der e -e- Ebene ais Kenn feld darstellen (Abb . 4.9, recht s). Auf einer Geraden nimmt die Stellgrofle u den Wert Null an, oberhalb dieser Gerad en positive und unterhalb negative Werte. Ohn e den erste n Summanden wiird e diese Gerade wegen h(O) = 0 mit der durch q = 0 definierten Gerad en zusa mmenfallen. Vergleicht man dieses Kenn feld mit der Regelbasis eines typischen FuzzyReglers, wie sie ebenfalls in Abb . 4.9 dar gestellt ist , so fallt sofort die A.hnlichkeit der Ausgang sgrofen der beiden RegIer auf. Es liegt dah er nah e, fur die Stabilitat sanalyse eines Fuzzy-R egiers einen vergieichbaren Sliding ModeRegIer zu entwerfen und darau s Stabilitatsbedingungen fur den Fuzzy-Regler abzuleite n.
4.8 Vergleich mit einem Sliding Mode-Regler
NB ~M ZO PM PB PB ZO PS PM PB PB PM NS ZO PS PS PB ZO ~M !NS ZO PS PM ~M NB !NS!NS ZO PS INB NB NB ~M !NS ZD
,
,
\,
u
305
e
~>o e
,, , ,
u=O
q~O
Abb. 4.9. Regelbasis eines Fuzzy-Reglers und Null-Linie eines Sliding ModeReglers Fur die Stabilitatsanalyse eines gegebenen Fuzzy-Reglers ergeben sich damit die folgenden Schritte: Abzusch atzen sind zunachst eine obere Grenze F fur die Modellfunktion fund eine obere Grenze D fur die Amplitude der Storung d. Da T/ nur ein MaB fiir die Annaherungsgeschwindigkeit des Systems an die Hyperflache q = 0 darstellt und das System fur jedes T/ ~ 0 stabil ist , wird der Einfachheit halber T/ = 0 gesetzt. Fur die Funktion h(q) ist der Parameter tJ> vorzugeben, der gleichzeitig ein MaB fur den zu akzepti erenden Toleranzbereich ist. Fur tJ> wird zunachst ein groBer Wert gewahlt, da dies auf weniger st renge Bedingungen fur die Ste llgrofe des Fuzzy-Reglers fiihrt . Damit ist der Sliding Mode-Regier (4.136) bis auf den Parameter A festg elegt. In einer nummerischen Optimierung wird A nun so bestimmt, dass die durch u = 0 gegebene Hyp erebene des Sliding Mode-Reglers moglichst genau mit der Hyperebene des Fuzzy-Reglers ube reinstimmt. Dann ist nummerisch fur eine ausreichend groBe Anzahl an Vektoren e zu ub erpriifen , ob die St ellgrolle des Fuzzy-Reglers ftir alle Vektoren e auf der einen Seite der durch u = 0 gegebenen Hyp erebene graBer und auf der anderen Seite kleiner ist als die Stellgrofe des Sliding Mode-Reglers . Falls dies gilt, so ist nach den Ausfiihrungen zu (4.136) garantiert, dass das Syst em vom Fuzzy-Hegler aus jedem beliebigen Zustand in eine Zone Iql < tJ> urn die durch q = 0 definierte Hyp erebene uberfiihrt wird und auch dort verbleibt . Innerhalb dieser Zone nahert es sich dann dem Zielpunkt e = 0 und erre icht schlieBlich einen Toleranzbereich, der umso grober ist , je grofer tJ> gewahlt wurd e. Da tJ> zunachst groB gewahlt wurde, kann die Rechnung anschlieBend mit kleinerem tJ> wiederholt werd en, urn nicht nur die Stabilitat, sondern auch einen moglichst kleinen Toleranzbereich zu gewahrleisten. Mit kleineren Werten von tJ> werd en sich aber strengere Anford erungen an den Fuzzy-Regler ergeben. Oft kann es vorkommen, dass die durch u = 0 gegebene Hyperebene des Fuzzy-Reglers durch die ent sprechende Hyperebene des Sliding Mode-Reglers nur unzureichend approximiert werden kann. Daher sind fur die flexible Gestaltung der Hyperebene moglicherweise zusat zliche Freiheitsgrade notwendig. Diese konn en dadurch gewonnen werd en, dass q nicht entsprechend Gleichung (2.328) durch
306
4. Stabilitatsanalyse von Fuzzy-Reglern [)
q(e) = ( at
+ A)n-l e
(4.138)
sondern dur ch Gleichung (2.342) definiert wird. Dur ch entsprechende Wahl der Ci lasst sich die Hyperebene des Sliding Mode-Reglers nun auf jeden Fall so gestalten, dass sie der dur ch den Fuzzy-Regler vorgegebenen Hypereb ene sehr genau ent spricht. Die nummerische Optimierung wird durch die erhohte Anzahl zu optimierender Parameter natiirlich aufwiindiger. Entschiirfen lasst sich die Bedingung fiir St abilitat noch, wenn ein Modell der Strecke bekannt ist . In (4.135) und (4.136) t rit t dann auf der recht en Seit e jeweils noch der Summand - fo(x ) aus (4.134) hinzu , und F kann entsprechend kleiner gewiihlt werden. Natiirlich werden sich dann ftir A bzw. fur die c; andere Wert e ergebe n, die einzelnen Rechenschrit te andern sich aber nicht . Zusiitzlich zur Entschiirfung der St abillit iitsb edingung gewinnt man auf diese Art und Weise mit F auch ein MaG ftir die Robu stheit des Fuzzy-Reglers, wie dies in Kap. 2.8.10 schon erliiute rt wurde . Konkrete Beispiele fur den Vergleich von Fuzzy-Reglern mit Sliding ModeReglern finden sich in [41] und [66]. Es wird dart allerdings keine St abilit at san alyse eines bereits existierenden Fuzzy-Reglers durchg eftihrt , sondern ein Fuzzy-Regier entsprechend den Anforderungen an einen Sliding Mode-RegIer entworfen. In KapiteI 5.2.2 wird gezeigt, wie ein auf einem Sliding Mode-RegIer basierender Fuzzy-Regler sogar adaptiv laufend an die Str ecke angepasst werden kann . Dieser Fuzzy-Hegler ist dann allerdings nicht mehr dur ch Fuzzy-Regeln, sondern dur ch ein Kennfeld gegeben.
4.9 Direkte Analyse im Zustandsraum Die bisher vorgestell te n Verfah ren hab en gemeinsam, dass sie die direkt e Berechnun g von Traj ektorien vermeiden. Stattdessen werden Bedingungen untersucht , die zwar einen best immt en Verlauf der Traj ektori en und damit ein bestimmtes Stabilitiitsverhalt en des Systems garant ieren, ohne dass aber einzelne Traj ektorien berechnet werden mlissen. So werden beim LjapunovKrit erium die negat ive Definith eit der Ableitung der Ljapunov-Funktion unt ersucht , bei der harmonischen Balance die Schnittpunkte zwischen Beschreibungsfunktion und Ortskurve und bei den anderen Kriterien bestimmte Ubert ragungseigenschafte n der einzelnen Systemteile. Auf solche Kriterien wird bei den im Folgenden vorgestellten Verfahren verzichtet . Hier erfolgt eine direkte Analyse der moglichen Trajekto rienverlaufe im Zust andsraum . 4.9.1 Konvexe Zerlegung
Einen Ansat z in dieser Richtung bildet das Verfahr en der konvexen Zerlegung, wie es in [82] dargestellt wird . Es basiert auf ciner relativ einfachen
4.9 Direkte Analyse im Zustandsraum
307
Grundidee. Vorausgesetzt wird ein System, also ein gesehlossener Kreis, dessen zeitdiskretes Ubertragungsverhal ten dureh eine Faeettenfunktion (vgl. Kap . 4.2.3) gegeben ist , d .h. der Zust and sraum ist in konvexe Polyeder Pj aufgete ilt , in denen das dynamische Verh alten des Systems jeweils dur eh eine affine Funk t ion approximiert wird: fur x(k) E Pj
(4.139)
Dab ei konnen die Paramet er K , und d, auf numm erischem Wege ermitt elt werden. Die Stetigkeit der Faeettenfunk tion ist fiir die naehfolgende Stabilit at sanalyse nicht erforderlieh. Eine wesentliche Vereinfachung bedeutet es aber, wenn die Polyeder aehsenparallele Hyperquader sind. Weiterhin muss ein Gebiet H urn die zu unt ersuehende Ruh elage gegeben sein, von dem man sieher weiB, dass es zum Einzugsbereieh der Ruh elage gehort . Der Einfaehheit halber sollte H aus der Vereinigungsmenge einiger Polyeder bestehen , obwohl dies nieht unb edingt erforderlieh ist. Dan n kann mit der Meth ode der konvexen Zerlegung untersueht werden, ob ein Gebiet G ebenfalls Teil dieses Einzugsbereiehes ist. Dab ei sei G ein dur eh seine Eekpunkt e gegebenes Polyeder. Zunachst kann der Teil von G, der in H ent halten ist , ftir die weitere Unte rsuehung eliminiert worden , da man von ihm schon weifi, dass er zum Einzugsbereieh der Ruh elage gehort . Der Rest von G wird dann in konvexe, beschrankte Teilgebiet e Gj zerlegt , die jeweils vollstandig in einem Polyeder Pj enthalten sind. Diose Zerlegung erfordert einigen nummerisehen Bereehnun gsaufwand , ist aber prinzipi ell moglich. Abb . 4.10 zeigt ein Beispiel fur ein System zweiter Ordnung. Die Polyeder Pj sind hier rechteckformig, und das Gebiet H beste ht aus den inneren vier Reehteeken. Das Gebiet G erstreckt sich tiber vier Polyeder und muss in vier Teilgebiete zerlegt werden. G 4 ist vollst andi g in H enthalte n und wird climiniert. "2
\ G.
G2
.\ G) G
G4
p.
1
)
J
H
x.
Abb. 4.10. Zur Methode der konvexen Zerlegung Naeh der Zerlegung in Teilgebiet e wird auf jedes nieht elirninierte Teilgebiet Gj die in Pj giilt ige, affine Abbildun g fj angewendet , d.h. man bereehnet die Bildpunkte fj (xj,;) der Eekpunkte Xj,; von G j . Wegen der Affinitat von fj stellen diese Bildpu nkte wicderum die Eekpunkt e eines konvexen , beschrankten Gcbiet es f}(G j) dar, das allerdings nicht mehr unb edingt innerhalb cines
308
4. Stabilitatsanalyse von Fuzzy-Reglern
Polyeders Pk liegt , sondern sich tiber mehrere Polyeder erst recken kann . Auf dieses Gebiet ist dann der gesamte Algorithmus erneut anzuwenden, d.h. es ist zu zerlegen, in H ent halte ne Teile werd en eliminiert , und auf die restlichen Teilgebiete wird die ents prechende affine Abbildung angewendet . Die wiederholte Durchfiihrung dieser Schritte fiihrt auf eine Baumstruktur , wie sie in Abb . 4.11 dargest ellt ist . G gehort dann zum Einzugsb ereich der Ruh elage, wenn aile Ast end en dieses Baum es in H ent halten sind . Falls dies nicht gilt , ist keine Aussage moglich. Dieser Fall kann insbesondere dann eint rete n, wenn man , wie in der Praxis ublich, das Verfahren nach einer vorgegebenen Maxim alanzahl an Schritt en abbricht . ~ G1
G
.. G2
....
G3
f1 f2 f3
.. f1(G 1) .. f 2(G2) .. f 3(G3)
.,. ....
.,. .... .,. ....
Abb. 4.11. Resultierende Baumstruktur bei der Methode der konvexen Zerlegung
Offenbar wird bei diesem Verfahren direkt der Verlauf der Trajektorien im Zust andsraum ausgewert et, obwohl nicht einzelne Zustandspunkte, sondern immer gleich ganze Gebiete im Zust andsraum betrachtet werden. 4 .9.2 Cell-to-Cell Mapping Die konvexe Zerlegun g ent halt aber immer noch ein analyt isches Element , narnlich die Beschreibung des Systemverh alt ens innerh alb der Polyeder durch affine Funktionen. Vollstandi g numm erisch erfolgt dagegen die Stabilitat sanalyse, wenn sie auf dem sogenannte n Cell-to-cell mapp ing basiert. Einige theoreti sche Aspekt e dieses Verfahrens werden in [31, 63, 64] behand elt , wahrend die in der Praxis auft rete nden Probleme in [121 , 122] und [132] erortert werden. Mit diesem Verfah ren kann das Stabilit iitsverh alt en einer gegebenen Ruhelage bestimmt werd en . Eine Umformung des Systems vor Beginn des Verfahrens ist hier nicht erforderlich. Der Sollvektor w darf von Null verschiedene Werte aufweisen, sofern er konst ant ist . Und auch die fur einige Verfahren erforderliche Unt ert eilun g in einen linearen und einen nichtlinearen Systemteil ist nicht notwendig. Sowohl der Regler als auch die Strecke konn en nichtlinear sein und eine int erne Dyn amik aufweisen . Das entscheidende Merkm al dieses Verfahr ens ist aber, dass die tiber das System benoti gt e Information nicht in einer speziellen Form vorliegen muss, also beispielsweise als Facettenfunkt ion, Kennfeld oder TSK -Modell. Es miissen nur zeit diskrete Abbildungen existieren , mit der die akt uellen Ausgangsgrofen des Reglers u(k ) bzw. der Strecke y(k) aus bekannten, moglicherweise vergangenen Syst emgrofen zi(k) oder zj (k - 1) berechnet werd en
4.9 Direkte Analyse im Zustandsraum
309
konn en , Damit kann aber der Regier fur die St abilitatsan alyse in genau der Form verwendet werden, wie er auch ftir die Anwendung programmi ert wurde. Und das Ubert ragungsverhalten der Str ecke kann sowohl durch ein klassisches, anal ytis ches Modell als auch dur ch ein TSK-Modcll oder cine Facettenfunktion beschrieben werden. Sogar eine qualit ative Beschreibun g durch eine Fuzzy-Relation oder ein Neuronales Netz ist moglich. Dami t ist das Verfah ren fur die Anwendung besonders interessant, denn das bevorzugte Einsatzgebi et von Fuzzy-Reglern sind gerade die Strecken, deren Verhalt en nur qualitativ beschrieben werden kann. Wenn das Ubertragungsverhalt en von Regier und Str ecke, in welcher Form auch immer , bekannt ist , milssen die Zustandsgr6Ben des geschlossenen Kreises festgelegt werden. Dies sind neben den Zust andsgr6Ben der Strecke auch mogliche Zust andsgr6Ben im Regier, die durch eine reglerinterne Int egration oder Differentiation von Ein- oder Ausgangsgr6Ben des Fuzzy-Reglers ent stehen. Diese Festlegung ste llt in der Praxis normalerweise das gr6Bte Problem des Verfahrens dar, insbesondere wenn der Anwender nicht tiber ausreichende regelungstechnische Kenntnisse verfilgt . Andererseits ist es ab er kein spezifisches Problem des hier beschriebenen Verfahr ens, sondern tri tt grundsatzlich bei allen Verfahren auf, die auf einer Zustandsdarstellung des geschlossenen Kreises basieren. Mit Kenntnis der Zust and sgr6Ben lassen sich dann die Abbildungen ftir den Regier und die Strecke zu einer zeit diskrete n Zust and sdarst ellung des Syste ms zusamm enfassen:
x (k) = f (x (k - 1))
(4.140)
Die Abbildung f kann dab ei dur chaus als Kombination von Fuzzy-Relationen, Neuronalen Netzen und approximierenden , ana lytischen Funktionen gegeben sein.
•
•
•
•
Abb. 4. 12 . Aufteilung des Zustandsraumes in Zellen Fur die Stabilitatsan alyse wird dann der Zustandsraum zunachst auf einen interessierenden Bereich urn die Ruhelage beschrank t und in Zellen mit achsenparallelen Ka nten aufgeteilt (Abb. 4.12). Jede Zelle wird dur ch ihren Mitte lpunkt reprasentiert . AnschlieBend werden fiir jeden Zellenmit telpunkt mit Hilfe der Zustandsgleichung (4.140) so viele Nachfolgezustande berechnet , bis der erste dieser Zust and e in einer anderen Zelle liegt . Diese andere Zelle
310
4. Stabilitatsanalyse von Fuzzy-Reglern
wird dann als Nachfolgezelle der erst en vermerkt . Abb . 4.13 zeigt als Beispiel einen Ausschnit t des Zustandsraumes. Zunachst werden die Nachfolgezustande des linken oberen Zellenmittelpunktes berechnet . Der dritte dieser Zustande liegt in der mit tler en oberen Zelle, so dass diese als Nachfolgezelle der linken oberen Zelle definiert wird . Entsprechend wird die rechte unt ere Zelle als Nachfolgezelle der mittleren oberen Zelle definiert .
Abb. 4.13. Berechnung von Nachfolgezellen Als Result at dieses Schrittes erhalt man schlieBlich zur Beschreibung des Systemverhalt ens ein Cell-to- cell mapping, also eine Abbildung, die jeder Zelle eine Nachfolgezelle zuweist (Abb . 4.14). Diese Abbildung erset zt die Zustandsgleichung, die fiir jeden Zust and einen Nachfolgezustand definiert. Mit ihrer Hilfe wird die Stabilitatsanalyse sehr einfach. Ausgehend von der Zelle, die durch die Ruh elage charakt erisiert wird , werden zunachst aile Zellen ermittelt , die direkt auf diese Zelle abgebildet werden, danach die Vorganger dieser Zellen, usw.. AIle Zellen, die dur ch ein- oder mehrm aliges Abbilden in die Ruhez elle tiberftihrt werden, bilden dann den Einzugsbereich der Ruhelage. In Abb . 4.14 liegt die zu untersuchende Ruhel age im Mittelpunkt des Koordinatensystems. Es ist zu erkennen, dass samt liche innen liegenden Zellen zum Einzugsbereich dieser Ruh elage gehoren. In der Praxis konnen ab er Probleme auftreten, auf die hier kur z eingegangen werden solI. Insb esondere, wenn das Modell der Strecke dur ch eine Identifikation gewonnen wurd e, kann es Bereiche des Zustandsraum es geben, in denen keine Information tiber das Verhalten der Strecke und dami t des Systems vorliegt . Dami t kann ab er auch ftir die ent sprechenden Zellen keine Nachfolgezelle berechnet werden , was natiirlich eine Stabilit atsau ssage fur diese Zellen unrnoglich macht. Da eine Stabilitat saussage im Zweifelsfall eher zu konservativ ausfall en muss, werden solche Zellen im Folgenden als inst abile Zellen bezeichnet und zahlen nicht zum Einzugsbereich der betrachteten Ruh elage. Eb enfalls als inst abile Zellen zu behandeln sind diejenigen Zellen am Rand des untersuchten Gebietes, bei denen die Trajektori e ihrer Nachfolgezust and e aus dem Gebiet herausfiihrt. Und schlieBlich gelten auch aile Zellen als instabil, die direkt oder nach Zwischenschritten auf inst abile Zellen abgebildet werden. Instabile Zellen sind in Abb . 4.14 mit I bezeichnet . Die Eckpunkte miissen als instabil angesehen werden, weil dort keine Informa tion tiber das Syst emverhalt en vorliegt , wahrend am oberen und unt eren Rand jeweils eine inst abile Zelle exist iert, deren Nachfolgezelle auBerhalb des unt ersuchten Gebietes liegen wiirde. Weit ere instabile Zellen enste hen durch Abbildung auf die eben genannten Zellen.
4.9 Direkte Analyse im Zustandsr aum
, , , , I , I , I , , ,
, ,
,
/
/
/
/
/
-
/
/
G /
-
1-
G
G
1-
G
I
I
I
G
R
I
/
I
I
I G
I
I
-,
<,
I
G
I
I
, G -, <, , , -, -, , , ,
<,
-,
"
-,
-
-
-
G
G
-
-
-
-
1/ G
,,'
G
-
G -,
-
"G
, , ,,' , ,, -, ,,' I
-
-
-
-,
IG I
"-
-,
IG
I
I
I
IG
/
/
IG I
I--
-
I--
/
G G/
/
/ /
311
R
-,
I'
I
t'
I
I'
, , , / , , , I
Abb. 4 .14. Cell-to-cell mapping Ebenfalls ein Problem verursachen zusatzliche Ruhelagen. Eine Ru helage ist doch dadurch definiert , dass sich die Zust and straj ekt orie von diesem Punkt des Zustandsraumes nicht mehr ent fernt. Ent halt daher eine Zelle eine Ruhelage, so wird die vom Zellenmi ttelpunkt aus berechnete Traj ektorie moglicherweise in die Ruh elage hineinlaufen und dor t enden. And ererseits versu cht das Verfahren , so lange weitere Nachfolgezustande zu berechnen , bis einer auBerhalb der Zelle liegt , damit fur die Zelle eine Nachfolgezelle angegeben werd en kann . Die Ruh elage in der Zelle wird also dazu fiihren , dass der Algorithmus nicht endlich ist . Urn diesem Problem vorzub eugen , muss man eine untere Grenze fiir die rninimale Verand erung des Zustandsvektors in einem Abtast schritt vorgeben. Wenn diese Grenze unterschritten wird , werd en keine weiteren Nachfolgezustande berechnet und die Zelle wird als RuhezelIe definiert . Mit dieser Definit ion kann es dann aber auch vorkomm en , dass Zellen, in denen sich der Systernzustand nur sehr langsarn veran dert , ebenfalls als Ruhezellen eingest uft werden. Verrneiden lasst sich dieses Problem nicht . Falls neben der eigent lich betr acht eten Ruhe zelle weitere Ruhezellen gefunden werd en, muss der Anwend er den ents prechenden Bereich des Zustandsra umes von Hand daraufhin iiberpriifen, ob die Ursache nur in einer zu langsam en Verand erun g des Syste rnzustandes oder tatsachlich in einer bisher nicht erkannte n Ruh elage besteht . In Abb . 4.14 st ellen die mit R bezeichneten Zellen zusatzliche Ruhezellen dar , auf die auch einige andere Zellen abgebildet werd en . Sowohl die zusatz-
312
4. Stabilitatsanalyse von Fuzzy-Reglern
lichen Ruhezellen als auch die auf sie abgebildeten Zellen diirfen natiirlich nicht zum Einzugsbereich der betracht eten Ruhelage gezahlt werden. Das letzte Problem entsteht durch Grenzzyklen . Ebenso wie bei Zustandsgleichungen konnen natiirlich auch beim Cell-to-cell mapping Grenzzyklen auft ret en, d .h. eine Zelle wird nach mehrfacher Abbildung wieder auf sich selbst abgebildet. Die Ermittlung von Grenzzyklen ist nicht schwierig, wenn man sich vergegenwartigt, dass aile Zellen , die weder inst abile Zellen noch Ruh ezellen sind und auch nicht zu deren Einzugsbereichen gehoren , Teil von Grenzzyklen oder deren Ein zugsbereichen sein miissen. Dar aus folgt , dass man zunachst aile Ruh ezellen und instabilen Zellen samt ihren Einzugsbereichen detektieren muss. AnschlieBend wird aus den restlichen Zellen eine beliebige ausgewahlt . Dann werden fortlaufend ihre Nachfolgezellen bestimmt , und zwar solange, bis eine Zelle zum zweitenmal erreicht wird . Dami t lasst sich sofort der Grenzzyklus angeben. In Abb . 4.14 bilden die mit G bezeichneten Zellen einen Grenzzyklus. Zudem exist ieren Zellen, die auf den Grenzzyklus abgebildet werden , aber nicht Teil des Grenzzyklus sind . Urn den Wert der mit diesem Verfahren ermitte lten St abilitatsaussage abscha tzen zu konnen, muss man sich daruber im klaren sein, dass es zwei Quellen von Ungenauigkeit gibt , die das Ergebnis verfalschen konnen. Zum einen ist die zu Grunde liegende Zust ands gleichung (4.140) selbst aus moglicherweise nur qualit ativer Inform ation tiber das Str eckenverhalt en ents tanden und spiegelt deshalb die tatsachlichen Zusammenhange nur ungenau wider. Wenn man daher auf der Basis dieses Modells eine Langzeitsimulation des Syst ems durchfuhren wollte, so wiirde das berechnet e Systemverh alt en wegen der Akkumul ation der Fehler schon nach kurzer Zeit betrachtlich vom realen Systemverh alt en abweichen. Eine solche Langzeitsimulation wird hier ab er vermieden. Ausgehend vom jeweiligen Zellenmittelpunkt werden nur einige wenige Folgezust and e berechnet , bis eine Nachbarzelle erreicht ist . Innerh alb dieser wenigen Simulationsschritte kann die Abweichung zwischen Modell und Realit at aber auch bei ungenauem Modell nicht allzu groB werden. Denno ch beeintrachtigt die Ungenauigkeit der Zust and sgleichung natiirlich die Cute des mit diesem Verfahren ermittelte n Ergebnisses. And ererseits exist iert eine solche oder ahnliche Fehlerquelle auch bei allen anderen Verfahren. Die andere Ungenauigkeit ist dagegen spezifisch fiir dieses Verfahren und entsteht beim Ubergang von der Zustandsgleichung auf ein Cell-to-cell mapping, also durch die Diskret isierung des Zust andsraumes. Beispielsweise gilt in Abb. 4.13 die Zelle rechts unt en als zweiter Nachfolger der Zelle links oben. Wiirde man aber, ausgehend vom Zellenmittelpunkt links oben , mehr Nachfolgezust and e berechnen , so wiirde die Trajektori e vom linken oberen Zellenmittelpunkt durch die mittlere Zelle wahrscheinlich zur rechten oberen Zelle verlaufen. Dann ware aber die rechte obere der zweite Nachfolger der linken oberen Zelle. Durch die Diskretisierung kommt es also zu Fehlern , die aber relativ einfach dadurch behob en werden konnen, dass man die St abilit atsanalyse mehrmals, mit verschiedenen Diskret isierungen, dur chfiihrt. Kommt es
4.10 Fazit
313
dann trotz unterschiedlicher Diskretisierungen immer zum selben Ergebnis, so kann man davon ausgehen , dass dieses Ergebnis dann auch korrekt ist.
4.10 Fazit Festzustellen ist , dass alle Verfahren zur Stabilit atsan alyse verschiedene Starken und Schwachen aufweisen, die vor allem in ihren unt erschiedlichen Voraussetzungen begriind et sind. Unter genau diesem Gesichtspunkt bietet sich dah er ein Fazit am eheste n an. Das Extrembeispi el stellt dab ei sicherlich der Stabilit atsnachweis dur ch den Vergleich mit einem Sliding Mode-RegIer dar: Ein klassischer (SlidingMode-)RegIer muss entworfen werden , um die Stabilitat eines Fuzzy-Reglers nachzuweisen. Wenn ein soIcher klassischer Reglerentwurf aber moglich ist , steIlt sich die Frage, warum iiberhaupt ein Fuzzy-Hegler entworfen wurde. Ein Fuzzy-Hegler , dessen Stabilitiit so nachzuweisen ist , macht Bur Sinn, wenn er von vornh erein als Modifikati on des entsprechenden Sliding-Mod e-Reglers aufgefasst und entworfen wird , um z.B. den SteIlgr6Benverlauf an praktische Randbedingungen anzupassen. Auch das Verfahren der harmonischen Balance, das Pop ov-Kriterium, das Kreiskriterium sowie der Hyp erst abilitat sbeweis weisen einen ganz wesentIichen Mangel auf. Sie erfordern die Aufteilun g des geschlossenen Kreises in einen linear en und einen nichtlinear en Ant eil. Da der Fuzzy-Hegler schon nichtlin ear ist , miissen sich die Nicht linearitate n der Strecke direkt an ihrem Ein- oder Ausgang befinden, damit man sie vom linear en Rest der Strecke abspalten und mit dem Fuzzy-Regier zu einem nichtlin ear en Systemteil zusammenfassen kann , um so die gewiinschte Auft eilung in einen linear en und einen nichtlin earen Systemt eil zu erhalte n. Bei einer so einfachen Struktur der Strecke und dem Vorhand ensein eines analyt ischen Streckenmodells lasst sich aber in der Regel relativ problemlos ein klassischer Regier entwcrfen. Es sind daher nur wenige Falle denkb ar , in denen unter solchen Voraussetzungen der Entwurf eines Fuzzy-Reglers stat t eines klassischen Reglers iiberhaupt Sinn macht . Und nur in diesen Fallen konnen die oben gcnannten Stabilitatskriterien zum Einsatz kommen. Dagegen erford ert die direkte Methode von Ljapunov keine spezielle Struktur des Systems. Und wenn ihr ein System in TSK-DarsteIlung zu Grunde liegt , lasst sich die bei dieser Methode norm alerweise kritische Frage nach der Existenz einer Ljapunov-Funktion und damit nach der Stabilitat sogar auf Knopfdruck mit Hilfe von LMI-Algorithmen beantworten . Die TSKDar stellung ist ab er ftir aIle Systeme ohne Hysterese, Sprungfunktionen und Lau fzeiten probl emlos moglich. Und auch diese drei Effekt e konnen in der Regel recht gut durch TSK-Systeme approximiert werden. Dami t hat diese Methode ftir die Praxis sicherlich ein sehr groBes Potential, was auch die wachsende Anzahl an Veroffentlichungen zu diesem T hema in den letz ten .Jahr en widerspiegelt.
314
4. Stabilitatsanalyse von Fuzzy-Reglern
Das gleiche Anwendungssp ektrum ergibt sich fur die normenbasiert e St abilit atsanalyse, da auch diesem Verfahren eine T SK-Darstellung des Syste ms zu Grunde liegt. Die normenbasierte St abilit atsanalyse weist aber den grundsatzlichen Nachtei l auf, dass die Kriterien auf dem small gain theorem bas ieren und die Analyse dami t zu sehr konservativen Ergebnissen fuhr t . Fur ein TSK- Syst em ist die direkt e Met hode von Ljapunov fur einen Stabilitatsnachweis daher sicherlich erfolgversprechender. Es bleiben die beiden zuletzt vorgestellten Verfahr en zur direkt en Analyse im Zust and sraum , die schon vom Ansatz her sicher lich eine Sond erst ellun g einnehmen. Sie unterscheiden sich von den iibrigen Verfahr en dadurch, dass hier eine direkte, nummerische Betrachtung der Traj ekt orienverlaufe im Zustandsraum erfolgt, wahr end bei den anderen Verfahr en abgeleitete Kriterien unt ersucht werden, urn einen analytischen Nachweis zu ermoglichen. Dies sind z.B. die negative Definith eit der Ableitung der Ljapunov-Funktion, die Schnittpunkte zwischen den Kurven der Beschreibungsfunktion und der Ortskurve (bei der harm onischen Balance) oder bestimmte Ubert rag ungseigenscha ften der einzelnen Syst emteile. Die beiden Verfah ren verzichten im Gegensatz zu allen anderen Verfahr en also von vornherein auf einen (exakten) analy t ischen St abilitatsnachweis. Andererse its ist aber festzustellen, dass die Uberpriifung eines analyt ischen Stabili tatskriteriums nur bei einer sehr einfachen Stru kt ur des gegebenen Systems tatsachlich au f analyt ischem Wege erfolgen kann , wie dieses Kapit el deut lich gezeigt hat . Fu r die meisten Anwendu ngsfalle in der Praxis sind dagegen num merische Berechnungen erforder lich, so dass auch hier die ana lyt ische Exak th eit des Stabilitatsnachweises nicht mehr vorhande n ist . Zudem tauscht ein analytischer Beweis die ana lyt ische Exa kt heit oft nur vor. Denn er basiert auf einem Modell der Strecke, das insbesond ere nach einer Lineari sierung betrachtlich vom tatsiichlichen Systemverhalten abweichen kann. Von daher besteht also kein prin zipieller Nachte il der beiden Verfahren zur direkten Analyse im Zustandsraum gegeniiber den andere n Verfahr en. Und ihr entsc heidender Vorteil best eht darin, dass bei ihnen keine Einschriinkungen hinsichtli ch der Struktur der St recke oder der Art der Inform ati on tiber das Syst emverhalten best ehen . Analytische Funktionen konn on ebenso verwendet werd en wie Fuzzy-Modelle oder Neuronale Net ze. Bei der konvexen Zerlegung werden diese durch Facettenfunktionen approximiert , und beim cell-to-cell mapping konnen sie sogar direkt in den Algorithmus inte griert werd en. Die konvexe Zerlegun g ist nummerisch wesentlich anspruchsvoller und beinh alt et damit auch mehr Mi.iglichkeit en zu nummerischen P roblemen . Dafur bietet das cell-to-cell mapping weniger Sicherheit hinsichtlich der mit ihm gewonne nen Stabili tiitsaussage, da von jeder Zelle nur der Zellenm it telpunkt unt ersucht wird , wahrend bei der konvexen Zerlegung alle Zust and e innerhalb eines Polyeders beriicksicht igt werden. Dieser Nachteil des cell-to-
4.10 Fazit
315
cell mapping lasst sich aber dadurch ausgleichen, dass die Stabilitatsanalyse mehrmals, mit unterschiedlichen Diskretisierungen des Zustandsraumes durchg efiihrt wird. Wenn die Ergebniss e in aIle Fallen ahnlich sind , kann man Fehler, die durch die Diskretisierung des Zust andsraumes entstehen konnt en, weitgeh end ausschlieBen. AbschlieBend bleibt zu sagen, dass die direkte Methode von Ljapunov fur TSK-Systeme und die Verfahren zur direkten Analyse im Zustandsraum sicherlich den grofiten Anwendungsbereich von allen Verfahren hab en und daher auch grofere Beachtung als die iibrigen Ansatz e verdienen. Dies sollte aber nicht dazu verleiten, die anderen Ansatz e von vornherein als nutzlos abzut un. Denn fur jedes Verfahren exist ieren Systeme , fur die gerade dieses Verfahren die optimale Losung darstellt.
5. Einstellung und Optimierung von Fuzzy- Reglern
Imm er wieder findet man als wicht iges Argument fur den Ein satz von FuzzyReglern, dass sie schn ell und leicht zu entwickeln sind. Dies gilt abe r nur bei sehr einfachen Strecken , wahrend mit zunehmender Kompl exitat des Syst ems der Aufwand ftir die En twicklun g eines Fuzzy-Reglers dramatisch ansteigt . Die heuri stische Vorgehensweise zur Festlegun g der Zugehorigkeitsfunktionen und Regeln , die bei einfachen Strecken durchaus als Vorteil zu werten ist , wird dann zun ehm end ein Zeit kost end er Nacht eil. Aus dem Grund sind seit dem Ende der acht ziger J ahre verschiedene Ansatze entst anden, urn den Entwurf und die Adaption eines Fuzzy-Re glers zu systematisieren . Die wichti gsten dieser Ansatze sollen in diesem Kapitel vorgestellt werd en. Vorher seien allerdings noch einige Verfahren aus der klassischen Regelungst echnik skizziert , die grundsatzlich den Reglerentwurf, also auch den Entwurf von Fuzzy-Reglern , wesentlich vereinfachen konn en und daher in diesem Zusammenh ang Beachtung verdi enen. Die erste dieser Methoden ist das Prinzip der mehrschleifigen Regelung (vgl. Kap . 2.8.2) . Sofern die Strecke als Hinterein anderschaltung einzelner Teile dargestellt werden kann und die Ausgangsgrofen dieser Teile auch messb ar sind, biet et sich dieses Regelprinzip an. J ede Ausgangsgrofle wird zuril ckgefilhrt und von einem eigenen Regier geregelt , so das s sich ein aus mehreren Schleifen bestehender Regelkreis gemaf Abb . 2.64 ergibt . Zunachst wird der Regier ftir den inn erst en Kreis ausgelegt . Dan ach kann der geschlossene innerste Kr eis als einfaches Verzogerungsglied mod elliert und unter dieser Vorauss etzung der nachstaufere Regier ausgelegt werden. Auf diese Art und Weise werden die Regier fortl aufend von innen nach aufen aus gelegt . Diese Vorgehensweise bietet auch den nicht zu unterschatzend en Vort eil in der Praxis, da ss das Gesamtsystem stilckweise von innen nach auBen in Betrieb genommen werd en kann, wodurch die Gefah r von Beschadigungen bei falsch ausgelegte n Reglern minimiert wird . Ein anderes, moglicherweise hilfreiches klassisches Verfahren bildet die Entkopplung. Sie wird eingesetzt , urn Mehrgrofensysteme in Ein groflensyst eme zu zerlegen, die dann unabhangi g voneinander geregelt werd en konn en , Wie eine Entkopplung unter gewissen Voraussetzungen fiir lineare Syst eme vorzunehmen ist , wird in Kapitel 2.6.4 beschrieben . Filr nichtlineare Systeme exist iert leider weder ein Algorithmus zur Berechnung der EntkopplungsglieK. Michaels et al., Fuzzy-Regelung © Springer-Verlag Berlin Heidelberg 2002
318
5. Einstellung und Optimierung von Fuzzy-Reglern
der , noch konnen die Voraussetzungen in einfacher Form angegeben werd en, unter denen eine Entkopplung ilberhaupt moglich ist. Daher muss zunachst in einer genau en Untersuchung des Syst ems die Wechselwirkung zwischen den einzelnen GraBen festgestellt und anschlieBend eine Strat egie zu ihrer Elimini erung entwickelt werden. Einige Uberlegun gen zu diesem Thema im Hinblick auf Fuzzy-Systeme linden sich in [48, 49] und [198] . Diese Verfahren gehen allerdings von einem reinen Fuzzy-System aus , d.h. das Ubertragungsverhalten sowohl des Reglers als auch der Strecke ist durch FuzzyRelationalgleichungen beschrieben. Damit sind diese Verfahren eher von mengentheoretischem als von praktischem Int eresse, so dass hier auf ihre DarsteIlung verzicht et werden kann . Aus der klassischen Regelungstechnik stammt auch das Prinzip des Gain Scheduling, dessen Grundgedanke bereits in Kapitel 2.8.2 vorgestellt wurde. Die Idee des Gain Scheduling ist , fur verschiedene Arb eitspunkte einer nichtlinear en Strecke verschiedene Regler auszulegen und diese dann je nach Arbeitspunkt zu aktivieren. In [98] wird dazu ein Verfahren vorgest ellt , bei dem die NachfUhrung der Koeffizienten von PID-Regiern durch ein Fuzzy-Syst em erfolgt . Die Regeln des Fuzzy-Systems spiegein dabei Erfahrungswissen wider , das ublicherweise ftir die Einstellung von PID-Reglern genutzt wird . Eine andere Variante des Gain Scheduling stellen die TSK-Regler dar , die in den Abschnitten 3.2, 4.1.3 und 4.2.2 bereits eingefuhrt wurd en. In diesem Kapitel wird im Abschnitt 5.1 noch ein sehr elegantes Entwurfsverfahren flir TSK -Regler vorgestellt. Auch die in Kapitel 4 vorgestellten Verfahren zur Stabilitat sanalyse konnen ftir den Entwurf von Fuzzy-Reglern verwendet werden. Bei der Verwendung der direkt en Methode fiir gewohnliche Fuzzy-Regler wird beispielsweise erst eine Ljapunov-Funktion festgelegt , dann mit ihrer Hilfe ein GrenzUbertragungsverhalten fiir den Regier berechnet (vgl. Kapitel 4.2.1) und schlieBlich ein Fuzzy-Regler so ent worfen, dass er innerhalb der dur ch dieses Grenz-Ubertragungsverhalt en vorgegebenen Grenzen bleibt . Eine ahnliche Vorgehensweise wird in [164] fur den Fall angegeben, dass das Syst em in Form einer Facettenfunktion gegeben ist . In entsprechender Weise fur den Reglerentwurf verwendbar sind das Popov- , Kreis- und Hyperstabilitat skriterium sowie die Konzeption eines Sliding Mode-Reglers. In allen Fallen sind anhand des Streckenmodells mit Hilfe des Stabilitatskriteriums diejenigen Bedingungen abzuleiten, die ein RegIer zu erfiillen hat , damit das Syst em st abil ist. Erst dann wird ein RegIer entworfen, und zwar gerade so, dass er die Bedingungen erftillt . Einen Grenzfall zwischen klassischer Regelungstechnik und Fuzzy-Reglern biidet die Adaption von Kennfeidern . Fuzzy-Regler werden dab ei von vornherein ais Kennfelder beschrieben (vgl. Kap . 4.1.2) und im laufenden Betri eb immer weiter an die Strecke bzw. den jeweiligen Arb eitspunkt ada ptiert . Da bei diesen Verfahren Fuzzy-Mengen explizit iiberhaupt nicht mehr auftre te n, lasst sich darub er streit en, ob es sich eher urn klassische oder Fuzzy-Verfahren
5. Einstellung und Optimierung von Fuzzy-Reglern
319
handelt. And ererseits finden sich sehr interessan te Ansat ze zu diesem Thema gerade in Fuzzy-Fachzeits chrift en , so dass hier auf eine Dars t ellung dieser Thematik nicht verzichtet werden konnt e (Abschnitt 5.2). Typis ch fur Fuzzy-Regier ist dagegen die auto mat ische, auf heuristischen Regeln basierende Modifikation von Fuzzy-Regeln im laufenden Betrieb. Diese Vorgehensweise ist recht verbr eitet und wird immer wieder in Veroffentlichungen behandelt , so dass sie auch in dieses Kapitel aufgenommen wurde. Die Dars tellung konnt e allerding s recht kur z ausfallen , da diese Methode einen eklatanten Mangel aufweist , wie in Abschnitt 5.3 erlautert wird . Wie dieser Mangel zu beheben ist , wird dann an schlieBend in Abschnitt 5.4 gezeigt. Ein e and ere typi sche Anwendung fiir Fuzzy-Regier ist die Nachbildung eines gegebenen Ubertragungsverhalt ens dur ch einen Fuzzy-Regier. Diese Vorgehensweise tritt in der Praxis recht haufig auf, beispielsweise, wenn eine Strecke, die bisher von einem Menschen geregelt wurde, in Zukunft von einem Fuzzy-Regier geregelt werden sol!. In dem Fall sind zunachst das Ubertragungsverhalten des Menschen tiber einen langeren Zeitraum zu beobachten und die aufgezeichnete n Messwert e abzuspeichern . AnschlieBend kann dann auf der Basis dieser Messwerte ein Ubertragun gselement berechn et werden , das in ahnlicher Weise auf den Prozess reagiert wie der Mensch. Die Berechnung kann auf klassischem Wege erfolgen, indem man ein Kennfeld ansetzt, dessen Par amet er dur ch ein Regressionsverfahren gewonnen werden. Es kann ab er auch ein Neuronales Net z mit Hilfe der Messwerte so lange trainiert werden, bis seine Reaktion en auf den Proz ess denen des Menschen ausreichend ahneln. Wird dagegen auf eine linguisti sche Int erpretierbarkeit des Ubertragungsverh alt ens Wert gelegt, bieten sich Fuzzy-Clustering-Methoden an, wie sie in Abschnitt 5.5 beh and elt werden. Ein weit eres, sehr interessant es Anwendungsgebiet fiir Fuzzy-Regier ist ihre Kombination mit Neurona len Netzen , urn die Vorteile eines Fuzzy-Reglers (linguistische Interpretierbarkeit) dur ch die Vorteile eines Neuronalen Netzes (Lernfahigkeit] zu erganzen. Derartige Kombin ati onen exist ieren in den verschiedensten Auspragungen und werden als Neuro Fuzzy-Regier bezeichnet . Neuro Fuzzy-Regler erfordern allerdings geeignete Moglichkeit en zum Training des Neuronalen Net zes, die in der Praxis nicht immer gegeben sind. In denjenigen Fallen, in denen der Regier ausreichend trainiert werden kann , ste llen Neuro Fuzzy-Hegler aber eine interessante Moglichkeit fiir den Reglerentwurf dar. Vorgestellt werden sie in Abschnitt 5.6. Nicht zu vern achlassigen sind auch die Einsat zmoglichkeit en evolut ionarer Algorithmen bei der Entwicklung von Reglern und insbesondere von FuzzyReglern. Voraussetzung fiir solche Verfahren ist ein relativ prazises Streckenmodel!. Dann wird zuna chst eine Anzahl von moglichen Fuzzy-Reglern (Population) mehr oder weniger zufallig erzeugt . Mit jedem dieser moglichen Fuzzy-Regier werden dann verschiedene Simulat ionen anha nd des Modells durchgefiihrt und anschlieBend die Simulationsergebnisse hinsichtlich cines
320
5. Einstellung und Optimierung von Fuzzy-Reglern
vorher festzulegenden Kriteriums bewertet. Dieser Wert stellt ein MaB fiir die Cute (Fitness) des jeweiligen Reglers dar. Je nach Wahl der Parameter des evolutionaren Algorithmus werden dann die Regier entsprechend ihrer Cute eliminiert, verandert oder miteinander kombiniert. Die so neu entstandenen Regier stellen dann die Population der nachsten Generation dar, die anschlieBend den gleichen Schritten unterworfen wird. Auf diese Art und Weise hofft man, nach einer gewissen Anzahl an Schritten mindestens einen mogli chst guten Regier zu erhalt en. Zwei Gesichtspunkte sind bei diesem Verfahren allerdings zu beachten: Zum einen ist ein relativ prazises Modell der Strecke erforderlich. Wenn aber ein solches Modell existiert, sollte zunachst gepriift werden , ob nicht ein klassischer Reglerentwurf vorzuziehen ist . Der zweite Punkt besteht darin , dass ein in einigen Simulationslaufen erfolgreicher Regier noch lange nicht allen realen Situationen gewachsen sein muss. Die Stabilitat als Grundvoraussetzung ftir jede Regelung ist durch dieses Verfahren nicht gewahrleistet. Dennoch bildet der Einsatz evolutionarer Algorithmen eine interessante Alternative fur den Reglerentwurf, sofern er angesichts der genannten Kritikpunkte mit AugenmaB betrieben wird (vgl. Abschnitt 5.7).
5.1 Entwurf von TSK-Reglern Voraussetzung fur den Entwurf eines TSK-Reglers ist , dass auch die Strecke als TSK-System (vgl. Kap. 4.1.3) vorliegt. Dann kann, analog zu den Verfahren in Kapitel 4.2.2, der Entwurf des TSK-Reglers als LMI-Problem forrnuliert und das Problem mit LMI-Algorithmen (vgl. Anhang A.7) gelost werden
([181]) . Ausgangspunkt sind die Gleichungen (4.72) und (4.73) , fur die lediglich in geeigneter Weise einige Zwischengrofien zu definieren sind. Mit G jj = A, + BiFj wird aus (4.72) und (4.73) zunachst
AfP + (BiFjfP + PA i + PBjF j < 0 AfP + (BjFjfP + A;P + (BjFjfP +PA j + PB jF j + PAj + PBjF i < 0
(5.1) fur
i
<j
(5.2)
Dann werden beide Ungleichungen sowohl von links als auch von rechts mit p- 1 multipliziert: p- 1Af + P-1FfBf + AjP- 1 + BjFjP- 1 < 0
T +P-1AT +P-1FTB T P -1A T, +P-1FTB J , J 'J 1 1 1 +AjP- + BjFjP- + AjP- + BjFjP- 1 < 0
(5.3) fur
i
< j (5.4)
Und schlieBlich ergibt sich mit den Definitionen X = p- 1 und H, = FiP- 1 sowie unter Beriicksiohtigung der Symmetrie von P und X
5.1 Entwurf von TSK-Reglern
XA ; + H;B; + AiX + BiH i < 0 T +XAT +HTB T XA T +HTB I J I J I J +AiX +
s .a, + AjX + n.a, < 0
321 (5.5)
fur i < j
(5.6)
Dieses Gleiehun gssyst em ist offensiehtli eh linear ftir die unb ekannten Matrizen X und Hi und kann dah er ent spr eehend Anh ang A.7 in die Grundform (A.44) eines LMI-Problems ub erfuhrt werden . Die Anwendung eines LMI-Losungs-Algorithmus liefert dann nieht nur eine Aussage tiber die Existenz einer Losung, sond ern au eh eine mogliche Losu ng fur X und H i' Daraus ergeben sich dann die Regler-Matrizen an den einzelnen Stiitzst ellen zu F , = HiX - 1 . Da diese Regler-M at rizen direkt aus den St abil it atsb edin gungen gewonnen wur den , ist der Gesamt-Regler sieher stabil. Anzumerken ist abschliefend, dass in [29] das soeben vorgestellte Verfahren sogar Iilr Syst eme mit Par ameterunsieherheit en des Typ s (4.52) angegeben wird . Zusat zlich zur St ab ilit at lassen sieh sogar noeh andere Krit erien in den LMI-Reglerentwurf einarbeiten. Beispielsweise kann man die Ford eru ng naeh einer ausreiehend hohen Regelgesehwindi gkeit dadureh ausdriieken, dass die Ljapunov-Funktion eine bestimmte And erungsgesehwind igkeit aufweisen muss, die umso hoher ist , je weit er der Zust and vom Ursprung des Zust andsra umes ent fernt ist (vgl. [181]):
V(x(t) ) :::: - aV (x (t ))
(5.7)
Dab ei ist a > 0 ein frei wahlbarer P arameter , der umso grofier ist , je grofer die Regelgesehwind igkeit sein soll. Als vereinfaehte Vari ante zu (5.7) lasst sich aueh die Bedingun g der quadratisehen St abiliUit verwend en:
V (x(t)) :::: -all(x(t))11 2
(5.8)
Aus Gleiehung (4.43) wird mit (5.7)
V =
L kixT(A;P + PAi)x < - aV (x ) = - a xTp x mit
Lki = 1
(5.9)
und aus der St abilitatsbedingun g (4.42)
A;P+PAi + aP
(5.10)
Samtlichen Ungleiehun gen ist also lediglieh der Summand aP hin zuzufiigen . Das Ungleiehungssystem bleibt weit erh in linear in P , so dass aueh die LMILosungs-Algorithmen weiterhin anwendbar sind .
322
5. Einstellung und Optimierung von Fuzzy-Reglern
5.2 Adaption von Kennfeldern Kernpunkt dieser Algorithmen ist ein Fuzzy-Regler in Form eines Kennfeldes (vgl. Kap . 4.1.2) (5.11) wobei k = (k l , ka , ... )T der vom Momentanzustand abhangige Vektor der Gewichtungsfaktoren ist. u = (UI ' U 2 , .. . f ste llt den normalerweise konst anten Koeffizient envektor des Kennfeldes dar, der im Rahmen der im Folgenden vorgestellten Verfahren laufend adapt iert wird , urn ein stabiles Regelverhalt en zu gewahrl eisten , 5.2.1 Adaptiver Kompensationsregler
Die erste hier vorgest ellte Klasse solcher RegIer bilden die adapt iven Kompensationsregler, von denen der in [194] vorgestellte Ansatz naher erlaute rt werden soIl. Anwendbar ist er auf Eingrofenstrecken der Form x (n)
= f(x) + bu
y=x
(5.12)
mit b > 0, dem Zustandsvektor x = [x , x,...,x(n- I) ]T und der Ausgangsgrofe y. Naeh Definition eines Fehlervektors e = fe, e, .. ., e(n -l)j T mit e = Ys - Y und dem Sollwert Ys sowie geeigneter Festl egung eines Par ametervektor s r = [ro , ... , rn -l]T lasst sich ein ideales Regelgesetz (5.13) angeben, mit dem sieh, eingesetzt in (5.12), fur den Fehler und seine Ableitungen die Differenti algleiehung (5.14) ergibt. Dur eh dieses Regelgeset z erfolgt also offenbar eine Komp ensation der nichtlinearen Funktion f(x) , so dass eine linear e Differentialgleiehung ubrig bleibt. Wahlt man r so, dass aIle Nullstellen des eharakt erist isehen Polynoms dieser Differentialgleiehung einen negativen Realt eil aufweisen , so werden der Fehler und seine Ableitungen aueh bei zeitveranderlichem Sollwert gegen Null konvergieren . Ein solches Regelgesetz ist aber im allgemeinen nicht realisierbar , da die Funktion f nicht exakt bekannt ist . Aus dem Grund wird hier ein aus zwei Anteilen bestehendes Regelgeset z definiert : u = uc(t , x ) + us(x)
(5.15)
Dab ei ist U c die Ausgangsgrofie des Fuzzy-Reglers (5.11), der mit der Zeit so adapt iert werden solI, dass sie moglichst genau der idealen Stellgrofe u*
5.2 Adaption von Kennfeldern
323
entspricht. Die Adaption setzt aber voraus, dass der Fehler- bzw. der Zustandsvektor beschrankt ist . Urn dies sicherzustellen, wird ein zweiter Regier mit der Ausgangsgrofe U s parallelgeschalt et , der nur dann eingreift , wenn die Beschrankung verletzt wird. Mit diesem Regeigesetz andert sich die Differentialgleichung fur den Regelfehler. Ausgeh end von Gieichung (5.12) x (n)
= f(x) + b(uc + us)
(5.16)
liefert die Subtraktion von b7L' mit (5.13)
Daraus folgt ftir den Fehler ern) = yi n) - x (n) = _ r T e
+ b(u'
-
Uc -
(5.18)
us)
und in vektorieller Schreibweise
e= mit b
=
Re
+ b(u' -
Uc -
us)
(5.19)
[0, ...,0 , b] T und der Matrix
(5.20)
R = ( . : . . : . . : . • • •. . . : . . ) -ro -rl -r2 .. . -rn-l
die ein st abiles System beschreibt . Nun soll zun achst das Regelgesetz fiir die Stellgrofe U s entwickelt werden. Mit einer vorzugebenden, positiv definit en Matrix Q ergibt sich aus der Ljapunov-Gleichung (vgl. Satz A.6) (5.21) eine symmetrische, positiv definite Matrix P . Mit dieser wird wiederum eine spate r als Ljapunov-Funktion verwendete Funktion (5.22) definiert. Weiterhin sind eine ober e Schranke F > fund eine untere Schranke o < B ::; b fur die Streckenparameter zu ermitteln sowie eine Grenze Vo fur die Funktion Ve vorzugeben. Damit lasst sich das Regelgesetz angeben:
us(x) = {sgn(eTPb)
o
sonst
[Iucl + ~(F + Iyi ) I + IrTel)] n
fiir Ve
;:::
Vo
(5.23)
324
5. Einstellung und Optimierung von Fuzzy-Reglern
Us ist also nur dann von Null verschieden, wenn der Term 4eTpe grofler als die Schranke Va ist. Fur den Fall soll gezeigt werden , dass die Ableitung der LjapunovFunk tion v" aus (5.22) immer kleiner als Null ist . Fur diese gilt zunachst
Ve
=
~eTpe + ~eTpe
(5.24)
Einsetz en von (5.19) ergibt . 1 Ve = 2'(Re + b(u* - Ue
-
1
T 1 T us)) Pe + 2'e P(Re + b(u* - Ue
1
= 2'eT (R Tp + PR)e + 2'(u* -
Ue
-
-
us))
u s)(bTpe + eTPb)
(5.25)
Da bTpe ein Skalar und P symmetrisch ist , gilt
bTpe = (b Tpe f = eTpTb = eTPb
(5.26)
und dah er mit (5.21) .
1 T
T
*
Ve = -2'e Qe + e Pb(u - Ue
-
us)
(5.27)
Unt er Verwendung des Regelgesetzes (5.23) ftir Ve 2 Va wird dar aus
Ve = -~eTQe + eTPb(u* - leTPbl [Iuel +
ue )
~(F+ ly~n)1 + IrTel)]
(5.28)
Abschat zen des zweit en Summanden mit (5.13) liefert
Ve < -~eTQe + leTPb l [~(lf(X)1 + ly~n)1 + Ir Tel) + luel] -leTPbl [IUel + ~
1 T
-2'e Qe < 0
~ (F + ly~n)1 + Ir TeD] fur e i- 0
(5.29)
Damit ist die negative Definitheit der Ljapunov-Funktion bewiesen. Dar aus folgt mit (5.22), dass durch Us der Ausdruck ~ eT Pe so lan ge vcrkleinert wird, bis er kleiner als die Grenze Va ist . Das bedeute t aber wiederu m, dass mit Hilfe von Us der Fehlervektor aus jedem beliebigcn Anfan gszust and in den dur ch Ve = ~ eT pe ~ Va gegebcncn Bereich uberfiihrt und dort geha lten wird . Wiird e man die Grenze Va = 0 setze n und auf den Ant eil U e in (5.15) verzichten, so war e wegen der fortwahrenden Vcrringerung von Ve sogar garantiert, dass der Fehlervektor gegen Null konvergiert . Eine solche Rcgelun g
5.2 Adaption von Kennfeldern
325
wiirde allerdings wie ein Sliding Mode-Regier den Nachteil aufweisen, dass bei jedem Vorzeichenwechsel des Terms eTPb wegen der Signumfu nktion in (5.23) die Stellgr6Be einen relativ groBen Sprung aufweist , was natiirlich negative Auswirkungen auf das Stellglied hat. Solange sich das Syst em daher innerhalb des durch Ve :s: Va gegebenen Bereiches befindet , ist der ada pt ive Fuzzy-RegIer vorzuziehen, der im Folgenden beschrieben wird. Dieser Fuzzy-Regier solI durch ein Kennfeld ents prechend Gleichung (5.11) beschrieben werden. Mit einer Konst ant en I > 0, einer geeignet zu wahlenden Schranke U > 0 und der n-t en Spalte Pn der Matrix P aus (5.21) wird da nn das folgende Adap tionsgeset z fur den Koeffizientenvekt or definiert : I
u=
{
[eT Pn] k (x )
falls
a sonst
lui < U oder (lui ~ U und e T PnuTk (x ) :s: 0)
(5.30)
Fur den Beweis, dass durc h dieses Adaptionsgesetz tatsiichlich ein st ahiler Regier entsteht , ist zunachst die Beschrank theit des Koeffizientenvektors lui :s: U nachzuweisen. Zu diesem Zweck wird eine Ljapunov-Funkt ion Vu = ~ lul 2 = ~ uT u definiert. Fur ihre Ableitung gilt mit (5.30)
V.u =
U
T·
U
l eT PnuTk (x ) falls =
{
o
lui < U oder (lui ~ U und T T e Pnu k(x) :s: 0)
(5.31)
sonst
Dar aus folgt : Solange lui < U ist , kann sich der Wert der Ljapunov-Funkti on und damit der Betrag des Koeffizientenvektors beliebig veriindern . Falls aber lui ~ U gilt, erfolgt eine Veriinder ung der Ljap unov-Funk t ion bzw. des Betrages nur da nn, wenn e T PnuTk (x ) :s: 0 ist , und zwar urn eben genau diesen Wert e T PnuTk (x ), mult ipliziert mit der positiven Konst ant en J. Damit ist gewiihrleiste t , dass die Ljapunov-Funk tion fur lui ~ U irnrner negativ semidefinit und der Betrag lui monoto n abnehmend ist. Der Koeffizientenvektor u wird dah er dur ch das Ada pt ionsgesetz (5.30) in den Bereich lui < U iiberfuhrt und dann dort gehalt en. Es lasst sich also ein Zeit pun kt definieren , von dem ab der Bet rag des Koeffizientenvektors lui irnmer kleiner als die Schra nke U ist. Eb enfalls beschrankt ist der Zust andsvektor, und zwar aus folgendem Grund: Durch U s wird doch die negati ve Definitheit der Ljapunov-Funktion Ve = ~ eT Pe gara nt iert , sofern ihr Wert grofier als die vorgegebene Schranke Va ist . Mit Hilfe von U s wird , wie oben schon angernerkt , der Fehlervektor e in den durch Ve = ~ eT Pe :s: Va gegebenen Bereich iiberfuhrt und dort geha lten. Damit folgt aber auch die Beschriinkth eit von lei. Und dar aus resultiert wiederum, sofern der Betrag des Sollvektors beschriinkt ist , wegen e = Ys - Y und y = x auch die Beschriinkth eit des Zust and svektors x dur ch einen Wert X ~
[x].
Nachdem die Exist enz von Schran ken fur Zust and s- und Koeffizientenvekto r sichergeste llt ist , kann innerhalb des dur ch die Beschriinkungen vorgegebenen Bereiches ein optimaler Parametervektor definiert werden:
326
5. Einstellung und Optimierung von Fuzzy-Reglern
(5.32)
u" = {u I min sup luc(x, u) - U*(X)I} lul:5 U Ixl:5 X
u * kennzeichnet also denj enigen Param et ervektor aus dem Bereich lui::; U, fur den die Ausgangsgrofe U c des Fuzzy-Reglers fur alle [x] ::; X die geringst en Abweichungen von der theoretisch optimalen Stellgrof e u* aufweist. Dabei wird aber normalerweise ein von Null vers chieden er Restfehler
w(x) = u*(x) - uc(x , u ")
(5.33)
zuriickbleiben , der jedoch umso klein er wird, je mehr Stiitzstellen das Kennfeld besit zt . Mit diesem Restfehler wird a us der Differentialgleichung fur den Regelfehler (5.19) mit U c = uTk
e=
+ b(uc(x , u") + w - U c - us) = Re + bLluTk(x) + b( w - us) Re
(5.34)
mit einem Mod ellfehler Llu = u" - u. Nun soll eine neu e Ljapunov-Funktion (5.35) definiert werden. Wenn gezeigt werden kann, dass ihr e Ableitung negativ definit ist , so bedeutet dies eine st andige Abnahme sowohl des Regel- als auch des Modellfehlers. Daraus folgt let ztendlich sowohl die asymptot ische Stabilitiit des Systems als auch das Erreichen eines optimalen Koeffizientenvektors. Zun achst gilt fur die Ableitung der Ljapunov-Funktion .
V =
I T b T -I eTPe + -e Pe + -Llu LliJ.
2
(5.36)
~
2
Einsetzen von (5.34) liefert
v = ~(Re + bLluTk + b(w 1
-eTP(Re + bLluTk
2
us) fPe
+
b T . + b(w - us)) + -Llu Llu ~
(5.37)
und unter der Ausnutzung der Tat sache , dass das Produkt LluTk eine n Skalar darstellt und demnach innerhalb eines Vektorproduktes beliebig verschoben werden kann und a uch durch eine Tr ansposition unverandert bleib t
v = ~eT(RTp + PR)e + ~bTpe(LluTk + w 1 b . - eTPb(LluTk + w - us) + -LluT Llu 2
"y
us) + (5.38)
5.2 Adaption von Kennfeldern
327
Die Verwendung von (5.21) und (5.26) ergibt
V = - ~ eTQe + eTPb(L1u Tk + w 2
us) + ~L1uT L1iJ.
1
(5.39)
Mit L1iJ. = -iJ. und dem Adaptionsgeset z (5.30) wird daraus (5.40) Da b nur in der letzten Komponente von Null verschieden ist , gilt eTPb = beTPn. Dieser Skalar kann innerhalb des let zten Vektorproduktes an den
Anfang verschoben werden. Damit heben sich der erste Summ and in der Klamm er und der let zte Summ and der Gleichung heraus. Zudem ist wegen der Signumfunktion in (5.23) der Term - eTP bu s sicherlich negativ . Damit ergibt sich die Abschiitzung (5.41) Wenn der Restfehler w so klein ist, dass der Bet rag des zweiten Summanden kleiner ist als der des ersten , ist die Ableitung der Ljapunov-Funktion negativ, und sowohl der Fehlervektor e als auch die Abweichung des Koeffizient envektor s L1u gehen gegen Null. w kann dur ch eine ausreichend hohe Anzahl an Stiitzstellen des Fuzzy-Kennfeldes beliebig klein gemacht werden, doch es wird immer sehr kleine Wert e von e geben, fiir die der Betrag des ersten Summ and en kleiner ist als der des zweite n. Demn ach kann man fur sehr kleine Fehlervektoren e nicht gara ntieren, dass die Ableitung der LjapunovFunkt ion immer negat iv ist . Und dam it kann auch nicht garant iert werden, dass e und L1u gegen Null gehen. Damit war e der Regier dann aber auch bei konst antcm Sollwcrt nicht stationar gcnau. And ererseit s muss aber Folgendes beriicksichtigt werden: Der P aram etervekt or u wird dur ch das Verfahren so ada ptiert , dass die Ausgangsgrofe des Reglers innerhalb eines gegebenen Bereiches rnoglichst genau dem idealen Regelgesetz u* entspricht . Wenn sich nun , bei stationar em Sollwert , die Ausgangsgrofie des Systems diesern Sollwert angenahert hat , dann wird sich auch der Par amet ervektor irnrner rnehr demjenigen Pararn et ervektor annahern, mit dem die Ausgangsgrofle des Reglers der idealen Regelgrofe fiir diesen kleinen Bereich urn den Soliwert ents pricht . Der Parametervektor wird also durch die Adaption mit der Zeit perfekt an gena u diesen einen Arb eitspunkt angepasst . Dadurch wird dann aber auch die stationare Regelabweichung verschwinden. Nach dieser aufwandigen Rechnung sollte vielleicht noch einmal kur z zusarnrnengefasst werden. Das Regelgesetz ist bei diesern Verfahren dur ch (5.15) gegeben, wobei sich U s aus (5.23) und U c aus (5.11) ergibt . Dab ei wird der Koeffizientenvekt or u laufend nach (5.30) ada pt iert . kist der vom Moment anzust and abhiingige Vekt or der Gewichtungsfaktoren.
328
5. Einstellung und Optimierung von Fuzzy-Reglern
Die notwendigen Parameter in den Gleichungen erhalt man folgendermaBen: Zunachst werden die Koeffizienten r; fur die Fehlerdifferentialgleichung (5.14) so festgelegt, dass der Fehler gegen Null konvergiert , d.h. dass das charakteristische Polynom ausschlieBlich Nullstellen mit negativem Realteil besitzt. Damit ist dann auch die Matrix R nach (5.20) definiert. AnschlieBend muss eine positiv definite Matrix Q gewahlt werden, im einfachsten Fall also Q = I. Mit R und Q lasst sich dann auch Pals Losung der LjapunovGleichung (5.21) berechnen. Der dazu notwendige Algorithmus ist Bestandteil jeder modernen regelungstechnischen Software. Dann wird eine beliebige positive Konstante 'Y gewahlt. Sie stellt eine Art Beschleunigungsfaktor fur die Adaption des Koeffizientenvektors u dar. Bei groBem 'Y erfolgt die Adaption schnell , dafiir muss aber auch mit - wenn auch stabilen - Schwingungen gerechnet werden . Bei kleinem 'Y kann es dafur langer dauern, bis der richtige Koeffizientenvektor gefunden ist und die Regelung zufriedenstellend arbeitet. AuBerdem muss eine obere Schranke U fur den Betrag des Koeffizientenvektors festgelegt werden . Sie steUt gewissermaBen eine obere Schranke ftir den Betrag der Stellgrofe dar. Da sich der Gewichtungsvektor k aus dem Momentanzustand des Systems ergibt, der Fehlervektor e gemessen wird und Pn die letzte Spalte der oben berechneten Matrix P ist, ist das Adaptionsgesetz (5.30) fur u und damit U c vollstandig definiert . Fiir die Berechnung von Us fehlen nun noch Abschatzungen ftir die Modellparameter fund b aus (5.12), und zwar eine obere Schranke F fur fund eine untere Schranke B ftir b. Ebenso muss eine obere Schranke Va fiir Ve aus (5.22) angegeben werden. Diese stellt ein MaB fur den maximal zulassigen Fehler dar. Solange der Fehler klein ist, arbeitet der Fuzzy-Hegler, bei groferen Fehlern wird dagegen Us wirksam. In dem Fall muss dann aber eine starke Beanspruchung des Stellgliedes in Kauf genommen werden. Die Kenntnis des Vektors b ist nicht erforderlich, denn es gilt sgn( eTPb) = sgn( eTPi) mit dem Einheitsvektor i = (0, .., 0, 1)T. Damit ist die Regelung vollstandig definiert. Inwieweit sie in der Lage ist , die Ausgangsgrofie y des Systems immer nahe genug am Sollwert Ys zu halten, hangt aber ganz wesentlich davon ab, dass die Anzahl der Stiitzstellen des Fuzzy-Kennfeldes (5.11) hoch genug ist, so dass die Abweichung w aus (5.33) zwischen bestmoglicher und idealer Stellgrofie ausreichend klein wird. Beliebig hoch sollte man die Anzahl der Stiitzstellen aber auch nicht wahlen, da jede weitere Stiitzstelle eine zusatzliche Komponente des Koeffizientenvektors u und damit einen zusatzlichen, vom Verfahren zu optimierenden Parameter bedeutet. Und dies wirkt sich wiederum negativ auf die Konvergenz des Adaptionsverfahrens aus . Kritisch anzumerken ist dariiber hinaus, dass sowohl zur Berechnung von Us gemaf (5.23) als auch fiir die Adaption des Fuzzy-Kennfeldes nach (5.30) die Kenntnis des Fehlervektors e erforderlich ist, und damit insbesonde-
5.2 Adaption von Kennfeldern
329
re auch der (n - l )ten Ableitung des Fehlers e. Diese kann in der Praxis aber unm oglich direkt aus e gewonnen werden, da sich das unvermeidliche Messrauschen auf der gemessenen Grol3e e spatestens mit der zweit en Ableitung so stark auswirken wiirde, dass an eine Verwendung des Signales nicht mehr zu denken ist . Abhilfe kann hier nur die Verwendu ng eines Beobachters schaffen. Dieser setzt jedoc h die Existenz eines relativ genauen Modells der Strecke vora us. Damit ste llt sich abe r die Frage nach dem Sinn des Verfahrens, denn die Adaption dient doch letztendlich gerade dazu , das Streckenmodell zu approximieren. In [130] wird die diskrete Variante dieses Verfahre ns auf eine Beispielstrecke angewendet. Eine Erweit eru ng dieses Verfahrens auf Strecken der Form x(n)
=
f(x)
+ g(x) u
y =x
(5.42)
findet sich in [42, 175] und [195]. Dabei darf g aber nicht beliebig, sondern muss entweder immer posit iv oder immer negativ sein. Die Struktur der Regelung unterscheidet sich nicht vom hier vorgestellten Algorit hmus. Allerdings wird dort nicht nur f , sondern auch g durch ein Kennfeld in einer Adaption approximiert. Das Beweisschema bleibt jedoch gleich und fuhrt letztendlich auf eine ahnliche Stabilitatsaussage wie (5.41). Die Darstellun g in [42] ist dar iiber hinaus reizvoll, weil das P rinzip des Komp ensationsreglers und auch das Verfahren seiber auf der Basis von Lie-Ableitungen entwickelt werden. Aufgegriffen wird das oben beschriebene Verfahren auch in [101] . Hier wird vorgeschlagen , das Regelgesetz (5.15) urn einen von e abha ngigen Ant eil (5.43) mit k d > 0 zu erweitern . Dadur ch soll das Regelverhalten verbessert werden, ahnlich wie durch das Hinzufugen eines Different ialanteiles zum PI-Regier. Die Stabilitatsaussage andert sich nicht , auch hier filhrt der Beweis let ztendlich auf Gleichung (5.41). Ein anderes Verfahren fur die Adapt ion eines Kompensationsreglers wird in [174] vorgeste llt . Es ist ebenfalls fiir Strecken der Form (5.42) geeignet, gar antiert im Gegensatz zu den obigen Verfahren aber die asymptot ische Stabilit at , d.h . es kann eine Ljapunov-Funktion ents prechend (5.35) angegeben werden, deren Ableit ung immer negativ definit ist . Dafiir erfordert dieses Verfah ren aber die Angabe von Intervallgrenzen fur jeden einzelnen Koeffiziente n des g approximierenden Kennfeldes. So soll sichergeste llt werden, dass der fur g geschatzte Wert immer positiv ist . In [147] wird das Verfahren sogar auf Systeme der Form
x=
A (x) + B (x)u
y=h(x)
(5.44)
erweit ert. Bedingung ist ab er, dass die Elemente der Matrix B aul3erhalb der Hauptdiagonalen Bur sehr kleine Werte im Verhaltnis zu den Werten der
330
5. Einstellung und Optimierung von Fuzzy-Reglern
Haup td iagonalen aufweisen, was einem weitgehend ent koppelten System entspricht. Zudem weist der Regier , urn die Stabilitat zu gewahrleiste n, einen sehr groBen schaltend en Anteil auf, was in der Praxis zu erheblichen Problemen fiihren diirfte.
5.2.2 Adaptiver Sliding Mode-Regler Ein anderer Ansa tz wird dagegen in [186] verfolgt. Auch hier wird ein Kennfeld adaptiert , doch dient diese Adap tion der Verb esserung eines Sliding Mode-Reglers (vgl. Kap. 2.8.10). Ausgangspunkt der Uberlegungen ist das Stellgesetz (2.337) des Sliding Mode-Reglers u
= - fo(x) + g;.. (e) + x~n) + Usgn(q)
(5.45)
mit U ~ F + D + 1]
(5.46)
nach (2.340) . Der wesentli che Nacht eil dieses Reglers best eht dar in, dass auf der durch q = 0 gegebenen Hypereb ene die Stellgrofe einen unsteti gen Verlauf aufweist. Der zugehorige Sprung ist dab ei offenba r umso grofier, je grofler U ist. F ist eine obere Grenze fur die Abweichung zwischen realer Strecke und nomin alem Modell:
F ~ lL1f (x)1= If (x ) - f o(x )1
(5.47)
Normalerweise wird fur diesen "Vert eine Konst ante angesetzt, weil man die Funkti on L1f(x ) nicht einmal nah erungsweise kennt. Ware diese Funk tion aber bekannt , so konn te man den konst anten Wert U in (5.45) durch eine zustandsa bhangige Funktion
U*( x) = lL1f( x)1
+ D + 1]
(5.48)
ersetzen, mit der die asy mptotische Stabilitat des Syst ems ebenfalls gewahrleiste t war e. Die Unste t igkeite n im Verlauf der Stellgrof e konn ten dadurch zwar nicht vermi eden werd en , wiird en ab er im allgerneinen doch wesentlich kleiner ausfallen, als dies bei einem konst anten F bzw. U der Fall ware. Die Idee ist nun , U* durch ein Kennfeld (5.11) zu approximieren und dieses durch das Adaptionsgesetz U = 'Y lqlk (x)
(5.49)
so zu ada ptieren, dass U(x) moglichst gena u U*( x) ents pricht. Dabei ist u der Par am et ervektor, k der Gewichtungsvektor , 'Y eine positive Konstante und q die in (2.328) definierte Variable. Aufgrund der diskreten St ru kt ur eines Kennfeldes kann U* aber nur nah erungsweise approx imiert werden. Die beste und dam it kleinst rnogliche Approxi mation sei
5.2 Adaption von Kennfeldern
Uopt(x) = U*(x) +c
331 (5.50)
mit einer positiven Konstanten c. Entsprechend exist iert ein optimaler Parametervektor Uopt mit Uopt(x) = U~Ptk(x) (5.51) und ein Parameterfehler L1u = Uopt - u . Damit gilt der im Folgenden noeh verwendete Zusammenhang (5.52) Urn zu zeigen , dass aueh bei der Approximation von U* (x) dureh ein Kennfeld mit dem Adaptionsgesetz (5.49) noeh ein asymptotiseh stabiles Gesamtsystem vorliegt, wird die Ljapunov-Funktion 1
1
V = _ (q2 + - L1u T L1u) 2 .,
(5.53)
definiert und gezeigt , dass sie gegen Null konvergiert. Fur ihr e Ableitung naeh der Zeit gilt . . 1 T. V=qq--L1u U (5.54)
.,
wegen L1it
= -vu. Einsetz en von (2.334) und (5.45) liefert
V=
q(- L1 f (x ) - d - Usgn(q)) -
= q(-L1f(x) - d) -lqlU -
.,~L1uT
.,~L1uT
it
it
(5.55)
und mit (5.48) und (5.52)
V=
q(- L1 f (x ) - d) - lql(lL1f (x )1+ D + rJ - L1uTk + c)
_~L1uT it
.,
(5.56)
Wegen -qL1f(x) -lqllL1f(x)1 :::; 0 und -qd -lqlD :::; 0 lasst sieh abschatzen .
., 1
T
V :::; - lql(1J + c) - -L1u (it - ., Iqlk )
(5.57)
Der erste Summand ist sieher negativ und der zweite wegen des Adaptionsgeset zes (5.49) Null. Damit ist die Ableitung der Ljapunov-Funktion fur q f=. 0 negativ definit, d.h. q und der Fehlervektor L1u konvergieren gegen Null. Die Konvergenz von q gegen Null ist aber naeh KapiteI2.8.10 gleiehbedeutend mit der asymptot isehen Stabilitat des Syst ems. Und ein versehwindender Fehlervektor L1u bedeutet , dass sich die Ausg angsgrofe U des Kennfeldes so dieht wie rnoglich dem optimalen Wert U* annahert . Daraus folgt wiederum na eh dem anfangs Gesagten , dass die St ellgrofensprunge minimal geword en sind.
332
5. Einstellung und Optimierung von Fuzzy-Reglern
In [10, 11, 12] wird der gesamte Ansatz noch einmal sehr detailliert anaIysiert und ein anschauliches Beispiel vorgefuhrt. In [199] wird ein Adaptiver Sliding Mod e-Hegler fiir Systeme der Form x (n ) =
f(x)
+ b(x)u + d(t)
(5.58)
entwickelt . Dabei wird nicht die Stellgrofe direkt adaptiert , sondern FuzzyModelle ftir fund b. Die entsprechenden Adaptionsgesetze sowie der Stabilitatsbeweis unterscheiden sich aber nicht wesentlich vom hier vorgestellten Verfahren, so dass auf eine explizite Darstellung verzichtet werden kann. Wie schon bei den adaptiven Kompensationsreglern besteht auch hier ein wesentlicher Kritikpunkt am Verfahren darin, dass in die Berechnung der Stellgrofe laut (5.45) die (n - l)-te Ableitung des Fehlers e eingeht. Diese kann ohn e einen nichtlinearen Beobachter nicht berechnet werden, der ab er wiederum ein relativ prazises Modell der Strecke voraussetzt. Bei Existenz eines solchen Modells st ellt sich aber die Frage nach dem Sinn des ganz en Verfahrens , denn die Adaption dient doch letztendli ch dazu, genau dieses Modell zu approximieren. Am Ende dieses Kapitels muss festgestellt werden, dass bei der Adaption von Kennfeldern , wie sie hier erlautert wurde, die Fuzzy-M engen tiberhaupt nicht mehr auftauchen. Von daher stellt sich die Frage, ob dieses Thema nicht eher zum Bereich der klassis chen Regelungstechnik zu zahlen ist . Andererseits muss man aber die Tatsache akzeptieren , dass ein Fuzzy-RegIer nichts anderes ist als ein Kennfeldregler . Er unterscheidet sich von einem klassischen Kennfeldregler nicht in seiner Wirkung, sondern nur in der Art und Weise, wie er entwickelt wird. Die in diesem Kapitel vorgestellten Verfahren bilden damit die Grenze zwischen klassischer Regelungstechnik und FuzzyReglern und durften deshalb nicht vernachlassi gt werd en. 1m Folgenden soll aber wieder zu Fuzzy-Reglern, die auf Fuzzy-M engen basieren, zurii ckgekehrt werden.
5.3 Modifikation der Fuzzy-Regeln Bei diesem Verfahren handelt es sich urn einen Ansatz , der auf den ersten Blick auBerst plausibel erscheint . Er st bei genauerer Betrachtung stellt man fest , dass dieser Ansatz die Gefahr der Instabilitat in sich birgt und daher in der Praxis bei St recken hoherer Ordnung unb edingt vermieden werd en sollte. Vorgestellt werden soll der einfachste Ansatz, z.B. nach [158, 173, 178, 183]. Die Erlauterung dieses Ans atzes erfolgt hier ftir Eingrofensyteme. Das Verfahren ist ab er auch auf Mehr grobensysteme erweiterbar. Voraussetzung ist ein exist ierender Fuzzy-RegIer, der im geschlossenen Kreis bereits arbeitet . Diesem wird eine Adaptionseinheit (vgl. Abb . 5.1) zugeordnet , die als Eingangsgrolle wie der Fuzzy-Hegler zu jedem Zeitpunkt t = kT einen Messwert e(k ) erhalt . Dabei ist T die Abtastzeit der Regelung . Intern lasst sich daraus leicht die Differen z zweier aufeinand erfolgender
5.3 Modifikation der Fuzzy-Regeln
333
Messwert e .1e(k) = e(k ) - e(k - 1) ber echnen . Anhand der Werte e(k) und .1e(k) wird dann die Adaption nach folgender Strategie durchgefiihrt: Wenn sowohl der Fehler als auch die Differenz Null sind , arb eitet der Fuzzy-Regler offenbar zufried enstellend. 1st der Fehler beispielsweise positiv, die Differenz ab er negativ, so best eht ebenfalls kein Handlungsbedarf, wei! der Fehler gerade kleiner wird . Wenn aber sowohl der Fehler als auch die Differenz beide positiv oder beide negati v sind, d.h . wenn der Absolutwert des Fehlers wachst , greift die Adaption ein. Und zwar wird davon ausgegangen, dass die Ursach e fur das Anwachsen des Fehlers im Zeitin tervall (k - l)T < t :s: kT durch eine fehlerhaft e St ellgrofe n( k - 1) zum Zeitpunkt t = (k -1)T hervorg erufen wurde. Dann wird rekonstruiert, welche Fuzzy-Regel fur das Zust andekommen dieser Stellgrofe maBgeblich verantwortlich ist . Die Ausgangsgrofe dieser Regel wird ansehlieBend ents prechend der Regelbasi s in Abb . 5.1 verand ert . Bei dieser Regelbasis handelt es sich also nicht urn die Regelbasis des FuzzyReglers, sondern urn das Adaptionsgeset z.
w
NB NM 20 PM PB PB 20 PS PM PB PB PM NS 20 PS PS PB ZO ~M NS ZO PS PM NM NB :NS NS ZO PS NB INBiNB NMNS 20
Abb. 5.1. Einfaehe Adaption eines Fuzzy-Reglers Wenn beispielsweise sowohl e(k ) als auch die Differenz .1e(k) positiv sind , so bedeutet dies doeh , dass die Ausgangsgrofle y nicht nur kleiner ist als der Sollwert w, sond ern dass sich der Abst and zwischen w und yauch noch immer weite r vergroflert . Die Stellgrofe des Fuzzy-Reglers zum Zeitpunkt t = (k - 1)T war also offenbar zu klein , weshalb die Ausgangsgrofle der zugehorigen Regel dureh das Adaptionsgeset z vergroflert wird . Diese Strategie wirkt auf den erste n Blick durchaus verniinftig, weshalb sie aueh immer wieder, vor allem von Nieht-Regelun gsteehnikern , aufgegriffen wird. Sie ist aber nur bei Streeken erste r Ordnung sieher erfolgreich. In anderen Fallen kann sie dagegen erns t hafte Probleme verursachen . Dies kann man sich leieht verdeutliehen anh and eines Fuzzy-Reglers mit den Eingangsgrofen e und .1e und der Ausgangsgrofe .1u, die ansehlieBend zur Stellgrofe u = I:.1u aufsummiert wird (vgl. Abb. 4.1). Dadurch ent ste ht ein Gesamt-Regler, der einem PI-Regier vergleichbar ist . Die Regelb asis des Fuzzy-Reglers mage der in Abb . 4.5 ents prechen. Dieser RegIer regelt beispielsweise eine aus 3 Verzogerun gsgliedern bestehend e, lineare Streeke 3. Ordnung.
334
5. Einstellung und Optimierung von Fuzzy-Reglern
Es sei angenommen, dass die St ellgrofen des Fuzzy-Reglers vom Betrag her zu grof sind und sich das System dicht an der Stabilitatsgrenze befind et . Im linearen Fall wiird e dies bedeuten, dass die Or tskurve der Kr eisiibert ragungsfunktion dieht am Punkt -1 vorbeilauft , ihn aber noch nieht umschlingt (vgl. Kap . 2.5.5) . Nach einer Anr egung fuhrt das System dah er starke und kaum abklingend e Schwingungen aus. Nun solI ein Zeitpunkt t = kT wahrend einer Schwingung betrachtet werden , in dem die Regeldifferenz gerade wieder positiv wird , d.h. sowohl e(k) als auch Lle(k) sind positiv. Der Fuzzy-R egIer wird eine positive Stellgrofe Llu(k) ausgeben. Im na chst en Abtastschritt ist e(k + 1), da die Regeldifferenz gerade erst wieder positiv geworden war , noch etwas grofer geworden. Das Adaptionsgesetz wird deshalb in diesem darauffolgenden Abtastschritt aber laut Regelbasis in Abb. 5.1 die Ausg angsgrofe derjenigen Regel vergroBern, die fur Llu(k) haupt verantwortlich ist . Durch die Adaption werden die St ellgrofsen des Reglers in diesem Fall also noch weit er vergrofert. Damit wird die Heglerverst arkung vergroflert. War e der Fuzzy-R egler ein linear er RegIer , so wiird e nun die Ortskurve der Kreisubertragungsfunktion gedehnt werden und moglicherweise den Punkt -1 umschlingen . Das Nyqui stkriterium ware verlet zt und das Syst em instabil. Damit ist offensiehtlich, dass dieser Ansatz nicht nur erfolglos, sondern bei nieht-trivialen Strecken sagar gefahrlich ist . Eine sinnvolle Adaption erford ert Rilcksicht nahme auf die Struktur der Strecke und nicht nur auf die Entwicklung der Regelabweichung in einem bestimmten Zeitintervall. Aus dem Grund basieren die im folgend en Kapitel vorgest ellt en Verfahren auf einem Mod ell der Strecke.
5.4 Modellbasierte Regelung 5.4.1 Modellstruktur Das bei diesem Ansatz verwend et e Streckenmodell muss es errnoglichen , mit den Messwerten , die zu einem bestimmten Zeitpunkt t = kT vorliegen (also auch vergangene Messwerte) , den Ausgan gsgrofenvektor y(k + 1) bzw. den Zust andsvektor x(k + 1) zum Zeitpunkt t = (k + 1)T vorh erzusagen . Ein Zust andsrnod ell beschreibt beispielsweise den Zusammenhang zwischen akt uellem Zust andsvektor x(k) , aktuellern St ellgrofenvektor u(k) und der daraus resultierenden And erung des Zust andsvektors im nachsten Abtastschritt Llx(k + 1). Die Differenzengleiehung eines solchen Modells lautet
Llx(k + 1) = x(k
+ 1) -
x(k) = f(x(k) , u(k ))
(5.59)
Die Alt ernat ive zum Zust andsmodell bildet ein Mod ell, das dir ekt den Zusa mrnenha ng zwischen Ein- und Ausgan gsgrofien der Strecke beschr eibt und insofern mit einer Ub ertragungsfunktion zu vergleichen ist :
5.4 Modellbasierte Regelung
y(k
+ 1) = f [u(k -
n), ..., u(k) ,y(k - n), ...,y (k)]
335
(5.60)
Beide Modellvarianten konn en fiir die naehfolgend besehriebenen Algorithmen verwendet werden, wobei sieh a ber, wie sieh noeh zeigen wird, die einfacher en Losungen bei einem Zustandsmodell ergeben . 1m allgemeinen wird das Mod ell der Streeke aber nicht als Differenzengleiehung vorliegen , zumal in dem Fall sowieso meist ens die Auslegung eines klassisehen Reglers vorzuzieh en ist . Hier muss st attdessen davon a usgega ngen werden , dass die Information tiber die Streeke nur in Form eines Kennfeldes, eines Neuronalen Net zes oder als Fuzzy-Modell zur Verfiigung steht. Kennfelder und Neuronale Net ze sollen an dieser Stelle nieht explizit behandelt werden , da sie bereit s in Kapitel 4.1 bzw. 5.6 bes ehrieben sind. Ab er aueh ein Fuz zy-Modell muss hier wahl nieht mehr ausfiihrlieh erlaute rt werden. Einerseit s kann es in Form von Regeln der Art
R:
' IL (n ) an d ... an d X n IS R . (n H) d d ' (n + rn) an d Ul IS IJR an . .. a n Urn IS IJR A • (1) d ... an d oUX A • (n) t hen oUXl IS l/R an n IS IJR .
If
.
(1)
X l IS IJR
(5.61)
mit dem Zustandsvektor x = [Xl , . . . , xn ]T und dem St ellgrofenvektor u [Ul , .. . , u rnV vorliegen , od er ab er aueh als Fuzzy-Relation.
=
Modellbildung. Es stellt sieh noeh die Fr age , wie man iiberhaupt ein Modell der Streeke erhalte n kann. Ein Mod ell in Form von Differenzengl eiehungen lasst sieh dir ekt auf analyt isehem Wege au fstellen , sofern a usreiehe ndes Wissen tiber die der Streeke zu Grunde liegenden physikalisehen Gesetze exist iert . St ehen dagegen nur Messwerte der Streeke zur Verfiigung, so biet en sieh st at ist isehe Verfahren a n, wie sie in der Literatur ausfiihrlieh b esehrieben sind [69, 70, 105, 113, 192]. Kennfelder und Neuronale Net ze werd en auf der Basis gem essener Werte erste llt. Die Berechnung von Kennfeldern kann ebenso wie die nummerisehe Ermittlung der Koeffizienten von Differenzengl eichungen mit Hilfe klassiseher stat ist ischer Verfahren erfolgen, und Hinweise zur Konfiguration und zum Tr ainieren von Neuronalen Netzen finden sieh in Absehnitt 5.6. Bei Fuzzy-Modellen sind wiederum mehrere Arten der Mod ellbildung mogli ch. Einerseits kann das Streekenverhalten a uf der Basis des vorhandenen Wis sens tiber die Streeke dir ekt linguistiseh in Form von Fuzzy-Regeln b esehri eb en werd en . Man kann ab er aueh anhand von gemessenen Werten mit Hilfe von Fuzzy Clus tering-Algori thmen ein Fuzzy-Modell erhalte n (vgl. Absehnitt 5.5) . Sowohl die linguistisehe Modellbildung als aueh die Modellbildung mit Hilfe von Ciu st ering-Algorithmen fuhren auf ein linguistiseh interpreti erbar es Modell, das sowohl in Form von Fuzz y-Regeln als au ch als Fuzzy-Relation abge speiehert werden kann . Fuzzy-Modelle. SehlieJ3lieh bleibt noeh die Moglichkeit , jedem wahrend der Identifikation angefallene n Messwerttupel dir ekt eine eigene Fuzz y-Relatio n
336
5. Einstellung und Optimierung von Fuzzy-Reglern
zuzuordnen und diese Relationen dann disjunktiv zu verknilpfen [120] . Das so entstandene Modell ist natiirlich nicht mehr linguistisch int erpretierbar, weist aber ftir eine modellbasierte Regelung einige Vorteile auf, weshalb das Verfahren im Folgenden naher beschrieben werden soll. Der Einfachheit halber soll der Algorithmus anhand einer statischen Eingrofienstrecke ohne interne Dynamik erklart werden. Bei einer solchen Strecke Wit wahrend der Identifikationsphase zu jedem Zeitpunkt t = kT ein Messwertpaar (u(k) , y(k)) an. Damit besteht also ein Zusammenhang zwischen dem Stellgrofienwert u(k) und dem Ausgangsgroflenwert y(k), den man durch eine zunachst scharfe Relation Rk = {(u(k),y(k))} beschreiben kann, d.h. man speichert lediglich das Messwertpaar (u(k),y(k)) ab . Nun kann man aber doch davon ausgehen, dass , wenn das Wertepaar (u(k), y( k)) auftreten kann, au ch ahnliche Wertepaare auftreten konnen, Unter Verwendung der Ahnlichkeitsrelation
E : (IR x IR)2 -+ [0,1] , ((uI,xd, (U2 ,X2)) -+ min {1- min (lUI - u2 1, 1),1 - min (lxI - x21, I)}
(5.62)
lasst sich Rk daher durch eine Fuzzy-Relation, und zwar die extensionale Hulle von Rk /-lRk :
IR x IR -+ [0,1], (u, y) -+ min {I - min (Iu(k) - u], 1) ,1 - min (Iy(k) - yl, I)}
(5.63)
ersetzen. Aus dern Punkt (u(k) ,y(k)) in der u - y-Ebene wird dadurch die Fuzzy-Menge /-lR k (vgl. Abb. 5.2). Aus mengentheoretischer Sicht ist /-lRk die Menge aller zu (u( k), y(k)) ahnlichen Punkte, wobei die Ahnlichkeit durch (5.63) definiert ist. Man kann diese Fuzzy-Relation auch als Menge aller Wertepaare (u, y) der Strecke an sehen, die iiberhaupt moglich sind . Das Wertepaar (u( k) , y( k)) als gemessenes Wertepaar ist sicherli ch moglich und hat daher zu dieser Menge den Zugehorigkeitsgrad Eins , wahrend der Zugehorigkeitsgrad fur andere Wertepaare mit zun ehmendem Abstand zum Punkt (u(k),y(k)) sinkt. Man unterstellt also, dass Wertepaare, die in der Nahe eines gemessenen Wertepaares liegen, ebenfalls moglich sind, und zwar umso mehr, je kleiner der Abstand ist . Angemerkt sei, dass sich mit einer anderen Ahnlichkeitsrelation naturlich eine andere Fuzzy-Relation /-lRk ergeben wiirde, Es bietet sich aber im Hinblick auf die Rechenzeit an , fur die Modellbildung eine moglichst einfache Relation zu verwenden. Die disjunktive Verkniipfung aller wahrend der Identifikation entstandenen Fuzzy-Rclationen /-lRk ergibt dann das Fuzzy-Modell der Strecke: (5.64)
5.4 Modellbasierte Regelung
337
Abb. 5.2 zeigt ein solches Modell, das aus zwei Messwertpaaren (u( I), y(I)) und (u(2) ,y(2)) entstanden ist .
,r
,,
y(2)
y(l )
y
Abb. 5.2. Fuzzy-Modell einer Strecke Anstelle disjunktiv verknupfte r Ahnli chkeit srelati onen sind na tiirlich auch konjunktiv verkniipfte Implikationen fiir die Modellbildung denkbar. Aus theoret ischer Sicht ware dies sogar besser l weil dann mit jedem neuen Messwertpaar die Modellrelat ion, also die das Ubertrag ungsver halte n charakt erisierende Fuzzy-M enge kleiner , d. h. scharfer und damit praziser werden wtirde, Und dies ist doch eigent lich auch beabsicht igt , wenn man dem Modell neue Inform ation hinzuftigt . Im Gegensatz dazu wird bei d isjunktiver Verkniipfung der einzelnen Relationen die Gesamtrelation mit jedem neuen Messwertpaar und jeder neuen Teilrelation JLRk immer grof er und unscharfer. Allerdings gibt es bei der konjunktiven Verknupfung ein nicht zu unte rschatzendes pr akt isches Problem. Wenn namlich Messrau schen vorliegt , konnen sich fiir denselb en Wert der Eingangsgrofie wahrend der Identifikat ion durchaus unte rsch iedliche Werte der Ausga ngsgro fe ergeben. Dies fiihrt dann aber zu einer totalen Eliminieru ng sa mt licher Inform ation in dem bet reffenden Bereich des Mod ells, so dass es let ztendlich vollig unbrau chbar ist . Aus dem Grund ist die disjunktive Verknupfung von Ahnli chkeit srelationen vorzuziehen . Zur Vervollst andi gun g der Er lauterungen soll nun noch beschriebe n werden, wie man anhand dieses Mode lls fiir eine gegebene Ein gangsgrof e u(k) die zu erwart ende Ausgan gsgrofle Ym (k ) bere chnet. Dazu definiert man zunachst eine Ein gan gs-Fu zzy-Menge (Singleto n)
JLu:IR ----+[O,l] , u ----+ {
° I
: u = u(k ) : sons t
(5.65)
und berechnet mit dieser und der gegebenen Mode llrelation JLR die Relationalgleichung JLy = JLu a JLR. Man erha lt die Ausgan gs-Fu zzy-Menge JLy : IR ----+ [0,1], Y ----+ sup {min [JLu(u), JLR(U , y)] I u E U}
(5.66)
= JLR(u(k ), y) = JLy(Y) Diese Vorgehensweise entspricht einem Schnitt parallel zur y-Achse durch die Relat ion JI R an der Stelle u = u(k ), der auf die Ausga ngsvariable y proji ziert
338
5. Einstellung und Optimierung von Fuzzy-Reglern
wird (Abb. 5.3). Durch anschlieBende Defuzzifizierung erh alt man dann den zu erwartenden Wert der Ausgangsgrofe Ym(k) . Offenbar sind dies dieselb en Schritte, die auch bei der Bere chnung der Ausgangsgrofie eines gewohnlichen Fuzzy-Reglers erforderlich sind , wenn dieser als Fuzzy-Rel ation abgesp eichert ist .
y
Abb. 5.3. Berechnung der Ausgangsgrofle bei einem Fuzzy-Modell Die gesamte Vorgehensweise ist ohne Probleme auf Mehr grofenstrecken hoherer Ordnung iibertragbar. Ein e Strecke erster Ordnung lasst sich beispielsweise durch Messwerttripel (u(k), x(k), f!.x(k + 1)) (Stellgrofe, Zust andsgrofie, resultierende And erung der Zustandsgrofle) beschreiben , wobei Stell- und Zustandsgrofe die Eingangsgrofen des Modells sind und die And erung der Zustandsgrofe die Ausgangsgrofe. Das Fuzzy-Modell muss also eine zusiitzliche Dimension erhalte n. Allgemein konnen sich fur beliebige Strecken somit multidimensionale Fuzzy-Modell e ergeb en. Offenbar lassen sich aber samtliche Gleichungen leicht auf mehrere Dimensionen erweite rn, so dass sich am gesamten Verfahren durch die Erweiterung auf mehr ere Dimension en nichts andert . AbschlieBend zu diskutieren ist noch die Absp eicherung eines solchen Modells . Hier bietet es sich an , den gesamten Raum, der durch die beteiligten Grofen aufgespannt wird , zu diskretisieren. An jed er der so entstandenen Stiitzstellen wird anschlieBend der dort giiltige ZugehOrigkeitsgrad einget ragcn (Abb. 5.4). Die Modellrclation ist dann durch die Interpolation zwischen dicsen abg espeicherten Zugehorigkeitsgraden definiert. Dies fiihrt natiirlich zu einer Differenz zwischen Originalrelation und abgespeicherte r Relation, doch kann man die Differenz bei ausreichend feiner Rast erung beliebig klein machen. I
I
f
I
-- -- ~ - ----7- - ---r- - - - ~-- -
I
I
I
I
-- - - ~ ~ - - - - f I -
-
-
I -/- -
-
,
__ - ~ L
I -
-
I -of -
-
f
I
- ~ ~--
, -
-
-
I I- -
-
I -
-
I - 1- I
-
I
,
I
I
I
I
I
-
I
- -- - , --- -- ,-- - - -,--- - , --,, ,, ,, I
I
I
I
y
Abb. 5.4. Zur Abspeicherung eines Fuzzy-Modells
5.4 Modellbasierte Regelung
339
5.4.2 Einschritt-Regelung Den Kern der Einschri tt-Regelun g nach Abb . 5.5 bildet kein gewohnli ches, sondern ein invertiertes St reckenmodell. Ein solches Modell st ellt zwar wie ein gewohnliches Mod ell den Zusammenh an g zwischen Ein- und Ausgan gsgroBe dar , besitzt allerdings vertau scht e Ein- und Ausgan gsgrofien. In dieses invertierte Modell wird dann beispielsweise eine gewiinschte Anderu ng des Zust andsvektors Llx(k + 1) oder ein gewunscht er Wer t ftir den Ausgan gsvektor y(k + 1) im niichsten Abtast schritt eingegebe n, und man erhiilt als Ausg ang sgrofle diejenige Stellgrofie u(k), die dazu zum akt uellen Zeit punkt erforderlich ist . Nun kon nt e man im einfachste n Fall den Sollwert w als gewiinschte n Ausgangsvekt or y(k + 1) im nachsten Abtast schrit t vorgeben , doch stellt sich dab ei ein Problem. Falls namlich, wie es norm alerweise der Fall sein wird , der Sollwer t nicht inne rh alb eines Abtast schrit tes erre icht werd en kann , kann das invertierte Modell auch keine St ellgrofe liefern . Daher ist eine weitere Einheit notwendi g, in der anhand der Werte von w und y(k) fiir den folgenden Abt astschri t t zuniichst ein geeignetes Zwischenziel z be rechnet wird , das dann auch t atsachlich innerh alb eines Abtastschrittes erreicht werd en kann. Dieses Zwischenziel bildet dann die Eingangsgrofe fur das invertierte Streckenmodell. Die Stellgrofienb erechnung auf der Basis des Streckenmodells verursacht abe r noch ein weite res Problem . Solang e das Streckenm odell ein exaktes Abbild der Strecke darst ellt , ftihrt die damit berechnet e Stellgrofie auch exa kt auf das gewiinschte (Zwischen- )Ziel. Existie ren abe r Differen zen zwischen Modell und Strecke aufgrund von Modellungenaui gkeiten oder Veranderungen inn erh alb der Strecke, so ist dies nicht mehr der Fall, und der RegIer arbeite t nicht meh r stationar gena u. Zu losen ist dieses Problem nur dadurch, da ss das Streckenm odell st andig an eine sich moglicherweise vera ndernde Strecke angepasst wird . Dazu mussen die Messwerte aus der St recke in jedem Abtastschritt in das Modell zur uckgefiihrt werd en , wie dies auch in Abb. 5.5 eingezeichnet ist . __ _____ _____ ____ ~_e,gl~r
_
w
Abb. 5.5. Einschritt-Regelung mit invcrtiertcm Modell
y
340
5. Einstellung und Optimierung von Fuzzy-Reglern
1m Folgenden sollen nun die Modellinversion , die -ad ap tion und die Berechnung von Zwischenzielen fur die verschiedenen Modellvarianten diskutiert werden, und zwar zunachst die Inversion , dann die Adaption und zum Schluss die Berechnung von Zwischenzielen. Modellinversion. Am einfachsten ist die Inversion von Fuzzy-Relationen (Abb. 5.2). Wegen der Symmmetrie des Fuzzy-Mod ells hinsichtlich seiner Einund Ausgan gsgrofien kann die Mod ellinversion hier namlich durch schlichtes Vertaus chen der GroBen erfolgen. Beim st atischen Eingrofensyst em wird der gewiinschte Wert z = y(k) zur Eingang sgrofe und die zugehorige Stellgrofe um(k) zur Ausgangsgrofe des Modells. Der Schnitt durch die Relation (vgl. Abb. 5.3) erfolgt dann parallel zur u-Achse an der Stelle y = y(k). Man erhalt eine Fuzzy-Menge Mu und nach einer Defuzzifizierung schlieBlich die Stellgrofe u (vgl. [111, 120]). Da Fuzzy-Relationen auch ohn e weit eres ftir mehrdimension ale Systeme aufgest ellt werd en konnen, ist die Modellinversion auch ftir Strecken hoherer Ordnung und Mehrgrofiensyst eme unproblematisch. Die Modelle werd en wie gewohnt erste llt und anschlieBend lediglich invers benutzt. Man kann fiir die Modellinversion bei Fuzzy-Relationen t heoret isch auch einen anderen Weg [149, 188] beschreit en , der auf den Ergebnissen von Sanchez [167] basiert. Anhand dieser Er gebni sse ist es moglich, ftir gegebene Mengen My und MR die groBtmogliche Fuzzy-Menge Mu zu berechnen , mit der die Relationalgleichung My = Mu 0 MR erfiillt ist . Dies ents pricht aber doch gerade der vorliegenden Aufgab enst ellung. Gegeb en sind y und R , wahrend u gesucht ist . Allerdings exist iert dab ei ein Problem . Die Losung Mu ist namlich nur dann eine nicht-leere Menge, wenn My ausrcichend groB gewahlt wird. Wenn man also, wie es am einfachste n ist, die gewiinschte Ausgan gs-Fuzzy-Menge My als Singleton vorgibt , so wird normalerweise keine Losung Mu fur die Relat ionalgleichung exist ieren. Dami t kann aber fur den Regier in den meist en Abtastschritten auch keine Stellgrofe ermit te lt werd en. AuBerd em ist der Algorithmus sehr rechenaufwandig, so dass insgesa mt der vorh er vorgest ellte Losungswog vorzuziehen ist. Ein vollig anderer Weg fiir die Mod ellinversion ist einzuschlagen, wenn das Mod ell in Form von Fuzzy-Regeln , als Kennfeld oder als Neuronales Net z vorliegt . Wahrend man ein Kennfeld dur ch Interpolation zwischen den Werten an den Stii tzstellen zumindest prinzipiell auch invers benutzen kann, ist dies bei Fuzzy-Regeln und Neuronalen Netz en vollkomm en unmo glich. Abhilfe biet et hier der Vorschlag in [150], das Modell von vornherein invers aufzub au en , d.h. mit vertaus cht en Ein- und Ausgangsgrofen. Schon beim Erz eugen des Modells werden also y und x als Ein gan gs- und die Stellgrofe u als Ausgang sgrolle behandelt. Keiner lan gen Erklarungen bedarf es, wenn das Streckenm odell als Differenzengleichung vorliegt , denn fur die Inver sion gibt es hier nur zwei AIternativen . Entweder lasst sich die Funktion f in den Differenzengleichun gen (5.59) oder (5.60) nach der gesuchte n GroBe u(k) auflosen oder nicht . Falls
5.4 Modellbasierte Regelung
341
ja, so kann aus diesen Gleichungen auf analyt ischem Wege ein inverses Modell mit u(k) als Ausgangsgrofe bestimmt werden. Andernfalls kann dagegen fur eine gegebene Ausgangsgrofe die ent sprechende Stellgrofe anhand der Differenzengleichungen nur numm erisch berechnet werden. Deshalb wird beispielsweise in [75] die analyt ische Auflosbark eit einfach vora usgesetzt. Grundsiitzlich exist iert ftir alle Arten von Modellen ein sehr einfacher, dafur aber rechenaufwandiger Weg, urn die Inversion zu vermeiden. Und zwar wird eine ausreichend groBe Anzahl verschiedener Werte fiir u jeweils als Eingangsgrofie in das nicht invert ierte Modell eingespe ist . Derjenige Wert von u , bei dem die Ausgangsgrofe y (k + 1) dem Zwischen-Ziel z am nachst en komm t , wird dann als Ste llgrofie auf die Strecke gegeben [109, 157].
Modelladaption. Damit sollen die AusfUhrungen zur Modellinversion abgeschlossen werden. Der nachst e zu diskutierend e Punkt ist die Adaption des Modells. Bei einer Fuzzy-Relati on kann diese Modell-Adaption relativ einfach erfolgen , wie wieder anhand der stat isehen Ein grofienstrecke erlaute rt werd en soll. Und zwar wird in jedem Abtasts chritt die Ste llgrofle u(k) , die an die Streeke ausgegeben wird , auch in das nicht-inverti erte Streekenmodell eingegeben. Man erhalt die zu erwartende Ausgangsgrolle Ym(k ). Diese wird dann mit der sich tatsachlich einste llenden, gemessenen Ausgangsgrofie y (k ) verglichen. 1m Faile einer Differenz muss der ents preehende Teil der Modell-Relation f-L R in y-Richt ung verschoben werden, so dass die veranderte Relati on die akt uellen Verhaltnisse in der Strecke widerspiegelt (Abb. 5.6). Das Modell wird also in jedem Abtastsehritt sowohl invers fur die Berechnung der Ste llgrofe , als auch nieht-i nvers fiir die Adapt ion verwendet.
-
ym(k)
y(k)
Abb. 5.6. Adaption einer Fuzzy-Relation Nach demselb en Prinzip hat die Adaption zu erfolgen, wenn das FuzzyModell in Form von Fuzzy-Regeln oder als Kennfeld vorliegt. In jedem Abt astsehritt ist die Ausgangsgrofie des Modells mit der gemessenen Ausgangsgrofie der Strecke zu vergleiehen, und im Faile einer Abweichung ist das Modell zu verand ern . Bei einer Fuzzy-Regel verandert man die Ausgangs-FuzzyMenge und bei einem Kcnnfcld die an den ents preehenden Stiitzstellen abgespeieherten Werte. Noeh einfaeher ist die Adap tion bei einem Neuro nalen Netz. Sofern es sieh im Trainin gsmodu s befindet , wird es sieh automatiseh an Veriinderu ngen innerh alb der Streeke anpassen.
342
5. Einstellung und Optimierung von Fuzzy-Reglern
Liegt das Mod ell dagegen als Differenzengleichung vor , so muss auf ein klassisches Identifikationsverfahren zuriickgegriffen werden. Da zu werden tiber ein lan geres Zeitintervall ausreichend viele Messwerte der Strecke gesammelt und anschlieBend durch Regression auf nummerischem Wege ein neues, aktuelles St reckenmodell berechnet. Hier kann die Aktualisierung des 1'10dells also nicht in jedem Abtastschritt , sondern nur in grofe rem zeit lichen Abstand erfolgen. Zudem ist eine solche Neub erechnung nummerisch nicht unproblematis ch, wenn die neu gesammelte n Messwerte nicht genugend Informat ion ent halte n. 1m Hinblick auf die Adaption sind die anderen Modelle also sicherlich einer Differenzengleichun g vorzuziehen. Berechnung von Zwischenschritten. SchlieBlich bleibt die Berechnung von Zwischenschritten anzusprechen, die das entscheidende Problem der Ein schrit t-Regelung offenb aren wird. Eine sehr elegante Losung fiir Modelle in Form von Fuzzy-R elationen wird dazu in [53] vorgeschlagen. Die Tatsache, dass der Soliwert w moglicherweise nicht in einem Abtastschritt erreicht werden kann , wird dadurch beriicksi chti gt , dass als gewiinscht er Ausgangswert y(k + 1) nicht nur ein Singleton, sondern eine Fuzzy-Menge fly vorgegeben wird. Die ZugehOrigkeitsfunktion dieser Fuzzy-Menge weist fur y = y(k) den Wert Null auf und steigt mit zun ehm ender Nahe zum Wert y = w an . Abb. 5.7 zeigt eine solche Funktion fur ein System erst er Ordnung. Diese FuzzyMenge bild et dann die Eingangsgrofe der Relat ionalgleichun g fl u = ILy 0 ILR. Die ZugehOrigkeitsfunktion der Ausgan gsgrofie fl u wird dam it ftir genau die Werte von u von Null verschieden sein, die im folgend en Abtastschri tt eine Ausgangsgrofe y( k + 1) zwischen y(k) und w hervorrufen konn en, Dab ei hang t der Zugehori gkeitsgrad sowohl vom Abst and zwischen zu erwarte nder Ausgan gsgrofie und w , als au ch von den entsprechenden Werten der Modellrelation aboJ e naher eine Stellgrofie das Syst em an den Sollwert w heranfiih ren kann, desto grofer ist ihr Zugehorigkeitsgrad zur Menge fl u . Durch Defuzzifizierung von flu wird sich dann sicherlich eine geeignete Stellgrofie ergeben.
y(k)
w
Abb. 5.7. Erweiterte Eingangsgrofle fiir das inverse Modell Bei Modell en in Form von Fuzzy-Regeln , Kennfeldern , Neuronalen Net zen oder Differenzengleichungen ist dieser Algorithmus natiirlich nicht verwendbar. Fur diesen Fall wird in [75] zur Berechnung der Zwischenziele ein einfacher I-RegIer mit der Eingan gsgrofe e = w - y vorgeschlagen. Die Ausgang sgrofe dieses Reglers, also das Zwischenziel z, ent spricht im stationaren Zu-
5.4 Modellbasierte Regelung
343
stand gerade der RegelgroBe y. Denn zwischen z und y befinden sich nur das inverse Modell und die Strecke, die sich beid e, sofern das Modell annahernd exa kt ist, in ihrer Wirkung komp ensier en. AuBerdem muss y im stationaren Zustand gleich w sein , da sonst die Eing angsgrofe w - y des Integrators von Null verschieden ware und sieh die Ausgangsgrofe des Integrators verandern wiirde. Damit ware dann ab er noeh kein stationa rer Zustand erre icht. 1m st ationaren Zustand gilt also w = z = y. Nach einer Anderung des Sollwertes w wird sieh z als Ausgan gsgrofe des l-Reglers solange stetig verandern, bis y gleieh w und die Regelabweiehung e versehwunden ist . In dem dann err eichten, neuen st ationaren Zust and gilt wieder w = z = y . z und damit die Folge der Zwischenziele andert sieh also ste t ig und bei entsprechender Auslegung des l-Reglers auch langsam vom alte n zum neuen Sollwert . So soll gewahrleist et werd en , dass zu jedern Zwisehenziel auch t atsachlich eine Stellgrofle existiert, die die Strecke innerhalb von einem Abtastsehritt zum Zwisehenziel hinfuhren kann. Offenb ar wird bei beiden soeb en vorgestellten Verfahren vorausg esetzt, dass eine Stellgrofle exist iert, mit der sieh der Ausgangsvektor y , wenn der Sollwert w nieht im nachfolgend en Abtast sehritt erreieht werd en kann, zumindest in Riehtung des Sollwertes verandern lasst . Ausgehend von einem Vektor y(k ) zum akt uellen Zeitpunkt muss also ftir die Kornponent en des Ausg ang svektors zum nachfolgend en Zeitpunkt immer
+ 1) :s; ui, 2: Yi(k + 1) 2: Wi
Yi (k) < Yi (k
falls Wi 2: Yi(k)
Yi(k)
falls ui; :s; Yi(k)
(5.67)
gelte n. Im zweidim ension alen Fall (Abb . 5.8) bedeutet dies , das s das System ausgehend von einem Vektor y (k) so in den Zielzust and w hineingefuhrt werd en kann, dass alle y (k) naehfolgend en Ausgangsgroben y(k + j ) in einem Reehteek mit den Eekpunkt en y(k) und w liegen . Y2
y(k)
Abb. 5.8. Zulassiges Gebiet fur nachfolgende Ausgangsvektoren und m6gliche Trajektorie eines Nicht-Minimalphasensystems Diese Vorau sset zung ist jedoeh nur fur Minimalphasensys teme immer erftillt (vgl. Anh an g A.2). Bei Systemen mit nieht-minimaler Phase, die insbesond ere unter den Mehrgroflensystemen haufig anzut reffen sind, kann es vorkommen , das s das Syst em von y(k) nach w nur auf einer Tr aj ektorie
344
5. Einstellung und Optimierung von Fuzzy-Reglern
iiberfiihr t werden kann , die dieses Gebiet verlasst oder soga r vollstiindig auBerhalb verlauft (Abb . 5.8) . Auf so1che Systeme kann die Einschritt-Regelung daher nicht angewendet werden. Noch eingeschriinkter ist der Anwendungsbereich sogar, wenn ein Zustandsmo dell nach (5.59) verwendet wird , und zwar unabh iingig davon , ob es in Form von Differenti algleichun gen oder als Fuzzy-Modell vorliegt. Hier wiirde die Einschri tt-Regelung bei jedem System versage n, dessen Ordnung groBer als Eins ist. Als Beispiel sei eine Beschleuni gun gsst recke angenommen, die durch die Differentialgleichun g F = ml mit den Zust an dsgrofien 1 un d v gegeben ist (vgl. Kap . 2.7.1). Das System soll von einem Star t zust and (lo,vo) = (0, 0) in den Endzust and (ll,vd = (w, O) ub erfuhrt werd en. Die dazu notwendige Tr aj ekt orie im Zust andsraum ist in Abb. 2.48 dargest ellt . Offensichtli ch ist zwischenzeitlich eine von Null verschiedene Geschwindigkeit v erforder lich, damit sich der Korp er in den Endzustand bcwegt . Andererseits ist aber die Geschwindi gkeit sowohl im Anfan gs- als auch im Endzustand Null. Demnach ist hier das Gebiet moglicher Zwischenzustiinde (Abb. 5.8) von einem Recht eck zu einer Verbindungslinie zwischen Anfan gs- und Endzustand auf der l-A chse degeneriert , auf der die Geschwindigkeit ftir alle Zust iinde gleich Null ist. Beide Verfahren wiird en dam it nur Zwischenziele erzeugen, die auf der l-Achse liegen , bei denen die Geschwindigkeit also Null ist . Der Korp er soll seine Position von 1 = nach 1 = w veriindern , ohne dass seine Geschwindigkeit jemals von Null verschieden wird. Dies ist offensicht lich unmoglich. Wegen dieses eklatanten Mange ls des Einschritt-Verfahrens wird in [4] vorgeschlagen , das Streckenmodell fiir eine Vorh ersage iiber mehr ere Abt astschr itte zu nutzen. Dazu werde n zunachst im Hinblick auf die Gegebe nheite n der St recke obe re und untere Grenzen fiir die Ste llgrofen sowie die maxima l mogliche Anderung einer Stellgrofle innerhalb eines Abtastschrittes festgelegt. Weite rhin wird der Ste llgrofenra um diskretisiert , d.h. es werden nur end lich viele verschiedene Werte ftir die Stellgrofien in Bet racht gezogen. SchlieBlich wird noch eine feste Anzahl r an vorherzusagenden Abt astschri tte n vorgegeben. Unte r dicscn Vorausset zung en gibt es innerhalb des Vorh ersage intervalls nur endlich viele rnogliche Stellgrofensequenzen. Zu einem Zeitpunkt t = kT werd en dann alle rnoglichen Stellgrofensequenzen ftir das Zeitintervall kT :::; t :::; (k + r )T anhand des Streckenmodells simuliert und der resultierend e Verlauf der Regelgrofie bewertet. Von derjenigen Sequenz, deren Bewertung am besten ausfallt, wird dann der erste Wert zum Zeitpunkt t = kT als Ste llgrofie an die Strecke ausgegeben . Die gesamte Rechnung wird im nachfolgenden Abtastzeit punkt t = (k + l)T mit dem urn einen Schrit t verschobenen Vorh ersageintervall wiederholt . Ahnliche, im Det ail aber schlechtere Vorschliige finden sich auch in [35, 40] und [168]. Das gru ndsiit zliche Problem bei diesem Ansatz besteht darin, die Anzahl r an vorhe rzusagenden Abtastschritten sowie die Bewertungsfunkt ion fiir die Regelgrofle geeignet festzulegen. Wenn r zu klein gewiihlt wird und die Re-
°
5.4 Modellbasiert e Regelung
345
gelgrofe innerhalb des Vorh ersageintervalls noeh nieht de n Sollwer t erreieht , kann fur Systeme mit nieht-minim aler Phase der Erfolg oder Misserfolg der St ellgrofensequenz iiberhaupt noeh nieht abgeschatzt werd en . Dam it wird aber aueh die Auswahl einer geeigneten Bewertungsfunktion unmoglich, Andererseits muss man natiirlieh wegen des Reehenau fwandes daran interessiert sein , r so klein wie moglich zu halten . Letztendli eh miissen r und die Bewertungsfunktion also an die Streeke angepasst werde n, was bei vorher unb ekannten Streeken nur in mehreren It erationen moglich ist .
5.4.3 Optimale Regelung Bei der optimalen Regelun g naeh [120] wird dagegen eine Strategie zur Bereehnung der Zwisehenziele verfolgt , die einen optimalen Verlauf der RegelgroBe und das Erreichen des Sol1wertes von vornherein gewahrleiste t . Ansonst en entspricht die Gesamtstruktur der Regelung der Ein sehritt-Regelung au s Abb. 5.5. Den Kern bildet ein Zust andsmodell der Streeke in Form einer Fuzzy-Relation, da s fur die Bereehnung der St ellgrofie invers benutzt wird . Auch die Mod ellad aption zur Cewahrleistung stat iona rer Gena uigkeit erfolgt hier gena uso wie bei der Einschritt-Rege lung. Der Unterschied zur Ein schrittRegelung besteht demn ach nur in der Berechnung der Zwischenziele. Die Strategie zur Berechnun g der Zwischenzi ele beruht dar auf, bei einem Wechsel des Sollwert es zunac hst mogliche Zust andstr aj ektori en zum Zielpunkt zu ermitteln und das System dann in den folgend en Abtastschritte n auf einer dieser Tr ajektori en in den Zielpunkt zu ftihren . Wegen des Reehenaufwandes zur Berechnung der Traj ektorien eignet sich dieses Verfahren insbesondere fur Systeme mit unveran derlichern Sollwer t , wah rend bei einem sich fortwahrend verandernden Sol1wert der Rechenaufwand moglicherweise zu groB ist. Erklart werden soll dieser Algorit hmus anhand eines Systems zweite r Ordnun g mit einer Ste llgrofie und einem festen Sollwert bzw. Zielzustand. Die Modellrelation f.lR weist als Ein gan gsgrofen die beiden Zustandsgrofien xl( k) und x2(k) sowie die St ellgrofie u(k ) auf, wahrend die Au sgangsgrofen die aus den Eingan gsgrofen resultierend en And erungen der Zust andsgrofen im nachfolgenden Abtast sehrit t L1xl(k + 1) und L1x2(k + 1) sind . Damit ist die Relation f.lR ftmf-dim ensional, 1m erst en Schritt wird ein Arb eitsbereieh urn den Zielzust and fest gelegt, von dem man sieher weiB, dass er vom System nicht verl assen wird . Dieser begrenzte Zustandsraum wird diskr eti siert, so dass inn erh alb der Gr enzen eine endliehe Anzahl diskr et er Zustande existiert . Aus Abb. 5.11 ist eine solche Diskr etisierung fur ein Syste m zweite r Ordnung ersicht lich. Dabei ist der Urspr ung des Koord inatensystems der Zielzust and. 1m zweite n Sehri t t wird fiir jeden dieser Zustande ermittelt , wie groB die Moglichkeit ist, ihn mit einer geeigneten Stellgrofe inn erh alb eines Ab t astschr ittes in einen seiner Nachba rzustande zu ub er fuhr en , Ab b. 5.9 verdeutlicht dies fiir einen Zust and des Beispielsystems. In der Mit t e ist der betrachtete Zust and , der von acht Nachbarzustanden umgeben ist . Gesucht ist jetzt
346
5. Einstellung und Optimierung von Fuzzy-Reglern
beispi elsweise die Moglichkeit , den mittleren Zustand innerhalb eines Abtastschrittes in den recht en oberon Zustand zu ub erftihr en. Gegeb en sind dabei die Koordinaten des mittleren Zust andes (Xl m, X2m) und des rechten oberen Zust andes ( Xl n X2r)' Dann wird der mittlere Zust and als aktueller Zustand (xl (k ), x2(k)) = (Xl m, X2m) definiert, und die Differenz zwischen mittlerem und recht em oberen Zustand als die im folgenden Abtastschritt gewiinschte Zust andsdifferenz (.:1xl(k + 1), .:1x2(k + 1)) = ( Xl r - Xl m,X2r - X2m )' X2
0.2 0.9
0.8
0.3 0.1 0.9 0.0 0.2
-
xI
Abb. 5. 9 . Moglichkeiten fur den Ubergang von einem Zustand in seine Nachbarzustande AnschlieBend werd en fur X l und X2 ZugehOrigkeitsfunktion en (Singletons) ents prechend (5.65) definiert. Fur .:1 Xl und .:1x2 als gewiinschte Ausgangsgrofien werden dag egen Zugehorigkeitsfunktionen entsprechend Abb . 5.7 gewiihlt, die fur .:1xi = 0 den Wert Null, und fur .:1xi = Xir - Xim den Wert Eins aufweisen . Mit den durch diese Zugehorigkeitsfunktionen definiert en Fuzzy-Mengen und der Mod ellrelation J-lR kann dann die Relation algleichun g (5.68) berechnet werden, und man erha lt eine Fuzzy-Menge J-lu fur die Ste llgr6Be. Diese Fuzzy-Menge kenn zeichnet all diejenigen Stellgr6Ben , die das Syst em vom mit tleren Zust and aus dem rechte n oberen Zust and nah er bringen konn en , Sie wird jetz t allerdings nicht defuzzifiziert, da man nur an einem MaB fur die Moglichkeit des Zust andsiiberganges, nicht ab er an der dazu notwendigen Ste llgrofe int eressiert ist . Dieses MaB ist der groflte vorkommende Zugeh6rigkeitsgrad (5.69) in der Fuzzy-Men ge J-lu, in unserem Fall also 0.8. Die Verwendung eines anderen MaBes, beispielsweise J-lu(u )du wiird e wenig Sinn machen , da man nicht an der Machti gkeit der Menge interessiert ist , sondern nur daran, ob iiberhaupt irgend eine Stellgr6Be exist iert , mit der der betrachtet e Zustandsiib ergang erzwungen werden kann. Als Resultat dieses Schrittes ist ftir jeden Zust and des beschr ankten , diskretisierten Zustandsraumes bekannt, wie groB die Moglichkeit ist , ihn innerhalb eines Abtastschrittes in seine Nachbarzustande zu iiberfiihr en . Zwischen
J
5.4 Modellbasierte Regelung
347
je zwei benachbarten Zust iinden kann man sich damit zwei mit einer MaBzahl versehene Verbindungslinien in beide Richtungen denken, die die Moglichkeit fur den entsprechenden Zustandsiibergang angeben. In Abb . 5.9 sind nur die vom mittleren Zustand ausgehenden Verbindungslinien eingezeichnet. Nun soli von jedem Punkt des diskretisi erten Zust andsraum es aus eine Trajektorie tiber verschiedene andere diskrete Zustande in den Zielpunkt gefunden werd en. Diese soli einerseits moglichst kur z sein, and ererseits aber nur Zust andsiibergiinge beinhalten, die einen groBen Moglichkeitswert aufweisen. Denn umso grofier ist dann auch die Moglichkeit , dass die Trajektorie vom realen Syst em nachvollzogen werden kann . Urn diese Aufgabenstellung in geschlossener Form als Opt imierungsproblem formulieren zu konn en , werden die Moglichkeit swert e aller Zust andsiibergiinge zunachst transformiert, und zwar gemaf pi = 1.0 _ P" mit a > 0 (5.70) Der Wert pi ist also umso kleiner , je groBer die Moglichkeit des zugehorigen Zustandsiiberganges ist. Mit a kann das Verh altnis der pl-Werte groBer und kleiner Moglichkeitswerte zueinander beeinflusst werd en . Dies hat wiederum Auswirkungen auf die Wahrs cheinlichkeit, mit der in den berechneten Trajektorien Zust andsiibergange mit groBen oder kleinen Moglichkeitswerten auft rete n. Nachdem aile Moglichkeitswerte transformiert worden sind , kann das Gewicht einer Traj ektorie als Summ e aller Werte pi der beteiligten Zust andsubergange definiert werden . Offensichtlich ist dieses Gewicht umso kleiner, je weniger Zust and sub ergange die Trajektorie ent halt und je kleiner die Werte pi der bet eiligten Zust andsiibergange sind . Dies bedeutet ab er doch gerade , dass die Trajektorie kur z ist und Zustandsiibergange mit groBen Moglichkeitswerten ent halt . Die Aufgab e lautet daher , von jed em Punkt des Zustand sraume s die Trajektorie ZUIll Zielpunkt mit dem kleinstrnoglichen Gewicht zu finden . Diese Aufgabe lost der Algorithmus von Dijkstra, der im Folgend en erlautert werd en solI. Dieser Algorithmus ist rekursiv definiert. Deshalb wird fur die Erkliirung zunachst ein zusamrnenh angend es Gebiet des diskretisiert en Zust andsraumes vorausgesetzt , in dem fur aile Zust and e die optimalen Trajektori en, die innerhalb des Gebietes zum Zielpunkt verlaufen, bereits bekann t sind. Diesem Gebiet soli nun ein weiterer, benachbarter Zustand hinzugefiigt werd en, d.h. auch fur ihn ist die optimale Traj ektorie inner halb des Gebietes zu berechnen . Da der Zustand dem Gebiet benachbart ist , werd en einige Zustandsiibergange mit ent sprechenden Gewichten pi zwischen diesem Zust and und Zust and en innerh alb des Gebietes exist ieren. Da die optim ale Trajektorie von jedem dieser alten Zust ande aus bereits bekannt ist , muss nur iiberprtift werden, tiber welchen dieser Zustande die optimale Trajektorie des neuen Zust and es verliiuft . Dazu ist jeweils das Gewicht des Zustandsiiberganges vom neuen zum alte n Zustand zum Gewicht der opt imalen Traj ektorie des alten Zustandes zu addieren. Uber denj enigen
348
5. Einstellung und Optimierung von Fuzzy-Reglern
alten Zustand, bei dem die Addition den kleinsten Wert ergeben hat , verlauft dann die optimale Trajektorie des neuen Zustandes. Fur den neuen Zustand wird daher dieser alte Zustand als Naehfolger innerhalb der Traj ektorie abgespeiehert. AnsehlieBend muss ab er aueh noeh iiberpruft werden, ob sieh dureh das Hinzufiigen des neuen Zustandes die optimale Traj ekto rie ftir einen alten Zustand verandert, d.h . ob es von diesem alten Zustand aus moglicherweise gunstiger ist , tiber den neuen Zustand in den Zielpunkt zu laufen. Naehdem aueh dies iiberpruft ist und fur diejenigen Zustande, deren Traj ektorie in Zukunft tiber den neuen Zustand verlauft, eben dieser neue Zustand als Nachfolger eingetragen ist , ist der Rekursionssehritt beend et. Das Gebiet wird urn den neuen Zustand erweitert, und der Algorithmus beginnt mit dem nachsten neuen Zustand von vorn. Anhand des einfaehen Beispiels in Abb. 5.10 solI der Algorithmus nun verdeutlicht werden . Der Zielpunkt ist S, und das Gebiet , in dem die optimalen Trajektorien bereits bereehnet sind, besteht aus A , B und S . Diesem Gebiet solI der neue Zustand N hinzugefUgt werden. Die Gewichte der Zustandsubergange von N zu seinen Naehbarn A und B in beiden Riehtungen sind bekannt. Die Trajektorie N - A - S hat das Gewieht 0.3 + 0.4 = 0.7, wah rend die Trajektorie N - B - S das Gewieht 0.1 + 0.9 = 1.0 aufweist . Die optimale Trajektorie von N naeh S verlauft demnach tiber A . AnsehlieBend kann aber festg estellt werden , dass das Gewieht der Trajektorie B - N - A - S mit 0.8 geringer ist als das Gewicht der urspriinglich optimalen Trajektorie von B naeh S mit 0.9. Daher muss aueh fiir Beine neue optimale Trajektorie definiert werden, die jetz t tiber N und A verlauft. Am End e dieses Rekursionssehritt es wird dann ftir N der Naehfolger A und fur B der Naehfolger N eingetragen.
Abb. 5.10. Beispiel zum Algorithmus von Dijkstra Mit Dijkstra's Algorithmus kann man nun , ausgeh end vom Zielzustand, fur aIle diskreten Zustande des begrenzten Zustandsraum es die optimalen Trajektorien zum Zielzustand bereehnen (Abb. 5.11). Mit Hilfe dieser Trajektori en lasst sieh ftir die Regelung immer das geeignete Zwisehenziel angeben . Die Bereehnung sieht fur jeden Abtastsehritt folgendermaBen aus: Der akt uelle Zustand der Str eeke wird gemessen und der nachstli egende diskrete Zust and bestimmt . Dessen Naehfolgezustand innerhalb der bereehnet en
5.4 Modellbasierte Regelung
349
Trajektori e wird dann als Zwisehenziel an das inverse Modell ausgegeben. Das inverse Modell liefert wiederum die notwendige Stellgrofie, urn das System zumindest naherungsweise innerhalb des nachsten Abt astsehrittes in das Zwisehenziel zu iiberftihren. Von dem Zust and aus, der am Ende dieses Abtastsehrittes erreicht ist , erfolgt dann die gesamte Bereehnung von neuem. Die Frage ist natiirlieh, inwieweit sich das nur nahe rungsweise Erreiehen eines Zwisehenzieles innerhalb eines Abt ast schrit tes auf dieses Regelverfahren auswirkt . Denn es ist anzunehmen, dass dieser Fall sogar der Norm alfall ist . Dureh Akkumulation dieser Fehler in mehreren Abt astsehritten kann es dann im sehlimmste n Fall vorkomm en, dass sich das System immer weit er von der ursprtin glieh bereehneten Traj ektori e ent fernt und schlieBlich einen Zustand annimmt, der naher an einer anderen bereehneten Traj ekt orie liegt. Von diesem Zeitpunkt an wird es dann auf der anderen Trajektorie weit ergeftihrt. Am End resultat and ert sich dadurch nichts, da aueh diese Trajektorie im Zielpunkt endet . Wegen dieser Redundanz mussen die Trajektorien also nur nah erungsweise rieht ig sein. Von daher reieht es aueh bei lan gsam zeitverand erlichen Streeken aus, die Trajektorien nur in groferen zeit lichen Abst and en neu zu berechnen. Das Syste m kann auch dann noch auf der Basis dieser Trajektorien in die Nahe des Zielpunktes uberftlhrt werden. Dort spielen dann die Traj ekt orien, die der Berechnung von Zwischenzielen dienen, sowieso keine Rolle mehr , wei! das System den Zielpunkt nun innerhalb eines Abt astschrittes erreichen kann . Die dazu notwendige Stellgrofe wird abe r anha nd des (invertierten) Fuzzy-Modells berechnet , das wegen der fortwah renden Adap tion im Gegensatz zu den Trajekto rien die aktu ellen Verh altni sse in der Strecke widerspiegelt . Somit wird diese Stellgrolle das Syst em exakt in den Zielpunkt iiberfiihren , und die stationa re Genauigkeit der Regelung ist gewahrleistet.
Abb. 5.11. Trajektorien in einem diskretisierten, begrenzten Zustandsraum
350
5. Einstellung und Optimierung von Fuzzy-Reglern
5.5 Fuzzy-RegIer und Fuzzy-Clustering Auf den ersten Blick scheinen Fuzzy-Regelung und Fuzzy-Clusteranalyse wenig Gemeinsamkeit en aufzuweisen. Bei der Clusteranalyse wird versucht , Cluster, d.h. Gruppierungen oder einzelne Anhaufungen von Dat en in einem Datensatz zu finden . Eines der einfachste n und elementarste n FuzzyClus teringverfahren sucht nach etwa kugelformigen Punktwolken (Clustern) in Datensatzen und reprasentiert jede einzelne Punktwolke durch einen ty pischen Vertreter, den (gewichteten) Schwerpunkt (Clusterzentrum) der jeweiligen Punktwolke. Fur die Datenpunkte werden Zugehori gkeitsgrade zu den einzelnen Clust ern berechnet . Dabei betragt der Zugehorigkeits grad eines Datums im Clusterzentrum eins und wird im Wesentlichen mit zun ehm endem Abstand zum Clusterzentrum kleiner. Betrachtet man Mamdani-Regler in dem Sinne, dass jede Regel einen uns charfen Punkt im Produkt raum aus Ein- und Ausgangsgrofen repr asentiert, so wird der Zusammenhang zur Fuzzy-Clusteranalyse deutlich: Ein e Regel charakte risiert einen typischen Punkt auf dem Graphen der Ubert ragungsfunktion und mit zun ehrnend em Abstand zu diesem Punkt wird der Erfullungs-y'Zugehorigkeitsgr ad zu der Regel geringer . Ein e Regel kann auf diese Weise als ein Cluster gedeutet werd en. Das Clu st erzentrum ist der durch die Regel charakte risierte Punkt auf dem Graphen der Ubertragungsfunktion, im FaIle von Dreiecksfunktionen in der Regel der Punkt, an dem aIle Dreiecksfunktionen den Wert Ein s annehmen. Hat man Daten tiber das Regelverh alten eines (menschlichen) Reglers gesammelt, biet et die Fuzzy-Clusteranalyse eine Moglichkeit , aus diesen Daten Fuzzy-Regeln zu erzeugen . Das Ergebn is einer Clusteranalyse muss nur unter Verwendung der eben beschrieb enen Analogie zwischen Fuzzy-Clustern und Fuzzy-Regeln in eine Regelbasis umgewandelt werden. Dab ei erzeugt jedes Cluster eine Regel. Bevor wir auf dieses Verfahren genauer eingehen , sollen zunachst einige grundlegende Verfahren der Fuzzy-Clusteranalyse vorgest ellt werden. Wir fuhren diese Verfahren hier nur insoweit ein, wie sie fur das elementar e Verst andnis in Verbindung mit Fuzzy-Reglern notwendi g sind. Ein e det aillier te Darstellung verschiedener Fuzzy-Clustering-Verfahren sowie weit erfiihrende Techniken zur Regelerzeugung mittels Fuzzy-Clusteranalyse finden sich in [60, 61]. 5.5 .1 Fuzzy-Clusteranalyse Bei der Fuzzy-Clusteranalyse ist ein Datensatz X = {x., . . . ,Xk } ~ IRP aus k jeweils p-dimensional en Dat entupeln jVektoren gegebe n, der in eine vorh er festgelegt e Anzahl evan Clust ern eingeteilt werd en solI. Wie die Anzahl c der Clust er automatisch bestimmt wird, werd en wir sparer noch sehen. J edes der c Cluster wird durch einen Satz von Param et ern , dem Clusterprototyp w. , gekennz eichnet. 1m einfachste n Fall konn te W i da s jeweilige Clust erzentrum sein , d .h. W i E lie. Neb en den Clusterp ar amet ern W i solI au13erdem ftir jedes
5.5 Fuzzy-Regier und Fuzzy-Clustering
351
Datum Xj zu jedem Cluster Wi ein ZugehOrigkeitsgrad U ij E [0,1] berechnet werden. Die Clusterpar ameter W i und die ZugehOrigkeitsgrad e U i j sollten so bestimmt werden, dass die Dat en moglichst nah an dem Cluster liegen, dem sie zugeordnet sind. Formal soil dies dur ch die Minimierung der folgenden Zielfunktion erreicht werden: e
k
LL
F (U ,W;X)
U iJd(W i ,Xj)
(5.71)
i= 1 j = 1
Dab ei ist U = (U i j) die Matrix aus den ZugehOrigkeitsgraden und W (WI , . . . , W e ) die Matrix der Clusterprototypen. d(W i , X j) ist der noch nah er zu definierende Abstand des Datums X j zum Cluste r W i. In der Zielfunktion F werden die mit den ZugehOrigkeitsgraden gewichteten Abstande der Dat en zu den Clustern aufsummiert. Auf die Bedeutung des vorher zu wahlenden Param eters m werden wir spater eingehen. Soil die Funktion F ohne weitere Einschrankungen minimiert werden, so ist die Losung offensichtlich : Man wahle einfach Uij = 0 fiir aile i = 1, . .. , C, j = 1, . .. , k, d.h. , kein Datum wird irgend einem Clust er zugeordne t. Urn diese trivi ale, abe r unerwiinschte Losung auszuschlieBen, wird die Nebenbcdingung
(j =I , .. . , k )
(5.72)
eingefuhrt . Diese Nebenbedingung verlangt , dass jedes Datum Xj mit einem Gesamtzugehor igkeit sgrad von Eins zugeordnet werden muss. Dieser Gesamtzugehorigkeitsgrad kann aber auf die einzelnen Cluste r aufgeteilt werden. Die Nebenbedingung (5.72) erlaubt es, die Zugehorigkeitsgrade auch als Wahrscheinlichkeite n zu interpretieren, weshalb man auch von probabilistischer Clust eranalyse spricht . Der einfachste Fuzzy-Clustering-Algorithmus auf dieser Grundlage ist der Fuzzy-c-Means-Algorithmus (FCM) . Beim FCM soilen die Prototypen die Clusterzent ren repr asenti eren, d.h. W i E lRP . Als Abst andsmaf
wird der quadratische euklidische Abst and verwendet. Fur die Zielfunktion (5.71) unter der Nebenbedingung (5.72) ergeben sich dann die folgenden notwendigen Bedingungen fur das Vorhand ensein eines Minimums: k
L uik' Xj Wi
=
j=1 =----:-k---
LU;'k j= 1
(5.73)
352
5. Einstellung und Optimierung von Fuzzy-Reglern 1 Uij
=
c
L
(d (Wi , Xj )) f=1 d(Wf ,Xj )
1
(5.74)
m -l
War en die Zugehi::irigkeitsgrade Uij scharf, d.h. Uij E {O, I} , dann entsprache in der Formel (5.73) W i genau dem Schwerpunkt der Vektoren, die dem i-te n Cluster zugeordnet sind: Im Zahler bewirken die Uij , dass nur die Daten aufaddiert werden, die dem Cluster zugeordnet sind, der Nenner ergibt genau die Anzahl der dem Cluste r zugeordnete n Daten. Bei Zugehi::irigkeitsgrad en U i j E [0, 1] ergibt sich ein mit den Zugehi::irigkeitsgraden gewichte ter Schwerpunkt . Die Formel (5.74) besagt , dass sich die Zugehi::irigkeitsgrade aus den relativen Distanzen der Dat en zu den Clustern ergeben. Damit erhalt man fur ein Datum den gri::iBten Zugehi::irigkeitsgrad fiir das Cluster , zu dem es den geringst en Abstand ha t . An dieser Formel lafit sich auch der Einfluss des Paramet ers m - Fuzzifier genannt - erklaren. Fiir m --t 00 folgt U i j --t ~' d.h ., jedes Datum wird jedem Cluster mit (nahezu) demselben Zugehi::irigkeitsgrad zugeordnet . Fiir m --t 1 gehen die Zugehi::irigkeitsgrade gegen die (scharfen) Werte 0 oder 1. Je kleiner m (mit m > 1) gewahlt wird , desto "weniger fuzzy" wird die Clustereinteilung . In vielen Fallen wird m = 2 gesetzt. Leider fiihrt die Minimierung der Zielfunktion (5.71) auf ein nichtlinear es P roblem. In den beiden Gleichungen (5.73) und (5.74) treten auf der rechte n Seite jeweils noch zu optimie rende Paramet er auf: Bei den Prototypen W i die Zugehi::irigkeit sgrade Uij und umgekehrt . Aus diesem Grund wendet man die St rategie der alte rnierenden Opt imieru ng an. Zu Beginn werden die Clusterzentren W i zufallig gewahl t und mit diesen Wert en die Zugehi::irigkeitsgrade U i k mit Hilfe der Formel (5.74) berechnet . Danach halt ma n die Zugehi::irigkeitsgrad e fest und bestimmt die Cluste rzent ren mittels Gleichung (5.73). Mit den neuen Clusterzentren werden so wiederum die neuen Zugehi::irigkeitsgrade berechnet und dieses altern ierende Schema wird bis zur Konvergenz fortgesetzt, d .h., bis die Anderung der Prototypen oder der Zugehi::irigkeitsgrad e eine vorgegebene kleine Schranke unterschreit et . Bei diesem Verfahren ist noch ein Sonderfall bei der Anwendung der Formel (5.74) zu betrachten. Ist der Abst and eines Datums zu einem der Cluster null, so wird der Nenner in der Formel (5.74) ebenfalls null. In diesem Fall sollte der Zugehi::irigkeitsgrad des Datums zu dem Clust er mit Abstand null auf eins, der Zugehi::irigkeitsgrad zu allen anderen Clustern auf null geset zt werden. Sollte die Dist anz eines Datums zu mehreren Cluste rn null sein, was beim FCM den pathologischen Fall bedeut en wiirde, dass zwei Clusterzentren zusa mmenfallen, so werden die Zugehi::irigkeits grade des Datums gleichmafiig auf die Cluste r mit Abstand null aufgeteilt . Neben dem FCM werden noch einige weitere Fuzzy-Clustering-Verfahren fiir die Erzeugung von Fuzzy-Reglern aus Dat en eingesetzt. An dieser Stelle soil exemplarisch nur noch eine weite re Technik und eine Mischform mit dem
5.5 Fuzzy-Regier und Fuzzy-Clustering
353
FCM vorgestellt werden. Weitere Fuzzy-Clustering-Verfahren und ihr Bezug zu Fuzzy-Reglern sind in [60, 61] zusammengefaBt . Wir betracht en eine fur unsere Zwecke etwas vereinfachte Variant e des Fuzzy-c-Variet ies-Algorithmus (FCV) [15, 17]. Bei diesem Algorithmus werden nicht wie beim FCM haufenformig e Cluster gesucht, sondern Cluste r in Form von Hyperebenen , d.h ., bei zweidimensionalen Dat en Cluster in Form von Geraden, bei dreidimensionalen Dat en in Form von Eb enen. Auf diese Weise kann ein Dat ensatz lokal dur ch lineare Beschreibun gen angenahert werden , die sich fur die Verwendung von TSK-Modellen eignen. Der FCV basiert auf derselben Zielfunktion (5.71) wie der FCM , wobei die Dist anzfunktion modifiziert wird . Allerd ings wird ein Clust er beim FCV durch cine Hyperebene beschrieben, d.h . durch einen Ortsvektor V i und einen norm alisierten Normalenvekto r e., der senkrecht auf der dem Cluster zugeordneten (Hyp er-)Ebene steht . Ais Distanz wird in der Formel (5.71) der quadr ati sche Abst and des Datums zu der dem Cluster zugeordneten Hyperebene verwendet : (5.75) Dab ei ist (Xj - v.) T e i das Skalarprodukt der Vektoren (x , - V i) und e. . Die ZugehOrigkeitsgrade werden beim FCV nach derselben Formel (5.74) wie beim FCM berechne t , wobei die Distanzfunktion (5.75) zu verwenden ist . Die Ortsvektoren beim FCV werden genauso wie die Clusterzentren (5.73) beim FCM bestimmt. Der Normalenvektor e, eines Clusters ist der normalisierte Eigenvektor der Matrix k
'"' · - v '·)(xJ· - v ,·)T Z:: u~(x 'J J
Ci
j =l k
Luij j=l
zum kleinsten Eigenwert. Ein Nachteil des FCV besteht dari n, dass die Geradencluster (oder allgemeiner : die Hyperebenencluster) unendli che Ausdehnung hab en. Aus diesem Grund kann ein Cluster zwei Ceradenstiicke abdecken, zwischen denen eine Lucke liegt , sofern die beiden Cluster annaher nd auf einer Geraden liegen. Deswegen wird an Stelle des reinen FCV eine Kombin ation mit dem FCM bevorzugt , bei der die Distanzfunktion eine Konvexkombin ation aus der FCVund der FCM-Distanz ist:
Fur Q = 0 ergibt sich der FCM , fur ex = 1 der FCV . Die mod ifiziert e Distanzfunktion wirkt sich dir ekt nur bei der Berechnun g der ZugehOrigkeitsgrade U i j aus . Man spricht bei der Verwendung dieser Distanzfunktion auch von
354
5. Einstellung und Optimierung von Fuzzy-Reglern
Elliptotype-Clusterin g, da die Cluster - je nach Wahl des P arameters 0: eher die Form langgestreckter Ellipsen hab en [15]. Das prob abilistische Clustern mit der Nebenbedingung (5.72) hat den Nacht eil, dass die ZugehOrigkeitsgrad e allein aufgrund der relat iven Dist anzen berechnet werden. Das hat zur Folge, das die ZugehOrigkeitsfunktionen zu den Clustern zum Teil unerwiins chte Eigenschaften aufweisen. Im Clusterzentrum ist der Zugehi.irigkeit sgrad eins und mit steigendem Abst and fallt der Zugehi.irigkeitsgrad zunachst aboTrotzd em kann der Zugehi.irigkeitsgrad spa ter wieder anste igen. Beispielsweise ergibt sich fur Ausreisserdat en, die sehr weit von allen Clustern ent fernt sind , ein Zugehi.irigkeitsgrad von ca. l i e zu allen Clustern . Das Noise-Clustern [34] vermeidet diesen Effekt indem zwar die probabilist ische Nebenbedingung (5.72) beibehalt en wird , ab er ein zusatz liches Rausch(Noise)-Cluster eingefiihrt wird , dem die Ausreisserdaten mit hohem Zugehi.irigkeitsgrad zugeordnet werden sollen. AIle Dat en hab en eine vorher festgelegt e und im Verlauf der Clust eran alyse unverand erte (groBe) Dist anz zum Rausch-Cluster. Auf diese Weise erhalte n Dat en, die sehr weit von allen and eren Clustern ent fernt liegen , einen hohen Zugehi.irigkeits grad zum Rau sch-Clust er. Das possibilisti sche Clustern [96J laBt die probabilistische Nebenbedingung ganzlich fallen und fiihrt zusat zlich einen Term in die Zielfunktion ein, der Zugehi.irigkeitsgrade nahe Null bestraft. Nachteil des possibilistischen Clust ern ist , dass jedes Cluster unabh angig von den anderen berechnet wird , so dass eine gut e Initialisierung (z.B, mit dem Ergebnis einer prob abilist ischen Clusteranalyse) erforderlich ist . Bisher sind wir davon ausgegangen, dass die Anzahl e der Cluster bei der Clust eranalyse vorher festgelegt wird. SolI die Anzahl der Clust er aut omatisch bestimmt werden , gibt es zwei prinzipelle Ansatze: 1. Man verwendet ein globales Giit emaB, das das Gesamtergebnis der Clustera na lyse bewertet . Eines von vielen solcher Giit emaBe ist die Separat ion [197J c
k
L L U~']d(Wi 5
X j)
i= l j =l C·
min{11 i#-t
Vi -
vt} 11 2 }
,
die den mittleren Abst and der Daten zu den ihnen zugeordnet en Clustern im Verh altnis zum kleinsten Abstand zweier Clust erzentren betrachtet . Umso kleiner der Wert von 5 , desto besser ist die Clustereinteilung. Man beginnt die Clust eranalyse mit zwei Clust ern bis hin zu einer Maximalzahl von gewiinschte n Clustern und bestimmt jeweils den Wert 5 . Man wahlt am Ende die Clust eranzahl und -eint eilung, fur die 5 den kleinsten Wert ergeben hat .
5.5 Fuzzy-Hegler und Fuzzy-Clustering
355
2. Bei der Verwendung von lokalen GiitemaBen beginnt man mit einer eher zu groBen Anzahl von Clustern und wendet das Compatible Cluster Merging (CCM) an [95]. Sehr kleine Cluster werden geloscht , Cluster, die sehr nahe beieinander liegen, verschmolzen, was zu einer verringerten Anzahl der Cluster fuhrt . Die Clusteranalyse wird dann wiederum mit der verringerten Anzahl von Clustern durchgefUhrt. Dabei wird als Initialisierung das Ergebnis verwendet, das man aus dem Loschungs- und Verschmelzungsprozess erhalten hat. Einen genaueren Uberblick tiber weitere GiitemaBe und ihre Verwendung bei der Bestimmung der Clusteranzahl gibt [60,61].
5.5.2 Erzeugung von Mamdani-Reglern Eine einfache Moglichkeit, aus gemessenen Daten mittels Fuzzy-Clusteranalyse einen Mamdani-Hegler zu generieren, besteht darin, den gesamten Datensatz mit dem FCM zu clustern und jedes Cluster als eine Regel zu int erpretieren. Dazu werden die Cluster auf die einzelnen Eingangsgroben und die Ausgangsgrofie projiziert und anschlieBend durch geeignete Fuzzy-Mengen (z.B . Dreiecks- oder Trapezfunktionen) angenahert. Abb. 5.12 zeigt eine typische Projektion eines Fuzzy-Clusters auf die Variable x . Dazu wird die x-Koordinate jedes Datums auf der x-Achse aufgetragen. Die Hohe der einzelnen Striche gibt den jeweiligen ZugehOrigkeitsgrad des entsprechenden Datums zum betrachteten Cluster an. Die Approximation einer solchen diskreten Fuzzy-Menge mittels einer Dreiecks- oder Trapezfunktion erfolgt tiblicherweise durch ein heuristisches Optimierungsverfahren. Dazu werden Daten mit kleinen Zugehorigkeiten gar nicht betrachtet und ftir die restlichen zum Beispiel die Summe der quadratischen Fehler der Zugehorigkeitsgrade minimiert. Ein mogliches iteratives Verfahren wird in [177] beschrieben. Die durch Approximation der Clusterprojektionen erhalte nen Fuzzy-Mengen erfullen im allgemeinen nicht die Voraussetzungen, die man iiblicherweise an die Fuzzy-Partitionen stellt. Die Fuzzy-Mengen konnen zum Beispiel sehr unterschiedliche Uberlappungsgrade aufweisen. In der Regel werden daher projizierte Fuzzy-Mengen, die sich sehr ahnlich sind, durch eine Fuzzy-Menge ersetzt. AuBerdem nimmt man durch das Projizieren und die Approximation einen Informationsverlust in Kauf. Die Fuzzy-Regeln, die sich aus einer FuzzyClusteranalyse ergeben, werden daher haufig verwendet , urn einen Uberblick tiber mogliche sinnvolle Regeln zu erhalten oder zur Initialisierung beispielsweise eines Neuro Fuzzy-Systems [134] (siehe hierzu auch Abschnitt 5.6). Alternativ werden zum Teil auch nur die Eingangsgrofen oder die Ausgangsgrofe [177] separat geclustert, urn geeignete Fuzzy-Mengen zu erhalten.
5.5.3 Erzeugung von TSK-Modellen Das Elliptotype-Clustering eignet sich zur Bestimmung eines TSK-Modells aus Daten. Wie schon bei den Mamdani-Reglern induziert jedes Cluster eine
356
5. Einstellung und Optimierung von Fuzzy-Reglern
r / /
/ / / /
I I I /
I
/
' -, ,
,
,
-,
,, , , '
'
Abb. 5.12. Projektion eines Fuzzy-Clusters und Approximation mit einer Drei-
ecksfunktion Regel. Ebenso werden wie bei den Mamdani-Reglern mittels Projektionen geeignete Fuzzy-Mengen fur die Eingangsgr6Ben bereehnet. Fur die Funktionen in den Konklusionsteilen der Regeln werden Funktionen der Form
verwendet, die den Geraden, Ebenen bzw. Hyperebenen entspreehen, die den jeweiligen Clustern zugeordnet sind. Dazu muss die bei der Clusteranalyse dureh Orts- und Normalenvektor besehriebene Gerade oder (Hyper- )Ebene nur entspreehend als Funktion in den Eingangsgr6Ben ausgedriickt werden.
5.6 Neuro Fuzzy-Regelung Als vielverspreehender Ansatz zur Optimierung einer bekannten Regelbasis oder aueh zum vollstiindigen Erlernen eines Fuzzy-Systems haben sieh Ansiitze erwiesen, die dureh die Kopplung von Fuzzy-Systemen mit Lernverfahren kilnstlicher Neuronaler Netze motiviert sind . Diese Methoden werden im Allgemeinen unter dem Begriff Neuronale Fuzzy-Systeme oder Neuro Fuzzy-Systems zusammengefasst. Mittlerweile gibt es eine Vielzahl von spezialisierten Modellen . Neben Modellen fur regelungsteehnisehe Anwendungen wurden insbesondere Systeme zur Klassifikation und allgemeinere Madelle zur Funktionsapproximation entwiekelt. Eine ausflihrliehe Einflihrung in dieses Gebiet findet sich z.B. in [HO, 135]. Ein Uberbliek tiber aktuelle Anwendungen kann z.B. [21, 213] entnommen werden. Wir werden uns in diesem Absehnitt auf eine Einflihrung in die Methodik beschranken und einige ausgewiihlte Ansiitze diskutieren. Des Weiteren geben wir im Folgenden eine kurze Einflihrung in die Grundprinzipien Neuronaler Netze insoweit sie fur die naehfolgend diskutierten regelungsteehnisehen Modelle notwendig sind. Eine ausfiihrliche Einflihrung in die Grundlagen kunstlieher Neuronaler Netze wird z.B. in [23, 162, 210] gegeben .
5.6 Neuro Fuzzy-Regelung
357
5.6.1 Neuronale Netze Die Motivation zur Entwicklung kiinstlicher Neuronaler Netze entsprang der Erforschung der biologischen Nervenzellen. Diese sind trotz ihrer im Vergleich zu Mikroprozessoren langsamen Schaltzeiten in der Lage durch massive und hierarchische Vernetzung und die damit erzielte hochgradige Parallelitat komplexe Aufgaben effizient zu losen, Ein Neuronales Netz entsteht hierbei aus der Zusammenschaltung mehrerer Neuronen (Nervcnzellen bzw. Verarbeitungscinhciten) zu cinem komplexen Netzwerk. Die einzelnen Neuroncn iibernehmen hierbei die Funktion cinfacher Automatcn oder Prozessoren, die aus ihrer aktuellen Eingabe und ihrem Zustand (Aktivicrung) ihren neuen Zustand und ihre Ausgabe berechnen. Bci kiinstlichcn Neuronalen Netzen versucht man dieses Verhalten durch eine Menge von Abbildungen nachzubilden . Wahrend die Verschaltung biologischer Neuronaler Netze sehr komplex sein kann, beschrankt man sich bci der Betrachtung kiinstlicher Neuronaler Netze meist auf Netzwerke mit einem hierarchischen Aufbau. Hierbei werden die Ncuroncn in Schicht en zusammengefasst. Die Neuronen einer Schichten konnen nur von Neuroncn benachbarter Schichten beeinflusst werden, d .h. die Neuronen einer Schicht sind untereinander nicht verbunden. Die auferen beiden Schichten dienen zur Kommunikation des Netzes mit seiner Umgebung und werden als Ein- und Ausgabeschicht bezeichn et (siehe auch Abb . 5.13) . Ein Netz dieser Struktur wird auch als vorwartsbetriebenes (feed-forward) Netz bezeichnet. Lasst man auch Riickkopplungen zwischen den Schichten bzw. einzelnen Neuronen zu, so spricht man von einem riickgekoppelten oder auch rekurrentem (recurrent) Netz.
Ausgabeschicht
innere Schicht
Eingabeschicht
Abb. 5.13. Ein zweischichtiges Neuronales Netz bestehend aus zwei Eingangsneu-
ronen, fiinf inneren Neuronen und einem Ausgabeneuron Die meisten Modelle kiinstlicher Ncuronaler Netz e lassen sich durch folgende allgemeine Definition beschreiben (nach [135]).
Definition 5.1 Ein Neuronales Netz ist ein Tupel (U, W, A , 0 , NET) , wobei gilt: 1. U ist eine endliche Menge von Verarbeitungseinheiten (N euronen},
358
5. Einstellung und Optimierung von Fuzzy-Reglern
2. W , die Ne izuierkst ruk iur, ist eine Mat rix die die Abbildung vom kortesischen Produki U x U in R definiert , 3. A ist eine Abbildung, die jedem u E U eine Aktivierungsfunktion A u : lR3 -7 lR zuordne t, 4. 0 ist eine Abbildung, die j edem u E U eine Ausgab efunktion O« : lR -7 JR zuordne t und 5. NET ist eine Abbildung, die j edem u E U eine Netzeingabcfunktion NET u : (R x lR)U -7 R zuordnei.
Die Bestimmung der Ausgab e des Netzes erfolgt in einem vorwartsbetriebenen , schichtweise aufgebauten Net z dur ch aufeinander folgende Berechnun g der Ausgaben von der untersten zur obersten Schicht . Dieser Vorgang wird auch als Propagation bezeichnet . Bei der Propagation berechnet jedes Neuron U i basierend auf den Ausgaben der vorhergehenden Schicht seine eigene Aktivierung und Ausgab e. Hierzu wird zunachst aus den anliegenden Eingaben OJ (dies sind die Ausgaben der vorherigen Schicht oder die Eingaben in das Netz) mit der Netzeingabefunktion NET ; die Netzein gabe
(5.76) berechnet . In den meist en Netzmodellen wird mit t els der Netzgewicht e Wj; die gewichtete Summe tiber die Eingabewerte des Neurons U; gebildet , d .h. net;
=L
Wj; . OJ'
(5.77)
j
Mittels der Aktivierungsfunktion A ; wird anschlieBend die aktuelle Aktivi erun g a; berechnet : ) (5.78) ai -_ Ai ( net. , a;(alt ) ,e;, wobei a~alt) der bisherige Zust and des Neurons und ei eine ext erne Eingabe ist . Die externe Eingab e wird im allgemeinen nur bei den Eing abeeinheiten in der Eingabeschicht verwendet . Eb enso wird die alte Aktivi erung a~alt) in (vorwiirtsb etriebenen) Netzmodellen meist nicht verwendet . Somit vereinfacht sich die Berechnun g der Aktivierun g zu a; = A;(net;). Als Aktivierungsfunktion werden hierb ei meist sigmoide Funktionen verwendet (siehe auch Abb . 5.14): 1
a· -1t +eX' Die Berechnun g der Ausgabe
0;
(5.79)
erfolgt schlieBlichdurch die Ausgab efunktion
Oi' Diese kann zur Skalierung der Ausgab e verwendet werd en, wird aber in den meist en Netzmodellen durch die Identitat realisiert , d.h.
(5.80)
5.6 Neuro Fuzzy-Regelung
359
o Abb. 5.14. Eine sigmoide Aktivierungsfunktion
Eine schematische Darstellung der Arbeitsweise eines Neurons wird in Abb . 5.15 gegeben. Das wohl bekannteste Netzmodell ist das Multilayer-Perzeptron. Ein Netz dieses Typs besteht aus beliebig vielen Neuronen, die analog Abb . 5.13 in Form eines gerichteten Graphen bestehend aus einer Eingabeschicht, einer Ausgabeschicht und beliebig vielen verdeckten Schicht en angeordnet werden konnen, Hierbei sind keine Riickkopplungen zwischen den Neuronen erlaubt, d.h. die Ausgabe des Netzes kann basierend auf den aktuellen Eingaben durch einmalige Propagation von der Eing abe- zur Ausgabeschicht berechnet werden. Die Eingabeschicht reicht bei diesem Modell die Eingaben an die folgende - die erste verd eckt e Schicht - weiter, ohne eine Transformation der Eing ab ewerte durchzufiihren, d.h. die Aktivierungsfunktion wird durch die Identitat ersetzt . Hierdurch ist es moglich eine Eingabe an mehrere Neuronen weiterzuleiten. Fur das Multilayer-Perzeptron wurde gezeigt , dass es ein universelle r Approximator ist , d.h . es kann prinzipiell jede st etige Funktion beliebig gut approximiert werden (siehe z.B. [47, 62]). Das Lern en in einem Neuronalen Netz erfolgt durch Veranderung der Net zgewichte . Das Ziel des Lernvorgangs ist es das Netz so zu trainieren, dass es auf best immte Netz eingab en mit einer bestimmten Ausgabe reagiert. Auf diese Weise ist es dann au ch in der Lage auf neue unbekannte Eingab en,
Abb. 5.15. Schematisches Darstellung eines Neurons
360
5. Einstellung und Optimierung von Fuzzy-Reglern
d .h. Eingaben die nicht zum Training des Netzes verwendet wurden , mit einer geeigneten Ausgabe zu antworte n (Genera lisierungsfiihigkeit) . Die existierenden Lernverfahren lassen sich in iiberwacht e und nicht-Iiberwachte Lernverfahren unt erscheiden. Bei den nicht-Iiberwachten Lernverfahren sind lediglich die Eingaben in das Netz bekannt. Nach Abschluss des Lernvorgangs soll das Netz ahnllche Eingaben auf ahnliche Ausgaben abbilden. Hierb ei werden meist Verfahren zum Wettbewerbslernen eingesetzt. Ein bekan ntes Netzmodell das ein solches Verfahren einsetzt sind die selbstorgan isierenden Kar ten , auch nach ihrem Entwickler Kohonen-Net ze genannt
[92]. Bei den iiberwachten Lern aufgaben sind sowohl die Eingab en in das Netz, als auch die zugehorigen Ausgaben bekannt . Das Prinzip der zugehOrigen Lernverfahr en basiert darauf, zunachst eine Eingab e dur ch das Net z zu propagieren , und diese dann mit der gewiinschte n Ausgabe zu vergleichen. AnschlieBend werden die Gewichte und Schwellenwerte so veriindert, dass das Netz bei nochmaliger Eingab e des selben Musters der gewiinschte n Ausgabe naher kommt . Dieser Prozess wird mit den veriigbaren Trai ningsdate n so lange wiederholt , bis das Netz eine gewiinschte Genauigkeit erre icht hat . Das wohl bekannt est e Lernverfahr en das dieses Prinzip verwendet ist das Backpropagation Verfahren fur das Multilayer-Perzept ron [165]. Die Grund idee des Verfahrens besteht in einer iterativen Verkleinerung des Ausgabefeh lers entlang der Gradienten einer Fehlerfunktion. Der Ausgabe fehler E wird hierbei nach jeder Pro pagation basierend auf den Fehlern an den einzelnen Ausgabeeinheiten Ai berechnet:
E= L(Pi-
Oi)2,
(5.81)
A;
wobei Pi die gewiinschte Ausgab e und 0i die t atsachliche Ausgab e der Einheit Ai beschreibt . Nach jedem Lernschrit t werden die Netzgewichte dann prop ortional zu den negati ven Fehlergradienten verandert , d.h.
BE
-1wu v ex - -,:::.-- .
(5.82)
UW u v
Eine ausftihrliche Beschreibun g des Verfahrens sowie diverser Variant en, die die Konvergenz des Verfah rens beschleunigen sollen (wie z.B. Quickprop [39] und resilient backpropagation (RP ROP) [160]), kann den zu Beginn des Kapit els genannte n Biichern entnommen werden. Das Gru ndprinzip dieses Lernverfahrens wird auch in den im Folgenden vorgeste llte n Neuro FuzzyModellen eingeset zt . Regelungstechnische Anwendungen. Neurona le Netze konnen sowohl als Regier als auch zur Modellierung bzw. Identifikation der Strecke eingesetzt werden. Gru ndlegende Voraussetzungen hierfiir sind, dass geniigend Date n vorhanden sind die zum Trai nieren des Netzes verwendet werden konnen.
5.6 Neuro Fuzzy-Regelung
361
Weiterhin miissen diese Daten auch den gesamten Zustandsraum der Strecke abdecken. Falls Paare (x(k), u(k)) von Messgrofen (im Allgemeinen die Ausgangsund Zustandsgrofen der Strecke oder die von einem bestehenden Regier verwendeten Eingangsgrofen) x(k) = [xI(k) , ...,xn(k)]T und zugehOrigen Stellgrofen u(k) = [uI(k), ...,um(k)]T bekannt sind, kann ein Neuronales Netz, z.B. ein Multilayer-Perzeptron, direkt mit diesen Werten trainiert werden. Das verwendete Netz muss in diesem Fall aus n Eingabeneuronen und m Ausgabeneuronen bestehen. Die Wertepaare konnen z.B. durch Messungen an einem bestehenden Regier - wobei das Netz in diesem Falliediglich den Regier ersetzen wiirde - oder durch Protokollierung der Stellgrofen eines menschlichen Bedieners ermittelt werden. Das Neuronale Netz sollte nach dem Training aufgrund seiner Generalisierungeigenschaft in der Lage sein auch fur Zwischenwerte die nicht in den Trainingsdaten enthalten waren geeignete Stellgrofien zu ermitteln. Ebenso kann ein Neuronales Netz auch zur Modellierung der Strecke (auch invers) verwendet werden. Dazu miissen ausreichend viele Zustandsvektoren x(k) = [xI(k), ...,xn(k)]T und Ausgangsgrofen y(k) = [YI(k), ...,Yn,(k)]T der Strecke sowie die zugehorigen Stellgrofen u(k) = [UI (k) , ..., Urn (k)]T bekannt sein . Basierend auf diesen Werten kann dann ein Neuronales Netz zur Modellierung der Strecke entworfen werden. Hierbei werden die Vektoren x(k) und u(k) als Eingangsgrofien und y(k + 1) als Ausgangsgrofien zum Training des Netzes verwendet. Ein inverses Streckenmodell erhalt man durch einfaches Vertauschen der Ein- und Ausgangsgrofien, Zu beachten ist hierbei, dass vorwiirtsbetriebende Neuronale Netze ein statisches Ein- / Ausgabeverhalten haben, da sie lediglich eine Abbildung von den Eingabewerten auf die Ausgabewerte durchfiihren. Somit miissen die fur das Trainieren des Netzes gewahlten Eingangsgrofen des Netzes eindeutig die Abbildung auf die Ausgangsgrofen beschreiben. Ein vorwiirtsbetriebenes Netz ist nicht in der Lage ein dynamisches Verhalten zu Lernen. Detaillierte Diskussionen zu regelungstechnischen Anwendungen Neuronaler Netze finden sich z.B. in [110, 123, 159].
5.6.2 Kombination Neuronaler Netze und Fuzzy-Hegler Die Kombination von Neuronalen Netzen und Fuzzy-Systemen in sogenannten Neuro Fuzzy-Systemen soli die Vorteile beider Strukturen vereinen. Von den Fuzzy-Reglern soll im wesentlichen die Moglichkeit zur Interpretation des Reglers und des Einbringens von Vorwissen iibernommen werden. Neuronale Netze sollen die Lernfahigkeit und somit die Moglichkeit zur automatischen Optimierung oder auch der automatischen Generierung des gesamten Reglers beitragen. Durch die Moglichkeit a priori Wissen in Form von Fuzzy-Regeln in das System einbringen zu konnen, erhofft man die Zeit und die Anzahl an Thainingsdaten die zum Training des Systems benotigt wird im Vergleich zu reinen
362
5. Einstellung und Optimierung von Fuzzy-Reglern
Neuronalen Reglern deutlich zu reduzieren. Falls nur sehr wenig Traingsdaten vorhand en sind , kann das Einbringen von Vorwissen unt er Umstanden sogar notwendig sein, urn einen Regier iiberhaupt erstellen zu konnen , Weiterhin hat man mit Neuro Fuzzy-Syst emen prinzipiell die Moglichkeit einen Regier zu erlernen und dessen Regelstrat egie anschlieBend dur ch Analyse dcr gelernten Fuzzy-Regeln und Fuzzy-Mengen zu interpretieren und ggf. manuell - auch im Hinblick auf die im vorherigen Kapitel diskutiert en St abilit atskriterien - zu iiberarb eiten, 1m wesentlichen werden bei den Neuronalen Fuzzy-Reglern kooperative und hybride Modelle unt erschieden. Bei den kooperativcn Modellen arbeiten das Neuronale Netz und der Fuzzy-RegIer gctrennt. Das Neuron ale Net z dient hierbei dazu, einige Paramet er des Fuzzy-Reglers (offline) zu erzeugen oder (online) wahrend des Einsatz cs zu optimieren (siehe z.B. [93, 141, 153]). Hybride Modelle versuchen , die Strukturen Ncuronaler Netzc und Fuzzy-Hegler zu vereinigen. Ein Fuzzy-RegIer kann somit als Neuronales Netz interprctiert oder sogar mittels eines Neuronalen Netzes implem cntiert werden. Hybridc Modelle hab en den Vorteil einer einheit lichen Struktur, die keine Kommunikation zwischen den beid cn unt erschiedlichen Modellen erfordcrt . Somit ist das Syst em prinzipiell in der Lage sowohl online als auch offline zu Lernen. Diese Ansatze haben sich mit tlerweile gegeniiber den kooperati ven Modellen dur chgcsetzt (siehe z.B. [9, 55, 72, 136, 189]). Die Grundgedanke der hybriden Verfahren besteht darin , die FuzzyMengen und Fuzzy-Regeln in eine Neuronale Struktur abzubilden. Dieses Prinzip soll im Folgenden verdeutlicht werden. Betrachten wir hierzu die Fuzzy-Regeln R; eines Mamd ani-R eglers
Ri
:
If X l is It~l ) and
and
Xn
is It~ n) (5.83)
th en y is Iti , bzw.
R; eines TSK-Reglers R'i
:
If
. X l IS
Iti( 1) an d
then Y = f i( XI ,
an d z.. X n iIS Iti(n)
,xn ) .
(5.84)
Die Aktivierung iii dieser Regeln kann wie in Abschnitt 3.1 bzw. 3.2 beschrieben durch eine t-Norm berechnet werden. Bei gegebenen Eingabewerten X l, ... , X n erhalt en wir fur iii mit der t-Norm min somit: (5.85) Eine Moglichkeit eine solche Regel mit Hilfe eines Neuronalen Netzes darzustellen besteht darin , die reellwertigen Verbindungsgewichte Wji von einem Eingab eneuron U j zu einem inneren Neuron U i jeweils dur ch die Fuzzy-Menge It~j ) zu ersetzen. Das innere Neuron reprasentiert somit eine Regel und die Verbindung von den Eingab einheiten reprasentieren die Fuzzy-Mengen in den
5.6 Neuro Fuzzy-Regelung
363
Pramissen der Regeln. Urn mit dem inner en Neur on die Regelaktivi erung berechnen zu konn en miissen wir lediglich seine Netze ingabefunkt ion rnadifizieren. Wahlen wir z.B. als t-norm das Minimum, so definieren wir als Netze inga be (vgl. (5.76) und (5.77)) : . {Jli(1) (Xl) , .. . , Jli(n ) ( X n ) } . net ,. -_ NETJ.(X l , · · · , X n ) _- nun
(5.86)
Erset zen wir schlieBlich noch die Akti vierungsfunk tion des Neurons durch die Identitat , entspricht die Akti vierung des Neurons der Regelaktivierung in (5.85) und das Neuron kann somit unmittelbar zur Berechnun g der Regelaktivierung einer beliebigen Fuzzy-Regel verwend et werd en. Eine grafische Darstellung dieser Struktur fiir eine Regel mit zwei Eingab en ist in Abb. 5.16 (links) gegeben. Eine alternative Darstellungsmoglichkeit ergibt sich, wenn die FuzzyMengen der Pramisse als eigenst andige Neuronen modelliert werd en. Hierzu wird die Netzeingabefunktion durch die Identitat und die Aktivierungsfunkti on des Neurons durch die cha ra kte rist ische Funktion der Fuzzy-Menge erset zt. Das Neuron berechnet somit fur jede Eing abe den ZugehOrigkeitsgrad zu der durch die Akti vierungsfunk tion reprasentiert en Fuzzy-Menge. In dieser Darstellung benoti gt man zwei Neuronenschichte n urn die Pramisse eine Fuzzy-Regel zu modellieren (siehe Abb . 5.16 (rechts)) . Hierb ei ergibt sich der Vorteil, dass die Fuzzy-Mengen unm itt elbar in mehr eren Regeln verwende t werd en konn en, urn somit die Interpretierbarkeit der gesamte n Regelbasis sicherzuste llen. Die Netzgewichte W ij in den Verbindungen von den FuzzyMengen zum Regelneuron werd en in dieser Darst ellung mit 1 initialisiert und als konst ant bet rachtet. Die Gewichte von den Eingab ewerten zu den FuzzyMengen konn en zur Skalierung der Eingabegrofen verwendet werd en. Soli auch die Auswertung einer gesamten Regelbasis modelliert werd en, muss unterschieden worden, ob ein Mamd ani oder eine T SK-Regler verwendet wird. Fur den TSK-Regler sind verschiedene Realisierungen moglich. Prinzipiell wird aber fur jede Regel cine weitere Einheit zur Auswertung der Ausgabefunkt ion Ii - die dann als Netz eingabefunktion implementi ert wird angelegt und mit allen Ein gab eeinheiten ( Xl , . . . ,X n ) verbunden , Die Ausgaben dieser Einheiten werd en dann mit den von den Regelneuronen berechneten Regelaktivierungen ai in einem Ausgabeneuron U out zusammengefiihrt, welches schlieBlich mittels der Netzeingabefunktion die Ausgab e des TSKReglers berechnet (siehe auch 3.9) :
L i(ai . I i(xI , ... , x n ) ) L i ai
(5.87)
Die Verb indungsgewichte zwischen den angelegten Neur onen sind dabei wieder konstant 1 und als Aktivierungsfunk ti on wird die Identit at verwendet. Fur den Mamd an i-Regler hangt die konkr ete Implementierung von der gewahlte n t-Conorm und der Defuzzifizierungsmethode ab (siehe hierzu auch Abschnitt 3.1). In jedem Fall fasst abe r ein gemeinsames Ausgab eneuron die
364
5. Einstellung und Optimierung von Fuzzy-Reglern
Abb. 5.16. Beispiel eines Neuronales Netz zur Berechnung der Aktivierung einer Fuzzy-Regel (If XI is 11;1) and X2 is 1l;2)then ...): Modellierung der Fuzzy-Mengen als Gewichte (links) und als Aktivierungsfunktionen eines Neurons (rechts) Aktivierungen der einzelnen Regelneuronen zusammen und berechn et mittels einer modifizierten Netz eingab efunktion basi erend auf den jeweiligen FuzzyMengen in den Konklusionen der Regeln einen scharfen Ausgabewert. Die Ub erfiihrung einer Fuzzy-R egelbasis in eine Netz struktur lasst sich somit au ch in folgenden Vorschriften zusammenfassen: 1. Fur jede Ein gangs grofe Xi wird ein Neuron gleicher Bezeichnung in der Ein gab eschicht an gelegt. 2. Fur jede Fuzzy-Menge J.L~j) wird ein Neuron gleicher Bezeichnung angelegt und mit dem entsprechenden Ein gabeneuron Xi verbunden . 3. Fur jede Ausgabegrolle Yi wird ein Neuron gleicher Bezeichnung ang elegt . 4. Fiir jede Fuzzy-Regel R; wird ein inn eres (Regel-) Neuro n gleicher Bezeichnung angelegt und eine t-Norm zur Berechnung der Aktivierung festgelegt. 5. Jedes Regelneuron R; wird gemaf ihrer korr espondierend en Fuzzy-Regel mit den ent sprechenden Neuronen, die die Fuzzy-Mengen der Pramissen reprasentieren , verbunden. 6. Mamdani-Regler: J edes Regelneuron wird gemaf der Konklusion ihrer korr espondierenden Fuzzy-Regel mit dem Ausgab eneuron verbunden . Als Verbindungsgewicht ist jeweils die Fuzzy-Menge der Konklusion zu wahl en , Weit erhin ist eine t-Conorm und das Defuzzifizierungs-Verfahren in den Ausgabeneuronen geeignet zu int egrieren. TSK-Regler: Fur jede Regeleinheit wird ein weite res Neuron zur Berechnun g der Ausgab efunktion angelegt und mit dem ents prechenden Ausgabe neuron verbunden . Weit erhin werden aIle Ein gab eeinh eiten mit den Neuronen zur Berechnung der Ausgab efunktionen und aIle Regeln mit dem Ausgabeneuron verbunden.
5.6 Neuro Fuzzy-Regelung
365
Nach der Uberftihrung einer Regelbasis in die oben beschriebene Darstellung , konnen anschlieBend Lernverfahren Neuronaler Netze auf diese Struktur iibertragen werden. Die Lernverfahren miissen jedoch aufgrund der geanderten Netzeingabe- und Aktivierungsfunktionen, und da nicht mehr reellwertige Netzgewichte, sondern die Parameter der Fuzzy-M engen gelernt werden sollen, modifiziert werden. Mit der Abbildung auf eine Neuronale Netzstruktur ist man somit - insoweit geeignete Lerndaten verfUgbar sind - in der Lage die Parameter der Fuzzy-Mengen zu optimieren. Bestehen bleibt allerdings das Problem eine initiale Regelbasis aufstellen zu miissen, die dann in eine Netzwerkstruktur uberfiihrt werden kann. Diese muss entweder manuell erstellt werden oder es miissen andere Verfahren, z.B. die im vorherigen Abschnitt beschrieben Fuzzy-Clustering Verfahren, Heuristiken oder evolutionare Algorithmen (siehe Abschnitt 5.7), herangezogen werden. In den folgenden Abschnitten diskutieren wir zwei hybride Neuro FuzzySysteme, an hand derer wir die Prinzipien und Probleme von Neuro FuzzyArchitekturen insbesondere im Hinblick auf den Einsatz in regelungstechnischen Anwendungen naher erlautern.
5.6.3 Madelle mit iiberwachten Lernverfahren Neuro Fuzzy-Modelle mit iiberwachten Lernverfahren versuchen die FuzzyMengen und ~ ftir ein TSK-Modell - die Parameter der Ausgabefunktionen einer gegebenen Regelbasis mit Hilfe von bekannten Ein- und Ausgabegr6Ben zu optimieren. Die iiberwachten Modelle bieten sich sornit an , wenn z.B. bereits eine Beschreibung der Strecke mit Fuzzy-Regeln vorhanden ist, die Regelbasis aber noch nicht die gewiinschte Genauigkeit erreicht. Stehen Messdaten der zu approxirnierenden Strecke zur VerfUgung (Tupel von Zustands-, Ausgangsund Stellgr6Ben) so konnen diese zum nachtrainieren der Systems verwendet werden, Dies ist sowohl fiir das normale als auch das inverse Streckenmodell moglich . Der Vorteil gegeniiber dem Einsatz eines Neuronalen Netzes liegt darin, dass das Fuzzy-Modell bereits eine Approximation der Strecke beschreibt und somit das Training meist wesentlich schneller geht und auch weniger Daten ben6tigt werden, als es beim Training eines Neuronalen Netz es der Fall ist . Dieses muss die Ubertragungsfunktion der Strecke vollstandig aus den Daten lernen. Hierbei tritt immer das Problem auf, dass der Lernvorgang in einern lokalen Minimum enden kann , oder dass in Teilbereichen, z.B . weil fur diese nicht ausreichend oder sogar gar keine Messdaten vorhanden waren , nicht das wirkliche Streckenverhalten approximiert wird . Neuro Fuzzy-Modelle mit uberwachten Lernverfahren bieten sich auch dann an , wenn ein bestehender Regier durch einen Fuzzy-Regier ersetzt werden solI, d.h. ebenfalls Messdaten des Regelverhaltens des realen Reglers verfugbar sind. Auch hier wird eine bestehende Regelbasis vorausgesetzt. Die
366
5. Einstellung und Optimierung von Fuzzy-Reglern
Lernverfahr en konnen dann genutzt werden , urn die App roximati on des ursprunglichen Reglers zu verbessern. Ist keine initial e Fuzzy-Regelbasis vorhanden , die das zu approximierende Syst em, d.h . den Regier oder die Strecke, beschreibt und kann diese auch nicht nah erungsweise manu el! aufgeste llt werd en, bietet sich die Komb inati on mit denen im vorherigen Abschnitt beschriebenen Fuzzy-Clu st erin g Verfahren oder den im letzten Abschnit t beschriebenen evolut ionaren Algorit hmen an. Diese konnen genutzt werd en urn basierend auf den Messdat en eine initiale Fuzzy-Regelbasis zu erstellen. Im Foigend en diskutieren wir als typisches Beispiel fur ein Neuro FuzzySyst em mit iiberwachte m Lernen das ANFIS-Modell. Neben diesem gibt es eine Reihe weiterer Ansatze, die jedoch auf ahnlichen Prinzipien beruh en. Ein Uberbli ck tiber weitere Modell findet sich z.E . in [21 , 110, 135]. Das ANFIS-Modell. In [72] wurd e das Neuro Fuzzy-Syst em ANF IS I (Adaptiv-Network-b ased Fuzzy Inference System) vorgeste llt, das mittlerweiIe in einer Vielzahl von Entwicklungs- bzw. Simulationswerkzeugen int egriert wurd e. Das ANFIS-M odel! basiert auf einer hyb riden Struktur , d .h. es ist sowohl als Neuronales Netz als auch als Fuzzy-System interpreti erb ar. Das Modell verwendet die Fuzzy-Regeln eines TSK -Reglers (siehe auch Abschnitt 3.2). In Abb . 5.17 ist ein Beispiel eines Modells mit den dr ei Fuzzy-Regeln
RI R2 R3
:
If X l is A l and
X2
is B I then y =
!J( Xl , X2 )
:
If X l is Al and If Xl is A 2 and
X2
is B 2 t hen Y = is B 2 then y =
h (X I , X2 )
:
X2
!3 (X I,X2)
wobei AI, A 2 , B I und B 2 linguist ische Ausdrii cke sind, die den jeweiligen Fuzzy-Mengen in den Pramissen zugeordnet sind, dargestell t. Die Funktionen Ii in den Konklu sionen sind beim ANFIS-Modell durch eine Linearkombinat ion der Eingangsgrofien definiert , d.h . im obigen Beispiel mit zwei EingangsgroBen durch (5.88) I i = P i XI + Qi x 2 + rio
flY)
Die Struktur des Modells zur Berechnun g der Regelakt ivierung ents pricht der im vorherigen Abschnitt diskutierten (Schicht 1 und 2 in Abb . 5.17). Ais t- Norm zur Auswerung der Pramisse wird hier aber das Produkt verwend et , d.h. die Neuro nen der Schicht 2 berechnen die Akti vierung iii einer Regel i durch 1
In [72] wird das im Folgenden diskutierte TSK-Regler basierte Modell genauer als t ype-3 ANFIS bezeichnet. Die Autoren verwenden den Typ hierbei urn Regelbasen mit unterschiedlichen Konklusionen zu unterscheiden. Mit t ype-l werden Modelle mit monotonen Fuzzy-Mengen in den Konklusionen und mit type2 Mamdani-Regel basierte Modelle bezeichnet. Da die Autoren nur fur typ e- 3 Modelle explizit ein Lernverfahren vorschlagen, bezeichnet man mit ANF1S im Allgemeinen das type-3 ANFIS-Modell.
5.6 Neuro Fuzzy-Regelung
367
)'
Schicht 5 Auswertung der Konklusionen
Schicht 4
Schicht 3
Schicht 2
Auswertung der Pramissen (Regelaktivierung)
Schicht I
Eingabeschicht
XI
Abb . 5. 17 . Struktur eines ANFIS Netzes mit drei Regeln ii i =
II /.l;j) (Xj).
(5.89)
j
Die Auswertung der Konkl usionen und die Berechnung eines Ausgabewertes ist im ANF IS-Modell auf die Schichte n 3 bis 5 verteilt . Schicht 3 berechnet den relati ven Anteil ii , jcder Regel an der Gesam t au sgabe basierend auf den Regelaktivi erungen iii . Die Neuro nen der Schicht 3 berechnen somit
- =
Qi
Qi
= n et i =
iit·
~.
(5.90)
L.Jj Qj
Die Neuronen der Schicht 4 berechnen ans chlieJ3end die gewichte t en Regelausgaben basi erend auf den Eingabegrof en Xk und den relativen Regelakt ivieru ngen iii der vorh erigen Schicht: (5.91)
Das Ausgab eneuron U out in Schicht 5 berechnet schlieBlich die Gesamtausgabe des Netz es bzw. des Fuzzy-Syst ems: (5.92)
368
5. Einstellung und Optimierung von Fuzzy-Reglern
Das ANFIS-Modell benotigt zum Lernen eine feste Lernaufgabe. Es mussen somit eine ausreichende Anzahl von Paaren von Ein- und Ausgabegrofen zum Trainieren vorhanden sein. Basierend auf diesen Lerndaten werden dann die Modellparameter, d .h. die Parameter der Fuzzy-Mengen und die Parameter der Ausgabefunktionen f;, bestimmt. Als Lernverfahren werden in [72] unterschiedliche Ansatze vorgeschlagen . Neben einem reinen Gradientenabstiegsverfahren analog dem Backpropagation Verfahren fur Neuronale Netze (siehe hierzu auch Abschnitt 5.6.1) werden auch Kombinationen mit Verfahren zum Losen iiberbestimmter Linearer Gleichungssystem (z.B. der Methode der kleinsten (Fehler-) Quadrate bzw. least square estimate (LSE) [24]) vorgeschlagen . Hierbei werden die Parameter der Pramissen (Fuzzy-Mengen) mit einem Gradientenabstiegsverfahren und die Parameter der Konklusionen (Linearkombination der Eingangsgrofen) mit einem LSE Verfahren bestimmt. Das Lernen erfolgt hierbei in mehreren getrennten Schritten, wobei jeweils die Parameter der Pramissen bzw. der Konklusionen als konstant angenommen werden . Im erst en Schritt werden aIle Eingabevektoren durch das Netz bis zu Schicht 3 propagiert und fur jeden Eingabevektor die Regelaktivierungen gespeichert. Basierend auf diesen Wert en wird ftir die Parameter der Funktionen j; in den Konklusionen ein uberbestimmtes Gleichungssystem aufgestellt. Seien 1\j die Parameter der Ausgabefunktionen f;, xi(k) die Eingabegrofen und y(k) die Ausgabegrofle des k-ten Ttainingspaares, sowie lii(k) die relativen Regelaktivierung so erhalt man n
y(k) = L o'i(k)Yi(k) = L o'i(k)(L rijxj(k)
+ riO) , Vi, k .
(5.93)
j =l
Mit xi(k) := [1, Xl (k), ... , xn(k )]T erhalt man somit fur eine genugend groBe Anzahl m an Trainingsdaten (m > (n + 1) . r, wobei r die Anzahl der Regeln und n die Anzahl der Eingangsgrofien ist) das uberbestimmte lineare Gleichungssystem
y=aRX.
(5.94)
Die Parameter des so aufgestellten linearen Gleichungssystems - die Parameter der Ausgabefunktionen j; in der Matrix R - lassen sich somit nach Propagation aller Trainingspaare mit einem LSE Verfahren bestimmen. AnschlieBend wird der Fehler an den Ausgabeeinheiten basierend auf den neu berechneten Ausgabefunktionen bestimmt und mittels eines Gradientabstiegsverfahren die Parameter der Fuzzy-Mengen optimiert. Die Kombination beider Verfahren ftihrt zu einer verbesserten Konvergenz, da die Losung des LSE bereits eine (im Sinne der kleinsten Fehlerquadrate) optimale Losung fiir die Parameter der Ausgabefunktion bzgl. der initialen Fuzzy-Mengen liefert. Leider sieht das ANFIS-Modell fur die Optimierung der Fuzzy-Mengen in den Pramissen keine Restriktionen vor, d.h. es ist nicht sichergestellt, dass der Eingabebereich nach der Optimierung noch vollstiindig mit Fuzzy-Mengen
5.6 Neuro Fuzzy-Regelung
369
iiberdeckt ist . Somit konnen ggf. Definitionsliicken nach der Optimierung auftreten. Dies ist nach dem Lernen eines Modells unbedingt zu prufen. Ebenso konnen sich Fuzzy-Mengen unabhangig voneinander vera ndern und auch ihre Reihenfolge und somit ihre Bedeutung vert auschen . Dies sollt e insbesond ere dann beacht et werden, wenn eine initial e Regelbasis manuell aufgestellt wurd e und der RegIer anschlieBend interpreti ert werden solI. 5.6.4 Madelle mit veratarkendem Lernen Die Grundidee der Modelle mit verst arkendem Lernen (reinforcement learning) [7] besteht darin , einen RegIer moglichst ohne Kenntnis der Strecke zu bestimmen. Der Lernprozess soli dab ei mit einer minimalen Menge von Informationen tiber das Regelziel auskommen. 1m Extremfall erhalt das Lernverfahren lediglich die Inform ation ob die Strecke noch st abil ist oder der RegIer versagt hat (im Fall der Regelung eines inversen Pendels kann dies z.B. dann der Fall sein wenn das Pendel umgefallen ist oder der Wagen , der das Pendel halt , an eine Begrenzung gestoBen ist). Das Hauptproblem dieser Ansat ze besteht darin , die Bewertung der Regelakt ion geeignet aufzubereite n, so dass sie zum Lernen bzw. zur Optimierung des Reglers genutzt werden kann . Wie schon in Abschnitt 5.3 gezeigt , kann es bei der direkten Nutzung eines Fehlersignals zur Optimi erung sogar im Extremfall zu einer Divergenz des Lernvorgangs kommen. Dies licgt an dem prin zipiellen Problem, dass der akt uelle Zust and der Strecke nicht nur von der let zten Regelungsaktion , sondern von allen vorhergehenden Zustand en beeinfiuBt ist. Wir konnen im Allgemcinen somit auch nicht davon ausgeh en, dass die letzte Regelaktion den grosste n Einfiuss auf den akt uellen Systernzust and hat. Dieses Problem wird auch als credit assignment problem bezeichnet [7], d.h . das Problem einer Regelaktion die (langfristige) Auswirkung auf die Strecke zuzuordnen. Mittlerweile wurden im Bereich des verst arkenden Lernens eine Vielzahl von Modellen vorgeschlagen. Aile Modelle basieren im wesentlichen auf dem Prinzip das Lernproblem auf zwei Syst eme aufzut eilen: Ein Bewertungssystern (Kritiker) und ein System, dass eine Beschreibung der Regelungsstrategie speichcrt und diese auf die Str ecke anwendet (Akto r) . Die Aufgab e des Bewertungssystems ist es, den akt uellen Zustand unt er Beriicksichtigung der vorherigen Zust and e und Regelaktionen zu beurteilen und basierend auf diesen Information en die Ausgabe des Aktors zu bewerten und dessen Regelungsstrat egie ggf. zu adapt ieren. Eine Int egration eines solchen Ansatzes in einen Regelkreis kann Abb . 5.18 ent nommen werden. Die bisher vorgeschlagenen Verfahr en die Prinzipien des verst arkenden Lernens verwenden basieren meist auf einer Kopplung mit Neuronalen Netzen (siehe z.B. [6, 77]). Als sehr erfolgversprechend hab en sich dabci Verfahren erwiesen, die Meth oden der dynamischen Programmierung [8, 13, 14] verwenden , urn eine optimale Regelstrat egie zu bestimmen. Eine ausfiihrliche Diskussion dieser T hemat ik kann z.B. in [159] gefunden werden.
370
5. Einstellung und Optimierung von Fuzzy-Reglern
w
Abb. 5.18. Regleradaption mittels eines Kritikers: Basierend auf der Regelabweichung (links) und als Zustandsrcglcr (rechts) 1m Bereich der Neuro Fuzzy-Syst erne gibt es mittlerweile ebenfalls eine Vielzahl von Ansat zen, die allerdings bis heute leider nicht die Cu te der Syst eme, die basierend auf Neuronalen Netzen entwickelt wurd en, erreicht haben. Beispiele solche Ansat ze sind GARIC [9], FY NESSE [1 61] und das NEF CON-Modell [1 33, 142], das wir im Folgenden kurz vorstellen werden. Das NEFCON-Modell. Das Haup t ziel des NEF CON-Modells (NEeura l Fuzzy CONntro ller) ist es online mit einer moglichst geringen Anzahl von Trainingszyklen eine geeignete und interpr etierbare Regelbasis zu ermitte ln. Weit erhin soll es moglich sein, rnoglichst einfach Vorwissen in den Traningprozess einzubeziehen urn den Lernvorgang zu beschleunigen. Dieses unterscheidet es von den meisten reinforcement learni ng Ansat zen, die versuchen einen moglichst optimalen Regier zu erzeugen und hierfur auch sehr lange Lern phasen in Kauf nehm en. Des Weiteren sind im NEF CON-Modell auch heurist ische Ansatze zum Erlernen einer Regelbasis vorgesehen, wodurch es sich von den meisten anderen Neuro Fuzzy-Systemen unterscheidet , die im Allgemeinen nur zur Optim ierun g einer Regelbasis eingesetzt werden konnen. Das NEFC ON-Modell ist ein hybrides Modell eines Neuronalen FuzzyReglers. Ausgehend von der Definition eines Mamd ani-Reglers, erhalt man die Netzst ruktur , wenn man - analog der Beschreibung in Abschnitt 5.6.2 die Fuzzy-Mengen als Gewichte und die Mess- und Stellgroben sowie die Regeln als Vera rbeitungseinheiten interpretiert . Das Netz hat dann die Strukt ur eines Multilayer-Perzeptrons lind kann als dreischichtiges Fuzzy-Perzept ron [137] interp retiert werden. Das Fuzzy-Perzept ron entsteht hierb ei aus einem Perzeptron (siehe Abb . 5.13), durch Modellierung der Gewichte, der Netzeingabe und der Aktivi erung der Ausgab eeinheit als Fuzzy-Mengen. Ein Beispiel fur einen Fuzzy-Regler mit 5 Regeleinheit en, 2 Messgrofen und einer StellgroBe ist in Abb. 5.19 gegeben. Die inneren Einheiten R I , . .. , R 5 repr asentieren hierb ei die Regeln, die Einheiten X l , X 2 und y die MeB- bzw. Stellgrofien und Jl~i) und u; die FuzzyMengen fur die Pramissen bzw. Konklusionen. Die Verbindungen mit gemeinsamen Gewicht en kennzeichnen gleiche Fuzzy-Mengen. Bei einer Vera nderung dieser Gewicht e miissen somit alle Verb indungen mit diesem Gewicht angepasst werden, urn sicherzust ellen, dass gleiche Fuzzy-Mengen weiterhin durch gleiche Gewichte repr asent iert werden. Somit laBt sich die dur ch die Netz-
5.6 Neuro Fuzzy-Regelung
371
Abb. 5.19. Ein NEFCON System mit 2 Eingangsgrossen und 5 Regeln
struktur definierte Regelbasis aueh in Form der in Tabelle 5.1 aufgelistete n Fuzzy-Regeln formuli eren . Ri : if Xl R2 : if Xl R 3: if Xl R 4 : if X l R 5 : if Xl
is A il ) is Ail ) is A~l ) is A ~l ) is A~l )
and and and and and
X2 X2 X2 X2 X2
is A i 2) is A~2) is A~2 ) is A~2) is A~2 )
then then then then then
y y y y y
is B, is B , is B2 is B 3 is B3
Tabelle 5.1. Die Regelbasis des in Abb. 5.19 gezeigten NEFCON-Systems
Das Lern verfah ren des NEFCON-Modells laBt sieh im Wesentliehen in zwei voneinander unabhangige Phasen aufteilen. In der ersten Phase wird eine Regelbasis fur das dynamisehe Syst em erlernt, oder - falls a priori Wissen vorhanden ist - manuell aufgest ellt. Diese Regelbasis wird im Allgemeinen das System noeh nieht au sreiehend genau steuern und somit ist eine Optimierung der Fuzzy-Mengen notwendig. Diese Anpassung erfolgt in der zweiten Phase dureh den eigentliehen NEFCON-Lernalgorithrnus. Beide Phasen erfordern die Definition eines Syst ern-Fehlers zur Bestimmung bzw. Anpassung der Kontrollregeln. Der System-Fehler ub ernimmt hierb ei die Aufgab e eines Kritikers, der den aktuellen Systemzustand bewertet .
372
5. Einstellung und Optimierung von Fuzzy-Reglern
Neben dem Fehler e muf weiterhin bekannt sein, ob die optimale Stellgrofe Yopt fur einen gegebenen Zust and positi v oder negativ ist . Zusammen ergibt sich somit der erweite rte Fehler E E [-1 ,1]:
mit der Eing ab e (Xl, ...,X n ) . Einige Moglichkeiten zur Beschreibung des Syst em-Fehlers werden am Ende dieses Abschnittes beschrieb en. Lernen einer Regelbasis. Falls fur das zu ste uern de Syst em noch keine ausreichende Regelbasis exist iert, bzw. aufgeste llt werd en kann , muss sie durch ein geeignetes Regellernverfahren erzeugt werd en. Die im Folgend en vorgest ellten Algorithmen zum Erl ern en einer Regelbasis kommen ohn e eine vorgegebene fest e Lern aufgabe aus, sondern versuchen basierend auf dem Syst em-Fehler eine geeignete Regelbasis zu bestimmen (siehe auch [142]) . Beide Verfah ren set zen geeignete Fuzzy-Partitionierung der Mess- und Stellgrofienb ereiche vorraus (siehe hierzu auch die Diskussionen in Abschnitt 3.4.2). Ein Eliminationsverfahren zum Lernen einer Regelbasis Das Eliminationsverfahren beginnt mit einer vollst andigen iiberbestimmten Regelbasis, d.h. die Regelbasis besteht aus allen Regeln die durch Kombination der FuzzyMengen in den initialen Fuzzy-Partitionierungen der Mess- und Stellgrofen aufgeste llt werd en konn en , Der Lernvorgan g t eilt sich im Wesentlichen in zwei Phasen auf. In der erste n Phase werd en die Regeleinh eit en entfernt, deren Ausgab en ein unterschiedliches Vorzeichen zur optimalen Stellgr6Be aufweisen. In der zweiten Phase wird bei allen Regeln basierend auf ihrem Anteil an der Regelausgabe (Regelaktiv ierung) die Fehler tiber mehrere Regelungszyklen akkumuliert. Aus den Mengen von Regeln mit ident ischen Pramissen wird bei jeder Stellgrofenberechnung jeweils eine Regel zufallig ausgewahlt. Nach einer festgelegt en Anzahl von Zyklen werden aus den verbli ebenen Mengen der Regeln mit gleichen Pramissen jeweils die Regeln ausgewahlt, die in mehreren Regelun gszyklen den geringste n Fehler akkumuliert hab en. Die restlichen Regeln und solche Regeln, die sehr selte n oder ub erh aupt nicht akt iv waren, werd en eliminiert . Ein Nachteil des Eliminati onsverfahrens ist , dass es mit einer sehr grossen Regelbasis beginnt und somit bei Syst emen mit vielen Messwerten oder sehr vielen Fuzzy-Mengen zur Beschreibung der Mess- und Stellgrofien sehr speicherplatz- und rechenze itaufwendig ist . Dieses Problem versucht man mit einem inkrement ellen Lernverfahren zu losen . Inkrementelles Lernen der Regelbasis. Dieses Verfahren beginnt mit einer leeren Regelbasis und versucht ~ ausgehend von einer vorgegebenen Fuzzy-Partitio nierung der der Mess- und Stellgrofen - eine Regelbasis iterativ zu konstruieren . Dieses Lernverfahren best eht au s zwei Phasen. In der erst en Phase werd en die Messwerte mit Hilfe der vorha ndenen P artitionierung
5.6 Neuro Fuzzy-Regelung
373
klassifiziert , d.h . fiir jeden Messwert wird die Fuzzy-Menge mit dem hochsten Zugehorigkeitsgrad ausgewahlt. Die zugehOrige Stellgrofen wird mittels einer Heuristik direkt aus dem Fehler bestimmt und anschlieBend analog den Messwerten klassifiziert . Die so gefundene Regel wird in die Regelbasis aufgenommen. Dab ei geht man davon aus, dass Messwert tupel mit ahnlich en Fehlerwerten auch ahnliche Stellgrofen erfordern . In der zweite n Phase wird versucht, die Regelkonklusion en zu optimieren in dem die gelernte Regelbasis auf die Str ecke angewendet und basierend auf den so ermittelt Fehlerwerten die Fuzzy-Mengen in den Konklu sionen ggf. getauscht werden. Die verwendete Heuristik bildet den erweit erten Fehler E lediglich linear auf das Int ervall der Stellgrofie ab o Es wird dab ei von einer direkt en Abhangigkeit zwischen dem Fehler und der St ellgrofe ausgegangen. Dies ist insbesondere fur Strecken probl ematisch, die einen Int egralanteil zur Regelung benotigen, d .h. die eine Stellgrofe ungleich Null benotigen urn da s Regelziel zu erreichen bzw. zu halt en. Diese Heuristik setzt ebenfalls voraus, dass der Fehler nicht nur aus der Regelabweichung bestimmt wird , sondern dass versucht wird , auch die folgenden Zustande der Str ecke zu beriicksicht igen (siehe hierzu die Diskussion im Abschnitt iiber die Bestimmung des Syst emfehlers sowie die Betrachtungen in Abschnitt 5.3). Das inkr ement elle Lernverfahren errnoglicht es sehr gut, Vorwissen in die Regelbasis einfliel3en zu lassen. Fehlend e Regeln werden dann dur ch das Verfah ren hinzug efUgt. Beide vorgestellten Heuristiken konnen aufgrund der bereits diskutierten Probleme jedoch nicht fur aile Strecken eine sinnvolle Regelbasis liefern. Die mit den oben vorgestellten Verfahren gelernten Regelbasen sollten zumindest dann, wenn das im Foigenden disku tiert e Optimierungsverfahren keine zufriendenst ellende Losung erzielen kann - noch einmal manuell auf ihre Konsist enz gepriift werden. In jedem Fall sollte die Moglichkeit zur Einbeziehung von Vorwissen genutzt werden, d.h. bekannte Regeln solit en vor dem Lernen in die Regelbasis aufgenommen werden . Die Regellernverfahren sollten die manuell definierten Regeln anschlieBend nicht mehr verandern . Optimierung einer Regelbasis. Der NEFCON-Lernalgorithmus zum Optimi eren einer Regelbasis basiert auf dem Prinzip des BackpropagationAlgorithmus ftir das mehr schichtige Perzeptron. Der Fehler wird , beginnend bei der Ausgabe einheit , riickwart s dur ch das Netzwerk propagiert und lokal zur Adaption der Fuzzy-Mengen genutzt. Das Optimieren der Regelbasis erfolgt dur ch Veranderung der FuzzyMengen in den Pramissen und Konklu sionen. Die Fuzzy-Mengen einer Regel werden in Abh angigkeit von ihrem Beitrag zu einer Regelaktion und dem daraus resultierenden Fehler entweder 'belohnt' oder 'bestra ft'. Es wird somit das Prinzip des verstarkenden Lernens verwendet . Eine 'Belohnung' oder 'Best rafung' kann hierb ei durch Verschieben oder Verkleinern /Vergrofiern des Triigers der Fuzzy-Mengen erfolgen. Diese Anpas sungen werden iterativ vorgenommen, d.h. der Regier wird wahrend des Lernvorgangs zur Regelung der
374
5. Einstellung und Optimierung von Fuzzy-Reglern
Str ecke eingesetzt und nach jeder Regelaktion erfolgt eine Beur teilung des neuen Zustandes und eine inkr ementelle Adaption des Reglers. Das prinzipielle Problem dieses Ansatz es besteht darin , dass die Bestimmung des System-Fehlers sehr sorgfiilt ig durchgefUhrt werden muss, urn die zu Beginn dieses Abschnittes diskut ierte n Probleme der Bewertung einer Regelakt ion zu vermeiden. Dies kann in vielen Fall en sehr aufwendig oder sagar unmo glich sein. Denno ch konnen die vorgeschlagenen Verfahrcn bei einfachen Strecken eingeset zt werden und auch bei komplcxeren Strecken bei der Entwicklung eines Fuzzy-Reglers durchaus hilfreich sein. Zu beachten ist , dass der so ermittelt Regier sehr sorgfaltig auf seine Stabilitat hin untersucht werden sollte . Bestimmung eines Systemfehlers. Der System-Fehler iibemimmt im NEFCON-Modell die Aufgab e des Kritikers, d.h. er ist unmittelbar fur den Erfolg odcr Misserfolg des Lernvorgangs verantwortlich. Eine gute Definition des System-Fehlers ist fur die vorgeschlagenen Lernverfahren somit eine unabdingbare Voraussetzung. Im Prinzip ergeben sich fur die Definition des System-Fehlers eine Vielzahl von Moglichkeiten, die auch die Verwendung von Streckenmodellen mit einschlieBt Ist ein solches (inverses) Modell vorhanden kann es genut zt werden , urn die Regelaktion des Fuzzy-Reglers Zll bewerten. (siehe hierzu die Diskussionen zur Modellbasierten Regelung in Abschnitt 5.4). Dieser Ansatz ste llt sozusagen den 'perfckte n' Kritiker dar. Ziel der verst arkenden Lernverfahren ist es aber, moglichst auch unb ekannte Systeme regeln zu konnen und somit ohne ein Modell der Strecke a usz ukommen , Fur das NEFC ON-Modell wurd en deshalb Ansatze vorgeschlagen, die mit moglichst wenig Inforrna tion en iiber die Strecke auskommen sollen. Ein sehr einfacher Ansatz zur Beurteilung der Giit e eines Systemzust and s besteht darin ftir 'gute' Zustand e im wesentlichen zwei Faile zu unterscheiden: • Die Messwerte entsprechen in etwa den optimalen bzw. den gewiinschte n Werten. • Die Messwert e weichen vom Optimum ab , streben aber dem optimalen Zustand entgegen (kompensatorische Situation). Diese Zust ande erhalten die Giit e G = 1. 'Schlechte ' Zust and e (z.B. groBe Abweichung von den optimalen Wert en und Tendenz zur Vergroferung der Abweichung vom Optimum) werden mit G = 0 bewert et. Basierend auf der Giite G E [0,1] des aktuellen Systemzust ands lasst sich dann unm ittelbar der System-Fehler E bestimmen:
Diescr sehr einfache Ansatz kann jedoch - ana log dem Beispiel in Abschnitt 5.3 - dazu fiihren , dass die Ste llgrofe bei einem leicht schwingenden System
5.7 Fuzzy-Regier und evolutionare Algorithmen
375
mit dem Ziel des Gegensteuerns immer weiter vergrofert und das Schwingen somit verst arkt wird. Bei dem Entwurf der Giit efunktion muss deshalb versucht werd en, auch solche Zustand sand erung en, die durch zu starke Regelaktionen verur sacht wurden, geeignet zu beurteilen. In [135] wurd e deshalb ein alternat iver Ansat z vorgeschlagen , bei dem man versucht , den Syst em-Fehler direkt mit Fuzzy-Regeln zu beschr eiben . Dies hat den Vorteil, dass man bei Verwendung von Zust andgrofen der Strecke mit der Fehlerbeschreibung implizit eine Regelungsstrategie vorschlagen kann, die vom Regier dann zur Optimierung genutzt wird. Die Aufstellung einer Regelbasis set zt natiirlich ein Verst andis fur die Strecke voraus und ist fur komplexe Systeme meist zu aufwandig. Wie in [135] am Beispiel des inversen Pend els gezeigt, kann dieser Ansat z jedo ch dur chaus erfolgreich zum Lernen eines Fuzzy-Reglers eingesetzt werden. 5.6.5 Diskussion Wir wir in diesem Abschnitt gezeigt hab en, konnen Neuro Fuzzy-Syst eme genut zt werden, urn einen Fuzzy-Hegler oder das Fuzzy-Modell einer Str ecke mit Hilfe von Messdaten zu optimieren. Insbesondere die Verfahren die auf tiberwachten Lernverfahren basieren konnen hierftir auch bei komplexen Stre cken eingesetz t werden. Die bisher entwickelten Neuro Fuzzy-Systeme, die auf verstarkenden Lernverfahren beruhen , konnen (bisher) leider nur zum Lernen von Reglern fur sehr einfache Stre cken erfolgreich genutzt werden. Allerdings ist zu erwar t en , dass auch hier in naherer Zukunft Verfahren vorgeschlagen werden, die - analog den Modellen, die basierend auf Neuronalen Netze entwickelt wurd en erfolgreich zum Lernen von Regelungsstrat egien eingeset zt werden konnen.
5.7 Fuzzy-Regler und evolutionare Algorithmen Unt er dem Begriff evolut ionare Algorithmen werden Optimierungsstrat egien zusammengefasst , die sich am Vorbild der biologischen Evolution orientieren. Evolutionar e Algorithmen versuchen dur ch die Anwendung einiger Grundprin zipien natiirlicher Evolution spro zesse auf eine Population von Losungsalt ern ativen schrittweise tiber mehrerer Generationen bessere Losungen zu £Inden . Hierzu ist es notwendig sowohl die Zielfunktion , die das (Optimierungs-) Problem definiert als auch notwendige Bewertungskriterien geeignet zu kodieren. Die den evolut ionare n Algorithmen zugrunde liegenden Grundprinzipien und Moglichkeiten der Problemkodierung werden im Folgenden nah er beschrieben . Um eine vorgegebene Zielfunktion zu optimieren , d.h. die freien P aram eter der Zielfunktion so zu wahlen , dass sie einen moglichst kleinen (Minimierung) oder moglichst groBen (Maxirnierung) Wert annimmt, wird zunachst eine Popul ation von zufalligen Losungen (Chrom osomen ) crzeugt . Dicse Familic von
376
5. Einstellung und Optimierung von Fuzzy-Reglern
zufalligen Anfangslo sungen wird im Allgemeinen noch sehr weit von einem Optimum der Zielfunktion ent fernt sein. Aus dieser Anfangspopulation werden neue Losungen durch die Anwendung genetischer Op eratoren bestimmt . Die wichtigst en genetischen Op eratoren sind Mut ation und Crossover. Bei der Mutation werden zufallige, nach Moglichkeit kleine Anderu ngen an den Param et ern (Genen) eines Indi viduums (einer Losung innerhalb einer Population) vorgenommen. Beim Crossover werden die Par am et ersiit ze zweier Individuen vermis cht . Man lasst dann einen Teil dieser erweite rte n Populati on ausste rbe n, so dass man wieder eine Population in derselben GroBe wie die Anfangspopulation erhalt . Mit dieser neuen Generation und den Folgegenerationen fahrt man wie mit der Anfang spopul ation fort . Das Ausst erb en wird tiber die Selektion gesteuert , bei der Individuen mit einer hoher en Fitness eine grofere Uberlebens- oder Vermehrungschance erhalte n. Die Fitness eines Individuums ist umso grofer, je besser es die Zielfunktion opt imiert . Diesen Auswahl vorgang nennt man Selektion. Beend et wird dieser Evolut ionsprozess wenn eine genii gend gute Losun g gefunden wur de oder sich tiber mehrere Generationen keine bessere als die bisher gefundene best e Losung ergeb en hat . Es gibt eine Reihe von evolut iona ren Algorithmen , die auf diesen Grundprin zipien basieren [5, 51, 119, 139]. Fur die Zwecke der Fuzzy-Regelun g werden wir uns an dieser Stelle auf die elementaren Grundlagen der zwei Hauptrichtungen evolut iona re Algorithmen , die Evolutionsstrategien und die genetischen , Algorithmen konzentrieren o 5.7.1 Evolutionsstrategien
Evolutionsstrategien eignen sich fiir die Optimierung von Zielfunk t ionen mit reellwerti gen Param et ern. Ein e potenzielle Losung des Op t imierungsproblems, d.h. ein Individuum innerh alb einer Population, wird als reeller Vekto r fest er Dimension definiert. Will man beispielsweise gemessene Daten {(Xi,Yi, Zi) I i = 1, . . . , n } durch eine Ebe ne f( z) = a+ bx+cy anna her n, die die Summe der absolute n Fehler in z-Richt ung minimi ert, wtird e man als Zielfunktion n
Z(a ,b, c) = L la+b , xi + C'Yi - Zil i=l
verwend en. Ein Individuum, d .h. eine mogliche Losun g, best eht aus einem dr eidimensionalen Vektor (a, b, c). Die Populationsgrofe - die Anzahl der Individuen in einer Generation - wird bei den Evolutionsst rat egien tiblicherweise mit J.1 bezeichnet (wobei dami t hier keine Fuzzy-Menge gemeint ist!) . Aus einer Anfan gspopulation von J.1 zufiilligen Losun gen (al , bl , ci ), . .. , (aJL , bJL , c,J werden durch Mutation v Nachkommen erzeugt . Die Mutat ion erfolgt , indem auf eine Losun g (aj , bj , Cj) drei unabhiingige norm alverteilte Zufallswerte Cl, C2, C3 jeweils mit Erwartungs wert Null und festegelgt er kleiner Varian z addiert werden , so dass
5.7 Fuzzy-Hegler und evolutionare Algorithmen
377
man als Nachkomme (a j + 10 1, bj + 102, Cj + 103) erhalt. Insgesamt werden so von jeder Population 1/ Nachkommen erzeugt . Die Selekt ion erfolgt bei den Evolutionsst ra tegien nach dem Elit eprinzip, bei dem die J.1 besten Individuen in die Folgegeneration iibernomm en werden. I-lierbei werd en zwei unterschiedliche Vorgehensweisen unterschieden: • Es werden die J.1 besten Individuen aus den J.1 + 1/ Eltern und Kind ern ausgewiihlt. In diesem Fall spricht man von einer (J.1 + l/)-Strategie oder einfach Plus-Strategie. • Die J.1 Nachfolger werden nur aus den 1/ Kind ern gewiihlt . Diesen Ansat z bezeichnet man als (J.1 , 1/ )-St rategie oder einfach als Komma-Strategie. Der Vorteil der Plus-Strategie besteht darin , dass sich die beste Losung in einer Population niemals verschlechtern kann . Dafur neigt eine Plus-Strat egie eher dazu , in einem lokalen Optimum st ecken zu bleibcn. Komm a-Strategien konnen sich einfacher aus einem lokalen Minimum befreien, allerdings kann sich auch eine Verschlechteru ng von einer Generation auf die nachste ergeben. Bci der Verwendung einer Komma-S trat egie sollte in jedem Fall die bisher best e gefundene Losun g gesondert gespeichert werden. Auch wenn diese einfache Form der Evolut ionsstrategie haufig schon recht zufriedenste llende Losungen liefert , empfiehlt sich eine Schrittweitenada ption. Das bedeutet , dass der Parametervektor jedes Indi viduums noch urn eine weit erc Komponente ergiinzt wird. Die zusatz liche Komponente gibt die Varianz der Normalverteilung bei der Mut at ion an. Fuhren Mutationen haufig zu Verbesserungen, so kan n die Schrit tweite, d.h. die Varianz, vergrofert werden. Sind die Nachkommen fast aile schlechter als die Eltern , so sollte die Schrittweite verkleinert werden , Eine Faustregel besagt hier , dass die Schrittweit e (Varianz) gut gewiihlt ist , wenn etwa ein Funftel der Nachkommen erfolgreich sind. Bei einer grofieren Anzahl erfolgreicher Nachkommen kann die Schrittweitc erhoht , bei weniger als ein Flinft el erfolgreichen Mutationen verringert werden. 5.7.2 Genetische Algorithmen
1m Gegensatz zu den Evoluti onsstratcgicn vcrwenden die genetischen Algorithmen in der ursprlinglichen Form eine rein biniire Kodierung, in etwas allgemeinerer Form eine beliebige diskret e Kodierung der Losun g. Anstelle der reellen Paramct ervcktoren der Evolutionsstrategicn arbcitcn gcnetischc AIgorit hmen mit biniiren Vektoren oder Vektoren , deren Komp onenten jeweils nur endlich viele Wert e annchmen konnen, Ein typisches P roblem war e beispielsweise die Verteilung einer Anzahl von Fertigungsauftragen. Dies konnten zum Beispiel Kopien in verschiedenen Stuckzahlen sein, die auf zwei verschiedenen Produk tionsmaschinen erste llt werden sollen, so dass die Zcit zur Erledigung aller Auft rage moglichst kur z ist. Sollen n Auftrage bear beitet werden , wiirde man einen binaren Vekt or mit n Komponent en verwenden. Eine Eins an der
378
5. Einstellung und Optimierung von Fuzzy-Reglern
i-te n Stelle wiirde bedeuten , dass del' i-t e Auf trag auf del' Maschine Eins bearb eitet wird, bei einer Null wiirde er auf del' anderen Maschine produziert werden. Mutation werden bei genet ischen Algorithmen mit einer sehr kleinen Wahrscheinlichkeit fur jede Variable dur chgefUhrt. Bei einer binaren Kodi erung wird im Faile einer Mutation eine Eins in eine Null umgewand elt und umgekehrt. Kann eine Variable mehr als nur zwei Werte annehmen, so wird del' mutiert e Wert oft nach einer Gleichvert eilung tiber aIle moglichen Werte zufallig ausgewahlt. Cfinstiger ist es in diesem Fall jedoch - sofern die Problemstellung dies errnoglicht - nur Mut ationen zu ahnlichen oder benachbarte n Werten zuzulassen. Eine wesentliche Rolle spielt bei den genet ischen Algorithmen das Crossover. Dab ei werden zufallig zwei Individuen (Chromos omen) aus einer Population ausgewahlt und zufallig ein Kreuzu ngspun kt ftir die beiden Paramet ervektoren bestimmt . An den Teil VOl' dem Kreuzungspunkt des ersten Chromosoms wird del' Teil nach dem Kreuzungspunkt des zweiten Chromosoms angehangt und umgekehr t . Auf diese Weise erha lt man zwei neue Individuen. Soli zum Beispiel Crossover nach del' vierten St elle auf die beiden Chromosomen 110011101 und 000010101 angewendet werden , so erhalt man als Er gebn is die beiden Chrornosomen 110010101 und 000011101. Das Crossover soli dazu dienen, zwei Losungen zu einer insgesamt verb esserten Losun g zu vereinigen , wenn die eine Losung fur die ersten Par ameter eine recht gute Konfiguration gefunden hat und die andere Losung fur die hinteren Paramet er eine gute Kombin ation liefert . Diesel' Effekt kann nur auft rete n, wenn die einzelnen Paramet er nicht zu stark voneina nder abhangen. Ansonst en ents pricht Crossover eher einer massiven Mut ation. Del' hier beschriebene Crossover-Op erator wird auch One-Point- Crossover genannt , da die Chrornosomen an einer Stelle gekreuzt werden. Giinst iger ist meist ens das TwoPoin t-Crossover , bei dem zwei Kreuzungspunkte ausgewahlt werden und del' Abschnit t zwischen diesen beiden Punkten ausgetauscht wird . Die Selektion involviert bei den genet ischen Algorithmen immer einen Zufallsmechanismus im Gegensatz zu del' reinen Bestenauswahl bei den Evolutionsstrategien. In del' urspriinglichen Version del' genet ischen Algorithmen wird die Roulettradselektion angewendet . Dab ei erha lt jedes Chromosorn eine individuelle Selektionswahrscheinlichkeit, die propo rt ional zu seiner Fitness gewahlt wird. Es gibt zahl reiche Variante n dieses Selektion sverfahrens. Ublicherweise wird zumindest das beste Chromosom in die nachste Generat ion iibernommen, auch wenn es tro tz seiner grofite n Selektionswahrscheinlichkeit zufallig nicht iiberlebt hatte. Die sich aus den oben beschriebenen Operator en ergebende Grundstruktur genet ischer Algorithmen ist in Abb . 5.20 dargestellt . Prinzipiell lassen sich genetische Algorithrnen immer auf eine binare Kodierung redu zieren. Endli ch viele Wert e konnen dur ch eine geeignete Anzahl von Bits dargestellt werden , was lediglich zu Iangeren Chromosomen
5.7 Fuzzy-Regier und evolutionare Algorithmen
379
begin t:=O ; initialize(P(t)) ; II Bestimme Anfangspopulation evaluate(P(t»); II Bewerte die Population while (not Abbruchkriterium(P(t),t)) do t:=t+l; select pet) from pet-i); crossover(P(t»; mutate(P(t» ; evaluate(P(t»); end; end; Abb. 5.20. Grundstruktur genetischer Algorithmen
fiihrt. Allerdings kann dadureh ein zusatzlicher unerwiinsehter Mutationseffekt beim Crossover auft rete n. Wird eine Variable, die aeht Werte annehmen kann , dureh dr ei Bit kodiert, so kann Crossover nun aueh innerhalb dieser Variabl en st att finden, so dass naeh der Kreuzung die Kodierung der Variablen mehr oder weniger zufallig ist. Neben der eigentliehen P aramet erkombination wird dadureh beim Crossover auBerdem ein Variablenwert geandert. Genetisehe Algorithmen lassen sich aueh auf Probleme mit reellwertigen Paramet ervektoren anwenden. Man verwend et dazu fur jeden reellen Par ameter cine geniigend groBe Anzahl von Bits , so dass sich die reelle Zahl mit der gewiinschte n Genauigkeit darstellen lasst. Dies unterseheidet die Genetisehe Algorithmen zun achst nieht von den Evolutionsstrategien, da aueh dort die reellen Parameter im Reehner lediglieh binar reprasentiert werden . Allerdings gewinnt die Mutation eine v6l1ig andere Bedeutung. Wird ein hoherwertiges Bit mutiert , andert sich der kodierte reelle Wert extrern, wahrcnd eine Veranderung eines niederwertigen Bits eher der Mutation in kleinen Schritten im Sinne der Evolutionsst rategien ents prieht. In diesem Sinne empfiehlt es sich, untersehiedliche Mut ationswahrscheinlichkeiten fur die einzelnen Bits vorzug eben . Hoherwer tige Bits soliten im Gegensa tz zu den niederwertigen Bits eine sehr geringe Mutationswahrseheinliehk eit erhalte n. 5.7.3 Evolutlonare Algorithmen zur Optimierung von Fuzzy-Reglern
Soli ein Fuzzy-Regier mit Hilfe evolut ionarer Algorithmen automati seh erst ellt werd en, so muss zunachst die vom evolutio naren Algorithmus zu optimi erend e Zielfunktion festgelegt werd en. Liegen Messdaten eines Reglers vor - dies konnen z.B. Messdaten die dureh Beobaehtung eines mensch lichen Bedieners gewonnen wurden sein - , so sollte der Fuzzy-Hegler die so definierte Regelfunktion moglichst gut annahern. Als zu minimi erend e Fehlerfunktion bieten sieh die mittlere quadr atisehe oder absolute Abweichung sowie die maximale Abweiehung der Reglerfunktion von den Messdaten all. Wenn die Messdaten von versehiedenen Personen st amrnen, kann eine Ap-
380
5. Einstellung und Optimierung von Fuzzy-Reglern
proximation zu einem sehr schlechten Gesamtverh alten des Reglers fuhre n, Wenn die einzelnen Personen jeweils durchau s erfolgreiche, aber unterschiedliche Regelun gsst rategien verfolgen , und der RegIer gezwungen wird , die Date n moglichst gut anzuna hern, wird sich an jeder Stelle eine Mittelung der Einzelstrategien ergeben, die als Gesamtst rat egie im schlimmsten Fall tiberhaupt nicht funk tioniert . Sollen beispielsweise Hinderni sse umfah ren werden, und in den Dat en wurde in jeweils der Halft e der Falle links und rechts ausgewichen , ergibt die Mit telun g weiter gerade aus auf das Hind erni s zuzufahren. Die verwendete n Daten sind soweit rnoglich immer auf ihre Konsistenz hin zu ub erpriifen. St eht ein Simulationsmod ell der zu regelnd en Strecke zur VerfUgung, so lassen sich divers e sinnvolle Giitekri terien definieren , z.B, die Zeit oder die En ergie, die der Regier brau cht , urn den Prozess aus verschiedenen Anfan gszustanden auf den Sollwert zu bringen, eine Bewertung des Uberschwingverhaltens etc. Verwend en die evolut ionaren Algorithmen ein Simulati onsmodell mit einer derartigen Zielfunk tion, ist es im Allgemeinen giinst iger , die Zielfunktion lan gsam zu verschar fen. In einer zufalligen Anfangsp opul ation wird wah rscheinlich ub erh aupt kein Ind ividuum (Regier) in der Lage sein , den P rozess sehr nah e an den Arbeitspunkt zu bringen. Man konn te daher zunachst als Zielfunkti on die Zeit nehm en , die der Regier den P rozess in einer sehr groBziigigen Umgebung das Arb eitspunkt es halten kann [59]. Mit zunehmender Generatio nsza hl wird die Zielfunk t ion imm er weite r verscharft , bis sie schlieBlich die eigent lich gewiinschte n Kriterien ent halt . Die Paramet er eines Fuzzy-Reglers, die mit einem evolut ionaren Algorithmus erlernt werden konnen, te ilen sich in dr ei Gruppen auf, die im Folgenden nah er beschrieben werd en. Die Regelbasis. Wir gehen hierb ei zunachst davon aus, dass die FuzzyMengen fest vorgegeben sind oder auch gleichzeitig mit einem anderen Verfahren optimiert werden. Hat der Regier zum Beispiel zwei Ein gangsgroflen, fur die n l bzw. n 2 Fuzzy-Mengen definiert sind, so kann fiir jede der moglichen nl . n2 Kombinationen eine Ausgab e definiert werd en . Bei einern Mamd an iRegier mit n o Fuzzy-Mengen fur die Ausgangsgrolle wiird e sich dah er ein Chromosom mit n l . n2 Param etern (Genen) anbiete n, wobei jedes dieser Gene einen von no Werten annehmen kann. Die fur den genetischen Algorithmus erforderliche Kod ierung der Regeltab elle als linearer Vektor mit nl . n 2 Komponent en kann jedoch beim Crossover zu P roblemen ftihren. Das Crossover sollte bei einem genet ischen Algorith mus daftir sorgen, dass zwei Losun gen , die jeweils einen anderen Teil der Parameter bereits gut opt imier t hab en , zu einer besseren Gesamt16sun g verschmolzen werden. Bei der Op timi erung einer Regelbasis eines Fuzzy-Reglers liegen die giinstigen Vora ussetzungen vor, dass die Par am eter eine gewisse Una bha ngigkeit aufweisen. Zwar wirken benachbarte Regeln auf ub erlappend e Bereiche, aber nicht-benachbart e Regeln int eragieren nicht . Wenn zwei Fuzzy-Regier vorliegen , die jeweils in einem anderen Teil der Regelt abelle giinstige Eint rag e
5.7 Fuzzy-RegIer und evolutionare Algorithmen
381
fur die Ausgab en del' Regeln gefunden hab en , ergibt sich aus dem Zusammensetz en del' beiden Teiltabellen ein insgesam t besserer Regier. Ein Bereich entspricht in einer Tabelle allerd ings nicht einem linearen Teilstuck, sondern eher einem rechtec kigen oder quadratischen Ausschnitt . Ein genet ischer Algorithmus in Reinform wtird e beim Crossover nur lineare Teilst ucke austauschen. Bier ist es dah er vorteilhaft , wenn man bei del' Tabellen-forrnigen Kodieriu ng bleibt und einen modifizier ten Crossover-Ope rator einfiihrt , del' Teilt ab ellen austauscht [86]. Wir hab en hier zwar nur den Fall von zwei Ein gangsgr6Ben disku tiert , die Ubert rag ung auf Regier mil' mehr eren Einga ngsgr6Ben erfolgt jedoch analog. Urn bei del' Mut at ion nur kleine Veranderungen vorzun ehm en , sollte eine Ausgab e-Fuzzy-Menge nicht du rch eine beliebige zufallige andere, sond ern durch eine del' beiden benachbar ten ersetzt werd en. Bei einem TSK -Mod ell miissen ftir die Regelbasis anste llc del' AusgabeFuzzy-Mengen Ausgabefunktionen bestimmt werd en. Ublicherweise werden diese Funktionen in par amctrisierter Form angegeben, z.B,
bei den Ein gan gsgr6Ben x und y sowie den in Regel R zu bestimmenden drei Parametern on , bR und CR. Bei einer Regelt ab elle mit - wie obe n nl . nz Eint rag en miissten hier insgesam t 3 . n l . nz reelle Param eter fur die Regeltabelle best immt werd en. In diesem Fall sollte wegen del' reellen Param eter eine Evolutionsstrategie gewahlt werden . Soli nicht die gesa mt e Regeltabelle ausgefiillt werden, sondern nur eine beschrankte Anzahl von Regeln erzeugt werden , kann jeder Regel ein zusatzliches bin ares Gen zugeordnet werden, das besagt , ob die Regel des Reglers iiberh aupt verwendet wird . Bei einem TSK-Modell hatte man in diesem Fall einen echte n evolutionar en Algorithmus, da sowohl reelle als auch diskr ete Par am eter verwendet werde n. Die Anza hl del' akt iven Regeln kann fest vorgegeben werden, wobei ab el' sichergestellt werd en muss , dass sich diose Anzahl bei Mutation und Crossover nicht verandert. Bei del' Mutati on konnte zum Beispiel cine Regel zufallig akt iviert und dafur eine andere deaktiviert werd en. Beim Crossover miisst e somit ansch lieBend ein Reparaturalgorithmus angewendet werden. Bei zu vielen aktiven Regeln wiird en beispielsweise zufallig so viele Regeln deaktivi ert , bis die gewiinschte Anzahl erre icht ist . Ein e bessere Strat egie besteht darin, die Anzah l del' akt ivcn Regeln nicht festzulegen. Da Fuzzy-R egier mit einer kleineren Anzahl von Regeln vorzuziehen sind, ist es sinnvoll, in die Zielfunk tion einen Zusatzterm aufzunehmen , del' mit ansteigend er Regelzahl den Wert del' Zielfunk tion zunehmend verschlechtert. Diesel' Zusatzterm solIte mit einem geeignet en Gewicht eingehen. W ird das Gewicht zu groB gewahlt , wird pr imal' eine kleine Anz ahl von Regeln belohnt , na hezu unabhangig davon , wie gut oder schlecht das Regelverhal ten ist . Bei einem zu kleinen Gewicht spielt del' Term eine zu geringe Rolle und bewirkt keine Ver ringeru ng del' Anza hl del' Regeln.
382
5. Einstellung und Optimierung von Fuzzy-Reglern
Die Fuzzy-Mengen. Die Fuzzy-Mengen werden iiblicherweise in paramet risierter Form wie bei Dreiecks-, Trapez- oder GauBfunktionen angegeben. Diese rellen Par ameter sind wiederum fur eine Evolutionsstrategie geeignet. Allerdings ftihrt das bloBe Op timieren derar tiger parametri sierter FuzzyMengen nur selte n zu vern iinftigen Ergebnissen. Der opt imierte Fuzzy-Regier kan n zwar durcha us ein sehr gutes Regelverhal ten aufweisen, die FuzzyMengen iiberlappen sich aber vollig beliebig, so dass es kaum moglich ist , ihnen sinnvolle linguistische Terme zuzuordnen und interpretierbare Regeln zu formulieren. Der Fuzzy-Regier ents pricht dann eher einer Black Box, wie bei Neuronalen Netzen , bei der zwar interne Paramet er so eingeste llt wurden, dass ein gewiinschtes Verh alten gezeigt wird , die Parameterwahl aber keine Int erpr etation zulasst. Giinstiger ist es, den Param et ersatz so zu wahlen, dass die Interpreti erbarkeit des Fuzzy-Reglers immer gewahrleistet ist . Eine Moglichkeit ware die Einschrankung auf Dreiecksfunktionen, die jeweils so gewahl t sind, dass der linke und rechte Nachbar einer Fuzzy-Menge an der Stelle den Wert Eins annehmen, an der die mittlere Fuzzy-Menge gerade auf null gefallen ist . Die Evolut ionsst rategie wiirde in diesem Fall pro Eingangs- oder Ausgangsgrofe gena uso viele reelle Par ameter hab en, wie Fuzzy-Mengen erwiinscht sind . Der jeweilige reelle Parameter gibt an, wo die ents prechende Dreiecksfunktion den Wert Eins annimmt. Selbst bei dieser Par ametri sierun g konnen noch unerwiinschte Effekt e auftreten, etwa wenn die Fuzzy-Menge etwa null dur ch Mutationen irgendwann die Fuzzy-Menge p ositiv klein iiberholt . Eine einfache Anderung der Par ametri sierung wiirden diesen Effekt vermeiden: Der Betrag des k-te n Parameters gibt nicht mehr die Lage der Spitze der Dreiecksfunkt ion absolut an, sondern wie weit sie von der Spitze der vorh ergehenden Dreiecksfunkt ion ent fernt ist. Der Nachtei l dieser Kodierung besteht darin , dass eine Anderung (Mutation) des erste n Wertes eine Verschiebung aller Fuzzy-Mengen zur Folge hat und damit eine recht groBe Anderung im Gesamtverhalt en des Reglers bewirken kan n. Werden die Dreiecksspitzen direkt paramet risiert , wirkt sich eine Mut ation nur lokal aus. Daher sollte man bei der direkten Par ametrisierun g bleiben, allerdin gs Mut ationen, die zum Uberholen von Fuzzy-Mengen fiihren, verbieten. Auf diese Weise bewirken Mutat ionen kleine Veranderungen und die Int erpreti erbarkeit des Fuzzy-Reglers bleibt erhalte n. Zusatztiche Parameter. Mit evolutionaren Algorithmen lassen sich insofern dies gewiinscht ist - auch weit ere Param et er eines Fuzzy-Reglers einste llen. Man kann beispielsweise eine parametri sierte t-Nor m fur die Aggregation der Regelpramissen verwenden und fur jede Regel den Par ameter der t-Norm individuell einste llen. Derselbe Ansatz bietet sich auch fur eine param etri siert e Defuzzifizierungsstrategie an. Derartige Par ameter hab en auf die Interpret ierbarkeit eines Fuzzy-Reglers meist nachteilige Effekt e und sollen daher an dieser Stelle nicht weite r verfolgt werden.
5.7 Fuzzy-Regler und evolutionare Algorithmen
383
Eine offene Frage bleibt, ob die Regelbasis und die Fuzzy-Mengen gleichzeitig oder naeheinder optimiert werden soUten. So lange sieh die Regelbasis noeh massiv andern kann , erseheint es wenig sinnvoU, eine Feinoptimierung der Fuzzy-Mengen vorzunehmen. Die Regelbasis stellt eher das Grundgeriist des Fuzzy-Reglers dar, wahrend die konkrete Wahl der Fuzzy-Mengen mehr fur die Feinjus tierung verantwortlieh ist . Urn den evolutionaren Algorithmus nieht mit einer zu graBen Param cterzahl zu iiberfrachten , empfiehlt es sich, zuerst die Regelbasis auf der Grundlage von St and ard-Fuz zy-Partitionen zu erlernen und danach die Fuzzy-Mengen bei festgehaltener Regelbasis zu optimieren .
5.7.4 Ein Genetischer Algorithmus zum Erlernen eines TSK-Reglers
Urn das Prinzip der Parameterkodierung zu verdeutlichen st ellen wir im Folgenden einen Genetischer Algorithmus zum Erlernen eines TSK-Reglers vor, der in [102] vorgeschlagen wurd e. Der Algorithmus versuch t aUe Parameter des Reglers, d .h. die Regelbasis, die Form der Fuzzy-Mengen und die Paramet er der Konklusionen , gleichzeitig zu optimieren. Urn die Regeln R; : If Xl is J.l~) and . . . and
Xn
is Ilf:) then Y =
fr( XI , .. .
,xn ) ,
mit f r( XI, " .,
x n ) = P~
+ Xl
. P~
+ .. .+ X n
. P~
eines Takagi-Sugeno-Reglers erlernen zu konnen , miissen die Fuzzy-Mengen der Ein gabegrofen und die Parameter Po, . . . -P« jeder Regel kodiert werden. Eine dr eiecksforrnige Fuzzy-Menge wird in diesem Ansatz durch drei binar kodierte Par ameter beschrieb en (m em bership [un ction ch rom osom MFC) : left base
center
rightbase
I 10010011 I 10011000 I 11101001 I Die Parameter leftbase, t igbtbese und center sind dabei keine absoluten Grofen , sondern bezeichnen die Abstand e zu einem Bezugspunkt. left base und t igbibese beziehen sich auf den Mittelpunkt (cent er) einer Fuzzy-Menge und center bezieht sich auf den Abstand zum center des linken Naehbarn der Fuzzy-Menge. Wahlt man diese Parameter positiv, werden Uberholungseffekte und anormale Fuzzy-Mengen vermied en. Die Parameter Po , . . . , Pn einer Regel werden direkt dur ch Binarzahlen kodiert und ergeben das rule-consequent param et ers chrom osom e (RPC): Po
I 10010011
c:J
Pn
11101001 I
Die komplette Regelbasis eines TSK-Reglers wird basierend auf diesen Parameterkodierungen dann in Form eines Bit-Strings kodiert:
384
5. Einstellung und Optimierung von Fuzzy-Reglern
GroBe 1
Crofc n
Paramet er der Konklusionen
Neben der Par ameteroptirnierung wird versucht , die Anzahl der FuzzyMengen einer GroBe und dam it auch die Anzahl der Regeln in der Regelbasis zu rninimieren. Dabei wird von einer maximalen Anzahl von Fuzzy-Mengen ausgegangen. Es werden diejenigen eleminiert, die nicht mehr im zulassigen Wertebereich einer GroBe liegen. Des Weiteren werden RegIer mit weniger Regeln bei der Selektion gegeniiber anderen mit gleicher Leistung bevorzugt . In [102] wurde dieser Ansatz mit einem invertierten Pendel (StabbalanceP roblem) getestet . Fu r eine Regelbasis mit 5 Fuzzy-Mengen je Einga begrofie (2) und 8-Bit Binarzahlen ergibt sich eine Chromo somenlange von 2· (5·3· 8) + (5 ·5) · (3·8) = 840. Zur Bewertung wurd en die RegIer mit 8 Start bedingungen getestet und die Zeit gemessen, die der RegIer benoti gt , urn das Pendel in die Senkrechte zu bring en. Dab ei ist zwischen drei Fallen zu unterscheiden: 1. Gelingt es dem RegIer, das Pendel innerhalb einer festgelegt en Zeit spann e
in die Senkr echte zu bringen, erha lt er urn so mehr Punkt e je schneller ihm dies gelang. 2. Gelingt es dem RegIer in dieser Zeitspann e nicht , das Pendel senkrecht zu halten , erhalt er eine festgesetzt e Anzahl von Punkten , die in jedem Fall geringer ist als im ersten Fall. 3. Fallt das Pendel wahrend der Simulat ionszeit urn, erhalt der ents prechende RegIer urn so mehr P unkte, je Hinger das Pendel aufrecht blieb, jedoch weniger als in den beiden erste n Fallen. Fur das Erlernen eines 'brauchbaren' Reglers wurden tiber 1000 Generationen benot igt . Diese recht hohe Anzahl an Generat ionen ergibt sich aus der groBen Chrornosomenlange und den daraus enste henden groBen Schemata. Bei der Kodierung werden auBerdem kaum Nachbarschaftsbez iehungen ausgenutzt. So kann es sein, dass die Prarnisse einer Regel dur ch die am Anfan g des Chromsomoms kodierte Fuzzy-Menge bestimmt wird , die zugehorige Konklusion sich jedoch am Ende des Chromosoms befindet . Somit ist die Wah rscheinlichkeit , dass eine gute Regel bei einem Crossover wieder zerst ort wird recht hoch. Int eressant ist die Fahigkeit dieses Ansatzes, die Anzahl der benotigten Regeln zu minimieren. Im Vordergrund steht dab ei nicht alleine das Regelungsverh alten des Reglers zu opti mieren, sondern die fur die Regelung wicht igen Regeln zu bestimmen.
5. 7.5 Diskussion Wir haben verschiedene Ansatzen diskutie rt, wie Fuzzy-Hegler mit Hilfe von evolutionaren Algorithmen erlernt oder opt imiert werden konnen. Eine wesentl iche Rolle spielt dabei die Kodieru ng des Fuzzy-Reglers fur den evolut iona ren Algorit hmus. Die Kodieru ng sollte zum einen so gewahlt werden, dass
5.7 Fuzzy-Regier und evolutionare Algorithmen
385
- wie sich auch immer die Parameter im Rahmen der zugelassenen Moglichkeiten durch den evolutionaren Algorithmus ergeben ~ die Interpretierbarkeit des Fuzzy-Reglers gewahrleistet wird . Zum anderen sollte die Kodierung sicherstellen, dass der evolut ionare Algorithmus seine Starken ausspielen kann. Mutation zum Beispiel sollte nicht nur eine kleine Veranderung der kcdierten Paramet er zur Folge haben , sond ern auch nur eine kleine Anderung im Gesamtverh alt en des Reglers bewirken. Ins gesamt sollt e man versuchen , gtinstige Heuristiken zu verwend en, die sowohl die Interprctierb arkeit des Erg ebnis ses erleichte rn als auch den evolutionaren Algorithmus bei seiner Optimierungsstrat egie untersttitzen. Ein en Uberbli ck tiber die enorm groBe Anzahl von Publikationen im Bereich FuzzySyst erne und evolut ionare Algorithmen geben [32, 56, 57, 152].
A. Anhang
A .I Korrespondenztafel zur Laplace-Transformation
f(t)
mit
f(t
f(8) = I: {f(t)}
Impuls
5(t)
1
Sprung
s( t)
1 s
nr
tn
1 sn + l
sinwot
S2~QW6
coswot
s s2 + w6
h(t) e- a t
h(s + a)
388
A. Anhang
A.2 Systeme mit nicht-minimaler Phase Syst eme mit nicht-minimaler Phase hab en einige sehr unang enehm e Eigenschaften , die dazu fuhren, dass einige regelungste chnische Verfahren, wie beispielsweise viele ada ptive Fuzzy-Regler , bei solchen Strecken versagen. Deshalb ist es wichti g, sich mit diesen Syst emen nah er zu beschaftigen. Urn derartig e Syst eme besser definieren zu konnen, solI zunachst ein spezieller Typ rationaler Ubertragungsfunktionen eingefiihrt werd en, der Allpass. Dieser ist dadurch charakte risiert, dass der Betrag seines Frequenzgang es fur aIle Frequenzen gleich ist. Ein Laufzeitglied ware damit ein besonders einfaches Beispiel fur einen Allpass, doch werden normalerweise nur rein rationale , stabile Ubert ragungsfunktionen, deren Frequenzgan g den konstanten Betrag Eins hat , als Allpasse bezeichnet. Im Folgenden sollen nun die Eigenschaften dieser Ubertragungsglieder nah er betracht et werd en. Schreibt man den Frequenzgan g einer allgemeinen , rationalen Ubert ragung sfunktion in der Form m
G(j w) = bm a n
IT (j w _/1= -:::-1
n,..) _
n
(A.I)
ITUw-PII) 11 =1
so lassen sich Zahler- und Nenn erpolynom als Produkt von komplexen Vektoren auffassen. Offensichtli ch kann der Bet rag des Frequenzgang es nur dann ftir aIle Frequenzen konstant Eins sein , wenn Zahl er- und Nenner polynom vom selbe n Grad sind und zu jedem Vektor im Nenn er ein Vektor gleichen Betrages im Zahl er existiert . Set zt man teilerfr emde Polynome voraus, so ist dies nur erfullt fiir n il = -PII , wenn also Pole und NuIlste Ilen spiegelbildli ch zur irnaginaren Achse angeordnet sind (Abb . A.I) . Wegen der vorausgesetzt en Stabil it at der Ube rt rag ungsfunkt ion mtissen dab ei die Pole auf der linken Seite der imaginar en Achse liegen . j Im(s)
P3
Re(s) e
nz
Abb. A.I. Pole und Nullste llen bei einem Allpass
Als Beispiel sei ein Allpass erster Ordnung betracht et :
G(s)
= _ s - PI S
bzw . sein Frequenzgan g
+ Pl
(A.2)
A.2 Systeme mit nicht-minimaler Phase
G(jW) = _~W -
PI
=
e -j 2arctan
ii'1
389
(A.3)
JW+PI
Die zugehorige Ortskurve zeigt Abb . A.2. Eb enfalls abgebildet ist die Sprungantwort, bei der der Anfangswert ein dem Endw ert ent gegengesetztes Vorzeichen hat . Dieses Verh alten ist typiseh ftir einen Allpass und ma eht ihn so schwer zu regeln. Man muss sieh nur einen Mensehen vorst ellen, der als Regier fur einen Allpass fungieren soll. Wenn er in der Anfangsphase der Sprungantwort fest st ellt , dass seine Ste llgrofe anseheinend genau die falsehe Reaktion der Streeke hervorruft, wird er vermut lieh die Ste llgrofe in die entgeg engesetzte Richtung vera ndern, obwohl er doeh eigent lieh nur hatte abwarte n miissen. Dar an sieht man schon, dass ein prim iti ver RegIer nicht in der Lage sein wird , einen Allpass zu regeln. y(t)
j Im(G(jco»
Re(G(jco» -1+--
-
- --
Abb. A.2. Sprungantwort und Ortskurve eines Allpass erster Ordnung Anh an d des Frequenzga nges wird klar , dass ein Allpass die Stabilitat eines Syst ems gefiihrdet. Fiigt man beispielsweise zu einer gegebenen Kr cisiibertragungsfunktion einen Allpass hinzu , so wird der Absolutwert der Phase des Frequenzganges mit zun ehmendem W vergrofert, ohn e dass der Betrag verandert wird. Die Ortskurve wird dadureh in Abhangigkeit von W verdr eht. Offenbar steigt dami t aueh die Gefahr, dass der kritisehe Punkt -1 des Nyquist -Krite riums umlaufen wird, womit der gesehlossene Kr eis instabil ware. Abb . A.3 zeigt, wie die Ortskurve eines PTI -Gliedes dureh Hinzufiigen eines Allpass so verdreht wird , dass die Kurv e den Punkt -1 umsehlingt . Aus der Kr eisiibertragungsfunktion
v
s-
PI
G(s)K(s) = - - - - T s + 1 s + PI
(AA)
ist aber ersieht lieh, dass die Anzahl der Polst ellen auf und reeht s von der imaginiiren Aehse Null ist und die erla ubte Phasendrehung beziiglieh -1 laut Nyquistkriterium daher ebenfalls Null betriig t . Dies ist aber bei der reehten Ortskurve nieht der Fall. Die Phasendrehung bet riigt - 27f, und der gesehlossene Regelkreis ware instabil. Folgendes lasst sieh festst ellen : Dureh das Hinzufiigen des Allpasses wird nicht der Bet ra gsverlauf, wohl aber der Phasenverlau f des Frequenzganges
390
A. Anhang j Im(GK(jro»
j Im(GK(jro»
-I
Re(GK(jro))
Re(GK(jro))
PT]-Glied+ Allpass
PT]-Glied
Abb. A.3. PT1-Glied mit Allpass
verandert , und zwar wird der Absolutwert der Phase vergrofert. Das PT1Glied ohne Allpass weist also bei gleichem Bet ragsverlauf des Frequenzganges kleinere Absolutwerte der Phase auf. Diese Vergrofierung der Absolutwert e der Phase bei Hinzufugen eines Allpasses gilt offenbar ftir jedes st abile, rationale Ubertragun gsglied. Andererseits lasst sich zeigen, dass ein rationales Ubertragungsglied ohne Allpass die fur einen gegebenen Betragsverlauf kleinstrnoglichen Absolutwerte der Phase aufweist . Ein solches Ubertragungsglied bezeichnet man daher als Minim alphasenglied , wahrend ein Ubertragungsglied mit Allpass als Nicht-Minim alphasenglied bezeichnet wird. Offenbar konnen nur Ubert ragungsglieder, die weder Null- noch Polstellen mit positivem Realt eil entha lten, Minimalphasenglieder sein. Denn von jeder anderen, stabilen, rationalen Ubertragungsfunktion lasst sich noch ein Allpass abspalte n, wie das folgende, einfache Beispiel zeigt : G( s)
s -2
s + 2 s -2
= --1 = --1 --2 = Gmin(S)G aU( s) s+ s+ s+
(A.5)
Eine ration ale Ubertragun gsfunktion , die Nullstellen mit posit ivem Realte il aufweist, ent halt also einen Allpass und ist demnach ein NichtMinimalphasenglied. In der Praxis tret en allpasshalt ige Strecken wesentlich haufiger auf, als man zunachst annimmt. Ein Beispiel fur eine allpass haltige Strecke ist ein Motorradfahrer, der eine Linkskur ve fahren will. Er muss zunachst eine kleine Bewegung nach recht s machen, urn die erforderliche Schraglage nach links zu bekommen. Ein anderes Beispiel ist das Heck eines Flugzeuges, das beim Ubergang vom Horizontal- in den Steigflug zunachst nach unt en absackt, bevor es sich dann schliefllich nach oben bewegt .
A.3 Normen
391
A.3 Normen Mit den hier angegebenen Definit ionen soll lediglich das Grundgeriist vermittelt werden , das zum Verstandnis der Normen von Ubertragungsgliedern notwendig ist. Eine wesentli ch ausfiihrlichere Darstellung findet sich z.B. im Anhang von [18] .
Definition A.I Ein e Menge X heisst Linearer Raum, wenn eine Addition und eine Skalarmultiplikation definiert sind, fur die folgende Eigenschaften gelten (dabei sind x, y , ZEX und a, b kompl exe Zahlen) : (Kommutativit iit)
x + y = y +x
x + (y + z ) = (x + y) + z
(Assoziativitiit)
O+x =x
(Exist enz eines Nullel em entes)
x +x =x + (-x ) = O
(Exist enz eines inve rsen Elem ent es)
a( x
+ y) =
(a + b)x (ab)x
+ ay
(Distributivitiit)
= ax + bx = a(bx)
(Distributivitiit)
ax
Ix = x
(A.6)
(Assoziati vitiit) (N eutrales Elem ent)
Definition A.2 Ein linearer Raum X heisst normiert, wenn eine reellwertige Norm II_II mit den folgenden Eigenschaften defini ert ist (dabei sind x, yEX und a eine kompl exe Zahl) :
Ilxll > 0 Ilxll = 0 Ilx + yll ~ Ilxll + Ilyll Ilaxll = lal llxli
fur x
-I 0
fur x = 0 (Dreiecksungleichung)
(A.7)
Die Menge der fur -00 < t < 00 in der p-t en Potenz 1 ~ P < 00 absolut int egrierbaren Funktionen 1(t) bilden offenbar einen linear en Raum, und zwar den Raum L p • Normiert wird dieser Raum durch die sogenannte p-Norm einer zeitve randerlichen Funktion:
Ilfll, ,~ Fur p = Norm
00
erhalt man den Raum
(Z
1
If(tll'dt) ,
(A .8)
£00 der beschrankten Funktionen mit
11/1100 :=
sup t
I/(t)1
der
(A.9)
392
A. Anhang
Falls f(t) ein Signal am Ein- oder Ausgang eines Systems ist , so lasst sich ftir p = 2 die sogenannte 2-Norm als ein Mail fur den Energieinhalt des Signales deuten, also ftir die En ergie, die in das System hinein- oder aus ihm herausgefUhrt wird . Als Beispiel sei f(t) = u(t) die Spannung an einem elekt rischen Wid erstand R. Dann ergibt sich fur die 2-Norm
00
00
J
IIf l1 2= lIul12=
lu(t)l2dt =
R
-00
J~U2 (t)dt
-00
00
R
J -00
P(t)d t
=
V RW
(A. 10)
mit der im Widerstand umges etzten elekt rischen Leistung P und der En ergie W . Die 2-Norm ist hier demn ach proportional zur Wurz el aus der elekt rischen En ergie. Die Vekt orfunktionen f = [h(t), ..., f n(t )]T
(A.H)
< 00
lautet eine mo gliche Norm
mit f if.Lp bilden den Raum fiir diesen Raum:
L~ .
Fur 1 :::; p
(A.12)
und ents prechend fur p
= 00
11£1100
:= . max
t= l , ... ,n
IIhlloo
(A.13)
Nicht zu verwechseln mit den Funktionenn orm en sind die Normen gewohnlicher kompl exwertiger Vekt oren , wie z.E.:
(A.14)
Fur k = 2 ergibt sich die euklidische Vektornorm , die, urn der Verwechslungsgefah r vorzube ugen, mit einfachen Bet ragsstrichen gekennzeichnet werd en so11: n
Ixl:=
L ;=1
IXi 12
(A.15)
A.3 Normen
393
D efinition A .3 Ein Operator T auf einem linearen Raum X heisst linear , wenn fur beliebige x , Yf.X und kompl exe Zahlen a, b gilt: T(ax
+ by ) = a T x + b Ty
(A.16)
Dabei ist T x := T( x) .
Definition A.4 Ein Operator T auf einem normiert en Raum X heisst beschriinkt, wenn ein e reelle Zahl c existiert, so dass fur alle Xf. X gilt:
IITxl 1~ cIlxll Die kleinst e derartige Schrank e heisst Op eratornorm und wird mit zeichne t: IITxl 1~ IITll llxl1
(A.17)
IITII be(A.18)
Fur T 0 = 0 lasst sieh die Op eratornorm offensieht lieh nach
IITII =
sup xfO
II Txl1 Ilxll
(A.19)
bestimmen. Mit den jet zt bekan nten Definit ionen soli nun noeh ein spezieller und fur die Praxis bcsonders wiehtiger Fall behandelt werden . Gegeben sei der Ra um L~ der Vektorfunktionen gemaf (A.l1) mit der zugehorigen Norm ftir p = 2 naeh Gleiehung (A.12 ). Interpret iert man eine solehe Vektorfunktion als Signalvektor am Ein- oder Ausgan g eines Syst ems, so st ellt die 2-Norm ein MaB fur den En ergieinh alt des Signalvektors dar. Der Op erator , der einen Signalvektor auf einen ande ren ab bildet, ist bei linearen Syst emen die Ubertragun gsmatrix G (jw ). Die Abbildung eines Ein gan gsvektors x auf einen Ausgan gsvektor y erfolgt im Frequ enzbereieh dureh Multiplikation des Eingan gsvektors mit der Ubertragun gsmatrix: y = Gx. Es lasst sich zeigen , dass auf dem dureh die 2-Norm norm ierten Raum L ~ die zum Op erator G gehor end e Operatornorm naeh Definit ion A.4 die oo-Norm der Ubertragungsmatrix IIG(jw)l loo ist . Fur diese Norm kann man wiederum die folgende n Zusammenh ang e hcrleit cn:
. )II IIG (Jw
00
= sup
x /O
-IIyl1 IIx-II2 2
= sup a- {G (jw)}
(A.20) (A.2I)
w
= sup sup w
= sup w
xf O
V
IG(jw)x l Ix I
Am a x { G(jw)T G(jw)}
(A.22) (A.23)
394
A. Anhang
Gleichun g (A.20) spiegelt das schon gesagte wider: x ist die Vekt orfunktion am Ein gang des Systems, y die Vektorfunktion am Ausgang und G der zuge hor ige Op erator. Gleichun g (A.20) ents pricht damit gerade Gleichun g (A.19) . Die co-Norm einer Ube rtragungsmatrix kennzeichnet demn ach das max ima l mogliche Ubertragungsverha lt nis von Eingan gs- zu Ausga ngsenergie des Systems. i1{G (j w)} in Gleichung (A.21) ist der maximale sing uliire Wert der Matrix G (j w ), der auch als Spek tralnorm bezeichnet wird . Die 00Nor m ist dami t die max imal mogliche Spektraln orm tiber aile Frequenzen w. Die Spekt ralnorm einer Mat rix kennz eichnet lau t (A.22) wiederu m das maximal mogliche Betrags-Ub ertragun gsverhaltnis zwischen Ein- und Au sgangsvekto r der Matrix G (j w ) bei einer festen Frequenz w. Dami t ist die Spekt ra lnorm wegen (A.19) abe r gerade die Op eratornorm des Op erators G auf dem durch die euklidische Vekt ornorm normierten gewohnlichen Vektorraum. Der Unterschied zwischen Gleichung (A.20) und (A.22) ist, das s in die 2-Norm der gesamte int egrierte Signalverlauf eingeht , wahrend in (A.22) nur der Betrag des zu einem einzigen Zeitpunkt anli egend en Vektors gebildet wird . Da die Spektraln orm das maximale Betrags-Ub ertragun gsverhaltnis fiir eine ganz bestimmte Frequ enz w ist und andererseits fur die oo-No rm das Maximum tiber aile Frequ enzen gebildet werd en muss, folgt aus Gleichung (A.22) weite rhin, dass die oo-Norm hinsichtli ch der euklidischen Vektorno rm de n grofitmoglichen Ube rtragungsfa ktor dar st ellt , der bei dem gegebenen System iiberhaupt auftreten kann. Berechnen lasst sich die Spe ktralnor m und damit auch die co-No rm gemaf (A.23) aus dem maximalen Eigenwert Am ax des Produktes aus der Matrix mit ihre r konjugiert kompl ex Transpo nierten. Aus Gleichung (A.22) lasst sich fiir Eingroflenstrecken sofort der einfache Zusamm enh ang (A.24) IIG(jw) lloo = sup IG(jw)1 < 00 w
ableite n. Hier ist die co-Norm also gera de der maximale Abstand der Ortskurve vorn Urspru ng. Da dieser Wert nach Definition A.4 endlich sein muss, darf die Ub ertragun gsfunkti on keine Pole auf der imaginaren Achse besit zen . Bei nichtlinear en Syste mcn ist zu berticksichti gen , dass der Au sgan gsvektor y nicht mehr wie bei linear en Syst emen durch cine Mul tiplikation des Eingan gsvektors mit einer Ub ertragun gsmatrix gebildet wird , sondern eine nichtlinear e Funktion des Ein gangsvektors und gegeb enenfalls seiner Ableit ungen ist: y = f(x ,x, ...). Die Gleichun gen (A.21) und (A.23) sind daher auf nichtlinear e Syst eme nicht ub er tr agbar , so dass sich fur die oo-Norm nur die folgend en Zusarnm enhan ge ergeben:
lvl IIyl12 Ilf lloo = sup -I I = sup -I I -II x #O x x #O x 2
(A.25)
Die Supre mumbildung beinh altet dabei nicht nur die Sup rem umbildung tiber aile x =1= 0, sondern auch tiber aile Ableitungen von x. Interessan t ist , dass sich nu n auch eine verallgemei nerte Fassung der Ube rtragungsstabilitat (BIBO-Stabilitat) angeben lasst:
A.3 Normen
395
Definition A .5 Ein System mit der EingangsgrojJe x und tler AusgangsgrojJe y heisst Lp-stabil, wenn die p-Norm der AusgangsgrojJe durch die pNorm der EingangsgrojJe beschriinkt ist (0::; c < (0) :
fur aile x
(A.26)
Dab ei ist diese Definition strenger als die der BIBO- Stabilit iit. Dort musste bei einem beschrank ten Eingangssignal das Ausgangssignal lediglich ebenfalls beschrank t sein. Bei einem Lp-stabilen Syst em muss dariib er hinaus bei verschwindendem Eingangssigna l das Ausgangssignal ebenfalls verschwinden. Offensichtlich ist Def. A.5 gleichbedeute nd mit der Forderung, dass die Norm des das System char akterisierenden Operators beschrank t ist :
IITII ::; c < 00 II - II ist
mit y = T x
(A.27)
dab ei die zur obigen p-Norm gehorende Operatornorm. Demnach gara nt iert ein endlicher Wert fur die oo-Norm bei linearen Systemen nach Gleichung (A.20) Lz-St abilit iit und nach Gleichung (A.22) auch die einfache BIBO-Stabilit iit . Dasselbe gilt fur nichtlin eare Syste me nach Gleichung (A.25).
396
A. Anhang
A.4 Die Ljapunov-Gleichung Satz A.6 Es sei Q eine symm etrische, positiv definite Mat rix. Dann ist die Losung P der Lj apunov-Gleichung A Tp +PA=-Q
(A.28)
genau dann positiv definit, wenn die Matri x A ausschlieJ1lich Eigenwerte mit negativem Realteil aufweist. Beweis (vgl. [81]): Zunachst soli vora usgesetzt werden, dass A ausschlieBlich Eigenwerte mit negati vem Realt eil aufweist . Dar aus ist die positive Definit heit von P zu folgern. x sei ein Zust andsvektor des Systems
x =Ax
(A.29)
Weit erhin gilt unter Verwendung von (A.28):
%t (x T p x) = x Tpx + x Tpx = x TATpx +xTpAx = - xT Q x
(A.30)
Die Int egration dieser Gleichun g liefcrt
J 00
xT(oo)Px(oo) - x T (O)Px(O ) = -
x T (t )Qx(t )dt
(A.31)
o Da A ausschlieBlich Eigenwerte mit negat ivem Realteil aufweist , ist das Syste m (A.29) stabil im Ljapunovschen Sinne , d .h. der Zustandsvektor x konvergiert aus jede m Anfangszust and gegen Null: x (oo) = o. Zudem gilt wegen der positiven Definitheit von Q (A.32) fiir alle x . Insgesamt wird dam it aus (A.31)
J 00
x T (O )Px(O) =
x T (t )Qx(t )dt > 0
(A.33)
o Da diese Ungleichung fiir jeden Anfangszustand x (O) erfiillt ist , muss auch P positiv definit sein . In anderer Richtung wird nun die positi ve Definitheit von P vorausgesetzt. Daraus ist zu folgern , dass A ausschlieBlich Eigenwert e mit negativem Realt eil besitzt. Zun achst lasst sich filr das System (A.29) eine Ljapunov-Funktion (A.34)
A A Die Ljapun ov-Gleichung
397
angeben, die wegen der positiven Definitheit von P sicher ebenfalls positiv definit ist . Fur die Ableitu ng dieser Ljapunov-Funktion gilt mit (A.3D)
(A.35) Diese Ableitung ist wegen der positiven Definith eit von Q sicherlich negativ definit . Daraus folgt die Stabilitat des Systems (A.29) und damit wiederurn die Tat sache, dass A ausschlieBlich Eigenwerte mit negati vem Realt eil aufweist .
398
A. Anhang
A.5 Die Lie-Ableitung Definition A.7 Gegeben sei die skalarwertige Funkt ion "\(x) des Vektors x = [Xl , ..., xn ]T sowie die Vektorfunktion f(x) = [II(x), ..., fn(x)jT . Die LieAbl eitung von ),(x) entlang f(x) ist defini ert als die skalarwertige Funktion o),(x ) L~ Ii(x) n
Lc)'(x) =
i= l
(A.36)
'
Definition A.8 Die wiederholte Lie-Abl eitung zuniichst entlang f(x) und dann en tlang g(x) ist definiert zu
(A.37)
Definition A .9 Die k-fache Lie-Abl eitung von ),(x) entlang f(x) ist die skalarwertige Funkt ion L~)'(x), die als R ekurs ion sbeziehung definiert ist durch
(A.38) mit L~)'(x) = ),(x) .
A.6 Positiv reelle Systeme
399
A.6 Positiv reelle Systeme Je nach Dimension und Beschreib ungsform des Systems kann einer der folgenden Satze herangezogen werden, um zu best immen, ob das vorliegende System (stre ng) positiv reell ist . Auf den Beweis der Satze soll hier verzichtet werden . Satz A .IO Ein lineares Eingroflensystem ist genau dann streng positiv reell, wenn seine Ubertragungsfunktion nur Pole mit negativem Realteil aufweist utul Re( G(jw)) > 0 fur w ~ 0 gilt. Ein Mehrgroflensystem mit quadratischer Ubertragungsmatrix G (s ) ist qencu dann streng positiv reell, wenn die Elemente G ij (s) der Ma trix ausschliefl lich Polstellen mit negativem R ealteil aufweisen und auflerdem die hermi tesche Ma trix 1 -T H (j w) = 2( G(jw) + G (jw)) (A.39) fur aile w weist.
~
0 positiv definit ist , d.h. aussc hliefllich positive Eigenwerte auf-
Wegen der negat iven Realtei le der Pole aller Teiliibertragungsfunktio nen ist jede einzelne Ubertragungsfunktio n und da mit das gesamte System stabil. Die Stabilitat eines Systems ist demnach eine Voraussetzung dafiir, dass es auch streng positiv reell ist . Satz A .ll Ein durch
x = A x -l Bu y
= Cx-l Du
(A.40)
gegebenes lineares System ist genau dann streng positiv reell, wenn die folgenden Bedingungen erfullt sind: • Das lin eare System muss vollstiindig steuer- und beobachtbar sein. • Es muss Matrizen L , P und Y geeigneter Dimension geben mit
A Tp
+ PA =
- LLT
(A.41) (A.42) (A.43)
LY = C T -PB D +DT = y Ty
• grad(L) = grad(A) = n • P ist symmetrisch und positiv definit: P = p T und P
>0
Anmerk ung: Aus grad( L) = n folgt hier, dass LLT eine symmetrische, positiv definite Mat rix ist . Weiter hin ist P nach Voraussetz ung ebenfalls positiv definit. Damit folgt aus (A.41) und Satz A.5, dass A nur Eigenwerte mit negat ivem Realteil aufweist. Auch aus diesem Satz lasst sich also ableiten, dass die Stabilitat eine Voraussetzung dafiir ist, dass das System positiv reell ist.
400
A. Anhang
A.7 Lineare Matrixungleichungen Die Darstellun g in diesem Abschnit t folgt im wesentli chen der Darst ellung in
[169]. Das Grundproblem in der Theorie der linearen Matrixungleichungen (linear matrix inequalities, LMI's) kann folgendermaBen formuliert werd en: Gegeben sei eine symmet rische Matrix, deren Koeffizienten affin von gewissen freien Paramete rn abhange n. Kann man diese freien Paramet er dann so wahlen, dass die symmetrische Matrix negativ definit wird , d.h . ausschlieBlich negati ve Eigenwerte besitzt ? Dab ei ist eine affine Funkt ion eines Par amet ers a definiert durch f(a) = aa + b, wobei a und b Konstant en sind . Eine affine Funktion ist demn ach eine linear e Funktion, erweitert urn einen konstanten Ant eil. Mit x als Vekt or der freien Paramet er und F(x) als symmet rische Matrix, deren Koeffizienten affin von den freien Parametern abhangen, lasst sich das Gru ndproblem auch anders definieren: Existiert ein Vektor x , fur den F(x)
<0
(A.44)
gilt? Wegen der Affinitat der Matrixfunktion F (x ) ist die Losun gsmenge fur x immer konvex. Und dies ist der entsc heidende Grund daftir, dass die Losbarkeitsfrage mittels passend er nummerischer Algorithmen vollst andi g beh andelt werd en kann . Ein Beispiel daftir ist die Matl ab LMI-Toolbox, mit deren Hilfe zum einen die Frage beantwortet werd en kann , ob ub erh aupt eine Losun g x des Problems existicrt, und die dan n, sofcrn cine Losung exist iert , eine solche Losun g auch berechnet . Die Aufgab e redu ziert sich mit einem derartigen Tool dar auf , ein vorhandenes Problem in die Form der Gleichung (A.44) zu bringen. Dabei sollen die folgend en Bemerkungen helfen: • Eine LMI der Form G(x) > 0 ist zu (A.44) mit G = -F aquivalent . • Bei der Matrixungleichung A T p + PA + Q < 0 mit der gesuchten Matrix p lasst sich F(x) = A T p + PA + Q setze n. Die Koeffizienten von P bilden dab ei den Vekt or x der gesuchte n Par amter. Offensichtlich sind die Koeffizienten von F affin von diesen Parametern abha ngig. Urn die Symm etrie von F zu gewahrleiste n, mussen aber P und Q symmet risch sein. • Die Negativi tat einer Blockmatrix lasst sich mittels der Negativitat ihre r Blocks chara kte risieren:
(~
~)
< 0 <=} A < 0 und B - C T A - 1 B < 0 <=}
B < 0 und
A - CB - 1CT < 0
(A.45)
Die Ausdrticke B - C T A -IB und A - CB- 1CT werden als SchurKomplemente der Blockmat rix bezuglich der Blocke A und B bezeichnet .
Literaturverzeichnis
401
Mit Hilfe der Schur-Komplemente lasst sich beispielsweise die Ricceti-
Ungleichung
ATp +PA - PBBTp+ Q < 0,
(A.46)
die keine affine, sondern wegen des dritten Summanden eine quadratische Ungleichung fiir die gesuchte Matrix P darstellt und damit zunachst nicht als lineare Matrixungleichung behandelt werden kann , in eine (A.44) entsprechende Form bringen: (A.47) Bei dieser Form hangen die einzelnen Koeffizienten der Matrix offensichtlich nur noch affin von den Koeffizienten von P ab o Setzt man in Gleichung (A.45) C = 0 , so folgt daraus, dass eine blockdiagonale Matrix genau dann negativ definit ist, wenn dies ftir jeden einzelnen Ihrer Blocks zutrifft. Damit liisst sich wiederum das System endlich vieler linearer Matrixungleichungen (A.48) F1(x) < 0 ,..., Fn(x) < 0 mit F(x) = diag(F1(x), ..., Fn(x)) auf die Form (A.44) bringen. Insbesondere das System aus Ungleichungen
A;P +PA i < 0
mit
i=I, ... ,n
(A.49)
fur eine gesuchte Matrix P liisst sich sehr einfach auf die Form (A.44) bringen:
( A;P+ PA, (A.50) Die Losungsmengen von (A.49) und (A.50) sind nach dem vorher gesagten offensichtlich aquivalent.
Literaturverzeichnis
1. J. Ackermann. Abtastregelung, Band I: Analyse und Synthese. SpringerVerlag, Berlin, 1983. 2. M. A. Aisermann und F . R. Gantmacher. Die absolute Stabilitiit von Regelsystemen. Oldenbourg-Verlag , Miinchen, 1965. 3. T . Azuma, R. Watanabe, K. Uchida und M. Fujita. A New LMI Approach to Analysis of Linear Systems Depending on Scheduling Parameter in Polynomial Forms. Automatisierungstechnik, 48:199-204, 2000. 4. R. Babuska und H. B. Verbruggen. Fuzzy Modeling and Model-Based Control for Nonlinear Systems. In M. Jamshidi, A. Titli, S. Boverie und L. A. Zadeh, Hrsg. , Applications of Fuzzy Logic: Towards High Machine Intelligence Quotient Systems, pages 49-74. Prentice Hall, New Jersey, 1997. 5. T . Back . Evolutionary Algorithms in Theory and Practice. Oxford University Press, New York, 1996. 6. A. G. Barto. Reinforcement Learning and Adaptive Critic Methods. In D. A. White und D. A. Sofge, Hrsg. , Handbook of Intelligent Control. Neural, Fuzzy, and Adaptive Approaches , pages 469-491. Van Nostrand Reinhold, New York, 1992. 7. A. G. Barto, R. S. Sutton und C. W . Anderson. Neuronlike Adaptive Elements That Can Solve Difficult Learning Control Problems. IEEE Transactions on Systems, Man , and Cybernetics, 13:834-846 , 1983. 8. R. E . Bellmann. Dynamic Programming. Princeton University Press, Princeton, NJ, 1957. 9. H. R. Berenji und P. Khedkar. Learning and Tuning Fuzzy Logic Controllers through Reinforcements. IEEE Transactions on Neural Networks , 3:724-740, 1992. 10. R. Berstecher, R. Palm und H. Unbehauen . Entwurf eines adaptiven robusten Fuzzy sliding-mode-Reglers, Teil1. Automatisierungstechnik, 47:549-555, 1999. 11. R. Berstecher, R. Palm und H. Unb ehauen. Entwurf eines adaptiven robu sten Fuzzy sliding-mode-Reglers, Teil2. Automatisierungstechnik, 47:600-605, 1999. 12. R. Berstecher , R. Palm und H. Unbehauen. Entwurf eines adaptiven robusten Fuzzy sliding-mode-Reglers, Teil 3. Automatisierungstechnik, 48:35-41, 2000. 13. D. P. Bertsekas. Dynamic Programming. Prentice-Hall , Engl ewood Cliffs, NJ , 1987. 14. D. P. Bertsekas. Dynamic Programming and Optimal Control. Athena Scientific , Belmont, MA, 1995. 15. J . C. Bezdek. Pattern Recognition with Fuzzy Objective Function Algorithms. Pl enum Press, New York, 1981. 16. J . C. Bezdek . Fuzzy Mode ls - What Are They, and Why? IEEE Transactions on Fuzzy Systems, 1:1-5, 1993.
404
Literaturverzeichnis
17. H. H. Bock. Clusteranalyse mit unscharfen Partitionen. In H. H. Bock, Hrsg. , Klassifikation und Erkenntnis: Vol. III: Numerische Klassifikation, pages 137163. INDEKS, Frankfurt , 1979. 18. J . Boeker, I. Hartmann und C. Zwanzig. Ni chtlineare und adaptive Regelungssyt em e. Springer-Verlag, Berlin, 1986. 19. H. W. Bode. Network Analysis and Feedback Amplifier Design. D. van Nost rand, Princeton/New Jersey, 1945. 20. R. Bohm und V. Krebs. Ein Ansatz zur Stabilitatsanalyse und Synthese von Fuzzy-Regelungen. Automatisierungstechnik , 41:288-293, 1993. 21. H.-H. Bothe. Neuro -Fuzzy-Methoden. Spri nger-Verlag, Berlin , 1997. 22. M. Braae und D. L. Rutherford. Theoretical and Linguistic Aspects of the Fuzzy Logic Controller. Automatica, 15:553-577, 1979. 23. R. Brause. N euronale Netze, 2. iiberarbeit et e und erweitert e Auflage. TeubnerVerlag , Stuttgart, 1995. 24. I. N. Bronstein und K. A. Semendjajew. Taschenbuch der Math ematik. Verlag Harri Deutsch, Frankfurt/Main, 1983. 25. H. Buh ler. Stabilitatsuntersuchung von Fuzzy-Reglern . In VDI-Berichte 1113, pages 309-318. VDI-Verlag GmbH , Dusseldorf, 1994. 26. D. Butnariu und E.-P. Klement . Triangular Norm-Based Measures and Games with Fuzzy Coalitions. Kluwer Academic Publishers , Dordrecht, Netherlands , 1993. 27. S. G. Cao , N. W . Rees und G. Feng. Stability Analysis of Fuzzy Control Systems. IEEE Transactions on Systems, Man, and Cybern etics - Part B : Cybern etics, 26:201-204, 1996. 28. Y.-Y. Cao und P. M. Frank. Ana lysis and Synthesis of Nonlinear T ime-De lay Systems via Fuzzy Control Approach. IEEE Transactions on Fuzzy Systems, 8:200-211 , 2000. 29. Y.-Y. Cao und P. M. Frank. Robust Hoo Disturbance Attenuation for a Class of Uncertain Discrete-Time Fuzzy Systems. IEEE Transactions on Fuzzy Systems, 8:406-415, 2000. 30. Y. Chen . Stability Analysis of Fuzzy Control - A Lyap unov Approach. IEEE, 1987. 31. Y. Y. Chen und T . C. Tsao. A Description of the Dynamical Behavior of Fuzzy Systems. IEEE Transactions on Systems, Man, and Cybern etics, 19:745-755 , 1989. 32. O. Cordon , F . Herrera, F. Hoffmann und L. Magdalena . Gen etic Fuzzy Sy stems: Evolutionary Tuning and Learning of Fuzzy Knowledge Bases. Advances in Fuzzy Systems. World Scientific Publishing, Singapore, 2001. 33. L. Cremer. Ein neues Verfahren zur Beurteilung der Stabilitat linearer Regelsysteme. Zeits chrift fur angewandte Math ematik und Mechan ik, 25(27) :161, 1947. 34. R. N. Dave. Ch aracterization and Det ect ion of Noise in Clustering. Pattern Recognition Letters, 12:406-414, 1991. 35. J . V. de Oliveira und J . M. Lemos . Long-range predictive adaptive fuzzy relational control. Fuzzy Sets and Systems , 70:337-357, 1995. 36. J . C. Doyle, B. A. Fra ncis und A. R. Tannenbaum. Feedback Control Th eory. Macmillan , New York, 1992. 37. J . C. Doyle, K. Glover, P. Khargonekar und B. A. Francis. State-Space Solutions to Standard H2 and H oo Control Problems. IEEE Transactions on Automatic Control, 34:831-847, 1989. 38. D. Driankov, H. Hellendoorn und M. Reinfrank. An Introduction to Fuzzy Control. Springer-Verlag, Berlin, 1993.
Literaturverzeichnis
405
39. S. E. Fahlmann. An empirical stud y of learning speed in back-propagation networks, Technical R eport CMU-CS-88-162. Carneg ie Mellon Universit y, Pittsburgh, PA , 1988. 40. D. P. Filev und P. Angelov. Fuzzy optimal cont rol. Fuzzy S ets and Systems , 47:151- 156, 1992. 41. D. P. Filev und R. R. Yager. On t he analysis of fuzzy logic cont rollers. Fuzzy Sets and Systems, 68:39-66, 1994. 42. K. Fischle und D. Schroder. An Improved St able Adaptive Fuzzy Control Method . IEEE Transactions on Fuzzy Syst ems, 7:27-40, 1999 . 43. O . Follinger . Laplace- und Fourier- Transformation. Elitera-Verlag , Berlin , 1977 . 44. O. Fellinger. Regelungstechnik. Hiithig- Verlag, Heidelberg, 1992 . 45. O. Follinger, Nichtlin eare Regelungen, Band I. Oldenb our g-Verlag , Miinchen, 1993. 46. O. Follinger . Nichtlin eare Regelungen, Ba nd II. Oldenbourg-Verlag , Munchen, 1993 . 47 . K. Funahas hi. On the Approximate Realization of Continuous Mappings by Neural Networks . Neural Networks , 2:183-192 , 1989. 48. A. E . Gegov und P. M. Frank . Decompos ition of multivar iab le systems for distributed fuzzy cont rol. Fuzzy Sets and Systems, 73:329-340 , 1995 . 49. A. E. Gegov und P. M. Frank. Hierarchical fuzzy cont rol of multivariable systems . Fuzzy Sets and Sys tems , 72:299-310, 1995. 50. A. Gelb und W . E. V. Velde. Mult iple-Input Describing Functions and Non lin ear System Design. McGr aw-Hill, New York , 1968. 51. D. E . Goldb erg. Genetic Algorithms in Search, Optim ization and Machin e Learning. Addi son-Wesley, Reading, 1989 . 52. K. Goldn er und S. Kubik. Mathematische Grundl agen der Syst emanalyse. Verl ag Harri Deutsch, Frankfurt /Main , 1983. 53. M. B. Gorzalczany. Interval-valued fuzzy controller based on verbal model of object. Fuzzy Sets and Sys tems, 28:45- 53, 1988. 54. W. Hahn. Stability of Motion. Spr inger-Verlag, Berlin , 1967. 55. S. K. Halgamu ge und M. Glesner. Neural Networks in Designin g Fuzzy Syste ms for Real World Applicat ions. Fuzzy S ets and Sys tems , 65:1-12, 1994. 56. F . Herr era und L. Magdalena. Genetic Fuzzy Syste ms. Taira Mountain s Math em atical Publications, 13:93-121 , 1997 . 57. F . Herr era und J. L. Verd egay. Genetic Algorithm s and Soft Computing. Physica-Verlag, Heidelberg, 1996. 58. T . Hojo , T . Teran o und S. Masui . Stability analysis of fuzzy control syst ems based on ph ase space analysis. Japan ese Journal of Fuzzy Th eory and Sy stems , 4:639-654, 1992 . 59. J . Hopf und F . Klawonn , Learning t he Rule Base of a Fuzzy Controller by a Genetic Algorithm . In R. Kru se, J. Gebhardt und R. Palm, Hrsg. , Fuzzy Sy stems in Computer Science , pages 63-74. Vieweg-Verlag , Braunschweig, 1994. 60. F . Hoppner , F . Klawonn und R. Krus e. Fuzzy- Clust eranalyse: Verfahren fur die Bilderkennung, Klassifikat ion und Dat enanalyse. Vieweg-Verlag, Braunschweig, 1997. 61. F . Hoppner , F . Klawonn , R. Kru se und T . Runkler. Fuzzy Clus ter Analys is. Wiley, Chichester, 1999. 62. M. Hornik, M. St inchcombe und H. White. Mult ilayer Feedforward Networks Are Universal Approxi mators. Neural Networks, 2:359-366, 1989 . 63. C. S. Hsu . A Theory of Cell-to-Cell Mapping Dynam ical Systems. Journal of Ap plied Mechani cs, 47:931-939 , 1980.
406
Literaturverzeichnis
64. C. S. Hsu und R. S. Guttalu. An Unravelling Algorithm for Global Analysis of Dynamical Systems: An Application of Cell-to-Cell Mappings. Journal of Applied Mechanics, 47:940~948, 1980. 65. A. Hurwitz. tiber die Bedingungen, unter welchen eine Gleichung nur Wurzeln mit negativen reellen Teilen besitzt. Math. Annalen, 46:273, 1895. 66. G.-C. Hwang und S.-C. Lin. A stability approach to fuzzy control design for nonlinear systems. Fuzzy Sets and Systems, 48:279-287, 1992. 67. R. Isermann. Digitale Regelsysteme, Band I. Springer-Verlag, Berlin, 1988. 68. R. Isermann. Digitale Regelsysteme, Band II. Springer-Verlag, Berlin, 1988. 69. R. Isermann. Identifikation dynamischer Systeme, Band I. Springer-Verlag, Berlin, 1992. 70. R. Isermann. Identifikation dynamischer Systeme, Band II. Springer-Verlag, Berlin, 1992. 71. A. Isidori. Nonlinear Control Systems. Springer-Verlag, Berlin, 1995. 72. J.-S. R. Jang. ANFIS : Adaptive-Network-Based Fuzzy Inference Systems. IEEE Transactions on Systems, Man, and Cybernetics, 23:665-685, 1993. 73. C. Jianqin und C. Laijiu. Study on stability of fuzzy closed-loop control systems. Fuzzy Sets and Systems, 57:159-168, 1993. 74. J . Joh, Y.-H . Chen und R. Langari. On the Stability Issues of Linear TakagiSugeno Fuzzy-Models. IEEE Transactions on Fuzzy Systems, 6:402-410, 1998. 75. T . A. Johansen. Fuzzy Model Based Control: Stability, Robustness, and Performance Issues . IEEE Transactions on Fuzzy Systems, 2:221-234, 1994. 76. M. Johansson, A. Rantzer und K.-E . Arzen . Piecewise Quadratic Stability of Fuzzy Systems. IEEE Transactions on Fuzzy Systems, 7:713-723, 1999. 77. L. P. Kaelbling, M. H. Littman und A. W. Moore. Reinforcement Learning: A Survey. J. Artificial Intelligence Research, 4:237-285 , 1996. 78. J . Kahlert und H. Frank. Fuzzy-Logik und Fuzzy-Control {2.Auflage} . Friedr. Vieweg & Sohn Verlagsgesellschaft mbH, Braunschweig, Wiesbaden, 1994. 79. R. E . Kalman. On the General Theory of Control Systems. In Proc. 1st International Congress on Automatic Control 1960, Bd. 1, pages 481-492, London. Butterworths, 1961. 80. H. Kang. Stability and Control of Fuzzy Dynamic Systems via Cell-State Transitions in Fuzzy Hypercubes. IEEE Transactions on Fuzzy Systems, 1:267-279, 1993. 81. H. Kiendl. Totale Stabilitat von linearen Regelungssystemen bei ungenau bekannten Parametern der Regelstrecke. Automatisierungstechnik, 33:379386, 1985. 82. H. Kiendl. Robustheitsanalyse von Regelungssystemen mit der Methode der konvexen Zerlegung. Automatisierungstechnik, 35:192-202, 1987. 83. H. Kiendl und J . Ruger. Verfahren zum Entwurf und Stabilitatsnachweis von Regelungssystemen mit Fuzzy-Reglern. Automatisierungstechnik,41:138-144, 1993. 84. H. Kiendl und J . Ruger. Stability analysis of fuzzy control systems using facet functions . Fuzzy Sets and Systems, 70:275-285, 1995. 85. E. Kim und H. Lee. New Approaches to Relaxed Quadratic Stability Condition of Fuzzy Control Systems. IEEE Transactions on Fuzzy Systems, 8:523534,2000. 86. J. Kinzel, F. Klawonn und R. Kruse. Modifications of Genetic Algorithms for Designing and Optimizing Fuzzy Controllers. In Proc. IEEE Conference on Evolutionary Computation, pages 28-33, Orlando, FL. 1994. 87. K. Kiriakidis. Fuzzy Model-Based Control of Complex Plants. IEEE Transactions on Fuzzy Systems, 6:517-530, 1998.
Lit eraturverzeichni s
407
88. F. Klawonn. On a Lukasi ewicz Logic Based Controller. In MEPP '92 Int ernat ional S eminar on Fuzzy Control through Neural Int erpretations of Fuzzy S ets, Reports on Computer Science & Math emat ics, Ser. B No 14, page s 5356, 'Thrku . Abo Akad emi , 1992. 89. F. Klawonn. Fuzzy set s and vague environment s. Fuzzy Sets and Systems , 66:207-221 , 1994. 90. F . Klawonn und J . 1. Castro. Similarity in Fuzzy Reasoning. Mathware and Soft Computing, 2:197-228, 1995. 91. F . Klawonn und V. Novak . T he Relation between Inference and Interpolation in the Fram ework of Fuzzy Syste ms. Fuzzy Sets and Systems, 81:331-354, 1996. 92. T . Kohonen . Self-Organiz ed Formation of Topologically Correct Feature Map s. Biological Cybernetics, 43:59-69 , 1982. 93. B. Kosko , Hrsg. Neural Networks for Signal Processing. Prentic e Hall , Englewood Cliffs, NJ , 1992. 94. H.-J . Kowalsk y und G. O. Michler. Lin eare Algebra, 10. Aufiage. de Gruyt er , Berlin , 1995. 95. R. Krishnapuram. Fitting an Unknown Number of Lines and Pl an es to Im age Dat a Through Compatible Cluste r Merging. Pattern Recognition, 25:385-400 , 1992. 96. R. Krishnapuram. A Possibilistic Approach to Cluste ring. IEEE Transactions on Fuzzy Systems, 1:98-110, 1993. 97. R. Kruse, J . Gebhardt und F . Klawonn . Fuzzy-Systeme, 2. erweiterte Aufiage . Teubner-Verlag , Stuttgart , 1995. 98. T . Kuhn und J . Wernstedt . Ein Beit rag zur Losung von Adaptionsproblemen klassischer RegIer mit tels optima ler Fuzzy-Logik. Autom atisierungstechni k, 44:160-170,1996. 99. J . LaSalle und S. Lefschet z. Die Stabilitiitsth eorie von Ljapunow. Bibliographis ches Institut, Mannheim , 1967. 100. A. J . Laub. A Schur Method for Solving Algebraic Riccati Equation. IEEE Transactions on Automatic Control, 24:913-921, 1979. 101. C.-H. Lee und S.-D. Wang . A self-organizing ada pt ive fuzzy controller. Fuzzy Sets and Sy stems, 80:295-313, 1996. 102. M. Lee und H. Ta kagi. Integra t ing Design Stages of Fuzzy Systems Using Gen et ic Algorithms. In Proc. IEE E Int . Conf. on Fuzzy Sy stems 1993, pages 612-617, San Francisco. 1993. 103. S. Lefschet z. Stability of Nonlin ear Control Sys tems. Acad emic Press, New York , 1965. 104. A. Leonhard. Ein neues Verfahren zur St abilitatsuntersu chung, Archiv fur Elektrotechnik, 38:17, 1944. 105. W. Leonhard. Statistische Analyse lin earer Regelsystem e. Teubner-Verlag, Stuttgar t , 1973. 106. W . Leonhard. Einfuhrung in die Regelungstechnik. Vieweg-Verlag , Br aunschweig, 1985. 107. W . Leonhard. Digitale Signalv erarbeitung in der Mefl- und Regelungstechnik. Teubner-Verlag, Stuttg art, 1989. 108. W . Leonh ard. Control of Electrical Drives. Springer-Verlag, Berlin, 1996. 109. C.-T . Lin . A neur al fuzzy cont rol syste m with st ruc t ure and par ameter learning. Fuzzy Sets and Sy stems, 70:183-212, 1995. 110. C.-T. Lin und C.-C. Lee. Neural Fuzzy Systems. A Neuro-Fuzzy Synergism to Int elligent Systems. Prentice Hall, New York , 1996. 111. S. Liu und S. Hu . A method of generat ing cont rol rul e mod el and its application. Fuzzy Sets and Systems, 52:33- 37, 1992.
408
Literaturverzeichnis
112. M. A. Ljapunov. Problems general de la stabilite du mouvement (Ubersetzung aus dem Russischen) . Ann. Fac. Sci., 9:203, 1907. 113. L. Ljung. System Identification - Th eory for the User. Prentice Hall, Englewood Cliffs, New Jersey, 1987. 114. D. G . Luenberger. Observing th e State of a Linear System. IEEE Transactions on Military Electronics , 8:74-80, 1964. 115. D. G. Luenb erger. An Introduction to Observers. IEEE Transactions on Automatic Control, 16:596-602, 1971. 116. E . H. Mamdani und S. Assilia n. An Experiment in Linguistic Synthesis with a Fuzzy Logic Controller. International Journa l of Man Machine Studies, 7:1-13 , 1975. 117. A. Mayer , B. Mechler, A. Schlindwein und R. Wolke. Fuzzy Logic. AddisonWesley, Bonn, 1993. 118. A. W . Michailow. Die Methode der harmonischen Analyse in der Regelungstheorie (russ .). Automat. Telemek ., 3:27, 1938. 119. Z. Michalewicz. Genetic Algorithms + Data Structures = Evolution Programs. Springer-Verlag , Berlin , 1996. 120. K. Michels. A mod el-bas ed fuzzy controller. Fuzzy Sets and Systems, 85(2) :223-232, 1997. 121. K. Michels. Numerical st ability analysis for a fuzzy or neural network cont roller. Fuzzy Sets and Syst ems , 89(3) :335-350, 1997. 122. K. Michels und R. Kruse. Numerical stability analysis for fuzzy cont rol. Int ernational Journal of Appro ximate Reasoning , 16(1) :3-24 , 1997. 123. W. T. Miller, R. S. Sut ton und P. J . Werbos , Hrsg . Neural Networks for Control. MIT Press, Cambridge, MA, 1990. 124. R. R. Mohler. Nonlinear Systems, Vol. I, Dynamics and Control. Prentice Hall, New Jersey, 1991. 125. R. R. Mohler. Non linear Systems, Vol. II , App lications to Bilinear Control. Prentice Hall , New Jersey, 1991. 126. R. E . Moore . Interval Analysis. Prent ice Hall, Englewood Cliffs, 1966. 127. R. E . Moore. Methods and Appli cations of Interval Analysis. SIAM , Phil adelphia, 1979. 128. K. MUller. Ein Entwurfsverfahren fur selbsteinstellende robuste Regelungen. Dissertation, Institut ftir Regelungstechnik, TV Braunschweig, 1991. 129. K. MUller. Entwurf robuster Regelungen. Teubner-Verlag, Stuttgart , 1996. 130. N. Muskinja, B. Tovornik und D. Donlagic. How to Design a Discrete Supervisory Controller for Real-Time Fuzzy Control Syst ems . IEEE Transactions on Fuzzy Systems, 5:161-166 , 1997. 131. N. N. IEEE Transactions on Automatic Control: Special Issue on LinearQuad ratic-Gaussian Estimat ion and Control Problem. IEEE Transactions on Automatic Control, 16:527-869, 1971. 132. N. N. FSM - Fuzzy Stability Manager, Handbook. Transfertech GmbH , Braunschweig, 1996. 133. D. Nauck. NEFCON-I: Eine Simu lationsumgebung fur Neuronale FuzzyRegier. In 1. GI- Workshop Fuzzy-Systerne '93, Braunschweig. 1993. 134. D. Nauck und F . Klawonn . Neuro -Fuzzy Classification Initialized by Fuzzy Clustering. In Proc. 4th European Congress on Intellig ent Techniques and Soft Computing (EUFIT '96), pages 1551-1555 , Aachen . 1996. 135. D. Nauck, F . Klawonn und R. Kruse. Neuronal e Netze und Fuzzy-Systeme , 2. erweit erte Auflag e. Vieweg-Verlag , Wiesbaden, 1996.
Literaturverzeichnis
409
136. D. Nauck und R. Kruse. A Fuzzy Neural Network Learning Fuzzy Control Rules and Membership Functions by Fuzzy Error Backpropagation. In Proc. IEEE Int . Conf. on Neural Networks 1993, pages 1022-1027, San Francisco. 1993. 137. D. Nauck und R. Kruse. NEFCON-I: An X-Window Based Simulator for Neural Fuzzy Controllers. In Proc. IEEE Int. Conf. Neural Networks 1994 at IEEE WCCI'94 , pages 1638-1643, Orlando, FL. 1994. 138. O. Nelles und M. Fischer. Lokale Linearisierung von Fuzzy-Modellen. Automatisierungstechnik, 47:217-223 , 1999. 139. V. Nissen. Einfiihrun9 in Evolutioniire Algorithmen. Vieweg-Verlag , Braunschweig, 1997. 140. R. Noisser und E . Bodenstorfer. Zur Stabilitatsanalyse von Fuzzy-Regclungen mit Hilfe der Hyperstabilitatstheorie. Automatisierungstechnik, 45:76-83, 1997. 141. H. Nomura, I. Hayashi und N. Wakami. A Learning Method of Fuzzy Inference Rules by Descent Method. In Proc. IEEE Int. Conf. on Fuzzy Systems 1992, pages 203-210, San Diego, CA. 1992. 142. A. NUrnberger, D. Nauck und R. Kruse. Neuro-Fuzzy Control Based on the NEFCON-Model. Soft Computing, 2(4) :182-186, 1999. 143. H. Nyquist. Regeneration Theory. Bell System Technical Journal, 11:126, 1932. 144. H.-P. Opitz. Entwurf robuster, strukturvariabler Regelungssysteme mit der Hyperstabilitiitstheorie. VDI- Verlag GmbH , DUsseldorf, 1984. 145. H.-P. Opitz. Die Hyperstabilitatstheorie - Eine systematische Methode zur Analyse und Synthese nichtlinearer Systeme. Automatisierungstechnik, 34:221-230, 1986. 146. H.-P. Opitz. Fuzzy Control. Automatisierungstechnik, 41:A21-A24, 1993. 147. R. Ordonez und K. M. Passino. Stable Multi-Input Multi-Output Adaptive Fuzzy/Neural Control. IEEE Transactions on Fuzzy Systems, 7:345-353, 1999. 148. R. Palm. Sliding Mode Fuzzy Control. In Proc. of IEEE International Conference on Fuzzy Systems, San Diego, CA. IEEE, 1992. 149. C. P. Pappis und G. I. Adamopoulos. A computer algorithm for the solution of the inverse probl em of fuzzy systems. Fuzzy Sets and Systems, 39:279-290 , 1991. 150. Y.-M. Park, D.-C. Moon und K. Y. Lee. A Self-Organizing Fuzzy Controller for Dynamic Systems Using a Fuzzy Auto-Regressive Moving Average (FARMA) Model. IEEE Transactions on Fuzzy Systems, 3:75-82 , 1995. 151. P. C . Parks und V. Hahn. Stabilitiitstheorie. Springer-Verlag, Berlin , 1981. 152. W . Pedrycz, Hrsg . Fuzzy Evolutionary Computation. Kluwer Academic Publishers, Boston, 1997. 153. W. Pedrycz und H. C. Card. Linguistic Interpretation of Self-Organizing Maps . In Proc. IEEE Int . Conf. on Fuzzy Systems 1992, pages 371-378, San Diego, CA. 1992. 154. V. M. Popov. The Solution of a New Stability Problem for Controlled Syst ems . Automatic and Remote Control , 24:1-23, 1963. 155. V. M. Popov. Hyperstability of Control Systems. Springer-Verlag, Berlin, 1973. 156. E. P. Popow. Dynamik automatischer Regelsysteme. Akademie-Verlag, Berlin, 1958. 157. B. E . Postlethwaite. Building a model-based fuzzy controller . Fuzzy Sets and Systems, 79:3-13 , 1996.
410
Literaturverzeichnis
158. T . J. Procyk und E. H. Mamdani. A Linguistic Self-Organizing Process Controller. Automatica, 15:15-30, 1979. 159. M. Riedmiller. Selbstiindig lernende neuron ale Steuerungen. VDI- Verlag GmbH, Diisseldorf, 1997. 160. M. Riedmiller und H. Braun. A direct adaptive methode for faster backpropagation learning: The RPROP algorithm. In Proc. of IEEE Int . Conf. on Neural Networks (ICNN-93) , pages 586-591 , San Francisco CA . 1993. 161. M. Riedmiller, M. Spott und J . Weisbrod. FYNESSE: A hybrid architecture for selflearning control. In I. Cloete und J . Zurada, Hrsg., Knowledge-Based Neurocomputing, pages 291-323. MIT Press, Cambridge, 1999. 162. R. Rojas. Theorie der Neuronalen Netze : Eine systematische Einfiihrung. Springer-Verlag, Berlin, 1993. 163. E. J . Routh. Stability of a Given State of Motion. Adams Prize Essay, London, 1877. 164. J.-J. Riiger . Weiterentwicklung des Konzeptes der Facettenfunktionen zum Reglerentwurf und zur Stabilitatsanalyse. Automatisierungstechnik, 44:391398, 1996. 165. D. E . Rumelhart, G. E. Hinton und R. J . Williams. Learning Internal Representations by Error Propagation. In D. E. Rumelhart und J . L. McClelland, Hrsg ., Parallel Distributed Processing: Explorations in the Microstructures of Cognition . Foundations, Band 1, pages 318-362. MIT Press, Cambridge, MA, 1986. 166. T . Runkler und M. Glesner. A set of axioms for defuzzification strategies towards a theory of rational defuzzification operators. In IEEE International Conferen ce on Fuzzy Systems, pages 1161-1166, San Francisco. IEEE, 1993. 167. E. Sanchez . Resolution of composite relation equations. Information and Control, 30:38-48, 1976. 168. V. N. Sastry, R. N. Tiwari und K. S. Sastri. Dynamic programming approach to multiple objective control problem having deterministic or fuzzy goals. Fuzzy Sets and Systems, 57:195-202, 1993. 169. C. W . Scherer. Lineare Matrixungleichungen in der Theorie der robusten Regelung. Automatisierungstechnik, 45:306-318, 1997. 170. G. Schmitt und S. Giinther. Das Hyperstabilitatskurven-Verfahren als graphisches Frequenzbereichskriterium zur Stabilitatsprufung nichtlinearer MehrgroBenregelkreise. Automatisierungstechnik, 44:281-288, 1996. 171. M. Schroeder, R. Petersen, F . Klawonn und R. Kruse. Two Paradigms of Automotive Fuzzy Logic Applications. In M. Jamshidi, A. Titli, L. A. Zadeh und S. Boverie, Hrsg ., Applications of Fuzzy Logic - Towards High Machine Intelligence Quotient Systems. Prentice Hall, Upper Saddle River, 1997. 172. H. Schwarz. Nichtlineare Regelungssysteme. Oldenbourg-Verlag, Miinchen, 1991. 173. S. Shao. Fuzzy self-organizing controller and its application for dynamic processes. Fuzzy Sets and Systems, 26:151-164, 1988. 174. J . T . Spooner und K. M. Passino. Stable Adaptive Control Using Fuzzy Systems and Neural Networks. IEEE Transactions on Fuzzy Systems, 4:339359, 1996. 175. C.-Y. Su und Y. Stepanenko. Adaptive control of a class of nonlinear systems with fuzzy logic. IEEE Transactions on Fuzzy Systems, 2:285-294, 1994. 176. M. Sugeno. An Introductory Survey of Fuzzy Control. Information Sciences , 36:59-83, 1985. 177. M. Sugeno und T . Yasukawa. A Fuzzy Logic-Based Approach to Qualitative Modelling. IEEE Transactions on Fuzzy Systems, 1:7-31 , 1993.
Literaturverzeichnis
411
178. R. Sutton und 1. M. Jess. A design study of a self-organizing fuzzy autopilot for ship cont rol. Proceedings of the Inst itution of Mechanical Engineers, 205:35-47, 1991. 179. T . Takagi und M. Sugeno. Fuzzy Identification of Syst ems And Its App lications to Modeling and Control. IEEE Transactions on Systems, Man , and Cybern etics, 15:116-132, 1985. 180. K. Tanaka, T . Ikeda und H. O. Wang . Robust Stabilization of a Class of Uncert ain Nonline ar Systems via Fuzzy Control: Quadratic St abilizability, H oo Control, and Linear Matrix Inequalities. IEEE Transactions on Fuzzy Systems, 4:1-13, 1996. 181. K. Tanaka, T . Ikeda und H. O. Wang . Fuzzy Regul ators and Fuzzy Observers : Relaxed Stability Conditions and LMI-Based Designs. IEEE Transactions on Fuzzy Systems, 6:250-265, 1998. 182. K. Tanaka und M. Sugeno . Stability analysis and design of fuzzy cont rol syste ms. Fuzzy Sets and Systems, 45:135-156, 1992. 183. R. Tanscheit und E. M. Scharf. Exp eriments with the use of a rule-based self-organising controller for robotics applications. Fuzzy Sets and Systems , 26:195-214, 1988. 184. M. C. M. Teixeira und S. H. Zak. Stabilizing Controller Design for Uncertai n Nonlinear Systems Using Fuzzy Models. IEEE Transactions on Fuzzy Systems, 7:133-142 , 1999. 185. M. A. L. Thathachar und P. Viswan ath. On the Stability of Fuzzy Systems. IEEE Transactions on Fuzzy Systems, 5:145- 151, 1997. 186. C.-S. Ting, T .-H. S. Li und F .-C . Kung. An approach to systematic design of the fuzzy control syste m. Fuzzy Sets and Systems, 77:151-166, 1996. 187. H. Tolle. Mehrgroflen-Regelkreissynthese, Band I: Grundlag en urul Frequenzbereichsverfahren. Oldenbourg-Verlag , Miinchen, 1983. 188. G. M. Trojan, J . B. Kiszka, M. M. Gupta und P. N. Nikiforuk . Solution of multivariable fuzzy equations. Fuzzy Sets and Systems , 23:271-279, 1987. 189. N. Tschichold-Gurrnan. Generation and Improvement of Fuzzy Classifiers with Incremental Learning Using Fuzzy RuleNe t . In K. M. George, J. H. Carrol, E. Deaton, D. Opp enheim und J. Hightower, Hrsg., Applied Computing 1995. Proc. 1995 ACM Symposium on Applied Computing, Nashvill e, Feb. 26-28, pages 466-470 . ACM Press, New York, 1995. 190. H. Unb ehauen. Regelungst echnik I, Lineare Kontinuierliche Systeme. ViewegVerlag , Braun schweig, 1992. 191. H. Unbehauen . Regelungstechnik II, Zust andsregelungen, digitale und ni chtlineare Systeme. Vieweg-Verlag , Braunschweig, 1993. 192. H. Unb ehauen. Regelungstechnik III, Identijikation, Adaption, Optimierung. Vieweg-Verlag , Braunschweig, 1993. 193. R. Unb ehauen, Syst emth eorie. Oldenbourg-Verlag, Miinchen , 1971. 194. L.-X. Wang . Stab le Adaptive Fuzzy Control of Nonlinear Systems. IEEE Transactions on Fuzzy Systems, 1:146-155 , 1993. 195. L.-X. Wang . Stable Adaptive Fuzzy Controllers with Appli cation to Invert ed Pendulum Tr acking . IEEE Transactions on Systems, Man , and Cybern etics - Part B: Cybern etics, 26:677-691 , 1996. 196. A. Weinm ann . Regelungen - Analyse und technis cher Entwurf, Band 2. Springer-Verlag, Wien , 1987. 197. X. L. Xi und G. Beni . A Validity Measure for Fuzzy Clust ering. IEEE Transactions on Pattern Analysis and Machine Intellig ence, 13:69-78, 1991. 198. C.- W. Xu . Linguistic decoupl ing cont rol of fuzzy multivariable processes. Fuzzy Sets and Systems, 44:20!l-217 , 1991.
412
Literaturverzeichnis
199. B. Yoo und W . Ham. Adaptive Sliding Mode Control of Nonlinear System. IEEE Transactions on Fuzzy Systems, 6:315-320, 1998. 200. D. C. Youla , H. A. Jabr und J . J. J. Bongiorno. Modern Wiener-Hopf Design of Optimal Controllers - Part I: The Single Input-Output Case . IEEE Transactions on Automatic Control, 21:3-13, 1976. 201. D. C. Youla, H. A. Jabr und J. J. J . Bongiorno. Modern Wiener-Hopf Design of Optimal Controllers - Part II : The Multivariable Case . IEEE Transactions on Automatic Control, 21:319-338, 1976. 202. L. A. Zadeh . Fuzzy Sets . Information and Control, 8:338~353, 1965. 203. L. A. Zadeh . Towards a Theory of Fuzzy Systems. In R. E. Kalman und N. de Claris, Hrsg., Aspects of Networks and System Theory, pages 469-490. Rinehart and Winston, New York, 1971. 204. L. A. Zadeh. A Rationale for Fuzzy Control. J. Dynamic Systems, Measurement and Control, Series 6, 94:3-4, 1972. 205. L. A. Zadeh. Outline of a New Approach to the Analysis of Complex Systems and Decision Processes. IEEE Transactions on Systems, Man, and Cybernetics, 3(1) :28-44, 1973. 206. L. A. Zadeh. The Concept of a Lingustic Variable and its Application to Approximate Reasoning, Part I. Information Sciences, 8:199-249, 1975. 207. L. A. Zadeh . The Concept of a Lingustic Variable and its Application to Approximate Reasoning, Part II. Information Sciences, 8:301-357, 1975. 208. L. A. Zadeh. The Concept of a Lingustic Variable and its Application to Approximate Reasoning, Part III. Information Sciences, 9:43-80, 1975. 209. L. A. Zadeh und C. A. Desoer . Linear System Theory: The State Space Approach. McGraw Hill, New York, 1963. 210. A. Zell. Simulation Neuronaler Netze . Addision-Wesley, Bonn, 1994. 211. K. Zhou und P. P. Khargonekar. Stability Robustness Bounds for Linear State-Space Models with Structured Uncertainty. IEEE Transactions on Automatic Control, 32:621-623, 1987. 212. H.-J. Zimmermann, Hrsg. Fuzzy Technologien. VDI-Verlag GmbH, Dusseldorf,1993. 213. H.-J . Zimmermann, Hrsg . Neuro + Fuzzy Technologien. VDI-Verlag GmbH, Dusseldorf, 1995. 214. H.-J . Zimmermann und P. Zysno. Latent Connectives in Human Decision Making and Expert Systems. Fuzzy Sets and Systems, 4:37-51 , 1980.
Sachverzeichnis
Adaption - eines Fuzzy-Modells 341 - von Fuzzy-Regeln 332 - von Kennfeldern 322 Adaptive Regelung 165 - d irekt 166 - indirekt 166 Adaptiver Kompensationsregler 322 Adaptiver Slidin g Mode-Regier 330 Ahnli chkeit srelation 46 Affine Funktion 287,307,400 Aiserm ann 'sche Vermutung 213 Akt ivierung 358 Aktivierungsfunktion 358 algebraische Summe 17 algebraisches Produkt 15 Allpass 388 - erster Ordnung 388 ANFI S 366 Ap eriodi sches Einschwingen 72,107 Arbeits punkt 75,161 ,269 Ausgab eschicht 357 Ausgangsmat rix 131 Ausgan gsrlickflihrung 153 Beobachtbarkeit 136, 186 Beobacht er - linear 149 - nichtlinear 237 Beobachtungsnormalform 133 Beschr eibungsfunktion 192,291 Biimplikati on 18 Blockschaltbild 63 Bode-Diagramm 92 Bounded Sum 245
CC M 355 Cell-to-cell Mapping 308 Cente r of Area 244
Cent er of Gravity 243 charakte rist ische Funktion 2 Chromosom 375 Clusteranalyse - poss ibilistische 354 - probabilistische 351 Clustern - Noise- 354 - possibilisti sches 354 - probabili sti schcs 351 Compat ible Cluste r Merging 355 credit assignment problem 369 Crossover 376
Darnpfung 72,104 Dau erschwingun g 170, 183 Defuzzifizierung 243 Differenzengrad 163 Dijkstra-Algorithmus 347 Direkte Methode von Ljapunov 272 - fiir Fuzzy-Regier 273 - ftir TSK-Syst eme 274 Dividi erer 67 drastische Summe 17 drastisches Produkt 15 Dr eiecksfunktion 7 Dr eipunktglied 173 Durchgangsmatrix 131
Eigenkreisfrequ enz 72 Eing ab eschicht 357 Ein gan gsmatrix 131 Eliteprinzip 377 Ellip totyp e-Clu sterin g 354 Entkopplung 126 Ersatzzeitkonst an te 86 evolutiona rer Algorit hmus 375 Evolutionsstrategie 376
188,
414
Sachverzeichnis
extensional 47 extensionale Hiille 48 Extensionalitiit 47 Extensionsprinzip 28, 32
Facettenfunktion 287,307 Faltung 81 FCM 351 FCV 353 Feder-Masse-System 63,131 , 191 Fitness 376 Frequenzbereich 77 Frequenzgang 87 Fiihrungs-Ubertragungsfunktion 97 Fuhrungsgrofe 60 Ftihrungsgrofengenerator 124 Fiihrungsverhalten 63 Fuzzifier 352 Fuzzifizierung 241 Fuzzy-c-Means-Algorithmus 351 Fuzzy-c-Varieties 353 Fuzzy-Clusteranalyse 350 Fuzzy-Logik 10 Fuzzy-Menge 2 - konvexe 6 Fuzzy-Regler - Approximation 265 - Struktur 263 Fuzzy-Relation 39 F'uzzy-Teilmenge 2 Gain Scheduling 167 Gamma-Operator 18 Gen 376 Genauigkeit 62, 105 - stationiir 106 Generalisierungsfiihigkeit 360 Gen eration 376 genetischer Algorithmus 377 genetischer Operator 376 Gleichstrommaschine 163 Glockenkurve 7 Grenzstabilitiit 207 Grenzzyklus 172,183,312 GiitemaJ3 108 Harmonische Balance 192,291 Hintereinanderschaltung - von Fuzzy-Relationen 43 horizontale Sicht 8
Hurwitz-Kriterium 104 Hyp erstabilitiit 222,302 Hysteres e 171 Implikation - Lukasiewicz- 14 - GOdel- 14 - residuierte 18 Impulsantwort 81 Impulsfunktion 80 Indikatorfunktion 2 Individuum 376 Instabilitiit 62 Integralungleichung 222 Integrator 65, 79 - Ortskurve 90 Integrierzeit III
Kalman-Filter 150 kartesisches Produkt 30 Kaskadenregelung 121,167 Kaskadenschaltung 121 Kennfeld 322 Kennlinienglied 68 Komma-Strategie 377 Kompensationsregler 117, 322 komp ensatorischer Op erator 18 Konvexe Zerlegung im Zustandsraum 306 Kr eisfrequenz - naturlich 72 Kreiskriterium 214,295 Kreisiibertragungsfunktion 97 Kreisverstarkung 97
Laplace-Transformation 76 - Differentiationssatz 78 - Faltungssatz 78 - Grenzwertsatz 78 - Integrationssatz 77 - Korrespondenztafel 387 - Uberlagerungssatz 77 - Verschiebungssatz 78 Laufz eit 67, 79 - variabel 280 Laufzeitglied - Ortskurve 91 Lie-Ableitung 398 Lineare Matrix-Ungleichung 400 Linearer Operator 393
Sachverzeichnis
Linearer Raum 391 Linearisieru ng 75,161 ,269 - exakt 163 Lineari sierung durch Rlickfilh ru ng 179 lingu istische Ausdriicke 6 linguisti scher Modifizi erer 25 Ljapunov- Funktion 188, 323 - Methode nach Aiserm ann 274 Ljapunov-Gleichung 396 LMI 276,400 LSE 368 Lue nb erger-Beobacht er 150 Lukasiewicz-t- Conorrn 17 Lukasiewicz-t- Norrn 15
Mam dani-Reg ler 239 Matrizen-E xponent ialfunkt ion 135 Mean-of-Maxima 248 Messglied 61 Minima lphase nglied 390 Mod ell 334 - adaptiv 341 - Fuzzy-Mod ell 336 Mod ellb asi ert e Regelung 334 - optimal 345 Moglichkcitsgrad 57 Multilayer- Perz eptron 359 Mul tiplizierer 67 Mutati on 376
Nerve nzellen 357 Netze inga be 358 Netz werkst rukt ur 358 Neuro Fuzzy-Syst eme 361 - hybride 362 - koop erative 362 Neur on 358 Neuronales Net z 357 - rekurrentes 357 - riickgekoppelt es 357 - vor war tsbetrieb enes 357 Neur onen 357 Nivea umenge 8 Noise-C luste rn 354 Nor m - 2-Norm 154, 392 - oo-Norul 155,214,299, 394 - p- Norm 154, 391 - Euklidische Vekto rn orm 392 - Op eratornorm 393
- Spekt ralnorm 299, 394 nor mal 31 Normen 154, 298,391 Nor mieru ng 64 Nor mopt ima ler Regier 153 Nut zfrequ enzbereich 105 Nyquist-Kriterium 100
Optimaler Zust andsregler Optimierung - alternierend e 352 Ortsku rve 88
147
P ar am et er - konzen tri ert 74 P end el 68, 75 Phasenkorrekturglied 115 Plus-Strat egie 377 Popov-Kriterium 205,294 Po pov-O rt skurve 208 Populat ion 375 Possibilitatsverteilung 58 P rop agation 358 Proport ion alglied 65, 79 P rototyp 350 - Cluster- 350 P T1-Glied 70 - Or tskurve 88 - Ube rt ragungsfunkti on 79 P T2-Glied 71 - Ortskurve 89 - Ub er t ragungsfunkt.i on 79 Pulsweit enmodulation 178 Regelabweichung 60 Hcgelflache 86 Regelgeschwindigkeit 107 Regelgrofe 60 Regelung 60 Regelungsn orm alform 133 Regier - I-Regier 111 - logikb asierter 252 -- P-Regler 109 - PD-R egler 114 - PI-Regier 112 - PID-Regler 113 reinforcem ent learning 369 Re konstruie rbarkeit 140 Reson anzrrequ en z 89
415
416
Sachverzeichnis
Resonanztiberhohung 89,92 Riccati-Gleichung 148 Riccati-Regler 148 Riccati-Ungleichung 401 Robustheit 154, 278 Roulettradselektion 378 Routh-Kriterium 104 Ruckfuhrung, erganzend 120 Ruhelage 180,311 - Definition des Nullpunktes 186 - Einzugsbereich 182
Schnitt 8 Schur-Komplement 400 Schwerpunktsmethode 243 Sektortransformation 209 Selektion 376 Separation 354 Separationstheorem 151 Singularer Wert 394 Sliding Mode 175 Sliding Mode-Regler 233,303 - adaptiv 330 Small Gain Theorem 158,215 Sollgrofle 60 Sollwert 60 Spektralradius 299 Sprungantwort 66, 82 - Endwert 84 Stabilisierbarkeit 146 Stabilitat 62 - Lp-Stabilitat 395 - absolut 206 - BIBO-stabil 94 - linearer Systeme 93, 184 - Ljapunov 140,181 - - asymptotisch 182 -- gleichmallig 183 - - global 182 - orbital 184 - quadratisch 321 - Regelkreis 96 - Sprungantwort 93 - Ubertragungsfunktion 95 Stabilitat von Trajektorien 183 St.abilitatsgrenzfall 62 Stellglied 61 Stellgrofe 60 Steuerbarkeit 136, 186 - Ausgangssteuerbarkeit 139 - Zustandssteuerbarkeit 139 Steuerung 60
Stor- Ubertragungsfunktion
97 Storgrofle 60 Storgrofienaufschaltung 119 StOrverhalten 63 Strecke 59 Streckenmodell 63 - invertiert 339, 340 Sugeno- Takagi- RegIer 249 Summierer 65 System - analytisch-linear 163 - kontinuierlich 73 - linear 66 - nicht-minimale Phase 388 - positiv reell 211,226,399 - zeitdiskret 73 - zeitinvariant 73 Systemmatrix 131
t-Conorrn 16 t-Norm 15 Takagi-Sugeno-Kang-RegIer 249 Takagi-Sugeno-Kang-System 267 Trager 373 Transitionsmatrix 136 Trapezfunktion 7 TS-Modell 249 TSK-Beobachter 238,272 TSK-Modell 249, 268 TSK-Regler 267 - Entwurf 320 TSK-System 267 - mit Laufzeit 280 - Robustheit 278 - Stabilitat 274,298 Ubertragungsfunktion 76 - rational 80,91 - Vereinfachung 85 Ubertragungsglied 65 - linear 66 - nichtlinear 67
Verarbeitungseinheiten 357 Verkopplung 125 verstarkendes Lemen 369 Verstarkungsfaktor 109 vertikale Sicht 8 Verzogerungsglied - erster Ordnung 70
Sachverzeichnis - zweiter Ordnung Vorfilter 118 Vorsteuerun g - dynamisch 124 - st atisch 123
71
Wahrheitsfunktionalitat 19 Wichtungsfunk t ion 155 Wichtungsmatrix 155 Wur zelort skurve 93 Wurzelort sverfahr en 116 Zeit bereich 77 Zeitop timale Regelung
177
Ziegler-Nichols Eins tellregeln 117 ZugehOrigkeitsgrad 2 Zust andsdarstellung 128 Zustand sgrofen 128 Zust andskurve 130 Zustandsraum 130 Zust ands regelung 136 Zust and sregler - Entwurf 143 - Polvor gab e 145 - St ationare Genauigkeit 151 Zustandsvari ablen 128 Zweipunktglied - idea l 168, 196 - mit Hysterese 171,200 zylindrische Erweiterung 31
417