Anton Braun Grundlagen der Regelungstechnik
v
Bleiben Sie einfach auf dem Laufenden: www.hanser.de/newsletter Sofort ...
742 downloads
2347 Views
6MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Anton Braun Grundlagen der Regelungstechnik
v
Bleiben Sie einfach auf dem Laufenden: www.hanser.de/newsletter Sofort anmelden und Monat für Monat die neuesten Infos und Updates erhalten.
Anton Braun
Grundlagen der Regelungstechnik Kontinuierliche und diskrete Systeme
mit 182 Bildern
Fachbuchverlag Leipzig im Carl Hanser Verlag
Der Autor: Professor Dr.-Ing. Anton Braun Fachhochschule Regensburg, Fachbereich Elektro- und Informationstechnik Alle in diesem Buch enthaltenen Programme, Verfahren und elektronischen Schaltungen wurden nach bestem Wissen erstellt und mit Sorgfalt getestet. Dennoch sind Fehler nicht ganz auszuschließen. Aus diesem Grund ist das im vorliegenden Buch enthaltene Programm-Material mit keiner Verpflichtung oder Garantie irgendeiner Art verbunden. Autor und Verlag übernehmen infolgedessen keine Verantwortung und werden keine daraus folgende oder sonstige Haftung übernehmen, die auf irgendeine Art aus der Benutzung dieses ProgrammMaterials oder Teilen davon entsteht. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Bibliografische Information Der Deutschen Bibliothek Die Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über abrufbar. ISBN 3-446-40305-1 Dieses Werk ist urheberrechtlich geschützt. Alle Rechte, auch die der Übersetzung, des Nachdruckes und der Vervielfältigung des Buches, oder Teilen daraus, vorbehalten. Kein Teil des Werkes darf ohne schriftliche Genehmigung des Verlages in irgendeiner Form (Fotokopie, Mikrofilm oder ein anderes Verfahren), auch nicht für Zwecke der Unterrichtsgestaltung – mit Ausnahme der in den §§ 53, 54 URG genannten Sonderfälle –, reproduziert oder unter Verwendung elektronischer Systeme verarbeitet, vervielfältigt oder verbreitet werden.
Fachbuchverlag Leipzig im Carl Hanser Verlag © 2005 Carl Hanser Verlag München Wien Internet: http://www fachbuch-leipzig hanser.de Lektorat: Dipl.-Ing. Erika Hotho Herstellung: Dipl.-Ing. Franziska Kaufmann Satz: PTP-Berlin Protago-TeX-Production GmbH Druck und Bindung: Druckhaus „Thomas Müntzer“ GmbH, Bad Langensalza Printed in Germany
Vorwort Dieses Lehrbuch zeichnet sich durch eine umfassende Behandlung der Analyse und Synthese analoger und diskreter Regelsysteme aus. Es ist in seiner Logik so aufgebaut, dass die Behandlung diskreter Regelsysteme als plausible Fortsetzung bekannter Verfahren aus der analogen Regelkreis-Synthese betrachtet werden kann. Konkret heißt dies, dass die Übertragungsfunktion des Reglers mit Hilfe bekannter Syntheseverfahren im kontinuierlichen Zeitbereich dimensioniert und die kontinuierliche Übertragungsfunktion des Reglers mit den in diesem Buch vorgestellten Methoden in den diskreten Zeitbereich übertragen wird. Diese Vorgehensweise hebt sich deutlich von anderen Büchern ab, die sich mit ähnlicher Materie befassen. Die entsprechenden Kapitel sind inhaltlich und logisch so strukturiert, dass dieses Buch als Begleitmaterial zu Vorlesungen der analogen und digitalen Regelungstechnik an Fachhochschulen und Universitäten bestens geeignet ist. An theoretischen Vorkenntnissen werden vom Leser lediglich die Grundlagen der Differenzial- und Integralrechnung sowie eine gewisse Sicherheit im Umgang mit Differenzialgleichungen erwartet. Zum besseren Verständnis des teilweise sehr komplexen mathematischen Hintergrundes sind die Kapitel mit zahlreichen Beispielen ergänzt, die mit der Simulationssoftware MATLAB simuliert wurden und gegebenenfalls leicht nachvollzogen werden können. Das Buch ist in 12 Kapitel eingeteilt. In der Einleitung wird neben dem grundsätzlichen Aufbau von Regelkreisen vor allem die Basis zur Behandlung von Regelkreisen aus mathematischer Sicht geschaffen. Hierzu zählen insbesondere der Begriff der Übertragungsfunktion sowie die Modellierung dynamischer Systeme. Auf Grund der in diesem Zusammenhang maßgeblichen Bedeutung der Laplace-Transformation wurden ihre Definition sowie die für regelungstechnische Anwendungen wichtigsten Rechenregeln im Anhang I konzentriert zusammengestellt. Das 2. Kapitel erläutert die in der Praxis gängigen Regeleinrichtungen, wobei einleitend eine Unterteilung der diversen Grundregler aufgezeigt wird. Das 3. Kapitel definiert die wichtigsten Testsignale zur Analyse technischer Systeme und zeigt die gängigsten Übertragungsglieder bezüglich ihres Übertragungsverhaltens auf. Im Kapitel 4 wird ein zentraler Punkt der Regelungstechnik erschöpfend behandelt: die Beurteilung der Stabilität von Regelkreisen. Hierzu zählen insbesondere das grundlegende Stabilitätskriterium im Zeitbereich, das Stabilitätskriterium von Routh/Hurwitz anhand der charakteristischen Gleichung, das Stabilitätskriterium von Nyquist anhand der Ortskurve des offenen Regelkreises sowie die Behandlung von Wurzelortskurven als Bindeglied zwischen der Beurteilung der Stabilität von Regelkreisen und der Regelkreis-Synthese. Die Kapitel 5 und 6 zeigen schließlich die Regelkreis-Synthese analoger Systeme. Neben typischen Qualitätskriterien bezüglich des Einschwingverhaltens der Regelgröße wird im Kapitel 5 vor allem die Dimensionierung von Reglern auf der Basis von Systemen zweiter Ordnung behandelt. Im Kapitel 6 wird eine Regelkreis-Synthese in vorwiegend drei grundsätzlich unterschiedlichen Strategien aufgezeigt: die Dimensionierung von Reglern im Bode-Diagramm, die Regelkreis-Synthese mit Hilfe von Wurzelortskurven sowie die Verwendung der bekanntesten empirischen Einstellregeln.
6
Vorwort
Nachdem die klassische Regelungstechnik bekanntlich auf Eingrößensysteme beschränkt ist, wird im Kapitel 7 in einem angemessenen Rahmen die Analyse technischer Systeme im Zustandsraum behandelt. Dabei werden neben der Aufstellung der Zustandsgleichung vor allem die Themen Steuerbarkeit und Beobachtbarkeit sowie die diversen Normalformen mit Priorität vorgestellt. Im Kapitel 8 wird im Rahmen der Zustandsbeschreibung technischer Systeme großer Wert auf die Beurteilung der Stabilität gelegt. Hierzu sind insbesondere die Regeln von Sylvester sowie die Vorgehensweise von Liapunov zu erwähnen. Im Kapitel 9 werden die verschiedenen Verfahren der Regelkreis-Synthese im Zustandsraum aufgezeigt. Hierzu zählen insbesondere das Verfahren der Polzuweisung bzw. des ZustandsBeobachters für den Fall, dass nicht sämtliche Zustandsgrößen einer Messung zugänglich sind. Schließlich wird anhand eines einfachen Beispiels zum Ende des 9. Kapitels die Optimierung eines Reglers auf der Basis des Riccatti-Reglers erläutert. In den Kapiteln 10 bis 12 wird schließlich die Analyse und Synthese diskreter Regelkreise ausführlich behandelt. Salopp ausgesprochen kann man sagen, dass die z-Transformation diskreter Systeme das Äquivalent zur Laplace-Transformation kontinuierlicher Systeme ist. In Analogie zum kontinuierlichen Regelkreis werden deshalb im Anhang II die z-Transformation mit den wichtigsten Rechenregeln und die Rücktransformation vom z- in den diskreten Zeitbereich aufgezeigt. Das Kapitel 11 beinhaltet im Wesentlichen die Stabilität diskreter Systeme und die Bestimmung der diskreten Übertragungsfunktion der klassischen Standard-Regler. Im Kapitel 12 werden schließlich die gängigsten Iterations-Verfahren zur Realisierung diskreter Filter und Regler hergeleitet. Darüber hinaus wird die Regelkreis-Synthese diskreter Systeme auf der Basis von Wurzelortskurven und im Bode-Diagramm vorgestellt. Abschließend werden noch einige praktische Empfehlungen zur Wahl der Abtastperiode gegeben. Die vorliegende Arbeit entstand aus meiner mehrjährigen Tätigkeit als Professor für Regelungstechnik im Rahmen von Pflicht- und Wahl-Vorlesungen an der Fachhochschule Regensburg. Meinen Studenten, vor allem aus dem Studiengang der Mechatronik und der Elektrotechnik, verdanke ich zahlreiche Anregungen bei der Abfassung des Manuskriptes. Der Verfasser möchte es darüber hinaus nicht versäumen, sich bei dieser Gelegenheit in aller Form beim Fachbuchverlag Leipzig im Carl Hanser Verlag, insbesondere bei Frau Dipl.-Ing. E. Hotho sowie bei Frau Dipl.-Ing. F. Kaufmann, für die wertvolle Unterstützung im Zuge der langen Entstehungsphase des Buches und für die bewiesene Geduld zu bedanken. Darüber hinaus gilt mein Dank meinem Sohn Michael für seine wertvolle Mitarbeit bei derAufbereitung des umfangreichen Textes und der entsprechenden Diagramme. Schließlich danke ich an dieser Stelle auch meiner Frau, die mir so viele häusliche Pflichten abgenommen hat, dass mir erst dadurch die entsprechende Zeit zur Abfassung dieser Arbeit möglich geworden ist. Regensburg, im Juli 2005
Prof. Dr. Ing. Anton Braun
Inhaltsverzeichnis 1
Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1 Grundsätzlicher Aufbau von Regelkreisen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Ein typisches Beispiel einer angewandten Regelung . . . . . . . . . . . . . . . . . . . . . 1.3 Historischer Überblick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4 Die Übertragungsfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.1 Definition und Herleitung der Übertragungsfunktion . . . . . . . . . . . . . 1.4.2 Pol-Nullstellen-Plan der Übertragungsfunktion . . . . . . . . . . . . . . . . . . 1.4.3 Zusammenschaltung von Übertragungsgliedern . . . . . . . . . . . . . . . . . 1.4.4 Linearisierung nicht linearer Systeme . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.5 Frequenzgang linearer Systeme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.5 Mathematische Modelle und Blockschaltbilder dynamischer Systeme . . . . . . 1.5.1 Der Weg zum mathematischen Modell . . . . . . . . . . . . . . . . . . . . . . . . . 1.5.2 Demonstrationsbeispiele zur Erstellung des mathematischen Modells . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11 11 12 13 13 13 14 16 18 21 24 24 25
2
Regeleinrichtungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1 Einteilung und Bezeichnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.1 Unstetige Regeleinrichtungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.2 Stetige Regeleinrichtungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Technische Realisierung der Grundregler mit Operationsverstärkern . . . . . . . .
31 31 33 35 44
3
Analyse des transienten und stationären Verhaltens von Systemen . . . . . . . . . . 3.1 Typische Testsignale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1.1 Die Sprungfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1.2 Die Gewichtsfunktion (Impulsantwort) . . . . . . . . . . . . . . . . . . . . . . . . . 3.1.3 Die Sinusantwort . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Die wichtigsten Übertragungsglieder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.1 Systeme erster Ordnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.2 Systeme zweiter Ordnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 Dynamisches Verhalten des Regelkreises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4 Stationäres Verhalten des Regelkreises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
48 48 48 48 49 51 51 55 60 62
4
Stabilität von Regelkreisen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 4.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 4.2 Das Stabilitätskriterium von Routh und Hurwitz . . . . . . . . . . . . . . . . . . . . . . . . 69 4.3 Das Stabilitätskriterium von Nyquist . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 4.3.1 Vereinfachtes Nyquist-Kriterium . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 4.3.2 Begriff der relativen Stabilität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 4.4 Das Wurzelortskurven-Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 4.4.1 Themenstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 4.4.2 Regeln zur Konstruktion von Wurzelortskurven . . . . . . . . . . . . . . . . . 92 4.4.3 Typische Beispiele zur Konstruktion von Wurzelortskurven . . . . . . . 101
8
Inhaltsverzeichnis
5
Qualitätskriterien von Regelkreisen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 5.1 Entwurfsforderungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 5.2 Systeme zweiter Ordnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 5.3 Typische Kennwerte des dynamischen Verhaltens . . . . . . . . . . . . . . . . . . . . . . . 115 5.4 International standardisierte Gütemaßzahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 5.5 Das ITAE-Gütekriterium zur Optimierung des Systemverhaltens . . . . . . . . . . 118
6
Entwurf linearer Regelkreise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 6.1 Regelkreis-Synthese im Bode-Diagramm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 6.1.1 Frequenzantwort . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 6.1.2 Die Bode-Plot-Technik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 6.1.3 Bestimmung des stationären Fehlers im Bode-Diagramm . . . . . . . . . 129 6.1.4 Spezifikation der Bandbreite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 6.1.5 Zusammenhang zwischen Phasenrand und Dämpfung . . . . . . . . . . . . 131 6.1.6 Zusammenhang zwischen Phasengang und Amplitudengang . . . . . . . 133 6.1.7 Kompensationsmethode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 6.2 Regelkreis-Synthese mit Hilfe von Wurzelortskurven . . . . . . . . . . . . . . . . . . . . 150 6.2.1 Grundgedanke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150 6.2.2 Beispiele für den Reglerentwurf mit Hilfe von Wurzelortskurven . . . 150 6.3 Empirische Einstellregeln von Ziegler und Nichols . . . . . . . . . . . . . . . . . . . . . . 158
7
Mathematische Beschreibung linearer Systeme im Zustandsraum . . . . . . . . . . 161 7.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161 7.1.1 Beschreibung linearer Systeme durch Zustandsvariable . . . . . . . . . . . 161 7.1.2 Lösung der Vektordifferenzialgleichung im Zeitbereich . . . . . . . . . . . 167 7.1.3 Lösung der Zustandsgleichungen im Bildbereich . . . . . . . . . . . . . . . . 169 7.1.4 Zusammenhang zwischen Übertragungsfunktion und Zustandsdarstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 7.2 Analyse geregelter Systeme im Zustandsraum . . . . . . . . . . . . . . . . . . . . . . . . . . 172 7.2.1 Mathematisches Rüstzeug zur Systemanalyse im Zustandsraum . . . . 172 7.2.2 Steuerbarkeit eines Systems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176 7.2.3 Beobachtbarkeit eines Systems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179 7.3 Normalformen der Zustandsraumdarstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . 180 7.3.1 Regelungsnormalform . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180 7.3.2 Beobachtungsnormalform . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183 7.3.3 Diagonalform . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
8
Stabilität von Systemen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192 8.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192 8.2 Das Stabilitätskriterium von Liapunov für lineare Systeme im Zustandsraum 193 8.2.1 Erste Methode von Liapunov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193 8.2.2 Zweite Methode von Liapunov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194
Inhaltsverzeichnis
9
9
Regelkreis-Synthese im Zustandsraum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203 9.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203 9.2 Das Verfahren der Polzuweisung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203 9.2.1 Bestimmung der Rückführmatrix mit Hilfe der steuerbaren Normalform . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205 9.2.2 Bestimmung der Rückführmatrix mit der Ackermann’schen Formel . 208 9.3 Regelkreis-Synthese unter Verwendung des Zustands-Beobachters . . . . . . . . . 219 9.3.1 Problemstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219 9.3.2 Dimensionierung der Beobachter-Matrix K e . . . . . . . . . . . . . . . . . . . . 221 9.3.3 Dimensionierung der Beobachter-Matrix K e mit der direkten Methode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226 9.3.4 Zusammenschaltung des Beobachters mit der zu regelnden Strecke . 230 9.3.5 Systeme mit von null verschiedenem Sollwert . . . . . . . . . . . . . . . . . . . 234 9.4 Optimale Regelsysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252 9.4.1 Parameteroptimierung auf der Basis der zweiten Methode von Liapunov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253 9.4.2 Das quadratische Gütekriterium . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257
10
Diskrete Regelung kontinuierlicher Systeme . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262 10.1 Signaltypen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262 10.2 Prinzipieller Aufbau digitaler Regelkreise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263 10.3 Signalkonversion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 264
11
Übertragungsverhalten diskreter Systeme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268 11.1 Übertragungsfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268 11.2 Idealer Abtaster . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270 11.2.1 z-Transformierte aus einem Halteglied und einem kontinuierlichen Übertragungsglied . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272 11.2.2 Beurteilung der Stabilität diskreter Systeme . . . . . . . . . . . . . . . . . . . . . 274 11.2.3 Numerische Methoden zur Bestimmung der Stabilität . . . . . . . . . . . . 276 11.3 Übertragungsfunktion zusammengesetzter Systeme . . . . . . . . . . . . . . . . . . . . . 282 11.3.1 Kontinuierliche Systeme mit und ohne Abtaster . . . . . . . . . . . . . . . . . 282 11.3.2 Übertragungsfunktion rückgekoppelter Systeme . . . . . . . . . . . . . . . . . 285 11.3.3 Übertragungsfunktion des Standard-Regelkreises . . . . . . . . . . . . . . . . 286 11.3.4 Übertragungsfunktion des diskretisierten PID-Reglers . . . . . . . . . . . . 288 11.3.5 Realisierung digitaler Regler und digitaler Filter . . . . . . . . . . . . . . . . . 292
12
Synthese diskreter Regelsysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 299 12.1 Das diskrete Filter aus einem äquivalenten analogen Filter . . . . . . . . . . . . . . . . 299 12.1.1 Rechteckregel in Rückwärtsrichtung . . . . . . . . . . . . . . . . . . . . . . . . . . . 300 12.1.2 Rechteckregel in Vorwärtsrichtung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303 12.1.3 Trapezregel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304
10
Inhaltsverzeichnis
12.1.4 12.1.5
Bilineare Transformation mit Prewarping-Technik . . . . . . . . . . . . . . . 306 Getrennte Abbildung von Pol- und Nullstellen vom s- in den z-Bereich . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 310 12.2 Regelkreis-Synthese mit Hilfe von Wurzelortskurven . . . . . . . . . . . . . . . . . . . . 315 12.2.1 Dynamisches Verhalten digitaler Regelkreise . . . . . . . . . . . . . . . . . . . . 315 12.2.2 Allgemeine Regeln zur Konstruktion von Wurzelortskurven . . . . . . . 316 12.2.3 Wurzelortskurven digitaler Regelkreise . . . . . . . . . . . . . . . . . . . . . . . . 319 12.3 Regelkreis-Synthese im Frequenzbereich . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 338 12.3.1 Bilineare Transformation und w-Ebene . . . . . . . . . . . . . . . . . . . . . . . . 338 12.3.2 Bode-Diagramme im w-Bereich . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 341 12.3.3 Zur Wahl der Abtastrate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 347 12.3.4 Zusammenfassung und Ausblick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 349 Anhang I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 350 I.1 Die Laplace-Transformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 350 I.1.1 Definition der Laplace-Transformation . . . . . . . . . . . . . . . . . . . . . . . . . 350 I.1.2 Wichtige Theoreme der Laplace-Transformation . . . . . . . . . . . . . . . . . 351 I.1.3 Laplace-Transformierte elementarer Zeitfunktionen . . . . . . . . . . . . . . 358 I.2 Inverse Laplace-Transformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 363 I.2.1 Partialbruchzerlegung zur Berechnung der inversen LaplaceTransformierten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 363 I.2.2 Lösung linearer Differenzialgleichungen mit Hilfe der Laplace-Transformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 368 Anhang II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 371 II.1 Die z-Transformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 371 II.1.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 371 II.1.2 Bestimmung der z-Transformierten . . . . . . . . . . . . . . . . . . . . . . . . . . . . 371 II.1.3 z-Transformierte typischer Signale . . . . . . . . . . . . . . . . . . . . . . . . . . . . 372 II.1.4 Wichtige Eigenschaften und Theoreme der z-Transformation . . . . . . 375 II.2 Inverse z-Transformierte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 384 II.2.1 Verfahren der Polynomdivision . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 385 II.2.2 Verfahren der Partialbruchzerlegung . . . . . . . . . . . . . . . . . . . . . . . . . . . 386 II.2.3 Rücktransformation mit Hilfe des Inversionsintegrals . . . . . . . . . . . . . 392 II.2.4 Lösung von Differenzengleichungen mit Hilfe der z-Transformation 398 II.3 Abbildung der s-Ebene in die z-Ebene . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 399 II.3.1 Primärstreifen und komplementäre Fortsetzung . . . . . . . . . . . . . . . . . . 400 II.3.2 Linien konstanten Betrags in der z-Ebene . . . . . . . . . . . . . . . . . . . . . . 401 II.3.3 Linien konstanter Frequenz in der z-Ebene . . . . . . . . . . . . . . . . . . . . . 401 II.3.4 Linien konstanter Dämpfung in der z-Ebene . . . . . . . . . . . . . . . . . . . . 403 Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 406 Sachwortverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 409
1
Einleitung
Der Begríff „Regelung“ ist von sehr allgemeiner Art. Beim Lenken eines Fahrzeuges handelt es sich ebenso um einen Regelprozess wie bei der Drehzahlregelung eines Gleichstrommotors oder der Temperaturregelung eines Wohngebäudes. Beispielsweise hat der Fahrer eines Automobils die Aufgabe, einen ständigen Vergleich zwischen der momentanen und der gewollten Geschwindigkeit herzustellen und die Abweichung zwischen den beiden Geschwindigkeiten durch eine entsprechende Gaspedalstellung auszuregeln. Man spricht in diesem Fall von einer manuellen Regelung. Im Gegensatz dazu sind bei einer automatischen Regelung, wie z.B. der Temperaturregelung eines Heizofens, nur mechanische Komponenten involviert. Aus den beiden Beispielen lässt sich bereits eine allgemeine Definition eines Regelvorgangs ableiten: Unter einer Regelung versteht man die gezielte Beeinflussung einer Eingangsgröße eines zu regelnden Systems, damit die Ausgangsgröße, d.h. die Regelgröße des Systems, den Wunschwert möglichst schnell und möglichst genau annimmt. Der „Wunschwert“ der Regelgröße wird in der Praxis als Sollwert oder auch als Führungsgröße bezeichnet. Beiden Regelprozessen, der manuellen wie der automatischen Regelung, ist die ständige Messung der Regelgröße und der Vergleich mit dem Sollwert gemeinsam. In Abhängigkeit des Ergebnisses dieses Vergleichs bewirkt der Regler eine so genannte Stellgröße als Eingangsgröße des zu regelnden Systems, bezeichnet als Regelstrecke, mit dem Ziel, die Regelgröße an den Sollwert heranzuführen und dort zu halten.
1.1
Grundsätzlicher Aufbau von Regelkreisen
In diesem Kapitel soll die grundsätzliche Struktur aufgezeigt werden, die jedem Regelkreis zu Grunde liegt. Ein Regelkreis besteht gemäß Bild 1.1 aus folgenden Komponenten: Regler, Stellglied, Regelstrecke und Messglied. DerAusgangspunkt der Betrachtung ist die Regelstrecke, von der eine zeitveränderliche Größe, die Regelgröße ys (t), in bestimmter Weise beeinflusst werden soll. Diese physikalische Größe wird vom Messglied erfasst und in eine andere physikalische Größe, die so genannte rückgeführte Regelgröße y(t), umgesetzt. Die rückgeführte Regelgröße wird nun mit dem Sollwert w(t) verglichen; das Ergebnis dieses Vergleichs ist die Regelabweichung e(t). Der Regler, in der praktischen Anwendung ein beschalteter Operationsverstärker oder ein Mikrocomputer, hat entsprechend seinem Aufbau die Reglerausgangsgröße uR (t) zu erzeugen. Die Reglerausgangsgröße uR (t) wird dem sog. Stellglied zugeführt, das über die Stellgröße u(t) auf die Regelstrecke korrigierend einwirkt. Diesem geschlossenen Wirkungsablauf unterliegt je-
12
1 Einleitung
Bild 1.1: Blockschaltbild des Standard-Regelkreises
der Regelkreis, wobei die Aufgabe des Reglers darin besteht, eine auf Grund einer Störung z(t) eingetretene Regelabweichung möglichst schnell zu beseitigen oder zumindest möglichst klein zu halten.
1.2
Ein typisches Beispiel einer angewandten Regelung
Anhand des folgenden Beispiels der Drehzahlregelung eines Motors, gemäß der Vorgehensweise nach James Watt, sollen Bezug nehmend auf Bild 1.1 die wichtigsten Komponenten des Standard-Regelkreises erläutert werden.
Bild 1.2: Drehzahlregelung einer Antriebsmaschine
Das zu regelnde System, also die Regelstrecke, ist im gegebenen Fall die Antriebsmaschine mit der anzutreibenden Last als Störgröße. Die Drehzahl des Antriebsmotors als die zu regelnde physikalische Größe wird über die skizzierten Zahnräder dem Fliehkraftpendel als Messglied zugeführt. Die Differenz aus der Kraft der vorgespannten Feder als Sollwertgeber und der
1.4 Die Übertragungsfunktion
13
entgegengerichteten Kraft der Fliehmassen ergibt die Regelabweichung, die sich unmittelbar auf die Position des Steuerventilkolbens auswirkt. Die Position dieses Kolbens als Regler bewirkt über die Druckölvorlage eine entsprechende Verschiebung des Arbeitskolbens, der im gegebenen Beispiel dem Stellglied entspricht. Wenn nun beispielsweise die momentane Drehzahl des Motors auf Grund einer Lasterhöhung unter die Solldrehzahl sinkt, dann verursacht die Abnahme der Zentrifugalkraft der Fliehgewichte eine Bewegung des Kolbens im Steuerventil derart, dass das nun zufließende Drucköl den Arbeitskolben nach unten drückt. Dies hat wiederum zur Folge, dass über das Regelventil mehr Kraftstoff zufließt und dadurch die Motordrehzahl wieder anzusteigen beginnt.
1.3
Historischer Überblick
Die erste maßgebliche und gezielte Entwicklung eines Regelkreises geht zweifelsfrei auf die Drehzahlregelung der Dampfmaschine nach James Watt (1788) zurück. Die theoretische Behandlung von Regelkreisen anhand von Differenzialgleichungen zur Beschreibung von Regelungsvorgängen wurde von Maxwell (1868) und Stodola (1893) eingeleitet. Nachdem sich die Stabilität von Regelkreisen sehr bald als eines der zentralen Probleme aufgezeigt hat, haben sich auf diesem Gebiet vor allem Hurwitz (1893) und Nyquist (1932) verdient gemacht. Auf dem Gebiet der Regelkreis-Synthese, also der Dimensionierung von Reglern, haben sich schließlich Oppelt und Bode (1940 bis 1945) besondere Verdienste erworben. Das Gebiet der so genannten modernen Regelungstechnik, d.h. die Entwicklung optimaler Regler mit Hilfe der Beschreibung von Regelkreisen im Zustandsbereich, wurde federführend von Pontrjagin, Liapunov und Bellman (1956 bis 1957) vorangetrieben.
1.4
Die Übertragungsfunktion
1.4.1
Definition und Herleitung der Übertragungsfunktion
Lineare, kontinuierliche, zeitinvariante Systeme werden durch gewöhnliche Differenzialgleichungen ˙ + a0 y(t) = an y (n) (t) + an−1 y (n−1) (t) + . . . + a1 y(t) bm u(m) (t) + bm−1 u(m−1) (t) + . . . + b1 u(t) ˙ + b0 u(t) mit n ≥ m beschrieben, wobei y(t) Ausgangsgröße und u(t) Eingangsgröße des betrachteten Systems ist. Setzt man alle Anfangsbedingungen zu null und wendet auf beide Seiten dieser Differenzialgleichung die Laplace-Transformation an, so erhält man die Übertragungsfunktion zu F (s) =
Y (s) b0 + b1 s + . . . + bm−1 s m−1 + bm s m = U (s) a0 + a1 s + . . . an−1 s n−1 + an s n
(1.1)
14
1 Einleitung
Die Übertragungsfunktion ist also durch das Verhältnis der Laplace-Transformierten des Ausgangssignals zur Laplace-Transformierten des Eingangssignals gegeben. Wenn, wie in Gl. (1.1), das Nennerpolynom der Übertragungsfunktion vom Grad n ist, so spricht man von einem System n-ter Ordnung. Die Form der Übertragungsfunktion hängt ausschließlich vom betrachteten System ab und nicht von der Form des Eingangssignals. Wie im Abschnitt 1.6.2 gezeigt werden wird, kann mit Hilfe der Übertragungsfunktion die Dynamik eines Systems in bequemer Weise untersucht werden. Wählt man als Eingangssignal eine Impuls-Erregung u(t) = δ(t), so ist das zugehörige Ausgangssignal die Impuls-Antwort oder die Gewichtsfunktion g(t). Aus Gl. (1.1) folgt somit F (s) = L [g(t)] . Beispiel 1.1: Für ein System entsprechend der Differenzialgleichung dy(t) du(t) + 2y(t) = + u(t) dt dt ist die zugehörige Übertragungsfunktion zu bestimmen. Die Laplace-Transformierte der gegebenen Differenzialgleichung mit zu null gesetzten Anfangsbedingungen wird zu (s + 2) Y (s) = (s + 1) U (s). Die Übertragungsfunktion des Systems wird damit zu F (s) =
1.4.2
s+1 Y (s) = . U (s) s+2
Pol-Nullstellen-Plan der Übertragungsfunktion
Für eine Reihe von Untersuchungen, z.B. für Stabilitätsbetrachtungen, ist es zweckmäßig, die gebrochen rationale Übertragungsfunktion F (s) in der faktorisierten Form F (s) =
Z(s) (s − z1 ) (s − z2 ) . . . (s − zm ) = k0 , N (s) (s − p1 ) (s − p2 ) . . . (s − pn )
n≥m
(1.2)
darzustellen. Nachdem die Koeffizienten ai und bj der Gl. (1.1) nur reell sein können, können auch die Nullstellen zi und die Polstellen pj von F (s) nur reell oder konjugiert komplex sein. Die Pole und Nullstellen der Übertragungsfunktion F (s) lassen sich in der komplexen s-Ebene sehr anschaulich gemäß folgendem Bild darstellen. Da das Eigenverhalten (also der Fall u(t) = 0) allein durch die charakteristische Gleichung N(s) = 0 beschrieben wird, beinhalten somit die Pole pj der Übertragungsfunktion diese Information vollkommen.
1.4 Die Übertragungsfunktion
15
Bild 1.3: Beispiel der Pol-NullstellenVerteilung einer echt gebrochen rationalen Übertragungsfunktion in der komplexen s-Ebene
Will man den Zeitverlauf der Ausgangsgröße y(t) beim Einwirken einer beliebigen Eingangsgröße u(t) unter Verwendung der bekannten Übertragungsfunktion F (s) berechnen, so muss zunächst die zu u(t) korrespondierende Laplace-Transformierte U (s) gebildet werden. Damit wird entsprechend den Gl. (1.1) und (1.2) die Ausgangsgröße Y (s) zu Y (s) =
Z(s) U (s) N (s)
(1.3)
Wenn nun Y (s) in obiger Gleichung eine gebrochen rationale Funktion darstellt, dann kann dieser Ausdruck in Partialbrüche zerlegt und die inverse Laplace-Transformierte y(t) berechnet werden; siehe hierzu Anhang I. In die Lösung y(t) gehen somit außer den Polstellen auch die Nullstellen der Übertragungsfunktion F (s) ein. Sämtliche Anfangsbedingungen von y(t) werden dabei definitionsgemäß zu null gesetzt. Da durch die Polstellen die Partialbrüche bestimmt werden, lässt insbesondere die Lage der Pole einfache Schlüsse auf die Art der Zeitfunktion y(t) zu. Unter Verwendung von Bild 1.4 und der Ergebnisse von Abschnitt I.2 im Anhang können wir feststellen:
Bild 1.4: Lage der Pole in der s-Ebene und zugehöriges Zeitverhalten
16
1 Einleitung
1. Einer einfachen Polstelle s = −δ auf der negativ reellen Achse entspricht in der PartialA , d.h. im Zeitbereich ein Anteil y(t) = Ae−δt , dessen bruchentwicklung ein Term s+δ Zeitverhalten im Bild 1.4 skizziert eingetragen ist. 2. Einem Paar konjugiert komplexer Polstellen mit negativem Realteil nach Bild 1.4 entB1 s+B2 spricht im Laplace-Bereich ein Teilbruch (s+δ) 2 +ω2 und im Zeitbereich eine gedämpfte 0
Schwingung y(t) = Ae−δt sin(ω0 t + ϕ), deren möglicher Zeitverlauf im Bild 1.4 aufgezeigt ist. 3. Liegen die Polstellen in der rechten s-Halbebene, so entsprechen diesen im Zeitbereich bei einfachen reellen Polen ansteigende Anteile, also y(t) = Aeδt oder y(t) = Aeδt sin(ωt + ϕ) bei konjugiert komplexen Polstellen. 4. Einer im Ursprung der s-Ebene liegenden Polstelle entspricht im Laplace-Bereich der Teilbruch As , im Zeitbereich resultiert daraus die Konstante y(t) = Aε(t). 5. Ein Paar von konjugiert komplexen Polstellen auf der imaginären Achse nach Bild 1.4 2 bedingt im Laplace-Bereich den Teilbruch Cs12s+C , d.h. im Zeitbereich eine stationäre +ω2 Schwingung y(t) = A sin(ω0 t + ϕ).
0
Zusammenfassung: Ist si eine Polstelle einer echt gebrochen rationalen Bildfunktion F (s), so entspricht • •
Re(si ) < 0 ein zeitlich abklingender (flüchtiger) Anteil, Re(si ) = 0 ein zeitlich konstanter (stationärer) Anteil,
•
Re(si ) > 0 ein zeitlich ansteigender Anteil in der zugehörigen Zeitfunktion y(t).
1.4.3
Zusammenschaltung von Übertragungsgliedern
Für die Zusammenschaltung von Übertragungsgliedern lassen sich einfache Rechenregeln zur Bestimmung der gesamten Übertragungsfunktion herleiten. Reihenschaltung
Bild 1.5: Reihenschaltung von Übertragungsgliedern
Aus der Schaltung entsprechend Bild 1.5 folgt unmittelbar Y (s) = F2 (s) · Y1 (s) Y1 (s) = F1 (s) · U (s) Y (s) = F1 (s) · F2 (s) · U (s) F (s) =
und damit
Y (s) = F1 (s) · F2 (s). U (s)
1.4 Die Übertragungsfunktion
17
Somit ergibt sich die gesamte Übertragungsfunktion einer Reihenschaltung von Übertragungsgliedern aus dem Produkt der einzelnen Übertragungsfunktionen. Parallelschaltung
Bild 1.6: Parallelschaltung von zwei Übertragungsgliedern
Aus Bild 1.6 ergibt sich die Laplace-transformierte Ausgangsgröße zu Y (s) = (F1 (s) + F2 (s)) · U (s) und damit die Übertragungsfunktion der Gesamtschaltung zu F (s) =
Y (s) = F1 (s) + F2 (s). U (s)
Die gesamte Übertragungsfunktion einer Parallelschaltung von Übertragungsgliedern berechnet sich somit als Summe der einzelnen Übertragungsfunktionen. Kreis- oder Rückführschaltung
Bild 1.7: Rückführschaltung zweier Übertragungsglieder
Aus Bild 1.7 folgt für die Ausgangsgröße Y (s) = (U (s) − Y2 (s)) · F1 (s), Y2 (s) = F2 (s) · Y (s). Damit wird Y (s) zu Y (s) = (U (s) − F2 (s)Y (s))F1 (s).
18
1 Einleitung
Die gesuchte Übertragungsfunktion der gesamten Kreisschaltung wird damit zu F (s) =
Y (s) F1 (s) = . U (s) 1 + F1 (s) · F2 (s)
Da die Ausgangsgröße von F1 (s) über F2 (s) wieder auf den Eingang zurückgeführt wird, spricht man ganz allgemein von einer Rückkopplung. Der Fall der negativen Rückkopplung, wie im Bild 1.7 gezeigt, wird als Gegenkopplung bezeichnet. Wird das Signal Y2 (s) positiv in die Summierstelle eingespeist, spricht man von einer Mitkopplung. 1.4.4
Linearisierung nicht linearer Systeme
In diesem Abschnitt soll eine Methode zur Linearisierung eines nicht linearen Systems aufgezeigt werden, die in den meisten Fällen angewandt werden kann. Diese Methode basiert auf der Umformung einer nicht linearen Funktion in eine Taylor-Reihe, wobei davon, außer dem ersten Glied, die höheren Terme vernachlässigt werden. Linearisierung einer Funktion y = f (u) Zur Bestimmung eines linearen mathematischen Modells eines nicht linearen Systems gehen wir von der Annahme aus, dass sich die Variablen nur unwesentlich von ihrem stationären Arbeitspunkt unterscheiden. Für ein System mit der Eingangsgröße u(t) und der Ausgangsgröße y(t) wird der Zusammenhang zwischen diesen Größen zu y = f (u)
beschrieben.
(1.4)
Wenn die Koordinaten im betrachteten Arbeitspunkt mit (u, ¯ y) ¯ bezeichnet werden, so wird dort die zugehörige Taylor-Reihe zu y = f (u) = f (u) ¯ +
df 1 d2 f (u − u) ¯ + (u − u) ¯ 2 + ... . du 2! du2
(1.5)
Wenn nun, was hier vorausgesetzt wird, die Abweichungen (u − u) ¯ um den Arbeitspunkt klein sind, können die Terme mit den höheren Ableitungen vernachlässigt werden und Gl. (1.5) wird zu y ≈ y¯ + a(u − u) ¯ a=
df du u=u¯
mit
und y¯ = f (u). ¯
(1.6) (1.7)
Durch die Gl. (1.7) ist das ursprünglich nicht lineare System in der Umgebung des Arbeitspunktes in ein lineares System umgeformt worden.
1.4 Die Übertragungsfunktion
19
Linearisierung einer Funktion y = f (u, v) Es soll nun der Fall betrachtet werden, dass die Ausgangsvariable y von zwei Eingangsvariablen u und v abhängig ist, also y = f (u, v).
(1.8)
Zur Linearisierung des nicht linearen Systems der Gl. (1.8) um den Arbeitspunkt (u, ¯ v, ¯ y) ¯ bekommt die Taylor-Reihe die Form ∂f ∂f y = f (u, ¯ v) ¯ + (u − u) ¯ + (v − v) ¯ ∂u ∂v 2 1 ∂ f ∂ 2f ∂ 2f 2 2 + + ... (u − u) ¯ · (v − v) ¯ + 2 (v − v) (u − u) ¯ +2 ¯ 2! ∂u2 ∂u∂v ∂v wobei die partiellen Ableitungen im Arbeitspunkt u = u, ¯ v = v¯ und y = y¯ zu bilden sind. In der nahen Umgebung des Arbeitspunktes werden nun wieder die höheren Terme der TaylorReihe vernachlässigt. Mit y¯ = f (u, ¯ v) ¯ verbleibt dann ein lineares mathematisches Modell des nicht linearen Systems ∂f ∂f y = y¯ + a(u − u) ¯ + b(v − v) ¯ mit a = ,b= . ∂u u=u,v= ∂v u=u,v= ¯ v¯ ¯ v¯ Es sei jedoch noch einmal darauf verwiesen, dass die hier aufgezeigte Vorgehensweise nur zu vertretbaren Ergebnissen führt, wenn die Abweichungen der Variablen vom Arbeitspunkt genügend klein sind. Beispiel 1.2: Das folgende Bild zeigt ein Hydraulik-Servo-System, bestehend aus einem Stellzylinder und einem Arbeitskolben. Dabei sei angenommen, dass der Stellzylinder symmetrisch aufgebaut und der Öffnungsquerschnitt proportional zur Ventilposition x ist. Durch die Position des Stellzylinders wird der Zufluss von Hochdrucköl in den Arbeitskolben ermöglicht, der z.B. eine große Last zu bewegen hat. Weiter sei angenommen, dass der Versorgungsdruck mit ps bezeichnet sei und der zu vernachlässigende Druck im Rückflusskanal mit p0 bezeichnet wird. Außerdem soll die Kompressibilität des Hydrauliköls als vernachlässigbar klein vorausgesetzt werden. Der Durchsatz des Hydrauliköls durch die Kanäle 1 bzw. 2 ist gegeben zu √ q1 = C ps − p1 x √ √ q2 = C p2 − p0 x = C p2 x mit der bereits eingangs getroffenen Annahme p0 = 0; C ist die Viskosität des Hydrauliköls. Die Aufgabe besteht in der Aufstellung eines linearisierten mathematischen Modells des Stellzylinders in der Umgebung x = 0.
20
1 Einleitung
Bild 1.8: Hydraulik-Servo-System
Mit q1 = q2
gilt
p s − p 1 = p2 ; definiert man den Differenzdruck am Arbeitskolben mit p, also p = p1 − p2 , dann wird p1 =
ps + p ps − p , p2 = . 2 2
Die Durchfluss-Rate q1 auf der rechten Seite des Arbeitskolbens wird damit zu √
q1 = C ps − p1 x = C ·
ps − p x = f (x, p) . 2
Die linearisierte Gleichung in der Umgebung des Arbeitspunktes x = x, ¯ p = p, ¯ q1 = q¯1 wird damit zu q1 = q¯1 + a · (x − x) ¯ + b · (p − p); ¯ mit
(1.9)
∂f ps − p¯ a= und =C ∂x x=x,p= 2 ¯ p,q ¯ 1 =q¯1 ∂f C b= =− √ √ x¯ ≤ 0. ∂p x=x,p= 2 2 ps − p¯ ¯ p,q ¯ 1 =q¯1
In der Umgebung des Arbeitspunktes x¯ = 0, p¯ = 0, q¯1 = 0 wird Gl. (1.9) zu q1 = K1 x − K2 p, mit den Abkürzungen
1.4 Die Übertragungsfunktion
K1 = C
K2 =
ps − p¯ 2
21
=C x=0, ¯ p=0, ¯ q¯1 =0
ps ; 2
C = 0. · x¯ √ √ 2 2 ps − p¯ x=0, ¯ p=0, ¯ q¯1 =0
Damit wird das linearisierte Modell des Stellzylinders in der Umgebung des Arbeitspunktes zu q1 = K1 x. 1.4.5
Frequenzgang linearer Systeme
Der Frequenzgang eines linearen Systems ist gemäß der Definitionsgleichung (1.1) der Übertragungsfunktion das Verhalten des betrachteten Systems entlang der Imaginär-Achse der s-Ebene, d.h. der Laplace-Operator s ist in der Übertragungsfunktion F (s) mit jω zu ersetzen. Damit wird der Frequenzgang eine komplexe Funktion, die nur von der Variablen ω abhängig ist. Man kann deshalb den Frequenzgang eines jeden linearen Systems mit FR (jω) als Realteil und FI (jω) als Imaginärteil in der Form F (jω) = FR (jω) + jFI (jω)
(1.10)
anschreiben und F (jω) in bekannter Weise als Zeiger in der komplexen Ebene darstellen. In der Polardarstellung erhält man den Frequenzgang zu F (jω) = |F (jω)| ejϕ(jω)
(1.11)
mit |F (jω)| als Betrag und ϕ(jω) als Phase des Frequenzgangs. Gemäß den Regeln der komplexen Rechnung gelten die Beziehungen FR (jω) = |F (jω)| · cos ϕ(jω) FI (jω) = |F (jω)| · sin ϕ(jω) |F (jω)| = FR2 (jω) + FI2 (jω) ϕ(jω) = arctan FI (jω)/FR (jω) . Die grafische Darstellung des Frequenzgangs ermöglicht es dem Regelungstechniker, wichtige Eigenschaften des untersuchten Systems sofort zu erkennen und Hinweise auf mögliche Verbesserungen des Systemverhaltens zu gewinnen. In der Regelungstechnik sind im Wesentlichen zwei grafische Darstellungsformen des Frequenzgangs üblich, nämlich • •
die Nyquist-Ortskurve und das Bode-Diagramm (Frequenzkennlinien).
22
1 Einleitung
Die Nyquist-Ortskurve Bei einer Veränderung der Kreisfrequenz ω von ω = 0 bis ω → ∞ beschreibt die Spitze des durch den Betrag |F (jω)| und die Phase ϕ(jω) festgelegten Zeigers in der komplexen F (jω)-Ebene eine stetige Kurve, die als Ortskurve des Frequenzgangs oder Nyquist-Ortskurve bezeichnet wird. Die zu den Punkten der Ortskurve gehörenden Werte der Kreisfrequenz ω werden als Skalierung angeschrieben. Außerdem wird die Ortskurve in Richtung wachsender ω-Werte orientiert. Aus der Ortskurvendarstellung kann man für eine vorgegebene Kreisfrequenz den Betrag, den Phasenwinkel, den Realteil und den Imaginärteil direkt ablesen. Schließlich ist noch zu erwähnen, dass der Phasenwinkel ϕ(jω) im Gradmaß angegeben und (in der neueren Literatur) auf den Wertebereich −180◦ ≤ ϕ ≤ 180◦ beschränkt wird. Bode-Diagramm (Frequenzkennlinien) Häufig erstreckt sich der interessierende Frequenzbereich über mehrere Zehnerpotenzen, so dass eine lineare Darstellung unhandlich große Diagramme ergeben würde, wenn man eine gewisse Mindestauflösung fordert. Man bildet deshalb den Wert der Kreisfrequenz logarithmisch ab und trägt den Betrag des Frequenzgangs im logarithmischen Maßstab auf; hierzu hat sich das Dezibel-Maß (dB) bewährt; man bezeichnet diese Größe als Amplitudengang: |F (jω)|dB = A(ω) = 20 lg |F (jω)|
(1.12)
Man stellt den Verlauf des nach Gl. (1.12) gebildeten Amplitudengangs und der Phase ϕ(jω) im linearen Maßstab über dem logarithmischen Wert der Kreisfrequenz ω in einem gemeinsamen Diagramm, dem Bode-Diagramm, dar. Den Verlauf der Phasenkennlinie bezeichnet man als Phasengang; Amplituden- und Phasengang zusammengenommen werden auch als Frequenzkennlinien oder Bode-Diagramm bezeichnet. Beispiel 1.3: Gesucht ist das Bode-Diagramm des Frequenzgangs F (jω) =
4,7 . 1 + 1,3(jω) + 1,52(jω)2 + 0,76(jω)3 + 0,1(jω)4
Für ω ≈ 0 beginnt der Amplitudengang bei |F (0)|dB ≈ 20 lg 4,7 = 13,4 dB und die Phase bei 0◦ . Für ω → ∞ überwiegt im Nenner die höchste Potenz von ω, d.h. man hat F (jω) ≈
47 4,7 = . 4 (jω)4 0,1(jω)
1.4 Die Übertragungsfunktion
23
Den logarithmischen Betrag erhält man in diesem Bereich zu |F (jω)|dB ≈ (20 lg 47 − 80 lg ω) = (33,4 − 80 lg ω). Vergrößert man die Kreisfrequenz um den Faktor 10, so nimmt |F (jω)|dB um 80 dB ab, d.h. |F (j ω)|dB fällt mit 80 dB pro Dekade. Der Amplitudengang hat also bei hohen Kreisfrequenzen einen annähernd linearen Verlauf, d.h. er nähert sich einer Asymptote. Den Phasenwinkel von F (jω) erhält man für große ω-Werte mit F (jω) ≈
47 47 = 4 4 (jω) ω
zu
ϕ(jω) ≈ 0◦ .
Der vollständige Verlauf von Amplituden- und Phasengang ist für den Bereich 0,01 s−1 ≤ ω ≤ 100 s−1 im folgenden Bode-Diagramm dargestellt.
Bild 1.9: Bode-Diagramm eines Systems vierter Ordnung
24
1.5
1 Einleitung
Mathematische Modelle und Blockschaltbilder dynamischer Systeme
Für den Entwurf eines Regelsystems ist es notwendig, die zu regelnde Strecke quantitativ zu beschreiben. Da es sich bei den Regelstrecken um dynamische Systeme handelt, ist es notwendig, die beschreibenden Differenzialgleichungen, deren unabhängige Variable die Zeit ist, für jede Komponente des Systems aufzustellen. Im Anschluss daran sind die diversen Differenzialgleichungen in den Laplace-Bereich zu transformieren, wobei sämtliche Anfangsbedingungen zu null gesetzt werden. Das gesamte Blockschaltbild des betrachteten Systems entsteht schließlich dadurch, dass man jede in den Laplace-Bereich transformierte Differenzialgleichung symbolisch durch einen Übertragungsblock darstellt und die einzelnen Blöcke nach dem „Ursache-Wirkungs-Prinzip“ miteinander verknüpft. 1.5.1
Der Weg zum mathematischen Modell
Die Aufstellung des mathematischen Modells erfolgt in zwei Schritten: 1. Die Festlegung eines möglichst einfachen physikalischen Modells, das die wesentlichen Eigenschaften des Systems beschreibt. Dieser Schritt ist wiederum zu unterteilen in a) die Erfassung der wesentlichen physikalischen Größen und die Vernachlässigung unwesentlicher Effekte sowie b) die Annahme einfacher Ursache-Wirkungs-Beziehungen zwischen den physikalischen Variablen. 2. Die Herleitung der maßgeblichen Differenzialgleichungen, die das physikalische Modell beschreiben. a) Auswahl und Definition der physikalischen Variablen: • in der Mechanik: Weg- und Geschwindigkeitskoordinaten sowie Kräfte und Momente, • in der Elektrotechnik: Strom- und Spannungsvariablen, • in der Wärmetechnik: Wärmeflüsse und Temperaturen, • in der Strömungsmechanik: Massendurchsatz und Drücke; b) Aufstellen der Gleichgewichtsbedingungen: • in der Mechanik: Newton’sche Gesetze, Hebelgesetz etc., • in der Elektrotechnik: Kirchhoff’sche Gesetze, • in der Wärmetechnik: Hauptsätze der Thermodynamik, • in der Strömungstechnik: Energie- und Impulssatz; c) Einsetzen der physikalischen Grundgesetze am gegebenen System: • in der Mechanik: Feder- und Trägheitsgesetze, • in der Elektrotechnik: Induktions- und Ladungsgesetze, • in der Wärmetechnik: Speicherkapazität, Wärmeleitfähigkeit etc., • in der Strömungsmechanik: Strömungswiderstände, Pumpleistung etc.;
1.5 Mathematische Modelle und Blockschaltbilder dynamischer Systeme
25
d) Linearisierung, falls notwendig, e) Zeichnen des Blockschaltbildes. 1.5.2
Demonstrationsbeispiele zur Erstellung des mathematischen Modells
Beispiel 1.4: Als einführendes Beispiel soll für den folgenden RC-Vierpol das Blockschaltbild erstellt werden, wobei ue (t) Eingangsgröße und ua (t) Ausgangsgröße des Systems ist.
Bild 1.10: RC-Vierpol
Aus der Maschengleichung am Eingang des Vierpols erhält man für den Strom i(t) die Gleichung ue (t) − ua (t) , R 1 i(t)dt. ua (t) = C
i(t) =
(1.13) (1.14)
Die Laplace-Transformierte der Gleichungen (1.13) und (1.14) wird zu I (s) =
Ue (s) − Ua (s) , R
Ua (s) =
(1.15)
I (s) . sC
(1.16)
Die Summation in der Gl. (1.15) kommt im folgenden Blockschaltbild zum Ausdruck:
Bild 1.11: Blockschaltbild bezüglich Gl. (1.15)
26
1 Einleitung
Die Umsetzung der Gl. (1.16) in ein Blockschaltbild zeigt Bild 1.12:
Bild 1.12: Blockschaltbild entsprechend Gl. (1.16)
Kombiniert man nun beide Blockschaltbilder, so erhält man das gesamte Blockschaltbild für das System RC-Vierpol:
Bild 1.13: Blockschaltbild des RC-Vierpols
Es sollte darauf hingewiesen werden, dass diese Methode der Erstellung von Blockschaltbildern nur sinnvoll ist, wenn das gesamte System, wie im gegebenen Beispiel, durch eine Differenzialgleichung beschrieben wird. Bei der Behandlung von Systemen, die durch mehrere Differenzialgleichungen beschrieben werden, ist für jeden Block das Ursache-WirkungsPrinzip zu beachten. Hierzu folgendes Beispiel 1.5: Betrachten wir das auf einem beweglichen Untergestell montierte Feder-Masse-DämpfungsSystem gemäß Bild 1.14:
Bild 1.14: Feder-Masse-DämpfungsSystem auf einem beweglichen Wagen
1.5 Mathematische Modelle und Blockschaltbilder dynamischer Systeme
27
Es soll das mathematische Modell dieses Systems unter der Voraussetzung entwickelt werden, dass sich der Wagen für t < 0 in Ruhe befindet. Im obigen Bild ist die Eingangsgröße u(t) die Position des Wagens und die Position y(t) der Masse die Ausgangsgröße. Dabei bedeutet m die Masse des beweglichen Aufbaues, b den viskosen Reibungskoeffizienten des Dämpfers und k die Federkonstante der skizzierten Feder. Entsprechend den physikalischen Grundgesetzen ist die Dämpfungskraft proportional zur Differenz der Positionen y˙ − u˙ und die Rückstellkraft der Feder ist proportional zu ihrer Auslenkung y − u. Für dieses System, bei dem nur Kräfte der Translation auftreten, wird das zweite Newton’sche Gesetz ma =
F,
wobei a für die Beschleunigung und F für die jeweilige Kraft steht, zu
d2 y du dy m 2 = −b − − k(y − u) dt dt dt
m
bzw.
d2 y dy du +b + ky = b + ku. 2 dt dt dt
(1.17)
Die Gl. (1.17) ist das mathematische Modell des betrachteten Systems im Zeitbereich. Die entsprechende Übertragungsfunktion erhält man durch die Transformation der Gl. (1.17) in den Laplace-Bereich, wobei sämtliche Anfangsbedingungen definitionsgemäß zu null gesetzt werden: (ms 2 + bs + k)Y (s) = (bs + k)U (s). Durch Bildung des Verhältnisses
F (s) =
Y (s) U (s)
ergibt sich die Übertragungsfunktion des Systems zu
bs + k Y (s) = . U (s) ms 2 + bs + k
(1.18)
Separiert man aus der Gl. (1.18) die Ausgangsgröße Y (s), so erhält man Y (s) = −
1 b 1 k 1 b 1 k Y (s) − 2 Y (s) + U (s) + 2 U (s). s m s m s m s m
Mit Hilfe dieser Gleichung lässt sich nun in einfacher Weise das zugehörige Blockschaltbild aufstellen:
28
1 Einleitung
Bild 1.15: Blockschaltbild des Feder-Masse-Dämpfungs-Systems
Beispiel 1.6: In diesem Beispiel soll das Blockschaltbild eines konstant erregten Gleichstrom-Motors entsprechend Bild 1.16 erstellt werden.
Bild 1.16: Geräte-Übersicht eines konstant erregten Gleichstrom-Motors
Dabei wurden folgende Symbole eingeführt: Ra La ia if ea eb θ T J b
ohmscher Widerstand der Ankerwicklung Induktivität der Ankerwicklung Ankerstrom Erregerstrom zum Aufbau des magnetischen Feldes Angelegte Spannung im Ankerkreis Elektromotorische Gegenspannung Drehwinkel der Motorwelle im Bogenmaß Antriebsmoment des Motors Massenträgheitsmoment der Last einschließlich Motor-Anker Viskoser Reibungskoeffizient der rotierenden Last einschließlich Motor-Anker
1.5 Mathematische Modelle und Blockschaltbilder dynamischer Systeme
29
Folgende Gleichungen dienen zur mathematischen Beschreibung des Gesamtsystems. Das Antriebsmoment des Motors ist proportional zum Ankerstrom ia und zum magnetischen Fluss Ψ im Luftspalt, der wiederum dem Erregerstrom proportional ist; also Ψ = Kf i f , wobei Kf eine Konstante ist. Damit gilt für das Antriebsmoment T = Kf if K1 ia ; K1 ist eine positive Konstante. Für einen konstanten Erregerstrom wird auch der magnetische Fluss konstant, wodurch das Antriebsmoment direkt proportional zum Ankerstrom wird: T = Kia mit K als so genannter Maschinenkonstante. (Es sollte darauf hingewiesen werden, dass sich bei einer Umkehrung der Polarität des Ankerstroms auch die Richtung des Antriebsmomentes ändert.) Durch die Rotation des Motor-Ankers wird in der Motor-Wicklung eine Spannung eb induziert, die proportional zum Erregerfluss und zur Winkelgeschwindigkeit dθ dt des Ankers ist, also eb = Kb
dθ , dt
(1.19)
wobei eb die elektromotorische Gegenspannung und Kb der entsprechende Proportionalitätsfaktor ist. Die Winkelgeschwindigkeit des Motor-Ankers wird durch die (geregelte) Ankerspannung beeinflusst. Die Differenzialgleichung für den Ankerkreis ergibt sich aus der GeräteÜbersicht unter Anwendung der Maschengleichung zu La
dia + Ra ia + eb = ea . dt
(1.20)
Das Antriebsmoment des Motors dient der Überwindung der Reibung sowie dem Antrieb der Last: J
d2 θ dθ = T = Kia . +b 2 dt dt
(1.21)
Setzt man wiederum alle Anfangsbedingungen zu null und transformiert die Gleichungen (1.19), (1.20) und (1.21) in den Laplace-Bereich, so erhält man die Gleichungen Kb sθ (s) = Eb (s),
(1.22)
(sLa + Ra ) · Ia (s) + Eb (s) = Ea (s),
(1.23)
(J s 2 + bs) · θ (s) = T (s) = KIa (s).
(1.24)
Mit Ea (s) als Eingangsgröße und θ (s) als Ausgangsgröße erhält man unter Verwendung der Gleichungen (1.22), (1.23) und (1.24) das zugehörige Blockschaltbild.
30
1 Einleitung
Bild 1.17: Blockschaltbild des konstant erregten Gleichstrom-Motors
Obwohl es sich im gegebenen Beispiel um die Betrachtung einer bloßen Strecke und nicht um einen Regelkreis handelt, sieht man, dass der konstant erregten Gleichstrom-Motor auf Grund der elektromotorischen Gegenspannung ein rückgekoppeltes System ist. Die Übertragungsfunktion dieses Servomotors ergibt sich mit den obigen Gleichungen zu F (s) =
θ (s) K . = Ea (s) s J Ls s 2 + (bLa + J Ra )s + (bRa + KKb )
(1.25)
Wenn man die in der Regel kleine Induktivität des Ankerkreises La vernachlässigt, dann vereinfacht sich die Übertragungsfunktion zu θ (s) Km = s(1 + sTm ) Ea (s) Km = K (bRa + KKb ) F (s) =
mit
als proportionaler Übertragungsbeiwert des Motors und Tm = J Ra (bRa + KKb ) als Zeitkonstante des Motors. Bild 1.18 zeigt das zugehörige vereinfachte Blockschaltbild.
Bild 1.18: Blockschaltbild des vereinfachten konstant erregten Gleichstrom-Motors
2
Regeleinrichtungen
2.1
Einteilung und Bezeichnung
Die Aufgabe einer Regeleinrichtung besteht darin, die Regelgröße laufend mit einem vorgegebenen festen Sollwert (Festwertregelung) oder einem zeitveränderlichen Sollwert (Folgeregelung) zu vergleichen und beim Auftreten einer Abweichung ein geeignetes Stellsignal zu liefern, um die Abweichung zu verringern oder nach Möglichkeit ganz zu beseitigen. Es soll hier kurz betont werden, dass künftig aus Gründen der Einfachheit der Begriff Regler statt Regeleinrichtung für die Kombination aus Regler und Stellglied verwendet wird, wie das auch in der Praxis häufig der Fall ist. Nur in Fällen, in denen Fehldeutungen entstehen könnten, werden die Begriffe Regler und Stellglied streng voneinander getrennt. Eine Unterteilung der Gesamtheit der Regler ist nach folgendem Schema möglich: 1. Unstetige Regler • •
ohne Hilfsenergie mit Hilfsenergie
2. Stetige Regler •
ohne Hilfsenergie
•
mit Hilfsenergie
Unstetige Regler ohne und mit Hilfsenergie Die unstetigen Regler (unabhängig davon, ob mit oder ohne Hilfsenergie) sind dadurch gekennzeichnet, dass die Stellgröße u(t) nur eine begrenzte Zahl verschiedener Zustände annehmen kann. Das Bild 2.1 a) zeigt ein typisches Beispiel einer unstetigen Regelung mit Hilfsenergie. Das oben skizzierte Magnetventil erlaubt im Hinblick auf den Medienzufluss nur zwei Zustände: Bei zu niedrigem Füllstand wird mit Hilfe des Schwimmers über einen Schalter die elektrische Versorgung der Magnetspule betätigt, wodurch der Zufluss freigesetzt wird. Im anderen Fall, bei zu hohem Füllstand, wird der Schalter geöffnet und damit das Magnetventil in den spannungslosen Zustand versetzt, was wiederum den Zufluss von Flüssigkeit in den Behälter unterbindet. Für den Fall, dass das Zulaufventil durch eine mechanische Vorrichtung, also ohne die Zuführung einer elektrischen Spannung betätigt wird, handelt es sich um eine unstetige Regelung ohne Hilfsenergie.
32
2 Regeleinrichtungen
Bild 2.1: Füllstandsregelung als unstetige Regelung mit Hilfsenergie a) Geräte-Übersicht b) Elektromechanisches Magnetventil
Stetige Regler ohne und mit Hilfsenergie Das wesentliche Kriterium einer stetigen Regelung besteht darin, dass die Stellgröße u(t) innerhalb des Stellbereichs jeden beliebigen Wert annehmen kann. Die folgenden zwei Beispiele zeigen stetige Regelungen ohne Hilfsenergie.
Bild 2.2: Druckregelung mit einem stetigen Regler ohne Hilfsenergie
Im Bild 2.2 handelt es sich um einen industriellen Druckregler ohne Hilfsenergie, bei dem der Solldruck vom Betreiber mit Hilfe der angedeuteten Rändelschraube von Hand eingestellt wird. Durch die dadurch vorgespannte Feder ist die Ausbeulung der Membran proportional zur Differenz des Eingangsdrucks und des Drucks am Ausgang des Reglers. In Abhängigkeit der Position des an der Membran montierten Ventilkegels fließt mehr oder weniger Medium zu, so dass damit insgesamt ein analoges Regelsystem vorliegt. Das nächste Beispiel gemäß Bild 2.3 zeigt das Konzept einer Füllstandsregelung ohne Hilfsenergie.
2.1 Einteilung und Bezeichnung
33
Bild 2.3: Füllstandsregelung ohne Hilfsenergie 1: Schwimmer, 2: Hebel, 3: Ventil
Dieses Bild zeigt das Konzept einer industriellen Füllstandsregelung. In dieser Ausführung, ohne Hilfsenergie, ist der Schwimmer über ein Gestänge direkt mit dem Zulaufventil verbunden, mit der Konsequenz, dass die zufließende Flüssigkeitsmenge direkt proportional zur Regelabweichung ist. Wie man leicht sieht, verläuft die Regelung stetig, da beliebig kleine Lageänderungen des Schwimmers bereits eine dazu entsprechendeVerschiebung desVentilkegels zur Folge haben. Sind die erforderlichen Stellkräfte zur Bewegung des Ventilkegels sehr groß, so muss zu einer stetigen Regelung mit Hilfsenergie übergegangen werden. Diese Regelung ließe sich z.B. so auslegen, dass die Position des Schwimmers mit einem induktiven Weggeber erfasst werden und das verstärkte Ausgangssignal einem Stellmotor zugeführt würde, der seinerseits über eine Spindel die Position des Ventilkegels entsprechend verstellen könnte. 2.1.1
Unstetige Regeleinrichtungen
Zu den unstetigen Regeleinrichtungen zählen insbesondere der Zweipunktregler und der Dreipunktregler, jeweils mit und ohne Hysterese. Der Zweipunktregler Der Zweipunktregler arbeitet nur in den beiden Schaltzuständen EIN und AUS, d.h. die Stellgröße ist entweder in voller Größe auf den Eingang der Strecke geschaltet oder sie ist abgeschaltet. Dieses idealisierte Schaltverhalten ist im folgenden Bild durch die dazu entsprechende Kennlinie wiedergegeben.
Bild 2.4: Idealisierte Kennlinie des Zweipunktreglers
34
2 Regeleinrichtungen
Liegt die Regelgröße y(t) unter dem (als konstant angenommenen) Sollwert w(t), so liefert der Regler die maximale Stellgröße uh ; erreicht die Regelgröße den Sollwert, so wird die Stellgröße abgeschaltet. Dieser idealisierte Zweipunktregler hätte jedoch den Nachteil, dass die Stellgröße mit sehr hoher Frequenz ständig zu- und abgeschaltet werden würde. Technisch ausgeführte Zweipunktregler besitzen deshalb eine sog. Schaltdifferenz oder Hysterese, die dadurch in Erscheinung tritt, dass die Stellgröße erst bei einem geringen Betrag der Regelgröße oberhalb des Sollwertes abgeschaltet und bei einem ebenso geringen Betrag unterhalb des Sollwertes eingeschaltet wird. Die Summe dieser beiden Abweichungen ist die Schaltdifferenz , wie im folgenden Bild zu sehen ist.
Bild 2.5: Zweipunktregler mit Hysterese
Ein wesentlicher Nachteil der Zweipunktregelung besteht darin, dass bei jedem Schaltprozess die volle Leistung zu- oder abgeschaltet wird. Dies führt zu großen Laststößen, was bekanntlich die Blindleistung im versorgenden Netz erhöht und darüber hinaus auf die Messleitungen hohe Störimpulse einstreut. Der Dreipunktregler Der Dreipunktregler besitzt im Gegensatz zum Zweipunktregler drei Schaltzustände. Gemäß der Kennlinie im Bild 2.6 entspricht die mittlere Stellung der Ruhelage, d.h. in diesem Bereich sind Regelgröße und Sollwert nahezu identisch.
Bild 2.6: Kennlinie des Dreipunktreglers mit Hysterese
2.1 Einteilung und Bezeichnung
35
Die beiden anderen Schaltzustände werden eingenommen, wenn die Regelabweichung einen bestimmten positiven oder negativen Wert überschreitet. Im Beispiel einer Temperaturregelung würde dies bedeuten, dass weder geheizt noch gekühlt wird, wenn die Raumtemperatur annähernd der Solltemperatur entspricht. Bei zu hoher Temperatur, also negativer Regelabweichung, wäre die Kühlung in Gang zu setzen, bei zu niedriger Temperatur, also positiver Regelabweichung, müsste die Heizung eingeschaltet werden. Natürlich ist wie beim Zweipunktregler wieder eine Schaltdifferenz notwendig, weil sonst die Schaltfrequenz (theoretisch) unendlich hoch werden würde. 2.1.2
Stetige Regeleinrichtungen
Die Aufgabe eines stetigen Reglers umfasst die •
Bildung der Regelabweichung e(t) = w(t) − y(t) sowie deren
•
weitere Verarbeitung zur Reglerausgangsgröße uR (t) oder direkt zur Stellgröße u(t), falls das Stellglied mit dem Regler als Regeleinrichtung zusammengefasst ist.
Die stetigen Regler werden entsprechend ihrem Übertragungsverhalten und ihren grundsätzlichen Eigenschaften in folgende Kategorien unterteilt: Der Proportional-Regler (P-Regler) Wenn die Reglerausgangsgröße uR (t) proportional zur Regelabweichung e(t) ist, wird von einem proportional wirkenden Regler gesprochen. Die allgemeine Gleichung des ProportionalReglers lautet also uR (t) = KR · e(t);
(2.1)
die Übertragungsfunktion des P-Reglers lautet somit FR (s) =
UR (s) = KR E(s)
(2.2)
wobei KR der so genannte proportionale Übertragungsbeiwert oder der Verstärkungsfaktor ist. Typisch für proportional geregelte Strecken ist, dass mit größer werdender Verstärkung KR die Geschwindigkeit erhöht wird, mit der die Regelabweichung e(t) in Richtung kleinerer Werte getrieben wird. Die Größe der Reglerverstärkung KR ist allerdings nach oben durch Stellgrößenbeschränkungen begrenzt und, wie sich in einem späteren Kapitel zeigen wird, durch Stabilitätsprobleme. Außerdem lässt sich bei der Kombination eines P-Reglers mit einer Regelstrecke erster oder höherer Ordnung der Nachteil einer bleibenden Regelabweichung im stationären Zustand nicht vermeiden.
36
2 Regeleinrichtungen
Der Integral-Regler (I-Regler) Der Integral-Regler unterliegt im Zeitbereich der Gleichung
uR (t) = KI
e(t)dt,
(2.3)
d.h. die Reglerausgangsgröße ist dem Zeitintegral der Regelabweichung e(t) proportional; der Vorfaktor KI wird als integraler Übertragungsbeiwert des Reglers bezeichnet. Die entsprechende Übertragungsfunktion wird durch die Anwendung des Integrationssatzes der LaplaceTransformation zu FR (s) =
UR (s) KI = . E(s) s
(2.4)
Der Integral-Regler hat den wesentlichen Vorteil im Vergleich zum P-Regler, dass er eine endliche Stellgröße uR (t) aufbauen und erhalten kann, obwohl das Fehlersignal e(t) zu null geworden ist. Diese Eigenschaft lässt sich leicht damit begründen, dass uR (t) dem zeitlichen Integral der Regelabweichung und nicht dem Momentanwert von e(t) proportional ist, wie dies beim P-Regler vorliegt. Somit sorgt der vergangene Fehler für die „Aufladung“ des Integrators auf einen festen Wert, der erhalten bleibt, auch wenn der Fehler e(t) zu null geworden ist. Als grundlegender Nachteil des Integral-Reglers muss jedoch hervorgehoben werden, dass durch seinen Einbau jeder Regelkreis weniger stabil bzw. geringer gedämpft ist. Diese Eigenschaft wird später noch ausführlich behandelt. Der Differenziationszusatz Ein Differenzial-Regler als alleiniges Arbeitsprinzip existiert nicht, weil er gemäß seiner Grundgleichung de(t) (2.5) dt nur auf die Änderungsgeschwindigkeit, jedoch nicht auf eine konstante Regelabweichung eine Stellgröße liefert, die das Ziel verfolgt, die Regelabweichung zu null auszuregeln. Gemäß der obigen Gleichung ergibt sich die Übertragungsfunktion zu uR (t) = KD ·
FR (s) =
UR (s) = sKD E(s)
(2.6)
mit KD als differenziellem Übertragungsbeiwert. Der D-Zusatz wird in der Regel in Verbindung mit einem Proportional- und/oder einem Integral-Regler verwendet, um die Dämpfung der Regelgröße und die Stabilität des Regelkreises zu verbessern. Der Proportional-Differenzial-Regler (PD-Regler) Wie bereits die Namensgebung verrät, setzt sich der PD-Regler aus einem proportionalen und einem differenzierenden Anteil zusammen:
2.1 Einteilung und Bezeichnung
KD de(t) uR (t) = KR e(t) + · KR dt
37
(2.7)
Obige Gleichung in den Laplace-Bereich transformiert ergibt: UR (s) = KR [E(s) + sTv · E(s)] , wobei der Faktor Tv =
KD KR
(2.8)
in der Praxis als Vorhaltzeit bezeichnet wird.
Damit wird die endgültige Form der Übertragungsfunktion des PD-Reglers zu FR (s) =
UR (s) = KR (1 + sTv ). E(s)
(2.9)
Das Frequenzverhalten dieser Übertragungsfunktion ist im folgenden Bild wiedergegeben.
Bild 2.7: Amplituden- und Phasengang des PD-Reglers
38
2 Regeleinrichtungen
(Zu obigem Bode-Diagramm sollte erwähnt werden, dass zusätzlich zum kontinuierlichen Verlauf des Amplituden- und Phasengangs jeweils die so genannte Geraden-Näherung eingetragen ist.) Der stabilisierende Einfluss des PD-Reglers zeigt sich deutlich durch die mit der Frequenz zunehmende Phase des Reglers zu positiven Werten. Am Amplitudengang ist zu erkennen, dass der Betrag des Frequenzgangs mit steigender Frequenz zunimmt. Dies ist ein äußerst unerwünschter Nachteil des PD-Reglers, weil er hochfrequente Störsignale entsprechend verstärkt, die typischerweise in jedem realen System vorhanden sind. Das phasenanhebende Übertragungsglied (Lead-Glied) Um die Verstärkung hochfrequenter Störsignale und die damit verbundene Störempfindlichkeit des PD-Reglers abzuschwächen, wird dieser zusätzlich mit einem Pol erster Ordnung ergänzt; allerdings mit einer Eckfrequenz, die wesentlich höher als 1 Tv liegt. Damit ist die Phasenanhebung („lead“) im interessierenden Frequenzbereich nach wie vor vorhanden, aber der Einfluss hochfrequenter Störsignale wird weitgehend unterdrückt. Die zugehörige Übertragungsfunktion lautet somit FR (s) =
1 + sTv UR (s) = KR E(s) 1 + sαTv
(2.10)
mit 0 < α < 1. Bild 2.8 zeigt den Amplituden- und Phasengang des phasenanhebenden Übertragungsgliedes (für den Fall KR = 1, Tv = 10 sec, α = 0,2). Zu bemerken ist, dass das Lead-Glied eine signifikante Phasenanhebung und darüber hinaus im Vergleich zum PD-Glied eine geringere Verstärkung hochfrequenter Signale bewirkt. Die Aufgabe des Entwicklungsingenieurs besteht darin, einen solchen Wert von α zu finden, dass ein guter Kompromiss zwischen akzeptabler Dämpfung und Störempfindlichkeit hochfrequenter Signale getroffen wird. Selbst wenn in einem System nur vernachlässigbar kleine Störungen vorhanden sind und die echte PD-Regelung gemäß Gl. (2.9) anwendbar wäre, so würde die tatsächliche Regelung mehr der Gl. (2.10) folgen, weil ein echter Differenzierer ohne Verzögerung aus physikalischen Gründen gar nicht gebaut werden kann. (Kein physikalisches System, mechanisch oder elektrisch, reagiert mit unendlich großer Amplitude bei unendlich hohen Frequenzen.) Somit hat jedes System einen Frequenzbereich (Bandbreite), innerhalb derer überhaupt von der Bildung einer echten Ableitung gesprochen werden kann. Der Proportional-Integral-Regler (PI-Regler) Der PI-Regler ist der in der Praxis am häufigsten verwendete Reglertyp. Seine beschreibende Differenzialgleichung unterliegt der Form
1 uR (t) = KR e(t) + e(t)dt , (2.11) Tn wobei Tn in der Praxis als Nachstellzeit bezeichnet wird.
2.1 Einteilung und Bezeichnung
39
Bild 2.8: Bode-Diagramm des phasenanhebenden Übertragungsgliedes (Lead-Glied)
Obige Gleichung in den Laplace-Bereich transformiert liefert die Übertragungsfunktion des PI-Reglers zu
1 UR (s) FR (s) = . (2.12) = KR 1 + E(s) sTn Folgendes Bild zeigt den Amplituden- und Phasengang des PI-Reglers für KR = 1 und Tn = 1 sec. Der besondere Vorteil des PI-Reglers ist die große Verstärkung für kleine Frequenzen. Diese Eigenschaft hat zur Folge, dass der stationäre Fehler (siehe Endwertsatz) bei konstantem Sollwert verschwindet. Nachteilig wirkt sich jedoch die negative Phasenverschiebung unterhalb der Eckfrequenz T1n in Bezug auf die Stabilität des Regelsystems aus. Das phasenabsenkende Übertragungsglied (Lag-Glied) Das phasenabsenkende Übertragungsglied wird benutzt, um von einer bestimmten Frequenz an die Betragskennlinie abzusenken. Die Übertragungsfunktion dieses Übertragungsgliedes lautet
40
2 Regeleinrichtungen
Bild 2.9: Bode-Diagramm des PI-Reglers
s 1+ (1 T ) 1 + sT FR (s) = KR · = KR · s 1 + αsT 1+ (1 αT )
mit
α > 1.
(2.13)
Mit s = jω sowie den Eckfrequenzen ωZ = 1 T und ωN = 1 (αT ) folgt der Frequenzgang zu ω ωZ FR (jω) = KR · ω . 1+j ωN 1+j
(2.14)
Folgendes Bild zeigt das der Gl. (2.14) entsprechende Bode-Diagramm des Lag-Gliedes. Es wird, analog zum Lead-Glied, wieder ein Frequenzverhältnis m = ωωNZ = α > 1 eingeführt. Damit erhält man die Absenkung des Amplitudengangs für hohe Frequenzen zu
2.1 Einteilung und Bezeichnung
41
Bild 2.10: Bode-Diagramm des phasenabsenkenden Übertragungsgliedes
|∆FR |dB = −20 · lg
KR = 20 · lg(KR m). α
Formt man die Gl. (2.13) mit KR = 1 in die Darstellung 1−1 α 1 FR (s) = + α 1 + αT s
(2.15)
um, so erkennt man, dass das phasenabsenkende Übertragungsglied die Parallelschaltung eines P-Gliedes mit dem Verstärkungsfaktor 1 α und eines PT1 -Gliedes mit der Verstärkung (1 − 1 α) und der Zeitkonstante αT darstellt. Die einem solchen Übertragungsglied entsprechende Übergangsfunktion folgt aus Gl. (2.15) zu hR (t) = ε(t) ·
1 1 . + 1− · 1 − e−t / αT α α
Den grafischen Verlauf der Übergangsfunktion zeigt Bild 2.11.
(2.16)
42
2 Regeleinrichtungen
Bild 2.11: Übergangsfunktion des Lag-Gliedes für α = 2 und T = 2 sec
Der Proportional-Integral-Differenzial-Regler (PID-Regler) Durch die Kombination des PI- und des PD-Reglers erhält man den PID-Regler. Der zeitliche Verlauf der Reglerausgangsgröße lautet entsprechend
uR (t) = KR · e(t) + KI ·
e(t)dt + KD
de(t) dt
(2.17)
Obige Gleichung in den Laplace-Bereich transformiert ergibt die Übertragungsfunktion des PID-Reglers zu
1 UR (s) FR (s) = (2.18) + sTv , = KR 1 + E(s) sTn mit Tn als der bereits bekannten Nachstellzeit und Tv als Vorhaltzeit. Im Bild 2.12 sind Amplituden- und Phasengang des PID-Reglers wiedergegeben. Das Zeitverhalten des PID-Reglers ist äquivalent zur Kombination eines Lead- und LagNetzwerks. Er wird deshalb auch manchmal als Lead-Lag-Kompensator bezeichnet.
2.1 Einteilung und Bezeichnung
43
Bild 2.12: Bode-Diagramm des PID-Reglers mit Geraden-Näherung für Tn Tv = 10
Zusammenfassende Betrachtung der wichtigsten Grundreglertypen Der PD-Regler erzeugt eine merkliche Phasenvoreilung oberhalb der Eckfrequenz. Er erhöht die Reaktionsgeschwindigkeit und damit die Empfindlichkeit des Regelkreises. Die Lead-Kompensation erhöht ebenso die Phasenvoreilung, die Verstärkung wird jedoch nur in einem Frequenzband zwischen den beiden Eckfrequenzen erhöht. Dieses Verhalten kommt wie bereits erwähnt besonders der Unterdrückung des Signalrauschens zugute. Der PI-Regler zeigt eine hohe Verstärkung in einem Frequenzbereich unterhalb der Eckfrequenz und erniedrigt dabei den stationären Fehler. Er bewirkt jedoch eine Phasennacheilung, die sich besonders auf die Stabilität des Regelkreises nachteilig auswirkt, wie in einem späteren Kapitel nachgewiesen wird. Mit der Lag-Kompensation gelingt es, die Verstärkung zwischen den Frequenzen 1 T und 1 αT gezielt zu beeinflussen. Ebenso wird die Phase nur in diesem Frequenzband wesentlich beeinflusst. Damit besteht ebenso die Möglichkeit, wesentlich auf die Stabilität des Regelkreises einzuwirken.
44
2.2
2 Regeleinrichtungen
Technische Realisierung der Grundregler mit Operationsverstärkern
Zur Herstellung des gewünschten Übertragungsverhaltens der diversen Grundregler, aber auch zur Verstärkung von Sensor-Signalen und zur Implementierung von Filtern werden in der Praxis häufig Operationsverstärker verwendet. Anhand des folgenden Schaltbildes sollen die grundsätzlichen Eigenschaften des Operationsverstärkers aufgezeigt werden.
Bild 2.13: Grundsätzlicher Aufbau des Operationsverstärkers
Wie man in obigem Bild sieht, werden die Eingangssignale E1 (s) und E2 (s) relativ gegen Masse gemessen. Das an dem mit einem Minuszeichen gekennzeichneten Eingang anliegende Signal wird bez. seines Vorzeichens invertiert, man spricht deshalb vom invertierenden Eingang; das Signal an dem mit einem Pluszeichen gekennzeichneten Eingang wird nicht invertiert. Dieser Eingang wird somit logischerweise als nicht invertierender Eingang bezeichnet. Die tatsächliche Eingangsspannung des Operationsverstärkers (OPs) ist damit E0 (s) = E2 (s) − E1 (s). Damit wird das Ausgangssignal zu U (s) = K · (E2 (s) − E1 (s)) = −K · (E1 (s) − E2 (s)), wobei K die differenzielle Spannungsverstärkung des OPs ist und E1 (s) sowie E2 (s) Gleichspannungs- oder Wechselspannungs-Signale sein können. Die Verstärkung K liegt für Gleichspannungen und für Wechselspannungen bis etwa 10 Hz im Bereich 105 bis 106 . In der Umgebung von etwa 50 MHz geht die differenzielle Verstärkung gegen den Wert eins. (Der OP wird auch als Differenz-Verstärker bezeichnet, weil er, wie aus obigem Schaltbild hervorgeht, die am Eingang anliegende Differenzspannung verstärkt.) Auf Grund der hohen Verstärkung des OPs ist es notwendig, das Ausgangssignal über ein Netzwerk dem Eingangssignal gegenzukoppeln. Für den idealisierten OP wird der Eingangsstrom auf Grund der hohen Spannungsverstärkung vernachlässigbar klein, d.h. die Eingangsimpedanz wird als unendlich hoch und die Ausgangsimpedanz zu null angenommen. Im Rahmen der folgenden Analyse des OPs wird von dieser Annahme Gebrauch gemacht.
2.2 Technische Realisierung der Grundregler mit Operationsverstärkern
45
Der invertierende Operationsverstärker Zur Untersuchung des Übertragungsverhaltens des beschalteten OPs wird von folgendem Bild ausgegangen.
Bild 2.14: Beschaltung des Operationsverstärkers
Mit dem Eingangsstrom I1 (s) =
E(s) − E (s) Z1 (s)
und dem gegengekoppelten Strom I2 (s) =
E (s) − U (s) Z2 (s)
erhält man bei vernachlässigbarem Eingangsstrom des Verstärkers E(s) − E (s) E (s) − U (s) = . Z1 (s) Z2 (s) Wegen der hohen Verstärkung (K ≈ 106 ) wird E (s) vernachlässigbar klein. Damit wird obige Gleichung zu U (s) Z2 (s) =− . E(s) Z1 (s) (Für Z1 (s) = Z2 (s) wird der OP zu einem sog. Inverter.) Die Übertragungsfunktion des invertierenden OPs lautet somit F (s) =
U (s) Z2 (s) =− . E(s) Z1 (s)
(2.19)
Der nicht invertierende Operationsverstärker Zur Bestimmung der Übertragungsfunktion des nicht invertierenden OPs wird von Bild 2.15 ausgegangen:
46
2 Regeleinrichtungen
Bild 2.15: Beschaltung des nicht invertierenden Operationsverstärkers
Aus Bild 2.15 ergibt sich das Ausgangssignal im Laplace-Bereich zu
U (s) = K · E(s) −
Z1 (s) · E(s) . Z1 (s) + Z2 (s)
Bringt man diese Gleichung auf die Form
E(s) =
Z1 (s) 1 + Z1 (s) + Z2 (s) K
so erhält man wegen F (s) =
1 K
U (s),
≈ 0 die Übertragungsfunktion des nicht invertierenden OPs zu
U (s) Z2 (s) = 1+ E(s) Z1 (s)
(2.20)
Aus Gl. (2.20) ist unschwer zu erkennen, dass bei dieser Art der Beschaltung keine Verstärkungen unter eins möglich sind! Anhand der folgenden Beispiele soll das Übertragungsverhalten bei der jeweiligen Beschaltung untersucht werden. Beispiel 2.1: Für den im folgenden Bild beschalteten Operationsverstärker ist die Übertragungsfunktion aufzustellen.
Bild 2.16: Praktisches Beispiel eines beschalteten Operationsverstärkers
2.2 Technische Realisierung der Grundregler mit Operationsverstärkern
47
Mit Z2 (s) = R2 +
1 sC
Z1 (s) = R1
und
erhält man durch eine kurze Rechnung die gesuchte Übertragungsfunktion zu F (s) = −
Z2 (s) R2 =− Z1 (s) R1
1+
1 sR2 C
.
Diese Übertragungsfunktion hat gemäß Gl. (2.12) die Form eines PI-Reglers mit Tn = R2 C
und
KR =
R2 . R1
Beispiel 2.2: In diesem Beispiel soll die Eingangsimpedanz Z1 (s) eines invertierenden OPs aus der Parallelschaltung eines ohmschen Widerstandes R1 mit einer Kapazität C und die Gegenkopplungsimpedanz aus einem ohmschen Widerstand R2 bestehen, also 1 R1 sC = Z1 (s) = ; 1 1 + sR1 C R1 + sC R1
Z2 (s) = R2 .
Gesucht sind wieder die Übertragungsfunktion sowie die Abhängigkeit der kennzeichnenden Parameter von den Bauelementen R1 , R2 und C. Gemäß Gl. (2.19) lautet die Übertragungsfunktion F (s) = −
Z2 (s) R2 = − (1 + sR1 C). Z1 (s) R1
Diese Übertragungsfunktion ist von der Form FR (s) = KR (1 + sTv ). Somit handelt es sich im gegebenen Beispiel um ein PD-Verhalten mit KR =
R2 R1
und
Tv = R1 C.
Demgemäß lassen sich sämtliche anderen Grundregler durch eine entsprechende Beschaltung realisieren.
3
Analyse des transienten und stationären Verhaltens von Systemen
3.1
Typische Testsignale
Zur Analyse und Identifikation von Systemen werden in der Praxis im Wesentlichen fünf verschiedene Testsignale verwendet: die Impulsfunktion, die Sprungfunktion, die Rampe, die Beschleunigungsfunktion und die Sinusfunktion. Welches dieser typischen Testsignale im jeweiligen Fall zur Analyse eines gegebenen Systems verwendet wird, hängt im Wesentlichen davon ab, welchem Signaltyp das zu untersuchende System im realen Betrieb am meisten unterworfen ist. Wenn beispielsweise ein System im praktischen Betrieb vorwiegend Sprüngen oder Impulsen ausgesetzt ist, dann ist mit großer Sicherheit auch ein Testsignal dieser Art das am besten geeignete Eingangssignal. Interessiert andererseits, wie dies bei nachrichtentechnischen Systemen häufig der Fall ist, das Frequenzverhalten, so wird man eine in der Frequenz einstellbare Sinusfunktion verwenden. 3.1.1
Die Sprungfunktion
Die Sprungfunktion als Eingangssignal des zu untersuchenden Systems ist definiert durch u(t) = uˆ · ε(t) mit
ε(t) =
uˆ = konst. und
0 für t < 0 . 1 für t ≥ 0
Das zugehörige Ausgangssignal y(t) als Reaktion auf die Sprungfunktion wird als Sprungantwort bezeichnet. Die auf die Amplitude uˆ des Eingangssignals bezogene Sprungantwort h(t) =
y(t) uˆ
wird als Übergangsfunktion bezeichnet. 3.1.2
Die Gewichtsfunktion (Impulsantwort)
Die Gewichtsfunktion g(t) ist die Systemantwort auf die Impulsfunktion δ(t) (Einheitsimpuls oder „Dirac-Stoß“) als Eingangsgröße. Dabei ist die δ-Funktion definiert zu
δ(t) =
∞ für 0 sonst
t =0
∞ oder auch
δ(t)dt = 1. −∞
3.1 Typische Testsignale
49
Bild 3.1: Näherung der δ-Funktion;
symbolische Darstellung der δ-Funktion
Gemäß Bild 3.1 wird die δ-Funktion auch als Rechteckimpuls der Breite α und der Amplitude 1 α aufgefasst, wobei die Breite α gegen null geht. Symbolisch wird die δ-Funktion als Pfeil der Länge 1 dargestellt. Die Länge 1 wird gelegentlich auch als Impulsstärke bezeichnet. Dabei ist jedoch zu beachten, dass für die Höhe des Impulses weiterhin δ(t) → ∞ gilt. Entsprechend der Definition der Sprungfunktion und der Impulsfunktion gilt der Zusammenhang δ(t) =
dε(t) . dt
(3.1)
Auf Grund des linearen Zusammenhangs zwischen der Eingangs- und Ausgangsgröße des betrachteten Systems erhält man zwischen der Gewichtsfunktion g(t) und der Übergangsfunktion h(t) die Beziehung g(t) =
dh(t) . dt
(3.2)
Schließlich sei noch angemerkt, dass sich die Impulsantwort eines Systems, nachdem die Laplace-Transformierte der Impulsfunktion 1 ist, auch als Rücktransformierte der Übertragungsfunktion g(t) = L−1 [F (s)]
(3.3)
ergibt. 3.1.3
Die Sinusantwort
Wählt man ein sinusförmiges Eingangssignal in der komplexen Form u(t) = uˆ · ejωt
mit uˆ = konst. und
0 ≤ ω ≤ ∞,
so wird die Ausgangsgröße im eingeschwungenen Zustand zu y(t) = yˆ · ej(ωt+ϕ) .
50
3 Analyse des transienten und stationären Verhaltens von Systemen
Das stationäre Ausgangssignal mit der Amplitude yˆ ist wieder sinusförmig und in der Phase um den Phasenwinkel ϕ gegen das Eingangssignal verschoben. Das Verhältnis zwischen dem Eingangssignal und dem Ausgangssignal ergibt den Frequenzgang F (jω) =
yˆ y = · ejϕ u uˆ
(3.4)
Der Frequenzgang ist ein komplexer Zeiger, dessen Betrag das Amplitudenverhältnis und dessen Phase ϕ die Phasenverschiebung des Ausgangssignals gegenüber dem Eingangssignal im stationären Zustand angibt. Ergänzend sei noch angemerkt, dass sich der Frequenzgang in Anlehnung an Abschnitt 1.4.5 auch als Sonderfall der Übertragungsfunktion ergibt, wenn der Laplace-Operator s = σ + jω mit s = jω ersetzt wird. Beispiel 3.1: Für den Spannungsteiler im Bild 3.2 sind die Übertragungsfunktion F (s) sowie der Frequenzgang F (jω) zu bestimmen.
Bild 3.2: Einfacher Spannungsteiler
Mit Ua (s) = F (s) = Ue (s)
R2 +
1 sC
R1 + R 2 +
1 sC
folgt die gesuchte Übertragungsfunktion zu F (s) =
1 + sR2 C . 1 + sC(R1 + R2 )
Mit s = jω erhält man den entsprechenden Frequenzgang zu F (jω) =
1 + jωR2 C . 1 + jωC(R1 + R2 )
3.2 Die wichtigsten Übertragungsglieder
3.2
51
Die wichtigsten Übertragungsglieder
Es ist Angelegenheit der Systemtheorie, das Übertragungsverhalten sämtlicher praktisch realistischer Übertragungsglieder zu untersuchen. Dies sind im Wesentlichen das Proportionalglied, das Integralglied sowie das differenzierende Übertragungsglied, jeweils mit und ohne Verzögerung. Im Rahmen dieser Arbeit soll lediglich das für regelungstechnische Belange maßgebliche Proportionalglied mit Verzögerung erster bzw. zweiter Ordnung untersucht werden. 3.2.1
Systeme erster Ordnung
Betrachten wir einleitend folgendes System, bei dem die Ausgangsgröße eines Integrators auf eine Summierstelle rückgekoppelt wird.
Bild 3.3: Blockschaltbild eines Systems erster Ordnung
Physikalisch kann dieses System beispielsweise einen RC-Spannungsteiler repräsentieren. Bildet man die Übertragungsfunktion dieses Systems, so erhält man die Gleichung F (s) =
1 Y (s) = . W (s) 1 + sT
(3.5)
Transformiert man diese Gleichung in den Zeitbereich zurück, so erhält man eine Differenzialgleichung erster Ordnung; hiermit ist die Namensgebung „System erster Ordnung“ begründet. Im Folgenden soll die Systemantwort y(t) für eine sprungförmige Eingangsgröße w(t), für eine Rampe sowie für die oben definierte Impulsfunktion untersucht werden. Sprungantwort eines Systems erster Ordnung Mit w(t) = ε(t) und damit W (s) = 1s erhält man aus Gl. (3.5) die Laplace-transformierte Ausgangsgröße zu Y (s) =
1 1 · . 1 + sT s
Um den entsprechenden zeitlichen Verlauf der Ausgangsgröße y(t) zu bestimmen wird obige Gleichung in Partialbrüche zerlegt; man erhält daraus nach einer kurzen Rechnung Y (s) =
T 1 − . s 1 + sT
52
3 Analyse des transienten und stationären Verhaltens von Systemen
Bild 3.4: Sprungantwort eines Systems erster Ordnung
Transformiert man nun beide Terme der rechten Seite dieser Gleichung in den Zeitbereich, so erhält man die gesuchte Ausgangsgröße im Zeitbereich zu y(t) = 1 − e−t / T
mit t ≥ 0.
(3.6)
Aus Gl. (3.6) kann man unschwer erkennen, dass die Ausgangsgröße y(t) mit dem Wert null beginnt und im stationären Zustand den Wert eins annimmt. Zum Zeitpunkt t = T hat die Ausgangsgröße 63,2 % ihres stationären Endwertes erreicht. (Der Nachweis ist einfach zu liefern, indem man in Gl. (3.6) t = T setzt.) Die Zeitkonstante T ist ein Maß für die Schnelligkeit des betrachteten Systems. Des Weiteren soll darauf hingewiesen werden, dass sich die Steigung des Funktionsgraphen zum Zeitpunkt t = 0 zu 1 T ergibt: 1 1 dy(t) = . = · e−t/T t=0 dt T T Rampenantwort eines Systems erster Ordnung Mit w(t) = t bzw. W (s) = s12 wird jetzt die Laplace-transformierte Ausgangsgröße des Systems im Bild 3.3 zu Y (s) =
1 1 · 2. 1 + sT s
3.2 Die wichtigsten Übertragungsglieder
53
Die Partialbruchzerlegung dieser Gleichung bekommt damit die Form Y (s) =
1 T2 T + . − s2 s 1 + sT
Die Rücktransformierte dieser Gleichung wird durch eine kurze Rechnung zu y(t) = t − T 1 − e−t / T , t ≥ 0.
(3.7)
(3.8)
Die Rampe w(t) als Eingangsgröße sowie die Rampenantwort y(t) als Ausgangsgröße sind im Diagramm von Bild 3.5 wiedergegeben.
Bild 3.5: Rampenantwort eines Systems erster Ordnung
Wie man aus Bild 3.5 und anhand der Gl. (3.8) leicht ersehen kann, wird das Differenzsignal zwischen der Eingangsgröße und der Ausgangsgröße, der so genannte Schleppfehler, im stationären Zustand zu T . Je kleiner also die Zeitkonstante ist, desto kleiner wird auch der stationäre Fehler. Impulsantwort eines Systems erster Ordnung Für w(t) = δ(t) bzw. W (s) = 1 erhält man aus der Laplace-transformierten Ausgangsgröße Y (s) =
1 1 + sT
54
3 Analyse des transienten und stationären Verhaltens von Systemen
die zugehörige Impulsantwort zu y(t) =
1 −t / T , ·e T
t ≥ 0.
(3.9)
Der entsprechende Funktionsgraph gemäß Gl. (3.9) ist im folgenden Bild für T = 1 sec wiedergegeben.
Bild 3.6: Impulsantwort eines Systems erster Ordnung
Eine wichtige Eigenschaft linearer zeitinvarianter Systeme In der obigen Abhandlung wurde gezeigt, dass sich für eine Rampenfunktion als Testsignal die Ausgangsgröße des Systems zu y(t) = t − T 1 − e−t / T , t ≥ 0 ergeben hat. Für die Sprungfunktion als Ableitung der Rampe ergab sich die Ausgangsgröße zu y(t) = 1 − e−t / T
mit t ≥ 0.
Schließlich erhielten wir für den Einheitsimpuls als Ableitung der Sprungfunktion die entsprechende Ausgangsgröße y(t) zu
3.2 Die wichtigsten Übertragungsglieder
y(t) =
1 −t/ T ·e , T
55
t ≥ 0.
Vergleicht man die hier aufgeführten Systemausgangsfunktionen miteinander, so ist unschwer zu erkennen, dass sich die Systemantwort bez. der Ableitung der Eingangsgröße ebenso aus dem Differenzial der ursprünglichen Ausgangsgröße ergibt. Dies ist eine typische Eigenschaft eines linearen zeitinvarianten Systems. 3.2.2
Systeme zweiter Ordnung
Ein System zweiter Ordnung ist dadurch gekennzeichnet, dass in dem betrachteten System zwei verschiedenartige Energiespeicher vorhanden sind und infolgedessen das Übertragungsverhalten durch eine Differenzialgleichung zweiter Ordnung beschrieben wird. Bei der folgenden Betrachtung soll zunächst am Beispiel eines Feder-Masse-Dämpfungs-Systems die Differenzialgleichung und die Übertragungsfunktion eines Systems zweiter Ordnung aufgestellt werden. ImAnschluss daran wird das System zweiter Ordnung einer allgemeinenAnalyse unterzogen. Hierzu gehen wir aus von Bild 3.7.
Bild 3.7: Mechanischer Schwinger
Das obige Bild zeigt eine mechanische Feder mit der Federkonstanten c, ein Dämpfungsglied mit der geschwindigkeitsproportionalen Dämpfung b sowie eine Masse m. Die Differenzialgleichung zur Beschreibung der Bewegung y(t) der Masse m als Ausgangsgröße und einer treibenden Kraft w(t) als Eingangsgröße lautet nach dem ersten Newton’schen Gesetz my(t) ¨ + by(t) ˙ + cy(t) = w(t). Aus der umgeformten Differenzialgleichung y(t) ¨ =
1 ˙ − cy(t)] [w(t) − by(t) m
(3.10)
56
3 Analyse des transienten und stationären Verhaltens von Systemen
Bild 3.8: Blockschaltbild des mechanischen Schwingers
lässt sich das Blockschaltbild dieses Systems durch die Reihenschaltung zweier Integratoren und entsprechende proportionale Rückführungen einfach entwickeln; siehe hierzu Bild 3.8. Unterzieht man die Gl. (3.10) einer Laplace-Transformation s 2 Y (s) =
1 (W (s) − bsY (s) − cY (s)), m
so erhält man durch eine einfache Anwendung der zugehörigen Rechenregeln die Übertragungsfunktion des betrachteten Systems zu F (s) =
Y (s) = W (s)
1 c . b m 2 1+ s+ s c c
(3.11)
Allgemeine Analyse von Systemen zweiter Ordnung Nach der vorausgegangenen exemplarischen Betrachtung sollen nun Systeme zweiter Ordnung einer allgemeinen Analyse unterzogen werden. Bezeichnet man die in Gl. (3.11) auftretenden Koeffizienten mit Faktoren, die, wie sich zeigen wird, über das dynamische Verhalten des Systems Aufschluss geben, so eignen sich die Definitionen K=
1 y(t) = c w(t) t→∞
bzw. unter Verwendung des Endwertsatzes Y (s) K= W (s) s→0 für den proportionalen Übertragungsbeiwert, m 1 = 2 c ω0
3.2 Die wichtigsten Übertragungsglieder
57
mit ω0 als Eigenkreisfrequenz der ungedämpften Schwingung der Ausgangsgröße sowie 2d b = , ω0 c wobei d der Dämpfungsfaktor ist. Damit wird die Übertragungsfunktion eines Systems zweiter Ordnung in allgemeiner Form zu F (s) =
K . 2d 1 1+ s + 2 · s2 ω0 ω0
(3.12)
Das dynamische Verhalten des Systems wird bekanntlich durch die Wurzeln der charakteristischen Gleichung, d.h. aus den Lösungen des zu null gesetzten Nenners der Übertragungsfunktion bestimmt. Aus der charakteristischen Gleichung N(s) = 1 +
2d 1 s + 2 s2 = 0 ω0 ω0
(3.13)
erhält man die Pole der Übertragungsfunktion zu s1,2 = −ω0 d ± ω0 d 2 − 1. In Abhängigkeit dieser Lösungen der charakteristischen Gleichung, also der Lage der Pole der Übertragungsfunktion in der s-Ebene, lässt sich das Schwingverhalten eines Systems zweiter Ordnung anschaulich beschreiben. Dazu ist folgende Fallunterscheidung angebracht: • 0 < d < 1 (periodischer Fall) Die charakteristische Gleichung (3.13) liefert für diesen Fall ein konjugiert komplexes Polpaar s1,2 = −ω0 d ± jω0 1 − d 2 . Die zugehörige Sprungantwort erhält man aus der Laplace-transformierten Ausgangsgröße Y (s) =
K 1 · 2d 1 2 s 1+ s + 2s ω0 ω0
bzw. Y (s) =
K · ω02 (s − s1 )(s − s2 )s
58
3 Analyse des transienten und stationären Verhaltens von Systemen
durch Partialbruchzerlegung und anschließende Rücktransformation in den Zeitbereich für t ≥ 0 zu
d y(t) = K 1 − e−ω0 td cos(ωd · t) + √ sin(ωd · t) , (3.14) 1 − d2 √ wobei ωd = ω0 1 − d 2 die Eigenkreisfrequenz der gedämpften Schwingung ist. Wenn man den Sinus- und den Kosinusterm zu einer Sinusfunktion zusammenfasst, so erhält man den zu obiger Gleichung alternativen Ausdruck zu √ e−ω0 td 1 − d2 y(t) = K 1 − √ · sin ωd t + arctan . d 1 − d2
Bild 3.9: Sprungantwort eines Systems zweiter Ordnung für d < 1
Bild 3.9 zeigt ein typisches dynamisches Verhalten eines schwingfähigen Systems; im gegebenen Fall für eine Dämpfung von d = 0,4. • d = 1 (aperiodischer Grenzfall) Für diesen Fall liefert die charakteristische Gleichung (3.13) der Übertragungsfunktion eine doppelte Polstelle zu s1,2 = −ω0 ,
3.2 Die wichtigsten Übertragungsglieder
59
d.h. es liegt ein Doppelpol auf der negativ reellen Achse vor. Für eine sprungförmige Eingangsgröße, also W (s) = 1/s, wird die Ausgangsgröße im Laplace-Bereich zu Y (s) =
K · ω02 . s(s + ω0 )2
Die inverse Laplace-Transformierte erhält man für diesen Fall unter Verwendung der Gl. (3.14) durch den Grenzübergang d → 1 zu y(t) = K 1 − e−ω0 t (1 + ω0 t) ,
t ≥ 0.
(3.15)
• d > 1 (aperiodischer Fall) Für diesen Fall liefert die charakteristische Gleichung zwei negativ reelle Pole, s1,2 = −ω0 d ± ω0 d 2 − 1. Weil – übrigens wie im Fall b) – die Lösungen reell sind, kann man für die charakteristischen Eigenwerte s1,2 reelle Zeitkonstanten definieren: T1 = −1 s1
und
T2 = −1 s2 ;
damit wird die zugehörige Sprungantwort im Laplace-Bereich zu Y (s) =
K 1 · . s (1 + sT1 )(1 + sT2 )
Wie man aus dieser Gleichung leicht sehen kann, liegt gewissermaßen die Reihenschaltung zweier Verzögerungsglieder erster Ordnung vor, jedoch mit unterschiedlichen Zeitkonstanten. Bei der Berechnung der Sprungantwort y(t) nach Gleichung (3.14) werden für diesen Fall die Argumente der beiden Kreisfunktionen komplex. Über den Zusammenhang cos(jx) = cosh(x) und
sin(jx) = j · sinh(x)
erhält man im vorliegenden Fall die gesuchte Übergangsfunktion zu
d y(t) = K 1 − e−ω0 dt cosh ω0 d 2 − 1 · t + √ (3.16) sinh ω0 d 2 − 1 · t d2 − 1
Das folgende Diagramm zeigt das Zeitverhalten eines Systems gemäß Gl. (3.15) für d = 1 bzw. entsprechend Gl. (3.16) für d > 1. Wie man unschwer erkennen kann, haben beide Funktionsgraphen qualitativ gleiches Zeitverhalten. Der transiente Übergang wird jedoch mit zunehmender Dämpfung langsamer.
60
3 Analyse des transienten und stationären Verhaltens von Systemen
Bild 3.10: Sprungantwort eines Systems für d ≥ 1
• d = 0 (ungedämpfter Fall) Aus der charakteristischen Gleichung folgt für diesen Fall ein rein imaginäres Polpaar s1,2 = ±jω0 . Damit wird die Übertragungsfunktion zu F (s) =
ω2 K 2 =K 2 0 . 1 + s 2 ω0 ω0 + s 2
(3.17)
Als Sprungantwort y(t) ergibt sich nun die bekannte ungedämpfte Schwingung y(t) = K(1 − cos ω0 t).
3.3
(3.18)
Dynamisches Verhalten des Regelkreises
In diesem Abschnitt wird im Wesentlichen das dynamische Verhalten sowie im nächsten Abschnitt das stationäreVerhalten von Regelkreisen untersucht. In einem weiteren Kapitel werden die in der Praxis gängigsten Verfahren aufgezeigt, mit denen die Stabilität von Regelkreisen untersucht und beurteilt werden kann. Schließlich wird das so genannte WurzelortskurvenVerfahren dargestellt, das sowohl für die Analyse als auch für die Synthese, d.h. für die Dimensionierung von Regelkreisen herangezogen werden kann.
3.3 Dynamisches Verhalten des Regelkreises
61
Das folgende Bild zeigt den bereits bekannten Standard-Regelkreis, wobei Regler und Stellglied zur Regeleinrichtung mit der Übertragungsfunktion FR (s) zusammengefasst sind, außerdem ist in diesem Bild das Messglied dem zu regelnden Objekt mit der Übertragungsfunktion FS (s) zugerechnet worden.
Bild 3.11: Blockschaltbild des allgemein gültigen Regelkreises
Der Vollständigkeit wegen werden noch einmal die maßgeblichen Variablen mit ihren entsprechenden Bezeichnungen aufgelistet: W (s) E(s) U (s) Z(s) Y (s)
Sollwert bzw. Führungsgröße Regelabweichung Stellgröße Störgröße rückgeführte Regelgröße
Wie man in obigem Bild sieht, erhält man die rückgeführte Regelgröße des geschlossenen Regelkreises zu Y (s) = Z(s) + [W (s) − Y (s)] · FR (s) · FS (s). Durch Umstellen dieser Gleichung folgt daraus die Regelgröße in Abhängigkeit der Störung und der Führungsgröße zu Y (s) =
1 FR (s)FS (s) · Z(s) + · W (s). 1 + FR (s)FS (s) 1 + FR (s)FS (s)
(3.19)
Anhand dieser Gleichung können nun die zwei wesentlichen Aufgabenstellungen einer Regelung aufgeführt werden. •
Für W (s) = 0 ergibt sich das Verhalten der Regelgröße in Abhängigkeit der Störgröße; man spricht deshalb in diesem Zusammenhang vom Störverhalten des Regelkreises. Die Störübertragungsfunktion lautet dann Y (s) 1 FZ (s) = = . (3.20) Z(s) W (s)=0 1 + FR (s)FS (s)
•
Für Z(s) = 0 erhält man entsprechend die Übertragungsfunktion des geschlossenen Regelkreises oder das so genannte Führungsverhalten, d.h. das Verhalten der Regelgröße in Abhängigkeit der Führungsgröße. Die Führungsübertragungsfunktion lautet somit
62
3 Analyse des transienten und stationären Verhaltens von Systemen
Y (s) FR (s)FS (s) = W (s) Z(s)=0 1 + FR (s)FS (s)
FW (s) =
(3.21)
Der Ausdruck Fo (s) = FR (s) · FS (s)
(3.22)
wird als Übertragungsfunktion des offenen Regelkreises bezeichnet; sie entsteht als Verhältnis zwischen der Eingangsgröße W (s) und der zur Vergleichsstelle rückgeführten Regelgröße, wobei in die Rückführung ein geöffneter Schalter unmittelbar vor der Vergleichsstelle zu denken ist. Mit dieser Definition wird Gl. (3.20) zu FZ (s) =
1 1 + Fo (s)
und Gl. (3.21) zu FW (s) =
Fo (s) . 1 + Fo (s)
Für den geschlossenen Regelkreis erhält man durch Nullsetzen des Nennerausdrucks der Gl. (3.20) oder Gl. (3.21) 1 + Fo (s) = 0
(3.23)
die charakteristische Gleichung in der Form a0 + a1 s + a2 s 2 + . . . + an s n = 0,
(3.24)
die uns später noch bei der Beurteilung der Stabilität bzw. bei der Stabilisierung von Regelkreisen begegnen wird.
3.4
Stationäres Verhalten des Regelkreises
Das stationäre Verhalten, d.h. die Genauigkeit, mit der sich die Regelgröße y(t) nach einer vorübergehenden Störung wieder auf die Führungsgröße einschwingt, spielt eine ganz zentrale Rolle bei der Synthese von Regelkreisen. Theoretisch wäre es wünschenswert für einen Regelkreis, dass bei Positions-, Geschwindigkeits- oder Beschleunigungsregelungen im stationären Betrieb keine Regelabweichung mehr vorhanden wäre. Für die Bestimmung des Fehlers im stationären Betrieb, also des stationären Verhaltens, eignet sich besonders der Endwertsatz der Laplace-Transformation, wie im Folgenden gezeigt wird. Dazu betrachten wir wieder den Standard-Regelkreis von Bild 3.11 in der komprimierten Form von Bild 3.12:
3.4 Stationäres Verhalten des Regelkreises
63
Bild 3.12: Regelkreis mit direkter Rückführung
Die Regelabweichung E(s) bei gegebenem Sollwert W (s) liegt vor in der Form E(s) 1 = . W (s) 1 + Fo (s)
(3.25)
Den stationären Fehler erhält man unter Verwendung des Endwertsatzes der LaplaceTransformation zu s · W (s) . s→0 1 + Fo (s)
est = lim e(t) = lim t→∞
(3.26)
In der angewandten Regelungstechnik ist man gewöhnlich an Positions-, Geschwindigkeitsund Beschleunigungsregelungen bzw. entsprechenden Sollwerteingängen interessiert. Danach lauten für den Sprung, für die Rampe und die Parabel die mathematischen Ausdrücke: •
Positionsregelung:
w(t) = ε(t),
W (s) = 1/s
(3.27)
•
Geschwindigkeitsregelung:
w(t) = t · ε(t),
W (s) = 1/s 2
(3.28)
1 2 (3.29) t · ε(t), W (s) = 1/s 3 2 Im nächsten Schritt wird der stationäre Fehler für den entsprechenden Sollwert gemäß den Gleichungen (3.27) bis (3.29) bestimmt. •
Beschleunigungsregelung:
w(t) =
Die Übertragungsfunktion des offenen Regelkreises lässt sich allgemein in der Form F0 (s) =
Ko 1 + β1 s + β2 s 2 + . . . + β m s m · s k 1 + α1 s + α2 s 2 + . . . + αn−k s n−k
(3.30)
mit m < n darstellen. Die ganzzahlige Konstante k = 0, 1, 2 . . . charakterisiert die Zahl der im offenen Regelkreis vorhandenen Integratoren; Ko stellt die Verstärkung des offenen Regelkreises dar: k=0 k=1 k=2
Proportionales Verhalten Integrales Verhalten Doppelt integrierendes Verhalten im offenen Regelkreis.
64
3 Analyse des transienten und stationären Verhaltens von Systemen
Positionsregelung Mit w(t) = ε(t) bzw. W (s) = 1/s erhält man mit Gl. (3.26) est = lim
s→0
1 s · (1/s) = 1 + Fo (s) 1 + lim Fo (s)
(3.31)
s→0
Der Ausdruck lim Fo (s) ist als Positionskonstante KP definiert: s→0
KP = lim Fo (s).
(3.32)
s→0
Damit lautet der stationäre Fehler est =
1 . 1 + KP
(3.33)
Aus Gl. (3.30) ist zu ersehen, dass die Positionskonstante unendlich wird für alle Systeme mit einem oder mehreren Integratoren im offenen Kreis. Aus Gl. (3.33) ist weiter zu erkennen, dass alle Systeme, die mindestens einen Integrator im offenen Kreis beinhalten, keine stationäre Regelabweichung aufweisen. Enthält ein Regelkreis kein Integrierglied (k = 0), so wird der stationäre Fehler bei sprungförmiger Sollwertänderung zu est =
1 = 0. 1 + Ko
Geschwindigkeitsregelung Mit w(t) = t · ε(t) bzw. W (s) = 1 s 2 erhält man jetzt mit Gl. (3.26) s(1 s 2 ) 1 est = lim = . s→0 1 + Fo (s) lim sFo (s)
(3.34)
s→0
Der Ausdruck lim sFo (s) wird als Geschwindigkeitskonstante Kv definiert: s→0
Kv = lim sFo (s) s→0
(3.35)
Damit ergibt sich der stationäre Fehler der Regelgröße in Abhängigkeit der Geschwindigkeitskonstanten zu est =
1 . Kv
(3.36)
Die Gl. (3.36) zeigt, dass der stationäre Fehler eines geregelten Systems mit rampenförmigem Eingang gleich dem Kehrwert der Geschwindigkeitskonstanten ist. Die Geschwindigkeitskonstante Kv wird unendlich für alle Systeme, die mehr als zwei Integratoren (k ≥ 2) im offenen
3.4 Stationäres Verhalten des Regelkreises
65
Kreis beinhalten; für solche Systeme verschwindet der stationäre Fehler. Offene Regelkreise ohne Integrationsverhalten (k = 0) können einem geschwindigkeitsproportionalen Sollwert nicht folgen. Weiterhin ergibt sich aus Gl. (3.36), dass ein Regelkreis mit nur einem Integrator eine konstante stationäre Regelabweichung aufweist. Beschleunigungsregelung Der stationäre Fehler gemäß Gl. (3.36) ergibt sich jetzt mit w(t) = 21 t 2 · ε(t) zu s(1 s 3 ) 1 est = lim = . s→0 1 + Fo (s) lim s 2 Fo (s)
(3.37)
s→0
Der Ausdruck lim s 2 Fo (s) wird als Beschleunigungskonstante Ka definiert: s→0
Ka = lim s 2 Fo (s). s→0
(3.38)
Damit wird der stationäre Fehler in Abhängigkeit von Ka zu est =
1 . Ka
(3.39)
Die Gl. (3.39) zeigt, dass der stationäre Fehler eines geregelten Systems mit parabolisch ansteigendem Sollwert gleich dem Kehrwert der Beschleunigungskonstanten ist. Aus Gl. (3.38) sieht man, dass die Beschleunigungskonstante für alle Systeme mit drei oder mehr Integratoren (k ≥ 3) im offenen Regelkreis unendlich wird und damit für solche Systeme die stationäre Regelabweichung verschwindet. Gl. (3.39) impliziert weiterhin, dass alle Regelkreise, die mindestens drei Integratoren enthalten, bei parabolischem Sollwerteingang keine bleibende Regelabweichung aufweisen. Systeme, die weniger als zwei Integratoren im offenen Regelkreis enthalten (k < 2), können einem parabolisch verlaufenden Sollwert nicht folgen, so dass der Fehler mit zunehmender Zeit immer größer wird. Systeme mit zwei Integratoren (k = 2) weisen entsprechend einen stationären Fehler von 1 Ko bei parabolisch verlaufendem Sollwert auf. Die folgende Tabelle enthält eine Zusammenfassung der in diesem Kapitel hergeleiteten Zusammenhänge zwischen dem stationären Fehler und der Zahl der Integratoren im offenen Regelkreis beim jeweiligen Sollwerteingang: Beispiel 3.2: Gegeben ist ein Boden-Radarsystem, das einem Flugobjekt mit einem möglichst geringen Schleppfehler folgen soll. Das Blockdiagramm bez. der Azimut-Achse des Parabolspiegels ist im Bild 3.13 wiedergegeben.
66
3 Analyse des transienten und stationären Verhaltens von Systemen
Tabelle 3.1: Stationärer Fehler in Abhängigkeit von der Anzahl der Integratoren Anzahl der Integratoren (k)
Sprung
Eingang Rampe
Parabel
∞
∞ ∞
0
1 1 + Kp
1
0
1 Kv
2
0
0
3
0
0
1 Ka 0
Bild 3.13: Geräte-Übersicht eines Radarfolgesystems
Zu bestimmen ist der stationäre Fehler des Radarfolgesystems für die durch die Dynamik des Flugobjekts vorgegebenen Sollwerte: a) w(t) = 10 t b) w(t) = 10 t + 6 t 2 . zu a) 10 s· 10 s2 est = lim = s→0 1 + Fo (s) lim sFo (s)
s→0
est =
10 = 0. 0,1(s + 1) 1 lim s · · s(s + 0,1) (s + 0,5)
3.4 Stationäres Verhalten des Regelkreises
67
zu b) w(t) = 10 t + 6 t 2 ; est =
W (s) =
10 6 · 2 + 3 s2 s
10 12 + = est1 + est2 Kv Ka
mit Kv = lim sFo (s) s→0
und Ka = lim s 2 Fo (s). s→0
Kv = lim s · s→0
1 0,1 0,1(s + 1) · = → ∞; s(s + 0,1) s(s + 0,5) 0
daraus folgt est1 = 0. Damit wird est2 =
12 12 = = 6. Ka 2
Somit ist der Gesamtfehler im stationären Betrieb eine Konstante; nämlich est = est1 + est2 = 6.
4
Stabilität von Regelkreisen
4.1
Einleitung
Der große Vorteil einer Regelung gegenüber einer Steuerung besteht in der Möglichkeit, durch ständige Überwachung der Regelgröße ein System auch dann gezielt zu beeinflussen, wenn es nur unvollständig bekannt ist. Da jedoch jeder Regelkreis eine rückgekoppelte Struktur besitzt, können dabei allerdings Stabilitätsprobleme auftreten. Für einen in der Praxis brauchbaren Regelkreis muss aber gewährleistet sein, dass für beliebige Eingangssignale trotz auftretender Störungen und bei Parameterschwankungen einzelner Regelkreisglieder keine bleibenden oder gar aufklingenden Schwingungen der Ausgangsgröße auftreten. In den folgenden Betrachtungen wird der Regelkreis als lineares, zeitinvariantes System mit einer Eingangsgröße und einer Ausgangsgröße aufgefasst. Zur Definition der Stabilität eines Systems bzw. eines Regelkreises wird vom folgenden Satz ausgegangen:
Ein lineares, zeitinvariantes System wird genau dann als stabil bezeichnet, wenn seine Übergangsfunktion h(t) mit zunehmender Zeit t einem endlichen Wert zustrebt, oder, damit gleichbedeutend, wenn seine Impulsantwort g(t) mit zunehmender Zeit gegen null läuft. In einfachen Fällen kann dieses Kriterium durch die Berechnung der Übergangsfunktion bzw. der Impulsantwort direkt angewandt werden. Für kompliziertere Systeme erhöht sich jedoch sehr schnell der Rechenaufwand, um die entsprechende Systemantwort zu berechnen und daraus die Stabilität zu beurteilen. Verwendet man stattdessen die Übertragungsfunktion des zu betrachtenden Systems, so lässt sich das oben definierte Stabilitätskriterium folgendermaßen formulieren. Grundlegendes Stabilitätskriterium Ein lineares, zeitinvariantes System ist genau dann stabil, wenn sämtliche Pole seiner Übertragungsfunktion links der Imaginärachse der s-Ebene liegen, d.h. einen negativen Realteil haben. Dieser Satz bedarf insofern keiner besonderen Begründung, wenn man sich daran erinnert, dass bei einer bekannten Übertragungsfunktion des geschlossenen Regelkreises die charakteristische Gleichung zu 1 + Fo (s) = 0 wird. Die Übergangsfunktion wird damit zu h(t) = k0 +
n i=1
ki · esi t
4.2 Das Stabilitätskriterium von Routh und Hurwitz
69
wobei si die Lösungen der charakteristischen Gleichung bzw. gleichbedeutend die Pole der Übertragungsfunktion des geschlossenen Regelkreises sind. Die Residuen ki , i = 1 . . . n werden auf bekanntem Weg (siehe Anhang I) mit Hilfe der Partialbruchzerlegung berechnet. Wenn nun sämtliche Lösungen si der charakteristischen Gleichung einen negativen Realteil haben, so verbleibt für die Übergangsfunktion im stationären Zustand nur der Term k0 , der mit der Rücktransformierten der sprungförmigen Anregung korrespondiert.
4.2
Das Stabilitätskriterium von Routh und Hurwitz
Der große Vorteil des grundlegenden Stabilitätskriteriums besteht darin, dass mit Hilfe der Übertragungsfunktion eines Systems Aussagen über seine Stabilität getroffen werden können, ohne dazu die Übergangsfunktion bzw. die Impulsantwort berechnen zu müssen. In der Praxis erfordert es jedoch bereits für ein System dritter oder höherer Ordnung einen relativ großen Rechenaufwand, für die Beurteilung der Stabilität die exakte Lage der Lösungen der charakteristischen Gleichung zu bestimmen. Die Systemtechniker Routh und Hurwitz haben unabhängig voneinander algebraische Kriterien entwickelt, mit deren Hilfe sich überprüfen lässt, ob und wie viele Wurzeln der charakteristischen Gleichung rechts der Imaginärachse der s-Ebene liegen, ohne diese Lösungen berechnen zu müssen. Ausgangspunkt ist bei dieser Vorgehensweise die charakteristische Gleichung eines beliebigen geregelten Systems in der Form 1 + Fo (s) = an s n + an−1 s n−1 + an−2 s n−2 + . . . + a1 s + a0 = 0.
(4.1)
Routh und Hurwitz haben nun zunächst festgestellt, dass der betrachtete Regelkreis bereits instabiles Verhalten aufweist, wenn einer oder mehrere Koeffizienten des obigen charakteristischen Polynoms fehlen oder negativ sind. Für den Fall, dass sämtliche Koeffizienten vorhanden, reell und positiv sind, wird die weitere Stabilitätsuntersuchung folgendermaßen vollzogen: Dazu werden, wie das folgende Zahlenschema zeigt, in den ersten beiden Zeilen die (bekannten) Koeffizienten der charakteristischen Gleichung angeordnet. n: n−1: n−2: n−3: n−4: n−5: . . . 0:
an an−1 b1 c1 d1 e1 . . . z1
an−2 an−3 b2 c2 d2 e2 . . .
an−4 an−5 b3 c3 d3 e3 . . .
an−6 an−7 b4 c4 d4 e4 . . .
... ... ... ... ... ... ... ... ...
(4.2)
70
4 Stabilität von Regelkreisen
Die Elemente der dritten und weiteren Zeilen werden durch den folgenden Algorithmus berechnet: an−1 an−2 − an an−3 an−1 an−4 − an an−5 an−1 an−6 − an an−7 b1 = ; b2 = ; b3 = ; ... an−1 an−1 an−1 c1 =
b1 an−3 − b2 an−1 b1 an−5 − b3 an−1 b1 an−7 − b4 an−1 ; c2 = ; c3 = ; ... b1 b1 b1
In analoger Weise werden die restlichen Koeffizienten des obigen Zahlenschemas berechnet. Die diversen Zeilen werden in der ersten Spalte von n (= Grad der charakteristischen Gleichung) bis 0 rückwärts durchnummeriert. Die gesamte Anordnung besteht somit aus n + 1 Zeilen. Aus dem obigen Zahlenschema ergibt sich nun folgende Aussage bezüglich der Stabilität eines geregelten Systems: 1. Notwendig und hinreichend dafür, dass die charakteristische Gleichung nur Nullstellen mit negativem Realteil aufweist (=Stabilität) ist die Bedingung, dass sämtliche Elemente der ersten Spalte des obigen Zahlenschemas ein gleiches Vorzeichen haben. 2. Wechselt das Vorzeichen innerhalb der ersten Spalte x-mal, so existieren x Wurzeln der charakteristischen Gleichung rechts der imaginären Achse der s-Ebene. Ergibt die Berechnung des ersten Elements einer Zeile den Wert null, während die anderen Elemente dieser Zeile einen von null verschiedenen Wert haben, so lässt sich dieses Schema trotzdem anwenden, wenn man sich diese null durch eine beliebig klein angenommene Konstante ε ersetzt denkt. Die Berechnung der nachfolgenden Zeilen erfolgt dann wieder nach dem beschriebenen Algorithmus. Beispiel 4.1: Gegeben ist die charakteristische Gleichung eines Regelkreises in der Form 1 + Fo (s) = a3 s 3 + a2 s 2 + a1 s + a0 = 0, wobei sämtliche Koeffizienten als positiv angenommen werden. Gesucht ist die Bedingung für stabiles Regelverhalten unter Anwendung des Routh-Hurwitz-Kriteriums. Das obige Zahlenschema bekommt für das gegebene Beispiel die Form 3: 2: 1: 0:
a3 a1 a2 a0 a1 a2 − a 0 a3 a1 a3
Die Bedingung dafür, dass sämtliche Wurzeln der charakteristischen Gleichung einen negativen Realteil haben und damit das System stabil ist, ist gegeben durch die Bedingung a1 a2 > a0 a3 .
4.2 Das Stabilitätskriterium von Routh und Hurwitz
71
Beispiel 4.2: In diesem Beispiel ist die charakteristische Gleichung gegeben zu s 4 + 2s 3 + 3s 2 + 4s + 5 = 0. Es soll wieder die Stabilität anhand des aufgezeigten Verfahrens untersucht werden. Das aufzustellende Zahlenschema bekommt in diesem Beispiel die Form 4: 3: 2: 1: 0:
1 2 1 −6 5
3 4 5
5 0
Offensichtlich existieren zwei Vorzeichenwechsel in der ersten Spalte des obigen Schemas. Dies bedeutet wiederum, dass zwei Wurzeln der charakteristischen Gleichung einen positiven Realteil haben und das gegebene System somit instabil ist. Beispiel 4.3: Gegeben sei ein System mit der charakteristischen Gleichung 1 + Fo (s) = s 5 + s 4 + 4s 3 + 4s 2 + 2s + 1 = 0. Die Stabilität ist mit Hilfe des Routh-Hurwitz-Kriteriums zu untersuchen. (Dieses Beispiel ist insofern von Interesse, weil (wie sich zeigen wird) der Fall eintritt, dass das erste Element einer Zeile der ersten Spalte zu null wird.) Das Routh-Hurwitz-Schema bekommt im gegebenen Fall die Form 5: 4: 3: 3 : 2: 1: 0: Mit lim
ε→0
4ε−1 ε
1 1 0 ε 4ε − 1 ε −ε 2 + 4ε − 1 4ε − 1 1 = −∞ und lim
ε→0
4 4 1 1
2 1 0 0 ← Ersatz der Zeile 3
1
0
0
0
0
0
−ε2 +4ε−1 4ε−1
= +1 treten in der ersten Spalte zwei Vorzeichen-
wechsel auf. Das gegebene System ist somit instabil. Abschließend soll noch auf das so genannte Hurwitz-Kriterium hingewiesen werden. Dieses Kriterium liefert jedoch nur eine Aussage diesbezüglich, ob das gegebene System stabil
72
4 Stabilität von Regelkreisen
ist, man erhält jedoch keine Aussage darüber, wie viele Wurzeln der charakteristischen Gleichung einen positiven Realteil haben. Das Hurwitz-Kriterium lässt sich in folgender Weise formulieren: Ein System mit der charakteristischen Gleichung a0 + a1 s + a2 s 2 + . . . + an−1 s n−1 + an s n = 0 ist dann stabil, wenn sämtliche folgende Bedingungen erfüllt sind: 1. Sämtliche Koeffizienten der charakteristischen Gleichung sind vorhanden und positiv; 2. Sämtliche so genannte Hurwitz-Determinanten sind positiv oder höchstens null: H1 = |a1 | > 0; a1 H3 = a3 a5
a0 a2 a4
H2 0 a1 > 0; a3
Hn−1
a = 1 a3
a0 > 0; a2
a1 a3 a = 5 . . 0
a0 a2 a4 . . 0
Hn = an Hn−1 > 0.
... ... ... ... ... ...
> 0; an−1
0
Beispiel 4.4: Für den im Bild 4.1 skizzierten Regelkreis ist der Bereich des Parameters K für stabiles Regelverhalten zu untersuchen:
Bild 4.1: Geschlossener Regelkreis
Die Übertragungsfunktion des geschlossenen Regelkreises lautet Fw (s) =
Fo (s) K = . 1 + Fo (s) s(s 2 + s + 1)(s + 2) + K
Die charakteristische Gleichung wird damit zu s 4 + 3s 3 + 3s 2 + 2s + K = 0. a1 a0 = 2 · 3 − K · 3 > 0 folgt K < 2. Mit H2 = a3 a2
4.3 Das Stabilitätskriterium von Nyquist
73
Bildet man jedoch die schärfere Bedingung a1 H3 = a3 a5
4.3
a0 a2 a4
0 14 a1 > 0, so folgt 0 < K < als endgültiges Ergebnis. 9 a3
Das Stabilitätskriterium von Nyquist
Dieses Stabilitätskriterium hat sich zur Beurteilung der Stabilität geregelter Systeme bestens bewährt. Es unterscheidet sich von anderen mathematischen Kriterien vor allem dadurch, dass die zu untersuchende Funktion auch grafisch, etwa als gemessene Ortskurve, gegeben sein kann. Die Anwendung dieses Stabilitätskriteriums erfordert die Kenntnis der Ortskurve des offenen Regelkreises, Fo (jω), die übrigens in der Literatur auch als Nyquist-Ortskurve bezeichnet wird. Mit Hilfe des im Folgenden zu erläuternden Nyquist-Kriteriums erhält man die Anzahl der Wurzeln der charakteristischen Gleichung mit positivem Realteil aus dem Verlauf der Ortskurve des offenen Regelkreises Fo (jω) in der komplexen Ebene. Zur Herleitung des Nyquist-Kriteriums gehen wir aus von der gebrochen rationalen Übertragungsfunktion des offenen Regelkreises Fo (s) =
Zo (s) , No (s)
(4.3)
wobei 1. die Polynome Zo (s) und No (s) als teilerfremd und 2. Grad Zo (s) = m ≤ n = Grad No (s) vorausgesetzt sind. (Diese Voraussetzung ist für physikalisch realisierbare Systeme stets erfüllt.) Die Pole sp,o des offenen Regelkreises ergeben sich als Wurzeln seiner charakteristischen Gleichung No (s) = 0.
(4.4)
Nun interessieren für die Stabilitätsuntersuchung aber die Pole sp,g des geschlossenen Regelkreises, also die Wurzeln der charakteristischen Gleichung, die man aus der Bedingung P (s) = 1 + Fo (s) =
Ng (s) No (s) + Zo (s) = =0 No (s) No (s)
(4.5)
in der Form Ng (s) = No (s) + Zo (s) = 0 erhält. Wegen n ≥ m gilt Grad Ng (s) = n.
(4.6)
74
4 Stabilität von Regelkreisen
Im Hinblick auf die Stabilitätsbeurteilung muss also die Funktion P (s) = 1 + Fo (s) näher untersucht werden. Die Gl. (4.5) lässt sich allgemein auf die Form n
P (s) = 1 + Fo (s) = k0 ·
i=1 n
(s − sp,gi ) (4.7) (s − sp,oi )
i=1
bringen, wobei sp,g die Pole des geschlossenen Regelkreises und sp,o die Pole des offenen Regelkreises sind. Weil das gebrochen rationale Polynom P (s) der Nenner der Übertragungsfunktion des geschlossenen Regelkreises ist, kann man leicht einsehen, dass die Nullstellen von P (s) die Pole des geschlossenen Regelkreises darstellen. Es ist deshalb für einen stabilen Regelkreis zwingend und notwendig, dass die Nullstellen sp,g einen negativen Realteil haben. Die Wurzeln sp,o unterliegen bez. der Stabilität zunächst keiner Restriktion. Wie sich jedoch zeigen wird, ist auch die Kenntnis der Wurzeln sp,o notwendig, wenn die Stabilität mit Hilfe des offenen Regelkreises Fo (s) beurteilt bzw. ermittelt werden soll. Den Betrag und die Phase der charakteristischen Gleichung 1 + Fo (s) = 0 erhält man aus Gl. (4.7) zu n s − sp,gi
|P (s)| = |1 + Fo (s)| = k0
i=1 n
, s − sp,oi
(k0 > 0)
und
(4.8)
arg(s − sp,oi ).
(4.9)
i=1
arg [P (s)] = ϕ(s) =
n
arg(s − sp,gi ) −
i=1
n i=1
Durch die beiden Gleichungen (4.8) und (4.9) werden jedem Wert der komplexen Variablen s = σ + jω entsprechende Werte für den Betrag |P (s)| und die Phase ϕ(s) zugewiesen. Durchläuft insbesondere die komplexe Variable s eine geschlossene Kontur s in der s-Ebene, so beschreibt die Spitze des Zeigers ebenso eine geschlossene Kurve P in der komplexen P (s)-Ebene; siehe hierzu Bild 4.2. Wie sich später zeigen wird, steht die Anzahl der Umschließungen des Koordinatenursprungs und die Umlaufrichtung in der P (s)-Ebene in einem engen Zusammenhang mit der Stabilität des betrachteten Regelkreises. Betrachten wir beispielsweise die Übertragungsfunktion des offenen Regelkreises der Form Fo (s) =
6 . (s + 1)(s + 2)
Die charakteristische Gleichung wird damit zu P (s) = 1 + Fo (s) = 1 +
6 (s + 1,5 + j2,4)(s + 1,5 − j2,4) = = 0. (s + 1)(s + 2) (s + 1)(s + 2)
4.3 Das Stabilitätskriterium von Nyquist
75
Bild 4.2: Geschlossene Konturen in der s-Ebene und in der komplexen P (s)-Ebene
Die Funktion P (s) ist in der gesamten s-Ebene analytisch, außer in den singulären Punkten. Für jeden analytischen Punkt der s-Ebene korrespondiert ein Punkt in der komplexen P (s)Ebene. Für einen beliebigen, angenommenen Punkt s = 1 + j2 wird P (s) zu P (1 + j2) = 1 +
6 = 1,115 − j0,577. (2 + j2)(3 + j2)
Somit wird der Punkt 1 + j2 der s-Ebene in den Punkt 1,115 − j0,577 der P (s)-Ebene abgebildet. Die bisherige Diskussion ist eine grafische Erklärung des in der Literatur der Funktionen-Theorie so genannten Abbildungs-Theorems, das, wie sich zeigen wird, die Basis des Nyquist-Stabilitätskriteriums ist. Abbildungs-Theorem Es sei P (s) eine gebrochen rationale Funktion in s. Außerdem sei P die Anzahl der Pole und Z die Zahl der Nullstellen, die innerhalb einer geschlossenen Kontur der s-Ebene liegen, wobei mehrfache Pol- und Nullstellen entsprechend ihrer Vielfachheit zu berücksichtigen sind. Außerdem wird vorausgesetzt, dass diese geschlossene Kontur weder durch Polstellen noch durch Nullstellen der Funktion P (s) verläuft. Diese geschlossene Kontur der s-Ebene wird in der P (s)-Ebene ebenso als geschlossene Kontur abgebildet. Die Anzahl N der Umschließungen des Ursprungs der komplexen P (s)-Ebene im Uhrzeigersinn ergibt sich zu Z − P . Für N > 0 erfolgt der Umlauf auf der Kontur P im Uhrzeigersinn, für N < 0 entgegen dem Uhrzeigersinn. (Es soll jedoch darauf verwiesen werden, dass mit diesem Theorem weder die Zahl der Nullstellen noch die Anzahl der Pole gefunden werden kann, sondern nur ihre Differenz.) Dieses Kriterium soll hier kurz nachgewiesen werden: Dabei wird vom Cauchy-Theorem und dem Residuen-Theorem Gebrauch gemacht. Das Cauchy-Theorem besagt, dass das Integral von P (s) entlang einer geschlossenen Kurve in der s-Ebene null ergibt, wenn P (s) innerhalb und auf dieser Kontur analytisch ist, oder
76
4 Stabilität von Regelkreisen
P (s)ds = 0
(4.10)
Nun sei P (s) angenommen zu P (s) =
(s + z1 )k1 (s + z2 )k2 . . . · X(s) (s + p1 )m1 (s + p2 )m2 . . .
wobei X(s) innerhalb der geschlossenen Kontur der s-Ebene analytisch ist und sämtliche (s) Pol- und Nullstellen von der Hüllkurve umschlungen werden. Damit kann der Quotient PP (s) geschrieben werden als P (s) = P (s)
k1 k2 m1 m2 X (s) , + + ... − + + ... + s + z1 s + z2 s + p1 s + p2 X(s)
(4.11)
wobei der Zusammenhang P (s) = dPds(s) gilt. Aus obiger Gleichung sieht man, dass durch die Bildung des Verhältnisses P (s) P (s) eine Nullstelle k-ter Ordnung von P (s) zu einem einfachen Pol der Funktion P (s) P (s) wird. Bezugnehmend auf Gl. (4.11) und unter Anwendung des Residuen-Theorems, das besagt, dass sich die Integration von P (s) P (s), ausgeführt im Uhrzeigersinn entlang einer geschlossenen Kontur in der s-Ebene, zu −2jπ multipliziert mit der Summe der Residuen an den einfachen Polstellen von P (s) P (s) ergibt; oder formal ausgedrückt
P (s) ds = −2jπ · Residuen. P (s)
Im gegebenen Fall folgt daraus
P (s) ds = −2jπ [(k1 + k2 + . . .) − (m1 + m2 + . . .)] = −2jπ(Z − P ), P (s)
wobei Z = k1 + k2 + . . . =
Gesamtzahl der von der Hüllkurve umschlossenen Nullstellen von P (s) in der s-Ebene und
P = m1 + m2 + . . . = Gesamtzahl der von der Hüllkurve umschlossenen Polstellen von P (s) in der s-Ebene ist. Weil außerdem P (s) eine komplexe Größe ist, gilt auch P (s) = |P | ejθ
und
ln P (s) = ln |P | + jθ.
Beachtet man außerdem, dass P (s) P (s) in der Form
4.3 Das Stabilitätskriterium von Nyquist
77
d ln P (s) P (s) = P (s) ds geschrieben werden kann, so erhält man in der komplexen Schreibweise P (s) d ln |P | dθ = +j . P (s) ds ds Wenn nun die geschlossene Kontur in der s-Ebene in eine geschlossene Kontur P in der komplexen P (s)-Ebene abgebildet wird, so gilt
P (s) ds = P (s)
d ln |P | + j
dθ = j dθ = 2jπ (P − Z).
Das Integral d ln |P | wird bei obiger Integration zu null, weil ln |P | am Anfang und am Ende der Integrationsgrenzen der geschlossenen Kontur zueinander identisch ist. Somit verbleibt noch θ2 − θ1 = P − Z. 2π Die gesamte Winkeldifferenz zwischen dem Endwert und dem Anfangswert von θ ist identisch mit der gesamten Phasenänderung der Funktion P (s) P (s), wenn sich ein repräsentativer Punkt in der s-Ebene entlang der geschlossenen Kontur bewegt. Beachtet man, dass N die Anzahl der Umschließungen des Ursprungs der P (s)-Ebene im Uhrzeigersinn ist und θ2 − θ1 entweder nur null oder das Mehrfache von 2π sein kann, so folgt aus obiger Gleichung θ2 − θ1 = −N. 2π Somit gilt die eingangs aufgestellte Behauptung N = Z − P. Mit dem Abbildungs-Theorem kann nun die Frage nach der Stabilität des geschlossenen einschleifigen Regelkreises beantwortet werden. Hierzu legt man die Kontur s in der s-Ebene so fest, dass sie die gesamte rechte s-Halbebene umschließt; siehe hierzu Bild 4.3. Diese so genannte Nyquist-Kontur verläuft also zunächst entlang der imaginären Achse in Richtung steigender ω-Werte und kehrt dann auf einem Halbkreis mit dem Radius r zurück. Für den Grenzfall r → ∞ umschließt diese Kontur die gesamte rechte s-Halbebene. Das Nyquist-Diagramm ist die Ortskurve der Funktion 1 + Fo (s) in der komplexen Ebene, wenn s die Werte der in Bild 4.3 dargestellten Kontur durchläuft. Liegen einzelne Pole von 1 + Fo (s) auf der Imaginärachse, so werden diese durch infinitesimal kleine Halbkreise rechtsseitig umgangen. Damit liegen alle Wurzeln der charakteristischen Gleichung mit positivem Realteil innerhalb dieser Kontur.
78
4 Stabilität von Regelkreisen
Bild 4.3: Kontur s des Nyquist-Pfades
Damit erhält das Nyquist-Kriterium folgenden Wortlaut: Wenn eine Funktion P (s) auf und innerhalb einer geschlossenen Kontur analytisch ist, außer für eine begrenzte Anzahl von Polen und Nullstellen innerhalb dieser Kontur, dann ist die Zahl der Umläufe des Koordinaten-Ursprungs der Funktion P (s) in der komplexen P (s)-Ebene gleich der Anzahl der Nullstellen minus der Zahl der Pole von P (s), wenn s die geschlossene Kurve in der s-Ebene einmal durchläuft. Dabei sind mehrfach auftretende Pole und/oder Nullstellen entsprechend ihrer Vielfachheit zu zählen. Übertragen auf den einschleifigen Regelkreis ist die Funktion P (s) die charakteristische Gleichung 1 + Fo (s) = 0. Beliebige Wurzeln der charakteristischen Gleichung mit positivem Realteil liegen innerhalb der Hüllkurve von Bild 4.3, wenn der Radius r gegen unendlich strebt. Wenn deshalb 1 + Fo (s) gemäß der im s-Bereich vorgegebenen Kontur (Bild 4.3) aufgetragen wird, dann muss die Zahl der Umläufe von 1 + Fo (s) um den Ursprung gleich der Anzahl der Nullstellen minus der Anzahl der Pole von 1 + Fo (s) in der rechten s-Halbebene sein. Ein Beispiel soll die praktische Anwendung des Nyquist-Kriteriums veranschaulichen. Beispiel 4.5: Gegeben sei die charakteristische Gleichung eines Regelkreises in der Form P (s) = 1 + Fo (s) = 1 +
K . (1 + s)3
Das zugehörige Nyquist-Diagramm ist im Bild 4.4 skizziert. In Bild a) ist der Nyquist-Pfad in der s-Ebene aufgezeigt. Der Umlauf ist im Uhrzeigersinn orientiert und besteht aus drei Abschnitten: A, B und C.
4.3 Das Stabilitätskriterium von Nyquist
79
Bild 4.4: a) Nyquist-Pfad in der s-Ebene b) Nyquist-Diagramm in der 1 + Fo (s)-Ebene c) Nyquist-Diagramm in der Fo (s)-Ebene
Der Abschnitt A ist definiert für 0 ≤ ω ≤ ∞; Abschnitt B ergibt sich für −∞ ≤ ω ≤ 0 und Abschnitt C für −∞ ≤ ω ≤ +∞. In Bild b) ist die Nyquist-Ortskurve in der 1 + Fo (s)-Ebene eingetragen, korrespondierend zum Nyquist-Pfad in Bild a). Um die entsprechende Ortskurve zu erhalten, ist natürlich in der charakteristischen Gleichung s = jω zu setzen: 1 + Fo (jω) = 1 +
K . (1 + jω)3
Bild b) ist die Ortskurve von 1 + Fo (s) für s-Werte entlang der Imaginärachse −j∞ ≤ jω ≤ +j∞. Der strichliert gezeichnete Kurvenast gilt dabei für negative Frequenzen. Zu den drei Wegstücken A, B und C im Nyquist-Pfad (siehe Bild a)) sind im Bild b) die entsprechenden Kurvenäste wiedergegeben. Dabei ist zu beachten, dass der Halbkreis C mit r → ∞ im Bild a) in der 1 + Fo (s)-Ebene zu einem einzigen Punkt entartet. Wichtig: Die P (s) = 1 + Fo (s)-Ortskurve im Bild b) umschließt den Koordinaten-Ursprung zweimal, und zwar für −j∞ ≤ ω ≤ +j∞. Im Bild c) ist die Fo (s)-Ortskurve aufgetragen. Die Umschließung des Koordinaten-Ursprungs der 1 + Fo (jω)-Ortskurve ist äquivalent zur Umschließung des Punktes (−1, j0) der Fo (jω)Ortskurve. Weil es häufig bequemer ist, die Ortskurve von Fo (jω) statt von 1+Fo (jω) aufzuzeichnen bzw. zu messen, wird man in der Praxis meist nur die Fo (jω)-Ortskurve gemäß Bild c) aufzeichnen und die Umschließungen des Punktes (−1, j0) ermitteln. Dabei beginnt man bei ω = −∞, geht bis ω = 0 und endet bei ω = +∞ und zählt dabei die Anzahl der Umläufe im Uhrzeigersinn des Ortskurvenvektors in der Fo (jω)-Ebene. (Für gegebene Fälle ist zu beachten, dass die Ortskurven von Fo (jω) und Fo (−jω) immer spiegelsymmetrisch zur reellen Achse verlaufen.)
80
4 Stabilität von Regelkreisen
Mit dem Nyquist-Diagramm, aufgezeichnet in einem Koordinaten-System, bei dem der Ursprung in den Punkt (−1, j0) verschoben ist (Bild c)), kann das Stabilitätskriterium von Nyquist algebraisch formuliert werden als N =Z−P wobei N die Zahl der im Uhrzeigersinn gezählten Umschließungen des Punktes (−1, j0) der Nyquist-Ortskurve ist, P ist die Zahl der Pole der Übertragungsfunktion des offenen Regelkreises Fo (s) mit positivem Realteil und Z ist die Zahl der Wurzeln der charakteristischen Gleichung 1 + Fo (s) mit positivem Realteil. (Für ein stabiles System muss natürlich Z = 0 sein.) In den meisten praktischen Fällen ist die Übertragungsfunktion des offenen Regelkreises stabil und somit P = 0. Weil für ein stabiles System auch Z = 0 sein muss, ergibt sich für diesen praktisch wichtigen Fall gezwungenermaßen N = 0. Für das obige, in Bild 4.4 analysierte Beispiel hat Fo (s) keine Pole in der rechten s-Halbebene; somit ist P = 0 und Z = N . Weil außerdem die Ortskurve in Bild c) zwei Umkreisungen des Punktes (−1, j0) im Uhrzeigersinn aufweist, muss N = 2 und deshalb wiederum Z = 2 sein. Dies bedeutet, dass zwei Wurzeln der charakteristischen Gleichung in der rechten s-Halbebene liegen. Somit ist das betrachtete System instabil. Zur Stabilisierung dieses Systems muss entweder die Verstärkung K verkleinert oder ein frequenzabhängiges Netzwerk hinzugefügt werden, damit keine Umschließung des Punktes (−1, j0) mehr auftritt. In Fällen, bei denen ein- oder mehrfache Pole im Ursprung der s-Ebene auftreten, ist der Zusammenhang zwischen dem Nyquist-Pfad in der s-Ebene und der zugehörigen Ortskurve in der Fo (s)-Ebene etwas komplizierter. Zunächst sei noch einmal erwähnt, dass der Nyquist-Pfad alle Pole auf der imaginären Achse durch infinitesimal kleine Halbkreise links liegen lässt. Dieser Fall soll anhand des folgenden Beispiels untersucht werden. Beispiel 4.6: Gegeben ist die Übertragungsfunktion eines offenen Regelkreis zu Fo (s) =
k0 . s(1 + sT1 )(1 + sT2 )
Bild 4.5 a) zeigt zunächst den Nyquist-Pfad, bei dem Betonung auf die Umgehung der Polstelle im Ursprung gelegt wurde. Um die Ortskurve dieser Funktion zu bestimmen, setzt man s = jω in Fo (s) und erhält Fo (jω) =
k0 , jω(1 + jωT1 )(1 + jωT2 )
dessenVerlauf im Bild 4.5 b) dargestellt ist. (Die Ortskurve für negative Frequenzwerte verläuft konjugiert komplex zu positiven Frequenzen.) Zunächst soll der Nyquist-Pfad in Bild 4.5a) erläutert werden:
4.3 Das Stabilitätskriterium von Nyquist
81
Bild 4.5: a) Nyquist-Pfad in der s-Ebene b) Ortskurve des offenen Regelkreises
Der Umlauf ist durch vier Abschnitte gekennzeichnet. Der Abschnitt AB ist definiert für Frequenzwerte 0+ ≤ ω ≤ ∞; der Abschnitt EFGHA steht für den Frequenzbereich 0− ≤ ω ≤ 0+ ; Abschnitt DE für −∞ ≤ ω ≤ 0− . Schließlich deckt der Abschnitt DCB den Frequenzbereich −∞ ≤ ω ≤ +∞ ab. Dabei ist zu beachten, dass der Halbkreis DCB in Bild a) zu nur einem Punkt im Bild b) entartet. Neu ist jetzt die Umgehung des Ursprungs über den Pfad EFGHA in Bild a). Es soll nun gezeigt werden, wo dieser Pfad in der Fo (s)-Ebene zu liegen kommt: Der Weg entlang der Imaginärachse in der Umgebung des Ursprungs wird betrachtet als Halbkreis mit dem infinitesimal kleinen Radius δ in der positiven Halbebene, damit der Pol im Ursprung rechtsseitig umgangen wird. Für diesen halbkreisförmigen Weg von j0− bis j0+ gilt s = δ · ejΘ , wobei bezüglich Betrag und Phase gilt: δ→0
und
− π 2 ≤ θ ≤ +π 2.
Damit ergibt sich für die Gleichung der Ortskurve in der Fo (s)-Ebene für diesen Bereich (s → 0) k0 k0 Fo (s) = = = s δ · ejΘ
k0 δ
·e
−jΘ
=
k0 δ
· ejα .
82
4 Stabilität von Regelkreisen
Dabei ist zu beachten, dass gilt kδ0 → ∞ für δ → 0 und α = −θ, wobei α von +π 2 bis −π 2 läuft. Dies bedeutet wiederum, dass die Endpunkte von ω → 0− und ω → 0+ in Bild b) durch einen Halbkreis mit unendlich großem Radius im ersten und vierten Quadranten verbunden sind, denn wenn ω von 0− nach 0+ in der s-Ebene läuft (θ läuft im Uhrzeigersinn), dann hat die in der Fo (s)-Ebene entsprechende Kurve 180◦ im Uhrzeigersinn für ω = 0− bis ω = 0+ zu durchlaufen, weil ja θ = −α ist. Die Analyse der Nyquist-Ortskurve in Bild b) zeigt, dass der Punkt (−1, j0) zweimal im Uhrzeigersinn umlaufen wird. Sonst ist N = 2, wobei bekanntlich N =Z−P
ist.
Weil außerdem kein Pol der Übertragungsfunktion des offenen Regelkreises in der rechten s-Halbebene liegt (P = 0), muss gelten 2 = Z − 0;
Z = 2.
Aus dieser Betrachtung folgt somit, dass zwei Wurzeln der charakteristischen Gleichung des geschlossenen Regelkreises in der rechten s-Halbebene liegen. Somit ist das System mit dem vorgegebenen k0 -Wert instabil. Um das System trotzdem zu stabilisieren müsste entweder wieder die Verstärkung k0 verkleinert oder ein frequenzabhängiges Netzwerk eingebaut werden, damit der Punkt (−1, j0) nicht mehr umschlungen wird. Das folgende Bild zeigt abschließend zur Verdeutlichung einige Beispiele typischer NyquistDiagramme. Dabei werden jeweils die Übertragungsfunktion Fo (s), die Ortskurve der Übertragungsfunktion sowie die Werte von N , Z und P aufgezeigt und Angaben über die Stabilität bzw. Instabilität des geschlossenen Regelkreises getroffen. 4.3.1 Vereinfachtes Nyquist-Kriterium Wenn der offene Regelkreis keine Polstellen mit positivem Realteil aufweist, also stabil ist, kann das Nyquist-Kriterium wie folgt formuliert werden: Der geschlossene Regelkreis ist genau dann stabil, wenn die Ortskurve des offenen Regelkreises den so genannten kritischen Punkt (−1, j0) weder umkreist noch durchdringt. Eine andere Fassung des Nyquist-Kriteriums, die auch angewandt werden kann, wenn der offene Regelkreis Fo (s) Pole im Ursprung der s-Ebene besitzt, ist die so genannte LinkeHand-Regel: Der offene Regelkreis soll nur Pole in der linken s-Halbebene haben, außer einem ein- oder zweifachen Pol im Ursprung (z.B. I - oder I2 -Verhalten). In diesem Fall ist der geschlossene
4.3 Das Stabilitätskriterium von Nyquist
83
Bild 4.6: Beispiele typischer Nyquist-Diagramme
Regelkreis genau dann stabil, wenn der kritische Punkt (−1, j0) stets links der Ortskurve von Fo (jω) liegt, wenn diese in Richtung wachsender ω-Werte durchlaufen wird. Dabei ist der Teil der Ortskurve maßgebend, der dem kritischen Punkt am nächsten liegt. Bei komplizierterem Verlauf der Ortskurve sollte man jedoch auf die (vorher behandelte) allgemeine Fassung des Kriteriums zurückgreifen. Das folgende Bild zeigt einige typische Beispiele zur Bestimmung der Stabilität mit Hilfe des vereinfachten Nyquist-Kriteriums.
84
4 Stabilität von Regelkreisen
Bild 4.7: Stabilitätsbestimmung mit dem vereinfachten Nyquist-Kriterium
Da die Ortskurven 1 und 3 den kritischen Punkt weder durchdringen noch umschließen bzw. weil der kritische Punkt (−1, j0) stets links von diesen Ortskurven liegt, wenn sie in Richtung steigender ω-Werte durchlaufen werden, handelt es sich offenbar um stabiles Regelverhalten. Die Ortskurven 2 und 4 stehen dagegen für instabile Regelkreise. 4.3.2
Begriff der relativen Stabilität
Im Gegensatz zu anderen Stabilitätskriterien bietet das Nyquist-Kriterium auch die Möglichkeit einer praktischen Abschätzung der Stabilitätsgüte oder, wie man auch sagt, der relativen Stabilität eines Regelkreises. Je größer nämlich der Abstand der Ortskurve vom kritischen Punkt −1 ist, desto weiter ist der geschlossene Regelkreis von der Stabilitätsgrenze entfernt, oder positiv ausgedrückt, desto stabiler ist der geschlossene Regelkreis. Als Maß für die relative Stabilität benutzt man die Begriffe Phasenrand und Amplitudenrand, die in den folgenden Bildern verdeutlicht sind. Die erste maßgebliche Größe ist die so genannte Durchtrittsfrequenz ωD , das ist die Frequenz, bei der die Ortskurve des offenen Regelkreises den Einheitskreis schneidet. Der Winkel zwischen Fo (jωD ) und der positiv reellen Achse ist entsprechend der Durchtrittsphasenwinkel ϕD . Der Phasenrand ϕr ist definiert als der Winkel zwischen der negativ reellen Achse und dem Schnittpunkt der Ortskurve mit dem Einheitskreis. Somit gilt für den Phasenrand die Definition ϕr = 180◦ + ϕD
(4.12)
Vereinfacht ausgedrückt ist der Phasenrand ein Maß dafür, wie weit |Fo (jω)| = 1 von der negativ reellen Achse entfernt ist. In Bezug auf das vereinfachte Nyquist-Kriterium bedeutet ein positiver Phasenrand stabiles Regelverhalten. Ein negativer Phasenrand ist dagegen ein Kriterium für ein instabiles Regelverhalten. Ein weiteres Kriterium für die Beurteilung der Stabilitätsgüte ist der Schnittpunkt der Ortskurve des offenen Regelkreises mit der negativ reellen Achse; die entsprechende Frequenz ωk wird in der Literatur als kritische Kreisfrequenz bezeichnet.
4.3 Das Stabilitätskriterium von Nyquist
85
Bild 4.8: Phasenrand und Amplitudenrand in der komplexen Ebene
Der Amplitudenrand ist definiert als Reziprokwert des Betrags von Fo (jωk ): Ar =
1 |Fo (jωk )|
(4.13)
Entsprechend der Definition gemäß Gl. (4.13) wird derAmplitudenrand im Bode-Diagramm zu Ar [dB] = −A0 (ωk )
(4.14)
Obwohl hierzu in einem späteren Kapitel ausführlich die Rede sein wird, sei bereits an dieser Stelle angemerkt, dass für ein gut gedämpftes Einschwingverhalten folgende Richtwerte eingehalten werden sollten: Ar [dB] = 12 dB . . . 20 dB ϕr = 40◦ . . . 70◦ . Die Durchtrittsfrequenz ωD ist ein Maß für die Schnelligkeit des Regelkreises. Je größer ωD ist, desto größer ist die Grenzfrequenz des offenen Regelkreises und damit desto schneller die Reaktion auf Sollwertänderungen oder Störungen. Die folgenden Beispiele sollen abschließend den Einblick in die Materie bezüglich des Phasen- und Amplitudenrandes vertiefen. Beispiel 4.7: Für den im folgenden Bild skizzierten Regelkreis sind Phasen- und Amplitudenrand zu bestimmen, wobei der Faktor K einmal den Wert 10 und das andere Mal den Wert 100 haben soll.
Bild 4.9: Einfacher Regelkreis
86
4 Stabilität von Regelkreisen
a) Für K = 10 bekommt das Bode-Diagramm des offenen Regelkreises folgende Form:
Bild 4.10: Bode-Diagramm zu Bild 4.9 mit K = 10
Wie aus obigem Diagramm leicht zu ersehen ist, handelt es sich auf Grund des Phasenrandes von ϕr ≈ 20◦ und Ar ≈ 8 dB um stabiles Regelverhalten. b) Für K = 100 sieht man aus dem Bode-Diagramm in Bild 4.11, dass jetzt der Phasenrand zu ϕr ≈ −30◦ und der Amplitudenrand zu Ar ≈ −12 dB wird; für diese Verstärkung liegt somit instabiles Regelverhalten vor. Beispiel 4.8: Gegeben ist die Übertragungsfunktion eines offenen Regelkreis in der Form Fo (s) =
Ke−0,8s , s+1
die als Näherung eines Systems höherer Ordnung betrachtet werden kann. Unter Verwendung der Ortskurve des offenen Regelkreises ist die kritische Verstärkung zu bestimmen, d.h. die Verstärkung, bei der sich der geschlossene Regelkreis gerade an der Stabilitätsgrenze befindet.
4.3 Das Stabilitätskriterium von Nyquist
87
Bild 4.11: Bode-Diagramm zu Bild 4.9 mit K = 100
Mit s = jω wird der Frequenzgang des offenen Regelkreises zu Fo (jω) =
Ke−0,8jω K(cos 0,8ω − j sin 0,8ω)(1 − jω) = 1 + jω 1 + ω2
Fo (jω) =
K (cos 0,8ω − ω sin 0,8ω) − j(sin 0,8ω + ω cos 0,8ω) . 1 + ω2
Der Imaginärteil des offenen Regelkreises wird zu null für sin 0,8ω + ω cos 0,8ω = 0. Aus dieser Beziehung erhält man die Gleichung ω = − tan 0,8ω, die natürlich nur iterativ gelöst werden kann. Unter Anwendung eines geeigneten Iterationsverfahrens erhält man die gesuchte Kreisfrequenz zu ωk = 2,4482.
88
4 Stabilität von Regelkreisen
Setzt man diese Frequenz in die Gleichung des Frequenzgangs des offenen Regelkreises ein, so erhält man Fo (j2,4482) =
K (cos 1,9586 − 2,4482 sin 1,9586) = −0,378 K. 1 + 2,44822
Die gesuchte kritische Verstärkung erhält man aus der Bedingung Fo (j2,4482) = −1 . Aus dieser Gleichung folgt 0,378 K = 1 und damit die gesuchte Grenzverstärkung zu Kkrit = 2,65.
4.4
Das Wurzelortskurven-Verfahren
4.4.1 Themenstellung Mit dem Wurzelortskurven-Verfahren werden die Wurzeln der charakteristischen Gleichung 1 + Fo (s) = 0 des geschlossenen Regelkreises als Funktion eines maßgeblichen Parameters, in den meisten Fällen ist dies die einstellbare Reglerverstärkung, in der s-Ebene aufgetragen. Durch die Veränderung dieses Parameters ändert sich natürlich auch die Lage der Wurzeln. Somit entstehen in der s-Ebene Funktionsgraphen, die als Wurzelortskurve (WOK) des geschlossenen Regelkreises bezeichnet werden. Der laufende Parameter wird in der allgemeinen Behandlung von WOKs mit k0 bezeichnet. Das Wurzelortskurven-Verfahren beruht auf dem Zusammenhang zwischen den bekannten Pol- und Nullstellen der Übertragungsfunktion des offenen Regelkreises Fo (s) und den Wurzeln der charakteristischen Gleichung des geschlossenen Regelkreises 1 + Fo (s) = 0. Die Kenntnis der Wurzelortskurve ermöglicht sowohl eine absolute Aussage über die Stabilität des geschlossenen Regelkreises und eine Beurteilung der relativen Stabilität als auch eine Abschätzung des transienten Verhaltens der zu regelnden physikalischen Größe. Ausgangspunkt zur Bestimmung der WOK ist die Gleichung des geschlossenen Regelkreises: Fw (s) =
Y (s) Fo (s) = . W (s) 1 + Fo (s)
Die Pole der Übertragungsfunktion des geschlossenen Regelkreises werden durch seine charakteristische Gleichung 1 + Fo (s) = 1 + k0 · F (s) = 0 ermittelt, wobei
(4.15)
4.4 Das Wurzelortskurven-Verfahren m
F (s) =
l=1 n
89
(s − sN,l ) (s − sp,i )
i=1
die Produktform der Pole sp,i und der Nullstellen sN,l des offenen Regelkreises ist. Der Vorfaktor ist der laufende Parameter, durch dessen Veränderung sich die Lage der Pole des geschlossenen Regelkreises verschiebt. Die Umstellung der Gl. (4.15) nach F (s) ergibt F (s) = −
1 1 = ej(2k+1)π k0 k0
mit
k = 0, ±1, ±2, . . .
k0 ≥ 0.
und
(4.16)
Die Gl. (4.16) liefert zwei Bedingungen, die für die Existenz einer Polstelle des geschlossenen Regelkreises erfüllt sein müssen: 1. Der Winkel von F (s) ist auf jedem Punkt der WOK ein ungeradzahliges Vielfaches von 180◦ ; diese Eigenschaft kommt in der Gl. (4.17) als Phasenbedingung zum Ausdruck: ϕ(s) = arg(F (s)) = (2k + 1)180◦
(4.17)
2. Der Betrag von F (s) besitzt in jedem Punkt der WOK den Wert 1 k0 , also |F (s)| =
1 ; k0
(4.18)
diese Eigenschaft wird in der technischen Literatur als Amplitudenbedingung bezeichnet. Aus diesen beiden Bedingungen ergibt sich folgende Definition der WOK: Alle Punkte der komplexen s-Ebene, die die Phasenbedingung erfüllen, stellen den geometrischen Ort aller möglichen Pole des geschlossenen Regelkreises dar, die durch die Variation des Vorfaktors k0 entstehen. Zur Einführung in die Theorie der Wurzelortskurven soll zunächst ein Beispiel betrachtet werden, bei dem der Verlauf der WOK direkt aus der charakteristischen Gleichung analytisch berechnet wird. Beispiel 4.9: Die Übertragungsfunktion des offenen Regelkreises sei gegeben zu Fo (s) = k0 sp,1 = 0
1 1 = k0 s(s + 1) (s − sp,1 )(s − sp,2 )
und
sp,2 = −1.
Gesucht sind die Pole der Führungsübertragungsfunktion und damit die WOK, wenn der Parameter k0 zwischen 0 und ∞ variiert.
90
4 Stabilität von Regelkreisen
Aus der charakteristischen Gleichung 1+Fo (s) = 0 erhält man im gegebenen Beispiel die Pole des geschlossenen Regelkreises als Lösungen der quadratischen Gleichung s 2 + s + k0 = 0 zu 1 1 sp,g1,2 = − ± 1 − 4k0 . 2 2 Nachdem der Parameter k0 sämtliche positiven Zahlenwerte annehmen kann, ist folgende Fallunterscheidung zu treffen: k0 ≤ 41 : Beide Wurzeln sp,g1,2 sind negativ reell und liegen somit auf der negativ reellen Achse der s-Ebene im Bereich −1 ≤ σ ≤ 0. 1 k0 > 4 : Die Wurzeln sp,g1,2 sind konjugiert komplex mit dem von k0 unabhängigen Realteil √ von −1 2 und dem Imaginärteil ± 21 4k0 − 1, dessen Betrag mit k0 unbeschränkt wächst.
Bild 4.12: Wurzelortskurve eines Systems zweiter Ordnung
Damit ergibt sich der im Bild 4.12 dargestellte Verlauf der gesuchten WOK, die übrigens im Punkt (sp,1 + sp,2 )/2 = −0,5 einen so genannten Verzweigungspunkt hat, wovon zu einem späteren Zeitpunkt noch die Rede sein wird. Der Verlauf der WOK soll nun mit Hilfe der Phasenbedingung entsprechend Gl. (4.17) für einen beliebig herausgegriffenen Testpunkt sT überprüft werden. Sie ist erfüllt, wenn gilt: 1 = − arg(s) − arg(s + 1) ϕ(s) = arg(F (s)) = arg s(s + 1) = −ϕ1 − ϕ2 = (2k + 1)180◦ . Die komplexen Zeiger sT und (sT + 1) schließen mit der reellen Achse die Winkel ϕ1 und ϕ2 ein und haben die Zeigerlängen |sT | sowie |sT + 1|. Mit ϕ1 = 135◦ und ϕ2 = 45◦ gemäß Bild 4.12 wird bestätigt, dass im Testpunkt sT die Phasenbedingung tatsächlich erfüllt ist. Durch Auswerten der Amplitudenbedingung entsprechend Gl. (4.18) 1 = 1 |F (s)| = s(s + 1) k0
4.4 Das Wurzelortskurven-Verfahren
91
lässt sich für beliebige Punkte auf der WOK der zugehörige k0 -Wert bestimmen. Beispielsweise ergibt sich für den Punkt s = − 21 + j der laufende Parameter k0 zu k0 = |s(s + 1)|s=− 1 +j = 2
5 . 4
Der Wert für k0 im Verzweigungspunkt σv = −0,5 wird zu k0 = |−0,5(−0,5 + 1)| = 0,25. In den meisten praktisch vorkommenden Fällen lässt sich jedoch der Verlauf der WOK nicht unmittelbar analytisch bestimmen, wie dies im Beispiel 4.9 der Fall ist. Im Folgenden wird die Phasen- und die Amplitudenbedingung etwas näher beleuchtet, um daraus allgemein gültige Regeln zur Konstruktion der WOK aufstellen zu können, ohne deren Verlauf analytisch berechnen zu müssen. Wird die Übertragungsfunktion des offenen Regelkreises Fo (s) als gebrochen rationale Funktion m (s − sNl ) (s − sN1 )(s − sN2 ) . . . (s − sNm ) l=1 = k0 n Fo (s) = k0 · , (4.19) (s − sp1 )(s − sp2 ) . . . (s − spn ) (s − spi ) (k0 > 0,
n ≥ m,
i=1
sNl = spi )
angeschrieben, so lautet die entsprechende Darstellung nach Betrag und Phase s − sN ejϕN1 s − sN ejϕN2 . . . s − sN ejϕNm m 1 2 Fo (s) = k0 s − sp ejϕp1 s − sp ejϕp2 . . . s − sp ejϕpn n 1 2
(4.20)
oder in kompakter Form m s − sN
l
Fo (s) = k0
l=1 n
·e s − sp
j
m
l=1
ϕNl (s)−
n
i=1
ϕpi (s)
(4.21)
.
i
i=1
Mit Bezug auf Gl. (4.17) wird jetzt die Phasenbedingung ϕ(s) =
m l=1
ϕNl (s) −
n
ϕpi (s) = (2k + 1)180◦
i=1
und die Amplitudenbedingung zu
mit
k = 0, ±1, ±2, . . .
(4.22)
92
4 Stabilität von Regelkreisen m s − sN l
|F (s)| =
l=1 n
1 = k0 . s − sp
(4.23)
i
i=1
Dabei kennzeichnen ϕNl (s) und ϕpi (s) die zu den komplexen Zeigern (s − sNl ) bzw. (s − spi ) gehörenden Winkel. 4.4.2
Regeln zur Konstruktion von Wurzelortskurven
Regel 1: Die Zahl der so genannten Äste der Wurzelortskurve ist identisch mit dem Grad n der charakteristischen Gleichung. Die Anzahl der Wurzeln der charakteristischen Gleichung ist mit dem Grad n identisch. Da jeder Ast der WOK die Verschiebung einer einzelnen Polstelle des geschlossenen Regelkreises bei Veränderung eines Parameters beschreibt, ist dies auch gleichzeitig die Anzahl der Äste. Regel 2: Die diversen Äste der WOK beginnen mit k0 = 0 in den Polstellen des offenen Regelkreises und enden mit k0 → ∞ in den Nullstellen des offenen Regelkreises. Aus Gl. (4.23) ist zu ersehen, dass in den Nullstellen des offenen Regelkreises (s = sN ) die Amplitudenbedingung nur dann erfüllt sein kann, wenn dort k0 unendlich groß wird. Dagegen muss k0 in den Polstellen (s = sp ) des offenen Regelkreises den Wert null haben, wenn Gl. (4.23) erfüllt sein soll. Ist der Nennergrad n der Übertragungsfunktion des offenen Regelkreises Fo (s) höher als der Zählergrad m, was übrigens in allen praktischen Fällen gegeben ist, so laufen (n − m) Äste der WOK ins Unendliche der s-Ebene. Bei mehrfachen Pol- oder Nullstellen des offenen Regelkreises beginnt bzw. endet dort eine Anzahl von Ästen, entsprechend der Vielfachheit dieser Pole bzw. Nullstellen. Regel 3: Die Wurzelortskurve verläuft immer symmetrisch zur reellen Achse. Dieser Satz ist damit bewiesen, dass komplexe Pole oder Nullstellen der charakteristischen Gleichung stets als konjugiert komplexe Paare auftreten, wenn die charakteristische Gleichung eine rationale Funktion von s mit reellen Koeffizienten ist, was wiederum für technisch realistische Systeme stets gegeben ist.
4.4 Das Wurzelortskurven-Verfahren
93
Regel 4: Jeder Punkt der reellen Achse ist Punkt der Wurzelortskurve, wenn die Gesamtzahl der Pol- und Nullstellen auf der reellen Achse rechts von diesem Punkt ungerade ist. Diese Regel ergibt sich aus der Phasenbedingung gemäß Gl. (4.22). Dabei ist zu beachten, dass ein konjugiert komplexes Pol- oder Nullstellenpaar keinen Beitrag zur Winkelsumme liefert, weil die beiden Winkel gleich groß sind und verschiedene Vorzeichen aufweisen. Auch Poloder Nullstellen auf der reellen Achse links vom betrachteten Testpunkt liefern keinen Beitrag zur Gesamtphase. Somit liefern nur Pole und Nullstellen einen Phasenbeitrag, die rechts vom fraglichen Testpunkt liegen. Die bisherigen und noch folgenden Regeln zur Konstruktion der Wurzelortskurve sollen am folgenden Musterbeispiel aufgezeigt werden. Beispiel 4.10: Vorgegeben sei die Übertragungsfunktion eines offenen Regelkreises in der Form Fo (s) = k0 ·
1 . s(s + 4)(s + 5)
Diese Übertragungsfunktion besitzt drei Pole an den Stellen sp1 = 0; sp2 = −4 und sp3 = −5 und keine Nullstellen. Die Anwendung der Regeln 1 bis 4 wird am folgenden Bild veranschaulicht.
1 Bild 4.13: Wurzelortskurve zu Fo (s) = k0 s(s+4)(s+5)
94
4 Stabilität von Regelkreisen
Der Nenner der vorliegenden Übertragungsfunktion ist dritten Grades, somit besteht die Wurzelortskurve aus drei Ästen (Regel 1), die in den Punkten (0, j0), (−4, j0) und (−5, j0) ihre Startpunkte (k0 = 0) haben. Nachdem Fo (s) keine Nullstellen im endlichen s-Bereich hat, enden wegen n − m = 3 − 0 = 3 Äste der Wurzelortskurve im Unendlichen (Regel 2). Außerdem ist entsprechend der Regel 3 die geforderte Symmetrie zur reellen Achse gewährleistet. Teile der WOK auf der reellen Achse sind nach der Regel 4 die Abschnitte von −∞ bis −5 und von −4 bis zum Ursprung der s-Ebene. Regel 5: Die Asymptoten der (n − m) ins Unendliche strebenden Äste der WOK schneiden sich sämtlich im so genannten Wurzelschwerpunkt σa auf der reellen Achse; wobei gilt n
σa =
Re(spi ) −
m
Re(sNl )
l=1
i=1
(4.24)
n−m
mit n
Zahl der Pole des offenen Regelkreises
m Zahl der Nullstellen des offenen Regelkreises.
Zur Herleitung der Gl. (4.24) wird die allgemeine Form der Übertragungsfunktion des offenen Regelkreises Fo (s) = k0
b0 + b1 s + b2 s 2 + . . . + bm−1 s m−1 + bm s m a0 + a1 s + a2 s 2 + . . . + an−1 s n−1 + an s n
(4.25)
unter Verwendung des Wurzelsatzes von Vieta auf die Form
s m + s m−1 (sN1 + sN2 + . . . + sNm ) + . . . + sN1 sN2 . . . sNm Fo (s) = k0 · s n + s n−1 (sp1 + sp2 + . . . + spn ) + . . . + sp1 sp2 . . . spn
(4.26)
gebracht. Für einen Testpunkt, der sehr weit vom Ursprung entfernt ist, wird Gl. (4.26) zu Fo (s) =
k0 . s n−m + (sp1 + sp2 + . . . + spn ) − (sN1 + sN2 + . . . + sNm ) · s n−m−1 + . . .
Setzt man diese Beziehung in die charakteristische Gleichung 1 + Fo (s) = 0 ein, so bekommt diese die Form s n−m + (sp1 + sp2 + . . . + spn ) − (sN1 + sN2 + . . . + sNm ) · s n−m−1 + . . . = −k0 . Für einen großen Wert von s kann diese Gleichung zu
4.4 Das Wurzelortskurven-Verfahren
(sp1 + sp2 + . . . + spn ) − (sN1 + sN2 + . . . + sNm ) s+ n−m
95
n−m =0
(4.27)
approximiert werden. Wenn schließlich der Schnittpunkt der Asymptoten mit der Abszisse der s-Ebene mit σa bezeichnet wird, so erhalten wir σa = −
(sp1 + sp2 + . . . + spn ) − (sN1 + sN2 + . . . + sNm ) , n−m
(4.28)
womit der Beweis für die Richtigkeit der Gl. (4.24) geliefert ist. Bezugnehmend auf Beispiel 4.10 soll nun der Schnittpunkt der Asymptoten mit der reellen Achse der s-Ebene berechnet werden. Unter Anwendung der Gl. (4.24) erhält man den gesuchten Wurzelschwerpunkt zu σa =
(−4 − 5 − 0) − (0) = −3. 3−0
Der Asymptotenschnittpunkt σa ist im Bild 4.13 ebenso eingetragen. Regel 6: Die Neigungswinkel αk der Asymptoten der (n − m) nach Unendlich strebenden Äste der Wurzelortskurve sind gegeben durch αk = ±
(2k + 1)180◦ ; n−m
k = 0, 1, 2, . . .
(4.29)
Für (n − m) = 1, 2, 3 und 4 erhält man daraus die im Bild 4.14 skizzierte Anordnung der Asymptoten:
Bild 4.14: Verlauf der Asymptoten der WOK für (n − m) = 1, 2, 3 und 4
Die Gleichung (4.29) lässt sich anschaulich erklären, wenn man die Phasenbedingung für einen Punkt der s-Ebene ansetzt, der sehr weit von den endlichen Pol- und Nullstellen entfernt ist. Für einen solchen Punkt tragen nämlich sämtliche Pol- und Nullstellen annähernd den gleichen Winkel αk zur gesamten Winkelsumme bei. Damit wird die Phasenbedingung zu
96
4 Stabilität von Regelkreisen
ϕ(s) = −(n − m)αk = (2k + 1)180◦ ;
k = 0, 1, 2, . . . .
Stellt man diese Gleichung nach αk um, so erhält man gerade den Zusammenhang gemäß Gl. (4.29). Für das obige Beispiel sollen zur Verdeutlichung die Neigungswinkel der Asymptoten ermittelt werden: Mit Gl. (4.29) ergeben sich die gesuchten Anstiegswinkel der Asymptoten zu 180◦ = ±60◦ ; 3 = ±180◦ .
k = 0: αk1,2 = ± k = 1:
αk,3
Die entsprechenden Asymptoten sind auch im Bild 4.14 eingetragen. Regel 7: Besitzt die WOK auf der reellen Achse einen Ast zwischen zwei Polstellen des offenen Regelkreises, so muss in diesem Bereich mindestens ein Verzweigungspunkt existieren, in dem zwei Äste der WOK vom reellen in den komplexen Bereich verzweigen. Nachdem der Parameter k0 in den beiden Polstellen den Wert null hat und entlang der reellen Achse in Richtung des Verzweigungspunktes ansteigen muss, erreicht k0 gerade im Verzweigungspunkt ein Maximum kV, max bezüglich der reellen Achse. In Bild 4.15, b) ist k0 in Abhängigkeit von σ entlang der reellen Achse für einen Verzweigungspunkt zwischen den Polstellen sp1 und sp2 aufgetragen. Besitzt die WOK auf der reellen Achse einen Ast zwischen zwei Nullstellen des offenen Regelkreises, so muss in diesem Bereich mindestens ein Vereinigungspunkt existieren, in dem zwei Äste der WOK aus der komplexen s-Ebene auf die reelle Achse stoßen. Nachdem der laufende Parameter k0 in den beiden Nullstellen unendlich ist und entlang der reellen Achse in Richtung Vereinigungspunkt kleiner werden muss, erreicht k0 im Vereinigungspunkt ein Minimum kV,min . In Bild 4.15, d) ist k0 über σ entlang der reellen Achse für den Fall eines Vereinigungspunktes dargestellt. Liegt auf der reellen Achse der s-Ebene ein Ast der Wurzelortskurve zwischen einem Pol und einer Nullstelle des offenen Regelkreises, dann existieren dazwischen entweder kein Verzweigungs- und kein Vereinigungspunkt, oder sie treten paarweise auf. Die gesuchten Verzweigungs- bzw. Vereinigungspunkte der WOK auf der reellen Achse erhält man mit der charakteristischen Gleichung 1 + k0 F (s) = 0 zu k0 = −
1 F (s)
4.4 Das Wurzelortskurven-Verfahren
97
Bild 4.15: Verzweigungs- und Vereinigungspunkt mit dem jeweiligen Graphen k0 (σ )
aus der Extremwertbedingung dk0 = 0. ds
(4.30)
Die Verzweigungs- bzw. Vereinigungspunkte sollen nun wieder anhand von Beispiel 4.10 berechnet werden: Mit Fo (s) = k0
1 s(s + 4)(s + 5)
wird die charakteristische Gleichung 1 + k0 F (s) = 0, umgestellt nach k0 zu k0 = −s(s + 4)(s + 5) bzw. k0 = −(s 3 + 9s 2 + 20s).
98
4 Stabilität von Regelkreisen
Mit dk0 = −(3s 2 + 18s + 20) = 0 ds folgen daraus die Verzweigungspunkte σ1 = −1,47 und σ2 = −4,53. Der Verzweigungspunkt σ1 ist im Bild 4.13 eingetragen, σ2 ist keine Lösung, nachdem dieser Punkt der reellen Achse nicht Teil der WOK (siehe Regel 4) ist. Regel 8: Die Schnittpunkte der Wurzelortskurve mit der Imaginärachse der s-Ebene an den Stellen ±jωI bzw. der diesen Schnittpunkten entsprechende Wert des laufenden Parameters k0 können durch Anwendung des Hurwitz-Kriteriums bestimmt werden. Wie man leicht sieht, geht es bei diesem Punkt nicht um die Konstruktion der WOK, sondern mehr darum, einen bestimmten Punkt der WOK aufzufinden. Zur Erläuterung hierzu soll wieder das bisher behandelte Beispiel aufgegriffen werden. Die charakteristische Gleichung dieses Beispiels lautet bekanntlich s 3 + 9s 2 + 20s + k0 = 0. Durch Anwendung des Hurwitz-Kriteriums erhält man folgendes Zahlenschema: 3:
1
20
2:
9 180 − k0 9 k0
k0
1: 0:
Aus der dritten Zeile des obigen Schemas erhält man eine Bedingung für die maximal zulässige Verstärkung für stabiles Regelverhalten, nämlich k0 = kmax = 180. Bei dieser Verstärkung schneidet die WOK die imaginäre Achse der s-Ebene. Damit ist der geschlossene Regelkreis für k0 < kmax stabil. Der Schnittpunkt der WOK mit der imaginären Achse ergibt sich mit s = jω bez. der o.a. charakteristischen Gleichung durch Nullsetzen des Realteils: −9ω2 + 180 = 0. √ Daraus ergeben sich die gesuchten Schnittpunkte an den Stellen ωI1,2 = ± 20 = ±4,48. Diese Punkte sind im Bild 4.13 ebenfalls vermerkt.
4.4 Das Wurzelortskurven-Verfahren
99
Regel 9: Der Winkel, unter dem die WOK aus einer Polstelle des offenen Regelkreises austritt bzw. in eine Nullstelle einmündet, lässt sich aus der Phasenbedingung entsprechend Gl. (4.22) bestimmen: Austrittswinkel ϕa,Pρ aus der Polstelle sPρ : ϕa,Pρ
m n 1 ◦ ϕPi ± (2k + 1)180 = ϕNl − rPρ l=1 i=1 i = ρ
(4.31)
Eintrittswinkel der Wurzelortskurve in eine Nullstelle des offenen Regelkreises: ϕe,Nρ
m n 1 ◦ ϕNl + = ϕPi ± (2k + 1)180 − rNρ i=1 l=1 l = ρ
(4.32)
mit k = 0, 1, 2, . . . ; rPρ bzw. rNρ als Vielfachheit der betrachteten Pol- bzw. Nullstelle des offenen Regelkreises. Zur Erläuterung dieser Gleichungen soll hierzu ein separates Beispiel angefügt werden. Beispiel 4.11: Die Übertragungsfunktion eines offenen Regelkreises sei gegeben zu Fo (s) = k0
s(s 2
1 . + 4s + 8)
Wie aus Bild 4.16 zu entnehmen ist, liefert die Anwendung der Regel 5 den Schnittpunkt der Asymptoten auf der reellen Achse an der Stelle −1,33; die Neigungswinkel der Asymptoten ergeben sich mit der Regel 6 zu ±60◦ und ±180◦ . Es sollen die maximal zulässige Verstärkung kmax für stabiles Regelverhalten sowie die Austrittswinkel der WOK aus den beiden konjugiert komplexen Polstellen des offenen Regelkreises ermittelt werden. Zur Bestimmung von kmax und den Schnittpunkten der WOK mit der imaginären Achse wird nach Regel 8 verfahren. Die charakteristische Gleichung des zu untersuchenden Systems lautet s 3 + 4s 2 + 8s + k0 = 0.
100
4 Stabilität von Regelkreisen
Bild 4.16: Wurzelortskurve zu Fo (s) = k0
1 s(s 2 +4s+8)
Unter Anwendung des bereits bekannten Hurwitz-Kriteriums wird die maximal zulässige Verstärkung für stabiles Regelverhalten zu kmax = 32. Den Schnittpunkt der WOK mit der imaginären Achse erhält man, indem man mit s = jω und k0 = 32 in der charakteristischen Gleichung den Imaginärteil zu null setzt. Daraus erhält man die Gleichung −4ω2 + 32 = 0. Die Lösungen dieser Gleichung ω1,2 = ±2,82 sind gerade die gesuchten Schnittpunkte. Zur Berechnung des Austrittswinkels der Wurzelortskurve aus der Polstelle sP2 = (−2 + j2) wird Gl. (4.31) herangezogen. Mit den gemessenen bzw. berechneten Polwinkeln ϕP1 = 135◦ und ϕP3 = 90◦ erhält man den Austrittswinkel der WOK aus der Polstelle sP2 zu ϕa,P2 =
1 · 0 − (135◦ + 90◦ ) + 180◦ = −45◦ . 1
Regel 10: Der Wert des laufenden Parameters k0 in einem beliebigen Punkt auf der Wurzelortskurve wird durch Anwendung der Amplitudenbedingung (gemäß Gl. (4.23)) bestimmt. Zur Anwendung der Amplitudenbedingung wird wieder das Beispiel 4.10 herangezogen. Mit der Übertragungsfunktion des offenen Regelkreises Fo (s) = k0
1 s(s + 4)(s + 5)
4.4 Das Wurzelortskurven-Verfahren
101
soll für den im Bild 4.13 mit A gekennzeichneten Punkt der Parameter k0 unter Anwendung der Amplitudenbedingung ermittelt werden. Gemäß Gl. (4.23) wird die Amplitudenbedingung im gegebenen Beispiel zu 1 1 bzw. kA = |sA | · |sA + 4| · |sA + 5| . s · (s + 4) · (s + 5) = k A A A A Mit den gemessenen Beträgen |sA | = 2,2; |sA + 4| = 3,5 und |sA + 5| = 4,3 ergibt sich der gesuchte Parameter zu kA = 2,2 · 3,5 · 4,3 = 33,1. Regel 11: Für jeden Parameter k0 entlang der Wurzelortskurve ist die Summe der Wurzeln des offenen Regelkreises mit der Summe der Wurzeln des geschlossenen Regelkreises identisch: n
sP,gi =
i=1
n
sP,oi
(4.33)
i=1
Dabei sind in dieser Gleichung sP,gi die Pole des geschlossenen Regelkreises und sP,oi die Pole des offenen Regelkreises. Dieses Kriterium erweist sich besonders dann als vorteilhaft, wenn für einen beliebigen Wert von k0 auf (n − 1) Ästen der WOK die entsprechende Lage bekannt ist und für den verbleibenden Ast ermittelt werden soll. Im Beispiel 4.10 wurden die Schnittpunkte der WOK mit der imaginären Achse der s-Ebene für k0 = 180 zu ω1,2 = ±4,48 berechnet. Es soll nun mit Gl. (4.33) der entsprechende Punkt auf dem entlang der reellen Achse verlaufenden Ast der WOK bestimmt werden: Unter Anwendung der Gl. (4.33) erhalten wir (+j4, 48 − j4, 48 + sx ) = (0 − 4 − 5) und daraus sx = −9.
4.4.3 Typische Beispiele zur Konstruktion von Wurzelortskurven Die folgenden Beispiele sollen die Vorgehensweise zur Konstruktion von Wurzelortskurven anhand der Anwendung der entsprechenden Konstruktionsregeln verdeutlichen. Beispiel 4.12: Gegeben sei die Übertragungsfunktion eines offenen Regelkreises in der Form Fo (s) = k0
1 . (s + 1)(s − 1)(s + 4)2
Gesucht ist der Verlauf der entsprechenden Wurzelortskurve des geschlossenen Regelkreises.
102
4 Stabilität von Regelkreisen
Der offene Regelkreis besitzt einen Doppelpol und eine einfache Polstelle auf der negativ reellen Achse sowie einen positiven, d.h. instabilen reellen Pol. Regel 1: Regel 2:
Regel 3:
Die WOK besitzt vier Äste, weil der Nennergrad von Fo (s) vier ist. Jeweils ein Ast der WOK startet mit k0 = 0 in den einfachen Polstellen des offenen Regelkreises, zwei Äste starten im Doppelpol (−4; j0). Alle Äste enden für k0 → ∞ im Unendlichen der s-Ebene. Die Wurzelortskurve verläuft symmetrisch zur reellen Achse.
Regel 4: Auf der reellen Achse ist der Abschnitt zwischen −1 und +1 sowie der Doppelpol an der Stelle −4 Teil der Wurzelortskurve. Regel 5: Der Schnittpunkt der Asymptoten der Wurzelortskurve liegt auf der reellen Achse im Punkt σa =
(−1 + 1 − 2 · 4) − (0) = −2. 4−0
Regel 6: Die Neigungswinkel der Asymptoten der nach unendlich strebenden Äste der Wurzelortskurve ergeben sich zu α0 = ±
180◦ = ±45◦ 4
und α1 = ±
3 · 180◦ = ±135◦ . 4
Regel 7: Verzweigungspunkte der Wurzelortskurve auf der reellen Achse: Aus der charakteristischen Gleichung 1 + Fo (s) = 1 +
k0 =0 (s + 1)(s − 1)(s + 4)2
folgt
k0 = −(s + 1)(s − 1)(s + 4)2 . Leitet man diesen Ausdruck nach s ab, so erhält man aus dk0 = −2(s + 4)(2s 2 + 4s − 1) = 0 ds die Lösungen dieser Gleichung σV1 = 0,22;
σV2 = −2,22
und
σV3 = −4.
Die Lösung σV2 = −2,22 hat keine Bedeutung, weil der Punkt (−2,22; j0) kein Punkt der Wurzelortskurve ist. Setzt man nun die gewonnenen Ergebnisse aus den angewandten Regeln in die s-Ebene um, so erhält man den im Bild 4.17 wiedergegebenenVerlauf der Wurzelortskurve. Bemerkenswert für dieses Beispiel ist die Feststellung, dass das gegebene System für jedes beliebige k0 instabil ist, weil immer mindestens eine Wurzel der charakteristischen Gleichung in der rechten sHalbebene liegt.
4.4 Das Wurzelortskurven-Verfahren
Bild 4.17: Verlauf der Wurzelortskurve für Fo (s) = k0
103
1 (s+1)(s−1)(s+4)2
Beispiel 4.13: Zur Übertragungsfunktion eines offenen Regelkreises der Form Fo (s) = k0
(1 + 0,1 s) s + 10 = 1,6 k0 2 s(1 + s)(1 + 0,25 s) s(s + 1)(s + 4)2
ist die Wurzelortskurve des geschlossenen Regelkreises zu konstruieren. Der offene Regelkreis besitzt vier Pole sowie eine Nullstelle. Sämtliche Pol- und Nullstellen des offenen Regelkreises liegen auf der reellen Achse der s-Ebene. Die WOK wird wieder schrittweise mit den oben aufgestellten Regeln konstruiert. Regel 1:
Die WOK besitzt vier Äste, weil der Nenner der Übertragungsfunktion des offenen Regelkreises vierten Grades ist. Regel 2: Jeder Ast der WOK startet mit k0 = 0 in der jeweiligen Polstelle des offenen Regelkreises. Wegen n − m = 3 laufen drei Äste der WOK ins Unendliche der s−Ebene. Regel 4: Auf der reellen Achse sind der Doppelpol an der Stelle −4 sowie die Bereiche zwischen −1 und dem Ursprung der s-Ebene sowie zwischen −10 und −∞ Punkte der Wurzelortskurve.
104
Regel 5:
4 Stabilität von Regelkreisen
Der Schnittpunkt der Asymptoten mit der reellen Achse liegt an der Stelle σa =
Regel 6:
(−2 · 4 − 1 − 0) − (−10) = 0,33. 4−1
Die Neigungswinkel der Asymptoten ergeben sich zu α0 = ±
Regel 7:
180◦ = ±60◦ ; 4−1
α1 = ±
3 · 180◦ = ±180◦ . 3
Bestimmung der Verzweigungspunkte der WOK auf der reellen Achse: Mit der charakteristischen Gleichung 1 + Fo (s) = 1 +
1,6 k0 (s + 10) =0 s(s + 1)(s + 4)2
wird die nach k0 umgestellte Gleichung zu k0 = −
s(s + 1)(s + 4)2 . 1,6(s + 10)
Leitet man diesen Ausdruck nach s ab und setzt das daraus resultierende Polynom zu null, so erhalten wir die Lösungen σV1 = −0,45;
σV2 = 2,25;
σV3 = −4
und
σV4 = −12,5,
wobei σV2 = 2,25 keine Lösung sein kann, weil durch diesen Punkt kein Ast der WOK verläuft. Die Lösungen σV1 und σV3 sind Verzweigungspunkte, σV4 ist ein Vereinigungspunkt der WOK. Regel 8: Bestimmung des Schnittpunkts der WOK mit der imaginären Achse der s-Ebene: Ersetzt man im charakteristischen Polynom s 4 + 9 s 3 + 24 s 2 + (16 + 1,6 k0 )s + 16 k0 = 0 den Laplace-Operator s mit jω, so erhält man den folgenden komplexen Ausdruck: ω4 − j9ω3 − 24ω2 + jω(16 + 1,6 k0 ) + 16 k0 = 0. Setzen wir den Realteil der obigen Gleichung zu null, so erhalten wir die Beziehung ω4 − 24ω2 + 16 k0 = 0 16 + 1,6 k0 . ω= 9
und daraus die Lösung
Wird dieser Wert nun in den ebenfalls zu null gesetzten Imaginärteil der komplexen charakteristischen Gleichung eingesetzt, so erhält man daraus k0 im Schnittpunkt der WOK mit der Imaginärachse zu k0 = 3,167. Somit ist der geschlossene Regelkreis stabil für 0 < k0 < 3,167. Setzt man nun diesen Maximalwert bez. k0 in
4.4 Das Wurzelortskurven-Verfahren
105
den obigen Wurzelausdruck ein, so erhält man den Schnittpunkt der WOK mit der imaginären Achse der s-Ebene zu 16 + 1,6 · 3,167 ωI = = 1,53. 9 Die Übertragung der diversen Ergebnisse in die komplexe s-Ebene liefert den im Bild 4.18 wiedergegebenen Verlauf der Wurzelortskurve.
Bild 4.18: Wurzelortskurve zu Fo (s) = k0
(1+0,1 s) s(1+s)(1+0,25 s)2
Beispiel 4.14: In diesem letzten Beispiel ist die Übertragungsfunktion des offenen Regelkreises gegeben zu Fo (s) = k0
(s + 4) . (s + 0,5)2 · (s + 2)
Es soll wieder der Verlauf der Wurzelortskurve konstruiert werden. Regel 1: Regel 2:
Die Wurzelortskurve besitzt drei Äste. Die drei Äste der Wurzelortskurve starten in den Polstellen des offenen Regelkreises, wovon (wegen n − m = 2) zwei Äste nach unendlich streben.
106
4 Stabilität von Regelkreisen
Bild 4.19: Wurzelortskurve zu Fo (s) = k0
Regel 5:
(s+4) (s+0,5)2 (s+2)
Der Schnittpunkt der Asymptoten mit der reellen Achse berechnet sich zu σa = 0,5.
Regel 6:
Die Neigungswinkel der Asymptoten ergeben sich zu α0 =
±180◦ = ±90◦ . 2
Regel 7:
Der einzige Verzweigungspunkt ist offensichtlich der Doppelpol an der Stelle −0, 5; eine weitere Anwendung von Regel 7 ist deshalb nicht nötig. Regel 8: Der Schnittpunkt der Wurzelortskurve mit der imaginären Achse der s-Ebene und der entsprechende Wert des Parameters k0 können auf einfachem Weg durch Anwenden des Hurwitz-Kriteriums gefunden werden. Aus der charakteristischen Gleichung 1 + Fo (s) = 0 erhält man das charakteristische Polynom zu s 3 + 3 s 2 + (2,25 + k0 )s + (4 k0 + 0,5) = 0. Wendet man nun auf diese Gleichung das Hurwitz-Kriterium an, so erhält man den maximal zulässigen Wert von k0 für stabiles Regelverhalten zu k0,max = 6,24.
4.4 Das Wurzelortskurven-Verfahren
107
Um den Schnittpunkt der Wurzelortskurve mit der imaginären Achse zu finden, wird im charakteristischen Polynom der Laplace-Operator s wieder mit jω und k0 mit 6,24 ersetzt. Setzt man schließlich den Realteil des daraus resultierenden Ausdrucks zu null, so erhalten wir die Schnittpunkte der Wurzelortskurve mit der imaginären Achse der s-Ebene zu ω1,2 = ±2,92. Die Anwendung weiterer Regeln zur Konstruktion der Wurzelortskurve ist für dieses Beispiel überflüssig. Das Bild 4.19 zeigt schließlich den Verlauf der WOK des gegebenen Beispiels aus der Übertragung der gewonnenen Ergebnisse in die komplexe s-Ebene.
5
Qualitätskriterien von Regelkreisen
5.1
Entwurfsforderungen
Die grundlegenden Forderungen an einen geregelten Prozess beziehen sich im Wesentlichen auf die Stabilität, die bleibende Regelabweichung sowie auf das transiente Verhalten der Regelgröße. Die Stabilität eines Regelkreises, d.h. seine Eigenschaft auf eine begrenzte Eingangsgröße mit einer begrenzten Ausgangsgröße zu reagieren, muss eine unabdingbare Eigenschaft jeder Regelung sein. Durch den Entwurf einer Regelung ist unbedingt sicherzustellen, dass diese Bedingung bei allen zulässigen Betriebszuständen erfüllt ist. Die bleibende Regelabweichung muss im stationären Betriebszustand hinreichend klein sein, d.h. est = lim e(t) t→∞
darf für vorgegebene – meist sprungförmige – Zeitverläufe der Führungsgröße eine in der Spezifikation festgelegte Schranke nicht überschreiten. Dabei sollte jedoch bei der Festlegung der Genauigkeitsschranke beachtet werden, dass keine Regelung genauer sein kann als der zur Erfassung der Regelgröße verwendete Sensor. Das transiente Verhalten wird über die Spezifikation bezüglich der Dämpfung und Schnelligkeit des Übergangsverhaltens festgelegt. Diese Spezifikationen werden in der Regel dadurch definiert, dass man für den Verlauf der Regelgröße y(t) einen „Zielkorridor“ vorschreibt, der bei einer sprungförmigen Verstellung der Führungsgröße w(t) nicht verlassen werden darf. Dieser Zielkorridor hat normalerweise das im folgenden Bild dargestellte Aussehen, wobei die einzelnen Begrenzungen folgende Aufgaben haben:
Bild 5.1: Spezifikation der Sprungantwort eines Regelkreises
Die Grenze a soll verhindern, dass der Regelkreis bei einer Zunahme der Führungsgröße zunächst mit einer Abnahme der Regelgröße reagiert. Durch die Grenze b wird die Anstiegsge-
5.2 Systeme zweiter Ordnung
109
schwindigkeit der Regelgröße eingegrenzt und die damit häufig verbundene starke Beanspruchung der Stellglieder vermieden. Die Grenze c beschränkt die zulässige Überschwingweite und stellt damit eine Mindestdämpfung des Einschwingvorgangs sicher. Die Grenze d soll ein zu träges Einschwingen der Regelgröße auf den Endwert verhindern. Durch die Grenzen e und f wird schließlich der zulässige stationäre Fehler eingeschränkt.
5.2
Systeme zweiter Ordnung
Aus der Sicht der Frequenzebene ist unter der Ordnung eines geregelten Systems die höchste Potenz von s im Nenner der Übertragungsfunktion des geschlossenen Regelkreises zu verstehen. Im Zeitbereich erhält man die Ordnung eines Systems als höchste Ableitung der Ausgangsgröße in der Differenzialgleichung, die den Zusammenhang zwischen der Ausgangsund der Eingangsgröße beschreibt. Systeme zweiter Ordnung charakterisieren die Dynamik vieler angewandter Regelungen, wie z.B. auf dem Gebiet servomechanischer Antriebe, Regelungen in der chemischen Industrie, Fluglagenregelungen und dergleichen mehr. Es ist in diesem Zusammenhang wichtig festzuhalten, dass die Auslegung vieler Regelkreise auf Systemen zweiter Ordnung beruht. Wenn auch das geregelte System im jeweiligen Fall von höherer Ordnung ist, so kann es doch in vielen Fällen näherungsweise durch ein System vom Grad zwei behandelt werden, um eine erste Approximation der Reglerparameter mit bemerkenswert guter Genauigkeit zu erhalten. Die Aufgabe dieses Abschnitts ist deshalb die Beschreibung des transienten Verhaltens typischer Regelkreise, die entweder exakt oder auch nur näherungsweise einem System zweiter Ordnung unterliegen. Betrachten wir als Beispiel einen Gleichstrom-Servomotor mit der Übertragungsfunktion FM (s) = Km Tm
Km s(1 + sTm )
Motorkonstante Motorzeitkonstante
mit direkter Rückführung gemäß folgendem Bild:
Bild 5.2: Geschlossener Regelkreis als System zweiter Ordnung
Wie sich sofort zeigen wird, entsteht durch die direkte Rückführung bereits ein System zweiter Ordnung; der Einfachheit wegen wurde die Verstärkung der Motoreingangsspannung E(s) zu eins gesetzt und deshalb in obiges Bild auch nicht eingezeichnet.
110
5 Qualitätskriterien von Regelkreisen
Die Übertragungsfunktion des geschlossenen Kreises ist gegeben durch K m Tm Y (s) . " # = 2 W (s) s + s 1 T m + K m Tm
(5.1)
Mit ω0 als Eigenfrequenz des ungedämpften Systems und dem Dämpfungsfaktor d, also ω02 =
Km Tm
und d =
1 2ω0 Tm
kann Gl. (5.1) umgeschrieben werden zu ω02 Y (s) = FW (s) = 2 . W (s) s + 2dω0 s + ω02
(5.2)
Wie man aus Gl. (5.2) sehen kann, hängt das transiente Verhalten der Regelgröße y(t) bei vorgegebenem Sollwert w(t) ausschließlich von den Parametern ω0 und d ab. Eine gedämpfte Schwingung der Regelgröße y(t) ist nur möglich für Dämpfungswerte d < 1 (siehe Abschnitt 3.2.2). Deshalb soll auch hier nur dieser Fall betrachtet werden. Für einen sprungförmigen Sollwert w(t) = ε(t) bzw. W (s) = 1 s wird Gl. (5.2) zu Y (s) =
"
ω02
s s 2 + 2dω0 s + ω02
#;
(5.3)
wenn man schließlich noch den Nenner dieser Gleichung faktorisiert, so wird die Laplacetransformierte Ausgangsgröße zu Y (s) =
√
ω02
s s + ω0 d − jω0 1 − d 2
. √ s + ω0 d + jω0 1 − d 2
(5.4)
Die Partialbruchzerlegung dieser Gleichung lautet somit Y (s) =
C1 C3 C2 + + √ √ 2 s s + ω0 d − jω0 1 − d s + ω0 d + jω0 1 − d 2
(5.5)
Die Konstanten C1 , C2 und C3 erhält man in bekannter Weise durch Einsetzen einfacher sWerte in Gl. (5.5). Um den Rechengang zu vereinfachen, wird vom Zusammenhang zwischen der Dämpfung und der Lage der konjugiert komplexen Pole gemäß Bild 5.3 Gebrauch gemacht: Mit α = 90◦ − ϕd
5.2 Systeme zweiter Ordnung
111
Bild 5.3: Lage der konjugiert komplexen Pole in der s-Ebene
folgt cos α = d sin α = 1 − d 2
(5.6) (5.7)
Damit können die Konstanten C1 , C2 und C3 ausgedrückt werden zu C1 = 1 C2 =
e−jα 2j sin α
C3 = −
ejα 2j sin α
Damit wird Gl. (5.5) zu Y (s) =
−1 1 e−jα + s + ω0 d − jω0 1 − d 2 s 2j sin α −1 ejα − . s + ω0 d + jω0 1 − d 2 2j sin α
(5.8)
Das Zeitverhalten der Ausgangsgröße erhält man nun durch Rücktransformation der Gl. (5.8) in den Zeitbereich zu
e−jα − ·e y(t) = 1 + 2j sin α
√ ω0 d−jω0 1−d 2 t
ejα − ·e − 2j sin α
Diese Gleichung lässt sich leicht vereinfachen zu
√ ω0 d+jω0 1−d 2 t
.
112
5 Qualitätskriterien von Regelkreisen
e−ω0 dt e y(t) = 1 + √ · 1 − d2
√ j ω0 t 1−d 2 −α
−e 2j
√ −j ω0 t 1−d 2 −α
e−ω0 dt y(t) = 1 − √ · sin ω0 1 − d 2 t + α 1 − d2
bzw.
mit
t ≥0
(5.9)
Das folgende Bild zeigt die Regelgröße für w(t) = ε(t), ω0 = 1, d = 0,3:
Bild 5.4: Regelgröße eines untergedämpften Systems; d = 0,3
Dabei ist zu beachten, dass die Ausgangsgröße mehrere Überschwinger aufzeigt, bevor sie den stationären Endwert annimmt. Dieses Verhalten ist typisch für eine exponentiell gedämpfte Sinusschwingung und wird wegen d < 1 als untergedämpft bezeichnet. Die verstrichene Zeit bis zum Auftreten des ersten Maximums und der entsprechende Amplitudenwert sind zwei charakteristische Größen bez. des Einschwingverhaltens. Es sollen deshalb im nächsten Schritt diese Größen in Abhängigkeit von ω0 und d ausgedrückt werden. Gl. (5.9) zeigt, dass die Eigenkreisfrequenz ωm des gedämpften Systems von der Eigenkreisfrequenz ω0 des ungedämpften Systems verschieden ist: ωm = ω0 1 − d 2 . (5.10) Den Zeitpunkt tmax , bei dem die maximale Überschwingweite auftritt, erhält man durch einmalige Differenziation der Gl. (5.9) nach der Zeit, wenn man die daraus resultierende Gleichung zu null setzt:
5.2 Systeme zweiter Ordnung
113
−ω0 de−ω0 dt dy(t) = √ · sin ω0 1 − d 2 t + α dt 1 − d2 √ + ω0 e−ω0 dt · cos ω0 1 − d 2 t + α = 0; dy(t) ω0 · e−ω0 dt · sin ω0 1 − d 2 t = 0. = √ dt 1 − d2 Dieser Ausdruck ist null für ω0 1 − d 2 · t = 0, π, 2π, 3π, ... Damit sind der Zeitpunkt des ersten Maximums tmax sowie ω0 tmax gegeben durch: tmax = ω0 tmax
√
π
, ω0 1 − d 2 π =√ . 1 − d2
(5.11)
Die Substitution der Gl. (5.11) in Gl. (5.9) ergibt den zugehörigen Maximalwert der Regelgröße y(t): − √π·d
e y (tmax ) = 1 − √
1−d 2
1 − d2
· sin(π + α)
(5.12)
Dieser Ausdruck kann mit sin(π + α) = − sin α
und
sin α =
1 − d2
vereinfacht werden zu y (tmax ) = 1 + e
− √π·d
1−d 2
Somit erhält man für w(t) = ε(t) emax [%] = (y (tmax ) − 1) · 100 = e
− √π·d
1−d 2
· 100
(5.13)
für 0 ≤ d < 1. Dieser Wert wird in der Regel in Prozenten des Sollwerteingangs ausgedrückt. Für den Fall in Bild 5.4 mit d = 0,3 ist emax = 37 %. Um mit dem Schwingungsglied zweiter Ordnung mit seinem typischen Einschwingverhalten vertrauter zu werden, zeigen die folgenden Bilder noch einmal das transiente Verhalten (Bild 5.5) sowie im Bild 5.6 die maximale Überschwingweite emax [%] in Abhängigkeit der Dämpfung.
114
5 Qualitätskriterien von Regelkreisen
Bild 5.5: Einschwingverhalten eines Systems zweiter Ordnung bei sprungförmigem Eingang
Bild 5.6: Maximale Überschwingweite eines Systems zweiter Ordnung in Abhängigkeit der Dämpfung
Schließlich soll darauf hingewiesen werden, dass sich die Gl. (5.13) im Bereich 0 ≤ d ≤ 0,6 durch die Näherung, siehe Bild 5.6,
d · 100 [%] (5.14) emax ≈ 1 − 0,6 relativ gut approximieren lässt.
5.3 Typische Kennwerte des dynamischen Verhaltens
5.3
115
Typische Kennwerte des dynamischen Verhaltens
Neben der bereits eingeführten maximalen Überschwingweite und dem entsprechenden Zeitpunkt tmax ihres Auftretens (Gl. (5.11) bzw. (5.13)) gehen auch die folgenden kennzeichnenden Eigenschaften des transienten Verhaltens von einem sprungförmigen Sollwert aus. Die Sprungantwort eines geregelten Systems zweiter Ordnung als Reaktion auf den Einheitssprung ist besonders zur Definition verschiedener Kenngrößen des transienten Verhaltens geeignet. Wenn der Regelkreis höher als zweiter Ordnung ist, so ergibt sich trotzdem eine gute Approximation des Übergangsverhaltens, wenn ein konjugiert komplexes Polpaar (ein so genanntes dominantes Polpaar) im Vergleich zu den restlichen Polstellen der Imaginärachse der s-Ebene sehr nahe liegt. Davon wird später bei der Regelkreis-Synthese mit Hilfe von Wurzelortskurven Gebrauch gemacht werden. Zum Zweck der Illustration gehen wir aus von einem echten System zweiter Ordnung. Die Übertragungsfunktion des geschlossenen Kreises ergab sich zu (siehe Gl. (5.2)) ω02 Y (s) , = FW (s) = 2 W (s) s + 2dω0 s + ω02 die zugehörige Sprungantwort ist der Gl. (5.9) zu entnehmen. Die verstrichene Zeit vom Sollwertsprung bis zu dem Zeitpunkt, ab dem die Regelgröße y(t) praktisch auf den stationären Endwert eingeschwungen ist, wird als Ausregelzeit ts bezeichnet. Bekanntlich wäre der rein theoretische Wert der Ausregelzeit für ein System zweiter Ordnung unendlich groß. In der Praxis geht man jedoch davon aus, dass der transiente Übergang als abgeschlossen gilt, wenn die Regelgröße nur noch Schwingungen von ±2 % um den stationären Endwert durchführt. Die Ausregelzeit ts kann näherungsweise als das Vierfache der Zeitkonstante der einhüllenden Exponentialfunktion gemäß Gl. (5.9) angesehen werden, also dω0 ts ≈ 4, ts =
daraus
4 ω0 d
(5.15)
Die Anstiegszeit tr ist definiert als verstrichene Zeit, bis die Regelgröße (bei sprungförmigem Eingang) von 10 % auf 90 % ihres stationären Endwerts angestiegen ist. Das Produkt ω0 tr kann natürlich gemäß Gl. (5.9) nur iterativ berechnet werden. EinAusgleichspolynom der Art ω0 tr = 1,589 d 3 − 0,1562 d 2 + 0,9247 d + 1,0141 liefert eine sehr gute Approximation;
116
5 Qualitätskriterien von Regelkreisen
aufgelöst nach tr ergibt sich tr =
1 (1,589 d 3 − 0,1562 d 2 + 0,9247 d + 1,0141) ω0
(5.16)
Das Bild 5.7 zeigt das Produkt ω0 · tr in Abhängigkeit der Dämpfung d:
Bild 5.7: Abhängigkeit des Produkts ω0 tr vom Dämpfungsfaktor d
Die Gleichung tr ≈
1,80 ω0
(5.17)
ist erfahrungsgemäß eine sehr gute Näherung der Gl. (5.16) mit noch vertretbarem Fehler. Die Zeit bis zum Auftreten des ersten Maximums, tmax , ist nur für untergedämpfte Systeme, also d < 1, von Interesse. Auch wenn realistische Werte für den Zeitpunkt des Auftretens der maximalen Überschwingweite, für die Anstiegszeit, für die Ausregelzeit und die maximale Überschwingweite gewählt wurden, kann man nicht sicher sein, ob ein gutes Zeitverhalten vorliegt: Wenn beispielsweise die Anstiegszeit sehr klein gewählt wurde, so steigt damit die maximale Überschwingweite und die Ausregelzeit. Wenn andererseits der Regelkreis auf minimale Überschwingweite ausgelegt wurde, so wächst damit zwangsläufig die Anstiegszeit. Um diesen Konflikt zu lösen, der zwischen einer optimalen Anstiegszeit, einer realistischen maximalen Überschwingweite und einer geeigneten Ausregelzeit existiert, wurden weitere Kriterien vorgeschlagen, die ein optimales Einschwingverhalten eines Regelkreises kennzeichnen. Einzelne dieser Kriterien sollen im folgenden Kapitel aufgezeigt werden.
5.4 International standardisierte Gütemaßzahlen
5.4
117
International standardisierte Gütemaßzahlen
Komplexe Regelsysteme benötigen gewöhnlich anspruchsvollere Gütekriterien als die bisher aufgestellten Qualitätsmerkmale (Anstiegszeit, Ausregelzeit etc.). Wie bereits im vorigen Kapitel gezeigt wurde, ist die Regelabweichung in ihrem zeitlichen Verlauf sowie bez. der Amplitude ein sehr aussagekräftiges Gütekriterium. Auf der Basis der Regelabweichung wurden deshalb für die praktische Auslegung von Regelkreisen Maßzahlen entwickelt, die besonders gut über die Qualität einer Regelung Aufschluss geben. • Das IAE-Kriterium (Integral of Absolute Error) Das IAE-Kriterium ist definiert als
∞ |e(t)|dt → Min.
S1 =
(5.18)
0
Bei der Auswertung des obigen Integrals sind die Reglerparameter so zu wählen, dass S1 zu einem Minimum wird und somit ein optimal eingestellter Regelkreis entsteht. • Das ISE-Kriterium (Integral of Squared Error) Die wohl am häufigsten benutzte Gütemaßzahl ist das quadratische Gütekriterium
∞ S2 =
e2 (t)dt → Min.
(5.19)
0
Durch die Quadrierung der Regelabweichung e(t) werden positive und negative Fehler gleich bewertet. Es kann gezeigt werden, dass S2 für ein System zweiter Ordnung ein Minimum bei einer Dämpfung von d = √1 hat. 2
• Das ITAE-Kriterium (Integral of Time Multiplied by the Absolute Error) Das mit der Zeit gewichtete absolute Gütekriterium
∞ t · |e(t)| dt → Min.
S3 =
(5.20)
0
bewertet nicht nur den Absolutwert des zeitlichen Fehlers, sondern es gewichtet außerdem die Dauer eines Einschwingvorgangs. Die bisher aufgezählten Kriterien sind die in der Praxis am häufigsten angewandten Gütemaßzahlen. Weiterhin existieren noch das •
ITSE-Kriterium (Integral of Time Multiplied by Squared Error)
∞ S4 =
t · e2 (t)dt → Min. 0
(5.21)
118
•
5 Qualitätskriterien von Regelkreisen
ISTAE-Kriterium (Integral of Squared Time Multiplied by the Absolute Error)
∞ t 2 · |e(t)| dt → Min.
S5 =
(5.22)
0
Das ISE-Kriterium (S2 ) ist nicht besonders sensitiv bez. Parametervariationen des Regelkreises, weil das Minimum sehr breit angelegt ist. Es hat jedoch den Vorteil, dass es relativ leicht berechnet werden kann. Das IAE-Kriterium ist etwas sensitiver als das ISE-Kriterium. Regelkreise, die nach dem IAE-Kriterium ausgelegt werden, weisen generell kleinere Überschwingweiten und weniger Oszillationen auf als solche, die nach dem IAE- oder dem ISE-Kriterium ausgelegt sind. Das ITAE-Kriterium ist das empfindlichste Kriterium von den oben aufgezählten; nur geringfügige Parameterschwankungen verschlechtern bereits das Regelverhalten enorm.
5.5
Das ITAE-Gütekriterium zur Optimierung des Systemverhaltens
Das ITAE-Gütekriterium gemäß Gl. (5.20) bewertet neben dem Betrag der Regelabweichung zusätzlich die Dauer des Einschwingvorgangs bei Sollwertänderungen. Wir betrachten zunächst die Form, die die Übertragungsfunktion des geschlossenen Regelkreises bei jeweils verschiedener Systemordnung haben sollte, damit bei sprung- und rampenförmiger Sollwertänderung der stationäre Fehler verschwindet und das ITAE-Kriterium S2 minimal wird. Für diesen Fall wird die Übertragungsfunktion des geschlossenen Regelkreises zu FW (s) =
Y (s) bn+1 = n n−1 W (s) b1 s + b 2 s + . . . + bn+1
(5.23)
DieVorgehensweise zur Erstellung einer Tabelle von Standard-Übertragungsfunktionen FW (s) besteht in der separaten Variation eines jeden Koeffizienten der Gl. (5.23), bis das Zeitintegral entsprechend Gl. (5.20) zu einem Minimum wird. Eine Liste optimaler Übertragungsfunktionen, basierend auf dem ITAE-Kriterium, ist in folgender Tabelle zusammengestellt. Sie zeigt jeweils die optimale Form des Nenners für Systeme von der durch Gl. (5.23) gegebenen Art. Die optimale Nennerfunktion lautet z. B. für ein System zweiter Ordnung ω02 Y (s) = 2 W (s) s + 1,4ω0 s + ω02
mit d = 1,4 2 = 0,7.
Die optimale Form eines Systems dritter Ordnung ist gegeben durch ω03 Y (s) . = 3 W (s) s + 1,75ω0 s 2 + 2,15ω02 s + ω03
5.5 Das ITAE-Gütekriterium zur Optimierung des Systemverhaltens
119
Tabelle 5.1: Nennerpolynom optimalen Einschwingverhaltens auf der Basis des ITAE-Kriteriums s + ω0 s 2 + 1,4ω0 s + ω02 s 3 + 1,75ω0 s 2 + 2,15ω02 s + ω03 s 4 + 2,1ω0 s 3 + 3,4ω02 s 2 + 2,7ω03 s + ω04 s 5 + 2,8ω0 s 4 + 5ω02 s 3 + 5,5ω03 s 2 + 3,4ω04 s + ω05 s 6 + 3,25ω0 s 5 + 6,6ω02 s 4 + 8,6ω03 s 3 + 7,45ω04 s 2 + 3,95ω05 s + ω06
Beispiel 5.1: Gegeben sei der im Bild 5.8 skizzierte Regelkreis. Die Konstanten K1 , β1 und β2 sind so zu bestimmen, dass das ITAE-Kriterium minimal wird.
Bild 5.8: Regelkreis mit geschwindigkeits- und beschleunigungsproportionaler Rückführung
Die Übertragungsfunktion in Vorwärtsrichtung lautet FV (s) =
K1 · s2
1 s+1
bzw. 1 · β1 s 2 + 1 s+1 K1 1 K1 FV (s) = 2 · = 2 . 2 s 1 + s + β1 s s + s 3 + β1 s 4
120
5 Qualitätskriterien von Regelkreisen
Wird schließlich die Rückführung β2 s mit einbezogen, so lautet die Übertragungsfunktion des inneren Kreises Fi (s) =
FV (s) K1 = 2 . 3 1 + FV (s) · β2 s s + s + β 1 s 4 + K 1 β2 s
Berücksichtigt man schließlich noch die direkte Rückführung, so ergibt sich mit FW (s) =
Y (s) Fi (s) = . 1 + Fi (s) W (s)
die Übertragungsfunktion des geschlossenen Regelkreises im gegebenen Beispiel zu FW (s) =
K1 K1 + K1 β2 s + s 2 + s 3 + β1 s 4
Um einen Vergleich mit Tabelle 5.1 herzustellen, wird FW (s) zunächst durch β1 dividiert: FW (s) =
K 1 β1
s4 +
1 3 1 β2 s + s 2 + K 1 s + K 1 β1 β1 β1 β1
.
Durch einen Koeffizienten-Vergleich gemäß Zeile 4 dieser Tabelle erhält man 1.
K1 β1 = ω04
2.
1 β1 = 2,1ω0 = 3,4ω02
3.
K1 ·
β2 = 2,7ω03 β1
Durch entsprechende Auflösung folgt β1 = 0,77;
β2 = 4,42;
K1 = 0,112.
6
Entwurf linearer Regelkreise
Nachdem die Stabilität eines Regelkreises mit einer der nunmehr bekannten Methoden (Nyquist, Hurwitz etc.) analysiert wurde, muss in nahezu allen Fällen festgestellt werden, dass die Dynamik des Regelkreises trotz Stabilität noch nicht zufrieden stellend ist und deshalb entsprechend modifiziert werden muss. Es muss deshalb dafür Sorge getragen werden, dass eine gewünschte Genauigkeit im stationären Zustand erreicht und das transiente Verhalten dem jeweiligen Anwendungsfall angepasst wird. Als Überbegriff für den Prozess der Stabilisierung und der Spezifikation der Genauigkeit des stationären und transienten Verhaltens dient der Begriff der Regelkreis-Synthese. Bei der Stabilisierung von Regelkreisen geht es, wie bereits die Namensgebung verrät, ausschließlich darum, die bloße Stabilität der Regelgröße zu erreichen. Mit dem Wort Kompensation wird der Vorgang der Verbesserung der stationären Genauigkeit und die Erhöhung der Reaktionsgeschwindigkeit auf eine Sollwert- oder Störgrößenänderung verstanden. Das kompensierende Gerät ist der Regler, der in Reihe zu der zu regelnden Strecke eingebaut wird (Reihenkompensation); siehe hierzu folgenden Standard-Regelkreis:
Bild 6.1: Standard-Regelkreis als Reihenkompensation
Die bekanntesten Verfahren zur Dimensionierung des Reglers sind die Regelkreis-Synthese mit Hilfe des Bode-Diagramms und die Regelkreis-Synthese unter Verwendung von Wurzelortskurven, die deshalb an dieser Stelle auch behandelt werden sollen.
6.1
Regelkreis-Synthese im Bode-Diagramm
Der Entwurf von Regelkreisen industrieller Prozesse wird wohl am häufigsten unter Einsatz von Frequenzgang-Methoden durchgeführt. Der Hauptgrund für die Popularität der Regelkreis-Synthese im Frequenzbereich besteht darin, dass über diesen Weg ein gutes Einschwingverhalten erzeugt werden kann, trotz gewisser Unsicherheit bezüglich der Kenntnis der Streckenparameter. Ein weiterer Vorteil im Einsatz der Frequenzantwort-Methode besteht darin, dass man für den Entwurf auch experimentelle Messungen heranziehen kann. Hierzu genügen relativ grobe Messungen der Ausgangsamplitude und der Phase einer Strecke bei sinusförmigem Eingang. Ein gewisser Nachteil der Frequenzgang-Methoden besteht allerdings darin, dass die grundlegende Theorie ein breites Wissen bezüglich der komplexen Rechnung voraussetzt.
122
6.1.1
6 Entwurf linearer Regelkreise
Frequenzantwort
In diesem Abschnitt wird zunächst gezeigt, wie ein lineares System auf eine sinusförmige Eingangsfunktion reagiert; diese Reaktion des Systems wird als Frequenzantwort bezeichnet. Außerdem soll gezeigt werden, wie man die Frequenzantwort aus der Lage der Pole und Nullstellen der Übertragungsfunktion erhält. Wird ein System durch die Übertragungsfunktion F (s) =
Y (s) U (s)
beschrieben, wobei u(t) Eingangsgröße und y(t) Ausgangsgröße ist, so erhält man mit u(t) = U0 · sin ωt U (s) = U0 ·
s2
bzw. im Laplace-Bereich
ω + ω2
die Laplace-transformierte Ausgangsgröße zu Y (s) = F (s) · U0
s2
ω . + ω2
Die Partialbruchzerlegung obiger Gleichung wird dann im allgemeinen Fall zu Y (s) =
c0∗ c1 c2 cn c0 + + ... + + + s + s1 s + s2 s + sn s + jω s − jω
(6.1)
wobei s1 , s2 , . . . , sn die Pole der Übertragungsfunktion F (s) sind; c0 erhält man durch Anwenden der Partialbruchzerlegung, c0∗ ist die konjugiert komplexe Größe zu c0 . Die zu Y (s) korrespondierende Zeitfunktion y(t) wird zu y(t) = c1 · e−s1 t + c2 · e−s2 t + . . . + cn · e−sn t + 2 · |c0 | · sin(ωt + Φ)
(6.2)
mit Φ = arctan
Im(c0 ) . Re(c0 )
Für stabile Systeme müssen definitionsgemäß alle Pole si einen negativen Realteil haben. In diesem Fall verschwinden mit zunehmender Zeit die Eigenbewegungen und als stationäre Ausgangsgröße verbleibt nur noch die am Eingang angelegte Sinusfunktion gemäß Gl. (6.2). Das Bild 6.2 zeigt zum Beispiel die Antwortfunktion eines Systems mit der Übertragungsfunktion 1 F (s) = s+1 mit dem Eingangssignal u(t) = 1 V sin(ωt) = sin(10 t).
6.1 Regelkreis-Synthese im Bode-Diagramm
123
Bild 6.2: Sinusantwort eines proportionalen Verzögerungsgliedes erster Ordnung
Man sieht in diesem Bild deutlich, wie die reelle Lösung e−t über der Zeit verschwindet und im stationären Zustand nur noch die von der Anregung herrührende Sinusfunktion verbleibt. Der verbleibende Sinusterm in Gl. (6.2) kann ausgedrückt werden als y(t) = U0 · A(ω) · sin(ωt + Φ)
mit
A(ω) = |F (jω)| = |F (s)||s=jω
und
Φ = arctan
Im(F (jω)) . Re(F (jω))
Die Gl. (6.2) zeigt, dass ein lineares, stabiles System mit der Übertragungsfunktion F (s), angeregt durch ein sinusförmiges Signal der Amplitude 1 V und der Frequenz ω, im stationären Zustand wieder ein sinusförmiges Ausgangssignal mit der gleichen Frequenz ω, mit der Amplitude A(ω) und Phase Φ(ω) liefert. In dieser Tatsache drückt sich die Linearität des Übertragungssystems F (s) aus. Bei nicht linearen oder diskreten Systemen kann das Ausgangssignal eine andere Frequenz als das Eingangssignal haben. Die Amplitude A(ω) erhält man aus |F (jω)|; die Phase Φ(ω) ist gegeben durch arg(F (jω)). 6.1.2
Die Bode-Plot-Technik
Die Aufzeichnung der Frequenzantwort geht besonders auf Arbeiten von Bode in den Jahren 1932 bis 1942 zurück. Dabei wird die frequenzabhängige Verstärkung logarithmisch und die Phase linear über der logarithmisch geteilten Frequenz ω aufgezeichnet. Diese Methode
124
6 Entwurf linearer Regelkreise
erlaubt die Zeichnung von Frequenzgängen F (jω) hoher Ordnung durch einfache grafische Addition der einzelnen logarithmischen Frequenzgänge. Man sieht die Möglichkeit der Addition aus folgendem Ansatz. Es sei F (jω) =
|F1 | · ejϕ1 · |F2 | · ejϕ2 F1 (jω) · F2 (jω) = |F3 | · ejϕ3 F3 (jω) =
|F1 | · |F2 | |F3 |
· ej(ϕ1 +ϕ2 −ϕ3 )
(6.3)
Aus Gl. (6.3) ist zu sehen, dass zur Bestimmung der Phase des gesamten Systems die Phasen der einzelnen Übertragungsfunktionen lediglich zu addieren sind. Weiterhin wird wegen |F (jω)| =
|F1 | · |F2 | |F3 |
log10 |F (jω)| = log10 |F1 | + log10 |F2 | − log10 |F3 | der Logarithmus der Verstärkung des Gesamtsystems zur Addition der Logarithmen der einzelnen Terme. Die Behandlung von Systemen mit der Bode-Plot-Technik beinhaltet also folgende Vorteile: 1. Die Reihenschaltung von Systemen wird bei der logarithmischen Darstellung zurAddition. 2. Durch die logarithmische Darstellung kann ein großer Frequenzbereich des Systemverhaltens bequem aufgezeichnet werden. 3. Bode-Diagramme kann man auch experimentell ermitteln. 4. Die Reglerdimensionierung kann vollständig mit dem Bode-Diagramm durchgeführt werden. In den bisherigen Kapiteln wurde die Übertragungsfunktion des offenen Regelkreises vorwiegend in der Pol-Nullstellen-Form Fo (s) = k0 ·
(s − sN1 )(s − sN2 ) . . . (s − sP1 )(s − sP2 ) . . .
(6.4)
geschrieben, weil in dieser Darstellung am einfachsten mit Hilfe der Wurzelortskurve der Grad der Stabilität ermittelt werden kann. Bei der Aufzeichnung von Bode-Diagrammen wird der Laplace-Operator s mit jω ersetzt und die Übertragungsfunktion in die Bode-Normalform Fo (jω) = K ·
(1 + jωT1 )(1 + jωT2 ) . . . (1 + jωTa )(1 + jωTb ) . . .
(6.5)
überführt, wobei der Faktor K in dieser Form direkt der Verstärkung bei kleinen Frequenzen entspricht.
6.1 Regelkreis-Synthese im Bode-Diagramm
125
Alle bei regelungstechnischen Belangen auftretenden Frequenzgänge sind aus drei Klassen von Termen zusammengesetzt: 1. K · (jω)n ; 2. (1 + jωT )±1 ;
2 jω jω 3. 1 + 2d . + ω0 ω0 Zunächst soll die Aufzeichnung der einzelnen Terme diskutiert werden und anschließend die Vorgehensweise bei der Aufzeichnung des Bode-Diagramms, wenn davon entsprechende Kombinationen auftreten. 1. K · (jω)n wegen log K (jω)n = log K + n · log |jω| ist der Amplitudengang (Betragskennlinie) dieses Ausdrucks eine Gerade mit der Steigung n. Der Graph des Amplitudengangs für obigen Ausdruck ist am bequemsten zu zeichnen, wenn man zunächst an der Stelle ω = 1 den Ordinatenwert log K aufträgt und dann eine Gerade mit der Steigung n durch diesen Punkt zieht. Wird der Amplitudengang A(ω) in dB aufgetragen, dann entspricht dies einer Steigung von n·20 dB/Dekade. Der Phasengang ϕ(ω) beträgt n·90◦ ; er ist unabhängig von der Frequenz und somit eine horizontale Gerade: ϕ(ω) = −90◦
für n = −1;
ϕ(ω) =
−180◦
für n = −2;
ϕ(ω) =
+90◦
für n = +1,
und so weiter. 2. (1 + jωT ) Der Amplitudengang dieses Terms nähert sich für sehr kleine und sehr große Frequenzen jeweils einer Asymptote, die man in der Regel als Geraden-Näherung bezeichnet: • •
Für ωT 1 wird 1 + jωT ≈ 1. Für ωT 1 wird 1 + jωT ≈ jωT .
Aus dieser Betrachtung geht hervor, dass der Amplitudengang für Frequenzen unterhalb bzw. weit unterhalb der so genannten Eckfrequenz ωe = 1 T eine Konstante ist, während er für Frequenzen oberhalb der Eckfrequenz eine Steigung von 20 dB/Dekade aufweist. Das Beispiel im Bild 6.3 mit F (s) = 1 + 10 s zeigt, dass sich beide Asymptoten bei der Eckfrequenz schneiden. Der Verlauf des Phasengangs kann ebenso einfach konstruiert werden, wenn man die Asymptoten bei kleinen und großen Frequenzen bestimmt:
126
6 Entwurf linearer Regelkreise
Bild 6.3: Amplituden- und Phasengang für F (s) = 1 + 10 s
• •
für ωT 1: arg(1 + jωT ) ≈ 0◦ für ωT 1: arg(1 + jωT ) ≈ 90◦
•
für ωT = 1: arg(1 + jωT ) = 45◦ .
Es sollte insbesondere darauf hingewiesen werden, dass kein nennenswerter Fehler auftritt, wenn man den exakten Verlauf des Phasen- und Amplitudengangs mit der wesentlich einfacher zu konstruierenden Geraden-Näherung ersetzt.
2 ±1 jω jω 3. 1 + 2d + ω0 ω0 Dieser Term ist in etwa mit dem zweiten Fall zu vergleichen. Der Unterschied besteht jedoch darin, dass der Amplitudengang ab der Stelle ω = ω0 bei einem positiven Exponenten des Klammerausdrucks eine Steigung von +40 dB/Dekade bzw. −40 dB/Dekade bei einem negativen Exponenten annimmt. Der Phasenwechsel beträgt entsprechend ±180◦ , die Steigung des Phasengangs im Punkt ω0 hängt von der jeweiligen Dämpfung d ab. Das Bild 6.4 zeigt den Amplituden- und Phasengang für verschiedene Dämpfungsgrade für den Fall
6.1 Regelkreis-Synthese im Bode-Diagramm
127
2 −1 Bild 6.4: Betrag und Phase von 1 + j · 2d ωω0 + j · ωω0
−1
ω ω 2 1 + j · 2d + j· : ω0 ω0
In diesem Bild ist unschwer zu erkennen, dass die Asymptote des Amplitudengangs für Frequenzen oberhalb der Eigenfrequenz ω0 eine Steigung von −40 dB/Dekade aufweist und an der Stelle ω = ω0 ausschließlich vom Dämpfungsgrad abhängig ist. Diese Feststellung geht im Übrigen auch aus der folgenden Gleichung hervor: 1 |F (jω)| = 2d ω=ω0 Für den Verlauf der Phasenkurve existiert jedoch keine derartige Gleichung. Sehr aufschlussreich ist nun der Vergleich des Frequenzverhaltens gemäß Bild 6.4 mit dem transienten Verhalten gemäß Bild 5.5. Die Kurven des transienten Verhaltens (Bild 5.5) sind bezüglich der
128
6 Entwurf linearer Regelkreise
Abszisse auf ω0 t bezogen. Aus dem Frequenzverhalten ist zu sehen, dass ω0 die Grenzfrequenz und überschlägig die Bandbreite ist; also die Frequenz, bei der die Verstärkung vom Wert des Niederfrequenzverhaltens abzufallen beginnt. Somit kann die Anstiegszeit mit Hilfe der Bandbreite abgeschätzt werden. Ferner kann man feststellen, dass für d < 0, 5 die maximale 1 Überschwingweite im Frequenzbereich proportional zu 2d ist. Die maximale Überschwingweite der Sprungantwort kann wiederum mit Hilfe der Überschwingweite des Amplitudengangs an der Stelle ω = ω0 ermittelt werden. Somit ist zu sehen, dass im Frequenzverhalten exakt die gleiche Information enthalten ist wie im transienten Verhalten der entsprechenden Zeitfunktion. Beispiel 6.1: Um mit der Konstruktion des Bode-Diagramms vertraut zu werden, sollen derAmplitudengang A(ω) und der Phasengang ϕ(ω) folgender Übertragungsfunktion konstruiert werden: 200 · (s + 0,5) (6.6) F (s) = s · [(s + 10)(s + 50)] s=jω Schritt 1:
F (s) in die Form der Gl. (6.5), d.h. in die so genannte Bode-Form umwandeln.
ω 0,2 1 + j 0,5 (6.7) F (jω) = ω ω jω 1 + j · 1+j 10 50
Schritt 2:
Der separate Term jω im Nenner ist erster Ordnung, also liefert der entsprechende Beitrag bez. des Amplitudengangs ein Gefälle von 20 dB/Dekade. Damit wird die Asymptote für niedrige Frequenzen (im gegebenen Beispiel für ω < 0,5, weil an der Stelle ω = 0,5 eine Eckfrequenz liegt) durch folgenden Term bestimmt: F (jω) =
2 . jω
(6.8)
Der Amplitudengang dieses Terms hat die Steigung −1 bzw. −20 dB/Dekade. Schritt 3: Die weiteren Asymptoten erhält man mit einer Linie der Steigung null, die bei ω = 0,5 die Gerade kleiner Frequenzen schneidet. Die nächste Gerade mit der Steigung −1 bzw. −20 dB/Dekade schneidet die oben mit der Steigung null konstruierte Gerade im Punkt ω = 10. Schließlich entsteht noch eine Asymptote mit der Steigung −2 bzw. −40 dB/Dekade, die diejenige mit der Steigung −1 im Punkt ω = 50 schneidet. Schritt 4: Der Verlauf des Amplitudengangs mit Hilfe der Geraden-Näherung entsteht nun dadurch, dass man den Asymptotenverlauf in den Knickpunkten um 3 dB nach oben bzw. unten korrigiert und die im Schritt 4 ermitteltenAsymptoten einzeichnet. Schritt 5: Weil die Phase des Integrators, siehe Gl. (6.8), konstant −90◦ ist, beginnt der Phasengang des gegebenen Beispiels für kleine Frequenzen in der Umgebung von −90◦ .
6.1 Regelkreis-Synthese im Bode-Diagramm
129
Bild 6.5: Amplituden- und Phasengang gemäß Gl. (6.6)
Schritt 6: Diese Überlegungen ergeben schließlich den im Bild 6.5 wiedergegebenen Amplituden- und Phasengang des betrachteten Beispiels. 6.1.3
Bestimmung des stationären Fehlers im Bode-Diagramm
Im Abschnitt 3.4 wurde gezeigt, dass der stationäre Fehler eines geregelten Systems in gleichem Maße abnimmt wie die Verstärkung der Übertragungsfunktion des offenen Regelkreises bei kleinen Frequenzen zunimmt. Aus dem obigen Beispiel ist zu sehen, dass der asymptotische Verlauf des Amplitudengangs für kleine Frequenzen durch die Gleichung Fo (jω) = Ko · (jω)n
(6.9)
gegeben ist. Daraus folgt wiederum, dass der stationäre Fehler des geschlossenen Kreises umso kleiner ist, je größer die Verstärkung bei niedrigen Frequenzen wird. Für ein System mit dem Grad n = 0 hat die Asymptote für kleine Frequenzen einen horizontalen Verlauf und die Verstärkung Ko . Damit wird die Positions-Fehlerkonstante KP mit der Verstärkung Ko des offenen Kreises identisch. Also formal ausgedrückt:
130
6 Entwurf linearer Regelkreise
KP = lim Fo (jω) ω→0
(6.10)
Bei direkter Rückführung und sprungförmigem Sollwerteingang ergab sich in Abschnitt 3.4 der stationäre Fehler zu est =
1 . 1 + KP
Für ein System mit n = −1 zeigt (siehe Gl. (6.9)) die Asymptote des Amplitudengangs für kleine Frequenzen ein Gefälle von −1 bzw. −20 dB/Dekade. Der asymptotische Amplitudengang für kleine Frequenzen ist gemäß Gl. (6.10) mit der Verstärkung Ko verbunden: Wegen 20 log |Fo (jω)| = 20 log Ko − 20 log ω kann man Ko wieder direkt vom Amplitudengang des Bode-Diagramms ablesen. Im Abschnitt 3.4 wird gezeigt, dass die Geschwindigkeits-Fehler-Konstante Kv gleich der Verstärkung des offenen Regelkreises für den Fall (n = −1) ist, also Kv = lim ω · Ao (ω) ω→0
(6.11)
Für ein System mit direkter Rückführung und rampenförmigem Eingang ergibt sich bekanntlich der stationäre Fehler zu est =
1 . Kv
Die einfachste Art, den Wert von Kv und damit den stationären Fehler zu bestimmen, besteht darin, den asymptotischen Amplitudengang niedriger Frequenzen an der Stelle ω = 1 sec−1 abzulesen. In manchen Fällen kann die unterste Eckfrequenz auch unterhalb ω = 1 sec−1 liegen. In diesen Fällen wird die Asymptote bis ω = 1 sec−1 durchgezogen, um Kv direkt ablesen zu können. Eine alternative Bestimmung von Kv besteht darin, den Amplitudengang an einer beliebigen Frequenz auf der Niederfrequenzasymptote abzulesen und Kv gemäß Gl. (6.11) zu berechnen. Beispiel 6.2: Als Beispiel zur Bestimmung des stationären Fehlers sei der Amplitudengang eines offenen Regelkreises gemäß Bild 6.6 gegeben. Der Amplitudengang zeigt für niedrige Frequenzen ein Gefälle von 20 dB/Dekade. Die Verlängerung der Asymptote bei kleinen Frequenzen schneidet an der Stelle ω = 1 sec−1 den Wert A(ω) = 20 dB ab. Somit ist Kv = 10 und der stationäre Fehler beträgt bei direkter Rückführung und rampenförmigem Sollwert est =
1 1 = = 0,1. Kv 10
6.1 Regelkreis-Synthese im Bode-Diagramm
Bild 6.6: Bestimmung von Kv im Bode-Diagramm
6.1.4
131
Spezifikation der Bandbreite
Eine sehr nahe liegende Spezifikation im Frequenzbereich ist die Bandbreite. Bei sinusförmigem Sollwerteingang ist die Bandbreite als die Kreisfrequenz definiert, bei der das Ausgangssignal auf den 0,707fachen Wert (3 dB Abfall) gegenüber kleinen Frequenzen abgefallen ist. Die Bandbreite ist ein Maß für die Reaktionsgeschwindigkeit des Systems und hat etwa dieselbe Aussage wie die Anstiegszeit im Zeitbereich oder die Eigenfrequenz ω0 im s-Bereich bei einer Dämpfung von d = 0,707. Für andere Dämpfungswerte ist diese Aussage allerdings bezüglich ω0 mit einem entsprechenden Fehler behaftet. 6.1.5
Zusammenhang zwischen Phasenrand und Dämpfung
Die Dämpfung des Einschwingvorgangs der Regelgröße ist eng mit dem Phasenrand ϕr des offenen Regelkreises verbunden. Diesen Zusammenhang kann man für PT2 -Führungsverhalten des geschlossenen Regelkreises folgendermaßen angeben: Aus dem allgemeinen Zusammenhang FW (s) =
Fo (s) 1 + Fo (s)
132
6 Entwurf linearer Regelkreise
erhält man die Übertragungsfunktion des offenen Regelkreises zu Fo (s) =
FW (s) . 1 − FW (s)
(6.12)
Setzt man für den geschlossenen Regelkreis FW (s) PT2 -Verhalten an, also FW (s) =
1 , 2d 1 2 1+ s + 2s ω0 ω0
(6.13)
dann wird die Übertragungsfunktion des offenen Regelkreis zu Fo (s) =
1 . 2d 1 s + 2 s2 ω0 ω0
Mit s = jω erhält man den zugehörigen Frequenzgang zu Fo (jω) = j
ω ω0
1
2d + j
ω ω0
.
(6.14)
Betrag und Phase des offenen Regelkreises sind somit gegeben durch 1 |Fo (jω)| = $ (6.15)
2 und ω ω · 4d 2 + ω0 ω0
ω ϕo (jω) = −π 2 − arctan . (6.16) ω0 2d Die Durchtrittsfrequenz ωD , definiert durch die Bedingung |Fo (jωD )| = 1, erhält man aus Gl. (6.15) in bezogener Form zu ωD = −2d 2 + 4d 4 + 1. (6.17) ω0 Den Phasenrand ϕr = π + ϕo (ωD ) erhält man durch Einsetzen der Gl. (6.17) in Gl. (6.16) zu 1 ϕr = π 2 − arctan −2d 2 + 4d 2 + 1 . 2d Dieser Zusammenhang ist für 0 ≤ d ≤ 2 im folgenden Bild dargestellt.
(6.18)
6.1 Regelkreis-Synthese im Bode-Diagramm
133
Bild 6.7: Phasenrand in Abhängigkeit der Dämpfung bei PT2 -Verhalten
6.1.6
Zusammenhang zwischen Phasengang und Amplitudengang
Einer von Bodes wichtigsten Beiträgen ist sein so genanntes erstes Theorem: Für jedes stabile Minimalphasensystem (Systeme mit Pol- und/oder Nullstellen nur in der linken s-Halbebene) steht der Phasengang arg(F (jω)) in direkter Beziehung zum Amplitudengang A(ω) des als bekannt vorausgesetzten Frequenzgangs F (jω) des Systems. Wenn die Steigung des Amplitudengangs A(ω) = 20 log |F (jω)| auf einfach logarithmischem Papier einen konstanten Wert von n · 20 dB/Dekade annimmt, dann lautet die entsprechende Beziehung für den Phasengang arg(F (jω)) ≈ n · 90◦ ,
mit
n = 0, ±1, ±2 . . . .
(6.19)
Wenn man z.B. zum Vergleich den Amplitudengang im Bild 6.8 betrachtet, so kann man sehen, dass Gl. (6.19) auf die jeweils eine Dekade vom Steigungswechsel entfernten Frequenzen ω1 = 0,1 und ω2 = 10 anwendbar ist. Man erhält somit als Maximalphase einmal −180◦ (für kleine Frequenzen) bzw. −90◦ (für hohe Frequenzen). Der Verlauf des exakten Phasengangs zeigt, dass die Approximation in der Tat recht gut ist. Außerdem kann man sehen, dass diese Näherung an Qualität verliert, wenn man die Bewertung bei Frequenzen ansetzt, die relativ nahe am Steigungswechsel (im Bild 6.8 an der Stelle ω = 1) liegen. Die Gl. (6.19) wird zur Bestimmung der Stabilität unter ausschließlicher Verwendung von |F (jω)| allein herangezogen. Wenn |Fo (jω)| = 1,
134
6 Entwurf linearer Regelkreise
Bild 6.8: Darstellung der Amplituden-/Phasen-Beziehung
dann ist für n = −1
arg(Fo (jω)) ≈ −90◦
und für n = −2
arg(Fo (jω)) ≈ −180◦ .
Des Weiteren muss für stabile Systeme gelten: arg(Fo (jω)) > −180◦ an der Stelle |Fo (jω)| = 1 oder damit gleichbedeutend ϕr > 0. Somit muss durch die Reglereinstellung der Amplitudengang Ao (ω) = 20 log |Fo (jω)| so getrimmt werden, dass er an der Durchtrittsfrequenz ωD , also an der Stelle |Fo (jω)| = 1, eine Steigung von −1 bzw. −20 dB/Dekade aufweist. Wenn das Gefälle des Amplitudengangs eine Dekade oberhalb und unterhalb der Durchtrittsfrequenz 20 dB/Dekade ist, dann beträgt der Phasenrand etwa 90◦ , der jedoch im Hinblick auf das dann schlechte dynamische Verhalten des Systems schon zu groß ist. Für ein gutes Einschwingverhalten (ϕr ca. 30◦ bis 70◦ ) reicht es in der Regel dafür Sorge zu tragen, dass ein Gefälle von −20 dB/Dekade genügt, wobei die Durchtrittsfrequenz ωD innerhalb dieser Dekade mittig liegt.
6.1 Regelkreis-Synthese im Bode-Diagramm
135
Beispiel 6.3: Um die Qualität dieser Vorgehensweise aufzuzeigen, soll diese Methode der RegelkreisSynthese auf die Regelung des Anstellwinkels einer Rakete angewandt werden. Dabei besteht die Aufgabe darin, einen geeigneten Regler mit der noch unbekannten Übertragungsfunktion FR (s) zu finden, der eine gute Dämpfung und eine Bandbreite von etwa 0,2 rad/sec gewährleistet.
Bild 6.9: Beispiel-Definition
Das Bode-Diagramm im Bild 6.10 zeigt zunächst den Amplituden- und Phasengang der ungeregelten Strecke. Wie man leicht einsieht, muss durch den Regler der Amplitudengang des Systems modifiziert werden, da er ein Gefälle von −40 dB/Dekade über den gesamten Frequenzbereich aufweist und damit bei Verwendung eines Proportional-Reglers instabiles Regelverhalten aufweisen würde.
Bild 6.10: Amplituden- und Phasengang der bloßen Strecke
136
6 Entwurf linearer Regelkreise
Bild 6.11: Bode-Diagramm des offenen Regelkreises
Die einfachste Kompensationsmethode für Strecken mit integrierendem Verhalten besteht in der Verwendung eines PD-Reglers mit der Übertragungsfunktion FR (s) = KR (1 + sTv ), also eines phasenanhebenden Übertragungsgliedes. Dabei wird die Verstärkung KR so eingestellt, dass die gewünschte Bandbreite eingehalten wird, während die Eckfrequenz ω1 = 1 Tv so gewählt wird, dass ein Gefälle von −1 bzw. −20 dB/Dekade bei der Durchtrittsfrequenz erreicht wird. Mit relativ guter Näherung kann man davon ausgehen, dass die Durchtrittsfrequenz ωD mit der Bandbreite des geschlossenen Regelkreises übereinstimmt (was am Ende des Beispiels auch gezeigt wird). Der Syntheseprozess, der das Ziel hat, die spezifizierten Forderungen einzuhalten, ist nun sehr einfach: Die Verstärkung KR ist auf einen solchen Wert einzustellen, bei dem in Verbindung mit der Regelstrecke eine Durchtrittsfrequenz von 0,2 rad/sec erreicht wird. Die Eckfrequenz ω1 ist etwa um den Faktor 1/4 unterhalb der Durchtrittsfrequenz zu legen, damit das notwendige Gefälle von 20 dB/Dekade in der Umgebung der Durchtrittsfrequenz ωD entsteht.
6.1 Regelkreis-Synthese im Bode-Diagramm
137
Bild 6.12: Regelgröße für w(t) = ε(t)
Im Folgenden sind noch einmal die durchzuführenden Schritte zusammengestellt: 1. Aufzeichnen des Amplitudengangs A(ω) = 20 log |FS (jω)| der Strecke; 2. ωb/ 4 ≈ ω1 = 1 Tv (hier = 0,05) berechnen; 3. Gefälle des Amplitudengangs A(ω) von 20 dB/Dekade an der Stelle ω1 ansetzen; 4. KR so, dass an der Stelle ω = ωD (hier = 0,2) |FS (jω)| = 1 bzw. A(ω) = 0 dB wird; im gegebenen Beispiel ergibt sich damit KR = 1 100. Die oben erklärte Vorgehensweise zur Reglerauslegung ist im Bild 6.11 der Deutlichkeit wegen noch einmal dargestellt. Die gesuchte Übertragungsfunktion des Reglers lautet somit FR (s) = 0,01 · (1 + 20 s), womit das Syntheseproblem abgeschlossen ist. Um einen Eindruck von der Qualität dieses Syntheseverfahrens zu bekommen, ist schließlich im Bild 6.12 die Regelgröße y(t) für einen sprungförmigen Sollwert, d.h. w(t) = ε(t) wiedergegeben: Anhand von Bild 6.11 kann man im Übrigen deutlich feststellen, dass der Phasenrand des auf diesem Wege konzipierten Regelkreises 75◦ beträgt, der bekanntlich für ein gut gedämpftes Einschwingverhalten bürgt. Bild 6.13 stellt schließlich denAmplitudengang des geschlossenen Regelkreises dar, also Fo (jω) . A(ω) = 20 log 1 + Fo (jω)
138
6 Entwurf linearer Regelkreise
Bild 6.13: Frequenzverhalten des geschlossenen Regelkreises
Wie man sieht, sind in der Tat die Durchtrittsfrequenz ωD und die Bandbreite ωb nahezu identisch. 6.1.7
Kompensationsmethode
Wenn die Dynamik des zu regelnden Prozesses von einer Art ist, dass ein zufrieden stellendes Einschwingverhalten der Regelgröße nicht mehr durch die Vorschaltung eines bloßen Verstärkers als Regler erreicht werden kann, wird eine Modifikation der Prozessdynamik notwendig. Man spricht in solchen Fällen von der Kompensation von Regelkreisen. Von der Vielzahl der Möglichkeiten haben sich besonders die Lead- und die Lag-Kompensation als sehr nützlich für die Beeinflussung des Regelverhaltens erwiesen. Das Lead-Netzwerk und der PD-Regler erhöhen hauptsächlich die Bandbreite und erniedrigen damit die Anstiegszeit und die maximale Überschwingweite. Das Lag-Netzwerk und der PI-Regler erhöhen vor allem die Verstärkung bei kleinen Frequenzen und verbessern so die stationäre Genauigkeit des Regelkreises. Die im Folgenden zu besprechenden Kompensationsregler haben also den Zweck, die Stabilität, das dynamische Verhalten sowie die stationäre Genauigkeit von Regelkreisen zu be-
6.1 Regelkreis-Synthese im Bode-Diagramm
139
einflussen. Die Übertragungsfunktion und das Bode-Diagramm des jeweiligen Reglertyps wurden bereits in Abschnitt 2.2 behandelt. PD-Kompensation Die Übertragungsfunktion des PD-Reglers lautet bekanntlich FR (s) = KR (1 + sTv ).
(6.20)
Der stabilisierende Einfluss dieses Reglertyps ergibt sich durch die Phasenanhebung für Fre quenzen oberhalb der Eckfrequenz 1 Tv . Bei technischen Anwendungen wird diese Eckfrequenz mit der Zielsetzung festgelegt, dass in der Umgebung der Durchtrittsfrequenz ωD eine Phasenanhebung entsteht und somit der Phasenrand erhöht wird. Es sollte aber auch beachtet werden, dass die Verstärkung des PD-Reglers mit steigender Frequenz wächst. Diese Eigenschaft bringt den Nachteil mit sich, dass hochfrequente Rauschsignale mit verstärkt werden, die typischerweise in jedem realen System vorhanden sind. Aus diesem Grund wird der echte PD-Regler gemäß Gl. (6.20) in der Praxis nur selten angewandt. Lead-Kompensation Um die oben erwähnte Empfindlichkeit des PD-Reglers gegenüber Rauschsignalen herabzusetzen, wird der bloße PD-Regler gemäß Gl. (6.20) mit einer Polstelle erster Ordnung ergänzt, die bei wesentlich höheren Frequenzen als die des Zählers (−1 Tv ) liegt. Damit wird die gewünschte Phasenanhebung („lead“) bezweckt, aber die Verstärkung hoher Frequenzsignale limitiert. Die Übertragungsfunktion des Lead-Netzwerks lautet somit FR (s) = KR · KR Tv
1 + sTv 1 + αsTv
(6.21)
Reglerverstärkung Differenzierzeit, α < 1.
Beispiel 6.4: Als Beispiel zur Dimensionierung eines Lead-Kompensators gemäß Gl. (6.21) gehen wir aus von einer zu regelnden IT1 -Strecke mit der Übertragungsfunktion FS (s) =
1 . s(s + 1)
(Der Einfachheit wegen und ohne Verlust auf Allgemeingültigkeit wurden für die Systemparameter nur einfache Zahlenwerte gewählt). Die Forderungen an den geschlossenen Regelkreis sollen darin bestehen, dass der stationäre Fehler für rampenförmigen Sollwerteingang kleiner als 10 % vom Sollwert ist. Weiterhin darf die maximale Überschwingweite 25 % der Führungsgröße nicht überschreiten.
140
6 Entwurf linearer Regelkreise
Lösung: Der stationäre Fehler ist bekanntlich gegeben zu 1 · W (s), est = lim s s→0 1 + Fo (s)
wobei W (s) = 1 s 2 für die Einheitsrampe ist. Damit wird est = lim s→0
1 = FR (0) . 1 s + FR (s) · s+1 1
Entsprechend der Aufgabenstellung est ≤ 0, 1 darf FR (s = 0) = KR nicht kleiner als 10 sein, um die Forderung bezüglich der stationären Genauigkeit einzuhalten; es gilt also für Gl. (6.21) die Bedingung KR = 10. Um einen Bezug zwischen der maximal zulässigen Überschwingweite und dem notwendigen Phasenrand herzustellen, liest man aus Bild 5.6 die zugehörige Dämpfung ab und mit dieser gewonnenen Dämpfung geht man wiederum in Bild 6.7, um den zugehörigen Phasenrand zu bestimmen. (Im Übrigen wäre auch aus Bild 6.7, allerdings mit bedeutend geringerer Genauigkeit, sofort der notwendige Phasenrand für eine zulässige Überschwingweite abzulesen.) Aus beiden aufgezeigten Strategien folgt, dass für eine zulässige Überschwingweite von 25 % ein Phasenrand von etwa 45◦ erforderlich ist. Das Bode-Diagramm im Bild 6.14 zeigt bei der Verwendung eines bloßen P-Reglers mit Fo = KR · FS (jω), dass nur ein Phasenrand von etwa 20◦ besteht, wenn man keine Phasenanhebung (phase-lead) hinzufügen würde. Wenn es jedoch möglich wäre, nur die Phase anzuheben ohne den Amplitudengang zu beeinflussen, so bräuchte man lediglich 20◦ zur Phase von KR · FS (jω) bei der Durchtrittsfrequenz ωD = 3 rad/sec hinzufügen (siehe hierzu Bild 6.14). Die Beibehaltung der gleichen Niederfrequenz-Verstärkung KR und das Hinzufügen einer Kompensatornullstelle hebt jedoch auch die Durchtrittsfrequenz an, somit sind vom LeadNetzwerk mehr als 20◦ Phasenanhebung notwendig. (Durch das Lead-Netzwerk wird ja auch die Verstärkung angehoben!) Um auf der sicheren Seite zu liegen, wird deshalb der LeadKompensator so ausgelegt, dass er eine maximale Phasenanhebung von etwa 40◦ bewirkt. Nach einigen Versuchen – neudeutsch: trial and error – kann man feststellen, dass mit einer Differenzierzeit Tv = 0,5 sec,
α=1 5
und damit αTv =
1 1 1 · = sec 5 2 10
6.1 Regelkreis-Synthese im Bode-Diagramm
141
Bild 6.14: Bode-Diagramm des offenen Kreises mit nur einem proportionalen Regler
die eingangs gestellte Forderung bezüglich der Überschwingweite von 25 % optimal erfüllt wird. Die Übertragungsfunktion des Lead-Reglers lautet damit endgültig 1+s 2 . FR (s) = 10 · 1 + s 10 Das folgende Bode-Diagramm zeigt noch einmal den nun ausgelegten und fertigen Regelkreis auf; insbesondere im Vergleich zu Bild 6.14, bei dem nur die Reglerverstärkung KR festgelegt war. Zusammengefasst sieht die am Beispiel gezeigte Vorgehensweise folgendermaßen aus: 1. Bestimmung der Niederfrequenz-Verstärkung mit Hilfe der Spezifikation des stationären Fehlers; 2. Kombination des Lead-Faktors 1 α und der Lage der Nullstelle (1 Tv ), damit bei der Durchtrittsfrequenz ein akzeptabler Phasenrand verbleibt. Diese Vorgehensweise kann auf viele praktische Beispiele angewandt werden. Im obigen Fall wurden die maximale Überschwingweite und der stationäre Fehler spezifiziert. Dabei rechnete man die Überschwingweite in einen entsprechenden Phasenrand, um eine Behandlung der Aufgabe im Bode-Diagramm zu ermöglichen. Aus dem geforderten maximalen Fehler wurde
142
6 Entwurf linearer Regelkreise
Bild 6.15: Amplituden- und Phasengang des kompensierten Regelkreises
über den Endwertsatz direkt die Reglerverstärkung KR ermittelt. Den Amplitudenrand bei der Reglerdimensionierung zu verwenden ist hier nicht sinnvoll, weil die Phase des offenen Kreises nirgendwo die −180◦ -Grenze überschreitet. Das folgende Bild zeigt schließlich noch die Sprungantwort des so konzipierten Regelkreises. Wie man sieht, zeigt die Regelgröße durchaus akzeptables Einschwingverhalten.
PI-Kompensation In diesem Abschnitt geht es vordergründig um die Auslegung eines PI-Reglers im BodeDiagramm. Die Übertragungsfunktion dieses Reglertyps wird durch eine geringfügige Modifikation der in Abschnitt 2.2 aufgezeigten Form zu FR (s) =
KR (s + 1 Tn ). s
(6.22)
Der gewünschte Effekt des PI-Reglers ist die unendlich hoheVerstärkung bei der Frequenz null, weil damit für viele Anwendungsfälle der stationäre Fehler verschwindet. Dieser Vorteil wird
6.1 Regelkreis-Synthese im Bode-Diagramm
143
Bild 6.16: Regelgröße y(t) für sprungförmige Sollwertänderung
allerdings auf Kosten einer Phasenabnahme unterhalb der Eckfrequenz ω = 1 Tn erkauft. Deshalb wird die Eckfrequenz 1 Tn auf einen Wert gelegt, der wesentlich kleiner als die Durchtrittsfrequenz ωD ist, so dass der Phasenrand des Systems nur unwesentlich beeinflusst wird. Lag-Kompensation Eine Approximation des PI-Reglers ist das Lag-Netzwerk. Seine Übertragungsfunktion lautet FR (s) = KR ·
1 + sT 1 + αsT
(6.23)
mit dem Lag-Faktor α > 1. Die Form dieser Übertragungsfunktion ist zwar identisch mit dem Lead-Kompensator, aber wegen α > 1 hat die Polstelle eine niedrigere Eckfrequenz als die Nullstelle. Dadurch wird sowohl eine Anhebung der Amplitude als auch eine Absenkung der Phase für kleine Frequenzen erreicht. Diese Eigenschaft gibt diesem Kompensationsglied im Wesentlichen den Charakter eines Integrationsgliedes; nämlich eine hohe, aber nicht unendlich hohe Verstärkung im Niederfrequenz-Bereich. Beispiel 6.5: Es wird von der gleichen Strecke wie in Beispiel 6.4 ausgegangen, allerdings soll diesmal eine Lag-Kompensation vorgenommen werden. Im Bild 6.17 ist zunächst das Bode-Diagramm für den offenen Regelkreis Fo (s) = KR · FS (jω) dargestellt, wobei nunmehr sofort von KR = 10 ausgegangen werden kann, weil diese
144
6 Entwurf linearer Regelkreise
Bild 6.17: Regelkreis mit P-Regelung
Verstärkung im Beispiel 6.4 aus der Forderung nach einem stationären Fehler ≤ 0, 1 resultierte. Die Aufgabe des Regelungstechnikers besteht nun darin, die Eckfrequenzen 1 T und 1 αT so zu wählen, dass die Durchtrittsfrequenz erniedrigt wird und ein höherer Phasenrand als der mit bloßer P-Regelung von zunächst nur 20◦ resultiert. Im Interesse eines guten dynamischen Verhaltens sind der Pol und die Nullstelle des LagGliedes zu wesentlich kleineren Frequenzen zu verschieben als die neue, durch die LagKompensation entstehende Durchtrittsfrequenz. Eine mögliche Wahl der beiden Eckfrequenzen wird im folgenden anhand von Bild 6.18 gezeigt. Die Nullstelle des Lag-Gliedes wird auf 0,1 rad/sec und die Polstelle auf 0,01 rad/sec gelegt. Damit wird die zu bestimmende Übertragungsfunktion des gesuchten Reglers zu FR (s) = 100 ·
1 + s10 1 + sT = 100 · . 1 + αsT 1 + s100
Das Bode-Diagramm unter Verwendung des so konzipierten Reglers zeigt, dass mit dieser Wahl der Eckfrequenzen ein Phasenrand von etwa 50◦ erreicht und damit die geforderte Spezifikation von 45◦ eingehalten wird.
6.1 Regelkreis-Synthese im Bode-Diagramm
145
Bild 6.18: Offener Regelkreis mit Lag-Kompensation
Wichtig ist ferner darauf zu verweisen, dass die Herabsetzung der Durchtrittsfrequenz von der Verhältniszahl α (zwischen der Eckfrequenz der Kompensations-Nullstelle zur Eckfrequenz der Kompensations-Polstelle) abhängt und nicht von der absoluten Lage von Pol- und Nullstelle. Die vorteilhaften Eigenschaften der Lag-Kompensation kann man in zweifacher Weise definieren: 1. Sie reduziert die Verstärkung bei hohen Frequenzen mit der Konsequenz eines höheren Phasenrandes und sie erhöht 2. die Verstärkung bei niedrigen Frequenzen mit der Konsequenz eines besseren stationären Verhaltens. Gerade im Hinblick auf Punkt 1) sieht man aber auch sofort den Nachteil der Lag-Kompensation im Vergleich zur Lead-Kompensation, wenn man die Regelgröße y(t) für einen sprungförmigen Sollwert betrachtet: Bei einem Vergleich mit Bild 6.16 ist zu sehen, dass sich durch die Herabsetzung der Durchtrittsfrequenz von 5 rad/sec (Lead-Kompensation) auf 0,8 rad/sec (Lag-Kompensation) die Einschwingdauer etwa verzehnfacht hat. Außerdem ist die maximale Überschwingweite von etwa 18 % auf ungefähr 28 % angestiegen.
146
6 Entwurf linearer Regelkreise
Bild 6.19: Sprungantwort des konzipierten Regelkreises
PID-Kompensation Durch die Kombination der Gleichungen (6.20) und (6.22) ergibt sich der PID-Regler. Seine Übertragungsfunktion wird damit zu FR (s) =
KR 1 (1 + sTv ) · s + s Tn
(6.24)
Diese Form weicht zwar von der Darstellung in Gl. (2.18) etwas ab; es handelt sich jedoch in beiden Fällen um die Beschreibung des PID-Verhaltens. Der PID-Regler ist im Wesentlichen äquivalent zur Kombination einer Lead- und einer Lag-Kompensation, die deshalb auch manchmal als Lead-Lag-Kompensator bezeichnet wird. Beispiel 6.6: Als Beispiel zur Dimensionierung eines PID-Reglers im Bode-Diagramm soll das Problem der Fluglagenregelung einer Rakete noch einmal aufgegriffen werden. Hier wird jedoch insofern von einer realistischeren Situation ausgegangen, als eine Verzögerung im Messglied und ein Störmoment berücksichtigt werden sollen. Im Bild 6.20 ist zunächst das Blockschaltbild des zu behandelnden Systems wiedergegeben. Die Spezifikationen für den geschlossenen Regelkreis lauten: •
der stationäre Fehler wird zu null gefordert,
•
der Phasenrand soll mindestens 65◦ betragen, die Bandbreite soll möglichst groß sein.
•
6.1 Regelkreis-Synthese im Bode-Diagramm
147
Bild 6.20: Blockschaltbild des gesamten Regelkreises
Wenn das Flugobjekt eine stationäre Lage einnimmt, dann muss entsprechend Bild 6.20 die Summe der in die Strecke einlaufenden Momente, MR + Md , null sein. Wenn also das Störmoment Md von null verschieden ist, dann hat der Regler ein Moment der Größe MR = −Md zu produzieren. Die einzige Möglichkeit, diese Forderung zu erfüllen, ohne dass eine stationäre Regelabweichung verbleibt, besteht darin, dass der Regler einen integrierenden Term beinhaltet. Damit ist bereits die Notwendigkeit für den I-Anteil begründet. (Die Notwendigkeit des I-Anteils kann übrigens auch leicht durch Anwendung des Endwertsatzes der Laplace-Transformation nachgewiesen werden.) Die Übertragungsfunktion der gesamten Strecke, also Rakete einschließlich Sensor, lautet FS (s) =
0,9 2 · ; 2 s s+2
(6.25)
das zugehörige Bode-Diagramm ist im Bild 6.21 wiedergegeben. Zunächst sollte darauf hingewiesen werden, dass durch das Gefälle von −40 dB/Dekade für kleine Frequenzen bzw. −60 dB/Dekade für große Frequenzen das System Rakete plus Sensor bei der Verwendung eines Proportional-Reglers mit jeder beliebigen Verstärkung KR instabil wäre, wenn kein D-Anteil hinzugefügt werden würde, wie man unschwer in Bild 6.21 erkennen kann. Der D-Anteil im PID-Regler ist also schon allein deshalb notwendig, um das Gefälle des Amplitudengangs in der Umgebung der Durchtrittsfrequenz auf 20 dB/Dekade abzusenken. Somit besteht die Aufgabe in diesem Beispiel darin, die drei Parameter KR , Tv und Tn der Gl. (6.24) so einzustellen, dass die eingangs spezifizierten Forderungen erfüllt werden. Der einfachste Lösungsweg besteht darin, zunächst dafür zu sorgen, dass der geforderte Phasenrand von 65◦ bei möglichst hoher Frequenz erreicht wird. Dieses Ziel wird vorwiegend durch eine geschickte Einstellung der Vorhaltzeit Tv erreicht. Im Anschluss daran werden die Nachstellzeit Tn und die Reglerverstärkung KR dimensioniert:
148
6 Entwurf linearer Regelkreise
Bild 6.21: Bode-Diagramm der ungeregelten Rakete einschließlich Messglied
•
•
•
•
Für 1 Tv ≥ 2 rad/sec würde der phasenanhebende Teil des PID-Reglers die Phasennacheilung des Sensors kompensieren, so dass die Phase des gesamten offenen Kreises nirgendwo −180◦ erreichen würde. Diese Wahl der Vorhaltzeit ist insofern nachteilig, weil dann ein übergedämpftes System entstehen würde, das bekanntlich nur sehr langsam auf Sollwertänderungen oder auf Störungen reagiert. Für 1 Tv ≤ 0,01 rad/sec würde die Phase des offenen Kreises für den unteren Frequenzbereich entlang der −90◦ -Linie laufen und dann die −115◦ für einen großen Frequenzbereich überschreiten, d.h. der geforderte Phasenrand würde wieder nicht eingehalten werden können. Die Eckfrequenz 1 Tv = 0,1 rad/sec produziert den geforderten Phasenrand von 65◦ an der Durchtrittsfrequenz ωD = 0,5 rad/sec, wie man unschwer anhand von Bild 6.22 erkennen kann. Bei dieser Vorhaltzeit überschreitet nämlich die Phase des offenen Regelkreises nirgends den Wert −115◦ (entsprechend dem geforderten Phasenrand von 65◦ ). Würde man die gleiche Überlegung mit einer (wesentlich kleineren) Eckfrequenz von 1 Tv 0,05 rad/sec anstellen, so könnte man mit Hilfe des Bode-Diagramms feststellen, dass sich der Phasengang in der Umgebung der Durchtrittsfrequenz von etwa 1 rad/sec nur
6.1 Regelkreis-Synthese im Bode-Diagramm
149
Bild 6.22: Bode-Diagramm des offenen Regelkreises für KR = 1 und Tv = 10 sec
unwesentlich von der im Bild 6.22 unterscheiden würde. Dies besagt wiederum, dass der geforderte Phasenrand auch mit 1 Tv = 0,05 rad/sec erreicht werden könnte. • Somit ist 0,05 < 1 Tv < 0, 1 rad/sec der optimale Bereich für 1 Tv . Alle Werte unterhalb von 0,05 rad/sec liefern keinen signifikanten Zugewinn an Bandbreite, alle Werte oberhalb 0,1 rad/sec erfüllen nicht den spezifizierten Phasenrand. Somit wurde hier die Entscheidung für 1 Tv = 0,1 bzw. Tv = 10 sec getroffen. Bestimmung der Nachstellzeit Tn : • In Anlehnung an eine bewährte Daumenregel wird die Nachstellzeit als der zwanzigfache Wert der Vorhaltzeit gewählt, also Tn = 20Tv = 200 sec bzw. 1 Tn = 0,005 rad/sec. Der Faktor 20 ist damit begründet, dass kleinere Nachstellzeiten den Phasenrand wieder reduzieren würden. Außerdem ist es generell wünschenswert, den Amplitudengang des offenen Kreises unterhalb der Durchtrittsfrequenz so groß als möglich zu halten, weil damit ein schneller transienter Übergang und ein kleiner stationärer Fehler erreicht werden. Um beide Forderungen – also kurze und kleine stationäre Fehler – zu erreichen, Einschwingzeit hält man die Frequenzen 1 T und 1 T so groß als möglich, womit einmal mehr die Wahl v n von 1 Tv und damit 1 Tn gerechtfertigt ist.
150
6 Entwurf linearer Regelkreise
Bestimmung der Reglerverstärkung KR : • Die Reglerverstärkung KR muss so gewählt werden, dass die in den vorangegangenen Schritten ermittelte Durchtrittsfrequenz mit einem Phasenrand von 65◦ unter allen Umständen erhalten bleibt. Die grundsätzliche Vorgehensweise zur Lösung dieses Problems besteht darin, den Amplitudengang des offenen Regelkreises zunächst für KR = 1 aufzuzeichnen, den entsprechenden dB-Wert an der Durchtrittsfrequenz abzulesen und diesen Wert mit 1 KR gleichzusetzen. Im Bild 6.22 ist Ao (s) = 30 dB bei der gewünschten Durchtrittsfrequenz von 0,5 rad/sec. Somit ist 20 log KR = −30 dB und somit KR = 0,03. Damit lautet die endgültige Übertragungsfunktion des Reglers, der die einleitend aufgestellten Forderungen erfüllt: FR (s) =
0,03 [(10 s + 1)(s + 0,005)] . s
6.2
Regelkreis-Synthese mit Hilfe von Wurzelortskurven
6.2.1
Grundgedanke
Der Reglerentwurf mit Hilfe des Wurzelortskurven-Verfahrens baut unmittelbar auf den Überlegungen in den Abschnitten 5.1 und 5.2 auf. Dort wurden für den geschlossenen Regelkreis FW (s) mit einem dominanten Polpaar die Forderungen an die Überschwingweite, die Anstiegszeit und die Ausregelzeit in Bedingungen für den Dämpfungsgrad d und die Eigenfrequenz ω0 der zugehörigen Übertragungsfunktion FW (s) umgesetzt. Mit d und ω0 liegen aber gemäß Bild 5.3 direkt die dominanten Pole der Funktion FW (s) fest. Es muss also die Übertragungsfunktion des offenen Regelkreises Fo (s) so bestimmt werden, dass der geschlossene Regelkreis ein dominantes Polpaar an der gewünschten Stelle erhält, das durch die Werte von ω0 und d vorgegeben ist. Einen Ansatz dieser Art bezeichnet man in der regelungstechnischen Literatur auch als Polvorgabe. Mit dem Wurzelortskurven-Verfahren kann bekanntlich eine Aussage über die Lage der Pole des geschlossenen Regelkreises getroffen werden. Es bietet sich an, das gewünschte, dominierende Polpaar zusammen mit der Wurzelortskurve (WOK) des fest vorgegebenen Teils des Regelkreises in die s-Ebene einzutragen und durch Hinzufügen von Reglerpol- und Nullstellen in den offenen Regelkreis die WOK so zu verformen, dass zwei ihrer Äste bei einer bestimmten Verstärkung ko das gewünschte, konjugiert komplexe Polpaar schneiden. Das Bild 6.23 zeigt, wie man im Prinzip durch Hinzufügen eines Pols die WOK nach rechts bzw. durch Hinzufügen einer Nullstelle nach links „verbiegen“ kann. 6.2.2
Beispiele für den Reglerentwurf mit Hilfe von Wurzelortskurven
Beispiel 6.7: Gegeben sei eine integrierende Regelstrecke mit zwei Verzögerungen entsprechend der Übertragungsfunktion
6.2 Regelkreis-Synthese mit Hilfe von Wurzelortskurven
151
Bild 6.23: Verformen einer WOK a) nach rechts durch einen zusätzlichen Pol b) nach links durch eine zusätzliche Nullstelle im offenen Regelkreis
FS (s) =
1 . s(s + 3)(s + 5)
Für diese Regelstrecke soll ein Regler so entworfen werden, dass die Übergangsfunktion hW (t) der Regelgröße des geschlossenen Regelkreises folgende Forderungen erfüllt: • •
maximale Überschwingweite emax ≤ 16 % Anstiegszeit tr ≤ 0,6 sec
Im Zuge des Lösungsgangs müssen diese Forderungen zunächst mit Hilfe der Gleichungen (5.13) und (5.17) in Bedingungen für ω0 und d umgesetzt werden. Unter Verwendung dieser Gleichungen erhält man d ≥ 0,5 und ω0 ≥ 3,0 rad/sec. Bezugnehmend auf Bild 5.3 ist festzustellen, dass der Abstand der beiden dominanten Pole vom Ursprung gerade ω02 d 2 + (1 − d 2 )ω02 = ω0 , die Eigenfrequenz des ungedämpften Systems, und der so genannte Dämpfungswinkel sin ϕd =
ω0 d =d ω0
bzw. ϕd = arcsin d
ausschließlich eine Funktion der Dämpfung ist. Durch den Dämpfungsgrad d und die Eigenfrequenz ω0 ist damit die Lage des dominanten Polpaares eindeutig festgelegt.
152
6 Entwurf linearer Regelkreise
Bei der Synthese wird man generell versuchen, den minimal erforderlichen Dämpfungsgrad nicht unnötig zu erhöhen, weil dadurch bei einer gegebenen Eigenfrequenz ω0 auch eine Zunahme der Anstiegszeit tr resultiert. Die Erhöhung der Eigenfrequenz ω0 bringt zwar eine Vergrößerung der Regelgeschwindigkeit mit sich, man sollte aber auch diesen Parameter nicht unnötig vergrößern, weil sonst eventuell die Dominanz des Polpaares verloren gehen könnte. Das Bild 6.24 zeigt zunächst die WOK des geschlossenen Regelkreises bei Verwendung eines Proportional-Reglers. In diesem Bild sind auch die Lagen des dominierenden Polpaares auf den beiden Halbgeraden H1 und H2 eingetragen. Man erkennt hier sofort, dass die eingangs gestellten Forderungen bezüglich ω0 und d mit einem reinen P-Regler nicht erfüllt werden können, weil die WOK die beiden Halbgeraden H1 und H2 für die gewollten Lagen der dominanten Pole nicht schneidet. Ebenso wird deutlich, vor allem im Vergleich zu Bild 6.23, welche Maßnahmen man ergreifen kann, damit die beiden in Frage kommenden Äste der WOK die Halbgeraden im Arbeitspunkt, d.h. im Abstand ω0 vom Ursprung unter dem Winkel ϕd = arcsin d zur imaginären Achse der s-Ebene schneiden:
Bild 6.24: WOK der Regelstrecke mit einem P-Regler und Lage des dominanten Polpaares
Verschiebt man nämlich die beiden Pole s2 = −3 und s3 = −5 weiter nach links, so verschiebt sich auch der Wurzelschwerpunkt und damit wiederum die gesamte WOK nach links, ohne dass sich dadurch qualitativ die Struktur des Systems ändert. Eine Möglichkeit, dies mit einem einfachen phasenanhebenden Übertragungsglied (Lead-Kompensation) zu bewerkstelligen, besteht darin, den Pol s2 = −3 durch eine Reglernullstelle zu kompensieren und – im Interesse einer Linksverschiebung – in der Umgebung von −10 einen Reglerpol s4 einzufügen. Die Reglerpolstelle s4 liegt sogar eindeutig fest, wenn man darauf achtet, dass im Arbeitspunkt die Phasenbedingung erfüllt sein muss.
6.2 Regelkreis-Synthese mit Hilfe von Wurzelortskurven
153
Damit erhält man die Übertragungsfunktion des Reglers zunächst zu FR (s) = KR
s+3 s + 10
Die noch unbekannte Reglerverstärkung KR erhält man schließlich durch Anwenden der Amplitudenbedingung im Arbeitspunkt zu KR ≈ 38. Damit wird die gesamte Übertragungsfunktion des Reglers zu FR (s) = 38
s+3 . s + 10
Beispiel 6.8: In diesem Beispiel ist für eine instabile Regelstrecke mit der Übertragungsfunktion FS (s) =
1 (s + 1)(s + 5)(s − 1)
der Regler zu entwerfen. Es liegt natürlich zunächst nahe, den instabilen Pol s1 = 1 durch eine entsprechende Reglernullstelle zu kompensieren. Man könnte dies zum Beispiel durch einen Allpass erster Ordnung mit der Übertragungsfunktion FR (s) =
s−1 s+1
bewerkstelligen. Dabei ist jedoch unbedingt zu beachten, dass in der Praxis die Kompensation einer instabilen Polstelle durch eine Reglernullstelle nie exakt gelingt, weil bekanntlich die Information bezüglich der Lage der Pol- und Nullstellen immer mit einem nicht zu vermeidenden Fehler behaftet ist und deshalb aus Stabilitätsgründen auf eine solche Lösung verzichtet werden muss. Ein erster Versuch einer erfolgreichen Regelung besteht darin, als Regler einen Proportional-Regler zu verwenden; dieser liefert die Wurzelortskurve entsprechend Bild 6.25. Wie man sieht, ist der P-Regler nicht in der Lage, den Regelkreis zu stabilisieren, da die beiden rechten Äste der WOK für jede beliebige Reglerverstärkung stets in der rechten s-Halbebene verbleiben und damit instabiles Regelverhalten zeigen würden. Verwendet man jedoch einen Regler, der an der Stelle s = −1 eine doppelte Nullstelle sowie einen Pol bei s = 0 besitzt, so wird die Polstelle der Strecke bei s2 = −1 durch eine Reglernullstelle ersetzt. Dadurch bekommt die Übertragungsfunktion des Reglers die Form FR (s) = KR
(s + 1)2 . s
154
6 Entwurf linearer Regelkreise
Bild 6.25: Wurzelortskurve eines Regelkreises mit instabiler Strecke und Proportional-Regler
Diese Pol-Nullstellenverteilung ergibt den klassischen PID-Regler, wie im Folgenden gezeigt wird:
(s + 1)2 1 = KR 2 + + s bzw. FR (s) = KR s s
0,5 FR (s) = 2KR 1 + + 0,5s s Das Bild 6.26 zeigt die jetzt in den stabilen Bereich „verbogene“ Wurzelortskurve unter Verwendung des genannten Reglers. Außerdem ist unschwer zu erkennen, dass der Regelkreis erst ab einer gewissen Verstärkung stabil wird, weil dann sämtliche Pole des geschlossenen Regelkreises in der linken s-Ebene zu liegen kommen. Die Wahl der Reglerverstärkung KR kann beispielsweise durch die Vorgabe einer Eigenfrequenz und einer bestimmten Dämpfung des Einschwingvorgangs getroffen werden. Wie bereits an anderer Stelle erklärt wurde, muss der Regler entsprechende Pol- und Nullstellen beinhalten, wenn die gewünschte Prozessdynamik mit nur einem Verstärkungsglied (P-Regler) nicht erreicht werden kann. In diesem Zusammenhang haben sich zwei Reglertypen als besonders einfach und nützlich erwiesen: das Lead-Netzwerk und das Lag-Netzwerk. Das Lead-Netzwerk agiert vorwiegend im Hinblick auf die dynamischen Eigenschaften der Regelgröße bezüglich der Anhebung der Bandbreite und somit einer Verkleinerung der Anstiegszeit und einer Verminderung der maximalen Überschwingweite; salopp gesprochen kann man sagen, dass das Lead-Netzwerk einer Approximation des PD-Reglers entspricht. Das LagNetzwerk wird in der Regel zur Anhebung der Niederfrequenz-Verstärkung benutzt, wodurch
6.2 Regelkreis-Synthese mit Hilfe von Wurzelortskurven
155
Bild 6.26: Wurzelortskurve einer instabilen Strecke kombiniert mit einem PID-Regler
wiederum die stationäre Genauigkeit des Regelkreises verbessert wird. Dieses Netzwerk entspricht der Approximation eines PI-Reglers. Beide Netzwerke sollen im folgenden Beispiel auf eine in der Antriebstechnik typische Strecke (Servosystem) angewandt werden. Beispiel 6.9: Es wird von einer integrierenden Strecke mit Verzögerung erster Ordnung mit der Übertragungsfunktion FS (s) =
1 s(s + 1)
ausgegangen. Als Regler soll zunächst nur ein P-Regler mit der Übertragungsfunktion FR (s) = KR Anwendung finden; der offene Regelkreis lautet somit Fo (s) =
KR . s(s + 1)
Die dick ausgezogene Linie im Bild 6.27 zeigt die zugehörige Wurzelortskurve.
156
6 Entwurf linearer Regelkreise
Bild 6.27: a) WOK für Fo (s) = KR [s(s + 1)], (ausgezogene Linie) b) WOK für Fo (s) = KR · (s + 2) [s(s + 1)], (strichlierter Kreis)
Um nun den Einfluss eines Lead-Netzwerks auf den Verlauf der WOK zu erklären, wird zum P-Regler zunächst eine Nullstelle bei s = −2 hinzugefügt, also FR (s) = KR (s + 2). Die ursprüngliche WOK wird dadurch zu dem strichlierten Kreis und der Geraden auf der negativ reellen Achse im Bild 6.27 verformt. Dabei ist zu beachten, dass durch die hinzugefügte Nullstelle die WOK nach links, also in Richtung besserer Stabilität der s-Ebene, verschoben wird. Wenn allerdings auf Grund einer geforderten Anstiegszeit eine Eigenfrequenz von ω0 ≈ 2 sec−1 gefordert wird, dann kann mit der Verstärkung KR allein nur eine geringe Dämpfung erreicht werden. Somit würde bei der notwendigen Verstärkung die maximale Überschwingweite sehr groß werden. Durch das Hinzufügen der Reglernullstelle kann man jedoch die WOK in eine gewünschte Position verschieben, und dies soll als wesentlicher Vorteil herausgestellt werden, so dass der geschlossene Regelkreis eine Eigenfrequenz von ω0 = 2 sec−1 und eine Dämpfung von d ≥ 0,5 annimmt. Der Nachteil einer Kompensation durch eine bloße Reglernullstelle besteht jedoch darin, dass ein Netzwerk mit einer Übertragungsfunktion FR (s) = KR (s + 2) praktisch nicht oder nur annähernd realisiert werden kann und außerdem hochfrequente Störsignale am Reglereingang entsprechend stark verstärkt werden würden. Dieser Nachteil wird aufgehoben, wenn zum bisherigen Netzwerk ein Pol höherer Frequenz hinzugefügt wird; etwa an der Stelle s = −20. Damit wird die korrigierte Übertragungsfunktion des Reglers zu
6.2 Regelkreis-Synthese mit Hilfe von Wurzelortskurven
FR (s) = KR ·
157
s+2 ; s + 20
bei obiger Gleichung handelt es sich um die bekannte Gleichung eines Lead-Netzwerks. Um den Einfluss der Reglerpolstelle auf die Kompensation aufzuzeigen, ist im Bild 6.28 die Wurzelortskurve für zwei Fälle dargestellt.
Bild 6.28: a) WOK mit FR (s) =
s+2 s+2 ; b) WOK mit FR (s) = s + 20 s + 10
Im Bild a) ist die WOK für FR (s) = (s + 2) (s + 20) skizziert, im Bild b) für FR (s) = 1 (s + 2) (s + 10); kombiniert jeweils mit der Strecke Fs (s) = s (s+10) . Für kleine Verstärkungen haben beide Wurzelortskurven ungefähr den gleichen Verlauf wie die im Bild 6.27 mit FR (s) = KR (s + 2). Aus dem Vergleich der Bilder 6.27 und 6.28 kann man deutlich ableiten, dass durch die Reglerpolstelle die Wurzelortskurve nach rechts aufgebogen wird. Bei kleinen Verstärkungen, das heißt in der Nähe der Streckenpole, ist der Einfluss der Polstelle des Reglers auf den Verlauf der WOK nur unwesentlich. Die Vorgehensweise bezüglich der Wahl der Polstellen und der Nullstellen des Lead-Netzwerks kann auch weniger heuristisch, also mehr analytisch durchgeführt werden, wenn man erst den gewünschten Pol des geschlossenen Regelkreises auf Grund eines spezifizierten Übergangsverhaltens als Arbeitspunkt der Wurzelortskurve wählt. Im Anschluss daran wird die Nullstelle des Lead-Netzwerks auf der Basis der zulässigen Überschwingweite gewählt und nachfolgend mit Hilfe der Phasenbedingung der Wurzelortskurven der Reglerpol des Lead-Netzwerks ermittelt. Diese Vorgehensweise wurde bereits im Beispiel 6.7 aufgezeigt und bedarf deshalb keiner weiteren Erläuterung mehr.
158
6 Entwurf linearer Regelkreise
Die physikalische Realisierung des Lead-Netzwerks wird in der neueren Technik mit einem Mikrocomputer, in der klassischen Regelungstechnik durch einen beschalteten Operationsverstärker entsprechend Bild 6.29 durchgeführt.
Bild 6.29: Realisierung eines Lead-Netzwerks mit einem beschalteten Operationsverstärker
Die Übertragungsfunktion obiger Schaltung ergibt sich unter Anwendung der Kirchhoff’schen Gesetze zu FR (s) = KR ·
1 + sT1 1 + sαT1
R3 =1 R1 + R 2 T1 = R1 C KR =
α=
mit
für R3 = R1 + R2
R2 . R1 + R 2
Somit liegt die Reglernullstelle an der Position sN,R = −1 T1 und die vorher viel diskutierte Polstelle bei sp,R = −1 αT1 .
6.3
Empirische Einstellregeln von Ziegler und Nichols
Verfahrenstechnische Regelstrecken (Druck-, Durchfluss-, Temperaturregelstrecken) weisen Übergangsfunktionen mit rein aperiodischem Verhalten gemäß der Skizze im Bild 6.30 auf. Solche Prozesse können durch ein vereinfachtes mathematisches Modell relativ gut approximiert werden, nämlich FS (s) =
KS · e−sTu 1 + sTa
(6.26)
also durch ein Verzögerungsglied erster Ordnung und ein Totzeitglied, wie aus Bild 6.30 hervorgeht. Dabei wird durch die Konstruktion der Wendetangente die Übergangsfunktion hS (t) durch folgende drei Größen charakterisiert: • • •
KS Verstärkungsfaktor der Strecke Ta Anstiegszeit (oder auch Ersatzzeitkonstante) Tu Verzugszeit (oder auch Ersatztotzeit)
6.3 Empirische Einstellregeln von Ziegler und Nichols
159
Bild 6.30: Beschreibung einer Übergangsfunktion durch drei Kenngrößen: KS , Ta , Tu
Für Regelstrecken der beschriebenen Art wurden zahlreiche Einstellregeln entwickelt, die größtenteils durch empirische Vorgehensweisen gefunden wurden. Die bekanntesten Einstellregeln dieser Art sind die von Ziegler und Nichols. Bei der Anwendung dieser Einstellregeln kann je nach Aufgabenstellung zwischen zwei Fassungen gewählt werden: Methode I: (Methode des Stabilitätsrandes) • •
•
Der im Regelkreis vorhandene Standardregler, also der PID-Regler, wird zunächst als reiner Proportional-Regler betrieben. Die Verstärkung KR dieses P-Reglers wird nun so weit erhöht, bis die Regelgröße des geschlossenen Regelkreises Dauerschwingungen konstanter Amplitude ausführt. Die dabei eingestellte (kritische) Verstärkung des Reglers wird mit KR,krit bezeichnet und die sich einstellende Periodendauer der Regelgröße mit Tkrit . Anhand von KR,krit und Tkrit erhält man mit Hilfe der folgenden Tabelle die Reglerparameter für den im realen Betrieb einzusetzenden Reglertyp.
Methode II: (Wendetangentenverfahren) Häufig ist es bei industriellen Anlagen nicht möglich, den Regelkreis im grenzstabilen Fall zu betreiben. Die Messung der Übergangsfunktion hS (t) der Strecke bereitet jedoch im Allgemeinen keine großen Schwierigkeiten. Daher scheint in vielen Fällen die zweite Form der Ziegler-Nichols-Einstellregeln, die direkt von der Steigung der Wendetangente KS Ta und der Verzugszeit Tu der Übergangsfunktion ausgeht, als zweckmäßiger. Dabei ist zu beachten,
160
6 Entwurf linearer Regelkreise
dass die Messung der Übergangsfunktion hS (t) nur bis zum Wendepunkt erforderlich ist, da die Steigung der Wendetangente bereits das Verhältnis KS Ta beschreibt. Anhand der Messwerte Tu und KS Ta sowie mit Hilfe folgender Tabelle lassen sich dann die Reglerparameter des jeweiligen Reglertyps einfach berechnen. Tabelle 6.1: Reglereinstellwerte auf der Basis der Ziegler-Nichols-Einstellregeln Reglereinstellwerte Reglertyp Methode I:
Methode II:
KR
Tn
Tv
P
0,5 · KR,krit
–
–
PI
0,45 · KR,krit
0,85 · Tkrit
–
PID
0,6 · KR,krit
0,5 · Tkrit
0,12 · Tkrit
P
1 Ta · KS Tu
–
–
PI
0,9 Ta · KS Tu
3,33 · Tu
–
PID
1,2 Ta · KS Tu
2 · Tu
0,5 · Tu
7
Mathematische Beschreibung linearer Systeme im Zustandsraum
7.1
Einleitung
Das zeitliche Verhalten der Ausgangsgröße eines linearen Systems bei definiertem Eingang erhält man bekanntlich durch a) Aufstellen der Differenzialgleichung und b) durch Lösen der Differenzialgleichung, wobei sich die Gesamtlösung aus der allgemeinen Lösung der homogenen Differenzialgleichung und einer partikulären Lösung der inhomogenen Differenzialgleichung zusammensetzt. Auf entsprechende Beispiele soll hier jedoch verzichtet werden, nachdem die Vorgehensweise aus den Grundlagen der Mathematik weidlich bekannt ist. Bei einfachen linearen Systemen ist der Aufwand relativ gering, die skalare Differenzialgleichung des zu betrachtenden Übertragungsgliedes mit Hilfe physikalischer Gesetze aufzustellen. Die Lösung dieser Differenzialgleichung bereitet aber besonders dann Schwierigkeiten, wenn die Eingangszeitfunktion unstetig ist, also Sprünge oder Dirac-Impulse enthält, was jedoch bei regelungstechnischen Anwendungen häufig der Fall ist. Abhilfe schafft hier die Laplace-Transformation, mit der man das Übertragungsverhalten des Systems als Funktion einer komplexen Variablen s = σ + jω aufstellen kann. Dabei bezeichnet σ den Realteil und ω den Imaginärteil des Laplace-Operators s. Man transformiert also die Aufgabenstellung aus dem Bereich der reellen Zeitvariablen t (Originalbereich) in den Bereich der komplexen Bildvariablen s (Bildbereich). Den genauen Verlauf der Ausgangszeitfunktion berechnet man, indem man die Ergebnisse des Bildbereichs in den Zeitbereich rücktransformiert. Diese Operation erledigt man fast ausschließlich mit Hilfe von Tabellen und/oder der Partialbruchzerlegung, wie dies ausführlich im Anhang A I gezeigt wird. 7.1.1
Beschreibung linearer Systeme durch Zustandsvariable
Die Beschreibung eines linearen Übertragungsgliedes durch die skalare Differenzialgleichung, durch die Übertragungsfunktion oder durch den Frequenzgang verknüpft den Verlauf der Ausgangsgröße y(t) mit dem der Eingangsgröße u(t), sie sagt jedoch nichts über den inneren Aufbau des Übertragungsgliedes aus. Dies soll besagen, dass Prozesse mit unterschiedlicher innerer Struktur durchaus das gleiche Eingangs-/Ausgangsverhalten haben können. Um die innere Struktur eines dynamischen Systems zu erfassen, führt man zusätzlich zu den p Eingangsgrößen ui (t), i = 1, 2, . . . , p und den q Ausgangsgrößen yi (t), i = 1, 2, . . . , q weitere n Größen xk (t) ein, die den momentanen inneren Zustand des Systems in eindeutiger
162
7 Mathematische Beschreibung linearer Systeme im Zustandsraum
Weise kennzeichnen und daher auch als Zustandsgrößen oder Zustandsvariablen bezeichnet werden. Aus der Sicht der Mathematik entspricht die Darstellung dynamischer Systeme im Zustandsraum einer Umwandlung einer Differenzialgleichung n-ter Ordnung in ein dazu äquivalentes System von n Differenzialgleichungen erster Ordnung. Physikalisch gesehen ist der Zustand eines dynamischen Systems durch den Energieinhalt der im System vorhandenen Energiespeicher bestimmt. Konkret heißt das, der Zustand eines Systems mit n Energiespeichern wird durch n Zustandsgrößen beschrieben, die zu einem so genannten Zustandsvektor zusammengefasst werden, wie im Folgenden gezeigt wird. Durch die Einführung der Zustandsvariablen erhält man die Zustandsgleichungen x˙1 = f1 x1 (t), x2 (t), . . . , xn (t), u1 (t), u2 (t), . . . , up (t) x˙2 = f2 x1 (t), x2 (t), . . . , xn (t), u1 (t), u2 (t), . . . , up (t) . . . x˙n = fn x1 (t), x2 (t), . . . , xn (t), u1 (t), u2 (t), . . . , up (t) sowie die Ausgangsgleichungen y1 (t) = g1 x1 (t), x2 (t), . . . , xn (t), u1 (t), u2 (t), . . . , up (t) y2 (t) = g2 x1 (t), x2 (t), . . . , xn (t), u1 (t), u2 (t), . . . , up (t) . . . yq (t) = gq x1 (t), x2 (t), . . . , xn (t), u1 (t), u2 (t), . . . , up (t)
(7.1)
(7.2)
Das Gleichungssystem (7.1) verknüpft die zeitlichen Änderungen der Zustandsvariablen mit den momentanen Werten der Zustandsvariablen und den Eingangsgrößen und beschreibt damit das dynamische Verhalten des Systems. Die Gleichungen (7.2) stellen die Abhängigkeit der Ausgangsgrößen yi (t) von den Zustandsgrößen xk (t) und den Eingangsgrößen ui (t) dar. Die auf den ersten Blick unhandlich erscheinenden Zustandsgleichungen (7.1) und (7.2) kann man in Vektorschreibweise in der Form ˙ = f {x(t), u(t)} x(t)
(7.3)
y(t) = g {x(t), u(t)}
(7.4)
und
verkürzt anschreiben. Die Vektorgleichung (7.3) wird als Zustandsdifferenzialgleichung, die Vektorgleichung (7.4) als Ausgangsgleichung, derVektor u(t) als Eingangs- oder Steuervektor,
7.1 Einleitung
163
der Vektor x(t) als Zustandsvektor und der Vektor y(t) als Ausgangsvektor bezeichnet. Für lineare, zeitinvariante Systeme wird die Zustandsgleichung (7.1) zu x˙1 (t) = a11 x1 (t) + . . . + a1n xn (t) + b11 u1 (t) + . . . + b1p up (t) x˙2 (t) = a21 x1 (t) + . . . + a2n xn (t) + b21 u1 (t) + . . . + b2p up (t) . . . x˙n (t) = an1 x1 (t) + . . . + ann xn (t) + bn1 u1 (t) + . . . + bnp up (t)
(7.5)
sowie die Ausgangsgleichung (7.2) zu y1 (t) = c11 x1 (t) + . . . + c1n xn (t) + d11 u1 (t) + . . . + d1p up (t) . . . yq (t) = cq1 x1 (t) + . . . + cqn xn (t) + dq1 u1 (t) + . . . + dqp up (t)
(7.6)
Mit Hilfe der Vektorschreibweise kann man schließlich die Gleichungssysteme (7.5) und (7.6) auch in der Matrizenschreibweise wie folgt anschreiben:
a11 x˙1 (t) x˙2 (t) a21 . = . . . x˙n (t) an1
a12 . . a1n x1 (t) b11 a22 . . a2n x2 (t) b21 . . . + . . . . . xn (t) bn1 an2 . . ann
b12 . . b1p u1 (t) b22 . . b2p u2 (t) . . . (7.7) . . . up (t) bn2 . . bnp
c12 . . c1n x1 (t) d11 x2 (t) d21 c22 . . c2n . . . + . . . . . xn (t) dq1 cq2 . . cqn
d12 . . d1p u1 (t) d22 . . d2p u2 (t) . . . . . . up (t) dq2 . . dqp
y1 (t) c11 y2 (t) c21 . = . . . yq (t) cq1
(7.8)
Diese Gleichungen lauten schließlich in der Vektorform: ˙ = Ax(t) + Bu(t) x(t)
(7.9)
y(t) = Cx(t) + Du(t)
(7.10)
Dabei ist A die (n × n)-Systemmatrix, B die (n × p)-Eingangs- oder Steuermatrix, C die (q × n)-Ausgangsmatrix und D die (q × p)-Durchgangsmatrix. Das folgende Bild zeigt das Blockschaltbild zu den Gleichungen (7.9) und (7.10). Für den Sonderfall eines Systems mit nur einem Eingang und einem Ausgang wird die Steuermatrix zum Steuervektor b und die Ausgangsmatrix zum Ausgangsvektor c.
164
7 Mathematische Beschreibung linearer Systeme im Zustandsraum
Bild 7.1: Allgemeines Blockschaltbild eines Systems in Zustandsdarstellung
Beispiel 7.1: Für das im Bild 7.2 gezeigte RC-Netzwerk sollen die Systemgleichungen in der Zustandsraumdarstellung ermittelt werden.
Bild 7.2: Elektrisches Netzwerk
Es ist nahe liegend, für dieses Beispiel als Zustandsvariablen die Spannungen u1 (t), u2 (t) und u3 (t) an den Kondensatoren zu wählen, weil bekanntlich jeder Kondensator in der Lage ist, Energie des elektrischen Feldes zu speichern. Für die Knoten 1, 2 und 3 erhalten wir die Gleichungen u2 (t) − u1 (t) ; R1 u3 (t) − u2 (t) u2 (t) − u1 (t) C2 u˙ 2 (t) = i2 (t) − i1 (t) = − ; R2 R1 ue (t) − u3 (t) u3 (t) − u2 (t) C3 u˙ 3 (t) = i3 (t) − i2 (t) = − . R3 R2
C1 u˙ 1 (t) = i1 (t) =
Außerdem gilt für die Ausgangsspannung ua (t) = u1 (t). Nach Division obiger Ausdrücke durch C1 , C2 bzw. C3 erhält man die gesuchten Zustandsgleichungen zu
7.1 Einleitung
165
−
1 R1 C1
u˙ 1 (t) 1 u˙ 2 (t) = R1 C 2 u˙ 3 (t) 0
1 R1 C1
1 1 1 − + C2 R1 R2 1 R2 C3
" ua (t) = 1
0
u1 (t) # 0 · u2 (t) .
0
1 R2 C 2
1 1 1 − + C3 R2 R3 0 u1 (t) u2 (t) + 0 1 u3 (t) R3 C3
· ue (t)
u3 (t) Durch den Vergleich mit der allgemeinen Zustandsgleichung ergeben sich die Elemente der Matrix A sowie der Vektoren b und cT . Beispiel 7.2: Es wird das im Bild 7.3 dargestellte mechanische Schwingungssystem mit der Masse m, der Dämpfungskonstanten d und der Federkonstanten c betrachtet, das durch eine Kraft u(t) zur Schwingung angeregt wird.
Bild 7.3: Mechanischer Schwinger; a) Geräteskizze, b) zugehöriges Blockschaltbild
Zur Differenzialgleichung für den Weg y(t), der die Bewegung der Masse m beschreibt, lautet der Newton-Ansatz my(t) ¨ + d y(t) ˙ + cy(t) = u(t).
166
7 Mathematische Beschreibung linearer Systeme im Zustandsraum
Aus dieser umgeformten Differenzialgleichung y(t) ¨ =
1 ˙ − cy(t)] [u(t) − d y(t) m
lässt sich das Blockschaltbild des betrachteten Systems durch die Reihenschaltung zweier Integratoren einfach aufbauen. Auf Grund der oben aufgezeigten allgemeinen Umwandlung einer Differenzialgleichung n-ter Ordnung in n Differenzialgleichungen erster Ordnung ist es nahe liegend, die Ausgänge der Integratoren als Zustandsgrößen x1 (t) und x2 (t) zu definieren und in die ursprüngliche Differenzialgleichung einzusetzen: x1 (t) = y(t) x2 (t) = y(t) ˙ Diese Zustandsgrößen haben im Übrigen auch eine physikalische Bedeutung: Zustandsgröße x1 (t) beschreibt den Weg der Masse und ist somit ein Maß für die potenzielle Energie der Feder, x2 (t) ist ein Maß für die kinetische Energie der Masse. Das gesuchte System von Differenzialgleichungen erster Ordnung ergibt sich sowohl aus dem Blockschaltbild als auch direkt aus der Differenzialgleichung durch Ableitung der oben definierten Zustandsgrößen: x˙1 (t) = x2 (t)
x˙2 (t) = −c/ m·x1 (t) − d m · x2 (t) + 1 m · u(t).
Wenn dieses Gleichungssystem in der Matrizenschreibweise dargestellt wird, so erhält man
x˙1 (t) x˙2 (t)
=
0 1 −c m −d m
x1 (t) x2 (t)
+
0 1 m
· u(t)
oder in der etwas komprimierten Vektorschreibweise ˙ = Ax(t) + bu(t) x(t) mit x(t) =
x1 (t) x2 (t)
;
A=
0 1 −c m −d m
;
b=
0 1 m
.
Die Ausgangsgröße ist zunächst gegeben durch y(t) = x1 (t). In vektorieller Schreibweise lautet die Ausgangsgleichung " # x1 (t) " # T mit cT = 1 0 . y(t) = c · x(t) = 1 0 x2 (t)
7.1 Einleitung
7.1.2
167
Lösung der Vektordifferenzialgleichung im Zeitbereich
Die Vektordifferenzialgleichung ˙ = Ax(t) + Bu(t) x(t) hat eine formale Ähnlichkeit mit der skalaren Differenzialgleichung x(t) ˙ = a · x(t) + b · u(t), deren Anfangsbedingung zum Zeitpunkt t0 = 0 sei mit x(0) = x0 bezeichnet. Durch Anwendung der Laplace-Transformation auf obige Gleichung erhält man sX(s) − x0 = aX(s) + bU (s) und daraus X(s) =
1 1 · x0 + · bU (s). s−a s−a
Durch Rücktransformation in den Zeitbereich erhält man die Lösung dieser Gleichung zu
t x(t) = eat · x0 +
ea(t−τ ) bu(τ )dτ. 0
Es ist deshalb nahe liegend, für den vektoriellen Fall der Zustandsgleichung die gleiche Struktur der Lösung anzusetzen und die skalaren Größen durch entsprechende Vektoren bzw. Matrizen zu ersetzen. Dies führt rein formal auf die Beziehung
t x(t) = e x 0 + At
eA(t−τ ) Bu(τ )dτ 0
Die hier auftretende Matrizenfunktion eAt wird in Anlehnung an den skalaren Fall durch die Reihe eAt = I + A
t t2 + A2 + . . . 1! 2!
definiert; I bezeichnet die (n × n)-Einheitsmatrix und die Potenzen der Systemmatrix A sind die Matrizenprodukte entsprechend ihrer Potenz. Allgemein wird obige Gleichung in der Form
t x(t) = Φ(t)x 0 +
Φ(t − τ )Bu(τ )dτ
(7.11)
0
geschrieben, wobei die Matrix Φ(t) = eAt
(7.12)
168
7 Mathematische Beschreibung linearer Systeme im Zustandsraum
als Fundamental- oder Übergangsmatrix oder auch als Transitionsmatrix bezeichnet wird. Diese Matrix spielt bei den Methoden des Zustandsraums eine außerordentlich wichtige Rolle. Sie ermöglicht gemäß Gl. (7.11) auf einfache Weise die Berechnung des Systemzustands für alle Zeiten t allein aus der Kenntnis eines Anfangszustands x 0 im Zeitpunkt t0 = 0 und des zeitlichen Verlaufs des Eingangsvektors. Der Term Φ(t) · x 0 beschreibt die Lösung der homogenen Zustandsgleichung, die auch als Eigenbewegung oder freie Reaktion des Systems bezeichnet wird. Der zweite Term entspricht der partikulären Lösung, also dem durch die äußere Anregung (erzwungene Reaktion) gegebenen Anteil. Anmerkung: Ist der Anfangszeitpunkt t0 = 0, so ändert sich Gl. (7.11) nur formal, indem das Argument t durch t − t0 ersetzt wird und t0 als untere Integrationsgrenze einzusetzen ist:
t x(t) = Φ(t − t0 ) · x(t0 ) +
Φ(t − τ )Bu(τ )dτ t0
Beispiel 7.3: Gegeben sei die Zustandsgleichung 0 6 0 ˙ = x(t) · x(t) + · u(t); −1 −5 1
3 x 0 = x(0) = 1
sowie die zugehörige Fundamentalmatrix " −2t # " −2t # 3e 6e − 2e−3t − 6e−3t Φ(t) = " # " # . −e−2t + e−3t −2e−2t + 3e−3t (Methoden zur Ermittlung der Transitionsmatrix Φ(t) werden im folgenden Abschnitt behandelt.) Es soll der zeitliche Verlauf des Zustandsvektors für einen Einheitssprung u(t) = 1, t ≥ 0 mit Hilfe der Gl. (7.11) bestimmt werden. Durch Einsetzen von Φ, b, A und x 0 in Gl. (7.11) erhält man zunächst " −2t # " −2t # 3e − 2e−3t − 6e−3t 6e 3 x(t) = " + # " # −2t −3t −2t −3t 1 −e +e + 3e −2e
t "6e−2(t−τ ) − 6e−3(t−τ ) # + " # · dτ. −2e−2(t−τ ) + 3e−3(t−τ ) 0
Nach Ausführung der Multiplikation und Integration erhält man
7.1 Einleitung
169
x(t) =
7.1.3
6e−3t − 5e−2t
x(t) =
15e−2t − 12e−3t
+
1 + 12e−2t − 10e−3t
1 − 3e−2t + 2e−3t e−2t − e−3t
bzw.
5e−3t − 4e−2t
Lösung der Zustandsgleichungen im Bildbereich
Für die Behandlung der Zustandsgleichungen im Bildbereich wird die Laplace-Transformierte zeitabhängiger Vektoren benötigt: L {u(t)} = U (s). Zur Berechnung der Übergangsmatrix Φ(t) werden die Zustandsgleichungen (7.9) und (7.10) einer Laplace-Transformation unterzogen: sX(s) − x 0 = AX(s) + BU (s) Y (s) = CX(s) + DU (s) Durch Umordnen der ersten Gleichung folgt (sI − A) · X(s) = x(0) + BU (s) oder X(s) = (sI − A)−1 · x(0) + (sI − A)−1 · BU (s), da (sI − A) nicht singulär, also invertierbar ist. Diese Beziehung stellt die Laplace-Transformierte der Gl. (7.11) für t0 = 0 und somit die Lösung der Zustandsgleichung im Bildbereich dar. Der erste Term der rechten Seite beschreibt die freie Reaktion, der zweite Term die erzwungene Reaktion des Systems. Durch Vergleich der entsprechenden Gleichungen folgt unmittelbar die Übergangsmatrix + , Φ(t) = L−1 (sI − A)−1
(7.13)
oder L {Φ(t)} = Φ(s) = (sI − A)−1 Die Berechnung der Matrix Φ(s) ergibt sich mit den bekannten Methoden der Matrizenrechnung aus der Inversion von (sI − A), also aus der Beziehung
170
7 Mathematische Beschreibung linearer Systeme im Zustandsraum
Φ(s) =
1 · adj(sI − A) det (sI − A)
(7.14)
Die Adjungierte einer Matrix M = mij entsteht bekanntlich daraus, dass man jedes Element mij durch den Kofaktor Mij ersetzt und diese entstehende Matrix anschließend transponiert. Der Kofaktor Mij ist definiert durch Mij = (−1)i+j · Dij , wobei Dij die Determinante der Matrix ist, die aus der Matrix M durch Streichen der i-ten Zeile und j -ten Spalte entsteht. Damit besteht die Möglichkeit, die Fundamentalmatrix Φ(t) analytisch zu berechnen, wie folgendes Beispiel zeigt. Beispiel 7.4: 0 6 Gegeben sei die Systemmatrix A = ; gesucht ist die Transitionsmatrix Φ(t). −1 −5 Unter Verwendung der gegebenen Systemmatrix A wird (sI − A) =
s
−6
1 s+5
;
als adjungierte Matrix erhält man unter Anwendung der oben angeführten Methode adj(sI − A) =
s+5 6 −1 s
.
Mit det(sI − A) = s 2 + 5 s + 6 = (s + 2)(s + 3) folgt Φ(s) = (sI − A)
−1
1 · = (s + 2)(s + 3)
s+5 6 −1 s
.
Die Rücktransformation dieses Ausdrucks in den Zeitbereich liefert schließlich die gesuchte Transitionsmatrix # " −2t # " −2t − 2e−3t − 6e−3t 6e 3e Φ(t) = " # " # . −e−2t + e−3t −2e−2t + 3e−3t
7.1 Einleitung
7.1.4
171
Zusammenhang zwischen Übertragungsfunktion und Zustandsdarstellung
Mit der Eingangs-Ausgangs-Beschreibung durch die Übertragungsfunktion F (s) und der Darstellung im Zustandsraum stehen zwei prinzipiell gleichwertige Verfahren zur mathematischen Beschreibung linearer Systeme zur Verfügung. Somit muss auch eine Umrechnung zwischen den beiden Darstellungsformen möglich sein. Die Übertragungsfunktion eines linearen Systems verknüpft bekanntlich die Eingangsgröße U (s) mit der Ausgangsgröße Y (s) über die Beziehung Y (s) = F (s) · U (s). Transformiert man andererseits die Zustandsgleichungen (7.9) und (7.10) in den LaplaceBereich, wobei alle Anfangswerte zu null zu setzen sind, so erhalten wir s · X(s) = AX(s) + BU (s) Y (s) = CX(s) + DU (s). Aus der ersten der obigen Gleichungen erhält man den in den Bildbereich transformierten Zustandsvektor zu X(s) = (sI − A)−1 · BU (s). Einsetzen dieses Ausdrucks in die Ausgangsgleichung und Ausklammern von U (s) ergibt Y (s) = C(sI − A)−1 B · U (s) + DU (s) Für ein Eingrößensystem wird obige Gleichung zu Y (s) = cT · (sI − A)−1 b · U (s) + d · U (s) Durch einen Vergleich dieser Beziehung mit Y (s) = F (s) · U (s) wird die gesuchte Übertragungsfunktion zu F (s) = cT · (sI − A)−1 · b + d
(7.15)
wobei man sich gegebenenfalls zu erinnern hat, dass der bereits bekannte Zusammenhang Φ(s) = cT (sI − A)−1 gilt. Bei Mehrgrößensystemen (p > 1, q > 1) wird Gl. (7.15) zu F (s) = C · (sI − A)−1 B + D
(7.16)
172
7 Mathematische Beschreibung linearer Systeme im Zustandsraum
Beispiel 7.5: Gegeben sei ein Eingrößensystem in der Zustandsraumdarstellung mit A=
0 1 −12 7
;
0 b= ; 1
" # cT = −10 4 ;
d = 1.
Für dieses System soll die Übertragungsfunktion F (s) ermittelt werden. Gemäß Gleichung (7.15) gilt F (s) = cT · (sI − A)−1 b + d Daraus erhält man durch eine kurze Rechnung F (s) =
7.2
(s − 1)(s − 2) . (s − 3)(s − 4)
Analyse geregelter Systeme im Zustandsraum
Während die klassische Regelungstechnik auf der Beschreibung des betrachteten Systems mittels der Übertragungsfunktion basiert, baut die moderne Regelungstechnik auf der Systembeschreibung durch ein System von n Differenzialgleichungen erster Ordnung auf, die zu einer Vektormatrix zusammengefasst werden. Der Vorteil der Vektorschreibweise liegt in der vereinfachten mathematischen Darstellung im Vergleich zur Differenzialgleichung bzw. zur Übertragungsfunktion. Darüber hinaus ändert sich durch die Zunahme der Zahl von Zustandsvariablen bei entsprechend komplexen Systemen und der Zahl der Eingangs- und/oder Ausgangsvariablen die Komplexität der beschreibenden Gleichungen nicht. 7.2.1
Mathematisches Rüstzeug zur Systemanalyse im Zustandsraum
Die Eigenwerte einer (n × n)-Matrix Die Eigenwerte einer (n × n)-Matrix A sind identisch mit den Wurzeln der charakteristischen Gleichung |λI − A| = 0. Verschiedentlich werden die Eigenwerte auch als charakteristische Wurzeln bezeichnet. Betrachten wir das folgende einfache Beispiel;
0 1 0 0 1. A= 0 −6 −11 −6
7.2 Analyse geregelter Systeme im Zustandsraum
173
Die charakteristische Gleichung zur gegebenen Matrix wird somit zu λ −1 0 |λI − A| = 0 λ −1 = λ3 + 6λ2 + 11λ + 6 = (λ + 1)(λ + 2)(λ + 3) = 0. 6 11 λ + 6 Die Eigenwerte dieser Matrix bzw. die Wurzeln der charakteristischen Gleichung lauten somit λ1 = −1;
λ2 = −2;
λ3 = −3.
Die Eigenvektoren einer Matrix Zu jeder Lösung λi der charakteristischen Gleichung, also jedem Eigenwert, lässt sich ein zugehöriger Eigenvektor ei definieren, der die Vektorgleichung Aei = λi ei erfüllt. Es gilt somit die Definition: Zu jedem Eigenwert λi (i = 1, 2, . . . , n) der (n × n)-Matrix A gibt es einen von null verschiedenen Vektor ei (i = 1, 2, . . . , n), der die Gleichung Aei = λi ei erfüllt. Die Vektoren ei heißen Eigenvektoren. Beispiel 7.6: Aus der Systemmatrix 2 1 A= 3 4 ergeben sich zunächst die Eigenwerte zu λ1 = 5 und λ2 = 1. Gesucht ist der zum Eigenwert λ1 = 5 zugehörige Eigenvektor e1 mit den Komponenten e11 und e12 . Mit der gegebenen Matrix A und dem Eigenwert λ1 = 5 folgt aus obiger Vektorgleichung e11 2 1 e11 =5 . · e12 e12 3 4 Beide Gleichungen ergeben e11 = 13 e12 , d.h. die Komponente e11 kann beliebig gewählt werden. Wird e11 = 1 gewählt, so folgt für den gesuchten Eigenvektor 1 e11 = . e1 = 3 e12
174
7 Mathematische Beschreibung linearer Systeme im Zustandsraum
Analog erhält man mit e2 = 1 den Eigenvektor zu λ2 = 1: 1 e21 = . e2 = −1 e22
Invarianz der Eigenwerte Die Standard-Form eines Systems lautet bekanntlich x˙ = Ax + Bu,
y = Cx.
Nun soll für das gegebene System ein neuer Satz von Zustandsgrößen z1 . . . zn definiert werden; x = P z. Setzt man die transformierte Zustandsgleichung in die ursprüngliche Zustandsgleichung ein, so erhält man P z˙ = AP z + Bu. Durch Linksmultiplikation mit P −1 folgt z˙ = P −1 AP z + P −1 Bu sowie y = CP z. Um nun die Invarianz der Eigenwerte gegenüber einer linearen Transformation zu zeigen, muss nachgewiesen werden, dass die charakteristischen Polynome |λI − A| und λI − P −1 AP identisch sind. Weil die Determinante eines Matrixprodukts das Produkt der einzelnen Determinanten ist, muss gelten λI − P −1 AP = λP −1 P − P −1 AP = P −1 (λI − A)P = P −1 λI − A P = P −1 P λI − A . Beachtet man, dass das Produkt der Determinanten P −1 und |P | gleich der Determinante des Produkts P −1 P ist, so erhält man λI − P −1 AP = P −1 P |λI − A| = |λI − A| . Damit ist gezeigt, dass die Eigenwerte der Matrix A bez. einer linearen Transformation invariant sind.
7.2 Analyse geregelter Systeme im Zustandsraum
175
Das Cayley-Hamilton-Theorem Das Cayley-Hamilton-Theorem zeigt sich als besonders nützlich beim Beweis anderer Theoreme im Zustandsraum, aber auch bei der Regelkreis-Synthese, wie sich in einem späteren Kapitel zeigen wird. Ausgehend von einer (n × n)-Matrix A lautet bekanntlich die charakteristische Gleichung |λI − A| = λn + a1 λn−1 + . . . + an−1 λ + an = 0. Das Cayley-Hamilton-Theorem besagt nun, dass die Matrix A ihre eigene charakteristische Gleichung erfüllt; d.h. es gilt An + a1 An−1 + . . . + an−1 A + an I = 0. Beispiel 7.7: Die charakteristische Gleichung für die Systemmatrix 2 1 A= lautet λ2 − 6λ + 5 = 0. 3 4 Damit gilt nach dem Cayley-Hamilton-Theorem |A| = A2 − 6A + 5I = 0 oder
|A| =
12 6 5 0 0 0 7 6 − + = . 18 19 18 24 0 5 0 0
Die Berechnung von eAt Bei der Lösung regelungstechnischer Aufgaben ist es des Öfteren notwendig, den Ausdruck eA·t zu bestimmen. Der einfachste Lösungsweg besteht neben der Reihendarstellung der Exponentialfunktion in der Anwendung der Laplace-Transformation: Wegen . eAt = L−1 (sI − A)−1 ist zunächst die Matrix (sI −A) zu invertieren. Daraus erhält man eine Matrix, deren Elemente rationale Funktionen von s sind. Aus der Rücktransformation eines jeden Elements dieser Matrix in den Zeitbereich erhält man die gesuchte Lösung. Beispiel 7.8: Zur Matrix A=
0 1 0 −2
176
7 Mathematische Beschreibung linearer Systeme im Zustandsraum
ist eAt zu berechnen. Mit s 0 0 1 s −1 (sI − A) = − = 0 s 0 −2 0 s+2 erhält man
1 s(s + 2) . (sI − A)−1 1 s+2 Obige Matrix in den Zeitbereich rücktransformiert ergibt die gesuchte Lösung zu 1 −2t 1 1 − e . 2 eAt = L−1 (sI − A)−1 = −2t 0 e
1 s = 0
7.2.2
Steuerbarkeit eines Systems
Das System ˙ = Ax(t) + Bu(t) x(t)
(7.17)
mit x u A B
Zustandsvektor (n-dimensional) Stellgrößenvektor n × n-Systemmatrix n × 1- oder n × r-Steuermatrix
wird im Zeitpunkt t0 als zustandssteuerbar bezeichnet, wenn es möglich ist, eine Stellgröße zu erzeugen, die jeden beliebigen Anfangszustand des Systems in jeden beliebigen Endzustand in einem endlichen Zeitintervall t0 ≤ t ≤ t1 überführt.
Wenn jeder Zustand des Systems steuerbar ist, wird das betrachtete System als vollständig steuerbar bezeichnet. Es soll nun die Bedingung für vollständige Steuerbarkeit hergeleitet werden: Ohne Verlust der Allgemeingültigkeit sei angenommen, dass der Endzustand der Ursprung des Zustandsraums und der Ursprung der Anfangszeitpunkt null ist, d.h. t0 = 0. Die Lösung der Zustandsgleichung (7.17) lautet bekanntlich
t x(t) = e
At
· x0 +
eA(t−τ ) Bu(τ )dτ. 0
7.2 Analyse geregelter Systeme im Zustandsraum
177
Wendet man die Definition der vollständigen Zustandssteuerbarkeit an, so gilt
t x(t) = 0 = e
At1
· x0 +
eA(t1 −τ ) Bu(τ )dτ.
0
oder
t x(0) = −
e−Aτ Bu(τ )dτ.
(7.18)
0
Mit e−Aτ =
n−1
αk (τ )Ak
k=0
wird Gl. (7.18) zu x(0) = −
n−1 k=0
t1 αk (τ ) · u(τ )dτ.
k
A B
(7.19)
0
Setzen wir
t1 αk (τ ) · u(τ )dτ = βk , 0
so wird Gl. (7.19) zu x(0) = −
n−1
Ak Bβk
β0 β1 . = −[B AB . . . An−1 B] . . βn−1 k=0
(7.20)
Wenn das betrachtete System vollständig zustandssteuerbar ist, so muss Gl. (7.20) für jeden beliebigen Anfangszustand x(0) erfüllt sein. Dies wiederum bedeutet, dass die (n × n)-Matrix S c = [B AB A2 B . . . An−1 B]
(7.21)
den vollen Rang n haben muss. Die Matrix S c wird als Steuerbarkeitsmatrix bezeichnet.
178
7 Mathematische Beschreibung linearer Systeme im Zustandsraum
Beispiel 7.9: Ein System sei gegeben durch die Zustandsgleichung x˙1 1 1 x1 1 = · + · u. 0 −1 0 x˙2 x2 Zu prüfen ist die Steuerbarkeit des Systems. Die Steuerbarkeitsmatrix wird im gegebenen Beispiel zu 1 1 S c = [b Ab] = . 0 0 Nachdem die Steuerbarkeitsmatrix den Rang 1 hat, ist das gegebene System nicht vollständig zustandssteuerbar. In einem anderen Beispiel soll die Zustandsgleichung zu x˙1 1 1 x1 0 = · + · u. 2 −1 1 x˙2 x2 gegeben sein. In diesem Fall wird die Steuerbarkeitsmatrix zu 1 1 S c = [b Ab] = . 1 −1 Dieses System hat den geforderten Rang 2 und ist damit vollständig steuerbar.
Bedingung für vollständige Zustandssteuerbarkeit in der s-Ebene Eine notwendige und hinreichende Bedingung für vollständige Zustandssteuerbarkeit kommt in der s-Ebene insofern zum Ausdruck, als das betrachtete System nur dann vollständig steuerbar ist, wenn in der gegebenen Übertragungsfunktion keine Polstelle gegen eine Nullstelle gekürzt werden kann. Dies lässt sich am besten zeigen, wenn die Übertragungsfunktion in der Pol-Nullstellenform angeschrieben wird; siehe hierzu folgendes Beispiel 7.10: Gegeben sei die Übertragungsfunktion eines Eingrößensystems zu F (s) =
Y (s) s + 2,5 = , U (s) (s + 2,5)(s − 1)
wobei Y (s) Ausgangsgröße und U (s) Eingangsgröße des betrachteten Systems ist. Schreibt man diese Übertragungsfunktion in der Zustandsform an, so erhält man x˙1 0 1 x1 1 = · + · u. 2,5 −1,5 1 x˙2 x2
7.2 Analyse geregelter Systeme im Zustandsraum
179
Die Steuerbarkeitsmatrix des gegebenen Systems wird zu 1 1 S c = [b Ab] = . 1 1 Nachdem der Rang der Steuerbarkeitsmatrix eins ist, erhält man die gleiche Aussage, nämlich dass das gegebene System nicht vollständig zustandssteuerbar ist. 7.2.3
Beobachtbarkeit eines Systems
Das ungestörte (homogene) System x˙ = Ax
(7.22)
y = Cx
(7.23)
wird als vollständig beobachtbar bezeichnet, wenn jeder Zustand x(t0 ) aus der Beobachtung der Ausgangsgröße y(t) innerhalb eines endlichen Zeitintervalls t0 ≤ t ≤ t1 eindeutig bestimmt werden kann. Das Konzept der Beobachtbarkeit ist – wie sich in einem späteren Kapitel zeigen wird – sehr hilfreich bei der Rekonstruktion nicht messbarer Zustandsgrößen aus der Beobachtung messbarer Zustandsgrößen.
Analog zur Steuerbarkeit kann gezeigt werden, dass das betrachtete System dann und nur dann vollständig beobachtbar ist, wenn die so genannte Beobachtbarkeitsmatrix C CA . So = (7.24) . . . CAn−1 den vollen Rang n hat, also n linear unabhängige Zeilenvektoren besitzt. Alternativ zu Gl. (7.24) kann die Beobachtbarkeitsmatrix auch in der Form . S o = C T AT C T . . . (AT )n−1 C T angeschrieben werden. Beispiel 7.11: Für das System
x˙1 x˙2
=
1 1 x1 0 · + · u, −2 −1 1 x2
y = [1
ist die Steuerbarkeit und die Beobachtbarkeit zu überprüfen.
0] ·
x1 x2
180
7 Mathematische Beschreibung linearer Systeme im Zustandsraum
Der Rang der Steuerbarkeitsmatrix 0 1 S c = [b Ab] = 1 −1 ist 2, somit ist das System vollständig zustandssteuerbar. Die Beobachtbarkeitsmatrix . 1 1 T T T So = C A C = 0 1 hat ebenso den notwendigen Rang 2; somit ist das System auch vollständig beobachtbar. Bedingung für vollständige Beobachtbarkeit in der s-Ebene Die notwendige und hinreichende Bedingung für vollständige Zustandsbeobachtbarkeit kommt in der s-Ebene auch insofern zum Ausdruck, dass das betrachtete System nur dann vollständig beobachtbar ist, wenn in der gegebenen Übertragungsfunktion keine Polstelle gegen eine Nullstelle gekürzt werden kann.
7.3
Normalformen der Zustandsraumdarstellung
Zur Aufstellung der Zustandsraumdarstellung unter Verwendung der bekannten Differenzialgleichung des gegebenen Eingrößensystems existiert eine Reihe von Methoden. Die bekanntesten davon, nämlich die Regelungsnormalform oder Frobenius-Form, die Beobachtungsnormalform sowie die Diagonalform bzw. Jordanform sollen hier aufgezeigt werden. Die Differenzialgleichung des zu betrachtenden Systems sei gegeben zu y (n) + a1 y (n−1) + . . . + an−1 y˙ + an y = b0 u(n) + b1 u(n−1) + . . . + bn−1 u˙ + bn u, wobei u Eingangsgröße und y Ausgangsgröße ist. Diese Gleichung lautet Laplace-transformiert Y (s) b0 s n + b1 s n−1 + . . . + bn−1 s + bn = n . U (s) s + a1 s n−1 + . . . + an−1 s + an 7.3.1
(7.25)
Regelungsnormalform
Die Gl. (7.25) kann umgeformt werden zu Y (s) (b1 − a1 b0 )s n−1 + . . . + (bn−1 − an−1 b0 )s + (bn − an b0 ) , = b0 + U (s) s n + a1 s n−1 + . . . + an−1 s + an bzw. Y (s) = b0 U (s) + Y ∗ (s)
(7.26)
7.3 Normalformen der Zustandsraumdarstellung
181
mit Y ∗ (s) =
(b1 − a1 b0 )s n−1 + . . . + (bn−1 − an−1 b0 )s + (bn − an b0 ) · U (s). s n + a1 s n−1 + . . . + an−1 s + an
Die letzte Gleichung wird auf die Form Y ∗ (s) (b1 − a1 b0 )s n−1 + . . . + (bn−1 − an−1 b0 )s + (bn − an b0 ) =
sn
+ a1
s n−1
U (s) = Q(s) + . . . + an−1 s + an
gebracht. Aus dieser Gleichung erhält man die folgenden Beziehungen: s n Q(s) = −a1 s n−1 Q(s) − . . . − an−1 Q(s) − an Q(s) + U (s)
(7.27)
Y ∗ (s) = (b1 − a1 b0 )s n−1 Q(s) + . . . + (bn−1 − an−1 b0 )sQ(s) + (bn − an b0 )Q(s). Nun werden die Zustandsvariablen folgendermaßen definiert: X1 (s) = Q(s) X2 (s) = s · Q(s) . . . Xn−1 (s) = s n−2 · Q(s) Xn (s) = s n−1 · Q(s). Diese Zustandsvariablen stehen zueinander in folgender Beziehung: sX1 (s) = X2 (s) sX2 (s) = X3 (s) . . . sXn−1 (s) = Xn (s). Im Zeitbereich werden diese Gleichungen zu
(7.28)
182
7 Mathematische Beschreibung linearer Systeme im Zustandsraum
x˙1 = x2 x˙2 = x3 . . . x˙n−1 = xn . Wegen s n · Q(s) = s · Xn (s) kann Gl. (7.27) umgeschrieben werden zu sXn (s) = −a1 Xn (s) − . . . − an−1 X2 (s) − an X1 (s) + U (s)
oder
x˙n = −an x1 − an−1 x2 − . . . − a1 xn + u. Analog erhält man aus obigen Gleichungen Y (s) = b0 U (s) + (b1 − a1 b0 )s n−1 Q(s) + . . . + (bn−1 − an−1 b0 )sQ(s) + (bn − an b0 )Q(s) = b0 U (s) + (b1 − a1 b0 )Xn (s) + . . . + (bn−1 − an−1 b0 )X2 (s) + (bn − an b0 )X1 (s). Die inverse Laplace-Transformierte dieser Ausgangsgleichung wird zu y = (bn − an b0 )x1 + (bn−1 − an−1 b0 )x2 + . . . + (b1 − a1 b0 )xn + b0 · u. Die Zustandsgleichung und die Ausgangsgleichung lauten damit in der Vektorschreibweise
x˙1
x˙ 2 . . = . x˙n−1 x˙n
0
1
0
...
0
0 0 1 ... 0 . . . . . . . . . . . . 0 0 0 ... 1 −an −an−1 −an−2 . . . −a1
0 x 0 2 . . . . + ·u . . xn−1 0 x1
xn
(7.29)
1
x1 x2 . . . . b1 − a1 b0 · + b0 u. . . xn
y = bn − an b0 bn−1 − an−1 b0
(7.30)
Die Zustandsraumdarstellung gemäß den Gleichungen (7.29) und (7.30) wird als Regelungsnormalform oder auch als Frobenius-Form bezeichnet. Das folgende Bild zeigt das zugehörige Blockschaltbild der Frobenius-Form.
7.3 Normalformen der Zustandsraumdarstellung
183
Bild 7.4: Blockschaltbild der Frobenius-Form
Wie man aus obigem Bild leicht erkennen kann, werden die Ausgänge der Integratoren als Zustandsgrößen definiert. 7.3.2
Beobachtungsnormalform
Wir gehen wieder aus von der Übertragungsfunktion gemäß Gl. (7.25) und schreiben sie in folgender Form an: s n [Y (s) − b0 U (s)] + s n−1 [a1 Y (s) − b1 U (s)] + . . . + s an−1 Y (s) − bn−1 U (s) + an Y (s) − bn U (s) = 0. Dividiert man die gesamte Gleichung durch s n und ordnet sie entsprechend, so erhält man 1 1 [b1 U (s) − a1 Y (s)] + 2 [b2 U (s) − a2 Y (s)] + . . . s s 1 1 + n−1 bn−1 U (s) − an−1 Y (s) + n [bn U (s) − an Y (s)] . (7.31) s s Die Zustandsgrößen werden nun entsprechend den folgenden Gleichungen definiert: Y (s) = b0 U (s) +
1 b1 U (s) − a1 Y (s) + Xn−1 (s) s 1 Xn−1 (s) = b2 U (s) − a2 Y (s) + Xn−2 (s) s . . . 1 X2 (s) = bn−1 U (s) − an−1 Y (s) + X1 (s) s 1 X1 (s) = [bn U (s) − an Y (s)] s Xn (s) =
(7.32)
184
7 Mathematische Beschreibung linearer Systeme im Zustandsraum
Mit diesen Definitionen kann Gl. (7.31) geschrieben werden als Y (s) = b0 · U (s) + Xn (s).
(7.33)
Setzt man Gl. (7.33) in Gl. (7.32) ein und multipliziert beide Seiten der Gleichung mit s, so erhält man sXn (s) = Xn−1 (s) − a1 Xn (s) + (b1 − a1 b0 )U (s) sXn−1 (s) = Xn−2 (s) − a2 Xn (s) + (b2 − a2 b0 )U (s) . . . sX2 (s) = X1 (s) − an−1 Xn (s) + (bn−1 − an−1 b0 )U (s) sX1 (s) = −an Xn (s) + (bn − an b0 )U (s). Bildet man schließlich die inverse Laplace-Transformierte der obigen n Gleichungen und schreibt sie in umgekehrter Reihenfolge an, so erhält man x˙1 = −an xn + (bn − an b0 )u x˙2 = x1 − an−1 xn + (bn−1 − an−1 b0 )u . . . x˙n−1 = xn−2 − a2 xn + (b2 − a2 b0 )u x˙n = xn−1 − a1 xn + (b1 − a1 b0 )u. Ebenso wird die Rücktransformierte der Gl. (7.33) zu y = xn + b0 u . Wenn man schließlich die Zustandsgleichung sowie die Ausgangsgleichung vektoriell anschreibt, so erhält man folgende Systemdarstellung: 0 x˙1 x˙ 1 2 . . = . . . . x˙n 0
0 ... 0 0 . . . 0
... ... ... ... ...
−an
x1
b n − a n b0
0 −an−1 x2 bn−1 − an−1 b0 . . · . + . ·u . . . . . . . . 1 −a1 xn b1 − a1 b0
(7.34)
7.3 Normalformen der Zustandsraumdarstellung
x1 x2 . . .
185
y = 0 0 ... 0 1 + b0 u. xn−1 xn
(7.35)
Wie man leicht sieht, ist die (n×n)-Systemmatrix der Gl. (7.34) die transponierte Systemmatrix der Regelungsnormalform. Das Bild 7.5 zeigt das zu den Gleichungen (7.34) und (7.35) entsprechende Blockschaltbild.
Bild 7.5: Allgemeines Blockschaltbild der Beobachtungsnormalform
7.3.3
Diagonalform
Wir gehen wieder aus von der Übertragungsfunktion entsprechend Gl. (7.25) und betrachten zunächst den Fall, dass das Nennerpolynom ausschließlich verschiedene Wurzeln hat. Für diesen Fall wird Gl. (7.25) zu Y (s) b0 s n + b1 s n−1 + . . . + bn−1 s + bn = ; U (s) (s − p1 )(s − p2 ) · . . . · (s − pn )
pi = pj .
Diese Gleichung kann ebenso angeschrieben werden zu Y (s) = b0 U (s) +
c1 c2 cn U (s) + U (s) + . . . + U (s). s − p1 s − p2 s − pn
(7.36)
186
7 Mathematische Beschreibung linearer Systeme im Zustandsraum
Definiert man die Zustandsvariablen zu 1 U (s) s − p1 1 X2 (s) = U (s) s − p2 . . . 1 Xn (s) = U (s), s − pn
X1 (s) =
so gilt natürlich auch sX1 (s) = p1 X1 (s) + U (s) sX2 (s) = p2 X2 (s) + U (s) . . . sXn (s) = pn Xn (s) + U (s). Die inverse Laplace-Transformierte dieser Gleichungen liefert die gesuchten Zustandsgleichungen: x˙1 = p1 x1 + u x˙2 = p2 x2 + u . . . x˙n = pn xn + u. In Abhängigkeit der Zustandsvariablen X1 (s), X2 (s), . . . wird Gl. (7.36) zu Y (s) = b0 U (s) + c1 X1 (s) + c2 X2 (s) + . . . + cn Xn (s). Die inverse Laplace-Transformierte dieser Gleichung liefert die Ausgangsgleichung zu y = c1 x1 + c2 x2 + . . . + cn xn + b0 u. Die gesuchte Zustandsgleichung und die Ausgangsgleichung werden damit in der Vektorschreibweise zu
7.3 Normalformen der Zustandsraumdarstellung
p 0 ... 0 x1 1 x˙1 1 x˙ 0 p2 0 . . . 0 x 2 1 2 . . . . . ... . = · + ·u . . . . . . 1 x˙n xn 0 0 ... pn
187
y = c 1 c2
x1 x2 . . .
(7.37)
. . . cn · + b0 u x n−1 xn
(7.38)
Die Zustandsraumdarstellung entsprechend den Gleichungen (7.37) und (7.38) wird als Diagonalform bezeichnet. Das Bild 7.6 zeigt wieder das dazugehörige Blockschaltbild:
Bild 7.6: Blockschaltbild der Diagonalform
188
7 Mathematische Beschreibung linearer Systeme im Zustandsraum
Nun soll der Fall betrachtet werden, dass das Nennerpolynom der Gl. (7.25) auch mehrfache Wurzeln enthält. Gehen wir beispielsweise davon aus, dass der erste Pol dreifach vorkommt und alle restlichen Pole verschieden sind. Dann wird die faktorisierte Form der Gl. (7.25) zu Y (s) b0 s n + b1 s n−1 + . . . + bn−1 s + bn = . U (s) (s − p1 )3 (s − p4 )(s − p5 ) · . . . · (s − pn ) Die Partialbruchzerlegung dieser Gleichung wird dann zu Y (s) = b0 U (s) +
c1 c2 c3 U (s) + U (s) + U (s) + (s − p1 )3 (s − p1 )2 (s − p1 ) c4 cn U (s) + . . . + U (s) s − p4 s − pn
Definieren wir die Zustandsgrößen zu X1 (s) =
1 U (s) (s − p1 )3
X2 (s) =
1 U (s) (s − p1 )2
X3 (s) =
1 U (s) s − p1
X4 (s) =
1 U (s) s − p4
. . . Xn (s) =
1 U (s), s − pn
so stehen die Zustandsgrößen zueinander in folgender Beziehung: 1 X1 (s) = X2 (s) s − p1 1 X2 (s) = . X3 (s) s − p1
(7.39)
7.3 Normalformen der Zustandsraumdarstellung
189
Aus der Definition der Zustandsvariablen und der obigen beiden Gleichungen erhalten wir sX1 (s) = p1 X1 (s) + X2 (s) sX2 (s) = p1 X2 (s) + X3 (s) sX3 (s) = p1 X3 (s) + U (s) sX4 (s) = p4 X4 (s) + U (s) . . . sXn (s) = pn Xn (s) + U (s). Die Inversion dieser Laplace-transformierten n Gleichungen ergibt x˙1 = p1 x1 + x2 x˙2 = p1 x2 + x3 x˙3 = p1 x3 + u x˙4 = p4 x4 + u . . . x˙n = pn xn + u. Die Ausgangsgleichung (7.39) kann jetzt geschrieben werden als Y (s) = b0 U (s) + c1 X1 (s) + c2 X2 (s) + c3 X3 (s) + c4 X4 (s) + . . . + cn Xn (s). Die inverse Laplace-Transformierte dieser Gleichung lautet y = c1 x1 + c2 x2 + c3 x3 + . . . + cn xn + b0 u. Damit wird die vektorielle Darstellung für ein System mit einem mehrfachen Pol zu
x˙1
p1 x˙ 0 2 x˙3 0 x˙ 0 4= . . . x˙n
0
1 0 p1 1 0 p1 0 0
0
.
0 ...
0
0 ... 0 p4 . .
0 0
.
.
0
. pn
0 x 0 2 x3 1 x 1 · 4+ ·u . . . . . . x1
xn
1
(7.40)
190
7 Mathematische Beschreibung linearer Systeme im Zustandsraum
x1 x 2 . . . . cn · . + b0 u . . xn
y = c1 c2
(7.41)
Die Zustandsgleichung entsprechend der Gl. (7.40) sowie die Ausgangsgleichung gemäß Gl. (7.41) werden als Jordanform bezeichnet. Das folgende Bild zeigt wieder das entsprechende Blockschaltbild:
Bild 7.7: Blockschaltbild der Jordanform
Beispiel 7.12: Gegeben sei ein System mit der Übertragungsfunktion s+3 Y (s) . = 2 U (s) s + 3s + 2 Gesucht ist die Zustandsraumdarstellung in der Regelungsnormalform, in der Beobachtungsnormalform sowie in der Diagonalform.
7.3 Normalformen der Zustandsraumdarstellung
191
Durch entsprechende Vorgehensweise in den vorangegangenen Abschnitten erhält man für die Regelungsnormalform:
x˙1
=
x˙2
0 1 −2 −3
x1
x2
0 + u, 1
y= 3 1 ·
x1
,
x2
für die Beobachtungsnormalform:
x˙1
=
x˙2
0 −2 1 −3
x1
x2
3 + u, 1
y= 0 1 ·
x1
x2
,
und für die Diagonalform:
x˙1 x˙2
=
−1 0 0 −2
x1 x2
1 + u, 1
y = 2 −1 ·
x1 x2
.
8
Stabilität von Systemen
8.1
Einleitung
Der große Vorteil einer Regelung gegenüber einer Steuerung besteht in der Möglichkeit, durch ständige Überwachung der Ausgangsgröße(n) ein System auch dann gezielt zu beeinflussen, wenn es nur unvollständig bekannt ist. Da jedoch jede Regelung eine rückgekoppelte Struktur besitzt, können dabei Stabilitätsprobleme auftreten. Für einen in der Praxis brauchbaren Regelkreis muss gewährleistet sein, dass für beliebige Eingangssignale oder bei auftretenden Störungen keine bleibenden oder gar aufklingenden Schwingungen einer Regelgröße bzw. mehrerer Regelgrößen auftreten. In Anlehnung an Abschnitt 4.1 sollen hier noch einmal die wichtigsten Definitionen bezüglich der Stabilität von Systemen zusammengestellt werden, um einen guten Einstieg in die Definition der Stabilität auf dem Gebiet der Beschreibung von Systemen im Zustandsraum zu finden. Ein lineares zeitinvariantes System wird genau dann als stabil bezeichnet, wenn seine Sprungantwort mit zunehmender Zeit einem konstanten Wert entgegenstrebt bzw. seine Impulsantwort mit zunehmender Zeit gegen den Wert null läuft. In einfachen Fällen kann dieses Stabilitätskriterium direkt angewandt werden. Für kompliziertere Systeme ist es jedoch mühsam, den zeitlichen Verlauf der Sprung- bzw. Impulsantwort zu ermitteln. Bekannt, oder zumindest leicht zu ermitteln, ist hingegen die Übertragungsfunktion eines Systems bzw. eines Regelkreises, auf deren Untersuchung sich die Stabilitätsbetrachtung gemäß folgendem Satz reduzieren lässt: Ein lineares zeitinvariantes System ist genau dann stabil, wenn sämtliche Pole seiner Übertragungsfunktion einen negativen Realteil haben. Dieser Satz ist insofern schnell bewiesen, als man lediglich die gegebene Übertragungsfunktion in Partialbrüche zu zerlegen und die entstehenden Ausdrücke gliedweise in den Zeitbereich zurückzutransformieren hat. Gemäß der ersten Definition geht dann die Impulsantwort mit zunehmender Zeit nur dann gegen null, wenn – wie oben definiert – sämtliche Pole der Übertragungsfunktion des zu betrachtenden Systems einen negativen Realteil haben. Bei der Beurteilung der Stabilität entsprechend der zweiten Definition kommt nun erschwerend hinzu, dass für Systeme dritter oder höherer Ordnung ein relativ hoher Rechenaufwand notwendig ist, um die Polstellen zu berechnen und damit die Stabilität des Systems beurteilen zu können. Vorteilhaft wären deshalb Kriterien, mit denen die Stabilität beurteilt werden kann, ohne die Polstellen der Übertragungsfunktion bestimmen zu müssen.
8.2 Das Stabilitätskriterium von Liapunov für lineare Systeme im Zustandsraum
8.2
193
Das Stabilitätskriterium von Liapunov für lineare Systeme im Zustandsraum
In der Zustandsraumbeschreibung wird ein lineares System dann als stabil bezeichnet, wenn für jeden endlichen Anfangszustand x(0) die Bedingung lim x(t) = 0
t→∞
gilt.
(8.1)
Der Ausdruck x(t) ist dabei der Betrag des Zustandsvektors x(t); er ist definiert durch 1/ 2 n x(t) = xj2 (t) . (8.2) j =1
Es bedarf jedoch in der Regel eines erheblichen mathematischen Aufwandes, um die Stabilität anhand der Gl. (8.2) beurteilen zu können. Bezugnehmend auf Gl. (7.11) kann jedoch festgestellt werden, dass die Gl. (8.1) nur dann erfüllt und somit das betrachtete System stabil ist, wenn sämtliche Lösungen der – im Zustandsraum – charakteristischen Gleichung |sI − A| = 0
(8.3)
einen negativen Realteil haben. Bei Systemen dritter oder höherer Ordnung können jedoch bereits erhebliche mathematische Schwierigkeiten bei der Bestimmung der Eigenwerte gemäß Gl. (8.3) entstehen. 8.2.1
Erste Methode von Liapunov
Durch die im Folgenden zu erklärende Vorgehensweise wird die Stabilität des zu betrachtenden Systems anhand seiner Energiefunktion beurteilt. Aus der klassischen Mechanik ist bekannt, dass ein schwingfähiges System nur dann stabil ist, wenn seine Gesamtenergie, eine positiv definite Funktion, kontinuierlich abnimmt. Dies bedeutet wiederum, dass die zeitliche Ableitung der Gesamtenergie negativ definit sein muss, bis ein stabiler Gleichgewichtszustand erreicht ist. Betrachten wir hierzu das Beispiel des ungestörten mechanischen Schwingers im Bild 7.3. Die beschreibende Differenzialgleichung wird mit m = c = d = 1 zu d2 y(t) dy(t) + y(t) = 0. + dt 2 dt Die Zustandsgrößen seien zu x1 (t) = y(t), x2 (t) = y(t) ˙ definiert. Damit kann das System durch zwei Differenzialgleichungen erster Ordnung beschrieben werden:
194
8 Stabilität von Systemen
x˙1 (t) = x2 (t), x˙2 (t) = −x1 (t) − x2 (t). Mit den (angenommenen)Anfangswerten x1 (0) = 0; x2 (0) = 0 erhält man folgende Lösungen der obigen Differenzialgleichung: (8.4) x1 (t) = 1,15 · e−t / 2 · sin (0,866 t + π/3), x2 (t) = −1,15 · e−t / 2 · sin (0,866 t).
(8.5)
Wie man aus den beiden Gleichungen unschwer erkennen kann, handelt es sich offenbar um ein stabiles System, weil die beiden Zustandsgrößen mit zunehmender Zeit gegen null streben. Nun soll dieses einfache Beispiel vom energetischen Standpunkt betrachtet werden: Die gesamte gespeicherte Energie ist gegeben zu V (t) = c ·
x12 x2 +d · 2. 2 2
Mit c = d = 1 wird obige Gleichung zu V (t) =
x12 x2 + 2. 2 2
(8.6)
Diese Energie dissipiert natürlich als Wärme im Dämpfer mit einer Rate ∂V (t) dx2 ∂V (t) dx1 + = −x˙1 (t)x2 (t) = −x22 (t). V˙ (t) = ∂x1 dt ∂x2 dt Berechnet man den zeitlichen Verlauf der Funktionen V (t) und V˙ (t), so erhält man . V (t) = 0,667 · e−t · sin2 (0.86 t) + sin2 (0,86 t + π/3) , V˙ (t) = −1,33 · e−t · sin2 (0,86 t).
(8.7)
(8.8) (8.9)
Aus diesen Gleichungen ist unschwer zu erkennen, dass die Gesamtenergie mit zunehmender Zeit kontinuierlich gegen null strebt (positiv definit) und der zeitliche Gradient der Gesamtenergie stets negativ ist (negativ definit). Daraus ist wiederum ersichtlich, dass das betrachtete System asymptotisch stabil ist. 8.2.2
Zweite Methode von Liapunov
Aus den vorangegangenen Betrachtungen ist leicht ersichtlich, dass die Aufstellung der jeweiligen Energiefunktion zur Beurteilung der Stabilität von Systemen sehr schnell zu erheblichem mathematischen Aufwand führen kann. Liapunov geht deshalb bei seiner zweiten Methode weniger von energetischen als mehr von systemtheoretischen Betrachtungen aus. Bevor jedoch diese Methode näher untersucht werden kann, müssen einige Definitionen der Analysis eingeführt werden.
8.2 Das Stabilitätskriterium von Liapunov für lineare Systeme im Zustandsraum
195
1. Eine Klasse skalarer Funktionen, die eine wesentliche Rolle bei der Stabilitätsanalyse spielen, ist die sog. quadratische Form: x1 p11 p12 . . . p1n p p ... p x 2n 2 12 22 . . · , . . . xn · . . . . p1n p2n . . . pnn xn
V (x) = x T P x = x1 x2 x3
x ist dabei ein reeller Vektor, P ist eine reelle symmetrische Matrix. 2. Hermetische Matrix: Eine Matrix mit komplexen Elementen wird als komplexe Matrix bezeichnet. Erfüllt eine komplexe Matrix P die Beziehung P∗ = P
oder
aij = a¯ j i ,
so wird die Matrix P als hermetisch bezeichnet. In der Vektorschreibweise drückt sich diese Eigenschaft folgendermaßen aus: x1 p11 p12 . . . p1n p¯ p . . . p x 2n 2 12 22 . . · . . . . x¯n · . . . . p¯ 1n p¯ 2n . . . pnn xn
V (x) = x ∗ P x = x¯1 x¯2 x¯3
Für einen reellen Vektor x und eine reelle symmetrische Matrix P ist die hermetische Form mit der quadratischen Form identisch. 3. Eine skalare quadratische Funktion V (x) wird als positiv definit bezeichnet, wenn die notwendige und hinreichende Bedingung erfüllt ist, dass alle Unterdeterminanten der Matrix P von links oben beginnend positiv sind (Regel von Sylvester), d.h.
|p11 | > 0;
p p 11 12 > 0; p¯ 12 p22
...
(Für quadratische Formen ist p¯ ij = pij .)
p11 p12 . . . p1n p¯ 12 p22 . . . p2n . > 0. . . p¯ 1n p¯ 2n . . . pnn
196
8 Stabilität von Systemen
Beispiel 8.1: Es ist zu zeigen, dass folgende quadratische Form positiv definit ist: V (x) = 10x12 + 4x22 + x32 + 2x1 x2 − 2x2 x3 − 4x1 x3 . Die Funktion V (x) lautet in der Vektorschreibweise 10 1 −2 x1 " # T V (x) = x P x = x1 x2 x3 1 4 −1 x2 x3 −2 −1 1 Durch Anwenden der Regel von Sylvester erhält man 10 1 −2 10 1 10 > 0; > 0; 1 4 −1 > 0. 1 4 −2 −1 1 Nachdem alle Unterdeterminanten entlang der Hauptdiagonalen der Matrix P positiv definit sind, ist V (x) positiv definit. 4. Eine skalare Funktion V (x) ist negativ definit, wenn −V (x) positiv definit ist z.B.: V (x) = x12 + 2x22 V (x) = (x1 + x2 V (x) =
−x12
positiv definit
)2
− (3x1 + 2x2
V (x) = x1 x2 + x22
positiv semidefinit )2
negativ definit indefinit
Nach diesen einleitenden Definitionen kann nun zur Erläuterung der zweiten Liapunov’schen Methode übergegangen werden. Diese Methode ist rein algebraisch und erfordert nicht die Lösung der charakteristischen Gleichung |sI − A| = 0. Darüber hinaus kann diese Methode zur Bestimmung des optimalen Reglers herangezogen werden, wie sich in einem späteren Kapitel zeigen wird. Ausgegangen wird von der Zustandsgleichung des linearen ungestörten Systems x˙ = Ax
(8.10)
wobei x der n-dimensionale Zustandsvektor und A eine konstante (n × n)-Matrix ist; die Matrix A wird als nichtsingulär angenommen. Anhand obiger Gleichung ist zu sehen, dass der einzig mögliche Gleichgewichtszustand der Koordinatenursprung x = 0 ist. Für das durch Gl. (8.10) definierte System soll die Funktion V (x) = x ∗ P x
8.2 Das Stabilitätskriterium von Liapunov für lineare Systeme im Zustandsraum
197
als mögliche Liapunov-Funktion definiert werden, wobei P eine positiv definite hermetische Matrix ist (wenn x ein reeller Vektor und A eine reelle Matrix ist, dann kann P auch als positiv definite reelle symmetrische Matrix gewählt werden). Die zeitliche Ableitung von V (x) entlang einer beliebigen Trajektorie wird zu 1.
V˙ (x) = x˙ ∗ P x + x ∗ P x˙ = (Ax)∗ P x + x ∗ P Ax = x ∗ A∗ P x + x ∗ P Ax = x ∗ (A∗ P + P A) x.
Weil die Energie-Funktion V (x) für asymptotische Stabilität als positiv definit vorausgesetzt wird, muss V˙ (x) als negativ definit vorausgesetzt werden; somit muss gelten 2.
V˙ (x) = −x ∗ Qx.
Setzt man die Gleichungen 1) und 2) gleich, so erhält man Q = −(A∗ P + P A) = positiv definit. Das System gemäß Gl. (8.10) ist somit asymptotisch stabil, wenn die Matrix Q positiv definit ist. Um nun zu prüfen, ob diese (n × n)-Matrix positiv definit ist, wird das Kriterium von Sylvester angewandt: Eine notwendige und hinreichende Bedingung für eine positiv definite Matrix ist, dass sämtliche Unterdeterminanten entlang der Hauptdiagonalen positiv sind, wie bereits weiter oben festgestellt worden ist. Statt nun zunächst eine positiv definite Matrix P zu spezifizieren und zu prüfen, ob die Matrix Q positiv definit ist oder nicht, ist es nahe liegend, erst eine positiv definite Matrix Q zu definieren und dann zu prüfen, ob die Matrix P , determiniert aus A∗ P + P A = −Q, positiv definit ist oder nicht. Die bisherigen Erkenntnisse sollen nun als (das von Liapunov definierte) Theorem zusammengefasst werden. Theorem: Betrachtet sei das System x˙ = Ax, wobei x ein n-dimensionaler Zustandsvektor und A eine konstante, nicht singuläre Matrix ist. Eine notwendige und hinreichende Bedingung, dass der Gleichgewichtszustand x = 0 asymptotisch stabil ist, besteht darin, dass für eine gegebene positiv definite hermetische oder reell symmetrische Matrix Q eine positiv definite hermetische oder reell symmetrische Matrix P derart existiert, dass die Gleichung A∗ P + P A = −Q erfüllt ist. Die skalare Funktion x ∗ P x ist Liapunov-Funktion des gegebenen Systems.
198
8 Stabilität von Systemen
Ergänzende Kommentare: 1. Wenn für das zu betrachtende System der Zustandsvektor x und die Systemmatrix A reell sind, dann wird die Liapunov-Funktion x ∗ P x zu x T P x und die Liapunov-Gleichung bekommt dann die Form AT P + P A = −Q. 2. Die Aussage bez. der asymptotischen Stabilität hängt nicht von einer expliziten Matrix Q ab, soweit sie nur positiv definit ist. 3. Zur Feststellung, ob eine positiv-definite, hermetische oder reell symmetrische Matrix P existiert oder nicht, ist es (der einfachen Rechnung wegen) nahe liegend, die Matrix Q zur Einheitsmatrix zu wählen, d.h. Q = I . Somit werden die Elemente der Matrix P aus der Gleichung A∗ P + P A = −I ermittelt und auf die Eigenschaft positiv definit überprüft. 4. Zur Bestimmung der Elemente der Matrix P werden die Matrizen A∗ P + P Aund −Q elementweise gleichgesetzt. Daraus ergeben sich n(n + 1 2) lineare Gleichungen zur Bestimmung der Elemente pij = p¯ j i der Matrix P . 5. Es kann gezeigt werden, dass V˙ (x) entlang jeder Trajektorie nicht identisch null wird, wenn eine positiv semidefinite Matrix Q folgende Rangbedingung erfüllt:
Q1/ 2 Q1/ 2 A . = n. Rang . . 1 2 n−1 Q/ A Beispiel 8.2: Ein System zweiter Ordnung sei durch folgende Zustandsgleichung gegeben: x˙1 0 1 x1 = . −1 −1 x˙2 x2 Obwohl man sofort sieht, dass dieses System stabil ist, soll die Stabilität trotzdem mit Liapunov überprüft werden. Die Liapunov-Funktion lautet V (x) = x T P x,
8.2 Das Stabilitätskriterium von Liapunov für lineare Systeme im Zustandsraum
199
wobei P aus der Gleichung AT P + P A = −I ermittelt wird. Diese Gleichung wird, ausführlich angeschrieben, zu
0 −1 1 −1
p11 p12
+
p12 p22
p11 p12 p12 p22
0 1 −1 −1
=
−1 0 . 0 −1
Durch Ausmultiplizieren dieser Matrix erhält man folgende Gleichungen: −2p12 = −1 p11 − p12 − p22 = 0 2p12 − 2p22 = −1. Wenn man daraus die Koeffizienten p11 , p12 , p22 ermittelt, so erhält man die Matrix P =
p11 p12
p12 p22
3 1 2 2 . = 1 1 2
Um zu prüfen, ob die Matrix P positiv definit ist, werden nach der Regel von Sylvester die entsprechenden Unterdeterminanten berechnet: 3 2 > 0,
3 1 2 2 > 0. 1 1 2
Es ist leicht einzusehen, dass die Matrix P positiv definit ist. Damit ist der Gleichgewichtszustand im Koordinatenursprung asymptotisch stabil und die Liapunov-Funktion lautet für dieses Beispiel V (x) = x T P x = und
1 2 3x1 + 2x1 x2 + 2x22 2
" # V˙ (x) = − x12 + x22 .
Beispiel 8.3: Es soll der Bereich der Verstärkung K des folgenden Regelkreises für stabiles Regelverhalten ermittelt werden.
200
8 Stabilität von Systemen
Bild 8.1: Beurteilung der Stabilität mit Liapunov
Aufstellen der Zustandsgleichung: 1 X1 (s) = ; X2 (s) s
sX1 (s) = X2 (s);
x˙1 = x2 ;
1 X2 (s) ; = s+2 X3 (s)
sX2 (s) = −2X2 (s) + X3 (s);
x˙2 = −2x2 + x3 ;
X3 (s) =
K · (U (s) − X1 (s)); s+1
x˙3 = −Kx1 − x3 + Ku.
(I)
(II)
(III)
Damit wird die Zustandsgleichung in vektorieller Form zu
0 1 0 x1 0 x˙2 = 0 −2 1 · x2 + 0 · u −K 0 −1 K x˙3 x3 x˙1
(IV)
Zur Bestimmung der Stabilität wird der Eingang u zu null angenommen. Aus den Gleichungen (I) bis (III) folgt, dass der Ursprung x = 0 Gleichgewichtszustand ist. Nachweis: x˙1 = 0 → x2 = 0; x˙2 = −2x2 + x3 = 0; x˙3 = 0;
→ x3 = 0;
→ x1 = 0.
Die reelle, positiv semidefinite, symmetrische Matrix Q werde angesetzt zu
0 0 0 Q = 0 0 0 0 0 1
(V)
Obige Wahl von Q ist erlaubt, weil V˙ (x) = −x T Qx nirgends außer im Ursprung identisch null sein kann.
8.2 Das Stabilitätskriterium von Liapunov für lineare Systeme im Zustandsraum
201
Nachweis, dass dieser Ansatz für Q mathematisch gerechtfertigt ist: Aus Gl. (V) folgt V˙ (x) = −x T Qx = −x32 ; • • •
(VI)
V˙ (x) identisch null bedeutet x3 ≡ 0, siehe Gl. (VI); Für x3 ≡ 0 muss auch gelten: x1 ≡ 0; wegen x˙3 = −Kx1 − x3 bzw. 0 = −Kx1 − 0; Für x1 ≡ 0 folgt: x2 ≡ 0; wegen x˙1 = x2 bzw. 0 = x2 .
Ergo: V˙ (x) ist nur im Ursprung identisch null. Damit darf Q – entsprechend der obigen Definition – zur Stabilitätsanalyse herangezogen werden:
0 0 0
0 0 0
12 Q/ 0 0 1/ 2 0 Q A = 0 1 2 2 / 0 −K Q A 0 0 0 0 K −K
0 0 1 0 0 −1 0 0 1
Der Rang dieser Matrix ist 3 für K = 0. Somit darf die Matrix Q in die Liapunov-Gleichung eingesetzt werden. Die Liapunov-Gleichung wird damit zu AT P + P A = −Q :
0 0 −K p11 p12 p13 p11 p12 p13 0 1 0 0 p12 p22 p23 + p12 p22 p23 0 −2 1 1 −2 0 1 −1 −K 0 −1 p13 p23 p33 p13 p23 p33
0 0
0
= 0 0 0. 0 0 −1
202
8 Stabilität von Systemen
Ermittelt man daraus die Matrix P , so erhält man 2 6K K + 12K 0 12 − 2K 12 − 2K 6K K 6 P = . 12 − 2K 12 − 2K 12 − 2K K 6 0 12 − 2K 12 − 2K Damit die Matrix P positiv definit ist, muss wiederum gelten: 12 − 2K > 0
und K > 0
bzw.
0 < K < 6.
Die Probe mit Hurwitz führt natürlich zum selben Ergebnis.
9
Regelkreis-Synthese im Zustandsraum
9.1
Einleitung
Der wesentliche Nachteil der klassischen Regelungstechnik besteht in der ausschließlichen Einsatzmöglichkeit für lineare Eingrößensysteme. Hingegen können mit der Zustandsbeschreibung außer den hier erwähnten Problemkreisen auch Mehrgrößensysteme und nicht lineare Systeme behandelt werden. Darüber hinaus kann mit Hilfe der klassischen Regelungstechnik keine optimale Regelungstechnik betrieben und damit können auch keine adaptiven Regler erstellt werden. In den folgenden Abschnitten werden im Wesentlichen nachstehende Synthese-Verfahren besprochen: •
Reglerdimensionierung durch Polzuweisung,
• •
Regelung basierend auf dem Beobachterprinzip, optimale Regelung, basierend auf einem quadratischen Güteindex.
9.2
Das Verfahren der Polzuweisung
Bei dem vorzustellenden Verfahren wird vorausgesetzt, dass sämtliche, bei der Aufstellung der Zustandsgleichung definierten Zustandsvariablen physikalisch messbare Größen sind. Weiterhin soll gezeigt werden, dass die Pole eines geschlossenen Regelkreises beliebig gewählt werden können, wenn das zu regelnde System vollkommen zustandssteuerbar ist. Im Zuge der klassischen Regelkreis-Synthese eines Eingrößensystems wird der Regler so ausgelegt, dass der geschlossene Regelkreis ein dominantes Polpaar einnimmt, wodurch eine gewünschte Dämpfung d und eine gewünschte Eigenfrequenz ω0 der Regelgröße gewährleistet ist. Im Gegensatz hierzu werden bei der Methode der Polzuweisung sämtliche Pole des geschlossenen Regelkreises spezifiziert. Ausgegangen wird von der Zustandsgleichung des zu regelnden Systems x˙ = Ax + Bu mit x A B
n-dimensionaler Zustandsvektor konstante (n × n)-Systemmatrix konstante (n × 1)-Steuermatrix
(9.1)
204
9 Regelkreis-Synthese im Zustandsraum
Wir verwenden als Stellgröße das Signal u = −Kx.
(9.2)
Diese Form der Regelung wird (logischerweise) als Zustandsrückführung bezeichnet. Die (1 × n)-Matrix K ist die Zustandsrückführmatrix. Setzt man Gl. (9.2) in Gl. (9.1) ein, so erhält man ˙ = (A − BK) · x(t). x(t)
(9.3)
Der zeitliche Verlauf des Zustandsvektors ist damit gegeben durch x(t) = e(A−BK)t x(0), wobei x(0) der Anfangszustand des gegebenen Systems ist; die Stabilität und das Übergangsverhalten ergeben sich aus den Eigenwerten der Matrix A − BK. Die Eigenwerte der Matrix A−BKwerden als Reglerpole bezeichnet. Wenn diese Pole sämtlich in der linken s-Halbebene liegen, dann nähert sich x(t) mit zunehmender Zeit t dem Wert null. Das Bild 9.1 zeigt das ungeregelte System entsprechend der Zustandsgleichung (9.1); es ist ein gesteuertes System, weil der Zustandsvektor nicht rückgeführt wird.
Bild 9.1: a) Gesteuertes System; b) geschlossenes System mit u = −Kx
Es kann gezeigt werden, dass die Technik der Polzuweisung für ein gegebenes System nur dann möglich ist, wenn das zu regelnde System vollkommen zustandssteuerbar ist. Es sollen nun zwei Methoden zur Bestimmung der Rückführmatrix K aufgezeigt werden. Bei der ersten Methode wird eine Transformationsmatrix T aufgestellt, mit der die ursprüngliche Zustandsgleichung in eine steuerbare Normalform transformiert und die entstandene Gleichung mit der gewünschten charakteristischen Gleichung verglichen wird. Durch einen Koeffizientenvergleich erhält man daraus die Koeffizienten der gesuchten Rückführmatrix K. Die zweite Methode basiert auf dem Cayley-Hamilton-Theorem, das besagt, dass die Matrix A − BK = Aˆ
9.2 Das Verfahren der Polzuweisung
205
ihre eigene charakteristische Gleichungerfüllt. Durch eine entsprechende Modifikation des ˆ charakteristischen Matrix-Polynoms Φ A lässt sich wieder eine Gleichung für die Verstärkungsmatrix K ableiten. Die Gleichung zur Bestimmung der Verstärkungsmatrix K wird in der anglikanischen Literatur als Ackermann’sche Formel bezeichnet.
9.2.1
Bestimmung der Rückführmatrix mit Hilfe der steuerbaren Normalform
Zu Grunde gelegt seien die Systemgleichung (9.1) sowie die Gleichung des geregelten Systems entsprechend dem Ausdruck (9.3). Durch T = Sc · W
(9.4)
wird eine Transformationsmatrix T definiert, wobei S c = B AB . . . An−1 B
(9.5)
die bereits bekannte Steuerbarkeitsmatrix ist; die Matrix W ist gegeben zu
an−1 an−2 an−2 an−3 . . . W = . . . 1 a1 1 0
. . . a1 1 ... 1 . . . ... 0 ... 0
0 . . , . 0 0
(9.6)
wobei die Koeffizienten der obigen Matrix die des charakteristischen Polynoms |sI − A| = s n + a1 s n−1 + . . . + an−1 s + an
(9.7)
sind. Definieren wir nun einen neuen Zustandsvektor ˆ x = T x. Weil das System als vollständig steuerbar vorausgesetzt wird, muss die Steuerbarkeitsmatrix S c den vollen Rang n haben. Damit existiert auch die Inverse der Matrix T und Gl. (9.1) kann modifiziert werden zu x˙ˆ = T −1 AT xˆ + T −1 Bu
(9.8)
206
9 Regelkreis-Synthese im Zustandsraum
wobei gilt
0 1 0 0 1 0 . . . −1 T AT = . . . 0 0 0 −an −an−1 −an−2
0 0 . . ... 1 . . . −a1 ... ...
0 0 . −1 T B = . . . 0 1
(9.9)
(9.10)
Die spezifizierten Eigenwerte des geregelten Systems sollen mit µ1 , µ2 , . . . , µn bezeichnet werden. Damit wird die charakteristische Gleichung unter Verwendung der gewollten Eigenwerte des geregelten Systems zu (s − µ1 )(s − µ2 ) . . . (s − µn ) = s n + α1 s n−1 + α2 s n−2 + . . . + αn−1 s + αn . (9.11) Definieren wir weiter für den modifizierten Zustandsvektor eine modifizierte Rückführmatrix zu Kˆ = KT = δn δn−1 . . . δ1 .
(9.12)
Mit u = −Kˆ xˆ = −KT xˆ wird die ursprüngliche Systemgleichung zu ˆ x˙ˆ = T −1 AT xˆ − T −1 BKT x. Damit wird jetzt die charakteristische Gleichung des geregelten Systems zu sI − T −1 AT + T −1 BKT = 0. Nun soll die charakteristische Gleichung des Systems, dargestellt in der Steuerungsnormalform, vereinfacht werden:
9.2 Das Verfahren der Polzuweisung
207
Bezugnehmend auf die Gleichungen (9.9), (9.10) und (9.12) gilt sI − T −1 AT + T −1 BKT 0 1 ... 0 0 . . . 0 . . . = sI − + . · δn δn−1 . . . δ1 . . . . 0 ... 1 0 1 −an −an−1 . . . −a1 = a
s −1 ... 0 0 s ... 0 . . . n + δn an−1 + δn−1 . . . s + a1 + δ1
= s n + (a1 + δ1 )s n−1 + . . . + (an−1 + δn−1 )s + (an + δn ) = 0.
(9.13)
Gl. (9.13) ist die gesuchte charakteristische Gleichung für das geregelte System mit Zustandsrückführung. Die Lösungen dieser Gleichung müssen mit den Lösungen der Gl. (9.11) identisch sein. Setzt man die Koeffizienten gleicher Potenzen von s dieser beiden Ausdrücke zueinander gleich, so erhält man a1 + δ1 = α1 a2 + δ2 = α2 . . . a n + δ n = αn . Lösen wir obige Gleichungen nach den jeweiligen Unbekannten δi auf und setzen diese in Gl. (9.12) ein, so bekommen wir die gesuchte Rückführmatrix zu ˆ −1 = δn δn−1 . . . δ1 T −1 K = KT = αn − an αn−1 − an−1 . . . α2 − a2 α1 − a1 T −1 . (9.14) Zusammenfassung: Basierend auf der obigen Herleitung der Matrix K lässt sich die Vorgehensweise der Technik der Polzuweisung in folgende Schritte einteilen: Schritt 1:
Zunächst ist die Steuerbarkeit des zu regelnden Systems zu überprüfen. Die Steuerbarkeitsmatrix muss den Rang n haben. Falls dem nicht so ist, kann die Gl. (9.14) nicht angewandt werden!
208
9 Regelkreis-Synthese im Zustandsraum
2. Schritt: Aus der charakteristischen Gleichung |sI − A| = s n + a1 s n−1 + . . . + an−1 s + an sind die Koeffizienten a1 , a2 , . . . , an zu bestimmen. 3. Schritt: Bestimmung der Transformationsmatrix T , mit der die gegebene Zustandsgleichung in die Steuerungsnormalform transformiert wird. (Wenn das zu regelnde System bereits in der Steuerungsnormalform gegeben ist, wird T = I .) Die entsprechende Transformationsmatrix ist gegeben zu T = S c W wobei die Steuerbarkeitsmatrix S c durch Gl. (9.5) und W durch Gl. (9.6) gegeben ist. 4. Schritt: Schreibt man die charakteristische Gleichung der gewollten Eigenwerte (s − µ1 )(s − µ2 ) . . . (s − µn ) = s n + α1 s n−1 + α2 s n−2 + . . . + αn−1 s + αn des geregelten Systems an, so erhält man daraus die Koeffizienten α1 , α2 , . . . , αn . 5. Schritt: Die gesuchte Zustandsrückführmatrix erhält man schließlich aus folgender Gleichung: K = αn − an αn−1 − an−1 . . . α2 − a2 α1 − a1 · T −1 . Bemerkung: Wenn das gegebene System von dritter oder geringerer Ordnung ist, dann bietet sich häufig die direkte Substitution der Matrix K in das gewünschte charakteristische Polynom als einfacherer Lösungsweg an: Für einen Systemgrad n = 3 lautet die Rückführmatrix bekanntlich K = k1 k2 k3 . Setzt man die Matrix K in das gewünschte charakteristische Polynom ein, so erhält man folgende Gleichung: |sI − A + BK| = (s − µ1 )(s − µ2 )(s − µ3 ). Weil beide Seiten dieser Gleichung Polynome in s sind, erhält man durch einen Vergleich der Koeffizienten bei jeweils gleichen Potenzen in s die Faktoren k1 , k2 und k3 . 9.2.2
Bestimmung der Rückführmatrix mit der Ackermann’schen Formel
Es wird wieder von den Systemgleichungen (9.1) und (9.2) ausgegangen. Setzen wir Gl. (9.2) in (9.1) ein, so erhalten wir ˙ = (A − BK) · x(t). x(t)
9.2 Das Verfahren der Polzuweisung
209
Mit der Definition Aˆ = (A − BK) wird die gewünschte charakteristische Gleichung zu |sI − A + BK| = sI − Aˆ = (s − µ1 )(s − µ2 ) . . . (s − µn ) = s n + α1 s n−1 + α2 s n−2 + . . . + αn−1 s + αn = 0. Mit der Definition Φ(s) = s n + α1 s n−1 + α2 s n−2 + . . . + αn−1 s + αn
wird
Φ(A) = An + α1 An−1 + α2 An−2 + . . . + αn−1 A + αn I
(9.15)
Weil das Cayley-Hamilton-Theorem seine eigene charakteristische Gleichung erfüllt, gilt auch Φ Aˆ = Aˆ n + α1 Aˆ n−1 + α2 Aˆ n−2 + . . . + αn−1 Aˆ + αn I = 0. (9.16) Mit Hilfe der Gl. (9.16) soll nun die Ackermann-Formel hergeleitet werden. Zur Vereinfachung der Herleitung wird – ohne Verlust der Allgemeingültigkeit – von einem System dritter Ordnung ausgegangen. Stellen wir zunächst folgende Identitäten auf: I = I; Aˆ = (A − BK); ˆ Aˆ 2 = (A − BK)2 = A2 − ABK − BK A; Aˆ 3 = (A − BK)3 = A3 − A2 BK − ABK Aˆ − BK Aˆ 2 . Multipliziert man diese Gleichungen der Reihe nach von links mit α3 , α2 , α1 , α0 (wobei α0 = 0 ist) und addiert die Ergebnisse, so erhält man α3 I + α2 Aˆ + α1 Aˆ 2 + Aˆ 3 = α3 I + α2 (A − BK) + α1 A2 − ABK − BK Aˆ + A3 − A2 BK −ABK Aˆ − BK Aˆ = α3 I + α2 A + α1 A2 + A3 − α2 BK − α1 ABK − α1 BK Aˆ − A2 BK −ABK Aˆ − BK Aˆ 2 . Gemäß Gl. (9.16) gilt α3 I + α2 Aˆ + α1 Aˆ 2 + Aˆ 3 = Φ Aˆ = 0.
(9.17)
210
9 Regelkreis-Synthese im Zustandsraum
Weiterhin gilt α3 I + α2 Aˆ + α1 A2 + A3 = Φ Aˆ = 0. Setzt man die letzten beiden Gleichungen in Gl. (9.17) ein, so erhält man ˆ = Φ(A) − α2 BK − α1 BK Aˆ − BK Aˆ 2 − α1 ABK − ABK Aˆ − A2 BK. Φ(A) ˆ = 0 erhalten wir Wegen Φ(A) Φ(A) = B α2 K + α1 K Aˆ + K Aˆ 2 + AB α1 K + K Aˆ + A2 BK
α2 K + α1 K Aˆ + K Aˆ 2 = B AB A2 B . α1 K + K Aˆ
(9.18)
K Weil das System als vollkommen steuerbar vorausgesetzt wird, muss die Inverse der Steuerbarkeitsmatrix S c = B AB A2 B existieren. Multipliziert man beide Seiten der Gl. (9.18) von links mit der inversen Steuerbarkeitsmatrix, so erhält man α2 K + α1 K Aˆ + K Aˆ 2 −1 · Φ(A) = B AB A2 B . α1 K + K Aˆ K Multipliziert man beide Seiten dieser Gleichung von links mit 0 0 1 , so erhält man α2 K + α1 K Aˆ + K Aˆ 2 −1 0 0 1 · B AB A2 B · Φ(A) = 0 0 1 = K, α1 K + K Aˆ
K diese Gleichung lässt sich verkürzt anschreiben zu −1 Φ(A) K = 0 0 1 · B AB A2 B Die letzte Gleichung liefert die gesuchte Zustandsrückführmatrix K. Für ein System der beliebigen Ordnung n wird Kzu −1 Φ(A) K = 0 0 . . . 1 · B AB A2 B . . . An−1 B −1 = 0 0 . . . 1 · S c · Φ(A)
(9.19)
9.2 Das Verfahren der Polzuweisung
211
mit S c = B AB . . . An−1 B Die Gl. (9.19) wird in der anglikanischen Literatur als Ackermann’sche Formel bezeichnet und dient der Bestimmung der Koeffizienten der Zustandsrückführmatrix K. Beispiel 9.1: Gegeben ist ein System x˙ = Ax + bu mit 0 1 0 A= ; b= , 20,6 0 1 wobei beachtet werden sollte, dass im gegebenen Beispiel die Matrix A bereits in der Frobenius-Form gegeben ist. Die charakteristische Gleichung des (ungeregelten) Systems lautet somit s −1 |sI − A| = = s 2 − 20,6 = 0. −20,6 s Die charakteristischen Eigenwerte ergeben sich aus dieser Gleichung zu s1/ 2 = ±4, 539; das System ist damit instabil. Mit Hilfe der Zustandsrückführung u = −Kx sollen die Pole des geschlossenen Regelkreises die Werte s1/ 2 = −1,8 ± j2,4 annehmen, d.h. die Eigenwerte der Matrix A − bK sollen an den Stellen µ1 = −1,8 + j2,4
und
µ2 = −1,8 − j2,4 zu liegen kommen und das System somit stabilisiert werden. Gesucht ist die Zustandsrückführmatrix K für diese Zielsetzung. Lösung: Zunächst muss der Rang der Steuerbarkeitsmatrix geprüft werden: Es gilt S c = [b
Ab] =
0 1
1 . 0
Der Rang der Steuerbarkeitsmatrix ist 2; das Verfahren der Polzuweisung ist damit möglich. Diese Aufgabe soll nun mit Hilfe der drei aufgezeigten Möglichkeiten gelöst werden.
212
Methode 1:
9 Regelkreis-Synthese im Zustandsraum
Bei dieser Methode soll die Gl. (9.14) angewandt werden. Weil die Zustandsgleichung bereits in der Steuerungsnormalform gegeben ist, wird die Transformationsmatrix T zur Einheitsmatrix; d.h. T = I . Aus der charakteristischen Gleichung des Originalsystems ergeben sich die entsprechenden Koeffizienten zu a1 = 0;
a2 = −20,6
Das gewünschte charakteristische Polynom lautet mit den oben spezifizierten Polstellen (s − µ1 )(s − µ2 ) = (s + 1,8 − j2,4)(s + 1,8 + j2,4) = s 2 + 3,6s + 9 = s 2 + α1 s + α2 . Somit ist α1 = 3,6; α2 = 9. Bezugnehmend auf Gl. (9.14) bekommen wir mit T = I K = α2 − a2 α1 − a1 · T −1 = 9 + 20,6 3,6 − 0 · I −1 = 29,6 3,6 . Methode 2:
Hier soll die direkte Methode zur Bestimmung der Matrix K angewandt werden. Das charakteristische Polynom des gewünschten Systemverhaltens lautet s 0 0 1 0 |[sI − A + bK]| = − + · k 1 k2 0 s 20,6 0 1 s −1 = = s 2 + k2 s − 20,6 + k1 . −20, 6 + k1 s + k2 Dieses charakteristische Polynom ist mit dem Polynom der gewollten Eigenwerte gleichzusetzen: (s − µ1 )(s − µ2 ) = (s + 1,8 − j2,4)(s + 1,8 + j2,4) = s 2 + 3,6s + 9. Durch einen Vergleich der Koeffizienten bei jeweils gleichen Potenzen in s folgt k1 = 29,6; k2 = 3,6 oder K = k1 k2 = 29,6 3,6 .
Methode 3:
Hier soll die Ackermann-Formel gemäß Gl. (9.19) angewandt werden: Weil das gewünschte charakteristische Polynom |[sI − A + bK]| = sI − Aˆ = s 2 + 3,6s + 9 = Φ(s) lautet, wird Φ(A) zu
9.2 Das Verfahren der Polzuweisung
Φ(A) = A2 + 3,6 · A + 9 · I 0 1 0 1 0 = · + 3,6 20,6 0 20,6 0 20,6 29,6 3,6 = . 74,16 29,6
213
1 0
+9
1
0
0
1
Daraus erhält man die gesuchte Matrix K zu −1 −1 0 1 29,6 3,6 K = 0 1 b Ab Φ(A) = 0 1 74,16 29,6 1 0 = 29,6 3,6 . Das folgende Bild zeigt schließlich das Blockschaltbild des geregelten Systems.
Bild 9.2: Blockschaltbild auf der Basis der Zustandsrückführung
Beispiel 9.2: Bei der Regelung des invertierten Pendels besteht das Regelproblem gemäß Bild 9.3 darin, den auf einem Fahrwagen drehbar montierten Stab kontinuierlich in senkrechter Stellung zu halten. Das invertierte Pendel kann als Modell einer Rakete betrachtet werden, deren Anstellwinkel während der Startphase durch so genannte Steuerdüsen zu regeln ist, um die Rakete in die angestrebte Zielbahn zu überführen. Im Bild 9.3 ist θ der eingeschlossene Winkel zwischen dem Stab und der Vertikalen. Wenn man von kleinen Winkeln bez. θ ausgeht, dann ist die Näherung sin θ ≈ θ und cos θ ≈ 1 si-
214
9 Regelkreis-Synthese im Zustandsraum
cher gerechtfertigt. Ebenso darf wegen der vorausgesetzten kleinen Winkelgeschwindigkeiten θ θ˙ ≈ 0 angenommen werden. Die Aufgabenstellung besteht in diesem Beispiel darin, einen Regler zu entwerfen, der den durch eine Störung aus der vertikalen Position gebrachten Stab mit zufrieden stellender Dynamik wieder in die Vertikale und den Fahrwagen in die Bezugsposition x = 0 bringt und dort hält.
Bild 9.3: Gerätebild des invertierten Pendels
Als Qualitätskriterien bez. der Dynamik des transienten Vorgangs soll von einer Ausregelzeit von ca. 2 Sekunden und einer Dämpfung von d = 0,5 für das Standard-System zweiter Ordnung ausgegangen werden. Die Bewegungsgleichungen bezüglich der Position x(t) und des Auslenkwinkels θ(t) des Stabes lassen sich unter Anwendung der Newton‘schen Gesetze zu (M + m)x¨ + ml θ¨ = u; (9.20) mx¨ + ml θ¨ = mgθ
(9.21)
herleiten. Subtrahiert man die Gl. (9.21) von der Gl. (9.20), so erhält man M x¨ = u − mgθ.
(9.22)
Eliminiert man x¨ aus den Gleichungen (9.20) und (9.22), so erhält man Ml θ¨ − (M + m)gθ = −u, woraus man die Übertragungsfunktion des Systems invertiertes Pendel zu θ (s) 1 = 2 −U (s) Mls − (M + m)g erhält. Setzt man in diese Gleichung die praktisch realistischen Werte M = 2 kg, m = 0,1 kg, l = 0,5 m und g = 9,81 m/sec2 ein, so wird die obige Übertragungsfunktion zu
9.2 Das Verfahren der Polzuweisung
215
θ (s) 1 1 = 2 = 2 . −U (s) s − 20,601 s − (4,539)2 Wie man aus obiger Gleichung (und natürlich auch aus der Geräte-Übersicht) sieht, handelt es sich bei dieser Regelstrecke im ungeregelten Fall um ein instabiles System; ein Pol liegt auf der positiv reellen Achse an der Stelle s = 4,539. Das System soll nun mit Hilfe der Technik der Polzuweisung stabilisiert werden und nach Möglichkeit das eingangs geforderte dynamische Verhalten aufweisen. Wählt man die Zustandsgrößen zu x1 = θ, x2 = θ˙ , x3 = x, ˙ x4 = x, so ergeben sich die Zustandsgleichung des Systems zu
0 x˙1 M +m x˙ g 2 Ml = x˙3 0 m x˙4 − g M
1
0
0
0
0
0
0
0
0 x1 1 − 0 x2 Ml · + 0 x 3 1 1 x 4 0 M
0
· u,
(9.23)
sowie die Ausgangsgleichungen in vektorieller Form zu
y1 y2
=
1
0
0
0
0
1
x1 0 x2 · . x3 0
(9.24)
x4 Setzt man in die Zustandsgleichung die Werte für M, m, l und g ein, so bekommen die entsprechenden Matrizen der Systemgleichung x˙ = Ax + bu und der Ausgangsgleichung y = Cx
216
9 Regelkreis-Synthese im Zustandsraum
die Form
0 20,601 A= 0 −0,490
1 0 0 0
0 0 ; 1
0 0 0 0
0 −1 b= ; 0
0
C=
1 0
0 0
0 1
0 . 0
0,5
Wir verwenden die Zustandsrückführung, somit gilt u = −Kx Bevor die Rückführmatrix K konzipiert werden kann, ist die Zustandssteuerbarkeit zu überprüfen: Die Steuerbarkeitsmatrix
0 −1 S c = b Ab A2 b A3 b = 0
−1 0 0,5
0 −20,601 0
0
0,490
0,5
−20,601 0 0,490 0
hat den Rang 4; das System ist damit vollkommen zustandssteuerbar. Die charakteristische Gleichung des ungeregelten Systems lautet
s
−20,601 |sI − A| = 0
−1
0
s 0
0 s
0
0
0,490
0
0 −1 s
= s 4 − 20, 601s 2 = s 4 + a1 s 3 + a2 s 2 + a3 s + a4 = 0. Damit lauten die Koeffizienten der charakteristischen Gleichung a1 = 0;
a2 = −20, 601;
a3 = a4 = 0.
Im nächsten Schritt sind die gewünschten Polstellen des geregelten Systems zu wählen: Mit einer geforderten Ausregelzeit von ca. 2 sec und einer Dämpfung von etwa 0,5 kommen die dominanten Pole eines Systems an den Stellen µ1 = −2 + j3, 464;
µ2 = −2 − j3, 464
zu liegen. Die weiteren beiden Pole werden in der s-Ebene so weit nach links verschoben, dass sie sich nur noch unwesentlich auf das Zeitverhalten der Regelgröße auswirken:
9.2 Das Verfahren der Polzuweisung
217
µ3 = µ4 = −10. Damit wird die gewünschte charakteristische Gleichung zu (s − µ1 )(s − µ2 )(s − µ3 )(s − µ4 ) = s 4 + 24s 3 + 196s 2 + 720s + 1600 = s 4 + α1 s 3 + α2 s 2 + α3 s + α4 = 0. Somit lauten die entsprechenden Koeffizienten α1 = 24;
α2 = 196;
α3 = 720
α4 = 1600.
und
Nun soll die Rückführmatrix K mit Hilfe der Gl. (9.14) ermittelt werden. K = α4 − a4 α3 − a3 α2 − a2 α1 − a1 · T −1
mit
Mit bereits bekannter Beobachtbarkeitsmatrix S c und
0 0 T = ScW = −9,81
0 0 0
a3 a2 a a 2 1 W = a1 1 1 0
0 −20,601 0 1 1 0 0 1 0 −20,601 = 0 0 0 1 0 0 0 0 1 0 0 0
a1 1
wird die Matrix T zu
−1 0 0 −1 . 0,5 0
−9,81
0
0
0, 5
Durch Inversion der obigen Matrix erhält man
T −1
−
0,5 9,81
= 0 −1 0
0 0, 5 − 9,81 0 −1
−
1 9,81 0 0 0
0
1 − . 9,81 0 0
T = Sc · W .
218
9 Regelkreis-Synthese im Zustandsraum
Die gesuchte Rückführmatrix K wird schließlich zu K = α4 − a4 α3 − a3 α2 − a2 α1 − a1 · T −1 = = 1600 − 0 720 − 0 196 + 20,601 24 − 0 T −1
−
0,5 9,81
= 1600 720 216,601 24 · 0 −1 0 = −298,15
−60,697 −163,099
0 0,5 − 9,81 0 −1
−
1 9,81 0 0 0
0
1 − 9,81 0 0
−73,394 .
Damit wird die Stellgröße zu u = −Kx = 298,15x1 + 60,697x2 + 163,099x3 + 73,394x4 . Bild 9.4 zeigt das regelungstechnische Blockschaltbild des gesamten Systems. (Dabei sollte beachtet werden, dass es sich hier um ein Regelproblem mit Sollwert null bez. x(t) und θ (t) handelt, d.h. das Sollwertsignal ist immer null. In einem späteren Kapitel werden noch Beispiele mit von null verschiedenem Sollwert behandelt.)
Bild 9.4: Invertiertes Pendel mit Zustandsrückführung
Nachdem nun die Zustandsrückführmatrix festgelegt ist, können die Systemeigenschaften mittels Computer-Simulation untersucht werden. Zur Simulation des Gesamtsystems ist die Vektorgleichung des geregelten Systems x˙ = (A − BK)x
9.3 Regelkreis-Synthese unter Verwendung des Zustands-Beobachters
219
mit entsprechenden Zahlenwerten aufzustellen; im gegebenen Beispiel erhalten wir
x˙1
0 x˙ −277,55 2 = x˙3 0 148,58 x˙4
1 −60,697 0 30,34
0 −163,09 0 81,55
0 x1 −73,39 x2 · . 1 x3 36,69
x4
Die Anfangswerte des Systems seien angenommen zu x1 (0) = 0,1 rad; x2 (0) = 0; x3 (0) = 0; x4 (0) = 0. Das Bild 9.5 zeigt den zeitlichen Verlauf der vier Zustandsgrößen.
Bild 9.5: Zeitlicher Verlauf der Zustandsgrößen des invertierten Pendels
Abschließend sollte darauf verwiesen werden, dass natürlich das dynamische Verhalten der Zustandsgrößen eng mit einer guten Wahl der Pole des geregelten Systems verbunden ist.
9.3
Regelkreis-Synthese unter Verwendung des Zustands-Beobachters
9.3.1
Problemstellung
Bei dem vorgestellten Verfahren der Polzuweisung wird vorausgesetzt, dass sämtliche Zustandsvariablen messbare physikalische Größen sind. In der Praxis stehen jedoch nur in den seltensten Fällen sämtliche Zustandsgrößen einer Messung zur Verfügung. Wie sich im Folgenden zeigen wird, müssen deshalb nicht messbare Zustandsgrößen geschätzt bzw. simuliert werden. Auch die Differenziation einer Zustandsvariablen zur Erzeugung einer anderen scheidet in den meisten Fällen aus, weil dadurch das Signal-Rausch-Verhältnis erheblich erhöht
220
9 Regelkreis-Synthese im Zustandsraum
wird. Die so genannte Schätzung einer nicht messbaren Zustandsgröße wird in der Fachsprache als Beobachtung bezeichnet. Eine Vorrichtung (oder ein Computer-Programm), die eine Zustandsgröße schätzt oder beobachtet, wird als Zustands-Beobachter oder kurz als Beobachter bezeichnet. Zustands-Beobachter Ein Zustands-Beobachter schätzt mit Hilfe der Systemausgangsgrößen und der Stellgrößen die Zustandsvariablen. Wie sich zeigen wird, bekommt das Konzept der Beobachtbarkeit wesentliche Bedeutung. Ausgangspunkt sind die Systemgleichungen x˙ = Ax + Bu
(9.25)
y = Cx.
(9.26)
Nehmen wir an, dass der Systemzustand x durch den Zustand xˆ des dynamischen Modells " # x˙ˆ = Axˆ + Bu + K e y − C xˆ ,
(9.27)
approximiert wird, das den Zustands-Beobachter repräsentiert.
Bild 9.6: Blockschaltbild System und Zustands-Beobachter; u und y sind Skalare
Im Bild 9.6 ist das Blockschaltbild des zu regelnden Systems und des Zustands-Beobachters (strichpunktiert eingerahmt) wiedergegeben.
9.3 Regelkreis-Synthese unter Verwendung des Zustands-Beobachters
221
Der Zustands-Beobachter hat die Variablen y(t) und u(t) als Eingangsgrößen und xˆ als Ausgangsgröße. Der letzte Term der rechten Seite des Modells, siehe Gl. (9.27), ist ein Korrekturterm, der die Differenz zwischen dem gemessenenAusgang y(t) und dem geschätztenAusgang C xˆ berücksichtigt. Die Matrix K e hat die Funktion einer Gewichtsmatrix. Zur Herleitung der Fehlergleichung des Beobachters wird Gl. (9.27) von Gl. (9.25) subtrahiert: " # x˙ − x˙ˆ = Ax − Axˆ − K e Cx − C xˆ " # = (A − K e C) x − xˆ .
(9.28)
Mit der Definition e = x − xˆ wird Gl. (9.28) zu e˙ = (A − K e ) · e.
(9.29)
Aus der letzten Gleichung ist zu sehen, dass das dynamische Verhalten des Fehlervektors durch die Eigenwerte der Matrix A − K e · C bestimmt wird. Unter der Voraussetzung, dass diese Matrix stabil ist, konvergiert der Fehlervektor für jeden beliebigen Anfangswert e(0) ˆ mit zunehmender Zeit gegen null. Dies wiederum bedeutet, dass x(t) unabhängig von den ˆ Anfangswerten x(0) und x(0) mit zunehmender Zeit gegen x(t) konvergiert. 9.3.2
Dimensionierung der Beobachter-Matrix K e
Es wird ausgegangen von den Systemgleichungen x˙ = Ax + Bu
(9.30)
y = Cx.
(9.31)
Bei der Dimensionierung des Beobachters ist es vorteilhaft, obige Systemgleichungen in die Beobachtbarkeitsnormalform zu transformieren. Dies erreicht man folgendermaßen: Definieren wir eine Transformationsmatrix Q zu Q = (W · S ∗o )−1 ,
(9.32)
wobei für die Beobachtbarkeitsmatrix S o und die Matrix W gilt:
an−1
a n−2 . W = . . a1 1
an−2 an−3 . . .
... ...
a1 1 . . .
1 0
... ...
0 0
1 0 . . . 0 0
222
9 Regelkreis-Synthese im Zustandsraum
S o = C ∗ A∗ C ∗ . . . (A∗ )n−1 C ∗
(9.33)
Die Elemente der Matrix W entsprechen den Koeffizienten des charakteristischen Polynoms des Originalsystems, d.h. des ungeregelten Systems: |sI − A| = s n + a1 s n−1 + . . . + an−1 s + an = 0. Führt man eine Zustandstransformation der Art x =Q·ξ
(9.34)
durch, dann werden die Gleichungen (9.30) und (9.31) zu ξ˙ = Q−1 AQξ + Q−1 Bu
(9.35)
y = CQξ
(9.36)
und
mit
0 1 −1 Q AQ = 0 . . 0
0 0
... ...
0 0
1 . . 0
... . . ...
0 . . 1
−an −an−1 −an−2 . .
(9.37)
−a1
bn − an b0 bn−1 − an−1 b0 Q−1 B = . . b1 − a1 b0
(9.38)
CQ = 0
(9.39)
0
...
0
1 .
Man beachte: Für den Fall, dass die Systemmatrix A bereits in der Beobachtungsnormalform gegeben ist, wird die Matrix Q zur Einheitsmatrix I . Wie bereits in Gl. (9.27) gezeigt wurde, ist die Beobachter-Dynamik gegeben durch die Gleichung " # x˙ˆ = Axˆ + Bu + K e y − C xˆ = (A − K e C)xˆ + Bu + K e Cx.
(9.40)
9.3 Regelkreis-Synthese unter Verwendung des Zustands-Beobachters
223
Definieren wir nun den Zustandsvektor des Beobachters zu xˆ = Qξˆ ,
(9.41)
so erhält man durch Einsetzen der Gl. (9.41) in Gl. (9.40) ξ˙ˆ = Q−1 (A − K e C)Qξˆ + Q−1 Bu + Q−1 K e CQξ.
(9.42)
Subtrahiert man die Gl. (9.42) von Gl. (9.35), so folgt ξ˙ − ξ˙ˆ = Q−1 (A − K e C)Q ξ − ξˆ .
(9.43)
Definieren wir weiterhin den Fehlervektor e = ξ − ξˆ , dann wird Gl. (9.43) zu e˙ = Q−1 (A − K e C)Qe.
(9.44)
Für die Dynamik des Fehlers wird natürlich asymptotische Stabilität gefordert, außerdem soll e(t) mit hinreichender Geschwindigkeit gegen null streben. Die Prozedur zur Bestimmung der Matrix K e besteht zunächst in der Wahl der gewünschten Beobachterpole, d.h. der Eigenwerte der Matrix A−K e C, und der nachfolgenden Bestimmung der Matrix K e derart, dass der Beobachter die gewünschten Pole einnimmt. Mit Q−1 = W S ∗o folgt dafür in Vektorschreibweise
an−1 a n−2 . −1 Q Ke = . . a1 1 k1 k 2 . . Ke = . kn−1
mit
kn
an−2
...
a1
an−3 . . .
...
1 . . .
1 0
... ...
0 0
k1 k 0 2 CA . . . . · . · . , . . . 0 CAn−2 kn−1 1
0
C
CAn−1
kn
224
9 Regelkreis-Synthese im Zustandsraum
Weil Q−1 K e ein n-dimensionaler Vektor ist, lässt sich auch abkürzend schreiben δn δ n−1 . . −1 Q Ke = . . δ2 δ1 Bezugnehmend auf Gl. (9.39) gilt auch δn 0 δ n−1 0 . . . −1 Q K e CQ = 0 0 ... 1 = . . . δ2 0 δ1 und
Q−1 (A − K e C)Q = Q−1 AQ − Q−1 K e CQ 0 0 ... 0 −an − δn 1 0 . . . 0 −an−1 − δn−1 0 1 . . . 0 −an−2 − δn−2 . = . . . . . . . . . . . . 0 0 ... 1 −a1 − δ1
Die charakteristische Gleichung des Fehlers sI − Q−1 (A − K e C)Q = 0 wird damit zu 0 s −1 s 0 −1 . . . . . . 0 0
... ... s ...
...
0 an + δ n 0 an−1 + δn−1 0 an−2 + δn−2 =0 . . . . . . −1 s + a1 + δ1
0 0 . . . 0
... ...
...
0 0 . . . 0
δn
δn−1 . . . δ1
(9.45)
9.3 Regelkreis-Synthese unter Verwendung des Zustands-Beobachters
225
oder s n + (a1 + δ1 )s n−1 + (a2 + δ2 )s n−2 . . . + (an−1 + δn−1 )s + (an + δn ) = 0.
(9.46)
Das gewollte charakteristische Polynom für die Fehlerdynamik lautet (s − µ1 )(s − µ2 ) . . . (s − µn ) = s n + α1 s n−1 + α2 s n−2 + . . . + αn−1 s + αn = 0.
(9.47)
Beachte: Die gewünschten Eigenwerte µi sind dafür maßgeblich, wie schnell der Beobachterzustand gegen den aktuellen Zustand der Strecke konvergiert. Führt man einen Koeffizientenvergleich der Terme gleicher Potenzen in s zwischen den Gleichungen (9.46) und (9.47) durch, so erhält man a1 + δ1 = α1 a2 + δ2 = α2 . . . a n + δ n = αn . Daraus folgt unmittelbar δ1 = α1 − a1 δ2 = α2 − a2 . . . δ n = αn − a n . Aus Gl. (9.45) erhält man jetzt unmittelbar αn − an δn δn−1 αn−1 − an−1 . . Q−1 K e = = ; . . . . δ1 α1 − a 1
226
9 Regelkreis-Synthese im Zustandsraum
Somit erhalten wir schließlich αn − an αn − an αn−1 − an−1 αn−1 − an−1 . . Ke = Q · = (W S ∗o )−1 · . . . . α1 − a 1 α1 − a 1
(9.48)
Wenn also die Dynamik des Beobachters durch die Wahl der Eigenwerte festgelegt ist, kann dieser entworfen werden, vorausgesetzt, das System ist vollständig beobachtbar. Die gewünschten Eigenwerte des Beobachters sollten so gewählt werden, dass der ZustandsBeobachter mindestens vier- bis fünfmal schneller eingeschwungen ist als die Regelgröße des geschlossenen Regelkreises. Die Gleichung des Zustands-Beobachters lautet x˙ˆ = (A − K e C)xˆ + Bu + K e y.
(9.49)
Bemerkung: Bei den obigen Betrachtungen wurde vorausgesetzt, dass die Systemmatrix A und die Steuermatrix B des Beobachters mit denen der zu regelnden Strecke identisch sind. In der Praxis trifft jedoch diese Annahme nur in den seltensten Fällen zu. Damit trifft auch die Fehlerdynamik gemäß Gl. (9.40) nicht vollständig zu, d.h. dass der Fehler nicht exakt gegen null läuft. Somit sollte man versuchen, ein möglichst genaues Modell des Beobachters zu erstellen, um den Fehler tolerierbar klein zu halten. 9.3.3
Dimensionierung der Beobachter-Matrix K e mit der direkten Methode
Wie im Fall der Polzuweisung ist die direkte Methode nur dann geeignet, wenn es sich um ein System von nur niedriger Ordnung handelt. Für beispielsweise ein System dritter Ordnung wird die Beobachter-Matrix K e zu ke1 K e = ke2 . ke3
Setzt man diese Matrix in das gewünschte charakteristische Polynom des Beobachters ein, so erhält man |sI − (A − K e C)| = (s − µ1 )(s − µ2 )(s − µ3 ). Führt man einen Koeffizientenvergleich bei jeweils gleichen Potenzen in s durch, so erhält man die Werte der Koeffizienten ke1 , ke2 , ke3 .
9.3 Regelkreis-Synthese unter Verwendung des Zustands-Beobachters
227
Beispiel 9.3: Gegeben sei das System x˙ = Ax + bu y = cT · x mit A=
0
20,6
1
0
,
b=
0 1
,
cT = 0 1
Gesucht ist die Zustands-Beobachter-Matrix K e , wobei die gewünschten Eigenwerte zu µ1 = −1,8 + j2,4,
µ2 = −1,8 − j2,4
festgelegt seien. Die Beobachtbarkeitsmatrix So =
C∗
A∗ C ∗
=
0 1
1 0
hat den geforderten Rang 2; weil deshalb vollständige Zustandsbeobachtbarkeit gegeben ist, kann die Beobachter-Matrix berechnet werden. Es sollen hier zwei Lösungswege aufgezeigt werden. Methode 1:
Bestimmung der Beobachter-Matrix unter Verwendung der Gl. (9.48): Die Zustandsmatrix A ist bereits in der Beobachtbarkeitsnormalform gegeben; damit wird die Transformationsmatrix Q = (W · S ∗o )−1 zur Einheitsmatrix I . Mit der charakteristischen Gleichung des gegebenen Systems s −20,6 |sI − A| = = s 2 − 20,6 = s 2 + a1 s + a2 = 0 −1 s bekommen wir a1 = 0; a2 = −20,6. Die gewünschte charakteristische Gleichung bekommt die Form (s + 1,8 − j2,4)(s + 1,8 + j2,4) = s 2 + 3,6s + 9 = s 2 + α1 s + α2 = 0 mit α1 = 3,6 und α2 = 9 . Die gesuchte Beobachter-Matrix K e erhält man mit Gl. (9.48) zu 1 0 9 + 20,6 29,6 α2 − a2 ∗ −1 = · = . K e = (W S o ) · 0 1 3,6 − 0 3,6 α1 − a 1
228
9 Regelkreis-Synthese im Zustandsraum
Methode 2: Verwendung des Fehlervektors: Gemäß Gl. (9.29) gilt e˙ = (A − K e C) · e. Die charakteristische Gleichung des Beobachters wird damit zu |sI − A + K e C| = 0. Definieren wir die Beobachter-Matrix zu ke1 Ke = , ke2 so wird obige charakteristische Gleichung zu
s 0
0 s
−
0
20,6
1
0
+
ke1
ke2
s = −1
· 0 1
−20,6 + ke1 = s 2 + ske2 − 20,6 + ke1 = 0. s + ke2
Weil die gewünschte charakteristische Gleichung s 2 + 3,6s + 9 = 0 lautet, erhält man durch einen Vergleich mit obiger Gleichung ke1 = 29,6; ke2 = 3,6 29,6 Ke = . 3,6
bzw.
Beispiel 9.4: Gegeben sei das System x˙ = Ax + bu y = cT · x mit
0 1 0 0 1 ; A= 0 −6 −11 −6
0 b = 0; 1
cT = 1 0 0 .
Im Gegensatz zum ersten Beispiel ist hier die Systemmatrix A in der Regelungsnormalform gegeben. Gesucht ist der Zustands-Beobachter gemäß Bild 9.6; die gewünschten Eigenwerte der Beobachter-Matrix seien µ1 = −2 + j3,464; µ2 = −2 − j3,464; µ3 = −5.
9.3 Regelkreis-Synthese unter Verwendung des Zustands-Beobachters
229
Die Beobachtbarkeitsmatrix
S o = C ∗ A∗ C ∗
1 0 0 (A∗ )2 C ∗ = 0 1 0 0 0 1
hat den Rang 3; das System ist damit vollkommen beobachtbar und auch die Bestimmung der Beobachter-Matrix K e ist ebenso möglich. Die charakteristische Gleichung des ungeregelten Systems ist gegeben zu s |sI − A| = 0 6
−1 s 11
0 −1 = s 3 + 6s 2 + 11s + 6 = s 3 + a1 s 2 + a2 s + a3 = 0, s + 6
somit werden die entsprechenden Koeffizienten zu a1 = 6; a2 = 11; a3 = 6. Die charakteristische Gleichung des gewollten Systemverhaltens wird zu (s − µ1 )(s − µ2 )(s − µ3 ) = (s + 2 − j3,464)(s + 2 + j3,464) = s 3 + 9s 2 + 36s + 80 = s 3 + α1 s 2 + α2 s + α3 = 0. Somit lauten die entsprechenden Koeffizienten α1 = 9; α2 = 36; α3 = 80. In diesem Beispiel soll K e unter Verwendung der Gl. (9.48) ermittelt werden: Aus
α3 − a 3 K e = (W S ∗o )−1 α2 − a2 ; α1 − a 1
mit
1 0 0 S ∗o = 0 1 0 0 0 1
und
11 6 1 W = 6 1 0 1 0 0
folgt
(W S ∗o )−1
−1 1 0 0 0 0 1 11 6 1 = 6 1 0 · 0 1 0 = 0 1 −6 . 1 0 0 0 0 1 1 −6 25
Damit erhalten wir die gesuchte Matrix zu
0 0 1 80 − 6 3 K e = 0 1 −6 · 36 − 11 = 7 . 1 −6 25 9−6 −1
230
9.3.4
9 Regelkreis-Synthese im Zustandsraum
Zusammenschaltung des Beobachters mit der zu regelnden Strecke
Zunächst sollte deutlich darauf verwiesen werden, dass die bisherige Zielsetzung ausschließlich in der Konfiguration des Beobachters bestand. In diesem Abschnitt soll nun die Rückführmatrix K dimensioniert werden; siehe hierzu Bild 9.7.
Bild 9.7: Zustandsrückführung auf der Basis des Beobachterprinzips
Der Syntheseprozess ist von zweistufiger Natur; im ersten Schritt ist die Rückführmatrix K zu bestimmen, um das gewünschte charakteristische Verhalten des zu regelnden Systems zu erreichen und im zweiten Schritt ist die Beobachter-Matrix K e mit dem Ziel zu bestimmen, dass der Beobachter das geforderte Zeitverhalten annimmt. Ausgegangen wird vom vollkommen steuerbaren und beobachtbaren System x˙ = Ax + Bu y = Cx. Stellgröße ist der rückgeführte Zustandsvektor ˆ u = −K x. Mit dieser Stellgröße wird die Zustandsgleichung der Strecke zu " # x˙ = Ax − BK xˆ = (A − BK)x + BK x − xˆ .
(9.50)
9.3 Regelkreis-Synthese unter Verwendung des Zustands-Beobachters
231
ˆ Die Differenz zwischen dem tatsächlichen Zustand x(t) und dem beobachteten Zustand x(t) wurde bereits als Fehlervektor e(t) bezeichnet: ˆ e(t) = x(t) − x(t). Substituiert man den Fehlervektor e(t) in Gl. (9.50), so erhält man x˙ = (A − BK)x + BKe.
(9.51)
Die Fehlergleichung des Beobachters war in Gl. (9.29) gegeben zu e˙ = (A − K e C)e. Durch Kombination der Gleichungen (9.51) und (9.52) erhält man x x˙ A − BK BK · . = e e˙ 0 A − K eC
(9.52)
(9.53)
Die Gl. (9.53) beschreibt die Dynamik der Zustandsrückführung, basierend auf dem Beobachterprinzip. Die charakteristische Gleichung des gesamten Systems lautet dann sI − A + BK −BK =0 0 sI − A + K e C oder |sI − A + BK| · |sI − A + K e C| = 0. Hinweis: Die Pole des geschlossenen Kreises, basierend auf der Rückführung des BeobachterVektors, bestehen aus den Polstellen des Polzuweisungsprinzips der Strecke plus den Polstellen, basierend auf der Dimensionierung des Beobachters. Dies bedeutet wiederum, dass die bereits bekannte Methode der Polzuweisung für die Strecke und für den Beobachter unabhängig voneinander durchgeführt werden kann; beide Systeme können also separat ausgelegt und dann miteinander zu einem Gesamtsystem kombiniert werden. Eine Daumenregel besagt übrigens, dass die Beobachterpole etwa vier- bis fünfmal schneller sein sollten als die Pole des zu regelnden Systems. Beispiel 9.5: Gegeben ist die Zustandsgleichung der Strecke x˙ = Ax + bu y = cT · x;
(9.54) (9.55)
in Anlehnung an Beispiel 9.3 sind die Systemmatrix A, der Steuervektor b sowie der Ausgangsvektor cT gegeben zu 0 1 0 A= ; b= ; cT = 1 0 . 20,6 0 1
232
9 Regelkreis-Synthese im Zustandsraum
Zur Dimensionierung der Zustandsrückführmatrix K soll das Verfahren der Polzuweisung angewandt werden. Die gewünschten Pole des zu regelnden Systems sollen wieder die Werte µ1 = −1,8 + j2,4
und
µ2 = −1,8 − j2,4
annehmen. Im Beispiel 9.3 ergab sich daraus die Verstärkungsmatrix K zu K = 29,6 3,6 . Damit ist das Stellsignal u gegeben zu
u = −Kx = − 29,6 3,6 ·
x1
.
x2
Wenn nun das System auf der Basis des Beobachterprinzips geregelt werden soll, so gilt für das Stellsignal ebenso
u = −K xˆ = − 29,6 3,6 ·
xˆ1 xˆ2
,
wobei die Eigenwerte des Beobachters zu µ1 = µ2 = −8 gewählt worden seien. Gesucht ist die Beobachter-Rückführmatrix K e und das Blockschaltbild für das gesamte Regelsystem. Für das System gemäß Gl. (9.54) und (9.55) lautet das charakteristische Polynom s −1 |sI − A| = = s 2 − 20,6 = s 2 + a1 s + a2 . −20,6 s Somit ist a1 = 0; a2 = −20,6. Das gewünschte charakteristische Polynom des Beobachters lautet entsprechend der obigen Wahl der Eigenwerte (s − µ1 )(s − µ2 ) = (s + 8)(s + 8) = s 2 + 16s + 64 = s 2 + α1 s + α2 ; α1 = 16
damit ist
und α2 = 64.
Zur Bestimmung der Beobachter-Matrix K e wird Gl. (9.48) verwendet:
Ke =
W =
α2 − a2 · α1 − a 1 1 0 1 = . 0 1 0
(W S ∗o )−1 a1 1
mit S o =
C∗
A∗ C ∗
=
1 0 0 1
und
9.3 Regelkreis-Synthese unter Verwendung des Zustands-Beobachters
233
Damit ergibt sich die Beobachter-Matrix K e zu
Ke =
−1 0 1 1 0 64 + 20,6 0 1 84,6 16 · · = · = ; (9.56) 1 0 0 1 16 − 0 1 0 16 84,6
Gl. (9.56) ist die gesuchte Beobachter-Matrix K e . Die Beobachter-Gleichung ist gegeben zu x˙ˆ = (A − K e C)xˆ + Bu + K e y.
(9.57)
Wegen u = −K xˆ wird Gl. (9.57) zu x˙ˆ = (A − K e C − BK)xˆ + K e y oder
˙ xˆ 1 16 x˙ˆ 0 1 16 0 1 = 1 0 − 29,6 3,6 − + y ˙ 20,6 0 84,6 1 xˆ 2 84,6 x˙ˆ 2
=
−16 1 xˆ 1 16 · + y. −93,6 −3,6 84,6 xˆ 2
Das folgende Bild zeigt das Blockschaltbild des gesamten Regelkreises.
Bild 9.8: Blockschaltbild des zu regelnden Systems einschließlich des Beobachters
234
9.3.5
9 Regelkreis-Synthese im Zustandsraum
Systeme mit von null verschiedenem Sollwert
Bei den Ausführungen des bisherigen Kapitels wurde durchweg von Systemen mit Sollwert null ausgegangen; siehe z.B. Bild 9.7. Ergänzend sollen nun Systeme mit einer von null verschiedenen Führungsgröße behandelt werden. Das folgende Bild zeigt das Blockschaltbild eines Systems mit Zustandsrückführung und einem Soll-Ist-Vergleicher.
Bild 9.9: Zustandsrückführung mit einem Integrator im Fehlerkanal
Das Blockschaltbild im Bild 9.9 entspricht dem in der Praxis allgemein auftretenden StandardRegelkreis. Der Integrator im Fehlerkanal, zusammen mit der Zustandsrückführung, bewirkt bei sprungförmigem Sollwert ein Verschwinden der Regelabweichung im stationären Zustand. Strecken mit integrierendem Übertragungsverhalten Wir gehen aus von der zu regelnden Strecke x˙ = Ax + Bu y = Cx mit
A B C
(9.58) (9.59)
als (n × n)-Systemmatrix, als (n × 1)-Steuermatrix und als (1 × n)-Ausgangsmatrix.
Weiter soll hier davon ausgegangen werden, dass es sich bei der Stellgröße u und derAusgangsgröße y um Skalare handelt. Bei geeigneter Wahl der Zustandsgrößen ist es immer möglich, die Ausgangsgröße mit einer der Zustandsvariablen zu identifizieren. Das Bild 9.10 zeigt die allgemeine Konfiguration von Regelsystemen mit integrierendem Verhalten der Regelstrecke. Wie man sieht, wurde hier von der Annahme y = x1 ausgegangen. Bei der folgenden Abhandlung wird eine sprungförmige Führungsgröße r(t) = r · ε(t) vorausgesetzt. Das Regelschema ist von der Art x1 x2 . kn · . + k1 (r − x1 ) . xn
u=− 0
k2
k3
...
9.3 Regelkreis-Synthese unter Verwendung des Zustands-Beobachters
235
Bild 9.10: Strecke mit Integrator; Zustandsgröße x1 identisch mit Regelgröße y
bzw. u = −Kx + k1 r
(9.60)
mit K = k1
k2
...
kn .
(9.61)
Das Sollwertsignal sei, wie bereits oben erwähnt, eine Sprungfunktion an der Stelle t = 0. Dann wird die Dynamik des Systems für t > 0 durch die Gleichung x˙ = Ax + Bu = (A − BK) x + Bk1 r
(9.62)
beschrieben. Das Regelsystem soll so ausgelegt werden, dass die Pole des geschlossenen Regelkreises bestimmte, vorzugebende Werte annehmen. Das gesamte Regelsystem ist asymptotisch stabil, wenn die Regelgröße y(∞) gegen den konstanten Sollwert r und u(∞) gegen den Wert null läuft. Im stationären Zustand muss gelten ˙ x(∞) = (A − BK) x(∞) + Bk1 r(∞).
(9.63)
Mit der Führungsgröße r(t) als Sprungfunktion ist r(∞) = r = konst. für t > 0. Subtrahiert man Gl. (9.63) von Gl. (9.62), so erhält man ˙ − x(∞) ˙ x(t) = (A − BK) [x(t) − x(∞)] . Definieren wir x(t) − x(∞) = e(t),
(9.64)
236
9 Regelkreis-Synthese im Zustandsraum
so wird Gl. (9.64) zu e˙ = (A − BK) e;
(9.65)
diese Gleichung beschreibt die Dynamik des Fehlers. Das Synthese-Problem besteht damit in der Konzeption eines derart stabilen Regelsystems, so dass für jeden Anfangszustand e(0) der Regelfehler e(t) asymptotisch gegen null läuft. Wenn das System der Gl. (9.58) vollkommen zustandssteuerbar ist, erhält man durch die Spezifikation der gewünschten Eigenwerte µ1 , µ2 , . . . µn für die Matrix (A−BK) die Matrix K mit Hilfe des Konzeptes der Polzuweisung. Den stationären Wert der Zustandsgrößen x(t) sowie der Stellgröße u(t) erhält man folgendermaßen: Im stationären Zustand folgt aus Gl. (9.63) ˙ x(∞) = 0 = (A − BK) x(∞) + Bk1 r. Weil sämtliche definierte Eigenwerte des Systems (A−BK) in der linken s-Halbebene liegen, muss auch die Inverse der Matrix (A − BK) existieren. Somit kann x(∞) auch geschrieben werden als x(∞) = −(A − BK)−1 Bk1 r. Ebenso erhält man u(∞) zu u(∞) = −Kx(∞) + k1 r = 0, siehe hierzu folgendes Beispiel. Beispiel 9.6: Gegeben ist die Übertragungsfunktion eines zu regelnden Systems entsprechend Y (s) 1 = , U (s) s(s + 1)(s + 2) also integrierendes Verhalten mit zwei Verzögerungen. Die Pole des geregelten Systems sollen die Werte −2+j3,464; −2−j3,464 und −10 annehmen. Außerdem soll die Konfiguration des Gesamtsystems der im Bild 9.10 entsprechen; der Sollwert r(t) sei Sprungfunktion. Gesucht sind die Koeffizienten des Zustandsrückführvektors K. Definieren wir zunächst die Zustandsgrößen: x1 = y x2 = x˙1 x3 = x˙2 .
9.3 Regelkreis-Synthese unter Verwendung des Zustands-Beobachters
237
Damit wird die Zustandsraumdarstellung des Systems zu x˙ = Ax + bu
(9.66)
y = cT · x
(9.67)
mit
0 1 0 A = 0 0 1; 0 −2 −3
0 b = 0; 1
cT = 1 0 0 .
Bezugnehmend auf Bild 9.10 wird für n = 3 das Stellsignal u zu u = −(k2 x2 + k3 x3 ) + k1 (r − x1 ) = −Kx + k1 r
(9.68)
mit K = k1 k2 k3 . Die Zustandsrückführmatrix K soll mit Hilfe der Polzuweisung ermittelt werden. Hierzu ist zunächst die Steuerbarkeit des Systems zu untersuchen. Die Steuerbarkeitsmatrix
0 1 1 S c = B AB A2 B = 0 1 −3 1 −3 7 hat den geforderten Rang 3; die Strecke ist damit vollkommen zustandssteuerbar. Die charakteristische Gleichung des Systems lautet s |sI − A| = 0 0
−1 0 s −1 = s 3 + 3s 2 + 2s = s 3 + a1 s 2 + a2 s + a3 = 0; 2 s + 3
damit werden die entsprechenden Koeffizienten zu a1 = 3;
a2 = 2;
a3 = 0.
Zur Bestimmung der Matrix K über den Weg der Polzuweisung benötigen wir die Gleichung K = α3 − a3
α2 − a 2
α1 − a1 · T −1 .
(9.69)
Weil außerdem die Zustandsgleichung des Systems, Gl. (9.66), bereits in der steuerbaren Normalform gegeben ist, wird T = I .
238
9 Regelkreis-Synthese im Zustandsraum
Setzt man Gl. (9.68) in Gl. (9.66) ein, so erhält man x˙ = Ax + B(−Kx + k1 r) = (A − BK) x + Bk1 r.
(9.70)
Für t → ∞ gilt x(t) → x(∞), also ein konstanter Vektor, weil ja r(t) als Sprungfunktion vorausgesetzt worden ist. Im stationären Zustand gilt gemäß obiger Gleichung ˙ x(∞) = (A − BK) x(∞) + Bk1 r.
(9.71)
Subtrahiert man Gl. (9.71) von Gl. (9.70), so folgt ˙ − x(∞) ˙ x(t) = (A − BK) · [x(t) − x(∞)] . Mit der Definition x(t) − x(∞) = e(t) wird die Gleichung der Fehlerdynamik zu ˙ = (A − BK) e(t). e(t)
(9.72)
Nachdem die gewünschten Eigenwerte der Matrix A − BK zu µ1 = −2 + j3,464; µ2 = −2 − j3,464 und µ3 = −10 festgelegt sind, wird die charakteristische Gleichung unter Verwendung dieser Eigenwerte zu (s − µ1 )(s − µ2 )(s − µ3 ) = s 3 + 14s 2 + 56s + 160 = s 3 + α1 s 2 + α2 s + α3 = 0; somit lauten die Koeffizienten der spezifizierten charakteristischen Gleichung α1 = 14;
α2 = 56;
α3 = 160.
Die Zustandsrückführmatrix K ist gemäß Gl. (9.69) gegeben zu K = α3 − a3 α2 − a2 α1 − a1 · T −1 = 160 − 0 56 − 2 14 − 3 · I = 160 54 11 . Die Sprungantwort des konzipierten Systems erreicht man am bequemsten durch ComputerSimulation. Wegen
0 1 0 0 0 1 0 0 0 1 A − BK = 0 0 1 − 0 · 160 54 11 = 0 −2 −3 1 −160 −56 −14
9.3 Regelkreis-Synthese unter Verwendung des Zustands-Beobachters
239
wird die Zustandsgleichung des so dimensionierten Systems zu x˙1 x˙2 =
x˙3
0 x1 0 1 · x2 + 0 · r −160 −56 −14 160 x3 0 0
1 0
und die Ausgangsgleichung zu x1 y = 1 0 0 x2 . x3
Bild 9.11: Übergangsfunktion des konzipierten Systems
Das Bild 9.11 zeigt die Simulation der Regelgröße y(t) als Reaktion auf den Einheitssprung ˙ r(t) = ε(t); außerdem kann man leicht feststellen, dass x(∞) = 0 wird. Nun sollen noch x(∞) und u(∞) berechnet werden: Aus Gl. (9.71) folgt (A − BK) x(∞) = −Bk1 r.
240
9 Regelkreis-Synthese im Zustandsraum
Wegen (A − BK)−1 =
−1
0
1 0 0 0 1 −160 −56 −14
7 1 7 − 20 − 80 − 160 = 0 0 1 0 1 0
erhalten wir aus obiger Gleichung 7 1 7 0 − 20 − 80 − 160 −1 x(∞) = −(A − BK) Bk1 r = − · 0 · (160) · r 0 0 1 1 0 1 0 1 1 r 160 0 0 = · (160) r = · r = . 0 0 0 0
Wie man sieht, ist x1 (∞) = y(∞) = r; somit existiert kein stationärer Fehler. Abschließend soll die Stellgröße u(t) im stationären Zustand berechnet werden: Wegen u(∞) = −Kx(∞) + k1 r(∞) = −Kx(∞) + k1 r bekommen wir
x1 (∞)
u(∞) = − 160 54 11 · x2 (∞) + 160 r x3 (∞) r = − 160 54 11 0 + 160 r 0 = −160 r + 160 r = 0. Wie man leicht sehen kann, wird die Stellgröße im stationären Zustand wie erwartet zu null.
9.3 Regelkreis-Synthese unter Verwendung des Zustands-Beobachters
241
Strecken ohne integrierendes Verhalten Weil die Strecke kein integrierendes Verhalten hat und der Nachteil einer stationären Regelabweichung bei sprungförmigem Sollwert trotzdem vermieden werden soll, muss im Fehlerkanal ein Integrator vorgesehen werden, wie Bild 9.12 zeigt.
Bild 9.12: Zustandsrückführung mit einem Integrator im Fehlerkanal
Aus diesem Bild lassen sich folgende Zusammenhänge ablesen: x˙ = Ax + Bu
(9.73)
y = Cx
(9.74)
u = −Kx + k1 ξ
(9.75)
ξ˙ = r − y = r − Cx
(9.76)
mit ξ
Ausgang des Integrators (Skalar),
r y
Führungsgröße (Skalar), Regelgröße (Skalar).
Die Strecke gemäß Gl. (9.73) sei vollständig zustandssteuerbar. Das Sollwertsignal r(t) als Sprungfunktion soll zum Zeitpunkt t = 0 auf den Regelkreis aufgebracht werden. Dann kann das Systemverhalten für t > 0 durch eine Kombination der Gleichungen (9.73) und (9.76) beschrieben werden: ˙ x(t) A 0 x(t) B 0 = · + · u(t) + · r(t). (9.77) −C 0 ξ(t) 0 1 ξ˙ (t) Es soll ein asymptotisch stabiles System entwickelt werden mit der Forderung, dass x(∞), ξ(∞) und u(∞) konstante Werte annehmen. Durch diese Forderungen muss im stationären Zustand ξ˙ (∞) = 0 und y(∞) = r sein. Die Gl. (9.77) wird im stationären Zustand zu
242
9 Regelkreis-Synthese im Zustandsraum
˙ x(∞) ξ˙ (∞)
=
A 0 x(∞) B 0 · + · u(∞) + · r(∞). −C 0 ξ(∞) 0 1
(9.78)
Mit r(t) als Sprungfunktion wird r(∞) = r(t) = r = konst. Subtrahiert man Gl. (9.78) von Gl. (9.77), so erhält man
˙ − x(∞) ˙ x(t) ξ˙ (t) − ξ˙ (∞)
=
A 0 x(t) − x(∞) B · + · [u(t) − u(∞)] . −C 0 ξ(t) − ξ(∞) 0
(9.79)
Mit den Definitionen x(t) − x(∞) = x e (t), ξ(t) − ξ(∞) = ξe (t), u(t) − u(∞) = ue (t) wird Gl. (9.79) zu
x˙ e (t) ξ˙e (t)
=
B x e (t) + · ue (t) · ξe (t) 0 −C 0 A 0
wobei ue (t) = −Kx e (t) + kI ξe (t) ist.
(9.80)
Mit der Definition eines Fehlervektors e(t) der Ordnung (n + 1) gemäß e(t) =
x e (t)
ξe (t)
wird Gl. (9.80) zu ˆ ˆ e (t) ˙ = Ae(t) e(t) + Bu
(9.81)
mit Aˆ =
A 0 −C 0
,
Bˆ =
B 0
.
Ebenso wird mit Kˆ = [K − kI ] Gl. (9.80) zu ˆ ue = −Ke.
(9.82)
9.3 Regelkreis-Synthese unter Verwendung des Zustands-Beobachters
243
Der grundsätzliche Gedanke der weiteren Vorgehensweise besteht nun darin, ein stabiles System der Ordnung (n + 1) zu generieren, das den Fehlervektor e(t) für jeden beliebigen Anfangszustand e(0) asymptotisch gegen null führt. Die Gleichungen (9.81) und (9.82) beschreiben die Dynamik eines Regelsystems (n + 1)-ter Ordnung. Wenn das durch die Gl. (9.81) definierte System vollkommen zustandssteuerbar ist, dann kann mit Hilfe der Spezifikation der Form der gewünschten charakteristischen Gleichung des Gesamtsystems die Matrix Kˆ über den Weg der Polzuweisung ermittelt werden. Die stationären Werte von x(t), ξ(t) und u(t) ergeben sich folgendermaßen: Im stationären Zustand (t → ∞) werden die Gleichungen (9.73) und (9.76) zu ˙ x(∞) = 0 = Ax(∞) + Bu(∞) ξ˙ (∞) = 0 = r − Cx(∞); diese Gleichungen werden zu folgender Vektorgleichung kombiniert: 0 A B x(∞) 0 = · + . 0 −C 0 u(∞) r Wenn die noch zu definierende Matrix A B P = −C 0
(9.83)
den Rang (n+1) hat, dann existiert auch die Inverse und wir erhalten schließlich die stationären Werte zu
x(∞) u(∞)
=
A B −C 0
−1
0 · −r
.
Ebenso folgt aus Gl. (9.75) u(∞) = −Kx(∞) + kI ξ(∞); und daraus unmittelbar ξ(∞) =
1 [u(∞) + Kx(∞)] . kI
Es sei noch einmal angemerkt, dass das Verfahren der Polzuweisung nur angewandt werden kann, wenn die Matrix P der Gl. (9.83) den Rang (n + 1) hat. Die Fehlergleichung erhält man durch Einsetzen der Gl. (9.82) in Gl. (9.81):
244
9 Regelkreis-Synthese im Zustandsraum
e˙ = Aˆ − Bˆ Kˆ · e.
(9.84)
Wenn die spezifizierten Eigenwerte der Matrix Aˆ − Bˆ Kˆ , d.h. die gewünschten Pole des geschlossenen Regelkreises, mit µ1 . . . µn bezeichnet werden, so können die Zustandsrückführmatrix K und der integrale Übertragungsbeiwert kI eindeutig ermittelt werden. Üblicherweise sind nicht sämtliche Zustandsgrößen einer Messung zugänglich. In solchen Fällen ist der bereits bekannte Zustands-Beobachter zu verwenden. Bild 9.13 zeigt das Blockschaltbild eines solchen Systems mit einer Integration im Fehlerkanal.
Bild 9.13: Regelkreis mit Integration im Fehlerkanal und Zustands-Beobachter
Beispiel 9.7: Im Abschnitt 9.2 wurde das invertierte Pendel als typisches Beispiel zur Regelkreis-Synthese mit Hilfe der Zustandsrückführung aufgezeigt. Ergänzend hierzu soll in diesem Beispiel das Pendel für einen sprungförmigen Sollwerteingang bez. der x-Richtung auch hier so gut als möglich in vertikaler Position gehalten werden. Des weiteren sollen die Parameter M, m und l die gleichen numerischen Werte wie im vorangegangenen Beispiel in Abschnitt 9.2 haben. Das betrachtete System – Fahrwagen, invertiertes Pendel – besitzt in seiner Systembeschreibung keinen Integrator. Es wird deshalb die Ausgangsgröße y, die ja die Position des Fahrwagens angibt, auf den Vergleicher geführt und ein Integrator in den Fehlerkanal eingefügt, wie dies im Bild 9.14 wiedergegeben ist. Die im Abschnitt 9.2 definierten Zustandsgrößen lauten x1 = θ x2 = θ˙ x3 = x x4 = x. ˙
9.3 Regelkreis-Synthese unter Verwendung des Zustands-Beobachters
245
Bild 9.14: Systemtechnisches Blockschaltbild des invertierten Pendels
Unter Verwendung von Bild 9.14 ergeben sich die Gleichungen des Systems invertiertes Pendel zu x˙ = Ax + bu
(9.85)
y = cT x
(9.86)
u = −Kx + kI ξ
(9.87)
ξ˙ = r − y = r − Cx
(9.88)
mit
0 20,601 A= 0 −0,490
1 0 0 0 0 0
0 0 , 1
0
0
0
0 −1 b= , 0
cT = 0 0 1 0 .
0,5
Außerdem gilt für die Fehlergleichung im Zustandsraum die Beziehung ˆ + Bu ˆ e e˙ = Ae
(9.89)
246
9 Regelkreis-Synthese im Zustandsraum
mit
0 20,601 A 0 Aˆ = = 0 −C 0 −0,490 0
1 0 0 0 0 0 0 0 0 −1
0 0 1 0 0
0 0 0 , 0 0
0 −1 B 0 Bˆ = = 0 0,5 0
und der Stellgröße gemäß Gl. (9.82) ˆ ue = −Ke mit Kˆ = K −kI = k1 k2 k3 k4 −kI . Aufgabenstellung ist die Berechnung der Zustandsrückführmatrix Kˆ mit Hilfe der Methode der Polzuweisung. Dabei soll zur Bestimmung von Kˆ die Gl. ( 9.14) herangezogen werden. Zunächst ist der Rang der Matrix
0 20,601 A B P = = 0 −C 0 −0,490 0
1 0 0 0 0
0 0 0 0 −1
0 0 1 0 0
0 −1 0 0,5 0
(9.90)
zu überprüfen. Wie man aus obiger Matrix leicht erkennen kann, ist der notwendige Rang 5 erfüllt. Somit ist das System gemäß Gl. (9.89) vollkommen zustandssteuerbar. Als Nächstes wird die charakteristische Gleichung des Systems gemäß Gl. (9.89) aufgestellt. s −20,601 ˆ 0 sI − A = 0,490 0
−1 0 s 0 0 0 0
s 0 1
0 0 −1 0 s 0 0 s 0 0
= s 3 (s 2 − 20,601) = s 5 − 20,601s 3 = s 5 + a1 s 4 + a2 s 3 + a3 s 2 + a4 s + a5 = 0; Somit ist a1 = 0;
a2 = −20, 601;
a3 = a4 = a5 = 0.
9.3 Regelkreis-Synthese unter Verwendung des Zustands-Beobachters
247
Um ein dem Beispiel entsprechend schnelles Regelverhalten trotz hinreichender Dämpfung zu erreichen, sollen für die gewünschten Pole des geschlossenen Regelkreises (entsprechend einer Ausregelzeit von ca. 4 bis 5 sec und einer max. Überschwingweite von 15 % bis 16 %) die Werte µ1 = −1 + j1,732;
µ2 = −1 − j1,732;
µ3 = µ4 = µ5 = −5
gewählt werden. Damit bekommt die gewünschte charakteristische Gleichung die Form (s − µ1 )(s − µ2 )(s − µ3 )(s − µ4 )(s − µ5 ) = = (s + 1 − j1,732)(s + 1 − j1,732)(s + 5)(s + 5)(s + 5) = s 5 + 17s 4 + 109s 3 + 335s 2 + 550s + 500 = s 5 + α1 s 4 + α2 s 3 + α3 s 2 + α4 s + α5 = 0. Die entsprechenden Koeffizienten haben damit die Werte α1 = 17;
α2 = 109;
α3 = 335;
α4 = 550;
α5 = 500.
Der nächste Schritt besteht in der Ermittlung der Transformationsmatrix T gemäß T = Sc · W wobei die Matrizen S c und W bereits aus den Gleichungen (9.5) und (9.6) bekannt sind: . S c = Bˆ Aˆ Bˆ Aˆ 2 Bˆ Aˆ 3 Bˆ Aˆ 4 Bˆ 0 −1 0 −20,601 0 0 −(20,601)2 −1 0 −20,601 ; = 0 0,490 0 0 0,5 0,490 0 10,105 0,5 0 0 0 −0,5 0 −0,490 a 4 a3 a2 a1 1 0 0 −20,601 0 −20,601 0 a3 a2 a1 1 0 0 1 W = a2 a1 1 0 0 = −20,601 a 1 0 0 0 0 1 0 1 1 0 0 0 0 1 0 0
0 1 0 0
1 0 0 . 0
0 0
248
9 Regelkreis-Synthese im Zustandsraum
Damit wird die Matrix T zu 0 0 0 −1 0 0 0 0 −1 0 0 0,5 0 T = MW = 0 −9,81 . 0 0 −9,81 0 0,5 9,81 0 −0,5 0 0 Die Inverse der Matrix T errechnet sich zu 1 0,5 0,25 0 − 0 − (9,81)2 (9,81)2 9,81 0,5 1 − 0 − 0 0 9,81 9,81 −1 T = . 0,5 1 0 − 0 − 0 9,81 9,81 −1 0 0 0 0 0
−1
0
0
0
Gemäß Gl. (9.14) wird Kˆ zu Kˆ = α5 − a5 α4 − a4 α3 − a3 α2 − a2 α1 − a1 · T −1 = 500 − 0 550 − 0 335 − 0 109 + 20,601 17 − 0 · T −1 = 500 50 335 129,601 17 · T −1 = −157,6336 −35,373 −56,0652 −36,746 50,9684 = k1 k2 k3 k4 −kI . Damit erhalten wir schließlich die gesuchte Rückführmatrix K zu K = k1 k2 k3 k4 = −157,6336 −35,3733 −56,0652
−36,7466
und den integralen Übertragungsbeiwert des Integrators im Fehlerkanal zu kI = −50,9684. Nachdem die Rückführmatrix K und der integrale Übertragungsbeiwert kI ermittelt worden sind, soll nun die Sprungantwort des auf diesem Weg fertig dimensionierten Systems durch die Lösung der Vektorgleichung x˙ A 0 x b 0 = · + ·u+ ·r (9.91) T ˙ξ ξ 0 1 −c 0
9.3 Regelkreis-Synthese unter Verwendung des Zustands-Beobachters
249
untersucht werden. Wegen u = −Kx + kI ξ kann Gl. (9.91) geschrieben werden als
x˙ A − bK = ˙ξ −cT
0 0 bkI x · + 0 · r ξ 0 0 1
oder
0 1 0 0 0 x˙2 −137,033 −35,373 −56,065 −36,746 50,968 x˙3 = 0 0 0 1 0 17,686 28,032 18,373 −25,484 x˙4 78,326 0 0 −1 0 0 ξ˙ x˙1
0 x2 0 · x3 + 0 · r x4 0 ξ 1 x1
(9.92)
Das Bild 9.15 zeigt den zeitlichen Verlauf der Zustandsgrößen x1 (t) bis x4 (t) sowie den Integratorausgang ξ(t) und die Stellgröße u(t) für einen sprungförmigen Sollwert r(t) = 0,5 Meter. Sämtliche Anfangsbedingungen wurden zu null vorbesetzt. Der zeitliche Verlauf der Zustandsgröße x3 (t) weist eine Ausregelzeit von ca. 4,5 sec auf und die maximale Überschwingweite beträgt wie gewünscht ca. 14,8 %. Ein interessanter Punkt ist der Verlauf der Zustandsgröße x3 (t) in der Umgebung des Koordinaten-Ursprungs. Wie man sieht, bewegt sich der Fahrwagen zunächst für die ersten 0,6 sec in negativer xRichtung, womit eine Vorwärtsdrehung des Pendels veranlasst wird. Erst dann bewegt sich der Fahrwagen entsprechend dem Sollwert r(t) in positiver x-Richtung. Wie zu erwarten war, nähert sich x3 (t) mit zunehmender Zeit dem Sollwert r(t). Weiterhin ist aus den entsprechenden Kurvenverläufen zu entnehmen, dass x1 (∞) = 0, x2 (∞) = 0, x4 (∞) = 0 und ξ(∞) = 0,55 wird. Diese Ergebnisse sollen im Folgenden nachgewiesen werden.
250
9 Regelkreis-Synthese im Zustandsraum
Bild 9.15: Zeitlicher Verlauf der Zustandsgrößen, des Integratorausgangs sowie der Stellgröße für einen sprungförmigen Sollwert r(t) = 0,5 Meter.
Die Gleichungen (9.85) und (9.88) werden im stationären Zustand zu ˙ x(∞) = 0 = Ax(∞) + bu(∞) ξ˙ (∞) = 0 = r − cT x(∞); beide Gleichungen lassen sich wie schon des Öfteren gezeigt zu einer Vektorgleichung kombinieren:
9.3 Regelkreis-Synthese unter Verwendung des Zustands-Beobachters
A 0 = 0 −cT
251
b x(∞) 0 · + . u(∞) r 0
Nach den Unbekannten umgestellt wird obige Gleichung zu
A x(∞) = u(∞) −cT
b 0
−1 0 · . −r
Unter Verwendung der Gl. (9.90) wird die Transponierte obiger Matrix zu 1 0,5 0 9,81 0 9,81 0 −1 1 0 0 0 0 A b = . 0 0 0 0 −1 −cT 0 0 0 1 0 0 0 0,05 0 2,1 0 Damit wird obige Vektorgleichung zu 1 0,5 0 0 0 0 0 x1 (∞) 9,81 9,81 0 0 x2 (∞) 1 0 0 0 0 · 0 = r . x3 (∞) = 0 0 0 0 −1 0 0 x4 (∞) 0 0 1 0 0 −r 0 u(∞) 0 0,05 0 2,1 0 Gemäß Gl. (9.86) gilt
x1 (∞) x2 (∞) y(∞) = cT x(∞) = 0 0 1 0 = x3 (∞) = r. x3 (∞) x4 (∞) Damit ist gezeigt, dass die Regelgröße im stationären Zustand tatsächlich den Sollwert annimmt. Wegen ˙ x(∞) = 0 = Ax(∞) + Bu(∞) bzw.
0 0 0 20,601 = 0 0 0 −0,490
1 0 0 0
0 0 0 0
0 0 0 0 0 −1 · + · u(∞) 1 r 0 0 0 0,5
252
9 Regelkreis-Synthese im Zustandsraum
bekommen wir u(∞) = 0. Außerdem folgt wegen u(∞) = 0 aus Gl. (9.87) u(∞) = 0 = −Kx(∞) + kI ξ(∞) und daraus ξ(∞) =
1 1 −56,065 r = 1,1 r. [Kx(∞)] = k3 x3 (∞) = kI kI −50,968
Also wird der Integratorausgang für r = 0,5 zu ξ(∞) = 0,55. Abschließend muss noch angemerkt werden, dass die gewünschten charakteristischen Pole zu modifizieren sind und ein neuer Steuervektor ermittelt werden muss, wenn bei einem aktuellen Regelungsproblem das Einschwingverhalten der Regelgröße(n) bez. der Geschwindigkeit oder der Dämpfung nicht zufrieden stellend ist. Hier bietet sich eine Computer-Simulation umso mehr an, als man bei neueren Software-Tools nur die Pole so lange zu verschieben hat, bis das Zeitverhalten den Vorstellungen bzw. den gestellten Anforderungen entspricht.
9.4
Optimale Regelsysteme
In diesem Abschnitt soll die Entwicklung eines stabilen Regelsystems, basierend auf einem quadratischen Güteindex, aufgezeigt werden. Es wird wieder von der Zustandsgleichung des ungeregelten Systems x˙ = Ax + Bu
(9.93)
ausgegangen. Der Grundgedanke der vorzustellenden Methode besteht darin, den Steuervektor u(t) so zu wählen, dass ein vorgegebener bzw. geforderter Güteindex minimiert wird. Hierzu hat sich ein quadratischer Güteindex
∞ J =
L(x, u)dt 0
als besonders nützlich erwiesen, wobei L(x, u) eine quadratische Funktion von x und u ist. Mit obigem Ansatz ergibt sich ein lineares Regelgesetz der Art u(t) = −Kx(t)
9.4 Optimale Regelsysteme
253
mit K als (r × n)-Matrix, oder
u1 k11 k12 . . . k1n x1 u2 k21 k22 . . . k2n x2 . . . = − . · . . . . . . . . . . . . ur kr1 kr2 . . . krn xn Die Entwicklung eines optimalen Reglers auf der Basis eines quadratischen Gütekriteriums reduziert sich damit offenbar auf die Bestimmung der Elemente der Reglermatrix K. Im Folgenden soll der optimale Stellvektor für das System der Gl. (9.93) mit dem Güteindex, gegeben durch J =
∞
x T Qx + uT Ru dt → Min.,
(9.94)
0
entwickelt werden, wobei Q und R reelle symmetrische Matrizen sind; der Steuervektor u wird als unbegrenzt vorausgesetzt. Der optimale Regler ist so auszulegen, dass der in Gl. (9.94) definierte Güteindex zu einem Minimum wird. Aus einer Reihe von Möglichkeiten soll hier die optimale Stellgröße auf der Basis der zweiten Methode von Liapunov hergeleitet werden. 9.4.1
Parameteroptimierung auf der Basis der zweiten Methode von Liapunov
Im Rahmen der klassischen Regelungstechnik wird zuerst der Regler nach einer festgelegten Vorgehensweise bestimmt und dann in einem zweiten Schritt die Stabilität überprüft. Abweichend davon gibt es Methoden, nach denen die Stabilitätsbedingungen zuerst formuliert werden und dann der Regler innerhalb der ermittelten Stabilitätsgrenzen entwickelt wird. Im Folgenden wird eine direkte Beziehung zwischen der Liapunov-Funktion und einem quadratischen Güteindex hergestellt und auf dieser Basis eine Regleroptimierung durchgeführt. Es wird von dem zu regelnden System x˙ = Ax ausgegangen, wobei alle Eigenwerte der Matrix A negative Realteile haben sollen – oder gleichbedeutend damit – der Koordinaten-Ursprung x = 0 asymptotisch stabil sein soll. Weiter wird vorausgesetzt, dass die Matrix A einstellbare, d.h. zu optimierende Parameter beinhaltet. Des Weiteren bestehe die Forderung, den folgenden Güteindex
∞ J =
x T Qx · dt → Min. 0
254
9 Regelkreis-Synthese im Zustandsraum
zu minimieren, wobei Q eine reelle symmetrische Matrix ist. Die Aufgabenstellung reduziert sich nun dahin gehend, die einstellbaren Parameter der Matrix A so zu modifizieren, dass der oben definierte Güteindex zu einem Minimum wird. Im Folgenden wird gezeigt, dass die genannte Aufgabe mit Hilfe der Liapunov-Funktion effektiv gelöst werden kann. Ausgegangen wird von der Liapunov-Funktion x T Qx = −
d T x Px dt
wobei P eine reelle symmetrische Matrix ist. Nach Ausführung der Differenziation erhält man x T Qx = x˙ T P x − x T P x˙ = −x T AT P x − x T P Ax = −x T AT P + P A · x. Aus der zweiten Methode von Liapunov ist bekannt, dass für eine gegebene Matrix Q und eine stabile Systemmatrix A eine Matrix P derart existiert, dass die Beziehung AT P + P A = −Q
(9.95)
erfüllt ist. Somit lassen sich aus dieser Gleichung die Elemente der Matrix P in bereits bekannter Weise bestimmen. Der Güteindex J kann nun berechnet werden zu
∞ J =
∞ x T Qxdt = − x T P x = −x T (∞)P x(∞) + x T (0)P x(0). 0
0
Weil voraussetzungsgemäß alle Eigenwerte der Matrix A einen negativen Realteil haben, gilt x(∞) → 0. Damit erhält man J = x T (0)P x(0).
(9.96)
Wie aus obiger Gleichung zu sehen ist, erhält man den Güteindex J in Abhängigkeit der Anfangsbedingung x(0) und der Matrix P , die mit den Matrizen A und Q durch die Gl. (9.95) verbunden ist. Wenn z.B. ein Systemparameter so einzustellen ist, dass der Güteindex J ein Minimum annimmt, so erreicht man dies durch die Minimierung des Ausdrucks x T (0)P x(0) bezüglich des einzustellenden Parameters. Dieser Minimierungsprozess ergibt dann den optimalen Wert des in Frage stehenden Systemparameters. Beispiel 9.8: Gegeben ist ein Regelkreis gemäß Bild 9.16:
Bild 9.16: Einfacher Regelkreis
9.4 Optimale Regelsysteme
255
Es ist der Wert der Dämpfungskonstanten d so zu bestimmen, dass für einen sprungförmigen Sollwerteingang, d.h. w(t) = ε(t), der folgende Güteindex ein Minimum annimmt: J =
∞
e2 + µe˙2 dt
(µ > 0),
0
wobei e = w − y das Fehlersignal ist. Das System sei zum Zeitpunkt t = 0 im Ruhezustand. Aus obigem Bild ergibt sich die Übertragungsfunktion des geschlossenen Regelkreises zu Y (s) 1 = 2 W (s) s + 2ds + 1
Fw (s) =
bzw.
y¨ + 2d y˙ + y = w.
Die beschreibende Differenzialgleichung für das Fehlersignal wird mit E(s) =
1 · W (s) 1 + Fo (s)
zu
e¨ + 2d e˙ + e = w¨ + 2d w. ˙ Wegen w(t) = ε(t) gilt natürlich w(0+) ˙ = 0, und w(0+) ¨ = 0. Damit gilt für t ≥ 0+ e¨(t) + 2d e(t) ˙ + e(t) = 0;
e(0+) = 1;
e(0+) ˙ = 0.
Mit den Zustandsvariablen x1 (t) = e(t),
x2 (t) = e(t) ˙
bekommt die Matrix A der Zustandsgleichung x˙ = Ax die Form 0 1 A= . −1 −2d Der Güteindex J kann im gegebenen Beispiel formuliert werden zu J =
∞
e2 + µe˙2 dt =
0+
∞ =
x1
1 x2 0
∞ x T Qx · dt 0+
x12 + µx22 dt
0+
0+
=
∞
0 µ
x1 x2
dt
256
9 Regelkreis-Synthese im Zustandsraum
mit x=
x1
x2
e = , e˙
Q=
1 0
0 . µ
Weil die Systemmatrix A stabil ist, wird, bezugnehmend auf Gl. (9.96), der Güteindex J zu J = x(0+ )P x(0+ ), wobei die Matrix P aus der Gleichung AT P + P A = −Q berechnet wird. Obige Gleichung bekommt durch Einsetzen der entsprechenden Matrizen die Form 0 −1 p11 p12 p11 p12 0 1 −1 0 + = 1 −2d −1 −2d 0 −µ p12 p22 p12 p22 Aus dieser Darstellung erhält man drei Gleichungen −2p12 = −1; p11 − 2dp12 − p22 = 0 ; 2p12 − 4dp22 = −µ die Auflösung dieser Gleichungen nach den Unbekannten pij liefert die Matrix P =
p11
p12
p12
p22
1+µ d + 4d = 1 2
1 2 . 1+µ 4d
Der bereits oben definierte Güteindex J = x(0+ )P x(0+ ) wird damit zu
1+µ J = d+ 4d
· x12 (0+ ) + x1 (0+ ) · x2 (0+ ) +
1+µ 2 · x2 (0+ ). 4d
Mit den Anfangsbedingungen x1 (0+ ) = 1, x2 (0+ ) = 0 erhält man J =d+
1+µ . 4d
Die Minimierung des Gütekriteriums J bezüglich der Dämpfung d erhält man aus
9.4 Optimale Regelsysteme
257
1+µ ∂J = 0. =1− ∂d 4d 2 Aus dieser Gleichung folgt √ 1+µ d= . 2 Der optimale Wert der Dämpfung d für beispielsweise µ = 1 wird dann zu 9.4.2
√
2 2
= 0,707.
Das quadratische Gütekriterium
In diesem Abschnitt wird ein Verfahren zur Bestimmung der Matrix K des zu optimierenden Stellvektors u(t) = −Kx(t)
(9.97)
aufgezeigt, welcher das Ziel verfolgt, den Güteindex J =
∞
x T Qx + uT Ru dt
(9.98)
0
zu minimieren, wobei Q und R positiv definite oder reelle symmetrische Matrizen sind. Dabei sollte beachtet werden, dass der zweite Term der rechten Seite der obigen Gleichung auf die Minimierung der Stellenergie abzielt. Die Matrizen Q und R dienen der Bewertung bezüglich der Minimierung der Zustandsgrößen bzw. der Stellenergie. Für die folgende Betrachtungsweise wird davon ausgegangen, dass der Stellvektor u(t) unbeschränkt sei. Die zu bestimmenden Elemente der Matrix K werden unter der Prämisse bestimmt, dass der Güteindex J minimiert und damit die Stellgröße u(t) für jeden beliebigen Anfangszustand x(0)optimiert wird. Setzt man die Gl. (9.97) in die Zustandsgleichung x˙ = Ax + Bu des zu regelnden Systems ein, so erhält man x˙ = Ax − BKx = (A − BK)x. Es wird nun von der realistischen Voraussetzung ausgegangen, dass die Matrix A − BK stabil ist, d.h. deren Eigenwerte einen negativen Realteil haben. Mit Gl. (9.97) wird Gl. (9.98) zu
∞ J =
# x T Qx + x T K T RKx · dt
"
0
∞ = 0
# " x T Q + K T RK · x · dt.
258
9 Regelkreis-Synthese im Zustandsraum
Analog zur Parameteroptimierung des vorangegangenen Abschnitts setzen wir d T x T Q + K T RK · x = − x Px . dt Führt man die Differenziation der rechten Seite aus, so wird obige Gleichung zu . x T Q + K T RK x = −x˙ T P x − x T P x˙ = − x T (A − BK)T P + P (A − BK) · x Vergleicht man beide Seiten der obigen Gleichung und beachtet, dass diese Gleichung für jedes beliebige x gelten muss, dann gilt (A − BK)T P + P (A − BK) = − Q + K T RK (9.99) Im Rahmen der zweiten Methode von Liapunov wurde festgestellt, dass eine positiv definite Matrix P existiert, die obige Gleichung erfüllt, sofern die Matrix A−BK stabil ist. In analoger Weise, wie bei der Herleitung der Gl. (9.96), kann der Güteindex als J = x T (0)P x(0)
(9.100)
formuliert werden. Zur Lösung des quadratischen Gütekriteriums wird nun folgendermaßen vorgegangen. Weil die Matrix R als reelle, symmetrische und positiv definite Matrix angenommen wurde, ist folgender Ersatz möglich: R = T TT , wobei T eine nicht singuläre Matrix ist. Damit wird Gl. (9.99) zu AT − K T B T · P + P · (A − BK) + Q + K T T T T K = 0; diese Gleichung lässt sich auf die Form T −1 −1 T T T T A P + PA + TK − T TK − T B P B P
T
− P BR −1 B T P + Q = 0 bringen. Die Minimierung von J bezüglich der Matrix K erfordert die Minimierung des folgenden Ausdrucks x
T
TK − T
T
−1
T T
B P
TK − T
T
−1
T
B P x
bezüglich K. Weil der obige Ausdruck nicht negativ sein kann, tritt das Minimum für den Fall auf, dass dieser Ausdruck zu null wird; das heißt
9.4 Optimale Regelsysteme
259
−1 TK = TT BTP und somit −1 K = T −1 T T B T P = R −1 B T P
(9.101)
Die Gleichung (9.101) liefert die optimale Matrix K. Wie man sieht, ist das optimale Regelgesetz linear, wobei der Güteindex durch Gl. (9.98) gegeben ist. Die optimale Stellgröße wird damit zu u(t) = −Kx(t) = −R −1 B T P x(t). Die Matrix P der Gleichung (9.101) muss Gl. (9.99) bzw. die folgende reduzierte Gleichung erfüllen: AT P + P A − P BR −1 B T P + Q = 0
(9.102)
Die Gleichung (9.102) wird in der Fachliteratur als reduzierte Riccati-Gleichung bezeichnet. Bei entsprechenden Syntheseproblemen ist folgender Lösungsgang zu empfehlen: 1. Zunächst ist mit Hilfe der Gl. (9.102) die Matrix P zu bestimmen. 2. Einsetzen der Matrix P in Gl. (9.101). Die daraus resultierende Matrix K liefert den optimalen Stellvektor.
Beispiel 9.9: Gegeben sei das System entsprechend dem folgenden Bild. Aufgabe ist, für die Stellgröße u(t) = −Kx(t) die Rückführmatrix so zu optimieren, dass der Güteindex
J =
∞
x T Qx + u2 dt
0
minimal wird, wobei die Matrix Q gegeben sei zu Q=
1 0
0 ; µ
(µ ≥ 0).
260
9 Regelkreis-Synthese im Zustandsraum
Bild 9.17: Regelstrecke mit zwei Integratoren
Die Zustandsgleichung des gegebenen Systems ergibt sich aus Bild 9.17 zu x˙ = Ax + Bu mit A=
0 0
1 0
0 B= . 1
und
Es soll die Matrix K unter Verwendung der reduzierten Riccati-Gleichung für den optimierten Regelkreis ermittelt werden. Die Gl. (9.102) wird für das vorliegende Beispiel zu
0 0 1 0
p11 p12 p12 p22
p11 p12 + p12 p22 p11 p12 p12 p22
0 1
0 0
−
p11 p12 0 1 0 0 0 1 0 1 + = 1 0 µ 0 0 p12 p22
Diese Gleichung lässt sich vereinfachen zu
0 0 p11 p12
+
0 p11 0 p12
−
2 p12
p12 p22
p12 p22 2 p22
+
1 0 0 µ
=
0 0 0 0
.
Aus dieser Matrixgleichung folgen die Identitäten 2 =0 1 − p12
p11 − p12 p22 = 0 2 µ + 2p12 − p22
.
=0
Löst man diese Gleichungen nach den Unbekannten der gesuchten Matrix P auf, so folgt
9.4 Optimale Regelsysteme
P =
p11 p12 p12 p22
261
√ µ+2 1 √ = . 1 µ+2
Die Matrix K der optimalen Zustandsrückführung wird gemäß Gl. (9.101) zu K = R −1 B T P bzw. p11 p12 √ 1 · 0 1 · = p12 p22 = 1 µ + 2 . p12 p22 Die optimale Stellgröße wird schließlich zu u = −Kx = −x1 −
µ + 2 · x2 .
(9.103)
Abschließend sollte noch darauf hingewiesen werden, dass sich mit dem Regelgesetz gemäß Gl. (9.103) ein optimales Einschwingen ergibt, und zwar unabhängig vom Anfangszustand der Zustandsgrößen. Bild 9.18 zeigt schließlich das Blockschaltbild des geregelten Systems.
Bild 9.18: Optimale Regelung eines Systems zweiter Ordnung
10
Diskrete Regelung kontinuierlicher Systeme
Seit dem Beginn der Sechzigerjahre des zwanzigsten Jahrhunderts werden in zunehmendem Maße Prozessrechner und Mikrocomputer als Regler in industriellen Prozessen eingesetzt. Zur Optimierung dieser geregelten Prozesse, beispielsweise mit dem Ziel maximaler Produktivität bei minimalem Stellgrößenaufwand, werden immer häufiger digitale statt analoge Regler eingesetzt. Dieser Trend gilt für die Regelung industrieller Roboter ebenso wie für die Optimierung des Kraftstoffverbrauchs von Kraftfahrzeugen und Flugzeugen oder für die Minimierung des Wasserverbrauchs kommerzieller Waschmaschinen. Aus diesen und einer Reihe anderer Gründe ist die digitale Regelungstechnik Lehrgebiet für Studenten und soll deshalb auch in diesem Buch mit dem gebührenden Stellenwert behandelt werden.
10.1 Signaltypen Ein zeitkontinuierliches Signal zeichnet sich dadurch aus, dass es über einen kontinuierlichen Zeitbereich eindeutig definiert ist. Die Amplitude kontinuierlicher Signale kann einen kontinuierlichen Wertebereich oder auch nur eine endliche Anzahl verschiedener Werte annehmen. Ein analoges Signal ist über einen kontinuierlichen Zeitbereich eindeutig definiert, wobei die Amplitude einen kontinuierlichen Wertebereich annehmen kann. Das Bild 10.1 a) zeigt ein zeitkontinuierliches analoges Signal, Bild 10.1 b) zeigt zum Vergleich ein zeitkontinuierliches und bezüglich der Amplitude quantisiertes Signal. Dabei muss korrekterweise darauf verwiesen werden, dass das analoge Signal ein Spezialfall der zeitkontinuierlichen Signale ist. Ein zeitlich diskretes Signal ist definitionsgemäß nur für diskrete Zeitpunkte eindeutig definiert. Wenn die Amplitude dieses Signaltyps einen kontinuierlichen Wertebereich annehmen kann, dann wird dieses Signal als abgetastetes Signal bezeichnet. Anhand von Bild 10.1 ist leicht zu ersehen, dass ein zeitdiskretes Signal durch die Abtastung eines analogen Signals zu festen, d.h. diskreten Zeitpunkten, entsteht. Die diskrete Wertefolge kann dann auch als amplitudenmodulierte Impulsfolge verstanden werden; siehe hierzu Bild 10.1 c). Ein digitales Signal ist schließlich ein zeitdiskretes Signal mit quantisierten Amplituden. Dieser Signaltyp wird in der Regel durch eine Sequenz von Zahlenwerten dargestellt, beispielsweise in Form von Binärzahlen; siehe Bild 10.1 d). Wie man aus diesem Bild unschwer erkennen kann, ist das digitale Signal bezüglich der Amplitude und der Zeit quantisiert. Bei regelungstechnischen Aufgaben ist die zu regelnde physikalische Größe der Regelstrecke in den meisten Fällen ein zeitkontinuierliches Signal. Wenn nun die Regelgröße mit einem digitalen Regler geregelt werden soll, so wird eine Signalkonversion von analogen zu digitalen Signalen und umgekehrt notwendig; mehr darüber im Abschnitt 10.1.3.
10.2 Prinzipieller Aufbau digitaler Regelkreise
263
Bild 10.1: a) zeitkontinuierliches analoges Signal, b) zeitkontinuierliches quantisiertes Signal c) abgetastetes (diskretes) Signal, d) digitales Signal
10.2 Prinzipieller Aufbau digitaler Regelkreise Das folgende Bild zeigt die wesentlichen Komponenten eines digitalen Regelkreises; dieses Bild gilt stellvertretend für jeden diskreten Regelkreis.
Bild 10.2: Blockschaltbild des digitalen Standard-Regelkreises
Aus diesem Bild kann man unschwer erkennen, dass hier analoge, zeitdiskrete und numerisch codierte Signale nebeneinander, d.h. gleichzeitig im Regelkreis existieren. Die physikalische Regelgröße als zeitkontinuierliches Signal wird vom Sensor erfasst, der ebenso ein zeitkontinuierliches Signal produziert, das gegebenenfalls bei auftretenden Störungen auf der Übertragungsleitung gefiltert werden muss, bevor es dem Soll/Ist-Vergleicher zugeführt wird. Die Regeldifferenz wird über eine Sample/Hold-Schaltung (S/H) und einen Analog/DigitalWandler (A/D) diskretisiert. Diese Signalkonversion findet im Idealfall, von dem hier aus-
264
10 Diskrete Regelung kontinuierlicher Systeme
gegangen werden soll, zeitgleich mit der Abtastung statt. Der im angedeuteten Computer gespeicherte Regelalgorithmus verarbeitet die einlaufende Zahlensequenz und berechnet zu jedem Abtastzeitpunkt die Reglerausgangsgröße als neue Zahlensequenz. Der nachgeschaltete Digital/Analog-Wandler (D/A) formt die vom Computer ausgegebene codierte Zahlenfolge in dazu äquivalente Signalimpulse um, die wiederum von dem nachgeschalteten Halteglied bis zum Eintreffen eines neuen Impulses auf ihrem Pegel gehalten werden. Somit entsteht am Ausgang des Haltegliedes aus der einlaufenden Impulsfolge eine Treppenfunktion. Das Stellglied produziert schließlich entsprechend seines Übertragungsverhaltens aus der Treppenfunktion des Haltegliedes die dazugehörige kontinuierliche Stellgröße als Eingangsgröße der zu regelnden Strecke. Die Kombination des Abtast/Halte-Gliedes mit dem Analog/DigitalWandler kann als idealer Schalter betrachtet werden, der zu jedem Zeitintervall T infinitesimal kurzgeschlossen ist und eine Sequenz numerisch codierter Zahlen produziert. In der Fachliteratur wird dieser idealisierte Abtaster als δ-Abtaster bezeichnet. Der Computer erzeugt mit seinem Algorithmus zeitgleich eine numerisch codierte Zahlensequenz, die dem D/A-Wandler zur Decodierung zugeführt wird. Abgesehen von einer Reihe möglicher Abtastmethoden kommt in der Praxis vorwiegend die periodische Abtastung zur Anwendung, die deshalb in diesem Buch auch ausschließlich behandelt werden soll. In diesem Fall liegen die Abtastzeitpunkte zeitlich konstant versetzt, es gilt also die Beziehung tk = kT
(k = 0, 1, 2, . . . ),
mit tk T
Abtastzeitpunkt Abtastperiode.
Schließlich sollte noch erwähnt werden, dass als Regelalgorithmen, von Ausnahmen abgesehen, vorwiegend die diskretisierten Versionen der bewährten klassischen Reglertypen (PI, PD, PID) eingesetzt werden.
10.3 Signalkonversion Durch den Einsatz von Prozessrechnern und Mikrocomputern als regelnde Elemente kommen beim digitalen Regelkreis zwangsläufig Bauelemente zur Anwendung, die bei analogen Regelkreisen nicht in Erscheinung treten. Dazu gehören insbesondere Halteglieder, Analog/Digitalsowie Digital/Analog-Wandler, die nachfolgend bezüglich ihrer grundsätzlichen Funktionsweise kurz erklärt werden sollen. Halteglieder Dem Abtaster kommt in einem digitalen Regelkreis die Aufgabe zu, ein analoges Signal in eine Kette von amplitudenmodulierten Signalen umzuformen. Das nachgeschaltete Halteglied speichert die Impulsamplitude zum jeweiligen Tastzeitpunkt bis zum Eintreffen des Impulses im darauf folgenden Abtastzeitpunkt. Das Abtast/Halte-Glied ist zum A/D-Wandler insofern
10.3 Signalkonversion
265
eine notwendige Ergänzung, um Zahlenwerte zu erzeugen, die das Eingangssignal zum jeweiligen Abtastzeitpunkt möglichst genau repräsentieren. Abtast/Halte-Glieder werden in der Fachsprache unter der Bezeichnung „Sample-and-Hold“ geführt. Aus der Sicht der Mathematik werden die Operationen Abtasten und Halten als zwei getrennte Vorgänge betrachtet, von denen in einem späteren Kapitel noch ausführlich die Rede sein wird. Analog/Digital-Wandler Definitionsgemäß versteht man unter der Abtastung eines analogen Signals und der Konvertierung in eine Binärzahl eine Analog/Digital-Umsetzung. Somit transformiert ein Analog/ Digital-Wandler ein analoges Signal in ein numerisch codiertes Datenwort begrenzter Länge aus nur Nullen und Einsen. Aus praktischer Sicht beinhaltet die Analog/Digital-Konversion die Operationen Abtasten, Halten, Quantisierung und Codierung. Der A/D-Konverter sendet mit jedem Taktimpuls zu den Zeitpunkten tk = kT , (k = 0, 1, 2, . . . ) ein Binärwort an den digitalen Regler. Unter den vielen Verfahren der A/D-Wandlung kommen die folgenden Typen am häufigsten zur Anwendung: • • •
Verfahren der sukzessiven Approximation, Kaskadenumsetzer, Zählverfahren und
•
Wägeverfahren.
Jeder dieser aufgeführten Typen hat natürlich seine eigenen Vor- und Nachteile. Im jeweiligen Anwendungsfall muss vor allem die Konversionsgeschwindigkeit, die Genauigkeit und natürlich der Preis in Betracht gezogen werden. Der in der Praxis am häufigsten verwendete A/D-Wandler beruht auf dem Prinzip der sukzessiven Approximation, dessen Aufbau im folgenden Bild schematisch wiedergegeben ist.
Bild 10.3: Schema des sukzessiven A/D-Konverters
266
10 Diskrete Regelung kontinuierlicher Systeme
Das so genannte sukzessive Approximationsregister (SAR) setzt bei jeder Signalkonversion zunächst das höchstwertige Bit (entsprechend dem halben Maximum bez. der maximal darstellbaren Zahl) und vergleicht diesen Wert mit Hilfe des D/A-Umsetzers und dem Komparator mit dem analogen Eingangssignal. Mit Hilfe des Komparatorausgangs wird entschieden, ob dieses Bit gesetzt bleiben darf oder rückgesetzt werden muss. Wenn das analoge Eingangssignal größer ist als der halbe Messbereich, dann bleibt das höchstwertige Bit (Most Significant Bit, MSB) gesetzt. Beim Eintreffen des nächsten Taktimpulses des A/D-Wandlers wird das zweithöchste Bit gesetzt und das analoge Eingangssignal mit 75 % des maximal konvertierbaren Signalpegels verglichen. Im umgekehrten Fall, das heißt, wenn das MSB zurückzusetzen ist, wird in analoger Weise in Richtung kleinerer Spannungen verfahren. Durch n Vergleichsoperationen, wobei n die Länge des Binärwortes ist, entsteht am digitalen Ausgangsregister ein Bitmuster (Datenwort), das dem analogen Eingangssignal proportional ist. Handelsübliche A/D-Konverter benötigen etwa 2 µs für eine 12-Bit-Konversion.
Digital/Analog-Umsetzer Ein Digital/Analog-Umsetzer transformiert ein binäres Datenwort in ein dazu analoges elektrisches Signal. Für den vollen Bereich der digitalen Eingangsgröße korrespondieren 2n verschiedene Analogwerte, einschließlich der Null. Somit existiert für die Digital/Analog-Konversion eine Eins-zu-eins-Korrespondenz zwischen dem digitalen Eingang und dem analogen Ausgangssignal. Im Bild 10.4 ist der schematische Aufbau eines Analog/Digital-Wandlers wiedergegeben, der auf dem Prinzip der „Summation gewichteter Ströme“ beruht. Die Eingangswiderstände des Operationsverstärkers sind entsprechend dem obigen Bild in Zweierpotenzen gewichtet. Wenn dieser Schaltung eine binäre Eins zugeführt wird, dann kippt der als elektronisches Gate ausgeführte Schalter und verbindet den Widerstand mit der Referenzspannung Uref . Wird der Schaltung eine logische Null zugeführt, so verbindet der elektronische Schalter den Widerstand mit dem Masseanschluss.
Bild 10.4: Schematischer Aufbau eines 4-Bit-D/A-Wandlers
10.3 Signalkonversion
267
In der praktischen Anwendung wird dieser Schaltung das gesamte Datenwort parallel zugeführt, das heißt mit jedem Bit wird jeweils ein Schalter angesteuert. Somit erzeugt der D/A-Wandler eine analoge Ausgangsspannung, die zu dem zu konvertierenden Binärwort korrespondiert. Wenn beispielsweise am Eingang eines 4-Bit-D/A-Wandlers ein 4-Bit-Datenwort b3 b2 b1 b0 ansteht, wobei die b-Koeffizienten die Werte null oder eins annehmen können, so ergibt sich das dazu analoge Ausgangssignal zu R0 Ua = R
b2 b1 b0 b3 + + + 2 4 8
· Uref .
Dabei sollte beachtet werden, dass mit zunehmender Wortlänge die der Wertigkeit zugeordneten Widerstände entsprechend groß werden und damit natürlich die Genauigkeit des D/A-Wandlers herabgesetzt wird. Die Erklärung weiterer Versionen von D/A-Konvertern soll jedoch der vertiefenden Fachliteratur vorbehalten bleiben.
11
Übertragungsverhalten diskreter Systeme
11.1 Übertragungsfunktion Das Übertragungsverhalten linearer kontinuierlicher Systeme wird bekanntlich durch Differenzialgleichungen beschrieben. Analog dazu werden zeitdiskrete Systeme durch entsprechende Differenzengleichungen beschrieben. Das Eingangs/Ausgangsverhalten eines diskreten Systems wird durch die Differenzengleichung y(k) + a1 y(k − 1) + a2 y(k − 2) + . . . + an y(k − n) = b0 u(k) + b1 u(k − 1) + . . . + bm u(k − m)
(11.1)
beschrieben, wobei u(k) Eingangsgröße und y(k) Ausgangsgröße im k-ten Iterationsschritt bzw. zum Zeitpunkt t = kT mit k = 0, 1, 2, . . . ist . Will man im Interesse der Bestimmung einer Übertragungsfunktion diese Differenzengleichung in den z-Bereich transformieren, so ist analog zur Übertragungsfunktion kontinuierlicher Systeme von jedem einzelnen Term der Gl. (11.1) die z-Transformierte zu bilden. Bezugnehmend auf Tabelle II.3 (Anhang) und die Definition Z [y(k)] = Y (z) wird die z-Transformierte der Gl. (11.1) ohne Berücksichtigung der Anfangswerte zu Y (z) + a1 z−1 Y (z) + a2 z−2 Y (z) + . . . + an z−n Y (z) = b0 U (z) + b1 z−1 U (z) + . . . + bm z−m U (z) bzw. zusammengefasst Y (z) 1 + a1 z−1 + a2 z−2 + . . . + an z−n = U (z) b0 + b1 z−1 + . . . + bm z−m . Die Übertragungsfunktion wird (analog zur entsprechenden Definition im Laplace-Bereich) per Definition zu F (z) : =
Y (z) b0 + b1 z−1 + . . . + bm z−m . = U (z) 1 + a1 z−1 + a2 z−2 + . . . an z−n
(11.2)
Aus dem Bereich zeitkontinuierlicher Systeme ist bekannt, dass die Übertragungsfunktion die Laplace-transformierte Impulsantwort des betrachteten Systems repräsentiert. In Analogie dazu wird nun die Impulsantwort eines diskreten Systems untersucht:
11.1 Übertragungsfunktion
269
Mit dem Kronecker-Impuls
δ0 (kT ) =
1 0
für k = 0 für k = 0
und U (z) = Z [δ0 (kT )] = 1 wird die Ausgangsgröße zu Y (z) =
b0 + b1 z−1 + . . . + bm z−m = F (z). 1 + a1 z−1 + a2 z−2 + . . . an z−n
(11.3)
Wie man aus der obigen Gleichung unschwer erkennen kann, stellt die Übertragungsfunktion die z-transformierte Systemantwort des Delta-Impulses dar und spielt damit dieselbe Rolle wie die Übertragungsfunktion zeitlich kontinuierlicher Systeme. Die inverse z-Transformierte der Übertragungsfunktion der Gl. (11.3) y(k) = Z−1 [F (z)] wird, wiederum in Analogie zum kontinuierlichen Fall, als Gewichtsfolge bezeichnet. Beispiel 11.1: Gegeben sei die Differenzengleichung eines diskreten Systems zu y(k + 2) + a1 y(k + 1) + a2 y(k) = b0 u(k + 2) + b1 u(k + 1) + b2 u(k) wobei von derAnnahme ausgegangen wird, dass sich das System ursprünglich im Ruhezustand befand, d.h. u(k) = 0 für k < 0. Gesucht ist die Übertragungsfunktion F (z) =
Y (z) . U (z)
Die z-Transformierte der gegebenen Differenzengleichung wird zu 2 z Y (z) − z2 y(0) − zy(1) + a1 [zY (z) − zy(0)] + a2 Y (z) = b0 z2 U (z) − z2 u(0) − zu(1) + b1 [zU (z) − zu(0)] + b2 U (z) oder
z2 + a1 z + a2 Y (z) = b0 z2 + b1 z + b2 U (z) + z2 [y(0) − b0 u(0)]
+ z [y(1) + a1 y(0) − b0 u(1) − b1 u(0)] ;
(11.4)
270
11 Übertragungsverhalten diskreter Systeme
auf Grund der oben definierten Anfangsbedingungen ist y(k) = 0 für k < 0. Zur Bestimmung der Anfangsbedingungen y(0) und y(1) substituieren wir k = −2 und k = −1 in der gegebenen Differenzengleichung: y(0) + a1 y(−1) + a2 y(−2) = b0 u(0) + b1 u(−1) + b2 u(2). Diese Gleichung vereinfacht sich zu y(0) = b0 u(0).
(11.5)
Analog erhalten wir y(1) + a1 y(0) + a2 y(−1) = b0 u(1) + b1 u(0) + b2 u(−1) oder y(1) = −a1 y(0) + b0 u(1) + b1 u(0).
(11.6)
Setzt man nun die Gleichungen (11.5) und (11.6) in Gl. (11.4) ein, so erhält man z2 + a1 z + a2 Y (z) = b0 z2 + b1 z + b2 U (z). Die gesuchte Übertragungsfunktion wird damit zu F (z) =
Y (z) b0 z2 + b1 z + b2 . = 2 U (z) z + a1 z + a 2
11.2 Idealer Abtaster Im Kapitel 10 wurde bereits einleitend erwähnt, dass in jedem digitalen Regelkreis diskrete und kontinuierliche Signale nebeneinander, d.h. gleichzeitig existieren. Im Rahmen der Analyse diskreter Regelkreise spielt die z-Transformation eine sehr maßgebliche Rolle. Um dies aufzuzeigen wird zunächst das Konzept der Impuls-Abtastung vorgestellt. Die Aufgabe des konventionellen Abtasters besteht darin, zu jedem Abtastzeitpunkt T eine „Probe“ eines maßgeblichen Signals aufzunehmen. Dabei wird die Schließdauer des (als Schalter gedachten) Abtasters als vernachlässigbar klein im Vergleich zur dominanten Zeitkonstante des zu regelnden Systems vorausgesetzt. (Diese Form der Abtastung wird zuweilen auch als δ-Abtaster bezeichnet.) Durch den Prozess der Abtastung wird ein ursprünglich kontinuierliches Signal in eine Impulskette umgeformt, deren Einzelimpulse zu den Abtastzeitpunkten t = 0, T , 2T , . . . auftreten, wobei T die bereits definierte Abtastperiode ist. Das dem Abtaster nachgeschaltete Halteglied hält den jeweiligen Abtastwert bis zum Eintreffen des nächsten Impulses, das heißt, er konvertiert die einlaufenden Impulse in ein zeitlich kontinuierliches Signal.
11.2 Idealer Abtaster
271
Das Halteglied produziert an seinem Ausgang ein zeitkontinuierliches Signal h(t) aus der Sequenz der diskreten Signalwerte x(kT ). Neben anderen Versionen wird in der Praxis vorwiegend das „Halteglied nullter Ordnung“ eingesetzt, das durch die Gleichung h(kT + τ ) = x(kT );
(11.7)
mit 0 ≤ τ < T;
k = 0, 1, 2, . . .
charakterisiert ist. Aus Gl. (11.7) geht hervor, dass diese Schaltung den jeweiligen Abtastwert x(kT ) bis zum Eintreffen eines neuen Signals konstant aufrechthält und damit an seinem Ausgang eine so genannte Treppenfunktion produziert. Zur Bestimmung der Übertragungsfunktion des Haltegliedes gehen wir vom Bild 11.1 aus.
Bild 11.1: Impuls-Abtaster und Halteglied
Unter der Voraussetzung x(t) = 0 für t < 0 wird das gehaltene Ausgangssignal h(t) in Abhängigkeit der Abtastwerte zu h(t) = x(0) [ε(t) − ε(t − T )] + x(T ) [ε(t − T ) − ε(t − 2T )] x(2T ) [ε(t − 2T ) − ε(t − 3T )] + . . .
h(t) =
∞
x(kT ) [ε(t − kT ) − ε(t − (k + 1)T )].
k=0
Mit der bekannten Beziehung L [ε(t − kT )] =
e−ksT s
(11.8)
272
11 Übertragungsverhalten diskreter Systeme
wird Gl. (11.8) zu L [h(t)] = H (s) =
∞
x(kT )
k=0
∞ 1 − e−sT e−skT − e−(k+1)sT = x(kT ) e−skT . (11.9) s s k=0
Die rechte Seite dieser Gleichung kann als Produkt von zwei Termen definiert werden, nämlich zu H (s) = Fh (s)X ∗ (s),
(11.10)
wobei 1 − e−sT s
Fh (s) =
(11.11)
die Übertragungsfunktion des Haltegliedes nullter Ordnung ist. Der Term X∗ (s) =
∞
x(kT ) e−skT
(11.12)
k=0
ist die Laplace-Transformierte der Impulsfolge x ∗ (kT ). Diese Impulsfolge kann unter Anwendung der Ausblendeigenschaft des Impulses auf die Form x ∗ (t) =
∞
x(kT ) δ(t − kT ) mit δ(t) =
k=0
1 0
für t = kT für t = kT
(11.13)
gebracht werden. Dabei gilt im Übrigen der Zusammenhang ∞ Z [x(t)] = Z x ∗ (t) = X(z) = x(kT ) z−k .
(11.14)
k=0
11.2.1 z-Transformierte aus einem Halteglied und einem kontinuierlichen Übertragungsglied Bezugnehmend auf Bild 10.2 ist festzustellen, dass bei allen technisch realisierten Regelkreisen das Halteglied immer mit der zu regelnden Strecke gepaart in Form einer Kettenschaltung auftritt. Bezeichnen wir künftig mit G(s) grundsätzlich das Produkt der beiden Übertragungsfunktionen aus Halteglied und kontinuierlicher Strecke, so erhalten wir G(s) = Fh (s) · F (s). Setzen wir die bereits bekannte Übertragungsfunktion des Haltegliedes nullter Ordnung und die Übertragungsfunktion F (s) der Regelstrecke in allgemeiner Form ein, so erhalten wir
11.2 Idealer Abtaster
G(s) =
273
1 − e−sT F (s) · F (s) = (1 − e−sT ) · . s s
Beachtet man weiter, dass es sich bei der z-Transformation um eine lineare mathematische Operation handelt und der bekannte Zusammenhang z = esT gilt, so ergibt sich die z-Transformierte aus der Reihenschaltung des Haltegliedes mit der zeitlich kontinuierlichen Strecke zu F (s) z−1 F (s) −1 G(z) = 1 − z ·Z = ·Z . s z s
(11.15)
Es sei der Deutlichkeit wegen angemerkt, dass bei allen folgenden Abhandlungen davon ausgegangen wird, dass mit G(z) grundsätzlich die z-Transformierte eines Haltegliedes nullter Ordnung in Verbindung mit einem kontinuierlichen Übertragungsglied zu verstehen ist! Anhand des folgenden kurzen Beispiels soll die Vorgehensweise zur Bestimmung von G(z) aufgezeigt werden. Beispiel 11.2: Es ist die z-Transformierte der Reihenschaltung eines Halteglieds nullter Ordnung mit einem Verzögerungsglied erster Ordnung zu bestimmen. Es gilt also G(s) =
1 − e−sT 1 · . s s+1
Bezugnehmend auf Gl. (11.15) erhalten wir zunächst
G(z) = 1 − z
−1
1 ·Z . s(s + 1)
1 Unterzieht man den Term s(s+1) einer Partialbruchzerlegung, die jedoch sicher mit nur geringem Aufwand durchgeführt werden kann und deshalb hier nicht ausgeführt wird, so erhalten wir
G(z) = 1 − z und daraus
−1
1 1 1 1 −1 − ·Z · − = 1−z s s+1 1 − z−1 1 − e−T z−1
"
# 1 − e−T z−1 G(z) = . 1 − e−T z−1
274
11 Übertragungsverhalten diskreter Systeme
11.2.2 Beurteilung der Stabilität diskreter Systeme Im letzten Kapitel ist bereits verschiedentlich der Begriff der Stabilität angesprochen worden. In diesem Kapitel soll die Stabilität linearer, zeitinvarianter, diskreter Systeme und Regelkreise diskutiert werden. Wir gehen aus vom Standard-Regelkreis, zusammengesetzt aus dem diskreten Regler mit der Übertragungsfunktion FR (z) und der Kombination aus dem zu regelnden System und dem Messglied, repräsentiert mit der Übertragungsfunktion G(z). Damit wird die Führungsübertragungsfunktion zu FW (z) =
FR (z)G(z) Y (z) = . W (z) 1 + FR (z)G(z)
(11.19)
Die Stabilität des geschlossenen Regelkreises gemäß Gl. (11.19) wie auch anderer diskreter Systeme wird, analog zu kontinuierlichen Systemen, anhand der Lage der Lösungen der charakteristischen Gleichung P (z) = 1 + FR (z)G(z) = 0 beurteilt. Mit der – wiederum in Analogie zur Theorie kontinuierlicher Systeme – Definition des offenen Regelkreises zu Fo (z) = FR (z)G(z) bekommt die charakteristische Gleichung die endgültige Form zu P (z) = 1 + Fo (z) = 0.
(11.20)
Das System mit der charakteristischen Gleichung P (z) = 1 + Fo (z) = 0 ist dann stabil, wenn •
sämtliche Lösungen der charakteristischen Gleichung innerhalb des Einheitskreises der z-Ebene liegen. Jeder Pol des geschlossenen Regelkreises außerhalb des Einheitskreises ist ein Indiz für Instabilität.
•
Liegt ein einfacher Pol an der Stelle z = 1 oder an der Stelle z = −1, dann befindet sich das betrachtete System an der Stabilitätsgrenze. Weiterhin liegt in einem System der Fall der Grenzstabilität vor, wenn ein einfaches konjugiert komplexes Polpaar auf dem Einheitskreis der z-Ebene liegt. Jeder mehrfache Pol des geschlossenen Systems auf dem Einheitskreis ist ein Hinweis für die Instabilität des geschlossenen Regelkreises.
•
Die Nullstellen des geschlossenen Regelkreises haben keinen unmittelbaren Einfluss auf dessen Stabilität.
Beispiel 11.3: Für den im folgenden Bild skizzierten Regelkreis ist die Stabilität für den Fall K = 1 und der Abtastperiode T = 1 sec anhand der Lage der Polstellen des geschlossenen Regelkreises zu beurteilen.
11.2 Idealer Abtaster
275
Bild 11.2: Blockschaltbild des geschlossenen Standard-Regelkreises
Die Übertragungsfunktion des offenen Regelkreises ist, analog zur Definition im kontinuierlichen Regelkreis, das Verhältnis zwischen rückgeführter Regelgröße und Sollwert bei nicht vorhandener Rückführung, im gegebenen Fall erhalten wir somit für K = 1 Fo (s) =
1 − e−s 1 · . s s(s + 1)
Mit der bekannten Definition z = esT wird die Übertragungsfunktion des offenen Regelkreises im z-Bereich zu 1 . Fo (z) = 1 − z−1 · Z 2 s (s + 1) Verwendet man außerdem die Tabelle II.1 (Anhang) zur Transformation des Terms
1 2 s (s + 1)
in den z-Bereich, so erhält man Fo (z) =
0,3679z + 0,2642 . (z − 0,3679)(z − 1)
Weil die Übertragungsfunktion des geschlossenen Regelkreises von der Form Fw (z) =
Fo (z) Y (z) = W (z) 1 + Fo (z)
ist, wird die charakteristische Gleichung 1 + Fo (z) = 0 zu (z − 0,3679)(z − 1) + 0,3679z + 0,2642 = 0. Durch entsprechende Zusammenfassungen wird diese Gleichung zu
276
11 Übertragungsverhalten diskreter Systeme
z2 − z + 0,6321 = 0. Daraus ergeben sich wiederum die Wurzeln der charakteristischen Gleichung zu z1 = 0,5 + j0,6181
und z2 = 0,5 − j0,6181.
Wegen |z1 | = |z2 | < 1 ist der geschlossene Regelkreis stabil. Abschließend soll deutlich darauf verwiesen werden, dass im Gegensatz zum analogen Regelkreis ein diskretes System vom Grad 2 bez. des Laplace-Operators s auf Grund der Abtastung bei entsprechend großen Verstärkungen sehr wohl instabil werden kann. Im Fall des gegebenen Beispiels wird der Regelkreis für Verstärkungen K > 2,3925 instabil. 11.2.3 Numerische Methoden zur Bestimmung der Stabilität In vielen praktischen Fällen interessiert weniger die Lage der Pole des geschlossenen Regelkreises als vielmehr eine bloße Ja/Nein-Aussage bezüglich der Stabilität des zu untersuchenden Systems. Für Untersuchungen dieser Art wurden diverse Stabilitätskriterien entwickelt, von denen im Folgenden die bekanntesten davon aufgezeigt werden sollen. Das Stabilitätskriterium von Jury (1961) Bei der Anwendung des Stabilitätstests nach Jury auf eine bekannte charakteristische Gleichung P (z) = 0 wird zunächst eine Tabelle erstellt, deren Elemente aus den Koeffizienten des charakteristischen Polynoms Tabelle 11.1: Jury-Tabelle Zeile
z0
z1
z2
z3
...
1
an
an−1
an−2
an−3
...
a2
a1
a0
2
a0
a1
a2
a3
...
an−2
an−1
an
3
bn−1
bn−2
bn−3
bn−4
...
b1
b0
4
b0
b1
b2
b3
...
bn−2
bn−1
5
cn−2
cn−3
cn−4
cn−5
...
c0
6 .. .
c0 .. .
c1
c2
c3
...
cn−2
2n − 5
p3
p2
p1
p0
2n − 4
p0
p1
p2
p3
2n − 3
q2
q1
q0
zn−2
zn−1
zn
11.2 Idealer Abtaster
277
P (z) = a0 zn + a1 zn−1 + . . . + an−1 z + an
(11.21)
mit a0 > 0 entwickelt werden. Die Jury-Tabelle bekommt dann die Form nach Tabelle 11.1. Die Elemente der ersten Zeile sind die bekannten Koeffizienten a0 bis an des charakteristischen Polynoms P (z), angeordnet von links nach rechts in Richtung steigender Potenzen in z. Die Elemente der zweiten Zeile entsprechen denen der ersten Zeile, allerdings von rechts nach links aufgereiht. Die Elemente der Zeile 3 bis zur Zeile 2n − 3 werden durch die im Folgenden aufgezeigten Determinanten berechnet: an bk = a0
an−1−k ak+1
mit
k = 0, 1, 2, . . . , n − 1;
bn−1 bn−2−k mit k = 0, 1, 2, . . . , n − 2; ck = b0 bk+1 . . . p3 p2−k qk = mit k = 0, 1, 2. p0 pk+1 Das Ende der Jury-Tabelle ist durch die letzte Zeile mit genau drei Elementen gekennzeichnet. (Für Systeme zweiter Ordnung, also 2n−1 = 1, besteht die Jury-Tabelle aus nur einer Zeile mit drei Elementen und einer zweiten Zeile in umgekehrter Reihenfolge.) Das Stabilitätskriterium von Jury lässt sich nun folgendermaßen formulieren: Ein System mit der charakteristischen Gleichung P (z) = 0 ist stabil, wenn sämtliche folgende Bedingungen erfüllt sind: 1. |an | < a0 , 2. P (z)|z=1 > 0,
>0 3. P (z)|z=−1 <0
für n gerade , für n ungerade
4. |bn−1 | > |b0 | , |cn−2 | > |c0 | , . . . |q2 | > |q0 | . Die Handhabung des Jury-Kriteriums soll nun anhand einiger Beispiele aufgezeigt werden.
278
11 Übertragungsverhalten diskreter Systeme
Beispiel 11.4: Die Stabilität eines Systems mit der charakteristischen Gleichung P (s) = z4 − 1,2z3 + 0,07z2 + 0,3z − 0,08 = 0 soll mit Hilfe des Jury-Kriteriums beurteilt werden. Mit a0 = 1,
a1 = −1,2,
a2 = 0,07,
a3 = 0,3
und
a4 = −0,08
ist natürlich die Bedingung |a4 | < a0 erfüllt. Die zweite Bedingung P (1) = 1 − 1,2 + 0,07 + 0,3 − 0,08 = 0,09 > 0 ist ebenso erfüllt. Die dritte Bedingung wird mit n = 4, also gerade, zu P (−1) = 1 + 1,2 + 0,07 − 0,3 − 0,08 = 1,89 > 0. Wie man sieht, ist auch diese Bedingung erfüllt. Berechnet man schließlich die dem gegebenen Beispiel entsprechenden Elemente b3 , b2 , b1 und b0 sowie c2 und c0 der Jury-Tabelle, so erhalten wir daraus die Bedingungen |b3 | = 0,994 > 0,204 = |b0 | und |c2 | = 0,946 > 0,315 = |c0 | . Nachdem auch die vierte Bedingung des Jury-Kriteriums erfüllt ist, liegen sämtliche Wurzeln der charakteristischen Gleichung innerhalb des Einheitskreises der z-Ebene. Dies impliziert natürlich, dass es sich im vorliegenden Beispiel um ein stabiles System handelt. Beispiel 11.5: In diesem Beispiel ist die Übertragungsfunktion eines offenen Regelkreises gegeben zu Fo (z) =
K(0,3679z + 0,2642) ; (z − 0,3679)(z − 1)
T = 1 sec .
Es ist der Bereich des Parameters K für stabiles Regelverhalten mit Hilfe des Jury-Kriteriums zu bestimmen. Die Übertragungsfunktion des geschlossenen Kreises wird unter der Annahme der direkten Rückführung zu
11.2 Idealer Abtaster
Fw (z) =
279
Fo (z) . 1 + Fo (z)
Damit bekommt die charakteristische Gleichung P (z) = 1 + Fo (z) = 0 die Form P (z) = z2 + (0,3679K − 1,3679)z + 0,3679 + 0,2642K = 0. Nachdem es sich im gegebenen Fall um ein System zweiter Ordnung handelt, werden die Jury-Bedingungen zu 1. |a2 | < a0 , 2. P (1) > 0 und 3. P (−1) > 0;
n = 2 gerade.
Mit a2 = 0,3679 + 0,2642K
und
a0 = 1
wird die erste Bedingung zu |0,3679 + 0,2642K| < 1
oder
2,3925 > K > −5,1775.
Mit P (1) = 1 + (0,3679K − 1,3679) + 0,3679 + 0,2642K = 0,6321K > 0 erhält man die Bedingung K > 0, die im Vergleich zur ersten Bedingung als Verschärfung betrachtet werden kann. Mit P (−1) = 1 − (0,3679K − 1,3679) + 0,3679 + 0,2642K = 2,7358 − 0,1037K > 0 wird die dritte Bedingung zu 26,382 > K. Fasst man die drei Bedingungen zusammen, so erhält man den endgültigen Bereich für stabiles Regelverhalten zu
280
11 Übertragungsverhalten diskreter Systeme
0 < K < 2,3925. Der Fall K = 2,3925 entspricht natürlich erwartungsgemäß dem Stabilitätsgrenzfall. Berechnet man die Lage der charakteristischen Pole für den Fall K = 2,3925 aus der Gleichung z2 − 0,4877z + 1 = 0, so erhält man diese zu z1/ 2 = 0,2439 ± j0,9698. Unter Berücksichtigung der Abtastperiode von T = 1 sec und der Beziehung ϕ(z) = arg(z) = 2π
ωd ωs
wird die Frequenz dieser Dauerschwingung zu
ωs 0,9698 · arg(z) = arctan = 1,3244 rad/sec . ωd = 2π 0,2439
Stabilitätsanalyse mit Hilfe der bilinearen Transformation Eine alternative Methode zur Beurteilung diskreter Regelkreise besteht in der Verwendung der bilinearen Transformation in Verbindung mit dem bereits in Abschnitt 4.2 behandelten Stabilitätskriterium von Hurwitz für kontinuierliche Regelkreise. Bei dieser Methode wird durch die Transformation w=
z+1 z−1
(11.22)
die z-Ebene in eine andere komplexe Ebene, nämlich in die so genannte w-Ebene abgebildet, wobei das Innere des Einheitskreises der z-Ebene in die linke w-Ebene abgebildet wird und der Einheitskreis der z-Ebene auf der imaginären Achse der w-Ebene zu liegen kommt. Nachweis: Gehen wir aus von der Definition w = α + jβ, dann wird das Innere des Einheitskreises der z-Ebene durch die Bedingung w + 1 α + jβ + 1 <1 |z| = = w − 1 α + jβ − 1 ausgedrückt. Führt man die hier angedeutete Betragsbildung durch, so erhält man
11.2 Idealer Abtaster
281
(α + 1)2 + β 2 <1 (α − 1)2 + β 2 und erhält daraus (α + 1)2 + β 2 < (α − 1)2 + β 2 . Diese Bedingung ist nur für α < 0 erfüllt, womit bereits der Beweis geliefert ist, dass das Innere des Einheitskreises (|z| < 1) mit der linken w-Halbebene korrespondiert. Bei der Betrachtung von Stabilitätsproblemen kann nun in gewohnter Weise das Stabilitätskriterium von Hurwitz angewandt werden, weil bei diesem Kriterium, soweit es erfüllt ist, sämtliche Pole des geschlossenen Regelkreises in der linken s-Ebene liegen. Bei entsprechenden Aufgabenstellungen ist zunächst im charakteristischen Polynom P (z) = 1 + Fo (z) = a0 zn + a1 zn−1 + . . . + an−1 z + an = 0 der Operator z gemäß Gl. (11.22) zu ersetzen. Damit wird die charakteristische Gleichung zu
a0
w+1 w−1
n + a1
w+1 w−1
n−1 + . . . + an−1
w+1 w−1
+ an = 0.
Erweitert man nun diese letzte Gleichung mit (w − 1)n , so wird das charakteristische Polynom für die w-Ebene zu Q(w) = b0 w n + b1 w n−1 + . . . + bn−1 w + bn = 0. Auf dieses Polynom, Q(w) = 0, kann nun in gewohnter Weise das Hurwitz-Kriterium kontinuierlicher Regelkreise angewandt werden. Beispiel 11.6: Die charakteristische Gleichung eines Regelkreises sei gegeben zu P (z) = z3 − 1,3z2 − 0,08z + 0,24 = 0. Es ist die Stabilität unter Verwendung der bilinearen Transformation zu beurteilen. Mit z=
w+1 w−1
wird die charakteristische Gleichung zu
w+1 w−1
3 − 1,3 ·
w+1 w−1
2 − 0,08
w+1 + 0,24 = 0. w−1
282
11 Übertragungsverhalten diskreter Systeme
Erweitert man die einzelnen Terme dieser Gleichung mit (w − 1)3 , so erhält man das charakteristische Polynom, jetzt in der w-Ebene, zu w3 − 7,57w 2 − 36,4w − 14,14 = 0. Aus diesem Polynom könnte man nun die entsprechende Hurwitz-Determinante berechnen, um die Stabilität beurteilen zu können. Nachdem aber die Voraussetzung, dass sämtliche Koeffizienten des charakteristischen Polynoms positiv sein müssen, nicht erfüllt ist, steht bereits fest, dass der Fall der Instabilität vorliegt. Die Berechnung der Hurwitz-Determinante erübrigt sich also für das gegebene Beispiel.
11.3 Übertragungsfunktion zusammengesetzter Systeme Zur Analyse von digitalen Regelkreisen müssen wir im Stande sein, die z-transformierte Übertragungsfunktion in Abhängigkeit der Lage des Abtasters zu bestimmen. Wie sich zeigen wird, besteht die dabei zu befolgende Technik lediglich in einer einfachen Erweiterung der bereits bekannten Algebra der Blockschaltbilder kontinuierlicher Systeme. 11.3.1 Kontinuierliche Systeme mit und ohne Abtaster In diesem Abschnitt soll eine allgemein gültige Vorschrift zur Bestimmung der z-transformierten Ausgangsgröße kontinuierlicher Systeme hergeleitet werden, wenn an deren Eingang ein Impuls-Abtaster platziert ist, wie dies im folgenden Bild gezeigt wird.
Bild 11.3: Kontinuierliches System mit Impuls-Abtaster am Eingang
Mit der bekannten Eingangs/Ausgangsrelation Y (s) = U ∗ (s)F (s) und U (z) = U ∗ (s)z=esT wird die z-transformierte Ausgangsgröße zu Y (z) = U (z)Z {F (s)} = U (z) · F (z).
(11.23)
Für Beispiele der Art von Bild 11.3, d.h. wenn sich vor einem kontinuierlichen System ein Abtaster befindet, entsteht die z-transformierte Ausgangsgröße als Produkt der z-transformierten Eingangsgröße und des kontinuierlichen Übertragungsgliedes.
11.3 Übertragungsfunktion zusammengesetzter Systeme
283
Nun wird der Fall untersucht, dass das kontinuierliche Übertragungsglied und das kontinuierliche Eingangssignal entsprechend Bild 11.4 nicht durch einen Abtaster getrennt sind. Mit Y (s) = U (s)F (s) wird jetzt, im Gegensatz zum ersten Fall, die z-transformierte Ausgangsgröße zu Y (z) = Z [Y (s)] = Z {U (s)F (s)} = Z {U · F (s)} = U (z) · F (z).
(11.24)
Bild 11.4: Kontinuierliches System ohne Impuls-Abtaster am Eingang
Vergleicht man die Ergebnisse der beiden Betrachtungen anhand der Gleichungen (11.23) und (11.24) so folgt daraus ganz eindeutig, dass, entsprechend Gl. (11.23), die z-transformierte Ausgangsgröße aus dem Produkt der z-transformierten Eingangsgröße und der z-transformierten Übertragungsfunktion des kontinuierlichen Systems zu bilden ist. Im zweiten Fall, entsprechend Gl. (11.24), ist zunächst das Produkt der Laplace-transformierten aus Eingang und Übertragungsfunktion zu bilden und dieses Ergebnis dann in den z-Bereich zu transformieren. Diese Aussage soll anhand des folgenden Beispiels überprüft werden. Beispiel 11.7: Für die beiden Fälle der folgenden Bilder ist jeweils die z-transformierte Ausgangsgröße zu berechnen.
Bild 11.5: a) Zwei kontinuierliche Systeme durch δ-Abtaster getrennt; b) Zwei direkt verbundene kontinuierliche Systeme
284
11 Übertragungsverhalten diskreter Systeme
Für das System im Bild 11.5, a) sind die beiden kontinuierlichen Übertragungsglieder mit den Übertragungsfunktionen F1 (s) und F2 (s) durch Abtaster getrennt. Unter der Voraussetzung gleicher und synchroner Abtastung wird die diskrete Übertragungsfunktion für diesen Fall zu Y (z) 1 Y (z) U (z) 1 = · = F1 (z) · F2 (z) = Z ·Z . X(z) U (z) X(z) s+a s+b Unter Verwendung einer Korrespondenztabelle erhalten wir daraus Y (z) 1 1 . = X(z) 1 − e−aT z−1 1 − e−bT z−1 Für das System im Bild 11.5 b) müssen auf Grund des nicht vorhandenen Abtasters die beiden kontinuierlichen Systeme in einem Stück in den z-Bereich transformiert werden:
Y (z) 1 1 1 1 1 =Z · − , = Z [F1 (s) · F2 (s)] = Z s+as+b b−a s+a s+b X(z)
Y (z) 1 1 1 . = − · X(z) b−a 1 − e−aT z−1 1 − e−bT z−1 Durch die Schaffung eines gemeinsamen Nenners wird das endgültige Ergebnis für den Fall b) zu # " −aT − e−bT z−1 e Y (z) 1 #" # . = · " X(z) b−a 1 − e−aT z−1 1 − e−bT z−1 Es bedarf natürlich keiner Diskussion um festzustellen, dass sich beide Ergebnisse voneinander unterscheiden. Es gilt also F1 (z) · F2 (z) = F1 F2 (z). Im Hinblick auf das folgende Kapitel sei der Deutlichkeit wegen angemerkt, dass folgende Vereinbarungen gelten sollen: F1 F2 (z) = Z [F1 (s)F2 (s)] ; analog dazu soll die Vereinbarung U (s)F (s) = [U F (s)] gelten.
11.3 Übertragungsfunktion zusammengesetzter Systeme
285
11.3.2 Übertragungsfunktion rückgekoppelter Systeme Wie wir im vorangegangenen Abschnitt gesehen haben, führt die Anwesenheit oder die Abwesenheit eines Abtasters jeweils zu einem anderen Übertragungsverhalten im z-Bereich. In diesem Abschnitt besteht nun die Absicht, solche Fälle einer systematischen Untersuchung zu unterziehen. Betrachten wir einleitend den einfachst denkbaren Regelkreis des folgenden Bildes:
Bild 11.6: Einfacher Regelkreis
In diesem Beispiel befindet sich der Abtaster hinter der Vergleichsstelle. Entsprechend muss gelten E(s) = W (s) − F2 (s)Y (s) und Y (s) = F1 (s)E ∗ (s).
(11.25)
Damit wird die Laplace-transformierte Regelabweichung zu E(s) = W (s) − F2 (s)F1 (s)E ∗ (s). Transformiert man die letzte Gleichung in den z-Bereich und beachtet die Beziehung E(z) = E ∗ (s)z=esT , so ergibt sich die Beziehung E(z) = W (z) − Z {F1 F2 (s)} E(z). Separiert man die z-transformierte Regelabweichung entsprechend E(z) =
W (z) , 1 + F1 F (z)
dann erhalten wir die z-transformierte Ausgangsgröße Y (z) entsprechend Gl. (11.25) zu
286
11 Übertragungsverhalten diskreter Systeme
Y (z) = F1 (z) · E(z) = F1 (z) ·
W (z) . 1 + F1 F2 (z)
Die inverse z-transformierte der letzten Gleichung liefert die diskreten Werte der Ausgangsgröße zu den äquidistanten Abtastzeitpunkten. Das tatsächliche Ausgangssignal ist natürlich kontinuierlich! Die Übertragungsfunktion des geschlossenen Regelkreises erhält man für dieses Beispiel zu FW (z) =
Y (z) F1 (z) = . W (z) 1 + F1 F2 (z)
(11.26)
Die Tabelle 11.1 zeigt eine Zusammenstellung typischer diskreter Regelkreise. Bei allen Bildern wird eine gleiche und synchrone Abtastperiode vorausgesetzt. Eine wesentliche Besonderheit besteht im Gegensatz zu analogen Regelkreisen darin, dass bei einigen rückgekoppelten Systemen keine Übertragungsfunktion zwischen Ein- und Ausgangsgröße aufgestellt werden kann, wenn die Eingangsgröße vom nachgeschalteten kontinuierlichen Übertragungsglied nicht durch einen Abtaster getrennt ist. In der Tabelle 11.2 gilt dies für die Konfigurationen der dritten und vierten Zeile. 11.3.3 Übertragungsfunktion des Standard-Regelkreises Mit Hilfe der Erkenntnisse des vorangegangenen Kapitels soll nun die Übertragungsfunktion eines digitalen Regelkreises aufgestellt werden. Bild 11.7 zeigt das Blockschaltbild des Standard-Regelkreises, wie er in den meisten praktischen Fällen in Erscheinung tritt.
Bild 11.7: Blockschaltbild des digitalen Regelkreises
In diesem System ist die Differenzengleichung des zu realisierenden Reglers als Regelalgorithmus abgelegt; dessen z-Transformierte sei mit FR (z) bezeichnet. Außerdem soll die Übertragungsfunktion F (s) der zu regelnden Strecke einschließlich dem vorgeschalteten Halteglied mit G(z) bezeichnet werden. Schließlich sei noch angemerkt, dass durch die synchrone Ausgabe der Stellgröße m(kT ) mit dem Einlesen der Regeldifferenz e(kT ) der digitale Regler von dem kontinuierlichen Halteglied scheinbar durch einen Abtaster getrennt ist. Mit der bereits bekannten Beziehung
G(z) = 1 − z
−1
F (s) ·Z s
11.3 Übertragungsfunktion zusammengesetzter Systeme
287
Tabelle 11.2: Typische Konfigurationen rückgekoppelter diskreter Systeme
Y (z) =
F1 (z)W (z) 1 + F1 (z)F2 (z)
Y (z) =
F1 (z)W (z) 1 + F1 F2 (z)
Y (z) =
F1 W (z) 1 + F1 F2 (z)
Y (z) =
F2 (z)F1 W (z) 1 + F1 F2 F3 (z)
Y (z) =
F2 (z)F1 W (z) 1 + F1 F2 F3 (z)
288
11 Übertragungsverhalten diskreter Systeme
wird deshalb die z-transformierte Regelgröße Y (z) zu Y (z) = FR (z)G(z)E(z),
(11.27)
wobei die z-transformierte Regelabweichung natürlich die Differenz zwischen Sollwert und Regelgröße ist, also E(z) = W (z) − Y (z). Ersetzt man in der Gl. (11.27) die Regelabweichung E(z) mit obiger Gleichung, so erhält man die gesuchte Übertragungsfunktion des geschlossenen Regelkreises zu Fw (z) =
Y (z) FR (z)G(z) = . W (z) 1 + FR (z)G(z)
(11.28)
Definiert man schließlich noch, in Analogie zum kontinuierlichen Regelkreis, die Übertragungsfunktion des offenen Regelkreises zu Fo (z) = FR (z)G(z), so erhält man die bereits bekannte Übertragungsfunktion des geschlossenen, diskreten Regelkreises zu Fw (z) =
Y (z) Fo (z) = . W (z) 1 + Fo (z)
(11.29)
Analog zur Übertragungsfunktion kontinuierlicher Systeme wird die charakteristische Gleichung des geschlossenen Regelkreises zu 1 + Fo (z) = 0.
(11.30)
Die Qualität des Regelverhaltens hängt natürlich in hohem Maße von der Wahl und der nach Möglichkeit optimalen Dimensionierung des diskreten Reglers ab. Im folgenden Abschnitt sollen deshalb die bereits aus der analogen Regelungstechnik bekannten Reglertypen sowie einige weitere Algorithmen vorgestellt werden. 11.3.4 Übertragungsfunktion des diskretisierten PID-Reglers Das Prinzip des analogen PID-Reglers hat sich seit mehr als fünfzig Jahren in der industriellen Regelungstechnik bestens bewährt. Insofern ist es nahe liegend, diesen Reglertyp auch für diskrete Regelkreise einzusetzen. Unter Verwendung der Symbole im Bild 11.13 wird die Gleichung des PID-Reglers im Zeitbereich zu 1 m(t) = KR e(t) + Tn
t 0
de(t) e(τ )dτ + Tv dt
(11.31)
11.3 Übertragungsfunktion zusammengesetzter Systeme
289
wobei die entsprechenden Koeffizienten folgende Bedeutung haben sollen: KR Tn
Proportionalverstärkung
Tv
Vorhaltzeit (oder auch Differenzierzeit)
Nachstellzeit (oder auch Integrierzeit)
Um die diskrete Übertragungsfunktion des PID-Reglers aufstellen zu können wird Gl. (11.31) mit t = kT diskretisiert. Außerdem wird in der folgenden Herleitung die Integration durch die Trapezregel approximiert und die Differenziation durch den Differenzenquotienten ersetzt. Damit wird die Gl. (11.31) zu m(kT ) = T e(0) + e(T ) e(T ) + e(2T ) e((k − 1)T ) + e(kT ) e(kT ) + + + . . . + Tn 2 2 2 KR Tv + [e(kT ) − e((k − 1)T )] T (11.32) Wenn wir in einem ersten Zwischenschritt die Integration mit dem Trapezintegrator approximieren, so bekommt dieser die Form mI (kT ) = mI ((k − 1)T ) +
T [e(kT ) + e((k − 1)T )] . 2
(11.33)
In dieser Gleichung ist unter mI ((k − 1)T ) = mI,k−1 das Ergebnis der angenäherten Integration bis zum Zeitpunkt (k − 1)T und unter T T ek + ek−1 [e(kT ) + e((k − 1)T )] = 2 2 die Trapezfläche innerhalb eines Abtastschrittes zu verstehen. Summiert man die Gl. (11.33) über k und multipliziert jeden Term mit z−k , so erhalten wir ∞
mI,k z
−k
=
k=0
∞
mI,k−1 z
k=0
−k
T + 2
∞ k=0
ek z
−k
+
∞
ek−1 z
−k
.
k=0
Die linke Seite dieser Gleichung ist definitionsgemäß MI (z); entsprechend wird der erste Term der eckigen Klammer zu E(z). Führt man im zweiten Term der eckigen Klammer die Substitution l = k − 1 ein, so erhalten wir zunächst die Beziehung ∞ k=0
ek−1 z
−k
=
∞ l=−1
el z−(l+1) .
290
11 Übertragungsverhalten diskreter Systeme
Berücksichtigt man noch die generelle Vereinbarung e(kT ) = 0 für k < 0, so wird diese Summe zu z−1
∞
el z−l = z−1 E(z).
l=0
Die analoge Vorgehensweise führt beim ersten Term der rechten Seite zu Z
∞
mI,k−1 z
−k
= z−1 MI (z).
k=0
Fassen wir diese Ergebnisse zusammen, dann wird die z-Transformierte des Trapezintegrators zu MI (z) =
T 1 + z−1 E(z). 2 1 − z−1
(11.34)
Bezugnehmend auf Gl. (11.32) wird jetzt die z-transformierte Ausgangsgröße des PIDReglers zu
T 1 + z−1 Tv −1 E(z) + E(z) . 1−z E(z) + 2Tn 1 − z−1 T
M(z) = KR
Die z-transformierte Übertragungsfunktion des PID-Reglers wird damit zu
T 1 + z−1 M(z) Tv −1 FR (z) = + . = KR 1 + 1−z E(z) 2Tn 1 − z−1 T
(11.35)
Wollte man nun im gegebenen Fall den PID-Regler zu einem PD-Regler abändern, so müsste analog zum kontinuierlichen Regler die Nachstellzeit auf unendlich eingestellt werden. Nachdem es jedoch bei einem diskreten Regler, sei es ein Mikrocomputer oder ein Prozessrechner, nicht möglich ist, den Wert unendlich einzustellen, muss obige Gleichung dahin gehend modifiziert werden, dass man bei der Elimination des Integrators einen entsprechenden Faktor zu null zu setzen hat. Mit den Definitionen KR T v T KR T KI = Tn KD =
KP = KR −
differenzieller Übertragungsbeiwert, integraler Übertragungsbeiwert und KI 2
Proportionalverstärkung
11.3 Übertragungsfunktion zusammengesetzter Systeme
291
wird die endgültige Übertragungsfunktion des diskreten PID-Reglers zu FR (z) =
M(z) KI −1 1 − z , + K = KP + D E(z) 1 − z−1
(11.36)
bzw. in der etwas kompakteren Form zu FR (z) =
(KP + KI + KD ) − (KP + 2KD )z−1 + KD z−2 . 1 − z−1
(11.37)
Der in der Praxis zu realisierende Regelalgorithmus besteht schließlich in der Implementierung der zur obigen Übertragungsfunktion gehörenden Differenzengleichung. Anhand des folgenden Beispiels soll das Zeitverhalten eines Servosystems in Verbindung mit einem PID-Regler untersucht werden. Beispiel 11.8: Im Bild 11.8 ist das Blockschaltbild einer integrierenden Strecke mit Verzögerung, dem (zwangsläufig) vorgeschalteten Halteglied und einem diskreten PID-Regler wiedergegeben. Die Übertragungsfunktion der Regelstrecke sei gegeben zu Fs (s) =
1 ; s(s + 1)
die Übertragungsfunktion des Haltegliedes lautet bekanntlich Fh (s) =
1 − e−sT , s
die Abtastperiode T sei zu einer Sekunde angenommen.
Bild 11.8: Blockschaltbild eines Servoregelkreises
Mit diesen Übertragungsfunktionen wird die z-transformierte Übertragungsfunktion aus der Kombination des Haltegliedes einschließlich der kontinuierlichen Strecke zu Fs (s) 0,3679z−1 + 0,2642z−2 #" #; G(z) = 1 − z−1 · Z =" s 1 − 0,3679z−1 1 − z−1
292
11 Übertragungsverhalten diskreter Systeme
es sei kurz angemerkt, dass die z-Transformierte der obigen Gleichung ohne Mühe mit Hilfe einer Korrespondenz-Tabelle zwischen s- und z-Bereich erstellt werden kann. Auf Grund einer entsprechenden Voruntersuchung mögen sich die optimalen Reglerparameter zu KP = 1, KI = 0,2 und KD = 0,2 ergeben haben. Damit wird die diskrete Übertragungsfunktion des PID-Reglers zu FR (z) =
1,4 − 1,4z−1 + 0,2z−2 . 1 − z−1
Die Übertragungsfunktion des geschlossenen Regelkreises Fw (z) =
Y (z) FR (z)G(z) = W (z) 1 + FR (z)G(z)
wird mit den bereits bekannten Übertragungsfunktionen FR (z) und G(z) zu Fw (z) =
0,515z−1 − 0,145z−2 − 0,296z−3 + 0,052z−4 . 1 − 1,852z−1 + 1,590z−2 − 0,664z−3 + 0,052z−4
Geht man schließlich von einer sprungförmigen Sollwertänderung w(t) = ε(t) bzw. W (z) = 1 aus, so ergibt sich die gesuchte Ausgangsgröße y(kT ) aus der Rücktransformation der 1−z−1 z-transformierten Regelgröße Y (z) = W (z)Fw (z) . Im Zuge der Rücktransformation empfiehlt sich neben der Polynomdivision oder der Partialbruchzerlegung vor allem eine entsprechende, auf regelungstechnische Belange zugeschnittene Simulationssoftware. Das folgende Bild zeigt die Sprungantwort des untersuchten Regelkreises. Die Funktionswerte zu den diskreten Zeitpunkten t = kT wurden am Rechner per Simulation ermittelt; zwischen den Abtastzeitpunkten wurde eine lineare Approximation vorgenommen. 11.3.5 Realisierung digitaler Regler und digitaler Filter In diesem Abschnitt wird die Realisierung digitaler Regler und digitaler Filter mit einer vorgegebenen Übertragungsfunktion aufgezeigt. Die Realisierung einer bestimmten Übertragungsfunktion mit entsprechender Software bedeutet die Erstellung eines geeigneten Algorithmus auf der Basis der Differenzengleichung. Bei einer Hardware-Realisierung wird in der Regel ein Mikrocomputer mit entsprechender Möglichkeit zur Addition, Multiplikation und Verzögerungselementen verwendet. Im Rahmen dieser Einführung der digitalen Signalverarbeitung auf dem Gebiet der Regelungstechnik wird die Realisierung diskreter Regler auf der Basis des Blockschaltbildes der zu Grunde liegenden Übertragungsfunktion aufgezeigt. Wenn die Eingangsgröße des digitalen Reglers oder Filters zu den diskreten Zeitpunkten mit x(k) bezeichnet wird, dann kann die Ausgangsgröße y(k) entsprechend der folgenden allgemeinen Differenzengleichung formuliert werden:
11.3 Übertragungsfunktion zusammengesetzter Systeme
293
Bild 11.9: Diskrete Sprungantwort eines Servosystems
y(k) + a1 y(k − 1) + a2 y(k − 2) + . . . + an y(k − n) = b0 x(k) + b1 x(k − 1) + b2 x(k − 2) + . . . + bm x(k − m)
.
(11.38)
Die z-Transformierte dieser Differenzengleichung wird zu Y (z) + a1 z−1 Y (z) + a2 z−2 Y (z) + . . . + an z−n Y (z) = b0 X(z) + b1 z−1 X(z) + b2 z−2 X(z) + . . . + bm z−m X(z)
.
Die allgemeine Übertragungsfunktion FR (z) des diskreten Reglers oder Filters ist damit gegeben zu F (z) =
b0 + b1 z−1 + b2 z−2 + . . . + bm z−m Y (z) ; = X(z) 1 + a1 z−1 + a2 z−2 + . . . + an z−n
n ≥ m,
(11.39)
wobei die Koeffizienten ai und bj reell sind. Bezugnehmend auf Gl. (11.37) wird beispielsweise die Gleichung des PID-Reglers zu F (z) =
b0 + b1 z−1 + b2 z−2 1 + a1 z−1 + a2 z−2
294
11 Übertragungsverhalten diskreter Systeme
mit a1 = −1;
a2 = 0;
b0 = KP + KI + KD ;
b1 = −(KP + 2KD );
b2 = KD .
Bei den im Folgenden vorzustellenden Methoden der Realisierung diskreter Filter und Regler erscheinen die realen Koeffizienten ai und bj als Multiplikatoren im jeweiligen Blockschaltbild. Direkte Programmierung Das Bild 11.10 zeigt das grundsätzliche Blockdiagramm des digitalen Filters mit n Polstellen und m Nullstellen. Bringt man die Gl. (11.39) auf die Form Y (z) = −a1 z−1 Y (z) − a2 z−2 Y (z) − . . . − an z−n Y (z) + b0 X(z) + b1 z−1 X(z) b2 z−2 X(z) + . . . + bm z−m X(z), so kann man unschwer erkennen, dass diese Gleichung gerade mit diesem Blockschaltbild korrespondiert. Die im Bild 11.10 realisierte Form der allgemeinen Übertragungsfunktion entsprechend Gl. (11.39) wird als direkte Programmierung bezeichnet. Diese Bezeichnung ist damit begründet, dass für das Zähler- und Nennerpolynom der umzusetzenden Übertragungsfunktion jeweils ein separater Satz von Verzögerungselementen verwendet wird. Die Gesamtzahl der benötigten Verzögerungselemente ist somit n + m.
Bild 11.10: Blockschaltbild mit direkter Programmierung
Im Interesse der Verminderung der notwendigen Speicherelemente wurde eine alternative Realisierung der gegebenen Übertragungsfunktion entwickelt, die im nächsten Abschnitt vorgestellt wird.
11.3 Übertragungsfunktion zusammengesetzter Systeme
295
Standard-Programmierung Diese Form der Umsetzung der jeweiligen Übertragungsfunktion in ein Blockschaltbild beruht letztlich darauf, dass die jeweiligen Verzögerungselemente für das Zähler- und für das Nennerpolynom gleichzeitig verwendet werden. Damit reduziert sich, wie sich zeigen wird, die Gesamtzahl der notwendigen Speicherelemente von n + m auf n, wobei n ≥ m ist. Bringen wir hierzu die allgemeine Übertragungsfunktion der Gl. (11.39) auf die Form Y (z) Y (z) H (z) = X(z) H (z) X(z) " # = b0 + b1 z−1 + b2 z−2 + . . . + bm z−m ·
F (z) =
1 + a1
z−1
1 + a2 z−2 + . . . + an z−n
mit Y (z) = b0 + b1 z−1 + b2 z−2 + . . . + bm z−m H (z)
(11.40)
H (z) 1 = . −1 X(z) 1 + a1 z + a2 z−2 + . . . + an z−n
(11.41)
und
Um die Blockschaltbilder entsprechend den Gleichungen (11.40) und (11.41) zeichnen zu können, wird die Gl. (11.40) umgeformt auf Y (z) = b0 H (z) + b1 z−1 H (z) + b2 z−2 H (z) + . . . + bm z−m H (z)
(11.42)
und die Gl. (11.41) auf die entsprechende Form H (z) = X(z) − a1 z−1 H (z) − a2 z−2 H (z) − . . . − an z−n H (z)
(11.43)
gebracht. Aus Gl. (11.42) erhält man jetzt Bild a) und aus Gl. (11.43) Bild b) der Blockschaltbilder im Bild 11.11. Schließlich resultiert aus der Kombination der beiden Bilder das gesuchte Blockschaltbild der ursprünglichen Übertragungsfunktion entsprechend Gl. (11.39). Der wesentliche Vorteil dieser Umsetzung der allgemeinen Übertragungsfunktion besteht darin, dass jetzt im Gegensatz zur direkten Programmierung nur noch n Speicherelemente benötigt werden. Die Koeffizienten b0 , b1 , . . . , bm treten als Vorwärtsverstärkungen und die Elemente a1 , a2 , . . . , an als Gegenkopplungen in Erscheinung. Beispiel 11.9: Für das diskrete Filter mit der Übertragungsfunktion F (z) =
Y (z) 2 − 0,6z−1 = 1 + 0,5z1 X(z)
ist das Blockschaltbild 1. entsprechend der direkten Programmierung und 2. auf der Basis der Standard-Programmierung zu entwerfen.
296
11 Übertragungsverhalten diskreter Systeme
Bild 11.11: Realisierung des Blockschaltbildes a) gemäß Gl. (11.42); b) gemäß Gl. (11.43)
Bild 11.12: Blockschaltbild auf der Basis der Standard-Programmierung
11.3 Übertragungsfunktion zusammengesetzter Systeme
297
1. Direkte Programmierung: Bringt man die gegebene Übertragungsfunktion auf die Form Y (z) = −0,5z−1 Y (z) + 2X(z) − 0,6z−1 X(z), so resultiert daraus bereits das Blockdiagramm, wie es im Bild 11.13 wiedergegeben ist. Der Deutlichkeit wegen sei darauf hingewiesen, dass bei dieser Realisierungsmethode n + m = 2 Verzögerungselemente benötigt werden.
Bild 11.13: Blockschaltbild entsprechend der direkten Programmierung
2. Standard-Programmierung: Bei dieser Methode bringen wir die ursprüngliche Übertragungsfunktion auf die Form F (z) =
Y (z) 2 Y (z) H (z) = = 1 − 0,3z−1 X(z) H (z) X(z) 1 + 0,5z−1
mit Y (z) = 1 − 0,3z−1 H (z) und H (z) 2 . = X(z) 1 + 0,5z−1 Y (z) Entsprechend Bild 11.14 wird nun zunächst die Übertragungsfunktion H (z) als Blockschaltbild realisiert; siehe hierzu Bild 11.14a). Analog dazu wird in einem zweiten Blockschaltbild – (z) Bild 11.14b) – die Übertragungsfunktion H X(z) mit einem Verzögerungsglied und entsprechenden Verstärkungsgliedern erstellt. Die Kombination dieser beiden Bilder ergibt schließlich das gesamte Blockschaltbild entsprechend Bild 11.14c). Erwartungsgemäß bedarf es zur Realisierung des Blockschaltbildes der vorgegebenen Übertragungsfunktion nur eines Verzögerungsgliedes, während bei der direkten Programmierung zwei Speicherelemente notwendig sind.
298
11 Übertragungsverhalten diskreter Systeme
Bild 11.14: Blockschaltbild der Standard-Programmierung
12
Synthese diskreter Regelsysteme
Im Rahmen der bisherigen Kapitel wurden diverse Methoden zur Analyse diskreter Systeme aufgezeigt. Hierzu zählen insbesondere die Bestimmung der diskreten Übertragungsfunktion, die Untersuchung diskreter Systeme hinsichtlich ihrer Stabilität, der Zusammenhang zwischen der s- und der z-Ebene sowie die Algebra der Blockschaltbilder diskreter Systeme. In diesem Kapitel sollen nun verschiedene Methoden zur Dimensionierung diskreter Regelkreise vorgestellt werden. Hierzu sind vor allem das diskrete Äquivalent zum analogen Regelkreis, das Wurzelortskurven-Verfahren sowie die Frequenzgang-Methode zu erwähnen. Die erste dieser Methoden wird in der regelungstechnischen Literatur als indirekte Methode, die beiden weiteren Methoden werden in der Regel als direkte Methoden bezeichnet. Ein diskreter Regelkreis ist zu einem analogen Regelkreis definitionsgemäß dann äquivalent, wenn das Zeitverhalten der Regelgröße für typische Eingangsfunktionen (Sprung, Impuls, Rampe etc.) als gut übereinstimmend bezeichnet werden kann. Schließlich darf nicht unerwähnt bleiben, dass auf Grund einer ungünstigen Wahl der Abtastperiode der diskretisierte Regelkreis instabil sein kann, obwohl der ursprüngliche analoge Regelkreis stabiles Übertragungsverhalten zeigt.
12.1 Das diskrete Filter aus einem äquivalenten analogen Filter Durch die rasante Entwicklung schneller und billiger Mikrocomputer und A/D- sowie D/AKonverter bedarf es keines großen Aufwandes mehr, zu einem vorhandenen analogen Prototyp ein äquivalentes digitales Filter oder einen diskreten Regler zu entwickeln. Das Bild 12.1 zeigt im Bild a) einen analogen Regler und im Bild b) den äquivalenten diskreten Regler.
Bild 12.1: a) Analoger Regler, b) äquivalenter diskreter Regler
Zum Bild b) muss zur Klärung hinzugefügt werden, dass das kontinuierliche Eingangssignal in ein digitales Signal konvertiert wird, bevor es dem digitalen Computer zur Verarbeitung zugeführt und vom nachfolgenden D/A-Konverter wieder in den kontinuierlichen Zeitbereich umgesetzt wird. Der Computer-Algorithmus muss einen diskreten Regler produzieren, dessen Dynamik einem vorgegebenen analogen Regler äquivalent ist. Die geforderte Äquivalenz gilt dann als erfüllt, wenn das diskrete Filter bzw. der diskrete Regler annähernd das gleiche dynamische Verhalten und dieselbe Frequenzabhängigkeit aufweisen wie das ursprüngliche analoge System. In den folgenden Ausführungen werden deshalb die bekanntesten Methoden der Bestimmung äquivalenter diskreter Systeme aufgezeigt.
300
12 Synthese diskreter Regelsysteme
12.1.1 Rechteckregel in Rückwärtsrichtung Betrachten wir einleitend ein analoges Filter mit der bekannten Übertragungsfunktion F (s) =
Y (s) a = . X(s) s+a
(12.1)
Um das dazu äquivalente, diskrete Filter zu entwickeln bestimmen wir zunächst aus der obigen Übertragungsfunktion die entsprechende Differenzialgleichung: dy(t) = −ay(t) + ax(t). dt
(12.2)
Die Integration dieser Differenzialgleichung von 0 bis t führt zu
t
dy(t) dt = −a dt
0
t
t y(t)dt + a
0
x(t)dt. 0
Im Zuge der (gewollten) Diskretisierung wird nun die kontinuierliche Zeit t mit den diskreten Zeitpunkten kT ersetzt. Damit wird die obige Integralgleichung zu
kT 0
dy(t) dt = −a dt
kT
kT y(t) dt + a
0
x(t) dt
bzw.
0
kT y(kT ) − y(0) = −a
kT y(t) dt + a
0
x(t) dt.
(12.3)
0
Ersetzt man die obere Integrationsgrenze kT mit (k − 1)T , so wird Gl. (12.3) zu
(k−1)T
y((k − 1)T ) − y(0) = −a
(k−1)T
y(t) dt + a 0
x(t) dt.
(12.4)
0
Subtrahiert man nun die Gl. (12.4) von Gl. (12.3), so erhält man
kT y(kT ) − y((k − 1)T ) = −a
kT y(t) dt + a
(k−1)T
x(t) dt.
(12.5)
(k−1)T
Die Integration der Terme der rechten Seite der Gl. (12.5) soll nun dadurch approximiert werden, dass – entsprechend der Rechteckregel in Rückwärtsrichtung – der rechtsseitige Funkti-
12.1 Das diskrete Filter aus einem äquivalenten analogen Filter
301
onswert mit der Breite T eines Streifens eine tragbare Näherung des Integrals ergibt. Damit wird Gl. (12.4) zu y(kT ) = y((k − 1)T ) − aT [y(kT ) − x(kT )] .
(12.6)
Die z-Transformierte dieser Gleichung wird zu Y (z) = z−1 Y (z) − aT [Y (z) − X(z)] . Durch entsprechende Umordnung wird die gesuchte diskrete Übertragungsfunktion zu FD (z) =
aT a Y (z) = = . −1 −1 X(z) 1 − z + aT 1−z +a T
(12.7)
Durch einen formalen Vergleich der Gleichungen (12.1) und (12.7) kann man unschwer erkennen, dass die rechten Seiten für s=
1 − z−1 T
(12.8)
identisch werden. Die Gl. (12.8) zeigt die Abbildungsvorschrift, mit der die s-Ebene unter Verwendung der „Rechteckregel rückwärts“ in die z-Ebene abgebildet wird. Eine alternative Herleitung der Gl. (12.6) erreicht man, indem man in Gl. (12.2) den Differenzialquotienten durch den Differenzenquotienten ersetzt, also dy(t) y(kT ) − y((k − 1)T ) = ; dt T Gl. (12.2) wird damit zu y(kT ) − y((k − 1)T ) + ay(kT ) = ax(kT ) T oder y(kT ) = y((k − 1)T ) − aT [y(kT ) − x(kT )] . Diese Gleichung ist identisch mit Gl. (12.6). Um den Einfluss dieser Abbildungsvorschrift auf die Stabilität zu untersuchen ist es nahe liegend zu prüfen, in welchen Bereich der z-Ebene das stabile Gebiet der s-Ebene, nämlich Re(s) < 0, abgebildet wird. Bezugnehmend auf Gl. (12.8) wird das stabile Gebiet der z-Ebene zu
z−1 1 − z−1 = Re < 0. Re T Tz
302
12 Synthese diskreter Regelsysteme
Beachtet man, dass die Abtastperiode T nur positiv sein kann, und ersetzt den komplexen Operator z mit α + jβ, so wird obige Stabilitätsbedingung zu
α + jβ − 1 Re α + jβ
< 0.
Durch konjugiert komplexe Erweiterung erhält man Re
2 α − α + β 2 + jβ (α + jβ − 1)(α − jβ) = Re . α2 + β 2 α2 + β 2
Damit wird der gesuchte Realteil dieser Abbildung zu α2 − α + β 2 <0 α2 + β 2 oder (α − 1 2)2 + β 2 < (1 2)2 . Aus dieser Gleichung ist unschwer zu erkennen, dass durch diese Abbildung das stabile Gebiet der s-Ebene in einen Kreis abgebildet wird, dessen Mittelpunktskoordinaten die Werte α = 1 1 2 und β = 0 haben und dessen Radius 2 ist. Dieser Stabilitätsradius ist im Bild 12.2 b) angedeutet. Die Rechteckregel in Rückwärtsrichtung erzeugt ein stabiles, diskretes Filter aus einem stabilen kontinuierlichen Filter. Dabei ist zu beachten, dass instabile Bereiche der sEbene innerhalb des Einheitskreises der z-Ebene, also in einen scheinbar stabilen Bereich abgebildet werden.
Bild 12.2: Abbildung der linken s-Ebene in die z-Ebene: a) Rechteckregel in Vorwärtsrichtung; b) Rechteckregel in Rückwärtsrichtung; c) Trapezregel
12.1 Das diskrete Filter aus einem äquivalenten analogen Filter
303
12.1.2 Rechteckregel in Vorwärtsrichtung Eine zweite Näherung einer Integration ergibt sich durch die Verwendung des linksseitigen Funktionswertes. Bei dieser Methode werden die Flächen
kT
kT y(t) dt
und
(k−1)T
x(t) dt (k−1)T
durch die Terme y((k − 1)T ) · T
und
x((k − 1)T ) · T
approximiert. Mit diesem Ansatz wird Gl. (12.5) zu y(kT ) = y((k − 1)T ) − aT [y((k − 1)T ) − x((k − 1)T )] oder y(kT ) = (1 − aT )y((k − 1)T ) + aT x((k − 1)T ). Die z-Transformierte der letzten Gleichung wird zu Y (z) = (1 − aT )z−1 Y (z) + aT z−1 X(z). Die äquivalente Übertragungsfunktion des diskreten Filters bekommt damit die Form FD (z) =
Y (z) aT z−1 a a = = . = −1 −1 z−1 X(z) 1 − (1 − aT )z 1−z + a +a T T z−1
(12.9)
Ein Vergleich der rechten Seiten der Gleichungen (12.1) und (12.9) führt zu der Identität s=
z−1 1 − z−1 = . T z−1 T
(12.10)
Die Gl. (12.10) kann wieder als Abbildungsvorschrift der s- in die z-Ebene aufgefasst werden, wenn im Interesse einer Diskretisierung die Rechteckregel in Vorwärtsrichtung angewandt werden soll. Untersucht man jedoch die Stabilität dieser theoretisch möglichen Abbildung, so wird gemäß der Gl. (12.10) die linke s-Ebene in das Gebiet
z−1 Re T
<0
oder
Re(z) < 1
304
12 Synthese diskreter Regelsysteme
abgebildet, wie dies im Bild 12.2 a) angedeutet ist. Aus dieser Abbildung geht eindeutig hervor, dass Pole der linken, d.h. der stabilen s-Ebene außerhalb des Einheitskreises der zEbene zu liegen kommen können. Somit kann das äquivalente diskrete Filter durchaus instabil werden, obwohl die kontinuierliche Übertragungsfunktion Stabilität aufweist. Daraus folgt ganz eindeutig, dass die Rechteckregel in Vorwärtsrichtung als Diskretisierungsmethode in der Praxis nicht anwendbar ist. 12.1.3 Trapezregel Bei der Trapezregel, auch als bilineare Transformation oder als Tustin-Regel bekannt, werden die Flächen
kT y(t) dt (k−1)T
und
kT x(t) dt (k−1)T
durch die Trapezflächen 1 [y(kT ) + y((k − 1)T )] T 2
und
1 [x(kT ) + x((k − 1)T )] T 2
angenähert. Unter Verwendung der Trapezregel wird Gl. (12.5) zu y(kT ) = y((k − 1)T ) − +
aT [y(kT ) + y((k − 1)T )] 2
aT [x(kT ) + x((k − 1)T )] . 2
(12.11)
Die z-Transformierte dieser Gleichung wird mit den üblichen Rechenregeln der z-Transformation zu . aT . aT Y (z) + z−1 Y (z) + X(z) + z−1 X(z) ; Y (z) = z−1 Y (z) − 2 2 die zu Gl. (12.1) äquivalente Übertragungsfunktion bekommt damit die Form aT −1 1 + z a Y (z) 2 =" FD (z) = . = # aT X(z) 1 − z−1 2 −1 −1 1−z + 1+z +a 2 T 1 + z−1
(12.12)
12.1 Das diskrete Filter aus einem äquivalenten analogen Filter
305
Ein Koeffizientenvergleich bez. der Gleichungen (12.1) und (12.12) führt zu dem Ergebnis, dass bei der Anwendung der bilinearen Transformation jeder s-Operator der ursprünglichen Übertragungsfunktion mit s=
2 1 − z−1 T 1 + z−1
(12.13)
zu ersetzen ist. Führt man, analog zu den beiden bisherigen Abbildungsmethoden, eine Stabilitätsbetrachtung durch, so kann man anhand der Gl. (12.13) feststellen, dass die linke s-Ebene, Re(s) < 0, in das Gebiet
2 z−1 Re T z+1
<0
der z-Ebene abgebildet wird. Wegen T > 0 kann diese Ungleichung auch in der Form
z−1 Re z+1
<0
ausgedrückt werden. Mit der Definition z = α + jβ wird die letzte Ungleichung zu
z−1 Re z+1
α + jβ − 1 = Re α + jβ + 1 (α − 1 + jβ)(α + 1 − jβ) = Re . (α + 1 + jβ)(α + 1 − jβ) 2 α − 1 + β 2 + 2jβ = Re <0 (α + 1)2 + β 2
Die letzte Form dieser Ungleichung ist äquivalent zu α2 − 1 + β 2 < 0 oder α 2 + β 2 < 1. Diese Ungleichung korrespondiert mit dem Inneren des Einheitskreises der z-Ebene. Somit wird durch die Trapezregel die gesamte linke s-Ebene in den Einheitskreis mit seinem Mittelpunkt im Ursprung der z-Ebene abgebildet. Damit produziert, im Gegensatz zu den vorangegangenen Methoden, die bilineare Transformation ein stabiles diskretes Filter aus einem stabilen kontinuierlichen Filter. Es darf jedoch nicht unterlassen werden, den maßgeblichen Nachteil dieser Transformation zu erwähnen:
306
12 Synthese diskreter Regelsysteme
Bei der Anwendung der bilinearen Transformation wird die gesamte imaginäre Achse der sEbene, also −∞ ≤ ω ≤ ∞, in einen Umlauf des Einheitskreises der z-Ebene abgebildet. Bei der korrekten, rein theoretischen Abbildung z = esT wird hingegen die gesamte jω-Achse in eine unendliche Anzahl von Umläufen des Einheitskreises abgebildet. (Die gesamte jω-Achse der s-Ebene ist somit auf den Umfang 2π des Einheitskreises „gestaucht“.) Daraus resultieren wiederum erhebliche Frequenzverschiebungen im Vergleich zum analogen Filter. Der Grad dieser Frequenzverschiebung, in der anglikanischen Literatur wird in diesem Zusammenhang vom Warping-Effekt gesprochen, lässt sich jedoch durch einen geringen Eingriff, das so genannte „Prewarping-Verfahren“, kompensieren; mehr darüber im folgenden Abschnitt. 12.1.4 Bilineare Transformation mit Prewarping-Technik Wir gehen wieder aus von der als bekannt vorausgesetzten Übertragungsfunktion F (s) =
Y (s) a = X(s) s+a
eines kontinuierlichen Filters. Bestimmen wir mit Gl. (12.13) das dazu äquivalente diskrete Filter unter Verwendung der bilinearen Transformation, so erhalten wir die entsprechende z-Transformierte zu a FD (z) = . 2 1 − z−1 · +a T 1 + z−1 Um die durch die bilineare Transformation verursachte Frequenzverschiebung korrigieren zu können wird zunächst die Frequenzabhängigkeit der kontinuierlichen Übertragungsfunktion F (s) und der diskreten Übertragungsfunktion FD (z) untersucht. Die Frequenzabhängigkeit von F (s) wird durch den Frequenzgang F (jω) und das Frequenzverhalten von FD (z) wird mit z = esT in der komplexen Funktion FD (ejωT ) ausgedrückt. Um nun einen Vergleich der Frequenzabhängigkeit zwischen F (jω) und FD (ejωT ) herbeiführen zu können, benutzen wir die Substitution s = jωA für eine beliebige Frequenz des analogen Filters und z = ejωD T für eine entsprechende Frequenz des diskreten Filters. (Der Idealfall wäre natürlich dann gegeben, wenn sich die Frequenzen ωA und ωD als zueinander identisch ergäben). Mit Gl. (12.13) erhalten wir jωA =
2 1 − e−jωD T 2 ej/2ωD T − e−j/2ωD T = · · T 1 + e−jωD T T ej/2ωD T + e−j/2ωD T
bzw. jωA = j ·
2 ωD T · tan T 2
und daraus
2 ωD T ωA = · tan T 2
(12.14)
12.1 Das diskrete Filter aus einem äquivalenten analogen Filter
307
oder
2 ωA T ωD = · arctan . T 2
(12.15)
Die Gleichungen (12.14) bzw. (12.15) sind ein Maß für die Frequenzverschiebung, d.h. für den so genannten Warping-Effekt, der bei Anwendung der Tustin-Regel entsteht. Für kleine Frequenzen vereinfacht sich natürlich die Gl. (12.14) auf ωA ≈
2 ωD T · = ωD . T 2
Nach dieser Gleichung entspricht das Niederfrequenzverhalten des äquivalenten diskreten Filters offenbar näherungsweise dem des ursprünglichen kontinuierlichen Filters. Wenn die Frequenz " sich jedoch # " # ωD der Nyquist-Frequenz ωs 2 = π T nähert, dann läuft tan ωD T 2 gegen tan π 2 , die Frequenz ωA steigt rapide gegen große Werte und der Warping-Effekt bekommt dann einen wesentlichen Einfluss. Durch die Anwendung der so genannten Prewarping-Technik besteht jedoch die Möglichkeit, die störende Frequenzverschiebung von vornherein zu korrigieren, bevor die bilineare Transformation auf ein analoges Filter angewandt wird: a) Zunächst ist die gewünschte Filtercharakteristik F (s) im Laplace-Bereich anzuschreiben und eine maßgebliche Frequenz zu definieren, die bei der Diskretisierung erhalten bleiben soll. Dies kann, je nach Aufgabenstellung, die Bandbreite eines Tief- oder Hochpasses oder die Mittenfrequenz eines Bandpasses sein. b) Im zweiten Schritt ist diese markante Frequenz, die hier mit ωA bezeichnet sei, mit Hilfe der Gl. (12.14) zu ersetzen. c) Im letzten Schritt wird nun die bilineare Transformation durchgeführt, indem die Substitution s=
2 1 − z−1 · T 1 + z−1
für jeden auftretenden Laplace-Operator zu vollziehen ist. Beispiel 12.1: Tiefpassfilter Die Übertragungsfunktion eines Tiefpassfilters sei gegeben zu F (s) =
a , s+a
wobei natürlich die Eckfrequenz a als bekannt vorausgesetzt wird. Wenn dieses Filter unter Anwendung der bilinearen Transformation mit Prewarping-Technik durch ein diskretes Filter ersetzt werden soll, so ist zunächst die Frequenzanpassung auf der Basis der Gl. (12.14) durchzuführen. Durch diese Operation wird die korrigierte Übertragungsfunktion zu
308
12 Synthese diskreter Regelsysteme
aT 2 tan T 2
. F (s) = aT 2 tan s+ T 2 Im nächsten Schritt wird auf diese bezüglich der Frequenz angepasste Übertragungsfunktion die bilineare Transformation angewandt. Das heißt, der Laplace-Operator s wird entsprechend der Gl. (12.13) ersetzt. Damit wird die gesuchte diskrete Übertragungsfunktion zu
2 aT aT tan tan T 2 2 FD (z) = =
. 2 1 − z−1 1 − z−1 2 aT aT + + tan tan T 1 + z−1 T 2 1 + z−1 2 Diese Gleichung ist die gesuchte Übertragungsfunktion des diskreten Filters unter Anwendung der bilinearen Transformation mit Prewarping-Technik. Beispiel 12.2: Hochpassfilter Das analoge Hochpassfilter mit der Übertragungsfunktion F (s) =
s s+a
soll unter Anwendung der bilinearen Transformation mit Prewarping in ein dazu äquivalentes diskretes System konvertiert werden. Es wird wieder, in Analogie zum ersten Beispiel, die maßgebliche Eckfrequenz korrigierend modifiziert und der Laplace-Operator s entsprechend der Gl. (12.13) ersetzt; damit wird die zu bestimmende diskrete Übertragungsfunktion zu 2 1 − z−1 1 − z−1 −1 T 1+z 1 + z−1 FD (z) =
= . −1 −1 2 1−z 1−z 2 aT aT + + tan tan T 1 + z−1 T 2 1 + z−1 2 Die Übertragungsfunktion FD (z) ist die zu F (s) äquivalente diskrete Übertragungsfunktion. Beispiel 12.3: Vergleich der bilinearen Transformation mit und ohne Prewarping Für ein kontinuierliches Filter mit der Übertragungsfunktion F (s) =
10 s + 10
ist das Frequenzverhalten des dazu äquivalenten diskreten Filters unter Anwendung der bilinearen Transformation ohne bzw. mit Frequenz-Prewarping zu untersuchen. Die Abtastrate T sei zu 0,2 Sekunden festgelegt. Das in seinem Übertragungsverhalten zu erstellende diskrete Filter soll einen Amplitudengang aufweisen, der zu dem Frequenzgang
12.1 Das diskrete Filter aus einem äquivalenten analogen Filter
F (jω) =
309
10 jω + 10
des analogen Filters in einem möglichst großen Frequenzbereich identisch oder ihm zumindest sehr ähnlich wird. Hierzu bestehe im vorliegenden Beispiel die Forderung, dass die Eckfrequenz ωA = 10 1/ sec an der Stelle A(ω) = −3 dB zu liegen kommt. 1. Bei der Anwendung der bilinearen Transformation besteht zwischen den komplexen Variablen s und z der bekannte Zusammenhang s=
2 1 − z−1 . · T 1 + z−1
Ersetzt man in der vorgegebenen Übertragungsfunktion F (s) den Laplace-Operator mit der rechten Seite der obigen Gleichung, so erhält man die entsprechende Übertragungsfunktion (ohne Prewarping-Technik) zu FD (z) =
z+1 . 2z
Im Bild 12.3 ist, entsprechend der Kurve a, der Amplitudengang des so erhaltenen Filters wiedergegeben. Zum Vergleich zeigt der Funktionsgraph b den Amplitudengang des ursprünglichen analogen Filters. Wie man sieht, besteht zwischen beiden Funktionsverläufen ein signifikanter Unterschied. 2. Bilineare Transformation mit Prewarping: Auf Grund des Zusammenhangs
2 ωD T ωA = tan = 10 · tan (0,1 · ωD ) T 2 und der Forderung A(ω) = −3 dB an der Stelle ωD = 10 1/ sec erhält man ωA = 10 tan(1) = 15,574. Damit wird die korrigierte analoge Übertragungsfunktion zu FD (s) =
15,574 . s + 15,574
Mit Gl. (12.13) wird die diskrete Übertragungsfunktion des bilinearen Filters mit der Prewarping-Technik zu
310
12 Synthese diskreter Regelsysteme
FD (z) =
0,609(z + 1) 15,574 = . 2 z−1 z + 0,218 + 15,574 T z+1
Der entsprechende Amplitudengang ist im Bild 12.3 als Kurve c gekennzeichnet. Im Gegensatz zur bilinearen Transformation ohne Prewarping zeigt das Frequenzverhalten dieses diskreten Filters eine weitaus bessere Übereinstimmung mit dem Frequenzverhalten des analogen Filters.
Bild 12.3: Bode-Diagramme äquivalenter Filter a) bilineare Transformation ohne Prewarping b) originales analoges Filter c) bilineare Transformation mit Prewarping
Abschließend sollte noch festgehalten werden, dass bei der Anwendung der bilinearen Transformation mit Frequenz-Prewarping die linke s-Halbebene in das Innere des Einheitskreises der z-Ebene abgebildet und damit ein stabiles diskretes Filter aus einem stabilen kontinuierlichen Filter erzeugt wird. Außerdem tritt bei der Anwendung dieser Konvertierungsmethode das Aliasing-Phänomen nicht auf, weil der Frequenzbereich 0 < ωA < ∞ der s-Ebene auf den eindeutig rekonstruierbaren Frequenzbereich 0 < ωD < π/T der z-Ebene abgebildet wird. Schließlich darf nicht unerwähnt bleiben, dass die Anwendung der bilinearen Transformation mit Frequenz-Prewarping, ohne Verwendung entsprechenden Software-Unterstützung, schnell zu unübersichtlichen Funktionen im z-Bereich führt, wenn die Laplace-transformierte Übertragungsfunktion F (s) dritter oder höherer Ordnung ist. 12.1.5 Getrennte Abbildung von Pol- und Nullstellen vom s- in den z-Bereich Eine weitere Methode, ein äquivalentes diskretes Filter aus einem vorgegebenen analogen Filter zu entwickeln, besteht darin, die bekannten Pol- und Nullstellen des kontinuierlichen Filters mit der Übertragungsfunktion F (s) von der s- in die z-Ebene entsprechend der Relation z = esT getrennt abzubilden. (In der anglikanischen Literatur läuft deshalb diese Vorgehensweise auch unter der Bezeichnung „Matched-Pole-Zero-Method“ mit der Abkürzung MPZ.) Der Vollständigkeit wegen muss erwähnt werden, dass es sich bei diesem vorzustellenden Verfahren um eine rein heuristische Methode handelt und es deshalb keine Herleitungen im üblichen Sinne geben kann.
12.1 Das diskrete Filter aus einem äquivalenten analogen Filter
311
Gehen wir einleitend von einem kontinuierlichen Filter mit der bekannten Übertragungsfunktion a . F (s) = s+a aus. Die gesuchte z-Transformierte dieser Übertragungsfunktion wird unter Verwendung einer Korrespondenz-Tabelle zu FD (z) =
a 1 − e−aT z−1
=
z . z − e−aT
Betrachtet man zunächst nur den Nenner der diskreten Übertragungsfunktion FD (z) und der kontinuierlichen Übertragungsfunktion F (s), so fällt unschwer auf, dass die jeweiligen Polstellen durch die Beziehung z = esT miteinander verknüpft sind. Eine Erweiterung dieser zweifellos leicht handzuhabenden Eigenschaft auf das Zählerpolynom ermöglicht die Bestimmung eines diskreten äquivalenten Filters mit einem nur minimalen Rechenaufwand. Wenn also die Übertragungsfunktion F (s) eine Nullstelle im endlichen Zahlenbereich an der Stelle s = −b hat, dann hat, der obigen Logik folgend, das äquivalente diskrete Filter FD (z) eine Nullstelle mit dem Wert z = e−bT . Für eine Nullstelle im Unendlichen, d.h. für s → ∞, kann man daraus schließen, dass das äquivalente diskrete Filter eine Nullstelle im Punkt z = −1 aufweisen muss. Diese Schlussfolgerung lässt sich damit erklären, dass reelle Frequenzen, beginnend von ω = 0, entlang des Einheitskreises der z-Ebene von z = ej0 = 1 des bis z = ejπ = −1 abgebildet werden. Die höchste, eindeutig reproduzierbare Frequenz kontinuierlichen Systems ist entsprechend des Shannon-Theorems ωN = 0,5ωs = π T ; diese Frequenz wird in den Punkt z = −1 abgebildet. Zur Aufstellung der diskreten Übertragungsfunktion eines bekannten kontinuierlichen Filters mit Hilfe der MPZ-Methode bedient man sich folgender, im Wesentlichen heuristischen Regeln: 1. Zuerst muss die Übertragungsfunktion des kontinuierlichen Filters in die Produktform F (s) = Kc
(s − sN1 ) (s − sN2 ) . . . (s − sNm ) (s − sP1 ) (s − sP2 ) . . . (s − sPn )
(12.16)
umgeformt werden, wobei sN1 bis sNm die Nullstellen und sP1 bis sPn die bekannten Polstellen des kontinuierlichen Filters sind. 2. Im zweiten Schritt werden sämtliche Nullstellen der Übertragungsfunktion F (s) im endlichen Zahlenbereich entsprechend der Beziehung z = esT in die z-Ebene abgebildet. Wenn also F (s) eine Nullstelle im Punkt s = −b besitzt, dann liegt die entsprechende Nullstelle der diskreten Übertragungsfunktion FD (z) an der Stelle z = e−bT . 3. Die Nullstellen von F (s) für s → ∞ bzw. der Polüberschuss wird in eine (n − m)-fache Nullstelle im Punkt z = −1 abgebildet. Damit wird die gesuchte Übertragungsfunktion des diskreten Filters zu " #" # " # (z + 1)n−m · z − esN1 T z − esN2 T . . . z − esNm T " #" # " # . (12.17) FD (z) = Kd z − esP1 T z − esP2 T . . . z − esPn T
312
12 Synthese diskreter Regelsysteme
4. Die noch unbekannte Verstärkung Kd des diskreten Filters ist so zu wählen, dass ein gewünschtes Übertragungsverhalten des analogen Filters einer maßgeblichen Frequenz bei der Diskretisierung erhalten bleibt. Bei den meisten regelungstechnischen Anwendungen und für Tiefpassfilter gilt die Forderung F (s = 0) ≡ FD (z = 1). Analog dazu sollte für Hochpassfilter die Identität F (s → ∞) ≡ FD (z = −1) erfüllt sein. Bevor die Handhabung dieser sicher einfachen Vorgehensweise zur Bestimmung eines diskretenÄquivalents eines kontinuierlichen Filters an einigen exemplarischen Beispielen aufgezeigt wird, soll für den in der Einführung dieses Abschnitts gegebenen Tiefpass F (s) =
a s+a
das diskrete Äquivalent durch Anwendung der MPZ-Methode ermittelt werden. Zunächst ist festzustellen, dass die kontinuierliche Übertragungsfunktion F (s) keine Nullstellen im endlichen Zahlenbereich besitzt, einen Polüberschuss von n − m = 1 und eine Polstelle im Punkt s = −a aufweist. Damit kann die zu F (s) diskrete Übertragungsfunktion sofort angeschrieben werden zu FD (z) = Kd
z+1 . z − e−aT
Der noch unbekannte Verstärkungsfaktor Kd wird unter der Prämisse ermittelt, dass das Übertragungsverhalten des analogen Filters mit dem des diskreten Filters bei tiefen Frequenzen übereinstimmen soll; d.h. es muss die Identität F (s = 0) ≡ FD (z = 1) erfüllt sein. Wendet man diese Bedingung auf den vorgegebenen Tiefpass an, so erhält man die Beziehung F (s = 0) = 1 ≡ FD (z = 1) = Kd
2 . 1 − e−aT
Daraus erhält man die noch unbekannte Konstante zu Kd =
1 − e−aT . 2
Die gesuchte diskrete Übertragungsfunktion wird damit zu FD (z) =
Y (z) 1 − e−aT z + 1 = X(z) 2 z − e−aT
12.1 Das diskrete Filter aus einem äquivalenten analogen Filter
313
bzw. FD (z) =
1 − e−aT 1 + z−1 . 2 1 − e−aT z−1
Die zur diskreten Übertragungsfunktion entsprechende Differenzengleichung erhält man über den bekannten Weg der Rücktransformation in den diskreten Zeitbereich zu y(kT ) = e−aT y((k − 1)T ) +
1 − e−aT [x(kT ) + x((k − 1)T )] . 2
Beispiel 12.4: Für das kontinuierliche Filter mit der Übertragungsfunktion F (s) = s + a ist das äquivalente diskrete Filter FD (z) durch Anwendung der MPZ-Methode zu bestimmen, wobei die Forderung bestehen soll, dass das kontinuierliche und das diskrete Filter für tiefe Frequenzen gleiches Übertragungsverhalten haben. Die kontinuierliche Übertragungsfunktion F (s) besitzt eine Nullstelle im Punkt s = −a, sie hat keine Polstellen im endlichen Zahlenbereich, jedoch eine Polstelle für s → ∞. Die Nullstelle s = −a wird in den Punkt z = e−aT und die im Unendlichen liegende Polstelle in den Punkt z = −1 abgebildet. Somit wird die Übertragungsfunktion des äquivalenten diskreten Filters zu FD (z) = Kd
z − e−aT . z+1
Den noch unbekannten Verstärkungsfaktor Kd erhält man wieder aus der Bedingung, dass das Übertragungsverhalten des diskreten und des analogen Filters bei tiefen Frequenzen übereinstimmt. Somit gilt die Bedingung F (s = 0) = a ≡ FD (z = 1) = Kd
1 − e−aT ; 2
also
Kd =
2a . 1 − e−aT
Die Übertragungsfunktion des diskreten Äquivalents zu F (s) bekommt damit die endgültige Form FD (z) =
z − e−aT 1 − e−aT z−1 2a 2a . = −aT −aT 1−e z+1 1−e 1 + z−1
Beispiel 12.5: Zu dem kontinuierlichen Filter mit der kontinuierlichen Übertragungsfunktion F (s) =
1 1 1 # " # =" = 2 2 (s + a) + b (s + a + jb) · (s + a − jb) s − sp1 · s − sp2
ist das dazu äquivalente diskrete Filter unter Anwendung der MPZ-Methode zu bestimmen:
314
12 Synthese diskreter Regelsysteme
Die vorgegebene Übertragungsfunktion besitzt keine Nullstellen im endlichen Zahlenbereich, zwei konjugiert komplexe Pole sowie einen Polüberschuss von zwei. Damit wird die diskrete Übertragungsfunktion zunächst zu (z + 1)2 (z + 1)2 # " # , = z2 − 2ze−aT cos bT + e−2aT z − esp1 T · z − esp2 T
FD (z) = Kd "
wobei die noch unbekannte Verstärkung so einzurichten ist, dass das Übertragungsverhalten des analogen und des diskreten Filters bei tiefen Frequenzen identisch ist. Mit dem bekannten Ansatz F (s = 0) ≡ F (z = 1) erhalten wir den Parameter Kd zu Kd =
1 − 2e−aT cos bT + e−2aT # " 4 a 2 + b2
wird die endgültige Form der gesuchten Übertragungsfunktion zu #2 " 1 + z−1 1 − 2e−aT cos bT + e−2aT # " . Fr mD(z) = 1 − 2ze−aT cos bT z−1 + e−2aT z−2 4 a 2 + b2
Das nächste und zugleich letzte Beispiel soll die Vorgehensweise bei Verwendung der MPZMethode aufzeigen, wenn die Übertragungsfunktion des kontinuierlichen Filters einen Integrator beinhaltet. Beispiel 12.6: Für das Übertragungsglied mit der kontinuierlichen Übertragungsfunktion F (s) = Kc
s+a , s(s + b)
also einem verzögerten Integrator mit Phasenanhebung, ist die entsprechende diskrete Übertragungsfunktion auf der Basis des MPZ-Verfahrens zu bestimmen. Auf Grund der Lage von Pol- und Nullstellen wird die diskrete Übertragungsfunktion zunächst zu FD (z) = Kd
(z + 1)(z − e−aT ) . (z − 1)(z − e−bT )
Durch Anwendung des Endwertsatzes # " (z + 1) z − e−aT s+a # " = lim (z − 1) Kd lim sKc s→0 z→1 s+b (z − 1) z − e−bT
12.2 Regelkreis-Synthese mit Hilfe von Wurzelortskurven
315
erhält man die noch unbekannte Verstärkung zu Kd = Kc
a 1 − e−bT . 2b 1 − e−aT
12.2 Regelkreis-Synthese mit Hilfe von Wurzelortskurven 12.2.1 Dynamisches Verhalten digitaler Regelkreise Bevor im nächsten Abschnitt das Wurzelortskurven-Verfahren erläutert wird, sollen hier in Anlehnung an Abschnitt 5.3 zunächst die wichtigsten Kenngrößen zur Charakterisierung des transienten Verhaltens des geschlossenen Regelkreises in Erinnerung gerufen werden. In der Praxis wird das Zeitverhalten sowohl für analoge als auch für diskrete Regelkreise meist im Zeitbereich spezifiziert. Für beide Fälle wurden anhand des dynamischen Verhaltens der Regelgröße Kennwerte definiert, die über die Qualität der Regelung Aufschluss geben. Dies sind im Besonderen • die Anstiegszeit tr , • die maximale Überschwingweite emax , • der Zeitpunkt tmax der maximalen Überschwingweite sowie • die Ausregelzeit ts . Die aufgeführten Qualitätsparameter der Regelgröße y(t) als Reaktion auf den Einheitssprung w(t) = ε(t) am Sollwerteingang sind im folgenden Bild einer typischen Sprungantwort eingetragen.
Bild 12.4: Typische Qualitätsparameter des geschlossenen Regelkreises
316
12 Synthese diskreter Regelsysteme
Der Zusammenhang der oben aufgeführten Qualitätsmaße mit der Eigenfrequenz ω0 und der Dämpfung d eines Systems zweiter Ordnung wird hier der Vollständigkeit wegen noch einmal aufgezeigt; die detaillierte Herleitung ist bereits im Abschnitt 5.3 dargestellt: Anstiegszeit: tr ≈ 1,8 ω0 ; siehe Gl. (5.17), Maximale Überschwingweite:
emax [%] = exp(− √
Zeitpunkt der max. Überschwingweite: Ausregelzeit:
tmax
ts ≈ 4 ω0 d; siehe Gl. (5.15).
πd
) · 100; siehe Gl. (5.13), 1 − d2 π = √ ; siehe Gl. (5.11), ω0 1 − d 2
12.2.2 Allgemeine Regeln zur Konstruktion von Wurzelortskurven Im Gegensatz zu den im Abschnitt 12.1 aufgeführten Methoden zur Entwicklung digitaler Regler aus einem äquivalenten analogen Regler wird bei dem nunmehr vorzustellenden Verfahren von vornherein von der z-Ebene ausgegangen. Das folgende Bild soll zur Verdeutlichung der kommenden Ausführungen den digitalen Standard-Regelkreis in Erinnerung rufen.
Bild 12.5: Einfacher diskreter Regelkreis
Im Abschnitt 11.2.1 wurde bereits gezeigt, dass sich die diskrete Übertragungsfunktion des Haltegliedes einschließlich der kontinuierlichen Strecke zu z−1 Fs (s) G(z) = ·Z z s ergibt, wobei Fs (s) die als bekannt vorausgesetzte Übertragungsfunktion der kontinuierlichen Regelstrecke ist. Mit der z-transformierten Übertragungsfunktion FR (z) der Differenzengleichung des diskreten Reglers wird die bereits mehrmals definierte Übertragungsfunktion des offenen Regelkreises zu Fo (z) = FR (z)G(z). Die charakteristische Gleichung des diskreten Regelkreises bekommt damit die bekannte Form 1 + Fo (z) = 0.
(12.19)
12.2 Regelkreis-Synthese mit Hilfe von Wurzelortskurven
317
Wenn man zumVergleich die charakteristische Gleichung kontinuierlicher Regelkreise ausAbschnitt 4.4 heranzieht, so kann man unschwer feststellen, dass beide Gleichungen von derselben Form sind. Daraus folgt wiederum, dass die Regeln zur Konstruktion der Wurzelortskurve im z-Bereich ebenso gelten wie im s-Bereich. Der einzige Unterschied zwischen den beiden komplexen Ebenen besteht darin, dass die jω-Achse als Stabilitätsgrenze der s-Ebene zum Einheitskreis als Stabilitätsgrenze der z-Ebene wird. Aus diesem Grunde bedarf es auch keiner ausführlichen Herleitung der Regeln zur Konstruktion der Wurzelortskurven, es sollen im Folgenden nur die Ergebnisse aus Abschnitt 4.4.2 in komprimierter Form aufgeführt werden. Pole und Nullstellen Im Zuge der Konstruktion der Wurzelortskurve werden zunächst die Pole und Nullstellen des offenen Regelkreises in die z-Ebene eingetragen. Hierzu wird zunächst die charakteristische Gleichung 1 + Fo (z) = 0 auf die Form 1 + k0
(z − z1 ) (z − z2 ) . . . (z − zm ) =0 (z − p1 ) (z − p2 ) . . . (z − pn )
(12.20)
gebracht, wobei z1 bis zm die Nullstellen und p1 bis pn die Polstellen des offenen Regelkreises sind und 0 ≤ k0 ≤ ∞ laufender Parameter ist. Beginn und Ende der Wurzelortskurven-Äste Bezugnehmend auf Abschnitt 4.4.2 ist festzustellen, dass sämtliche Äste der Wurzelortskurve in den Polstellen beginnen und in die Nullstellen des offenen Regelkreises einmünden. Außerdem laufen (n − m) Äste der Wurzelortskurve ins Unendliche der z-Ebene. Bestimmung der Wurzelortskurve auf der reellen Achse Die Äste der Wurzelortskurve auf der reellen Achse werden mit Hilfe der reellen Pol- und Nullstellen des offenen Regelkreises ermittelt. Jeder Ast der Wurzelortskurve auf der reellen Achse erstreckt sich immer über einen Bereich von einem Pol oder einer Nullstelle zu einem anderen Pol oder einer anderen Nullstelle. Zur Auffindung der entsprechenden Wurzelortskurven-Äste wählt man einen beliebigen Testpunkt auf der reellen Achse. Wenn die Gesamtzahl reeller Pole und reeller Nullstellen rechts von diesem Testpunkt ungerade ist, dann ist dieser Testpunkt ein Punkt der Wurzelortskurve. Bestimmung der Asymptoten der Wurzelortskurve Den Schnittpunkt σa der Asymptoten mit der reellen Achse der z-Ebene erhält man aus der Beziehung σa =
(p1 + p2 + . . . + pn ) − (z1 + z2 + . . . + zm ) ; n−m
(12.21)
die Neigungswinkel αk , also die Winkel zwischen der jeweiligen Asymptote und der reellen Achse, folgen aus der Gleichung
318
12 Synthese diskreter Regelsysteme
αk =
±180◦ (2k + 1) ; n−m
k = 0, 1, 2, . . . (n − m)
(12.22)
mit n m
Zahl der endlichen Pole Zahl der endlichen Nullstellen des offenen Regelkreises
Bestimmung der Verzweigungs- und Vereinigungspunkte Nachdem die Wurzelortskurve immer symmetrisch zur reellen Achse verläuft, liegen die Verzweigungs- oder Vereinigungspunkte entweder auf der reellen Achse oder sie treten als konjugiert komplexe Paare in Erscheinung. Verläuft ein Ast der Wurzelortskurve auf der reellen Achse zwischen zwei Polstellen des offenen Regelkreises, dann existiert dazwischen mindestens ein Verzweigungspunkt. Verläuft dagegen ein Ast der Wurzelortskurve auf der reellen Achse zwischen zwei Nullstellen des offenen Regelkreises, eine Nullstelle davon kann im Unendlichen liegen, dann existiert dazwischen mindestens ein so genannter Vereinigungspunkt. Wenn schließlich ein Ast der Wurzelortskurve zwischen einem Pol und einer im Endlichen oder im Unendlichen liegenden Nullstelle verläuft, dann liegt dazwischen entweder weder ein Verzweigungs- noch ein Vereinigungspunkt, oder Verzweigungs- und Vereinigungspunkt treten paarweise auf. Schreibt man die charakteristische Gleichung 1 + Fo (z) = 0 in der Form 1 + k0
b(z) =0 a(z)
an, so wird der laufende Parameter k0 zu a(z) . (12.23) b(z) Aus der Bedingung, dass der Parameter k0 an der Stelle eines Verzweigungs- oder eines Vereinigungspunktes ein lokales Maximum bzw. Minimum haben muss, ergeben sich diese Punkte aus der Bedingung k0 = −
b(z)da(z) dz − a(z)db(z) dz dk0 =− =0 dz b2 (z)
.
(12.24)
Austrittswinkel der Wurzelortskurve aus einer Polstelle und Eintrittswinkel in eine Nullstelle des offenen Regelkreises Um den Verlauf der Wurzelortskurve entsprechend genau zeichnen zu können, muss deren Richtung in der Umgebung von komplexen Pol- und Nullstellen ermittelt werden. Der Austrittswinkel (Eintrittswinkel) der Wurzelortskurve aus einer komplexen Polstelle (in eine komplexe Nullstelle) ergibt sich aus der Phasenbedingung der Wurzelortskurven, siehe Abschnitt 4.4.2, wobei von sämtlichen Pol- und Nullstellen zur fraglichen Pol- oder Nullstelle
12.2 Regelkreis-Synthese mit Hilfe von Wurzelortskurven
319
Zeiger zu ziehen und deren Phasenwinkel vorzeichenrichtig in die Phasenbedingung einzusetzen sind. Im folgenden Bild ist beispielsweise die Bestimmung des Austrittswinkels aus der komplexen Polstelle p3 aufgezeigt.
Bild 12.6: Bestimmung des Austrittswinkels
Unter Anwendung der Phasenbedingung auf das im obigen Bild gegebene Beispiel wird der Austrittswinkel der Wurzelortskurve aus der Polstelle p3 zu ϕp3 = 180◦ − (θ1 + θ2 ) + Φ. Schnittpunkt der Wurzelortskurve mit der Imaginärachse der z-Ebene Jeder Punkt der Wurzelortskurve ist eine Polstelle des geschlossenen Regelkreises, wenn der laufende Parameter k0 in diesem Punkt die Amplitudenbedingung erfüllt. Dies bedeutet wiederum, dass man unter Anwendung der Amplitudenbedingung bei der bereits konstruierten Wurzelortskurve den Wert von k0 in jedem interessierenden Punkt der Wurzelortskurve bestimmen kann. Die Amplitudenbedingung lautet bekanntlich (z − p1 ) · (z − p2 ) · . . . · (z − pn ) . k0 = (12.25) (z − z1 ) · (z − z2 ) · . . . · (z − zm )
12.2.3 Wurzelortskurven digitaler Regelkreise Anhand einiger Beispiele sollen nun auf der Basis der Abschnitte 12.2.1 und 12.2.2 einige diskrete Regler dimensioniert und deren Qualität auf das Regelverhalten überprüft werden. Beispiel 12.7: Im Rahmen des ersten Beispiels wird ein besonderes Augenmerk auf den Einfluss der Reglerverstärkung und der Abtastperiode auf die Stabilität des geschlossenen Regelkreises gelegt. Dazu betrachten wir den im folgenden Bild skizzierten Regelkreis.
320
12 Synthese diskreter Regelsysteme
Bild 12.7: Einfacher diskreter Regelkreis
Die verschiedenen Übertragungsfunktionen seien gegeben zu Fs (s) =
1 s+1
als bekannte Übertragungsfunktion der Strecke; Fh (s) =
1 − e−sT s
als Übertragungsfunktion des Haltegliedes und FR (z) = K
z z−1
als Übertragungsfunktion eines diskreten Integrators mit einstellbarer Verstärkung K. Die Aufgabenstellung besteht in der Konstruktion der Wurzelortskurve und der Überprüfung der Stabilität für drei verschiedene Werte derAbtastperiode.Außerdem wird für jeden der drei Fälle die kritische Reglerverstärkung Kkrit und die Lage der Pole des geschlossenen Regelkreises für den Fall K = 2 berechnet. Im Zuge des Lösungswegs muss zunächst die z-Transformierte aus der Reihenschaltung des Haltegliedes und der kontinuierliche Strecke ermittelt werden. Mit G(z) = Z {Fh (s)Fs (s)} folgt zunächst
1 − e−sT 1 G(z) = Z s s+1
−1 ·Z = 1−z
1 . s(s + 1)
Durch Anwendung der Partialbruchzerlegung wird obige Gleichung zu
1 1 G(z) = 1 − z−1 · Z − . s s+1 Mit
1 z Z = s z−1
und
1 z Z = s+1 z − e−T
12.2 Regelkreis-Synthese mit Hilfe von Wurzelortskurven
321
wird G(z) zu
G(z) = 1 − z
−1
1 1 − −1 −1 1−z 1 − z e−T
=1−
1 − z−1 1 − z−1 e−T
bzw. G(z) =
1 − e−T . z − e−T
Mit Fo (z) = FR (z)G(z) erhält man die Übertragungsfunktion des offenen Regelkreises zu Fo (z) = K
z 1 − e−T z − 1 z − e−T
(12.26)
und die charakteristische Gleichung 1 + Fo (z) = 0 zu 1+K
z 1 − e−T = 0. z − 1 z − e−T
(12.27)
Nun soll, wie bereits oben erwähnt wurde, der Einfluss der Abtastperiode auf die Stabilität und auf die kritische Reglerverstärkung untersucht werden. Abtastperiode T = 0,5 sec: Bezugnehmend auf Gl. (12.26) nimmt die Übertragungsfunktion des offenen Regelkreises die Form Fo (z) = K
0,3935z (z − 1)(z − 0,6065)
an. Somit weist der offene Regelkreis zwei Pole an den Stellen z = 1 und z = 0,6065 sowie eine Nullstelle im Punkt z = 0 auf. Im Zuge der Konstruktion der Wurzelortskurve werden zunächst die beiden Pole und die Nullstelle in die z-Ebene eingetragen. Die Verzweigungs- bzw. Vereinigungspunkte ergeben sich im vorhandenen Beispiel aus der umgestellten Gl. (12.27) K=−
(z − 1)(z − 0,6065) 0,3935z
(12.28)
und der entsprechenden Ableitung dK z2 − 0,6065 =− =0 dz 0,3935z2
zu z2 = 0,6065
bzw.
z1,2 = ±0,7788.
322
12 Synthese diskreter Regelsysteme
Setzt man in der Gl. (12.28) z = 0,7788 bzw. z = −0,7788, so erhält man in beiden Fällen einen positiven Wert für den laufenden Parameter K. Dieses Ergebnis ist als Bestätigung zu werten, dass die Lösungen z1,2 = ±0,7788 relevante Werte für tatsächlich existierenden Verzweigungs- bzw. Vereinigungspunkte sind. Mit diesen Informationen kann bereits der Verlauf der Wurzelortskurve gemäß Bild 12.8 gezeichnet werden.
Bild 12.8: Verlauf der Wurzelortskurve für T = 0,5 sec
Die kritische Verstärkung Kkrit erhalten wir aus der Amplitudenbedingung zu (z − 1) "z − e−T # Kkrit = = 8,16. z(1 − e−T ) z=−1
Die Pole des geschlossenen Regelkreises ergeben sich schließlich mit K = 2 aus Gl. (12.27) zu z1,2 = 0,41 ± j0,66. Abtastperiode T = 1 sec: Für diesen Fall bekommt mit Gl. (12.26) die Übertragungsfunktion des offenen Regelkreises die Form Fo (z) = K
0,6321z . (z − 1)(z − 0,3679)
Die Pole des offenen Regelkreises liegen jetzt an den Stellen z = 1 und z = 0,3679; an der Stelle z = 0 liegt wie im ersten Fall eine Nullstelle. Die Verzweigungs- und Vereini-
12.2 Regelkreis-Synthese mit Hilfe von Wurzelortskurven
323
gungspunkte kommen entsprechend der obigen Vorgehensweise in den Punkten z = ±0,61 zu liegen. Bild 12.9 zeigt wieder die entsprechende Wurzelortskurve. Der laufende Parameter K wird im Verzweigungs- bzw. im Vereinigungspunkt zu K = 0,24 bzw. K = 4,08. Die kritische Verstärkung reduziert sich jetzt auf Grund der längeren Abtastperiode zu Kkrit = 4,33 und die Pole des geschlossenen Regelkreises kommen für eine Verstärkung von K = 2 in den Punkten z1,2 = 0,052 ± j0,60 zu liegen.
Bild 12.9: Wurzelortskurve für T = 1 sec
Abtastperiode T = 2 sec: Mit Gl. (12.26) wird jetzt die Übertragungsfunktion des offenen Regelkreises zu Fo (z) = K
0,8647z , (z − 1)(z − 0,1353)
wobei jetzt die Polstellen in den Punkten z = 1 und z = 0,1353 zu liegen kommen; die Nullstelle im Punkt z = 0 bleibt natürlich unverändert. Die Verzweigungs- bzw. Vereinigungspunkte kommen nun an den Stellen z = ±0,3678 zu liegen mit den dazu korrespondierenden Verstärkungen von K = 0,46 bzw. K = 2,16. Bild 12.10 zeigt wieder die zugehörige Wurzelortskurve. Die kritische Verstärkung reduziert sich wegen der noch größeren Abtastperiode auf den Wert Kkrit = 2,63 und die Pole des geschlossenen Regelkreises nehmen nun für K = 2 die Werte z1,2 = −0,29 ± j0,22 an.
324
12 Synthese diskreter Regelsysteme
Bild 12.10: Wurzelortskurve für T = 2 sec
Beispiel 12.8: In diesem Beispiel wird gezeigt, dass ein für jede beliebige Verstärkung stabiler analoger Regelkreis im diskreten Fall durch den Einfluss der Abtastperiode sehr wohl instabil werden kann. Vorgegeben seien eine Strecke mit der Übertragungsfunktion Fs (s) =
a s+a
sowie das Halteglied mit der bereits bekannten Übertragungsfunktion Fh (s) =
1 − e−sT . s
Der Regler sei ein bloßer einstellbarer Verstärker mit der Übertragungsfunktion FR (s) = FR (z) = KR ; siehe hierzu das Blockschaltbild des Bildes 12.11. Die diskrete Übertragungsfunktion des kontinuierlichen Teils des Regelkreises erhält man mit der bekannten Beziehung
z−1 Fs (s) G(z) = ·Z z s
12.2 Regelkreis-Synthese mit Hilfe von Wurzelortskurven
325
Bild 12.11: Proportional-Regler an einer Strecke mit Verzögerung erster Ordnung
zu
z−1 a G(z) = Z . z s(s + a) Mit Hilfe einer Korrespondenz-Tabelle bekommt die gesuchte z-Transformierte die Form
G(z) = 1 − z
−1
# 1 − e−aT z−1 1 − e−aT " #" # = . z − e−aT 1 − z−1 1 − e−aT z−1 "
Die für die Beurteilung der Stabilität maßgebliche Beziehung, nämlich die charakteristische Gleichung des diskreten Regelkreises wird für das vorgegebene Beispiel zu 1 + Fo (z) = 0 bzw. 1 + FR (z)G(z) = 1 + K
1−c = 0, z−c
wobei die Definition c = e−aT für die von der Abtastperiode T abhängige Polstelle des offenen Regelkreises eingeführt wurde. Für den kontinuierlichen Regelkreis bekommt die charakteristische Gleichung die Form 1 + Fo (s) = 1 + K
a = 0; s+a
es existiert also lediglich eine konstante Polstelle im Punkt s = −a. Das Bild 12.12 zeigt nun auf der linken Seite die Wurzelortskurve für den diskreten und rechts für den kontinuierlichen Regelkreis. Aus dem Verlauf der beiden Wurzelortskurven geht eindeutig hervor, dass beim diskreten Regelkreis, im Gegensatz zur kontinuierlichen Version, die für sämtliche Verstärkungen Stabilität aufweist, das geschlossene System für K-Werte, deren Wurzelorte außerhalb des Einheitskreises liegen, instabil ist. Diese Instabilität wiederum ist durch die Phasenverschiebung des Haltegliedes begründet.
326
12 Synthese diskreter Regelsysteme
Bild 12.12: Wurzelortskurve in der z- und in der s-Ebene
Beispiel 12.9: In diesem Beispiel soll ein diskreter Proportional-Differenzial-Regler (PD-Regler) mit der Übertragungsfunktion FR (z) = Kd
z−α z
zur Regelung einer zweifach integrierenden Regelstrecke mit der Übertragungsfunktion Fs (s) =
1 s2
in der z-Ebene so dimensioniert werden, dass die Eigenfrequenz der ungedämpften Schwingung der Regelgröße einen Wert von ω0 ≈ 0,3 1/ sec und eine Dämpfung von d ≈ 0,7 annimmt. Die Abtastperiode T sei zu einer Sekunde festgelegt. Die diskrete Darstellung des kontinuierlichen Teils des Regelkreises, also Strecke und Halteglied, ergibt sich mit
z−1 z−1 Fs (s) 1 G(z) = ·Z = ·Z 3 z s z s gemäß einer Korrespondenz-Tabelle G(z) =
z − 1 T 2 z(z + 1) · · z 2 (z − 1)3
mit T = 1 sec zu G(z) =
1 z+1 . 2 (z − 1)2
Auf Grund der Tatsache, dass es sich bei der zu regelnden Strecke um einen Doppelintegrator handelt, scheidet die Regelung mit einem Proportional-Regler aus. Wie man nämlich leicht
12.2 Regelkreis-Synthese mit Hilfe von Wurzelortskurven
327
anhand von Bild 12.13 feststellen kann, würde der einmal angeregte Regelkreis eine aufklingende Schwingung aufzeigen. Es ist nämlich deutlich zu sehen, dass die Wurzelortskurve, also die Pole des geschlossenen Regelkreises, ausschließlich außerhalb des Einheitskreises der z-Ebene, also im instabilen Bereich, verläuft.
Bild 12.13: Wurzelortskurve eines Doppelintegrators mit einem Proportional-Regler
Zur Stabilisierung des Regelkreises wird deshalb zum P-Anteil des Reglers ein stabilisierender Anteil, nämlich ein D-Anteil, hinzugefügt. Damit wird das angestrebte Regelgesetz zu FR (z) =
z−α U (z) = KR , E(z) z
(12.29)
wobei U (z) und E(z) Ausgangs- bzw. Eingangsgröße und KR bzw. α die Verstärkung bzw. der D-Anteil des zu dimensionierenden Reglers sind. Unter Verwendung der Gleichungen (11.17)
2πd ωd |z| = exp − √ 1 − d 2 ωs und (11.18)
(z) = 2π
ωd ωs
wird entsprechend den Forderungen ω0 ≈ 0,3 1/ sec und d ≈ 0,7 der zugehörige Wurzelort der z-Ebene in den Punkt
328
12 Synthese diskreter Regelsysteme
z1,2 = 0,78 ± j0,18 abgebildet. Das Bild 12.14 zeigt die entsprechende Wurzelortskurve mit α = 0,85 und der Reglerverstärkung KR als laufenden Parameter.
Bild 12.14: Wurzelortskurve eines PD-Reglers an einer IT1 -Strecke
(Dabei sollte festgehalten werden, dass sich der Wert α = 0,85 aus mehreren Simulationen ergeben hat.) Wie man anhand von Bild 12.14 sieht, liegt der gewünschte Wert von z auf der Wurzelortskurve. Die Reglerverstärkung KR im Punkt z = 0,78 ± j0,18 erhält man durch Anwendung der Amplitudenbedingung im Schnittpunkt der Linie konstanter Dämpfung (d = 0,5) und der Linie konstanter Eigenfrequenz (ω0 = 0,3) zu KR = 0,37. Damit wird die Reglergleichung (12.29) zu FR (z) = 0,37
z − 0,85 . z
Mit Gl. (12.29) U (z) = 0,37 1 − 0,85z−1 E(z) wird schließlich die gesuchte Differenzengleichung des Reglers zu u(k) = 0,37 e(k) − 0,318 e(k − 1).
12.2 Regelkreis-Synthese mit Hilfe von Wurzelortskurven
329
Beispiel 12.10: In diesem Beispiel soll der Einfluss der Abtastperiode T auf das Einschwingverhalten des diskreten Regelkreises aufgezeigt werden. Eine große Abtastperiode hat einen sehr nachteiligen Einfluss auf die Stabilität des geschlossenen Regelkreises. Für untergedämpfte Systeme (d < 1) gilt die pauschale Regel, dass die gedämpft schwingende Regelgröße acht- bis zehnmal während einer Periode abgetastet werden sollte. Übergedämpfte Systeme (d > 1) sollten acht- bis zehnmal innerhalb der Anstiegszeit abgetastet werden. Aus den bisherigen Betrachtungen geht eindeutig hervor, dass die Erhöhung der Abtastperiode bei konstanter Reglerverstärkung den diskreten Regelkreis in Richtung instabilen Regelverhaltens bewegt. Umgekehrt ausgedrückt gilt, dass für eine kleiner werdende Abtastperiode T die kritische Verstärkung größer wird. Die Dämpfungskonstante d einer Polstelle des geschlossenen Regelkreises lässt sich analytisch aus der Lage dieser Polstelle in der z-Ebene ermitteln, wie im Folgenden gezeigt wird: Für eine beliebige Dämpfungskonstante d < 1 ist die zugehörige Polstelle (der oberen Halbebene) des geschlossenen Regelkreises in der s-Ebene gegeben durch s = −ω0 d + jω0 1 − d 2 . Wegen z = esT kommt der korrespondierende Punkt in der z-Ebene im Punkt . z = exp T (−ω0 d + jω0 1 − d 2 ) zu liegen. Damit werden Betrag und Phase des charakteristischen Pols zu |z| = e−ω0 dT
(12.30)
und arg(z) = ω0 T
1 − d 2 = θ [rad] .
(12.31)
Aus den Gleichungen (12.30) und (12.31) kann der Wert der Dämpfung d ermittelt werden. Beispielsweise liegt für den Fall T = 0,5 sec und K = 2 (siehe Bild 12.8) der zugehörige Pol des geschlossenen Regelkreises an der Stelle z = 0,4098 + j0,6623. Damit wird gemäß Gl. (12.30) |z| =
0,40982 + 0,66232 = 0,7788.
Weil auch gilt |z| = e−ω0 dT , wird der Exponent zu ω0 dT = 0,25.
(12.32)
330
12 Synthese diskreter Regelsysteme
Bild 12.15: Sprungantwort y(kT ) für verschiedene Abtastzeiten; a) T = 0,5 sec, b) T = 1 sec, c) T = 2 sec, K = 2 jeweils
12.2 Regelkreis-Synthese mit Hilfe von Wurzelortskurven
331
Den zugehörigen Phasenwinkel erhalten wir damit zu
0,6623 = 1,0167 rad bzw. arg(z) = arctan 0,4098
58,25◦ .
Aus den Gleichungen (12.31) und (12.32) erhält man durch eine einfache Quotientenbildung 0,25 ω0 dT = √ 2 1,0167 ω0 T 1 − d bzw. √
d 1 − d2
= 0,2459
die Dämpfungskonstante zu d = 0,2388. Dabei ist darauf hinzuweisen, dass für Systeme zweiter Ordnung die Dämpfung d nur dann ein Maß für die relative Stabilität ist, wenn die Abtastfrequenz hinreichend groß ist (wie bereits erwähnt acht bis zehn Abtastungen innerhalb einer Periode der oszillierenden Regelgröße). Bei einer zu kleinen Abtastfrequenz wird die maximale Überschwingweite als Reaktion auf eine sprungförmige Sollwertänderung wesentlich höher, als man sie gemäß der Dämpfung d erwarten würde. Die Übertragungsfunktion des geschlossenen Regelkreises gemäß Bild 12.7 mit der Übertragungsfunktion des offenen Regelkreises entsprechend Gl. (12.26) lautet Y (z) Fo (z) Kz(1 − e−T ) " # " #. = = W (z) 1 + Fo (z) (z − 1) z − e−T + Kz 1 − e−T Für T = 1 sec und K = 2 wird die Sprungantwort im z-Bereich zu Y (z) =
0,3935 · 2z W (z). (z − 1) (z − 0,6065) + 0,3935 · 2z
Verwendet man den Einheitssprung mit W (z) = Y (z) =
z z−1 ,
so erhält man
0,7870z−1 1 −1 −2 1 − 0,8195z + 0,6065z 1 − z−1
und daraus (entweder durch Rücktransformation in den diskreten Zeitbereich oder durch eine entsprechende Computer-Simulation) die Sprungantwort gemäß Bild 12.15 a). Zur Bestimmung der Abtastwerte pro Periode der gedämpften Regelgröße y(kT ) wird Bild 12.16 herangezogen:
332
12 Synthese diskreter Regelsysteme
Bild 12.16: Pole des geschlossenen Regelkreises in der z-Ebene mit d als Parameter
Der Winkel θ, den die Ursprungsgerade zum dominanten Pol des geschlossenen Regelkreises z = 0,4098 + j0,6623 mit der reellen Achse einschließt (diese Gerade entspricht einer Linie konstanter Frequenz in der s-Ebene), beträgt etwa 58,25◦ . Mit Hilfe dieses Winkels der dominanten Polstelle wird die Zahl der Abtastungen der Regelgröße pro Periode festgelegt: Wegen
360◦ cos θ k = cos θ k + θ
ergibt sich für θ = 58,25◦ die gesuchte Zahl der Abtastungen pro Zyklus zu 360◦ θ = 360◦ 58,25◦ = 6,18, was übrigens auch aus Bild 12.15 a) hervorgeht. Analog hierzu wird für T = 1 sec und K = 2 die Sprungantwort der Regelgröße im z-Bereich zu Y (z) =
1,2642z−1 1 ; −1 −2 1 − 0,1037z + 0,3679z 1 − z−1
die daraus resultierende Sprungantwort im diskreten Zeitbereich zeigt Bild 12.15 b). Weil jetzt die Ursprungsgerade zum dominanten Pol z = 0,05185 + j0,6043 mit der reellen Achse einen Winkel von 85,10◦ einschließt, siehe Bild 12.16, ergeben sich nur noch 360◦ 85,10◦ = 4,23
12.2 Regelkreis-Synthese mit Hilfe von Wurzelortskurven
333
Abtastungen der Regelgröße pro Periodendauer. Schließlich wird für T = 2 sec und K = 2 die z-transformierte Sprungantwort der Regelgröße zu Y (z) =
1 1,7294z−1 . 1 + 0,5941z−1 + 0,1353z−2 1 − z−1
Im Bild 12.15 c) ist die zugehörige Sprungantwort im diskreten Zeitbereich wiedergegeben. Aus Bild 12.16 ist zu ersehen, dass jetzt die Ursprungsgerade zur dominanten Polstelle z = −0,2971 + j0,2169 mit der reellen Achse einen Winkel von 143,87◦ einschließt. Daraus folgt, dass jetzt wegen 360o 143,87◦ = 2,5 nur noch 2,5 Abtastungen der Regelgröße pro Periode erfolgen; Bild 12.15 c) zeigt den entsprechenden zeitlichen Verlauf der Regelgröße y(kT ). Wie man leicht sieht, führt eine so geringe Abtastperiode nicht mehr zu einem akzeptablen Zeitverhalten. Beispiel 12.11: In diesem Beispiel wird eine systematische Vorgehensweise der Reglerkonzipierung in der z-Ebene bei der Vorgabe entsprechender Spezifikationen bezüglich des Regelverhaltens im Zeitbereich aufgezeigt. Ausgangsbasis ist der im Bild 12.17 skizzierte Regelkreis.
Bild 12.17: Diskrete Regelung eines Integrators mit Verzögerung
Die Aufgabenstellung besteht darin, einen diskreten Regler für eine integrierende Strecke in der z-Ebene so auszulegen, dass die dominanten Pole des geschlossenen Regelkreises eine Dämpfung von d = 0,5 und eine Ausregelzeit von ts = 2 sec aufweisen. Die Abtastperiode sei zu T = 0,2 sec festgelegt. Außerdem ist der zeitliche Verlauf der Regelgröße y(t) zu ermitteln, wenn der Sollwert w(t) den Einheitssprung ausführt. Für das Standardsystem zweiter Ordnung mit einem dominanten Polpaar des geschlossenen Kreises existiert zwischen der Ausregelzeit ts und der Eigenfrequenz ω0 der ungedämpften Schwingung der Zusammenhang (siehe Abschnitt 5.3, Gl. (5.15)) ts =
4 . ω0 d
Damit ergibt sich die Eigenfrequenz der ungedämpften Schwingung zu ω0 =
4 4 = = 4 1 s, ts d 2 sec ·0,5
334
12 Synthese diskreter Regelsysteme
die Eigenfrequenz der gedämpften Schwingung wird somit zu ωd = ω0 1 − d 2 = 4 1 − 0,52 = 3,4641 s. Auf Grund der vorgegebenen Abtastperiode von T = 0,2 sec wird die Abtastkreisfrequenz zu ωs =
2π 2π = = 10π = 31,421 s. T 0,2 sec
(Wie man sieht, liegen etwa neun Abtastwerte pro Periode der gedämpften Schwingung vor, somit ist eine Abtastperiode von 0,2 sec hinreichend klein.) Nun ist die Lage der gewollten dominanten Pole des geschlossenen Regelkreises in der z-Ebene zu bestimmen. Mit den bekannten Beziehungen
2πd ωd |z| = exp(−ω0 dT ) = exp − √ 1 − d 2 ωs und arg(z) = ω0 T werden Betrag und Phase der dominanten Polstelle zu
2π0,5
3,464 |z| = exp − · 2 31,42 1 − 0,5
= 0,6703
und arg(z) = 2π
3,464 = 0,6927 rad 31,42
bzw.
39,69◦ .
Damit kann eine dominante Polstelle des geschlossenen Regelkreises in der z-Ebene lokalisiert werden; sie ist im Bild 12.18 als Punkt P gekennzeichnet. (Die zweite dominante Polstelle läge im selben Abstand vom Ursprung und würde lediglich einen Phasenwinkel von −39,69◦ mit der positiven reellen Achse einschließen.) Die Koordinaten des Punktes P ergeben sich mit der komplexen Rechnung zu ◦
z = 0,6703 · ej39,69 = 0,5158 + j0,4281. Unter Berücksichtigung der Abtastperiode von T = 0,2 sec wird die Übertragungsfunktion der Strecke einschließlich des vorgeschalteten Halteglieds zu
−1 G(z) = 1 − z ·Z
1 ; s 2 (s + 2)
12.2 Regelkreis-Synthese mit Hilfe von Wurzelortskurven
335
Bild 12.18: Lokalisierung der dominanten Polstelle in der z-Ebene
unter Verwendung einer Korrespondenz-Tabelle wird dieser Ausdruck zu G(z) =
0,01758(z + 0,8760) . (z − 1)(z − 0,6703)
Im nächsten Schritt werden die Pole (p1 = 1; p2 = 0,6703) sowie die Nullstelle (z3 = −0,8760) von G(z) in die z-Ebene eingetragen, wie im Bild 12.18 gezeigt ist. Wenn nun der Punkt P der gewollte dominante Pol des geschlossenen Regelkreises in der z-Ebene sein soll, so muss entsprechend der Theorie der Wurzelortskurven die Summe der Winkel in diesem Punkt ±180◦ sein. Bis jetzt, also ohne Einfluss des Reglers, ergibt sich die Winkelsumme im Punkt P zu ϕ(z3 ) − [ϕ(p1 ) + ϕ(p2 )] = 17,10◦ − 138,52◦ + 109,84◦ = −231,26◦ . Damit ist die Winkeldifferenz gegeben zu −231,26◦ + 180◦ = −51,26◦ . Die Übertragungsfunktion des Reglers muss somit eine Phase von +51,26◦ liefern, wenn der Punkt P ein Punkt der Wurzelortskurve werden soll! Für die gegebene Strecke (Integrator mit Verzögerung) ist sicher ein PD-Regler mit Verzögerung mit der Übertragungsfunktion FR (z) = KR ·
z−α z−β
336
12 Synthese diskreter Regelsysteme
der am meisten geeignete Regler, wobei neben der Polstelle β und der Nullstelle α mit KR die (noch zu bestimmende) Verstärkung des Reglers gemeint sind. Wenn man sich bezüglich der Dimensionierung von α und β auf die konventionelle Methode festlegt, den langsamsten Pol der Strecke, hier p2 = 0,6703, mit der Nullstelle des Reglers z = −α zu kompensieren, dann liegt der noch verbleibende Pol des Reglers durch die Bedingung fest, dass er im dominanten Pol P einen Winkelbeitrag von +51,26◦ liefern muss. Aus dieser Bedingung ergibt sich die entsprechende Reglerpolstelle zu z = 0,2543, entsprechend β = −0,2543. Damit lautet bis jetzt die Übertragungsfunktion des Reglers FR (z) = KR ·
z − 0,6703 . z − 0,2543
Die noch unbekannte Reglerverstärkung KR wird mit Hilfe der Amplitudenbedingung ermittelt, wie im Folgenden gezeigt wird. Die Übertragungsfunktion des offenen Regelkreises lautet bekanntlich Fo (z) = FR (z)G(z) mit Fo (z) = KR ·
z − 0,6703 0,01758(z + 0,8760) · z − 0,2543 (z − 1) (z − 0,6703)
Fo (z) = KR ·
0,01758(z + 0,8760) . (z − 1) (z − 0,2543)
bzw.
Die unbekannte Reglerverstärkung KR ergibt sich aus der bekannten Amplitudenbedingung |FR (z)G(z)|z=0,5158+j0,4281 ≡ 1
zu
KR = 12,67.
Damit lautet die endgültige Übertragungsfunktion des so entwickelten Reglers FR (z) = 12,67 ·
z − 0,6703 . z − 0,2543
Um das Zeitverhalten des so konzipierten Reglers zu bestimmen, wird zunächst die Übertragungsfunktion des offenen Regelkreises in Zahlenwerten Fo (z) = FR (z)G(z) =
0,2227(z + 0,8760) 12,67 · 0,01758(z + 0,8760) = (z − 1) (z − 0,2543) (z − 1) (z − 0,2543)
und daraus die Übertragungsfunktion des geschlossenen Regelkreises Fw (z) =
Fo (z) Y (z) 0,2227z + 0,1951 = = 2 W (z) 1 + Fo (z) z − 1,0316z + 0,4494
berechnet. Die Ausgangsgröße Y (z) wird für
12.2 Regelkreis-Synthese mit Hilfe von Wurzelortskurven
W (z) =
1 1 − z−1
Y (z) =
z 0,2227z + 0,1951 · . z2 − 1,0316z + 0,4494 z − 1
337
zu
Bild 12.19: Sprungantwort des konzipierten Regelkreises
Bild 12.19 zeigt den zeitlichen Verlauf der rücktransformierten Ausgangsgröße zu den diskreten Abtastzeitpunkten. Das Diagramm weist entsprechend einer geforderten Dämpfung von 0,5 tatsächlich eine Überschwingweite von etwa 16 % und eine Ausregelzeit auf, die nur unwesentlich größer als 2 Sekunden ist. Somit erfüllt der so konzipierte Regler die geforderten Gütekriterien mit hinreichender Genauigkeit. Kommentar: Es soll zum Abschluss dieses Beispiels noch darauf verwiesen werden, dass durch das Hinzufügen einer Reglernullstelle auf der negativ reellen Achse in der Nähe des Ursprungs der s-Ebene die maximale Überschwingweite bei sprungförmiger Erregung angehoben wird. Eine solche Nullstelle in der s-Ebene kommt im z-Bereich auf der positiv reellen Achse zwischen 0 und 1 zu liegen. Somit wird durch das Hinzufügen einer Reglernullstelle auf der positiv reellen Achse zwischen 0 und 1 die maximale Überschwingweite angehoben.
338
12 Synthese diskreter Regelsysteme
Analog dazu erhöht eine Reglerpolstelle im s-Bereich auf der negativ reellen Achse in der Nähe des Ursprungs die Ausregelzeit. Dieser Pol wird in der z-Ebene auf die positiv reelle Achse zwischen 0 und 1 abgebildet. Somit erhöht ein Pol des geschlossenen Kreises in der z-Ebene zwischen 0 und 1 die Ausregelzeit. Ein Pol oder eine Nullstelle des geschlossenen Regelkreises zwischen 0 und −1 in der z-Ebene wirkt sich nur unwesentlich auf das Einschwingverhalten der Regelgröße aus.
12.3 Regelkreis-Synthese im Frequenzbereich Die Behandlung von Regelkreisen im Frequenzbereich, auch als Frequenzgang-Methode bezeichnet, spielt bei der Konzeption digitaler Regler dieselbe wesentliche Rolle wie bei der Dimensionierung kontinuierlicher Regler. Ihr besonderer Vorteil liegt darin begründet, dass es in ihrer technischen Anwendung eines erheblich geringeren mathematischen Aufwandes bedarf als beispielsweise bei der Verwendung von Wurzelortskurven. Wesentlich ist jedoch dabei, dass grundsätzlich vor dem Abtaster ein Tiefpass eingebaut ist, damit zunächst die (störenden) Seitenbänder weggefiltert werden. Erst damit verbleiben Amplitude und Phase die einzigen Größen, mit denen sich der Anwender auseinander zu setzen hat. 12.3.1 Bilineare Transformation und w-Ebene Bevor die Frequenzgang-Methode erfolgreich auf diskrete Systeme angewandt werden kann, sind einige Modifikationen in der z-Ebene notwendig. Weil die komplexe Frequenz jω in der z-Ebene als z = ejωT erscheint, geht zunächst der Vorteil der logarithmischen Darstellung vollständig verloren. Die z-Transformation bildet bekanntlich den Frequenzbereich −jωs 2 ≤ jω ≤ +jωs 2 der linken s-Ebene in den Einheitskreis der z-Ebene ab. Konventionelle FrequenzgangMethoden, die von der gesamten linken s-Ebene ausgehen, können somit nicht in die z-Ebene abgebildet werden. Diese Schwierigkeit kann jedoch durch eine Abbildung der z-Ebene in eine neue Ebene, die so genannte w-Ebene, umgangen werden. Diese Transformation, allgemein als w-Transformation bezeichnet, ist eine bilineare Abbildung und definiert durch den Zusammenhang " # 1+ T 2 w " # , z= (12.33) 1− T 2 w wobei T die bekannte Abtastperiode des diskreten Regelkreises ist. Durch die Umformung einer im z-Bereich gegebenen Übertragungsfunktion in eine rationale Funktion in w können Frequenzgang-Methoden auf diskrete Regelkreise erweitert werden. Durch Auflösen der Gl. (12.33) nach w erhält man die dazu inverse Beziehung w=
2 z−1 . T z+1
(12.34)
12.3 Regelkreis-Synthese im Frequenzbereich
339
(Wie man sieht, wurde diese Transformation bereits im Rahmen der Betrachtung der Stabilität diskreter Regelkreise eingeführt.) Durch die z-Transformation und die nachfolgende w-Transformation wird der so genannte Primärstreifen mit 0 ≤ jω ≤ jω2s der linken s-Halbebene zunächst in das Innere des Einheitskreises der z-Ebene und dieser wiederum in die gesamte linke w-Halbebene abgebildet. Die beiden Abbildungsprozeduren sind im Bild 12.20 angedeutet. (Dabei ist zu beachten, dass in der s-Ebene nur der Primärstreifen betrachtet wird.) Der Ursprung der z-Ebene wird in den Punkt w = −2 T der w-Ebene abgebildet. Außerdem kann man leicht feststellen, dass der Bereich 0 ≤ jω ≤ jωs 2 der Imaginärachse der s-Ebene in den Bereich +1 ≤ z ≤ −1 entlang des Einheitskreises der z-Ebene abgebildet wird und dieser wiederum gemäß Gl. (12.34) in den Bereich 0 ≤ w ≤ ∞ entlang der Imaginärachse der w-Ebene läuft. Obwohl jedoch die linke w-Halbebene mit der linken s-Halbebene und die Imaginärachse der w-Ebene mit der Imaginärachse der s-Ebene korrespondiert, gibt es trotzdem Unterschiede zwischen beiden komplexen Ebenen. Der maßgebliche Unterschied besteht darin, dass der Frequenzbereich − ω2s ≤ ω ≤ ω2s der s-Ebene in den fiktiven Frequenzbereich −∞ < υ < +∞ der w-Ebene abgebildet wird. Wenn aber die Übertragungsfunktion F (z) mit Hilfe der w-Transformation in die neue Funktion F (w) transformiert worden ist, dann kann sie wie jede konventionelle Übertragungsfunktion, jedoch jetzt im w-Bereich, behandelt werden. Somit können dann die bekannten Frequenzgang-Techniken in der w-Ebene zur Untersuchung und Dimensionierung digitaler Regelkreise angewandt werden.
Bild 12.20: Abbildung von der s- in die z-Ebene und von der z- in die w-Ebene Primärstreifen der linken s-Halbebene; Abbildung des Primärstreifens in die z-Ebene; Abbildung des Einheitskreises der z-Ebene in die w-Ebene
Obwohl die w-Ebene der s-Ebene geometrisch ähnlich ist, sollte jedoch nicht übersehen werden, dass die Frequenzachse der w-Ebene im Vergleich zur s-Achse verschoben ist. Im Folgenden wird deshalb gezeigt, in welchem Zusammenhang die fiktive Frequenz ν der wEbene mit der tatsächlichen Frequenz ω der s-Ebene steht:
340
12 Synthese diskreter Regelsysteme
Mit w = jν folgt jν = jν =
2 ejωT − 1 2 z − 1 = T z + 1 z=ejωT T ejωT + 1
2 ejωT / 2 − e−jωT / 2 2 ωT = j tan T ejωT /2 + e−jωT /2 T 2
und daraus der gesuchte Zusammenhang
ωT 2 . ν = tan T 2
(12.35)
Mit Gl. (12.35) wird bestätigt, dass der aktuelle Frequenzbereich − ω2s ≤ ω ≤ 0 in den Bereich der fiktiven Frequenz −∞ ≤ ν ≤ 0 und die Frequenz 0 ≤ ω ≤ ω2s in den Bereich 0 ≤ ν ≤ +∞ abgebildet wird. Außerdem ermöglicht diese Gleichung die Berechnung der fiktiven Frequenz ν aus der aktuellen Frequenz ω. Wenn beispielsweise die Bandbreite mit ωb spezifiziert wird, ergibt sich die korrespondierende Bandbreite in der w-Ebene zu
ωb T . νb = 2 T · tan 2 Für kleine Frequenzen, also ωT 2 1, folgt aus Gl. (12.35) ν ≈ ω. Dies hat wiederum zur Konsequenz, dass für kleine ωT -Werte die Übertragungsfunktionen F (s) und F (w) einander ähnlich sind. Beispiel 12.12: Zur Reihenschaltung aus einem Halteglied und einer Strecke erster Ordnung entsprechend Bild 12.21 ist für eine Abtastperiode von T = 0,1 sec die Übertragungsfunktion F (w) zu bestimmen.
Bild 12.21: Kombination aus Halteglied und System erster Ordnung
Die z-Transformierte der Schaltung im Bild 12.21 lautet bekanntlich
1 − e−sT 10 G(z) = Z s s + 10
= 1−z
−1
10 ·Z s(s + 10)
=
0,6321 . z − 0,3679
12.3 Regelkreis-Synthese im Frequenzbereich
341
Durch Anwenden der bilinearen Transformation " # 1+ T 2 w 1 + 0,05w " # = z= 1 − 0,05w 1− T 2 w wird G(z) des vorgegebenen Beispiels nach G(w) transformiert: G(w) =
0,6321 0,6321(1 − 0,05w) = 1 + 0,05w 0,6321 + 0,06840w − 0,3679 1 − 0,05w
bzw. vereinfacht G(w) = 9,241
1 − 0,05w . 9,241 + w
Interessanterweise wird durch die w-Transformation die ursprüngliche Polstelle der Strecke vom Punkt s = −10 in den Punkt w = −9, 241 verlagert und die Verstärkung von 10 auf 9,241 modifiziert. Außerdem hat G(w) für w = 20 eine Nullstelle, während die Strecke im Laplace-Bereich keine solche aufzuweisen hat. Zudem ist zu sehen, dass offenbar der Zusammenhang lim G(w) = lim F (s) = lim
w→0
s→0
s→0
10 s + 10
gilt. Diese Beziehung ist häufig für eine globale Überprüfung bei der Transformation von G(s) nach G(w) sehr nützlich. Zusammenfassend lässt sich feststellen, dass es sich bei der wTransformation um eine bilineare Transformation handelt, die das Innere des Einheitskreises der z-Ebene in die linke w-Ebene abbildet. Im interessierenden Gebiet sind sich die w- und die s-Ebene ähnlich; siehe hierzu obiges Beispiel. 12.3.2 Bode-Diagramme im w-Bereich Durch die Anwendung der w-Transformation wird es möglich, die bereits auf dem Gebiet der klassischen analogen Regelungstechnik bekannten Methoden der Regelkreis-Synthese im Bode-Diagramm auf diskrete Systeme zu übertragen. Für diskrete Systeme besteht jetzt das Bode-Diagramm ebenso aus dem Amplitudengang |F (jν)| und dem Phasengang ϕ(ν); das heißt also, es wird lediglich die ursprüngliche Frequenz ω bei analogen Systemen mit der transformierten Frequenz ν bei diskreten Systemen ersetzt. Die Dimensionierung des Reglers mit Hilfe des Bode-Diagramms hat folgende wesentliche Vorteile: •
Die Asymptote an den Amplitudengang bei kleinen Frequenzen ermöglicht die (bereits bekannte) Bestimmung der Fehlerkonstanten Kp , Kv und Ka ;
•
Spezifikationen bezüglich des transienten Verhaltens im Zeitbereich können in Abhängigkeit des Phasenrandes und des Amplitudenrandes in den Frequenzbereich übertragen werden;
342
•
12 Synthese diskreter Regelsysteme
die aktuellen Werte bez. des Amplituden- und Phasenrandes können im Bode-Diagramm direkt abgelesen werden.
Grundsätzliche Vorgehensweise bei der Regelkreis-Synthese im Bode-Diagramm: Bezugnehmend auf Bild 12.22 läuft die Reglerdimensionierung in der w-Ebene in folgenden Schritten ab:
Bild 12.22: Digitaler Standard-Regelkreis
1. Zunächst ist aus der Übertragungsfunktion des Haltegliedes und der kontinuierlichen Strecke die zugehörige z-Transformierte G(z) zu bestimmen. Mit T w 2 z= T 1− w 2 1+
ist daraus die entsprechende w-Transformierte G(w) = G(z)|z= 1+wT /2
1−wT /2
aufzustellen. Bei der Festlegung der Abtastperiode liegt man auf der sicheren Seite, wenn die Regelgröße mit dem zehnfachen Wert der Bandbreite des geschlossenen Regelkreises abgetastet wird. 2. Substitution von w = jν in G(w) und Konstruktion des Bode-Diagramms von G(jν) wie bei kontinuierlichen Systemen. 3. Bestimmung der Fehlerkonstanten bzw. des Phasen- und Amplitudenrandes aus dem unter 2. konstruierten Bode-Diagramm. 4. Unter der vorläufigen Annahme, dass die Verstärkung des diskreten Reglers FR (w) bei niedrigen Frequenzen eins ist, wird die Gesamtverstärkung für eine geforderte Fehlerkonstante ermittelt. Im Anschluss daran sind, wie bei der Regelkreis-Synthese kontinuierlicher Systeme, die Pole und Nullstellen des diskreten Reglers festzulegen. Damit ist jetzt die Übertragungsfunktion Fo (w) = FR (w)G(w) des offenen Regelkreises gegeben.
12.3 Regelkreis-Synthese im Frequenzbereich
343
5. Im nächsten Schritt wird die Übertragungsfunktion des Reglers FR (w) mit Hilfe der bilinearen Transformation w=
2 z−1 T z+1
in den z-Bereich FR (z) = FR (w)|w= 2
z−1 T z+1
transformiert. 6. Bestimmung der Differenzengleichung als Basis zum Regelalgorithmus aus der Übertragungsfunktion FR (z) des diskreten Reglers. Dabei ist jedoch zu beachten, dass die Frequenzachse der w-Ebene verschoben ist. Bekanntlich gilt zwischen der fiktiven Frequenz ν und der tatsächlichen Frequenz ω der Zusammenhang ν=
2 ωT tan . T 2
Wenn also beispielsweise eine Bandbreite ωb für den zu realisierenden Regelkreis spezifiziert wurde, dann muss dieser Regelkreis im Bode-Diagramm auf eine Bandbreite von
2 ωb T νb = tan T 2 getrimmt werden. Die erläuterte Vorgehensweise soll im folgenden Beispiel ausführlich aufgezeigt werden. Beispiel 12.13: Vorgegeben sei der im Bild 12.23 skizzierte Regelkreis, bei dem eine integrierende Strecke mit Verzögerung so geregelt werden soll, dass sich ein Phasenrand von 50◦ und einAmplitudenrand von mindestens 10 dB (entsprechend einer Dämpfung von d = 0,5) ergibt. Außerdem soll bei einer Abtastperiode von T = 0,2 sec die Geschwindigkeitsfehlerkonstante Kv den Wert 2 sec−1 annehmen. Die Regelkreis-Synthese ist in der w-Ebene vorzunehmen.
Bild 12.23: Regelung einer integrierenden Strecke
344
12 Synthese diskreter Regelsysteme
Zunächst ist die z-transformierte Übertragungsfunktion G(z) aus der Zusammenfassung der Strecke und dem vorgeschalteten Halteglied zu bestimmen:
G(z) = Z
1 − e−sT 1 s s(s + 1)
= 1 − z−1 · Z
1 ; s 2 (s + 1)
unter Verwendung einer Korrespondenz-Tabelle wird diese Gleichung zu G(z) = 0,01873
(z + 0, 9356) . (z − 1)(z − 0, 8187)
Im nächsten Schritt wird G(z) unter Verwendung der bilinearen Transformation " # 1+ T 2 w 1 + 0,1w " # = z= 1 − 0,1w 1− T 2 w in den w-Bereich transformiert:
1 + 0,1w 0,01873 + 0,9356 1 − 0,1w
G(w) =
1 + 0,1w 1 + 0,1w −1 − 0,8187 1 − 0,1w 1 − 0,1w
(300,6 + w)(1 − 0,1w) w(0,997 + w)
w w +1 1− 300,6 10
G(w) = . w +1 w 0,997
G(w) = 0,003316
Im gegebenen Beispiel soll ein PDT1 -Regler mit der Übertragungsfunktion 1+w a FR (w) = K 1+w b zur Anwendung kommen. Damit wird die Übertragungsfunktion des offenen Regelkreises zu 1+w a Fo (w) = FR (w)G(w) = K 1+w b
w w +1 1− 300,6 10
. w w +1 0,997
12.3 Regelkreis-Synthese im Frequenzbereich
345
Mit der Spezifikation Kv = 2 sec−1 und der Beziehung Kv = lim w Fo (w) erhalten wir im w→0
gegebenen Fall bereits
K 1+w a · Kv = lim w w→0 1+w b
w w +1 1− 300,6 10 = K = 2.
w +1 w 0,997
Damit liegt bereits die Reglerverstärkung mit K = 2 fest. Bild 12.24 zeigt nun das BodeDiagramm des betrachteten Systems.
Bild 12.24: Bode-Diagramm des gegebenen Regelkreises
Nebenbei sei angemerkt, dass die Amplituden- und Phasengänge durch eine Rechnersimulation entstanden sind und deshalb nicht die Geraden-Näherungen, sondern die kontinuierlichen Verläufe eingezeichnet werden konnten. (Außerdem ist es nützlich, darauf zu verweisen, dass die Nullstelle bei ν = 10 Phasennacheilung bewirkt.) Der bereits bekannte Amplitudengang der Strecke ist mit As (ν) bezeichnet, der entsprechende Phasengang mit ϕs (ν). Die in der Aufgabenstellung gegebenen Spezifikationen machen einen Phasenrand von 50◦ und einen Amplitudenrand von mindestens 10 dB erforderlich. Mit diesen Vorgaben können die noch unbekannten Reglerparameter a und b ermittelt werden: Entsprechend einer bewährten Vorgehensweise kann mit der Nullstelle des Reglers der langsamste Pol der Strecke kompensiert werden. Also wird die Reglernullstelle zu 0,997
346
12 Synthese diskreter Regelsysteme
gewählt. Mit diesem, bis jetzt vorhandenen Regler wird die Durchtrittsfrequenz zu ν ≈ 2 bei einer Phase des offenen Regelkreises von ϕo (ν) ≈ −162◦ . Um den geforderten Phasenrand von 50◦ zu erreichen, muss bei der Durchtrittsfrequenz die Phase des offenen Regelkreises um 32◦ angehoben werden. Die noch unbekannte Verzögerungszeitkonstante des Reglers ist deshalb so zu lokalisieren, dass der geforderte Phasenrand erreicht wird. Nach einigen Versuchen kann man feststellen, dass der Reglerpol an der Stelle 3,27 den geforderten Phasenrand erfüllt. Damit wird die endgültige Übertragungsfunktion des Reglers zu 1 + w 0,997 . FR (w) = 2 1 + w 3,27 Jetzt können in das Bode-Diagramm der Amplitudengang AR (ν) und der Phasengang ϕR (ν) des Reglers sowie des offenen Regelkreises Ao (ν), ϕo (ν) eingetragen werden. Im Bild 12.24 ist auch zu sehen, dass durch die geschilderte Vorgehensweise der geforderte Phasen- bzw. Amplitudenrand eingehalten wird. Im Interesse der Bestimmung der Differenzengleichung des Reglers wird mit Hilfe der bilinearen Transformation w=
2 z−1 z−1 2 z−1 = = 10 T z+1 0,2 z + 1 z+1
die Übertragungsfunktion FR (w) des Reglers in den z-Bereich rücktransformiert:
z−1 1 10 1+ 0,997 z+1
FR (z) = 2 z−1 1 10 1+ 3,27 z+1 bzw. ausgerechnet zu
FR (z) = 5,436
z − 0,8187 . z − 0,5071
Unter Verwendung dieser Übertragungsfunktion kann natürlich sofort die entsprechende Differenzengleichung als Basis des Regelalgorithmus angeschrieben werden. Um eine abschließende Überprüfung der geforderten Spezifikationen durchführen zu können, soll noch die Wurzelortskurve des konzipierten Regelkreises im z-Bereich konstruiert werden. Hierzu wird natürlich zunächst die Übertragungsfunktion des offenen Regelkreises Fo (z) = FR (z)G(z) =
5,436 (z − 0,8187) 0,01873 (z + 0,9356) (z − 0,5071) (z − 1) (z − 0,8187)
bzw. Fo (z) = 0,1018
z + 0,9356 (z − 1) (z − 0,5071)
benötigt. Bild 12.25 zeigt die entsprechende Wurzelortskurve des konzipierten Regelkreises.
12.3 Regelkreis-Synthese im Frequenzbereich
347
Anhand dieses Bildes lassen sich folgende Feststellungen treffen: • •
Die Pole des geschlossenen Regelkreises liegen, wie gefordert, auf der Kurve mit konstanter Dämpfung d = 0,5. Das konzipierte System erfüllt die Spezifikationen •
Phasenrand 50◦ ,
Amplitudenrand ≥ 10 dB, Geschwindigkeitsfehlerkonstante Kv = 2 sec−1 Für das System wurde eine Abtastperiode von T = 0,2 sec gewählt. Aus der Wurzelortskurve ist zu sehen, dass das zu regelnde Signal 360◦ 25,15◦ = 14,3-mal pro Periode abgetastet wird. Der bereits früher erwähnte Erfahrungswert, nämlich mindestens zehnmal innerhalb einer Periode abzutasten, ist damit erfüllt. • •
•
Bild 12.25: Wurzelortskurve des dimensionierten Regelkreises im z-Bereich
12.3.3 Zur Wahl der Abtastrate Dem aufmerksamen Leser ist sicher aufgefallen, dass in fast sämtlichen Beispielen der vorangegangenen Kapitel eine ganz bestimmte Abtastrate kommentarlos festgelegt wurde, ohne eine Begründung für die jeweilige Wahl der Abtastperiode zu liefern. Die Wahl der Abtastrate bei digitalen Regelkreisen ist zunächst immer ein Kompromiss zwischen dem mechanischen Aufwand und der Qualität der Regelung. Eine kleine Abtastrate
348
12 Synthese diskreter Regelsysteme
bedeutet, dass dem Regelalgorithmus relativ viel Zeit zur Berechnung der Stellgröße zur Verfügung steht. Dadurch können langsame Computer und langsame A/D- und D/A-Wandler eingesetzt werden, was sich natürlich unmittelbar in den Beschaffungskosten auswirkt. Eine hohe Abtastrate erfordert in den meisten Fällen eine große Wortlänge, was sich natürlich negativ auf die Anschaffungskosten auswirkt. Diese Argumente legen die Vermutung nahe, dass in entsprechenden Fällen eine möglichst niedrige Abtastrate gewählt werden sollte. Wenn man sich allerdings für eine möglichst hohe Abtastrate entscheidet, so hat dies zur Konsequenz, dass die Welligkeit der Regelgröße mit zunehmender Abtastrate kleiner wird. In entsprechend günstigen Fällen erreicht die digitale Regelung eine Qualität, deren Zeitverhalten mit der analogen Regelung durchaus vergleichbar ist. Der Mindestwert der Abtastperiode Die absolute untere Grenze der Abtastperiode basiert auf dem Shannon’schen Abtasttheorem, das bereits im Abschnitt 11.2.2 diskutiert wurde. In diesem Theorem kommt zum Ausdruck, dass zur eindeutigen Rekonstruktion eines unbekannten kontinuierlichen Signals eine Abtastfrequenz gewählt werden muss, die mindestens doppelt so groß ist wie die höchste in dem Signal auftretende Frequenzkomponente. Wenn also für die Regelgröße eine bestimmte Bandbreite ωb gefordert wird, so muss die Abtastfrequenz ωs mindestens doppelt so groß wie die geforderte Bandbreite gewählt werden; das heißt, es muss gelten ωs > 2. ωb
(12.36)
Falls trotzdem eine Abtastrate gewählt wird, bei der obige Gleichung nicht erfüllt ist, tritt das bereits bekannte Aliasing-Phänomen auf. Die Konsequenz daraus wäre eine bemerkenswert schlechte Dynamik des sonst vielleicht gut konzipierten Regelkreises. Zeitverhalten und Welligkeit der Regelgröße Die Gl. (12.36) liefert die untere Grenze der Abtastrate, die wegen der oben genannten Gründe keinesfalls unterschritten werden darf. In praktischen Anwendungsfällen würde jedoch eine solch niedrige Abtastrate ein nicht akzeptables Zeitverhalten der Regelgröße nach sich ziehen. Wenn beispielsweise eine Anstiegszeit der Regelgröße von einer Sekunde gefordert wird (entsprechend einer Bandbreite des geschlossenen Regelkreises von 0,5 Hz), so hat sich im Interesse einer nicht zu großen Welligkeit der Regelgröße und in der Realität immer begrenzter Stellenergie eine Abtastrate zwischen 3 Hz und 20 Hz bewährt. Somit ist als pauschale Regel ein Verhältnis zwischen der Bandbreite und der Abtastrate von 6≤
ωs < 40 ωb
(12.37)
empfehlenswert. Es sollte jedoch nicht unerwähnt bleiben, dass die zulässige Welligkeit vom jeweiligen Anwendungsfall abhängt und darüber hinaus eine höchst subjektive Frage ist. Die Stellgrößen dürfen beispielsweise für einen Elektromotor relativ große Diskontinuitäten aufweisen, während für hydraulische Stellglieder (auf Grund der großen Viskosität) große Signalsprünge möglichst zu vermeiden sind.
12.3 Regelkreis-Synthese im Frequenzbereich
349
In Ergänzung zur Welligkeit der Stell- und Regelgrößen besteht in vielen Fällen ein Interesse an einer möglichst geringen Verzugszeit zwischen einer Sollwertänderung und der daraus resultierenden Änderung der Regelgröße. Für Regelkreise mit manuell vorzugebendem Sollwert sollte im Hinblick auf eine möglichst geringe Reaktionszeit die Abtastperiode nur einen Bruchteil der Anstiegszeit ausmachen. Wenn man pauschal davon ausgeht, dass der zeitliche Verzug höchstens 10 % der spezifizierten Anstiegszeit erreichen darf, so sollte ein Erfahrungswert von ωs ≥ 20 ωb
(12.38)
eingehalten werden. Schließlich sollte man noch die häufig vorkommende Situation in Erwägung ziehen, dass das Messsignal mehr oder weniger stark verrauscht ist. Damit der Anwender zur Selektion des Originalsignals nicht gezwungen ist, eine entsprechend hohe Abtastrate zu wählen, ist es empfehlenswert, vor dem Abtaster ein so genanntes Anti-Aliasing-Filter (im einfachsten Fall ein Tiefpass erster Ordnung) einzubauen, um die hochfrequenten, von den Störungen herrührenden Oberwellen wegzufiltern. 12.3.4 Zusammenfassung und Ausblick Die analoge Regelungstechnik beruht auf der Analyse dynamischer Systeme unter der Verwendung von Differenzialgleichungen bzw. von Differenzialgleichungssystemen, wobei die Eingangs/Ausgangssignale der entsprechenden Systeme vorwiegend im Frequenz- oder im Laplace-Bereich untersucht werden. Mit der Einführung kostengünstiger Mikrorechner und Prozessrechner zur Regelung technischer Prozesse hat sich in den letzten Jahren der Aufgabenschwerpunkt des Regelungstechnikers immer mehr von der klassischen Signalverarbeitung in die Richtung moderner Informationsverarbeitung verlagert. Dadurch haben sich zwangsweise auch die Aufgaben des Regelungstechnikers auf die neueren Gebiete der regelungstechnischen Programmierung und der Prozessdatenverarbeitung verschoben. Der neueste Trend auf dem Gebiet der modernen Regelungstechnik ist die objektbasierte Regelung, die vor allem durch die Einführung von Mikrorechnern möglich geworden ist. Sie besteht in der Regelung von Systemen auf der Basis von Fuzzy-Elementen und der Regelung mit Hilfe des Konzeptes der künstlichen neuronalen Netze. Die Einführung dieser neuen Technologien setzt jedoch nach wie vor die Grundlagen der analogen und digitalen Regelungstechnik voraus und erfordert darüber hinaus einen hohen Kenntnisstand auf dem Gebiet der modernen Techniken der Datenerfassung, der Programmierung sowie der Simulation angewandter Regelprozesse.
Anhang I I.1
Die Laplace-Transformation
Die Laplace-Transformation ist eine Operatorenmethode und hat sich gerade im Hinblick auf regelungstechnische Anwendungen u.a. zur Lösung linearer Differenzialgleichungen als sehr nützliches Werkzeug erwiesen. Mit Hilfe der Laplace-Transformation können verschiedene Standard-Funktionen, wie etwa die gedämpfte und die ungedämpfte Sinusfunktion, die Exponentialfunktion etc., in lineare Funktionen der komplexen Variablen s transformiert werden. Ebenso können die Differenziation und die Integration im Zeitbereich durch algebraische Operationen in der komplexen Ebene ersetzt werden. Somit wird eine lineare Differenzialgleichung mit Hilfe der Laplace-Transformation in eine algebraische Gleichung des komplexen Operators s transformiert. Die Lösung dieser algebraischen Gleichung liefert die Lösung der ursprünglichen Differenzialgleichung. I.1.1
Definition der Laplace-Transformation
Die Laplace-Transformierte einer gegebenen reellen Zeitfunktion f (t) mit f (t) = 0 für t<0, welche die Bedingung
∞ f (t)e−σ t dt < ∞ 0
für einen beliebigen reellen Faktor σ erfüllt, ist definiert zu
∞ L [f (t)] = F (s) =
f (t) · e−st dt.
(I.1)
0
Die komplexe Variable s = σ + jω wird als Laplace-Operator bezeichnet. Die Definitionsgleichung (I.1) wird auch einseitige Laplace-Transformation genannt, weil sich die Integrationsgrenzen von 0 bis ∞ erstrecken, d.h. negative Zeiten ausgeschlossen sind. Diese Voraussetzung bedeutet jedoch keine Einschränkung bez. der Anwendbarkeit auf technische Systeme, weil die Bezugszeit bei der Betrachtung reeller Zeitfunktionen in der Regel mit t = 0 identifiziert wird. Weiterhin kann für jedes technische System, das zum Zeitpunkt t = 0 stimuliert wird, die Reaktion des betrachteten Systems frühestens zum selben Zeitpunkt beginnen; man spricht hier im Übrigen auch von so genannten kausalen Systemen. Der umgekehrte Prozess, d.h. die Bestimmung der Zeitfunktion f (t) aus der Laplace-Transformierten F (s), wird als inverse Laplace-Transformation bezeichnet und durch die symbolische Schreibweise L−1 [F (s)] = f (t) angedeutet.
I.1 Die Laplace-Transformation
I.1.2
351
Wichtige Theoreme der Laplace-Transformation
Die Anwendung der Laplace-Transformation vereinfacht sich in sehr vielen Fällen, wenn der Anwender die Rechenregeln der Laplace-Transformation kennt. Diese Regeln sollen im Folgenden kurz aufgezeigt werden. Theorem 1: Linearitätsregel L [α · f1 (t) + β · f2 (t)] = α · F1 (s) + β · F2 (s) wobei α und β beliebige Konstanten sind. Dieses Theorem bedarf insofern keines mathematischen Beweises, weil die jeweilige Konstante entsprechend der Gl. (I.1) vor das Laplace-Integral gezogen werden kann und dann unter dem Integral nur die ursprüngliche Zeitfunktion f1 (t) bzw. f2 (t) verbleibt. Theorem 2: Differenziationsregel Die Laplace-Transformierte der Ableitung einer Funktion f (t) lautet df (t) L = sF (s) − f (0), dt
(I.2)
wobei f (0) der Anfangswert der Funktion f (t), also der Funktionswert an der Stelle t = 0 ist. Nachweis: Die partielle Integration des Laplace-Integrals führt zu
∞ f (t)e 0
−st
∞ ∞ df (t) e−st e−st dt = f (t) − dt. −s 0 dt −s 0
Aus obiger Gleichung folgt sofort f (0) 1 df (t) F (s) = + L ; s s dt durch Erweiterung mit s wird diese Gleichung zu df (t) L = sF (s) − f (0), dt womit der Beweis für die Richtigkeit der Gl. (I.2) geliefert ist. Durch analoge Vorgehensweise erhält man die zweite Ableitung der Funktion f (t) zu
d2 f (t) L = s 2 F (s) − sf (0) − f˙(0), dt 2
352
Anhang I
wobei f˙(0) die erste Ableitung der Funktion f (t) an der Stelle t = 0 ist. In allgemeiner Form wird die n-te Ableitung der Zeitfunktion f (t) im Laplace-Bereich zu (n−2) (n−1) dn f (t) n n−1 n−2 ˙ f f (0). f (0) − . . . s = s F (s) − s f (0) − s (0) − L dt n
Für den Fall, dass sämtliche Anfangswerte der Zeitfunktion f (t) und ihre entsprechenden Ableitungen null sind, wird die Laplace-Transformierte der n-ten Ableitung der Zeitfunktion f (t) zu s n F (s). Theorem 3: Integrationsregel Die Laplace-Transformierte der zeitlichen Integration der Zeitfunktion f (t) ist die LaplaceTransformierte der Funktion f (t), dividiert durch s, d.h. L
f −1 (0) F (s) + , f (t)dt = s s
wobei F (s) = L [f (t)] und f −1 (0) =
6
(I.3)
f (t) dt an der Stelle t = 0 ist.
Im Folgenden soll die Gültigkeit der Integrationsregel der Gleichung (I.3) nachgewiesen werden: Die partielle Integration des Laplace-Integrals liefert
∞ L [f (t) dt] =
f (t) dt e
−st
dt =
0
=
1 s
∞ ∞ e−st e−st f (t) dt − f (t) dt −s 0 −s
0
f (t)dt
+ t=0
1 s
∞
f (t)e−st dt =
f −1 (0) F (s) + . s s
0
Wie man leicht aus Gl. (I.3) erkennen kann, wird die Integration im Zeitbereich zu einer Division mit s im Laplace-Bereich. Wenn der Anfangswert des Integranden null ist, wird die Laplace-Transformierte des Integrals der Zeitfunktion f (t) zu F s(s) . Theorem 4: Komplexe Differenziation Wenn die Zeitfunktion f (t) transformierbar ist, dann gilt, mit Ausnahme an den Polstellen von F (s), der Zusammenhang L [tf (t)] = −
dF (s) , ds
mit
F (s) = L [f (t)] .
(I.4)
Dieser Zusammenhang wird als „komplexes Differenziationstheorem“ bezeichnet. Zum Nachweis der Gültigkeit dieses Theorems wird folgendermaßen vorgegangen:
I.1 Die Laplace-Transformation
∞ L [tf (t)] =
tf (t)e
353
−st
∞ dt = −
0
d d " −st # dt = − e f (t) ds ds
0
∞ 0
f (t)e−st dt =−
d F (s); ds
damit ist bereits der Nachweis des Theorems gemäß Gl. (I.4) geliefert. Analog erhält man mit der Definition tf (t) = g(t) . d2 d d d 2 L t f (t) = L [tg(t)] = − G(s) = − − F (s) = (−1)2 2 F (s) ds ds ds ds =
d2 F (s). ds 2
In allgemeiner Form wird Gl. (I.4) zu dn F (s) L t n f (t) = (−1)n (n = 1, 2, 3, . . .). ds n Theorem 5: Dämpfungssatz Korrespondiert eine Zeitfunktion f (t) mit der Laplace-Transformierten F (s), so entspricht der gedämpften Zeitfunktion f (t) · e−αt die Laplace-Transformierte
L f (t)e
−αt
∞ =
f (t)e−(α+s)t dt = F (s + α).
(I.5)
0
Wie man leicht sehen kann, hat die Multiplikation der Zeitfunktion f (t) mit e−αt den Effekt, dass in der entsprechenden Laplace-Transformierten F (s) = L [f (t)] der Operator s lediglich mit (s + α) zu ersetzen ist. Theorem 6: Ähnlichkeitssatz Der Ähnlichkeitssatz erlaubt es, aus der Laplace-Transformierten der Zeitfunktion f (t) die Laplace-Transformierte der Zeitfunktion f (at) zu berechnen. Zur Herleitung des Satzes greifen wir zurück auf die Definition der Laplace-Transformation und finden
∞ L [f (at)] =
f (at) e
−st
∞ dt =
0
f (at) e−ast /a d (at) a.
0
Mit der Definition einer neuen Integrationsvariablen τ = at folgt 1 L [f (at)] = a
∞ 0
f (τ ) e−sτ /a dτ.
(I.6)
354
Anhang I
Das Integral
6∞
f (τ )e−sτ /a dτ unterscheidet sich von dem in der Definitionsgleichung der
0
Laplace-Transformation auftretenden Integral
6∞
f (t)e−st dt nur dadurch, dass der Parameter
0
s mit s / a ersetzt worden ist. Da die anders lautende Integrationsvariable auf das bestimmte Integral keinen Einfluss hat, wird aus Gl. (I.6) L [f (at)] =
s 1 ·F . a a
(I.7)
Als Beispiel seien die Funktionen f (t) = e−t und f (t 5) = e−0,2t betrachtet. Mit Hilfe −t 1 des Laplace-Integrals erhält man L [f (t)] = L e = F (s) = s+1 . Unter Verwendung des Ähnlichkeitssatzes wird . L f (t 5) = L e−0,2t = 5F (5s) =
5 . 5s + 1
Theorem 7: Endwertsatz Mit dem Endwertsatz lässt sich aus der Bildfunktion F (s) ohne Kenntnis der Originalfunktion f (t) eine Aussage über den Endwert der Zeitfunktion lim f (t) machen. Der Endwertsatz kann folgendermaßen definiert werden: Falls f (t) und F (s) die Laplace-Transformierte von f (t) ist, so gilt
t→∞ df (t) dt Laplace-transformierbar sind und
lim f (t) = lim sF (s).
t→∞
s→0
(I.8)
Zum Nachweis dieses Theorems lassen wir in der Definitionsgleichung (I.1) der LaplaceTransformation für die Ableitung der Zeitfunktion f (t) den Laplace-Operator gegen null streben und erhalten
∞ lim
s→0
df (t) · e−st dt = lim [sF (s) − f (0)]. s→0 dt
0
Wegen lim e−st = 1 erhalten wir s→0
∞
d f (t) = f (t)|∞ 0 = f (∞) − f (0) = lim sF (s) − f (0); s→0 dt
0
aus dieser Gleichung folgt schließlich f (∞) = lim f (t) = lim sF (s). t→∞
s→0
I.1 Die Laplace-Transformation
355
Der Endwertsatz besagt, dass das stationäre Verhalten der Zeitfunktion f (t) dem Produkt sF (s) in der Umgebung s = 0 entspricht. Es ist somit möglich, den Grenzwert der Funktion f (t) für t → ∞ direkt aus F (s) zu berechnen. Beispiel I.1: Gegeben sei L [f (t)] = F (s) =
1 s(s+1) ;
gesucht ist der Grenzwert lim f (t). t→∞
Weil der Pol der Funktion sF (s) = 1 (s + 1) in der linken s-Halbebene liegt, existiert der gesuchte Grenzwert. Unter Anwendung des Endwertsatzes erhalten wir lim f (t) = f (∞) = lim sF (s) = lim
t→∞
s→0
s→0
s = 1. s(s + 1)
Dieses Ergebnis lässt sich leicht überprüfen, nachdem sich die zu F (s) korrespondierende Zeitfunktion auf einfachem Wege zu f (t) = 1 − e−t für t ≥ 0 bestimmen lässt. Theorem 8: Anfangswertsatz Mit dem Anfangswertsatz wird ohne großen mathematischen Aufwand aus der Laplacetransformierten Zeitfunktion F (s) der entsprechende Anfangswert f (0+ ) ohne Kenntnis der Zeitfunktion f (t) ermittelt. Wenn f (t) und dfdt(t) Laplace-transformierbar sind und der Grenzwert lim sF (s) existiert, dann gilt der Zusammenhang s→∞
f (0+ ) = lim sF (s).
(I.9)
s→∞
Zum Beweis obiger Gleichung wird die Laplace-Transformierte des rechtsseitigen Grenzwer tes von df (t) dt aufgestellt: d f (t) = sF (s) − f (0+ ). L dt
Für das Zeitintervall 0 ≤ t ≤ ∞ geht für s gegen unendlich der Ausdruck e−st gegen null. Somit gilt
∞ lim
s→∞
d f (t) · e−st dt = lim sF (s) − f (0+ ) = 0 s→∞ dt
und somit
0+
f (0+ ) = lim sF (s). s→∞
Der Anfangswertsatz und der Endwertsatz sind bei praktischen Anwendungen sehr nützliche Beziehungen, weil man damit in der Lage ist, ohne die vollständige Zeitfunktion zu kennen, bereits den Beginn und den stationären Zustand der Zeitfunktion f (t) aus der LaplaceTransformierten F (s) herzuleiten.
356
Anhang I
Beispiel I.2: Aus der Bildfunktion F (s) =
7s 2 − s + 12 s 3 + s 2 + 3s + 3
soll der Anfangswert f (0+ ) der Zeitfunktion f (t) berechnet werden. Unter Anwendung des Anfangswertsatzes erhält man " # s 7s 2 − s + 12 lim f (t) = lim sF (s) = 3 = 7. s→∞ t→0+ s + s 2 + 3s + 3
Damit ist also f (0+ ) ohne Kenntnis der Originalfunktion f (t) bestimmt worden.
Theorem 9: Faltungssatz Der Faltungssatz eröffnet einen Weg, die Rücktransformation vom Laplace- in den Zeitbereich durchzuführen, wenn die Laplace-Transformierte F (s) in einzelne Faktoren zerlegt werden kann, deren jeweilige Originalfunktionen bekannt sind. Hierzu gehen wir aus vom so genannten Faltungsintegral
t f1 (t − τ )f2 (τ ) dτ . 0
In der symbolischen Schreibweise wird dieses Integral geschrieben als f1 (t) ∗ f2 (t). Die mathematische Operation f1 (t) ∗ f2 (t) wird als Faltung bezeichnet. Mit der Substitution t − τ = ξ wird das oben angeführte Integral zu
t
0 f1 (t − τ ) f2 (τ ) dτ = −
t f1 (ξ ) f2 (t − ξ ) dξ =
t
0
f1 (τ ) f2 (t − τ ) dτ . 0
Somit gilt
t f1 (t) ∗ f2 (t) =
t f1 (t − τ ) f2 (τ ) dτ =
0
f1 (τ ) f2 (t − τ ) dτ = f2 (t) ∗ f1 (t). 0
Wenn die Zeitfunktionen f1 (t) und f2 (t) stückweise kontinuierlich sind, dann erhält man die 6t Laplace-Transformierte des Integrals f1 (t − τ ) f2 (τ ) dτ auf folgende Weise: 0
t L f1 (t − τ ) f2 (τ ) dτ = F1 (s) · F2 (s), 0
(I.10)
I.1 Die Laplace-Transformation
357
wobei gilt
∞ F1 (s) =
f1 (t) e
−st
∞ und F2 (s) =
dt
0
f2 (t) e−st dt.
0
Für den Beweis der Gl. (I.10) ist zunächst zu beachten, dass gilt
f1 (t − τ ) ε (t − τ ) = 0
für τ > t
und
ε (t − τ ) =
1 0
für τ < t für τ > t
.
Damit erhält man ∞ t L f1 (t − τ ) f2 (τ ) dτ = L f1 (t − τ ) ε (t − τ ) f2 (τ )dτ 0
0
∞ = 0
∞ e−st f1 (t − τ ) ε (t − τ ) f2 (τ ) dt . 0
Führt man in der letzten Gleichung die Substitution t − τ = λ ein und ändert die Reihenfolge der Integration, so bekommen wir t ∞ ∞ L f1 (t − τ ) f2 (τ ) dτ = f1 (t − τ ) ε (t − τ )e−st dt f2 (τ ) dτ 0
∞ =
0
f1 (λ)e−s(λ+τ ) dλ
0 ∞
=
0
∞ f2 (τ ) dτ 0
f1 (λ) e
−sλ
∞ dλ
0
f2 (τ ) e−sτ dτ
0
= F1 (s) · F2 (s). Wenn also die Laplace-Transformierte einer Zeitfunktion als Produkt zweier Laplace-Funktionen F1 (s) · F2 (s) bekannt ist, dann kann die korrespondierende Zeitfunktion durch das Faltungsintegral f1 (t) ∗ f2 (t) ermittelt werden. Beispiel I.3: Zur Bildfunktion as
F (s) = "
s 2 + a2
#2
358
Anhang I
soll mit Hilfe des Faltungssatzes die zugehörige Zeitfunktion f (t) berechnet werden. Wir zerlegen hierzu die gegebene Laplace-Transformierte F (s) =
a s · = F1 (s) · F2 (s) s 2 + a2 s 2 + a2
in ein Produkt von zwei Bildfunktionen. Mit den in der Tabelle I.2 aufgeführten Korrespondenzen erhalten wir L−1 [F1 (s)] = f1 (t) = cos (at) und
L−1 [F2 (s)] = f2 (t) = sin(at).
Mit Hilfe des Faltungssatzes erhält man schließlich die gesuchte Zeitfunktion zu
t f (t) = f1 (t) ∗ f2 (t) =
cos (aτ ) sin(at − aτ ) dτ . 0
Zur Berechnung des Faltungsintegrals wandeln wir das Produkt der beiden trigonometrischen Funktionen mit sin α · cos β = 21 [sin(α + β) + sin(α − β)] in eine Summe von Sinusfunktionen um und finden so 1 f (t) = 2
t [sin(at) + sin(at − 2aτ )] dτ 0
1 = sin(at) 2
t
1 dτ + 2
0
t sin(at − 2aτ ) dτ 0
1 1 1 = t sin(at) + [cos (−at) − cos (at)] = t sin(at). 2 4a 2
Zusammenfassung: In der folgenden Tabelle sind die mathematischen Eigenschaften und Theoreme der LaplaceTransformation zusammengestellt, von denen die meisten in diesem Kapitel hergeleitet worden sind. I.1.3
Laplace-Transformierte elementarer Zeitfunktionen
Laplace-Transformierte der Sprungfunktion Die in der Elektrotechnik häufig verwendete Sprungfunktion A · ε(t) ist definiert durch
f (t) =
A 0
für t > 0 , für t < 0
wobei A eine Konstante ist. (Für den Fall A = 1 spricht man auch vom so genannten Einheitssprung.) Die Laplace-Transformierte der gegebenen Zeitfunktion f (t) ergibt sich zu
I.1 Die Laplace-Transformation
359
Tabelle I.1: Zusammenstellung der wichtigsten Theoreme der Laplace-Transformation L [αf1 (t) + βf2 (t)] = αF1 (s) + βF2 (s) df (t) = sF (s) − f (0) L dt Differenziationsdn f (t) = s n F (s) − s n−1 f (0) − s n−2 f (1) (0) − . . . L satz dt n −sf (n−2) (0) − f (n−1) (0) t F (s) L f (τ ) dτ = s Linearitätssatz
0
t1 t2 tn F (s) . . . f (τ ) dτ dt1 dt2 . . . dtn−1 = n L s
Integrationssatz
0
Zeitlicher Verschiebungssatz Komplexer Verschiebungssatz Anfangswertsatz Endwertsatz
0
0
L [f (t − T ) ε (t − T )] = e−sT F (s)
L e∓αt f (t) = F (s ± α)
lim f (t) = lim sF (s) s→∞
t→0
lim f (t) = lim sF (s), sofern sF (s) keine Pole auf oder rechts der Imaginär-
t→∞
Faltungssatz
s→0
achse der s-Ebene hat t t F1 (s)F2 (s) = L f (τ ) f2 (t − τ ) dτ = L f1 (t − τ ) f2 (τ ) dτ 0
0
= L [f1 (t) ∗ f2 (t)]
∞ L [f (t)] =
A e−st dt =
A . s
0
Bei der Integration dieser Funktion wurde vorausgesetzt, dass der Realteil von s größer als null und damit lim e−st null ist. Das in obiger Gleichung ermittelte Ergebnis gilt für die ganze t→∞ s-Ebene mit Ausnahme einer Polstelle bei s = 0. Der Einheitssprung an der Stelle t = t0 wird in der Regel geschrieben als ε (t − t0 ). Die Laplace-Transformierte des Einheitssprungs gemäß
360
Anhang I
ε (t) =
für t ≥ 0 für t < 0
1 0
wird mit obigem Ergebnis zu L [ε (t)] =
1 . s
Physikalisch korrespondiert die Sprungfunktion mit einem Signalsprung konstanterAmplitude an der Stelle t = 0. Laplace-Transformierte der Rampenfunktion Die Rampenfunktion ist definiert durch
f (t) =
0 At
für t < 0 , für t ≥ 0
wobei A eine Konstante ist. Die entsprechende Laplace-Transformierte erhält man mit dem Laplace-Integral, Gl. (I.1), und der partiellen Integration zu
∞ L [At] =
At e 0
−st
∞ ∞ ∞ A e−st e−st A A dt = At − e−st dt = 2 . dt = −s 0 −s s s 0
0
Laplace-Transformierte der Exponentialfunktion Die Exponentialfunktion ist definiert durch
f (t) =
0 A e−αt
für t < 0 für t ≥ 0
,
wobei A und α beliebige Konstanten sind. Die zugehörige Laplace-Transformierte erhält man auf folgende Weise:
L Ae
−αt
∞ =
Ae 0
−αt −st
e
∞ dt = A 0
e−(s+α)t dt =
A . s+α
Wie man sieht, erzeugt die Exponentialfunktion eine Polstelle in der komplexen Ebene. Zur Konvergenz des Laplace-Integrals muss vorausgesetzt werden, dass der Grenzwert lim e−(s−α)t = 0 ist. Diese Bedingung ist erfüllt für Re (s − α) = σ − Re (α) > 0. t→∞
Zur Zeitfunktion f (t) = A e−αt existiert also eine Laplace-Transformierte, wenn σ > Re(α) gewählt wird. Dadurch ist die Konvergenzhalbebene der Bildfunktion bestimmt.
I.1 Die Laplace-Transformation
361
Laplace-Transformierte des Rechteckimpulses Der Rechteckimpuls ist definiert durch A f (t) = t0 0
für
0 < t < t0
,
für t < 0, t > t0
wobei A und t0 Konstanten sind. Entsprechend obiger Gleichung kann der Rechteckimpuls an der Stelle t = 0 interpretiert werden, dem ein negativer als Sprung der Amplitude A t 0 Sprung der Amplitude A t0 an der Stelle t = t0 überlagert ist. Somit kann die Gleichung des Rechteckimpulses auch formuliert werden als f (t) =
A A ε (t) − ε (t − t0 ). t0 t0
Mit Hilfe der Rechenregeln der Laplace-Transformation erhalten wir die Laplace-Transformierte der Zeitfunktion f (t) zu A A A −st0 A ε (t) − L ε (t − t0 ) = − e L [f (t)] = L t0 t0 t0 s t0 s # A " = 1 − e−st0 . (I.11) t0 s Laplace-Transformierte der Impulsfunktion Der zeitliche Verlauf der Impulsfunktion kann mit t0 → 0 als Spezialfall der Rechteckfunktion aufgefasst werden; sie ist definiert durch A für 0 < t < t0 f (t) = lim t0 t0 →0 0 für t < 0, t > t0 Weil die Amplitude des Impulses A t0 und die Impulsdauer t0 ist, wird die Fläche unter dem Impuls zu A. Weil außerdem wegen t0 → 0 die Impulsdauer t0 gegen null strebt, muss die Impulshöhe gegen unendlich streben. Bezugnehmend auf Gl. (I.10) wird die LaplaceTransformierte der Impulsfunktion unter Anwendung der L’Hospital’schen Regel zu L [f (t)] = lim
t0 →0
# d " A 1 − e−st0 # As A " dt = 1 − e−st0 = lim 0 = A. d t0 →0 t0 s s (st0 ) dt0
Somit wird die Laplace-Transformierte der Impulsfunktion zur Fläche unter dem Impuls. Der Impuls, dessen Fläche eins ist, wird als Einheitsimpuls oder als Dirac’sche Deltafunktion bezeichnet.
362
Anhang I
Der Einheitsimpuls an der Stelle t = t0 wird mathematisch mit δ(t − t0 ) bezeichnet. Somit gilt
δ(t − t0 ) =
∞ 0
für t = t0 ; für t = t0
∞ δ (t − t0 ) · dt = 1.
außerdem gilt −∞
Natürlich ist ein Impuls der Breite null und einer unendlich hohen Amplitude nur ein mathematisches Hilfsmittel, das in der Praxis jedoch nicht realisierbar ist. Weiterhin sollte darauf verwiesen werden, dass die Impulsfunktion δ (t − t0 ) als Ableitung der Sprungfunktion ε (t − t0 ) betrachtet werden kann; d.h. es gilt der Zusammenhang δ(t − t0 ) =
d ε (t − t0 ). dt
Laplace-Transformierte der Sinusfunktion Die allgemeine Sinusfunktion ist gegeben durch
f (t) =
0 A · sin ωt
für t < 0 , für t ≥ 0
wobei A bekanntlich die Amplitude und ω die Kreisfrequenz der periodischen Schwingung " # ist. Die entsprechende Laplace-Transformierte erhält man mit sin ωt = 2j1 ejωt − e−jωt zu
∞ A A jωt 1 ω 1 −jωt −st . e −e e dt = L [A sin ωt] = − =A· 2 2j 2j s − jω s + jω s + ω2 0
Laplace-Transformierte der Kosinusfunktion Der zeitliche Verlauf der allgemeinen Kosinusfunktion lautet bekanntlich
g(t) =
0 A · cos ωt
für t < 0 . für t ≥ 0
Im Gegensatz zur Herleitung der Laplace-Transformierten der Sinusfunktion soll hier der Differenziationssatz der Laplace-Transformation zur Anwendung kommen. Mit der Definition
f (t) =
0 A sin ωt
für t < 0 für t ≥ 0
wird, wie bereits gezeigt, L [A sin ωt] = F (s) = A
s2
ω . + ω2
I.2 Inverse Laplace-Transformation
363
Damit erhält man
d L [A cos ωt] = L dt
1 A sin ωt ω
=A·
1 [sF (s) − f (0)] = ω 1 s sω A· −0 =A· 2 . 2 2 ω s +ω s + ω2
In vielen Fällen kann die Laplace-Transformierte einer vorgegebenen Zeitfunktion f (t) außer über das Laplace-Integral auch durch eine geschickte Anwendung bereits bekannter Korrespondenzen bestimmt werden. Die folgende Tabelle zeigt Laplace-Transformierte von Zeitfunktionen, die besonders bei regelungstechnischen Aufgabenstellungen häufig in Erscheinung treten.
I.2
Inverse Laplace-Transformation
Der Übergang vom komplexen Ausdruck F (s) zu der korrespondierenden Zeitfunktion f (t) wird als Rücktransformation oder auch als inverse Laplace-Transformation bezeichnet. Formell kommt diese Operation durch die Schreibweise L−1 [F (s)] = f (t) zum Ausdruck. Streng mathematisch erhält man die gesuchte Zeitfunktion mit Hilfe des Umkehrintegrals c+j∞
1 f (t) = 2jπ
F (s) est ds;
(t > 0),
c−j∞
wobei c die reelle Konvergenz-Abszisse ist. Dabei ist darauf hinzuweisen, dass die KonvergenzAbszisse rechts von sämtlichen Polstellen von F (s) liegen muss. Die Berechnung des Inversionsintegrals ist jedoch selbst für einfache Beispiele mathematisch relativ aufwändig. Eine einfachere Methode, die Zeitfunktion f (t) aus F (s) zu bestimmen, besteht in der Verwendung von Korrespondenz-Tabellen. Wenn jedoch in besonderen Fällen die gegebene LaplaceTransformierte F (s) in keiner Korrespondenz-Tabelle zu finden ist, kann die gesuchte Zeitfunktion f (t) unter Verwendung der so genannten Partialbruchzerlegung ermittelt werden. I.2.1
Partialbruchzerlegung zur Berechnung der inversen Laplace-Transformierten
Bei regelungstechnischen Aufgabenstellungen erscheint F (s), die Laplace-Transformierte der B(s) gesuchten Zeitfunktionf (t), als rationale Funktion der Form F (s) = A(s) , wobei A(s) und B(s) Polynome in s sind und der Grad von B(s) kleiner als der Grad von A(s) ist. Wenn F (s) in einzelne Komponenten aufgespaltet werden kann, also F (s) = F1 (s) + F2 (s) + . . . + Fn (s), und die Laplace-Transformierten der Einzelkomponenten F1 (s), F2 (s), . . . , Fn (s) einfache, d.h. leicht transformierbare Funktionen sind, so erhält man die gesuchte Zeitfunktion zu
364
Anhang I
Tabelle I.2: Korrespondenzen häufig vorkommender Zeitfunktionen Nr.
f (t)
F (s)
1
δ(t)
2
ε(t)
1
3
t
4
t n−1 ; (n − 1)!
1 s 1 s2
5
e−αt
6
t e−αt
7
1 t n−1 e−αt ; (n − 1)!
8
t n e−αt ;
(n = 1, 2, 3, . . .) sin ωt
10
cos ωt
11
sinh ωt
12
cosh ωt
14 15
# 1" 1 − e−at a 1 −at e − e−bt b−a 1 1 −at 1+ be − a e−bt ab a−b
16
e−at sin ωt
17
e−at cos ωt
18
19
1 s+α 1 (s + α)2 1 (s + α)n n! (s + α)n+1 ω 2 s + ω2 s 2 s + ω2 ω 2 s − ω2 s 2 s − ω2 1 s(s + a) 1 (s + a)(s + b) 1 s(s + a)(s + b) ω (s + a)2 + ω2 s+a (s + a)2 + ω2
(n = 1, 2, 3, . . .)
9
13
1 sn
(n = 1, 2, 3, . . .)
ω0 e−dω0 t sin(ω0 1 − d 2 t) 1 − d2 e−dω0 t 1− sin ω0 1 − d 2 t + Φ 2 1 − d 1 − d2 Φ = arctan d
ω02 s 2 + 2dω0 s + ω02
ω02
s s 2 + 2dω0 s + ω02
I.2 Inverse Laplace-Transformation
365
f (t) = L−1 [F (s)] = L−1 [F1 (s)] + L−1 [F2 (s)] + . . . + L−1 [Fn (s)] = f1 (t) + f2 (t) + . . . + fn (t) wobei f1 (t), f2 (t), . . . , fn (t) die inversen Laplace-Transformierten von F1 (s), F2 (s), . . . , Fn (s) sind. Wie sich später zeigen wird, bedarf es bei dieser Vorgehensweise in den seltensten Fällen einer Korrespondenz-Tabelle, wenn man nur die Korrespondenzen einiger weniger Funktionen kennt. Es sollte jedoch darauf hingewiesen werden, dass bei der Partialbruchzerlegung die Kenntnis der Polstellen von F (s) notwendig ist. Partialbruchzerlegung von Funktionen mit ausnahmslos verschiedenen Polstellen Die Funktion F (s) als echt gebrochen rationale Funktion lässt sich anschreiben als F (s) =
B(s) b0 + b1 s + b2 s 2 + . . . + bm−1 s m−1 + bm s m = A(s) a0 + a1 s + a2 s 2 + . . . + an−1 s n−1 + an s n
K (s − z1 ) (s − z2 ) . . . (s − zm ) = (s − p1 ) (s − p2 ) . . . (s − pn )
,
wobei z1 , z2 , . . . , zm die Nullstellen und p1 , p2 , . . . , pn die Polstellen von F (s) sind, außerdem gilt für technisch realistische Systeme n > m. Wenn F (s), wie vorausgesetzt, nur verschiedene Pole hat, dann lässt sich diese Funktion als Summe von Partialbrüchen anschreiben: F (s) =
B(s) c1 c2 ck cn = + + ... + + ... + , A(s) s − p1 s − p2 s − pk s − pn
(I.12)
wobei es sich bei den Faktoren c1 , c2 , . . . , cn um Konstanten handelt, die im Rahmen der Funktionentheorie als Residuen der Funktion F (s) an der Stelle s = pk , k = 1, 2, . . . , n bezeichnet werden. Der Wert von ck ergibt sich durch Multiplikation der beiden Seiten der Gl. (I.12) mit s − pk , wobei anschließend s = pk gesetzt wird: B(s) = (s − pk ) A(s) s=pk
ck cn c1 c2 (s − pk ) + . . . + (s − pk ) + . . . (s − pk ) (s − pk ) + s − p1 s − p2 s − pk s − pn
s=pk
= ck . Wie man aus obiger Gleichung sieht, heben sich für s = pk alle Terme auf bis auf ck . Somit ergibt sich das Residuum ck aus der Gleichung B(s) ck = (s − pk ) . (I.13) A(s) s=pk Wenn zwei Pole, z.B. p1 und p2 , konjugiert komplex sind, dann sind auch die entsprechenden Residuen, also c1 und c2 , zueinander konjugiert komplex. Auf Grund der Korrespondenz
366
Anhang I
L−1
ck s − pk
= ck epk t
erhält man schließlich die zu bestimmende Zeitfunktion zu f (t) = L−1 [F (s)] = c1 ep1 t + c2 ep2 t + . . . + cn epn t
für
t ≥ 0.
Beispiel I.4: Zur Laplace-Transformierten F (s) =
s+3 (s + 1)(s + 2)
ist die inverse Laplace-Transformierte f (t) zu bestimmen. Die Partialbruchzerlegung zu F (s) lautet F (s) =
c1 c2 s+3 = + , (s + 1) · (s + 2) s+1 s+2
wobei c1 und c2 mit Hilfe der Gl. (I.13) ermittelt werden: s+3 s+3 = = 2; c1 = (s + 1) (s + 1)(s + 2) s=−1 s + 2 s=−1
s+3 c2 = (s + 2) (s + 1)(s + 2)
s=−2
s+3 = s+1
= −1. s=−2
Man erhält somit die gesuchte Zeitfunktion zu 2 −1 f (t) = L−1 [F (s)] = L−1 + L−1 = 2e−t − e−2t s+1 s+2
für
t ≥ 0.
Beispiel I.5: Zur Laplace-Transformierten F (s) =
2s + 12 + 2s + 5
s2
ist die zugehörige Zeitfunktion f (t) zu bestimmen. Wenn man die Polstellen p1,2 = −1 ± j2 aus der Gleichung s 2 + 2s + 5 = 0 ermittelt, so lautet das faktorisierte Nennerpolynom s 2 + 2s + 5 = (s + 1 + j2)(s + 1 − j2). In Fällen, wie im gegebenen Beispiel, bei denen F (s) konjugiert komplexe Polpaare aufweist, erhält man die gesuchte Zeitfunktion bequemer, wenn man F (s) nicht auf dem eben gezeigten Standard-Weg in Partialbrüche zerlegt, sondern in eine Summe gedämpfter Sinus- und Kosinusfunktionen aufspaltet. Mit
I.2 Inverse Laplace-Transformation
367
s 2 + 2s + 5 = (s + 1)2 + 22 und der bekannten Korrespondenzen L e−αt sin ωt =
ω (s + α)2 + ω2
und
L e−αt cos ωt =
s+α (s + α)2 + ω2
kann die gegebene Funktion F (s) als Summe einer gedämpften Sinus- und einer gedämpften Kosinusfunktion angeschrieben werden: F (s) =
2s + 12 10 + 2(s + 1) 2 s+1 = =5 +2 . s 2 + 2s + 5 (s + 1)2 + 22 (s + 1)2 + 22 (s + 1)2 + 22
Mit den oben angeführten Korrespondenzen wird die gesuchte Zeitfunktion zu −1
f (t) = L
[F (s)] = 5 · L
−1
2 s+1 −1 +2·L (s + 1)2 + 22 (s + 1)2 + 22
f (t) = 5e−t sin(2t) + 2e−t cos(2t); t ≥ 0.
Partialbruchzerlegung von Funktionen mit mehrfachen Polstellen Im Gegensatz zu dem Fall ausschließlich einfacher Pole soll die Partialbruchzerlegung von Funktionen mit mehrfachen Polstellen nur anhand eines Beispiels aufgezeigt werden. Beispiel I.6: Zur Laplace-Transformierten F (s) =
s 2 + 2s + 3 (s + 1)3
mit einer dreifachen Polstelle ist die dazu inverse Zeitfunktion f (t) zu bestimmen. Die Partialbruchzerlegung dieser Funktion bekommt zunächst die Form F (s) =
B(s) c2 c1 c3 , + + = (s + 1)3 (s + 1)2 s+1 A(s)
wobei im Folgenden die Bestimmung von c3 , c2 , und c1 gezeigt werden soll. Multipliziert man beide Seiten der obigen Gleichung mit (s + 1)3 , so erhält man (s + 1)3
B(s) = c3 + c2 (s + 1) + c1 (s + 1)2 . A(s)
Setzt man s = −1, so wird Gl. (I.14) zu
(I.14)
368
Anhang I
(s + 1)3
B(s) A(s)
= c3 . s=−1
Differenziert man außerdem Gl. (I.14) nach s, so erhält man d B(s) (s + 1)3 = c2 + 2c1 (s + 1). ds A(s)
(I.15)
Mit s = −1 wird Gl. (I.15) zu d B(s) = c2 . (s + 1)3 ds A(s) s=−1 Eine weitere Differenziation der Gl. (I.15) nach s ergibt d2 3 B(s) (s + 1) = 2c1 . ds 2 A(s) Aus dieser Vorgehensweise kann man leicht sehen, dass die Koeffizienten c3 , c2 und c1 , wie im Folgenden gezeigt wird, systematisch bestimmt werden können: c3 =
B(s) 1 = (s 2 + 2s + 3)s=−1 = 2; (s + 1)3 0! A(s) s=−1
1 c2 = 1! 1 c1 = 2!
d d 2 3 B(s) (s + 1) (s + 2s + 3) = = (2s + 2)s=−1 = 0; ds A(s) s=−1 ds s=−1
d2 1 d2 2 1 3 B(s) (s + 1) = (s + 2s + 3) = · 2 = 1. ds 2 A(s) s=−1 2! ds 2 2 s=−1
Damit wird die zu bestimmende Zeitfunktion zu 2 0 1 −1 −1 −1 −1 f (t) = L [F (s)] = L +L +L (s + 1)3 (s + 1)2 s+1 = t 2 e−t + 0 + e−t = (t 2 + 1) e−t
I.2.2
für
t ≥ 0.
Lösung linearer Differenzialgleichungen mit Hilfe der Laplace-Transformation
Lineare, zeitinvariante Systeme werden durch lineare gewöhnliche Differenzialgleichungen n-ter Ordnung y (n) (t) + an−1 y (n−1) (t) + . . . + a1 y(t) ˙ + a0 y(t) = u(t)
(I.16)
I.2 Inverse Laplace-Transformation
369
mit konstanten Koeffizienten beschrieben, wobei y(t) Ausgangsgröße und u(t) eine beliebige Störfunktion ist. Für den Fall u(t) = 0 handelt es sich um eine homogene Differenzialgleichung, im Fall u(t) = 0 um eine inhomogene Differenzialgleichung. Bei der Lösung linearer zeitinvarianter Differenzialgleichungen unter Verwendung der Laplace-Transformation sind grundsätzlich zwei Schritte durchzuführen: 1. Zunächst ist jeder Term der gegebenen Differenzialgleichung in den Laplace-Bereich zu transformieren. Durch diesen Prozess entsteht eine lineare Gleichung in s. 2. Die Lösung der gegebenen Differenzialgleichung erhält man durch Rücktransformation der verschiedenen Terme vom Laplace- in den Zeitbereich. Im Folgenden soll anhand von zwei Beispielen der grundsätzliche Lösungsweg aufgezeigt werden. Beispiel I.7: Zur homogenen Differenzialgleichung y(t) ¨ + 3 · y(t) ˙ + 2 · y(t) = 0 mit den Anfangsbedingungen y(0) = a
und
y(0) ˙ =b
ist die Lösung y(t) zu bestimmen. Mit der Definition L [y(t)] = Y (s) und dem Differenziationssatz der Laplace-Transformation L [y(t)] ˙ = sY (s) − y(0) und
˙ L [y(t)] ¨ = s 2 Y (s) − sy(0) − y(0)
wird die transformierte Differenzialgleichung zu . ˙ + 3 [sY (s) − y(0)] + 2Y (s) = 0. s 2 Y (s) − sy(0) − y(0) Setzt man die gegebenen Anfangsbedingungen ein, so wird diese Gleichung zu 2 s Y (s) − as − b + 3 [sY (s) − a] + 2Y (s) = 0 bzw. " 2 # s + 3s + 2 Y (s) = as + b + 3a. Auflösen nach Y (s) ergibt Y (s) =
as + b + 3a 2a + b a + b as + b + 3a = = − . 2 s + 3s + 2 (s + 1)(s + 2) s+1 s+2
(Dabei sollte darauf hingewiesen werden, dass sich die beiden letzten Brüche über die Partialbruchzerlegung ergeben haben). Die inverse Laplace-Transformierte, d.h. die gesuchte Lösung der gegebenen Differenzialgleichung, wird damit zu
370
Anhang I
y(t) = L−1 [Y (s)] = L−1
2a + b a+b −L−1 = (2a + b) e−t −(a + b) e−2t ; s+1 s+2 t ≥ 0.
Beispiel I.8: Zur inhomogenen Differenzialgleichung y(t) ¨ + 2y(t) ˙ + 5y(t) = 3
mit y(0) = 0, y(0) ˙ =0
ist die Lösung y(t) zu bestimmen.
Beachtet man, dass für die Laplace-Transformierte des Störterms L [3] = 3 s gilt, so wird die transformierte Differenzialgleichung zu s 2 Y (s) + 2sY (s) + 5Y (s) =
3 . s
Auflösen nach Y (s) ergibt Y (s) =
s(s 2
3 31 3 s+2 = − 2 + 2s + 5) 5s 5 s + 2s + 5 =
31 3 3 2 s+1 − . − 2 2 5s 10 (s + 1) + 2 5 (s + 1)2 + 22
Damit wird die inverse Laplace-Transformierte und damit die Lösung der Differenzialgleichung zu 3 −1 1 3 −1 2 s+1 3 −1 y(t) = L − L − L 5 s 10 (s + 1)2 + 22 5 (s + 1)2 + 22 3 3 −t 3 = − e sin 2t − e−t cos 2t 5 10 5
.
Anhang II II.1 Die z-Transformation II.1.1 Motivation Die z-Transformation spielt für diskrete Systeme die gleiche maßgebliche Rolle wie die Laplace-Transformation für kontinuierliche Systeme. Das dynamische Verhalten eines diskreten linearen Systems wird durch eine lineare Differenzengleichung beschrieben. Zur Bestimmung der Systemantwort ist die entsprechende Differenzengleichung bei bekannter Eingangsgröße zu lösen. Unter Verwendung der z-Transformation wird eine lineare Differenzengleichung zu einer algebraischen Gleichung in z, wobei, wie sich im Folgenden zeigen wird, z ein komplexer Operator ist. (In Analogie dazu wird mit Hilfe der Laplace-Transformation eine lineare, zeitinvariante Differenzialgleichung zu einer algebraischen Gleichung in s.) Die Intention dieses Kapitels besteht darin, die Definition der z-Transformation aufzuzeigen, die wichtigsten Rechenregeln im z-Bereich herzuleiten sowie diverse Methoden der Rücktransformation vom z-Bereich in den diskreten Zeitbereich zu präsentieren. II.1.2 Bestimmung der z-Transformierten Hat ein Signal nur diskrete Werte x(k) oder wird ein zeitkontinuierliches Signal x(t) nur zu diskreten Zeitpunkten t = kT mit T als Abtastperiode und k = 0, 1, 2, 3, . . . abgetastet, so lautet die Impulsfolge der durch die Abtastung diskretisierten Signale x ∗ (t) =
∞
x(kT ) · δ (t − kT ),
(II.1)
k=0
wobei δ (t) der Einheitsimpuls ist entsprechend der Definition
δ (t) =
1 0
für t = kT ; für t = kT
(II.2)
die gemäß Gl. (II.2) definierte Impulsfunktion wird zuweilen als Kronecker-Impuls bezeichnet. Unterzieht man die Gl. (II.1) einer Laplace-Transformation, so wird die Laplace-transformierte Impulsfunktion zu X∗ (s) =
∞
x(kT ) · e−skT .
k=0
Mit der Definition des z-Operators zu
(II.3)
372
Anhang II
z = esT
(II.4)
wird die z-Transformierte der Gl. (II.1) zu ∞ x(kT )z−k . X(z) = L x ∗ (t) esT =z = X ∗ (s) esT =z =
(II.5)
k=0
Bezüglich der Nomenklatur sei darauf verwiesen, dass der diskrete Funktionswert x(kT ) an der Stelle t = kT stattdessen in der etwas verkürzten Form mit xk bezeichnet wird, während mit (x(kT )) in der Regel die diskrete Wertefolge gemeint ist. II.1.3 z-Transformierte typischer Signale Im Folgenden wird die z-Transformierte verschiedener elementarer Funktionen hergeleitet. Dabei ist festzustellen, dass bei der Anwendung der einseitigen z-Transformation auf diskontinuierliche Signale x(t) immer der rechtsseitige Funktionswert herangezogen wird. Sprungfunktion
Die z-Transformierte der Sprungfunktion x(t) =
ε (t) = 1 0
für für
t ≥0 t <0
ergibt sich entsprechend der Definition der z-Transformation zu X(z) = Z [ε(t)] =
∞
1 · z−k =
k=0
∞
z−k = 1 + z−1 + z−2 + z−3 + . . ..
k=0
X(z) hat die Form einer geometrischen Reihe; deren Summe ist gegeben zu X(z) =
1 z = −1 1−z z−1
Einheitsrampe
Die Einheitsrampe ist gegeben durch die Funktion x(t) =
t 0
für für
t ≥0 . t <0
Die entsprechende z-Transformierte lässt sich bestimmen zu X(z) = Z [t] =
∞ k=0
x(kT )z−k =
∞
kT z−k = T z−1 + 2z−2 + 3z−3 + 4z−4 + . . . .
k=0
Diese Gleichung, geringfügig umgeformt, ergibt X(z) = T z−1 + z−2 + z−3 + . . . · 1 + z−1 + z−2 + z−3 + . . . .
II.1 Die z-Transformation
373
Wie man sieht, entspricht diese Form dem Produkt zweier geometrischer Reihen. Damit wird die gesuchte z-Transformierte zu z−1 Tz = . −1 2 (1 − z ) (z − 1)2
X(z) =
Potenzfunktion Nun soll die z-Transformierte der Funktion x(k) bestimmt werden, definiert durch
x(k) =
ak 0
für k = 0, 1, 2, . . . , für k < 0
wobei a eine Konstante ist.
Unter Verwendung der Definition der z-Transformierten erhält man ∞ ∞ k −k X(z) = Z a = x(k)z = a k z−k k=0
X(Z) =
1 + az−1
+ a 2 z−2
k=0
+ a 3 z−3
+ ... .
Offenbar handelt es sich bei dem obigen Ausdruck wieder um eine geometrische Reihe. Damit wird die gesuchte Summe zu X(z) =
z 1 = . 1 − az−1 z−a
Exponentialfunktion
Die Exponentialfunktion ist definiert durch x(t) =
e−αt 0
für für
t ≥0 . t <0
Wegen x(kT ) = e−αkT , k = 0, 1, 2, . . . wird X(z) zu ∞ ∞ X(z) = Z e−αt = x(kT )z−k = e−αkT z−k k=0
k=0
X(z) = 1 + e−αT z−1 + e−2αT z−2 + e−3αT z−3 + . . . X(z) =
1 z = . 1 − e−αT z−1 z − e−αT
Sinusfunktion Gegeben ist die Sinusfunktion gemäß x(t) =
sin ωt 0
für für
t ≥0 . t <0
374
Anhang II
Unter Verwendung der Euler-Gleichungen ejωt = cos ωt + j · sin ωt e−jωt
und
= cos ωt − j · sin ωt
wird die ursprüngliche Funktion zu 1 jωt e − e−jωt . 2j
sin ωt =
Nachdem sich die z-Transformierte der Exponentialfunktion weiter oben bereits zu Z e−αt =
1 1 − e−αT z−1
ergeben hat, bekommen wir nun X(z) = Z [sin ωt] =
1 2j
1
−
1
cos ωt 0
für für
1 − ejωT z−1 1 − e−jωT z−1 " jωT # − e−jωT z−1 e 1 # " X(z) = 2j 1 − ejωT + e−jωT z−1 + z−2
bzw. umgeformt X(z) =
z · sin ωT . z2 − 2z · cos ωT + 1
Kosinusfunktion Die Kosinusfunktion ist gegeben zu x(t) =
t ≥0 . t <0
Durch analoge Vorgehensweise gemäß der Bestimmung der z-Transformierten der Sinusfunktion erhält man die Transformierte der Kosinusfunktion . 1 zu X(z) = Z [cos ωt] = Z ejωt + e−jωt 2 X(z) =
z2
z2 − z · cos ωT . − 2z · cos ωT + 1
Für den Fall, dass eine Funktion im Laplace-Bereich gegeben ist, besteht eine Möglichkeit, die zugehörige z-Transformierte zu finden darin, diese Funktion in den Zeitbereich zu transformieren und diese dann in den z-Bereich zu transformieren. Ein alternativer Lösungsweg besteht darin, die Funktion X(s) in Partialbrüche zu zerlegen und diese dann mit Hilfe einer Korrespondenz-Tabelle gliedweise in den z-Bereich zu transformieren. Weitere Möglichkeiten werden in einem späteren Abschnitt gesondert betrachtet.
II.1 Die z-Transformation
375
Beispiel II.1: Für die Funktion X(s) =
1 s(s + 1)
ist die entsprechende z-Transformierte zu bestimmen. Die inverse Laplace-Transformierte zu X(s) erhält man auf dem üblichen Weg der Rücktransformation zu x(t) = 1 − e−t ;
t ≥ 0.
Die gesuchte z-Transformierte der einzelnen Terme wird dann zu X(z) = Z ε (t) − e−t =
1 1 − . −1 1 − e−T z−1 1−z
Wenn man im Interesse einer Vereinfachung beide Terme auf einen Nenner bringt, so folgt " # " # 1 − e−T z−1 1 − e−T z #" #= #. " X(z) = " 1 − z−1 1 − e−T z−1 (z − 1) z − e−T Im Rahmen dieses Abschnitts wurde anhand mehrerer Beispiele die Bestimmung der zTransformierten X(z) der wichtigsten Signaltypen x(t) durch direkte Anwendung der Definition der einseitigen z-Transformation hergeleitet. Analog zur Anwendung der LaplaceTransformation wird der geübte Anwender der z-Transformation sicher bestätigen, dass eine Tabelle der wichtigsten Korrespondenzen im z-Bereich in vielen Fällen sehr hilfreich sein kann. Aus diesem Grund sollen zum Abschluss dieses Abschnitts häufig auftretende Korrespondenzen in Form einer Tabelle aufgezeigt werden. II.1.4 Wichtige Eigenschaften und Theoreme der z-Transformation Die z-Transformation führt im Zuge der Analyse diskreter Systeme in vielen Fällen besonders schnell zum gesuchten Ergebnis, wenn man im Stande ist, die entsprechenden Theoreme der z-Transformation anzuwenden. In diesem Abschnitt werden deshalb wichtige Eigenschaften und wichtige Theoreme der z-Transformation aufgezeigt. Dabei wird durchwegs von der einseitigen z-Transformation, d.h. x(t) = 0 für t < 0 ausgegangen. Linearitätsregel Die z-Transformation ist eine lineare Operation, wie im Folgenden gezeigt wird. Das heißt, wenn f (k) und g(k) transformierbare Funktionen sowie α und β Konstanten sind, dann wird für die lineare Kombination x(k) = α · f (k) + β · g(k) die z-Transformierte zu
376
Anhang II
Tabelle II.1: Laplace- und z-Transformierte einfacher Zeitfunktionen Nr.
X(s)
1
1
2
e−nsT 1 s+a 1 s
3 4
x(kT ) od. x(k) 1 0
für k = 0 für k = 0 δ ((n − k)T ) e−akT ε (kT )
5
1 s2
kT
6
2 s3
(kT )2
7
a s(s + a)
1 − e−akT
8
1 (s + a)m
(kT )m−1 e−akT
9
s (s + a)2
(1 − akT ) e−akT
10
2 (s + a)3
(kT )2 e−kT
a
1 akT − 1 + e−akT a
11
s 2 (s + a)
12
s (s + a)2
(1 − akT ) e−akT
13
(b − a)s (s + a)(s + b)
b e−bkT − a eakT
14
a s 2 + a2
sin akT
15
s s 2 + a2
cos akT
16
s+a (s + a)2 + b2
e−akT cos bkT
17
b (s + a)2 + b2
e−akT sin bkT
X(z) 1 z−k 1 −aT 1−e z−1 z z−1 "
T z−1
#2 1 − z−1 T 2 z−1 1 + z−1 " #3 1 − z−1 1 − e−aT z−1 " #" # 1 − z−1 1 − e−aT z−1 z (−1)m−1 ∂ m−1 (m − 1)! ∂a m−1 z − e−aT 1 − (1 + aT )e−aT z−1 " #2 1 − e−aT z−1 T 2 e−aT 1 + e−aT z−1 z−1 " #3 1 − e−aT z−1 - . z aT − 1 + e−aT z + 1 − e−aT − aT e−aT " # a(z − 1)2 z − e−aT . z z − e−aT (1 + aT ) " #2 z − e−aT . z z(b − a) − b e−aT − a e−bT " #" # z − e−aT z − e−bT z sin aT z2 − (2 cos aT )z + 1 z(z − cos aT ) z2 − (2 cos aT )z + 1 z z − e−aT cos bT z2 − 2e−aT (cos bT )z + e−2aT ze−aT sin bT z2 − 2e−aT (cos bT )z + e−2aT
II.1 Die z-Transformation
377
X(z) = α · F (z) + β · G(z), wobei F (z) und G(z) die z-Transformierten der Funktionen f (k) und g(k) sind. Beweis: X(z) = Z [x(k)] = Z [αf (k) + βg(k)] =
∞
[αf (k) + βg(k)]z−k
k=0
=α
∞
f (k)z
−k
+β
k=0
∞
g(k)z−k
k=0
= α · F (z) + β · G(z) Verschiebungssätze Für x(t) = 0 für t < 0 und X(z) = Z [x(t)] wird der Rechtsverschiebungssatz zu Z [x(t − nT )] = z−n · X(z)
(II.6)
und der Linksverschiebungssatz der z-Transformation zu Z [x(t + nT )] = z
n
X(z) −
n−1
x(kT )z
−k
,
k=0
wobei n die Zahl der Verschiebungsschritte ist. Beweis: Um Gl. (II.6) zu beweisen ist zunächst zu beachten, dass gilt Z [x(t − nT )] =
∞
x(kT − nT )z−k
k=0
= z−n
∞
x(kT − nT )z−(k−n) .
k=0
Mit der Definition m = k − n kann diese Gleichung umgeschrieben werden zu Z [x(t − nT )] = z−n
∞ m=−n
x(mT )z−m .
(II.7)
378
Anhang II
Mit x(mT ) = 0 für m < 0 kann die untere Grenze der Summation zu null abgeändert werden. Damit erhält man endgültig Z [x(t − nT )] = z
−n
∞
x(mT )z−m = z−n X(z).
m=0
Multipliziert man also die z-Transformierte einer beliebigen Zeitfunktion mit z−n , so entspricht dies der Rechtsverschiebung dieser Zeitfunktion um n Abtastschritte. Zum Beweis der Gl. (II.7) gehen wir zunächst aus von der Standard-Form der z-Transformierten mit Z [x(t + nT )] =
∞
x(kT + nT )z−k
k=0
= zn
∞
x(kT + nT )z−(k+n)
k=0
= zn
∞
x(kT + nT )z−(k+n) +
k=0
= zn
∞
=
zn
k=0
x(kT )z−k −
k=0
n−1
X(z) −
n−1
x(kT )z
x(kT )z−k
k=0
x(kT )z−k
k=0 n−1
x(kT )z−k −
n−1
−k
.
k=0
Für eine Wertefolge x(k) lässt sich Gl. (II.7) auch in der Form Z [x(k + n)] = z
n
X(z) −
n−1
x(k)z
−k
darstellen.
k=0
Zur Erläuterung der Verschiebungssätze sollen nun einige Beispiele angefügt werden. Beispiel II.2: Es ist die z-Transformierte des Einheitssprungs zu bestimmen, der um eine bzw. vier Abtastperioden nach rechts verschoben ist. Unter Anwendung des Rechtsverschiebungssatzes erhalten wir Z [x(t − T )] = z−1 Z [ε (t)] = z−1
1 z−1 = . −1 1−z 1 − z−1
II.1 Die z-Transformation
379
Analog dazu erhält man die z-Transformierte der um vier Abtastschritte nach rechts verschobenen Sprungfunktion zu Z [ε (t − 4T )] = z−4 Z [ε (t)] = z−4
1 z−4 = . 1 − z−1 1 − z−1
Beispiel II.3: Es ist die z-Transformierte der Funktion zu bestimmen: 7 f (a) =
a k−1 0
für k = 1, 2, 3, . . . . für k ≤ 0
Gemäß Gl. (II.6) muss gelten Z [x(k − 1)] = z−1 X(z). Die z-Transformierte von a k lautet bekanntlich - . Z ak =
1 ; 1 − az−1
damit wird die z-Transformierte der gegebenen Funktion zu . z−1 1 Z [f (a)] = Z a k−1 = z−1 = . 1 − az−1 1 − az−1
Dämpfungsregel Auch die Dämpfungsregel ist eine zur Laplace-Transformation analoge Funktion. Wenn die Funktion x(t) mit der z-Transformierten X(z) korrespondiert, dann wird die z-Transformierte # " der Funktion x(t) · e−at zu X zeat , das heißt, jedes in X(z) vorkommende z ist mit zeat zu ersetzen. Beweis: ∞ ∞ −k x(kT )e−akT z−k = x(kT ) zeaT = X zeaT . Z e−at x(t) = k=0
(II.8)
k=0
Wird also der Operator z in X(z) ersetzt, so erhält man daraus die z-Transformierte der Zeitfunktion x(t) · e−at . Beispiel II.4: Es seien die z-Transformierten der Funktionen sin ωt bzw. cos ωt bekannt. Zu bestimmen sind die z-Transformierten der Zeitfunktionen e−at · sin ωt und e−at · cos ωt unter Verwendung der Dämpfungsregel. In der Transformierten der Sinusfunktion
380
Anhang II
Z [sin ωt] =
z−1 sin ωT 1 − 2z−1 cos ωT + z−2
erhält man mit der Dämpfungsregel Z e−at sin ωt =
e−aT z−1 sin ωT . 1 − 2e−aT z−1 cos ωT + e−2aT z−2
In Analogie dazu erhält man die z-Transformierte der Funktion e−at cos ωt: Z [cos ωt] =
1 − z−1 cos ωT . 1 − 2z−1 cos ωT + z−2
Substituiert man in dieser Gleichung zeaT für jedes z, so erhält man Z e−at cos ωt =
1 − e−aT z−1 cos ωT . + e−2aT z−2
1 − 2e−aT z−1 cos ωT
Beispiel II.5: Es ist die z-Transformierte der Funktion y(t) = t · e−at zu bestimmen. Unter Anwendung der bekannten Korrespondenz T z−1
Z [t] = "
1 − z−1
#2 = X(z)
wird die z-Transformierte der gegebenen Zeitfunktion zu T e−aT z−1 Z te−at = X zeaT = " #2 . 1 − e−aT z−1
Anfangswertsatz der z-Transformation Wenn die Zeitfunktion x(t) mit der z-Transformierten X(z) korrespondiert und der Grenzwert lim X(z) existiert, dann wird der Anfangswert der Funktion x(0) der Wertefolge x(k) zu z→∞
x(0) = lim X(z). z→∞
(II.10)
Zum Beweis dieser Gleichung schreiben wir einige Terme der Definition der z-Transformierten einer beliebigen Zeitfunktion x(t) an. X(z) =
∞
x(k)z−k = x(0) + x(1)z−1 + x(2)z−2 + . . . .
k=0
Mit z → ∞ verbleibt in dieser Gleichung nur der erste Term, womit Gl. (II.10) bereits bewiesen ist.
II.1 Die z-Transformation
381
Beispiel II.6: Es ist der Anfangswert x(0) zu bestimmen, wenn die z-Transformierte der Funktion x(t) gegeben ist zu " # 1 − e−T z−1 #" #. X(z) = " 1 − z−1 1 − e−T z−1 Unter Anwendung des Anfangswertsatzes ergibt sich die gesuchte Größe zu x(0) = lim X(z) = 0. z→∞
Beachtet man, dass X(z) die z-Transformierte der Funktion x(t) = 1−e−t und damit x(0) = 0 ist so sieht man, dass dieses Ergebnis mit dem des Anfangswertsatzes übereinstimmt. Endwertsatz der z-Transformation Gehen wir von der Annahme aus, dass die Wertefolge x(k) mit x(k) = 0 für k < 0 mit der z-Transformierten X(z) korrespondiert und sämtliche Pole von X(z) innerhalb des Einheitskreises der z-Ebene liegen mit der möglichen Ausnahme, dass ein Pol an der Stelle z = 1 liegt. (Hinter dieser Voraussetzung verbirgt sich die Annahme der Stabilität für x(k).) Unter diesen Bedingungen wird der Endwert der Wertefolge x(k), d.h. der Wert x(k) mit k → ∞, zu - . lim x(k) = lim 1 − z−1 X(z) . (II.11) z→1
k→∞
Beweis: Mit Z [x(k)] = X(z) =
∞
x(k)z−k
und
k=0
Z [x(k − 1)] = z−1 X(z) =
∞
x(k − 1)z−k
folgt
k=0 ∞
x(k)z−k −
k=0
∞
x(k − 1)z−k = X(z) − z−1 X(z).
k=0
Bildet man den Grenzwert für den Fall z → 1, so erhält man ∞ ∞ - . −k −k lim = lim 1 − z−1 X(z) . x(k)z − x(k − 1)z z→1
k=0
k=0
z→1
Wegen der angenommenen Stabilität und der Bedingung x(k) = 0 für k < 0 wird die linke Seite dieser Gleichung zu
382
Anhang II ∞
[x(k) − x(k − 1)] = [x(0) − x(−1)] + [x(1) − x(0)] + [x(2) − x(1)] + . . .
k=0
= x(∞) = lim x(k). k→∞
Aus dieser Summe folgt schließlich das gesuchte Ergebnis entsprechend Gl. (II.11) zu - . lim x(k) = lim 1 − z−1 X(z) . k→∞
z→1
Beispiel II.7: Es ist der Endwert der z-Transformierten X(z) =
1 1 − −1 −aT 1−z 1−e z−1
mit a > 0 mit Hilfe des Endwertsatzes zu bestimmen. Wendet man das Endwerttheorem auf die gegebene Funktion X(z) an, so erhält man
" " # # 1 1 − x(∞) = lim 1 − z−1 X(z) = lim 1 − z−1 z→1 z→1 1 − z−1 1 − e−aT z−1
1 − z−1 = lim 1 − = 1. z→1 1 − e−aT z−1 Schließlich ist noch anzumerken, dass die gegebene Funktion X(z) die z-Transformierte zur Zeitfunktion x(t) = 1 − e−at ist. Mit der Substitution t → ∞ wird x(∞) = 1; wie man sieht, liefert also der Endwertsatz das richtige Ergebnis. Neben den wenigen hier aufgezeigten Rechenregeln der z-Transformation liefert die Tabelle II.2 weitere wichtige Eigenschaften der z-Transformation, die natürlich jeweils in der einschlägigen mathematischen Literatur bewiesen sind (siehe hierzu das Literaturverzeichnis am Ende dieser Arbeit). Diskrete Faltung Die Operation der Faltung diskreter Systeme verhält sich analog zur Faltung kontinuierlicher Systeme. Wir gehen aus von der Annahme, dass eine z-Transformierte X(z) als Produkt zweier einfacher diskreter Funktionen X1 (z) und X2 (z) dargestellt werden kann; also X(z) = X1 (z) · X2 (z). Werden die komplexen Funktion X1 (z) und X2 (z) als Potenzreihen angeschrieben, so erhalten wir X(z) = x1 (0) + x1 (1)z−1 + x1 (2)z−2 + . . . · x2 (0) + x2 (1)z−1 + x2 (2)z−2 + . . . X(z) = x1 (0)x2 (0) + [x1 (0)x2 (1) + x1 (1)x2 (0)] z−1 + [x1 (0)x2 (2) + x1 (1)x2 (1) + x1 (2)x2 (0)] z−2 + . . . .
II.1 Die z-Transformation
383
Aus der letzten Gleichung kann man unschwer erkennen, dass der allgemeine Ausdruck der diskreten Wertefolge die Form x(k) = x1 (0)x2 (k) + x1 (1)x2 (k − 1) + . . . + x1 (k)x2 (0) x(k) =
k
x1 (i)x2 (k − i) =
i=0
k
bzw.
x1 (k − i)x2 (k − i) annimmt.
i=0
Die mathematische Operation der Faltung wird gewöhnlich durch folgende symbolische Schreibweise angedeutet: x(k) = x1 (k) ∗ x2 (k). Diese Gleichung ist die diskrete Faltungssumme. Das folgende Beispiel soll die Nützlichkeit der Faltungssumme aufzeigen, wenn sich eine gegebene Funktion als Produkt zweier einfacherer komplexer Funktionen ausdrücken lässt. Beispiel II.8: Gegeben sei eine komplexe Funktion zu X(z) =
z = X1 (z)X2 (z), (z − 1)(z − 2)
wobei wir die Definitionen z = 1 + z−1 + z−2 + . . . und z−1 1 X2 (z) = = z−1 + 2z−2 + (2)2 z−3 + . . . z−2 X1 (z) =
einführen. Gesucht ist die diskrete Wertefolge x(k). (Natürlich erhält man diese Reihen durch jeweilige Aufstellung der Potenzreihendarstellung.) Die diskrete Wertefolge x(k) ergibt sich durch Anwendung der Faltungsregel. Beispielsweise erhält man den diskreten Wert an der Stelle k = 3 zu x(3) =
3
x1 (i)x2 (3 − i)
i=0
x(3) = x1 (0)x2 (3) + x1 (1)x2 (2) + x1 (2)x2 (1) + x1 (3)x2 (0) " # x(3) = (1) 22 + (1)(2) + (1)(1) + (1)(0) = 7.
384
Anhang II
Tabelle II.2: Wichtige Eigenschaften und Theoreme der z-Transformation x(t) oder x(k) ax(t) + bu(t) x(t + nT )
Z [x(t)] oder Z [x(k)]
aX(z) + bU (z)
zn X(z) −
n−1
x(kT )z−k
k=0
z−n X(z)
x(t − nT )
d X(z) dz d X(z) −z dz X zeaT
−T z
tx(t) kx(k) e−at x(t)
" # X zea z X a
e−ak x(k) a k x(k)
lim X(z)
x(0)
z→∞
- x(∞) x( k) = x1 (k) ∗ x2 (k)
lim
z→1
. 1 − z−1 X(z)
X(z) = X1 (z)X2 (z)
II.2 Inverse z-Transformierte inverse z-TransformierteUm die Möglichkeiten und Vorteile der z-Transformation in vollem Umfang nutzen zu können müssen wir auch im Stande sein, aus einer z-transformierten Funktion X(z) die entsprechenden diskreten Funktionswerte x(kT ) bzw. die diskreten Werte x(k) zu bestimmen. Zur Notation sei angemerkt, dass mit x(kT ) = Z −1 [X(z)] die inverse zTransformierte der Funktion X(z) zu verstehen ist. Es sei der Deutlichkeit wegen darauf verwiesen, dass die inverse z-Transformierte eine Wertesequenz der Funktion x(t) nur an den Stellen t = 0, T , 2T , . . . liefert, aber nichts bezüglich x(t) zwischen den diskreten Zeitpunkten aussagt. Neben der Verwendung entsprechend ausgedehnter Korrespondenz-Tabellen existieren im wesentlichen drei Methoden zur Bestimmung der inversen z-Transformierten: 1. die Methode der Polynomdivision 2. die Methode der Partialbruchzerlegung 3. die Lösung des Inversionsintegrals
II.2 Inverse z-Transformierte
385
Bei der Berechnung der inversen z-Transformierten wird, wie bisher, angenommen, dass die Wertesequenz x(kT ) bzw. x(k) null ist für k < 0. II.2.1 Verfahren der Polynomdivision Bei der in diesem Abschnitt vorzustellenden Methode erhält man die inverse z-Transformierte dadurch, dass man die Funktion X(z) in eine unendliche Potenzreihe in z−1 entwickelt und den jeweiligen Koeffizienten der entsprechenden Potenz in z mit dem diskreten Funktionswert x(kT ) identifiziert, wie im Anschluss gezeigt wird: Es gilt X(z) =
∞
x(kT )z−k = x(0) + x(T )z−1 + x(2T )z−2 + . . . + x(kT )z−k + . . .
k=0
oder X(z) =
∞
x(k)z−k = x(0) + x(1)z−1 + x(2)z−2 + . . . + x(k)z−k + . . . .
k=0
Beispiel II.9: Gesucht ist die diskrete Wertefolge x(k) für k = 0, 1, 2, 3, 4 wenn X(z) gegeben ist zu X(z) =
10z + 5 10z + 5 = 2 . (z − 1)(z − 0,2) z − 1,2z + 0,2
Wendet man auf die Funktion X(z) die Polynomdivision an, so erhält man " # X(z) = 10z + 5 : z2 − 1,2z + 0,2 = 10z−1 + 17z−2 + 18,4z−3 + 18,68z−4 +. . . − 10z + 12 − 2z−1 17 − 2z−1 − 17 + 20,4z−1 − 3,4z−2 18,4z−1 − 3,4z−2 − 18,4z−1 + 22,08z−2 − 3,68z−3 18,68z−2 + 22,41z−3 − 3,73z−4 .........
386
Anhang II
Es gilt also X(z) = 10z−1 + 17z−2 + 18,4z−3 + 18,68z−4 + . . . . Vergleicht man nun diese Wertefolge mit der allgemein gültigen Wertefolge X(z) =
∞
x(k)z−k = x(0) + x(1)z−1 + x(2)z−2 + x(3)z−3 + x(4)z−4 + . . . ,
k=0
so liefert der Koeffizientenvergleich zwischen den beiden letzten Gleichungen die diskreten Funktionswerte zu x(0) = 0;
x(1) = 10;
x(2) = 17;
x(3) = 18,4;
x(4) = 18,68.
Wie man bereits aus diesem ersten Beispiel ersehen kann, ist diese Form der Rücktransformation nur angebracht, wenn nur wenige der ersten Terme der diskreten Sequenz gesucht sind. Die Anwendung dieser Methode der Rücktransformation, so bequem sie zu nutzen ist, liefert jedoch, von wenigen Ausnahmen abgesehen, keinen geschlossenen Ausdruck zur Bestimmung der diskreten Wertefolge x(k) bzw. x(kT ). Beispiel II.10: Es ist die diskrete Wertefolge x(k) der z-Transformierten X(z) =
z−1 1 = z+1 1 + z−1
zu bestimmen. Durch die bereits bekannte Polynomdivision erhält man X(z) = z−1 : 1 + z−1 = z−1 − z−2 + z−3 − z−4 + − . . . . Vergleicht man diese unendliche Reihe wieder mit der allgemeinen Form von X(z), d.h. mit X(z) =
∞
x(k)z−k ,
k=0
so ergeben sich die diskreten Funktionswerte zu x(0) = 0;
x(1) = 1;
x(2) = −1;
x(3) = 1;
x(4) = −1; . . . .
II.2.2 Verfahren der Partialbruchzerlegung Die Rücktransformation unter Verwendung der Polynomdivision liefert zwar die diskreten Werte x(0), x(1), x(2), . . . bzw. die Funktionswerte zu den diskreten Zeitpunkten x(0), x(T ), x(2T ), . . . , es ist jedoch nur selten möglich, einen allgemeinen Ausdruck für eine diskrete
II.2 Inverse z-Transformierte
387
Wertefolge zu produzieren. Dieses nun alternative Verfahren verhält sich analog zur Partialbruchzerlegung im Rahmen der Laplace-Transformation und liefert im Gegensatz dazu einen geschlossenen Ausdruck für die diskrete Wertefolge x(kT ) bzw. x(k) einer z-transformierten Funktion X(z). Gehen wir aus von einer gegebenen z-Transformierten zu X(z) =
b0 zm + b1 zm−1 + . . . + bm−1 z + bm zn + a1 zn−1 + . . . + an−1 z + an
mit
n ≥ m.
Um X(z) in Partialbrüche zu zerlegen werden zunächst die Polstellen p1 , p2 , . . . , pn ermittelt und anschließend der Nenner in der Produktform angeschrieben: X(z) =
b0 zm + b1 zm−1 + . . . + bm−1 z + bm . (z − p1 ) (z − p2 ) . . . (z − pn )
Im nächsten Schritt wird nun der Ausdruck X(z) z in einfache Partialbrüche zerlegt, die mit Hilfe einer Korrespondenz-Tabelle ohne Schwierigkeiten in den diskreten Bereich rücktransformiert werden können. Dieser Schritt ist jedoch nur möglich, wenn die Funktion X(z) z eine Nullstelle X(z) an der Stelle z = 0 hat. (Warum z und nicht X(z) in Partialbrüche zerlegt wird, soll erst einige Zeilen später erläutert werden.) Die Zerlegung von X(z) z in Partialbrüche bekommt dann die Form X(z) c1 c2 cn = + + ... + , z z − p1 z − p2 z − pn wobei man die Koeffizienten c1 , c2 etc. für einfache Pole mit den Methoden der Funktionentheorie aus der Beziehung X(z) ci = (z − pi ) · z z=pi erhält. Falls X(z) z einen mehrfachen Pol enthält, beispielsweise eine zweifache Polstelle an der Stelle z = p1 und sonst nur einfache Pole enthält, so bekommt X(z) z die Form X(z) c2 c1 c3 cn = + + + ... + . 2 z z − p z − p z − pn (z − p1 ) 1 3 Die unbekannten Residuen erhält man dann aus den Beziehungen der Funktionentheorie zu X(z) c2 = (z − p1 )2 z z=p1
und c1 =
X(z) d . (z − p1 )2 dz z z=p1
388
Anhang II
Damit wird schließlich die tatsächlich gesuchte Partialbruchzerlegung der Funktion X(z) zu X(z) = c2
z z z z + c1 + c3 + . . . + cn . 2 (z − p1 ) z − p1 z − p3 z − pn
An dieser Stelle leuchtet nun ein, warum X(z) z und nicht X(z) in Partialbrüche zerlegt wird: Nachdem nämlich zum jeweiligen Partialbruch ci z − pi keine äquivalente diskrete Zeitfunktion korrespondiert, muss der Zwischenschritt vollzogen werden, zunächst X(z) durch z zu dividieren, um anschließend Partialbrüche der Form ci
z z − pi
zu erhalten, die nun sehr einfach in den diskreten Zeitbereich transformiert werden können. Diese Vorgehensweise wird nun anhand einiger Beispiele erläutert. Beispiel II.11: Gegeben sei eine z-transformierte Funktion zu "
X(z) =
# 1 − e−aT z " #, (z − 1) z − e−aT
wobei a eine Konstante und T die Abtastperiode ist; gesucht ist die inverse z-Transformierte x(kT ) unter Anwendung der Partialbruchzerlegung. Die Partialbruchzerlegung von X(z) z wird im vorliegenden Beispiel zu X(z) 1 1 = − z z − 1 z − e−aT und damit X(z) =
z z − . z − 1 z − e−aT
Unter Verwendung einer Korrespondenz-Tabelle erhält man die Inverse der beiden Partialbrüche zu z z Z−1 = e−akT . = 1 und Z−1 z−1 z − e−aT Damit wird die inverse z-Transformierte der Funktion X(z) zu x(kT ) = 1 − e−akT ,
mit
k = 0, 1, 2, . . . .
II.2 Inverse z-Transformierte
389
Beispiel II.12: Zur Funktion X(z) =
2z3 + z (z − 2)2 (z − 1)
ist die zugehörige Wertefolge x(k) zu bestimmen. Mit dem Ansatz 2z2 + 1 c2 c3 c1 X(z) = = + + 2 2 z (z − 2) (z − 1) (z − 2) z−2 z−1 folgt unter Anwendung der obigen Gleichungen zur Bestimmung der Residuen die Gleichung 1 9 3 X(z) − = + . z (z − 2)2 z−2 z−1 Damit wird X(z) zu 9z−1
X(z) = "
1 − 2z−1
#2 −
1 3 + . −1 1 − 2z 1 − z−1
Die Rücktransformierte der einzelnen Terme wird zu z−1 Z−1 = k(2k−1 ), k = 0, 1, 2, . . . (1 − 2z−1 )2 1 −1 Z = 2k , k = 0, 1, 2, . . . 1 − 2z−1 1 Z−1 = 1. 1 − z−1 Damit wird die gesuchte Rücktransformierte zu # " x(k) = 9k 2k−1 − 2k + 3, k = 0, 1, 2, . . . .
Nun muss natürlich der Fall besprochen werden, wie Aufgaben zu behandeln sind, bei denen das Zählerpolynom keine Nullstelle an der Stelle z = 0 aufweist. Die grundsätzliche Vorgehensweise soll dabei anhand eines einfachen Beispiels aufgezeigt werden: Gehen wir aus von der bekannten z-Transformierten mit X(z) =
2z + 1 . z−2
Die entsprechende Partialbruchzerlegung wird dann (ohne Division durch z!) bekanntlich zu X(z) =
a , z−2
390
Anhang II
wobei natürlich die Konstante a im konkreten Fall zunächst zu bestimmen wäre. Führt man nun eine Erweiterung der Form X(z) = az−1
z z−2
durch, so wird die entsprechende Rücktransformierte unter Anwendung des Rechtsverschiebungssatzes und bekannter Korrespondenz zu x(k) = a · 2k−1
mit k = 1, 2, 3, . . . .
Beispiel II.13: Gesucht ist die Rücktransformierte der z-Transformierten X(z) =
z+2 . (z − 2)z2
Die Partialbruchzerlegung von X(z) wird zu X(z) =
c2 a1 1 1 c1 1 + =− 2 − + + 2 z z z−2 z z z−2
bzw. X(z) = z−1
z − z−2 − z−1 . z−2
Unter Anwendung des Rechtsverschiebungssatzes werden die Rücktransformierten der einzelnen Terme zu . 2k−1 , k = 0, 1, 2, . . . z −1 −1 Z z z−2 = 0, k ≤ 0; Z−1 z−2 = Z−1 z−1 =
1, k = 2 0, k = 2 1, 0
k=1 . k = 1
Damit wird die inverse z-Transformierte der Funktion X(z) zu 0−0−0=0 k=0 1 − 0 − 1 = 0 k=1 x(k) = ; 2−1−0=1 k=2 k−1 2 − 0 − 0 = 2k−1 k = 3, 4, 5, . . .
II.2 Inverse z-Transformierte
391
In der zusammengefassten Form wird die gesuchte Inverse von X(z) zu für k = 0, 1 0 für k = 2 . x(k) = 1 2k−1 für k ≥ 3
Beispiel II.14: Für die Funktion X(z) =
z2 + z + 2 " # (z − 1) z2 − z + 1
ist unter Anwendung der Partialbruchzerlegung die inverse Funktion x(k) zu bestimmen. Die Partialbruchzerlegung bekommt zunächst in allgemeiner Darstellung die Form X(z) =
k1 k 2 z + k3 #; +" 2 z−1 z −z+1
im gegebenen Fall wird die Partialbruchzerlegung zu X(z) =
4 −3z + 2 4z−1 −3z−1 + 2z−2 + 2 = + . z−1 z −z+1 1 − z−1 1 − z−1 + z−2
Berücksichtigt man, dass die beiden Pole des zweiten Terms konjugiert komplex sind, so kann X(z) umgeschrieben werden zu X(z) =
−1 4z−1 0,5z−2 z − 0,5z−2 + − 3 1 − z−1 1 − z−1 + z−2 1 − z−1 + z−2
X(z) = 4z−1
1 1 − 0,5z−1 0,5z−1 − 3z−1 + z−1 . −1 −1 −2 1−z 1−z +z 1 − z−1 + z−2
Mit den Korrespondenzen . Z e−akT cos ωkT =
1 − e−aT z−1 cos ωT 1 − 2e−aT z−1 cos ωT + e−2aT z−2
. Z e−akT sin ωkT =
e−aT z−1 sin ωT 1 − 2e−aT z−1 cos ωT + e−2aT z−2
und
sowie Identifikationen e−2aT = 1 und cos ωT = den für das gegebene Beispiel√geeigneten 1 2 wird ωT = π 3 und sin ωT = 3 2.
392
Anhang II
Damit wird 1 − 0,5z−1 kπ = 1k · cos und −1 −2 1−z +z 3 √ 3 −1 z 1 0,5z−1 2 −1 √ = √1 · 1k · sin kπ = Z Z−1 −1 −2 −1 −2 1−z +z 3 31−z +z 3
Z−1
Damit erhalten wir das gesuchte Ergebnis zu (k − 1)π (k − 1)π 1 + √ 1k−1 sin x(k) = 4 1k−1 − 3 1k−1 cos 3 3 3 bzw. in der komprimierten Form zu 4 − 3 cos (k − 1)π + √1 sin (k − 1)π 3 3 x(k) = 3 0
k = 1, 2, 3, . . .
.
k≤0
Die ersten Werte für x(k) ergeben sich unter Anwendung dieser Beziehung zu x(0) = 0;
x(1) = 1;
x(2) = 3;
x(3) = 6;
x(4) = 7;
x(5) = 5; . . . .
II.2.3 Rücktransformation mit Hilfe des Inversionsintegrals Die im Folgenden zu beschreibende Vorgehensweise ist die aus mathematischer Sicht allgemeinste Technik zur Bestimmung der inversen z-Transformierten x(k) bzw. x(kT ) einer z-Transformierten X(z). Bevor jedoch diese Methode angewandt werden kann, ist zunächst ein kurzer Exkurs in die Grundlagen der Funktionentheorie notwendig. Es sei z0 ein isolierter singulärer Punkt, also ein Pol der komplexen Funktion F (z). Im Rahmen der Funktionentheorie wird gezeigt, dass eine positive Zahl r1 mit der Eigenschaft existiert, dass die Funktion F (z) in jedem Punkt z analytisch ist, für den 0 < |z − z0 | ≤ r1 erfüllt ist. Der Kreis mit seinem Mittelpunkt in z = z0 und dem Radius r1 sei mit C1 bezeichnet. Weiterhin soll ein Kreis C2 mit dem Radius r2 ≥ r1 definiert werden, dessen Mittelpunkt ebenso im Punkt z = z0 liegen soll. Die beiden Kreise C1 und C2 mit der Singularität z0 sind im Bild II.1 wiedergegeben. Die Laurent-Reihe der komplexen Funktion F (z) um den Pol z = z0 lautet F (z) =
∞
an (z − z0 )n +
n=0
∞ n=1
bn , (z − z0 )n
wobei die Koeffizienten an und bn gegeben sind zu F (z) 1 an = dz, n = 0, 1, 2, 3, . . . 2jπ (z − z0 )n+1 C1
(II.12)
II.2 Inverse z-Transformierte
393
und bn =
1 2jπ
C2
F (z) (z − z0 )−n+1
dz,
n = 1, 2, 3, . . .
Bild II.1: Analytisches Gebiet der Funktion F (z)
Der Koeffizient b1 wird aus obiger Gleichung bestimmt zu b1 =
1 2jπ
F (z)dz.
(II.13)
C2
In der Literatur komplexer Funktionen wird gezeigt, dass das Ergebnis der Integration gemäß der Gl. (II.13) unverändert bleibt, wenn der Integrationsweg C2 durch eine beliebige Kurve C um den Punkt z0 ersetzt wird, sofern F (z) auf und innerhalb dieser Kurve analytisch ist; siehe hierzu Bild II.2.
Bild II.2: Kennzeichnung des analytischen Gebiets einer komplexen Funktion F (z)
Die geschlossene Hüllkurve C darf auch außerhalb des Kreisrings C2 liegen, soweit keine weiteren Polstellen eingeschlossen werden. Bezugnehmend auf das Cauchy-Theorem gilt nämlich
394
Anhang II
F (z)dz =
C
F (z)dz. C2
Damit kann Gl. (II.13) auch formuliert werden als b1 =
1 2jπ
(II.14)
F (z)dz. C
Der Koeffizient b1 wird im Rahmen der Funktionentheorie als Residuum der komplexen Funktion F (z) an der Stelle z0 bezeichnet. Für die weiteren Betrachtungen sei angenommen, dass die Funktion F (z) innerhalb der geschlossenen Hüllkurve C analytisch ist, außer in den m isolierten Polstellen z1 , z2 , . . . , zm , wie im Bild II.3 angedeutet ist.
Bild II.3: Geschlossene Hüllkurve mit m eingeschlossenen Polstellen
Auf der Basis des Cauchy-Theorems wird das Umlaufintegral entlang des geschlossenen Kurvenzugs C zu
F (z)dz =
C
F (z)dz + . . . +
F (z)dz+ C1
C2
F (z)dz, Cm
wobei C1 , C2 , . . . , Cm geschlossene Kurvenzüge um die Polstellen z1 , z2 , . . . , zm der komplexen Funktion F (z) sind. Bezugnehmend auf obige Gleichung muss gelten
II.2 Inverse z-Transformierte
395
# " F (z)dz = 2jπ b1,1 + b1,2 + . . . + b1,m
C
(II.15)
,
= 2jπ (K1 + K2 + . . . + Km )
wobei K1 = b1,1 , K2 = b1,2 , . . . , Km = b1,m die Residuen der Funktion F (z) in den Polstellen z1 , z2 , . . . , zm sind. Die Gleichung (II.15) wird im Rahmen der Funktionentheorie als Residuensatz bezeichnet. Dieser Satz besagt, dass sich das Umlaufintegral im Gegenuhrzeigersinn einer bis auf m Polstellen analytischen Funktion F (z) entlang einer geschlossenen Kurve C zu 2jπ, multipliziert mit der Summe der Residuen an den Polstellen z1 , z2 , . . . , zm ergibt. Nun sollen das Cauchy-Theorem und der Residuensatz auf die Rücktransformation ztransformierter Funktionen in den diskreten Zeitbereich angewandt werden. Gemäß der Definition der z-Transformation ist bekannt X(z) =
∞
x(kT )z−k = x(0) + x(T )z−1 + x(2T )z−2 + . . . x(kT )z−k + . . . .
k=0
Multipliziert man (im Interesse der Bestimmung des Residuums) beide Seiten dieser Gleichung mit zk−1 , so erhält man X(z)zk−1 = x(0)zk−1 + x(T )zk−2 + . . . + x(kT )z−1 + . . . .
(II.16)
Nun ist aber die Gl. (II.16) gerade die Laurent-Reihe der Funktion X(z)zk−1 um den Punkt z = 0. Man stelle sich deshalb einen Kreis C mit seinem Mittelpunkt im Ursprung der z-Ebene vor, der sämtliche Polstellen der Funktion X(z)zk−1 umschließt. Beachtet man außerdem, dass der Koeffizient x(kT ) als begleitender Faktor von z−1 in der Gl. (II.16) gerade das Residuum ist, so muss gelten 1 x(kT ) = 2jπ
X(z)zk−1 dz.
(II.17)
C
Die Gl. (II.17) ist das gesuchte Inversionsintegral für die bekannte z-Transformierte X(z). Die Berechnung des Inversionsintegrals wird unter der Anwendung des Residuentheorems vollzogen. Dabei sei ganz allgemein angenommen, dass die Pole der Funktion X(z)zk−1 mit z1 , z2 , . . . , zm bezeichnet seien. Weil definitionsgemäß die geschlossene Hüllkurve C sämtliche Polstellen umschließt, muss bezugnehmend auf Gl. (II.15) gelten:
X(z)zk−1 dz =
C
C1
X(z)zk−1 dz+ . . . +
X(z)zk−1 dz+ C2
X(z)zk−1 dz Cm
,(II.18)
= 2jπ · (K1 + K2 + . . . + Km ) wobei K1 , K2 , . . . , Km die Residuen der Funktion X(z)zk−1 an den Polstellen z1 , z2 , . . . , zm sind und C1 , C2 , . . . , Cm kleine geschlossene Kurven um die isolierten Polstellen symbolisie-
396
Anhang II
ren. Zum Schluss der Betrachtung werden nun die Gleichungen (II.15) und (II.16) kombiniert; daraus erhalten wir x(kT ) = x(k) = K1 + K2 + . . . + Km =
m
. Residuen der Fkt. X(z)zk−1 an den Polstellen z = zj .
(II.19)
j =1
Wenn die Funktion X(z)zk−1 nur einfache Pole aufweist, dann erhält man das Residuum K an der Polstelle z = zj zu K = lim
z→zj
-" . # z − zj X(z)zk−1 .
In Fällen, bei denen X(z)zk−1 einen q-fachen Pol an der Stelle z = zj hat, errechnet sich, analog zum Laplace-Bereich, das Residuum K an dieser Stelle zu K=
1 · lim (q − 1) ! z→zj
. #q dq−1 -" k−1 · X(z)z z − z . j dzq−1
Schließlich darf nicht unerwähnt bleiben, dass die Berechnung der Residuen relativ aufwändig wird, wenn die Funktion X(z)zk−1 an der Stelle z = 0 einen ein- oder mehrfachen Pol besitzt. In solchen Fällen kommt man erfahrungsgemäß mit der Partialbruchzerlegung schneller zum gewünschten Ergebnis. Die Vorgehensweise bei der Rücktransformation unter Anwendung des Residuensatzes soll nun anhand von zwei Beispielen aufgezeigt werden: Beispiel II.15: Für die z-Transformierte " # z 1 − e−aT # X(z) = " z − 1)(z − e−aT ist unter Anwendung des Residuensatzes die Wertefolge x(kT ) zu bestimmen. Die Funktion X(z)z
k−1
# " zk · 1 − e−aT " # = (z − 1) z − e−aT
hat zwei einfache Pole an den Stellen z1 = 1 und z2 = e−aT . Die Gl. (II.19) wird für das gegebene Beispiel zu x(k) =
2 i=1
# 1 − e−aT zk # an den Polstellen z = zi " Residuen von (z - 1) z − e−aT
= K1 + K 2
"
II.2 Inverse z-Transformierte
397
mit
# 1 − e−aT zk # =1 " K1 = lim (z − 1) z→1 (z − 1) z − e−aT "
und K2 =
z−e
lim
z→e−aT
−aT
# 1 − e−aT zk " # = −e−akT . (z − 1) z − e−aT "
Damit wird die gesuchte Wertefolge zu x(kT ) = K1 + K2 = 1 − e−akT
mit
k = 0, 1, 2, . . . .
Beispiel II.16: Für die komplexe Funktion X(z) =
z2 " # (z − 1)2 z − e−aT
ist die diskrete Wertefolge mit Hilfe des Inversionsintegrals zu bestimmen. In Ergänzung zum ersten Beispiel soll hier vor allem die Vorgehensweise bei Beispielen mit mehrfachen Polstellen aufgezeigt werden. Die Funktion X(z)zk−1 =
(z
zk+1 " # z − e−aT
− 1)2
hat eine einfache Polstelle im Punkt z1 = e−aT und einen Doppelpol an der Stelle z2 = 1. Bezugnehmend auf Gl. (II.19) wird die gesuchte Wertefolge x(k) = K1 + K2 mit K1 =
lim
z→e−aT
z−e
−aT
zk+1 " # z − e−aT (z − 1)2
e−a(k+1)T #2 1 − e−aT
="
und k d zk+1 e−aT 2" # = (z − 1) − K2 = lim " #2 z→1 dz 1 − e−aT z − e−aT (z − 1)2 1 − e−aT zu
398
Anhang II
e−aT · e−akT k e−aT x(k) = K1 + K2 = " − #2 + " #2 bzw. 1 − e−aT 1 − e−aT 1 − e−aT " # e−aT 1 − e−akT kT #− " x(k) = " mit k = 0, 1, 2, . . . . #2 T 1 − e−aT 1 − e−aT
II.2.4 Lösung von Differenzengleichungen mit Hilfe der z-Transformation Wir gehen aus von einem linearen, zeitinvarianten, diskreten System, das durch die Differenzengleichung y(k) + a1 y(k − 1) + a2 y(k − 2) + . . . + an y(k − n) = b0 u(k) + b1 u(k − 1) + b2 u(k − 2) + . . . + bm u(k − m)
(II.20)
beschrieben wird, wobei mit u(k) die Eingangsgröße und mit y(k) die Ausgangsgröße des betrachteten Systems bezeichnet sei. Wird nun diese Differenzengleichung in den z-Bereich transformiert, so muss, entsprechend der Linearitätsregel der z-Transformation, jeder einzelne Term in den z-Bereich übertragen werden. Mit Z [u(k)] = U (z)
und Z [y(k)] = Y (z)
sowie unter Beachtung des Rechts- bzw. Linksverschiebungssatzes können (einschließlich der Anfangsbedingungen) auch die Terme u(k − 1), u(k − 2), . . . etc. in den z-Bereich transformiert werden. Die folgende Tabelle zeigt Korrespondenzen, mit Hilfe derer eine Transformationen von Differenzengleichungen in den z-Bereich und umgekehrt besonders einfach wird. Tabelle II.3: z-Transformierte diskreter Funktionswerte Diskrete Funktion
z−Transformierte
y(k + 4)
z4 Y (z) − z4 y(0) − z3 y(1) − z2 y(2) − zy(3)
y(k + 3)
z3 Y (z) − z3 y(0) − z2 y(1) − zy(2)
y(k + 2)
z2 Y (z) − z2 y(0) − zy(1)
y(k + 1)
zY (z) − zy(0)
y(k)
Y (z)
y(k − 1)
z−1 Y (z)
y(k − 2)
z−2 Y (z)
y(k − 3)
z−3 Y (z)
y(k − 4)
z−4 Y (z)
II.3. Abbildung der s-Ebene in die z-Ebene
399
Anhand des folgenden Beispiels soll die Bestimmung der diskreten Wertefolge einer vorgegebenen Differenzengleichung mit Hilfe der z-Transformation gezeigt werden. Beispiel II.17: Es ist die Lösung der Differenzengleichung y(k + 2) + 3y(k + 1) + 2y(k) = 0 mit den Anfangsbedingungen y(0) = 0, y(1) = 1 zu bestimmen. Unter Verwendung der obigen Tabelle wird die z-Transformierte der gegebenen Differenzengleichung zu z2 Y (z) − z2 y(0) − zy(1) + 3zY (z) − 3zy(0) + 2Y (z) = 0. Durch Einsetzen der entsprechenden Anfangswerte und vereinfachender Zusammenfassung erhält man Y (z) =
z z z = − z2 + 3z + 2 z+1 z+2
bzw.
Y (z) =
1 1 − . 1 + z−1 1 + 2z−1
Mit Z−1
1 = (−1)k 1 + z−1
und Z−1
1 = (−2)k 1 + 2z−1
wird die gesuchte Differenzengleichung zu y(k) = (−1)k − (−2)k
mit k = 0, 1, 2, . . .
II.3 Abbildung der s-Ebene in die z-Ebene Im Zuge der Dimensionierung kontinuierlicher Regelkreise ist bekanntlich die Lage der Polstellen des geschlossenen Regelkreises in der s-Ebene maßgeblich für das Zeitverhalten der Regelgröße. Dementsprechend ist auch die Lage der Pol- und Nullstellen in der z-Ebene ein wichtiges Kriterium für das Zeitverhalten diskreter Regelsysteme. Im Folgenden soll deshalb aufgezeigt werden, in welchen Punkten charakteristische Gebiete der s-Ebene in die z-Ebene abgebildet werden. Zwischen den komplexen Variablen s und z besteht der bekannte Zusammenhang z = esT . Weil die komplexe Variable s einen Realteil σ und einen Imaginärteil ω besitzt, muss natürlich gelten
400
Anhang II
s = σ + jω und damit z = e(σ +jω)T = eσ T · ejωT
(II.21)
bzw. wegen der Mehrdeutigkeit der komplexen Ebene bez. der Winkel z = eσ T · ej(ωT +2πk)
mit k = 0, 1, 2, . . . .
Aus dieser Gleichung ist zu sehen, dass Pole und Nullstellen der s-Ebene für Frequenzen, die ein ganzzahliges Vielfaches der Abtast(kreis)frequenz ωs =
2π T
sind, in denselben Punkt der z-Ebene abgebildet werden. Diese Eigenschaft hat wiederum zur Konsequenz, dass eine unendliche Anzahl von s-Werten in einen Punkt der z-Ebene abgebildet wird. Bezugnehmend auf Gl. (II.21) korrespondiert die linke s-Halbebene wegen Re(σ ) < 0 mit |z| < 1. Die Imaginärachse der s-Ebene, entsprechend σ = 0, wird, resultierend aus der gleichen Überlegung, in den Einheitskreis der z-Ebene abgebildet und die rechte s-Halbebene wird wegen Re(σ ) > 0 in das Gebiet außerhalb des Einheitskreises der z-Ebene abgebildet. II.3.1 Primärstreifen und komplementäre Fortsetzung Auf jedem beliebigen Punkt der imaginären Achse der s-Ebene gilt |z| = 1 und wegen arg(z) = ωT durchläuft der Winkel von z den gesamten Zahlenbereich von −∞ bis +∞, wenn die Kreisfrequenz ω den gesamten Zahlenbereich −∞ ≤ ω ≤ +∞ durchquert. Betrachten wir nun den Sonderfall, dass der repräsentative Punkt entlang der Imaginärachse der s-Ebene den Bereich − ω2s ≤ ω ≤ ω2s durchläuft. Für diesen Fall erhalten wir neben |z| = 1 auch −π ≤ arg(z) ≤ π, wobei der Einheitskreis in der z-Ebene entgegen dem Uhrzeigersinn durchlaufen wird. Wenn nun der repräsentative Punkt den Frequenzbereich ω2s ≤ ω ≤ 3 ω2s auf der jω-Achse überstreicht, dann durchfährt der abgebildete Punkt in der z-Ebene den Einheitskreis ein weiteres Mal im Gegenuhrzeigersinn. Wenn schließlich der angenommene Punkt im Extremfall die gesamte Imaginärachse der sEbene von −∞ ≤ ω ≤ +∞ durchfährt, dann überstreicht der entsprechend abgebildete Punkt den Einheitskreis der z-Ebene unendlich viele Male. Aus dieser Betrachtung lässt sich der eindeutige Schluss ziehen, dass jeder Streifen der Breite ωs der linken s-Halbebene in das Innere des Einheitskreises der z-Ebene abgebildet wird. Auf Grund dieses Effekts ist es nahe liegend, die gesamte linke s-Ebene in eine unendliche Zahl periodischer Streifen der Breite ωs einzuteilen, wie dies im Bild II.4 gezeigt ist.
II.3. Abbildung der s-Ebene in die z-Ebene
401
Bild II.4: Periodische Streifen der s-Ebene und korrespondierendes Gebiet der z-Ebene
Der so genannte Primärstreifen überdeckt den Bereich − ω2s ≤ ω ≤ ω2s ; dieser Bereich kommt im Übrigen dem Hauptwert aus der Mathematik gleich. Die periodischen Fortsetzungen (komplementäre Streifen) überdecken die Bereiche ω2s ≤ ω ≤ 3 ω2s , 3 ω2s ≤ ω ≤ 5 ω2s in positiver und negativer Richtung entlang der ω-Achse der s-Ebene. Dabei sollte man beachten, dass jeder Punkt des Einheitskreises der z-Ebene Frequenzen zwischen − ω2s und + ω2s nur dann eindeutig repräsentiert, wenn die Abtastkreisfrequenz ωs doppelt so groß ist wie die höchste im betrachteten System vorkommende Frequenzkomponente. II.3.2 Linien konstanten Betrags in der z-Ebene Linien mit konstantem Realteil, also σ = konst. in der s-Ebene werden in der z-Ebene in Kreise mit dem Radius z = eσ T abgebildet. Bild II.5 zeigt die Abbildung einiger σ -Werte, wobei logischerweise Linien mit σ < 0 in Kreise mit |z| < 1 abgebildet werden. Die entsprechende Aussage gilt für σ > 0. II.3.3 Linien konstanter Frequenz in der z-Ebene Eine Linie konstanter Frequenz, beispielsweise ω = ω1 , entsprechend Bild II.6 wird in der z-Ebene in eine radiale Gerade abgebildet, die mit der reellen Achse den Winkel ϕ(z) = arg(ω1 T ) einschließt. Dabei sollte im Besonderen beachtet werden, dass •
Linien der Frequenz ω = ± ω2s der linken s-Halbebene mit der negativ reellen Achse der z-Ebene zwischen 0 und −1 korrespondieren, und
402
Anhang II
Bild II.5: a) Linien mit σ = konst. in der s-Ebene; b) korrespondierende Kreise in der z-Ebene
• • •
Linien der Frequenz ω = ± ω2s der rechten s-Halbebene mit der negativ reellen Achse zwischen −1 und −∞ korrespondieren. Außerdem ist festzustellen, dass die negativ reelle Achse der s-Ebene mit der positiv reellen Achse der z-Ebene zwischen 0 und 1 korrespondiert und schließlich Linien der Frequenzen ω = ±nωs (n = 0, 1, 2, . . .) der rechten s-Halbebene auf die positiv reelle Achse der z-Ebene zwischen +1 und +∞ abgebildet werden.
Bild II.6: a) Linien konstanter Frequenz in der s-Ebene; b) korrespondierende Linien in der z-Ebene
II.3. Abbildung der s-Ebene in die z-Ebene
403
II.3.4 Linien konstanter Dämpfung in der z-Ebene Im Folgenden wird gezeigt, dass eine Linie konstanter Dämpfung, eine radiale Gerade in der s-Ebene, als logarithmische Spirale in der z-Ebene abgebildet wird. Die charakteristischen Eigenwerte eines Systems zweiter Ordnung ergeben sich bekanntlich aus den Lösungen der charakteristischen Gleichung s 2 + 2dω0 s + ω02 = 0 zu
s1/ 2 = −ω0 d ± jω0 1 − d 2 = −ω0 d ± jωd ,
mit ω0 d √ ωd = ω0 1 − d 2
Eigenfrequenz des ungedämpften Systems (dimensionslose) Dämpfungskonstante Eigenfrequenz des gedämpften Systems
Bezüglich der Lage dieser Kennwerte wird auf Bild II.7 verwiesen.
Bild II.7: a) Linie konstanter Dämpfung in der s-Ebene; b) korrespondierende Linie im z-Bereich
Eine Linie konstanter Dämpfung unterliegt, entsprechend der Abbildungsvorschrift z = esT , in der z-Ebene der Gleichung z = es1 T = exp (−ω0 dT + jωd T ) . Trennt man diesen komplexen Ausdruck in Betrag und Phase, so erhalten wir
2dπ ωd ωd z = exp − √ + j2π ωs 1 − d 2 ωs mit
2dπ
ωd |z| = exp − √ 2 1 − d ωs
(II.22)
404
Anhang II
und ϕ(z) = arg(z) = 2π
ωd . ωs
(II.23)
Aus den beiden letzten Gleichungen ist unschwer zu erkennen, dass mit steigender Frequenz der Betrag von z exponentiell ab- und die Phase linear zunimmt; diese Feststellung geht übrigens auch aus Bild II.7 b) deutlich hervor. (In der Mathematik werden Funktionen dieser Art als logarithmische Spiralen bezeichnet.) Anhand der Gl. (II.22) ist unschwer zu erkennen, dass für ein gegebenes Verhältnis ωωds der Betrag von z ausschließlich eine Funktion der Dämpfung und der dazu entsprechende Winkel ϕ(z) eine Konstante wird. Gehen wir beispielsweise von einer Dämpfung von d = 0,3 und einem Verhältnis von 0,25 aus, so bekommen wir mit Gl. (II.22) den Betrag von z zu
ωd ωs
=
2π · 0,3 |z| = exp − · 0,25 = 0,610 1 − 0,32 und mit Gl. (II.23) den entsprechenden Winkel von z zu ϕ(z) = 2π · 0,25 = 0,5π = 90◦ . Analog erhält man für ωd = 0,5 ωs
2π · 0,3 |z| = exp − · 0,5 = 0,372 1 − 0,32
und
ϕ(z) = 2π · 0,5 = π = 180◦ . Anhand dieser beiden Beispiele ist zu sehen, dass man die logarithmische Spirale in Abhängigkeit der bezogenen Frequenz ωωds parametrisieren kann; siehe hierzu Bild II.7 b). Sobald nämlich die Abtastfrequenz ωs festgelegt ist, ergibt sich die gedämpfte Eigenfrequenz ωd folgendermaßen: Wenn beispielsweise ωs = 10 rad/sec als vorgegeben angenommen wird, dann gilt für den Punkt P (im Bild II.7 b)) ϕ(z) =
π ωd = 2π · 6 10
und damit ωd =
1 5 ωs = π rad/sec . 12 6
II.3. Abbildung der s-Ebene in die z-Ebene
405
Bild II.8: Linien konstanter Dämpfung im z-Bereich
Bild II.8 zeigt Linien konstanter Dämpfung für einige Dämpfungswerte. Dabei ist zu bemerken, dass diese Linien nur in der oberen z-Halbebene entsprechend einem Frequenzbereich 0 ≤ ω ≤ ω2s eingetragen sind. Die dazu spiegelbildlich liegenden Linien der unteren zHalbebene würde man für − ω2s ≤ ω ≤ 0 erhalten. Schließlich muss noch darauf verwiesen werden, dass die Linien konstanter Dämpfung senkrecht zu den Linien konstanter Eigenfrequenz ω0 in der s-Ebene verlaufen, wie Bild II.9 zeigt. In der z-Ebene schneiden die Linien konstanter Eigenfrequenz ebenso die Linien konstanter Dämpfung unter 90◦ , wie anhand Bild II.9 b) festzustellen ist. Abbildungen dieser Art, d.h. wenn entsprechende Winkel erhalten bleiben, werden übrigens in der Mathematik als konforme Abbildung bezeichnet.
Bild II.9: a) Orthogonalität von Linien konstanter Dämpfung d und konstanter Eigenfrequenz ω0 in der s-Ebene; b) korrespondierende Linien in der z-Ebene
Literaturverzeichnis Grundlagen der Regelungstechnik Böttiger, A.: Regelungstechnik. Oldenbourg, München, 1998. Brockhaus, R.: Flugregelung II. Oldenbourg, München, 1979. Carvalho, J.L.: Dynamical Systems and Automatic Control. Prentice Hall, New York, 1993. Chen, Ch.-T.: Analog and Digital Control System Design. Saunders College Publication, New York, 1993. Cremer, M.: Regelungstechnik. Springer, Berlin, 1988. Dickmanns, E. D.: Systemanalyse und Regelkreissynthese. Teubner, Stuttgart, 1985. Dorf, R., Bishop, R.: Modern Control Systems. Addison-Wesley Publishing Company, New York, 1995. Dörrscheidt/Latzel: Grundlagen der Regelungstechnik. Teubner, Stuttgart, 1989. Ebel, T.: Beispiele und Aufgaben zur Regelungstechnik. Teubner, Stuttgart, 1991. Föllinger, O.: Regelungstechnik. Einführung in ihre Methode und ihre Anwendungen. Hüthig, Heidelberg, 1992. Franklin, G. et al.: Feedback Control of Dynamic Systems. Addison-Wesley, New York, 1994. Heimann, B. et al.: Mechatronik. Fachbuchverlag, Leipzig, 2001. Jörgl, P.: Repetitorium Regelungstechnik. Oldenbourg, München, 1995. Kuo, B.C.: Automatic Control Systems. Prentice Hall, Englewood Cliffs, 1981. Leonhard, W.: Regelung in der elektrischen Antriebstechnik. Teubner Studienbücher, Stuttgart, 1973. Ludyk, G.: Theoretische Regelungstechnik, 1/2. Springer, Berlin, 1995. Lunze, J.: Regelungstechnik. 2. Auflage, Springer, Berlin, 1999. Lutz, H., Wendt, W.: Taschenbuch der Regelungstechnik. Harri Deutsch, Frankfurt/Main, 1995. Mann, H. et al.: Einführung in die Regelungstechnik. Carl Hanser, Leipzig, 1997. Pfaff, G.: Regelung elektrischer Antriebe. Oldenbourg, München, 1987. Philipps, C.: Feedback Control Systems. Prentice Hall, New Jersey, 1996. Reuter/Zacher: Regelungstechnik für Ingenieure. Vieweg, Wiesbaden, 2002. Schlitt, H.: Regelungstechnik. Vogel Verlag, Würzburg, 1993. Schmidt, G.: Grundlagen der Regelungstechnik. Springer, Berlin, 1991. Schulz, G.: Regelungstechnik. Springer, Berlin, 2002. Shinners, S.: Modern Control System, Theory and Design. John Wiley, Inc., New York, 1992. Tröster, F.: Steuerungs- und Regelungstechnik für Ingenieure. Oldenbourg, München, 2001. Unbehauen, H.: Regelungstechnik I und II. Vieweg, Braunschweig, 1992. Weinmann, A.: Regelungen – Analyse und technischer Entwurf. 2. Auflage, Springer, Berlin, 1995.
Literaturverzeichnis
407
Regelkreissynthese im Zustandsraum Föllinger, O.: Einführung in die Zustandsbeschreibung dynamischer Systeme. Oldenbourg, München, 1982. Freund, E.: Regelungssysteme im Zustandsraum. Bd. I und II. Oldenbourg, München, 1987. Hippe/Wurmthaler: Zustandsregelung. Springer, Berlin, 1985. Korn, U.: Mehrgrößenregelungen. Verlag Technik, Berlin, 1982. Luenberger, D.: An Introduction to Observers. IEEE Trans. AC-16, (1971), pp. 596–602. Strejc, V.: State Space Theory of Discrete Linear Control. Academia, Prag, 1981. Willems, J.C.: Controllability, Observability, Pole Allocation. IEEE, Trans. Automatic Control, AC-16, (1971), pp. 582–595.
Digitale Regelungstechnik Ackermann, J.: Abtastregelung. Springer, Berlin, 1988. Antoniou, A.: Digital Filters. McGraw-Hill, New York, 1997. Aström/Wittenmark: Computer-Controlled Systems. Prentice Hall, New Jersey, 1997. Baumgarth, S. et al.: Digitale Regelung und Steuerung in der Versorgungstechnik. Springer, Berlin, 1995. Braun, A.: Digitale Regelungstechnik. Oldenbourg, München, 1997. Bristol, E. H.: Design and Programming Control Algorithms for DDC Systems. Control Engineering, 24, pp 24–26, Jan. 1977. Büttner, W.: Digitale Regelungssysteme. Vieweg, Wiesbaden, 1990. Föllinger, O.: Lineare Abtastsysteme. Oldenbourg, München, 1993. Garbrecht, F.: Digitale Regelungstechnik. Springer, Berlin, 1991. Gausch, R. et al.: Digitale Regelkreise. Oldenbourg, München, 1993. Houpis/Lamont, G.: Digital Control Systems. McGraw-Hill, New York, 1992. Isermann, R.: Digitale Regelungssysteme. Springer, Berlin, 1987. Lacroix, A.: Digitale Filter. Oldenbourg, München, 1988. Leonhard, W.: Digitale Signalverarbeitung in der Mess- und Regelungstechnik. Teubner, Stuttgart, 1989. Mitra, S.K.: Digital Ladder Networks. IEEE Trans., AU-21, (1973), pp. 30–36. Ogata, K.: Discrete-Time Control Systems. Prentice Hall, New York, 1995. Oppenheim, A.V.: Discrete-Time Signal Processing. Prentice Hall, Massachusetts, 1989. Oppenheim, A.V.: Zeitdiskrete Signalverarbeitung. Oldenbourg, München, 1995. Paraskevopoulos, P.: Digital Control Systems. Prentice Hall, Englewood Cliffs, 1996. Philipps, C.: Digital Control System, Analysis and Design. Prentice Hall, New Jersey, 1995. Schönfeld, R.: Digitale Regelung elektrischer Antriebe. Hüthig, Heidelberg, 1988. Schüßler, H.W.: Digitale Signalverarbeitung. Springer, Berlin, 1988. Vaccaro, R. J.: Digital Control. McGraw-Hill, New York, 1995. Wellenreuther, G.: Automatisieren mit SPS. Vieweg, Braunschweig, 2001.
408
Literaturverzeichnis
Optimale Regelprozesse Bryson, A.: Applied Optimal Control. Taylor & Francis Group, London, 1975. Föllinger, O.: Optimierung dynamischer Systeme. Oldenbourg, München, 1988. Papageorgiou, M.: Optimierung. Oldenbourg, München, 1991. Ziegler, Nichols: Optimum Settings for Automatic Controllers. ASME Trans., 64, (1942), pp. 759–768.
Adaptive Regelsysteme und Neuronale Netzwerke Bayliss, L.: Living Control Systems. University Press, London, 1966. Böcker, J. et al.: Nichtlineare und adaptive Regelungssysteme. Springer, Berlin, 1986. Haykin, S.: Neural Networks. Prentice Hall, New Jersey, 1999. Miller, T. et al.: Neural Networks for Control. MIT-Press, London, 1990.
Mathematische Grundlagenbücher zur Regelungstechnik Beucher, O.: MATLAB und SIMULINK. 2. Auflage, Addison-Wesley München, 2002. Brauch, W. et al.: Mathematik für Ingenieure. 9. Auflage, Teubner, Stuttgart, 1995. Cannon, R.: Dynamics of Physical Systems. McGraw-Hill, New York, 1967. Churchill, R.: Complex Variables and Applications. McGraw-Hill, New York, 1990. Doetsch, G.: Anleitung zum praktischen Gebrauch der Laplace-Transformation und der z-Transformation. 5. Auflage, Oldenbourg, München, 1985. Föllinger, O.: Laplace- und Fourier-Transformation für Ingenieure. Hüthig, Heidelberg, 1990. Göldner, K.: Mathematische Grundlagen der Systemanalyse. Bd. I und II. Harri Deutsch, Frankfurt/Main, 1981. Heidepriem, J.: Prozessinformatik. Bd. 1 und 2, Oldenbourg, München, 2001. Hoffmann, J.: MATLAB und SIMULINK. Addison-Wesley, Bonn, 1998. Marko, H.: Methoden der Systemtheorie. 3. Auflage, Springer, Berlin 1995. Mildenberger, O.: Grundlagen der Systemtheorie für Nachrichtentechniker. Oldenbourg, München, 1981. Needham, T.: Anschauliche Funktionentheorie. Oldenbourg, München, 2001. Ogata, K.: Designing Linear Control Systems with MATLAB. Prentice Hall, Inc., New Jersey, 1994. Unbehauen, R: Systemtheorie. Oldenbourg, München, 1993. Weber, H.: Laplace-Transformation. 7. Auflage, Teubner, Stuttgart, 2003. Zurmühl, R.: Praktische Mathematik. Springer, Berlin, 1965. Zurmühl, R.: Matrizen. Springer, Berlin, 1964.
Sachwortverzeichnis A Abbildung –, bilineare 338 –, konforme 405 Abbildungs-Theorem 75, 77 abgetastetes Signal 262 Abtaster 270 –, idealisierter 264 Abtast/Halte-Glied 265 Abtastperiode 270, 348 Abtastrate 347 Abtasttheorem, Shannon’sches 348 Abtastung, periodische 264 Abtastzeitpunkt 264 Ackermann’sche Formel 208 Adjungierte 170 A/D-Konverter, sukzessiver 265 Ähnlichkeitssatz 353 Änderungsgeschwindigkeit 36 Äquivalenz 299 algebraisches Kriterium 69 Aliasing-Phänomen 348 Allpass erster Ordnung 153 Amplitude 123 Amplitudenbedingung 89, 91, 100, 319 Amplitudengang 22, 38, 125, 341 Amplitudenrand 84, 85, 341 Analog/Digital-Wandler 263–265 analoges Signal 262 Analyse von Systemen 48 analytischer Punkt 75 Anfangswertsatz 355, 380 Ankerkreis 28 Anstellwinkel 135 Anstiegszeit 115, 131, 150, 158, 315 Anti-Aliasing-Filter 349 Antrieb, servomechanischer 109 aperiodischer Fall 59 aperiodischer Grenzfall 58 Approximationsregister 266 Arbeitskolben 19 Arbeitspunkt 18, 152 Asymptote 23, 317 asymptotische Stabilität 197 Ausgangsgleichung 162
Ausgangsgröße 13, 52 –, stationäre 122 Ausgangsimpedanz 44 Ausgangsmatrix 163 Ausgangsvektor 163 Ausregelzeit 115, 150, 315 Austrittswinkel 99, 100, 318 automatische Regelung 11
B Bandbreite 131, 154, 348 Bellman 13 Beobachtbarkeit 179 Beobachtbarkeitsmatrix 179 Beobachtbarkeitsnormalform 227 Beobachter 220 Beobachter-Dynamik 222 Beobachter-Matrix 226, 230 Beobachterpol 223 Beobachterprinzip 231 Beobachtungsnormalform 183 Beschleunigungsfunktion 48 Beschleunigungskonstante 65 Beschleunigungsregelung 65 Betrag 21 Betragskennlinie 125 Bewegungsgleichung 214 Bildbereich 161, 169 bilineare Abbildung 338 bilineare Transformation 280, 304 Binärwort 265 Binärzahl 262, 265 bleibende Regelabweichung 35, 108 Blockschaltbild 24, 30, 56, 282 Bode 13, 133 Bode-Diagramm 21, 124, 341 Bode-Normalform 124 Boden-Radarsystem 65
C Cauchy-Theorem 75, 393 Cayley-Hamilton-Theorem 175, 204, 209 charakteristische Gleichung 14, 57, 69, 74, 78, 88, 172, 193, 206, 274, 316, 403 charakteristische Wurzel 172 Computer-Simulation 218
410
D Dämpfer 27 Dämpfung 131 Dämpfungsfaktor 57, 110 Dämpfungsgrad 127, 150, 151 Dämpfungskraft 27 Dämpfungsregel 379 Dämpfungssatz 353 Dämpfungswinkel 151 Delta-Impuls 269 Diagonalform 185, 187 Differenzengleichung 268, 292, 398 Differenzialgleichung 13 –, homogene 369 –, inhomogene 369 Differenzialgleichung zweiter Ordnung 55 Differenziation, komplexe 352 Differenziationsregel 351 Differenziationszusatz 36 differenzielle Spannungsverstärkung 44 differenzieller Übertragungsbeiwert 36 differenzierendes Übertragungsglied 51 Differenz-Verstärker 44 Digital/Analog-Umsetzer 266 Digital/Analog-Wandler 264 digitale Regelungstechnik 262 digitaler Regelkreis 286 digitaler Regler 262 digitaler Standard-Regelkreis 263 digitales Filter 292, 299 digitales Signal 262 Dirac’sche Deltafunktion 361 Dirac-Stoß 48 direkte Methode 226, 299 direkte Programmierung 294 direkte Substitution 208 diskret 288 diskrete Faltung 382 diskrete Faltungssumme 383 diskrete Wertefolge 372 diskreter PID-Regler 291 diskreter Regler 299 diskretes Signal 262 dominanter Pol 333 dominantes Polpaar 115, 150, 203 Doppelintegrator 326 Doppelpol 102 Drehzahlregelung 11
Sachwortverzeichnis Dreipunktregler 34 Dreipunktregler mit Hysterese 34 Druckregelung 32 Druckregler ohne Hilfsenergie 32 Durchgangsmatrix 163 Durchtrittsfrequenz 84, 132, 134 Durchtrittsphasenwinkel 84 Dynamik 121 dynamisches Modell 220 dynamisches System 24 dynamisches Verhalten 60, 162
E Eckfrequenz 39, 125, 136 Eigenbewegung 122, 168 Eigenfrequenz 150 –, ungedämpftes System 110, 151 Eigenkreisfrequenz 112 –, gedämpfte Schwingung 58 –, ungedämpfte Schwingung 57 Eigenvektor 173 Eigenverhalten 14 Eigenwert 172 –, spezifizierter 206 Eingang –, invertierender 44 –, nicht invertierender 44 Eingangsgröße 13 Eingangsimpedanz 44 Eingangsmatrix 163 Eingrößensystem 171 Einheitsimpuls 48, 361, 371 Einheitssprung 358 Einstellregel 159 –, empirische 158 Eintrittswinkel 318 elektromotorische Gegenspannung 28 empirische Einstellregel 158 Endwertsatz 62, 354, 381 Energie –, kinetische 166 –, potenzielle 166 Energiespeicher, verschiedenartige 55 Entwurfsforderungen 108 Ersatztotzeit 158 Ersatzzeitkonstante 158 erstes Newton’sches Gesetz 55 erstes Theorem 133
Sachwortverzeichnis erzwungene Reaktion 169 Exponentialfunktion 360
F Faltung 356 –, diskrete 382 Faltungsintegral 356 Faltungssatz 356 Faltungssumme, diskrete 383 Federkonstante 27 Feder-Masse-Dämpfungs-System 26, 55 Fehler, stationärer 39, 53, 63, 66, 129 Fehlerdynamik 225 Festwertregelung 31 fiktiver Frequenzbereich 339 Filter, digitales 292, 299 Fliehkraftpendel 12 Fluglagenregelung 109, 146 Flugobjekt 65 Folgeregelung 31 freie Reaktion 168, 169 Frequenzantwort 122 Frequenzbereich 339 –, fiktiver 339 Frequenzgang 21, 50 –, logarithmischer 124 Frequenzgang-Methode 121, 299, 338 Frequenzkennlinie 21 Frequenzverhalten 37, 48 Frobenius-Form 180 Führungsgröße 11 Führungsübertragungsfunktion 61 Führungsverhalten 61 Füllstandsregelung 32 Fundamentalmatrix 168 Fuzzy-Element 349
G gebrochen rationales Polynom 74 gedämpfte Schwingung 16 gedämpfte Sinusschwingung 112 gedämpftes System 112 Gegenkopplung 18 Gegenspannung, elektromotorische 28 geometrische Reihe 372 Geraden-Näherung 125, 128 geschlossener Regelkreis 73, 88 Geschwindigkeitskonstante 64
411 Geschwindigkeitsregelung 64 gewichtetes absolutes Gütekriterium Gewichtsfolge 269 Gewichtsfunktion 14, 48 Gleichgewichtsbedingung 24 Gleichgewichtszustand 196 Gleichstrom-Motor 30 –, konstant errregter 28 Gleichstrom-Servomotor 109 Grundregler 44, 47 Güteindex 254 –, quadratischer 252 Gütekriterium 117 –, gewichtetes absolutes 117 –, Minimierung des 256 –, quadratisches 117 Gütemaßzahl, standardisierte 117
117
H Halteglied 264, 270 Halteglied nullter Ordnung 271 Hauptwert 401 hermetische Matrix 195 hochfrequentes Störsignal 38 Hochpassfilter 308 homogene Differenzialgleichung 369 homogene Zustandsgleichung 168 Hüllkurve 76 Hurwitz 13, 69, 281 Hurwitz-Determinante 72 Hurwitz-Kriterium 71, 98 Hydraulik-Servo-System 19 Hysterese 34
I IAE-Kriterium 117 idealisierter Abtaster 264 idealisierter OP 44 Identifikation 48 imaginäres Polpaar 60 Impuls-Abtastung 270 Impuls-Antwort 14, 68 Impuls-Erregung 14 Impulsfolge 371 Impulsfunktion 48, 361 Impulskette 270 Impulsstärke 49 indirekte Methode 299
412
Sachwortverzeichnis
induktiver Weggeber 33 inhomogene Differenzialgleichung 369 instabile Regelstrecke 153 integraler Übertragungsbeiwert 36 Integralglied 51 Integral-Regler 36 Integrationsregel 352 Invarianz 174 inverse Laplace-Transformation 350, 363 inverse Laplace-Transformierte 15 inverse z-Transformierte 384 Inversion 169 Inversionsintegral 392 invertierender Eingang 44 invertiertes Pendel 213, 244 I-Regler 36 ISE-Kriterium 117 ISTAE-Kriterium 118 ITAE-Gütekriterium 118 ITAE-Kriterium 117 ITSE-Kriterium 117
J Jordanform 190 Jury 276 Jury-Kriterium 278 Jury-Tabelle 277
K kinetische Energie 166 Kofaktor 170 Komparatorausgang 266 Kompensation 121, 138, 156 Kompensationsregler 138 komplexe Differenziation 352 komplexe Ebene 21 komplexe Variable 74 konforme Abbildung 405 Konstruktion von Wurzelortskurven Konstruktionsregeln 101 kontinuierliches System 282 Kosinusfunktion 362 Kreisfrequenz 22 –, kritische 84 kritische Kreisfrequenz 84 kritische Reglerverstärkung 320 Kronecker-Impuls 269, 371 künstliches neuronales Netz 349
L Lag-Faktor 143 Lag-Glied 39 Lag-Kompensation 43, 143 Lag-Netzwerk 138, 143, 154 Laplace-Operator 350 Laplace-Transformation 13, 350 –, inverse 350, 363 Laplace-Transformierte, inverse 15 Laurent-Reihe 392 Lead-Faktor 141 Lead-Glied 38 Lead-Kompensation 43, 152 Lead-Lag-Kompensator 42, 146 Lead-Netzwerk 138, 154 Liapunov 13, 193, 196, 253 Liapunov-Funktion 197, 253, 254 Liapunov-Gleichung 198 Liapunov’sche Methode 196 lineare Transformation 174 lineares System 21 Linearisierung 18 Linearitätsregel 351, 375 Linke-Hand-Regel 82 Linksverschiebungssatz 377 logarithmische Spirale 403 logarithmischer Frequenzgang 124
M
92
Magnetventil 32 manuelle Regelung 11 Maschengleichung 25 Massenträgheitsmoment 28 mathematisches Modell 24 Matrix, hermetische 195 maximale Stellgröße 34 maximale Überschwingweite 113, 128, 156 Maxwell 13 mehrfache Wurzeln 188 Mehrgrößensystem 171 Membran 32 Messglied 11 Methode des Stabilitätsrandes 159 Mikrocomputer 11, 158, 262 Minimierung des Gütekriteriums 256 Minimierungsprozess 254 Mitkopplung 18
Sachwortverzeichnis
413
Modell –, dynamisches 220 –, mathematisches 24 –, physikalisches 24 MPZ 310ff. MSB 266
N Nachstellzeit 38, 42 negativ definit 194, 196 Neigungswinkel 317 neuronales Netz, künstliches Newton’sches Gesetz 27 –, erstes 55 Nichols, Ziegler und 159 nicht invertierender Eingang nicht lineares System 18 Niederfrequenz-Verstärkung Normalform 180, 205 Nullstelle 14, 75, 317 Nyquist 13 Nyquist-Diagramm 77, 78 Nyquist-Frequenz 307 Nyquist-Kontur 77 Nyquist-Kriterium 73, 78 –, vereinfachtes 82 Nyquist-Ortskurve 21, 73 Nyquist-Pfad 78
349
44 141, 154
O objektbasierte Regelung 349 offener Regelkreis 62, 63, 73, 88, 150, 274, 316 OP, idealisierter 44 Operationsverstärker 11, 44, 158, 266 Oppelt 13 optimale Stellgröße 253 optimale Übertragungsfunktion 118 optimaler Regler 253 optimaler Stellvektor 253 Ordnung eines geregelten Systems 109 Originalbereich 161 Ortskurve 22, 73, 79
P Parallelschaltung 17 Parallelschaltung von Übertragungsgliedern Partialbruch 15, 51, 192 Partialbruchzerlegung 161, 363, 386
17
PD-Regler 36, 138 Pendel, invertiertes 213, 244 periodische Abtastung 264 Phase 21, 123 phasenabsenkendes Übertragungsglied 39 Phasenänderung 77 phasenanhebendes Übertragungsglied 38 Phasenbedingung 89, 91, 152, 318 Phasengang 125, 341 Phasenrand 84, 131, 132, 137, 140, 341 Phasenvoreilung 43 Phasenwinkel 22 PID-Kompensation 146 PID-Regler 42, 154, 288, 290 –, diskreter 291 PI-Kompensation 142 PI-Regler 38, 138 Pol 14, 317 –, dominanter 333 Pol der Übertragungsfunktion 57 Polardarstellung 21 Pol-Nullstellen-Form 124 Pol-Nullstellen-Plan 14 Polpaar –, dominantes 115, 150, 203 –, imaginäres 60 Polstelle 14, 75 Polüberschuss 311 Polvorgabe 150 Polynom, gebrochen rationales 74 Polynomdivision 385 Polzuweisung 237 Pontrjagin 13 Positionskonstante 64 Positionsregelung 64 positiv definit 193–195 potenzielle Energie 166 P-Regler 35 Prewarping-Verfahren 306 Primärstreifen 339, 400, 401 Produktform 89 Programmierung, direkte 294 Proportional-Differenzial-Regler 36 proportionaler Übertragungsbeiwert 30, 35, 56 Proportionalglied 51 Proportional-Integral-Differenzial-Regler 42 Proportional-Integral-Regler 38
414 Proportional-Regler 35 Proportionalverstärkung 290 Prozessdynamik 138, 154 Prozessrechner 262
Q quadratische Form 195 quadratischer Güteindex 252 quadratisches Gütekriterium 117 Qualitätskriterium 108 Qualitätsmerkmal 117 quantisiertes Signal 262
R Rakete 146, 213 Rampe 48 Rampenantwort 52 Rampenfunktion 360 Rauschsignal 139 RC-Vierpol 25 Reaktion, erzwungene 169 Reaktionsgeschwindigkeit 43, 121, 131 Rechenregel 351 Rechteckimpuls 361 Rechteckregel 304 Rechtsverschiebungssatz 377 Regelabweichung 11, 35 –, bleibende 35, 108 Regelalgorithmus 264 Regeldifferenz 263 Regeleinrichtung 31, 35, 61 –, unstetige 33 Regelgröße 11, 31 –, rückgeführte 11, 61 Regelkreis 12, 68, 121 –, digitaler 286 –, geschlossener 73, 88 –, offener 62, 63, 73, 88, 150, 274, 316 –, stabiler 74 Regelkreis-Synthese 121, 244 Regelstrecke 11 –, instabile 153 Regelung 11 –, automatische 11 –, manuelle 11 –, objektbasierte 349 –, stetige 32 Regelung mit Hilfsenergie, stetige 33
Sachwortverzeichnis Regelungsnormalform 180 Regelungstechnik, digitale 262 Regler 11 –, digitaler 262 –, diskreter 299 –, optimaler 253 –, Proportional-Differenzial-Regler 36 –, Proportional-Integral-Differenzial-Regler 42 –, Proportional-Integral-Regler 38 –, Proportional-Regler 35 Reglerausgangsgröße 11, 35 Reglerparameter 160 Reglerpol 204 Reglerverstärkung 35 –, kritische 320 Reibungskoeffizient, viskoser 27 Reihe, geometrische 372 Reihenkompensation 121 Reihenschaltung 16 Residuen-Theorem 75 Residuensatz 395 Residuum 69, 365, 387, 394 Riccati-Gleichung, reduzierte 259 Roboter 262 Routh 69 Rückführmatrix 207, 230 Rückführschaltung 17 rückgeführte Regelgröße 11, 61 rückgekoppeltes System 285 Rückkopplung 18 Rückstellkraft 27 Rücktransformation 167
S Sample-and-Hold 265 Sample/Hold-Schaltung 263 Schaltdifferenz 34, 35 Schaltfrequenz 35 Schleppfehler 53, 65 Schwingung –, gedämpfte 16 –, stationäre 16 –, ungedämpfte 60 Schwingungsglied zweiter Ordnung Schwingungssystem 165 Schwingverhalten 57 s-Ebene 15
113
Sachwortverzeichnis Sequenz 262 servomechanischer Antrieb 109 Servomotor 30 Shannon’sches Abtasttheorem 348 Signal –, abgetastetes 262 –, analoges 262 –, digitales 262 –, diskretes 262 –, quantisiertes 262 –, zeitkontinuierliches 262 Signalimpuls 264 Signalkonversion 263 Signal-Rausch-Verhältnis 220 singulärer Punkt 75 Sinusfunktion 48, 362 Sinusschwingung, gedämpfte 112 Skalierung 22 Soll/Ist-Vergleicher 263 Sollwert 11, 31 Spannungsteiler 50 Spannungsverstärkung, differenzielle 44 Spirale, logarithmische 403 Sprungantwort 48, 57, 59 Sprungfunktion 48, 358 stabil 68, 192 stabiler Regelkreis 74 Stabilisierung 121 Stabilität 68, 88, 108, 193, 274 –, asymptotische 197 –, relative 84, 88 Stabilitätsgrenze 274, 317 Stabilitätsgüte 84 Stabilitätskriterium 73, 192, 276 Stabilitätskriterium von Jury 277 Stabilitätskriterium von Nyquist 73, 80 Stabilitätskriterium von Routh und Hurwitz Stabilitätsrand, Methode des 159 Standard-Regelkreis 61, 121, 234, 286 stationäre Ausgangsgröße 122 stationäre Schwingung 16 stationärer Fehler 39, 53, 63, 66, 129 stationäres Verhalten 60, 62 Steigung 52 Stellbereich 32 Stellenergie 257 Stellglied 11
415
69
Stellgröße 11, 35 –, maximale 34 –, optimale 253 Stellmotor 33 Stellvektor, optimaler 253 Stellzylinder 19 stetige Regelung 32 stetige Regelung mit Hilfsenergie 33 steuerbare Normalform 205 Steuerbarkeit 237 Steuerbarkeitsmatrix 177, 205 Steuermatrix 163 Steuervektor 162, 163 Störempfindlichkeit 38 Störgröße 12 Störimpuls 34 Störmoment 146 Störsignal, hochfrequentes 38 Störübertragungsfunktion 61 Störung 12 Störverhalten 61 Substitution, direkte 208 sukzessiver A/D-Konverter 265 Sylvester 195, 197 Synthese-Verfahren 203 System 14 –, dynamisches 24 –, gedämpftes 112 –, nicht lineares 18 –, rückgekoppeltes 285 –, übergedämpftes 329 –, untergedämpftes 329 –, zeitdiskretes 268 System höherer Ordnung 86 System zweiter Ordnung 55, 109 Systemantwort 51, 55, 68, 269 Systemmatrix 163
T Taktimpuls 265 Taylor-Reihe 18 Temperaturregelung 11, 35 Testsignal 48 Theorem 375 –, erstes 133 Tiefpassfilter 307 Transformation, bilineare 280, 304 Transformationsmatrix 204
416 transientes Verhalten 88, 108 Transitionsmatrix 168 Translation 27 Trapezregel 304 Treppenfunktion 264, 271 Tustin-Regel 304
U Übergangsfunktion 41, 48, 59, 68 Übergangsmatrix 168 Übergangsverhalten, Schnelligkeit des 108 übergedämpftes System 329 Überschwingweite 140, 150, 315 Übertragungsbeiwert 290 –, differenzieller 36 –, integraler 36 –, proportionaler 30, 35, 56 Übertragungsblock 24 Übertragungsfunktion 13, 27, 45, 63, 171, 268 –, optimale 118 Übertragungsglied –, differenzierendes 51 –, phasenabsenkendes 39 –, phasenanhebendes 38 Übertragungsverhalten 51 Umkehrintegral 363 ungedämpfte Schwingung 60 ungedämpfter Fall 60 unstetige Regeleinrichtung 33 untergedämpft 112 untergedämpftes System 329
V Vektordifferenzialgleichung 167 Vektorschreibweise 162 Vereinigungspunkt 96, 318 Verhalten –, dynamisches 60, 162 –, stationäres 60, 62 –, transientes 88, 108 Verschiebungssatz 377 Verstärkungsfaktor 35 Verzugszeit 158, 159 Verzweigungspunkt 90, 96, 318 Vierpol 25 viskoser Reibungskoeffizient 27 Viskosität 19 vollständig beobachtbar 179
Sachwortverzeichnis vollständig steuerbar 176 Vorhaltzeit 37, 42 Vorwärtsrichtung 304
W Warping-Effekt 306, 307 Watt, James 12 w-Ebene 280 Welligkeit 349 Wendetangentenverfahren 159 Wertebereich 262 Wertefolge, diskrete 372 Winkeldifferenz 77 WOK 88 w-Transformation 338 Wurzeln –, mehrfache 188 –, verschiedene 185 Wurzelortskurve 88, 92, 316 Wurzelortskurven-Verfahren 88, 150, 299 Wurzelsatz von Vieta 94 Wurzelschwerpunkt 94, 152
Z
z-Ebene 280 zeitdiskretes System 268 Zeitkonstante 52 zeitkontinuierliches Signal 262 Zeitverhalten 59 Ziegler und Nichols 159 z-Transformation 375 z-Transformierte 273 –, inverse 384 Zulaufventil 33 Zustands-Beobachter 220 Zustandsdifferenzialgleichung 162 Zustandsgleichung 162 –, homogene 168 Zustandsgröße 162, 166 Zustandsraum 162 Zustandsrückführmatrix 204 Zustandsrückführung 204, 230 zustandssteuerbar 176 Zustandstransformation 222 Zustandsvariable 162 Zustandsvektor 162 Zweipunktregler 33