© LAVOISIER, 2002 LAVOISIER
1.l, rue Lavoisier 75008 Paris
Serveur web: www.hern1es-science.com ISBN 2-7462-0464-9 Catalogage Electre-Bibliographie Lamnabhi-Lagarl"igue, Françoise*Rouchon, Pierre (sous la direction de) Systèmes non linéaires Paris, Hermès Science Publications, 2002 ISBN 2-7462-0464-9 RAl'vIEAU: commande non linéaire DEWEY: 629.5 : Autres branches de l'art de l'ingénieur. Commande automatique, Robotique
Le Code de lio\ propriété intellecluelle n'autorisanl, aux termes de l'arlic\e L. 122-5, d'une part, cjüc les "copies ou reproductions strictement réservées à l'usage privé du copiste ct non des-tillées à une utilisation collective" et, d'aulI"e PLu-t, que les analyses et les COUlics citations dans un but d'exemple et d'illustration, "toute représentation ou reproduction inlégrale, ou pal"tiellc, f'üite sans le consentement de l'auteur ou de ses ayants droit ou ayants cause, est illicite" (arlicle L 122-4), Celte représentation ou reproduction, par quelque procédé que ce soit, constituerait donc une conlrefaçon sanctionnée par les artÎcles L. 335-2 et suivanls uu Code de la propriété intellectuelle.
Systèmes non linéaires
sous la directio11 de
Frallçoise LalTIllablli-Lagarriglle Pierre R01ICll01l
Il C'·~C5 cience
~
- l ' l I h 1 .....'11 1
1'"''''''_
Il a été tiré de cet ollvrage 20 exe/1lplaires hors COl1llllerce réSell'és at/x membres du comité scielltiflqlle. aux alllellrs et il l'éditeur l1tlll1érotés de 1 il 20
Systèlnes 11011 lil1éaires sous la direction de Françoise La111llabhi-Lagarrigllc et Pierre
ROlie/101l
fait parLie de la série SYSTÈJ\IIES AUTOMATISÉS
par Claude Foulard
TRAITÉ IC2
COMMUNICATION
INFORMATTON - COMMANDE
sous la direction scientifique de Bernard Dubuisson Le traité Information, Comm.ande, Comnlunîcation répond au besoin de dispose1 d'un ensenlble complet des connaissances et mélhodes nécessaires à la nlaîtrise des systèmes technologiques. 4
Conçu volontairement dans un esprit disciplinaire, le lraité TC2 est l'état de l'art dans les domaines suivants relenus par le comité scientifique: Réseaux et télécoms Traitement du signal ei de l'image InFormatique ei systèmes d'information Systèmes automatisés Producti que Chaque ouvrage présente aussi bien les aspects fondanlentaux qu'expérimentaux. Une classification des différents articles contenus dans chacun, une bibliographie et un index détaillé orientent le lecteur vers ses points d'intérêt immédiats: celui-ci dispose ainsi d'un guide pour ses réilexions ou pour ses choix. Les thé01ies et ll1éthodes rassem blés dans chaque ouvrage ont été choisis pour leur pertinence dans l'avancée des connaissances ou pour la qualité des résultats obtenus dans le cas d'expérimentations réelles.
Liste des auteurs
Tarde AHrvlED-Au Ecole nationale supélieure des ingénieurs des études el techniques d'armenlent Brest Gilles Duc Supélec Gif~s ur-Yvette Didier DUMUR Supélec Gi f-sm":.. Yvette Fabienne FLORET-PONTET Supélec Gif-sUl":..Yvette Hassan
HAMJVlOURl
LAGEP Université Claude Bernard Lyon
Françoise LAMNABHT-LAGARIUGUE Supélec Gif-sur-Yvette Jean-Claude
MARQUÈS
LAGEP Université Claude Bernard Lyon
Claude
MOOG
IRCCyN
Nantes Pierre ROUCHON Ecole nationale supérieure des mines de Paris Nicolas SEUBE Ecole nationale supérieure des ingénieurs des études et techniques d'armenlent Brest
Tab1e des matières
Avant-propos . . . . . . . . . . . . . . . . . . . . . . . . . .
13
Chapitre 1. Méthodes basées sur les techniques linéaires Gilles Duc et Didier DUMUR
15
1.1. Introduclion. . . . . 1.1. Identification et commande linéaires d'un système non linéaire 1.2.1. Recherche d'un modèle linéaire . . ... 1.2.1.1. Séquence binaire pseudo-aléatoire . 1.2.1.2. Prétraîtement des données . . . . . 1.2.1.3. Algorithme des moindres carrés .. 1.2.2. Méthodologie de la commande prédiclive généralisée . . 1.2.2.1. Définition du modèle numérique . . . . . . . . . . 1.2.2.2. Prédicteur optimal . . . . . . . . . . . . . . . . . . 1.2.2.3. Définition et minimisation du critère quadratique 1.2.2.4. Synthèse du régulateur RST polynomial équivalent 1.2.2.5. ChoÎx des paramètres de réglage . . . . . . 1.2.3. Commande prédictive cascade vitesse-position d'un moteur asynchrone . . . . . . . . . . . . . . . . . 1.2.3.1. Structure du banc d' essai . . . . . . . . . . 1.2.3.2. Modèle linéaire identifié de la machine asynchrone 1.2.3.3. Résultats expérimentaux . . . . . 1.2.4. Conclusion partielle . . . . . . . . .. . 1.3. Techniques LPV appliquées II la commande d'un syslème non linéaire . . . . . . . . . . . 1.3.1. Systèmes et correcteurs LPV ... . 1.3.2. Systèmes et correcteurs quasi LPV 1.3.3. Présentation de l'exemple. 1.3.4. Synthèse du correcteur 1.3.5. Analyse du correcteur. 1.3.6. ConclusÎon . . . . . . .
15 16 16 16 18 19 21
21 22 21 22 23 24 24 25
26 28
28 28 30 31
32 36 37
10
Systèmes non linéaires
Chapitre 2. Inversion et linéarisation Claude MOOG
41
2.1. Introduction. 2.2. Inversion ... . . . . . 2.2. L Structure à l'infini 2.2.2. AlgOlithme d'inversion 2.2.3. Inversibilité. . . . . . 2.2.4. Dynamique des zéros . 2.3. Linéarisation entrée-sortie . 2.3.1. Formulation du problème 2.3.2. Cas monosortie . . . . . . 2.3.3. Cas 1l1ultisortie . . . . . . 2.3.4. Linéarisation entrée-sortÎe par retour dynamique de sortie: cas monosortie . . . . 2.3.5. Exemple ... 2.3.6. Robot sauteur. 2.4. Découplage. . . . . 2.4.1. Découplage par bouclage statique régulier 2.4.2. Découplage par bouclage statique régulier sur]' état 2.5. Linéarisation entrée-état. . . . . . . . . . . . . . . 2.5.1. Linéari~ation par bouclage statique sur l'état. . . . . 2.5.1.1. Formulation du problème. . . . . . . . . . . . . 2.5.1.2. Solution au problème de linéarisation entrée-état 2.5,2. Linéarisation par bouclage dynamique sur l'état . . . . 2.5.2.1. Formulation du problème. . . . . . . . . . . . . . 2.5.2.2. Solution du problème de linéarisation dynamique 2.6. Bibliographie. . . . . . . . . . . . . . . . . . . Chapitre 3. Observateurs de systèmes non linéaires Hassan }-IAMMOURI et Jean-Claude MARQUÈS
41 42 42 43 47 48 49 49 49 51
3.1. Introduction . . . . . . . . . . . . . . . 3.2. Observation des systèmes linéaires temps Învariants . . . 3.2. J. Observation des systèmes linéaires temps continus 3.2.2. Observateurs des systèmes linéaires temps discrets 3.3. Observabilité des systèmes non linéaires et rappels mathématiques 3.3.1. Quelques notions sur l'observabiHté . . . . . 3.3.2. Quelques rappels mathématiques. . . . . . . 3.4. Observation des systèmes affines en j'étal modu]o une injection de sortie. . . . . . . . . . . . . . . . . . . . . . . . . . 3.4.1. Observateurs pour les systèmes affines en r état modulo une injection de sonie. . . . . . . . . . . . . . . . . . . . . . . . 3.4.2. Linéarisation modulo une injection de sortie . . . . . . . 3.4.3. Linéarisation temps-variant modulo une injection de sortie 1A.4. Annlicatiolls . . . . . .
53 62 63
68 69
70 71 71 71 72 77 77 78 79 81 81 82
82 85 86
86 89 90
90 93 94
97
'n,bIc des matières
3.5. Observation des systèmes uniformément observables 3.5.1. Observabilité uniforme . . . . . . . . . . . . . . 3.5.1.1. Systèmes afllnes en rentrée . . . . . . . . 3.5.1.2. Une extension au cas nOI1 affine en l'entrée. 3.5.2. Observateurs il grand gain. . . . . 3.5.2.1. Cas monosortie . . . . . . . . . . . . . . . . 3.5.2.2. Extension au cas multisortie . . . . . . . . . 3.6. Quelques d'application de J'observateur grand gain 3.6.1. Exemple . . . . . . . . . 3.6.2. Résultats de simulation . 3.6.3. Exemple du bioréacleur . 3.6.4. Résultats de simulation 3.7. Bibliographie. . . . . . . . . .
Chapitre 4. Observation et observateurs-contrôleurs par modes glissants
11
100 103 104 106 106 106 109 115 115 117 118 122 122 125
Tarek AHMED-ALI et Nicolas SEUBE 4.1. Observateurs l1lonosurface 4.2. Observateurs glissants mulLisurfaces . . . . 4.3. Observateur et commande robuste 4.3.1. Synthèse de l'observateur glissant . . 4.3.2. Synthèse de la commande par modes glissants 4.3.2.1. Changement de coordonnées et surface de glissement. 4.3.2.2. Synthèse du contrôleur . . . . . 4.3.3. Application il un robot manipulateur. 4.4. Bibliographie . . . . . . . . . . . . . . . . .
Chapitre 5. Identification des systèmes non linéaires
126 127 131 131 l35 135 137 139 141 143
Fubienne FLORET-PONTET el Françoise LAMNABHI-LAGARRIGUE 5.1. lntroduction .. 5.2. Préliminaires . 5.2.1. Exemples 5.2.1.1. Pendule Cas multivariable 5.2.1.2. Cas monov::niable . . . . . . 5.2.2. Identil"iabilité . . . . . . . . . . . . 5.2.2.1. Identifiabilité globule dans le cas linéaire 5.2.2.2. Identifiabilité globule dans le cas non linéaire 5.2.2.3. Test dïdentifiabilité par r exemple. 5.2.3. Moindres carrés ., . . . . . . . . . . . . . . . . . 5.2.3.1. Algorithme . . . . . . . . . . . . . . . . . . . 5.2.3.2. Application à l'exemple 1l10novariable [5.2] en boucle ouverte . . . . . . . . . . . . . . 5.2.4. Méthodes basées sur l'erreur de sortie. 5.2.4.1. Tdentification en boucle ouverte 5.2.4.2. Identification en boucle fermée ..
143 146 146 146 147 147 147 148 149 151 151 151 152 152 153
12
Systemes 11011 linéaires
5.2.4.3. Application à l'exemple monovariable [5.2] en boucle fermée . . . . . . . . . . . . . . . . . 5.3. ldentilkation-stmcture variable en boucle ouverte 5.3.1. Description des systèmes étudiés. 5.3.2. Cas monovariable . . . . . . . . . . 5.3.2.1. Algorithme . . . . . . . . . . . 5.3.2.2. Exemple - Cas monovariable . 5.3.3. Cas multivariable sous la forme normale 5.3.3.l. Algorithme. . . . . . . . . . . . . . 5.3.3.2. Exemple sur le pendule en boucle ouverte 5.3.4. Cas ll1ultivarinble général . . . . . . . . . . . 5.4. Identification-structure variable en boucle fermée 5.4.1. DescrÎplion des systèmes étudiés. 5.4.2. Méthode d'identification indirecte 5.4.1.1. f) est supposé connu . . . 5.4.1.1. fJ est supposé inconnu. . . 5.4.3. Exemples en boucle fermée. . . 5.4.3. L Pendule en boucle fermée. 5.4.3.1. Cas monovariable en boucle fermée 5.5. Analyse de robustesse . . . . . . . . . . . . . . 5.5.1. Condition de lJlafching . . . . . . . . . . 5.5.2. Perturbations paramétriques variant dans fe temps 5.5.2.1. Prél Îminaires . . . . . . . . . 5.5.1.2. Analyse de robustesse. . . . 5.5.3. Exemple sur le cas monovariable . 5.6. Simulations - Etude comparative. . . . 5.6.1. Cas multivmiable (pendule) - Identification basée sur la théorie de la structure variable . . . . . . . . . . 5.6.1.1. En boucle ouverte, identification directe . 5.6.1.2. En boucle fermée. identification indirecte. 5.6.2.· Etude comparative Cas l11onovaIiable . . . . . 5.6.2.1. Préliminaires. . . . . . . . . . . . . . . . . 5.6.2.2. Comparaison en boude ouverte avec les moindres calTés 5.6.2.3. Comparaison avec les méthodes basées sur J'erreur de sortie - Boude fermée. 5.7. Conclusion . . 5.8. Bibliographie.
Index . . . . . . . . . .
154 154 154 155 155 157 157 157 159 160 161 161 162 162 163 165 165 166 166 166 ] 67 167 167 169 170 170 170 170 173 173 1.73 175 178 179 181
Avant-propos
Ce volume est le premier d'une série de deux ouvrages consacrés il r automatique non linéaire pour les de dimension finie. Nous avons volontairement restreint l'exposé aux systèmes continus gouvemés par des équations différentielles ordinaires. Dans bien des cas, des résultats équivalents existent pour les systèmes discrets. Plus on regarde vers le futur, plus les opportunités de nouvelles applications et les avûncées de la commande des systèlTles non linéaires sont nombreuses. Les nouvelles méthodes, de plus en plus perfOI11Ulntes pour capter, calculer. cOl11muniquer, inimaginables il y a vingt ans, ne cessent d'être améliorées, et créent ainsi un environnement très riche avec une énorme quantité de données. Face à toutes ces nouvelles technologies, la commande des systèmes non linéaires, qui intègre les contraintes physiques du système, son environnement variable et les diverses interactions, a Uil rôle de plus en plus important tl jouer afin de construire des bDuclages optimaux, robustes et performants. L'objectif de ces deux livres est d'expliciter quelques méthodologies et de les illustrer sur des applications issues de plusieurs domaines comme l'aérospatial. la robotique, l'électronique, rélectrotec1mique ou encore la biologie. Le premier chapitre montre sur deux cas précis comment utiliser des techniques linéaires pour contrôler certains syslèmes non linéaires (linéarisation et identification locale avec des techniques prédictives, systèmes linéaires avec paramètres variant dans le temps et synthèse du contrôleur avec des techniques LMI (Linear MalrÎe Inequalilies). L" objectif de ce chapitre est de montrer sans être exhaustif que des techniques linéaires correctement maît.risées peuvent être utitisées avec succès sur certains systèmel\ non linéaires. Le second chapitre aborde une classe importante de techniques non linéaires maintenant classiques et souvent utiles pour les systèmes continus: le découplage, l'inversion et la linénrisation. Ces méthodes utilisent le langage de la géométrie différcnticlle pour construire des bouclages (statique ou dynamique, en état ou en sonie) pour rendre le comportement du système non linéaire de départ aussi proche que possible de celui d"un
]4
Systèmes non linéaires
système linéaire découplé. Il s' agit essentÎeHement de techniques qui consistenl, après une analyse précise de la structure entrée-sortie. il compenser par Iecdback certaines non-I i néari tés. Les trois derniers chapitres abordent un sujet bien moins développé mais aussi nettement plus difficile, celui des observateurs et de l'identification. Le chapitre 4 présente, après avoir montrer les subtilités liées il la notion d'observabilité en 110n linéaire, quelques techniques pour synthétiser des observateurs avec preuve de convergence. Ces techniques utilisent le langage de la géométrie différentielle (comme pour le chapitre 3). Le chapitre 5 porle sur les observateurs par mode glissant d'une classe spécillque de systèmes. Cette méthode peut être vue comme « duale » de celle de la commande par mode glissant. Enfin, le demier chapitre aborde l'identification avec deux aspects: les critères d'identjfil.1bilité: la synthèse d'algorithme cstimanl des paramètres en boucle ouverte et en boucle fermée. Ici encore les résultats ne traitent pas le cas général (comme dans les deux chapitres précédents) mais montrent comment s'y prendre lorsque Je système dépend linéairement des paramètres avec une mesure complète de J'état (ces techniques sont à rapprocher de celles de la commande adaptative qui est l'objet d'un volume Le second volume consacré à l'automatique non linéaire aborde lu modélisation pour le contrôle et deux techniques non linéaÎres : la stabilisation par des méthodes d'énergie (Lyapounov), la planificatÎon de trajectoires avec les systèmes différentiellement plals. Nous avons délibérément laissé de côté tout ce qui touche au contrôle optimal et au principe du maximum de Pontryaguine, lhèmes abordés dans d'autres volumes de cette collection. EnHn, nOlis ne traitons pas la commande non linéaire des systèmes gouvernés par des équations aux dérivées partielles avec contrôle frontière. C' est un sujet très difficile. Des résultats récents sur des exemples significatifs (Euler, Navier-Stokes, Schrodinger. .. ) montrent que le domaine est en plein développement. Pierre Rouer-ION Françoise LAMNABHI-LAGARRTGUE
Chapitre 1
Méthodes basées Sllr les tecll11iqlles lil1éaires
1.1. Introduction La plupart des processus sont modélisés, au départ, par des équations différentielles non linéaires, ce qui semble de prime abord exclure l'utilisation de techniques linéaires. Mais, dans deux cas au moins, il est possible de se raccrocher à ces techniques. qui onl j~lilla preuve de leur emcacité : -lorsque l'on connaît la trajectoire à suivre (qui peut être simplement de réguler la sortie sur une valeur constante) el que l'on sail (ou que l'on suppose) que le système 5' écartera peu de cette trajectoire, un modèle linéaire tangent à celte trajectoire peut être utilisé, déterminé par exemple par une méthode d'identification linéaire, de manière à concevoir ensuite un cOlTecteur par les méthodes linéaires. Celles-ci donnent au minimum une garantie de stabilité dans un voisinage de la trajectoire et, en pratique. les résultats obtenus sont en général satisfaisants si l'on ne s'en écarte pas trop: - lorsque la non-linéarité des équations provient de quelques variables, accessibles à la mesure, il est possible de modéliser le processus par un système quasi LPY (linéaire à paramètres variants), en considérant la ou les variables qui interviennent de façon non linéaire à la fois comme des variables d'état et comme des paramètres. Les méthodes à base de LMl (Lil1ear Mafrix /nequalities) permettent alors de concevoir un correcteur lui aussi quasi LPY, qui est donc non linéaire en fonction de ces mêmes variables. avec une garantie de stabilité et de performances pour loute évolution dans un domaine convexe.
Chapitre rédigé par Gilles Duc et Didier
OUM UR.
Jo
Systèmes non linéaires
La section 1.2 ci-dessous envisage la première approche en se basant sur l'exemple de l'identification et de la commande cascade vitesse-position d'une machine asynchrone. La section 1.3 aborde ensuite la deuxième approche, à partir l'exemple d'un pilote automatique pour un missile au comportement forlement non linéaire.
1.2. Identification et commande linéaires d'un système non linéaire Cette section a pour but d'illustrer sur un processus complexe non linéaire les possibilités offertes par une technique de commande 1inéaire, la commande prédictive. La mise en œuvre de ceLLe est basée avant tout sur la connaissance d'un modèle linéaire de ce processus complexe, identifié pur des techniques linéaires classiques. Après avoÎr rappelé brièvement l'enchaînement identification du système puis synthèse prédictive, cette méthodologie esl app1iquée il la commande cascade vitesse-position de la machine asynchrone.
1.2.1. Recherche d'ml modèle li1léaire La mise en équation d'un processus complexe non linéaire conduit souvent, lorsque la modélisation est possible, tl des équations différentielles non linéaires d'ordre parfois élevé. L'ensemble s'avère alors inexploitable pour la synthèse d'une loi de commande. Une des stratégies possibles consiste dès lors il développer des méthodes d'identification expérimentale du système non linéaire, de façon à élaborer un modèle linéaire simplifié, représentatif du comportement du système pour un point de fonctionnement donné. Toute loi de commande linéaire peut ensuite être envisagée en se basant sur ce modèle identifié. Les points suivants ont pour but d'examiner une approche d'identification expélimentale adaptée au contexte industriel. 1.2.1.1, Séquence biliaire pselldo-aléatoire
Une démarche classique en identification [L.IU 87J stipule gue l'obtention d'un modèle identifié reflétant le plus fidèlement possible le comporlement du système nécessite que ce système soit sollicité par une entrée relativement riche, de façon à exciter le plus grand nombre de modes propres. Le meilleur signal candidat est alors le bruit blanc, malheureusement non déterministe. Une séquence binaire pseudo-aléatoire est un signal détenlliniste destiné à approcher une réalisation d'un bruit blanc. C' est une séquence de nombres valant ±A, pé1io~ dique. de période M et dont la fonction d'rllltocorrélation se caractérise graphiquement par la figure 1.1. Informatiquel11ent, elle est générée il partir d'un registre il décalage. Considérons donc un registre à décalage à Il étages, bouclé par un additionneur modulo '2. comme indiqué I1gure 1.'2.
MéLhodes basées sur les techniques linéaires
17
k M
Figure 1.1. FrJ1/ctioll d'lIwocorré/atirm d'll1le séql/ence billaire pseudo-aléatoire
Si a(k) désigne le vecteur d'état du registre à l'instant k :
L'état suivant est obtenu à partir de la matrice de transition A par la relation:
n(k
+ 1)
A a(k}
avec:
A
al
a}
1 0
0
0
0
an
0
ll.l.1 0
Figure 1.2. Génération par regislre d'Hile séquence biliaire pseudo-aléatoire
La sui te 1a(k)} ,M est une suite périodique et sa longueur maxima le est égale au nombre d'états possibles du registre en excluant l'étal nul (état bloquant), soit: Al = 2/1 - 1
i1.2]
La détermination des coeftkients ()'i s'effectue il partir d'une liste de polynômes caractéristiques établie pour chaque longueur de [1
18
Sy~lèl1les
non linéaires
conduisant aux bouclages les plus simples pour un nombre d'étages fixé, et respectant des conditions nécessaires et suffisantes d'obtention d'une séquence de longueur maximale. j
.2.1.2. PrétraÎlemem des dOllnées
Pour améliorer la qualité du modèle identifié, el avant d'appliquer un quelconque algorithme d'identification sur les données entrée/sortie enregistrées, un prétraiLemcnt de ces données ainsi qu'une mise en forme du modèle recherché peuL s'avérer très importante. Considérons tout d'abord le cas d'ull système ùont une partie est connue (par exemple la fonction de transfert de l' actionneur). TI est alors préférable dc tenir compte de cette connaissance (1 priori afin d" éviter d'augmenter initialement la dimension du vecteur paramètre. On procède alors (voir figure 1.3) en reconstruisant le signal intermédiaire 11* (sur cette figure, v représente l'influence de perturbations éventuelles). Un cas particulier est celui du système dont on sait (/ priori qu'il a un comportement intégrateur. Dans ce cas, il est préférable de dériver la sortie YI/li.'.\' plutôt que d'intégrer Il, afin d'éviter des dérivcs dues à dcs composantcs continues éventuelles. \'
li
SimulaI ion ùe la
rurlic COll flue
/1
*
Panic inconnue
Ynœ.\,
Nuuveau syslèmc il idclllilïcr
Figure 1.3. Cas d'lIIl système paJ'/Îellemcllf COI/ml
Un autre aspect fondamental consiste à filtrer les données si nécessaire, lorsque par exemple une bande de fréquences doit être sélectionnée. Par ailleurs. pour éliminer l'effet dcs perturbations sans avoir recours à un modèle stochastique, un traitement par corrélation peut être envisagé (voir ligure lA). Il est par exemple unc séquence binaire pseudo-aléatoire appliquée au système, non corrélée avec ]e signal perturbatcur v.
r. ·. ·. . .·. · · ·, · · · · · · · ·"·. . 1 1/
Syslème il idcnlillcr
J'1I11
Système fi
y
Figure 1.4. Traitement des donnécs pt/r corrélatiol/
i ï'lIy""., DI-
Méthodes basées sur les techniques linéaires
19
Notons par la suite )'1111 et )'11.1'/111'1 respectivemenl les fonctions d'auto et d'inter-corrélation des signaux li et Y'lll'S' dél1nies dans le cas d'une entrée de type séquence binaire pseudo-aléatoirc périodiquc par les relations:
1 AJ-l .. /'.11 Li=O Ymc.I'(r)I/(1 - k) llAJ IlU)u{i - k)
On montre alors que l'identification du système précédent fI partir des signaux Il el (ce dernier subissant l'influence des perturbations) est équivnlente il la recherche du même modèle, pour lequel )'/lYIIII'J devient la sortÎe fictÎve non bruitée du système lorsque J'l/II est son entrée (voir figure 104). Le prétraitement des signaux Il. YII/l'S par la méthode de corrélation permet donc, en toute théorie, d'élimîner l'effet des pel1urbations. Ce résultat s'avère lout à fail intéressant en milieu industriel puisqu'il permet de s'affranchir des bruits de mesure toujours présents sur une chaîne d'acquisition el nuisant de façon conséquente à la qualité du modèle identifié. )'11Il'.1
1.2.1.3. Algorithme des moindres carrés
Les paragraphes précédents ont permis de définir la structure du modèle la plus appropriée pour l'identification el de préparer les données afin de maxÎmÎser la qualité du modèle recherché. La dernière étape consisle dès lors à développer l'algorithme d'identification proprement dit. Dans ce but, la structure classique la plus miHsée est l'algorithme des moindres carrés avec toutes ses variantes. Ce paragraphe récapitule brièvement les points conduisant à r élaboration des paramètres identÎ flés dans le cas d'un modèle recherché sous la forme d'une fonction de transferl discrète. Le lecteur pourra consulter la littérature duns le domaine de l' identiflcation, parexemp]e lSOD 891 et lLAN 0 Il, pour des détails sur ces techniques.
Soit à identifler le système défini par l'équation aux di fférences : "J
Lf3i y(k -
Un
i) =
LO'; 11(11: -
i)
avec: {Jo = 1
[ 1.51
id)
y(k) et I/(k) étant respectivement la sortie et rentrée du système (ces signaux peuvent être si nécessaire des fonctions de corrélation d'après la démarche du paragruphe précédent).
20
SysLèmes
11011
linéaires
On peut alors écrire l'équation [1.5] sous la forme: [ 1.6]
avec:
p
l'
. = [-/11 ... -
= [y(k -
( rp(k)
[j1/11
.
0'1 ... O'1/n]
1)··· y CI.: -Il,,) u(k - 1)··· /I(!.: _11/1)]1'
Le prédicteur associé à r équation [1.6] est alors:
S, (k/I.:
I)
= pl' rp(k)
Oll
pest Uil vecteur eSlimé de P
[I.7]
On définit enfin l'elTeur de prédiction E(k) par la relatÎon : E(k) = y(k) -
pT rp{k)
[ 1.8]
L· algorithme des moindres carrés recherche alors pour A4 données disponibles le m.ei11eur jeu de paramètres Pme issu de la minimisation du critère quadratique: M
. .1 =
"
"' . ~E-(I)
[1.9]
i=1
sous la forme:
" Pille
= (RTR)-J
RT y
[1.10]
avec: y = [y (l ) ... y ( M) 1T
pT = [-#1'" - fil/II cil'"
y(l - Il,,)
y(O)
R
&1/IIJ ' et N
Ild
+ 11/1
u(O)
y(k - 1)
y (/VI
1)
dim p 11(1
11/1)
lI(k - 11 11
y(M -
I1d)
R dOÎt être de rang maximal et M 2: N.
u(lv! - 1)
)
Méthodes basées sur les Lechniques linéaires
21
1.2.2. A1étlIOdologie de la comma1lde prédicti1'e gé"éralisée A partir d'un modèle identifié expérimentalement sous une structure linéaire, autour d'un point de fonctionnement, le système non linéaire peut dès lors être piloté par une stratégie de cOlllmande linéaire à base de modèle. Parmi les lois existantes, envisageons ci-dessous les possibilités offertes par les méthodes prédictives. La commande prédictive repose sur des idées relativement anciennes et intuitives [RTC 93], mais n'a connu un réel essor en tant que technique de cOll1mande avancée que depuis le milieu des années 1980. Cet essor s'est réalisé principalement selon deux axes privilégiés: - la commande prédictive généralisée (GPC) de D. W. Clarke, 1985, - la commande prédictive fonctionnelle (PFC) de .J. Riclmlet, 1987. La philosophie de la commande prédictive se base sur quatre grandes idées, communes à toutes les méthodes: la création d'un effet anticipatif par exploitation de la trajectoire à suivre dans le futur, la définition d'un modèle numérique cie prédiction, la minimisation d'un critère quadratique à horizon Ilni, le principe de I"horizo\1 fuyant. Le lecteur pourra consulter [BIT 90] et [WER 87] pour de plus amples détails sur la commande prédictive. Envisageons les points fondamentaux de la structure prédictive généralisée [CLA 87a, CLA 87b, CLA 88] dans le cas Illonovariable, déduits de la traduction mathématique des concepts généraux précédents. Le lecteur pourra consulter le chapitre 13 de [LAR 02J pour le détail complet de l'élaboration de la loi de commande GPC et de ses extensions à une structure ~l modèles de référence multiples et cascade. 1.2.2.1.
D~fillition
dll modèle J/Il1l1érique
Toute forme est admissible pour le modèle, mais I"approche polynomiale par fonctions de transfert est tout ft fait privilégiée selon l'optique envisagée dans ce paragraphe. En effet, il a été montré précédemment qu'il était possible de déduire d'un système non linéaire une représentation linéaire utilisée pour la synthèse de la loi de cOl1lmande. Or les algorithmes d'identification classiques fournissent plus volontiers une structure identifiée de type fonction de transfert. C'est pourquoi la représentation adoptée ci-dessous, s'inspirant de la structure ARMA, développe le modèle sous la forme CARIMA (Conlro!led AUloNegressÎl'e fntegraled tv/01'Îl1g Al'erage) :
1:1.111 où ll(q-l)
=
1 - q-l, 11(1) et yU) sont respectivement l'entrée et la sortie du modèle,
22
Systèmes non linéaires
~(t) est un bruit blanc centré. q-I est l'opérateur retard et A(q-l) et B(q-I) des
polynômes définis par:
+ (11111 q-II ACl/- 1) = 1 + al q-I + { B(q-l) = bo + b1 q-l + .. + bu!> q-n" <
II
<.
[ 1.12]
Ce modèle, encore appelé modèle incrémentaI, introduit une action intégrale et permet d'annuler J'erreur statique vis-tt-vis de "entrée ou de la perturbation en échelon. /.1.1.1. Prédictellr op1b/lol
La sortie prédite yU + .i / t) est décomposée de façon classique en réponse libre et réponse forcée [BOU 95], incluant une f01111e polynomiale pour mener à bien la synthèse polynomiale finale, solut.ion unique d'équations diophanliennes :
+ j /1) =
y (t
Fi (q -1 ) yU)
+ Hj (q -1 ) b.u (t
-
1)
réponse libre [ 1.13]
réponse forcée Le prédicteur opLÎmaI est enfin défini en considérant que la meî11eure prédiction du bruit dans Je futur esl sa moyenne (supposée nulle ici), soit:
.v (1 + j / 1) = J .2.2.3. D~fil/itiol1
Fi (q -
1) Y (t )
+ Hj (q -1 ) b.11 ( / -
1) + G j (q -1 ) b.11 (1 + j - I) [ 1. 14 ]
et minimisa/ion du critère qlladratique
La loi de commande est obtenue par minimisation d'un critère quadratique porlant sur les erreurs futures avec un terme de pondération sur la commande: Nu
N"}.
J =
L Lv
(t
+ j) -
w (t
+ j) j::! + À L
:i=Nj
avec: b.1I(t
+ j)
~1I1 (r
+j
[1.15]
1)
}=I
0 pour j
~
Nu
<
Le critère nécessite la définition de quatre paramètres de - NI : horizon de prédiction minimal.
- N2 : horizon de prédiction maximal, Nil : - À :
horizon de prédiction sur la commande,
coeŒcient de pondération sur la commande.
1.2.2.4. Synthèse dll régulateur RST polynomial équipa/em
La minimisation du critère précédent conduit li un régulateur nomiale RST, correspondant à la structure de la figllre 1.5.
SOLIS
ln forme poly-
Méthodes basées sur les techniques linéaires
23
\1'
Régulateur polynomial
Figure 1.5.
Str/U.'lIl1"L'
polYl/omiale RST d/l régula/cuI' GPC étlllÎl'lIlclI1
La programmation informatique de la IOÎ de commande est dès lors très simple, nécessitant la mise en œuvre d'une simple équation aux différences Ilnies : S(q-I)U(t)
[1. 16]
T(q)w(J) - R(q-I )y(l)
On remarque que le polynôme T(q) renferme la structure non causale (puissances positives de q) inhérente il la commande prédictive. Par ailleurs, les troÎs po)ynôlnes R, S, T sonl donc élaborés hors ligne el définis de façon unique quand les quatre paramètres de réglage sont choisis. En conséquence. la boucle temps réel s'avère très peu gourmande en temps de calcul.
1.2.2.5. Choix des pan/1/UJlreS de réglage La définition du critère quadratique [1.15] a montré que l'utilisateur doit fixer quatre pammètres de réglage. Ce choix des paramètres s'avère cependant délicat pour une personne non spécialisle, car il n'existe pas de relations empiriques permettant de relier ces paramètres ü des « indicateurs ,> classiques en automatique. tels que les marges de stabilité ou la bande passante. A parLir de l'étude d'un grand nombre de systèmes types monovariables, il est cependant possible de dégager quelques règles basées sur des crÎtères classiques de stabilité el de robustesse lDUM 98J résumés ci-dessous: - NI : horizon de prédiction inférieur sur la sortie. Le produit d"échantillonnage) est choisi égal au retard pur du système;
NI~' (TL'
période
N2, : horizon de prédiction supérieur sur ln sortie. Le produit N2~' est limité par la valeur du temps de réponse. Plus N2 est grand. plus le système COlTigé est stable et lent; - Nil : horizon de prédiction sur la commande. Choisir Nil égal à 1 sÎmplifie les calculs ec ne pénalise pas les marges de stabilité (a contrario, une valeur supérieure i.l tendance à la marge de phase) ~
24
Systèmes non linéaires
- À : coefficient de pondération sur la commande. Ce paramètre est lié au gain du système, pm ln relation empirique:
11.17]
oi:I G est une matrice regroupant les coefficients de la réponse indicielle du modèle et intervenant lors du processus de minimisation. Le choix des paramètres se limite donc très souvent à une recherche bidimensionnelle (N2 et )c).
1.2.3. COlllmallde prédiclh'e cascade l'itesse-po:âtioll d'Ull moteur a.~yllchrolle
Envisageons désormais r application de la méthodologie des deux paragraphes précédents à lu commande prédictive cascade vitesse-position de moteurs d'axe al ternatÎfs asynchrones pour machines-outils. Se basant sur le canevas précédent, une identification est tout d'abord fournÎssant un modèle linéaire de la machine asynchrone, puis les régulateurs des deux boucles vitesse-position sont synthétisés à partir de ce modèle. Enfin, l'ensemble est implanté sur un banc d'essai pour machine-outil fournissant les résultats présentés.
1.2.3.1. Sll'lICltlre du ballc d'essai Le banc d'essai représenté à la figure 1.6 comprend une machine asynchrone caractéristique des motorisations rencontrées en commande d'axe de J11achine~outi1 (de vitesse nominale 3000 tours/min, couple nominal 6 Nm. puissance 1.9 kW), un codeur incrémentaI (32 bits avec 20000 points par tour), des convertisseurs numériques analogiques 12 bits, une cane DSP et une alimentation.
Commande numérique
Figure 1.6. Slmcllln' dll /JtlllC (l'e.l'xlli
Méthodes basées sur les techniques linéaires
25
Les asservissements des trois boucles de courant sont réalisés en numérique, tout comme les boucles de couple et de flux i mpluntées avec une stratégie de commande par flux orienté [BLA 721. Pur ailleurs. aucun capteur de vitesse n'est utilisé, l'information nécessaire sur la vitesse est reconstituée à partir de la mesure de pm;;itiol1. 1.2.3.2. Modèle li1léaire ident(fié de la machine asynchronc
L'objectif des essais proposés est lïmplantation d'une structure de commande prédictive cascade vitesse-position. En conséquence, les boucles de courant. les asservissements de couple et de flux implantés au niveau du variateur el du DSP sont conservés, les boucles envisagées venant se greffer au niveau supélieur, comme indiqué ligure 1.7. Il est donc nécessaÎre. pour la mise en œuvre de la commande de disposer d'un modèle identifié entre la référence de couple et la sail entre r* el n, el entre ln vitesse et la position. ()
Figure 1.7. Architecture de cOIll11t{/l1lle de la machille aSyllchrol/l!
En appliquant la procédure dldentification décrite lors des paragraphes précédents, pour une période d'échantillonnage 7:, = 4 ms, une longueur de séquence binaire pseudo-aléatoire M = 127 el en ayant forcé la présence d'un intégrateur dans le modèle, la fonction de transfert discrète identifiée entre la consigne de couple r* et la vitesse n eSl donnée par: Q(t) 1"*(1)
[ 1.18]
26
Systèmes non linéaires
Dans un souci de gain en temps de calcul dans la boucle temps réel, les degrés des polynômes identifiés ont été choisis relativement faibles. Le transfert entre la vitesse et la position correspondant en fait ft un simple intégrateur, le modèle choisi, issu de la discrétisation de l' intégrateur par exemple par la méthode d'Euler, a la forme suivante: 0(1)
[ 1.19]
n(1)
J .2.3.3.
Résultats expérimentaux
Avec ces transferts identifiés, les régulateurs prédictifs des deux boucles sont synthétisés pour les paramètres de réglage suivants: - boucle de vitesse (GPC/MRM) : N 1'2 = 1; N'n.
= 7;
Nil?
modèle de poursuite:
~
=
1;
À:;
= 400,
= 0,7, Wo = 500 rad/s.
- boucle de position (GPC) : NIl
1; N-ll = 7; Nil 1
=
1;
)'1
= 0,00018.
La consigne Îssue d'un module de génération de trajectoire à la cadence de 4 ms est de type trapézoïdal induisant une rotation de l'arbre moteur de dix tours, avec une vitesse de ± 250 tours/min. Dans ces conditions, les résultats obtenus sont reproduits aux figures 1.8 ft 1.1 1. 70 611 50
40 20 la 0
-10
0
0.2
Figure 1.8. PosÎtÎOI/ Cll/gulaire 111Otl'ur et cOllsIgne di' positio/1
Ces courbes illustrent les très bonnes performances obtenues, en termes de suivi de trajectoire (absence de dépassement, annulation des erreurs statiques et des en"eurs de traînage. minimisation des transÎloires) et de rejet des perturbations, principalement de couple, ce dernier point étant favorisé par la structure cascade. La loi de commande implantée permet donc de répondre aux spécificatÎons très sévères imposées par exemple dans le domaine de la machine-outiL Par ailleurs, 011 s'aperçoit en ana1.9 que la trajectoire de référence en vitesse imposée par la structure lysant la
Méthodes hnsées sur les techniques linéaires
27
,----;-----.--.---'--,---~--__,
300
:mn 100
o -100
-200 0.2
Figure 1.9.
Vi/esse
DA
0.6
O.X
angulaire mo/elll' el cOI/signe
\'Î/es,\'lJ
2 Erreur de pm;ition
1.5 0.5 0
-0.5 -1
-l.:'i
-2
0
0.2
nA
0.6
0.8
Figure 1.10. Errcur de position
10 .----.------,-,=S:-ig-n-c,,':-d-o-c-c-o-n-lmaÎldc S 6 4· 2
o -1 -4
Î
1
-6 .
ï
-8 -10
'Temps fs]
o
0.2
OA
0.6
)i'igure 1.11. C01lsigne dl!
0.8
1
cOl/pie 1II00CI/1'
OPC/MRM est pmfaltement suivie, prouvant la validité du modèle linéaire idenlifié. On remarque enfin que la consigne de couple générée par la structure cascade et envoyée au moteur par Je biais de lu cDmmande rl {-lux orienté s'avère peu chahutée malgré les variatiDns de position très fortes el très rapides imposées par la consigne.
28
Systèmes
110n
IÎnéaires
1.2.4. COllclllSÎOI1 partÎelle On constate donc que la démarche con~istant à synthétiser les régulateurs prédictifs sur un modèle linéarisé, identifié à partir du système global complexe et fortement non linéaire, procure de~ résultats tout à fait satisfaisants avec r avantage de conserver une structure de régulateur linéaÎre, s'implantant par une simple équation aux différences de degré faible. La robustesse naturelle de la loi de commande prédictive pe1met en effet de choisir LIlle structure de modèle identifié de faible complexilé.
1.3. Techniques LPV appli(IUées à la commande d'un système non linéaire Dans celte section, nOLIs allons ft présent examiner r application des techniques développées pour les systèmes linéaires Il paramètres variants (systèmes LPV) à la commande de ~ystèll1es non linéaires. Nous cOlllmencerons par prése11ler la modélisation par des système~ LPV ou quasi LPV et la recherche de correcteurs du même type; par manque de place, les méthodes permettant la synthèse de ces correcteurs ne seront pas présentées ici, mais on pourra par exemple se reporter au chapitre J 6 de [LAR 02]. Nous présenterons par contre en détail un exemple d'application de ces techniques, il savoir le calcul d'un pilote automatique pour le contrôle du mouvement longitudinal
d'un missile: le comportement du processus étudié dépend de façon non linéaire de l'incidence, de sorte que la recherche d'un COiTecteuf linéaire est vouée ft l'échec. 1.3.1. Systèmes et correcteurs '-,Pl' De nombreux processus peuvent être décrits par des systèmes linéaires dont les paramètres varient dans le Lemps. On les désigne sous le nom de systèmes LP\'. Sous forme d'étaL une description générale de ces syslèmes est la suivante:
'\"(1)) Dyc(fJ)
DYII (())
D:c(fJ)
D~II«n
eU) ( /lU)
[ 1.20J
où le vecteur (HI) = (0, (t), ... , 01' (t)) T représente les paramètres variants: le veeteur rassemble les entrées de l'asservissement (perturbations, bruits, consignes). 1I(1) représente les commandes. le vecteur yU) rassemble les variables ft réguler et ::: (1) les mesures disponibles.
e(r)
Lorsque les différentes matrices cIe cette représentation d'état dépendent de 0(1) de façon rationnelle, ce sysLème peut toujours être mis sous la forme présentée Il la figure 1.12 [ZHO 96], où un système linéaire invarhmt Sii est bouclé par une matrice (-1(1) fonction uniquement des parmnètres : [1.21 ]
Mélhodes hasées sur les techniques linéaires
29
Sans rentrer dans les détails, signalons simplement que les dimensions /1!, ...• " /1 dépendent de la complexité cie la relation entre les matrices de la représentation d'état [1.20] et les paramètres.
y
Figure 1.12. tdocléli.mriOlI
d'JIll systi'lIIc
LPF
Si les paramètres variants sont mesurables ct bornés, on peul chercher pour ce système un correcteur sous la même forme, c'est-tl-dire se présentant comme le bouclage d'un système invarÎant Kli et d'une réplique de la matrice BU) (voir figure L (3).
L'
Il
Figure LB,
Slrt1Cllfrl',Ç
dtt
système Cl
d/l
COfn!cti!Ur
Supposons que chaque paramètre variant évolue dans un intervalle:
ll.22J
Un objectif peut être de chercher ü minÎmiser, pour toute évolution admissible du vecteur O(t).le gain L-:. entre les entrées c(t) et les variables régulées y(1) :
JI
=
sup CU)E L 2
!!.i ~(I (f) :5Jïi
lIy(l)lb lieU )11-:.
[1
30
Systèmes non linéaires
Ll est l'ensemble des signaux de calTé intégrable et 11111 désigne la norme définie sur cet ensemble:
r \ Jo
x
J/e(t)/h:=
-
e(1)T e (l)dl
11.241
On trouvera dans les références lAPI( 95J, [PAC 94] et lSCO 95] diverses façons de calculer la pallie linéaire invariante Kli du correcteur. La méthode que nous allons utiliser est par ailleurs décrite en détail dans [LAR 02]. Toutes ces méthodes expriment la recherche du correcteur comme un problème d" optimisation sous des contraintes décrites par des inégalités matricielles 1inéaires (LMI). Ces problèmes sont intéressants car ils sont convexes et donc dénués de minima locaux. De plus, des logiciels spécialisés sont disponibles. tels que par exemple [GAH 95]. Le COlTecteur K(8) obtenu se présente lui-même comme un système LPV, dont les paramètres évoluent de façon synchrone avec ceux du processus : on dit qu'il est séqucncé jJar 0 (l). La partie 1inéaire invariante Kli est décrite par des équations d'éwt, de même ordre que celles de la partie linéaire Sli du système.
1.3.2. Systèmes et correcteurs qUllsi LPl' Il est intéressant de constater que cette façon de faire, développée à l'origine pour les systèmes lînéaires, fournit aussi dans certains cas une méthode pouvant s'appliquer à certaines classes de systèmes non linéaires. En effet, rien n'interdit de considérer parmi les « paramètres ) variants des vmiables d'état du processus. Considérons à titre d'exemple le système non linéaire:
+ Xl (t )x:d/) + eU)
'\..'] (l) = -1x] (r) .\'2(/)
{
Y (t)
= -xl(1) + .\.'2(1)2 + /I(t) = .tj (t) + Xl (t )
Ce système sc met
SIi:
.\'1 (r)
=-
.r2 (t)
=
SOLIS
2x 1(t)
-.\.'2 (t)
II) 1 (t)
=
w].(t)
= .\'2(1)
yU) =
XI (1)
X2 (l
[ 1.151
la forme présentée à la figure 1.12, en posant:
+ li 1(t) + e( 1)
+ V2 (t ) + /1 (t )
)
+ .\'1(t)
[ 1.26a]
Méthodes basées sur les technîques linéaires
31
ou encore:
= -2x, (t) + v[(1) + dt) ,t'::!(t) = -.\'2(1) + V2(t) + /l(t)
.(', (t)
SIi:
WI(t)
.t](t)
11.12(1)
= Xl(t)
y(T)
l1.26bl
.rdt) +X2(1)
Le premier cas correspond li la matrice e(l) diag(xl (1): X1U)}, le deuxième = diag{x2(t): X2(t)}. Comme on le voit, même pour un syslènle très simple, In solution n'est pas unique et le choix de rune ou de l'autre n'est pas indifférent: la première représentation conduira il un con'ecteur séquencé par XI (t) el x2 (t), tandis que dans la deuxième le seul paramètre de séquencemenl sera X2 (t). ~1
eu)
Ce type de système, en fait non linéaire. est appelé quasi LPV. Le calcul d'un correcteur se fait suivant les mêmes théories que pour un système LPV, qui fournissent donc lin moyen de commander des systèmes non linéaires modélisés SOllS cette forme. Les paragraphes qui suivent développent un exemple tiré de [HIR 99].
1.3.3. Présentation de [-'exemple Le problème que nous discutons ci-après concerne la synthèse d'un pilote pour la chaîne de tangage d'un missile. Il est souvent utilisé dans la littérature comme un bellchmark [REJ 9~] et il fait l'objet de nombreux travaux [NIC 93, SHA 93]. Le système est décrit par les équations d'étal suivantes: &(1)
K cA:)A1 Cl (odT), 8 (T), At} (t» cos(a(t)
ej (t)
Kq (z)A1(t)2C III (0'(1), 8(1), kl(t)
1
I} (t)
+ q (t) [1.~7]
K'I (z)!vI (t) '2 Cil (a (t), () (t ). !vI (1 ) )
Les variables d'état sont J'angle d'incidence aU) et la vitesse de rotation q(t): la sortie ri piloter esL l'accélération normale 11(1): on suppose mesurer l'incidence a(t). J'accélération normale I}U) et la vitesse de rotation q(t): la commande est l'angle de braquage des gouvernes 8(1), Les coefficients Ka (:). Kt; (':.), K1,(:;), dépendent de l'altitude moyenne;:. ~ A1 eSlle nombre de Mach; CIl(cY, 8, !vI) et CII/(O" /5, /vi) sont les coefficients aérodynamiques. qui sont des fonctions polynomiales en 0' eL affines en kl eL () :
Cil (a, 8, /vi) = alla:' + bllalO'I + (2 - !vi /3)c l1 a + dll 8 Cm (a, 8, flll) = allia:' + hm 0'10' 1+ (-7 + Sflil /3}cmO' + dm8
1
1.1.28]
32
Systèmes non lînénires
Nous considérons comme point de vol: /11 numériques des différents coefficients sont:
an = 1,0286 10--1 bl!
-0,94457 -0,1696 dl! = -0,034 Cil
lIlII
10-1
= 2,152410--1 -1. 9546
bill
=
Cm
3 et Z = 20 000 ft. Les valeurs
= 0.051
10- 2
Ka = 2,069 10- 2 Kq = 1.2320 K'l = 21.4432
rI .29 J
dm = -0,206
pour des angles exprilnés en degré. L'actÎonneur qui réalise le br
± 25 % sur ln partie dépendant de l'incidence dans Cm el Cil et ± 10 % sur la partie dépendant de l'angle de la gouverne.
1.3.4. Synthèse du correcteur Le modèle non linéaire peut s'écrire :
~(t)
3Ka (a ll la(.t) 1: + b ll !aU)! + Cil) aU) + q(t) + 3 Ka d /18(t) 9Kq (am 10'(1)1- + bm la(t)1 + c lII ) a{t) + 9K//dm8(t)
q(l) {
11{t)
= 9K'1
(ail
la(1)1
2
+b
ll
la(!)1
[1.30]
+ Cil) aU) + 9K'l dn o{t)
ell faisant l'approximation cos (0'(1)) ~ 1 (les valeurs de l'incidence restent faibles). Le missile peuL donc être VlI comme un système quasi LPV donlle paramètre variant est la valeur absolue de l'incidence, qui est elle-même la première variable d'étal. Ainsi, en utilisant la lhéOlie des systèmes LPV, un correcteur non linéaire dépendant de l'incidence peut être obtenu. Nous al10ns rechercher un correcteur de cc lype, conformément au schéma de la figure 1.14 (où l]ref désigne la consigne d'accélération). En notant que a lll ~ 2a n et bm ::::::-; 2b/l. In partie linéaire Su du modèle quasi LPV peul être obtenue en définissant les signaux:
!
VI (1)
= !a(t)la(l)
V2(t)
=
la(t)lw!Ct)
!a(t)I(a ll la(1)1
+ bl/)a(t) =
lœ(t)l w2(t)
[1.31 ]
Méthodes basées sur les techniques linéaires
33
'1
Figure 1.14. StruclIIrc
d'OSSCfVis.\'(,1IIC1l1
avec: 0'(1) ({{/l10'(t)1 +bll)ct(t)
Les équations [ 1.30]
l
à (t)
=
l;U)
17(1) =
li' écrivent
= lIJ/vj{t) +b
[1 I1 O'(t)
alors:
+ q (t) + (3 K dl! )il (t) + ,( 3 KCI) V2 (t ) + (9Kq d 1l1}8(t) + (18Kifh 2U) (9K /('I/)O'(I) + (9K'ldll)(i(l) + (9K,/)V2(t) (3, J(0' Cil) 0' (,1)
fi
(9Kl}clI/)a(t)
I
[ 1.33J
1
En ajoutant la dynamique de r actionneur, 011 obtient les équations d'état de la partÎe 1inéuire : 1
3Kadll
o o
9Kq d m
0
o
Sli :
o o o
0
0 9K,/d/J
o
(l,Il
o o
c5(l)
0
9K ,/
IS(t)
0
o
0] [Q'(t)] + [0 o (j(t)
o o
11.341
avec la matrice de séquencemenl
(;")(1)
= 10'(1)1 f-J..
Pour effectuer la synthèse du COlTecteur, on commence par corriger le processus en s'inspirant des règles de l'automatique classique (voir figure 1.15): un lîltre FI (s),
identique pour toutes les valeurs de 1ïncidence, est placé entre le correcteur il délerminer et la commande envoyée sur l'actionneur. Son rôle est d'auénuer les hautes
fréquences, pour éviter d'exciter Îllutilement la commande:
30 s
+ 30
[.1.35]
34
Systèmes non linéaires
soit en représentation d'étnt :
_11 (1)
1
Dc:(t)
= -30.-\") (1) + 3011(1)
[ 1.36]
xJCt)
1 - - - 1 - - - - + :.:::
Figure 1.15. Compell.mliol1 préaloble du processus
En sortie du système, on dispose un conecteur Pl K PI (s) sur l'erreur entre J'accélération normale et sa consigne, el un gain kll sur la mesure de vitesse gyroscopique. Ceux-ci sont pris fonctions de J'incidence (en radian) : f(P/(s)
kq
=
(0,014 - 0,01510'(1)1) ( 1 +
-(0,17
1+43010'(1)1)
:\.
+ 0,2910'(1)1)
Il.37J
Ces deux dernières relations s'écrivent sous forme d'état: j.1U)
(0,014 - 0,015IO'(0I)E(I)
= (1 + 43,010'(t) 1).1:2(1) + (0,014 { :::2(1) = -(0.17 + 0,29jO'(1)j)qU) :) (t)
[1.38J
0,01510'(I)I)E(1)
Ol! BU) = J]re/(t) - Jl(t) est l'erreur d'asservissement. Elles définissent donc un nouveau système LPV dont la partie linéaire cst décrite par les équations d'étal : 1.'3 (r) 114(1) ·\"1(1)
(0)-'"2(1)
+ (-0.015
0
0
0,014
0)
l'sU)
E(t) q(t)
F2/i :
1J!3(t)
0
1J)4 (1)
1
!1ls(f)
0
;: 1(t)
:2 (1)
1 0
'\:1(1)
+
° °
()
° 0
0
-0,015
0 43.0
°
0
0
-0.29
()
0
J
0
\13 (1)
°
0 1
1)4 (1)
0.014 0
0
HU)
-0.17
q(t)
0
1J5(1)
ll.39]
Mélhodes basées sur les techniques linéaires
35
avec: 111(1)
10'(t)1 w:~(r)
114(1)
10'(t)1 ll'-!(t)
t
[lAOl
vs(1) = 10'(1)11/15(1)
c'est-ft-dire avec une matrice de séquencement (0(1) = 10'(1)1/3. En rassemblant les modélisations du processus, du filtre FI (s) el de ce dernier système, on obtient un fiyslèmc LPV global, dont la partie linéaire eSl conslituée de la 11l1se en cascade des représentations ll,36], [1.34] et [1.39], avec la matrice de séquence ment globule H(l) = 10'(1 )1/5. Compte tenu du fonctÎonnement du missile, on sail de plus que 10'(1) 1 reste compris entre 0 et 20°. La recherche d'un correcteur LPV pour ce dernier système est menée en considérant comme vecteur d'entrée c(1) des perturbations s',üoutant aux mesures :, (1), :::2(1) et à la commande 1((1) respectivement, et comme grandeurs à réguler ces mêmes sorties z 1(1), :1(1) après perturbation, et la commande u(t) avant perturbation: cette démarche reproduit en fait la synthèse Hoo par IO()jJ-sha/ûllg des systèmes linéaires invariants: elle est connue pour amener à des comportements équilibrés des sorties régulées et des commandes, avec de bonnes propriétés de robuslesse [MCr 92], La synthèse conduit à un gain 1...2 égal à 6,6. avec un correcteur LPV dont la partie linéaire K/i, d'ordre 6, est séquencée par la matrice eu) = lœ(t)11s. avec 10'(1)1 compris entre 0 el 20°. La structure de correction est obtenue en associant le filtre Fds), les COITecteurs KI' 1 (s) et k'i représentés ensemble sous la forme LIlV, et ce dernier con'ectem LPV (voir figure 1.16).
}-------, f
li
/1
Figure 1.16. StrllCtllfe de correcliollJhll1le
36
Systèmes non linéaires
1.3.5. Allalyse dll correcteur Afin d'évaluer les performances et Ja robustesse du correcteur, vingt simulations non linéaires ont été réalisées en considérant des incertitudes sur les coefficients aérodynamiques telles qu'elles sont spécifiées au paragraphe 1.3.3. La consigne est constituée d'une série d'éche1ons sur la consigne d'accélération, d'amp1itudes variées afin de tester le pilote pour l'ensemble du domaine d'incidence. Les résultats des sÎmulations sont présentés sur les figures 1.17 el 1.18.
Tl (g)
20
10 0 _1 0
,Il,
-20IL~\' -30
1
.
------'---..) - -....' ---",--,..
~,
o
J j
2
345
6
Temps (5)
Figure 1.17. Accélùatiol1 normale
Rad.s-1 15r---~--~----~--~----~---.
10· . 5
o -5 -10~--~--~---~--~-~--~
o
234
5
6
Temps (s)
Figure 1.18. Dériw!e de la position dl' la gOlll'uut!
Méthodes basées sur les techniques linéairci-t
37
On a constaté que toutes les spécifications (le temps de réponse, le dépassement maximal, la précision, la saturation de 8(1)) étaient respectées. L'homogénéité des réponses illustre les propriétés de robustesse de la loi de commande. L'invariance du comportement vis-il-vis du point de fonctionnement a aussi été testée : le missile est stabilisé à une accélération donnée (successivement lJ = 0 g, lOg, 20 g et 30 g), c'est-à-dire à L1ne incidence donnée, et une consigne de 0,1 g est demandée. Les résultats sont présentés sur la figure 1.19.
n(g) 0.12 r-----..,...-::::::::=====:==---_=_ nn-i
0.1 0.08 0.06 0.04 0.02
o -0.02 '--_______ 0.5 1 o
--1--_ _ _' - -_ _- - "
1.5
2
Temps (5)
Figure 1.19. Répollses illdicielles pOlir d~trerel1fs POÎIIfS dcj'rJllclio/1l1ell1ellf
Les réponses indicielles obtenues autour de lOg, 20 g et 30 g sont très homogènes maJgré les valeurs différentes de l'incidence. Le modèle linéarisé autour de 0 g a par contre un comportement un peu différent des autres. On a pu remarquer lors de synthèses stationnaires que c'est déjà le point le plus difficile à régler, c'est-à-dire que, compte tenu de la structure de correcLion choisie, il est difficile d'obtenir un pilote qui respecte le cahier des charges.
1.3.6. Conclusion L'application présentée ci-dessus metcn évidence les capacités des techniques LPV pour Je contrôle de systèmes non linéaires: après une première phase de correction, la résolution d'un problème d;optimisation sous contraintes LMI permet d'optimiser le gain L'2 du système bouclé, ce qui conduit à un comportement homogène sur l"ensemble des valeurs possibles de l'incidence et à une bonne robustesse aux incertitudes sur les coefficients aérodynamiques.
38
Systèmes non linéaires
1.4. Bibliographie [APK 95J APKARIANP., GAHlNETP.. « Acol1vex characterizationot'gain-scheduled 1-100 t:ontrollers JO"~ fEEE Tralls. Amour, Control, vol. 40. p. 853-864. 1995.
[BIT 901 BITMEAD R.R .. GEVERS M., WERTZ v.. AdaplÎI'I! Optimal Control. The Thil/k.ing Mali 's GPc. Prenticc Halllntcrnalionai. Systems and Control Engineering. 1990. fBLA 711 BLASCIIKE E. {( The prindple of field OIiClllalion as applied to the new transvector closed-Ioop control system for rotating-tiled mnchîncs »), Siemell.\' RC1'iell'. vol. 39, p. 217220.1972.
[BOU 95 J BOUCHER P.• Dur..mR D.• ,( Predictive motion control )}. ]ourt/o/ (~rSyslellls El1gillccrillg. Special Issue 011 Motioll COl/lml Systell1s. vol. 5. p. 14f:-162. Springer Verlag. Londres. 1995. rCLA 87a1 CLARKE D.W.. MOIITADI c., TUFFS P.S .. ({ Generalizcd predictive control. Part 1 The basic algorithm, Part n Extensions. and interpfetation )), AlIIowafÎca. vol. 23. p. 137160. 1987.
fCLA 87b] CLARKE D. W.. MOII1'ADI C., TUFFS P.S., « Properties of Generalized Predictive Control )). Proccl'dÎlJgs j()rlI World COllgres'\" lFAC'87, vol. 9. p. 63-74. Munich. 1987. rCLA 88] CLARKE D.W.. « ApplicaLion of generalized predictive conlrol to industrial processes )', JEEE Control SyslL'11IS Maga:,;ne. p. 49-55, 1988. lDUM 981
DUMUJ~
D .. BOUCHER P.,
i(
A revic\V introduction
la
IincHr GPC and applications
»,
.lOI/mai A. voL 39, p. 21-35.1998.
tGAH 95j GAIIlNET P., NEi'vlIROWSKI A.. LAUfl A.L CHlLALI M., LMI COJltrol Toolbox User's Guide, The Mnthworks, 1995. lH1R 99J HIR.ET A.. Pilotage Robuste d'un Missile sur un Large DOl11L1îne de Vol. Synthèse ct Analyse dans le Cadre Boo et LPV, Thèse de doctorat, Supélec et Paris Sud. 1999. lLAN 0 Il LANDAU I.D., BESANÇON-VOJ)A A., fdmllHicatio1/ dcs systèmes. Hermès, Traité JCl, Paris. 2001. ILAR 02] DE LARMINAT P.. Alltomatique linélâre, Hermès, Traité lC2, Paris. 2002
~l
paraître.
[UU 87 J LJUNG L., System ident{fÎCatirJ/l, Prcntice Hall. Englewood ClilTs. New Jersey, 1987.
tMCF 92J l'vlcFARLANE D .. GLOVEI~ TC. "A loop-shaping design procedure using H::x:: sYlllhesis n, IEEE Tnms. 011 Al/tol11. Cam roI, vol. 37, p. 759-769, 1992. lNIC 93] NICl/OLS R.A .• REICHERT R.T., RUGI! W.J .. «( Gain-schedulîng for Hoo contro)]ers: a Jligllt control cX3mpie )', IEEE li'mls. COl/trol Systems Tech., vol. ]. p. 69-78. 1993. fPAC 941 PACKARD A., Gain schedulîng via lîl1car fractional lnmsformaLÏons )'. Sysl('lIIS & Cotllrol Ll'lters. vol. 12. p, 79-92. 1994. l(
rREI 92] REICHERT R.T.. DYl1amic scheduling of 1l10dcrn-robusl-control autopilol design fOf missiles », IEEE Coulrol Syslems Maf:lI::;Îl1e. p. 35-41, J992. f(
1RIe 931 RICHALET .1., PmtirlllC dl' la Commallde Prédictive. Hermès, Paris, 1993.
Méthodes basées sur \cs Icchniqucs linéaires
39
[SCO 95] SCORLETl'l G., EL GIIAOUI L.,« Improved Iînear matnx inequalîty conditions for gain scheduling H. 34 th IEEE C01!j: on Decision (ll1d COI/Tml, p. 3626-3631, La Nouvelle Orléans, Louisiane. 1995. [SI-lA 93] SI-IM\'1!vIA J .S .. CLOUTIER J .R., ( Gain-scheduled missile autopilot design using Iîncar parameter varying transformations n. AIAA J. (~l Gl/idal/ce. COlltrol (/1/(1 Dyl/olllÎcs. vol. 16. p. 256-263, 1993. [SOD 89] SODERSTRÜM T.. STOl CA P., Syslelll idelllijicalÎO/l. Prcnticc Hall, Englc\Vood Cliffs, Ncw Jersey. 1989. [WER 87J WERTZ v., GOREZ R .. ZHU K.Y., (( A nc\V gcncralized prcdictive controllcr application ta the cOlllrol of proccss \Vith unccrlain dcad-timc n. Procecdil/gs 26/ h CO/!/erencc 01/ Decisiol1 al1d COl/lrol. p. 2168-2173. Los Angeles. 1987.
[ZHO 96] ZIIOU K., DOYLE J.c., GLOVER K., Robusl (//ul Optil/1o! COl/trol, Prclllicc Hall. Englc\Vood Cliffs, New Jersey, 1996.
Chapitre 2
Inversiol1 et lil1éarisatiol1
2.1. Introduction L'étude de l'accessibilité d'un système peut se fonder sur la notion de degré relatif d'une fonction de l'état pou vam être considérée comme une sortie du système. Le degré relati f représente l'ordre de dérivation qui doit être appliqué ft la sortie afin d'avoir une dépendance explicite de l'entrée. Cela correspond ft la structure à l'infini dans le cas monosortie. De manière plus générale, la structure à l'infini d'un système non linéaire décrit la structure des« retards» de dérivation existants entre la sortie et l'entrée dans le cas multivariable. Elle est utile pour la résolution de nombreux problèmes de commande et elle sera définie dans ce chapitre pour les systèmes non linéaires. Elle est calculable par l'algorithme d'inversion qui sera également donné.
L'algorithme qui donne la structure à l'infini est également connu sous le nom d'algorithme d'inversion puisqu'il fmul1Ît, pour les systèmes inversibles, l'entrée en tant que fonction de la sortie, de dérivées de la sortie et éventuellement de certaines variables d'élat. Donc, il peut être directement considéré comme un algorithme de commande qui effectue le calcul de l'entrée nécessaire pour engendrer une sortie prescrite. En pratique, les méthodes de commande telles que la poursuite de trajectoire ou la méthode du couple calculé en robotique sont des cas particuliers d·application de l' algori thme d'inversion.
Chapitre rédigé par Claude MOOG.
42
Systèmes non linéaires
2.2. Inversion
2.2.1. Structure à l'illfini Etant donné un système: 1: =
{.i' y
f(x}
= !J(x)
+ g(x)lI
[2.1 J
où x E lR~/I, Il E ]R/lI, Y E RP et les éléments de f. g et!J sont des fonctions analytiques de x. on associe natureIJement il 1: une filtration de sous-espaces Eo C El C ... C EII
01" E définis par:
En
spanx: [dx} [1.2]
ElI
= span}C! dx,
DÉFINITION
fat:. k
cl.', .... , d/ II )].
2.1.- Etant dOl/née lafiltra/ion d'espaces vectoriels {l.lj, fll liste d'eHtiers
= l, .. . ,111 déjil1is pl/f: at:
Ek = dimx: -,,-
L2.3]
'-'k-l
est appelée la structure li
l'ÎI~lini
de :E.
La liste donnée par [2.31 contient une information sur le système qui joue un rôle crucial dans la solution de beaucoup de problèmes de commande [BEN 89, CON 91, PER 89]. La liste d'entiers (Sb k = 1•...• n) définis par:
k = 2, ... , Il
[2.4]
décrit les zéros à l'infini de 1: de la manière suivante. SI est le nombre de zéros à l'infini dont l'ordre esl égal il 1: Si est le nombre de zéros li J'Înfini dont l'ordre est égal à i. La liste des ordres des zéros à l'infini 111',) est déduite par dualité de la liste lai 1 : .!
On note que le degré relatif d'une sortie scalaire Yi est égal à l'ordre du zéro à l'infini du système monosortie :
.i' = f(x) + g(x)u { Yi=hi(X) Un algorithme pour le calcul de la structure à l'infini est donné dans le paragraphe 2.2.2.
Inversion et linéarisation
2.2.- L'ordre essentiell1it' de /a composante .'Ica/aire Yi de /0 sortie est
DÉFINITION d~{il1i
IIÎc
43
par:
= min 1k
E
FT
1
dyi ) ~ spanfC 1 dx. d." ..... dy(J.:-I). d.".i~i' dyU+ 1) •...• dy(Il)} ) k
[2.5]
2.2.2. Algor;thme cl 'ÎllI'ers;oll
L'algorithme de structure. ou l'algorithme d'inversion de Singh, constitue un Dutil fondamental dans l'étude des systèmes dynamiques non linéaires. Il résulte des travaux initiés par Silverman pour les systèmes linéaires invariants [SIL 69], dont la première généralisation aux systèmes non linéaires peut être trouvée dans lHIR 79 J. L'extension dans [SIN 89] est présentée ici et suÎt le développement de [BEN 89]. Etant donné le système [2. J],
Etape 1 : calculer:
.\' = =
ah(x)
--({'(x) ax -. al (x)
+ o(x)u) b
+ bl (X)I1.
Soit PI = rangbl (x). Pell11Uter, si nécessaire, les composantes cie la sortie pour que les PI premières lignes de bl (x) soient linéairement indépendantes sur le corps /C. On note .~I le vecteur des PI premières lignes de .\' et .~I le vecteur des p - PI autres lignes, de sorte que:
. (.VI) ,,= . 5"
.
1
Puisque les demières lignes de b 1(x) sont linéairement dépendantes des mières lignes, on peut écrire:
.~I
= al (x) + DI (X)II
.~I = .~'I (x, YI),
. -où la dernière est affine en .YI. Finalement, on définit BI (x) := /JI (x).
PI
pre-
44
Systèmes non linéaires
+1
Etape k
:.. ... 'Yk -(k) A(k). , , b' Supposons que, dans les étapes 1 il, k" YI, 'YI;: ment ete len d'f" e lOIS de sorte que:
-(/.:)
Yk
=
- (.:. al;:
-(!,:-!)
-(J.:)
x·y',··"Y,
'····yk-l
.:. -(k-I) + /)dx, YI· , .. , YI • ,." A(k)
Y"
AI!':):"
-(k)
-(k).
')'k-I) -1/;:-1)
-"1.'-1
)/1
-(1.')
YI;. (x, YI • ... 'YI ., .. , Yk )
-( il et Yk A(k) ; 1les de . l'1er, Yi' E11 parllcu sont dl" es lonctlOns meromorp
également que la matrice Îh :=
V'
I\.J,
0 n suppose
I/;r, ' ... Dlf est de rang plein, égal à Pk. Calculer:
'j"U"
k
k
~[/'(x) + o(x)/Ii + '" '" rh" LL
v~j+l) ·1
ô
j=i
qui peut être écrit sous la forme:
,1 -(j)
+ lJk+ 1(x, Yi
:s i .s k. i :s: j :::: k + 1) 1 . ' :::: 1 :s: II.. ( :s: .1 :s: I.;;)U, l'
•
1 .
Pk+ 1 := rangBk+] ,
Permuter, si nécessaire, les composanles de .\'kk+ 1) de sorte que les premières Pk+ 1 , de If'.Jk+1 :' ' ) "memrement . . d'epen dantes. 0 n d'ecompose YI.'(k+ 1) sous 1a f'orme: l Ignes S01ent 111 A
A
':'(k"'I))
(k-1·1)
YI;:
)'''-1·1
=
( ':'(k+l) Yk+1
Tnversion et lilléarîsatîon
4S
- (k-I-1) . "cl .. ( - l' P . 1 d .. l' ou~ )',,+ 1 est constItue es prem1eres Pk-!-I - Pk) 19nes, lIIsque es . erllleres Ignes de fh+1 sont linéairement dépendantes des premières Pk+1 lignes, on peUl écrire:
àJ{x)
_VI
+
+ bdx)u
(x. ) (x,
,vJ-il, 1 ::s i ::s k, i ::s j ::s k)tt yi}), 1 ::s i ::s le + 1, i ::s .i ::s k + 1)
. -T -T T Finalement, on pose Bk+1 := lBk . b k + 1 J .
L'algorithme s'alTète lorsque: <;.\:.
A(k-j-l)
rangu()',YI""'Yk+l) 1
li')(x=rango(y,YI' . IO};
~(/;) ]/')
.... Yk ) oX.
Les ordres des zéros à l'infini, de même que les ordres essentiels, peuvent être calculés Il partir des équations de l'inversion suivantes. k ::: 1 : -(k)
Yk
-
.:.
-(fI)
-(/;-1)
-(/;)
adx. YI· ...• Y, •... , J''''_I . -""-1) -(k-I) -(k-I») + ,-Jk (.:. X,)'I.·· "YI •...• -""-1 li
La liste des ordres des zéros à l'infini est donnée par la liste des plus petits ordres de 1... , . p apparaissant explicitement dans [2.6]. L'ordre essentiel dérivation de Yi. i l1il' est égal à l'ordre de dérivation le plus élevé de Yi apparaissant explicitement dans [2.6]. En fuit, l'algorithme d'inversion. ou de structure, calcule une base pour la filtration de sous-espaces [2.2J. THÉORi:;'ME 2.1 ([BEN 89]).- Ulle
Id
\ ·X,
d':'
)'1 •... ,
d-(k) YI •....
base de El. l'st dOllnée par: d-(k-I) -"k-1
'
d- un
)'k-1'
d-(k)} Y"
Démonstmtion. Notons que pour k = l, [d.\'. d);l] est un ensemble de générateurs de [, car d.~'1 E spanK:! d.r~ dYd. Puisque hd.\") eSL de rang plein, cet ensemble est constitué de vecteurs indépendants eL il forme donc une base de E,. Le reste de la démonstration peut être effectué par récurrence [BEN 89]. Il
II découle du théorème 2.1 que les listes {ak, k. = 1•... , JI} et {Pk, k sont égales. En particulier Pli est le rang du syslème ~.
=
1..... Il )
46
Syslèmes non linéaires
o
XI
Figure 2.1. L'ullicycle
EXEMPLE 2.1 d'état es! :
x
=
Considérons "unÎcycle décrit dal1!1/a.figure 2./ dont /Ille représentation
lIl]
C?S.\'3 [
smx] u] Il'].
L'algorithme d'il1\'ersion elltraÎne :
5' 1 = (cos x 3) 111 )'] = (sin X3)1I,
[2.71 (tan X3»>'
[2.8]
La seconde étape de l'algorithme donne:
et l'algod/hme se termine. L'en/rée est alors obtenue par: lI(
= j"
/ cos
l);2 112
.\'3
(tan x3)5;11 cos} X3
[2.9]
Inversion ctlinéarÎsatÎon
L'e,\1JllCe fI
CI
47
comme base 1dx, d.\'1l et l'espace [2 ad111etla base:
L'lll1icycle possède ml z.éro il /'ir~/irzi d'ordre 1 el fIIl :ém cl del/x ordres d'essentialité l'alem 2.
/'ÏJ~fil1i
d'ordre 2. Les
2.2.3. llwersibilité L'illversion des systèmes il été posée de longue date. En principe. elle permet, dès lors qu'un système inverse existe, d'engendrer ln commande nécessaire pour une sortie désirée.
2.3 (INvERsE À DROITE).- Le système:
DÉFINITION
I
f: = F(:, y, J' ..... y()!») 11
[2.10]
= H(:, y, )1, ...• .\'(1'»)
est 1111 système inverse à droite pour le sy.wème /2.1 J si la sortie y(t) de [2.1] est égal il yU) de [2. JO 1dès lo!"s que l'entrée 11 (t) de J] esl égale cl la sortie de /2.10 j. La définition d'ull système inverse à gauche est obtenu lorsque le rôle de [2.1] et de 12.10] sont échangés. DÉFINITION 2.4 (SYSTÈME INVERSE À GAUCHE).-
.:. -- F( ~, - .J" " ..,', '
"
{
11
Le système:
~)(\'))
•• ~ , ~t
l2.l ] ]
= H (:. y, )1, ... ,/1'))
est lm système im'erse li gauche pour le système [2.1] si la sortie u(l) de [2.111 est égale à l'entrée 11(1) de [2. /] dès lors que l'entrée yU) de /2.11 J est égale il la sortie de [2.1]. DÉFINITION
2.5.- Le système /2.1] est dit ÎIlI'e/:;,'ible cl gauche (resp. cl droite) s'il existl'
ml système inverse à gal/che (resp. li droite). PROPOSITION
2.1 ([FLI 86]).- Le système /2.1 J est inversible li gauche (resp. cl droite J
si er seulemeHl si SOif rang p EXE1\tIPLE
ei\'{
égal il
III
(resp. p J.
2.1.- Suite.
De /2.9J.
1111
système il/l'erSe de /'unicycle est:
= [.\;' -
I l'7
(tan
~]) y[] cos
2
1]
YI
= .\'1/ cos '] [j;} - (tan 17)YJJ cos 2 1) . = --------/1..,
ft [
-
5'[
48
Systèmes Ilon linéaires
En ulilisl1nlf2.8], 011 obtient X3 = arctan(\'2/\") et donc il existe 1/11 système ÎllI'erse sfatÎque (d'ordre z.éro) :
2.1.- Considérons
EXEMPLE (s
/111 système linéaire dOl1t la fOI/clion de tral1.~lerr égale
+ 1)/s2 : ofl {
-"2
oh
="
y
= .Y1
+X2
L'olgorithme d'inversion cOl1duit il .l' {ZN E 931 est: 1,1 /
/1
= -'"} +/1 ef donc lOI sys/ème Înverse
t(
réduil»
= -IJ + .~' = -1] + Y
Il est de dimension 1 et le sys/ème illl'erse d'ordre rédlfir représente la présence d'lIJ1 zéro de lransmissiol1.
2.2.4. Dynamique des zéros Dans [ISI 861 il est montré qu'îl exÎste trois notions de zéros de transmission qui généralisent. dans le contexte non linéaire, le concept de zéro de transmission d'un système linéaire invarianL. Une de ces notions, l'annulation de la sortie, donne un outil pour l'étude de la stabilisation locale par bouclage statique d'état des systèmes non linéaires. D'un autre côté, la notion de dynamique de zéro définie ci-dessous est en accord avec celle de l'exemple 2.1 el joue un rôle crucial dans les problèmes de commande par bouclage dynamique. en particulier dans le problème de la linéarisation par bouclage dynamique (voir paragraphe 2.5.2). DÉFINITION 2.6.- COI/sidérons le système 12.1] el SUppOSOIIS que p = 111. La dynll1uiqtle de :éro d" systè11le {2./ ] est (hf/il/ie par la dynamique dtl système réduit ÎIlI'erse.
L'algorithme de structure permel immédiatement de déduire le résultat suivant. PROPOSITION l'SI
égal il
Il -
2.2.- Si le sys/ème es! ÎI/ven'ible, a/nrs l'ordre de la dynamÎque de z.éro
1/;,
oilles 11; représe1l1ent les ordres de,'i' zéros à "h~fjlli.
Inversion et linéarisation
49
2.3. Linéarisation entrée·sortic La linéarisation exacte des systèmes non linéaires constitue une méthode naturelle et prometteuse: elle permel d'obtenir un comportement entrée-sortie linéaire par la mise en œuvre d'un bouclage. Par la suite, toute la théorie linéaire peUl être appliquée [CON 99, ISr 89, NU 90]. Les méthodes de commande avancées comportent souvent plusieurs bouclages dont un bouclage de linéarisation. La linéarisation entrée-sortie joue un rôle important dans un domaine comme la robotique: dans ce cas, la méthode du couple calculé est un cas particulier de la linéarisation entrée-sortie.
2.3.1. Formulation du problème Linéa rÎsatÎon en trée-sortie pa r retour d 'état
Etant donné le système: L;
= {.\" = fCr) y = h(x)
+ g(X)/1
l'étal x E iPi.1I , l'entrée 1/ E JR://I, la sortie y E JRU) et les composantes de f, g, h sont des fonctions méromorphes, trouver, si possible, Uil bouclage statique régulier d'état 1/ = a(x) + !3(x)v et une transformation d'état $ = cp(.\") telle que, dans les nouvelles coordonnées d'étal, le système compensé s'écrive: Ol!
A 1~1 + B, V1 ~"2 = .h(~I. ~2) + g2(~', ~"2)v y= C,~,
tl = {
où VI est un vecteur composé de certaines composantes de commandable et la paire (C, , A., ) est observable.
l2.12J
Il,
la paire (A l, BI) est
2.3.2. Cas lllollosortie Le cas monosortie de la linéarisation entrée-sortie par bouclage est certainement Je schéma de commande de base le plus élémentaire. TI réside au cœur de nombreuses lois de commande non linéaires plus sophistiquées qui sont développées ci-dessous. Cette méthode consiste à compenser, par bouclage, les non-linéarités qui apparaissent dans la dérivée d'ordre r de la sortie, où r est son degré relatif. Dans le domaine de la robotique, ce schéma de commande est bien connu sous la dénomination de méthode du COl/pIe calculé. Une condition nécessaire et suffisante pour la résolution de ce problème est formulée de la manière suivante.
50
Systèmes non linéaires
TI-IÉORÈTvŒ 2.2.- Supposons p 1. alors le problème de IinéarisatÎo1l de /a relation emrée-sortie par bouclage statique sur /' état adllJet ulle sol1ltÎoII pOUf :E si et seu/t'melll si SOli degré re/mU" est JinÎ.
DélllOllst ration.
Suffisance Soir r le degré relatif de la sortie et soit fi 1(x) := ."(x), ... , hr-I (x) := y(I"-I)(x) := y(r)(x, Il). On démontre par l'absurde que:
el VI
rang
a(h(x), /1[ Cr), ... ,hr-I (x)) (lx
[2.131
= r
Supposons que [2.13 J ne soit pas satisfaite. alors, sans perte de généralité, supposons que dhr-I E spunl({ dlr, cI" l, ... , dh r -2)' Du théorème des fonctions implicites, il existe localement V' telle que: 111"-1 (x)
= V/("(X), "lfx), .... 1I1'-2(x)).
Ceci implique dy(k)
E
Spi.1I11({ dh, dh 1,
...•
dhr-:d pour tout k 2: O.
Soit (~II, ... , ';Ir) = (h(x), Il 1(x), .... 11,.-1 (x)) qui peut être complété pour définir une transformation d'étal. De même, VI peUL être complété par (V2, •. _, VIII) de sorte que 8(VI, ... , VIII )jall soit inversible elle résultat suit. Nécessité
ToUL système linéaire communcIable el observable a un degré relatif fini.
Il
EXErvIPLE.- Soit:
= t io ,
:\"2
If
Y =XI
xi
Ollllpplique la procédure ci-dessus ef 011 d4/i1lÎT ;11 ·\'1. ';12 eT 11 2X111. Notons que la Iral1.~tolïlJa(ion ~(x) est méromorphe, alors que la transformation il/l'erse .; -1 Ile l'est pas. Le bouclage linéarisant l'ST Il = Vj'2x2 el la Jonction de tmn!.fert du système linéaire en boucleferlllée est 1j s2.
Inversion eL linéarisation
51
2.3.3. Ca.I\ I11llllisorlie
La solution éleJ1u:'lIhdre peut être facilement généralisée aux systèmes mullisorties. On obtient alors la condition suffisante suivante.
2.3.- Le problèllle de 10 lilléarisation
THÉORÈME
el1trée~sor/ie pOlir
E admet ulle
solutio/1 si : [2.14]
p où Il représente le degré re/aIt/de la sortie hi. pour; = l, .... p.
Délllo/1stralÎon. Posons Vi = y/,"d(x, If) pour Î = 1, .... p. De rl.l4J, on définit de sorle que av/au soit inversible. Le résultat suit. Il
VJ1+1, ••• , VIII
a(-/'l).l';'~l ..... /?)).
.
A
••
La matnce . 1 . -aIl ·1 qUI appanllt dans la condItlOl1 14] est usuellement appelée la matrice de découplage de 'E. La condition [2.14J est évidemment non nécessaire. Ceci peut être vu sur le système linéaire suivant. EXEMPLE
2.3.- Etal/! donné le systèl1le :
:\-] =
Il]
=.\'3
=
+ Il 1 [2. J5]
Il}
)'1 =-"1
ol1llUmtre./acileme/lt que
rang (j(5'1 \ ."2)/(l1l = 1.
Une condition nécessaire et suffisante pour la linéarisation entrée-sortie est donnée dans [ISI 84] et peut être formulée de la manière suÎvante. 2.4.- Supposom' que le systè/J/e [2.1J soit inversible il droite. Alors, la linéarisation entrée-sortie admet ulle solutioll si et sellle1llelll si :
THÉORÈME
a(li, li, . . . •
))
[2.161
Démonstration.
Nécessité La condition [2.16] est clairement vérifiée par le système en boude fermée. Cette condition est invariante sous bouclage statique d'état inversible.
52
Systèmes non linéaires
Suffisance Réécrivons l'algorithme de stmcture du paragraphe 2.2.2 dans le cas particu 1ier où la condition ['2.16J est satisfaite. Etape
1 :
calculer:
(_~r)
\' = -
=
YI
({~I (x) + '~r (X)1I)
:=
(/1(x)+br(x)1I
(~I) '::1
De la condition [2.16], les lignes de ,; 1(x) dépendent linéairement, (sur IR.) des lignes de ';1 (x), donc:
§.I =
âr(x) - LICidx)
+ LI:I
pour une certaine matrice réelle L \. Notons:
::2 := j,1 - LI~1 := Ci2(X) Etape 2 : ca1cu 1er:
.: . = ( Ci 2 (x)
.... '......
-
a2(.r)
+ '~2 (x )Il) + b2(X)1I
.= .
(~2) ....
'::2
De [2.16], les lignes de ';2 (x) dépendent linéairement, (sur lR) des lignes de
('~[ (X)) h:!(xj
donc:
~
~
(_)
.:.2 = lI2·\
-
L2
(è.'- l (X)) L (~1.) (.) + 2 .::. al
~
Z2
pour une certaine matrice réelle L2. Notons
Z3
:=
~2 -
L2
(~~ ).
Etape k : calculer:
~~\"/2).l6j, (
_: bk-I (x)
les lignes de bk(X) dépendent linéairement. (sur lR) des lignes de
. donc:
Inversion ct linéarisation
53
pour une certaine matrice réelle Lf::. Notons:
En raison de l'hypothèse d'inversibilité à droite, il existe N
E
N tel que:
hl (X») rang
(
_:
= p
hN(X)
Un bouclage statique sur l'état qui résout le problème est alors donné en résolvant en 11 l'ensemble des p équutions :
v
III EXEMPLE.-
·\:1 .\:2
= xJlIl = x4 + 2.\"3/11
·1-3 =
X3
:\'4
//2
[2.17]
YI =Xl
De l'étape J de l'algorithme de srructllre, posons VI := .\"3/11 ef ,'\'2 = X..j + 2.\'1. On dérive -\:"4 ail lieu de ef 011 pose V:?, := "1. Par conséque1lt. le houclage statique d'état linéarisant est donné par 11 1 = VI/.'\3 e1112 = V2.
2.3.4. Linéarisafioll ellfréc s(}rtie par ret(}ur dynamique de sortie: cas 11I01l0S01't;e M
Dans toutes les commandes décrites précédemment, on suppose que l'état est complètement disponible par la mesure. Cependant, cela est rarement le cas en pratique et dans ce cns on peut suivre deux options: soit on estime les variables d'état en construÎsant un observateur non linéaire, soit on recherche directement un bouclage
54
Systèmes non linéaires
statique ou dynamique sur ]a sortie qui puisse résoudre le problème de la linéarisation entrée-sortie. Ce n'est que récemment que la seconde option fut considérée et les premières conttibutions peuvent être trouvées dans [MAR 91, MAR 95, RES 85, XIA 96]. Des conditions nécessaires et suffisantes som données qui assurent l'existence d'un bouclage statique de sorlie solution du problème. Dans cette situation, un bouclage est obtenu de manière expllcite par un algorithme qui est constructif à des conditions standard d'intégrmion près. Des conditions suffisantes sont données pour l'existence d'un bouclage dynamique sur la sortie solution au problème. D'un point de vue technique, des injections de sortie ad dît ives jouent un rôle déterminanL\"{~"lemel1t dans la recherche de solutions par bouclage statique de sortie. Dans le cas des bouclages statiques de sortie, une slrucwre linéaire standard (modulo des injections de sortie) est nécessaÎre comme cela est montré dans le théorème 2.5. Dans le cas des bouclages dynamiques, une structure beaucoup plus générale est introduite et conduit à une condiLÎon suffisante nouvelle pour la résolution du problème. Les transfOlmarlons requises ne sont plus des injections de sortie standard, par opposition ù [XIA 96]. Une application de ce résultat il la commande d'un moteur à courant continu peut être trouvée dans 1POT 00]. LinéarisatÎo1l entrét'-sortie par retour stalique de sortie
On présente tlne généralisation directe de [MAR 91, XIA 96] au cas non observable/non accessible, On montre que le problème peut être résolu si et seulement si le système peul être linéarisé par injections de sortie. Bien que les injections de sortie jouent leur premier rôle dans la synthèse d'observaleurs asymptotiques (avec une dynamique d'erreur linéaire), elles jouent également un rôle crucial dans la linéarisation entrée-sortie par bouclage statique de sortie. Cela n'est plus le cas lorsque des bouclages dynamiques sont considérés. On considère un système non linéaire:
.," = f(x, li)
[2.18]
y = h(x)
où x E J.R:1l, If E lffi., Y E ID2., f, h sont des fonctions méromorphiques de leurs arguments. On s'intéresse à l'étude de la linéarisation entrée-sortie par bouclage statique de sortie. Le théorème 2.5 permet de résoudre Je problème. THÉORÈME 2.5.- Le système (2.IS! est linéarisable en entrée-sortie par bouclage statique slIr la sortÎe si et seulelllent si :
(i) dy(ll) est lil1éa rtsab le par li injections de sortie
cj))
(y, li), ... lPïi(Y, 11); 1
(ii) dimnt (spanIRfdy, dq,I, .. ·, dcj>Jil) = dim}C (span}C{ d)', d(p), ... , dq>IÏl).
Inversion cl linéarisation
55
La démonstration du théorème 2.5 suit la dén'lOl1stration du théorème 2.2 dans [MAR 91]. LinéarisatioJl el11rée-sortie par re/our dynamiqlle de sortie
Les conditions du théorème 2.5 sonl restrictives en pratique: cela signifie qu'il n'existe que rarement un retour statique de sort je. Dè~ lors, il est intéressant de rechercher une loi de commande dans une classe beaucoup plus large et qui peut néanmoins être mise en œuvre aussi facilement : la classe des bouclages dynal1lique~ de sortie. Une solution va être exposée à présent. D'un point de vlle technique. elle repose sur une structure originale de la relation entrée-sortie du syslème. Elle permet de donner la synthèse explicite d'un bouclage dynamique de sortie linéarÎsanL. De manÎère introductive, considérons l'exemple académique suivant:
1 X2 -
;:;-
In(.q
+ 2EI)
.\'1 + li 1 ---+XI +2u .,
In(xi
+ 21/)
[2.19"1
)'=XI
dont l'équation différentielle entrée-sortie est: [2,201 117) 1(y + 211 ). Bien que celte structure avec ,pl (y, li) = El, (1)"2. (w, y, /1) = (y + Il soit différente de la structure linéaire modulo des injections de sortie, elle conduit à la synthèse d'un compensaleur dynamique solution du problème de linéarisatÎon entrée-
sortie. Formulation du problème: le système [2.18] est linéarisable en entrée-sortie par bouclage dynamique de sort je s'j) existe Ull compensateur: /1
= H (y, 17, v)
1]
F (y, 17, v)
[2.21]
tel que le système en boucle fe1111ée : .\~
= f(x. H(h(x), 17, v))
'1 =
F(h (x),
y = h(x)
']. v)
[2.221
56
Systèmes non linél.lires
soit difféomorphe à :
{'
~2
Açl+bv
= f"7lU;. '], v)
y =
[2.23]
ct l
OÙ, 11 E t 1 E lPi.'I , (2 E IR:II+q-ii, (c, A) est une paire observable. Deux conditions suffisantes sont données ci-dessous. Elles constituenL loutes les deux une généralisation de la structure [2.20] de l'exemple introductif.
2.6.- Le
THÉORÈME
,\~\'slème
/2. J81 est linéarÎsable par bouclage dYllamique de
sorrie si : d \,(il) .
=
Â!
d \.(iÏ-ll
-
+ d [ l/Jii("
+ ... + Âr-I dv(JI-r+l) -v. Il)
0
d dt'
d dl 'l'
-qJÏt-1 (" V. li) o··· 0 -rl)r_I_! (',
\'.11)
. .
0
d ] dtérr.( v.lI) [2.24]
mi Âi
E
lft Ci = l, ... , r - 1).
Démonstratioll. Considérons le système [2.18]. Posons:
'Jl := (l>r(Y, u) '12 := 4)1'+ 1(11 l , y. 11) J}3
:=
(IJr+2Ub" y, li) [2.25]
l]ii-r li
:= 4),1-1 (11JÏ-r-l. y.
:= (/),;(171Ï-r. y.
Il)
Il).
On note que de la définition du degré relatif r, (l',. est inversible par rapport ~I 1/ el (IJ; est inversible par rapport fl (Î)j -l, pour Î = r + l, .... ji. On définit. alors le compensateur dynamique suivant: Il
17; = J]II -r
CP,-: 1(y,
/11 )
(1)/~~Î('7Î-f-" y. (IJ,--:1(y, 17)))
1.... ii - r 1
l2.261
t/),~ )(v y, (IÇ 1 (y, 17) )). 1
La subst.itulion cie l2.26] clans [2.24] conduÎl à la relation suivante pour le système en boucle fermée : [2.27] Donc. le svstème 12.1 Rl p.st
11nl~:lri"p nnr hOI1I+ICJP rhm:ll'ninlIP rll" cl'Irti/>
Inversion ct linéarisation
57
L'algorithme 2.1 qui suit permet de vérifier la condition [2.24]. Il permet également 1..... il) (à de calculer (dès lors qu'elles existent) les fonctions requises (I)i (i J'intégration de I-formes près). Supposons: [2.28] Test initial: dyUï) E pi. Si non, stop! Si oui. on Ilote (VI = dy(IÎ). Etape Î U = 1, ... r - 1) On choisît des fonctions !;i telles que (Vi J
E
ll
-
i.
(Vi+1
Posons Wi = !;i d.\'. Tester: iVi E span]R { cly J. Si
=
110n,
-
!;i dyUï-il E
stop! Si oui, on définit
(Vi·
wi
Etape r. On choisit des fonctions ;r, (J,. E JC telles que lVr - t;r dy(ii-r) - Or du (ii-r) E
E n- r . Poser wr tel que:
t;r
d.\' +Or du. Tester: div,.
1\
iVr = O. Si non, stop! Si oui, 011 définit
1)r (y! II)
L2.29]
où
Àr E
!C. Notons
':r-!-I
=
.
(/)r(\', If).
a(/Jr
Si ~
-=1=
0, on réécrÎt
lOI'
de sorte que:
lù r
E
'r (d_(IÎ-r-l) d- d (iï-r~l) , ••••. (11. 1 d. ,}\ . spanl( "/'+ l ' ... , . 11 Si î~)lIJi' = 0 et i~ll/lr i= 0, on réécrit (V r de sorte que:
'.\'
III
(li-r-l) ·1 d (ii-r-I) .... , d y. d} l.t>rEspanl( 1d ::r+1 , ... ,l:r+l, -" u.
e(C = r + 1.... , lï -
--'---
(V r
-
ft [
cl .::: (ii-t:) ('
é:
- "f
1). Choisir 1;(, Or, P.L E JC tcl que:
d (ÎÎ-I') Y
On pose ivr = /J-[ d.:::/, +!;f dy + O( du. Tester: divr Si oui, soit 1Jr(z.('. y, li) tel que:
1\
(VI'
1\
d(/Jr-I
= O. Si
non. stop!
L2.30] al! YI', À{' E !C. On note :::(+1 Wr E
Il).
On réécrit
(VI'
tel que:
(ii-f-I) d d (Jï-{-Il , ... , d y, d Il lii-t'-I) .... , d} spanJ( { d ;'('1'\ ....• :/:+1, Y li.
Etape ii. Par construction,
dW r
1h(:::f, y,
WI"
E
span}( 1d':::iï. dy. du}, et par définition:
= O.
Fin de l'algorithme. Algorithme 2,1
58
Syslèmes non 1inéaircs
Sous l'h.\ïJOfhèse /1.28], dy(IÎ) (2.241 si el seu/cment si dyUi) E E iÎ :
THÉORÈME 2.7.-
d(V r 1\
E
E peut i'!lre écrit
SOIIS
la forme [2.31 ]
=0,
[2.32]
I1existel;I, ... ,';r-1
tel qUi'
E
:
1'-1
dy(ii) -
L';i
dy(iï-i) E
E IÎ -
r
[2.33J
i=1
Démolls/ratio1/ (Nécessité). En raison du théorème 2.6, la nécessité de [2.33] est évir + 1 fonctions (I)i (i = r. ... , il) qui permettent dente. On suppose qu'il existe iï d'écrire d."!I;) comme dans la condition (i) du théorème 2.6. Alors, de [2.29] et de [2.30], les I-formes différentielles [Vi peuvenl être écrites de la manière suîvante : Eh/J,;
(VI'
a(!J{i_1
Wr+1
=
éJ(Piï
a
Î)qJii- 1
-.-._... 1
atPr+l
•.. - - .(/J r
()(i)ii-I
i)(/)r+2
dqJr(v. 11) . •
dqlr+1 (4)1'' y,
Il)
+ )11'+1 dql,.
(h/Jji-'1
Cela implique la nécessité de [2.31] el de [2.321. Suffisance: le déroulement de J'algorithme 2.1 montre la suffisance du théorème 2.7. III Une condition suffisante encore plus faible mais plus complexe esl donnée à présent. TI-IÉORt~ME 2.8.- Le système {2.18} est linéarisable en en/rée-sortie plir bouclage dynamique de sortie si :
3 iL q E r~J
dy'ÎÏ) = ÀI dyilî-l)
+ ... + 'AIl d)'
o~,.;)')( Il)] dl '1"- . , .\'.. Il) ~(I)l dl f (v, • 0
ot! ;)(/)!/r)u :;6 0, el
À; E
IR: (i = l, ... , JI).
[2.341
Inversion cl linéarisation REMARQUE.- Puisque l'indice d'observabilité l1e peut pas décroÎtre, il 2: li h.. degré re/at(j"uc pell1 pas di/JJin/ler il - Cf + 1 2': r.
el
59
jJ/lisq/le
Démonstratiol1 du théorème 2.8. On considère le système [2.18]. Posons:
171 :=
t/)1 (Ji 1 • y. 1/)
IJJ :=
(/)3(112. 17'. y,
Il)
l2.35] Jlq~' := li
q)q-' (Jll/-l,""
J]I, y~ Il)
:= lj)l/(J7q-I, ... , Jil, y, 1/).
Notons que de la définition du degré relatif, {tJI est inversible par rapport à 11 et est inversible par rapport à (iJi-l, pour i L .... if. On définit le compensateur dynamique suivant :
tPi
/1
.
1J;
.
/71]-1
lj)11 (y. 171) _}-I ( = C,)i-H 17i+1,
1.- 1 {Pi •••••
,/ -1 ( ,1 - 1 = (j)q V, (PIj_I"'"
/-1 ()1
./ -1
(j)1
J-I( ,y, (PI y.
,y,
0,t -
1(
y.
III
/71)
)
1, .... q - 2
[2.36]
»)
La substitution de [2.36] dans [2.34] implique la relation suivante pour le système en boucle fermée:
[2.37] Il
Donc, le système [2.18] est linéarisé par bouclage dynamÎque de sonie.
Si q ~ IÎ. une condition nécessaire et suffisante peut être donnée de manière algotithmiquc par l'algorithme 2.2. Pour introduire le second algorithme, on a besoin du lemme 2.1 suivant ([HUI OOJ, Lemme 2.6), LEMME 2.1.- On considère IIII coespace n c n'el une l-.fbrmc w
dim(span(w)
+ r.;n*
2': dim(Q)*
+1
où Q* représe/1te le plus gralld sous-espace Îlllégrahle conlenu dans
En'.
[2.381 /III
espace Q.
60
Systèmes non linéaires
Supposons q :::: IÎ. Test initial: 30' l, stop!
.... Clli-q E
-
1P~ tel que d/Ii )
L:!:::? ai dy(jj-i)
-
E
11 (/
On note lù = d)' (11 - Li:::1 ai Etape]. Tester 1.] : w E EfJ. Si non, stop! Choisir des fonctions ~1. BI E fC telles que lù - ~I dy(lI- 1) - (JI du(q-l) On définit une I-forme différentielle telle que iVI = ~I d.\' + BI du Test 1.2 : dWI A (VI O. Si non, stop! Soit 4>1 (y, u) telle que iVI 1,.1 d(PI où 11 !C. On note::1 = 4>1 (y, Il). Elape 2. Test 2.1 : lù E ElJ- 1 + span ( , }. Si non, stop! ChoÎ~ir des fonctions 02" !l'li E fC telles que: lV-W2I
Eq. Si nOI1,
E Eq-l.
- -~2
d:;,
On définit une I-forme différentielle telle que lV-:;. = Wll d:1 +~:. d)' + ()2, du. On définit 0.1 = span{ dq)I)' Test 2.2 : div2 A CV1 A dq}) O. Si non, stop! 11 existe Jr2 E QI. E!C e l , . y, Il} tels que: cv:. + Jr:. = 12 dtPl. On note ::1 = (~2(:::1. y, Il). q EtapelU :5;q- 1). Testl. 1 :lVE +span{d:i - n ..... d:j~~/)}.Sinon,stop! Choisir des fonctions ~/BI. tl-I.l. . .. fl-l.I-1 E K telles que: «(1-1> 111.1 d:1
lV -
On définit une l-forme différentielle lVI telle que: lV,
= J.LI,l-1 d::/-l
+ ... +
/11.1
d::1 + ~l dy + fh dl/.
On définit le coespace : 1:;-1
QI
= spanl L i=l
iJ(I>J::
-,-. d:i. k d";'· '-',
.
= 1.... ,111111(1-
1. q -1); dl/>I}'
Testl.l: dim(span{iIJt! + Qf}* ?: dimQt + 1. Si non, stop! 11 existe Jrl E 0./.1/ E lC et (IN(-:.! • ... , ::/-1. y. li) tel que (V, + Jrl = On note::'1 = 4)/(:/-1 .... ,4.1.", Il). Etapeq.Testq.1 ;(.VE El +spunld:I, .... d: q -1J. Si non, stop! Choisir des fonctions ~q. Bq, Iif/.I • ...• I·Lq.q-1 E Je telles que: cv =
/-lq.q_1
Test q.2 : dcv
A
d::q-l
+ ... +
/1q.1 d::1
+ ~II dy +
cv = O. Si non, stop!
Fin cie l'algorithme.
Algorithme 2.2
Bq dll.
ÀI
def>,.
Inversion cL linéarisalion
61
On définît un bouclage dynamique de sortie, triangulaire endogène de la manière suivante: Il
= FI (y. lJJ)
711
= F-:Jy,
Jl}
= F3(Y· 111 .... , Ir;)
111.1]].)
17,,-'1
= Fq_1 Cv. J7I •.... 17t,- d
17q-[
= F:,(y.1]I ..... Ih/-I, v)
Les bouclages dynamiques endogènes ont d'abord été considérés dans [MAR 92]. Notons aussi que [2.26J et l2.36] sont des bouclages dynamiques de sortie. triangulaires endogènes. On monlre que pour cette classe de bouclages, [2.34] est aussi nécessaire pour le problème de linéarÎsaLÎon dynamique.
Le système /2.18/ peut être linéarisé ell enlrée-,,'ortÎe par bouelage dynamique de sortÎe. IrÎollglI/aire endogène si et sell/eme11l si /2.34 J l'SI .wttÎ.~/l·tÎte.
THÉORÈME 2.9.-
Démolls/m/ion. (S 'dlislI Il ce). La
suffîsance suit de la démonstnlLÏon du théorème 2.8, puisqlle le compensateur décrit dans [2.36] est un bouclage dynamique de sortie, triangulaire endogène. Nécessité: il existe 12.39J tel que le système linéaire en boucle fermée s'écrive: [2.40]
pour un certain entier s. On déflnit le bouclage dynamique de sortie. triangulaire endogène suivam : V
=gl
~I =
g2
[2.41 ] • 1 g,\.=-
[
11'-
IJ 1
La compositjon de [2.39] avec [2.41.1 conserve la structure de bouclage dynamique de sortie, triangulaire endogène et implique: dV(/i) •
= Àl d .,,(ii-Il
+ ... + À-Il dv_ + dw
[2.42]
6:!
Systèmes non linéaires
DOIlC, sans perte de généralité, on peut supposer que le bouclage dynamique de sortie. triangulaÎre endogène [2.39] implique [2.42]. De [2.39], 011 a : 171
=
F 1- J (y, 1/)
F2-
1]1
1
(1) l , y,
Il)
1]3
= ,s-I (1l2. IiI, y. 11)
1/'
=
Fq<
I (' lIt, -
[2.43]
. [, ...• 171 • y.) 11
Alors, on obtient l'expression suivante de .
.
w = [ 4)1/(" (PIj-'2,···, (PI, y, Il)
d
. v, Il)
o-(!n( , ,4)1.
dt -
où (Pi
l~-I pour i
=
.
0
0
d
11) :
d dt
-4>1 (\'. Il)
]
dt'
[2.44]
1, ... , Cf. En combinant l2.40] et [2.44], le résultat suit.
Il
2.3.5. Exemple On considère lin système donné par une équation différentÎel1e œordre supérieur qui ne dépend que de l'entrée Il et de la sortie y seulement: [2.45] Notons que les théorèmes 2.5, 2.6 el 2.8 gardent leur sens également pour les systèmes décrits par une équation entrée-sortie [2.45 J. Cependant, tout système entréesortie [2.45] satisfaisant les conditions du théorème 2.5 admet une réalisation d'état [2.18]. Un système entrée-sortie qui satisfait les conditions du théorème 2.6 n'admet pas nécessairement une réalisation d'état. Considérons. ,,(.1) = (~1Î + Il + vû + Ir\' + \,2 11 + 3 \' ,'ii + ,;"li + \,2//(3) + 3,'vû + + .Ùty. Ce s'ystème ~ntrée-sorti~ Il'adl~)et de riaiisati~n~. D'abord, on n~l~ que son degré relatif vaut 1. Notons (J) = dy(-I) :
pas
y 2 ii
LV
=
+ (3.".\' + y2) dii + (yû + YII) d,,: + + 3:,'y + .\'5; + y) dli + (2.\'IÏ + 3yii + 2)'11 + 2iiy + 31iy + 11) d." + (3.Ni + 5i /Ï + 2)',,{J) + 3.\'û + 2yii + .';/1 + li) d)' + (S) + y5; + .\' + 1) du d"O)
InversÎon ct linéarisation
63
L'étape 1 de l'algorithme 2.1 implique WI = y 2 du. Alors, 4)/ = Il, )"1 = y1 et 21 = (j)\(y,lt). locstréécritdesortequecv E spanKI d::2 ..... cl:2. d.\i, .... d.". du): (V
y2
d:1
+ (3,\'.1' + )'2) CE:1 + (Y:2 + )'/1) d); + 3:2Y + Il) d"·
L'étape 2 implique CV2 y2 cI::1 + Y:::2 cl.\' + yll d.". La relation div2 Â iu:} Â d(!JI = 0 est satisfaite. Alors, 011 a I/l' (iV2 + y2 du) = dl/Y!. = d(y(ÎJl + lIY). et:3 = (d/dr) x (YI; + YlI). CV est réécrit de sorte que cv E spanK{ d':]. d:],d.\',dy,dIÎ,du} : cv = y + j'd:::3 + (:::3 + u)d.\' + .vdli + (:3 + ù)dy + (5' + I)dll. De l'étape 3, on dél1nit W3 y cl:'3 + (:3 + Il) c1y + y dl/. La relation div) Â 1\ drfJ1 0 est satisfaite. Alors, on n CV3 = d1)J = d(yrÎJ2 + "."), et ;::.t = ( d/dt )(Y(ÎJl + yu). uJ est réécrit de sorte que cv E span!\:: {d:..j.. d)', du} : cv = dz.--1 + dll. Donc, d(p..j. = dei)3 + du.
Un compensateur dynamique qui linéarise le système non linéaire est déduit à présenL De (/>1 = Il, (/)1 = yrÎ)l + If.". 4)3 = .WiJ2 + If." et (/J.t (i>;, + Il. on pose 111 = Il. '72 = y l71 + '71.\', '13 = )'Ih + 'JI Y et li = lb + I}I- Le compensateur : .
171
=
l
-(172 - IllY)
.
/13
=
V -
If
=
171
1]1
Y 1 - (113 - 171 y)
Y
lineanse ]e système et le système en boucle fermée admet une réalisation et s' écrit:
2.3.6. Robot sauteur Dans ce paragraphe, on donne des généralisations direcles pour le cas l1lultÎvariable des résultats décrits précédemment. On considère égalemenlle cas où les mesures sont différentes des sorties fi commander. Considérons le modèle cinématique d'un robot sauteur IFLI 96].
64
Syslèmes non linéaires
Ce système est linéarisable en entrée-sortie par bouclage dynamique de mesures mais il Il' est pas linéarisable par injections de sortie. Ce système ne satisfait pas la condition suffisante de IXIA 96] :
VI
= III
Vr = (-)
YI = )'2
[2.46J
_= c
l+m(C+l
Calculer:
+
211111 1112(;z: J) -----------~~~
(1 +111(:+ 1)-)-
/lui d: + 1)2 + 1 + m(::; + 1)"1
Comme on a:
2mu PI2(::: + 1) ----------,-. . . . + /}/(jJ.,d: - + 1)2 (1 + III (::; + 1 1 + m(::: + 1
il existe un bouclage dynamique de mesures qui linéarise la relation entrée-sortie du système [2.46]. Le compensateur peut être décrit par: '7
III
1]
= VI =
[
111(: + l)-VI + 1 + 1Jl (::: + 1)-; ")
]
(1
V"1
., + 111(: + 1)-)2111J1 (;?, + 1) ;
En boucle fermée, on a les relations YI = THI~ORf:''/vlE2.10.- SlIpposollsdîm E'Î SOllS la jàrme [2.34 Jsi ef selllellu.'111 si
"1
ct Y2 =
.V2.
2ii etq :::: il. PourÎï 2:: ii. dyUï) pem être écrit les reSlS dt! l'algorithl/le 2.2 sont sa,i.~rai[s.
tOIlS
DémOlrslrafÎOI/. La suffisance est évidente de la construction de l'algorithme 2.2, puisCju'ü]a fin de l'étape q, d(v /\ lJ) = O.
On démontre la néce~sité par récurrence. La nécessité de satisfaire le lest initial ainsi que les deux tests de r élape 1 est évidente. On ~uppose que tous les tests pour
Inversion ct linéarisation
65
les étapes l, ... ,/,1 ::::: q - 2. sont satÎsfaits et on montre que les deux tests de l'étape ! -1- 1 sont satisfaits également. Soit: ::1
(~dy. u)
Alors. par hypothèse, on
il
co = ~ d{!>i/(1Jq-I, ....
Hl/J
= ~. ( -.-u .
(j)/+]. ::/, ••• ,
'
iJq)u-1
d(/JII_I
çEK:
pour un certain
::1. y. Il)
(l(/>/j
.
+ ... -1- -.-.- d
. d:l-l-···-I-. d::/ a:::J
CL:I)
[2A7]
Puisque d(/>I+J C spanl d:::/ .... , d::], d.\'. dl/j. on oblient : d(j>/+I cspan(d:/ ... , cl:]. d.", dli, d::/, .... d:l. d)'. dll}
12,48J
et : d(!)/-I.l C span[d(~/+], .... d:j, d,\'. dll)
C spanl 12.-IRl
C
d(dl!>/..L\)
dl
.
' . d::/....
.
j.
d.\'. dll)
...
span(d:/ .... cl::]. cl)'. dll. cI::/ •... , d:::], d.\'. du}
12,49J
donc:
d(b/+2 C span 1dy. d)·. dY. du. dti. diÎ, d:::;, cl:;. cI:i. i = l, .... 1)
r2.501
De Illunière semblable, on prouve que: dqJI/_1
C span {cI.\', .. "
dy(I/-I-21.
du .... ,
dll(q-/-2î
d:::;, .... d;,;(1/-/-2) . f. = 1, ....
l2.51 J
lJ
el: d~(I_] C span{ cl)', ... , cI/,/-I-JJ. du ..... du(q-/-J)
d~.i,
. _I{I-I-])
.... d~'i
.
•1
= 1•...• 1}
[2.52]
66
Systèmes non linéaires
Donc, à partir de [2.47J, l2.48], [2.50] et [2.52J : l -q-l w E:,
. {d + span ·:i
d :':i(q-l-I) J
1 • • ••
[2.53]
Par récurrence, on montre: , {d-"i,·· .. d-(k)j span ~i C j;i+k ~
. . {d-·
~.I'·
Sp
1_(1/-1-1) J (~-i
•••
C
[2.54]
Elf- I -
I
, ( d-(/I-l-I) . + spLln ~'j , .1
1. ... , i l } r2.55]
pour i = l, ... , 1. Démonlrons l2.55] à titre d'exemple. En fait, [2.55] esl satisfaite pour i = 1 en raison de la défini lion de:: J. Supposons que la relation soit saLisfaite :our i - 1. Puisque:
span(
Il
....
'
C d -~/I-I-2)J 1
Eq-l-l
....
+ span { d~-..i"'" C E~ q-l-l
d-~. Itj /- I -
I ). • .1 -
. , [d-(I/-I-l) . + span ~'j , .J -
où la seconde inclusion découle de faite pour;.
1, ••• , t. - 1] 1....• 1. - 1]
[2.56]
r hypothèse de récurrence, el ainsi [2.55] est satis-
En combinant [2.53] el [2.56], on voit que: (V
q 1
E E -
+ span [d:::}(q-I-I) . j
1..... i
Il
C'est-il-dire quïl est nécessaire de satisfaire le premier test de l'étape 1 + 1. Pour prouver la nécessilé du second tesL de l' élape 1 dans [2.471 qui est obtenue il partir de la définition de :i :
w
[lq)/I (Jlj)I+2] ~. [ - , - " ' - . fJe/)q-1
+ J, détaillons l'expression
(~éJ4Jf+1 _(q-l-l L-.-d"'i
[)(/J!+I
i=1
il:j
+ i1cfJl+1 d,,{q-I-I) + ae/)I+l dU/tJ-I-I)") a.,,' ail E Eq-I-I + span{ d:::!. i = 1, ... ,1; j = O.. ", q 12~'1I
.i
Eq-I-I
u-I-j
+ span( d:::!. i 1, .... 11
= l, ... , min(l, q -1 1-2}
1 - 21
+ 1) [2.57]
Inversion ct linéarisation
67
On a:
d::i ll - 1-
1}
ar/) 1 d ,,(q-I-I) + i~(I),
=
iJy
d_ llJ -
a(P2 iL: 1
l - 3)
"':2
[2_.5.11 (hl)2 d_(rj-I-2)
é)::, -iI(/J'2
a:1
~'I
31)
(mod Eq- 1- J )
(D,c/JI -d,· «(l' -1-1) ()Y
(h/) 1 0/1(/ /
.
-/-1»)
mod Eq-I-J
[2.591
i)1I
;hl)2 d-(q-I-I)
d-(q-I-2} _ ~<.!
[2.581
d_(q-l-2) (mod Eq-I-2 ~'I
+span( d::;)} , j = O.... , q -1 -
(mod Eq-l-I)
dU(I/-I-I)
dll
.
- a:) (mod
."
Eq-I-I
+ spanf d:i·fi , j
122,-1] fît!>} d-(q-I-I)( -
. _
"1
d~.l
3/12 EK .r2.5R1
=
+ ih/)I
au
1110
= O.... , q -1- 2})
+ SpLlll .. f 0_«(1-1-2)}) "1
d Eq-I-I
l iq-I-ll ((J(/JI -,"i:1.l/)2 -c:; +/1' ri:, 1 ay
dtt(lJ-l-I»"
(mocl
cl
."
(ll-I-l)
EII- 1- I )
[2.60]
et plus généralement, on montre par récurrence qu'il existe llki)
IJldl
th/)I (q_I_1) - cl)' ( -. dy
D(/) + -, du
1
du
(q-l-I»)
E
JC tel que:
68
Systèmes non 1inénires
i1cP2
+ /1kldk-l) -,-
cl:: 1
+ /11\21
_(il-I-l)
cl ... 1
aqJI d (tl-l-I) y ( -,dy
+ (lep , 1 dlf(q-l-I du
l)
(mod
1)
[2.61]
En définissant le coespace : k - l '} ri
0/+1
= span { L -'{J'Pk .- d;::;. k = ;=1
~)"J • [J'/'I 2, ... , Inm{l. q -1 - 1): -,- d."
cl" .
tÎ::'.i
'] ,/
+,(J'Ill au
}
du
par construction de la forme différentielle 1 à l'étape 1 + l de l'algorithme 2.2, et en utillsant [2.57] à [2.61], on conclut une forme différentielle 7[,+ 1 E 0,+ 1 telle que:
JTHI =~.
(lr/l/l -.-.-'"
. a(1'/1- 1
a(/)1+2
(~ L
aq)H-1
(J - i i=I"
iJqJJ+1 d::; + - - d v + if" -
-
(Jr/).'+I) du (Ill
Alors. ft partir du lemme 2.1. le second test de l'étape 1 + 1 doit être satisfait. Supposons que tous les tests des étapes ] à q - 1 sont satisfaits, ]a nécessité des III tests de l'émpe 11 peut être montrée de manière semblable.
2.4. Découplage
Dam; le paragraphe 2.3.3, le bouclage qui résoud le problème de la linéarisation entrée-sortie découple également le système dans le sens dans le système en boucle 1..... p. Le problème du découfermée, rentrée Vi n'affecte que la sortle Yi, pour i plage est un problème de commande fondamental donlla solution permella commande multivariable el de concevoir des lois de commande en utilisant des techniques 1110110variables. De plus, la supervision de systèmes complexes découplés est largement sllllpliftée les différentes entrées scalaires contrôlent séparément les différentes sorties scalaires.
InvcrsÎon ct lînéarisalion
69
2.4.1. Découplage par bouclage statique régulier FORMULATION DU PROBLÈME.-
Etam donné le système: 'E =
1-\- =
f(x) y = h(x)
+ g(x)u
[1.611
011 l'état x E ]RI!, l'entrée Il E ]RIU, la sortie y E IIV} et les composantes de f. g, Il sont des fonctions méromorphes, trouver, si possible, un bouclage statique régulier sur l'état 11 œ(x) + fJ(x)v, avec fJ(x) inversible, lei que. pour tout i = 1.... , p :
i)
[1.63]
ii)
[1.64'1
La condition [1.63] représenle la contrainte de découplage proprement dite et la condition [2.64] garantit la commandabilîlé de la sortie en boucle fermée. La solution il ce problème est donnée par un résultat semblable au théorème 2.3, cependant la condition devient ici nécessaire et suffisante. THÉORÈME
1.11.- Le problème du découplage admet ulle solmioll par bouclage sta-
tiqlle réglllier sl/r l'état si et sell/emeut si les conditÎons (équipalentes) slIÎl'lmtes som
sati4ilites :
p
les degrés relatit~· des p sorties scalaires S0111 tOIlS .finÈs et la liste des degrés relat(F" à la liste des ordres des ::::éros cl ['ù~/illi.
est
DémollstratÎon. La suffisance suit de la démonstration du théorème 2.3. En ce qui concerne la nécessilé, notons que Il.641 implique que tous les degrés relatifs sont finis et la condition [1.63] entraîne l'indépendance des entrées apparaissant dans ri ). Il
yi
70
Systèmes non linéaires
2.4.2. Découplage par bouclage statique régulier sllI'l'état FORr.WLATION DU PROBLÈME.-
Etant donné Je système [2.62]. trouver si possible, un compensateur dynamique: F (.~, ~
~) + G(.~·, _:) v O'(.\,~) + f3(~\. ~)v
:: : { If
-
tel que, pour tout; l')
iî)
= l, ....
: E]R1f
[2.65]
III :
d. Yi({;:) E spall}C ( d X. (:, 1 d Vi,···. d Vi(k}} " k 2: 0. dyi
KI
tj spanA:{ d.\'. d:} pour un certain K
E
[2.66J
I~l
l2.67]
2.12.- Le problème du découplage admet Ime .\'olllt;O/1 par bOlle/lIge dynamique régulier SI/r / 'éTat si et seulemellt si le systèllle est i11versible il droile.
THÉORÈME
Démol/stration, La nécessité est évidente, et lu suffisance peut être démontrée en utilisant un compensateur dynamique standard, appelé cOlllpensateur de Singh, obtenu de , 0 Il 0 lJtlent ' l ' a l gant'1ll11e d" II1verSlOn. il 1ors Yi(IIi') = Vi pour tout 1• = 1, ... , p. 1
Si llit, =1= équations:
,
IIi'
,
dont la solution est
Il
yl~) _ _ .\; •••.• '.i.llil,-71~ -
__
posons ~il
-
= O'(x. z)
+ f3(x,
.(nil,-Il
y';
'.
,
et resolvons en
:::)/J
Finalemenl, le compensateur dynamique qui résoud le problème s'écrit :
:,"
li
EXEMPLE
•
1I1",-1l~ 1 1
=
Vi·
= a(x. ::::)
l'or i = 1, ... , p
+ tJ(x, ;,)v
2.4.- Exemple 2.J, ,\'/lite.
Un compensaleur dyl1amiqIIe standard est:
li
les
Inversion ellinénrisatioli
71
2.5. l..inéarisation entrée-état La solution du problème de la linéarisation entrée~sortie linéarise complètement l'état dans le cas d'un système Illonovnriable dont le degré relatif est égal il 11. Cela reste vrai dans le cas l11ultivariable lorsque la matrice de découplage est carrée inversible, c'est-il-dire que la condition 1:2.14J est satisfaite et que la somme des degrés relatifs est égale il Il. Le problème de la linéarisation entrée/état qui est considéré duns ce chapitre consiste en la recherche de fonctions de sortie qui satisfont les conditions ci-dessus. La résolution de ce problème revêt une imporLance majeure dès que la linéarisation entréesortie conduit à un système en boucle fermée comportant lin sOlls-syslème inobservable instable. La présence de telles dynamiques internes instables est rédhibiloire pour le schéma de linéarisation entrée-sortie. Une solution au problème de linéarisation entréeétat de contrôler la stabilité interne, bien qu'une sortie donnée puisse demeurer liée de manière non linéaire il J'entrée. Dans cette section, nous considérons d'abord le problème de linéarisation entréeétat par bouclage statique régulier sur l'étaL Lorsqu' un lei bouclage sur r étal pouvant assurer une linéarisation complète n'existe pas, alors il est intéressant de rechercher une solution dans la classe plus large des bouclages dynamiques. Dans ce cas, le problème consiste t\ rechercher des sorties linéarisHnles, c'est-il-dire des sorties telles que la somme des ordres des zéros il l'infini soit égal à 11.
2.5.1. L;lIéarb:at;oll par boue/age statique sur "élal
2.5.' .1. Formlllcuion du problè1lle Etant donné le système 'E :
.\' = I(x) + g(x)u
1:2·681
où l'élat x E IR". l'entrée /1 E ]fillll el les composantes de f. g sont des fonctions méromorphes, trouver, si possible, lin bouclage statique sur r élut: Il
= œ(x) + {3(x)v
[2.69]
et une transfonnation de l'état: :: =
où 0', {3, cp sont des fonctions méromorphes, rangtJ = 111 et cIl eslun difféomorphisme local de jR;,1I dans Jœ.J/ au voisinage de presque tout point de . tel que le système ell boucle fermée s'écrive:
:: = Az + Bv où la paire (A \ B) est commandable.
72
Systèmes non linéaires
Il n'est pas restrictif de résoudre le problème en imposant à la paire (A, B) une forme canonique de Brunovsky. La résolution du problème de linéarisation entrécsortie revient fi rechercher les plus grands blocs de Brunovsky indépendants, ou les plus longues chaînes d'intégrateurs ou encore, de manière équivalente, des fonctions dans K qui ont 1es plus grands degrés relatifs et qui sont commandées par des entrées indépendantes. Ces fonctions sont des candidmes pour jouer le rôle de foncliolls de sortie dans le problème de linémisatîon entrée-sortie. Le problème de linéarisation entrée-élat admet donc une solution pur bouclage statique régulier d'état si et seulement si la somme des degrés relatifs associés vaut 11, la dimension de l'étal. Ces principes sont formalisés dans le paragraphe suivant 2.5.1.2. Solution all problème de linéarisation en/rée-état THl!ORÈME
2.13.- Il existe
111/
balle/age stt/tique d'état qui résoud le problème de
Iil1éarisation entrée-état pOlir E si et seulement si :
(i) Hoo (Îi)
=0
H/.: est fe rll1é pour 10111 k ::: 1.
La condition (i) est la condition d'accessibilité qui est évidemment nécessaire puisque :E doit être transformé en un système linéaire commandable. La condition (ii) est une conditîon d'intégrabilité qui impl1que que les indices de cOllll1ltlndabiIité de 1:: correspondent aux indices de commandabilité du système linéaire en boucle fermée. Démons/ratio11 dll théorème 2.13. Les condWons du théorème 2. J 3 sont clairement max (k ::: OIHk =P 0], s = nécessaires. En ce qui concerne la suffisance, soit k* dim1ù:*, et { dCPl, ... , dcp,\"} une base pour H/.:*. Supposons que: (k~),
, ... , cp.\"
)
--~----------
au
< s
l2.70]
alors il existe D'j, i = 1, ... , s non tous nuls et tels que: ,~
L
i=1
. (k*) r)CPj
CYi--=O ail
Soit lJ) = L:l=l O'i dcp; calculons (ù(/.:*) qui apparlient à "Y. Donc, (ù est non nul et appartient à Hk.+I' En raison de cette contradiction, on conclut que [2.70] n'est pas vérifié et que s = dim(H1:~) + "Y)j.l'. Puisque Hk""-l ~
Hk*
+ Hk*, notons:
Hk~-I
cr := dim---Hk*
+ ft""
el soit {d
Inversion ctlinéaris!llion
73
Supposons que: ,.
rang
(PI
d ( tfJ 1
alors il existe tels que:
{el (e-I) (P-I) •••• , tfJs ,1/1 l ' ••• , VIcr )
au (Xi,
i = 1, ... , set /3;, j
< s
+ Cf
1.2.71]
l, .... Œ, où les fJj ne sont pas tous nuls,
L}'=I ai dCPi + L1=1 fJj chllj. Donc (ù est non nul et (v(e-Ii E rl'. Soil (ù Ceci entraîne (ù E Hk~. Cela est en contradiction avec le fait que les fij ne sont pê.1S tous nuls, et [2.71] n'est donc pas vérifiée. Par réctlITence, on montre gu'une base de 71.1 spanlCl dx] est obtenue par:
! dcp;}). i
= 1.... , lU, j
= 0, ... , ri
-
1)
où fi représente le degré relatif de cp;. La linéarisation entrée-sortie des sortÎes {CPi. Î = 1, ... , m} linéarise complètement l'équation d'étal dans les coordonnées [cpi}), i = 1, ... ,m,j=O, ... ,r;-l}. Il Lorsque le problème de la linéarisation entrée-état n'a pus de solution, alors il est intéressant de chercher à résoudre un problème plus général, dont une première solution peut être trouvée dans Marino [MAR 86]. On cherche à linéariser le plus grand sous-système d'un système 1: donné. Le système en boucle feffilée de la sorte, s'écrit:
[2.72]
dÎm:'1 + dim':1 JI et dim VI + dim V2 = 111. Nécessairement. la dimension du plus grand bloc de Brunovsky de la paire (A l, B j) est inférieure olt égale à k*. SOil 71." le plus grand sous-espace fermé contenu dans 71.1::. Par conséquent, une suÎte de sous-espaces: Oll
esl associée à la suite {1id. Par définition, HI = HI et Hk :) des Hb on a également:
Par construction
74
Systèmes non linéaires
et:
Cela permet de définir: .
Il)
+ l'y 'H,- + l'Y 'HI
:= (hm -(-::-')--
et de manière plus générale, pour le
= 2 .... , Il
:
[2.73]
Considérons le cas particulier des systèmes accessibles mono-entrée. THÉORÈME 2.14.- Si dill1ellsion s où :
III
=
s = max//.: ::: 1 l
l, alors le plus gral1d sOlls-système linéarisable est de
'# 0)
Puisque 'Hc:Q. s exiSTe tOl~j()l/rS el 1 ::: s ::: n. Démol1stru/ion. SOÎt :: II ln première composanle de z) dans l2.72]. Notons 1; := dîmzl. Supposons, sans perte de généralité que (A l, BJ) est sous forme canonique de Brunovsky. Nécessairement d::: Il E 'H~ et 'Hl; :) 'H s . Ceci montre que pour toute linéarisation partielle 1; ::: s.
Il reste il. montrer qu'il existe une soluLÎon qui linéarise un sOlls-système d'ordre s. Puisque lit = l, Ils = 1 et IIi 0 pour tout i = l, .... n, i '# s. On choisît d.:: II E 'H s , et 011 applique la linéarisation entrée-sortie standard et le résultat suit. Dans le cas multi-entrée, on déflnÎt de manière semblable III sorties fictives qui peuvent être Il linéarisées et découplées en suivant la procédure standard.
2.15.- On cOI/sidère lin système accessible, alors Il' plus grand systèllle linéarisable l'sI de dimension:
TUÉORÈl'vIE
III
S01tS-
+ 2112 + ... + Sils
DémonstratÎon. Choisir dtpll •...• dtpl,1l1 dans 'HI et de manière plus générale dqJk, J •••• , dtpk.lIk dans 'Hk, pour k = 2, ... , s tel que: a(cf)!, ... ,cfl,lll' .... Il 1
+ ... + 11,~
Inversion ct linéarisation
75
Le découplage standard de ces sorlies fictives conduit tl un sous-système linéaire formé de 111 blocs de dimension l er de n Î blocs de dimension i, pour i = 1, ... , s. Tl reste à montrer que toute linéarisation partielle est de dimension inférieure. Considérons le système partiellement linéarisé [1.72J et supposons sans perle cie généralité que (A 1. /3,) esl sous [onne canonique de Brunovsky. Soit Pi le nombre de blocs de Brunovsky d'ordre Î, pour i ::: 1. Nécessairement Pi = 0 pour i > set Ps ~ Ils. L'inspection des étapes suivantes montre que:
el plus généralement: ;=.1'
i=s
Î=k
i=k
LPi ~ Ln; pour tout k, 1 ~ k EXEMPLE.-
~
s. Ceci conduit au résultat annoncé.
Considémlls:
.h X..j
.\'3
0 0
X..j
0
=
a/ors
el
de
011
Il
("I)
[2.741
112
'\:11-1
XII
.tf}
0
0 1
ca/cule:
I1Il1l1ière
plus générale, pour 2
~
le
~ 11 -
1:
Par conséquellf, Il) = 2, 11 i = 0 pour toul i ::: 2. Les conditiol1s d'intégrabilité (ii) dllllS le théorème 2.J311l! SOllt pas sati~:lllites. Le théorème 2.15 II/011fre que le plus grand sOifs-système linéarisable est de dimensio1l 2 et cstforlllé de deux sous-systèl1les de dime11sioll J. 011 l10te que le système [2.74/ est accessible et que tOlile flmetion 110n COllstal1te de l'état CI /111 degré relatif 1 selliement. Le théorème 2.13 est 1111 CliS particulier du rhéorème 2.15 et esl équivale1lt 1I1/ résultat SIIÎl'{lIIl.
76
Systèmes non linéaires
COROLLAIRE 2.1.- Le système /2.68/ peut être complètemmll lint!arÎs{l par bouclage statiquc sur l'éTat si et seulement si : i=11I
Lilli=n Î=l
De manière alternative, les entiers III; peuvent être ca1cu1és par le corollaire suÎvanL COROLLAIRE 2.2.- POlir k = 1, ... , Il :
11 k
'HI; = dim -----:--Hk+l +
Démonstration On choisit des
[2.75J
base~
pour les sous-espaces suivants:
Hk+ 1 = span 1 dCPk+ 1} Hf:
= span { dcpk-I-I. d
Donc, dans l'équation [2.75], ·1-J (.f:) /1.-. k
+ ,J-"
= dim span{ dV/d. Calculer:
I1k
(k) d (1:+ 1) d,l (k) d } span {d CPk+l' CPk+l ' - ylk ' x
-l
(1.:+1) (k) = span[ dCh+1 ,dVlk ,dx)
er : ;-(k-I-I). H k +\ +,:[
Ik+ 1)
span{dCPk+\' dx}
En revenant à la définition [2.73], 11{: EXEivlPLE 2.5.-
= dim spun[ dl!llkl] et le résultat suit.
fi
On considère 1'1l/licyde dal/s l'exemple 2.1 Ql'ec la lIlod(ficafÎOI1
mille slIr les en/rées: la l'itesse
1/1
SI/i-
constitue 1/11 qttatrième étal el soit l'accélératioll
li \ III ltot/I'elle entrée. Hotée VI. La vilesse aJlgulaire u~ demeure la seconde e/ltrée el es/notée 1)2. La descriplion du système del'Ïent alors: 1
'. = .\
X0 (
COSX3)
(0
01"
0 0 + 0 1 010
.\"4 sinx] 0
(VI) V2
[2.76]
Inversion
et
linéarÎsation
77
Le système 767 est complètelllel1t lil1éarisable par le bOllc/age sto/ique réglllier obtel1/1 ell résoJl'CIIl/ le,'i' équations sIIÎl'llIUeS l'Il 11 : VI COSX) IJ 1
sin.\:3
1'}X4
=
sin.\"3
+ 1.'2.\..j COS XJ
w( 11)}
ce qui en/raÎlle :
= =
VI v}
1l!1 COS.t]
+ Wl sinx3
(W2COSX3
w)
sinx3)/X..j.
=
Les coordonnées d'état lil1éar;sl1nleS SOllt:'1 XI. :'2 = X..J cos .\"3, :::3 x} el Z..j =.1:-1 sin -'"3. Celle solwioll est obten/le de 1I1{l11ière équÎl'alellic l'Il considéra1lt XI ef x} comme .\·orties el l'II appliquant la teclmÎqllc de lilléarisathm el1trée-sorIÎe. 2.5.2. LinéarisatÎoll par bOllclage dYllamique
Sllr
l'état
2.5.2,1. Formulation du problème
Etant donné le système i
=
f(x)
de la forme l2.68] :
L;
+ g(x)u
[2.77]
trouver, si possible, un bouclage dynamique sur l'état:
{
~ /1
M(x,l;)+N(x, = O'(x,
~)
+ f3(x
1
~)v
[2.78]
où ~ E Jll~q pour un entier Cl et une transformation d'étal ::: Q) (x, ç) où cp est un difféomorphisme de dans lP~II·!·q au voisinage de presque tout point de IH:lI -h/, tel que le système en boucle fermée s'écrive:
où la paire (A, B) est commandable. TI n'est pas restrictif de résoudre le problème en cherchant L1ne paire (A, B) sous forme canonique de Brunovsky. Résoudre le problème de linéarisation e11lrée-sortle dynamique revient à chercher des fonctions dans JC qui ont la plus grande structure à l'infini. Ces fonctions sont candidates pour jouer le rôle de fOllctions dl' sortie dans
78
Systèmes non linéaires
le problème de linéarisation entrée-sortie. Le problème de linéarisation entrée-état admet alors une solution par bouclage dynamique sur l'état si et seulement si la somme des ordres des zéros à l'infini vaut Il, la dimension de l'espace d'état. De manière équivalente, ces sorties linéarisantes définissent un système sans dynamique de zéros, au sens du paragraphe 2.2.4. Ce résultat a d'abord été obtenu dans IISI 86]. Ces idées sont fonnalisées dans le paragraphe suivant. 2.5.2.2. Soll/tion d/l problème de lilléarismion dynallliq1le Une solution au problème de linéarisation dynamique est obtenue par inspection des sous-espaces Hk. Puisque le système en boucle fermée doit être complètement commandable, une condition nécessaire est Hx = O. Alors une base des Hk peul être construite comme suit. Soit (CVI;--'-) une base de 'Hk~ :
De manière plus générale, soit ((v,,") tel que:
pour k = 1•... , k*. Une condition suffisante pour la linéarisation dynamique est alors obtenue. THÉORÈME
2.16.- Si (CVI •... , (Vk-'-) est inrégrable, alors le problèll1e de linéarisation
dylla1l1 ique ad1l1el /Ille sol/l tiOll. EXEMPLE
2.6.- Considérons "ullÎcycle de l'exel/lple 2,1. Du calclIl:
HI = spanA.::1 dxJ 'Hl = spa nA.:: (sÎn .\"3) d.\1 - (COSX3) dXl1
71.3 =0 01/ 112
a k'" = 2. si n .\"] dXl -
= (sin X3) dXI - (cos X3) dXl. Puisque W2 dX3. 011 choisit (Vl = dx l, de sorte que:
CVl 1/ [
Hl = spanA::(w2, 'H2
)'2
111
cos X3 dx 1
il) 2, (VII
= spanA::( CV1)
Fil1alement, spanA::((Vl. W[) est il1tégrable ef WllIt spanJC( dYI, dYl) où X2 som les sorties linéarisal1fes.
=
+
)'1
= Xl ef
Inversion et linéarisation
79
Démonstratio1l du théorème 2.16. Soil {c1)'I, ... , c1Ym) une base cie spanK:llV1, ... , Wkt- J. Par construction, la somme des ordres des zéros il l'inIlni de {WI, .... Wk~ J vaut Il. Cette somme ne pem pas diminuer par changement de base. elle est aUSSl égale à la somme des ordres de zéros à lïnHni de 'd."I ..... dY/ill. Par conséquenl, {d)'l ... " dYlld dél1nit un ensemble de fonctions de sorties sans dynamique de zéros el conduit finalement ft une solution au problème de la linéarisation Il dynamique.
2.6. Bibliographie C.L, lSIDOfU A.,,, Exucllincarization anù zero dynamics n. Pme. 29/ 1i IEEE CO/Il Decisio/1 COIIII:. p. 2080-2084. 1990.
[BYR
90J
BYRNES
[CON 911 CONTE G .. Mooo CH .• PERDON A.M .•
linear systems: a structural approach
n.
« Model matchîng and factorÎzmion for 11011SIAM .1. CO/Ill: Optim .. 29. p. 769-785. 1991.
rCON 991 CONTE G .. MOOCi C.I-L. PERDON A.M., Nonlincar e0111ml sysTems:
(11/
olgebraic
seuil/g, vol. 242, Springcr Vcrlag, Lect. N. Com\'. InL Sei.. Londres. 1999. [BEN 891 DI BENEDEl1'O M.D., GIUZZLE .1 •• MOOG C.H., «Rank invarîanls of Ilonlinear systems n, SIAM J. COI/fi: Opfim., 27, p. 658-672. 1989, [FU 86J FLIESS M., « A notc on thc invcrlihilily of' 1101llinear input-output systems ". Sys. ConTI: Lett.• 8, p. 147-151, 1986. [FU 87 J FLIESS M., « Nonlincar control thcOl'y and diffcrcntial algebra: examples H, lOtI! IFAC H,zJrld COl1.f5reSS, Munich, p. 114-118, 1987.
~Ol11e
iIIustrative
[FU96J FLIESS M., LEVINE L MARTIN P.. ROUCHON P.. ,< diflërcnticllcmenl plaIs: intérêt ct cxemp1es H. Théorie et prllfiqlll! des systèmes plaiS. Grenoble. p. 1-41. 1996.
[HIR 79] Tmns.
BlRSCHORN Allf01I1(1/.
R.•
«
Inverl.Îbilily of multîvariable nonlincar control systems )'. IEEE p. 855-865, 1979.
C011lm/, 24.
[HUI 00] HUIJBERTS H.J.C .. MODO C.B., POTHIN R.. « Input-outpui decoupling of l10nlincar systems by statîc measurClllclll fccdhack r,. Syslems ond COli/roI LeIl(!/~\·. 39. p. 109-1 14. 2000.
fTST 891 ISIDORI A., NOlllùwar Control Systems (2nd cd.), ,.... nlrIl1'fll'l· Verlag. Berlin, 1989. [ISI861 ISIDOR1 A.. Mooo C.H., DE LUCA A.. « A Sufficicnl Condilion for full Linearization via Dynamîc StlUc Feedhack ", Proe. 25,h IEEE COl~f; Decision COllfl:. p. 203-208, 1986.
[ISI 84] ISIDORl A., RUIlERTI A., « Onlhe synthesis oflinear input-output rcsponses for non 1incar sysLems ~), Syst. COlm: Lett. 4, p. 17-22. 1984. [KRE 83J KRENER AJ., ISIDORI A .. «Lincarizalioll by oulpul injecl ions and nonlincar obscr-
vers ), SysTems {Iml Coll1rol LeI/ers. 3, p. 47-52, 1983. [MAR 86J MARINO R., 7, p. 345-35], ]986.
«
On lhe largesl fceuback Iinearizable subsystem
»,
Sysl. COlm: Leff.,
80
Systèmes non linéaires
[MAR 91] MARINO R., TOMEI P.. ( Dynamic output fecdhack lînearizatîon and global smbîlization )', Systcm.\· and COlllml Lellen', 17. p. 115- J2 J, 1991. lMAR 95] MARINO R .• TOMEI P.. NOl1lincar COli 1ml Dl'si1W Geollletrie, Adaptative alld No/mst. Prentice Hall. Englewootl Cliffs. 1995.
LMAR 92J MARTIN P., Contribution à r étude des systèmes différcnliellemenl plaIs, Thèse de doclorat. Ecole des mines tic Paris, 1992. [NU 901 NlJtvlEIJER 1-1.. VAN DER SCHAH A.J.. NOI/lil/l'u" f)Yll0J/lh'ol COl/tml SySIt.'IIIS. Springer Verlag. New York. 1990. [PER 891 PERDON A.M., CONTE G., MOOG c.H., « Sorne canonical properties or nonlinear systems. Rcalization and Modelling in System Theory n, Proc. (d' MTNS 89. Amsterdam, p. 89-96, 1989. [POT OOJ POTHIN R., MOOG C.H., XIA X .. « Nonlinear slllhilizing tlynamical output reeclback l'or a series OC motof >', IFAC cOl~f. DECOM 2000, Pretoria, Afrique du Sud, 2000.
[RES 851 RESPONDEK W., « Linearization, feedback and Lie brackets », Proc. hUf..'J'I1at. OJl~/: Geometrie 11reory l~f' Nonlil1eClr C(mtrol Syslems. Wroclaw Technical Press. Wroclaw. p. 131-166. 1985. LSIL 69] SILVERMAN LM., « Inversion of multivariable lincal' systems Omt/:. 14. p. 270-276. 1969.
)J,
IEEE Tralls. Atll.
[SIN 89] SINOII S.N .• « A modillcd algorilhm [or invcrlibilily in nonlinenr systems Tralls. Aw. Conl1:. 16, p. 595-598, 1981. [XIA 961 XIA X.. MODO C.l·t. « 1/0 linearizntion 35'11 CDC Congres.!', Kobe, 1996.
j,.
IEEE
or nonlÎncar systcms by outpUl [eedback»,
[XIA 991 XIA X" Mooo C.H., ,( Dislurbilnce decoupling by mcasurClllcnt reedhllck for SISO nonlinear systems », IEEE Trans. Awo11lllf. COllJml., 7. p. 1425-1429. 1999.
[ZHE 931 ZHENG Y.F.. CAO L, Signais Systems. 1993.
«
Recluced inverses for conlrol1ed systems )'. Mmll. Colltrol
Chapitre 3
Observatellrs de systèlnes non linéaires
3.1. Introduction Dans la plupart des domaines des sciences de l'ingénieur où l'on faît appel aux outils de l'automatique (algorithme de commande, de surveillance et de diagnostic), la connaissance de l'état à chaque Înstant est nécessaire à la réalisation de tel ou tel objectif. L'étal d'un système est un ensemble minimum de variables permettant de décrire l'évolution du procédé. Ainsi, l'état d'un réacteur parfaitemenl avec une double enveloppe, siège d'une réaction chimique, est formé des températures de la double enveloppe et du mélange dans le réacteur. du volume du mélange et des concentrations des produits. Pour un système électromécanique, l'étal du système est composé des différentes positions et vitesses ainsi que des tensions et (ou) des courants électliques qui génèrent les couples moteurs. La mesure en ligne de ces varinbles est souvent très cOÎlteuse Ol! parfois impossible pour des raisons techniques. Pour pallier cette difficulté, on a recours à des algorithmes d'estimation en ligne de ces variables non mesurées (observateurs ou encore capteurs logiciels). Ces algorithmes reposent sur un modèle de connaissance et Uil certain nombre de mesures issues de capteurs physiques. Ces algorithmes d'estimation reposent sur des modèles mathématiques formés d' équations dynamiqlles décrivant le procédé et des mesures en ligne donnant une information pertinente sur l'évolution du procédé. Ces équations sont localisées (équalions différenLielies ou aux différences finies) quand le système est représenté par un nombre fini de varÎables d'état, ou réparties (équations aux dérivées parLiel1es). Les mesures en ligne sont reliées à l'état du procédé peU des lois mathématiques (modèles). C' est justement ces lois qui permettent
ChapiLre rédigé par Hassan
1-IAt.Hvl0URI
cl.Tcun-Claude MARQUÉS.
82
Systèmes non linéaires
de mesurer la sensibilité de la mesure par rapport il l'état du système (observabilité). En génie des procédés par exemple, la mesure de la pression et de la température peut permettre de remonter, l'ia les lois de l'équilibre thelmodynamique, aux concentrations dans un réacteur. Parmi les observateurs les plus répandus, nous trouvons dans la littérature l'observateur de Luenbcrger et l'observateur de Kalman. Ces deux types d'observateurs sont conçus pour les modèles linéaires. Leur utilisation alltour du régime stationnaire (régime établi) est généralement satisfaisante. Pour les systèmes non linéaires, il est difficile de donner une théorie générale et exhaustive sur ce sujet. Cependant il existe quelques développements concernant la synthèse des observateurs. ParmÎ les techniques les plus classiques. nous pouvons citer le mlre de Kalman étendu. Cet observateur faÎt appel ti la résolution des équations dynamiques de Riccati et le réglage de ses paramètres devient vite complexe; il est même parfois difficile de distinguer entre les problèmes numériques liés il la résolution de ces équations et les problèmes de sensibilité qui sont liés aux problèmes de mesures el de structure du modèle (notion ù'observabilité). De plus, il est très difficile d'affirmer lin résultat mathématique de convergence ùe ces observateurs. Comme nous le verrons dans la suite de ce chapitre, 1; algorithme d'un observateur consiste à corriger le modèle en rDjoutant à ce dernier tin terme de correction proportionnel ù la différence entre la sortie de l'observateur et celle du procédé. Ce terme de correction est amplifié par un gain qui peut être complexe. Ainsi, le gain de l'observateur linéaire de Luenberger esl constant. Le gain du filtre de Kalll1l.1l1 étendu découle d'une équation de Riccati dynamique. Plus générulement, le choix du gain d'ull observateur va dépendre de la déviation de l'état de l'estimateur.
3.2. Observation des systèmes IinéaÎres temps invariants Dans ce paragraphe, nous allons rappeler certains résultats classiques concernant l'observabilité et l'estimation d'élal pour les systèmes linéaires temps-invariants. Autrement dit, les systèmes décrits par des équations différentÏelJes linéaires rt coeflldents constants. Le cas des systèmes linéaires discrets sera étudié succinctement Il la lin de ce paragraphe. Pour plus de détail. nous renvoyons aux références [WON 85] et
[KA180]. 3.2.1. Obserl'atÎOIl des systèmes li1léaires temps continus Considérons les systèmes linéaires de la forme:
.dt) = Ax(t) { yU) = Cx(t)
+ Bu(t)
[3.1]
IP~II représente l'état du système. u(t) E ]p~11l et yU) E lR~f1 sont les entrées et les sorties mesurées à l'instant!. il, B et C sont des matrices à coeflkients réels constants.
:rU) E
Observateurs de systèmes non linéaires
83
L'observabililé est une notion liée il celle de sensibilité de la sortie aux états du système. Cette notion (qui peut être affaiblie en la remplaçant par la détectabîlité) permet d' analyser la faisabilité de la reconstitution de 1'état du système [3.1 J. Nous dirons que la sortie es! sensible à l'état ou encore que le système est obserl'llble si pour une entrée donnée Il et pour deux conditions initiales quelconques.r (0) #- x' (0) les sorties correspondantes ne sont pas idenliquemenL égales sur tout l'intervalle de temps considéré. Cetle dél1nit.ion sera étendue plus finement aux cas des systèmes non linéaires. Dans ce qui suit, nous donnerons un critère algébrique permettant de vérifier l'observabilité d'un système linéaire. dit critère de Kall//m!. Tout d'abord, rappelons que les solutions de l'équation différeillielle la fonne :
l3. JJ sont de
et que la sortie est donnée par: y(1)
Cet ri_\(O)
+C
t ./0
e(l-s)A
BII(s)ds
L'observabilité de [3.1] est alors équivalente ~l i= x'(O), 3t ::: 0 rel que CeL>\(x(O) - x'(O)) #-
x(O)
:
pour toutes conditions initiales
o.
Ce qui montre que l'observabililé des systèmes linéaires est indépendante de l'entrée appliquée au système.
3.1 (CRJTÈRE DE KALMAN).- Le systèJ/le {3. JJ est observable. si, ef seulement si le rang de la matrice:
THÉORÈME
est égal il
11
(la dime1lsion dl' l'espace d'état).
En utilisant ce théorème, on peut montrer que l'état .\'(1) du système [3.1] peut se déduire de la sortie yU) et de l'entrée 11(1) en dérivant un certain nombre de fois une certaine combinaison linéaire de ces deux variables. Ce moyen théOlique permet de résoudre le problème de r estimation de r état il condition que les signaux y{t) et li (1) ne soient pas bruités. Dans le cas olt ces signaux sont accompagnés de bruits, des étapes de lissage sont nécessaires avant lOllte opération de dérivation. Cette technique devient vite inexpJoitable, surtout quand le nombre de sorties eSlnettement inférieur lt la dimension de œélaL
84
Systèmes l10nlinéaircs
Un autre moyen permettant de réaliser ceUe estimation consiste à utiliser un estimateur dynamique qui jouera en même temps le rôle d'un filtre. Le plus célèbre est connu sous le nom de l'obSCI1'Cltellr de LlIenbeQter. Ce dernier prend la forme suivante: J(t} = A.r(t)
+ Bu(1) + K(C.r(1) -
y(1))
[3.2]
où K est une matrice constante telle que le spectre de A + K C est à partie réelle strictement négative. Ceci est toujours possible si le système [3.1] est observable. L'observateur ainsi obtenu est à convergence exponentielle. Autrement dit, Il.r(t) x(I) Il converge exponentiellement vers 0, quand t tend vers +00. En effet, dans la théorie des systèmes linéaires [WON 85], il est montré que si le système [3.1] est observable, alors pour tout ensemble cr de 11 nombres complexes deux à deux conjugués, il existe lIne matrice K telle que A + K C aÎt comme spectre l'ensemble cr. En particulier si r on considère cr C C-, r ensemble des nombres complexes à partie réelle négative, l'erreur c(t) .r(l) - xU) satisfait à l'équation différentielle: è(l) = (A
+ KC)e(1)
[3.3J
et, par conséquent lieU) Il converge exponentiellement vers O. Plus généralement, supposons que le rang de la matrice suivante:
est égal à r :::: JI. Considérons une matrice L de rang r, formée de r colonnes de Ai. Complétons cette matrice d'une manière quelconque de lel1e sorte qu'on obtienne une rnattice carrée inversible N. Considérons le changement de variables:: = (g) = Nx ; un calcul simple montre que le système [3.1] s'écrit sous la forme:
[3.4]
On peut montrer que le spectre de la mattice A22 ne dépend pas de la manière dont sont choisies les matrices L et Ai ci-dessus. Les valeurs propres de sont dits les modes 11011 observables du système /3.1 j. Le système [3.1] est dit détectable, si le est dans C-. spectre de L'observateur de Luenberger ci-dessus peut s'étendre aux systèmes détectables de la manière sUÎvante. D'après la construction cÎ-dessus, le système: '::,'1 (t) = Allz] (1)
1
y(t)=
(1)
+ BllI(t)
[3.5]
Observateurs de systèmes
11011
linéaires
85
est lm système observable. Par conséquent, pour lout ensemble cr de r nombres COI11plexes deux ù deux conjugués, il existe une matrice KI, telle que sp( AI J( 1 = (J. Posons K = N- 1 ( "~l on peut alors conclure:
+
),
THÉORÈTvlE
3.1.- Le sysTème .'
.~(t) esl
Ull
A.r(t)
+ Bll(t) + K(C.r(l)
- y(l)
[3.61
obserl'ateuf exponentiel pOlir le système /3.1}.
3.2.2. Observateurs des systèmes linéaires temps discrets Les systèmes linéaires stationnaires discrets sont décrits par des équations récurrentes de la forme: X«k + 1)15) AdX(k8) { y(k8) Clx(k,8)
+ Bdl/(k8)
13.7]
où x(k8) E J.R11 ~ u{kS) E lR.m et y(kS) E mU]. Ici le temps prend des valeurs discrètes 0,8,28, ... ,k8, .... ~ 8 étant la période d'échantiHonage. Parmi les méthodes d'échantillonage, on trouve la méthode du bloqueur d'ordre zéro, la commande II appliquée au système [3.1] est constante dans l'intervalle [k8, (k+ 1)15 [et vaut u (k8). L'intégration du système 13.1] entre les instants k8, (k + 1)8, donne: x(k
+ 1)8)
(:!,u x (k8)
+ [8 e(8-/)A /311(k.8)dt
Jo
[3.8]
Les matrices du système [3.7] prennent alors la forme:
L' observHbilité des systèmes échantiJlonnés se définit de la même manière que pour les systèmes continus et le critère de Kalman reste encore un moyen algéblique simple pour tester cette observabilité. Cependant, il arrÎve que robservabilité soit perdue en échantî1lonnant un système continu observable.
86
ljnéaîre~
Systèmes non
THÉORÈME 3.3.- Une cOl/dition sidlisante pOlir que le système éclumtillomré d'un système continu observable reste ObSell '(/ble est que pour toliles les pilleurs propres I..f =P Àj " si la punie réelle R e()"i - Àj) = 0, alors la partie imaginaire Jill (Ài Àj) l1'eS[ pas 1111 multiple de 2rr IlS.
Notons que la condition Re(Àj Àj) = 0 implique 111l(À i - Àj) est un multiple de n'est pas une propriété ouverte ni dense. De ce fait, l'observabilité est souvent conservée lors d'une discrétisation.
'2t
Comme dans le cas continu, l'observateur de Luenberger pour le système [3.7] prend la forme:
La matrice 1(d est choÎsie de teHe sorte que Sp(A" des nombres complexes de module < 1).
+ Kt/Cf) c
DW, J) (le disque
l'eneur e(k8) = .\:(k8) - x(k8), vérifie l'équation:
En
el comme Sp( Ad
+ Kt/Cd) c
D(O. 1), l'erreur tend exponentiellement vers O.
En présence de bruit modélisé sur rentrée et la sortie, il est préférable de les gains de sorte que l'estimation ne soit pas trop biaisée. Duns le cas des bruits blancs gaussiens, le filtre de Kalman stationnaire donne une esLÎmatÎon non biaisée.
3.3. Observabilité des sllstèmes non linéaires et rappels mathématiques
3.3.1. Quelques notions slIl'l'ob.r.:crl'abilité Si pour les systèmes linéaires, l'observabilité est un concept global, ceci n'est pas le cus pour les systèmes non linéaires. Dans ce paragraphe, nOLIS allons donner et comparer plusieurs déflnitions d'observabilité. Les systèmes considérés dans toute la suite sont de la forme:
{:~
f(x, Il) II(x)
[3.9]
où X E !vI une variété différentielle (dans la plupart des applications, la variélé A1 est un ouvert de JR:.1I), Il E U un sous-ensemble de jp,~IIJ, Y E IR;.Jl. Pour simplifler r exposé, nous supposerons que r ensemble U est un fermé de lR/II. L'ensemble des entrées Il (.) sont des fonctions telles que, pour toute condition initiale x, il existe une solution unique XII (t) définie sur un intervalle maximal 10, T(II.x) l. Ces entrées seront appelées entrées admissibles. Nous supposons également que f et Il sont suffisamment différentiables par rapport à (x. 11).
Observateurs de systèmes non linéaires
DÉFINITION pOllf
3.1.- i) Deux conditions initiales x
tOlite entrée admissible, 11(.1'1/(1))
=
87
-# x sonl dites indisti11guables, si =
herl/(r)), pOlir t01l11 E 10. TL oit T
il/f(T(II ..I'l' T(Il,x). ii) Si deux conditions initiales x el
x SOli/ telles que 311 (.) 31
E
lO, T [/.q. h (xli (t) -#
h(xlI(t), 01/ dit que u(.) distinglle (x, x) sllr 10, TI. iii) Le système est dit observable si, pOlir tO/lt couple dl' conditions Îllitiales distinctes. il admet une entrée qui les relld distinguables.
h') Vne t'JI/rée qui distingue tOlll cO/lple de point dis/illct.\' .\'UI' lill illterl'alll' rD. Tl est dite 1l1liverselle stlr rO, TI, 0/1 el/core /1 rend le s.\'srèl11c obser\'{/b1e slIr 10. TI. Notons qu'un algorithme d'estimation d'étal n'a de sens que si l'entrée appliquée au système le rend observable. A ce sujet., il esl montré dans [SUS 79] que si le système observable est analytique (M. V sol1l des variétés analytiques. f et Ir sont analytiques), alors l'ensemble des entrées analytiques et unÎverselles est dense dans r ensemble CW([O, T]. U) des fonctions analytiques dénnies sur 10, TI et à valeurs dans V, Celte notion d'observabilité peut être affaiblie en la remplaçant par l'observabilité locale ou encore locale faible IHER 77, ISl 85, NlJ 901. Dans ce qui suit nous donnerons le concept local. Nous dirons que le système L3.9J est localement obsen'oble en un poinl.r s'il existe un voisinage ouvert V de .\" tel que pour tout voisinage ouvert HI de x, conLenu dans V et pour tout x E W: il existe un instant T > 0, tel que XII (t), (t) sont dans W , Vt E 10. Tl et "(XI/(I»), h(xlI(t)) ne sont pas identiquemenl sur [0, T[. Dans le cas des systèmes linéaires, toutes ces défi nitions coïncident. En non linéaire, on a seulemenL: l'observabilité => l'observabilité locale. Par contre (comme on le verra ci-dessous), le critère de Kalmnn d'observabilité continue à s'étendre aux systèmes non linéaires localement observables. Tout d'abord, rappelons quelques notations classiques dans ce domaine. Pour tnut U, nous notons par ./;/ le champ de vecteurs défini par J;/{x) = l(x.II). Si cp est une fonction différentiable sur 1\1, la dérivée de Lie de cp par rapport à '/;1 est notée par Lt;! (cp). Dans un système de coordonnées Cq .... , XII), le champ .1;/ s"écrit J;/ = 2:::.'= 1 a/ i)xi ou encore en représenlation matricielle: li
E
./11
=Z
( .".~:'I
Jill 1
)
88
Systèmes non linéaires
Notons par Q le plus petit espace fonctionnel contenant les composantes Il l ,.,., Il JI de la sortie Il et tel que pour toute fonction cp E n, on a L j;/ (cp) E n. n est appelé l'espace d'obsen'alÎ011 du syslè11le l3.9]. RErvIARQUE.- L'e.\]HICe d'o/Jsen'ation est engendré par les
fi (L
Lj"J ), où les
lOi ... "'I
'I..
Il; S0111
NololIspardn l 'espace des
h; el les dérivées de Lie
des cOllslalltes décrit!mll U.
I~ronllesdcp =
L Il
i=1
a
.c ~ ,011 cp E d.\;
n, purdn(x) l'espace
vectoriel réel des J :l'or11les de dn, évaluée ell x. NOLIS diro1/s qlle le syslème [3.9Jest observable au sens du rang en x, si la dilIIensiol1
de
dn (x)
esln. On a le théorè11le SlIiwlllt.
3.4.- Si le système 13.9J est obsen'able alors il est localement obsen'able en x.
THÉORÈME
{/II
sens dll l'lIllg ell
1111
point .r,
Ce théorème donne une condition suffisante pour l'observabilité locale. Comme au sens du rang est équivalente ft l'observabilité pour les systèmes linéaires, il donne une généralisation du critère de Kalman pour les systèmes non linéaires. La réciproque de ce théorème n'est pas vraie. En effet, considérons le système suivant:
r observabi lité
.,. = 0 { y = h(x)
[3.10]
où Il est une fonction différentiable et injective de IP~ dans lit et relIe que sa délivée en Il est clair que ce système est observable (donc, en particulier, localement observable en 0). Cependant, le système n'est pas observable au sens du rang en O.
o est nulle.
Prcl/l'c succincte dit théorè/lle 3.4. Supposons que le système est observable au sens du rang en un point x, alors il existe X = (Xt, ... , XII) où Xi E n, tel que le jacobien de X en .r est de rang plein, par conséquent, la restriction de X à un voisinage V de
x est un difféomorphisme. Si le système [3.9] n'est pas localement observable en x, on peut alors trouver un voisinage W c V de x et un S E W, X -::j:. S, tels que quelle que soit l'entrée admissible Il, on a l1(x/I(/)) = h(s"U)) et ceci VI E rO. Tf, pour un T tel que .\"/1(1), S/lU) E W, VI E [0, T[. En particulier. prenons des entrées II constantes par morceaux sur des intervalles [Ti, Ti+1 [, 0 = TO < TI < ... < Tt;, Oll les ri sont petits. Posons /Ii la valeur de Il sur l'intervalle [Ti, Ti+d, on a h(xl/(rd) = h(x/I(rl;)). quelque soit ri .... , rt;. Maintenant, en dérivant ces fonctions successivement par rapport Ü TI • ... , T/; et en faisant tendre les ri vers 0, on obtient b(L "/""1 ... L '/"II): )(x) = h(L ,/""1 ... L "/"II} )(x) et ceci quels que soient 111 • ••• , II/;. Donc, nécessairement X (x) = X Cf), ce qui contredit]' injectivité de X. Il
Observateurs de syslèmes non linéaires
89
Dans les paragraphes suivants, nous allons combiner les notions d'observabilité locale et d'observabilité au sens du rang pour en déduire des classes cie systèmes pOUf lesquels on peut synthétiser un observateur exponentiel. Pour cela, nous avons besoin de quelques notions mathématiques concernant les champs de vecteurs et les formes différentielles.
3.3.2. Quelques rappels mathé1/latiques Nous supposons que les notions suivantes sont acquises : 1'.1 est une variété de classe cr (r est LIn entier positif, l'infini, ou encore w pour dire analytique). TM = UXEAI Tr A1 désigne l'espace tangent qui est une variété de classe cr, de dimension 2/1, dans le cas Ol! 111 est de dimension /l, la libre Tr /l1 est un espace vectoriel de di mension /1. Un champ de vecteurs est une application X, de classe cr de !vI dans T 111. Dans un système de coordonnées local (XI . ... , XII), X = L~'= 1 {Ii j ÛXi, où chaque lIi est une fonction scalaire de classe Une distribution de classe sur M est un sousensemble de TM, tel que tout pointx de M possède un voisinage ouvert V et une ramille de champs de vecteurs (Xi)i El de classe cr telle que V:. EV, 1~, M est engendré par
a cr
cr.
(Xi (:))i El·
cr
Par dualité, on entend les formes différentielles de classe comme étant des applications linéaires de M dans T* M, l'espace cotangent (r.~,i' M est l'espace vectoriel dual de T.l"!vl, dans un système de coordonnées (x l, ...• XI/), (dXl . . , . , dx lI ) désigne la base duale de (ajaxl, ... , êljê1xll)' Dans ce système de coordonnées locales, L1ne forme différentielle prend la fonne w = L~'= 1 Widxi. Une fonne différentielle est donc une application de l'espace des champs de vecteurs dans l'espace des fonctions à valeurs scalaires: localement, si X = L~'=I lIiUJjDxi) et si w = Y. . ;'I=I (Oidxi' Hlors lV(X) = L~'=] (Villi·
cr
Notons par X (1'.1) I"espace des champs de vecteurs de classe sur M. Une q-forme différentielle de classe est une application q-linéaire altcrnée sur r espace (X (M) )11 à valeurs dans I"espace des fonctions de classe à valeurs scalaires Cr (M). Dans un système de coordonnées, une q-fonne s'écrit w = )' 1:::::il < ...
cr
cr
Pour finir ces rappels, nous définissons le produit intérieur entre formes dilTércntielles et champs de vecteurs de la manière suivante: soit X un champ de vecteurs et lù une q-forme différentielle, ix{cù) est une (q - 1)-forme différentielle définie par: pourtoutq-l-upletdcchampsdevecteurs(X], .... Xq_I),ix(w)(X] . ... , Xq-l) = (v(X, Xl, .... Xq_I).
90
Systèmes non linéaires
3.4. Observation des systèmes affines en l'état modulo une injection de sortie 3.4.1. Ob.'wrJ'tlfeurs pour les ,\~vslèl1les affines cl1l'étalmotlulo ulle Ï1~iectiml de sortie Un syslème affine en l'étal modulo une injection de sortie esl de la forme:
=
_'o {y X
Ifllll.
li
A(lI)x
+ B(u) + rp(u. y)
[3.11 ]
Cx(t)
E lP~1II et y E nV1 • la matrice A est supposée continue par rapport à li.
Dans le cas où cp(u,
i = A(u)x { Y Cx{t)
y)
= O. on relrouve les systèmes afllnes en
r état:
+ B(lI)
13.12]
Dans ce qui suiL nous allons donner LIn observateur pour les sys[èmes du type [3.121, puis nous étendron~ celte synthèse aux systèmes de la forme [3.11 J. A la différence des systèmes linéaires, un système am ne en \' état peUl avoir des entrées qui le rendent inobservable. POLlf cette raison, la synlhèse d'un observateur pour ces systèmes dépend de la nature de l'enlrée. En effet, considérons le système suivant: ,\:1
.\"2
+ Il.\:"3
.r::! = 0
[3.13]
=0
[
y
x)
Sur un intervaHe de temps donné. toute entrée constanle rend Je système inobservable sur cel intervalle et toute entrée non constante rend le système observable. Maintenant, notons $1/ (t, l'entrée /1 : dq)l/(t, (0)
.
{
=
dl q)l/(to, /0)
=
'0)
A(II(t)Q)l/(t. ID}
1
+ T),
Désignons par G(H./o.lo sur l'inlervalle 10, T J : G(I/, 10.
ln +
la matrice de transîtion du système 13.12], associée [l
T)
l
10
11)
On a le résultat suivant.
+T
Je gral11ll1Îen d'observabilité associé à rentrée
T
q)1I
(1. fo)C
T
(1I(l))C(u(T))$lIU.l0)dl
li
Observateurs de systèmes non
LEI\·tME si /'liIle
Iinéairc~
3.1.- Vnc entrée Il rend le système obser\'Clble sflr lI/1 imen'lIlIe ITo, des propriétés éqlli\'tllemes slIÎl'a111es est sali,\:/àitl' :
i) si C(II (1) )Q)lI (t. to)x = 0, Vt E if) Àmin(G(lI, fo, ln
+ T))
Uo, 10 + T J,
lIlors.r
(0
91
-1- T].
0,
> 0 (Àlllin désigné la pllls petite l'aleu/, propre).
La définition suivanle esl utile dans la synthèse de \' observateur que nous avons proposé. DÉFINITION 3.:2.- Ulle l'Jltrée Il esl dite régl/lièrement pcrsÎsfallle, si elle si elle \'('n/Ïc la proprihé sllil'{IIlIe : 3 al
> 0,
0'2
Àll1ill(G(l/.
> 0: 310 ::::: 0; Vt :::::
fo, 10
{ Àmax(G(If, 10, 10
Tn.
eSI
bornée et
011 Cl :
+ T» : : : 0'1 + T) :s al
OÙ )cmin (resp. Àmax) désiglle
la plils petile (resp. la plus grande) l'aleur propre.
COlnme pour le fiHre de Kalman, l'observateur que nous proposons délive d'un critère d'optimisation [BOR 88] :
{
-~(r) = A (1' (1)-\,(1)
:
b(1I
(t» -
S-IU )C T (uU)( C(u (t ))-\,(1) - y(l»
S (t) = -0 S (t) - A 1 (II (1) ) S (f) - S (t ) A (II (1 »)
+
{1/ (1 ) ) R C (li ( t) ,) l3.14.1
La conditÎon initiale .r(O) est quelconque, 8(0) et Q sont des matrices Il x 11, symétriques définies positives (SOr), (j est un paramètre strictement positif et R esl une matrice p x p, SDP. 3.5 ([BOR 88. I-IAM 91] ).- Si 1/ es! Hill' l'11Irée régulh'rl'lllclII persistalltl', /3. J4 JeSlUll nb.H'/TOIellr e.\]Joll L'II tiel pour le systèl/le /3.12 J: Il.\- (1) x(1) Il :s liC-1'1 11·\-(0) - x(O) Il. où 1-1-. l' SOllt des cOlls/anles positil'es. La prl'm'e l'sI basée slIr IL' l'l'Sil/lat slIil'lml.
THÉORÈME
alors le système
3.1 ([BOR 88, HAM 91 ]).- Si /'emrée 11 est réglllièreme1lf pers;sllIllIe esl SDP. alors il existe deux COllsf{l11tes STrictement posifil'cS f31. telles qlle Àmin ( S (t ) ::::: f31 eT Àma:d S (t » :s th ; Vt ::::: O. PROPOSITION
et si S(O)
Prel/l'e du tlu'orèl1le. Pour simplifier. nous donnons la preuve dans le cas Ol! Rest la matrice identité. Le cas Ol! R est une matrice SDP quelconque s'obtiendra c1'une manière similaire.
92
Systèmes non linéaires
Posons e(!)
,\'-(1)
= IA(II(t»
è(1)
on obtient" :
.r(t),
[3.15]
- S-I(t)C'I'(lI(t)C(II(t))!eU)
Posons li = (,TU)S(t)e(t) ~ dans ce qui suit, nOlis montrerons que" constitue une fonction de Lyapunov pour le système [3.15]. Pour cela, dérivons li. nous obtenons:
,i = è T (t ) S (t )c (t)
+ eT (1) S (t ) è (t) +
Ct )S (1) e (t )
Tous calculs faits. nous avons: \i =
.:::
-OeT(t)S(t)e(t) -
BC(II(t))e(J)f
-(-)\'
Par conséquenL :
Maintcnant utilisons la proposition 3.1 : nous obtenons alors:
<
_e-(J(
- #1
IIdO)11 2
ce qui démontre la convergence exponentielle de l'observateur.
D'unc manière si mi 1ai re, nous pouvons mon trer que le système suivant (observateur de type Kalman) converge exponentiellement chaque fois que rentrée appliquée au système est régulièrement persistante:
I
.~(J) S (t)
A(II(r).r(l) +/;(lI(1) -
=-
S (t) QS (t) - AT (II
(t»
S'-'I(t)CT(lI(t)(C(I1(r):~(I) S (r)
S (t ) A (/1 (t »)
-
yU»
+ c 7 (u (1 » R C (rd t) [3.16]
Nous concluons ce paragraphe par quelques exlensions cIe cet observateur: un observateur pOLIr le système f3.IIJ n'est autre qu'une copie du système 13.15J (ou encore [3.161 uuquel on rajoule l'injection de sortie !p(tt. y) :
I
~(t)
= A(u([)):(t) +,!p(tf(t), y(1)) - S-I(r)CT(lI(1_~(C(If(t)):(t) - y(l)) S(1) = -(ÎS(t) - Al (II(I))S(I) S(I)A(II(I)) + Cl (1f(t»RC(u(t)) [3.17]
Observateurs de systèmes
11011
linéaires
93
Plus généralement, un système est dit partiellement affine en l'état modulo une injection de sortie s'il est de la forme:
±= A(II. y): + ({l(u, y) { y=C::
[3.18]
Comme y(1) est mesurée, ln structure de J'observateur est similaire à celle de l'observateur pour les systèmes affines en l'état modulo une injection de sortie (voir r observateur donné par 171) :
~ (1) { S(t)
= A (II (t), y CI) ):. (1)
=
+ ({l (1/ (l), y (t)) -
S -1 (t ) C.'~' ( li (1 )( C ( Il (1) ):. (1)
-(-)S(t) - AT (1I(I))S(1) - S(I)A(II(t))
y(t ))
+ Cl (1I(1))RC(II(t)) [3.f9J
La convergence d'un tel observateur est garantie sous la condition que soit une entrée régulièrement persistante pour le système:
t = A(/I, y)Ç + Cp (II , y) { = Cç
(lIU). y(t))
[3.20]
W
3.4.2. Li1léarisation modul(} ulle injecti(}n de sortie
Un des thèmes de la commande auquelllll a donné beaucoup d'intérêt pendant les deux dernières décennies, porte sur le problème de la linéarisation par retour d'état. Le problème plus ou moins dual, consiste à caractériser les syslèmes non linéaires qui, par changement de variables, se transformenl en des systèmes linéaires plus une injection de sortie [KRE 83, KRE 85. WAL 87, XIA 89]. Ces systèmes forment ulle sous classe de la clusse des systèmes du type [3.27] dont l'observateur il été donné cidessus. L'intérêt de cette classe particulière réside dans le fait que pour ces syslèmes, on sait synthétiser un observnleur simple qui n'est autre qu'un observaleur de Luenberger amélioré. Pour cela, rappelons qu'un système linéaire plus une injection de sortie est un système de la forme: .\.(t) { yU)
où
=
Ax(t)
+ BuU) + ({l (rI , y)
= Cx(t)
XE m{II./1 E
lRlII et y
E
l3.21 J
1R:J1
Comme la seule non-linéarité porte sur le terme additif ne dépendant que de la sortie et que cette dernière est mesurée, un observaleur pour ce système prend donc la forme: [3.22]
avec K, tel que le spectre sp(A
+ KC) c C-.
94
Syslèmcs non linéaires
En effet, r équation êU)
(r eneur :
= (A + KC)e(1)
l3.23]
devient exponentiellement asymptotiquement stable. Si 4> désigne le changement de variable, un observateur pour le système non linéaÎre initial [3.9] prend donc la forme: [3.24J Oll
.hlJ désigne le jacobien de
1).
Dans ce qui suit, nous allons rappeler un résultat sur la linéarisation modulo l'injection de sonie. Pour simplifier cet exposé, nom; ne considérons que le cas des systèmes
autonomes: _l' {y
{(x)
=
[3.25]
l1(x)
On le résultat suivant dC! ft Krener et Tsîdori. THl~ORl~ME
3.6 (KRENER-IsIDORl).- POlir fjU 'U1I système aI/tonome soit t}"{/lI.~forl1lable l'ois;,/C/ge d'ml pOÎIl1 xO ['1/ 1111 système lin éa; r(J modulo 1Ine Îlûection de sorlie, N falf1 et il s/~lrit que: 1) l'espace vectoriel engendré par (ri Il (.rD), dL f (11)( x(), ... , dL 1;.-1 (II )(xo) soit de dimellsÎoII n ; Olt
2) sÎ Y désig1le "unique ch{l/l1p de ,'ccteur sa(i,~/ài.'iolls L r (II) el
L~f-l(h)
O. " ., L~/·-2 (11)
=0
1. alors: pour fOllt (i,.n, 1 ~ i, j ~ n - 1. rl1d~.(Y).lIdj.(Y)1 0 = Y . ., .,adj. (Y) = Lt {/d~-:-l (Y)], pour
oi! [., .] désigne le crochet de Lie et ad~( )') i ?:. 1.
Le cas des systèmes commandés avec plusieurs sorties a étudié clans [KRE 85] et [XIA 89].
3.4.3. Lilléarisatioll lemps-l'ariant modulo
tille
injection de sortie
Dans le paragraphe précédent. nous avons caractérisé les systèmes qui sont transformables par changement de coordonnées en des systèmes linéaires plus une injection de sortie. NOLIS avons également vu que pour ces systèmes on peut construire un observateur de type Luenberger. Dans ce paragmphe. nous allons caractérÎser les systèmes non linéaires transformables par changement de coordonnées en des systèmes de la forme [3.11].
Observateurs de systèmes non linéaires
95
Considérons les systèmes de la fomle :
-\- = l(x, { Y = h(x)
Il)
[3.26]
où x E NI une vatiété différentielle de dimension
Y
E
U un sous ensemble de IR" ,
11, 11 E
JEtP.
Nous allons donner une condition nécessaÎre et suffisante permettunt de caractériser les systèmes [3.26] qui sont transformables par un changement de coordonnées local .z = (p (x) sous 1a forme:
t = A(u)z+cp(u,y) { y = C:
l3.27]
L'intérêt de cette transformation réside dans le [ail qu' on sait construire un observateur pour cette classe de systèmes. En effet, un observateur pour [3.27] est donné par [3.17]. Dans toute la suite, nous allons supposer que le système [3.26] est observable au sens du rang. Quelques notations: par j;/, nous désignons le champ de vecteurs défini par = f (x, If). Soit X un champ de vecteurs sur M. on note par les espaces vectoriels suivants: nI' est l'espace vectoriel engendré par l'ensemble des deux-formes {dLj;,(h) /\ dh.u E RIII} et plus généralement n{+1 est l'espace vectoriel engen-
ni'
fil (x)
nt.:'
dré par l'ensemble des deux formes {dL.t;,(ixw) /\ dh; (V E (~), 11 E RI!!}, où ix désigne le produit inLérieur défini dans le paragraphe 3.3.2 des rappels mathématiques. Finalement,
n X , désigne
l'espace vectoriel engendré par
maintenant énoncer le résultat principal.
~oo n{. Nous pouvons ~k=1
3.7.- Le système [3.26J pellt se trll1L\jlml1er en [3.27/ pllr IfII clIl1llgCl/ICI/l de coordonnées local autour d 'lin point X(J, si, el seulemenl si, les cOlldiliollS slfÎl'al/lCS sont réalisées:
THÉORÈME
/1 existe
lfll
champ dc l'eCleurs X,
(h~fil1i slIr /III
l'oisillllge de .lo tel que:
1) Ls(h) = l, 2)
CI1
tall! ql/'espace vectoriel slIr lR., la dimension de
n X (2:) est égale li n
-
1.
3) V(V E n X (~), dUxw) = 0, 4)
/\11-1 (ix nx (L;))
/\
dhlro
"# OOIf /\"-1 (isnX CE)) est /'e.\pace l'ecforiel cl1gell-
dré parlafa1l1ille [ix «(VI) /\ ... /\ ix(cvll-I): CVI, ...
,Wn -l
E
n X CE) 1 restrei1lte il Xu·
96
Systèmes non linéaires
Prel/l'e. Condition nécessaire. Supposons que le système [3.26] est observable au sens du rang et qu' il est équivalent par difféomorphisme à un système affine en l'état modulo une injection de sortie de la forme l3.27]. Après un simple changement de coordonnées! on peut supposer que y = ':1 (ce qui veUl dire que C (1. 0, .... 0). En regroupant dans cp(lI. y) tous les termes dépendant de la sortie, nous pouvons mettre A(II) sous la forme:
(~
A(II) =
.al ll (1/)
:)
Comme les propriétés 1,2 et 3 sont intrinsèques (c'est-à-dire qu'clles ne dépendent pas du système de coordonnées considéré), il sufflt alors de vérifier ces propriétés pour le système [3.27]. En effet, considérons le champ X = (il/iL: 1 ) : il est claÎr que Lx L:: J )
1.
nf : nr
Pour vérifier la propriété 2. nous allons ca1culer les espaces vectoriels ne dépend pas de X el est engendré par la famille des deux formes Id(C A(II):) Ad:;l; Il E lPZ.TII
).
Par ailleurs.
ix (d:;
A
lin
calcul simple dOllne :
d::.d =
[3.281
-d:;j
Qi'
Un raisonnement par récurrence montre alors que est engendré par la famille des deux formes (d( C A (111) ... A (lIk)::) /\ d: 1: III •... ,lIk E ]R{IlI}. Par conséquent, n X est un espace vecloriel sur lP~ de dimension inférieure ou égale à Il - 1.
Ulilisons une autre fois la relation [3.28J. On obtient ix(t/(C A(lI]) ... A(lIk):) -d(C A(IIj) ... A(lId:). qui est une forme exacte, d'où la propriété 2.
A
c!-:'])
La propriété 3 découle du fait que le système [3.261 est observable au sens du rang et que J'observabilité est une propriété intrinsèque.
Observateurs cie systèmes non linéaires
97
Prelll'e. Condition sl~tl7s{/nt('. Supposons que les condÎlion~ du théorème sont satisfaites et calculons le changement de coordonnées par lequel le système peut se meUre sous la fonne l3.26]. Des deux dernières conditions, on peut déduire une base X WI •... , Ü)II_1 de n telle que di.dwk) = O. Pasons:1 h(x) el pour k :::: 2.:" tel que dZk ixCwd. Il est clair que (:1, .... ::/1) est Ull système de coordonnée~ 1ocal. Pour montrer que le système l3.26j peUl se mettre SOllS la forme l3.27 j. il surHl de l1lontrerque L./;,{:;) = Ej=2(Jij(II):j +f.{J;(II, ::d, où: -lIij(lI)
est une fonction de
Il
et de
Il
seulement,
- lPiU1.:I) est une fonction de (11,:1) et de (/1.::::1) seulement.
Utilisons ln définition des :j et celle de
n X . Il ~;"ensllÎt que L./;, (d:.: i ) 1\ d::)
E n.\'. c' eSl-ù-dil'e
donc il existe des oij (11) tels que LI;. (d::;) /\ d::'1 = ')";=2 (lij {II )d::'j
1\ d:: 1,
tels que d[L J;, (:.:;) - E';=2 ai} (II ):j 1/\ d::. 1 = O. D"où L J;, (:i)
E J=2 (lij (I,)::j + III
rpdll, y).
3.4.4. Applicf11ioll.\' EXEivlPLE (ECHANGEUR THERMIQUE).-
TrI
Tr::!
Tm
1/ esl Mi'l} COI/III/ que le 111odèlefil1 d'ull échangeur thermiqlle l'sI cOllljJOsé d'é{!lIOtiollS {/Il.\' dérÎl'ées parliel/es. Vile des méthodes permellmu de rédllire le II/odèle SOIIS la forme d'éqlllll;OIlS dUTérelllÎel/es ordillaires cOllsiste il faire 111/ découpage dl' l'éclw/lgeur l'II des l'nlumes slipposés hOl1logèlles (la températ/lre dons c!Jaque VOIIlIllC esl d'oppliq1ler le prillcipc dcs bilalls thermiqlles en considàllnl des échonges par com'celioll el par cOllducTùm cl flY/I'CrS 10 smface d 'à:lwnge sépam11l les del/X liquides Irtll'erswlll'éclwJlgelll: Le procédé est commalldé en déhi,. La températllre à l'el11rée de clwqllefluide est supposée constante. NOl/S m011lrerom; ql/e, SOli.\' ce1fe dernière hypothèse, le modèle ob/enll est bilinéaire. Par COI1Séquelll, ml obserl'ateur permellmll d 'eSIÎmer le pro.lil de tempémfllre II /'illléricllr de l'échangeur pCIII prendre la.f(ume [3. 1-11
slIppnsée 1I11~t()rllle) eT
Modèle réduit de
r échangeur
On a fait un découpage en II volumes. qu'on indexe par k J •••. , Il. On note par p et p' les densités volumiques des deux liquides. D et D' sont les débits traversant
98
Systèmes non linéaires
)' échangeur. Vk et Vi désignent les vo]umes de la tranche k correspondant à chaque liquide. On note par c, c' les capacités calorifiques des liquides. Finalement, Tc, Tt; sont sont les températures les températures constantes ft l'entrée de l'échangeur el Tb correspondantes aux volumes de la tranche k. Sel V{/ sont respectivement l'aire de la surface d'échange entre les deux fluide~ et le coefficient d'échange global associé. En appliquant les bilans d'énergie pour chaque tranche k, nous obtenons:
11
- fluide 1 : 1) pour k = l, on
LI :
d(pVlcTI)
dl 2) pour 2 ::: k :::
d(pVkCT1.)· •
1\
dt
d(p'''~cTi)
2) pour k
=
on a :
= P . C ('T/1;-1 /)
fluide 2 : 1) pour 1 ::: k ::: --d':":",--:;~
J1,
-
l'k ) +
11 -
1, on a :
,
.,
V -
1/
S
(1"k
-
'T ) 1k •
= P Dc( Tk+ 1 JI,
on a:
d(p' \I,:C~:)
dl
L'état du système est composé des varÎables Tb
Tt. l'entrée est formée des débits
D, D', Le système obtenu est un système bilinéaire. EXEMPLE,- (RÉACTION A
Modèle. Dans ce paragraphe. nous allons étudier le problème d'estimation en ligne des concentrations dans le cas d'une rénction en série du premier ordre. Ici nous nous limitons il llne réaction simple du type:
Ol! les Œi sont les ordres de la réaction. Le réacteur est supposé parfaitement agité. Il est entouré d'une double enveloppe de volume constant '~i traversée par un fluide à
Obscrvalcurs de systèmes
11011
linéaires
99
débit constant D, sa température à l'entrée Tii est mesurée. Les bilans de matiÈre ct d'énergie conduisent au modèle suivant: ·
T
VA = -pFC -(T -
·
T.i
T·) }
Q
+
li
UA
CI =
,JJ.J -/q) 1
1
T)
D
= p.\,.C. (T - Tj)
•
(T
"Ci
/ R1 C
1
J
+ V. (TJi
ci + - (C li
10
- T.j)
CI) - QC-, \' -
13.29J oit Tet 7} sont respectivement les températures dans Je réacteur el la double enveloppe. les concentrations des produits A, B et C. V est le coeffkîent global d'échange, A est la surface globale d'échange; E;, Ô /-Ii, el klli sont respectivement l'énergie d'activation, l'enthalpie el la constante cinétique de la réaction i, Rest la constante des gaz parfaits. Cl. Dl et C3
Estimation des concentrations dans le cas des réactions du premier ordre Dans cet exemple, seulement les rnesufCS en ligne des températures sont li notre disposition. Comme nous l'avons mentionné ci-dessus. nous restreignons notre étude au cas des réactions du premier ordre Ci 1 = crl = 1. TI est facile de voir que la connaissance ù chaque instant des températures ne permet pas de remonter à la concentration C3. Par conséquent, le système n'est pas observable. Seules les concentmt.ions Cl et Cl peuvent être estimées. Le modèle réduit permettant de synthétiser un observateur est composé des équations différentielles parLant sur T, CI et C2. La température mesurée T,i est considérée comme entrée pour le problème d'estimation que nous considérons. Le modèle réduit prend la forme suivante:
_rU) = {yU) =
A(u(l), y(t»).r(t)
+ /)(11(1), yU)
[3.301
Cx(t)
où .r(t) = (T(t), CI (t), C:.dt)/.
Le système [3.30] est observable et prend la forme [3.18]. Par conséquent, un observateur est donné par [3.19 J :
{
.~
= A(u(t). yU))i(t) + b(uU): y(I)) -
SU)
-()S(t)
S-I (t)CTlC.r(t) -
A(lI(t), y(1))T S(t) - S(t)A(u(t), y(1))
y(~)]
+ C7 C
[3.31 ]
100
Systèmes
11011
linéaires
où J:(t) = cru), ê l (1), ê2 (t)Y est l'estimation de (TU). CI (1), C~(1))t ; 11ft) el yft) sont respectivement rentrée et la sortie, où :
où (/33
= U A/(pFC), = k(}2.
({II
AHlkOl/(pC), {/J3
ail
kOI
et
Résultats cie simulation Nous avons simulé le système et l'observateur (équations [3.30] et [3.31]) en utilisant 1es valeurs numériques du tableau 3.1, les conditions initiales et les entrées suivantes:
Ti Q
V
=
293K.
Tji
343/(,
CIO=100molm- 3
5.3 x 10- 3 1 < 100 ( 1 x 1O-:~ 100 < 1 :s:: 400
312)
:(0) = ( l~
.
S(O)
=
.rcO)
1 0 0) (00 01 10
=
309.46) 4.49
( 20.06 et
(-) = 0.0005
La performance de l'observateur proposé en présence de bruit de mesures est illustrée sur les figures 3.1 à 3.4.
3.5. Observation des systèmes uniformément observables Nous Hvons VlI que. étant donné un système, 1a notion d'observabilité est une notion qui dépend de l'entrée qui est appliquée au système et à la sortie qui est mesurée. Même si un système non linéaire est observable, il est parfois possible de trou ver des entrées qui
Observateurs de systèmes non linéaires
Coefficient global d'échange Surface d'échange Constant cinétique de la première réaction kOl Constant cinéLique de la deuxième réaction km Energie d'activatÎon de la première réaction El Energie d'activation de la deuxième réaction E2 6.H, Enthalpie de la première réaction 6. H 2 Enthalpie de la deuxième réaction D Débit volumique du fluide caloporteur R Constante du gaz parfait p densité du produit dans le réacteur densité du fluide caloporteur p'.1 Capacité calorifique du produit dans le C Capacité calorifique du fluide caloporLeur C·.1
101
36 Id
U
'l
0.2 m-
A
15,155 x IO R
38,22 x 106 min- I 60 kJ mol- I 55 kJ 11101- 1
-30 Id -50 Id 2,1 x 10-5
11101- J 11101- 1
III 3
min- I
8.314 J lllol-i
1000 kg 111- 3 m- 3 1000 l-lT '"r= K- 1 4,18 leI K- 1 4,18 kJ
Tableau 3.1. Valeurs 1lU1l1ériques
350~--------------------------------------~
348 346 344
Q 342 '-' 340
r-:.-'
338 336
334 332
330 ()
50
100
150
200
250
300
350
400
Temps (min)
Figure 3.1. Tempér{/fure /J/c.Hlrée dalls la douhlc (./IlI'e/oppc
le rendent inobservable. Par ce rail, ralgorithme d'estimation (observateur) dépend de la nature de l'entrée. Par exemple, il est nécessaire d'utiliser des entrées régulièrement persistantes pour construire un observateur exponentiellement convergent dans le cas des systèmes afHnes en l'état. Dans ce paragraphe, nOlIS allons caractériser une dusse ùe systèmes ayant la propriété d'être observables indépendamment de l'entrée appliquée au système. Ces systèmes sont dit l/IJUcmnément obsen'lIbles (la propriété d'uniformÎté porte sur les entrées), Ensuite, nous montrerons que dans certains cas, il est possible de construire un observateur ne dépendant pas de l'entrée du système.
102
Systèmes non linéaires
312.----------------------------------------T-Il-1~-sl-lr-,é
310
T estimée
__ 308-
~ 306 i:!
:3 304 ::l
'~ 302 l= 300298 296
t2
294+----.-----.----.---~-----r----.----,~--~
o
50
100
150
200
250
300
350
400
Temps (min)
Figure 3.2. Températllre dtl système et . . 011 estimée 22 20 IS
c
..ê g c
~
v
c 0
u
16 14 12
JO 8 6 4 2. 0
~
#
CI estimée
50
LOO
150
:wo
250
300
350
400
Temps (min)
Figure 3.3. Conccntration Cl dit .\'yslè111e el .Wlt estimée
50 45 40-
.g .5c
35 30
!!J
c 25
u 0
u
20 15
- - C2rêclle
C'2 estimée
0
50
Ion
150
200
250
300
350
Temps (min)
Figure 3.4. Concentratioll C2 du système et SOli estÎmée
400
Observateurs de systèmes non linéaires
103
3.5.1. Obserl/abUité IIll~rO"lIle Considérons de nouveau les systèmes de la forme:
{
,\~(t) yU)
= I(x(t), /l(t)) = h(x(t»)
[3.32j
x(t) E M.H(t) EV, yU) E RfJ. Pour sÎmpliller, nous supposerons que l'espace d'état
i\1 est un ouvert de 'Rf'.
nn, l'espace des entrées V est généralement un domaine bOl11é de
3.3.- Le système [3.321 est dit uniformément observable (ou obsen'able indépendamment de l'entrée 011 encore observable pOlir tolite entrée), si tome emrée rend le systèl1/e obsert'able. Plus précisément. pour tolite cntrée If : [0, T] -;,. V, et pour toutes conditions initiales x =j::. x' il existe t E rO, Tl lel que y(x, lI, 1) i= y(x', li, 1), où y(x, /l, t) est la sortie à l 'il1stantt, associée cl la conditioll initiale x el à l'entrée li. DÉFINITION
Tout d'abord analysons r exemple suivant:
.\1 (t) = ,\'2(1)
+ fP 1(II (1), .\:[ (1 ) ) .\"3(1) + fP2(U(t), XI (1), .\"1(1)) x:! (t)
·\'/1-1 (1) = -"nU)
+ lPll(u(t), XI (1), ... , .\,,-1 (1)
'\'1/ (t) = lPn (If (t ), X (1) ) y(1)
= XI (1)
où .l(t) = [.\'[(1), ... , x/I(t)f, 1I(t) E R/II. Dans cet exemple, la sortie mesurée est la première composante de r état. Il est clair que si deux sorties y(x, Il, 1), y(x ' , il, 1) sont identiques sur un intervalle [0, T], alors forcément x = x' (ou encore si x =1- x', alors 31 tel que y(x, li, 1) =j::. J'(x', Il, 1)). En effet, posons
XI
(1) = y(x. Il, 1), x~ (1)
= y(x',
Il,
1) et supposons que XI (1)
=
x~ (1), VIE [0, T]. En dérivant XI (l), x~ (1), on obtient:
-'=2(1)
+ fPl (u(1)' XI (1))
x~(t)
+ rpJ (11(1), x; U»
En tenant compte du fait que .lJ (1) x~ (1). on en déduit: x:!(t) = x~(t). Délivons une autre foÎs les deux Lennes de cette dernière égalité, nOLIs déduisons x3(1) = .r~(t) et ainsi de suite. Dans ce qui suit, nous allons montrer que la structure du système donné dans l'exemple ci-dessus caractérise les systèmes uniformément observables dans le cas monosortie.
104
Systèmes non linéaires
3.5.1.1. Syslèmes
{~ifines
en l'entrée
Considérons les systèmes de la forme: III
{
:\'(1) =
./0 (x (1)) + ~ lfj{t)Ji(x(t))
y(t)
h(x(1))
- .f'0."\ (,) 1Cl,. J" (_\! Il ) )'ElR:(p 1).
+ Li=l Il,.f'·, (,) .\, A1 ""III
,
[3.33]
--
1T'tJJI ll", •1
/1 --
( If
1, ... ,1111/ ) E
U --.Il';. 1T'tJ/II et
Considérons la fonction
= L~f~1 (l1)(x): 1 :::;
[3.34]
Î ::: Il
où L J,0 "" (/1) désigne la /IllC délivée de Lie de ft dans la direction du champ de vecteurs f
f'o,
et
L~il (h) =
h.
REMARQUE.- Du fair que le système est obJ'ell'able indépendamment de l'entrée, en particlliier l 'ell t rée Ilulle rend le système obsell'able. Par cOllséquent, cp deviel11 11/1 d~/JëO/lI(17)his111e local autollr de tOllt pOÎnt appartenant ci lllt certain ouvert de !vi. Si ell plIlS, le système est analytique, cil del'ÎCl1Il111 dUl'éomorplrislIlc local presque partout. cD{x) d~finÎt lIl1 changcmel11 de variables (au moins localement). On peUl DOlic:: énoncer le résultat principal de ce paragraphe.
THÊORÎ:Jv1E 3.8.-
Si le système [3.33 Jest r.m~lorl1léllle1l1 obsen'able, alors cD tral1,~for111e
(au moins localement) ce système SOIiS la forme: 1/1
:(1) {
=
yU)
A;:(t)
+ Fo(z(t)) + ~lti(t)FÎ(Z(t))
[3.35]
C;:(t)
où:
0
0
0
0 0
A= 0 0
0 1
0
:C
=
[1
0]
0
[3.36]
0 [3.37]
lI'
Fj(n = [ Fjd~) ... F.il/(~) { F.ii(!;) = F.ii(!;l, ... , !id. pour 1 ::: i :::s
[3.38] Il
etl :::; j ::: 111
Ce résultaI a été initialement délllol1tré dans [CAU 81 J. puis il
CI
été repris dans
Observateurs de systèmes non linéaires
105
PnNll'e. D'après la remarque ci-dessus. cI) définit un changement de variables local. De plus, le système se transfom1e sous la forme: III
:(1) {
= Az(t} + Fo(z(t)) + t1l1i{t)F;(.:::(t»
[3.391
yU) = Cz(t)
où la matrice A est donnée ci-dessus. Dans ce qui suit, nous allons montrer que la composante Fij de F; dépend au plus de :) , .. . ;:.j et ceci pour 1 ::: i ::: 111.
/mc
Supposons que cela ne soit pas le cas et considérons que Î est le premÎer indice en jo tel qu'il exisle un j 2: .io + 1 tel que FUn/a:} =1- O.
a
Considérons le système suivant défini sur
il
=
2:1
+
Ft, (t:)
ZJo = Zjo+l
+
F-. (1::)
.:. - Flo (-) .
!;!
11';:'
+
xi 1,;", (-) FUn (:) IJO "
fJO "
..... 11 -
(7) Fil (:: ()
1::'"
l'I.lll ..,
IJO S
xÎ I.~.'
(1::)
1';'• • . "")
IJO "
= !;:! + F ..
rlj!} ("
xi
p.. (-) lJo'"
[3.40]
(C) _ F,.. ('7') Fil (!;J}
1.10 "
'.lu
~.
Maintenant, considérons la condition initiale (z(O),!; (0» telle que pOUf k ::: Jo, Zk(O) = !;k(O) et Zj(O) =1- !;J(O). La solution associée à cette condition initiale existe, est unique et définie sur un interval1e 10. TI, T > O. De plus, il n'est pas difficile de voir que pour tout 1 E [0, T[ et 1 ::: Il ::: .io . .:::dt) = !;dt). Dans la suite, nous notons par u;(1) la fonction (Zjo+ 1(t) - xiio+t (t) / (Fiio (~(t) - Fil (z 1(t»)) Maintenant considérons l'entrée Il dont toutes les composantes sont nulles sauf la composante li; qui vaut 1I1(t). D'après la construction ci-dessus, il est facile de voir que si z(O) et :(0) sont deux conditions initiales du système [3.39], alors pour
106
Systèmes non linéaires
tout 1 E (O. TL :1(1) [3.10].
:1 (1).
Ceci contredit l'observabilité uniforme du système
•
Une extension au cas non affine en l'entrée [FAR 01].
il
été établie dans [GAU 94] et dans
Tout d'abord, nous allons donner la forme canonique des syslèmes uniformément observables, non affines en l'entrée, dans le cas ITIonosortie.
3.5.1.2. Vile ex/ensioll {Ill cas non
{~ffille l'Il l'elllrée
Le système l3.32] est dill/1Jij'orl11élllellt suivant est uniformément observable:
,t
=f
observable si le système
(x, li)
. ar
j
;,~/i1/ilésil11all'1IIelll
:= (~.'.\_(X,lt).:. _
cil
.
iJ.r
[3.41 ]
,. = -(x).:
Sous l'hypothèse de J'observabilité infinitésimale [GAU 94], il existe un changement de variables permettant de transfomler le système [3.32] SOllS la forme:
[3.421
y
=:'1
3.5.2. Obsen'atcurs à gralld gain 3.5.2.1. Cas II/ollasar/ie Dans cetle parlie, nous aI10ns exploiter la structure [3.39]-[3.42] pour synthétiser un observateur pour les systèmes L3.32] et [3.33]. Comme r observabilité ne dépend pas de l'entrée appliquée all système, nous allons montrer qu'il en est de même pour l'observateur que nous proposerons.
Observateurs de systèmes non linéaires
107
1) Cas des systèmes affines en l'entrée Tout d'abord commençons par les systèmes uniformémem observables qui sont sous lu f0n11e l3.39 J et supposons que les termes non linéaires Fi sont des champs de vecteurs globalement lipschitziens, c'est-à-dire satisfont tll'hypothèse suivante: H) VIII > 0; 3e > 0; V(,::, f.) E (IR")2.IIFiU:, li) - Fi
li)!!::: cllz. -~.
On a alors le résultat suivant. THÉORÈME
3.9.-
SOllS
l'hypollrèse H, le système st.lh'WIl est 1111 obserl'atelireXp(J1IelllÎel
pOlir les systèmes du type [3.39] : III
A:
+ Foe) +
L
li;
Fi(Z.) - ÊloK(Cz - y)
[3.431
i=1
où K est tel que le spectre de Ji diagonale dillg({) . ... ,(III).
+ K C est il parlÎe réelle J/égative el Êlo estle/1I1atrice
Pills précisément. pOlir toulm > 0 .. pour loute enlrée Il, lelle que SUPI:"ôn lIu(1)Il ::: > 0; 'rie ~ f)o; 311_) > 0; > 0 lels que Il:(t) Il ::: /11 eJl:!llIz(O)- :(0) Il et ced pOlir lO1/t 1 ~ O. 111 ;
Dans le cas où les Ir'l~;ectoires titi syslème [3.39/ reSlenl dalls Ull domaine borné, l'hypothèse H ci-dessus peul être obtenue ell prolol1geant les termes 11011 linéaires en dehors de ce dOl1laÎne par des/onctions globalelllent lipschit::.ienlles.
REMARQUE.-
En utilisant le faÎt que la non-linéarité est globalement lipschitzienne, nous montrons succinctement que l'utilisation d'un grand gain peUl compenser l'effet de cette non linéarité. Pre/Il'e.
Posons.:- = ê(t)
A~I tif)
-=7.,'::
=
1: et
E
= :: -
~, nous obtenons:
= -fJ(A + KC)e(t) + !:::.ooF
[3.44]
où: III
8F
= Llli(t)!:::.ü'(F;(!:::.oiU)) -
Fj{lloz(t))
[3,45]
;=)
Utilisons un choix. de K de sorte que le spectre de A + K C soit à partie réelle strictement négative, il existe une matrice P, SDP telle que (A+K C)'J' P+ P(A+K C) = -1. où 1 est la matrice identité. Nous allons montrer que s(t) tend exponentiel lelllent vers O.
108
Systèmes non linéaires
PORons V (1) = H, nOLIs obtenons: \Î(I)
ê U )T
P f. (t) ct utilisons la structure des Fi, ainsi que l' hypothèse
= -011['(1)11 2 + 'lEU)'/' P8F :::. -fJI!E(I) 11
2
[3.46.1
+ 1cll,<;(1)11 2
où c est la constante de Lipschitz donnée par H. Finalement, on a : \;(1)
=
-(OÀ I1Jax (p))-1
2c(À1l\ildP})-1/2)\!(t)
Maintenant choisissons () suffisamment grand, nous obtenons le résultat du Il lhéorèmc. REtvlARQUE.- UII observateur pour le système
/3.33J prend la forme
SI/ÎI'm/le :
111
-~(r) = .fi)(.r(l))
+L
tli{t)'/i(.\-(l» - (JcÎl)-1 t1oK(hl-r(1») - y(t))
[3.47]
i=1
où cp est le chal/gement de variables dOJll1é d,ms (3.34/ et J~) désigne le jacobien dl' Q) él'{tlué en .\:(1).
2) Cas des systèmes non affines en rentrée
La forme canonique correspondante est donnée par le système [3.42]. Sous l'hypothèse que les lermes Fi sont globalement lipschitziens et que les dérivées des Fi par rapport à :i+ 1 gardent un signe constant, on peut construire un observateur basé sur le même principe. Pour simplifier nous émettons l'hypothèse suivante: 1-1') les F; sont globalement lipschitziennes el pour 1 ::: i 11 - l, on a : III 1 :::
::: III 2
où J~:::i-I-l désigne la dérivée de Fi par rapport tl ::;+1 el strictement positives.
1111,11/2
sont des constantes
La construction de l'observateur est basée sur le résultat technique suivant. LEMME
3.2.- 11/1 < Ill']. étant dellx eOl1stal1Tes strictement positives. alors il existe Ull
Ifee/l'ur cololll1e COllstallt K, il existe une constante p > 0 et une matrice P constante SDP, dépenda11ts selllemcm de (m 1,111'].) tels que pour toule fOllction ai (1), 1 ::: i < Il 1 vér(f1c/111 JIll :::. (lj(l) ::: nt2, et pour fOut t ~ O. on a:
(A(1)
+ KC)T P + (A(t) + KC)P
:::. -pl
Observaleurs de systèmes non linéaires
109
olÎ .'
o
o
o
o A(I)=
o o o
ali-lU)
o
0
et 1 est la II/atrice idel1tité. Pour la démonstration de ce lemme, nous renvoyons à IGAU 94]. Une autre preuve et un algorithme correspondant à la construction de J( et P ont été développés dans [HAM 01] Sous J'hypothèse H', un observateur pour le système [3.42] prend la forme:
i = F(:, If) -
[3.48]
b.oK(C: - v)
où K est donné par le lemme ci-dessus. La preuve de la convergence exponentielle repose sur la même technique que celle développée ci-dessus.
3.5.2.2. EXlcnsioll a/1 cas IIll1ltÎsortie Classe 1 Les systèmes considérés sont de la forme:
:11- 1 :11
Y
= :::"
l3.49]
+ Fq_1 (::1, ... , ZII-I. /1)
= FI} (':.,
Il)
=:'1
où ZÎ E IRP, pour 1 .:s i .::: q. SOllS la condition que les fonctions Fi soient globalemelH lipschitziennes (ou encore que les trajectoires sont dans un domaine borné, auquel cas, on peut les prolonger en des [onctions globalement lipschitziennes), Ull observateur pour ce système prend la fonne :
il =:1+
Fd:I,If)+RKI(:I-Y)
?'II-l
=:1{ + FI}-l (:1 .... , :I}-III) + (1 }-1 KI}_I (:1 -
~ -'-II
1:q~' (.:
1
y =:1
If)
+ DII 1\11 v (:: [7
~I
- .\.)
y)
[3.50]
110
OÙ
Systèmes non linéaires
Ki sont des matrices constantes p x p leIIes que le spectre de : KI
1"
0
K2
0
1/1
0
0 /jJ
Kq_1
Q
Kil
0
est tl partie réelle strictement négative. La preuve de la convergence de cel observateur est similaire ft ce qui a été fait ci-dessus. Classe 2. Considérons la classe des systèmes non linéaires:
: = Az + cp(u, z) { y=C:
[3.51 ]
où:
)' =
v, YI]
-;-
[.\p
E
RP
cJ Ck=[I,Q, ... ,O]
La structure des cp; est donnée par l'hypothèse suivante: Hl) il existe 2p entiers Iu[ ... u p }. [81, ... , /5 p l, tels que Dk > 0, k 1, ... , p, satisfaisant: pourk,! = J, ... ' p; i = 1. ... Ilk et pour j = 2, ... ,11/ on a: 1
acpki
sÎ -.. -(u , :) ~ (}:lj
°
k
pour un certain j 2: 2 alors u·
1
+ -/h2.
1
8/
> u· - .J 2
[3.52]
Observateurs de systèmes non linél.lires
REMARQUE.- L'hypothèse
== 0
, (u. z.) cl:k';
111
HI implique en particulier que:
i + 1 e[pollr 1.:::: i.::::
pOlir tour j
E}"'EMPLE.- Ce! exemple dOllne
IIl/e
II/;:
illllstraNolI de la structure décrite par l'hypothèse
Hl ci-dessus:
: i 1 = Z12 + cp 11(Il. :: 11• :'2 J , :'12) zi::: = Zl3 + ifJl:::(lI. ':::11. :::11 • .7:1/. :::11) Zi3
= !PU(II, :11, :::n. :::(3. :21, = ::11
=
Z::?J
+ rp2I (If, :::11, :::11) + CP21(U, :'11, :::)2, .:::U, :::12)
[3.53]
CP23(U.:II,:11,:13, .7:11,::::1.:13) y
[':11] :::11
La structure de l'obsel1 Jlltelirpour le système [3.5/J es! de lalorme: T CA - - S-lc A.::- + cp(u,;) F.) (Z
y)
l3.54]
où: i)
= Yk pOlir k = 1, ... , p (l'illjectioll de la sortie) :/::i,
pour i
#
1
ii)S8
l'! SO"k'
k = l, ... , p, est l'unique solll1ioll de :
]
S{h'
[3.55J On a a10rs le théorème suivant. THÉORÈME 3.10 ([BOR 91. BOR 01]).- Supposons que l'hypothèse Hl est slIti~.IlIÎ1e par le système (3.51] et que les termes non linéaÎres Fi SOI1l globalemellt lipscltit.::iells. Alors:
"lM > 0; 380 > 0; "If) 017
a :
Il
supllll(t)
(1) - :(1) 111 .:::: !V!.
.::::
~
(Jo;
> 0; 3110 > 0
Àoe-II(JlII~(O) - :(0)112 pour lOute ell1rée
li
telle que
112
Systèmes non linéaires
On peut montrer assez facilement que les coefficients SO~I; (i, j) sont de la forme: for 1 ::: i. j ::: et que
S{)bl
Il!
Il
II/.:
où Cil = - - - (1/ - p)!p!
est une matrice SDr pour tout fJ > 0 [GAU 92].
De même un calcul simple donne:
1
SO~k = ~ b.1; ({nStl; b.J;{ln
O"l
[3.561
-
où St!.. = S()b/; 10=1 et:
~k(e)
k = l, ... P
=
Dans ce qui suit, nous allons donner une preuve du théorème 3.10. Preul'e. Posons eU) = :(1) - :(1), l'équation d'erreur prend la forme:
Avec la notation:
CI] e2
e=
.
[e
p
nous obtenons : e'1; = (Ak -
s{~: Cr Cf.: )
Maintenant, posons:
AkCO) =
Cf.:
+ cp/.:(u, ;) -
cpJ..Cu, :)
Observateurs de systèmes non linéaires
pour k = l, ... p où
a/,"
sont les entiers donnés dans J'hypothèse Hl, on obtient:
h 1
Ck A ;; (tJ)
113
(h étant la matrice identité de type lIk
x
nd
= (}n lk
n,.6..;1 an = Com;idérons le changement de variables: ë" De l'équation de Ck
ek,
8li~ (Ak -
pour k = l, .... p.
on déduit:
cTc,,) A;I(8)ëk + Ad8) (tpk(ll,:)
Ak(O) (Ak
=
= Ak (8)ek
Cl Ck ) ëk
+ Ade) (tpd u. ::) -
tpk{tt.
tpJ.{u,
:»)
:»)
Pour montrer la convergence exponenlielle de ë vers 0, nous allons ITlonlrer que la fonction quadratique ci~dessous est une fonction de Lyapunov de l'équation en ë. p
Posons V (ë)
L
Fdë;)Oll Vi(ëj) = ëTSliëi eLS
= dÎag (Sil, ... , Slp).
i=)
On a alors: \i" =
i[ Sl"ëk + ë[ Slk êk
= 20 8k ë[ Slk Clk
SJj/
cl' Ck) ëk + 2ë{ SlkAd{f) (tpd
li , :)
_eli~ (ë[Slk ih + ë[ Cr C"h) + 2ë{SlkAdO) (tpdu.:) Par conséquent :
+ 2ë[ SlkAd8) (tpdu. :) _t)iil \lk + 2I1sl"ëIlIlAk({) (tpd1i,:)
li" ::: -OC~q!k :::
où À~ax est la plus grande valeur propre de S!J,.
tpd1/.
z»)
- tp,.{Ii. :J) Il
tpdll.
:»)
(pdu. :::))
114
Systèmes non linéaires
Des inégalités ci-dessus, nous déduisons: J>
II/,.
\i" :::
_(j1)k
VI;
+ lPkJ À~mx;V; L
11/
LL
i=1 1=1 j=J
o SI,.
supflalP,u!û::(lI, :::)1;::: E R Il et III/liN::: A1} et Xi,j
Ol1 Pk
sinon, Xi.}
=
()q;ki
--(11, ;::) ê):'j
==
O.
1.
D'Ol! :
Oll
À:nin désigne la plus pelÎte valeur propre de Sil. Donc: ")
1Ii;
\i" :5 - ( JO,'iJ. F" ) - + '2P"I1S J06k \1"
P
11/
L L L Xi.Jerr}-rr{
-1)k/
2- 01/2 J Ht)[ \I,
Î=l '=1 j=1
À.max(S)!À.min(S) (c'est-à-dire le conditionnement de S).
OLllls
Maintenant, ulilisons l'hypothèse Hl ci-dessus, il existe un ,
(J. -
J
k
(J.
-
l
D"
-
'2
-
8, < '2-
-
f" > 0 tel que:
-El.
Des inégalités ci-dessus découle: lIk
"l
"" :5 - (
JO,)" \ll;)- + '2Pk/1 SJOOk \/" L
P
1/1
L L e-
q
, JO,'}!
i=1 1=1 j=J
")
:5 -
P
(JO/)k\lk)- +'2llkPkl1s o- Je i5 q/" L
1/1
E
1=1 j=1
où E
min{Ek; 1 ::: k :::
pl.
Je,'jl\l[
V,
,
Observateurs de systèmes non linéaires
115
p
Posons Vt=FJfJl; Vl: pour le = ] •... , pet \1* =
et'i m•n \l, où omax = max{8k: 1 ::s k
L vt. Notons que e
l )lIliU"
::s
V* ~
k=1
min{8k: 1 ::s k ~ p.
~ p, 8min
On a alors:
li"
~
Il
vt +
111
R L L [Vi ,sB R ~
2IlkPkI1 SO-
E
1=1 j=l
::s - \ft + '211 k Il Pk Il ::s - \1: + '2llkIlPkI1SO-E \1* -E
Donc:
\i ::: - V*
+ 211 1 Pfl_SO-f.. \/*
::: - (1 où p = max{pk. 1
'21l 1p /l,s(}-F)
::s k ~
\1.
pJ.
Finalement:
Maintenant, choisissons
OÙP,f}
eo tel que 1 -
'211 1 PI1SO(JE > 0, on obtient:
=
Il
3.6. Quelques exemples d'application de l'observateur grand gain 3.6.1. Exemple Dans l'exemple décrit au paragraphe 3.4.4, nous avons donné Je modèle d'une réaction A ~ B ~ C et nous avons traité le problème de l'estimation des concentrations A, B dans le cas où les ordres des réactions sont égaux à 1. Ici, nous traitons
116
Systèmes non linéaires
le cas d'une réaction A ~ Boil l'ordre de la réaction
Ci
est quelconque.
Î'= UA (1'-T-)+ Q(Ti- T )- b.l-ll pile
. T-= j
p-V-C.1
v
.1
UA J
pC
D (T-T'}+-(Tï-T') v-.1
.1
.1
.1
.1
+Q (CIO 1 \1
èl
= _kOle-E\/(RT'e fi
è~
= k01C-EI/(RTlCf
[3.57]
CI)
Q
v
Comme ci-dessus, nous disposons des mesures de T et de d'alimentation et de soutirage.
T.i et des différents débits
Le système [3.57] est manifestement inobservable, car la concentration n'influe pas sur les températures T et Tj. Comme dans la section 3.2, r estimation de CI utilisera le modèle réduit suivant:
[3.58]
(-.tt), -X2
,2= 1.
"
Q -1'.. \1 r T·.1
1) /' (a0Il) /' (0)
(.0
,,3=
1,1I=
-,4=
l/l]
li2 113
(lq
Q
•
V CIO Appliquons le changement de variables du lhéorème 3.8. On obtient: .:: 1 T = = LIlII{x)J = -trlIXI - allx1,e-E,/(RT). Le système [3.58] se met sous la forme canonique [3.35]. Par conséquent, un observateur du système [3.58] prend la f0n11e :
lI(x) = XI, :::2
~
.t
~ =./' (.Y)
.:J
~ ~ + !---'u;g;(.\)
•
( d ClJ (J~))
ax
1
S-l C "! () CT (.\]
y)
1=1
où:
q) =
(~~) =
(aiisi -
a;:~r2e-EI/RT), Si;
1
G~)
(voir la remarque du paragraphe 3.5.2.2 et l'observateur [3.47]).
[3.59]
Observateurs de systèmes non linéaires
117
358 356
354 0
50
100
150 100 150 300 350 400 450 SOO Temps (min)
Figure 3.5.
Tempéraflire ml!.mréL' daus hl double L'I1I'e1oppe
3.6.2. Résultais de simulatioll Nous avons sÎmulé le système el l'observateur donnés par les équations 13.58J et [3.59], en utilisant les conditions initiales, les entrées et les paramètres suÎvants :
x(O) Q
V
T;
Tji
CIO
e~8),
{8.6 x 10-
.\'0) ( 3 / :::
=
e65 )
l'
K
= CO)
lOf)
5 x 10- 2 100 < 1 :s 500 {393/ < 100 343 100 < 1
~
{3721 < 100 325 100 < [
500
:s 500
{lOO/ <
100 150 100 < f
:s 500
0,002, U = 2 160 kJ /JI , /cOl 93,6 1/13 11/0/- 1J,-I, 1 El = 31 A kJ 1110/- , 111-1) = -87,4 IlJ mo/-l, D 1.4 x IO-..t 1I/31J-I, Les figures 3.5,3.6 et 3.7 montrenlla convergence de l'observateur en présence d'un bruit additif de 5 % sur les mesures.
(J
=
118
Systèmes non linéaires 370~----------------------------------~ - - - T mesurée - - - - -» T estimée
365 '
52
~ 360
.a Q
'& 355 E
t=
350 345+---~--~--~-.---.---.---.---r---r--~
o
50
100
J 50
200 250 300 350 400 450 500 Temps (min)
Figure 3.6. TCl/lpéralllrc dll systèmc el
SOli
estimée
40 ,....,
35
.§ 30
l
25
c
.2 20 ';::î
.t: 15
= = 10 u C)
u 0
- - - Xréelle X estimée
5
0
a
50
100
150 200 250 300 350 400 450 500 Temps (min)
Figure 3.7. CVI1ce1llratiol1 CI dll systhlll' ef SOli eslimée
3.6.3. Exemple du bioréacteu,. Ici, la bioréaction fait intervenir trois types de variables: - la biomasse: généralement ce sont des micro-organismes ou des cellules vivantes, - le substrat: c'esll'alimentation nécessaire au maintient et à la croissance de la biomasse, - les produits: acides, enzimes, etc., qui sont produits par la biomasse.
Considérons le cas élémentaire d'une bioréaclion comportant une biomasse, un produit et un substrat. Notons par X (1), S (t) et P (t) les concentrations (par exemple en
Observateurs de systèmes non linéaires
119
g II) de la biomasse, du substrat et du produit dans un fermenteur supposé parfaitement mélangé. Le bilan de matière en batch (aucune alimentation ni soutirage de matières) est donné par:
g
1)
[3.60]
Y1 r '].
-y[r] f2
Les ri sont les vitesses de croissance et les Yi sont les coefficients de rendement. Les lois mathématiques modélisant les ri sont en génér:JI des fonctions non linéaires des vmiables X, Set P. On peut citer la loi de Monod, la loi de Contois, etc. [BAl 86"1. Maintenant, considérons le cas d'un bioréactcur continu. Supposons qu'il est alimenté en substrat avec un débit d'entrée Fi' et une concentralion Se. Notons par F.I' le débit volumique de soutirage. Le bilan de matière est donné par: d(\1 X) = lI! d(V S) = dt d(V S)
r[ _
r1, -
l~rX fl·p
[3.61]
dl
d(V) dt \1 étant le volume du mélange dans le réacteur. On appelle faux de dill/fiol/ les rapport Fel V et Pd v.
Dans ce qui suit nous supposOm\ que Fc (c'est-à-dire que le volume V est constant en régime permanent), Notons par D le (aux de dilution Fel V = I~d V, on obtient: 1'1-
DX
.\'11'] - y:~r1
"2-
+ D(Se -
S)
[3.61J
DP
Généralement, les vitesses de croissance sont de la forme: rI = /l.X et r-:. = l'X. Il sont appelées vitesses de croissance spécifiques. Leurs expressions sont des fonctions non linéaires de X, S et P.
Il et
120
Systèmes non linéaires
Dans ce qui suit, nous considérons une bioréaction S - : X. le modèle [3.62] devient:
X = r) - DX { S -YUi + D(Sl'
[3.63J S)
La vitesse de croissance est donnée paf: rI ( 1-'
= IJX [3.64]
tlmllxS = ---KsX + S
où jJ max est la vitesse spéci fique maximum de croissance et K.I' est une constante de saturation.
', l
Nous supposons que le substrat est mesuré enligne et nous donnons un observateur à grand gain permettant d'estÎmer la biomasse. En posant x) = S et X2 = X, et en reportant l'expression de rI. Le modèle [3.63J prend la forme: ·\:1 -
.
x2
y
+ D(S·III
IJmaxYPi Xl
KsX2 I1ll1ax X )
= Ks.'cJ. +
XI
D
?
-
. )
·\1
[3.65]
Xl
x)
Xl
Appliquons le changement de variables donné par le théorème 3.8 :
c!)(x)
=
CP (()) l,,' (
=
(
x)
l3.66]
IJ nmx )'IX,X2
-
1/
l\.sX2
+
x)
Un simple calcul montre que le système [3.651 se met sous la forme canonique [3.35]. Utilisons la remarque du paragraphe 3.5.1.1, l'observateur du système f3.65J prend alors la forme:
1
(1fJ) . f}2
(x
y) [3.67]
Observateurs de systèmes non linéaires
0,1
0,09
:2 0.08 20.07 ::: OJ)(i
.g
~ 0,05
"0
~
0,04
~ 0,03
~ 0,02 0,01 0
~ .... g :r-
.r::. :::
-.r.
.g :::
'e i.::
ë
u
::: 0
u
0
t;,[)
10
10 15 Temps (h)
0.05 0.045 0,04 0,035 0,03 0,025 0,020,015 0,01 0,0,5
25 XI r~~lIc
XI
e~ljmée
n 0
t:::
5
5
10
10 15 Temps (h)
25
0,08
~ 0.075 :ru
~.
0.07
'ë 0,065 <':l co 0.06 Cs
0.055 . (1.05 C u 0,045 "'0 0,04 .9 0.035 ~ C 0,03 11.)
é
.~
u t::: 0
U
°
- - X2réclle - - - - - - X2. estimée
5
Figure 3.8. Tm/.\" de dill/fioll,
10 15 Temps (h) (,o/lCl'llfrafitm dl' suhs/rat Cf de cn ./"ol1ctiol1 dl/ temps
10
15
l/Iicro-(J/~~mli.l'lII(,s
121
122
Systèmes nOI1 linéaires
3.6.4. Résultats Ile ,.,ùmilatioll
La simulation a été menée avec les valeurs suivantes des paramètres el des com0.8 1l~1, K,\' = [, YI 1.4. Sil! 0.1 kg,! l, (-) = 2,0, mandes l.llllax x) (0) = 0,04 kgf l, .\'1(0) 0.045 kgf /, .f l (0) 0.045 kgf l, -\-:2(0) 0.03 kg/let: 8 x 10-1 11
=
t <
10 Il
:2 x 10- 1 10" < 1 S 20 Il
f
8
X
10- 1 20 It <
1
Le résultat de simulation est i1lustré sur la figure 3.8. 3.7. Bibliographie [BAI 86J B.I\ILEY J.. OLUS D., Biodu;JJJicaf E'l1gÎnccrillg Fwu/wl/(:!J!lals, McGnlw-Hill. New York. dcuxième édition, 1986.
Observer sysnlhesÎs l'or a class of nonlinear control syslems ». Europeall Journaf (!l Con/ml. vol. 2. p. 176-192. 1996.
fBES 96aJ BESANÇON G., BOHNAJm G .. HAlvltl/JOURI H .. "
G .. HAMtvlOURI H., « On uniform observmion of non uniformly obserSys/ems olld Ccm/ro/ Ll'flers. vol. 29. p. 9-19, 1996.
rBES 96b] BESANÇON
vable systems
n.
[BES 981 BESANÇON G .. I-IAMMOURI H..
«
On observer design
rOI'
intcrconnccled systcms ".
'/. {!lMlIIl!ewatica! Systems. Estimafiol1 aI/(l Cmllm/. vol. 8, 1998.
[BOR 881 BORNARD G.. CELLE F., COUENNE N., " Rcgularly Persistent Observers for Bmncar Systems n, Proccedillgs (~r /he 29/ 11 IlIferJw/;mw/ CO/!lercm'[' on Non!il/ear Systems. Nell' Trends il1 Nonfinca/" System.\' 1ïlCory. vol. 122, Lecture NDles in Control and Information Scicnces. Splillger Vcrlag. juin 1988. lBOR 911 BORNARD G., I-IAMlvIOUR! 1-1.. « A hîgh gain observer for il class of uniformly observable syslems )"', Pmceedings (~f't"c CO/{feJ"/!1Icc 011 DecisÎon mul COllIml, Brighton. GrandeBreLagne vol. 3, p. 1494-1496. 1991. [BOR 011 BORNARD G .. BUSAWON K.. 1-IAMMOlll<1 1-1.. Ali Obsen'crfor a C1as,\' Systems, LAGEP, 2001.
(~rN(m!ill['ar
ICEL 89J CELLE E, GAUTIIIER J.-P., KAZAKOS D.. SALLET G., ,< Synlhcsîs of nonlinear obscrvers: a harmonÎc-analysîs approach », Mallll'1110fica! Syste1lls Theory. vol. 22, p. 291-322. 1989. IDEZ 91] DEZA P.. GAUTHIER lP.. « Nonlinear observer for distillation columns );. Pmceedings (d'JIu' 30 th CDe IEEE. Brighton, Grande-Bretagne. 199 L
lDEZ 92a1 DEZA F., BUSVELLE E., GAUTHIER J.-P.. RAKOTOPARA D .. « High gain estimation for nonlincar sysLems ». Systellls lInd CO/lfrol Letfers. vol. 18. 11°4, p. 295-299, 1992. IDEZ 92b] DEZA E, BUSVELLEE.. GAUTIIIER J.,.~ Exponenlially cOl1verging observers fordÎstillatÎon columns and llllcrmtl sLability orthe dynmllÎc outpUl feedback ", Chemicaf Enginccrillg Scie/ICi', vol. 47, n° 15-16, p. 3935-3941, 1992,
123
Observateurs dc systèmcs non linéaircs
[KAL 61] KAL!vIAN R .. Bucy R .. « New results in linear nllering and prediction lhcnry Basic Engilleerillg, p. 95-108, mars 1961.
~1 •
./.
of
[FAR 97J FARZA G.. HArvlt\10uRI H., OTWvlAN S .. BUSAWON K .. « NOlllinearobscrvers for paratnclcr cstimation in bioproœsses ". CltL'lIIic{/1 Etlgilll'Cring Sciences. vol. 51. n° 23. p. 42514267,1997. lFAR 9RJ FARZA G., BUSAWON K .. HAMlvlOURI H.. « Simple nonlinear observers for on-line cstimation of kinctic rates in biorcnclors n. AmolIIofica. vo\. 34. n" 3. p. 301-318. 1998. lFAR (J1J FARZA H.G., BUSAWON K .. High Gain Ob.l'c/'I'C/' !J{Jsed S/rlIC/III'l'. LAGEP. 1001.
01/
UI/{f'orl/l Obserm!Jilily
lGAU SIJ GAUTI-IIET{ J.P.• BORNARD G .• « ObservabilÎly for any u(L) of a c1ass of nOlllinear syslcms )'. IEEE Tnm.\·oc/ion 01/ ;\II/o/lw/ic Con/ml. vol. 26. n 4. p. 922-926. 1981. D
[GAU 881 GAUTIIIER .T.-P.. IC\ZM;:OS 0 .. « Observabililé cl Obscrvatcurs de Systèmes Non Linéaires n, AP11, vol. 11. p. 101-212. 1988. lGAU 92J GAUTHIER J.P.. HAlvllvlOURI H .. OTI-l!vIAN S., « A Simple observer for nonlînear systems - application ta a biorcactor n, fEEE Tral/.mc/iOlI Otl AlltOIl/(//ÎC Control. vol. 37. nn 6. p. 875-880. 1992. [GAU 94] GAUll-IIER J.P., KUPKA I.. « Observability and obsen'ers for l10nlinear systcms ". S!AM JOllrnal (?f' Cm/roI alld Op/Îltli-:.a/iolJ. vol. 32, n" 4. p. 975-994. 1994. rGm 941 GmoN-FAIWEOT A.M., HAivlt.'iOUrU I-L CELLE P.. « Nonlinear obscrvers for chcmical rcactors )1, Chelllical EngincerÎng Sciencc.\'. vol. 49, n° 14. p. 1187-1300. 1994. [HAM SRI f-1AtvIMOURI ,,1.. GALITI-IlER .I.-P.. « Bilincarization up to outpul inje clion &: COlllrol Lctters, vol. 1 1, p. 139- 149, 1988.
».
SyS/l'III.\'
lHAM 91 J HA!vU...IOURI H., MORALES lO.L., ,( Topnlogical properlies of obscr"ers inputs Progress ill Sysfems al/d COl/trol. vol. 8, 1991.
».
[HAM 91J HArvHvIOuRI H.. GAUTHIER J.-P.. « Global lime-varying linearization up la outpUl inje clion ». Sia11/ .loI/rI/aI on COll/roI (//ul Opfil/l;:(/[ioll. vol. 30. n" 6. p. 1295-1310. novembre 1991. rHAM 96] HM,H...l0UHI H., KINNf\ERT M.. « A nc\V proccdure l'or limc-varyillg lincarization up lo outpul injection n. Systcl/1.\' &: COlIIml LCllcrs, vol. 18, p. 151 -157, 1996. [HAM 01] HArvlMouRI H., TARGUI 8., ARlvlANET F., « High gain observer based on a triangulaI' structure n. Intcl'J/a/iOlwl.lol/l'IIl1l f?f'Ro/)//Sf al/d NOl/iiI/coI' CO/1trol, 2001. [BER 77] HERMANN R., KRENER A., Trllll.I'tIC/ÎOll 011 AI//oma/ie Confrol.
Non linear conlrollability and observabilily». IEEE vol. 22. n" 5. p. 728-74-0, octobre 1977.
«
rTST 851 TSIDORI A.. NonlillcL//' ('on/roI systC1J/.\': AI/ illtrodllciol/. vol. 72. Springer, Berlin, 1985. [ISI 891 ISIDORI A.. Nonlilleor COll/roI SyS/l'tlts. dcuxièmc édition, Springcr Yerlag, 1989.
[JAM 88l JAl\'IES M., BARi\S J ..
«
An obscrvcr design for nonlincar conlrol syslems ". Lce/llrt'
Notcs in COll/roI al/d b!/OI'l1/{/f;OI/ Sciel/cc.\', AnalY.I'is and OptÎllli::,a/ioll (!f' Systems, p. 170-
180. 1988.
[KAI 80J KAILATI-I T.. Lincar Systelll.\', PrenLice-Hall, 1980.
124
Systèmes
11011
linéaires
[KRE 831 KRENER A.. ISlDoru A.. « LinearÎzatÎoll by output injecLion and nonlincar observers ~), Sys/. and Control LeI/crs. vol. 3. p. 47-52. 1983. [KRE 851 KRENER A .. RESPONDEK \V.. H Nonlil1car observcrs wi th lincal izahlc error dynamics )'. SIAM .1. COlltrol. Optill1., vol. 23. p. 197-216. 1985.
lLUE 661
D .. '( Observcrs for l11ultîvariahlc systems >', IEEE 1 L na 2. p. 190-197,1966.
LUENBERGER
Tnlll.mctjol1J 011
AlIlolI/ntÎe Control. vol.
[MOR 92J MORALES J.D.L.. ConstructÎon des observateurs pour les systèmes applicalions aux procédés, Thèse. UnÎversité Claude Bernard. Lyon, 1992.
[NIC 89J
11011
linéaires Cl
NICOSIA S .. TORNAMBEA., High gain observers in the slatc and parametercstimatioll of robots having clasLÎc joints )'. Systems mu! Con/roI LC[fers. va\. 13. n" 4. p. 33 1-338. 1989. t{
[NU 90] NUl\IEI1En H.. DER Verlilg. Bcrlin, 1990.
SCHAH
A.V.. NOt1lillcar DYII{/IJ/Ît'ü! CO/llrol
.s~\'stCJl1S.
Springcr
[SON 79) SONTAG E., « On the observahility ofpolynol11înl systcms, 1: finite-limc problcms ". Sinm .Io//J1w! COHlrol wul OptÎIII;:;([tiol1. vol. 17. n D 1. p. 139-151. 1979. SUSSMAN H .. Single-input observabilily ofcominuOlls-t.ime syslcms ». Mnlll. Syst('/II TIll'ory, vol. 12. p. 371-393. 1979.
lSUS 791
l(
(TAR 001 TARGUI B.. Modélisation ct observation des colonnes 1\ distiller. Thèse. Université Claude Bemnrd Lyon l, LAGEP, 2000. [THA 73J TIIAU E,
« Obscrving the slale vol. 17. p. 471-479,1973.
or Ilonlincar dynal11ics systcms n.
lm . .1. COlltm!,
ITS189] TSJNIAS .1 •• '( Observer design for nonlinear syslems ", Sy.Hl!IIIS ([m! COli/roi Leltcrs. vol. 13. p. 135-1-42, 1989.
IWAL 87] \VALCOTT B.. ZAKS .. « Stale observation ofllonlinearunccrlaÎIl dynamica1 systcms'·' IEEE TrOllS. 1\//1. Collt .• vol. 31. p. 166-170. ]987. [\VIL 77] WILLlMdSON D., " Ohservability of bilinear systems. with application ta biologieal
control
H.
A/llolllatÎca. vol. 31, p. 143-154. 1977.
[WON RSJ WONHAM W.M., Lillcar MllIIÎI'ar;ub!c Systems. A geomcl/'Îc approacll. Springcr Ycrlag. New York. 1985.
[XIA H9 J
XIA
X .. GAO \V... , Nonlinear observer design by observer erraI' linearization". SlAM
./. COlltmlll/u! Opt., vol. 17, p. 199-216.1989.
Chapitre 4
Observation et observateurs-contrôleurs par lTIodes glissallts
Ces demières années. la synthèse des observateurs non linéaires il focalisé l'attention de plusieurs chercheurs. On peut citer les contributions majeures de G. Bomard et H. Hammori [BOR 91] el D. G. Luenberger [LUE 71]. Ceci est dû, d'une part. au grand succès qu'a connu la commande non linéaÎre et, d'autre pan. au rait que plusieurs systèmes non linéaires possèdent des états non mesurables qui ne peuvent être utilisés dans la loi de commande. Le principal obstacle auquel se heurte la synthèse des observateurs non linéaires est la violal1on du principe de séparation dans la majeure panic des cas, ce qui complique la construction des observateurs en présence de la commande. A cel obstacle vient se greffer une autre diflkullé, celle de la démonstration de convergence de l'erreur d'observation qui est une solution d'une équation différentielle 110n linéaire. Parmi les observateurs qui existent dans la littérature se Lrouvent les observateurs glissants. Ces observateurs présentent plusieurs avantages, comme celuÎ de la convergence en temps fini el de la robustesse. Ces observateurs n'utilisent pas la structure du système. ce qui permet de contourner la violation du principe de séparation dans le cas des systèmes non linéaires. Le second thème abonlé est l'obtention d'observateurs contrôleurs par modes glissants LEME 67, FIL 60, UTK 8 J]. Cette méthode consiste à calculer une commande discontinue qui force Je système [1 osciHer aUlour d'une surface quelconque appelée surface de glissement dans l'espace d'étaL Celte commande est calculée en imposant ü la surface d'être aUractive.
Chapitre rédigé par "nu'ck AWvIED-Au et Nîcolas SEllBE,
126
Systèmes non linéaires
4.1. Observateurs glissants monosurfaces Cette classe d'observateurs 11 été proposée par J.J. Slotine [SLO 91 J. Elle utilise une seule surface de glissement qui est la première composante de l'erreur d'observation. Elle s'applique à la classe des syst.èmes suivants:
[4.11
y
[4.2]
=XJ
où x E RII, al ,!JI sont des vecteurs de coefficients constants et mande. L'observateur proposé se définit comme suit: XJ
+ K, sign(.r)
=
li
représente la com-
X))
[4.3]
Considérons les équations [4.1] et [4.3], on obtient alors l'elTeur d'observation sous la forme:
l4.4]
l'TI
t/ (.\- -
x) -
Kn sign(eJ).
PROPOSITION 4.1.- POlir toules les conditiolls initiales .l'o E N/I. on peut trouver des COllstalltes positil'es kil i l , .... Il telles que l'erreur eJ converge l'ers ::.éro en temps filli et le.'i erreurs t'i. i 2 ..... Il cOl/l'ergellf exponentiellement l'ers zéro.
Preltl'e. Afin d'étudier la slabilité du système d'erreur, commençons d'abord par la première équalion : el
= e2
-
K,sign(eJ).
Observation par modes glissants
127
On peut dire d'après la théorie d'Utkin [UTK 81] que si K 1 > lell, il existe alors un temps fini II LeI que VI > fI, un régime glissant apparaît sur la surface C1, ce qui O. On en déduit que: veut dire que él = e)
Ceci permet d'écrire que:
[4.5J
•
e 11
= li t (e) -
Kil -e..,. KI -
Il est facile de voir que, pour assurer lu stabilité exponentielle, il suffit de fixer KI pour garantir le régime glissant et de choisir les gains K2 . ... , Ku pOlir satisfaire les conditions de Hurwitz. Notons que la condition K2, > 1e21max signifie que r observateur n'esl défini que SUI' une partÎe de l'espace d'état. Il REMARQUE.- Le terme Sigll/!ij (e) représente la commande équivalenle qlli l'sr/a sortie
duJUlre
r: + z = sigJ1(e) lIvec T tendant vers :.éro /UTK 81 /.
4.2. Observateurs glissants multisurfaces Drakunov et Utkin [DRA 95] ont proposé un observateur qui utilise autant de surfaces que d'états. Cel observateur a été conçu sur la classe de systèmes stables suivante:
[4.6J y
=XI
OÙX E RU, On suppose que la sortie mesurable estx1! I(x. Il) est une fonction Lipschitz el que toutes les trajectoires du système appartiennent à une boule de rayon p donnée.
] 28
Systèmes non linêaircs
Considérons que.~ est l'estimée du vecteur d'état [4.61. L'observateur s'écrira de la manière suivante:
(4.7] avec:
v, = Iq sign(xl -
k i sign(=:i -.Yi)
Vi =
TiZ;
.\/)
+ Z'.i
=
1'i-]
pour i
= 2.3, ... ,11
:
Considérons les systèmes [4.6J et [4.71, le système d'erreur s'écrira :
el =x( è, =
x::!
-.~I
[4.8]
k. sign(e. )
[4.9] èi=Xi+I-Vi
èn
= ffx, Il) -
pOllri=2.3, ... ,n
(4.IOJ VI/'
4.2.- Pour tOllles les conditions Înitiah's .lo E RI!, 011 pelll troUI'er des COIlS/OllleS posi/ives k;, i = 1••••• Il .\'l~/lisallIlllel1l gmlldes el des cOlls/mUes posi/Îl'es Ti, i 2•.... Il sldlisa1Jl11lel11 petites telles qlle les erreurs d'observotion ei. i = PROPOSITION
l, .... Il cOlII'ergent l'ers ::.éro
l'Il
1l'lIIps./ini.
Preuve. Première étape Considérons la fonction de Lyaputlov sllivallle :
En utilisant (4.)\]. sa derivée totale par rapport au temps s'écrit: \' 1
= e1 è l = el (.\'2 - vr)
e1 Cr::!. -/qsign(e())
e]X2 -
k.
le, 1
Observation par modes gl issants
129
ce qui implique que: \iJ
:s lelllx::dmax -
kJ Icll .
Par ailleurs en choisissant kl tel que:
kl > Ix::,lmax.
,il sera définie négative. Ce qui veut dire qu' un phénomène de glissement apparaîtra en temps fini JI rSLO 91] sur la surface de glissement CI = O. Notons que poul'satisfaire la condition kl I-"llmax pour les systèmes stnbles. il suffit de choisir kl > p. En régime glissant, cette surface vérifiera la propriété d'invariance qui se traduit par:
Etape i pour i
=
2, 3 .....
1/
Considérons la fonction de Lyapunov suivante: \ 1i
1). ').( i
+ \1;- J.
Sa dérivée totale par rapport au temps s'écrit:
pout 1 > fi-l. Considérons Ti suffisamment petit, Utkin démontré que :::i = Xi si bien que:
el
Drakullov [DRA 95J ont
[4.111 Réécrivons maintenant l' équation [4.11 J de la façon suivante: \i;
::s lei Ilxi+llmax -
ki ICi 1.
En choisissant ki tel que:
\il sera définie négative et un phénomène de glissement apparaîtra il un temps fini sur la surface de glissement définie de la manière suivanle:
fi > 1i-1
('i=O;
ki>lxi+lllIl
130
Syslèmes non linéaires
D'autre part, en utilisant le principe d'invariance des modes glissants [SLO 91],
r erreur d'observation ei et sa dérivée par rapport au temps vérifient: ej(1) = èiÜ)
= 0,
VI?::
fi,
ce qui veut dire que l'on pelIt trouver un temps fini
VI
~
li
1;; (~ : 0 :
fi
el une com:lante k i tels que:
[4.11]
Etape n Considérons la fonction de Lyapunov suivante: \1Il -- le:? 2 Il
+ VIl-J·
En utilisant [4.12]. sa dérivée sera :
En tenant compte de [4.10] el pour l'" sufflsammelll petit on peut dire que :':11 = ce qui veut dire que:
XII'
\i" ::: ell (f(x, u) - VII) ::: ell/(x) - ell (k Ii S;gl1 (e ll ))
\iJl :::
14.13]
lelll O/(x, u)l- kil!}'
D'autre pu n, en choisissant kil lei que:
kil >
,i"
1/(:, il)1
sel~a définie négative et un phénomène de glissement apparaît en un temps fini
III > 1,,_1 [SLO 91], ce qui veut dire que: Cil
= O~
kil > 1/(:,11)1
En utilisant le principe d'invariance lSLO 91 J. "eneur d'observation et sa dérivée l'II : l'l/(1)
= ê/l(t)
0,
VI?:: fil'
ce qui veul dire que:
[4.J4]
Il
Observation par modes glissants
131
4.3. Observateur glissant et commande robuste Nous allons présenter maintenant la combinaison d'un observateur gl issant cl d' une commande robuste par modes glissants. Nous considérons une classe de systèmes triangulaires perturbés et nous supposons que tous les étals du système sont inaccessibles il lu mesure, sauf la sonie qui est supposée mesurubJe, Pius précisément: .\'1
X2+gl(Xj)+8,(x,f)
.\"2
X3
'\-11
f(x)
y
+ g2(XI, X2) + D2(X. t)
+ g(x)u + 8//(x, 1)
XI
.r,
oll g, gi. i l , .... Il - 1 sont des fonctions C= el où 8i sont des perturbations. On suppose que cette classe de systèmes vérifie les hypothèses suivantes: J) Soit i E 2, .. ,. 11 - 1. 11 existe un ensemble ri c Ri et une constante strictement positive )..~ telle que Igdx" X2 • ...• Xi) - gj{YI, .\'2· ... , Yi)1 .:s )..~ lI(x) - YI, Xl )'2,···, Xi - Yi)ll, pour tout (xl, X}, ...• Xi. YI, .\'2, ...• Yi) E 0/ x Qi. Dans la suite, on note Q l'ensemble n = n~'==-i (ni x RII-i). 2) \Ix E Q, "If
f3
?: O. les incertitudes fh,; = l, ... , n sont bornées par une constante
> 0 connue.
3) 11 existe
).0
Ilf(x)
> 0 et YI > 0 tels que:
f(.l-)+{g(x)-g(.\')IlCr·t)11
::SÀo+)'lll x ·\-11
où .f(t) dénote l'estimée de x. 4.3.1. Sy1lthèsc dc ['obscrJ'atclIr glissant
Introduisons maintenant l'observateur suivant: .\-1 .\-2
Xi
+ gl (XI) - kl sign(i l - Xl) + g2(.rl, .h) - k]signCtl - XI) .\:i+1
+ gi (.fl, ...
1
.fil - k;sign(.\-I - .\))
[4.15]
132
Systèmes non linéaires
Afin d'obtenir le8 conditions de convergence de cet observateur, écrivons d'abord les équations de la dynamique de l'erreur d'observation. Soit l' = x - .r, on obtient alor8 :
La première étape est d'assurer que .\-1 - XI la fonction de Lyapunov suivante: 1
0, 'VI > O. Pour cela, considérons
1
;-eï· Alors: \i)
0) (x. 1)
el (el -
klsign{el))
On en déduit que:
\11
:s kil (!ell + 18) (x. 1)1 -
kd
ou encore:
\i 1 ~ 1e 1 1 (1 e21
+ f3
k 1)
Ainsi, si on choisit k) > f3 alors, d'après les résultats de Filippov [FIL 60], il existe 1e21 < kl - 13. Si on choisiL\, (0) = .\'1 (0). un régime glissant dans la région el = 0; on obtiendra è 1 e) 0, pour tout 1 ::::: 0 et : [sign(l'I) Jeq Oll
[sign(el) Jeq est la valcur équivalente au sign(e, ) quand J'crreur
el
nulle. Sous cette condition, on aura donc:
êl
=0
• e, -
/;, = --"-e1 kl -
Ci
+
(!"J
.~
. .. x, ") + .'>01(XI '- -
.
o')(XI .'>_.'
x,- ) -
c ( x. _.
0')
/.:'1 \' ( X t ) t ) - -"-UI kl '
est quasiment
Observation par modes glissantl->
133
ou bien:
-82(X, r)
+ fCr) - I(x)
+ 19(.Y)
1 0
0
o
0
g(x)lu
-811 (x. t) - ~8dx, t)
où:
A=
o
0
1
000
Dans ce qui suit, choisissons les gains k;. i = 2, .... 11 reis que le polynôme:
soit un polynôme de HurwÎlz. Dans ce cas, A sera une matrice stable et donc il existera une matrice symétriqlle définÎe positive P (elle qlle PA + AT P -1. Afin cl' obtenir les conditions de stabilité du système d'e11'eur, considérons la fonction de Lyapuilov \f = Pë. La dérivée de " s'écrit alors:
-
8It-l - ---rI k 18 1 - ~{SJ ll -
KI
II
134
Systèmes non linéaires
Ceci implique que:
+
(
-
~81
-(:)1 -
kl
o
k 81 /:l
11~1 -
-
811-
ll -
1
k" S1 Iï€
ll
où ÂIl1 :l X P dénote la plus grande valeur propre de P. Soit Jl- = max(Â2, ... , ÂII_I, YI), alors:
En choisissant une valeur 0 <
(1
< 1 elles gains k;, i = 2, ... , Il, lels que:
1 - 2Jn=l/LÂ mflx P - a :::: 0
alors, li :::
-(1
lIëll 2 quand lIëll ::: ~ avec:
2Âmax P (ÂO
+ Jï7=1 (1 + _m_ak_~_(k_i\8 )
~=----------==--------------1 - 2Jï7=1,û. max P - Cl
A partir des arguments de Khl.1liJ [KHA 92], on en déduit que ë converge vers une boule:
lIêll
Ainsi pour fOut ~* > ~'ll!lI'JJ:~. il exisle un temps fini T (el que, pour tout t > T, "1Il1l1 < 1;*. Par ai1Jeurs, on peut déduire de Khalil [KHA 92] l'inégalité suivante:
lIëll ::::
Observation par modes glissanLs
135
pour tout t ::: O. Les conditions initiales doivent être choisies de telle façon que: À1lla~P
Àmin P
lIe(O) Il ::s 2r(Q)
[4.16]
où r(Q) est Je rayon de la plus grande boule contenue dans Q. En résumé. nous proposons le théorème suivant.
Supposons que les trois llypo1l1èses ou-dessus sonl SlIli!!.fllites el choÎsissmlS le gain k 1 > fi el les gains Ici. i = 2 ....• 11 de telle façoll que /4.16) soil sOli,~ro;te. Alm:'î. il existe lilI régi/1le glissallt slIr IL, domaine (!l:/ini par:
THÉORÈME 4.1.-
Unefois ce régime établi, l'erreur ê(J) C011l'erge l'ers la bOille:
lIeli
< ~*.
pour !OUT
>
À 111I1 .'\
P~
Àmin P
-
oprès Wl1ell1ps.filli T.
4.3.2. Sylltllè,fle de la
clJ1JlI1lOllde
pa,. modes glissants
Pmu" construire un contrôleur qui garantisse la poursuite de tmjectoires, on introduit tout d'abord un changement de coordonnées, semblable à celui du backsteppillg mais contenant de nouvelles fonctions, appelées Vj dans la sUÎte. Ces fonctions, qui auront pour arguments les états de l'observateur, auront pour t,1che d'assurer que la surface de glissement introduite est bien bornée ainsi que les états du système. Nous allons voir que cette commande est composée de deux parties. La première est une partie continue qui n'est rien d'autre qu~un relnur d'élal, appelée cOl1ll1lal1de équÎI'alellte, et la deuxième partie est une fonction discontinue.
4.3.2.1. Changement de coordonnées el swillce de gHssemem Considérons le changement de coordonnées récursif suivant Oll )"r(t) représente une trD;jecloire de référence lisse, bornée et dont toutes les dérivées nièmes sont aussi bornées: ::1
= _fi - )'1'(t)
-. 1 -;:.. 1 ':.1+ "~I+
+ 'VI A.·(;:'I , ••• , -'l' i:. t) -~
.'"U)(/) r
- V'({:1 1"
, •••••\":."
1)
136
Systèmes
11011
linéaires
avec:
pour; = 2, ... , 11
-
1.
Considérons maÎntenanlla surhice :
cr
=
ZI/
+ 11I n -IZ II -1 + ... +1111:::1
al! 111 Î sont des coefficients librement choisis. Le système peut alors s' écrire dans les nouvelles coordonnées comme suit:
1/-1
1=
-'::11-2 -
C,,-I::T/-I + cr -
LJ1Ij;:j
+ W/l-I (e2 - 8j) +
VIl-1
i=1
/1-1
1/-1
+ LHli(-Zi-1
- Ci'::,.
+
'::i+1
+ vj} + (wu + LlHiwd(e2 - 8d
i=l
i=1
avec: J I\:i
kl
et :
(a·,J,
i-l ~ ,,,;-1 uVi-l -A- - - . . L...t x' X' j=l.l .1
Wi = - - - ' "
)
~
(Xj+1
. . . -kj
+ gj(J:I, ... , Xj))-/, II A
Observation par modes glissants
] 37
4.3.2.2. Synthèse dIl contrôleur
Pour calculer la commande robuste par modes glissants, considérons la fonction cie Lyapunov suivante: 1 11-1
1
")
W="L:::;+'i
- i=1
-
Alors:
11-1
11-1
+ L:ilJJi(e2 -
8))
+ LZiVi + a (f('~) + g(.i)1I y,~J/))
k=l
k=1
11-1
n-I
+ Lall1;(-Zi-1
Ci::';
+ ::i+1 + vj) + a(w + L II
11/; Wi )(e2 - Dl)
i=l
i=1
En supposant que g(x) f::. 0, pour tout x E n. construisons le contrôleur suivant qui est une combinaison entre celui obtenu par la méthode du type backsteppillg el celui obtenu par la méthode de la structure variable (ou modes glissants) : ".
li (x, t}
=
1 . ~ -,,-l-.f(x) g(x)
+ Yr(II) (t)
- (/)"
11-1
- LJn;(-:i-1
Ci::'i
+ ::'i+1 + Vi)
Î=I
- K (a
+ Wsigna) + vlIJ
[4.17]
Avec ce contrôleur, l'inéquation précédente devient:
11-1
1/-1
+L
ZïlJJi(e2 -
8d +
L
::'iVj -
K(a'!.
k=1
k=1
11-1
+a(w/l
+ LJ11iw;)(e2 ;=1
(1) +avn
+ HI laI)
138
Systèmes
110n
linéaires
Les fonctions Vi, i = l, ... , 11 étant encore [\ notre disposition, choisissons-les de telle manière que les états du système soÎent bornés ainsi que la surface de glissement. Soit '7 > 0 et:
= -
Vi
1] , :;Zi Uf;,
;
= 1•....
11 -
l
Alors:
.
11-1
H,! < _ -
L . --') + -
"',11-1 a
Ck-"k
- ~./l-I
k=1
Posons maintenant: a;
a,,_1
=
Ci -
= C -1 1l
Î=I .... n-2
-lIli
2 -
1/- 1
1
- '\'" ml. -
-
') L..,; - k=1
Î
-
1
K--'1 où les constanLes
Ci
sont choisies telles que ai > 0, i = l, ... , 11
-
1. Alors:
ou encore: •
W :S -2a min W
11
J
II..,
+ - 1/e211- + -fJIl
11
où amill = min{a; J. En utilisant Je théorème précédent, on peut écrire :
Cette inégalité montre aussi que HI. Zi, i = 1..... 11 - 1 et la surface a sont bornés. De plus. on en déduit qu'i1 existe un temps fini T' > T tel que: VE>
Izil<E
et
lal<E
Observlltion par modes glissants
pour Î = 1.... , Il boule:
139
1. En d'autres termes, le système converge en temps fini vers la
-
1:11
[: E RH
<
1:::11-11
E,'"
<
lai
E,
<
E)
Notons que, SOLIS les hypothèses du théorème précédent, nOLIs obtenons aussi:
:dt) =
I·rl (1) -
Yr(t)1 = ly(1)
-"rU)1 <
E,
VI > Tf
Calculons maintenant aa, nOLIs obtenons: n-J
1
-K(a +W lal)+a(w n
+ LIll; wi)(e1 i=1
Alors: ,,[;
_K,,2 -
KIVI" 1+ Il w" + ~ lIli Wi III" 1(!e21 + Pl
Une condilion suffisante d'existence d'un donnée par: K
IV > maxD, [II w,,(x. /) + ~
lIIi Ul i (x. 1)
glissant sur a = 0 est donc
Il w+ P)]
THÉORÈME 4.2.- Si l'obsenJateur (.:J. J5/ est synlhétÎsésolls les hypothèses dlllhéorème précédent et si III commlmde [4.17J es' appliquée ait système, alors il existe Wl temps .fini T' tel que l'erreur de poursuite de la trqjectoire YI' (r) vérifie:
Yr (1)1 <
Iy(l)
E,
VI > Tf.
De plus. si la condition sl!ffisal1/e [4.18J eSll'ér(fiée, alors il existe un régime glissant sur la smiace a = O.
4.3.3. Applicatio1l à 1111 robot ma1lipulateur Pour illustrer cette méthode. considérons un robot flexible à une seule articulation donlles équations d'états sont données par: {il
Cf],
q1
-MI sin ql - KI (ql
in
q4
- qJ)
140
Systèmes non linéaires
où q 1 représente l'angle du bras, CJ3 l'angle du moteur el8 (t) = 2 si Il t est la pertubation. La sortie mesurée que l'on doit contrôler est la position du moteur. Ce système peul se mettre facilement sous forme triangulaire, on obtient:
b,.rl -
• x.,
Il
+-J
J AI sm . (.\' = -)2 - 3) b"]. 1
y = .\) L" observateur proposé est donc de la forme:
.fl = .\-2 ;,
X2
.\3
=
k)sign(.t)
~
x[) ~
"
1./
x3 -
bp:] - b'2.q
+J -
x-l
k3sign(.\-1
X)
•
A
k2 s1 gn (XI
_
- x)
Notons que le terme IJ}. M sin (*) ne figure pas dans les équations car il a été considéré comme une perturbation. ëeci permet 11 j'observateur d'avoir une forme très simple. Introduisons maintenant les nouvelles vmiables ::: 1 et:2 comme dans la parUe précédente. Il vient alors:
:::[ = XI :2 = .\-1 -
Yr(t) .\'1'(1)
+ LïZI
-
VI
et posons VI = -11:). Après quelques calculs, le contrôleur construit dans la section précédente prend la forme suivante:
+ b).\:2 + h2.YI - y,~2)(t) + J1H.r] 5'1'(1) - C\-] - Yr{l»
lI(.r, 1) = ./f-.\-3 -
(C)
- (1
+ J] ( k'1 k~ + CP1
- K(a
)2 ("
X2 -
.l'rU)
+ (CJ + Jl)(XI~) - Yr(t»
+ Wsign(a»)J.
où la surface de glîssement a la forme a =
::2
+ lIT 1~2.
Observation par ITlodcs glissants
141
4.4. Uibliographie IAI'IM 981 AlI!vIED-ALI T, Contrôleurs-Observateurs lldaptatifs et robustes pour des systèmes non linéaires incertains, Thèse de doctoral. UnÎversÎlé de Paris-Sud. octobre 1998. lBOR 911 BORNARD G., HAMlvlOURI H., '( A higb gain observer l'or a clîlSS of unirormaly observuble syslcms n. Prol'. IEEE cne, p. 1494-1496, 1991. [DRA 95J DRAKUNOV S., VTKIN V, Confercl1cc
[EME 67J
011
«
Sliding modes ohservers. TuLorial )). Pmi'.
(~l3-tfh
IEEE
DecisÎolll1lul COIllrol, p. 3376-3378. 1995.
E~ŒL'YANOV
S.v.. VarÎable
S/1'1ICllIre
Cm!/ml Sy.\"U!I11S, Moscou. Nauka, 1967.
[FIL 601 FlLlPPOV A.P.. {( Application of the theory of the dirrercntial equi1tiolls wilh discontinuolls righl-hand sides 10 Ilonlîncar control problems », Proe. (~l J.I"I IPAC "'or/ri COlIgress.
p. 913-9::!5, 1960. [FLO 0 Il FLORET-PONTET F.. LA/viNA III II-LAGARRIGUE F., « Statc and Parnmeter Idenlilkation for nonlinear unccrtain systems using the Variable Structure TheOl'y ". Scll.'cred Pl/persflv1/! the Ihe NOIl/inear C011lrol NelH'ork (NCN) H~)rksllOl.1. Slœilield (UK), Sprînger Verlag.100 1. (FLO OlJ FLORET-PONTET P., LAMNABI-If-LAGATŒ1GUE E, NKWAWO H .. 1< Paramctcr identification for l10nlinear uncertain systems parLially measurahlc ". Proce{!dillgs (~lt"l' 5 th IFAC S)'wpo.liium NOIlIiI/(;'or Comml Sys/l.'JJ/s (NOLCOS'Ol), Snint-Pclershnurg.. RussÎe. 2001. lKHA 921 KIli\LlL H.K., NOl/tiJ/cor Sy.\'fC/IIs. MacMillan. 1992.
flUE 71] LUENDERGER D.G., " An introduction (0 obscr"ers )·.lEEE 7hlllsactùm,\' 0/1 AlllolI/atÎe COlltrol, 16, p. 596-602, 1971. lSLO 911
SLOTINE
J,J .. LI W. Applied lIOn/iI/car cOlllro/, Premiee Hall, 1991.
[VTK 8IJ UTKIN V.1.. p. 271-272.1981.
[UTK 91J
UTKIN
«
Plinciples
or identification using sIiding regimcs ", SOl~
PlTys. Dole/..
V1., S/iding modcs il/ cOHtrol optimÎ';.alioll, Springer Verlag. Berlin, 1992.
Chapitre 5 Sllf
les Inéthodes d'identificatioll des systèmes n011 linéaires en te1nps continu
5.1. Introduction L'identification de systèmes est fortement liée à la construction de modèles décrivant de manière mathématÎque les processus physiques. La principale valeur ajoutée apportée par l'étape d'identification se traduit par une meilleure connaissance du système. Ainsi, lorsque l'étape préliminaire relative ù l'identification du processus est réalisée, il est possible d'atteindre des objectifs classiques d'automatique comme l'observation de variables non accessibles directement à la mesure ou la commande de ces processus. A l'origine, l'identification en tant que telle est fortement liée aux méthodes statistiques, comme la méthode des moindres calTés récursifs ou du maximum de vraisemblance, très largement appliquées sur des processus industriels. Ces deux méthodes sont obtenues grâce à l'optimisation d'un critère dépendant des paramètres du système. Néanmoins, elles sont très souvent utilisées sur des processus discrétisés. Il est clair que décrire un système en temps discret présente un avantage en termes de calculs informatiques. Mais beaucoup de systèmes réels sont modélisés en temps contÎnu grâce aux principes classiques de la physique. De plus, les paramètres ont, la plupart du temps. une signification physique en temps continu. Les algorithmes que nous proposons ici sont donc à temps continu et peuvent être implémentés tels quels sur des processus réels en considérant la faible fréquence d'échantillonnage de la carte d'acquisition par rapport à la bande passante du système étudié ou discrétisés si nécessaire par les
ChapiLre rédîgé par Fabienne
FLORET-PONTET
eL Françoise
LAMNABHI-LAGARRIGUE.
144
Systèmes non linéaires
méthodes habituelles (voir les travaux de Hermann, Spurgeon et Edwards l HER 99] par exemple). Beaucoup de procédures d' idenlification ~l temps continu sonl élaborées pour des processus stables en boucle ouverte et pour lesquels tout l'état est accessible à la mesure (ce qui est Je cas pour les méthodes usuelles des moindres calTés et du maximum de vraisemblance). Des avancées récentes proposenl des méthodes d'identification pour des systèmes non linéaires où le vecteur d'étal est partiellement mesurable ou pOLIr des syslèmes où l'identification est impossible il réaliser il cause d'instabilité en boucle ouverte. Nous nOlis intéressons plus particulièrement ici ft l'identification des paramètres combinée à une commande car ce type d'identification répond à un plus grand besoin dans Je domaine industriel. Néanmoins, quelques publications sont indiquées et discutées dans la suite concernant l'identification et l'observation d'étals simultanées. En ce qui conceme l'identification des paramètres combinée à un observateur d'états, il s'agit d'un double problème. D'une part, il faut estimer les états qui ne sonl pas directement accessibles par la mesure et les restaurer l'ia un observateur. D'autre part, un identificateur des paramètres est nécessaire pour déterminer les valeurs des paramètres du système étudié. Ce double objectif' sous-entend bien sùr une va1idité simultanée des deux algorithmes d'estimation. On peul citer les travaux de Niethammer, Menold el AIlg6wer [N1E 0 J] sur ]' estimation paramétrique combinée avec une reconstruction des dérivées successives obtenues grâce à un observateur de type grand gain. On peut aussi citer le travail de Floret-Pontet et Lamnabhi-Lagarrigue [FLO 01 a] dans lequel un observateur reconstruit toutes les variables d'étal du système non linéaire à partir d'une seule variable mesurée. Cel observateur est élaboré grâce ft la théorie de la structure variable, plus communément appelée théorie des modes glissants. L'utilisation de la théorie des modes glissants assure une convergence en temps fi ni de l'observateur des états reconstruits. Quant fI la loi paramétrique qui converge elle aussi en temps fini, elle est obtenue grâce à des propriétés d'identifiabili1é utilisant des équations inhérentes au système. L'un des avantages de celle méthode est la propriété de robustesse de l'algorithme par rapport aux incertitudes paramétriques ainsi qu'aux bruits de mesure. Ces deux propriétés, liées à l'utilisation des modes glissants, peuvent s'avérer très utiles lors de l'implémentalioll sur banc d'essais. Dans les travaux proposés par les mêmes auteurs [FLO 01 h, FLO 02], l'estimation des états du système est traitée simultanément avec l' ide11lification paramétrique. D'une munière générale, il s'agit de généraliser aux systèmes non linéaires le travail déjà effectué pur Utkin [UTK 81] sur l'identification paramétrique des systèmes linéaires. Pour cette approche, les états qui ne peuvent pas être mesurés sont reconstruits grâce à un observateur (différent du précédent) élaboré avec la théorie des modes glissants. On utilise ici des propriétés intrinsèques aux modes glissants : la convergence en temps flni ainsi que les propriétés d'invarÎance. Cel algorithme assure une convergence
Identification des systèmes non linéaires
145
asymptotique des paramètres vers leurs valeurs de référence el présente des conditions de robustesse inhérentes aux modes gl Îssants. Dans ce chapitre, nous nous intéressons à des algorithmes d'identification paramétrique dans un contexte de conduite de processus. Il est donc implicitement intéressant d'étudieretde comparer les procédures d'identification de paramètres en boucle ouverte eL en boucle fermée. L'avantage principal de l'identification en boucle fermée réside dans le fait que l'identification est toujours possible même si la boucle ouverte présente des instabilîtés. Dans ce domaÎne, on peut citer le travail de Xu et Hashimoto rXU 931 basé sur la théorie de la structure variable. Leur approche permet rîdentification des paramètres et la commande de non linéaires SISO (une entrée. une sortie) mais peut être étendu il des non linéairement paramétrés. Dans le conlexte de j'identification-commande, on peut bien sûr citer le travail de Landau, Anderson et De Bruyne [LAN 00] dans lequel différents algorithmes d'identification valables en boucles ouverle et fennée basés sur la notion de passivité sont proposés. A travers l'étude d'un cas SlSO instable en boucle ouverte, les auteurs prouvent mathématiquement et illustrent II des résultats de simulations l'apport de leur méthode dans le cas d'une incertitude paramétrique variant dans le temps et dans le cas d'un bruit additif. Notre objectif est d'étendre l'algorithme d'identification-commande ~lll11 système multivariable en conservant les propriétés essentielles présentes dans les travaux de Landau, Anderson et De Bruyne. NOLIS proposons dans la section 5.2 un nlppel sur la notion d'identifiabilité d'un système et sur deux méthodes classiques dans le domaÎne de l'identification il temps continu : les moindres can'és et la méthode proposée par Landau, Anderson et De Bruyne présentée dans [LAN 00] basée sur l'erreur de sorLie et la passivité. Dans la section 5.3, nous introduisons différents types de IOÎ d'identification en boucle ouverte pour les systèmes non linéaires suivants: - cas monovariuble, - cas multivariable avec forme normale, - cas mullivariable général. Ces trois lois d'identiJlcution direcle des paramètres sont basées sur la théorie de la structure variable. Grâce aux propriétés d'invariance, inhérentes II la théorie de la structure variable, la convergence (exponentielle ou asymptotique selon le cas) de chacune des lois d'idenlif1cation est démontrée. Dans la section 5.4, l'identification des paramètres est combinée avec une commande réalisant la conduite du processus. En fait, la loi d'identification devient indirecte et doit être compatible avec l'élaboration de la boucle fermée. De plus, nous supposons que le système étudié est stabilisable quand le vecteur des paramètres () est connu, c'est-tl-dire que nous supposons l'existence d'une commande Il Il (x, 8) réalisant les objectifs de poursuite de trajectoire (x est le vecteur d'états). Sur un système physique réel, les paramètres sont rarement connus parfaitement. Nous proposons donc une loi indirecte d'identification des paramètres
146
Systèmes non linéaires
déterminant les estimées Ô. Il est alors possible de démontrer, grâce à des arguments classiques de Lyapunov, la convergence de la commande Il = u(x, Ô). La section 5.5 est consacrée il l'analyse de la robustesse par rapport à des incertitudes paramétriques variant dans le Lemps. Finalement, d.ms la dernière section, nous réalisom; une étude comparative des différentes méthodes d'identific:nion des paramètres dans le contexte de la conduite de processus physiques.
5.2. Préliminaires 5.2.1. Exemples Tout au Jong de cel article, nous allons traiter deux exemples: - l'identîlicalion et la commande d'un pendule, l'identification et la commande d'un exemple SISO LLAN 00].
5.2.1.1. Pendille - Cas l1Iultil'ariable Considérons le système non linéaire sous la forme normale [ZEI 90] décrivant le comportement d'un pendule [KHA 92] représenté à la figure 5.1. Les équations du modèle sonlles suivantes:
l 1111-
--,11 -
g.
- 5111 XI -
1
k
-x,
111
-
= {)pl + {)2 sin XI + (J3x2
[5.1 ]
OilOI 1/(111/ 2), th = -g/I et 03 = -k/m sont supposés inconnus et doivent êLre identifiés. Les étuts XI = Ci' et X2 = œsont supposés mesurables.
longueur 1
k : coellïcicnt de friction
Cl
masse m
...
. . . . _---*"'"
Figure 5.1. Pendule Le modèle du pendule est un système non linéaire d'ordre 2 à 3 paramètres distincts sous une forme dite nonnale. Dans la dernière partie, les simulations réalisées avec la
Identification des systèmes non linéaires
147
méthode de la structure variable monlrent]' apport de l'identification en boucle fermée par rapport à celle obtenue ell boucle ouverte, 5,2.1.2. Cas JJlOJ/ol'arÎable Considérons le système instable en boucle ouverte lBAS 96, LAN 001 avec un seul paramètre inconnu fJ() à identifier: .\',
OoxT
+ li
[5,2]
oll la valeur de Ro est choisie égale à :
[5.3]
Ro =-5
On suppose que l'état x) est mesurable. Dans la dernière partie, une étude comparative sur l'exemple [5.2] des méthodes d'identification est proposée: - comparaison de 1'identifkation-structure variable avec la méthode des moindres carrés (en bOllcle ouverle), - comparaison de ridentification-structllre vnriable avec la méthode proposée par Landau, Anderson et De Bruyne [LAN 00] (en hOlicleferlllée).
5.2.2.
Jdellt~fiabilité
Une condition nécessaire pour réaliser une procédure d'identificatÎon est la propriété d'identifiabilité du système étudié, Il s'agit de déterminer s'il est possible d'obtenir tlne estimée des paramètres du système à panir des informations Conlenlles dans les données expérimentales,
5.2.2.1.
Idell/~fiabilité
globale dalls le cas linéaire
Rappelons quelques notions basiques d'identifiabilîté. Dans la cas IinéaÎre, l'élude de l'identifiabililté est basée sur la notion de fonction de transfert lWAL 87, WAL 94J. Soient deux fonctions de transfert T(s, 0) et TCs, f)') associées au même modèle avec deux valeurs distinctes R et (JI concernanl le vecteur des paramètres (s est la variable de Laplace). Le système linéaire est dit (structurellemel/O globalement identifiable si el seulement si l'égalité: T(s,8)
T(s, RI)
]48
Systèmes non linéaires
implique:
f)
fJ'
Ceci signîrie que pour un même comportement entrée/sortie, il existe un seul vecteur de paramètres décrivant convenablement le système.
e
Il est plus difficile d'étudier l'identifiabilité globale dans le cas non linéaire. Elle peut être étudiée en ut.ilisant la notion de séries génératrices [FLI 85].
5.2.2.2. Ident(fiabilité globale dans le cas
}JOli
linéaire
Considérons la classe générale de systèmes non linéaires, linéaires en la commande avec:
.r=f(x.lI.e) avec:
;=1/1 f(x,
Il,
.lo (x, 8) +
8) =
L Ji (x, EJ)
Iii
[5.4]
i=l
où.r E RlI est le vecteur d'états, (:) E RJI est le vecteur des paramètres inconnus, J(}, Ji. i J •••• ,illE C oo el Il E RIII est l'entrée du système. L'identifiabilîté du système [5.4] est déterminée de manière algébrique par un calcul formel dont l'algorithme peut être trouvé dans l'article de Lecourtier, LamnabhiLagarrigue et Waller [LEe 87] ou la thèse de doctorat de 011ivier [OLL 90]. Rappelons le résultal principal. Considérons une série génératrice (g) [FLI 85] associée à [5.4J définie par:
(g) =x(O)+
111
L
F'.i(O) ..• F'.i(vjX Ix(o) Zj(l') ••• Zj(O)
1':::0 j(O). .... .;(I')=O
où Fo el Fi, i
0, ... , III sont des dérivées de Lie définies par: j=1I
For'l
.
â[. J
= "./o(x, 0)i......J fix. j=l
.J
j=1I
iJl.j
l5.5]
Fi [.]
L ,
.1=
J
fi(X,
e).
ax/''
A cause de la propriété analytique des sérÎes génératrices [FLI 85], deux modèles décrits par [5.4] ont le même comportement entrée/sortie quels que soient le temps el
IdenLification des systèmes nonlinéaircs
149
les entrées si et seulement si elles sont associées ü la même série génératrice. Notons (g) UJ) et (g) (0') deux séries générattices associées au même modèle pour deux valeurs () et e' du vecteur des paramètres. Le modèle décrit par [5.4] est sfrucfllrellemeJ1l globalement ident{fiable si et seulement si, pOUf toute valeur de () : (g){O)
=
(g) (e')
implique:
comme unique solution. L'égalité (g)(l:J) et (g)(e') est équivalente ù l'égalité des coefficients F'.i(O) .•• F.i(l')X Ix(O) (0) el F,;{I) ... Filll)X !.dO) (8'). Le calcul formel de ces coefficients peut être trouvé dans les travaux de Lecourtier, L1l1l1nabhî-Lagarrigue et Walter [LEC 87] ou Rotella etZambettakis [ROT 91]. A notre connaissance, if n'exÎste pas de résultats généraux déterminant combien de ces coefficients sont nécessaires afin d'obtenir exactement p coefficients algébriquement indépendants et non triviaux. Enfin, nous considérons le système non linéaire algébrique composé de p équations: I~((J} ...
F'.i(lI}x '.1:(0)
(0) = F,i
[5.6J
Finalement, on peut en conc1ure que le système [5.4] est identifiable si el seulement si le système d'équations [5.6] a comme unique solution e = el.
5.2.2.3. Test d'idenrijiabilifé par l'exemple Exemple du pendule. Ailn de vérifier l'identi fi abilité structurelle du système 1], nous appliquons les travaux de Lecourtier, Lamnabhi-Laganigue et Walter [LEe 87] sur l'identifiabîlité struclurelle des systèmes non linéaires. Considérons les champs de vecleurs associés au modèle du pendule en se servant des équations [5.5] :
Calculons de manière formelle les dérivées de Lie : FI (Fo(O, OHy]) , FI (Fu (F(}(O, O)!y\) , FI (Fo (F{) (/~(O. e)[y]»))
150
Systèmes non 1inéaires
appliquée~
à la sortie y
= XI
du système [5.5]. Nous obtenons:
th (Fo ( Fo(O, (1)r y D)
FI (Fo{O, O)/yJ) FI
t)1 th
FI (Fo (Fo (Fo(O. B)[y]»))
= BI (Bi + 0:::)
L'égalité g{B) = g{(-)') implique l'écrimre du système; 01 = 0'{-)3
01
Of = B;B~
[5.7]
(uf + (h. ) B')(B: . + e~- ') ,2
où e' = (e;, ()~, o~) est un vecteur de paramètres différents de e. Nous obtenons un système non linéaire algébrique [5.7] avec trois équations indépendantes. La résolution de [5.7] pel111et d'obtenÎr: 01
=0;
(-)3
= e~
02
f)~
Finalement, nous avons montré que g{O) = g(B') implique J'égalité 0 0'. Nous avons donc prouvé par un calcul formel que le pendule est un système structurellement idemijiable.
Exemple dt, cas lIlollol'ariable. Dans la mesure où le système [5.2] comporte un seul paramètre, il est claÎr que ce système est identifiable. REMARQUE 5.1.- Dans la suite, IfOUS supposons que tous les systèmes étudiés possèdell1 la propriété d'idelll({iabilité stJ1lclllrelle.
Après ce bref rappel sur la notion d'identiflabililé, nous proposons au lecteur un rappel concernant deux méthodes qui nous semblent importantes dans le domaine de
l'identification à temps continu: - les moindres carrés [WAL 94], - les méthodes plus récentes basées sur l'erreur de sortie [LAN 00].
IdenLification des systèmes non linéaires
151
5.2.3. !vloilldres carrés 5.2.3.1. Algorithme La méthode des mOÎndres canés est sans doute rune des méthodes les plus répandues dans le contexte de l' idenLification de processus. Elle permet d'obtenir une estimée Ô du vecleur () E n:t P des paramètres du système à idenlîf1er. Cette méthode est basée sur la minimisation du critère:
où e(O) est l'erreur de sortie, c'est-à-dire, la différence entre y la sortie du processus et ."m la sortie du modèle. Q est une matrice de pondération symétrique définie non négative. On suppose que le modèle est paramétré linéairement. En d'autres termes. on suppose l'existence d'un vecteur cP d'observation tel que: ."111 ce)
= t;PO
Alors la minimisation du crÎtère quadratique J (f)) détermine J'estimateur des moindres carrés Ô : t)
( q> T Q cp ) - 1 cp T Q y
l5.8]
On remarque que l'obtention de r esti mateur 15.8] requiert nnversibilité de la matrice cpT QcP E JH:PxP. De plus, l'un des principaux intérêts de la méthode des moindres carrés est l'obtention analytique de Ô sans se soucier de l'initialisation de Ô(O).
5.2.3.2. App/icalio/l cl l'exemple JlwIJOI'ariabie (5.2] en boucle olll't'rle A partir de l'équation [5.2], nous obtenons la forme classique des moindres currés:
x?
avec c.p(t) = le vecteur d'observation. En utilisant l'équation [5.8], l'estimateur des moindres carrés est donc donné par:
[5.9] Nous rappelons que la méthode des moindres cUlTés ne nécessite pas lïnitialisation de Ôn.
152
Systèmes non linénires
5.2.4. iUétllOdes basées sur l'crrcur dc sortic 5.2.4.1. ldcllf(ficatÎo/1 en bouclc ouverte L' a] gori thme proposé par Landau, Anderson et De Bruyne [LAN 00] a pour objectif l'estimation des paramètres d'un système S1S0 non linéaire décrit par: S : y
= Po(u)
Oll Po esl ]' opérateur non linéaire inconnu, Il esr la commande et -" est la sortie scalaire du système. On introduit le modèle ajustable défini par:
/vi ; ."(t?) OLI
=
p(r), Il)
Ô est]' estimée du vecleur des paramètres.
Le schéma d'identification relatif à la boucle Ol/I'erte est donné à la figure 5.2. = y - y(H). L'alg01ithme d'identification ,üustable inspiré par la méthode des moimlres carrés est donné par:
L'erreur de sortie est déflnie par e
ô=
F(t)$(t)e(t)
p-l (1) = - (1 - ÀI (t))
F- 1(1)
f 0< 1-1(1)::: 1,0::: 1-1(1) < 2.
+ À2(t)cp(I)T
0, p-I(I) > O'F-J(O). 0 <
0'
<
00
[5.]01 oll $(t) est le vecteuf d'observation défini par: 4)(1)
=
lA
[
P (f). If)
J1' = ['Pf}l ({-),~ Il) ... Pf~I! (O. u) JT 1
A
avec P~ la délivée partielle de PU1, 1/) pOUf j allant de 1 à p avec p la dimension du °i
vecteur des paramètres. En supposant que les termes des séries de Taylor dépendant
U_-
~I
r
t_'-'I ;
Algorithme d'idenLificatiDnJ ajustable ..... Figure 5.2.
SchélJJlI de l'idt:1If(jicatùJ1/ - Errellr de sortie en bOlide (}Ill'erre
Identification des ~ystèmes non linéaires
153
e-
de e et de ê de rîlng élevé sont négligeables. on peut prouver que la convergence des paramètres est vérîl1ée ~ en d'autres termes:
Hm cpT (t)(f) - fJ)
0
[-,- C\J
5.2.4.2. Idel1l(fication en boucle fermée
Quant à l'identification en boucle fermée, le schéma est donné par la 5.3. Le principal attrait de cette méthode réside dans l'identification de systèmes instables en boucle ouverte mais stabilisés en boucle fermée par une commande Il r) où r est la référence du système.
m
__ m
__ . . . . 1
Système
Algorithme d'ident îlicLlt ion ~ Lljustable Figure 5.3. Sdlél1w de J'idemUicaliol1
Erreur dc Sor/Îl!
Cil
bO/lcle fer/llée
L'algorithme d'identification en boucle fermée a la même forme que celle en boucle ouverte [5.10J olt l'on remplace l'elTeur de sortie en boucle ouverte e(1) par l'erreur de sortie en boucle fermée ecdt), c'est-h-dire :
11 J 011 c.f.>(t) est le vecteur d'observation défini par: CIJ(I)=
!
[
A
,.
P(O,u(O))
JT
Considérons maintenant]' opérateur linéaire: H
où
PCL
Si
=
= [1
rOll
p-I CL
} .. (t} 'i
1
olt
À(l) > )..2(1) Yt
r5.121
+ (J Pli (f), I1(ê) )8Cy (r, y({J))] est supposé lnversible.
suppose que 1-1 définl en [5.12] est
p{fss~lalors
on peUl prouver que:
J 54
Systèmes non linéaires
De plus, si J'opérateur PC/~ peut s'exprimer sous forme de représe11fatioll d'états cl ,'ariants dans le temps, alors on peur prouver la convergence de J'algorithme d'identification 15.11], c'est-à-dire: cOl~lficiel1ts
Hm q) TU HÔ - (-)} = 0 (-..Oü
Les auteurs monlrent ilussi de manière formeUc la robustesse des algorithmes proposés (boucles ouverte et fermée) par rapport aux incertitudes paramétriques variant dans les temps el par rapport au bruit. 5.2.4.3. Application il l'exemple 11101lOvlIriable [5.21 en bOllcleferl1lée
La commande Il est choisie telle que lI(Ô) r = 2 + 0,5 sin(O, Il) et b
(ya)3 + by(ê)2) + r
où
= -0,4. Quant ft l'estÎmateur â, il esl défini grâce à l'éql1a-
Lion[S.Il]: ÔU) t-I(t)
= F(t)èP(t)ecdt),
Ô(O)
= - (1 -11(1) F-1U)
=0
+ A2(t)èP(t)Tcp(r)
où eI)(!) est le vecteur d'observation défini par:
où p esLla varÎahle de Laplace elles constanles AJ, A2 sont choisies égales à 0,5 et 1 respectivement comme dans lLAN 00]. Choisir ces valeurs de A1 et de A2 équivaut à utiliser la méthode des moindres carrés à oubli exponentiel.
5.3. Identificution-structure variable en boucle ouverte Dans cette section, nOLIs proposons trois méthodes permettant l'identification des paramètres en boucle ouverte en utilisant la théorie de la structure variable.
5.3.1. Descriptioll des systèmes étudiés Nous allons étudier successivement trois types de loi ct' identification suivant la classe de systèmes considérée: - système nOI1 linéaire mOl1ovariable, - système non linéaire multivarîable sous forme normale [FLO 02J, - système 110n linéaire multivariable général LAHM 02]. Pour les trois C,lS énoncés ci-dessus, le synoptique de ridentilkation-structure variable peut être schématisé par la figure 5.4.
Identification des systèmes non linéaires Commande u "'1 ' c-'" Systeme
1 Sanie système
!-.t
-j -
J
1
155
y---------..'1
1
Sortie mDdèle
1
i ·"lion c
v 1Kj=' .....- 1.....
--'1
~-----------~
Fonction signe
avec gain Kv Figure 5.4. Schéma de /'identUicmÎoll-strllcllI/c,' l'ariable
Cil
bOllcle mn'l'rle
5.3.2. Cas I1UJllOl'ariable
5.3.::?.). Algorithme Considérons la classe de systèmes non linéaires linéairement paramétrés décrit par: x
.fCI(X}
+ F(x)O + (go(x) + G(x)O)u
15.13]
où x E 1ft est l'état du système, Il est l'entrée scalaire mesurable et (-) E ]p~ est le paramètre constant et inconnu. Nous supposons que l'état x est complètement mesurable, le système l5.13] est globalement identifiable au sens de la définition du paragraphe précédent et 1I1(x, 11) F(x) + G(x)u est bornée. Introduisons la notation." dépendant de ê, l'estimée du paramètre (J. En se basant sur la théorie de la structure variable, l'observaleur adaptatif .r satisfait J'équation suivante:
x
.frICr)
+ F(x)Ô + (~o(x) + G(X)t~) If + v
15.14J
où v est l'entrée de l'identificateur et v est dél1nie par Il = Kl'sigl1 (x .\'} On introduit la notation e = .\: - x et Co = li - () (supposée bornée). En tenant compte des équations [5.1 3] et [5.14], on obtient: e
.~ - .\> =
F(x)c(I
+ G{X)COll + V ~ lIi(x, u)eo + v
oil /l1(x.lf) est un scalaire égal à F(x) l'unique solution de è = 0 [SLO 91] : Il
v('fj
=-
(P(x)
+ G(x)u) Co
+ G(x)lI.
La commande équivalente v'-'t} est
-111 (x, u)eo
[5.15]
La loi d'identification directe que nous proposons est donnée par. 15.16]
156
Systèmes non linéaires
Oll À() est une constanle strictement positive. Grâce aux propriétés d'invariance (voir équation 15]), la loi d'identification directe peuL encore s'écrire:
l5.17]
5.2.- Conditioll de glissement. POlir vér(fier la condition de g!iss(!mellt sur la slIl:{ace d~fiJlie par te ERie 0). 011 élI/die Ill/onctÎon de Lyapul101' V = . E1I déri\'lJlJ/ por rapport au Il'IJIfJs cefle équatiol/, 011 obtient :
RE1'vlARQUE
\i
e (Al(x, H)e(J
= eAt/(x, u)eo
+ v) =
-
e (!vICr. Il)eO
+
Kl'sigll(e»
K"lel ::: IeIIN/(x. Il)lleol
K"lel
Si /'011 choisit le gldn KI' sl~[lisa1ll11/l'l/t grand l'ér(/ia17l :
K,,:::: IMCr,lI)lleol 011
li
18]
proul'é qll 'il eXÎstait III/ régimc glissant slIr la slll:{ace {e E R / (:'
01
de
glissel/lell/. On peut maintenant énoncer le résultat principal dans le cas monovariable.
5.1
Soi/ le système flon linéaire décrit par [5.131 el supposons {jU 'UI1 idéal puisse êlre généré (condi/ion [5.18) vérifiée). Alors, / 't'.\'limée Ô par [5.16/ COI/l'elge expollel11Îelleuu.:'lIll'erS sallraie valew:
TI-IÊORI::i'vfE
régime glissaJ/t dOl1lll'c
Preuve de la convergence exponentielle de l'identification directe Considérons la fonction candidate de Lyapunov :
En dérivant l'équation précédente par rapport au temps et en remplaçant èo par SOI1 expression l5.17], on peUL finalement obtenir:
.
V(eo) =
')
')
= -),-oA1-(.clI)e(j
')
-2ÀoM-CL
u)V(eo)
On rappelle que Àf) est une constante striclement positive. Aînsî. ,i (eo) esl négative semi-déllnie. A la lumière du principe d'invariance de LaSalle, la convergence de Co vers zéro peut être établie. En effet, la condition ,i (co) = 0 est satisfaite uniquement pour la condition triviale ('(1 0 (le cas où M (x Il) 0 représente une perte de lïdcJ1t(fiabili/é du système). Ainsi, "(coU» dOÎt décroîlre vers zéro et donc: 1
lim eo(r) =0
It-(X)
De plus, l'équation [5.17] permet de conclure quant à la convergence exponentielle de la IOÎ d'identilkatioll paramétrique directe. Il
Identification des systèmes non linéaires
157
5.3.2.2. Exemple - Cas 11101101'arillble En considérant l'équation [5.14], l'observateur adaptatif pour l'exemple lS.2] est:
[5.19J où l'estimée êo est construite grâce à [5.16j
[S.10J
5.3.3. Cas
11l1tltÎl arÎahle S(JUS '
la forme Ilormale
5.3.3.1. A/gori/llme Soil le système non linéaire d'ordre Il exprimé sous la forme particulière (voir l'article de Zeitz [ZE190j pour les conditions d'obtention de ce système) :
[S.21]
où BlI et f}/J sont des vecteurs de paramètres constants mais inconnus, /1 E RJ/I est l'entrée. x eSlle vecteur d' états supposé mesurable et le système L5.21.l est supposé globalement identifiable. Cette classe de systèmes a aussi été étudiée par Xu et Hashimoto [XU 93]. Pour le système [5.211. l'observateur adaptatif décrivant.\- est donné par:
[S:11]
avec Ôa et
a" comme estimées des paramètres:
êo =
ÀVn{,T (x)
[S.23a1
;., T t)b = ÀV1/11 (t)
[S.23bl
REMARQUE S.3.- À est IIlll' constallte strictement posiril'e détermÎnl1n1 la l'i1esse de COl/pc/:r;enCl!
a
de la loi d'idew{ficatiol1 directe.
Supposons qu'un mode glissant idéal puisse être généré sur la surface de glissement Xli = O. L'unique solution cie Cr = 0 eSL donnée par:
= Xu
[5.24.1
158
Oll
Systèmes non linéaires
les erreurs d'estimation paramétrique sont notées:
=
De plus, nous supposons Cf] (eo l'équation l5.24] peut encore s'écrire: lIeq
ll
•
= eo:
REMARQUE
eo,,) et ~T
=
(a(x)'J' uT) bornées. Alors,
l5.25]
5.4.- En
montrer
qU'lIH
gaÎn kn
l'ér~fie
suÎVUl/t le même raisonnement qu'ù la rell/arque 5.2, 011 pelll régime glissant idéal est généré sur la sw:{acl' {O" E RIO" = 0) si le :
[5.26]
On peut maintenant présenter le principal résulull dans le cas d'un système ll1onovariable avec une forme normale. 5.2.- Soil le système 110n linéaire décrit par {5.21) et supposons qI/ '/III régime glissant idéal pllisse être gélléré (condition [5.26J vérijiée). Alors, les estimées êll et Ô/J données par /5. 23t1J et [5. 23b] COllvergent asympfotiquemem l'el:\' leurs vraies vllieurs ea el el> respectivl'ment. THÉORÈME
Preuve de la convergence asymptotique Considérons la fonction de Lyapunov : T
\/=
Calculons dans un premier temps l'fi:
En tenant compte de [5.23a] et [5.1.3bJ, nous pouvons obtenir réqualion suivante: e'{I
= ÀV
II (
_oT (x).
-ÀlJ/lz,T
-1/'') [5.27]
ldcnti ficatÎon des systèmes non linéaires
159
Ainsi, en utilisant [5.27], la dérivée par rapport au temps de la fonctÎon de Lyapunov V peut encore s'écrÎre sous la forme suivante: .
V=
Vn
-Àvn :
T T
eo
Grâce aux propriétés d'invariance de la théorie cie la structure variable, l'égalité vn "/} eo:: (équation [5.25J) est vérifi.ée sur la surface (f = O. Ceci implique:
li = -ÀII vn /.,} II~ Finalement, nous pouvons conclure lim'_>':\j li = 0 et donc lîm , _>,:x; eo d'autres termes: lim
eOI /
=0
lim
e{)l,
0
1->00
1->00
0, en
Par conséquent, les vecteurs de paramètres Ô(/ et Ôh convergent asymptotiquement ven; les l'mies valeurs 0(1 et f}!J respectivement. III
5.3.3.2. Exemple sur le pel/dule ell boucle Ollverte En considérant les équations [5.21] relatives li la méthode basée sur la théorie de la structure vmiable, nous avons pour le système l5.1] :
Ba
= (01 0)
= (JI aT = (sin.\) x:d ()/J
En utilisant r équation [5.22], l'observateur adaptatif est donné par les équations:
·~2
âPf
+ Ô2 sin Xl + tJ3 X 2 + V2
[5.281
L'application des lois d'identification paramétrique 15.23a] el [5.2JbJ au cas du pendule donne:
Ô,
ÀV1)1.
ÔI (0)
â2 = ÀlJ2 sin XI. â3 = ÀV2X2.
0
Ô2(0)
Ô3(O) = 0
=0
[5.29]
160
Systèmes
nOI1
linéaires
5.3.4. Cas multil'al'iable général Considérons la classe de systèmes non linéaires globalement identil1able SIMO décrit par:
.\' = foCr) + FT(x)(~ + (~w(X) + CT~.r)O) Il
[5.301
où x E jRll est le vecteur ct' états, Il E est r entrée scalaire mesurable et (-) E IR!' est le vecteur des paramètres constants et inconnus, 1 < P ::: 11, Nous supposons que Je vecteur d'état x est complètement mesurable. De plus, nous supposons l'existence d'L1ne matrice Q E lH:.pxlI qui vérifie det( QA1 T ) i= 0 où M =!:;. F(x) + G(x)u E IP2!n{ll. Introduisons la nolat.ion .r dépendant de rJ, l'estimée du vecteur des paramètres (). En se basant sur la VST, l'observateur adaptatif.r satisfait l'équation suivante:
.~ =
Jrl(X)
+ FT (x)Ô + (.~o(X) + CT (X)Ô) li + V
Dl! v est l'entrée de l'identificateur et v
KvsÎgn (x -
[5.31]
.1").
On note e
= .r -
x et
eo = Ô () supposée bornée. En tenunt compte des équations [5.30] et L5.31], il est possible d'obtenir:
è
= FT (.r)l'O + CJ'(x)eotl + v
La commande équivalente
VL'l[
est l'unique solution de è
= 0 [SLO 911 : [5.32]
OÙ
MT
=
F T (.\')
+ CT(X)ll esLsupposée bornée.
La 10i d'identification directe proposée est donnée par :
= Co =
~.
fj
T -1
Ào(QM)
QV('(I
[5.33J
Oll Ào est une constante strÎctement positive. Grâce aux propriétés d'invariance (voir équation [5.321), la loi d' ÎùentifÎcation directe peut encore s'écrire:
(} = èo
-Ào(QMT)-I(QAt/T)eo [5.34]
= -Àoeo REMARQUE 5.5.-
Par le mêl1le raÎsmmemenl qu 'cl la remarque 5.2, 011 pe/ll prouver
(jll 'il eXÎste 1111 régime glissant idéal"'Î Il' l'ectcur des gains KI' l'SI tel que:
15.35]
Identification des syslèmes non linéaires
161
On peut maintenant énoncer le résultat principal.
5.3.- SO;lle système non lil/éaire (p > 1) décrit par /5.30j el SllPfJOSOIIS régil11e glissa11l idéal puisse être généré (conditiol/ ( 5.3511'érUiée). Alors, les eSlil1lél~s () d011nées par /5.33 j COIll'C/:r;CJ/l expol1entiellement l'ers lellrs IT{/ies \'(deurs.
THÉORÈME qll 'UI1
Preuve de la convergence exponentielle de IïdenLÎficalion directe Considérons la fonction candidate de Lyupunov :
En dérÎvant r équation précédente par rapport au temps et en remplaçant èo par son expression [5.34], on peut finalement obtenir:
Comme )1.0 est slrictement positive. \i (co) est négative semÎ-définie. Grùce au principe dïnvariance de LaSalle, la convergence de Co vers zéro pellt être démontrée. En effet, la condition ,i (e{!) = 0 est satisfaite uniquement pour la condition triviale Cf} = O. Ainsi, V (eo (r)) décroît vers zéro et ainsi: Hm eo(t) =0
If--cç
De plus, l'équation [5.34J permet de conclure quant ü la convergence exponentielle de la loi d'identificalÎon paramétrique direCle. Il
5.4. Identification-structure variable en boucle fermée Nous proposons dans ce paragraphe une loi d'identification indirecte compatible avec l'élaboration d'une boude fermée dont le synoptique est donné il la figure 5.5.
5.4.1. DescriptilJ1l des systèmes étudiés L'actÎon de la commande est d'imposer au vecteur d'états x la poursuite de la trajectoire désirée .l'dU) variant dans le temps, On introduit la notal.Îon cAr) xU) Xd (t) qui est l' en'eul" de poursuite de trnjectoÎ re.
=
J 62
Systèmes non HnéaÎres
Fonction si,rnc
avec gain Kv Figure 5.5. Schémll de /'idem{jicalioll-S(I1ICfllfe l'ariable e1l hOllclej'crmée
5.6.- LlI méthode d';dent~ficl1fiol1-colI/l1/aJ1de qlle IIOt/S proposons Il';ml'as le typc de commande. Néol1moins, la seule exigence cOllcemallf la commande est q1le cefle demière impose ml '\TSIl'lI1e III poursuite de la lrtûectoire XdU) l'oriant dans le temps. NOlis laissons 011 leclellr le cllo;x de cette commol1de qui doit être cho;sie enfonction du sylème étudié. Dans le cas mOllOl'ariable el lIlultÎl'ariable {/l'CC une forme normale, il now.' semble 1udiciellx d'utiliser lll1e cOllll/lamle de type slmclitre pariable de ma/lière cl être el111déqllatÎol1l11'ec la procédure d'ident(ficliliol1. Le lecleur intéressé pettl se rttFérer (Ill Ifl'rt.> de SIonne el Li [SLO 917 pour plus de détails Slir cc type de commande. Dans le cas du système lIl/1lth'oriable général, Un'existe pas li /lotre COJ11wissol1ce de procédure systémalique quant il l'obtelllioll d'lfne C011ll11l111de réalisant la conduile du pmces.ms. Le lecfeur dOÎI choisir uue commande spéc(fique lItl système étudié. REMARQUE
POSl'
Le vecteur d'états x est la solution suÎvant les cas de l'équation différenLielle [5.13] ou [5.211 ou encore [5.30]. Nous avons choisi de traiter dans le suite le cas général multivariabje [5.30]. Il est clair que nous pouvons étendre les résultats obtenus dans ce contexte multivariable général aux cas monovariable et multivariable sous la forme normale.
5.4.2. fl.lét/lOde d'idelltificatioll il1directe 5.4.2.1. () l'sI ,\ïlpjJosé Cm1l111 Supposons dans un premier temps que le l'cctt'lIr des paramètres 0 esl COIlI1I1 el sutisfaitles conditjons natureIJes suivantes: /:;
rI) EDo} OLI Do; = {Oj E
Do =
U I:::::J:::::p
Do!
P!.{1jmill .::: f)j .::: ()jlllll\ 1
pour 1.::: j .::: p
15.36]
Identification des systèmes non linéaires
163
De plus, nous supposons l'existence d'une solution unique pour le système [5.30] par rapport à la trajectoire désirée Xd (t) et supposons que la trajectoire désÎrée est continûment différentiable nu moinsjusqu'ù l'ordre 11 + ]. Avec ces hypothèses, nOLIs supposons qu'il existe Il = If (x ,(}) choisie pour le système étudié:
(er
(gO (ex + x,,{t)
+ ê,\' = '-ll
(t ,
+ GT
+ Xt/(/)) 0 (ex
+ Xd(f)
()) l/(X. 0) - _\-,,(t)
l5.37]
ex. e)
Finalement, pour être en adéquation avec les théorèmes converses [KHA 92], nous supposons: D
t:,
(ex E 1R.
lI
/llexll
< l'j,
- '-ll : [0, (0) x D x Do
lP~1l
est continûment différentiable,
la matrice jacobienne [C)l}J /i1e x J est bornée sur D,
l'origine
ex
= () est exponentiellement stable.
Avec ces hypothèses, on peut définir une fonction de Lyapunov VU. t\·,fn satisfaisant les inégalités suivantes: c tllex Il ~
::s
V (t , ex JJ) ::::
av av , + -,-'-ll(t. ex. fJ) dl de.\'
av
Il iJe,
c::dlex Il ~
[5.38J
-q Ilex II~ avec () E Do
[5.39] l5AOJ
112 :::S C4 llex 112
pour des constantes positives
Cl, Cl, CJ
et ('4'
5.4.2.2. f:) est sllpposé ÎncO//l1/.I
On considère mainlenLll1l1e cas général où () est
itlCOllllU.
Ainsi, les estimées t) de
e sont construites grâce il [5.33] el [5.34] mais nOLIS imposons que ê vérifie l5.36] : en d'autres termes :
De plus, notre objectif est la poursuite de Xd (1) tandis que l'adaplation de Ô eSl calculée par "algorithme. Ceci est résumé dans le théorème 5.4.
164
Syslèmes non 1inéaircs
THÉORÈME 5.4.- Soi/le système llo11linéa;re décrit par (S. 37] ef supposons qu'il exÎsfe une cOiIIII1{lIlde ql/Î stabilise le système. Alors, les paramètres estimés t) cons/ruits par l'approche indirecte f 5.4 1] cOIll'e/~~ellt vers leurs l'raies !la/eurs et l'erreur de pOl/l'SUife l'x décroÎt li ziro pour ulle cOlII/lwllde 1/ = li (x, Ô).
Preuve de la stabilité en boucle fel111ée En prenant la dérivée par rapport au temps de V (t , ex,
av
f:h, nous obtenons:
av
.\ + oex ,'\ ot
Par souci de simplicité d'écriture, nous omcUons dans le reste de la démonstration l'argumenLr dans les expressions .IiJ(x), FT(x), go(x) et CT (x). En considéranl l'équation [5.37]. ,i
(t, ex, è) vérifie:
Grâce à l'inégalité l5.39j el l'hypothèse sur l'encadrement f) (équation [5AIJ), les deux premiers termes du membre droit de J'égalité précédente vérifient:
iJ·\1 dl
éJ V [ . + -.de - Jo + F T f) + A
x
Alors, \i (/, t'x,
(
gO
.
+ c T (1~) Il -
. ]
Xd
av + -.av- [( -,.\JI l, ex, ()'")] dt
ô) peut encore aÎsémenl s'écrire:
· (~) , ( ) V.:. êJ V T 1. e" fJ < -c3!le ,II:; + -.-A A - - . Iv! el) ,.\ ~ '\.;. D() der
V
où A1 T = FT
L
+ Cr,l.
En tenant comple de l'équation [5.41l, ,i(t, ex,
è) devient:
av Àrwo - .av AI! r l'o · (") ::: -c311t'x 11 2 -"
V t, ex, 0
")
ao
(Je.\'
Bex
Identification des
A partir du théorème 5.3. nOlis savons que pour FT Hm Co
lHoOO
sy~tèmes
+ gT II
!::,
non linéaires
165
kIT =1= 0 :
=0
Ainsi, nous obtenons:
'1(1, ex, Ô) est négative etsemi-définie. Néanmoins, li la lumière du principe d'invariance (théorème 4.8 du livre de Khalil lKHA 92]), on peut prouver la stabîlité du système global (ex. co) autour de (0,0). En effet, à partÎr de l'inégalité décrite par c311e.\' II~ continue sur D telle que: [5.38] et en choisissant W (e.r) \i (t, ex, Ô) :::: - W (ex) :::: 0, toutes les solutions de [5.37] satisfaisant ex(to) E D sont bornées et vérifient en plus limn--..oo W(e x ) = O. Ainsi:
lim cAf) = 0
INOO
Finalement on peUl conclure que le système complet (ex. co) est stable autour de (Q, 0). Il
5.4.3. Exemples Cil
bOllcle fermée
5.4.3.1. Pendule en bouclelerllléc Nous étudions ici de nouveau l'exemple du pendule décrit pur les équations [5.1] dans le contexte d'opérations en boucle fermée. L'identification indirecte consiste à conserver les équations [5.28J et [5.29] dans l'élaboration de la boucle fe11l1ée, Néanmoins, puisque nous réalisons ici un bouclage, l'entrée Il est modifiée par rapport à la boucle ouverte. Cette commande Il doit être élaborée de manière ft ce que les états Xl et X2 du système poursuivent des trajectoires désirées, Le système étudié dans le cas du pendule est sous une f0n11C normale ~ nous suggérons donc une commande de type structure vuriab1e (ou modes glissants). Alors, de manière classique lSLO 91], il est possible d'obtenir la commande Il telle que: li
[5.42J
Ît - Kc sign (0-)
où IÎ est l'unique solution de 0- = 0 avec cr, la surface de glissement définÎe par = (d/dt + )"'c)ex. ex = XI - XCI est J'erreur de poursuite en supposant que la trajecroire désirée est Xlt!. Ainsi, û est l'unique solution de :
0-
0-
= J:r: + lé.\' = tJ i li + (-l:!. SÜ1 XI + 83X} -
-~Id
+ lc x } -
le-ild
] 66
Systèmes non linéaires
[5.43] On remarque qu'il faut imposer llla valeur initiale ê, (0) d'être différente de zéro afin d'éviter une Îndéfinition au lancement de l'algorithme.
5.4.3.2. Cas 111OIlO\'arÎahlc en borldl'Iermée Dans le contexte de la boucle fermée, l'entrée Il
/1
est:
= IÎ - Kesign (a)
L5.44]
où IÎ est runique solution de Cr = 0 avec a = ex. et ex = x] - x,,,' Ainsi, IÎ vérifie: ....
1/
=
.
XI,} -
...
..,
00.\]
En considérant l'équation [5.14], l'observaleur adaptatif pour l'exemple [5.2] est toujours:
.~I = ÔoxT + 11
+ KIIl si gl/ (.ll - .rd
oll éo est construit à partir de
16] :
r)o = ÀO',rTlJ1'>'I' Ôo(O) = 0 v, = Kp,sign(xl-.rI)
1
5.5. Analyse de robustesse Dans cette section, nous étudions la robustesse de la loi d'identification par rapport rl des incertitudes paramétriques. REMARQUE
5.7.-
NOliS cOlltil/lIOIIS
l'unalyse
l'Il cOJlsidérallt
le
cas
muITjvariable
généml décriT par l'équation {5.30 1.
5.5.1. Conditio1l cie matching Considérons dans un premier temps une perturbation bomée .6. de type additif vélifiant : [5.45]
JI est bien connu (Lyapill/Ol' redesign, Khalil [KHA 92] et Sira-Rmnirez [SIR 88J) que le régime glissant vérifie toujours les conditÎonsd'invarÎance. En d'autres termes, le système adaptatif (commande et identification) est robuste par rapport à la perturbation .6., si el seulement si .6. vérifie ]a condition de 11l(1{chillg : .6. E spall {g(}{x)
+ G(x){-J}
Idcnt.i fication des systèmes non linéaires
167
5.5.2. Perturbatiolls paramétriques l'ariant tlalls le temp.\· 5.5.2.1. Préliminaires D'un point de vue pratique, les paramètres physiques dans les processus réels sont inconnus et non constants. Leurs valeurs dépendent des conditions de )' expérience. Ainsi, la propriété de robustesse par rapport aux Încertitudes vatiant dans Je temps doit être démontrée. Considérons donc le système perturbé suivant: :\. =.!il(X)
+ FT (x) {a/mlll + AB(t))
+ (fJO(X) + CT (x) {Onom + AB(l)}) lf
[5.46]
La nouvelle valeur à identifier est {} = O/!{Jw + .6,.(-:>(1) où t)/WIll conespond fila partie constante du vecteur des paramètres (voÎr sections 5.2 et 5.3) et AB est une Încertitude paramétrique variant dans le temps el dont la dérivée par rapport au temps vérifie:
[5.47 J
.6,.'B ( t) :::: 11. (:)
Avec ces notations, l'erreur d'estimation paramétrique est maintenant définie par:
eo = () -
e
ou: [5.48J
5.5.2.2. Analyse de robustesse Afln de montrer la robuslesse de la méthode présentée dans la seclion 5.2, nous introduisons la loi d'adaptation paramétrÎque suivante:
â=
-Gcm/SflIHf -
fJ
-Àoeo - Asigl1(eo)
As; gn (eo)
[5.49]
où âCII11.Htlflt est J'estimée obtenue si le vecleur (1 est constant (voÎr sections 5.2 et S.3). Dans le cas multivariable général, on a, grâce à l'équation IS.33], la relation:
168
Systèmes non linéaires
REMARQUE 5.8.- D'UlI point pratique, 011 ne peut pas implémenter sign (eo) = sign (ri car le veclellr des paramètres () l'st inC0I711u. Néanmoi1/s, sÎgn (eo) peut ql/lind même être déterminé. En e.fret, cOllsidérons il llOIII'CC/lIl'éqllotiol1 [5.32/ :
tn
01111011.'; IIO/O/IS
A1 ~ F(x)
QE
lJIIe l'il1l'erse
]RpXI/
!elle
E lR~J)Xll. Supposons l'existence d'une matrice QNf T existe, c'cst-a-dire deI (QA1 T ) =/: O. Alors:
+ G(x)u
Finalement, sÎgn (co) est donné pur:
NOLIS
énonçons maÎntenant le résultat principal de cette section.
5.5.- Soi/le système l1ol1/inéaire perturbé décrit par (5,46] où AB(t) l'sI une incertitude ponlmétrique l'ériJilll1t /5A7]. Soient les hypothèses /5.38]. {5.39] el {5AD] relatives il la houe/l'fermée. Alors, le système complet (ex. co) esl stable oulour de (0, 0), avec ex .tU) -xt/(t) f'erreurde poursuite el eo(t) = (hl) -OI!O/ll - AE-)(t) l'erreur d'estÎmotioll paramétrique. THÉORÈME
Preuve de la stabilité de lu boucle fermée De manière à prouver la propriété de robustesse, considérons à nouveaul .. fonction de Lyapunov :
En calculant sa dérivée par rapport au temps et en remplaçant éo par son expression l5.48], on peut facilement obtenir:
Maintenant, considérons l'équation [5.49]. L'équation précédente peut encore s'écrire comme ci-dessous:
". = ef)T ( -Àoe(t -
A sign(eo)
ldcnti ficatioll des systèmes non linéaires
169
Le premier tenne dans le membre de droite est défini négatif (voir section 5.2). Pour conclure, nOLIs devons prouver que A sign(eo) - ~'e(t» est aussi défini négatif. A partir de l'équation [5.47 J, nous avons:
el (-
;={'
A sign(eo) - ~'e(l» = -A
L
!cOi j -
e;f ~'e(t)
i=J
i=p
i={J
:::S -A
L
1COi 1
+ /1+) L
;=1
!cOi 1
Î=l
Ainsi, en considérant l'inégalité précédente, la dérivée par rapport au temps de la fonction de Lyapunov devient: i=p
,i :::S -Àolle{)l1~ -
i=p
AL leo 1+ L leo 1 i
/1(:)
;=1
i
i=l
Ainsi, si A est choisie telle que:
on peut donc conclure que \Î(en) est négative semÎ-détlnie. En utilisant le princÎpe d'invariance, eo 0 est la seule solution de ,i(eo(t» = O. Finalement, "(l'o(t)) doit décroître vers zéro et par conséquent lilnft--oo eo = O. En d'autres termes, cela signifie que:
=
lim Ô =
IH--OO
()/I01/1
+ ~e
et finalement, on peut attester de la propriété de robustesse de l'algorithme proposé par rapport aux incertitudes paramétriques. Quant à la preuve de la stabilité de eAI) autour de zéro relative à la boucle fermée, il suffit de suivre le même raisonnement que la démonstration du théorème 5.4. III
5.5.3. Exemple sur le cas Ilwl101'ariable On considère à nouveau l'exemple monovariable [5.2] où J'estimation de la partie constante du paramètre est donnée par [5.20]. Si l'on souhaite que l'algorithme à structure variable soit robuste par rapport aux incertitudes paramétriques variant dans le temps, on utilise la loi d'estimation proposée en [5.49J adaptée élU cas monovariable, c'est-à-dire :
170
Systèmes
nO!1
linéaires
Le terme sign(eo) n'est pas directemenl exploitable car {'(J = Ôo - [Jo dépend de 00 qui est supposé inconnu. Grâce aux propriétés d'invariance des modes glissants, il est possible d'obtenir la valcur du sign(eo) (voir équation [5.15]). Comme Vicq = -eoxT alors sÎgn{eo) = sign(vl",,). Ainsi, la loi d'estimation paramétrique robuste est: 15.50]
5.6. Simulations - Etude comparative Nous proposons dans un premier temps l'application de la méthode d'identification en boude fermée sur un système multivl:lriable avec la forme normale.
5.6.1. Cas 1I11llth'ariable (pell(lule)-ltlelltificatioll basée Slll' la théorie de la structllre "ariable
5.6.1.1. EH bOl/cIe ou\'erle. idemilicatioJ/ direcle Nous utilisons l'équmion [5.28] concernant l'observateur adaptatif et les estimées des paramètres sont obtenues grâce aux équations [5.29]. Les simulations sont obtenues en injectant L1ne entrée suff1samment riche en fréquences. Nous avons choisi d'ajouter à la commande Il de type sinusoidal Ull bruit blanc car il s'agit d'un signal nalure]]ement persistent d' excimtÎon pour tous les ordres. De plus, le gain de r observateur adaptati f est choisi égal "-]. = 20 concemant J'équation [5.28.1 et celui de l'identification est À = 10 pour les estimées des paramètres [5.29J. D'un point de vue pratique, il esr impossible de réaliser les simulations avec ]a fonction sign (.) car elle présente un gain infini il l'origine. La fonction sign (.) est donc remplaçée par une fonction de type saturation uJ(lul + 8) oü8 0.01 pour nos simulations. Nous supposons que les vraies valeurs des paramètres sont: 01 = 5, rh = - L,9 et ()3 = -4. Les résultats en boucle ouverte sont donnés à la figure 5.6. Les estimées des paramètres convergent vers leurs vraies valeurs en moins de 5 secondes sans fort dépassement el sans biais. Nous nous proposons mainlenant de réaliser l'identification des trois paramètres dans le contexte de la boucle fermée.
5.6.1.2. En bouclefenllée, idcJ1l(ficlIlioll il/directe Nous étudions ici de nouveau J'exemple du pendule décrit pnr les équations l5.1] dans Je contexte d'opérations en boucle fermée. Au vue de l'équation [5.43], on doit choisir une valeur initiale de (~I différente de zéro. On choisit êl (0) 0,5. Les conditions de simulation sont les mêmes que celles en boucle ouverte (pour l'identîflcation directe). Les gains de la commande à structure variable sont Kc' = J 00 pour l'équation [5.42] el Àc = 150 dans l'équation [5,43]. La trajectoire désirée Xlt! est une sinusoide d'amplitude Ad = 0,01 el de pulsation Wei = br 10. Nous obtenons dans Je contexte de l'identification en boucle fermée les résultats proposés à la figure 5.7.
Identification des systèmes non linéaires
rtI (jj
:fi
6 "
4
ID ID
E 2
~
ID
C\l
.mID
0
ID
.~ -1
-m -2 rtI
-;; -2 ID
E-4
ID
5
10
15
\
0
5
10
15
10
15
2
ID ..c 0 ~
0
1
.;; 0
M
V
\
--.-r
-6
5
0
temps en secondes
Figure 5.6. EstÎlllées des trois paramèfres dll pCffdll1l' al'ec la 1I1tÎtlmdc de la Sflllcllirc vari{/b!e l'II boucle ouverte ~
6
.;; 4 ID (jj ID
2
E
~ 0
r---,_---.----~--_r---,----~--~----,_--,_--~
r""""L -__J -_ _
o
0.1
~
_ _ _ _L __ __ L_ _
0.2
0.3
DA
~
____
0.5
~
_ __ L_ _ _ _L __ _
0.6
0.7
0.8
~
__
~
0.9
C\J
ro
(jj ==
o~
:N -1
--
~w -2 L===~~~~~~==========================d ID
0
0.1
0.1
0.2
0.3
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
0.4
0.5
0.6
0.7
0.8
0.9
temps en secondes
Figure 5.7. Estimées des trois pl/ntlllèlre.'i d/l pendille avec la métftode de ln struetl/fe l'a fiable
Cil
boucle fermée
\71
172
Systèmes non linéaires
A partir de cette figure, nous voyons que la convergence des paramètres en boucle fermée est obtenue beaucoup plus rapidement que dans le cas de la boucle ouverte: la vitesse de convergence est approximativement divisée par 10 en boude fermée. De plus, les états Xl et x::: suivent des trajectoires que l'utilisateur impose au système, cOlllme lïndique la figure 5.8, Ainsi. les erreurs de poursuite e.q (r) = XI (t) - Xld(t} et ex~ (1) = x::: (t) - :\'1 li (t) vont vers zéro,
(lJx
2
a
.!!:l 'S
-2
II)
::1 0
0-
-6
::1
-8
~
(fi -10 ru
of
f
-4
-0
(lJ
x10-3
a
0.1
0.2
0.3
DA
0.5
0.6
0.7
0.8
0.9
0.1
0.2
0.3
004
0,5
0.6
0.7
0.8
0.9
1,5
!!! '5 II)
::1
0
0-
0.5
(lJ
-0
::1
@
a "-
m-0.5
a
temps (secondes)
Figure 5.8. Erœ/lrs de poursuite
l'II
houcle fermée pOlir le pelldule
Ces résultats obtenus sur un pendule montrent que la méthode est valable pour des syslèmes non linéaires mullivarÎables nécessitam l'identiHcalÏon de plusieurs paramètres physiques. D'une part, nous avons montré que l'identification en boucle fermée est plus performante que celle en boucle ouverte en termes de vitesse de convergence. D'autre part, identifier un système en boucle fennée permet de stabiliser les états du système autour d'une trajectoire en évitant ainsi les instabilités éventuelles de la boucle ouverte.
Nous proposons maintenant de comparer sur un exemple simple (cas SISQ) la méthode basée sur la théode de la stmcture variable avec la méthode usuelle des moindres carrés (en boucle ouverte) et celle plus récente basée sur la notion d'erreur de sortie (en boucle fermée) développée par Landau, Anderson el De Bruyne [LAN 00].
Identîncation des
SVS:tèl1I1CS nOI1
linéaires
173
5.6.2. Etude comparatÎl'e - Cas 11101lOl'llr;able 5.6.2.1. Prélill/illaires On considére le système instable en boucle ouverte suivant: [5.51] Il est clair que le système r5.511 est idcntiHable. NOLIs nous proposons donc ici de comparer la méthode basée sur la théorie dl' la structure l'arioNe (VST) avec di fférentes méthodes:
- comparaison de la méthode VST avec les moindres carrés en boucle Ollver/e, - comparaison de la méthode VST avec les méthodes basées sur les erreurs de sortie en bOllclefennée,
5.6.2.2. Comparaison
l'Il
bouc/e ouverle avec les 11/oindres carrés
Les de l'identificatÎon-structure variable sont choisis tels que KI'I = 25 pour [5.19] et Ào = 55 et A = 50 pOUf [5.50). De manière à comparer les deux algorithmes (moindres calTés et identification-structure variable) de manière objective, nous avons excité le système avec la même entrée If dans les deux algorithmes d'identification (il n'y a pas de condition de persistence d'excitation requise car un seul paramètre doit être idelltiflé). L'entrée 11 est choisie égale à li = 1 + sin( 101). Dans le cas idéal d'lm environnement où le paramètre On est constant el que la mesure de Xl est SHns bruit les deux algOlithmes (VST et moindres carrés) donnent les mêmes résultats. NOLIS nous intéressons donc, dans un premier temps, n traiter le cas oll le paramètre Bo subit une incertitude paramétrique de type sinusoïdale telle que: Bo(t) = -5
+ W(/5) sinO!)
Les résultats obtenus sont résumés à la figure 5.9. Nous pouvons observer que les deux algorithmes semblent robustes par rapport aux incertitudes paramétriques. Néanmoins, on observe que la convergence de l'estimateur moindres can-és est légèrement plus rapide que celle obtenue avec l'estimateur structure variable. Par contre, l'erreur paramétrique est plus petiœ et sans biais dans le cas de l'estimation structure variable par rapport à l'estimation moindres carrés. Comparons maintenant ces deux méthodes dans le cas d'Lill environnement de mesure bruÎté où les résultats des deux méthodes sont plus disparates. Nous supposons que le bruit de mesure est un bruil additif à la mesure de x,. Pour la simulation, nous supposons que le bruit de mesure est un bruit blanc de covariance 1. Ur"l. NOLIS obtenons les résultats de la figure 5.10. Il est clair que dans le cas bruité ralgorîthme des moindres carrés ne donne plus de résultat valuble. En effet, nOLIs supposons dans l'algorithme des moindres calTés que la variable y = .r 1-1/ est accessible. Ceci suppose
174
Systèmes non linéaires
0
o~---------~ - - - Sll1lclun: variable
- - - l'liloÎndrcs carrés
-1
-1
:2
-3
-3 -4
-4
-5
-5
5
5
4
3 - - - Mnilllln:s
cam~s
4
4
3
3
5
~---------~ - - - Structure variable
1 l O-I~----------------~
0 :2 3 4 Temps (sec)
0
5
o
1
3
4
5
Temps (sec)
Figure 5.9. COlllparaisoll Cil boude ouverte m'cc I/IlC il/certitl/de paroll/étrique. Figures dll hallt : Estil/ules de (Jo, .ligures dl/ brIs : errew:\' ri' estimatioll po/"mllétriqlle
...-,
l
- - - Moindres carrés
:: 2S 0 cD lU
1
-1
~
LLl'
1 1
'qJ
.5
1
1 1
-1 -3
3
0 0
4
5
- - - Identification SlruclUl'C variable
~ -1 ~ -2
8-3 ,éj -4 E
.~
Lr.l
-5
-6
0
2
3 Temps (sec)
Figure 5.10. COllljJurai.\'OII ell boucle ouverte dans le
4 CCIS
5 bruité
Identification des systèmes non linéaires
175
que la dérivée de XI est ({ parfaitement connue )). Or, )a variable Xl est mesurée avec du bruit, de ce fait le bruit additif se lrouve être lui aussi dérivé, ce qui entmÎne des résultats inexploitables dans le contex.te de l'estimateur moindres carrés. Ln figure 5.10 concerne aussi l'identification en boucle ouverte de l'algorithme VST. Il est clair que les résultats obtenus sont nettement plus satisfaisants que l'estimateur des moindres cnrrés car nous ne dérivons jamais la variable Xl.
A partir de ceueétude en boude ouverte, il est intéressant maintenant de comparer la méthode VST avec des mét.hodes basées sur les moindres calTés adaptées aux opérations en boude fermée.
5.6.1.3. Comparaison avec les méthodes basées sur l'erreflr de sortie BOIlc/l'fermée Le système étudié est toujours:
où la valeur de 80 est maintenant choisie égale à : (Jo
=
-0,5
[5.51]
K1!l = 15 pour [5.19] et 20 pour l'équation l5,44] ,
Les gains de l'estimateur-structure variable sont choisis Ào Xlt!
= 0,15 pour [5.20] ~ le gain de la commande est Ki' est la trajectoire désirée telle que
Xld
= 0.5sill(JOt).
Simulations pour 1II1 paralllèfre eo COl1stal11. Les résultats concernant les deux méthodes sont proposés il la figure 5. J 1 pour un paramètre 00 constant vérifiant la condition Les deux méthodes d'identification en boucle fermée (elTeur de sortie et structure variable) ont des performances quasiment équivalentes dans le cas d'un paramètre constant. O~---------Er-~-'u-r(-k-s(-)r-lic~'
() ...----====-S-lr-uc-·ll-lrC-\-·ar-ill-bl.....,c
-0,1
-0,1
i:Ê -0,2
c5 -0.2
,~
-0,3
,~
.~
-0.4 -
E
t.I.l
-0,3
E '9. -0,4 P..1
-0,5 v
-0,5
-0,6
-0,6
-0,7 - t - - - - - . , - - - . , - - - , - - - - 1 o 5 JO 15
-0,7 +-----;----,---...., 15 0 5 10 Temps (sec)
Temps (sec)
Figure 5.11. Comparaisoll Cil boucle fermée daIls le C(/S non bruité m'eL' À1 0.5 et À2 = 1 pOIll" l'estimaleur-errellr de sortie
176
Systèmes non linéaires
SimulatÎons pour 1111 paramètre 00 wlrÎa111 dans le temps. Tmîtons le cus maintenant où le paramètre est variant dans le temps. Pour cela, on suppose que 80 subit une incertîtude paramétrique bomée telle que: On
=
-0,5
+ 0,25 s1n(O,03t)
Si l'on souhaite que l'algorithme h structure variable soit robuste par rapporll:1l1X incertitudes paramétriques varianl dans le temps, on utilise la loi d' estimatÎon proposée en l5.50] adaptée au cas monovariable, c'est-ft-dire :
REMARQUE 5.9.- L'algorithme basé slir l'erreur de sortie nécessite le réglage par 1'1IIi!isateur de 4 gains OII cOlis/antes: b, (0), Àl et À2. QW1I1t cl l'estimateurstrucfllre \'ariable, 4 gains sOIl/nécessaÎres pour l'identificatio1l en boucle fermée: Ke, KI'!' Ào et A. On pcut donc en cOllclure que les deux algorithmes cités précédemmé/1t l'I/t fa lI/ême complexité.
Les simulations sont réalisées en C01lservant les précédents gains et en choisissant A = 2 pour l' équatÎon [5.50]. Les résultals sont donnés à la figure 5.12. On peut observer que l'estimateur-structure variable est plus proche de sa vraie valeur que celui correspondant à la méthode basée sur l'erreur de sortie pour laquelle l'estimateur Ôo esl obtenu avec un biais. On peut donc conclure que J'estimateur-structure variable est plus robuste que celui basé sur relTeur de sortie pour ÀI = 0,5 el À2 = l, relatives il l'équation [5.10]. Si l'on considère maÎntenanl ÀI = 0,5 el À} = 0,001 [5.10], l' estÎ mateur-erreur de sortie ne présente plus de biais dans Je cas d'une incertitude paramétrique comme j'atteste la partie gauche de la figure 5.13. On remarque que,
0.,.-------------,
() , - - - - - - - - - - - - - , - - Errcur Jc sortie
-0,1 -0,2 -0,3
variable
-0.1
8 'li 'Ë -DA
cB -0.3 'E -OA (J
~ -0,5
"" -0,5 -0,6 -0,7
~
-0.6 -0,7
-0,8
- - Sll'UCllIre
-0,1
0
50
100
150
100
-0,8 0
50
100
150
100
Temps (sec.::)
Temps (sec.::)
bDucle fermée dans le L'liS mm bruité (lI'CC = O,S CI }":2 = 1 pOlir l'estimateur-errellr de sortie
Figure 5.12. Comparaison
l'II
il1cl'rrilllde paramétrique' lIl'ec À 1
Identification des systèmes non linéaires
cf) u
'Ë
O,-------------E-rr-cl-Ir-dc-'~-OI-·!ic~' -0,1 .
-D,I
-0.2
-0,2
~
\~
-004'
-0.3
E -0,4
&-0,5 -0.6 -0.7 -0.8
(),----------, - - Ern~llr de sortie
o
-0.3
177
:r;
l.lJ
-0,5 -II~ .P.----------i . -OJj
-O. 7 +------,----,----,--..-~ () :2 3 4 S
f---.----,.--,----l
o
50
100 150 Temps (sec)
:WO
Temps (sec)
Figure 5.13. EwimarCllr-erff.'1I1' de sor/ie en boucle fermée dal/s le eus 0.5 el A} O,OOJ
mm bmité {/\'C'C Îllct.'rtÎtttde parllll/l!lriqlll! {ll'ee À J
pour ces nouvelles valeurs de À 1 et À2, r estimateur-erreur de sortie, dans le cas d'un paramètre 00 constant (partie droite de la figure 5.13), présente un phénomène hautes fréquences indésirable dans la partie transitoire dû au faible poids du vecteur d'observation c[)(t) dans l'expression permettant d'obtenÎr 1(1). Ce phénomène n'était étaient choisies égales ft 0,5 et 1 pas visible à la figure 5.11 où les constantes À 1 et respectivement. L'estimateur-structure variable uvec perturbation paramétrique variant dans le temps (voir figure 5.12) est quant fI lui obtenu avec les mêmes gains que pour l'estimateur d'un paramètre (-Jo constant. De ce faiL on peut en conclure que le choix des gains concernant la méthode basée sur la théorie de la structure variable ~(avère être systématique quelque soil le comportement de la vraie valeur de 00. SiIJ/LIlatio1ls pOlir 1/11 paramètre f)() dans lm ellvirollllemelll bruité. Comparons maintenant les ré~u1tat~ de ces deux méthodes dans le cas bruité. En supposant que Je bruit est additif et blanc (covariance 0- 2 = 1.10-" et moyenne nulle), on obtient les résultats de la figure 5.14. Les résultats obtenus dans le cadre de la méthode de l'erreur de sortie
0.1-.------------,
o ~
-0,1
~
-0,2
o
'~
o _ -0.1 c;5 ~
'\l,J
-0.2
~§ -()~3
E -0.3 rJO
l.lJ
0.1 -'---::::::::-SI-ru-cll-m-.:''-"ar-iii-hl""'c
- - Errcur de surtÎc
:Il
-004 -0,5
!..!l Il-;;;:;;-=----------!
-0,6 -I---,---r------r--r---l o 10 20 30 40 50 Temps (sec)
-DA -O.S ·H-----·,..r-.-"'""",..r~·~~ -0.6 -l----,-----,----,--..-----i
o
10
20
30
40
Temps (sec)
Figure 5,]4. Comparaison en boucle fermée dalls le
C{/S
bruité
50
178
Systèmes non linéaÎres
sont plus robustes par rapport au bruit de mesure que la mélhode basée sur la théorie de la structure variable qui utilise des gains« relativement) grands qui multiplient l'effet du bruit sur J'algorithme d'identificatÎon. On en conclut que pour l'identification d'un système du premier ordre non 1inéaire, la méthode basée sur l'erreur de sortie est à retenir dans un environnement très bruité. Par contre, l'estimateur-structure variable est plus performant dans le cas d'une incertÏLude paramétrique significative varÎant « rapidement n dans le temps.
5.7. Conclusion NOliS avons proposé ici différentes méthodes d'identification des paramètres pour des systèmes non linéaires à Lemps continu. Les méthodes basées sur la théorie de la structure variable que nous présentons sont dédiées à des systèmes pouvant comporter plusieurs paramètres inconnus. Elles peuvent être appliquées en boucles ouverte ou fermée. D'un point de vue théorique, la procédure en boucle fermée permet d'identilier les paramètres d'un système instable en boucle ouvel1e. L'identification en boucle fermée est donc requise pDur des processus où l'identification en boucle ouverte n'est pas réalisable à cause d'instabilités. De plus, la convergence des estimées des paramètres dans le contexte de la boucle fermée est plus rapide que celle obtenue en boucle ouverte.
Nous avons prouvé de manière formelle et illustré par des simulations l'apport de l'estimuteur structure variable. En effet, ce type dïdentHkation reste valable pour des systèmes multÎvariables à plusieurs paramètres. De plus. il présente des propriétés de robustesse par rapport aux incertitudes paramétriques variant « rapidement » dans Je temps. L'estimateur à structure variable converge vers sa vraie valeur (variant dans le temps) sans aucun biais avec un réglage des gains de l'algorithme d'identification systématique quelquesoit le comportement de la vraie valeur du paramètre () à identifier. Cette robustesse est essentielle dans le contexte de l' identi ficmion d'un processus physique car les paramètres de ce dernier ne sont jamais constants et peuvent être amenés à varier au cours de l'expérience. Quant il la robustesse par rapport au bruit de mesure, nous avons montré par
r exemple que l'algorithme d'identification basé sur la théorie de la structure variable est plus flable dans le contexte de la boucle DU verte que la méthode classique des Inoindres carrés qui requiert les dérivées successives cie la sortie mesurée bruitée. Néanmoins, dans un contexte boucle fennée et bruité, l'estimateur-structure variable donne des résultats acceptables mais moins satisfaisants que la méthode basée sur l'erreur de sortie qui est très robuste par rapport au bruit de mesure. On peut donc conclure que la méthode basée sur l'erreur de sortÎe est à retenir sur des processus en boucle fermée fortement bruités. Pur contre, l'estimateur basé sur la théorie de ]a structure variable peut être implémenté sur des processus Olll' acquisition d'informatÎons est réalisée avec un faible bruit de mesure, comme par exemple avec tIne carte d'acquisition DSP (sur
Identification des systèmes non linéaires
179
laquelle notre équipe est en train de réaliser des implémentations). Cependant, il est possible d'utiliser ce type d'identification en milieu bruité si l'on injecle un lillre pcrmeltant d'éliminer le bruit. Dans ce cas, le filtre doit bien sûr éliminer le bruit de mesure nuisible à l'algorithme lout en conservant suffisamment d'informations primordiales ft la procédure d'identification.
5.8. Bibliographie lAI-lM 01J AHMED-ALI T.. FLORET-PONTET E, Li\ivINAIlIII-LMJAlmIGUE P.. « Conlrol and robust parametcr idelllifkation for nonlinear ul1ccnaÎn syslems n. Systcms olld COl/lml LCffer.l', li paraître, 2002. lBAS 96J BASAR T.. DIDINSKY G., PAN Z" ,< A llCW c1ass or idcmiticrs l'or robllst paramcter identification and cOlllml in lInccrtain syslems », dans F. Garal"alo et L. Glielmo (dir.), Ro!ms/ Control via l'oriable .\'trlrc/ure and l.-yapll1/(w tl'chl/iques. Springcr Verlag. p. 149-173, 1996. 851 FLIESS M., HAZEWINIŒL M., « Aigebraîc and geomelrÎc methods in nonlînear conlrol theory \). Proc. COI!!: Poris, M. Hazewinkel. 1985.
1 FLI
01 aJ FLORET-PONTET E, LAMNABHI-LAGARRIGLIE E,« Parameter identification methodo), ImernalimwlJormwl (~rC01l1ml. vol. 74. n" 18. p. 1743-1753. logy Llsing sliding 1001.
rFLO
hl FLORET-PONTET F.. LAMNABHI-LAGARRIGLIE E. NKWAWO IL « Paramctcr identificalion [or nonlinear uncerlain systems partlally measurable n, Pmn'l'dil1g.\' (~r /ile 5 th IFAC Symposilllll NOl//il/e",. COlllml SYJfl'11lS (NOLCOS'O]). Saim-Petersbourg. Russie. 2001.
WLO Cl1
[FLa
02J FLORET-PONTET F., LJ\MNABIII-LAGJ\RRIGUE E, (, State and paramctcr identification
for Ilolllincar 1I1lccrtain syslems using Ihe variable structure lheory », Se/l'cted Papersji'otll the NOl/lil/mr Control Netll'ork (NCN) W'orksllOf>. Shcmcld (Grande-Bretagne), Springcr
Vcrlag. 2002. [HER 99] HERRNIANN G., SrURGEON S.K .. ED\VJ\lms C. (/ Oiscrctization Dfsliding moùe bas cd control schcmcs ». Proccedillgs {d' J!/C 38'h CUI(j'erellcc 0/1 Decision (/lui COlltrol. Phoenix (Arizona). p. 4257-4262. 1999. [KHA 9:2J KUALIL RK., No Il 1i1l ear systems, Macmillan Publishing. Company. New York. 1992. [LAN OOJ LANDAU l.D., ANDEnSON B.O.O .. Dr: BRUYNE P.. '( Aigorithms l'or îùentilical.ion of conLinuolls lime nonlincar systems: il pnssivity approach n. dans A. lsidori. F, LamnabhiLagarrigue ct W. Responùck (dir.), NOl1lilwar COlltrol in the l'L'al" 20()(). SprÎngcr Vcrlag. voL 2, p. 13-44, 2000. [LEC 87] LECOURTIER Y.. LAMNABIII-LAGAlmIGUE E, WALTER E., '( Volterra anù genernting power series appruaches la identifiilbîlity tcsting H, dans E. Waltcr (dir.). Idemijinbi/ity (!( paraml'fric mode/s. Pcrgamon Press. p. 50-66. 1987. [NIE 01J NIETlIA.!vUvIER M., MENOU) P.H .• ALLGÜWER F.• « Paramcler and dcrivalivc eslimation
for Ilonlinear conlinuous-lime system identification », Proceedil/gs (~ltl1C 5'11 IFAC SYlllfJONonlillem" COli/roI Systems (NOLCOS'O/), Saint-Petersbourg. Russie. 2001.
Si/11II
180
Systèmes non linéaires
90] OLLIVIER F.. Le problème de l'idcntillubililé structurelle globale: approche théorique, méthodes efTcctives cl bornes de complexité. Thèse de doctoral. Ecole P01Ylcchniquc, 1990.
rOLL
ROTELLA F., ZA~,mETTAKls L, {( Gcncrating powcr series for analyüc systems »,AIgcbroie COlllpUli1/g;1I C01l/rol, G. Jacob et F. Lamnabhi-Lagarrigue (diL), LNCIS 165. Springer Vcrlag. p. 279~287, 1991-
[ROT 91]
rSIR 881 SIRA-RM\IIREZ H., 111teHlatÎ01w! .I01lJ1W/ rSLO
«
DifferentiaI gcomelric rnelhod in variahlc structure control
or COllTml. vol. 48. p. 1359-1390, 1988.
»,
911 SLOTINE J..1 .• WEIPING LI. Applicd I/ol/lil/cor con/roI, Prcnticc Hall, 1991.
rUTT< 811 UTKIN Y.l., « Principles of idcnlificalion using sliding rcgimcs vol. 26n° 3. p. 271-272.1981.
»••
Sim Phys. Dakl..
[\VAL
87J WALTER E .. ldl'1I1(fiabilily ofpamme/rie models. Pergamon Press, ]987.
[WAL
94J WALTER E .. PRONZATO L.,ldelll(fiCafiOll de modèles paramétriques, Masson, 1994.
[XU 93 j Xv J' HASHlMOTO H., ( Paramcter idemificatÎon methodologies based on variable structure control l', IHfeHlational .Ioumal (~f COHon!, vol. 57. n° 5, p. 1207-1220, ] 993. T
[ZEI 90J
ZEITZ M., ( CanonÎCal rorms for nonlînenr syslems n, A. Isidori (dir.), NO/llil/car COli/mI Systems Design. Selec/cd PapcrsJim}/ thc /FAC Symposill1/1, Pcrgamol1, p. 33-38,
1990.
Index
A,B accessibilité 41 algOlithme d'inversion 41, 43 algolithme des moindres carrés 19 banc d'essai 24 bioréacteur J 18 bouclages dynamiques 61
en boucle fermée 153 en boucle ouverte 154 inégalités matricielles linéaires 30 injections de sortie 54 inversibilité 47
L
Lil1ear Matrix Inequalilies 15 C,D CARlMA 21 cas monosortie 49, 106 cas multisortie 51, 109 commmande prédictive 16, 21, 24 critère de Kalman 83 critère quadratique 21 découplage 68 degré relatif 41,42,56 dynamique des zéros 48
E,F échangeur thermique 97 entrée régulièrement persistante 91, 93 erreur d'estimation paramétrique 167 estimation 82 fonction de Lyapullov 113, 128-130
1 identifîabilité 147 identification 16, 19
linéarisation dynamique 78 entrée-état 71 entrée-sortie 49
lVl machine asynchrone 16, 24 matrice de séquence ment 35 méthodes basées sur l' clTeur de sortie 152 missile 28, 3 J, 32 modèle numérique 21 moindres canés 151. 173
o observabilité 82, 86 uniforme 103 observable 106 observateur à grand gain 106. 1 15 adaptatif 157, 160 de Luenbergcr 84, 93
182
Systèmes non linéaires
glissant monosurruce 1'26 glissant l11ultisurface 127 optimisation sous conlraintes 30 ordre essentiel 42,45 ordres des zéros à l'infini 45
p pendule 146, 149,159,165 prédicteur 20 optimal 21 régime glissant 160 rejet des perturbations 26 retour dynamique de sortie 55 retour statique de sortie 54 robot sauteur 63 robustesse 23, 28, 36, 146, 166
S,T,V série génératrice 148 simulation 117, 122 structure illïnfini 42 structure polynomiale RST 23
suivi de trajectoire 26 système détectable 84 globalement identifïable 147 inverse fl droite 47 inverse ù gauche 47 linéaire temps contÎnu localement observab1e 87 LPV 28 observable au sens du rang 88 partiellement affine 93 quasi LPV 15. 28, 30, 32 séquencé 30 uni formément infinitésimalement uniformément observable 100, 101,103 non l.inéaires 86 linéaire temps discret 85 théorie de la stlUcture variable 145 unicycJe 76, 78
CET OUVRAGE A ÉTÉ COMPOSÉ PAR HERMÈS SCIENCE PUBLICATIONS ET ACHEVÉ O'll\iIPRII'vrER PAR L'IMPRHvIERIE FLOCH
À
MAYENNE EN JUIN
2002.